文摘
为了提高检索效率,民事诉讼的情况下,研究了模糊神经网络算法和构造目标检索算法系统。在仿真验证,发现,在专家组的人工主观评价结果,综合评分的参考案例的检索方案超过水平参考案例的案例推广和研究了最高法院。使用这个方案可以有效地节省prelitigation文档的准备时间,有助于改善法庭审判的公平和正义的过程。这是证明检索方案具有一定的推广价值。
1。介绍
案例指导的操作系统以来,学术界一直争论的有效性、创造和应用的指导情况。基于这些问题的意识,谢系统来回应这些实际问题在评论王教授本新书的情况下指导和法律方法(1]。在民法体系中,判例是一个非正式的法源。除了个别情况下,理论上是不被认为是绑定先例。在普通法体系中,判例法是正式的法律渊源。判例法是指判断,可以调用作为法律依据确认后由主管当局在一些国家。详细的解释也被称为“案例”。法院可以调用判断作为听到类似案件的基础(2]。特定情况下由最高法院的司法解释中国扮演的角色类似普通法国家的先例。
案例检索是一个复杂的、系统的和繁琐的工作。我们应该找到我们想知道的内容从成千上万的判断文档。案例检索引擎相关文献层出不穷。依赖于一个单一的搜索引擎不能完全提供人们需要的信息(3]。因此,一个软件或网站需要无缝集成各种搜索引擎,所以智能搜索引擎也诞生了。除了提供传统的快速检索和相关排序等功能,它还可以提供注册用户角色等功能,自动识别用户的利益,语义理解的内容,智能信息过滤和推动。
2。现实意义中国法院的先例
诉讼行为,也称为诉讼活动,是指法律行为可以产生诉讼效果,它是由司法机关和当事人依法建立的过程,包括申请、调查、起诉,拘留、逮捕、审判刑事案件的司法机关,接受,调查、收集证据,和调解民事案件,以及当事人的起诉,响应,提供证据,辩论,或防御。上述逻辑如图1。
在图1,现在的中国法庭接受审讯系统。主审法官指导所有试验。主审法官收集证据和追踪犯罪根据他的权利和倾听双方的辩护律师。双方的律师依法保护所涉及的法律法规和案例,和主审法官宣读判决听完双方的意见,考虑由合议庭4]。防御的过程中,律师提供证据,提出案例参考,分别和辩论的中心集中在双方的判例法的适用性。如果律师无法找到更多的适用和新法律的过程中案件准备,他将在法庭辩论中处于不利地位。法律规范形成的判例法系统需要在前面的判断必须遵循在类似的情况下,也就是说,必须使用规范在前面的情况下,试图判断情况(5]。法律规定和审判的逻辑引用案例法中的决定性的意义在中国法庭辩论中,没有陪审团,主审法官审判意见甚至直接问题判断的结果(6]。
引用,它关注案件的双方的需求和他们的审判逻辑。在进入法庭辩论之前,双方的律师不能有效获得另一方的辩论方向,所以他们需要解决许多可能适用的情况下(7]。因此,算法的设计目标是获取较高的情况下法律文书耦合的网络,而不是简单地根据关键字搜索。合议庭的法官也需要引用先例作为参数合议庭的辩论中,所以他们需要寻找这些台词先例基本上是双方律师的相同。
目前,大约有1200万个可选的法律文书文件的实际情况下的网络,包括刑事诉讼、民事诉讼、调解和仲裁在办公室外面,和执行文档。如果只使用关键字查询,将产生大量的无效的搜索结果。目前,法律文件网络提供高级搜索选项,但是它是有限的查询条件,如原告,被告,法官,司法部门,并记录时间,不能实现特定的查询要求。正如上面分析的,双方的律师和法官的合议庭需要搜索试验逻辑,不能意识到传统的搜索功能。
即检索要求应用于机器人算法理解标准文本的能力,但这种能力不成熟的技术在当前机器人算法的研究。因此,本研究选择的特殊文字识别计划小规模的神经网络,它不需要机器人算法理解文本,但是提供了功能领域提取semistandardized文本。也就是说,法律文件的整体格式基本上是相同的。关键字段中提取相对固定格式形成标准化安排semistandardized文本和检索过程与关键字属性标记算法为核心算法。
3所示。基于神经网络的检索算法
3.1。列举了案例文档的数据标识
近年来智能起诉是一个热点问题,和类似的案例检索公共法律服务模块的基本要求聪明的起诉。传统的关键字检索方法限制了相似的情况下表面的文字水平,不能满足用户的检索需求的文章和语义层面上(8]。案例检索关键字的“核心”,这是我们需要的标签。理想的关键字应该确保所有我们需要的信息应该包括这个标签的需求。完整案例文件可以使用“自然人名称”,“法人的名字,”“诉讼声称,”“辩护意见,”“判断结果”中提取关键字,“自然人的姓名的,”和“法人名称”可以提取自然人和法人的身份信息和明确的主题。“判决结果”提取参考结果,执行结果,上诉或抗诉法律文章的结果。法律的参考结果可以检索条参考,文件数量,在文档和判断时间,使检索内容更简洁、一目了然,并给出最接近用户的需求文档(9]。上述要求在图所示2:
在图2通过整理数据从文本中提取,4个字段设置为每一行的数据,包括字段含义(原告的名字,被告的名字,吸引力,看来,判断,等等),字段序号指针(32位整数指针变量),开始字符指针(16位整数指针变量),和结束字符指针(16位整数指针变量)。多行记录包含以上四个字段构成的初步查询结果。如果一个案例包含多个原告或被告,可以反映在上述记录。检索过程将由多列实现神经网络。每个用例文档的某些指针向前一步将触发一个判断,如图3,每个判断将形成一个连续的记录包含以上四个字段。
在图3模糊神经网络的意义是,多个输入数据转换成一个双精度变量。输入数据是字符串的字符序列。无论采用编码什么,每一个字符序列都可以强制转换为整数变量,和整型变量可以强制转换为双精度浮点变量。假设步长在上面的字符串生成过程是500个字符,每个模糊神经网络的输入层是500输入节点,和一个双精度变量输出后深度迭代。defuzzified变量之后,它直接形式对应的字段的值,尤其是字段意义的部分,并设置降落点间隔的双精度变量对应于相应的字段含义。因此,上述四个变量排序后是数值变量。
多项式深度迭代函数是选择上述模糊神经网络节点: 在哪里y神经网络节点的输出值,J-order多项式的吗我结果上神经网络的输入节点,一个j系数是退化的j阶多项式N是上层神经网络的节点总数。
去模糊化的过程中,使用线性权重法defuzzify乘以结果值输出的模糊神经网络的固定权重系数;即双精度在[0,1]区间变量乘以模糊神经网络的输出n调整降落点区间[0,n]。
3.2。案例文档的相似性比较
通过上述算法,生成的字符串数组的算法实现文档和B文档之间的比较。因为当前文件还没有被尝试,它只包含一些元素如起诉书。因此,比较传统的方法无法比较的一致性;也就是说,它属于不完整的数据之间的比较算法。算法如图4。
形成的数值矩阵图的两个比较模块4是一个4-row n列矩阵,每个元素是一个数值变量。以上讨论的具体数值意义。比较模块的两个矩阵的输入,比较模块选择日志深度迭代回归算法建立神经网络节点,和双精度变量的输出比较模块处理的二进制模块组成的二进制算法节点形成最终的输出结果。
对数的基函数迭代回归算法中使用比较模块显示为 在哪里一个和B变量是更糟。见公式(1),其他数学符号的含义。
基函数的二值化算法用于二值化模块显示为 在哪里e是自然常数,这里的近似值是吗e= 2.7182818。见公式(1)和(2),其他数学符号的含义。
二值化后的输出结果是一个双精度变量,位于区间[0,1],无限接近0.000或1.000。当结果是接近1.000,认为两个案例文档相似,结果接近0.000时,它被认为是两个案例文档并不相似。搜索根据比较的结果,而不是设置搜索关键词,直接输入起诉书,直接在相反的顺序使用所有检索到的文档数据的算法3和4,并选择最接近的案例文件1.000人工判断的结果。
4所示。模拟测试算法的神经网络检索算法的效率
模拟环境选择Python仿真平台,需要1200万法律文件中的数据网络检索数据,选择200例典型病例推荐的最高法律从2018年1月至2020年12月为研究对象,输入他们的控诉搜索搜索参考案例,并使用专家小组手册之间的耦合程度评价方法来判断搜索结果案例和实际案例。五十专家小组的成员,所有律师拥有超过10年的民事诉讼经验和实践者在学院和大学教法律,给出一个分数形式的主观评价,满分为10和最低分数为0。参照群体是实际上引用在法庭辩论中,得分也高于50的专家。两组的分数计算的算术平均值,这是包括在表中1。
在表1,得分最高的是得分最高的平均值在所有情况下,最低分数是最低得分的平均值在所有情况下,所有成绩的平均分数是平均值在所有情况下,和标准差系数之和的区别每个特定分数,平均分数和总病例数。数据显示,手动评估分数的第一个10例系统的原始分数高于参照组。即使对推荐的情况下最高法律,仍有许多改进的空间在其内部情况下引用。如果推荐的情况下水平最高的法律,该算法有能力获取至少20例1200万例。
评估的例子后,专家组进行了模拟法庭上面的200例中,实验要求专家组作为律师集团解决数据基于传统关键字检索,计算了工作时间,并使用该算法来解决数据基于神经网络,并比较结果如表所示2:
在表2搜索结果的评价方法是一样的,在桌子上1。总搜索时间的总和的实际材料准备时间模拟法庭,律师集团计算小时(h)。搜索响应时间所花费的时间进入搜索条件系统返回搜索结果。数据显示,尽管神经网络检索方法需要很长时间来检索每一次,实际人小时占领短,专家组的主观评价结果在起诉或响应材料也很高。证明了神经网络检索算法具有较高的检索效率,减少检索时间和高耦合的检索结果。
5。总结
面向这样的神经网络检索算法由多列显示了模糊神经网络具有较高的检索效率仿真和演示,证明其实际可操作性远高于手动检索高级实践者的结果。在使用这对案例检索算法,它可以节省更多的prelitigation准备时间为双方的律师和积极意义的改善法庭辩论的客观性。然而,该算法仍然有缺点系统响应时间长、要求高的大数据系统检索过程的例子。后续研究将有针对性的、深入的研究。
数据可用性
底层的数据结果提出了在本文研究中是可用的。
信息披露
作者确认手稿的内容没有被发表或投稿。
的利益冲突
没有任何潜在的利益冲突在我们的纸上。
作者的贡献
所有作者看到了手稿和批准提交出版。