文摘

无论理论研究或实践经验,智慧国际法庭的建设产生了大量的智慧成就;然而,科学融合的制度化逻辑可持续发展和现有的实际成果尚未意识到,还有智能法庭的建设中存在的问题,如实际应用不足,可怜的系统一致性和在线诉讼不足。因此,本研究提出了一种融合CNN-GRU网络结果模型使用一个文本分类神经网络结构卷积神经网络具有良好的效果结合格勒乌神经网络模型结构进行推荐的任务。促进智能的内涵的发展法院通过协作集成人工智能的技术和系统,促进司法理论的深度集成和智能技术,诉讼的深度集成需求和智能技术,和一般的深度集成技术和专有的发展提供技术的机制和法律制度的建设智能法院。

1。介绍

作为司法实践的基本价值、公平和效率总是吸引了很多注意力,以及创建和改进新格式的法院现代化和智能法院恰恰反映了技术的方法实现智能正义的价值。为基本规划的现代化法院近年来,建设智能法院已经收到了强烈的注意力从学术界和司法实践部门(1]。无论理论研究或实践经验,尽管当前的智能法庭建设为我们提供了大量的智慧成就,在可持续发展的制度化的逻辑方面,现有的实际结果尚未实现科学的融合,智能法庭建设的实践是在某些领域,如技术探索、知识结构、算法开发、等领域。故障现象,有必要进一步探索和改进系统工程建设的理论基础和切实可行的解决方案2]。因此,从智能法庭建设的实践出发,系统地总结现阶段智能法庭建设的基本问题,并在此基础上,深入分析问题的起源及其发展趋势。问题导向,探索建设智能的方向法院和聚集理论共识,国际智能法院的可持续性建设实践经验(3]。的发展逻辑,建设智能法院属于法院现代化的基本范畴,它的基本结果是法院信息化建设模式下的法院现代化,特别是“人工智能+正义。“然而,这个问题也是客观的,这是有关智能的发展初期,法院(4]。

随着时代的智慧,虽然智能建筑已经触及法院信息化建设的各个方面,应用不足的问题裁定也是重要的核心业务5]。缺乏实践的原因是多方面的,与司法人员的主观理解,技术的成熟度,适用性的狭窄范围的主要原因。由于上述因素,智能系统的应用在这个阶段还没有达到预期的效果,需要进一步发展和完善的功能完美、普遍性、和覆盖6]。以电子文件为例,深入应用程序提供的智能辅助功能的电子文件还不能覆盖整个审判过程实施和应用程序的完全覆盖全国法院。它不够聪明,人性化,即。,the push of similar cases is not accurate enough, and the automatic backfill of case information is not perfect enough [7]。此外,在诉讼实践中,聪明的法院系统的应用应该基于法官为核心,与法官的商业便利化,专业化,效率为主体。技术成熟度不仅需要指法官的机械的重复劳动价值减少,也有直接的关系与法官的个人理解,系统的认知和认可。的主要推动者的建设智能法院法院领导,和应用者的法官trial-line [8,9]。全面推进智能法庭的建设应该采取高智商司法服务的改进方向和提供应用程序建议方便,高效,通过无缝连接和专业智能服务的技术创新和实际应用之间trial-line法官实现智能的集成开发法院建筑和智能的应用,例如,诉讼服务、智能试验,和智能管理(10,11]。

连贯性不够系统面临的主要问题之一全球智能法院在这一阶段的建设。作为一个系统和技术复杂的项目,有许多问题在系统收集智慧的法院系统在这个阶段。需要改善,子系统之间的兼容性和子系统缺乏有效连接,数据共享,协调、操作程序之间的交互。基于司法数据共享系统的滞后大数据已经成为一个基本问题限制整个系统的有效操作智能法院(4]。只有准确地解释司法固有的功能机制通过大量分散的数据聚合和结构化大数据处理,系统地揭示了各个模块之间的关联,并实现统计上显著的价值判断和预测,除了进行历时和多变的研究,可以预测和发展趋势分析的目的才能实现(12]。驾驶一个相互关联的建设和无缝的智能系统需要全面,包罗万象,和所有字段共识各种司法实践部门促进业务数据的应用和共享资源的能力,依靠智能技术和数据资源的协调和统一,这个基本问题的解决方案。事实上,它影响的修复问题不足下级子系统之间的集成整个智能法院系统(13,14]。然而,这个恢复过程所涉及的范围和对象广泛,需要协调的最高人民法院和基层法院,以及从技术公司先进的技术支持。问题和解决方案往往不完全一致的形式,它需要时间来对应一个接一个。这是密不可分的精确设计技术的公共关系人员。聪明的法院的一个重要的立足点是智能技术,开放之间的集成智能技术和司法也是一个不可避免的要求系统的集成(15]。为此,有必要对光滑的供应渠道“人工智能+正义”复合人才,这将不可避免地涉及的创造和发展新的跨学科的学科。结果,参与解决的问题缺乏连贯性的聪明的法院系统也广泛16]。

在线智能法院诉讼的基本体现。然而,由于种种原因,目前的争端解决机制的国际法庭仍由离线诉讼,和在线诉讼的范围和应用仍然是不够的。通常,司法活动有很强的现场表达意义,反映出一种司法诉讼活动现场,与重要的物理空间、主体参与,和活动的开放性。相比之下,在线智能法院诉讼中具有明显的虚拟空间,非现场参与,和相对保密的活动。这两者之间的显著差异使得公民很难适应基于传统诉讼的惯性思维(17]。在正常情况下,传统离线情况下的转让纠纷在线将不可避免地给当事人带来很多不适,其中的技术成就,情感的接受,诉讼结果的可接受性是主要的瓶颈限制在线诉讼的发展。虽然电子商务纠纷的数量持续增长的多样化发展网络经济的新格式,目前的争端解决机制在中国仍然是主要离线(18]。的确,网络纠纷解决的区别和传统司法纠纷的时代情报将促进可持续发展的在线诉讼形式,因为有限的在线网络法院诉讼方法在这个阶段,普通电子商务纠纷仍喜欢离线诉讼。除了电子商务诉讼纠纷通过在线诉讼模式适用于解决,其他普通的司法纠纷的实际条件从线下转移到在线尚未公布。它直接关系到网络诉讼诉讼主体的认知和接受。在实践中,法院的现代化面临的问题是不同的,例如,在审判系统,有问题,如异议缺乏清晰定位功能,以及标准和程序申请民事行政颁布需要优化(19]。

智能法院更多关注的司法应用人工智能技术和它带来的便利和智能服务审判业务。目前,智能法庭的建设主要围绕司法大数据的推广应用和人工智能技术在法院信息化的过程中,和真正意义上的智能法院尚未达到充分的理解在科学和技术方面。在这方面,技术成就的程度之间的集成和一体化程度的司法精神显然是更复杂的比人工智能的简单的应用程序。从概念的角度分析,智能法院的定义,学术界和司法实践部门提供更多的对司法公正的期望,方便诉讼,和技术中立。在这个阶段,智能法庭建设的重点主要是在提高诉讼效率,促进相同的情况下,相同的句子,刑事援助,和智能执行。学术界的理论讨论也主要集中于它。然而,作为一个聪明的司法系统,除了上述功能外,智能法院也考察其科学的主要指标和可持续的自然,尤其是司法公正的实现。智能技术和正义之间的联系往往不在于法院裁判但在技术开发人员。技术中立的立场下技术工具主义不给裁判更方便,也不限制他们的自由裁量权的行使。对于裁判,中立的技术主要体现在遵守法律规定,这是与实质意义上的司法公正。 The riskiness of technology can usually be avoided through institutionalized design. The double-edged effect of smart court construction should be implemented under the framework of institutional rationality, and ultimately, one should realize its own auxiliary value through institutional control. Based on it, the construction of smart courts in the intelligent era urgently needs to take the creation of an ecological system that conforms to the logic of judicial justice as the basic development direction. In terms of practical rationality, it is imperative to explore the solution path of various problems in the initial stage of the construction of smart courts.

1.1。国家的艺术

法律情报的研究有着悠久的历史。随着科学技术的进步和网络技术的快速发展,信息化在司法领域也基本完成;由于使用司法信息化也产生了大量的数据,大数据正在改变并将继续深刻改变我们的社会治理经营模式和组织结构。一方面,在这种大规模生产的时代,共享、大数据和应用程序,它提供了大量的信息,检察机关处理案件。另一方面,它也形成了一个趋势,迫使检察机关引入大数据。公诉业务领域的大数据应用程序的主要功能和预测与量刑建议的任务可以均匀,形成一个新的商业模式:大数据智能判决,这也是基于深度学习技术处理大数据的法律智慧。

犯罪预测的任务是确定适当的犯罪案件过程中,如抢劫、盗窃、预测犯罪和暴力,通过分析文本和事实案例描述的机器。法律规定的建议是预测所涉及的相关法律规定和法律的情况下根据描述案例和事实在刑事诉讼的法律文件。犯罪预测和法律建议的任务在审判过程中,他们是重要的子任务相关的法律,判决犯罪和刑罚的法律规定,在司法过程中起着重要的作用,犯罪预测,和法律:文章推荐可以作为量刑辅助系统,它可以造福很多人参与任务的过程。例如,它可以提供一个方便的参考法律专家(如律师和法官)来提高他们的工作效率。与此同时,它还可以提供帮助和法律建议普通不熟悉法律知识的人。根据上述犯罪预测和推荐的描述任务的法律,它实际上是根据文本数据分类的描述和事实。现在,有很多的科学研究领域的自然语言文本分类任务。文本数据分类问题是一个重要的任务在自然语言处理领域的问题。相关的科学方法的研究可以追溯到1950年代,当科学研究方法是使用专家规则来解决文本数据的分类问题,在1980年代,文本数据分类的问题,拥有先进的工程技术知识,形成专家系统;然而,分类和分类精度的范围非常有限。 With the development of statistical learning-related method theories, especially the growth of text data on the Internet and the rise of machine learning disciplines after the 1990s, a class of classical algorithms to solve a large number of text classification tasks has been slowly established, and the main method technology in this period is artificial feature engineering combined with shallow classification models. The text classification task is divided into two components: feature engineering and classifier. The main methods are the naive Bayes classification algorithm, KNN, and SVM. The above method is a traditional solution to the problem of text data classification methods, the text representation of these methods, the main problem is high latitude and high sparseness, and the ability to express characteristics is very limited.

现在,主流技术和方法主要应用,深度学习技术实现文本分类方法。Bengio等人提出了神经概率语言模型(NPLM),使用一个文本分布表示。每个单词表示是一个密集的真正的向量。文本分布表示的最大优势在于,它有很强的能力来表达特性。缺点是缺乏上下文的语义表达。Mikolov等人提出了一个分布式的代表词的使用和发布了Word2Vec工具包。优势是实现好的结果丰富的语义表达,促进文本分析的发展,通过这个词向量来表示文本数据,高纬度和高稀疏的文本表示,和困难的过程,类似于图像和音频数据的连续密集的特点。缺点是Word2Vec词向量文本表示和文本。

仍然有一个固定的差距在最初的语义,和更多的是学习单词和类似的上下文。词向量表示解决问题的文本数据表示。它提供了一个方法,深度学习网络使用词提取特征向量表示,它可以解决文本分类问题。Joulin等人提出,句子中所有的字向量平均然后进入将Softmax函数对文本进行分类。这个模型很简单,可以获得大量的分类信息没有太多的非线性转换和功能组合。缺点是结构没有充分考虑词语在句中序列信息的一致性。金提出了句子使用卷积神经网络分类问题在2014年。方法的优点是,它可以提取相关地方特色的文本数据,和CNN的使用模型可以用来提取关键信息特性类似于句子字格。缺点是CNN固定过滤器的大小,无法成型时间序列信息,滤波器的hyperparameter调整也很麻烦。在自然语言处理问题,为了更好地表达上下文信息,递归神经网络(RNN)更为常用。 It uses the RNN multitask learning framework in the literature to learn multiple related tasks together, thus providing a text classification design method for RNN learning in multitask; however, it has the disadvantage of being impact-scoring. The key information in the class process is not intuitive enough to portray it. In 2016, Yang et al. used the principle of attention mechanism to increase the weight of features that have a greater impact on the classification results. Li Mengtong proposed an intelligent flood evacuation model based on the deep learning of various flood scenarios to make flood control intelligently [20.]。

2。方法

2.1。深度学习

深入学习是近年来科学研究的一个重要方向,它在许多领域取得了很好的性能的人工智能。计量仍是最重要的方法对评价科学的支持;然而,深度学习技术的出现可以补充现有的数据测量方法和指标评价体系的各种类型。因此,它已成为一个研究课题,科学评估需要关注目前和将来一段时间。在其根,深入学习是机器学习的一个分支,是指一类问题以及如何解决问题。首先,深入学习问题是一个机器学习的问题,指算法的一般规律总结从有限的样本。它可以应用于新的未知数据,例如,我们可以总结之间的法律案例描述和一些历史的审判法庭判决,所以当有一个新的案例描述,我们可以使用总结法律法官例描述已经犯了什么罪。其次,与传统的机器学习,深度学习使用模型,通常是复杂的,这意味着原始之间的数据流的输入和输出的目标样本通过多元线性或非线性组件。因为每个组件处理信息,它会影响后续组件。目前尚不清楚有多少每个组件的贡献。 This problem is called the credit assignment problem (CAP). In deep learning, the contribution allocation problem has always been a very critical issue, which is related to how to learn the parameters in each component. At present, a better model to solve the contribution allocation problem is the artificial neural network (ANN). Artificial neural networks are also called neural networks, and neural networks are mathematical models of construction that are inspired by the way neural networks in the human brain work. The structure of artificial neural networks is the composition of the connections between neurons, among which there are two special types of neurons.

一是能够接收数据信息以外,第二是向外输出数据信息。人工神经网络可以看作是数据处理网络,改变输入输出。神经网络控制的单位可以被视为一个复杂函数的一组参数,和神经网络的参数可以从数据机器学习的方式,因为神经网络模型通常是复杂的,从输入到输出。

信息传输路径相对较长。因此,学习复杂的神经网络可以被视为一种深机器学习,即。深度学习。

深度学习(DL)可以被视为一个问题如何学习“深度模式”的数据,和深度学习是机器学习的子问题。通过创建一个模型结构与一定的“深度”,建议让模型自动学习功能表示,和学习过程的特征是从底层特征到中间特征到高层的特性。因此,可以提高模型预测的准确性或认可。图1显示了深度学习数据处理过程。

表示学习:提高机器学习系统的准确性,我们需要输入的信息转换成一个有效的功能,也称为表示。如果有一个算法,可以自动学习有效的特性和改善最终的分类器的性能,那么这个叫做表示学习学习。领域的深度学习,表示是指输入样本观察X模型的形式和以何种方式通过模型的参数。表示学习是指学习有效的观测样本x表示有很多形式的代表学习,例如,CNN参数的监督培训是学习的一种监督形式表示,并无监督pretraining autoencoders和限制玻耳兹曼机参数是一个无监督学习的形式表示。深度学习的快速发展,模型的深度继续增加,和表示其特性的能力也越来越强,简化后续的预测。

深度学习的主要目的是自动学习有效的特性数据,即。,表示学习。技术深度学习在某种程度上可以视为一个表示学习技术,将原始数据到一个更高级,更抽象的表示通过多层非线性变换。这些学习表示可以取代人工设计的特性。随着神经科学和认知科学的发展,人们已经逐渐认识到,人类智能行为和大脑活动是相关的。灵感来自于人类大脑的神经网络系统,早期科学家构建一种模仿人类大脑。

神经系统的数学模型,称为人工神经网络,被称为神经网络。在机器学习领域,神经网络模型是指人工神经元网络结构模型由许多结构,和以前的这些人工神经元连接的强度是可以习得的一个参数。

神经元模型在计算机:1943年,心理学家麦克洛克和数学家皮特了生物神的网络结构和元素议员提出抽象的神经元模型。神经元模型由三部分组成,即输入,输出,和计算功能模块。输入部分相当于神经元的树突,输出神经元的轴突,和计算模块可以被理解为细胞核。神经网络模型在计算机的一个例子是显示在图2

2.2。神经网络模型的优化方法

神经网络模型优化是优化神经网络模型中的参数。在机器学习中,最简单、最常用的优化算法是梯度下降法,批处理梯度下降法(BGD),随机梯度下降法(SGD),和小批处理梯度下降法(MBGD)。本文采用随机梯度下降法优化最小化损失函数。损失函数是一个非负实值函数,用于量化深度学习的预测模型之间的差异和实际分类标签;对于分类问题,现在一般用叉损失函数。这项研究也使用这个函数来计算之前的预测和实际标签之间的区别。叉的损失函数可以被理解具体假设标签y∈{1…C}的示例是一个离散的类别标签,和模型的输出f(x,θ)∈[0,1]C的条件概率分布类标签,即。,见下面的方程。

满足以下方程。

一个c-dimensional一个炎热的向量y可以用来代表样本的标签。假设样本的标签k然后标签向量γ,只有的价值k尺寸是1,和其余的元素都是0。

样品标签y可以被视为真正的概率分布的样本标签,即。,cth维度(表示yc1≤cC)是真正的概率的类别c。假设样本的类k的概率,那么它属于kth类是1,其它类的概率是0。

两个概率分布,它们之间的差异可以用叉。标签的真实分布表现为y。前叉的预测分布系数yc (x, 0)以下方程所示。

在机器学习中,最简单、最常用的优化方法是梯度下降法,即。,the minimum value of the risk function on the training set D is calculated by an iterative method as shown in the following equation. 0 =参数值在哪里tth迭代和一个是搜索的步骤。在机器学习中,∞是一般所谓的学习速率,和梯度下降法的公式(1)- (4),目标函数是整个训练集的风险函数,称为批处理梯度下降(BGD)方法。批处理梯度下降的梯度方法需要计算每个样本上的损失函数和迭代。当样本容量N在训练集非常大,空间复杂度相对较高,每次迭代的计算开销也很大;在机器学习中,假定每一个样本是独立的,随机分布,从实际数据中提取分布,真正的优化目标是期望风险最小的。

批处理梯度下降相当于N样本实际数据分布和梯度的计算经验风险从他们的梯度近似理想的风险。为了减少每次迭代的计算复杂度,我们也可以只有一个样本在每个迭代中,计算此示例损失函数的梯度,并更新参数,即随机梯度下降的方法。足够数量的迭代通过时,随机梯度下降法,也被称为增量梯度下降法,可以收敛到局部最优解。

2.3。卷积神经网络

卷积神经网络(CNN)是一个全球性的多级可训练的人工神经网络模型和深层神经网络结构包含卷积计算卷积的内核。卷积神经网络可以通过更少的预处理过程,甚至从原始数据获得抽象。基本和高阶特征表示,其中的一个经典算法领域的深度学习,是一个神经网络模型设计过程数据与是因为结构。例如,在时间序列数据,它可以被认为是有定期抽样在时间轴上形成一维网格的图像数据。图像可以看作是二维像素网格和卷积神经网络在许多领域表现非凡的结果。他们现在广泛应用于计算机视觉、语音识别和自然语言处理。卷积神经网络通常包含数据输入,卷积层、汇聚层,完全连接层,和分类器,具体提取数据特征和分类过程的卷积网络数据所示34(1)输入层:假设一个二维张量,卷积的过程使用卷积内核如图4(2)池层:卷积后的操作层卷积神经网络模型结构。池层主要使用连接池功能。卷积层输出的特征结果池,池功能的原理是使用当地的特色功能映射而不是整体的特性来表示的输出位置,例如,马克斯池函数计算相邻矩阵的最大值。卷积层、汇聚层有fixed-shaped窗口(也称为池窗口)的一次输入数据计算输出。与卷积计算输入和内核之间的组间关联层,池层直接计算最大值或池内的元素窗口的平均值。此操作也称为最大池或平均池,分别。

池平均函数的平均值来计算矩阵,以及汇聚层的作用是不断减少的空间大小的数据。参数的数量和计算的神经网络模型也将减少。因此,池层还可以防止over-interaction模型在一定程度上。最大池功能具体池过程如图5

具体过程的原理图的平均池功能如图6

卷积神经网络也表现良好在文本分类领域的任务自然的处理,而且有几部分卷积神经网络结构模型的文本分类的过程,即数据文本预处理、数据字嵌入处理后,卷积层提取文本特征,池层压缩的数据,分类和分类功能。在比较分析卷积神经网络的结构和一般神经网络,有三个特点。第一种是本地连接,第二个是重量共享。第三是二次抽样,这使得卷积神经网络模型有更好的泛化能力和强大的数据特征提取能力。卷积神经网络的核心组件主要包含三个部分,卷积层、汇聚层,和完全连接层。通常,卷积层和池层是深度学习的主要组件。卷积神经网络可以自动选择数据的特征表示,和卷积神经网络可以获得分类目标特征提取后表示,然后通过分类函数。

3所示。结果分析和讨论

3.1。基于聚合CNN-GRU网络法律建议

律法是预测的建议所涉及的相关法律在这种情况下,基于案例和事实的描述在刑事法律文件。法律是司法量刑的主要依据。因此,本章为研究对象,本节研究的主要内容是提出了使用卷积神经网络的深度学习技术和格勒乌神经网络融合方法,促进法律情报法律。推荐任务取得了较好的效果,解决了有关法律参与此案的基于案例和事实的描述部分的刑事法律文件。它提供了一个法律依据快速判决和提供法律支持人员参与情况,从而提高司法效率,实现快速和智能判决援助。实验数据的数据集是基于中国法律研究杯比赛,这是作为刑事案件的数据提供的中国最高人民法院。

3.2。模型融合CNN-GRU网络法律的建议

本节的主要工作是提出融合CNN-GRU神经网络模型的结构根据之间的内在关系的案例描述事实和法律的规定,和融合CNN-GRU神经网络通过其他文本分类的实验结果分析了模型的模型来实现更好的结果。提出了融合CNN-GRU模型推荐的总体精度刑法基于卷积神经网络。由于在多个分类精度不足部分,通常这种结构编码输入序列的模型作为一个固定长度的向量表示,短长度的输入序列,模具可以学习一个合理的向量表示。然而,这个模型的问题是,当输入序列不长,学习合理的向量表示模型有困难。因此,格勒乌的引入神经网络模型来克服总体分类精度高,和单一的分类精度的问题,通过CNN和格勒乌来解决问题的法律建议,将推荐的法律本质,可以视为multiclassification问题,和法律的建议是一个根不同长度的输入方法。事实的描述情况下的法律文件预测所涉及的相关法律。通过这种方式,它可以帮助司法人员开展司法协助结果显示推荐的法律。

3.3。推荐模型聚合CNN-GRU网络

聚合CNN-GRU网络模型的结构在本章提出基于卷积神经网络(CNN)的特点和长期短期记忆网络(LSTM)网络模型。新的聚合CNN-GRU模型结构,提出了根据实际的法律建议法律情报文本需要解决的问题。卷积神经网络模型在文本分类领域有良好的性能在提取文本特征表示的情况描述和事实部分,有一个丰富的语义关系描述和文本上下文的一部分,和卷积神经网络具有丰富的语义关系描述文本信息功能。

之间的关系的能力获得特性表示之前和之后的文本信息是弱,格勒乌网络模型和神经网络模型对学习有好的影响的序列信息在长距离依赖关系。因此,本文提出了格勒乌网络模型提取的语义关系描述和事实部分,格勒乌网络模型和卷积神经网络融合成一个新的CNN-GRU网络结构模型。实验比较过程中常用的文本分类模型,融合CNN-GRU模型结构取得更好的结果在法律情报解决法律问题的建议。聚合的结构基于CNN和格勒乌CNN-GRU模型图所示7。融合GNN-GRU模块化结构分为数据输入层,嵌入层,卷积层、汇聚层,格勒乌层和输出层。

的主要过程的结构融合基于CNN和格勒乌CNN-GRU模型分为以下部分:

3.3.1。实验过程和结果分析

使用卷积神经网络作为文本分类方法,输入数据应该首先被处理,和文本数据将被转换成向量通过嵌入,其次是卷积层提取文本特征表示,然后通过池层压缩特性表示通过卷积神经网络提取主要特征表获取有效的文本数据的特点。然后,序列模型格勒乌层。long-dependent信息的文本信息进行描述,最后,分类函数计算获得目标类别。文本数据分类的目的是实现,然后法定情报法的推荐任务。卷积神经网络的具体过程为例描述和数据处理部分,如图8

3.3.2。卷积的层

卷积层的主要功能是提取的特征描述和部门,和卷积的主要结构层主要有价值共享的特点,本地连接,组成多个不同大小的回旋的内核。本地连接和权重的主要份额。

用例描述和这个词嵌入矩阵的事实信息的一部分,多个不同大小的卷积核的作用是主要的。使用的功能是提取的特征为例描述信息,因为不同的细粒度的信息提取的信息用不同粒度是使案件的特征描述和事实的一部分文本信息提取更符合原意的表达。卷积与多个卷积内核层,其中一个可以被表达,在高度h和宽度k h单词卷积操作,输出特点表达如下: w是卷积粒重矩阵参数,x+ 1表示输入的特征表示,年代代表的特征表示输出,b代表了一种偏见,和f代表一个非线性激活函数模型时使用的培训学习。

ReLU函数作为激活函数来加速收敛,并表示如下:

卷积内核w和输入层复杂的一次性对于每一个卷积,即。,相应的特征映射(s∈R“ht)表达式如下:

3.3.3。汇聚层

在描述和事实的法律文件的一部分,文本向量在每个卷积核,卷积和地方特征向量使用每一个回旋的内核。CNN-GRU网络模型采用最大池操作。在文本分类的过程中,作为主要提取重要的字可以代表整个文本表示,使用最大池操作可以实现这个函数获得最重要的特性的描述和事实的部分。

3.3.4。格勒乌层

卷积层的操作后,池的输出层用作格勒乌的输入层,和每个池输入向量可以被视为当前时刻t数据输入x在格勒乌模块。格勒乌的数据输出t是如方程所示8

3.3.5。数据输出层

向量输出格勒乌网络模块发送将Softmax函数分类器进行分类。

3.4。实验结果和分析

本节的主要内容是介绍实验中使用的数据集,该部门的训练集,验证集和测试集,数据集的具体形式存储。在实验期间,CNN-GRU的参数设置融合模型的神经网络模型,和实验结果的融合网络模型与其他模型的结果进行比较和分析。

3.4.1。实验数据集

本章实验数据集的数据集是基于第一阶段的2018年中国“法律研究杯”法律智慧的挑战。

CAIL2018-small数据包含196000仪器样本,包括150000年的训练集、验证集,16000和30000的测试集。在这些数据,共183条法律。在json格式的数据存储,数据为每个行为的一部分,和每一块数据字典。以下表格的数据是:

行为:事实描述
元:注释信息,包括:
罪犯:被告(每只包含一个被告)
punish_ of_钱:好的(单位:元)
指控:有罪
relevant_ _articles:有关法律
term_ of_监禁:句子
句子的格式(单位:月)。
death_处罚:是否为死而死
life_监禁:不定
监禁:监禁入狱
一个简单的数据如下:
{
“事实”:

“湖南宁乡县境内的人民检察院,指控:大约在17:00点8月1日2016年,被告,

X罗,受害者X领域的X, Shuangjiangkou镇,宁乡县境内,由于农田灌溉。在冲突期间,被告周xxx罗受伤的受害者的鼻子用拳头xxx。后标识:罗Moumou受伤是一个轻伤的第二学位。案件发生后,被告周XX补偿受害者罗XX为各种损失9000元,获得宽恕受害者罗XX。

“元”:
{
“relevant_文章”:[234],
“指责”:“故意伤害”,
“punish_ of_钱”:0,
“罪犯”:“周X”,
“term_ of_监禁”:
“death_点球”:假的,
“监禁”:6,
“life_监禁”:假的
}
}
3.4.2。实验参数设置

具体的实验环境配置表中给出了在这一节中12(1)预处理数据,删除后暂停的话,个人姓名、地名,和其他相关信息,文本数据的长度基本上是在500,和每个文本数据的长度设置为500年的实验。结束的结束并不足以弥补0,这样每个案例描述和事实部分是统一的,一个长度的有效输入训练神经网络结构。(2)断路器的工具这个词中文文本数据在本节选择断路器工具基于Python编程语言Jieba词断路器的工具。(3)词向量:本节实验使用Word2Vec工具由谷歌开发的Skip-gram模型Word2Vec工具处理文本数据预处理后,得到分词后的文本,300维向量为每一个词在文本中。(4)卷积神经网络模型的输入数据向量维数是300。能够获得更多的维度的情况描述的特点,卷积层使用三个卷积核大小、(3、4、5)。每个卷积核的大小是32。操作池层使用的最大池,池内核大小是4。有效矢量Softmax池层发送输出。辍学的函数分类器分类和训练策略,最后,推荐的分类预测方法实现的描述。在培训过程中使用的hyperparameters表2

3.4.3。实验结果和分析

获得每个模型的性能的综合评价,预测准确率(acc) %, microaverage (F-micro) %,和macroaverage (F-macro) %主要用作评价指标在实验过程。Microaverage (F-micro) %和macroaverage (F-macro) %也作为评价指标的预测任务提出的问题在其他模型实验。评价模型的有效性和实用性,FastText是用于合法的建议问题的任务。结果TFIDF + SVM,卷积神经网络(CNN),和融合CNN-GRU网络模型提出了这一章比较在相同的数据集使用评价指标准确率(acc), micromean (F-micro) %,和macroaverage (F-macro) %。使用不同的模型的实验结果在同一数据集给出了表3

从上面的实验结果,可以看出,当使用精度评价指标时,FastText, TFIDF + SVM, CNN, CNN-LSTM,和熔融CNN-GRU网络模型实现相对较高的准确性,因为数据预测183年的法律,一个multiclassification问题,这个准确率是正确的总体预测精度,如果不考虑。在每个类别的精度情况下,这些模型可以在一定程度上由于不平衡的情况下描述信息适用于每个法律所使用的数据集需要使用microaverages和macroaverages作为评价指标来评估每个模型的性能。从实验结果可以看出,融合CNN-GRU网络模型结构在本章提出在每个类别分类预测。该技术已经有了很大的改进,提高了模型的实用性和有效性在某种程度上,并使人们有可能为辅助判决提供法律建议。在某种程度上,它有望成为一个有效的工具为应用程序的法律智慧。

根据每个模型规则的预测实验结果推荐表中给出3显然,我们可以使用折线图描述前面的每个模型的结果的关系。FastText TFIDF + SVM, CNN模型在文献中所提出的解决方案建议的任务;的整体精度性能好格勒乌,CNN + LSTM,融合CNN-GRU提出了研究。推荐的预测实验结果的折线图模型中的每个模型图所示9

从折线图可以看出预测实验结果推荐的各种模型的方法在图9FastText, TFIDF + SVM, CNN,格勒乌,CNN + LSTM和熔融CNN-GRU模型提出在这项研究中,当使用卷积神经网络(CNN)模型,实验结果表明最低microaverage (F-micro)和macro-average (F-macro)的准确性。在高数据的情况下,可以得出结论,在大量的数据和不平衡数据,CNN模型处理大量的文本数据,和CNN的能力模型中提取文本信息功能很强;然而,当有数据,提取文本信息功能的能力是弱。使用格勒乌网络模型来处理相同的数据集。准确率,micromean (F-micro)和macroaverage (F-macro)值相对较近(文本分类是一个二进制分类时,每个类别对应一个回忆和准确率,评价是一个类)。在分类精度,n二进制分类评估,整个分类系统的总体性能可以评估这些个体分类的准确性。全面调查的精度和召回率n二进制分类混淆矩阵,macroaverages microaverages需要使用n二进制分类混淆矩阵。从这可以看出,格勒乌网络模型表现良好在提取文本信息功能不平衡条件下的数据量。聚合CNN-GRU网络模型提出了结合两种模型的优点的CNN和格勒乌形成新的网络结构模型作为模型来解决法律问题的建议。从图9可以看出,在每个模型的实验结果,提出了融合。

CNN-GRU模型试验的结果达到了最好的结果。因此,提出了融合的有效性CNN-GRU网络模型进一步验证。根据实验结果数据,列图表每个模型方法可以获得推荐的,和不同评价指标的fastText之间的区别,TFIDF + SVM, CNN,格勒乌,CNN + LSTM和融合CNN-GRU模型提出了清晰可见的准确性(acc), micromean (F-micro)和macromacro不同。

从图可以看出10FastText, TFIDF + SVM, CNN,格勒乌,CNN + LSTM和熔融CNN-GRU模型提出,总体精度而言,FastText, TFIDF + SVM, CNN, CNN + LSTM,融合CNN-GRU模型是行为端正的在文献中提出的模型。TFIDF + SVM组合模型来实现最好的结果,TFIDF frequency-inverse文本单词频率是有两部分组成,如特遣部队和IDF, TF在哪里这个词的频率,可以理解为每个单词的频率统计信息出现在文本数据和文本数据的功能。后提取特征,然后结合支持向量机算法形成了TFIDF + SVM模型算法,由于支持向量机算法是基于统计学习的理论基础,和文本数据是由矢量化文本训练来获得更高的分类精度。因此,它可以知道的前提下提取有效特征的文本数据,然后通过分类器的良好性能,可以实现模型的更好的分类性能。准确率(acc), microaverage (F-micro)和宏也可以看到从图10

平均(F-macro)有不同的评价指标,通常更多解决问题的任务提出了其他模型;提出融合CNN-GRU网络模型提出在这项研究中,根据法律文本数据的特点,提取的案例描述和事实的一部分信息特征提取和使用案例描述和事实信息的一部分特征,获得最好的性能指标。进一步表明,提取的聚合CNN-GRU网络模型具有一定的实用价值,在一定程度上,它将帮助有关司法人员提高工作效率。

4所示。结论

提出了一种融合CNN-GRU网络结果模型使用一个文本分类卷积神经网络与神经网络结构格勒乌神经网络模型结构进行推荐法律的任务。实验验证后,融合CNN-GRU结构模型,提出了实现好的结果,这提高了卷积神经网络只提取整个地方特色来代表整个文本的数据,因为例描述之前和之后,相关的上下文,和一个不能使用卷积神经网络结构。本文描述和事实的一部分案件提取使用卷积网络结构。提取文本数据的语义表示使用格勒乌网络结构模型,最后,Sofmax函数用于有效的分类。通过实验数据集训练模型,结果表明,本文提出的融合CNN-GRU模型结构可以获得有效的特征表示和可以获得背景丰富的语义表征,可以达到更好的结果在multicategory标签分类任务,具有一定的实用价值。

前景:人工智能技术仍处于发展的初级阶段。理论技术需要进一步发展。法院判决问题相关的各种条件因素。因此,法律情报想达到同样的判决人类智慧。还有很长的路要走,要做大量的工作任务。本文在深入学习是基于法律情报任务。虽然有一个阶段的初步结果,但仍有许多任务需要探索和研究的领域。在未来,我们将准备进一步研究和探索以下问题:(1)在文本分类的过程中,首先需要预处理的数据。提取关键信息,然后输入到模型;如果模型改进,数据模型的要求不是很严格,可以完成文本分类任务输入原始数据,这是一个重要的问题,优化神经网络模型结构在未来或提出一个新的分类模型。(2)在法律情报问题,特别是在犯罪预测、法律建议,和句子预测任务,本研究主要研究犯罪预测和法律建议的任务,并将进一步探索和研究句子在未来预测。研究尝试使用区间划分方法和逻辑回归算法来解决这个问题。

数据可用性

标签数据集用于支持本研究的发现可以从相应的作者。

的利益冲突

作者宣称没有利益冲突。

确认

这项工作是支持的项目保定市科技局(保定基层的建设策略研究智能法院AI的背景下,2140 zz029)。