文摘
为了解决存在的问题在当前的决策算法,如数据处理表现不佳,低决策正确性,和长时间的决定,一个自动决策算法的刑事司法解释对基于数据活动顾问设计。根据需求合理设计顾问系统数据活动,要求数据活动顾问提供数据处理要求和范围。使用Scrapy web爬虫框架爬数据相关的刑事司法解释和刑法规定从相关网站,和清晰和提取收集到的数据,实现数据的查询。基于获得的数据,刑法功能的设计,和刑事司法解释的决定。C4.5决策树算法是用来预测正确的决定。刑事司法解释的决定正确的调整不断根据预测结果达到的目标自动决定刑事司法解释的权利。实验结果表明,该算法具有优越的数据处理性能,高决策正确性,决策时间短,验证了算法的有效性。
1。介绍
的个人资料活动顾问系统最初是在德国出生的。依照第四条,第一款,联邦数据保护法案(1)、公共机构和私人法律科目(除了私人公司少于9人)自动收集、过程,和使用个人数据或,否则,个人处理数据,至少有20永久雇员。preinspection私人话题,进行自动数据处理,传输或匿名化个人数据业务,或数据处理自动化市场或研究目的必须任命,在写作的时候,一个永久的顾问的个人数据的活动。如果没有指定个人数据活动顾问或不这样做,在规定时间内或规定的方式,或者如果一个指定的个人数据活动顾问不合格或不值得信任,企业承担行政罚款不超过€50000。
数据活动顾问应该有常识的数据保护和必要的知识相关企业的特定数据的活动。虽然刑法只需要个人资料活动顾问拥有必要的技能,不需要特定的职业培训,在实践中,通常要求个人资料活动顾问有“技术背景。“个人资料活动顾问非常专业,所以他们可以直接读取算法,比普通人更容易发现问题和行政官员。个人数据顾问本身是员工的企业,和企业的商业秘密保护的企业和个人数据之间的信任关系顾问。奥巴马政府还一直在适当的谦虚,多亏了顾问的个人数据的活动。在德国,个人数据活动顾问一直发挥着重要作用在调节企业数据的活动。通过强调自我控制对数据行为的原则,政治体系力求避免干扰企业的日常经济活动和最大化尊重企业自由。
刑法司法解释是一种权威的解释和刑法的影响,它是中国最高水平的试验。在刑法的具体应用,检察机关直接阐明刑法规范的内涵和外延,各级检察机关应当遵循的试验(2]。因此,刑法司法解释具有重要意义对执法人员和公民正确理解刑法规范的确切意义和适用范围。也是其中的一个重要手段实现,最终实现立法目的反映和体现了刑法规范(3]。所以本文将讨论数据活动顾问,该系统应用于决策的刑事司法解释使政治系统防止大规模目标实现的风险。特别是有关刑事司法活动和一些合理的解释和建议4),这也将有助于缓解行政机关的压力,避免政府官僚主义弊端,保证社会稳定(5]。然而,大多数当前的决策算法是基于人工智能(6]。然而,在实际应用中发现,该算法数据处理表现不佳等问题,决策准确性低,和长时间的决定,其实际应用效果不好。
因此,本文主要进行自动的设计决策算法的刑事司法解释与数据活动顾问为核心,以提高专业和刑事司法解释正确的决定的正确性,促进企业和社会的进一步发展在一个安全的和稳定的方式。
2。设计的自动决策算法的刑事司法解释的权力
在下面几节中,我们提供的细节决定算法的刑事司法解释。
2.1。刑事司法解释电力数据处理基于数据活动顾问
为了提高刑事司法解释权力的自动决策的准确性,有必要设计一个合理的数据活动咨询系统。因此,本文着重于系统的设计,以及具体要求如下:(1)数据活动顾问应专业、可靠和满足资格要求在刑法中指定。(2)如果它不履行义务的,应当给予行政处罚。(3)的数据活动顾问有义务保密,不得披露由于他的地位获得的商业秘密。(4)数据活动顾问应积极传授活动合规知识相关人员。(5)数据活动顾问应当参与设计、检验和评价算法和编写和保存算法报告。(6)数据活动顾问应当定期收集刑事司法信息。(7)摘要数据活动有效地创建多系统连接分深入顾问刑法应当积极配合部门。(8)数据活动顾问有权寻求帮助和支持活动监督管理机构的数据。(9)如果数据活动顾问忽视履行职责或提交一个违法行为会同有关部门,应当承担连带责任。
因此,通过活动顾问系统的数据,内部刑事司法机关应被理解最大化数据的合规活动在不影响刑事司法的有效性。今天,广泛应用的算法和机器学习的快速发展,数据活动顾问可以充分发挥整个数据采集过程的角色刑事司法解释的权力。因此,数据活动顾问必须了解数据处理程序和通知的时间实现一种新的算法。只有这样他们才能得到足够的时间来理解和做出正确的决定在刑事司法解释的力量。本文以活动顾问为核心的数据收集和处理数据的刑事司法解释的力量来为后续算法的研究打下坚实的基础。之前收集和处理数据的刑事司法解释,设计一个合理的数据活动顾问系统根据相关要求,要求数据活动顾问给相关数据处理需求和范围,使用Scrapy网络爬虫框架爬刑法规定和其他相关数据正确的刑事司法解释的相关网站,并清理和提取原始数据的数据查询和显示,实现刑事司法解释的权力。
刑事司法解释能力的数据处理架构包括三个模块:数据采集、数据处理和查询显示。数据处理的基本框架体系结构如图1。
2.1.1。数据收集模块
刑法和相关内容的研究需要大量的刑法内容支持。因此,目标数据收集包括各种刑法规定。数据采集模块使用Scrapy框架和硒测试工具访问相关网站,在网站中提取文本数据,并将其存储在MongoDB数据库后的后续处理布隆过滤器去除(7]。
介绍了Scrapy爬虫的实现通过一个网站的刑法。首先,使用硒和PhantomJS测试工具来访问该网站的主页,模拟浏览器渲染,并直接获取呈现的页面。然后,BeautifulSoup找到导航标签用于反馈响应信息,获得各种犯罪规定的URL地址开始,和落实deep-first搜索策略爬犯罪规定的数据(8]。通过观察,发现每个刑法文章是caseName的标记名称。通过获得的超链接地址信息标记一个接一个,每个刑法文章的URL地址可以通过连接地址与以前的类别。这时,布隆过滤器用于URL deprocessing和目标URL传递到布隆过滤器检查网址是否存在于集合(9]。如果集合中的URL地址已经存在,它将被放弃;否则,它将排队和散列映射后的地址将被添加1 (10]。最后,从复述,请求队列读取URL地址进入身体的接口刑法的文章。相关信息,如标题、正文内容、和执行刑法的文章数量。请求中的do-cld属性值作为刑法的惟一标识符的文章和存储在MongoDB数据库(11]。
2.1.2。数据处理模块
所获得的数据的爬虫是粗糙和不利的对于后续的检索和分析,数据处理模块采用提取和处理收集到的原始数据,从文本中提取关键信息。通过分析刑法规定的一般格式,适当的匹配模板的目的是提取关键信息并将其存储在MySQL数据库。此外,Jieba分词和术语Frequency-Inverse文档频率(TF-IDF)操作进行刑法的内容文章提取每个刑法文章便于后续的关键词检索和分析。
在文本关键字提取部分,Jieba分词(12)和TF-IDF技术采用。Jieba分割模式有三个词:精确模式,完整的模式,和搜索引擎模式。此外,它可以标记词分词后。自从精确模式将句子准确,适用于文本分析,本文采用这种模式对于分词(13]。为了提高语言的准确性,通过大量的研究和分析刑法条款,本文商店定制关键词Jieba用户词典和设置演讲的一部分新西兰。在刑法的规定,名词和动词可以更好地反映刑法规定的内容。因此,文本分割是提取后词类(名词)(动词),(自定义词)和模型导入到袋的话语;关键词的出现频率计算,词的频率小于5次被淘汰,以减少错误的分词和其他因素的影响后续处理。然后TF-IDF操作进行犯罪规定的提取的关键词。与此同时,为了提高关键词提取的准确性,克服缺陷TF-IDF不能反映词的位置信息,本文部分犯罪规定,加强关键段落的内容(14]。
Tf-IDF权重计算方法用于评估的重要性词分词后的文本。这是常用的在纸矿业等领域和关键字提取(15]。常见的公式如下:
其中,关键字出现的次数在刑法的文章是单词的总数在刑法分词后的文章。刑法的文章的总数,刑法的文章包括关键字的数量吗 。从这个公式不难看出,尽管常见词经常出现在刑法的规定,即:是一个很大的数,也有许多包含这个词的刑法规定,也就是说,也是一个很大的数,导致单词在逆文档频率接近0和体重减少[16]。因此,可以看出TF-IDF会过滤掉常用单词和保留重要的单词。后计算的TF-IDF价值词在每一篇文章的刑法,最高的五个字重量值存储在数据库的关键字代表刑法规定为方便后续查询(17]。
2.1.3。查询显示模块
(1)检索显示功能的实现。数据检索的部分是基于SQLAlchemy的框架,它提供了一个SQL工具和对象关系映射工具。开发人员可以进行持久化操作数据库的面向对象,提高了开发的效率。具体使用步骤如下:(1)设计所需的模型文件中的实体。实体类继承基类的实例和字段名称和属性与相应的MySQL表结构一致。(2)由create_engine创建MySQL数据库连接()方法,将数据库表与模型文件,并设置会话对话框。(3)模型文件和会话对话框导入视图文件,然后使用MySQL数据库表的查询操作方法下相应的路由地址。用户可以执行多维检索操作的数据根据不同的查询条件搜索和查询页面。客户端通过检索字段到适当的路由器通过Okhttp路径地址,和SQLAlchemy匹配请求字段并将处理的结果返回给客户端。此外,为了确保用户体验,避免资源的浪费,分页模块是程序执行分页操作数据的刑法规定,提高系统的使用效率。当用户滚动列表底部附近,后台自动向服务器发送数据请求加载新数据和更新当前界面。请求时间短和接口更新很快,这提高了系统的鲁棒性。后点击刑法的一篇文章的标题,页面将跳转到详细信息页面的查看具体内容条刑法刑法。此外,点击摘要按钮在右上角的细节页面触发工具栏导航栏,显示了刑法关键信息的文章。
(2)推荐功能的实现。使用查询功能时,用户可能没有直接输入查询条件,但需要类似的结果。如果有推荐功能,为用户提供一些刑法规定相关查询条件,这对于用户来说非常方便。
推荐是基于Word2Vec函数,利用TF-IDF技术重量词向量。加强关键词在刑法的文章的影响,有效地使用词向量来表达刑法文章,计算词的距离向量刑法文章的余弦相似度公式,并推动刑法最类似于前五的文章。这个过程分为两个步骤,如下所示:第一步是生成一个向量模型的刑法文章:首先,收集到的刑法的文章被分词预处理去除符号和数字,和相关的词性词(名词,动词,和自定义词)中提取的词类。然后,训练样本导入Word2Vec,每个单词的词向量是通过使用Skip-Gram模型进行训练。然后,每一篇文章的刑法分为单词,每个单词的词向量及其TF-IDF词频体重值加权平均,从而得到文档向量和索引的列表刑法的文章和生成矢量模型。第二步是余弦相似度计算:在页面上的显示界面到刑法、刑事法律的规定将所有文档在文档向量和向量模型向量的余弦相似性计算和结果的相似度排序和取出前五名的文章索引列表与相关法律建议用户界面。
其中,和代表不同的刑法文章向量,和表示向量的分量和 。
2.2。设计的自动决策算法的刑事司法解释的权力
至于刑事司法解释的力量,它可分为刑法的多种元素。一个 - - - - - -维数组的作为每个特征属性的名称在适当的状态,每个元素的属性和相应的值相应标记成吗 。作用下的具体应用情况 ,一个特定元素的特点在哪里 ,刑法刑事司法解释权力的一般特征阵列状态可以表示为
目前,大数据储备刑法案件和刑事法律关系数据库在中国显然是不够的,还缺乏相应的分词语料库和刑法的集成语言。因此,如果智能决策函数通过机器学习是必要的,它只能依靠人工整理相应的样本数据库。为了解决这个问题,一个培训数据库特定类的需要建立的关系。数据库的字段和记录结构如表所示1。
行记录的总数 ,上述标准刑法的每一行识别一个特定情况中包含的数据记录,字段的名称用于指示的名字吗元素可以包含在刑法的关系,和刑法领域记录观察结果的关系模型下的情况 ,行动的原因,对应于历史决定的结果。不同的原因对应不同的刑事法律关系。根据实际情况,可以形成不同的刑法关系数据库中的样本,然后 - - - - - -维数组可以在每个记录形成的价值 。应该指出,刑法类型的观察结果的关系模型是有限的。虽然代表的值观察结果一致在数据集的价值最终将出现在数组的成员吗 。与此同时,字段根据实际的决策结果形成每个记录的情况下,在每个字段和记录的一般公式值表中可以看到吗1。
在每个字段的值,因为特征属性,构成特定的刑事法律关系的二态性通常只有“是”和“,”字段的值在每条记录可以表示为相应的“1”或“0”。同样,字段的值通常是1或0指示是否正确。至于字段的值 ,因为这个领域不需要参与具体的数据化运营,和这个字段是本质上的观察结果记录行,它的值可以是任何类型的数据。为了方便本文的演示,在字段,从1开始连续自然数是指刑法的每个子类的关系模型,从而形成一个特定的数组 ,使初步决定刑事司法解释的权利。
为了实现正确的预测率决定的刑事司法解释的权利,要解决的第一个问题是如何总结刑法分散的数据到一个特定的刑法的关系模型。在这方面,本文建议应该建立一个完整的刑法的关系数据库根据上述数据样本集,然后一定刑法数据可以用科学的数据分类算法分类。因此,决策树分类算法的核心是选择最合适的特征属性作为分支节点,以便它可以更准确地预测每个样本的分类,和树的大小尽可能小,从而建立一个合理的连接与刑事司法解释的决定的目标,成为最合适的分类算法。比较了三种不同的主流决策树表所示2。
本文指的是古典的C4.5算法,刑法的分类情况适当改进。以下三个步骤来实现刑法的分类关系模型。(1)合并行具有相同特征值的记录因为决策的刑事司法解释的力量追求最大程度的正确性,刑事法律关系的模型基础学习和培训应该是尽可能全面、简洁。在这种需求的要求下,训练样本集表所示1具有明显的缺陷。在此基础上,刑事司法解释权力的数据应该整合和优化。为了实现准确的决策树分类,只有最精确的观察结果记录应保留在刑法的关系数据库中。简而言之,是合并所有不同的记录行相同的特征值,只保留一条记录行不同特性值记录。事实上,场决策结果没有与刑法关系模型的建立,所以这个领域可以直接删除或忽略的刑法关系模型基础。因此,最全面的样本的各种刑事法律关系的发生概率模型可以在理论形成的状态。此外,由于考虑的可理解性刑法关系模型的数据库,可以人为地补充丢失的记录行所有可能的形式记录在理想状态,使刑法关系模型数据库完成。 合并后的记录行后,分裂特征属性的信息熵每个组成元素可以根据上面的方程,计算代表的记录行数满足特定条件结合刑法关系模型基础。良好的分割信息熵计算可以直观地显示某些特征属性的复杂性。熵值越高,就越不稳定中相应的刑法构成要件的理想状态,和更可行的它会改变到其他类似的构成要件。(2)计算特征值的信息增益信息增益是数据属性的另一个指标不同于信息熵在科学数据的基本理论。更重要的一个属性的影响观察结果,分类的不确定性空间将被淘汰,也就是说,将提供更多的信息分类。从刑事法律关系的模糊性的角度来看,如果某一本构元素更重要的是刑法的确定关系,其相应的形式元素属性的数据样本集不太复杂,也就是说,信息增益更大,更容易确定的刑事司法解释权力的决策过程。因此,下面的公式计算得到的组件元素 本文提出,这是类似于数据信息增益的计算方法科学 代表观察到的结果的类别信息熵的刑法关系模型的数据样本,和是指特定的属性的信息熵 。数据结果,相应的本构信息增益元素可以反映了确定性和准确性的大前提和小前提犯罪推理的过程。(3)递归构造树模型后分裂的信息熵和信息增益的计算本构元素在前两个步骤的信息增益率特性这个本构的元素在一个特定的示例数据集可以根据获得的信息增益率的概念定义信息科学根据下面的公式,和一组由所有特征属性的信息增益率可以形成的。
根据上面的信息增益率形式的集合中,选择一个最大的值作为一个特定的标签数据集第一次分类属性;因此,二进制或叉形式的数据集,再上面的三个步骤的基础上的递归分类、筛选的每个子样品最大信息增益率点的属性。用这个作为子类化的标签属性。最后,通过递归最小的子类刑法具有相同的观测结果的关系模型;也就是说,它符合构建树的算法目标来确定分类标准,和每个分支节点的标签是明确的。因此,刑法的分类决策树的建设完成后通过学习和培训根据现有数据样本,然后刑事司法解释的未知结果正确的事实可以包含或根据这棵树分类预测模型。
朴素贝叶斯分类方法是基于数学贝叶斯定理和特征属性的独立假设相应的数据。朴素贝叶斯算法获得的数据结论通常以概率的形式呈现。在刑法应用程序的上下文中,朴素贝叶斯算法可以用于预测或分析的风险正确的刑事司法解释正确的决定基于历史数据。实现过程是学习和训练数据样本,得出具体的概率模型按照规定体现在样品。实现概率的预测结论的具体未知事实根据模型和应用模型,建立数据表结构模型的基础上,在桌子上1朴素贝叶斯算法的改进应用在刑法场景和相应的自动决策算法的实现刑事司法解释正确的解释如下。
朴素贝叶斯算法下的概率模型是根据训练样本的观测先验概率预测后验概率但是需要假设先验概率计算工艺条件是相互独立的,没有十字架之间的关系,但前提是刑法的基本情况,可以按照它;科学理论的本构要求刑法的基本是独立的元素。因此,在这个前提下,先验概率的计算公式可以从已知事实的结合特性推导出元素对未知的纠纷,符合本构元素的所有功能分类下的包容和吸收 代表观测结果记录的所有数据的准确性,和 代表每个特性的相应精度的情况下匹配每个特性的价值特性集的事实。
此外,它也是必要的计算总概率 每个特性的值的实际特性集,也就是说,正确的和速率和误码率为每个条件的价值功能。计算公式如下:
因此根据贝叶斯定理,从先验概率和概率的结果推断出特定刑法关系模型下的刑事司法解释精度概率模型,概率模型的现实意义是历史的决策结果和未知的刑事司法解释决策过程;结果建立了一定的联系,前者为后者提供了一个合理的预测。
如图所示在上面的方程中,得到的后验概率的某些特征元素的组合,这个方程是正确的预测利率的决定刑事司法解释的力量形成的刑事法律关系的构成要素。当正确的概率率高于0.9,它通常被认为是刑事司法解释的决定力量高,结果可以直接输出。然而,如果概率低于0.9,需要不断调整的决定结果,从而达到改善的目的的正确速度自动决定刑事司法解释的权力。
3所示。实验验证和结果分析
3.1。实验设计
为了验证自动决策算法的有效性的刑事司法解释权力基于数据活动顾问,一个实验设计。具体的实验环境如表所示3。
由于刑事法律关系的复杂性,组成元素的数量相对较大。本文以一个简单的刑事法律关系7元素为例,将所有的数据样本和参与算法实现。在此基础上,所有相关的司法解释信息刑法的规定将收集,收集到的数据将被清洗和处理,将作为实验样本数据,以验证判断算法。
3.2。实验结果分析
为了验证设计的自动决策算法的有效性的刑事司法解释与数据活动顾问为核心,数据收集,处理和查询在不同数据水平是第一个测试。具体结果如表所示4。
与实验数据量的增加,本文算法的数据采集、处理和查询时间会上涨,和500 GB的实验数据的情况下,该算法的数据采集、处理、和查询时间达到最大值,最长时间为1.37的数据收集、数据处理时间最多1.42 s。数据查询时间是0.61秒,数据收集、处理,该算法较低和查询时间,达到了研究的预期。在上述基础上,本文算法的决策正确性比较基于人工智能的自动决策算法。决策正确性是指之间的相似程度,不同方法的决策结果和当局的决策结果。具体的比较结果如表所示5。
通过分析表中的数据5,我们可以看到自动决策的准确性的刑事司法解释的力量这个算法是96.9%在最高和最低的93.8%。刑事司法解释权力的自动决策的准确性基于人工智能算法是86.5%在最高和最低的71.9%。相比之下,基于人工智能的自动决策算法,自动决策的准确性刑事司法解释这个算法更高的力量,可以打下坚实的基础的分析和研究刑事司法解释的权力。
最后,这个算法的决策时间和基于人工智能的自动决策算法相比,比较结果如图2。
通过分析数据在图2可以看出,刑事司法解释的自动决策时间的算法在本文从0到0.65不等,和刑事司法解释的自动决策时间的基于人工智能的自动决策算法从0到2.39不等。与基于人工智能的自动决策算法相比,刑事司法解释的自动决策时间的算法在本文更短。整体运行效率较高,和刑事司法解释的自动决策权力可以实现更快。
4所示。结论
刑事司法解释权力的自动决策算法不仅是一种刑法问题,但也是一个政治和经济问题。政治体系需要防止社会动荡造成的大规模的伤害。因此,设计具有重要意义的自动决策算法刑事司法解释的权力。因此,为了解决目前算法存在的问题,如数据处理性能差,决策准确性低,决策时间长,本文设计一个自动决策算法的刑事司法解释与数据活动顾问为核心。根据要求,数据活动顾问给了相关的数据处理需求和范围、收集刑法规定和其他数据通过使用Scrapy网络爬虫框架,过程收集到的数据,并提供了数据查询和显示功能,以完成数据处理的设计架构。在此基础上,刑法的特点设计,和刑事司法解释的决定力量。C4.5决策树算法预测决策的准确性,以及刑事司法解释的决策权力不断调整根据预测结果,从而达到自动决策的目标刑事司法解释的权力。实验结果表明,该算法的最大数据采集时间1.37秒,最大数据处理时间是1.42秒,数据查询时间是0.61秒。数据采集、处理和查询时间很低。刑事司法解释的最高精度的自动决策权力是96.9%,最低为93.8%,和决策时间从0到0.65不等。 It can realize the correct and rapid decision-making of the power of criminal judicial interpretation and can provide important theoretical reference for relevant research.
数据可用性
使用的数据来支持本研究的发现可以从相应的作者。
的利益冲突
作者宣称他们没有竞争的经济利益或个人关系可能出现影响工作报告。