文摘
社区数量显著增加,环境变得复杂。有问题,如贫困信息收集社区公共服务信息治理,缺乏相关的分析标准和模型,和不可靠的预测结果。为了预测和管理社区的风险信息,本研究分析了社区的公共信息通过协作深度学习模型。首先,信息特征因素影响社会风险的选择基于相关分析理论。其次,卷积神经网络用于深度学习的模拟社区风险预测模型。最后,通过模型预测结果的比较分析,可以得出结论,提出了预测模型的准确率达到92.5%。一个有效的合作深度学习模型用于管理社区公共服务信息。
1。介绍
社区公共服务信息的分析和研究直接影响着社区公共安全的治理。只有良好的社区安全管理环境能有效保护广大人民的利益。我们党高度重视这一点。在19日全国代表大会的报告,提出沉社会治理基层(1]和发表意见加强社区公共安全防控体系建设相关的政府网站,强调社区治安防控的重要性2]。社区风险量化的一个直观的指标是社区治安案件的数量。通过研究社区公共服务信息,准确的预测数量的社区情况下不仅能有效地预防和减少社区公共安全的情况下,还提供辅助支持有关公安机关(3),以提高打击的能力相关的违法犯罪行为,减少社区治理的风险,更有效的使用和分析社区公共服务信息。目前,大部分研究社区公共服务相关信息治理以盗窃的风险事件为计量标准(4]。盗窃最常发生在社区,它通常被认为是盗窃是最典型的案例类型的社区。然而,基于实际情况,其他类型的情况下的预测结果也很重要风险治理5];与此同时,大多数现有的预测模型是基于卷积神经网络,但是现有的分析神经网络预测模型基本上是单通道(6]。摘要现有的单通道提高预测模型和多通道卷积神经网络预测模型用于提高预测模型的准确性。更好适应太多的特点特征因素和各种类型的社区治安案件。同时,自然灾害的影响是增加了整体风险预测,从而大大提高了模型预测的准确性。因此,本文综合考虑各种各样的案件类型,需要各种各样的案件类型作为一个整体,并通过多通道卷积神经网络模型预测。
最后,是说一个大的预测与实际值之间存在相关性车回归树预测模型。结果,预测性能更好。此外,的实际值和预测值之间的关系综合预测模型是好的。综合预测高于单一预测模型及其预测的准确性也更高。
最初,这项研究组织和检查收集到的数据。特色社会保障影响因素初步选定用相关分析理论。无关紧要的因素是通过数据清理建立可靠的数据来源。其次,基于深度学习的卷积神经网络预测模型建立的最终改善单通道卷积神经网络和多通道的使用卷积神经网络扩大数据接受和神经网络的预测能力。实验结果表明,预测模型的准确性达到92.5%,高于单一的预测模型。相比之下,第一次模拟考试模式,集成预测模型具有较高的精度和鲁棒性。最后,合作深度模型计算实现社区公共服务信息和管理社区风险。
剩下的纸是组织如下:(我)部分2提供了一些好点的相关工作(2)部分3详细介绍了该方法(3)部分4分析并讨论了结果(iv)部分5总结了论文
2。相关工作
社区公共服务信息分析和治理是一个非常复杂的项目,和信息往往是巨大的。然而,在信息处理的过程中,经常有问题,如人力不足,运营成本高,无法快速响应处理结果(7]。然而,深入学习算法的出现和发展近年来展示他们的强大的预测能力。因此,近年来,深度学习技术是国内外广泛使用的分析和预测社区公共服务信息,以实现公共服务的协作治理信息(8]。例如,孟菲斯警察局进行了分析和预测,社区公共服务信息通过深入的学习模式,大大减少了暴力犯罪在过去的五年里。同时,发现大数据分析和预测的准确性基于深入学习远远高于传统方法(9]。基于深度学习模型,社区公共服务信息的预测在中国比在国外开始晚一点,但近年来也取得了很大的进步。例如,天津大学进行的研究建立一个智能和安全的社区,社区公共服务信息预测的基础上,深入的学习模式和社区提高治理效率(10]。
中国学者思敏和其他人联合社区信息数据和相关犯罪数据建立一个社区犯罪率分析和预测系统基于数据挖掘方法(11]。在此基础上,李,李12)提出了一种基于深度学习犯罪预测模型和算法模型大数据分析。目前,常见的算法是随机森林算法。肖和勇13)提出了退化决策树算法基于随机算法获得准确的预测结论。以上海为例,云施和其他人建立犯罪磁化率之间的定量关系和社区公共服务信息特征因素基于深度学习算法,分析了影响因素的动作方程(14]。分析和研究的一些社区空间位置数据和犯罪时空,他和其他人识别和分析了盗窃空间聚合区域通过社区个人位置数据集群和集群的帮助下GIS数据分析软件和空间分析工具基于最近邻指数分析方法(15]。根据不同类型的社区公共服务信息和预测对象和技术,深入学习网络模型也不同。例如,模糊反向传播(BP)神经网络模型通常是用来预测社区风险事件的数量。社区活动的时间预测技术通常是基于支持向量机(SVM)预测模型。犯罪时间的相关风险情况下的预测技术是基于自回归支持向量机集成移动Average-Least广场(ARIMA-LSSVM)混合模型。同时,相关学者这理论知识应用于现实,进行大数据研究+智能监控,并建立智能城市AI和大数据。其中,战争流行金盾工程展示了优秀科技成果报告系统的对抗传染病。同时,它覆盖了近40000名居民的健康信息和实时数据的企业在56社区管辖北京经济开发区,提供强有力的保证协作管理的社区公共服务信息。
通过上述研究的国内外现状,社区公共服务信息分析技术而言,我们通常使用大数据分析,快速、高效地分析大量数据基于深度学习网络模型,开展社区风险评估基于现有大数据模型。然而,目前,相对单一评价特征因素。当收集社区公共信息服务的风险因素的特点,大多数研究人员只考虑单个风险事件的特征因素,如盗窃案件,而忽略各类治安案件的特征因素在社区里,导致不完善的社区公共服务信息的收集,从而影响后续的风险评估、预测和治理。此外,第一次模拟考试模型是一个模型由许多弱学习设备。虽然同构或异构学习单通道高于传统预测模型中,多通道的集成学习和弱学习从未执行。
3所示。方法
与深度学习模式相比,传统的机器学习算法具有更糟糕的学习效果当多道训练基地的数量很大,但与此同时,传统的机器学习算法性能更好当训练的数量很低。大部分的数据集用于本文来自社区公共信息和涉及某些保密。因此,数据和基础并不大,性能将优于传统的机器学习算法。因此,我们的预测模型选择决策树模型。决策树模型的一个经典模型算法用于预测在传统机器学习。它的数据量要求较低,容易施工,操作效率高。在决策树模型,本文选择分类和回归树(CART)决策树算法,其算法结构是二分法。车基本上是一个决策树分类算法,构建了一个基于基尼的杂质指数分裂准则。该算法操作重复三个步骤:(i)寻找最佳分割的每个特性;(2)寻找最佳分裂节点; (iii) using the best node split from the first two steps to split the node until stopping criterion is satisfied. The whole algorithm is in the shape of a binary tree, involving classification and regression. Therefore, the algorithm can be used for both classification and regression, which depends on the target task of decision-making. When the prediction result expected by the decision task is discrete data, the Classification And Regression Trees (CART) algorithm automatically generates the classification decision tree. On the contrary, when the large prediction result required by the decision task is continuous data, the CART algorithm automatically generates the classification decision tree. At the same time, when CART generates a classification decision tree, the inflection point of its prediction result is the Gini value according to node splitting. When CART generates a regression decision tree, the inflection point of its prediction result, i.e., node splitting, is based on Mean Squared Error (MSE) (standard variance of prediction result). Since the final prediction result of this paper is the risk degree of the community, and its quantitative index is expressed as a continuous value by the number of community cases, CART regression algorithm is selected here. The specific algorithm is as follows:
首先,确定最优算法的特征选择方法。根据预测数据集的数量和类型,车回归树和均方误差用于测量模型。在公式(1),是实际的观测值在预测过程中,然后呢模型的预测价值。然后,车回归树建立了基于决策树的。通过输入训练集D,它是必要的,以确定阈值样本的数量,以避免影响预测结果数据集的大小和输出决策树T:
在公式(2递归地),训练集划分为两个亚区通过构造一个二叉决策树,和输出值。在这个过程中,变量可以遍历得到最小值对吗 。通过不断调用两个子域除以二分法,输出值 和 满足的条件。然后输入控件分为米根据区域 和 生成决策树t .注意,在公式的应用,如果使用的输入特性,也就是说,没有可用特性,输出值 和 期间将停止分裂操作。如果输入特征元素相同的类,输出结果完全一直处于分裂状态,和二分法操作不再进行区分,分裂的决定将会停止。如果所有的样本已用完了最后一个子节点,节点不再有样本划分和停止分裂。
然而,决策树已经过度拟合现象在执行决策算法预测结果。为了解决这一问题所导致的过度拟合现象培训,我们调整购物车回归的预测结果(回归树的修剪)。通过正则化,学习能力车决策模型的样本数据集可以有效地增加。本文中使用的购物车正规化采用postpruning方法。通过公式生成购物车后回归树(2),交叉验证方法用于验证车回归树的修剪效果,以选择修剪策略与最强的效果。整个过程大致可以分为两个步骤。首先,生成的车回归树是通过不同的修剪策略正规化;其次,车修剪策略的效率和性能验证通过交叉验证的方法。最后,车回归树与最好的效果和性能是选择最终的预测算法模型。具体的算法公式如下:
公式(3)表明,如果没有修剪的过程,任何子树位于一个子节点T的损失值输入数据值的预测过程。公式(4)表明,正规化的过程中,如果只有儿童的数量切,根节点的损失值是保留。与此同时,当零个或无限趋近于零,指数吗切断,保留根节点的损失价值大于失去的价值在任何指数t任何子节点。当继续增加,不平等是逆转,损失价值满足公式(5根据的大小) 。 正规化程度参数,代表了地面深度学习模型的预报值之间的误差算法和输入实际价值。本文选择MSE(方差)来衡量算法的训练数据的拟合程度。C的数量是T回归树的叶节点的子树。的数量是T二分类回归树的叶节点的子树。当是零,正规化程度参数为零;即预测过程不是正规化;然后生成购物车回归号码是最佳的子树。当趋于无穷时,它意味着的正规化程度是无限接近最大值。这时,正则化强度最大,购物车的根节点的数量由回归最优索引数量。总之,0到无穷大之间,就越大值越大,程度的正规化和修剪越强,和小错误生成的最优指数与最初的车号码。当值是常数,损失函数是最小的,当有独特的subnumbers。公式(5)可以计算每个子树是否需要修剪的阈值,然后法官。最后,通过交叉验证,最优正则化值被选为最终结果。总体构架如图1。
基于深度学习的确定算法模型后,我们还需要制定风险识别和评估标准,以判断风险事件。这里的风险评估是指在风险分析和研究的基础上,收集和分析社区公共服务信息通过深入学习模型算法评估风险事件的概率和提供后续评价的基础和根据预测结果处理方法。常见的风险评估方法包括模糊层次分析法、德尔菲法、d - s证据理论方法,模糊综合评价方法。本文中采用的风险评估方法是灾害风险评估模型在报告中提出了“与风险共存”的联合国国际减灾战略局(ISDR)。其具体的评估算法公式所示(6)。 在哪里R代表风险程度,H代表脆弱,V代表灾害风险程度,C代表应急能力。公式(6)评估三个方面的风险:脆弱性,灾害风险程度,和应急反应能力,使风险模型更适合社区公共服务信息的管理和评估可能的风险。的三维评价模型也对应于社区灾难导致的三方面因素,社区脆弱性和社区应急响应社区风险评估的能力。其中,风险程度的灾难导致因素与社区的整体风险呈正相关。风险程度的灾难导致因素越高,社区的整体风险就越大。脆弱性与风险程度呈正相关。脆弱性越高,风险就越大。减灾的能力与社会的总风险负相关。减灾的能力越强,风险越小。
在确定算法预测模型和相关的风险评估标准,我们开始提取社区安全风险因素来自社区的公共服务信息基于深度学习模型。这次的数据来源主要是公共服务信息N社区米城市(以下简称N社区)为主要来源,采集方法是参考网上的材料。本文的数据称为主要的公共安全预防和控制数据米从2017年到2019年,城市天气和气候数据的米从2017年到2019年,城市的二手房价数据N社区从2017年到2019年,等。经过脱敏和简单的现有数据的分析,我们可以看到,在社区风险事件的发生,主要时间是盗窃,但仍有其他案件类型,其他类型的73年每天也占一定比例。可以推断,他们也对最终的预测结果有一定的影响。因此,合作治理过程中基于深度学习的社区公共服务信息模型中,我们必须考虑整体的影响类型和考虑案件类型除了偷窃,而不是只考虑类型占的比例很大,忽略了其他情况下的预测和分析。与此同时,根据心理学家的实验研究、天气对人的情绪有很大的影响。犯罪的环境决定论,也提到环境的质量不仅影响人们的健康,也影响社会和谐稳定超出了我们的想象。因此,在公共服务的过程中信息收集和分析深度模型的基础上,本文还将考虑气候的影响对人们的情绪和气候特征因素添加到最终结果的预测。最后,我们的历史气象数据捕获米城市从历史气象网站。捕捉维度包括日期、天气、风向、风力、最大和最小温度,城市,等。此外,住房是一个重大事件相关国民经济和民生,和房价也对社会稳定至关重要。同时,房价通常用来衡量社区和周围的环境在某种程度上反映了社区居民的生活质量,社区配套设施,安全条件。后的二手房价攀升米城市二手交易房子数据网站,比较病例数相关的时候,我们发现有一定相关性的二手房价和社区风险事件的数量,这种波动在一定范围从2018年3月到2019年12月,和波动趋势是相似的。除了上面的数据,我们也调查了社区的面积和注册居民在社区通过社区属性,社区的地理位置信息,在互联网上和其他公开信息。2017年到2019年的住房价格变化如图2。
在收集数据的过程中,可能会有问题,如数据丢失或错误的值在数据统计传输的过程中,这将大大影响最终的预测效果。因此,在数据收集、数据预处理是非常重要的。本文主要做缺失值填充和删除处理,数据归一化处理,并生成派生数据项的收集社区公共服务信息。
缺失值的预处理取决于缺失值的大小和性质。对缺失值不会影响预测结果的客观性和有效性,删除方法通常是直接使用。由于大量的数据,删除个别缺失值数据的总体预测结果几乎没有影响,这保证了预测结果的客观性和准确性在最大的程度上。缺失值丢失较少但更重要的是和某些级影响预测结果,手动补充通常采用的方法,它是通过二次确认,手动收集的信息。绝对影响的数据收集的情况下,不能再一次,不管它的大小,本文运用移动窗口均值填补缺失值填充方法。如果社区风险事件的数量缺失某一天,风险事件的缺失数据的平均价值被定义为风险事件的前三天,未来三天,这是作为风险事件的数量在那一天和填写。算法如下:
分析特征因素的过程中,单位和每个特征因素的大小是不同的。例如,二手房屋通常是计算的房价在10000辆,而社区风险事件的发生通常是计算在个位数。在这个时候,在分析相关因素,通常规模较大的二手房价面具那么大小的影响,如风险事件的发生。因此,单位之间的差异大小不同的特征因素需要规范化。处理算法如下:
此外,在随后的模型建设过程中,有一些不能直接反映在数据的特点,以及一系列的预处理也应进行,如天气特征因素,通常显示为晴天或雨天,而不是直观的量化数据。在这里,我们使用评分处理。更糟糕的是天气,得分越高。同样,量化处理和特征选择的假期,和算法如下:
4所示。结果分析和讨论
通过相关分析方法分析原始输入数据的因素特征,我们最终得到的实际数据和预测数据之间的相关性在第一个七天是0.978。在前六天的数据,实际数据和预测数据之间的相关性是0.982。从这,我们可以看到第一个七天的预测数据和数据在第一个六天更准确和有很高的相关性。为了丰富输入数据的数量,我们改变了二分法的结构树和树的最大深度设置为4和最低叶节点为5。实验结果如图所示3。
图3通过比较数据集上的预测结果和实际输入的结果,可以看出,购物车回归树预测模型表现良好。横坐标是日期和协调社区风险事件的数量。蓝色实线是输入的数据集,米是真正的病例数在一年内每天,和橙色是车回归树模型的预测结果,也就是说,社会风险事件的数量每天在那一年。可以看出,橙色的趋势线与蓝线基本上是一致的。最后的结果表明,相关系数为86.2%,误差系数是74.3%,方差是0.971。综上所述,我们可以认为是一个大型的预测值和实际值之间的相关性车回归树预测模型,预测性能好。
神经网络模型是一个非常强大的模型来计算和模拟非线性关系。它有很强的适用性不管变量之间的关系是什么。在第一次模拟考试,传统卷积神经网络用于预测结果。深度学习框架是由建筑多个单一模型和集成多通道卷积神经网络。多个单独的网络模型不需要它们之间复杂的关系,和多通道深度学习模型可以集成不同的信息源。每个连接信息来源有一个参数称为体重,和不同神经元之间的信息转换,并学会了根据不同的权重。在多层传感机制中,层是完全连接,上部层中的每个神经元与神经元在较低的层。在多层传感机制,是输入层和底层数据训练。中间是隐藏层数据,这是隐藏层之间的不断传播和学习。最后,输出层输出最终结果。 The specific structure is shown in Figure4。
最后,预测结果进行分析的基础上,综合预测模型,结果如图所示5。一天的数据是基于粒度,横坐标是日期和协调社区风险事件的发生。蓝色实线米,这是真正的风险事件每天都在社区2019年,橙色是综合预测模型的预测结果。可以看出,蓝色实线的变化趋势基本上是一样的橙色的实线。与此同时,与单一预测模型相比,可以看出,综合预测模型的结果明显优于单一预测模型。最后的结果表明,实际数据之间的相关系数和综合预测模型的预测数据是92.5%,误差值是85.5%,方差是0.703。总之,实际值和预测值之间的相关性的综合预测模型是好的,这是高于单一预测模型,预测结果的准确性也更高,这是高于单一预测模型。比较结果的综合预测模型如图5。
最后,是说一个大的预测与实际值之间存在相关性车回归树预测模型。结果,预测性能更好。此外,的实际值和预测值之间的关系综合预测模型是好的。综合预测高于单一预测模型及其预测的准确性也更高。
5。结论
本文所进行的研究的基础上,深度学习模型。拟议的研究可以解释成几个主要逐步分如下:(i)最初,社区相关危险因素的筛选特征,(2)然后,建筑模型,即。树,车回归预测模型和多通道卷积神经网络模型,分别;打破了传统的预测方法,多个单通道模型集成到多通道预测模型;(3)最后,实验验证表明,多道预测模型不仅可以提高社区公共服务信息的处理能力,但也预测社区公共服务安全治理问题的发生。虽然该模型大大提高了预测精度和处理速度的风险事件,在处理算法,更多的是考虑时间序列模型。此外,没有更深入的分析了空间因素的影响模型的预测精度。因此,社区空间位置的影响将是下一阶段。同时,希望这项研究将提供一些思路和方法对当前社区公共服务信息协同治理的基础上深度学习模型。
数据可用性
使用的数据来支持本研究的发现可以要求作者。
的利益冲突
作者宣称没有利益冲突。
确认
这项研究受到了工程哲学和社会科学研究江苏省高校,研究社区公共服务的综合发展道路的背景下城乡一体化(2021 sja1439)。