人群密度检测算法基于监控视频动态信息分析旅游景点

文摘

在本文中,我们分析和计算人群密度旅游区利用视频监控动态信息分析和人群计数和密度估计任务划分为三个阶段。摘要小说规模感知模块和逆规模感知模块旨在进一步促进矿业多尺度信息的计算模型;第三阶段的主要功能是生成人口分布密度图,主要包括三列无效卷积具有不同孔隙率和生成最终的人口分布密度图使用不同分支回归的特征图谱。同时,算法使用跳卷积顶部和底部之间的连接无效卷积层以减少网络梯度消失和梯度爆炸的风险,使用一个中间监督策略优化网络参数。层次密度估计使用分层策略,而且我的语义特征和多尺度信息的方式,这是用来解决问题的规模变化和透视失真。同时,考虑到背景噪声影响生成的质量密度地图,柔软的注意机制集成到模型延伸前景和背景之间的距离进一步提高密度图的质量。同时,受多任务学习的启发,本文嵌入一个辅助计算分类器计算模型来执行计数分类辅助任务和提高模型表达语义信息的能力。大量的实验结果证明该算法的有效性和可行性在解决问题的规模变化和透视失真。

1。介绍

随着科学技术的发展提高到一个新的水平,人民的生活质量逐步提高(1]。与此同时,随着世界人口的增加和第三产业的崛起,世界经济发展迎来了新一波(2]。研究的目标人群的主题数和密度估计是服务人们的日常需要,具有十分重要的现实意义的人群计数和密度估计在实际场景中(3]。因此,人群计数和密度估计可以扩展到以下三个应用程序;在真实的场景中,火车站、机场、大型体育场馆、旅游景点,和大型购物中心是拥挤的聚集的地方,和数量的人聚集在这些地方通常是非常大的(4]。员工通过电子照相设备监控等人群位置实时动态信息,因此,相关技术用于分析潜在的安全隐患,将灾难性事件扼杀在萌芽状态(5]。人群计数研究还可以提供早期预警的异常变化在某些关键地方的人数(政府网站等)。人群计数和密度估计技术也可以用来收集情报分析和推断事件(6]。在年度假日旅行的情况下,已经成为一个正常的人口的一部分,它是有用的分析人员流动的主要旅游目的地国家道路交通管理和调整整体旅游政策基于人口的旅游偏好和利益在每一次(7]。此外,人群动力学的分析在某些旅游目的地可以使管理者控制的最大数量的人在相应的区域,从而减少拥挤和踩踏等事故的可能性8]。除了上述之外,分析流的人数不同货架位置在大型购物中心可以用来评估人们的偏好对各种类型的商品和调整商品和其他安排的位置根据分析结果最大化经济效益(9]。结果和分析人群计数和密度估计的研究成果可以为虚拟现实转换同样提供可靠的数学模型,通过在虚拟场景中各种环境的进化可以进一步增强,完全符合现实世界(10]。这些通常应用于大型计算机平台的动作游戏,电影特效,排练各种真实事件(例如,在关键情况下人群疏散,公共空间的设计,和调整)(11]。

京等人提出了一个semisupervised弹性网(SSEN)回归方法改善“时空密集”假设需要一个足够高的视频帧速率的平滑时间轴上的人群,通过构造一个普通术语基于未标记样本之间的订单信息和其邻国在时域。这些都是受到不合理的预测变化(12]。Coşar认为现实世界中很难满足需求在考虑问题,比如数据带宽、存储空间,和实际硬件设备;它提出了一个替代semisupervised回归框架,使用底层人口分布的几何形状信息来执行转移学习,而放松要求基于“时空密集。“假设的要求不仅使模型平滑探索内在的结构总体分布时空,也使人口计数法更一般的和可靠的13]。Chebiyyam et al .,在准确计算研究中考虑人口密集的地区,提出了人口密集的地区代表不规则和不均匀材质和使用傅里叶分析在本地块,头检测,SIFI-based的兴趣点三个子模式最终实现区域人口数量和总源(傅里叶、头检测和利益点)在马尔可夫随机场统计信息在全球范围内限制数(14]。此外,作者引入了数据集的图像样本大小50帧包含63974个人头标记信息,称为UCF_CC_50 [15]。杨等人介绍了一个新概念的累积特性根据统计回归模型学习产生当只有稀疏和不平衡数据(16]。这两个结果表现出优良的性能结果。Saon等人首先提出一个研究学习当地补丁之间的线性映射块和相应的映射实现人口密度计算,成功地避免了检测的缺陷和回归方法通过引入基于密度估计的新方法(17]。在随后的科学研究中,陆等人发现学习的任务之间的线性映射image-density地图是非常困难的,因此提出了一个战略学习图像块之间的非线性映射块和密度地图解决计算问题(18]。Basiri等人聚集图像块的特征空间到子空间和学习他们的嵌入通过收集这些子空间的目标人群的差异,而不是继续前面的学习策略(学习之间的映射整体人口密度特性及其相应的地图),作者用图片和密度的对应关系在特征空间映射到形成一个基于子空间的密度估计策略学习,和相关的实验证明,其计算精度与当时的主流方案,竞争和运行速度的测试阶段是相当大的19]。在同一时期,易等人得出的结论是,现有的人口密度估计方案计算昂贵,有一些缺陷在加工特性,提出了随机森林的数量嵌在树节点作为回归模型结合更广泛和更丰富的图像特性来实现计算估计和计算策略已经取得一定成果20.]。

尽管人口计数算法基于传统方法取得了一些科研成果,其缺点也是显而易见的。它不是有效的在处理高密度和其他具有挑战性的问题,如规模显著变化,严重的角度扭曲,模糊的人口特征。在本文中,我们使用动态信息分析浅纹理特征编码相同的人口分布在不同的决议通过使用图像金字塔设置为输入和特征编码器来提高计算模型的多尺度表示。人口分布密度地图生成的密度地图回归模块,它包含多个cross-branching子网,这些子网的卷积空洞与不同的孔隙率为主要元素扩展模型的感官领域不增加权重参数。

2。设计的人群密度监测视频动态分析

2.1。人们密度监测视频的动态分析模型

人群计数和密度估计研究旨在设计高效的智能算法来分析图像数据和我的有效的行人特征信息来实现人群计数。早期研究人员使用传统的机器学习算法来解决计算任务问题[21]。深度学习的出现和发展,卷积神经网络方法显示领域的巨大潜力人群计数,如图1。

如图1,人口统计研究基于卷积神经网络(CNN)分为四个主要部分:数据预处理、模型训练、测试模型,并生成密度地图和计算结果,其中M表示迭代的总数。参数学习和优化模型训练的一个重要组成部分22]。从图像或视频数据输入密度地图或计算结果输出是向前传播的过程。模型参数学习的过程和优化是反向传播过程,优化器的优化迭代加权参数获得最佳的计算模型。常见的优化是随机梯度下降法(SGD),自适应估计(亚当),和批处理梯度下降(BGD),主要用于梯度下降法。测试模型的主要目的是来验证算法的有效性23]。

被认为是由连续图像f(x,y),来计算梯度值的大小和方向在一个点,这个点的偏导数需要获得。由于数字图像是离散的,它可以取代一个一阶微分的阶偏差(24]。一阶微分的函数图像在水平方向上的二维离散函数定义如下:

因此,在垂直方向被定义为一阶差异

罗伯茨操作更简单,因为它使用本地差分图像的边缘。它检测到的边缘通过使用一个像素的梯度大小近似的绝对值对角线方向的两个相邻像素之间的差异(25]:

罗伯茨算子边缘定位精度高,但它也对噪声敏感和适用于分段的场景截然不同的边缘和噪声小26]。罗伯茨算法使用本地差分得到的边缘图像,但缺点,生成图像的边缘不光滑后罗伯特的算法。原因是罗伯特的算法通常会生成一个宽脉冲响应在该地区相邻的图像边缘,所以改进之前通常需要与罗伯特的检测算法,进而影响边缘定位的精度。

一个纹理特征是一个全球性的特性,描述了表面特征相应的图像场景中,但由于纹理是只有一个物体表面的特征,它并不能反映所有物体的固有特性(27]。我们不能期望得到更深入的照片图像只要看它的纹理特性。纹理特征是统计每个像素的像素。这样的区域特征模式匹配上乘,当地没有偏差,无法匹配。纹理特征通常用于检索之间具有显著差异的图像纹理信息。作为一个统计特性,它通常是旋转不变和具有较强的噪声免疫力。然而,当图像的分辨率较低,结构计算可能会有较大的偏差,或者当纹理之间的差异很小,很难对人类视觉感知区分纹理差异小,它不再是适当使用纹理特征来区分图像。监控现场的人员流动是非常复杂的,和不同密度的人将显示不同的纹理图像中的信息。特别是在高密度人口的情况下,由于严重的阻塞,如果你仍然使用传统的基于像素特征的方法来估计密度的人,错误的将是巨大的。然而,使用texture-based人群密度检测算法可以显著提高在高密度人群流动情况下的准确性。

假设窗口被跟踪W,KLT算法是一个方法来计算方视频帧灰度区别这个窗口(平方之和强度差异)作为标准的跟踪算法。KLT灰度图像的算法,我们假设一个功能窗口W其中包含纹理特征信息。图像帧我(x,y,t)的时刻t和这个职位我在时刻t满足以下方程(28]: 也就是说,每个像素属于下一帧我(x,y,t可以通过翻译)米= (x,y)单位响应窗口的像素在前一帧我(x,y,t)。这也是前一节中描述;KLT算法的目的是找到解决的过程d:

一般来说,有在哪里n(X)是照明的变化所产生的噪声τ时间。的平方积分n(X)在整个窗口因此获得的平方之和的窗口图像灰度差异(SSD) [29日]:

当d远低于X泰勒展开的一个(X−d),四舍五入任期越高,收益率

替代(8)(7),同时获得,使结果为0d在左右两边的方程(7),使

在这种情况下,ε需要一个很小的值。方程(9反过来,)可以被转换为

减少运动图像处理质量的影响,我们的模型一个仿射变换的图像序列。仿射模型需要的选择特征点在图像和跟踪他们,和整个图像的仿射变换参数拟合获得的所有特征点的偏移量,从而建立仿射图像之间的关系。因此,特征跟踪和特征提取成为解决问题的关键。特征提取在图像处理的概念是一个分析和处理外部世界的过程用计算机视觉的理论知识。边缘、纹理、颜色和其他特性的图像用于描述和处理图像。我们可以选择特征点的灰度变化的图像边缘,纹理基元的顺序和几何特性的图像边缘。一般来说,特征点跟踪和提取的两个基本问题是如何选择特征点适合跟踪和如何实现连续跟踪帧到帧的特征点。

2.2。密度的分类和系统流程

行人密度检测是常用的在公共场所如商场、车站和大型娱乐设施。人群密度的平均数量在现场区域行人。为企业或事件经理,这个值不能太大或太小。如果它太大了,人们不容易疏散,可能导致事故的发生。如果它太小了,它将不会达到预期的效果。人群密度可分为五个层次,和组织者或管理者可以根据实时做出及时调整水平。在现实生活中,人群密度的定义水平可以根据应用场景改变。在本文中,我们采用提出的定义Hemanth et al。30.),将人的密度划分为五个层次从低到高,如表所示1。


参数	时间(女士)	帧

了	12.67	5.7
KCF	12.6	64.0
TLD	60.4	14.8
CT	17.2	56.9
MST-ours	6.5	132.9
MIX-ours	64.2	23.4

人群密度监测系统是一个系统,利用计算机视觉技术来分析和处理图像信号包含实时人群场景。人群密度检测主要包括运动检测跟踪和密度估计。一般的处理步骤如下:首先,人群的运动行为和特征提取运动前景。基于像素统计,运动前景的纹理分析和个人特征用于分类人群。然后,分类结果传送到控制系统进行处理。

相机持续回升的图像目标区域的流动人场景和提要回视频处理模块。捕获的视频图像转换为视频序列,分析了视频图像处理算法来获取人群密度信息。根据密度处理的视频处理模块和相应的现场,人群密度检测算法使适当的判断,然后自动或手动进行下一步行动。最重要的事情在整个框图是视频处理模块,模块的核心是视频图像处理算法。处理算法的选择直接影响观察结果的准确性(31日]。

前景提取是一种常见的工具用于人群密度检测研究。其目的是提取移动对象感兴趣的我们从图像序列的背景,忽略其他的信息对我们的帮助。视频的图像,可以使用技术,使用运动检测得到运动对象或目标32]。这是非常重要的跟踪移动物体等后处理和分析图像异常事件。通常,常见的前景提取方法用于视频监控光流法、帧间差分法,概率方法,前景建模方法,等等。

大多数现有的行人检测技术使用全身特征提取,所以需要注意收集原始视频中行人的全身照片提取。然而,由于行人目标运动的变化,经常有行人和对象之间的相互遮挡行人或,当全身不是捕获,现有的准确性在训练数据集将会大大减少。在本节中,现有的方法使用的全身运动行人的照片(33]。方法的第一步也是收集原始图像数据集,然后,收集到的原始图像检测和识别的卷积神经网络使用现有的网络模型精度高,数据集在哪里使用现有VOC2012数据集训练。

卷积神经网络算法用于帧图像中的行人和计算他们的信心水平,该系统的置信区间设置为大于50%,但大多数框架行人目标的图像有一个置信水平不到50%,所以这些目标之间存在着严重的阻塞,无法辨认的,但在现实中,目标存在,所以这个解决方案的准确性不高34- - - - - -40]。然而,当结合实际情况和多个图像的观察,很容易看到,有一个最小的阻塞行人头部区域,因此本文使用头识别检测行人。

数据注释是一个关键因素深入学习算法的准确性,和良好的数据注释可以有效地提高深度学习的准确性。同时,数据注释也将与最多的深度学习任务,和通用数据标准使用人工注释,它需要大量的浪费工作时间。因此,在本节中,减少人工工作量数据注释,结合人工注释方法和模型。即基于深度学习目标探测模型可以识别一些明显的特征和注释本身在训练过程中减少手工任务。本文主要实现行人的统计数据,在这个研究中,深度学习主要是实现训练和检测的目标,所以在数据,标记,数据需要标记主要选择目标负责人候选人框位置信息以及目标的信息。本节首先选择视频序列的60%收集到的原始视频作为训练集,长约20小时,而本文严格遵循视频拍摄的序列,确保所有培训和测试的独立性。以来连续视频,飙升的行人目标通常不是快,一秒钟内的所有帧或几秒钟不改变,所以抽样法用于这些图片删除一些相同或非常小的差别减少工作量和标记时间的帧。因此,视频删除过程是通过结合现有的成熟的OpenCV图像处理库,最后,42600年保留视频图像与原始训练图像。

3所示。实验设计分析的检测算法

3.1。人群密度检测算法的设计和实验

在传统的深度学习,网络通常VGG-Net的特性,它正确地检测和高精度测试在帕斯卡VOC的数据集。因此,VGG-Net-based网络是最高执行图像特征提取的基础设施网络体系结构深度学习算法。然而,近年来,深度学习变得更加要求网络架构和卷积神经网络算法已经成熟,例如,ResNet Inception-ResNet,取得更好的结果比VGG-Net基地网络特征提取(35]。因此,这些方法将深度学习的首选算法网络体系结构中使用论文检测头的目标。从本文的研究问题,论文对监控视频,员工需要高实时性能,所以有一些算法的处理速度的要求。图像帧率的监控录像中使用本文是15,这意味着每个图像帧所需的处理时间不超过0.067秒。因此,在评价指标的要求时间的应用深度学习算法小于0.067秒,并尽可能有效的算法选择目标探测在会议的时间标准的前提下36]。阅读大量参考文献,可以发现,深度学习检测时间和准确性往往成反比,即。,the higher the number of network architecture layers and more input parameters in deep learning, the better the accuracy of target detection and the longer the time required, as shown in Figure2。

考虑时间和准确性后,系统采用的网络架构resnet - 101 + RFCN作为行人的深度学习特征提取网络体系结构检测。在本节中,详细解释网络体系结构以及实验测试和分析。人口密度的基于像素分类,视频被选中作为实验对象,并由OpenCV处理,这是大致分为三类:低密度、人口密度非常低,纹理分析。人群密度分类基于像素统计的算法很简单,但它只适用于低密度人口。阈值的选择是特别注意;在这里,它是用来分析多个视频提取低密度,密度很低,和纹理分析的人口获得相应的图像,减少人类的主体性,更有说服力。如果使用人口密度基于像素的分类方法,高密度人口出现在人群之间的重叠,虽然该算法简单,结果有较大的误差,所以纹理分析的基础上,使用人口密度分类方法,这个方法是一个复杂的算法和计算体积相对较大。它通常首先提取grayscale-based同现矩阵,特征值在此基础上,使用支持向量机分类特征值。

个人杂粮交互网络主要考虑个体之间的相互约束的轨迹信息和行为信息来预测更合理的结果。如图3过程中,一个人改变运动的方向,整个运动轨迹的方向往往反映了整体运动趋势,而反过来,运动变化也包含轨迹运动的信息,例如,两条路径是相互影响的。

因此,有必要单独的交互建模预测轨迹和运动信息,共同约束两个更现实的结果。整个个人杂粮信息交互网络由三部分组成:编码网络交互网络,解码网络。首先,输入到网络的轨迹变化值和行动改变值预测的个人间的交互网络。使用变化值作为输入的原因是,一方面,他们有助于避免内存网络环境,另一方面,原始轨迹特征和动作特征之间的关系很难模型。

输入轨迹变化的维度值∆交易是32,虽然行动∆行为维度变化值是128,所以需要编码输入双向LSTM之前。编码网络采用多层感知器(MLP),这一方面编码两个渠道到相同的维度,另一方面,相当于编码前的两个渠道进入相同的隐式空间信息融合交互。由于双向LSTM可以在两个方向上保险丝信息,本章中采用两个时间步双向LSTMs,一个输入编码的轨迹信息在一个时刻,另一个输入动作变化信息在另一个时刻。forward-backward信息交互融合之后,融合信息输出。第一时刻对应于新的信息行动轨迹信息进行考虑后,和其他时刻输出轨迹的新信息后,考虑到信息的行动。预测结果,不同的解码网络也是采用解码的输出双向LSTM网络未来的轨迹和行动框架。解码网络也由多层感知机,一个解码轨迹信息到最终的预测二维∆′交易和其他解码运动信息到最终的预测运动变化∆′的行为。上述流程完成时间的个体内的交互建模t,即,the trajectory and motion prediction of timet。时间的预测t然后递归预测长期的输入。然后,预测的结果t是用作下次输入,长期预测是递归。

3.2。评价指标设计分析

评估特征检测算法的性能,重点通常是计算检测结果的准确性和回忆。的米美联社是最常见的一种绩效评估指标,在美联社的积分面积曲线的精度和召回,米是所有APs的平均值,米通常是作为P。的价值就越高米,检测算法的性能就越高。具体的米美联社计算如下: 在哪里问是类别的数量在本设计系统的所有图片和大街吗P(一个)的平均精度(美联社)一个所有类别的th。深度学习检测和培训,需要匹配相应的高性能计算机,和更好的计算性能,培训和测试将越快。该系统中使用的计算机有一个英特尔酷睿i7 - 8700 k的CPU和NVIDIA GTX1080TI GPU。

定量验证我们提出的聚合的概念,比较它与人类的运动。群众运动实验中使用的数据库包含413 62运动场景的视频剪辑。每个视频包含100帧的图像。接近真实的结果,我们在视频分类人群运动分为三个级别:高、中、低。然后,我们提出了两个标准来评估聚集之间的协议我们论文中描述和划定真正的群众运动。第一个标准是人群得分之间的联系和聚合的程度。我们把这些分数加起来作为人群得分视频。这个分数的范围。从修改后的图,我们可以看到集合的大小,人群得分,和速度。使用KLT算法中引入第三节,我们提取特征点的视频剪辑,可以计算出集聚程度和群众运动在这个视频剪辑的速度。图4描述了所有视频剪辑人群得分和速度之间的关系。集聚和人群得分关联性更强,集聚的结果是符合人类感知。

密度地图的质量取决于正确的计算在图像数据的人数。第一步是拯救的中心位置的像素坐标标记图像中使用注释,中心位置的像素坐标的正面形象充满了1号,和其他职位充满了数字0到形成一个稀疏矩阵与原始图像样本的大小是一致的;第二步是将相应的稀疏矩阵转化为高斯滤波的密度图。的二维密度图是一个阴谋的总和所有密度值和总人数相应的形象。1在稀疏矩阵是由与固定大小的高斯卷积操作内核G形成密度映射矩阵,在密度和密度的范围值映射矩阵对应于理论头的大小,由高斯核的大小影响G .因此,人口统计的计算性能和密度估计模型密切相关密度地图生成的方式。在先前的研究中,研究人员的方法分为两种类型,是否高斯内核G大小是固定的或不使用:固定内核密度地图生成方法和几何自适应核密度地图生成方法。

固定的高斯内核缺乏行人大小变化的适应性输入图像由于其固定大小,即。,the estimation error for head size is large in densely populated scenes, while it has an advantage in sparsely populated scenes; however, the density map generated by the geometric adaptive kernel is exactly the opposite of the density map generated by the fixed kernel, and the average distance between thek最近的邻居是人口密集的小场景。因此,小的头部大小估计错误,而在稀疏场景之间的平均距离k最近的邻居太大,影响的质量密度地图生成和最终的计算结果。因此,地图生成的密度是影响质量的关键因素之一密度地图,无论是基于固定高斯内核(的初始化大小固定内核的质量也会影响人口密度图)或基于几何自适应内核生成人口分布密度图;都有一定的优点和缺点。

4所示。分析的结果

4.1。不同的检测算法的实现和性能比较

卷积神经网络作为基础网络的训练和测试已经组织特征数据集,其中卷积神经网络基础网络连接与第五项卷积层。训练算法是随机梯度下降法(SGD),学习速率设置为0.005,学习速率调整到0.1当训练迭代达到30000。ResNet、ResNet-50 ResNet - 101被视为卷积神经网络算法的网络模型,所有的基地网络上执行TensorFlow框架。ResNet-50和resnet - 101网络架构搜索使用他们的第四层卷积神经网络层和输出层。从这一层所有的数据特性,特征提取盒的RPN网络没有形成直接7×7网格,使用的剪切功能TensorFlow框架,这帧自动剪切特性的位置,然后在14×14缩放,最后执行最大池操作调整功能框7×7。基础网络的Inception-ResNet使用其第六卷积神经网络层探测目标的特性。在整个学习培训,所有的网络结构是SGD算法。的值精度检测标准米三种网络结构的ResNet-50美联社,resnet - 101, Inception-ResNet在深度学习训练图所示5。

在图5(一个)显示了米美联社的检测指标曲线ResNet-50网络体系结构培训,(b)显示了米美联社的检测指标曲线resnet - 101网络体系结构培训,和(c)显示了米美联社的检测指标曲线Inception-ResNet网络体系结构的训练。从图5,我们可以直观地比较特征检测性能的三个网络的体系结构、ResNet-50的网络结构有一个光滑的检测性能在迭代后期,和另外两个大的波动;然而,Inception-ResNet网络结构的检测性能,最好和ResNet-50网络结构最糟糕的检测性能。性能比较完成后,本节还准确地测量检测性能的三个网络架构,即。,500 images are selected as the original images to be detected and then tested on the already trained models and datasets, and the specific accuracy results of the three network architectures are shown in Figure6。

从图6可以看出,精度指标米美联社《盗梦空间》的网络结构是96.3%,精度指标米美联社resnet - 101网络结构是94.7%,精度指标米美联社ResNet-50网络结构的94.1%,算法精度最低,只有91.4%米美联社。与此同时,Inception-ResNet网络结构被发现是最慢的速度,比其他三个快3倍,resnet - 101, ResNet-50,和VGG-16网络结构能够以相似的速度检测,所有低于设置检出率(0.067秒)。

然而,准确性是关键的选择基础网络,提供所需的时间测试。因此,从图可以看出7这一米美联社的resnet - 101是高于其他两个,所以resnet - 101应该选择作为这个系统的基础网络。在前面的实验中,本文选择resnet - 101作为基础网络。然后,深入学习算法需要选择resnet - 101基地网络。RFCN, SSD, Faster-RCNN测试实验。训练实验的三个网络结构,初始学习是0.001和批量大小是4。结果三种网络结构如图7。

在图7,RFCN检测精度最高的精度标准米美联社95.7%的检测过程是收敛的,和SSD最低精度米美联社仅为90.3%时收敛,这是严重低于最低系统设计标准。在检测速度、Faster-RCNN是最快的,平均每单0.057 s, RFCN是最慢的,在0.061秒。尽管RFCN处理速度最慢,它仍然是在容许取向(即。,处理时间≤0.067 s)。通过上述一系列实验的模拟,我们可以清楚地理解所有网络的具体性能参数和相应的指标结构。分析和比较之后,Res RFCN组合被选中作为深度学习的网络结构。在网络结构选择实验中在这一节中,没有cross-testing三个基地网络的三种网络结构,但首先,确定选择的基础网络,然后使用基础网络来测试网络结构和得到最终想要的结果。这有效地减少了实验测试的基础上的数量达到我们的目标。确定使用Res RFCN后,网络的具体表现也模拟和测试。对于这个测试,初步学习速率为0.005和衰变为0.1,20000年迭代。实验后,精度标准米美联社的检测过程记录及其变化曲线如图8。

从图可以看出8,当精度指标米美联社达到最大值0.957,迭代轮的数量大约是26500。检测的速度是62 ms,满足系统的最低要求采用这个结果。使用上面描述的实验结构,检测结果的实际检测数据可以得出结论:最后的方法采用在本节中,resnet - 101 + RFCN,可以实现一个行人的检测目标在监测环境中;同时,算法的精度和速度会减慢系统的需求。基础网络的设计是关键部分,影响整个系统的性能,因为一系列的特征提取操作完成深度学习的基础网络。

CNN利用一个中间监督策略深入优化计算模型参数。因此,为了验证参数设置的合理性在中间监督策略和不同的参数值计算性能的影响,SACNN执行评估实验数据集的一个部分。首先,SACNN评估的性能参数范围内的10到0.00001,如图9。应该注意的是,参数值设置为0的所有参数评价实验,和其他所有的设置都是一样的。从表中的数据,SACNN时最好的计算性能参数的值是1,值为0.00001时最严重的计算性能。同时,更好地显示的趋势SACNN计算性能参数值,本节将图中的数据9线图评估变化趋势。如图9,SACNN计算性能的趋势显示了增加然后减少趋势,重大变化从1e−5到1e−4,紧随其后的是一个温和的增长趋势和最佳性能值为1时,在计算性能的显示了一个缓慢减少的趋势。它可以得出结论,当值足够小(0.00001),SACNN的计算性能主要是由密度估计的损失,损失影响不大;当的值在0.0001∼10的范围,开始发挥作用,和SACNN更稳定的计算性能参数的敏感性。

4.2。评价指标的分析结果

图10显示的可视化结果密度SACNN算法生成的地图,在每一列的图像表示为原始图像,真正的密度地图,地图和生成的密度,分别和每一行的三个图像映射属于同一样本。此外,“GT”和“ET”图代表真正的密度和密度估计,分别。观察对比真正的密度地图,估计密度图,可以得出结论,生成的质量密度地图是接近真实的密度地图。通过比较真实的密度值和估计的人口密度在测试样本,发现本节中算法的计算精度高。它还显示足够的多尺度信息有助于计数模型的性能改进。

做仿真的卡尔曼滤波跟踪算法思想运动,卡尔曼滤波算法对位置跟踪具有良好的效果。但是生活中遇到的二维运动,所以我们继续模拟二维卡尔曼滤波跟踪算法。理想环境运动然后用蒙特卡罗模拟比较测量位置,真正的位置,和过滤后的跟踪预测位置,如图所示11。

在实验二维平面的卡尔曼跟踪算法,它可以发现,在同样的环境下,卡尔曼跟踪算法具有良好的跟踪移动目标的影响,并从图11,可以看出卡尔曼跟踪协方差的算法将逐渐变小随着时间的推移,和它的波动也将变得越来越小,最后逐渐趋于0。根据上面的图,我们可以得出结论,卡尔曼滤波可以达到以下效果移动目标跟踪,但需要一定数量的跟踪时间(跟踪步骤的数目在上面的图最好应该设置为40岁以上)。

图11显示的人数在复杂的环境中,左上角显示实时的人数,右上角显示被跟踪的人数。第一张照片有两个行人就越过了线,一个行人从另一个方向擦拭,并计数显示的人数是0,被跟踪的人数为0;第二幅图显示目标的跟踪过程在虚拟线框,和计数显示的人数是0,被跟踪的人数是2,我们可以看到跟踪状态是好的;第三张照片显示所有三个行人进入虚拟线框,并开始跟踪、计数为0和被跟踪的人数是2。第四个图显示三个行人有走出虚拟线框完成统计,和两个行人走进虚拟线框的计数3和0的数。通过计算的人数在三的视频场景中,三种情况的检测结果记录,如图12。

它还演示了软件的运行流程和上层计算机接口的设计;最后,员工完成实验为三个不同的场景和简单到复杂检测背景。根据测试结果,发现人民计数系统设计摘要可以有效地处理监控的地方简单的背景,可以满足需求的普遍情况。模型的属性首先描述:速度是常数和方向是所有个体的平均方向。然后,聚合的概念和测量方法在SDP模型介绍和分析。聚集的三个主要特性进行了讨论。然后,列出的人口聚集算法的步骤。集聚就验证了模拟的准确性对单一和混合组运动。在进一步研究证明SDP模型中,我们与人类的认知比较聚合反应人群的实际情况,并得出结论,聚合反应匹配我们实际的看法。这是立即紧随其后重新生效的SDP模型的广泛适用性,通过运动的细菌菌落。 By combining the aggregation degree with the crowd density, we get the information of speed, direction, density, and aggregation degree of the crowd for better analysis of the crowd movement state. Finally, the range of agglomeration degree under different density levels is given.

5。结论

本文首先介绍了流密度检测的意义和研究的状态流密度检测国内外图像预处理的知识,这是人群密度检测的理论基础。在特征提取和跟踪算法的研究,重点是特征提取和跟踪基于动态信息监控录像分析算法,与传统的特征提取方法相比,最后,视频图像的特征点的提取完成后使用动态信息监控录像分析算法。在这一部分的研究是为聚合反应奠定基础的人群密度。研究人群密度检测算法,基于像素的主流算法基于纹理分析的统计和分析。比较两种算法的实验完成,在用灰度共生矩阵纹理分析算法。在阐述后聚合的概念深入SDP(自励的粒子)模型的分析,测试的SDP模型模拟。聚合描述个体参与的程度一组运动。聚合使管理者能够快速识别的主要个人视频活动。集聚还定性地反映了人群的密度,高密度的人群与高聚合度,反之亦然。最后,通过结合人群密度和聚合,聚合的实用性和准确性进行了验证,5岁以下和聚合的价值范围密度水平。 The combination of agglomeration and crowd density is the innovation of this paper, which also provides a reference for the future development of a complete system.

数据可用性

使用的数据来支持本研究的发现可以从相应的作者。

的利益冲突

作者声明没有已知的金融利益冲突或人际关系可能出现影响工作报告。

确认

这项工作得到了山东社会科学规划项目:研究城市休闲发展的山东省(没有。17 clyj24)。

引用

x w . Wang,公元前Ooi d . Zhang和y壮族“有效深度上优于综合检索,“VLDB日报,25卷,不。1,第101 - 79页,2016。视图:出版商的网站|谷歌学术搜索
w . Tang a .帕纳西h .克里米亚,l .戴“分析基于字典学习的分类:结构鲁棒性,”IEEE图像处理,28卷,不。12日,第6046 - 6035页,2019年。视图:出版商的网站|谷歌学术搜索
a . Almagbile”的人群密度估计无人机图像基于角点检测过程和聚类分析,“地理空间信息科学,22卷,不。1,23-34,2019页。视图:出版商的网站|谷歌学术搜索
j·m·格兰特和p . j .弗林”,人群从视频场景的理解:一项调查,”ACM交易多媒体计算、通信和应用程序,13卷,不。2、1、2017页。视图:出版商的网站|谷歌学术搜索
s . a·艾哈迈德·d·p·多格拉人,s .凹地和p·p·罗伊,“Trajectory-based监测分析:一项调查,”IEEE电路和系统视频技术卷,29号7,1985 - 1997年,2018页。视图:谷歌学术搜索
m·库马尔和c·博Zero-stopping基于混合动态跟踪模型和高密度人群视频,”成像科学杂志,卷65,不。2、75 - 86年,2017页。视图:出版商的网站|谷歌学术搜索
a . m . s . Zitouni Sluzek, h . Bhaskar”对理解socio-cognitive群体行为从视觉监测数据,”多媒体工具和应用程序,卷79,不。3 - 4、1781 - 1799年,2020页。视图:出版商的网站|谷歌学术搜索
m . s .凯撒,k t·伦·m·马哈茂德et al .,“进步通过城市对城市人群分析应用程序事件检测,”IEEE智能交通系统,19卷,不。10日,3092 - 3112年,2017页。视图:谷歌学术搜索
y Yoshimura, a·克雷布斯和c . Ratti无创蓝牙监测”的游客呆在卢浮宫的长度,”IEEE普适计算,16卷,不。2,保险,2017页。视图:出版商的网站|谷歌学术搜索
刘y, j .曹x, x,“Door-monitor:计数与COTS WiFi设备时好时坏的游客,”IEEE物联网,7卷,不。3、1704 - 1717年,2019页。视图:谷歌学术搜索
x, x的歌,f .夏h .郭j . Wang和a . Tolba”LoTAD:长期流量异常检测基于众包总线轨迹数据,”万维网,21卷,不。3、825 - 847年,2018页。视图:出版商的网站|谷歌学术搜索
y, b .郭z . Wang v . o . Li j . c . Lam和z Yu”CrowdTracker:优化城市移动物体追踪使用移动人群传感、”IEEE物联网,5卷,不。5,3452 - 3463年,2017页。视图:谷歌学术搜索
s . Coşar g . Donatiello诉Bogorny, c . Garate l . o .•阿尔瓦雷斯和f . Bremond”向异常轨迹和事件检测在视频监控中,“IEEE电路和系统视频技术,27卷,不。3、683 - 695年,2016页。视图:谷歌学术搜索
m . Chebiyyam r·d·Reddy d·p·多格拉人h . Bhaskar和l . Mihaylova”视觉监测、异常检测和运动轨迹分析”多媒体工具和应用程序,卷77,不。13日,16223 - 16248年,2018页。视图:出版商的网站|谷歌学术搜索
s . r . e . Datondji y Dupuis, p . Subirats和p . Vasseur”的调查应用路路口,交通监控”IEEE智能交通系统,17卷,不。10日,2681 - 2698年,2016页。视图:出版商的网站|谷歌学术搜索
x, l . Tang c . Ren陈y, z谢,和李问:“行人网络一代基于众包的跟踪数据,”国际地理信息科学杂志》上,34卷,不。5,1051 - 1074年,2020页。视图:出版商的网站|谷歌学术搜索
s Saon h·哈希姆·m·a·Ahmadon和山口,“基于云计算的人对抗,”电气工程和信息学的公告,9卷,不。1,第291 - 284页,2020。视图:谷歌学术搜索
吴y, z曾庆红,h . g . g . Chua和j·张,“出租车服务:智能系统分析、预测和可视化,”人工智能通信没有,卷。31日。1,33-46,2018页。视图:出版商的网站|谷歌学术搜索
a . Basiri p . Amirian a Winstanley, t·摩尔”使旅游导航系统更智能、适应性和个性化的使用人群的运动数据,”环境智能和人性化计算杂志》上,9卷,不。2、413 - 427年,2018页。视图:出版商的网站|谷歌学术搜索
美国易、h·李和x王,“行人行为建模从固定人群应用智能监测、”IEEE图像处理,25卷,不。9日,第4368 - 4354页,2016年。视图:出版商的网站|谷歌学术搜索
黄x, y, x高,l·罗和段,“鼠笼式局部二进制模式及其在视频异常检测中的应用,”IEEE取证和安全信息,14卷,不。4、1007 - 1022年,2018页。视图:谷歌学术搜索
y . a .撒哈拉和h . Zarei,“沉浸在电脑游戏使用单一和立体增强现实,”国际期刊的人机交互,34卷,不。2、187 - 194年,2018页。视图:谷歌学术搜索
a . a·加西亚。g . Bobadilla g·a·菲格罗亚m·p·拉米雷斯和j·m·罗马“虚拟现实训练系统的维护和操作高压架空输电线路,”虚拟现实,20卷,不。1,27-40,2016页。视图:谷歌学术搜索
B.-J。孙,D.-S。公园,j . Choi”态度的信心和用户在虚拟现实阻力为采购可穿戴设备:基于虚拟现实头盔,“情报和信息系统杂志》上,22卷,不。3、165 - 183年,2016页。视图:出版商的网站|谷歌学术搜索
e·A·奥康纳和j·多明戈,”一个实用指南,理论基础,创建有效的虚拟现实学习环境,“《教育技术系统,45卷,不。3、343 - 364年,2017页。视图:谷歌学术搜索
c·戈麦斯s Chessa a .百合花纹的g .·鲁索斯和d . Preuveneers“物联网,使智能环境:地角度看,“环境智能和智能环境杂志》上,11卷,不。1,23-43,2019页。视图:出版商的网站|谷歌学术搜索
g . Tieri g·马龙、美国保鲁西和m . Iosa“虚拟现实技术在认知和运动康复:事实,小说和谬误,”医疗器械的专家审查,15卷,不。2、107 - 117年,2018页。视图:出版商的网站|谷歌学术搜索
a·休斯,a·莫雷诺,t·h·我的目的地是更聪明吗?应用程序(SA) 6框架建立智能旅游目的地排名,“国际信息系统、旅游杂志》(IJIST),4卷,不。1,19-28,2019页。视图:谷歌学术搜索
x, l .林P.-Y。程,x, y . Ren, Y.-M。黄”,通过虚拟现实研究创造力支持系统”,教育技术的研究和发展,卷66,不。5,1231 - 1254年,2018页。视图:出版商的网站|谷歌学术搜索
j·d·Hemanth高丝,o . Deperlioglu诉h·c·德·阿尔布开克,”一个增广reality-supported移动应用的诊断心脏疾病,”《华尔街日报》的超级计算,卷76,不。2、1242 - 1267年,2020页。视图:出版商的网站|谷歌学术搜索
j . Martin-Gutierrez c·e·莫拉b . Anorbe-Diaz和a . Gonzalez-Marrero“虚拟技术教育的趋势,”欧亚大陆《数学、科学和技术教育,13卷,不。2、469 - 486年,2017页。视图:出版商的网站|谷歌学术搜索
n .钟J.-Y h . Lee。金,c .古“增强现实经历影响了环境的作用:在韩国文化遗产旅游的情况下,“旅游研究杂志》卷,57号5,627 - 643年,2018页。视图:出版商的网站|谷歌学术搜索
j . m .上流社会的m . e . Paoletti j .广场,广场,和j·李,“视觉注意力导向高光谱图像分类,”IEEE地球科学和遥感卷,57号10日,8065 - 8080年,2019页。视图:出版商的网站|谷歌学术搜索
w . s . Li歌,l .方p . Ghamisi y . Chen和j·a . Benediktsson“深度学习的高光谱图像分类:概述,“IEEE地球科学和遥感卷,57号9日,第6709 - 6690页,2019年。视图:出版商的网站|谷歌学术搜索
y Ariji, m .福田y Kise et al .,“对比度增强型计算机断层扫描图像的评估颈部淋巴结转移患者的口腔癌症通过使用深度学习的人工智能系统,”口腔外科、口腔医学、口腔病理学和口腔放射学,卷127,不。5,458 - 463年,2019页。视图:出版商的网站|谷歌学术搜索
k . y . Chen Zhu l .朱x, p . Ghamisi和j·a . Benediktsson“卷积神经网络的自动设计的高光谱图像分类,“IEEE地球科学和遥感卷,57号9日,第7066 - 7048页,2019年。视图:出版商的网站|谷歌学术搜索
m·t·阮、p . Siritanawan和k . Kotani“卓越检测人类人群不同密度水平使用注意机制的图像,”信号处理:图像通信文章ID 115976卷,88年,2020年。视图:出版商的网站|谷歌学术搜索
h . Fradi诉Eiselein J.-L。Dugelay,凯勒,t . Sikora“时空人群密度模型在人体检测和跟踪框架中,“信号处理:图像通信31卷,第111 - 100页,2015年。视图:出版商的网站|谷歌学术搜索
m . Kordestani A . A .影响,和A . Sadrzadeh”诊断新方法的类型和位置扰动法尔斯配电系统”电气工程学报2016年24日伊朗会议(ICEE),10卷,页1871 - 1876,设拉子,伊朗,2016年5月。视图:谷歌学术搜索
h . Ullah m . Uzair m . Ullah汗,a·艾哈迈德·w·汗,“人群密度独立的流体动力学模型一致性检测,“Neurocomputing卷。242年,28-39,2017页。视图:出版商的网站|谷歌学术搜索

复杂性

认知计算解决方案在计算社会系统复杂性问题

文摘