在公共安全视频监控中发挥着越来越重要的作用,是构建安全的技术基础和智能城市。传统的视频监控系统只能提供实时监控或手动分析情况下检查监控录像。所以,很难有效地使用监控录像的数据采样。在本文中,我们提出了一个有效的视频检测对象超分辨率和深度融合网络公共安全。首先,我们设计了一个超分辨率视频检测对象的框架。通过融合的目标检测算法,视频关键帧选择算法,和超分辨率重建算法,我们提出了一个基于深度学习智能视频检测对象超分辨率(SR)方法。其次,我们设计了一个回归目标检测算法和视频关键帧选择算法。对象检测算法被用来协助警察和保安人员实时跟踪可疑对象。关键帧选择算法可以选择从大量冗余信息的关键信息,这有助于提高视频内容分析的效率,减少劳动力成本。最后,我们设计了一个不对称的递归深度投影网络超分辨率重建。 By combining the advantages of the pixel-based super-resolution algorithm and the feature space-based super-resolution algorithm, we improved the resolution and the visual perception clarity of the key objects. Extensive experimental evaluations show the efficiency and effectiveness of our method.
视频监控系统是广泛分布在城市街道和道路、商业场所,居民区,银行网点,车站,码头,机场和其他公共场所,在公共安全发挥着越来越重要的作用。通过视频监控系统,可以发现可疑迹象,对象在时间和密切监测,有效地避免犯罪危害的发生。警察可以通过监控录像和获得罪犯的信息询问可疑车辆和人员的位置。在案件的审讯阶段调查,监控录像可以作为客观诉讼证据。视频监控已成为第四大调查技术在刑事科学技术领域,动作技术和网络调查技术。它起着不可替代的作用在安全、智能城市的建设。2015年,公安部科学技术部和其他九个部委提出若干意见》关于加强公共安全视频监控建设”的网络应用程序。他们指出,建设公共安全视频监控的网络应用程序有助于维护国家安全和社会稳定,预防和打击暴力恐怖犯罪新形势下。具有重要意义,提高城乡管理和创新社会治理体系。
传统的视频监控系统只能提供实时监控或手动分析情况下检查监控录像。它会导致低使用率的监控视频数据。人工智能和机器学习技术,视频监控系统可以智能地分析视频内容,检测异常行为,并发现潜在的有害行为(
为了解决上述问题,我们提出了一个视频超分辨率方法检测对象。我们使用目标检测算法来帮助监视视频观众实时追踪对象和使用超分辨率算法来重建高分辨率的视频帧与清晰的视觉感知。传统的目标检测算法OpenCV级联分类器使用一个滑动窗口选择区域,然后使用猪+支持向量机和其他特征提取方法,最后使用分类器分类检测区域(
在本文中,我们提出了一个基于深度融合的超分辨率方法监测网络视频对象检测。首先,我们设计了一个全面的监控录像分析框架,集成了目标检测算法,关键帧选择算法和超分辨率算法。对象解决工作量大的问题,容易损失,在公安和低分辨率视频数据分析。其次,我们使用回归物体检测和识别算法来识别实时视频对象,这是方便监视视频观众跟踪对象。此外,我们使用关键帧选择算法选择框架与重大变化在现场监控录像来减少视频分析的工作量。最后,结合像素空间和特征空间超分辨率算法用来重建对象的关键帧。它有利于提高分辨率的关键对象和对象的视觉感知质量检测监控录像和监控录像查看器的调查和处理情况。总结了本文的主要贡献如下:(1)我们设计了一个新颖的监控录像的综合分析框架。它提高了效率和精度视频对象检测相结合的分析,关键帧选择,和超分辨率算法。(2)我们提出了一个关键帧选择算法,使用回归对象检测和识别算法识别实时视频对象。 (3) We proposed a super-resolution approach that deeply integrates the advantages of pixel space and feature space to improve the resolution of surveillance video detection objects.
本文的其余部分组织如下:部分
目标检测是计算机视觉的基本任务,可以广泛应用于对象跟踪、人群计数、人脸识别等领域。这是一个重要的公共安全算法。目标检测算法基于候选区域,也称为二级目标检测算法,主要包括提出卷积神经网络(R-CNN),快速R-CNN R-CNN更快,其他模型(
相对应的超分辨率算法可以重构高分辨率图像从一个或一系列低分辨率的图像。这是一个低级的计算机视觉算法和一种高层次的计算机视觉算法的基础。深超分辨率算法基于卷积神经网络可以重建高质量的超分辨率图像丰富的高频信息和清晰的纹理特性,已成为主流的研究方法。超分辨率的卷积神经网络(SRCNN)首次使用卷积神经网络领域的超分辨率和只使用三层卷积神经网络超越最传统的超分辨率方法(
来解决这个问题,视频监控系统在公共安全领域缺乏基本和智能管理和分析算法,我们提出了一个监控视频对象的超分辨率方法基于深度融合卷积神经网络。它帮助警察和其他监控录像分析师跟踪,识别和分析对象和调查情况。通过优化回归单程对象检测算法,我们可以识别对象的实时监控录像,它帮助观众来跟踪和分析视频内容的视频对象。我们设计了监控视频的关键帧选择算法。通过分析对象类别,数量,和自信程度的视频帧,少数有重大变化的视频帧对象选择从大量的视频协助监控录像查看器快速定位对象,减少工作量。我们使用了基于深度融合网络的超分辨率算法重建对象决定的。它有助于提高分辨率的关键对象,协助监控录像查看器仔细检查关键对象的细节,和完善的质量监控录像内容分析。监控视频的超分辨率方法对象基于深度融合本文构造的卷积神经网络可以有效地用于公共安全领域的协助警察和安全人员跟踪和分析监控录像对象。,它还提供了一个有效的辅助工具,预防和打击暴力恐怖犯罪。
回归单程对象检测方法需要网络的视频帧作为输入,并返回的位置和类别边界框(BBox)在输出端。对于每个网格的视频帧,它预测
相对应的超分辨率重建方法重建高分辨率的图像或视频基于一个或一系列低分辨率的图像(视频帧)。因为它是很难获得一系列低分辨率图像重建相同的对象,当前研究主要主要关注幅图片超分辨率。视频超分辨率重建需要综合利用信息在时间和空间维度和提高重建效果的中心框架使用相邻的低分辨率的信息帧。一个图像或视频帧的降解过程可以被描述为(
视频监控系统广泛分布在社区,道路,街道,和商业场所(超市)是一个强大的公共安全的保证。的结合,传统的视频监控系统和人工智能技术能有效提高视频内容分析的准确性和异常行为的警告,大大提高工作效率的监控视频的观众,并减少劳动力成本。视频的超分辨率框架基于深度学习的检测对象图所示
超分辨率的视频检测对象的工作过程。
视频的超分辨率方法基于深度学习的检测对象主要分为三个步骤。首先,我们使用回归对象检测算法执行实时目标检测监控视频来自社区,道路,街道,超市,和其他地方。标记范围、类别、和信心的对象实时视频帧协助警察、安全、和其他视频观众跟踪对象。然后,我们使用一个关键帧选择算法选择从大量的视频帧与重大变化并选择从大量的冗余信息的关键信息快速高效地帮助观众分析视频内容。我们最后使用超分辨率重建算法,提高分辨率,和识别的关键对象。
改善社区等公共场所的安全,超市、道路、街道和协助监控录像观众迅速和有效地定位对象,我们设计一个视频对象检测超分辨率算法相结合的目标检测和超分辨率重建。如图
视频超分辨率网络检测对象。
对象检测网络由三部分组成。首先,我们使用等骨干由模块重点,CBL (BN, conv ReLU漏水),和CSP提取视频帧特性。重点模块用于片输入图像映射和转换的维数特征。例如,我们可以把608
的核心模块对象检测网络和多尺度特性融合网络。
在我们进行超分辨率重建,我们将选择避免浪费计算能力的检测对象super-resolve大量无用的对象。对象的选择过程是详细描述部分
对象检测算法可以帮助警察和安全人员在分析对象和调查监控录像安全情况。它有助于实时追踪和监视可疑的迹象和对象,以避免刑事伤害。对象检测算法包括两个核心模块,CBL CSP, CSP的残余结构CSP-1和卷积结构CSP-2组成,如图
我们的目标检测算法首先使用骨架提取输入视频帧的特征;然后使用多尺度特征融合模块来加强网络特征融合的能力;最后使用GIoU损失优化对象框架,通过DIOU_NMS过滤对象框架,和输出对象框架信息,信息分类信息,和信心。目的优化损失函数
根据监控录像的输出对象检测算法,我们可以从视频的类别,选择帧数,和检测帧产生重大变化与前一帧作为关键帧。静态的照片经常出现在监控视频(视频中对象的类别和数量没有改变)。检测对象super-scores所有静态视频帧将导致大量的冗余信息,它不仅浪费计算能力,也不利于视频内容分析。所示的算法
基于像素空间超分辨率方法的目标是使super-resolved图像尽可能接近真实的图像在像素空间的每一个像素点。这些方法使用L1和L2作为损失函数和不使用对抗训练生成视频帧,和重建结果接近真实的视频帧的像素空间。然而,很容易失去高频信息,导致非常光滑和模糊重建视频帧和视觉感知质量差。特征空间超分辨率方法旨在使super-resolved图像的特征空间接近真实世界的图像。这些方法结合感知损失,对峙损失,L1和L2损失函数。他们用敌对的训练来生成高质量视觉感知的视频帧。然而,这些方法容易导致变形和超分辨率图像结构的扭曲。因此,我们提出一个基于像素空间的融合的超分辨率方法和特征空间。基于像素空间超分辨率方法保证了视频帧的真实性而损失函数基于特征空间的融合可以提高视频帧的视觉感知质量。
基于深度投影结构的超分辨率方法学习之间的映射关系LR和SR重建过程中的几次,和将采样单元放置在序列。的结构,将采样单元如图
抽样单位、递归结构和非对称投影结构。
提高超分辨率重建的影响,我们需要堆栈几个upsampling和downsampling单位获得高层语义特征。然而,叠加数upsampling单位和downsampling单位将导致大幅增加模型的参数,和模型的训练和使用将变得更加困难。如图
图像超分辨率重建的方法基于像素空间缺乏高频细节信息,和纹理特征不够明显。我们试图直接生成超分辨率图像基于生成对抗网络的使用方法。然后,我们发现,这些方法可以提高视觉的清晰度。然而,生成的SR形象遭受结构变形和失真,它是容易模式崩溃在处理现实世界的视频超分辨率重建帧,和模型的鲁棒性是不够的。因此,我们建议使用L1损失函数基于像素空间和上下文损失基于不对称的特征空间深度递归网络投影。上下文损失函数所示(
我们使用PyTorch建立视频超分辨率模型检测对象。在模型训练阶段,我们使用一个高性能的服务器模型训练和验证。在模型中测试阶段,我们使用个人电脑进行测试,以确保模型的可用性和鲁棒性在实际应用场景。高性能服务器上运行Linux操作系统,GPU是NVIDIA泰坦Xp。个人电脑的操作系统进行测试与i5 Windows 10 CPU核心。我们已经采取了一些视频,不涉及个人隐私的社区,道路,街道,超市,和学校。然后提取视频帧的增量训练对象检测模块。我们选择一些高分辨率视频帧的拍摄视频并将它们添加到DIV2K数据集,然后我们扩大了训练集,验证集和测试集1000年到200年。
视频的超分辨率方法的评价指标检测对象包括目标检测的准确性和速度、峰值信噪比,老的结构相似图像。我们使用意味着平均精度(mAP)评估对象检测准确性,主要包括精确率和召回率,所示(
我们第一次网上获得一些监控视频,但是我们发现幕后参与这些监视视频相对单一。来验证我们的方法的有效性在公共安全领域,我们已经采取了一些监控视频,不涉及个人隐私的社区,道路,街道,超市,学校,和其他地方。视频帧率是30 fps,视频分辨率为720 p(16: 9),和十秒的视频大小约为1.5 MB。我们使用回归目标检测算法来检测实时监控视频中的对象。对象检测算法协助警察和保安人员实时追踪可疑物品,防止犯罪。另一方面,对象的输出信息为关键帧选择检测奠定了基础和关键对象超分辨率重建。我们使用的视频监控三个场景:超市、社区,和公路,来验证对象检测算法的影响,如图
目标检测的结果超市、社区和道路。
在超市,主要检测监控录像的对象是人。我们的目标检测算法可以实时准确地检测人。我们可以实时监控贵重物品在超市通过扩大训练数据集。当类型,数量,和信心的贵重物品的变化,我们可以及时提醒超市管理人员。人的实时检测和贵重物品可以帮助超市经理及时跟踪可疑人员,防止贵重物品被盗。在社区的场景中,监控录像的主要监控对象人们和汽车,这有助于在确保人民的生命和财产的安全。因为有许多小物体在社区视频监控和车辆在停车场之间的遮挡是更严重的,对象检测算法需要识别小物体和阻挡物体。我们可以看到,我们的目标检测算法可以确定小对象和模糊对象图
当调查犯罪案件时,警察经常需要找到一个非常小的帧数,从大量的视频关键信息。选择关键帧手动需要大量的成本和物质资源,效率低下。在目标检测算法基础上,我们设计了一个关键帧选择算法与重大改变挑选关键帧类别,数量,和信心从大量的冗余的视频帧信息。我们选择12个关键帧来自社区的监控录像(540帧),14个关键帧从超市监控录像(450帧),和16个关键帧的道路监控录像(510帧)。我们的关键帧选择算法可以过滤大量的冗余信息帧生成的静态照片。图
一些关键帧选择关键帧选择算法和关键对象。
在社区的场景中,监控录像的主要监控对象是地面停车场。当没有行人和其他对象在地面停车场及周边道路、监控录像是在静态图像所以没有关键帧提取。如图
监控视频遭受低分辨率由于硬件技术,硬件成本,拍摄环境、网络传输等。观察关键信息的细节,警察和保安人员经常需要放大图像4次,8倍,甚至更高。如果你直接放大图像,放大图像高频信息,会错过很多患有低质量和视觉感知差,很难辨认。老的pixel-space-based超分辨率方法可以重建视频帧接近真正的图像通过优化super-resolved之间的距离图像和实际图像的像素空间。然而,重建帧可能缺乏大量的高频细节信息,以及纹理的视觉感知特征尚不清楚。因此,基于像素空间超分辨率方法的基础上,我们进一步整合基于特征空间的上下文的损失。通过优化地方特色super-resolved图像和实际图像的特征空间,我们可以改善的高频信息重建老视频帧并获得高质量的图像清晰的视觉感知。应该注意的是,对象检测和关键帧的基础上选择,我们从关键帧选择关键对象根据阈值的信心。决议和存储容量通常非常小和缺乏高频信息。PIRM2018-SR ESRGAN是冠军的解决方案(3)地区超分辨率竞争,这可以产生自然老和详细的图片。 SPSR adds gradient map branches based on ESRGAN to constrain the structure of the generated image, which improves the authenticity of the SR image and the quality of visual perception. Therefore, the SPSR and ESRGAN [
比较super-resolved关键对象(三轮车)在道路监控录像。
比较super-resolved关键对象(出租车)在道路监控录像。
比较super-resolved关键对象(客户)在超市监控录像。
比较super-resolved关键对象(孩子)在社区监控录像。
我们设计了非对称深度递归网络投影。我们首先构造一个投影结构的上部和下部抽样单位是堆在序列通过模拟人类的视觉系统。然后,我们使用了层叠投影误差和同源投影误差纠正upsampling的损失,将采样单元。此外,我们改进了SR重建效果的输出级联upsampling单位不同的深度。我们设计了一个递归循环和不对称结构改善SR重建效果不增加参数。在路上,我们选择一个三轮车和一辆出租车重建SPSR和ESRGAN并作出比较。从图
维护和保障公共领域的安全构成安全、智能城市的基础。监视设备广泛分布在公共领域可以及时发现可疑迹象,对象,可以查询信息可疑车辆和人员通过监控录像,并能提供客观诉讼证据的调查和审讯阶段期间的情况。传统的视频监控系统依靠手工分析的视频内容,这使得它很难有效地发挥视频监控的作用。因此,我们将传统的视频监控系统与人工智能技术。首先,我们融合的目标检测算法,关键帧选择算法,和超分辨率重建算法来构造一个超分辨率框架视频检测对象,它提供了一个有效的辅助工具,警方人员。然后,我们使用目标检测算法来检测对象的实时监控录像,协助警察和其他人员跟踪可疑对象。此外,它可以帮助选择的类型、数量、和信心的监控视频帧从大量的冗余信息。从大量的冗余信息选择关键信息可以提高视频分析的效率,减少人工工作量。最后,为了解决这个问题,不能有效利用低分辨率的监控录像,我们选择的关键对象关键帧的超分辨率重建。结合基于像素的优点超分辨率方法和特征空间损失函数,我们设计了非对称深度递归投影网络,可以用高分辨率重建的关键对象。 The next step of our work is to realize super-resolution reconstruction of video detection objects under noise, blur, and other interference in the surveillance video.
图片,视频,关键帧和关键对象和SR结果数据用于支持本研究的发现已经存入GitHub库(
作者宣称没有利益冲突。
作者要感谢湖南大学艺术与科学的为他们提供高性能的服务器。所有的培训和测试视频的超分辨率模型检测对象的高性能服务器上完成。这项工作是由中国国家社会科学基金(没有。20 &zd120)。