基于自顶向下和自底向上的线索的移动物体检测不同背景视频序列

文摘

运动目标检测是一项重要和关键的任务对于任何监视系统。一般来说,一个移动目标检测的任务是执行的基础上连续帧差或背景模型是基于一些数学方面或概率的方法。但是,这些方法都是基于一些初始条件和短的时间需要学习所有这些模型。此外,瓶颈在所有这些以前的方法是,他们要求整洁干净的背景或需要创建一个背景首先通过使用一些方法和必须定期更新他们应对照明的变化。摘要移动物体检测执行使用视觉注意力,不需要背景背景独立制定和更新。许多自底向上的方法和一个结合自顶向下和自底向上的方法在本文提出。提出的方法更高效的学习背景模型的无关紧要的要求和由于独立之前的视频帧。结果表明,该方法可以在后台对轻微的运动,工作在不同的户外环境。

1。介绍

探测移动物体的过程中具有重要意义的计算机视觉领域像视频监控、自动目标检测和跟踪,等等。也非常开始和自动化监测系统的重要一步,因为它将移动物体和背景区分开。指定对象在视频帧或场景的移动对象关注并保持最大的注意力在那一刻。获取同一场景在不同时期和检测这些变化在不同领域有大量的应用程序。实时应用,如机器人愿景和监测将使用一系列的帧作为激励和目标检测的问题可以考虑移动物体检测等系统。

实现任何方法和使它有用,应该考虑两个因素:计算成本和效率。然而,大多数的目标检测方法是昂贵的计算成本而言。静态图像序列用于降低算法的复杂性,但同样应用在每个图像帧的视频对象检测将不是一个适当的解决方案。一种方法基于上述条件为静态图像使用最有效的算法将低于所需的移动物体检测技术进行实时分析。因此,它是非常重要的,该方法应该高效、可靠。一堆想法想到当它是关于人类的视觉注意力模型。一种类型的方法鼓励自下而上的方法赶出关注的重要性。这些类型的方法既不是任务的依赖也不是基于内存。索赔是我们的方法更容易关注对象从背景中脱颖而出。使用最广泛的模型之一,自底向上凸起是Itti-Koch模型(1]。

另一方面,有人指出各种自上而下的相关性方面的刺激来推动我们的注意力。这些任务相关的因素包括上下文和基于特征的线索在别人。例如,如果我们有寻找一个行人的任务在一个图像,我们可能会集中在路上尽管存在突出的物体在天空中。同时,寻找一辆车,我们会召唤我们的汽车是什么样子的,能驱动的知识关注对象类似于它而不是对象类似于杆。在拟议的工作中,上下文和基于特征的线索只有被认为是驱动我们的注意力在自上而下的影响。

2。背景介绍和相关工作

各种类型的方法已经提出了解决问题的检测对象从给定的一组图像。如图1检测,这些方法可以分为两个预测类:(1)时序差分和(2)背景建模和减法。

时间差分,场景捕捉到一个静态的相机和移动物体近似是由两个连续的视频帧之间的区别。当一个变化是发现高,像素被确定为一个移动的背景。然而,实时应用程序(如监测不使用时间差分由于其性能不佳。

在背景建模中,使用数学模型或设计的背景是概率定理和它从当前帧中减去。通过比较当前帧的有效的模型场景背景,背景减法段相对应的改变区域移动的物体,称为前景。然而,自动提取前景仍然是一个严重的挑战,当前状态的艺术一个任意的场景,例如,非静态的和杂乱的背景。最近从视频序列背景模型估计并相应地更新和前景从背景中是有区别的。一般来说,移动对象可以通过背景模型检测和减法的方法(2,3]。有方法如高斯混合模型(4),意味着模型、标准偏差模型,平均模型(5,6背景模型是估计的)。

方法建立人体模型和跟踪移动物体是由Mikić等人在7]。获得图像的视频时,物体或人体检测和分割图像序列。边界的人体生成同步,分割多个视频流。定位不同的身体部位是通过模板配件和不断增长的过程。这个模型的初始化是通过贝叶斯网络集成prerequired人体特性的知识。最后,通过卡尔曼滤波器用于跟踪程序执行模型的近似位置。

简单的背景帧差分等方法不是不变的光照变化,因此运行平均或移动平均法(8)由于使用所需的背景模型的更新。尽管运行平均属性低计算复杂度和内存密实度高。性能可能会提高如果结合模糊方法。在模糊背景减法,饱和线性函数是用来估计像素移动物体而不是硬限幅器的功能。另一个背景去除技术提出了(9)基于模糊理论使算法照度不变的和不变的阴影的颜色特性。

当背景模型估计的高斯混合模型(10),不能对光照的变化和小的不规则运动相机(相机抖动)。对于这一问题的解决方案是将模糊理论与高斯混合模型。2型模糊混合高斯模型(11)是这项技术克服了传统高斯混合模型的问题。背景减法健壮的方法被定义为张和Kamath12]。首次检测到对象为blob缓慢采用算法(卡尔曼滤波)。验证对象的执行通过整合blob检测和简单的帧差。直方图计算出使用扩展对象边界。技术执行更好的遮挡下更好的对象定位。但是有限制使用的椭圆边界建模对象像人类可能不适合,因为人类是一个复杂的对象。

分析建模的背景也是基于像素的颜色值(13]。每一个像素的颜色值分析了视频帧的时间很短。最常见的颜色是像素分配。算法还可以处理小扰动由于环境背景。它很容易实现,并迅速。但另一方面,该算法使虚假检测当视频帧包含复杂和拥挤的背景。(给出的方法之一14]还处理杂乱的背景和轻微移动背景由于树枝和灌木。对象检测是基于估计概率密度函数使用先前的像素值。另一个背景模型中给出(15)是基于核密度估计也用于跟踪。

背景减法和分割方法用于构建三维模型的人体16)可进一步转化为自由视点视频。从像素色彩的背景,统计对象是分离的。背景图像的平均值和标准偏差,如果计算像素颜色的不同渠道,为检测前景对象定义的阈值。的工作(17)表示有多少算法评价预处理算法的广泛变异。背景减法也用作预处理任务实时3 d动作捕捉(18]。在这种方法中,背景是由计算统计参数如在有限的学习期间的平均值和标准偏差。

雷恩et al。19)定义由单一高斯背景均值和协方差矩阵参数的集成,但这种方法并不承受动态背景。全能背景减法模式提出了(20.]。这里作者鉴于初始化和更新的详细描述和模型是如何工作的。该算法可以更具体地理解划分成三个任务。首先,它是前景或背景像素的分类。其次,模型可以被初始化,只单帧,节省时间,使其适用于实时和短序列。第三,它是关于更新模型。目前建议的方法(21)使用背景减法模式作为移动目标检测的预处理和初步的步骤。作者代表反馈背景评估框架,进而给出了背景区域。

2.1。问题

计算,前面提出的方面是他们花大量的时间;还建立和更新背景模型将是一个繁琐的过程。所有这些方法都值得没有背景;然而,生成的背景模型可能并不适用于一些场景和突然的变化。因此,它可以表示,减少这些改变的影响是极大地依赖一个好的背景模型。高效的实现通常使用一个可靠的和廉价的技术找到感兴趣的区域,可能会进一步受到成本计算。受关注的成功模型基于静态图像,在拟议的工作,这些注意力模型对视频对象检测扩展使用暗示希望实现更好的结果尚未探索的标准技术。

3所示。视觉注意力

3.1。为什么视觉注意力?

视觉注意力,也叫卓越,是使一个对象的感知质量,人,或像素比邻国脱颖而出,因此它吸引了我们的注意力22]。视觉注意力评估方法大致可以分为生物基础,纯粹的计算,或两者的结合。一般来说,所有方法使用低级的方法通过确定不同的图像区域相对于周围环境,使用一个或多个特征强度,颜色,和方向。异常,有效执行这项工作的方法是模仿人类的行为描述。人类的视觉注意机制是生物等效的预选区域进行进一步的成本计算。人类高度发达的认知机制,允许他们执行任务需要的视觉指导效率。出于人类的效率,提出了一种动态视觉注意力计算模型,将帮助我们更有效地执行任务在视频对象检测并实现一个工作模型沿着相同的路线来验证我们的建议的可行性。

视觉注意力估计图像处理已经成为一个有价值的工具;然而,现有的方法表现出相当大的变化的方法,往往很难属性的改进特定算法在生成的质量属性。灵感来源于成功的视觉注意力模型基于静态图像,在拟议的工作,这些视觉注意力模型扩展为视频对象检测希望使用暗示标准技术实现更好的结果还没有探索。视觉注意力和基于特征的线索被用于开发一个模型来计算区域的兴趣视频合并时间方面的视频在计算这些线索。相比以前的方法,使用的培训,使探测器学习视频中的对象,该方法消失这个劣势。基于注意力的方法经常被使用的高度成功的任务预选区域在静态图像。这些方法都不同程度的自然的复杂性和它们利用不同的线索来人类视觉注意力模型。因此,重要的是该工作的常用方法为静态图像处理问题的方法将工作最好的视频。

视觉注意力的方法分为两个主要流:自下而上和自上而下的模式。低水平等功能对比,颜色,强度,方向,纹理,运动可以使测量每个像素在图像的特点。这种类型的模型被定义为自底向上凸起或视觉注意力模型。通常,大部分的自底向上凸起的方法(1,23)使用地方特性,而不是全球层面特征。在自顶向下方法中,显著地图是由全球功能,如物体或场景的上下文信息(24- - - - - -27]。物体或场景的上下文可以定义的统计概率分布。全球信息提供了空间形式和类别的场景或对象(28,29日]。这些方法是足够快而自底向上的方法因其搜索机制和固定。

很多工作已经完成之前人类视觉注意力模型;他们中的许多人只使用自底向上的(30.)或只有自上而下的因素(31日)来预测人类的关注。我们的灵感结合自顶向下和自底向上的特性(所示的工作32]和基于我们的研究领域的行33]。给出了一些常用的技术如下。

侯和张34]凸起检测算法提出独立的特性,分类,或其他形式的先验知识的对象。通过分析日志的一个输入图像,图像的光谱残留在光谱域提取,并更快的方法来构造相应的特点提出了在空间域映射。

Harel et al。35提出了新的自底向上的视觉显著模型,它被称为基于视觉显著(GBVS)。它包括两个步骤:首先形成激活地图在某些特色频道然后正常化的方式,强调明显并承认结合其他地图。生物模型是简单而合理的在某种程度上是自然并行。

Itti et al。1)定义了自底向上的方法计算显著地图。低层次的特性,如强度、色彩对立(红绿,自民党),和四个方向,(0、45、90年和135年)用于计算特征图。权重分配结果映射成正比的微分响应邻居。因此,卓越地图地图的定义结合42特征。

在这里,在这个建议的方法,突出视觉注意力,也就是说,基于图像的司机的注意力的方法,已被用于图像序列的运动目标检测。

4所示。提出的方法

该方法分为两个不同的流已经发现使用视觉注意力的视频序列运动目标:(1)基于自下而上的线索的方法和(2)结合自顶向下和自底向上的线索为基础的方法。

4.1。基于自下而上的提示视觉注意力的方法

以下4.4.1。我修改的频率调谐的空间模型

在监控系统中,经常运动是一个重要的线索来引起注意(36]。主要突出部分的视频帧序列被认为是移动的对象,因此,可以应用在监视它作为一个基本步骤。移动对象有一些突出的属性和功能,可以很容易与背景区分。如果一个图像有一个小物体,图像的平均灰度值将价值背景值附近。相比之下,如果图像有一个对象规模更大,附近的平均值将前景对象。这个方法是一个修改版的方法(37]。两个修改完成:首先,它是在37),作者发现显著地图使用高斯模糊图像的差异大小的3×3的面具和平均图像,提出了显著图的图像计算使用不同的高斯低通(面具11和大小5)图像和平均滤波器提供图像的大小。

方法。应用平均滤波器的视频序列,有大小为特定的时间, 在哪里平均滤波器,面具的尺寸吗,被定义为两个图像之间的卷积。

采用高斯滤波器在图像在哪里高斯低通滤波器,面具大小11日和是5。显著值在每个像素位置是由在哪里两个像素之间的距离在各自的图像。提出这种方法的第一步是图像平均和第二步是减去从图像的低通版本使用高斯低通滤波器的,结果没有尖峰噪声和随机输出图像的像素。最后,形态学操作执行创建blob等结构的合成输出图像中提取重要组成部分的图像。

但对于提高速度的方法,所有在频域中应用的基本步骤。图像平均频率分量的直流分量,应考虑突出图像中大部分的对象。应用高斯滤波器具有低通特性,定义了合成高截止频率显著地图。高截止频率清楚地说明图像的边缘和边缘但去除噪声和随机像素(这也是高频组件)结果,实施模糊的图像通过使用高斯扩散,振铃效应是可以避免的。

4.1.2。基于彩色图像的视觉特点(颜色特点(38])

基本上,人类认知发展可以更好地使用HSV颜色空间中执行代表色调,饱和,价值(38]。任何红色,绿色和蓝色组成部分特定像素的图像转换到HSV组件按照下列方程(39]: 在哪里如果;否则,; 给定的彩色图像的大小通过像素,像素颜色值的位置表示为。计算饱和度和亮度的平均值在整个图像,表示它们,分别。

的色彩特点在位置给出了二维s形的函数(40,41), 的参数和是两个常数。一般来说,判断凸起时,我们遇到的感觉和主观组件裁决。例如,我们大多数人可以感知更明亮、更纯的颜色比枯燥和混合颜色更容易;卓越的判断两个颜色相同的亮度和饱和度可以主观的。因此,在目前的研究中,选择饱和度和亮度显著措施。然后,色彩特点是标准化的范围。

4.1.3。高斯空间模型合并的高斯拉普拉斯算子(日志)滤波器和高斯滤波器

突然的变化检测到图像锐化滤波器,通常采用拉普拉斯算子的滤波相同的一个。但作为定义的声音也突然的变化图像的细节信息,需要一个过滤器可以产生合成图像的原始图像像素在哪里有变化没有噪音。拉普拉斯算子的高斯滤波器是一个高斯函数的二阶导数。图像首先是平和的高斯滤波器,这样可以消除噪音,然后与高频信息,如增强边缘和线条使用拉普拉斯算子的过滤器。这两步的过程称为高斯拉普拉斯算子(日志)操作(42]。

二维对数函数,高斯函数的中心位于零和标准差可以表达的形式43]

方法。应用高斯滤波器在图像现在,计算图像的测井响应,我们得到的卓越的地图在像素位置可以估计找出两张图片的反应之间的欧氏距离;也就是说,

4.1.4。梯度特点利用Sobel算子

索贝尔算子(43)是用于检测图像的快速变化。梯度图像像素的强度决定使用Sobel算子。响应Sobel过滤器的每个像素是一个绝对星等响应的梯度方向和梯度方向像素。计算图像的梯度计算,是廉价的,因此这是快速而且原始。

在图像上应用Sobel过滤器,有大小,连续像素的距离像素, Sobel与正在执行Sobel操作图像使用不同的过滤器,一个和另一个: 正常化后的结果之间,结果将使凸起的结合地图作为

4.1.5。修改频率调谐空间模型II

作为人类感知的颜色和强度可以与HSI模型(44),因此,实验室颜色空间在此HSI颜色空间在这种方法所取代。该方法几乎是一样的(37),但唯一的区别是,HSI颜色模型是用来代替实验室颜色空间和高斯滤波器的窗口大小是11×11代替3×3。卓越的地图对于一个图像的宽度和高度像素可以根据[制定37] 在哪里平均或二维图像数组和意味着什么是相应的图像像素矢量高斯模糊版的价值(使用11×11窗口大小)的原始图像37]。合成顺从的大小(使用欧氏距离计算)。使用HSI颜色空间,是每个像素位置向量。

4.2。组合方法(结合自下而上和自上而下的线索)

4.2.1。准备将色彩特点与纹理特征(局部二进制模式(LBP))

Ojala et al。45)提出了一个方法定义为局部二进制模式(LBP)。最初,用于纹理分析的方法是(46),但后来被用于不同的应用程序。枸杞多糖是光照不变量,计算效率,适用于计算机视觉任务。枸杞多糖,邻居3×3像素为每个像素定义,而中间的像素。如果是高于中间的一个,它可以被指定为0,其他1。因此十进制值定义从8邻居像素。后来,扩展的枸杞多糖在这附近发现了窗口大小变化(47]。枸杞多糖的例子计算人的形象是显示在右边的图2。

提出研究的显著特点(颜色)和功能(基于局部二进制模式特性)地图获得了我们的测试图像。结合之前,两个地图规范化矩阵与每个像素值在0和1之间由一个数字。各种可能的组合也检查结合这两个maps-weighted加法和乘法的两组权重分配给每个地图。这是获得更多精心节7。此外,单一源模型的性能也被检查。

4.2.2。整合修改频率调谐空间模型面向我和直方图的梯度(猪)48]

的柱状图的梯度(猪)48是特征描述符,实现检测。猪人探测器使用检测窗口是64像素宽,128像素高根据人的结构。它作用于88像素细胞检测窗口内的这些细胞将被组织成重叠块。在一个细胞中,梯度向量在每个像素计算。64年8×8,梯度向量是提取并投入9本直方图。直方图的变化从0到180度,每本有20度。直方图箱是由梯度向量的大小。贡献分裂两者之间最亲密的垃圾箱。下一步在计算描述符正常化直方图。而不是单独正常化每个直方图,细胞首先分为块和规范化的基于直方图的块。 The final descriptor is designed using this procedure as shown in Figure3。

4.3。优化问题制定

拟议的框架选择显著地图移动物体检测通过定义一个学习基础框架。

复合显著地图被定义为参数化的线性组合n基础显著地图;例如: 与。nonnegativity约束执行mercer条件显著地图上(SM)。提出学习框架旨在学习优化显著地图移动物体检测。

因此,我们定义检测性能最大化为优化目标。有限的地面真理过度拟合的数据可能创造条件。因此,优化目标需要一个正则化项,确保理想的移动物体检测性能独立于地面实况数据的数量。

我们应用最大熵原理建立规范提出的王et al。49]。规范是实现通过应用最大熵原则分配概率函数值相等是0或1。因此,完整的优化目标为多个凸起被定义为映射问题在哪里表示完整的数据集和代表数据集的子集的例子假定可以与地面真理。信息功能评估不同重量参数代表正则化参数。函数代表了卓越的检索性能地图计算和作为在哪里代表一组给定的输入序列的检测结果。代表实际的输入序列和地面实况代表了计算检出率。函数代表规范术语定义为方差之和所有视频序列的检测率的计算

5。视频数据库

测试视频采用从[22,50,51]。视频分辨率4 cif(常见的中间格式)(704×576像素),帧速率30帧(帧/秒),图片730,mpeg - 1视频格式。一些用于测试的视频静态背景,而其他人则略动态背景。的细节,所有的视频概述在表用于测试目的1。


视频的名字	格式	长度	帧每秒	的帧数	框架 (宽×高)	图像类型

自动取款机	MPEG	29秒	25	728年	704×576	真实的颜色
凸轮	AVI	2分32秒	29日	4567年	384×288	真实的颜色
Campus_raw	AVI	1分57秒	10	1179年	352×288	真实的颜色
epc - 200天的鸟	AVI	37秒	29日	1115年	320×240	真实的颜色
HALLWAY_A	MPEG	22秒	30.	661年	704×576	真实的颜色
highwayI_raw	AVI	29秒	14	440年	320×240	真实的颜色
person15_walking_d1_uncomp	AVI	29秒	25	741年	160×120	真实的颜色
楼梯	MPEG	23秒	30.	707年	704×576	真实的颜色
visor_1197284015696_07_fumogeno4	AVI	1分钟20秒	25	2024年	320×240	真实的颜色

6。实验装置

实验进行一个英特尔(R)的核心(TM) i5 2430 CPU 2.40 GHz 6 GB RAM和使用MATLAB 7.8实现的算法工具。

7所示。结果

视频被认为是基于视频的背景和对象的变化来测试该方法在不同条件下的稳定性。改变颜色,强度,和纹理的背景以及对象也被认为是。提供独特的室外和室内条件以确保检查建议的方法的效率。其中一个视频是还算轻微变化的背景检查和稳定对动态视频见。在结果中,数字定义视频和字母数量定义不同的特定的视频图像帧。所有结果的第一列是原始图像序列的视频,第二列是凸起的地图图像序列,和第三形象考虑各自的图像序列的合成目标检测。这里,凸起地图已经计算了所有提议的方法的差距(10帧)的视频序列。

7.1。基于自下而上的提示视觉注意力的方法

安装7.1.1。我修改的频率调谐的空间模型

结果如图4,5,6,78个不同类型的视频使用平均滤波器和高斯滤波器的组合方法。所有的视频都有不同背景,不同的材质,颜色,和对象。对象有差异从人类机器像汽车和鸟类。即使所有的变化都在后台,该算法给出了一个高效和优秀的结果。

第一个视频显示,一个人走向一辆汽车和检测到的对象。第二个视频是关于公路交通,该算法可以正确检测所有的汽车。第三个位置有一个校园一些的汽车已经停和一辆车进入校园;发现这是件好事。其他视频包括两个人进入走廊(视频4),鸟在巢(视频5),一个人要远离相机在校园区域(视频6),一个房间进入ATM(视频7),和一个走在路上(视频8)。

在视频5,鸟儿在巢,背景被认为是稍微移动由于树叶但拟议的技术是给一个明显的结果。

7.1.2。基于彩色图像的视觉特点(颜色特点(38])

显著的结果数据中演示了使用色彩特点的方法8和9。在第一个视频,一个人上楼,他正确地检测到。但是随之产生一些错误的后果也被视频1 (a)这种方法是基于视频序列的颜色值,因此,一些对象发现这是错误的,他们有相同的颜色对象。

7.1.3。高斯空间模型合并的高斯拉普拉斯算子(日志)滤波器和高斯滤波器

结果显示7个不同的视频数据10,11,12在所有的这些视频,以正确的方式检测到的对象。但是有一些问题面临在检测由于增加假阳性。在视频2中,检测到图像的左上角有相同的颜色和不是一个移动物体。视频5和6中检测到绿色通知董事会不需要检测(假检测)。在视频7中,车辆在停车场也检测到非法的对象而不是移动的。视频4但在这种方法中,一些汽车已经放置在停车场不考虑移动物体检测这是真的。

7.1.4。梯度特点利用Sobel算子

在图13,结果给出了使用的方法从静态图像梯度特点使用Sobel四个不同的视频。这里,在视频1中,所有的汽车检测正确,但是由于他们的阴影最终检测是合并和汽车检测积累。在视频2中,击剑在楼梯和检测到左上角。当对象(一个人)向摄像机,完整的身体不能被识别,而在视频3,车辆在左上角不应该被发现但他们检测到错误。

7.1.5。修改频率调谐空间模型II

结果如图14和15验证我们的算法在检测运动物体的视频帧序列。在视频中2、3、5、6,所有移动物体检测体面。一些可能定义错误的对象喜欢的视频,在视频1和视频4中,左上角和左下角,发现分别是错误的。

7.2。组合方法(结合自下而上和自上而下的线索)

7.2.1。将色彩特点与纹理特征(局部二进制模式(LBP))

图16显示在视频帧移动物体检测的结果。这些结果表明,该方法可以成功区分从视频序列的移动对象。正确检测到视频1中,但是在一些视频帧,左上角移动物体检测。在这两个视频1和2,人的脸和上半身完美。

7.2.2。整合修改频率调谐空间模型面向我和直方图的梯度(猪)48]

数据17和18显示的结果整合修改频率调谐空间模型与猪的特性。从结果,它可以被定义,算法正确检测到运动目标从背景。整体显著地图后自下而上的线索与自顶向下相结合的线索显示在中间列的结果。

8。比较分析

比较了基于时间、精度和算法的结果。在表2定义了一个特定的方法,这个方法的执行时间。最长时间被凸起方法使用频率调谐方法使用HSI颜色模型和最小时间是由法梯度特点使用Sobel从静态图像。


方法名称	执行时间(秒)

我修改的频率调谐的空间模型	0.842
基于彩色图像的视觉特点(颜色特点(38])	0.670
高斯空间模型合并的高斯拉普拉斯算子(日志)滤波器和高斯滤波器	0.68
梯度特点利用Sobel算子	0.620
修改频率调谐空间模型II	1.360
将色彩特点与纹理特征(局部二进制模式(LBP))	0.7
整合修改频率调谐空间模型面向我和直方图的梯度(猪)	0.849
高斯混合模型(GMM)	1.560
核密度估计(KDE)	1.489

在表4,比较分析了基于该方法的准确性。方法名定义各自的方式如表所示3。第一列指定视频的名称用于检查各种方法的准确性和第二列定义了一个视频图像帧的总数。其余的列代表帧的数量移动物体的正确检测到对一个特定的方法。精度的有关方法的最后一行中定义表4这表明,方法1(频率调谐空间模型使用聚合平均滤波器和高斯滤波器)有高效和满意的结果比其他算法。


方法1	方法2	方法3	方法4	方法5	方法6	方法7

我修改的频率调谐的空间模型	基于彩色图像的视觉特点(颜色特点(38])	高斯空间模型合并的高斯拉普拉斯算子(日志)滤波器和高斯滤波器	从静态图像梯度特点利用索贝尔	修改频率调谐空间模型II	将色彩特点与纹理特征(局部二进制模式(LBP))	整合修改频率调谐空间模型面向我和直方图的梯度(猪)


视频的名字	总框架	方法1	方法2	方法3	方法4	方法5	方法6	方法7	GMM (10]	KDE (15]

自动取款机	728年	651年	511年	597年	604年	540年	623年	674年	487年	503年
凸轮	4567年	4329年	4018年	4111年	3986年	3898年	4178年	4415年	3795年	3852年
Campus_raw	1179年	1094年	993年	1021年	956年	997年	1024年	1099年	885年	924年
epc - 200天的鸟	1115年	1005年	994年	973年	989年	898年	1023年	1097年	774年	855年
HALLWAY_A	661年	606年	545年	506年	469年	511年	595年	614年	363年	425年
highwayI_raw	440年	389年	328年	298年	305年	340年	370年	398年	286年	234年
person15_walking_d1_uncomp	741年	689年	602年	624年	597年	611年	662年	704年	583年	604年
楼梯	707年	644年	578年	603年	592年	612年	630年	675年	520年	563年
visor_1197284015696_07_fumogeno4	2024年	1965年	1901年	1898年	1830年	1920年	1946年	1990年	1719年	1756年

总	12162年	11435年	10470年	10631年	10328年	10327年	11051年	11739年	9412年	9716年
精度(%)		94.02	86.09	87.41	84.92	84.91	90.86	96.52	77.39	79.89

在图19,结果显示静态图像使用该方法和发现它是优秀的静态图像以及视频表演。评估的结果是使用召回执行参数如表所示5。


视频的名字	总对象	方法1	方法2	方法3	方法4	方法5	方法6	方法7	GMM (10]	KDE (15]

自动取款机	698年	0.9327	0.7321	0.8553	0.8653	0.7736	0.8926	0.9656	0.6977	0.7206
凸轮	4431年	0.977	0.9068	0.9278	0.8996	0.8797	0.9429	0.9964	0.8497	0.8693
Campus_raw	1104年	0.9909	0.8995	0.9248	0.8659	0.9031	0.9275	0.9508	0.7506	0.7837
epc - 200天的鸟	1100年	0.9136	0.9036	0.8845	0.8991	0.8164	0.93	0.9955	0.8016	0.8370
HALLWAY_A	621年	0.9758	0.8776	0.8148	0.7552	0.8229	0.9581	0.9973	0.7036	0.7773
highwayI_raw	410年	0.9488	0.8	0.7268	0.7439	0.8293	0.9024	0.9887	0.5845	0.6844
person15_walking_d1_uncomp	705年	0.9773	0.8539	0.8851	0.8468	0.8667	0.9390	0.9707	0.6976	0.5707
楼梯	678年	0.9499	0.8525	0.8894	0.8732	0.9027	0.9292	0.9574	0.7376	0.7986
visor_1197284015696_07_fumogeno4	1995年	0.985	0.9529	0.9514	0.9173	0.9624	0.9754	0.9975	0.8617	0.8802
整体的回忆		0.9612	0.8643	0.8733	0.8518	0.8619	0.9330	0.98	0.7427	0.7691

(一)

(b)

(c)

(d)

(e)

(f)

(g)

(h)

图19

静态图像的比较分析:(a)原始图像,(b)梯度特点利用Sobel算子,(c)修改频率调谐空间模型II, (d)将色彩特点与纹理特征(局部二值模式(LBP)), (e)修改频率调谐我空间模型,基于彩色图像的视觉显著(f)(颜色特点(38]),(h)整合修改频率调谐空间模型面向我和直方图的梯度(猪)48]。

9。结论

运动目标检测是使用在室内以及室外条件下视觉注意力。本文提出了不同的移动物体检测的技术。在拟议的方法,检测到移动物体由七个不同的方法。我们的测试结果表明,频率调谐使用平均滤波器和高斯滤波器的组合空间模型有效地代表移动物体在一个静态的背景。频率调谐空间模型使用平均滤波器和高斯滤波器的组合方法检测运动物体有细微变化时在后台或动态环境。探测移动物体使用视觉注意力的建议提供了积极的错误率较低等级的可能性是假的。它还支持一个成功的移动物体的识别。其结果验证了该算法的有效性和与其他方法进行比较。未来的增强可以通过将这些方法应用到移动背景。

利益冲突

作者宣称没有利益冲突有关的出版。

引用

l . Itti c·科赫,大肠Niebur”saliency-based视觉注意力模型的快速场景分析,“IEEE模式分析与机器智能,20卷,不。11日,第1259 - 1254页,1998年。视图:出版商的网站|谷歌学术搜索
m .口语和美国Deniz”,质量中心模型(一个小说背景建模方法分割的对象,“图像和视觉计算,25卷,不。8,1365 - 1376年,2007页。视图:出版商的网站|谷歌学术搜索
A . Manzanera和j . c . Richefeu”,一种新的运动检测算法基于法的背景估计,“模式识别的字母,28卷,不。3、320 - 328年,2007页。视图:出版商的网站|谷歌学术搜索
c . Stauffer和w·e·l . Grimson“混合自适应背景模型实时跟踪”《IEEE计算机学会学报计算机视觉与模式识别会议(99年CVPR”)柯林斯堡,页2246 - 2252年,科罗拉多州,美国,1999年6月。视图:谷歌学术搜索
b . Coifman d . Beymer p . McLauchlan和j·马利克,“车辆跟踪和交通的实时计算机视觉系统监测、”交通研究C:新兴技术》第六卷,没有。4、271 - 288年,1998页。视图:出版商的网站|谷歌学术搜索
陆j .香港、郑y、y, b,“小说背景提取和更新车辆检测和跟踪的算法,”《模糊系统和知识发现的第四次国际大会上(FSKD ' 07),3卷,第468 - 464页,2007年8月。视图:出版商的网站|谷歌学术搜索
Mikić,m . Trivedi e·亨特,p . Cosman“人体模型获取和跟踪使用立体像素数据,”国际计算机视觉杂志》上,53卷,不。3、199 - 223年,2003页。视图:出版商的网站|谷歌学术搜索
m . Sigari: Mozayani, h . Pourreza”模糊平均和模糊背景减法:概念和应用程序中,“国际计算机科学杂志和网络安全,8卷,不。2、138 - 143年,2008页。视图:谷歌学术搜索
f . El Baf, t . Bouwmans和b . Vachon“移动物体检测、模糊积分”《IEEE国际会议上模糊系统(模糊08年)2008年6月,页1729 - 1736。视图:出版商的网站|谷歌学术搜索
c . i . Patel和r·帕特尔,”基于高斯混合模型的运动目标检测,从视频序列”学报的国际会议和研讨会的新兴趋势科技(ICWET 11)ACM,页698 - 702年,纽约,纽约,美国,2011年2月。视图:出版商的网站|谷歌学术搜索
f . El Baf, t . Bouwmans和b . Vachon”2型模糊混合高斯模型的模型:应用程序背景建模、”视觉计算(ISVC 08年)国际研讨会,1卷,页772 - 781,拉斯维加斯,内华达州,美国,2008年12月。视图:谷歌学术搜索
研究所。张和c . Kamath“强大背景减法和前景为城市交通视频验证,”Eurasip应用信号处理》杂志上卷,2005年,第2340 - 2330页,2005年。视图:出版商的网站|谷歌学术搜索
n . Nihan e . Hallenbeck j .郑,y,“提取道路背景图像:一个基于模式的方法,”交通研究期刊》的研究报告卷,1994年,第88 - 82页,2006年。视图:谷歌学术搜索
a . Elgammal d·哈伍德,l·戴维斯,“引入轮减、非参数模型”第六届欧洲计算机视觉学报》上IEEE,页751 - 767年,都柏林,爱尔兰,2000年7月。视图:谷歌学术搜索
a . Elgammal r . Duraiswami d·哈伍德,l·s·戴维斯”背景和前景的建模使用非参数核密度估计视觉监视,“IEEE学报》,卷90,不。7,1151 - 1163年,2002页。视图:出版商的网站|谷歌学术搜索
j·卡兰,c . Theobalt m . a . Magnor h·p·塞德尔,“人类演员的自由视点视频,”ACM交易图片,22卷,不。3、569 - 577年,2003页。视图:谷歌学术搜索
郑胜耀Elhabian s h·艾哈迈德,k . m . El-Sayed“移动物体检测在空间域使用背景去除techniques-state-of-art,”计算机科学最近的专利,1卷,不。2008年1月1 32-54页。。视图:谷歌学术搜索
t . Horprasert Haritaoglu, c·雷恩·d·哈伍德,l·戴维斯和a . Pentland“实时3 d动作捕捉”诉讼的研讨会上感知用户界面,第90 - 87页,1998年。视图:谷歌学术搜索
c·r·雷恩a . Azarbayejani t·达雷尔和a . P . Pentland“P仪:人体的实时跟踪,”IEEE模式分析与机器智能,19卷,不。7,780 - 785年,1997页。视图:出版商的网站|谷歌学术搜索
o . Barnich和m . van Droogenbroeck”氛围:通用背景减法视频序列的算法,”IEEE图像处理,20卷,不。6,1709 - 1724年,2011页。视图:出版商的网站|谷歌学术搜索|MathSciNet
张黄k . j . s .徐,t·罗”准确的移动目标检测基于背景减法和苏珊,”国际计算机与电子工程》杂志上,4卷,不。4、436 - 439年,2012页。视图:谷歌学术搜索
c . Schuldt拉普帖夫海,和b·卡普托”认识到人类活动:当地的支持向量机方法,”17学报》国际会议模式识别(ICPR ' 04),3卷,页32-36,2004年8月。视图:出版商的网站|谷歌学术搜索
r . Rosenholtz”,一个简单的卓越模型预测的运动可以现象,”视觉研究,39卷,不。19日,3157 - 3163年,1999页。视图:出版商的网站|谷歌学术搜索
a·奥利瓦和a . Torralba“上下文对象识别的作用,”认知科学趋势,11卷,不。12日,第527 - 520页,2007年。视图:出版商的网站|谷歌学术搜索
g·e·布拉斯斯珀林,Z.-L。陆”,测量放大的关注,“美国国家科学院院刊》上的美利坚合众国,卷96,不。20日,第11686 - 11681页,1999年。视图:出版商的网站|谷歌学术搜索
诉Navalpakkam和l . Itti建模任务对注意力的影响。”视觉研究,45卷,不。2、205 - 231年,2005页。视图:出版商的网站|谷歌学术搜索
s . Frintrop g .支持者和大肠罗马,“有目的的搜索与自上而下的调制系统计算的关注,”《德国协会的年度会议模式识别(DAGM ' 05),页117 - 124年,维也纳,奥地利,2005年。视图:谷歌学术搜索
A . m . -特雷斯曼和g . Gelade feature-integration理论的关注。”认知心理学,12卷,不。1,第136 - 97页,1980。视图:出版商的网站|谷歌学术搜索
w . Einhauser, Rutishauser, c .科赫”任务要求中可以立即扭转丰富性非常在意的影响特点的复杂的视觉刺激,”杂志的视觉,8卷,不。2,第二条,2008年。视图:出版商的网站|谷歌学术搜索
j·k·Tsotsos和n·d·b·布鲁斯,“基于信息最大化,卓越”神经信息处理系统的进步18韦斯y, b . Scholkopf和j·普拉特,Eds。,pp. 155–162, MIT Press, Cambridge, Mass, USA, 2006.视图:谷歌学术搜索
a . Torralba m . s . Castelhano a·奥利瓦和j·m·亨德森”上下文眼球运动的指导和关注在实际场景:全局特征对象搜索的作用,“心理评估,卷113,不。4、766 - 786年,2006页。视图:出版商的网站|谷歌学术搜索
Itti和c·科赫.“视觉注意力计算模型”,神经系统科学自然评论,卷2,不。3、194 - 203年,2001页。视图:出版商的网站|谷歌学术搜索
k . a . Ehinger Hidalgo-Sotelo, a . Torralba和a·奥利瓦”造型寻找人们900年的场景:一个源模型眼指导相结合,“视觉认知,17卷,不。6 - 7,945 - 978年,2009页。视图:出版商的网站|谷歌学术搜索
x侯和l .张“卓越检测:光谱残留的方法,”《IEEE计算机学会学报计算机视觉与模式识别会议(CVPR ' 07),页1 - 8,IEEE计算机协会,明尼阿波利斯,明尼苏达州,美国,2007年6月。视图:出版商的网站|谷歌学术搜索
Harel j·c·科赫,p . Perona一起“Graphbased视觉特点,”神经信息处理系统的进步19麻省理工学院出版社,页545 - 552年,剑桥,质量,美国,2007年。视图:谷歌学术搜索
d . a . Poggel h .斯特拉斯堡,m . MacKeben”提示关注相对运动在视野的边缘,“感知,36卷,不。7,955 - 970年,2007页。视图:出版商的网站|谷歌学术搜索
f r . Achantay s Hemamiz Estraday s Susstrunky“Frequency-tuned显著区域检测,”《IEEE计算机视觉和模式识别国际会议(CVPR ' 09)2009年6月,页1597 - 1604。视图:出版商的网站|谷歌学术搜索
c .黄问:刘,s . Yu”地区从彩色图像中提取感兴趣的视觉特点的基础上,“《华尔街日报》的超级计算,卷。58岁的没有。1、特尔,2011页。视图:出版商的网站|谷歌学术搜索
c .黄、刘问:和美国,“自动中央从彩色图像中提取对象”《信息工程与计算机科学国际会议(ICIECS ' 09),5卷,页1 - 4,IEEE,武汉,中国,2009年12月。视图:出版商的网站|谷歌学术搜索
问:周,l .妈,m . Celenk, d . Chelberg“基于内容的图像检索是基于ROI检测和相关反馈,”多媒体工具和应用程序,27卷,不。2、251 - 281年,2005页。视图:出版商的网站|谷歌学术搜索
c .黄问:刘,s . Yu”地区从彩色图像中提取感兴趣的视觉特点的基础上,“《超级计算,卷。58岁的没有。1、特尔,2011页。视图:出版商的网站|谷歌学术搜索
r . m . Haralick和l·g·夏皮罗电脑和机器人视觉,addison - wesley朗文,波士顿,质量,美国第1版,1992年版。
r·c·冈萨雷斯和r·e·伍兹数字图像处理美国,新世纪,上台北,第3版,2006年版。
k . Ilanthodi彩色图像分析染色强度Quantification-Its应用医学研究和诊断的目的印度麦利普大学科技学院2012年http://shodhganga.inflibnet.ac.in/handle/10603/5042。
t . Ojala m . Pietikainen, t . Maenpaa”多分辨率灰度和旋转不变的纹理分类与局部二进制模式,”IEEE模式分析与机器智能,24卷,不。7,971 - 987年,2002页。视图:出版商的网站|谷歌学术搜索
d . s . Bolme j·r·贝弗里奇m .特谢拉和b·a·德雷珀”基社盟的脸识别评价系统:它的目的、功能和结构,”视觉系统的国际会议(ICVS ' 03)中的那,第311 - 304页,2003年。视图:谷歌学术搜索
t . Ojala、m . Pietikainen和d·哈伍德”纹理措施的比较研究与分类特征分布的基础上,“模式识别卷,29号1,51-59,1996页。视图:出版商的网站|谷歌学术搜索
n .中间人和b区格”的梯度直方图的人体检测,”《IEEE计算机学会学报计算机视觉与模式识别会议(CVPR ' 05),1卷,页886 - 893,IEEE计算机协会,圣地亚哥,加利福尼亚州,美国,2005年6月。视图:出版商的网站|谷歌学术搜索
s . j . Wang Kumar和S.-F。常,“学习与紧凑的散列码序列投影,”机器学习的国际会议(ICML 10)2010年6月,页1127 - 1134。视图:谷歌学术搜索
和y . m . h .孙w . de Neve罗,“隐私保护在视频监控系统:分析JPEG XR subband-adaptive匆忙的”IEEE电路和系统视频技术,21卷,不。2、170 - 177年,2011页。视图:出版商的网站|谷歌学术搜索
r . Vezzani和r . Cucchiara在线视频监控存储库(遮阳板):一个集成框架,“多媒体工具和应用程序,50卷,不。2、359 - 380年,2010页。视图:出版商的网站|谷歌学术搜索

多媒体的发展

文摘