文摘
目标和背景将长期跟踪过程中不断变化,这为准确的预测目标带来了巨大挑战。相关滤波算法基于手动功能难以满足实际需求由于其有限的特征表征能力。因此,为了提高跟踪性能和鲁棒性,提出一种改进的层次卷积特性模型为视觉物体跟踪相关过滤框架。首先,目标函数是由套索回归建模设计,和稀疏,时间序列低秩过滤器是学会增加模型的可解释性。第二,最后一层的特点,第二个池卷积神经网络提取层意识到目标位置预测从粗到细的。此外,使用过滤器从第一帧和当前帧计算响应地图,分别获得的目标位置找到响应的最大响应值映射。更新过滤器模型只有当这两个最大响应满足阈值条件。追踪评估提出的仿真分析tc - 128 / OTB2015基准包括100多个视频序列。大量实验证明该跟踪器实现竞争性能先进的追踪器。精确率和重叠的距离算法的成功率OTB2015是0.829和0.695,分别。 The proposed algorithm effectively solves the long-term object tracking problem in complex scenes.
1。介绍
视觉物体跟踪(1- - - - - -4)是一种最基本的和具有挑战性的研究问题在计算机视觉领域,结合先进的技术在一些领域如图像处理、模式识别和计算机应用程序。视频运动目标跟踪的本质是捕获的图像序列,通过分析和研究图像处理技术。首先,特性,比如整体或部分边缘,纹理,形状,具体目标的对比度和亮度信息提取和分析。检测到特定目标后在初始图像帧的视频序列,具体目标是动态的实时位置估计的基础上,在后续帧中提取目标特性。然后,目标位置之间的对应关系建立了前后帧来获取目标的运动轨迹。尽管取得了巨大的进步,视觉物体跟踪仍更具挑战性的完美地处理关键的情况。
在主流跟踪算法中,基于歧视相关滤波器的跟踪算法(DCF) [5- - - - - -7)框架具有较强的优势,迅速的应用和发展。Bolme et al。8)首先采用相关性过滤器框架,它使用输出最小平方误差的总和(MOSSE)算法和跟踪速度大大提高。然而,MOSSE跟踪器的跟踪精度不能满足实际的需求。提高跟踪精度,亨利克提出的循环结构tracking-by-detection与内核(埋头)算法(9,10),利用循环矩阵的对角化的计算过程简化的计算核回归,所以目标跟踪速度大大提高,其跟踪精度也更高。然而,当目标规模继续增长,卷积计算中提取目标的特征和培训过滤器将增加,这将导致目标跟踪速度。内核相关滤波算法(KCF) [11)是一个埋头的进一步改进算法利用面向梯度直方图(猪)跟踪目标和提高跟踪的准确性。猪的特性提取检测对象,提高跟踪的准确性。Galoogahi et al。12]提出background-aware相关滤波器(BACF)根据猪的特性,有效地调节各种物体的前景和背景。刘等人。13探索一个patch-based multi-CF模型的跟踪方法。多个部分的组合可以有效地调整噪声的影响。2014年,Danelljan等人提出了一个DSST算法,用猪的特性为目标建立一个规模金字塔规模估计基于MOSSE [14]。然而,当目标规模持续增加,卷积计算训练会增加,这将导致跟踪速度降低。在[15,16),卡尔曼滤波器算法被用来预测目标的状态,确定目标是闭塞的,标志着它来预测目标以后,仍阻挡。在长期目标跟踪过程中,由于多变的跟踪环境,目标可能有不同的变形,严重的阻塞,和其他问题,这可能会导致跟踪失败。如何快速恢复目标跟踪功能是实现长期目标跟踪的关键。Zhang et al。17)建立了描述符为旋转和尺度归一化和融合颜色和纹理特征对描述符执行最优相似匹配的候选人前后帧目标跟踪。更加注重强调目标样本比背景样本,元等。18)设计了一个target-focusing卷积回归模型的视觉物体跟踪任务。target-focusing损失函数能有效地平衡正负样本的比例,防止过度拟合的外观模型背景样本。马等。19)培训在线随机蕨重新检测对象的分类器的跟踪失败。处理一个单一功能的缺点来表示目标,基于多特征融合跟踪方法设计(20.- - - - - -23),这可能在一定程度上提高算法的鲁棒性。
近年来,随着深度学习的快速发展在机器视觉领域,其准确性已超越传统的图像处理方法在人脸识别和图像检测。与传统方法不同,深度学习不需要手工设计的特性但模拟人类的视觉感知系统和抽象表达基于原始图像的特征。马等。24]pretraining深cnn提高跟踪精度和鲁棒性,提取的最后三层卷积特性,和学习适应性的相关性过滤器。Qi et al。25)关注层次CNN-based跟踪框架(热变形),充分利用不同的特性和使用一种自适应的对冲方式对冲这些追踪器推向一个更强的人。Valmadre et al。26)解码了DCF学习者作为一个可微的CNN层和跟踪目标在一个端到端的方式。尽管这些方法取得了一些成功,他们所有的人都受到更大的计算成本或产生一个不令人满意的跟踪性能。
解决上述问题,进一步对目标跟踪技术的研究对提高跟踪效率和效果是必要的。在本文中,我们主要关注的问题长期跟踪在一个复杂的环境中,特别是在跟踪对象是闭塞的,光照变化,变形(DEF),和背景杂波。改善算法的语义描述能力和精确的定位能力,不同层的特点卷积神经网络的融合来提高跟踪的准确性。目标函数是由套索回归建模,和稀疏的滤波器模型是学会提高模型的可解释性。在建模的过程中,不同视频帧之间的低秩约束添加到改善滤波器的时间相关解决过度拟合的问题和不稳定的性能。提取候选区域的多层卷积特性,和响应计算每一层的地图通过学习过滤模型。在这部作品中,而且使用本地化策略,使用高级特性对粗定位和低级特性进行精确定位。通过发现的最大响应值的响应图,我们可以得到中央的目标。解决问题的目标模板漂移的过程中目标跟踪,介绍了两种模板更新策略更新目标模板只有当两个最大的反应满足阈值。
这项工作的主要贡献总结如下:(我)通过目标函数的套索回归建模和不同框架之间的低秩约束过滤器,提高模型的可解释性和性能稳定。(2)而且目标定位提出的策略是充分利用丰富的语义信息的高水平和低水平的准确的位置信息深卷积特性。高级功能是用来预测的目标位置粗粒度的位置,然后定位结果应用于低级的细粒度的位置特性来获得准确的目标位置。(3)一个健壮的模板更新方法设计:过滤器从第一帧和过滤器学会了从tth框架是用来计算最大响应和 ,分别。当两个最大响应值满足预设阈值,更新模板,可以在以下框架解决跟踪失败造成的错误的模板更新。
本研究的其余部分组织如下。部分2描述了不同特征的提取方法,建立了目标特征模型通过相关性过滤器框架,其中包括基本介绍KCF追踪,稀疏低秩滤波器建模,而且目标预测模型,模板更新策略。部分3通过实验验证算法的有效性和鲁棒性两个方面,即定量和定性分析,并描述了与一些相关的、有代表性的追踪器。部分4总结了简短结论这项工作。
2。方法
深卷积特性可以有效地解决跟踪问题严重的变形通过提取丰富的语义信息。的Conv5-4卷积特性选择定位目标,使用和Block2-pool层特性来实现准确的目标位置(见部分2.1详情)。传统的KCF算法使用规范设计目标函数,使贫穷的学习模型的可解释性。通过迫使稀疏过滤器模型最小化目标函数时,可以提高算法的鲁棒性。在本文中,我们使用套索回归模型目标函数和学习一个稀疏的过滤器 。为了解决过度拟合的问题和不稳定性能,低秩约束不同视频帧之间添加套索回归建模过程的目标函数来提高滤波器的时间相关,提高算法的鲁棒性和稳定性(见部分2.2详情)。而且目标定位策略设计(见部分2.3详情)。首先,最大响应值的位置最后一层是预测作为正则项的其他层进行迭代一层一层地,和响应计算其他层的结果。最大响应值的位置预测目标的位置。一个健壮的模板更新方法设计:过滤器从第一帧和过滤器学会了从tth框架是用来计算最大响应和 ,分别。当两个最大响应值满足预设阈值 ,更新模板,模板不更新的解决问题错误和失败的后续跟踪。该算法模型如图1。
2.1。特征表示
我们使用层次卷积特性从pretrained VGGNet-19 [27)编码对象出现的表达能力来解决复杂场景中的目标跟踪问题如目标变形。卷积VGGNet-19网络有19层,包括16层和3连接层。Block1-Block5 VGGNet-19卷积有五个模块,每个模块都有一个池层。功能图有很强的表达能力,Relu函数表示为 是用来执行每个卷积层后非线性处理操作。特点不同的卷积层有不同的表达能力。浅层次的数量,更详细的信息中包含的特征映射,但将生成背景杂波;的层数越深,越中包含语义信息特征地图,但包括详细的信息。神经网络的池操作降低了图像的空间分辨率,提高了各自的领域,使高层特征尺度和旋转不变性。提高语义描述和精确定位的能力,一些先进的跟踪算法合并卷积神经网络和手动功能来提高跟踪的准确性。然而,手动功能通常包含很多背景噪音,这让挑战追踪和跟踪性能的影响。因此,它被认为从卷积神经网络提取完整的边缘信息准确定位目标。卷积神经网络越深,背景抑制越明显。五个在VGGNet-19卷积模块的可视化结果如图2。Conv1-2未被选中,因为它太接近输入层(大吵)及其接受域很小。与Conv2-2相比,Block2-pool层保持准确的位置信息,同时降低空间分辨率。因此,Block2-pool层Block2用于提取特性来实现一个精确的目标位置。从图可以看出2,尽管Conv3-4卷积的输出层有很多位置信息,目标的边缘信息是不完整的,这很容易导致目标探测失败。Conv5-4和Block5-pool都有丰富的语义信息,但功能解决Block5-pool Conv5-4层的层的一半。复杂场景的背景杂波,粗糙Block5-pool层内黄色的边界框的位置是不正确的。对比,Conv5-4卷积特性在黄色的边界框是歧视从背景区域,尽管戏剧性的背景的变化。的财产Conv5-4卷积层是适合处理重要的外观变化,准确定位目标粗粒度级别。因此,考虑到效率和复杂性,Block2-pool层具有较强的空间分辨率和Conv5-4层选择具有较强的语义来描述目标的外观。
特征映射的大小在不同网络层是不同的池操作应用卷积神经网络。层越深,越小的大小特征映射。例如,Block5-pool地图大小是7×7层特性,这是 输出的图像大小224×224。然而,低空间分辨率不够准确定位目标。在本文中,使用双线性插值将每个特性映射到一个更大的大小来缓解这个问题。让特征映射之前插值和吗X地图是upsampled特性。的特征向量我th位置表达如下:
其中,插值系数 ,和它的价值取决于的特征向量 域。卷积特性是一个多通道的特性,但不是每个通道特性是有效的,它可能造成更少的目标跟踪。如果这些特性用于跟踪,可以跟踪预测阶段的不确定性。该功能可以减少冗余空间特征选择和横跨海峡的方法(28提高跟踪性能。考虑到每一层的低分辨率的卷积网络,空间特性的应用程序到深卷积网络只能实现有限能力的改善。可以减少大量冗余通道的通道特性正则化项添加到目标函数的过滤器。简化滤波器的目标函数的设计,冗余通道减少方差计算通道。例如,在VGGNet-19模型,Conv2-pool层包含256个频道,Conv5-4层包含512个频道。每一层选择第一个128或256个频道的卷积特性根据方差大小频道删除冗余的功能,提高跟踪算法的准确性。每个通道的方差计算如下: 在哪里W和H代表特征图的宽度和高度,分别。代表了特征值的中点 一个通道,代表一个通道的平均特征。
2.2。有识别力的相关性过滤器
典型的相关跟踪器可以有识别力的分类器,完成学习目标对象的评估通过搜索相关的响应的最大值的地图。利用移位的样本,相关滤波器可以有效地训练显著大量训练样本使用快速傅里叶变换(FFT)。目标跟踪的任务是预测目标的位置在后续帧中的目标位置初始框架。图3显示了结果的循环变化不同的像素X设在和Y设在方向目标样本。
2.2.1。单路岭回归建模
提取的特征映射 ,这是一个张量特征提取tth框架。和分别显示功能通道的宽度和高度。我们认为所有的圆转移特性的结果沿着和维度作为训练样本。每个样品转移 , 有一个高斯函数表示如下: 在哪里是核心的带宽。的中心位置的得分最高 。当这个职位 逐渐远离目标中心,比分吗衰减迅速从一个为零。的过滤器tth框架命名 使用一对训练样本的学习。获得 ,DCF制定目标作为主旨是最小平方问题: 在哪里是正则化项,防止过度拟合。为了简化描述,下标t省略,封闭解,推导方程(4)和将它设置为零:
其中, ,每一行代表一个向量。是一个列向量,每个元素代表预期的输出 。 代表了复杂的共轭转置矩阵 。 是一个单位矩阵具有相同的大小,所有元素的是1。循环矩阵可以对角化在傅里叶域中,在傅里叶域中,结果可以通过使用这个特点:
加法和除法(6)是由元素,意味着乘以元素,⌃相应的傅里叶表示,∗复共轭。
2.2.2。单通道套索回归建模
的规范是用来实现目标函数的设计公式(4)资产评估过程的偏差问题。的是规范的平方和的平方根计算元素的向量 。尽量减少规则条目 ,每个元素是非常小的,但不等于0。当每个重量系数不等于0,即所有元素被激活,这样一个过滤器模型不是稀疏。换句话说,提高模型的泛化能力,规范牺牲模型的可解释性。尤其是在处理多通道深神经网络功能,大部分的训练样本的特性的 不是最终的输出密切相关 。通过迫使一个稀疏的模型最小化目标函数时,正确的预测可以减少干扰。为了解决这个问题,我们使用套索回归模型目标函数的方法。稀疏正则化算子通过学习可以删除这些无知的特性,也就是说,重置这些特性相对应的权值为0。稀疏过滤器是学会了用套索回归建模,这是代表如下:
2.2.3。低秩约束的过滤器
在长期目标跟踪过程中,外观和动态跟踪目标的背景将会改变。过滤器从套索回归模型可能会过度拟合的问题和不稳定的性能。为了解决这个问题,低秩约束不同视频帧之间添加套索回归建模的目标函数来提高滤波器的时间相关,提高算法的鲁棒性和稳定性。时间序列的低秩平滑术语定义如下:
每一列的 是一个矢量滤波器 。在追踪的过程中,排名的实时计算会影响算法的效率。通过计算平均值,每次添加一个新的增量,之间的区别的两个相邻过滤器可以解决。因此,公式(8)计算下面的等价形式20.]: 在哪里的中值滤波器在中学到了什么框架和是一个距离测量功能。因此,所代表的正则化项规范公式(7)实现煤时间序列,可以近似描述如下:
从公式可以看出(10)计算以增量的方式进行,且只有一个参数需要实现时间序列低秩平滑的计算过程。
2.2.4。多通道低秩建模
Block2-pool层具有较强的空间分辨率和Conv5-4层选择具有较强的语义来描述目标的特征。提取的多通道特性的地图tth框架 ,这是一个张量组成的吗d声道输出的特征提取tth框架。然后, 是相应的理想高斯波形的反应。多通道过滤器 的tth帧从一个训练样本 。解决的过程中过滤是最小化目标函数。低秩建模的多通道目标函数定义如下: 在哪里是循环卷积算子(9), 是相应的区别的过滤器dth频道, 代表了dth信道特性代表的多通道形式 。 弗罗贝尼乌斯规范矩阵一个定义为计算的平方和的平方根矩阵中的元素一个代表两个矩阵之间的欧氏距离,表示如下: 在哪里代表元素我th行和jth列的矩阵一个。的规范矩阵可以表示为 。
2.2.5。优化的目标函数
公式表达的目标函数(11)是凸和可以被扩展拉格朗日优化方法29日]。通过引入松弛变量 ,构造拉格朗日函数如下: 在哪里优化参数和吗拉格朗日乘数的尺寸大小是一样的吗 。迭代优化公式(13)是由使用交替方向乘法器来确保收敛(19),具体表示如下: (我)解决方案的变量给定的变量 , ,和 ,变量的解决方案通过优化相应的目标函数,即表示如下: 为了简单起见,省略下标后相应的封闭解t如下(30.]: 其中,向量 , ,和中的元素组成的,分别是我th行和jth列在所有渠道的向量 , ,和 。(2)解决方案的变量给定的变量 , ,和 ,变量的解决方案通过优化相应的目标函数,即表示如下: 关闭解决方案可以通过收缩阈值(20.]: 在哪里和代表中的元素我th行和jth列和的d分别声道输出。是一个象征性的功能决定了积极和消极的问题 。(3)解决方案的变量给定的变量和 ,变量的更新方式和如下: 是防止奇点的最高刑罚参数,松弛变量之间的相似性测量吗和原始变量 。
2.3。而且位置预测
相关性过滤器学会了从tth框架是用于随后的目标估计(t+ 1)th框架。的功能层 的框架t+ 1提取,过滤响应在频域计算如下: 在哪里∧代表了离散傅里叶变换,代表element-wise乘法,代表了快速傅里叶逆变换。通过搜索位置的最大响应值的大小 ,目标的位置lth卷积层可以估计基于分层预测。预测是基于位置的最大响应值最后一层和迭代一层一层地正则项计算响应其他层的结果。假定的响应位置 在层表示为 和最大响应位置表示为 :
考虑到反应 和最大响应位置 的层 ,层的位置可以用以下公式预测: 在哪里的正则化项层 ,这是传播到早期的响应映射层。具体地说,与 为中心,随着半径,我们可以得到一个圆C。公式(22)表明,最大响应位置 中搜索 邻近的地区集中在 在 - - - - - -相关响应图。最后,使用公式(22),最大响应的位置上找到Block2-pool层作为最终的目标位置。
在实践中,跟踪结果对参数不敏感r邻域搜索的区域。目标位置可以通过计算预测的加权平均响应地图不同层的定义如下:
卷积神经网络的最后一层包含丰富的语义信息,是鲁棒目标变形。因此,我们希望为深层分配较大的正则化系数。发现的层越深,空间分辨率越低,最大响应值越低。利用正则化项的事实每一层的最大响应值成反比 ,正则化项设计如下:
在图4,我们比较从四个不同的加权最大响应值卷积层定位目标在狗序列。通过比较四种过滤响应曲线在图4,它可以发现的最大响应值Conv2-2层是最好的。原因是Conv2-2比Block2-pool层具有较强的空间分辨率,但它也会导致较低的帧率在使用Conv2-2层追踪(见图5详情)。加权的最大响应值Block2-pool使用公式(25)帮助跟踪目标在整个序列。
(一)
(b)
2.4。模型更新
在长期目标跟踪过程中,可能发生背景干扰,这可能导致模板更新错误。过滤背景的反应大于阈值 ,但在这个时候,预测的位置是错误的,和新学习模板也是错误的。在这种情况下,如果模板更新,这将导致跟踪漂移。通过计算每个后续帧的响应值,它仍然会发现最大响应值满足阈值条件,但目标不是所在地。这时,模板不再准确,最大响应的位置是背景。解决问题的目标模板更新背景干扰等复杂的场景,目标形变、遮挡,一个精确的模板是用于预测来获得更精确的位置信息。为此,提出了两种模板更新的判断方法。过滤器从第一帧和过滤器学会了从t帧是用来计算最大响应和 ,分别。当两个最大响应值满足预设阈值 ,模板(见更新部分2.4详情),它在以下框架可以解决跟踪失败造成的不正确的模板更新。
获得一个更好的近似,我们更新相关性过滤器在(26使用移动平均与多通道滤波器)在优化过程中部分获得2.2: 在哪里t帧索引和吗是一个学习的速度。一些存在追踪更新对象模型(13,16在每一帧不考虑是否检测是准确的。然而,在目标跟踪过程中,目标可能会严重堵塞或完全闭塞。如果目标模型继续被更新在这种情况下,它相当于更新背景作为目标,很容易导致模板漂移。当有多个类似的场景中对象,追踪对类似的目标为背景。只有当两个最大响应值大于预先设定的阈值 ,更新模型使用方程(26)。否则,模型不更新,之前的位置过滤器将被用于预测在随后的帧。因此,学会了过滤器是健壮的嘈杂的更新,经常引起快速模型退化和获得目标外观的长期记忆。
3所示。结果分析和讨论
客观评价算法和全面,我们两个标准基准数据集上运行该算法:OTB2015 [31日)和tc - 128 (32]。OTB2015注释有11个属性覆盖各种具有挑战性的因素,包括规模变化(SV)、光照变化(IV),闭塞(OCC),运动模糊(MB),变形(DEF),快速运动(FM)、出平面旋转(超载比),看不见了的时候(OV),平面旋转(IPR),背景杂波(BC)和低分辨率(LR)。tc - 128基准包含128彩色视频序列的有11个注释的属性,它旨在分析颜色信息对跟踪的影响。在本文中,超过1000的视频序列帧属于长期跟踪。我们使用基准协议和相同的参数表所示1所有的序列以及所有的敏感性分析。出于完整性的考虑,我们也报告结果的距离精确率、成功率,重叠和中心位置误差与最先进的算法相比:BACF [12],KCF [11],DSST [14),热变形(25),(7],SAMF [22]。我们在MATLAB中实现该跟踪R2018b电脑的配置英特尔酷睿i7 - 8550 u 2.0 GHz CPU、8 GB RAM和MatConvNet工具箱的GeForce GTX GPU。
3.1。评价标准
评估跟踪性能,一次通过的评价(开放)作为评价指标OTB2015 [31日数据集。开放的策略有两个评估标准,即距离精确速度(DPR)和重叠的成功率(OSR)。距离精确速度代表的百分比之间的中心位置错误预测真实位置和用不同的阈值。中心位置误差是指之间的欧几里得距离的估计位置 通过迭代和真正的位置 ,可以使用公式计算:
作为D减少,增加算法的准确性和稳定性。考虑到预测边界框估计的跟踪算法和真实的边界框 ,重叠率(R)可以计算如下: 在哪里代表两个边界框的十字路口,代表两个边界框的结合,代表两个边界框的面积。随着重叠率的增加,跟踪成功率增加。重叠的成功率代表帧的重叠率的百分比大于给定的阈值。用不同的阈值,可以得到一条曲线,和阈值设置为0.3。
3.2。定量分析
算法将被评估和分析从四个方面对OTB2015数据集和两个评价指标,DPR和OSR tc - 128数据集。
3.2.1之上。OTB2015实验数据集
在本节中,实验结果在OTB2015给出的跟踪性能,中心位置误差,DPR, OSR,与BACF [12],KCF [11],DSST [14),热变形(25),(7],SAMF [22算法:(1)跟踪性能图5(一个)表明,跟踪结果的比较不同的卷积层VGGNet-19选为特征。注意,如果一个卷积层包含多个子层,我们使用从最后一次层特性,例如,C2表示在VGGNet-19 Conv2-2层。我们使用不同的层(C5,C4,C3)分开和合并不同层次表达的比较结果的速度和成功率。VGG-C5-C2策略执行比VGG-C5-Block2-pool成功率和比VGG-C5-C2方案的速度。由于目标跟踪是一个实时任务和要求相对较高的处理速度,VGG-C5-Block2-pool方案达到最理想的综合效果。图5 (b)显示之间的成功率和跟踪速度提出了跟踪和追踪器相比其他OTB2015数据集。这表明该跟踪器跟踪成功率最高的达到良好的跟踪精度。然而,跟踪59帧每秒的速度比其他算法(FPS)是慢,KCF和DSST等,所以它仍然需要改进。(2)中心位置误差(CPE)在本节中,我们分析了提出的跟踪与BACF [12],KCF [11],DSST [14),热变形(25),(7],SAMF [22OTB2015]的CPE。CPE是目标跟踪精度的评价指标,即均值之间的欧几里得距离预测中心位置和实际目标中心位置。图6显示的结果序列的CPE Singer1 351帧和Car4 659帧。该算法执行与CPE的最先进的追踪器。该算法获得较低的CPE价值,最多只有9.69,Singer1和Car4序列。视频序列中的对象Singer1大型照明变化从90帧。BACF远远超过20像素的CPE,甚至导致跟踪失败。(3)距离精确速度成功率阴谋情节和重叠我们使用计算的成功率情节和精密情节开放的评价标准,进一步分析该算法的跟踪性能和其他六个比较算法。重叠的成功率(R中定义的公式(28)代表跟踪成功率的大小,范围是0到1。图7展示了该算法之间的全面统计结果和OTB2015比较算法。得分最高的0.832相比,该算法的距离精度速度是0.829,这是在第二级别和16.76%高于传统KCF算法。该算法0.695的分数达到最高等级的平均成功情节,高于1.58%的世界排名第二的热变形(0.684)。与KCF跟踪器相比,具有成功排名得分是0.504,该算法获得超过27.48%的改善。从上面的分析,得出套索回归的建模方法提高了不同通道之间的可解释性的特性和改进算法的准确性。
(一)
(b)
(一)
(b)
图7显示了算法的平均表现的比较开放的评价指标在不同的场景中。算法的效果会有所不同,如果数据集的属性是不同的。全面、准确地分析该算法的性能在各种复杂的场景,人物8显示了该算法的跟踪结果的比较和其他第四跟踪算法相比,OCC,公元前和SV与不同的属性。拟议中的追踪几乎达到最佳的性能在所有其他算法相比,在视频序列只执行稍差闭塞属性。该算法有显著提高对复杂场景下的排名算法的属性照明变化、遮挡,背景杂波,和规模变化。
(一)
(b)
(c)
(d)
(e)
(f)
(g)
(h)
3.2.2。实验tc - 128
在本节中,tc - 128 (32数据集是用于验证该跟踪器的性能。与一些先进的追踪器,包括BACF [12],KCF [11],DSST [14),热变形(25),(7],SAMF [22),如表所示2。此外,我们使用OTB2015和tc - 128数据集执行定量比较的DPR 20像素和OSR见表0.5像素2。它表明该跟踪器获得最高的性能与80.5和66.5的OSR的DPR tc - 128。该跟踪器达到82.9的DPR和性能比热变形略微差一些OTB2015 DPR 83.2。与KCF相比,该跟踪取得了显著改善,显示的好处使用套索回归建模方法和多通道特征选择方案。
3.3。定性分析
直观地说明该算法的跟踪精度,人物9显示其他先进的跟踪结果的跟踪算法具有挑战性的视频序列矩阵,狗,Singer1, Girl2。比较算法包括相关滤波器跟踪(KCF) multifeature追踪(SAMF),深度学习追踪(热变形),代表跟踪(了)。矩阵序列如图9(一个)第四的属性,SV, OCC,调频,知识产权,超载比,BC。狗序列如图9 (b)有属性的SV, DEF和超载比。Singer1序列如图9 (c)第四的属性,SV, OCC,超载比。Girl2序列如图9 (d)有属性的SV, OCC, DEF, MB,超载比。把图9 (d)作为一个例子,其他对象的对象是闭塞的,相比其他算法都无法找到对象,而该跟踪器能准确定位目标由于其redetection函数。热变形执行与变形序列和快动作(矩阵和狗),但失败当物体阻挡(女孩)。从图可以看出9 (b)所有狗视频序列算法有很好的结果,这表明,该算法可以处理轻微变形的目标的问题。然而,其他算法不能解决复杂场景中的目标跟踪问题如目标变形和背景干扰。视频序列矩阵,其中包含了背景干扰,该算法可以有效地去除背景信息,并建立一个有效的模型来平滑滤波器。
(一)
(b)
(c)
(d)
4所示。结论
改善跟踪性能和鲁棒性,提出一种改进的层次卷积特性模型为视觉物体跟踪相关过滤框架。目标函数的目的是通过套索回归建模获得稀疏,时间序列低秩过滤器,使滤波器的时序相关性和防止过度拟合的算法和性能下降。提出了粗粒度的细粒度的目标位置策略充分利用互补的特点,不同的层的深度卷积网络,可以实现鲁棒跟踪具有挑战性的视频。通过提取出功能丰富的语义信息在最后一层,执行粗粒度定位,有效地解决了目标变形的问题。通过提取底层特征具有高空间分辨率的精细定位,定位精度和精度可以提高。一个健壮的模板更新方法设计:过滤器从第一帧和过滤器学会了从t帧是用来计算最大响应和 ,分别。当两个最大响应值满足预设阈值 ,模板更新,解决了后续跟踪失败造成的不正确的模板更新。实验结果显示具有不同属性的竞争性能提出了跟踪器。
数据可用性
没有数据被用来支持本研究。
的利益冲突
作者宣称没有利益冲突。
确认
这项工作得到了省住房和城乡建设部科技计划项目(2016 - r2 - 060),中国国家重点研究发展计划(2017 yfc0804400和2017 yfc0804401号),自然科学研究的主要项目中国江苏高等教育机构(18 kja520012),徐州科技计划项目(KC19197),和学校科研项目的徐州理工学院(XKY20191070)。