计算智能和神经科学

在这一页上

文摘介绍背景实验结果结论数据可用性的利益冲突确认引用版权相关文章

特殊的问题

计算智能在图像和视频分析

把这个特殊的问题

研究文章|开放获取

体积2022年| 文章的ID1010767| https://doi.org/10.1155/2022/1010767

Scene-Specialized目标检测器SMC-PHD过滤器和YOLO网络的意思

Qianli刘 ,¹ 兵的李 ,¹ Qianhui董 ,¹ 和你们方 ¹

学术编辑器: 白元丁

收到了 2021年10月26日

修改后的 2022年2月28日

接受 2022年3月05

发表 2022年4月28日

文摘

你只看一次(YOLO)意思是最有效的目标探测网络之一。然而,YOLO网络意思的性能显著降低当训练数据和实际数据之间的差异很大。自动定制YOLO网络意思,我们建议一个新颖的迁移学习算法的序贯蒙特卡罗概率假设密度(SMC-PHD)滤波器和高斯混合概率假设密度(GM-PHD)过滤器。拟议的框架可以自动定制YOLO框架意思未标记的目标序列。未标记的目标序列的帧被自动标记。SMC-PHD的探测概率和杂波密度过滤和应用GM-PHD YOLO网络阻挡意思再培训目标和杂波。一种新的可能性的置信概率密度YOLO探测器和视觉上下文意思适应症选择目标样本实现。提出了一个简单的重采样策略SMC-PHD YOLO解决重量意思简并问题。与不同的数据集进行的实验显示,该框架实现了积极成果相对先进的框架。

1。介绍

上优于检测算法被证明是重要的几个领域,包括智能监测系统(1),无线传感器2,3),和安全的交通系统4]。在过去的几年中,卷积神经网络(cnn)取得优秀的成果在多个计算机视觉任务。你只看一次(YOLO)意思是一种有效的视觉检测方法(5]。与其他检测网络相比,YOLO网络意思可以预测类概率和边界框在一个评估直接从输入帧。然而,YOLO探测器,意思是教带注释的数据集和利用实现最高目标的变化。目标被摄像机的分布可能不是初始学习集的一个子集,当这些探测器应用于一个特定的场景,比如在闭路电视(CCTV)相机。因此,生成的通用YOLO探测器意思可能不会有效功能,尤其是对数量有限的训练数据(6]。

为了解决这个问题,转移和跨域提出了适应学习。需要一个特定的训练数据集生成一个特定的探测器。通常情况下,这些积极的特定样本训练数据集是手动选择目标数据集。然而,大量的标签数据需要调整探测器在每一帧,和标签是一个劳动密集型的任务。一个典型的解决方案减少集合时间是自动提供样品标签与目标框架。迭代标签样品收集到的未标记的顺序和添加到训练数据集(7]。

我们提出一个新颖的学习方法转移概率假设密度(博士)滤波器,它可以自动重新培训YOLO网络意思一个特殊的对象。scene-specific检测器生成的通用YOLO检测器训练有素的意思没有贴上标签帧和序列信息。YOLO探测器意思估计的参数通过一个迭代的过程。经过自动和迭代训练,最后专业YOLO探测器生产和意思可以运行没有SMC-PHD过滤器。图1说明了我们的方法的结构。

尽管提高YOLO SMC方法已用于转让意思学习(8),检测概率和杂波密度不考虑在目标序列。在更新的步骤方法,闭塞的目标选择和收集阳性样本进行训练。我们的方法的主要好处是,识别模型可以学习阻挡目标和杂波的出现。所示的实验结果部分4,我们提出SMC-PHD YOLO可以检测一些阻挡扬声器意思SMC-PHD基于过滤器阻塞策略,而SMC快提出CNN (R-CNN) [8)不能检测到阻挡目标。此外,积极收集样本时,一些错误的样本(杂乱)可能被添加到积极的训练数据集。SMC R-CNN[更快的性能8)将受到杂波的影响。在训练数据集有杂物时,SMC更快R-CNN产生错误的检测。基于杂波密度,这混乱将会分配一个低重量,我们的方法可以忽略错误的样本。我们建议博士YOLO网络有四个主要贡献:意思(我)解决训练数据集和目标之间的偏差,我们提出一个基于博士转移学习方法YOLO。意思对非线性任务、scene-specialized目标探测器SMC-PHD YOLO,意思。对于线性系统和高斯噪声的任务,我们扩展我们的方法GM-PHD YOLO消除担忧SMC意思依赖。(2)在SMC-PHD YOLO,意思我们表明SMC-PHD滤波器的检测概率和杂波密度提高的性能重新训练YOLO网络意思阻挡目标和多尺度的目标。当目标场景的图像质量不满意,即使有噪音,专业YOLO网络意思仍然可以检测到目标后密度。(3)小说提出了可能性来验证所选样本博士YOLO。意思积极收集样本进行训练,置信概率YOLO探测器和视觉上下文意思的迹象。(iv)体重退化问题的SMC YOLO,意思我们也提出一个新颖的和简单的重采样策略,可以从目标收集样本序列基于他们的重量,和提议分布假定为目标。与策略可以有效地检测分布采用即使少量的样本。

本文档的其余部分的结构如下:部分2介绍了当前应用于这个领域并提供细节对于我们提出的方法的好处超过其他专业化的方法。部分3详细描述了我们的建议策略。部分4详细的配置仿真,并给出了实验结果,并总结评论提供了部分5。我们遵守公约,规模变量,如自信,介绍了小写斜体,例如, 。符号为vector-formed州及其密度所示小写粗体斜体,例如, ,和多目标状态是由大写粗体斜体,例如, 。大写nonbold字母代表多项式。的符号矩阵,如过渡矩阵,所示大写粗体字母,例如, 。

2。背景

2.1。专业化的框架

如果训练样本的分布是不同的目标场景,那么传统的视觉探测器可能不是函数有效地9]。为解决这一问题,利用专业化框架自动创建scene-specific探测器对目标场景。转移使用带注释的模型学习算法基于最先进的理论和专业知识通过之前的作业。有三个主要类型的转换学习方法(10]。首先,通过改变源的参数学习模型,该模型提高了在目标域(11,12]。第二,源和目标分布之间的差异减少,和源学习模式是适应目标域(13,14]。第三,手动或自动选择训练样本,和重新训练模型的一个子集选择样本(15]。我们关注的是第三类,因为它可以自动标签所选样本和训练参数保持不变。

然而,新的训练数据集可能包含一些错误标签样品,因为样品的标签不是手动验证。这种类型的数据集,检测的准确性框架可能会减少。为了解决这个问题,不同的上下文的迹象,如对象的视觉外观,行人运动,道路模型,尺寸,和地点,用于验证有利的培训训练数据集的样本;然而,这种方法是敏感的闭塞(16]。此外,一些技术可能只使用目标域和浪费有用的样本(样本17]。着和何克背景减法算法来训练一个特定探测器(9)选择目标样本源和目标数据集。利用目标信息,自动标签tracklet链链接该样本tracklets [15预测一个appearance-target探测器。为每个目标场景,然而,这个框架,其中包括许多手工参数和阈值,可能影响到专业化的表现。另外,Maamatou et al。10)收集新鲜的样品。培养一个新的专门重新训练传感器,SMC转移学习方法来创建一个新的数据集(8]。

2.2。YOLO网络的意思

在这项工作中,我们使用YOLO (V3)网络意思(5)因为它通过图像只有一次到一个完全CNN (FCNN),这使它能够实现实时性能。YOLO (V3)开发基于YOLO[意思意思18有人知道由罗(V2)[]和19]。YOLO网络意思认为检测问题的回归问题。因此,网络直接通过回归为每个类生成一个边界框没有任何建议,更快R-CNN相比降低了计算成本。

YOLO检测意思模型如图1,网络训练集的每个输入图像分为网格。当网格是由地面真理的中心目标,网格用于检测对象。对于每一个网格,几个边界框和分数预测他们的信心。的信心被定义为

如果目标是在网格中, ;否则, 。 (十字路口的联盟预测和地面真理)是用来预测边界框之间的巧合和参考边界框,这表明网格是否包含目标。如果几种边界盒检测相同的目标,那么nonmaximum抑制(NMS)应用于选择最好的边界框。

YOLO更快地计算成本低于R-CNN意思;然而,它有更多的错误。为了解决这个问题,YOLO使用更快的“锚”意思R-CNN之前生成合适的边界框;YOLO使用k - means意思弄乱。采用锚箱减少意味着平均精度(地图)。此外,不像YOLO,意思YOLO-V3使用批处理规范化、多尺度预测,高分辨率的分类器,尺寸混乱,直接位置预测,细粒度特性,多尺度培训,和其他方法,大大提高检测精度。

2.3。随机有限集和博士过滤器

在本节中,我们讨论了随机有限集和博士过滤器scene-specialized变换学习。概率假设密度和随机有限集,提出了多目标跟踪(20.- - - - - -22]。随机有限集是一个灵活的算法,可以结合任何对象检测器生成位置和尺寸信息感兴趣的对象。Maggio等人使用探测器等背景减法,演算法分类器,和一个统计变化探测器跟踪对象与一个随机有限集(RFS) [23,24]。在跟踪处理遮挡问题,金等人提出了标签RFS [25]。RFS是一个昂贵的近似计算的multidistribution贝叶斯过滤器,博士是一阶RFS的时刻,这是一组随机变量(或向量)与随机基数(20.]。博士过滤器的另一种推导给出了基于经典点过程理论(26]。在多目标的研究中,高斯混合博士(GM-PHD)过滤器(27)和SMC-PHD过滤器(28)被广泛利用。GM-PHD过滤器是一个封闭的解决方案,因为它假设模型是线性和高斯。通过限制考虑分区的数量和可能的替代品,Granstrom等人提出了一个GM-PHD滤波器跟踪扩展目标(29日]。自不同的对象有不同程度的混乱,一个n型GM-PHD滤波器提出了真实的视频序列对象探测器信息集成到这个过滤器的两个场景(30.]。然而,非线性问题的精度可能会降低。为了解决非线性问题,SMC-PHD滤波器提出了基于蒙特卡罗方法。样品的重量(粒子),SMC-PHD滤波器可以跟踪不同数量的未知目标。

博士过滤器被定义为强度 ,这是应用于估计扬声器的数量。博士过滤器包括预测的步骤和一个更新步骤,递归地传播强度函数。被定义为博士预测步骤在哪里是目标边界框的状态。是出生的强度RFS。的模拟状态转换概率, 在哪里生存概率和吗是密度的过渡。是强度函数的产卵RFS与以前的状态吗。博士更新方程给出在哪里定义的概率可能性吗鉴于。是检测概率。杂波的强度RFS显示为 ,在哪里是泊松的平均数量每扫描和杂波点是每个杂波点的概率分布。博士递归涉及多个积分方程(2)和(4),没有封闭的解。为了解决这个问题,提出了SMC-PHD过滤器,广泛利用(28]。在SMC-PHD过滤器 ,目标博士是由一组粒子, ,在哪里是粒子的数量吗。最好的我们的知识有限,本文研究首次使用过滤器来训练一个scene-specialized博士,多目标探测器。随着目标不明数量的未标记的数据集和样本收集是非线性和非高斯,SMC-PHD过滤器应用于收集未标记的训练数据和定制YOLO网络的意思。

3所示。提出了框架

本节介绍了我们建议的框架,定制YOLO模型基于意思博士过滤器。博士过滤器用于标签的目标基于YOLO输出意思未标记的视频。积极的样本估计的博士过滤器是用来建立一个新的自定义数据集。YOLO网络意思是调整在这个自定义数据集,可能包含阻挡目标和目标不同的风格。由于未标记的视频的数量很大,训练数据集和真实数据之间的偏差减少。最先进的方法相比,我们提出的框架来遮挡和目标形状不敏感。该方法的总体框架如图2。

更具体地说,假设一个通用YOLO网络意思与一般训练数据集,如常见的对象上下文(可可)31日]。为目标序列,未标记的帧被表示为 ,在哪里的指标框架。检测的输出在框架是。在框架是一组检测吗 ,在哪里是一个边界框的状态检测的目标。检测到目标的指数,是检测到的数量目标。此外,博士过滤器更新估计目标状态。估计目标集,在哪里估计目标的数量吗和估计目标的指数。请注意,不等于。博士过滤器移除一些杂物和增加了一些错过了目标。的估计图像目标边界框设置应用于调整YOLO网络的意思。有人知道由罗称为调整 ,在哪里是调整的时间。博士的培训管道YOLO探测器意思可以在图中找到3。

面临的挑战是如何选择和样品SMC-PHD过滤器。在本节中,迭代过程分为三个步骤:预测,更新和重采样。下面列出的三个主要步骤的细节。自从SMC-PHD滤波器比GM-PHD更健壮的滤波器的跟踪任务,博士YOLO主要意思作为一个SMC-PHD过滤器实现。扩展我们的方法线性系统,GM-PHD YOLO最后简要讨论了本节的意思。

3.1。预测步骤

建立自定义数据集, ,几个粒子被应用。在框架 ,粒子被表示为 ,在哪里是粒子的重量。我们的工作只考虑两种粒子:生存出生粒子和粒子。SMC-PHD过滤器产生粒子的忽视。为生存的粒子,粒子的状态转换函数的计算 :

为出生粒子,粒子状态通常是设置在跟踪区域。粒子的重量计算

然而,如果新生粒子附近生存粒子,然后一个目标反复估计生存出生粒子和粒子。因此,目标的数量将超过地面真理。为解决这一问题,我们提出一个新的出生密度函数基于目标状态的历史: 在哪里在哪里生存概率和吗是出生的概率。代表样本的概率仍然存在。当 ,一个示例仍然存在在新的数据集。当 ,样品是重新取样,样品在不同的迭代是独立的。

3.2。更新步骤

在更新步骤中,粒子的状态进一步更新根据YOLO,意思的输出。博士的更新一步递归更新预测粒子的重量来近似的可能性是获得。预测权重更新在哪里

检测概率被简化为在我们之后的工作。目标的数量估计为权重的总和, 。

忽视杂乱,杂波密度函数应用,的价值多种多样不同的检测。显示混乱的程度,是一组值。当有一个高概率的凌乱,是一个高价值。如果检测不凌乱鉴于为0。通常情况下,设置为一个常数或估计的Beta-Gaussian混合模型(32]。

是检测概率,选择基于样本,可以估计的高斯混合模型(32]。如果样品被挡住,然后附近会有一个较低的值(0)。因此,闭塞的样品重量和高选择培训YOLO网络的意思。如果样品没有阻挡= 1,值吗是没有改变。

3.3。似然函数

除了检测概率和杂波密度,密度的可能性决定选择样本进行再培训。样本权重高的就业再培训YOLO网络意思,而忽视样本权重较低。应用概率密度来表示之间的关系YOLO网络和意思样品的检测。因此,我们定义的可能性在哪里

在迭代过程中,却降低了。当所选样本应用到培训分数相关的YOLO探测器具有很高的意思,样品可能是最大化。信心得分提供YOLO网络输出层意思。当 ,样品的重量设置为0,和示例数据集从专业中移除。表明样品是否检测到YOLO网络的意思。对于视觉线索,我们选定的样本之间的欧氏距离计算和之前的样品。在哪里在哪里检测的状态吗。选择高分样品 ,我们使用一个动态阈值: 在哪里和目标类标签吗年代计算了。相关的得分,是初始阈值。

3.4。重采样步骤

SMC-PHD过滤器是用来构造一个新的、特定的数据集进行再教育,根据重采样方法,重新取样的加权数据集都包含在生成的数据集。然而,传统SMC-PHD满足重量退化问题,样本的数量减少培训期间的一步。生成一个新的、未加权的数据集与相同数量的样本加权数据集,采用抽样策略。此外,有效的样本容量(ESS)计算:

ESS大于0.5时,粒子可以被认为是积极的为特殊的训练数据集样本。ESS小于0.5时,粒子通过Kullback-Leibler距离应该重新取样(KLD)取样33]:

额外的k - means方法用于估计基于粒子。注意,积极训练样本的比例可能不同于最初的锚 ,当我们使用借据重叠作为正样本。我们采用k - means方法集群样本更新锚的长宽比。降低计算成本,只有三个锚用于培训YOLO网络;意思他们将。这些建议是用来训练YOLO网络,意思是由微调特定的数据集。在下一次迭代中,这些网络将成为预测阶段的输入,用于创建目标建议(边界框)目标的场景。

3.5。GM-PHD YOLO

SMC-PHD主要是讨论和应用提高YOLO网络因为它是更健壮的意思比GM-PHD滤波器对非线性系统。然而,对于线性系统,GM-PHD过滤器可以提供更高的准确度比SMC-PHD过滤器。因此,在本节中,我们简要讨论如何使用GM-PHD滤波器改善YOLO网络的意思。的管道GM-PHD YOLO相似意思的SMC-PHD YOLO。意思YOLO pretrained在通用的数据集,意思和GM-PHD协助构建自定义数据集的未标记的目标序列。在这个自定义数据集YOLO微调意思。GM-PHD过滤器选择样本时,步骤包括预测步骤,更新步骤,和修剪。

在GM-PHD过滤器,是基于高斯密度分布在状态空间 ,在哪里和分别是均值和方差。在预测步骤中,对现有目标,(和 )预计为和 ,分别在哪里是过渡噪声方差。他们的重量计算。生目标跟踪中随机选择的区域。更新步骤中,未检测到目标,均值和方差保持它们的值,并计算其权重。检测到目标,意味着计算

方差是更新

更新粒子的重量

重量是标准化的

一个简单的修剪程序进一步用来减少高斯组件的数量。高体重目标设置并利用建立自定义数据集。

4所示。实验结果

本节介绍了测试结果在几个公共和私人数据集。首先,我们提出的方法的实现细节。其次,介绍了数据集和基本算法。第三,消融研究SMC-PHD YOLO过滤器意思进行了探讨。我们建议SMC-PHD YOLO探测器和几个意思基线的方法进行了比较。

4.1。实现细节

初始化YOLO在我们的意思提出SMC-PHD YOLO过滤器意思pretrained可可数据集(31日]。亚当优化器应用,体重下降0.0005和动量是0.9。虽然转移矩阵F显著不同在不同的对象类在不同的数据集,为了简化问题,我们假设F

YOLO网络意思是调整我们的评估数据集的不同任务的帮助下SMC-PHD-based转换方法。YOLO探测器意思是调整64 GB的NVIDIA GeForce GTX泰坦XGPU。

4.2。评价方法和数据集

我们在训练集训练YOLO探测器意思包含80 k训练帧和500 k例子从可可注释数据集,其中包含250万个标签实例在328 k的图像只有91个对象。虽然可可数据集不包含连续帧,它只是用来pretrain YOLO网络实验前的意思。在评价步骤中,数据集应该包含连续帧。评估与执行三个不同的数据集。

GOT-10k [34)是一个大规模、视觉与广泛的报道真实的对象数据集。它包含10 k的视频563类别,类别是超过一个数量级比同行更广泛的类似的规模。它的一些类别并不包含在可可数据集。因此,GOT-10k适合微调YOLO网络意思pretrained可可数据集。我们测试的注释包括鸟类、汽车、貘、牛。YouTubeBB [35)是一个大型的,与380000年不同的数据集视频部分从240000年和560万年23 human-drawn边框分类不同的YouTube视频。每个视频包括time-localized框架水准仪的特性,所以在segment-level粒度分类器的预测是可行的。我们测试了包括汽车和斑马的注释。在麻省理工学院交通数据集(36),提供了一个90分钟的视频。总共420帧的前45分钟用于专业化,从最后45分钟和420图片用于测试。由静止摄像机记录的视频。场景的大小是720到480年,它被分为20剪辑。我们测试了只包含汽车的注释。假阳性曲线每帧(FPPI)和接受者操作特征(ROC)曲线是用来评估我们的探测器和基线的方法。管道的数据准备博士YOLO实验如图意思4。

4.3。基线的方法

算法相比SMC-PHD YOLO算法是通用的YOLO[意思意思5),一般快R-CNN [37],SMC更快R-CNN [8),辛格et al。38),德斯穆克和卫生部39),康et al。40),Maamatou et al。10),时空采样网络(STSN) (41),突出目标检测(SOD) (42),李et al。43),杰et al。44),和Ghahremani et al。45]。表1显示比较基准方法和我们的方法。通用数据集上的探测器pretrained提出了第二列。一些方法自动调整网络与目标数据集收集的第三列所示的方法。例如,康的算法等。40不包括微调步骤,没有信息块。微调与目标数据集的计算复杂度是最后一列所示,是视频帧的数量,是SMC的粒子数的方法,在每一帧的平均数量目标,的尺寸(长度∗宽度)框架,然后呢是辅助网络的数量。

4.4。SMC-PHD过滤器YOLO的意思多目标检测

在本节,我们将讨论的贡献SMC-PHD在我们通过三个实验方法。在这三个实验中,我们评估的性能检测概率和杂波密度。注意,对于一个固定的标签数据集和固定YOLO,意思这些参数也是固定的,可以测量的数据集。显示检测概率的贡献和杂波密度,在实验中我们设置不同的值。

4.1.1。探测概率

评价检测概率性能,我们设置探测概率不同的常数。SMC-PHD的探测概率是逐步从0增加到1和6的情况下被认为是:0,0.2,0.4,0.6,0.8,1。YouTubeBB数据集被选中,因为它包括几个情况。例如,车辆在交通视频经常被其他车辆,飞机在机场时总是出现在现场。

表2显示的FPPI SMC-PHD YOLO网络与检测概率和意思的范畴。正确估计探测概率可以产生FPPI很高。例如,由于飞机总是显示在场景的中心在飞机的序列,飞机的最低FPPI类别。汽车类的最好的结果由于阻挡汽车。因此,如果目标经常堵塞,那么应该高价值的检测概率。此外,对于飞机的类别,FPPI 只有85%的吗。因此,如果探测概率太高,如1,那么检测的FPPI将减少。

10/24/11。杂波密度函数

杂波密度函数是用来解决混乱的问题。博士过滤器,杂波密度函数是基于不同的检测结果,这是在许多引用给定一个常数值(26,28,32,47]。在这些实验中,对所有检测杂波密度是一个常数值。然而,一个大可能会减少目标的权重,这导致样本数量不足被包括在训练数据集。一个低无法解决混乱的问题,重新训练YOLO模型仍然是敏感的意思混乱。自通常是将一个值从0到无穷大,我们测试8个不同的值在船上和自行车YouTubeBB数据集序列。遥远的建筑可以检测到船,和自行车检测性能也很容易受到周围环境的影响。结果如表所示3。船的最高FPPIs序列和自行车序列是0.3和0.1,分别,因为不同类别的杂乱的程度各有不同。“船”低于0.3,FPPI会稍微减少由于混乱是添加到专业训练数据和重新训练模型仍然是敏感的杂乱。如果超过0.3,FPPI也减少,因为目标样品的重量减少,培训数据集不包含足够的训练样本。

4.5。误差分析的SMC-PHD YOLO网络的意思

自目标数据集由SMC-PHD自动生成过滤器,它可能包括一些错误和未修正的样品标签。分析错误是否影响最终性能样品,我们测试SMC-PHD YOLO网络意思与YouTube数据集。我们雇佣包括汽车和斑马的注释。视频长度为每个注释,其中包含36000帧,20分钟。这些框架是由研究人员和人工标注自动标记的方法。手动将这些视频后,831615年和88234年以来积极目标样本获得的汽车和斑马多个目标可能出现在相同的帧。标签标记的方法,“汽车”包括797660真阳性样本和212假阳性样本,而“斑马”包括69821真阳性样品和17个假阳性样本。这些结果表明,算法分配标签比人类少因为一些小小的目标和低可能性的目标被认为是杂乱无视。“汽车“召回率(96%)高于“斑马”(79%),因为汽车常规剖面更容易探测。为了进一步分析这些错误的样品,我们打印这些数据分布。 The selected features comprise the input of the last fully connected layer of YOLO. Two main dimensions are selected by t-distributed stochastic neighbour embedding. Figure5显示了数据分布的阳性,假阳性和假阴性。这一发现证明了小目标被认为是异常值和忽视。我们还发现,一些杂物(绿点)在目标数据集被认为是积极的样品(假阳性)。杂物后手动忽视在目标数据集,YOLO性能不改变意思。主要的潜在原因是高威胁得分(99%),和SMC-PHD过滤器无视最不确定的样本。然而,这种方法不能从根本上解决混乱的问题,因为有些低可能性正样本被认为是假阴性(红点)。一些研究人员建议使用额外的信息,比如音频信息,解决杂乱的问题(48]。解决杂乱的问题将成为我们未来的研究课题。

4.6。Scene-Specialized目标检测器

显示性能的博士学习转移的方法,我们比较基线YOLO网络意思,SMC YOLO网络意思,SMC R-CNN,我们提议SMC-PHD YOLO网络和意思GM-PHD YOLO YouTubeBB数据集上的意思。因为SMC R-CNN不能解决阻挡样本,我们建议SMC-PHD R-CNN SMC-PHD提高R-CNN更快的性能和显示博士的方法的影响。我们用一般的训练集训练YOLO网络意思(可可数据集),其中包含一个有限的目标数据。SMC-PHD然后增加一个数据集包含看不见的数据。看不见的数据增广数据分配标签可能包含错误。YOLO调整这一目标数据集,意思和YOLO应用没有意思SMC-PHD过滤器。SMC-PHD过滤器只应用于增强数据在这工作。博士选择滤波器的参数根据Beta-Gaussian混合模型(32]。我们测试这些方法对飞机,自行车,船,汽车YouTubeBB数据集的类别。为不同的类别,我们训练的不同SMC-PHD YOLO网络参数独立意思。YOLO SMC-PHD网络和R-CNN调整的意思,GM-PHD, SMC过滤器如表所示4。后微调YOLO,意思过滤器不用于目标检测。我们建议的方法FPPI最高价值船和汽车类的所有方法,和SMC-PHD YOLO执行类似意思SMC-PHD R-CNN。结果显示,SMC提高YOLO和R-CNN意思大约8%的性能,和博士进一步提高大约6%的性能。尽管GM-PHD YOLO有8% FPPI高于YOLO,意思意思还是低于SMC-PHD YOLO。意思我们推测原因是边界框的数量被GM-PHD YOLO超过4%,意思被SMC-PHD YOLO。意思这是证明SMC-PHD YOLO比GM-PHD更健壮的意思YOLO。意思因此,在接下来的实验中,我们主要测试SMC-PHD YOLO。意思

该方法的一些结果和基线方法如图所示6。第一行和第二行每个subfigure检测到通用YOLO和特定YOLO,意思意思。在图6(一)检测到,拍打鸟只有专业YOLO探测器意思。因此,我们提出了一个移动的目标方法可以自定义检测器,因为数据集选择从一个序列似然函数。此外,一些阻挡汽车检测到我们的方法由于探测概率。在图6 (b)、汽车和斑马成功检测到专业YOLO探测器,意思虽然只有部分的车辆和斑马的图片所示。交通序列如图6 (c),汽车的数量发现与专业YOLO检测器检测到高于意思与通用YOLO探测器意思。SMC-PHD过滤器,我们提出的方法可以检测阻挡汽车和某些小型车辆。

(一)

(b)

(c)

进一步评估我们的方法,我们进一步比较方法与其他基线方法,如辛格et al。(38),德斯穆克和卫生部39),康et al。40),Maamatou et al。10],STSN [41),SOD (42),李et al。43),杰et al。44),和Ghahremani et al。45]。

图7显示过滤器的ROC曲线为不同的注释。在这个实验中,我们选择的鸟和船类别GOT-10k YouTubeBB数据集和数据集从麻省理工学院交通汽车类别。由于页面限制,数据7(一)和7 (b)只显示比较SMC-based探测器,如SMC-PHD YOLO,意思和通用探测器,如YOLO。意思我们建议的方法和先进的方法之间的比较如图7 (c)- - - - - -7 (e)。在图7(一),康的方法达到一个更高的真阳性比Kumar和中间人,因为前者是专门为船检测。与通用YOLO船检测意思相比,SMC-PHD YOLO检测器达到意思ROC改善13%。当船通常是阻挡在海湾,在SMC-PHD YOLO探测器探测概率的意思执行优于其他方法。船在YouTubeBB检测结果数据集类似于GOT-10k数据集。与泛型方法相比,专业方法实现中华民国大约有10%的改进。多基线转换学习方法被认为是在图7 (c),它显示为虚线。转换方法实现更好的性能比一般R-CNN或YOLO方法。意思SMC基于R-CNN达到类似的ROC值作为其他变换探测器。根据SMC, SMC R-CNN检测器和SMC-PHD YOLO探测器实现意思ROC值的增加3.8%和5.8%,分别与基线相比的方法。汽车检测,我们测试只有在麻省理工学院的交通数据集的方法。ROC曲线在图如图所示7 (e),YOLO SMC-PHD意思传感器优于所有其他汽车检测框架。的SMC-PHD YOLO探测器意思也优于其他四个专业探测器,即。,SMC Faster R-CNN, that of Kumar, that of Dalal, and that of Maamatou, by 5%, 6%, 9%, and 2%, respectively.

(一)

(b)

(c)

(d)

(e)

表5报告平均检测率的方法和其他先进的方法对不同的数据集。我们列出十GOT-10k和YouTubeBB注释。康和Maamatou方法用于船和流量检测,他们不包括在此表中。我们建议的方法达到检出率最高,特别是对麻省理工学院交通数据集。SMC-PHD YOLO可以检测意思闭塞的目标,比如汽车。尽管SMC R-CNN达到类似的的检出率SMC-PHD YOLO探测器,意思每秒的帧数(FPS) SMC-PHD YOLO网络意思是SMC R-CNN的100倍。因此,SMC-PHD YOLO探测器意思大大优于通用检测器与几个注释在所有政府数据集。相比基线YOLO探测器意思,SMC-PHD YOLO检测器达到意思检出率高出12%。

虽然我们提出方法检出率最高和大民国值在所有方法中,提出SMC-PHD YOLO性能取决于hyperparameters意思,如探测概率和杂波密度。开始时这些参数应该建立基于经验的培训。一些研究人员提出解决方案评估SMC-PHD滤波器的参数。例如,丽安et al。49)使用期望最大概率估计未知的混乱,和李et al。50)使用γ高斯混合模型来估计探测概率。这种估计方法应用于提高SMC-PHD YOLO过滤器意思将在我们未来的工作。

5。结论

定制的YOLO探测器意思独特的目标识别,我们提出一个有效的和精确的结构基于SMC-PHD过滤器和GM-PHD过滤器。信心的基础上,提出了参考可能性和小说重采样策略,可以使用这个框架通过选择适当的目标数据集训练样本,然后检测目标。这个框架自动提供了一个强大的专业探测器一般YOLO探测器意思和一些目标视频。测试表明,该框架可以生成一个特定YOLO探测器意思大大优于通用YOLO探测器在不同的数据集意思鸟,船,汽车检测。相关杂波仍具有挑战性SMC-PHD过滤器。未来的研究将着眼于扩大算法与杂波多通道的信息来解决相关问题。

数据可用性

使用的数据来支持本研究可从相应的作者。

的利益冲突

作者声明,关于这项工作他们没有利益冲突。

确认

这项工作得到了国家自然科学基金(批准号51879055)和黑龙江Touyan创新团队项目。

引用

a . Hampapur l .布朗,j·康奈尔et al .,“智能视频监控:探索多尺度时空跟踪的概念,“IEEE信号处理杂志,22卷,不。2,页38-51,2005年3月。
视图: 出版商的网站 | 谷歌学术搜索
s . Javadi h . Moosaei, d . Ciuonzo“学习无线传感器网络定位来源,”传感器,19卷,不。3,p。635年,2019年。
视图: 出版商的网站 | 谷歌学术搜索
l .赵和z黄”,一个移动物体检测方法使用深上优于无线传感器网络,”复杂性,第2021卷,第2021页。
视图: 谷歌学术搜索
r . Thiolliere e·邓巴g . Synnaeve m . Versteegh和e·斯贝尔,“混合动态时间warping-deep无监督声学建模、神经网络架构”Proc。INTERSPEECH,第3183 - 3179页,2015年。
视图: 出版商的网站 | 谷歌学术搜索
j . Redmon和a·哈蒂”Yolov3:增量改进”,2018年,https://arxiv.org/abs/1804.02767。
视图: 谷歌学术搜索
p .美元,z, p . Perona一起,s . Belongie“积分频道功能,”《英国机器视觉会议,BMVC出版社,伦敦,英国,2009年9月7日。
视图: 出版商的网站 | 谷歌学术搜索
b . Benfold。里德,“稳定的多目标实时跟踪监控录像,”《IEEE计算机视觉和模式识别(CVPR)IEEE,页3457 - 3464年,有限公司,2011年6月20日。
视图: 出版商的网站 | 谷歌学术搜索
a . Mhalla t .城堡,h . Maamatou s Gazzah n e·本·阿马拉和R.-C。n . n . Smc更快,“Smc更快R-CNN:向scene-specialized多目标探测器,“计算机视觉和图像理解卷,164年,页3日- 15日,2017。
视图: 出版商的网站 | 谷歌学术搜索
k . k .着特区豪格,“有效的行人检测器价值领域适应视频场景,”模式识别国际会议(ICPR)施普林格,页654 - 659年,斯德哥尔摩,瑞典,24 Auguust 2014。
视图: 出版商的网站 | 谷歌学术搜索
h . Maamatou t .城堡,s . Gazzah y Goyat,和n e·b·阿马拉”转换学习转移到专门一个通用的分类器对一个特定的场景,”计算机视觉国际联合会议,成像和计算机图形学理论和应用程序IEEE,页411 - 422年,罗马,意大利,2016年2月27日。
视图: 出版商的网站 | 谷歌学术搜索
y Aytar和a . Zisserman白板:模型转移对象类别检测”《计算机视觉国际会议(ICCV)施普林格,页2252 - 2259年,巴塞罗那,西班牙,2011年11月6日。
视图: 出版商的网站 | 谷歌学术搜索
t·托马西,f . Orabona和b·卡普托”学习类别从一些例子多模型知识转移,”IEEE模式分析与机器智能,36卷,不。5,928 - 941年,2014页。
视图: 出版商的网站 | 谷歌学术搜索
s . j ., i . w . Tsang j·t·郭和杨问:“域适应通过转让成分分析,IEEE神经网络,22卷,不。2、199 - 210年,2011页。
视图: 出版商的网站 | 谷歌学术搜索
b . Quanz j .欢,m . Mishra“知识转移与低质量数据:一个特征提取问题,“IEEE工程知识和数据,24卷,不。10日,1789 - 1802年,2012页。
视图: 出版商的网站 | 谷歌学术搜索
毛y和z阴,“训练使用tracklets scene-specific行人检测器,”学报的IEEE会议应用计算机视觉(WACV)IEEE,页170 - 176年,Waikoloa,嗨,美国,2015年1月5日。
视图: 出版商的网站 | 谷歌学术搜索
c·罗森博格·m·赫伯特·h·施耐德曼,“Semi-supervised自我训练的对象检测模型,”学报的IEEE会议应用计算机视觉(WACV)出台,页29-36、IEEE,有限公司,美国,2005年1月5日。
视图: 出版商的网站 | 谷歌学术搜索
k·d·汉斯勒,和f .小花,“Flowboost外观从稀疏带注释的视频,学习“IEEE, 1433 - 1440页。
视图: 谷歌学术搜索
j . Redmon s Divvala r . Girshick,哈蒂,“你只看一次:统一、实时检测,”《IEEE计算机视觉与模式识别会议IEEE,页779 - 788年,拉斯维加斯,NV,美国,2016年6月27日。
视图: 出版商的网站 | 谷歌学术搜索
j . Redmon和a·哈蒂”Yolo9000:更好,更快,更强”《IEEE计算机视觉与模式识别会议IEEE,页7263 - 7271年,檀香山,夏威夷,美国,2017年7月21日。
视图: 出版商的网站 | 谷歌学术搜索
r·p·s·马勒“多目标通过一阶多目标时刻,贝叶斯过滤”IEEE航空航天和电子系统,39卷,不。4、1152 - 1178年,2003页。
视图: 出版商的网站 | 谷歌学术搜索
r·马勒,”博士高阶滤波器在目标数,“IEEE航空航天和电子系统,43卷,不。4、1523 - 1543年,2007页。
视图: 出版商的网站 | 谷歌学术搜索
r·p·马勒“统计multisource-multitarget信息融合,”Artech房子诺伍德,妈,685卷,2007年。
视图: 谷歌学术搜索
e . Maggio m .泰姬,a . Cavallaro”有效的多目标视觉跟踪使用随机有限集,”IEEE电路和系统视频技术,18卷,不。8,1016 - 1027年,2008页。
视图: 出版商的网站 | 谷歌学术搜索
大肠Maggio和a . Cavallaro“学习”为多个场景上下文对象跟踪,IEEE图像处理,18卷,不。8,1873 - 1884年,2009页。
视图: 出版商的网站 | 谷歌学术搜索
d . y . Kim B.-N。签证官,俊男。签证官,“在线视觉多目标跟踪通过标签随机有限集过滤,“2016年,https://arxiv.org/abs/1611.06011。
视图: 谷歌学术搜索
美国美国辛格B.-N。签证官,a·巴德利和s . Zuyev“过滤器为空间点过程,”暹罗在控制和优化》杂志上,48卷,不。4、2275 - 2295年,2009页。
视图: 出版商的网站 | 谷歌学术搜索
B.-N。签证官和W.-K。妈,“高斯混合概率假设密度滤光片,”IEEE信号处理,54卷,不。11日,第4104 - 4091页,2006年。
视图: 出版商的网站 | 谷歌学术搜索
B.-N。Ba-Ngu Vo, s·辛格和a . Boucet“序贯蒙特卡罗方法对多目标过滤用随机有限集,“IEEE航空航天和电子系统第41卷。。4、1224 - 1245年,2005页。
视图: 出版商的网站 | 谷歌学术搜索
k . Granstrom c . Lundquist和o . Orguner”扩展目标跟踪使用高斯混合滤波器博士,”IEEE航空航天和电子系统,48卷,不。4、3268 - 3286年,2012页。
视图: 出版商的网站 | 谷歌学术搜索
n . l . Baisa和a·华莱士”发展多个目标的n型GM-PHD过滤器,多种类型的视觉跟踪,”杂志的视觉传达和图像表示59卷,第271 - 257页,2019年。
视图: 出版商的网站 | 谷歌学术搜索
T.-Y。林,m . Maire s Belongie et al .,“微软可可:常见的上下文中的对象,”计算机视觉的欧洲会议(大会)施普林格,页740 - 755年,苏黎世瑞士,2014年9月6日。
视图: 出版商的网站 | 谷歌学术搜索
r·p·s·马勒俊男。签证官,B.-N。签证官,“Cphd过滤与未知的混乱率和检测资料,”IEEE信号处理卷,59号8,3497 - 3513年,2011页。
视图: 出版商的网站 | 谷歌学术搜索
d·福克斯,“Kld-sampling:自适应粒子过滤器,”先进的神经信息处理系统,第720 - 713页,2002年。
视图: 谷歌学术搜索
l .黄、赵x和k .黄”Got-10k:通用对象的大型高多样性指标跟踪在野外,”2018年,https://arxiv.org/abs/1810.11981。
视图: 谷歌学术搜索
大肠真实,j . Shlens s Mazzocchi x,和诉Vanhoucke”Youtube-boundingboxes:大型高精度human-annotated数据集在视频对象检测”《IEEE计算机视觉与模式识别会议(CVPR)5305年,页5296 - 2017年6月19日。
视图: 出版商的网站 | 谷歌学术搜索
马x x, x小徐,w·e·l . Grimson”无监督活动感知在拥挤和复杂场景使用分层贝叶斯模型,”IEEE模式分析与机器智能没有,卷。31日。3、539 - 555年,2009页。
视图: 出版商的网站 | 谷歌学术搜索
任,k .他r . Girshick j .太阳和R.-C。n . n .更快,“与地区建议网络实时目标检测,”先进的神经信息处理系统,第99 - 91页,2015年。
视图: 谷歌学术搜索
k·k·辛格,f·肖和y .李杰从前“跟踪和传输:观看视频模拟强weakly-supervised人力监督对象检测”《IEEE计算机视觉与模式识别会议(CVPR)IEEE,页3548 - 3556年,拉斯维加斯,NV,美国,2016年6月27日。
视图: 出版商的网站 | 谷歌学术搜索
德斯穆克和t·s·艾。卫生部,“好对象检测自动化太阳能面板布局的一代”学报2018年17 IEEE国际会议上机器学习和应用程序(ICMLA)IEEE,页1402 - 1407年,美国佛罗里达州奥兰多市2018年12月17日。
视图: 出版商的网站 | 谷歌学术搜索
m·康k .霁x愣,林和z,“上下文提出卷积神经网络对sar船舶检测多层融合,“遥感,9卷,不。8,860年,页2017。
视图: 出版商的网站 | 谷歌学术搜索
g . Bertasius l . Torresani, j .史”与时空采样网络视频对象检测,”计算机视觉的欧洲会议(大会)施普林格,页331 - 346年,慕尼黑,德国,2018年9月8日。
视图: 出版商的网站 | 谷歌学术搜索
d . y . Li黄,d .秦l . Wang和锣,“改善对象检测与选择性self-supervised自我训练,”欧洲计算机视觉的诉讼施普林格,页589 - 607年,慕尼黑,德国,2020年9月8日。
视图: 出版商的网站 | 谷歌学术搜索
w·李,j . Na和g·金,“多任务self-supervised对象检测通过回收的边界框注释,”《IEEE计算机视觉与模式识别会议IEEE,页4984 - 4993年,长滩,CA,美国,2019年6月15日。
视图: 出版商的网站 | 谷歌学术搜索
x y z杰,魏、晋,j .冯和w·刘,“深自学学习弱监督对象定位,”《IEEE计算机视觉与模式识别会议IEEE,页1377 - 1385年,圣胡安,公关,美国,2017年7月21日。
视图: 出版商的网站 | 谷歌学术搜索
a . Ghahremani e . Bondarev和p h . n . de,“向多层次检测:自学的方法来减少类的噪音从训练数据集、”国际社会对光学和光子学卷,11041篇文章ID 110411米,2019年。
视图: 谷歌学术搜索
f·肖和y .李杰从前”跟踪和段:视频对象的迭代非监督方法建议,”《IEEE计算机视觉与模式识别会议IEEE,页933 - 942年,拉斯维加斯,NV,美国,2016年6月27日。
视图: 出版商的网站 | 谷歌学术搜索
t, s, m . Bolić和j·m·Corchado“算法设计的并行实现SMC-PHD过滤器,”信号处理卷,119年,第127 - 115页,2016年。
视图: 出版商的网站 | 谷歌学术搜索
a . y . Liu希尔顿,j·钱伯斯,赵y,和w·王,“零扩散粒子流动smc-phd过滤视听multi-speaker跟踪”《IEEE国际会议音响、演讲和信号处理IEEE,页4304 - 4308年,卡尔加里,AB,加拿大,2018年4月15日。
视图: 出版商的网站 | 谷歌学术搜索
f·丽安,c·汉和w·刘,“估计未知博士过滤杂波强度,”IEEE航空航天和电子系统,46卷,不。4、2066 - 2078年,2010页。
视图: 出版商的网站 | 谷歌学术搜索
t·c·李,w . Wang Kirubarajan, j .太阳和p . Lei,”博士和cphd过滤与未知的探测概率,”IEEE信号处理,卷66,不。14日,第3798 - 3784页,2018年。
视图: 出版商的网站 | 谷歌学术搜索

版权

PDF 下载引用

下载其他格式

订单打印副本

的观点

277年

下载

449年

引用