移动信息系统

PDF
移动信息系统/2021年/文章
特殊的问题

深度学习在移动计算:架构、应用程序和未来的挑战

把这个特殊的问题

研究文章|开放获取

体积 2021年 |文章的ID 6645629 | https://doi.org/10.1155/2021/6645629

气宣,叫海波彭日成Meiqin谢,Liu王成明因Zhanbo李, 研究基于暹罗的目标跟踪算法的神经网络”,移动信息系统, 卷。2021年, 文章的ID6645629, 11 页面, 2021年 https://doi.org/10.1155/2021/6645629

研究基于暹罗的目标跟踪算法的神经网络

学术编辑器:Xiaoxian杨
收到了 2020年12月18日
修改后的 07年2月2021年
接受 2021年3月11日
发表 2021年3月24日

文摘

目标跟踪是计算机视觉领域的一个重要课题。本文基于深暹罗的目标跟踪算法网络进行了研究。针对跟踪过程并不健壮的情况,如漂移或错过了目标,提高算法的跟踪精度和鲁棒性,提高了特征提取部分和在线更新部分。本文增加了SE-block和颞注意力机制(TAM)暹罗神经网络的框架。SE-block可以改进和提取功能;不同的渠道有不同的权重根据他们的重要性可以改善网络的歧视和跟踪器的识别能力。时间注意力机制可以通过调整权重更新目标状态的样本在当前帧和历史框架来解决模型的漂移引起的相似背景的存在。我们使用叉损失区分不同序列的目标,这样的距离特征域的时间更长,更容易识别的特性。我们训练和测试网络在三个基准和比较几种先进的跟踪方法。实验结果表明,该算法优于其他方法跟踪效果的图和评价标准。 The proposed algorithm can solve the occlusion problem effectively while ensuring the real-time performance in the process of tracking.

1。介绍

目标跟踪是一个研究热点,在数字图像处理基本主题。它在许多领域有着重要的应用,如军事领域、交通监控、人机交互、视频监控、精确制导等(1,2]。目标跟踪的任务是预测目标的位置和运动状态在后续帧的视频根据目标的运动轨迹和姿态变化的目标大小和位置的初始帧视频序列(3]。由于目标和环境的变化信息在目标跟踪过程中,目标是不断变化的特点,目标跟踪的速度和精度要求的问题也进行了讨论。有几个困难的目标跟踪,如背景杂波、变形、规模变化和遮挡。除了上面的共同挑战,还有其他具有挑战性的因素,如光照变化、运动模糊,旋转,视图,动作要快得多。所有这些挑战一起确定目标跟踪是一个非常复杂的任务在计算机视觉4]。为了解决这些实际问题,近年来研究者提出许多跟踪方法。

大部分的方法解决跟踪问题通过建立模型,可以区分目标和背景。因为目标是用于跟踪的具体信息,很难学习目标模型离线训练的过程中,在目标探测等。相反,必须构建目标模型通过使用目标信息在测试期间。目标跟踪问题的非传统的性质带来重大挑战当学习追求一个端到端的解决方案(5]。

这些问题已经解决了暹罗神经网络成功(6- - - - - -8]。这些方法学习功能嵌入计算两个图像之间的相似度的区域通过简单的互相关。然后,选择图像区域是最类似于模板被跟踪。因为模型只对应模板特征提取目标区域,跟踪器可以使用带注释的图像的端到端容易训练。尽管暹罗神经网络在目标跟踪近年来取得成功,仍有严重限制。首先,离线训练数据集的缺乏可以导致相似性的度量标准有时有错误,导致穷人泛化。其次,暹罗神经网络只使用目标当推断目标模型的外观但忽略了背景出现的信息,有必要区分目标和类似的对象。第三,暹罗神经网络缺乏一个强大的模型更新策略。所有这些限制使暹罗的健壮性神经网络需要改进(9]。

本文的贡献如下:首先,我们添加SE-block子结构(10暹罗神经网络),这可以增强特性表示的有效渠道和改善功能歧视,建模图像的每个通道之间的相关性。因此,我们可以减少成本的计算提取特征。其次,为了解决这个问题,目标很容易被阻挡在跟踪过程中,我们添加时间注意机制在暹罗神经网络框架。时间注意力机制可以帮助损失函数的参数更新通过调整权重的样本在当前帧和历史帧。

此外,我们使用叉损失区分不同视频序列的目标,这使得在功能域的距离保持的时间更长,有更多的分辨率的特性对目标和背景进行分类。

用于测试该算法的有效性,我们进行综合实验三个基准,分别。结果表明,该方法可以有一个美好的影响三个基准是优于其他对比方法通过定性和定量评估。本文可以验证我们提出的网络的可行性和有效缓解目标遮挡问题的同时确保实时性能。

2.1。深度模型

基于深度学习的目标跟踪方法可以通过强大的跟踪目标深度学习模型的表示能力。2012年,卷积网络AlexNet [11,12)是首次提出,许多网络基于卷积生成的目标跟踪随后,如VGGNet [13《盗梦空间》),谷歌网(14],ResNet [15],DenseNet [16]。卷积网络的发展解决了一系列问题的梯度扩散在反向传播过程中,提取的语义信息是更健壮的大变化。这些模型都在目标探测和识别有显著影响(17,18)和图像分类(19]。然而,跟踪的影响是微妙的,由于有限的数据集和实时性能等因素。

根据深度学习的模型特征提取、目标跟踪可分为基于pretrained跟踪特性和跟踪基于离线训练深深特性。

在基于pretrained深度模型的目标跟踪,ImageNet [17)于2013年最早的方法提取特征。马等人提出了HCF算法(20.)使用VGG综合浅特性和深特性的网络在2015年相关性过滤器。它显示一个好的实验结果,但该算法没有过程目标和假设的规模跟踪过程中目标规模不变的有少得多的鲁棒性与大规模跟踪目标时的变化。2016年,七等人使用对冲算法(21)提高相关性过滤器的融合训练每一层的功能。然后,Danelljan等人提出了C-COT算法(22),结合深层语义信息和浅外观信息通过插值获得连续的空间分辨率响应地图根据不同空间分辨率的反应,然后发现最佳规模和位置的迭代23]。C-COT算法可以和谐地集成不同分辨率的特征图谱。然而,缺点是在训练的数据量非常大,容易失去帧。2017年,Danelljan等人提出了生态(24)算法,提高了分组样本,卷积因子,分解和更新策略。它提高了算法的速度同时确保算法的准确性。2018年,Bhat等人提出了UPDT算法(25),这使得区分深特性和浅特性和利用数据增强和响应函数的差异有效地提高跟踪的准确性和鲁棒性,同时提出了质量评价方法自适应和融合响应映射到进一步优化跟踪的效果。深度学习模型基于pretraining需要较少的训练数据,可以直接用于目标检测。然而,模型更大,参数多,模型结构不灵活导致大量的计算。

目标跟踪的方法基于离线训练深度模型可以实现良好的跟踪结果通过端到端训练特征匹配跟踪任务。南和汉族等人提出了MDNet算法(26]2016年,学会了卷积特性来代表目标由轻量级SoftMax小规模网络和使用分类器(27)分类抽样的样本有很好的跟踪性能,但跟踪的速度应该更好。深度学习模型基于离线训练可以用更少的参数,实现更高精度,可以加速收敛,同时减少了参数的数量。

2.2。暹罗神经网络

暹罗神经网络属于离线训练的深度学习模型。Bertinetto等人提出了Siamese-FC算法(28]解决了更一般的相似性培训深度网络学习问题的初步离线阶段,训练一个完全卷积暹罗网络定位候选地区较大的搜索图像。这个算法实时表现良好,但精度不如相关滤波方法结合深度特性。道等人在此基础上做了改进,提出了它们的算法(29日),生成多个候选区域的图像,学会了候选区域的匹配函数和目标模板在暹罗神经网络,然后选择候选人地区最小的差异作为模板在线跟踪跟踪问题转化为第一次匹配的问题。然而,处理大量的候选区域的过程是繁琐和耗时。2018年,李等人使用该地区建议网络(RPN) [30.)基于Siamese-FC算法来取代有界框回归与多尺度检测获取的边界框最大响应可以提高跟踪的效率和性能,但卷积层的特征提取能力仍需要改进。然而,大多数的暹罗网络上面提到的基于浅网络,而深层网络容易由于填充位置错误。

2.3。SE-Block

SE-block子结构,由紧缩和激发,而值得注意的是,SE-block不属于网络结构完整性。SE-block是学习特征权重,根据网络这样的损失的有效功能体重变大,影响不大或无效的体重变得越来越小,提高图像的特性通过有效渠道(23]使输入图像帧提高有效特征提取利用渠道相关而考虑空间特征信息完全为了使培训模型实现更好的结果。

2.4。时间的注意机制

注意机制是神经网络的一个重要概念,已广泛应用于不同的领域,特别是在图像识别,图像处理,NLP (31日]。深度学习的注意机制是关注重点,获取关键信息,而忽略其他无用的信息。大多数的注意机制模型是基于encoder-decoder框架。框架如图1

在图1,我们给的输入 ,和目标 是由encoder-decoder框架。编码器编码输入 将输入转换成中间语义,为代表 通过非线性变换。解码器生成信息根据语义表示的目标 的输入 和生成的历史信息。所以,encoder-decoder框架被视为一个通用框架;编码器和解码器可以使用各种模型的组合,如CNN, RNN LSTM,格勒乌。

提出了很多方法将阻塞,但收到了好评(有限12,18,32]。本文介绍处理阻塞时间注意机制。详细时间注意机制是用于更新的目标状态通过调整重量损失从训练样本在当前帧和历史框架。

3所示。跟踪网

3.1。建设网络

本文提出了基于暹罗神经网络的网络,它可以提高速度和准确性和处理遮挡目标跟踪。通过端到端网络是离线的训练方式。我们的网络结构如图2

我们的网络的结构是由两个过程,一个是在暹罗神经网络特征提取操作,另一个是使用积极的和消极的样本在当前和历史的框架来更新目标状态的帮助下颞注意力机制。目标是一般的边界框第一帧,我们采用范例图像的大小是127×127像素预处理后,搜索图片的意思是候选框搜索区域帧的跟踪后,搜索图像的大小是255×255像素后预处理[23]。SE-block添加后conv5 SE-CNN网络形成的结构,可以充分利用图像的通道和空间信息来提高信道特性的有效性,提高特征提取的影响。SE-CNN用来提取特征,然后加权范例图像和搜索图像。搜索图像最大的状态分类得分作为估计目标状态。然后,我们收集积极和消极训练样本在当前帧根据重叠估计目标状态。积极的训练样本在历史帧也用于更新目标状态。时间注意力机制实际上反映了体重估计目标状态的全损当我们在线更新参数。积极和消极的总损失是由当前帧和积极的样本的样本历史框架,并使用叉损失模型训练。

3.2。网络改进

摘要网络使用AlexNet结构(10卷积),包括五层和三个完整的连接层提取特征。卷积核的conv1 11×11像素,conv2 5×5像素,分别和conv3-5 3×3像素。内核大小是3,跨越2。网络采用Max-pooling,和有一个ReLu(修正线性单元)非线性激活函数卷积后层除了conv5。添加SE-block conv5后,归一化层可以防止数据分布改变以减少过度拟合训练过程的风险。

第一个衡量我们的进步是嵌入SE-block conv5后形成摘要SE-CNN模块(23]。SE-block由紧缩和激励。挤压操作减少了维度的特性,每个二维特性通道变成一个实数,拥有全球接受域在某种程度上,并匹配输出渠道维度的数量输入功能,代表了全球分销渠道的响应特性。激发操作生成重量为每个渠道渠道之间的关联特性,以及体重意味着每个特性的信道特征选择后的重要性。调整操作使用乘法重量特性渠道原始特性,完成校准通道尺寸的原始特性。

改进的细节图所示3

第二个时间注意机制的改进是充分关注历史和当前样本基于阻塞状态。可以给不同的影响(即Encoder-decoder框架。,weight) to the positive and negative samples of video frames in different time and extract the key frames and their information we contained that may be useful for tracking which make the model be more accurate on judgment of target tracking without increasing the cost of calculation and storage. The historical sample is the reliable and positive sample collected at historical frame, and the sample at current frame reflects the state change of the target.

3.3。跟踪策略

从本质上讲,跟踪策略大致可以分为以下四个部分:特征提取。SE-CNN作为特征提取器提取输入图像的特点和搜索图像二元分类。从SE-CNN提取的特征输入到二元分类器,和输出的概率表明候选人属于估计目标状态的状态,这就是分类得分估计目标状态。比较分类评分后,候选人与选择得分最高的状态估计目标状态处理阻塞。我们从当前帧获取训练样本和历史框架。时间注意机制是当前和历史之间的相对重要性平衡基于阻塞状态的视觉线索

3.4。算法流程

本文算法的流程如图4

3.4.1。图像预处理

范例图像和搜索图像是一个固定大小的“修改”。具体来说,它包括填充、切割、和扩展,这些过程不能损害信息对象的大小进行手工标记的目标在图像的中心(23]。

3.4.2。特征提取

范例和搜索图像预处理后输入到卷积层在对卷积操作。假设输入图像 地图和输出特性 ,卷积操作的公式如下: 在哪里 意味着 卷积的内核, 意味着 输入, 意味着接受域的特征映射 通道。

地图的特性是挤压操作后差距(全球平均池),这是写成 为了表达功能的全球信息地图,我们变换的特征映射的输入 的输出 ,如下面所示:

接下来,功能是激发操作,这是表示 ,如下面所示: ReLu是一个非线性激活函数, 意味着乙状结肠函数, 意味着挤压操作的结果, 意味着两个完整的参数连接层,分别使用两个完整的连接层融合每个通道的特征地图信息,和 意味着特征图谱的重量设置为在不同的渠道 这些权重学习完整的连接层和非线性层,这样他们就可以被训练的端到端(23]。

最后,调整操作执行,输出的权重调整原始图像,对应如下: 在哪里 意味着重量和 是一个二维矩阵。我们给不同的权重不同的渠道。网络不仅可以加强有效渠道根据他们的重要性,也提高的表征能力特性在上面的改进(23]。

3.4.3。二元分类器

考虑到精炼功能表示 ,分类评分方法如下: 在哪里 二元分类器的输出,代表候选人是否状态的概率 是目标 目标分类器的参数吗

3.4.4。估计目标状态

目标的初始状态 估计通过选择的候选国家最大分类得分如下:

值得注意的是,过小的初始估计状态分类得分将导致偏差模型的更新。为了避免模型退化,我们设定一个阈值,如果分数低于阈值,代表在当前帧目标不是跟踪。否则,初始状态 将进一步细化使用对象检测状态 详细的检测状态 得到如下: 在哪里 计算边界框借据重叠比率 然后,目标的最终状态 定义如下: 在哪里 是一个预定义的阈值。

3.4.5。处理阻塞

在线更新的训练样本得到的当前帧和历史状态。被跟踪的目标,积极的在当前帧采样样本 规模变化和小位移估计目标状态 此外,历史也作为正样本。如果目标在当前帧被认为是无路径的,我们只使用目标的历史状态作为正样本。在当前帧所有负样本收集 有针对性的分支需要识别目标的能力,我们从其他目标和背景跟踪。因此,其他的估计状态跟踪目标,从后台随机抽样的样本被视为负样本。

为目标 ,鉴于目前正样本集 ,当前的负样本集 ,从历史和积极的样本集 ,损失的功能更新相应的有针对性的分支定义如下: 在哪里 在当前帧的损失负样本, 是积极的损失在当前帧样本, 历史上是积极的损失样品,然后呢 引入的时间关注机制。

为了缓解的目标遮挡问题跟踪的过程中,我们将介绍颞注意机制。时间的关注的目标 由特征加权定义 并与其他目标重叠状态如下: 在哪里 , , 参数是可学的, 特征加权的平均值吗 , 代表的闭塞状态的目标 ,值越大,更严重的是目标是阻挡和较小的正样本的重量在当前帧, 是最大的重叠 在当前帧和其他目标 , 是乙状结肠函数。因此,我们时间注意力机制添加到我们的网络,提供了一个良好的平衡的当前和历史的视觉线索的目标。

4所示。经验

4.1。实验装置

本文实验是基于PyTorch框架构建和训练卷积神经网络。模型的训练,本实验使用2.4 GHz的GeForce 2080 RTX ti GPU和CPU迭代50次(23]。第一个20只迭代训练特征提取的网络和过去30迭代训练整个网络这意味着发现对象的位置跟踪器是否被检测对象。的参数设置,SGD优化器(33- - - - - -35)是用于优化网络的损失函数和更新网络权值,以避免影响跟踪的速度。与此同时,算法参数设置如下:训练一批大小设置为16,预热采用学习速率的机制,前20个迭代的初始学习速率为0.001,过去30迭代的学习速率为0.005,下降到0.0005(重量衰变),测试序列的速度为0.5 fps,和动量是0.9。我们收集正≥0.7和负样本≤0.3借据重叠比率与当前帧的目标状态(36]。

4.2。实验过程

本文实验过程如图5,主要分为以下过程。

首先,SE-network和时间关注机制的框架介绍了Siamese-FC算法来调试代码。选择数据集进行训练和测试,培训数据预处理、代码实现改善算法,跟踪模型训练。然后,训练模型用于数据集进行实验,结果是评估。最后,其他高级跟踪算法和测试结果相比,我们提出的算法。

4.3。定性评价

评估算法的有效性,我们训练和测试网络公共可用GOT10k基准(37不受约束的环境中)。它包括563年超过10000个视频类别。测试视频序列包括许多干扰因素,如旋转、遮挡、光线变化,方向改变,和尺度转换有助于验证我们提出的算法的实用价值。C-COT [22],ECO [24],UPDT [25],MDNet [26],CFNet [38)选择与我们的算法在这个基准。所有的比较先进的算法包括我们使用相同的参数在测试过程中公平的比较。

本文展示了一些GOT10k六算法的实验结果。盒子有不同的颜色代表不同的算法的跟踪结果,我们提出的算法是用红色框表示。定性评价算法的执行从下面五个方面,展示了跟踪效果优于其它算法在一定程度上,如图6(1)目标旋转。在“000577”和“005501”目标的方向我们跟踪已经发生了巨大的变化,这使得其他五个算法跟踪失败但我们的算法可以准确跟踪目标。(2)运动模糊。视频序列的“003867”和“006037”运动模糊由于快速移动的目标或相机震动,导致算法相比有漂移,但我们的算法不受影响。(3)光照变化。视频序列的“000047”和“006504”照明变化显著的过程中跟踪,这需要强大的算法光照的影响。在视频序列的“006504”,对比算法失败一个接一个的,只有我们的算法可以准确跟踪目标后第119帧当照明变化显著。(4)复杂的背景。视频序列的“000492”和“000501”复杂的背景有很大挑战的跟踪精度的算法。除了我们的算法,算法比较复杂背景干扰,导致损失在000492年”的目标。”“000501年”,比较算法有不同程度的飘除了从十日我们的算法框架,我们的算法可以准确跟踪目标。(5)闭塞。视频序列的“000496”、“000505”,“000507”和“000510”目标在不同程度出现堵塞的过程跟踪。在“000510”,目标是阻挡了几个动物严重但只有我们的算法可以正确跟踪目标。

4.4。定量评价

为证明算法的有效性客观和全面,我们比较我们的算法和一些先进的跟踪方法在三个挑战性的基准。

GOT10k [37:这是一个大规模的基准包括超过10000个视频。我们的算法相比C-COT (22],ECO [24],MDNet [26],SiamFCv2 [38],CF2 [39],GOTURN [40],SiamFC [28)选择AO(平均重叠)和SR(成功率)作为评价标准。结果如表所示1


生态 C-COT MDNet SiamFCv2 CF2 GOTURN SiamFC 我们的

AO 31.6 32.5 29.9 37.4 31.5 34.7 34.8 39.6
30.9 32.8 30.3 40.4 29.7 37.5 35.3 42.9

VOT2018 [41:这是一个指标组成的60个视频。我们的算法相比UPDT (25建议],[41),原子(42],DiMP [43],DRT [44),有数45],LADCF [46)选择精度(平均重叠成功跟踪帧)和EAO(预计平均重叠)47)作为评估标准。结果如表所示2


UPDT 有数 DRT 分区, LADCF 原子 DiMP 我们的

精度 0.536 0.507 0.519 0.505 0.503 0.590 0.594 0.599
EAO 0.378 0.376 0.356 0.385 0.389 0.401 0.402 0.407

OTB2015 [48:这是一个基准,包括超过100个视频。我们的算法相比C-COT (22],UPDT [25],MDNet [26],SiamFC [28],CF2 [43],ADNet [49),和嵴50)选择开放(one pass评价)作为评估标准(51]。结果如图7

5。结论

本文使用了暹罗神经网络为研究框架,增加了SE-block和TAM到网络中。SE-CNN可以充分利用空间特征信息和信道相关性,使提取的特征权重变化根据贡献相当于一个通道的注意机制。TAM可以更新目标状态通过调整样品的重量变化在当前帧和历史帧。实验结果表明,该算法在目标跟踪中的应用,具有良好的鲁棒性,可以满足实时需求的跟踪和有效缓解阻塞的问题。然而,仍有偏差,因为速度太快的问题在一些视频序列的目标。如何解决这个问题是今后研究的重点。在这个问题上我们应该做进一步的研究。

数据可用性

使用的数据来支持本研究的结果可在https://上http://www.votchallenge.net/vot2018/dataset.html;http://got-10k.aitestunion.com/downloads;和http://cvlab.hanyang.ac.kr/tracker_benchmark/datasets.html

的利益冲突

作者宣称他们没有利益冲突有关的出版。

确认

这项研究是由郑州大学的年轻骨干教师项目(2019年zdggjs029):研究在视频跟踪移动物体建模;在线2017年郑州大学精品课程项目:数字图像处理;教育和教学改革研究和实践项目2019年郑州大学(2019年zzujglx224):培养模式的研究与实践创新和信息安全专业的创业人才;2019年郑州大学和线下课程优秀项目(2019年zzuxxkc023):数字图像处理。

引用

  1. e . Mazor a . Averbuch y Bar-Shalom, j·达扬”交互多模型目标跟踪方法:一项调查,“IEEE航空航天和电子系统,34卷,不。1,第123 - 103页,1998。视图:出版商的网站|谷歌学术搜索
  2. h·高,x秦,r . j . d .巴罗佐et al .,“基于协作学习工业物联网API推荐软件定义设备:隐性知识发现的角度来看,“IEEE新兴主题计算智能,1卷,2020年。视图:出版商的网站|谷歌学术搜索
  3. x r·李和v . p . Jilkov”机动目标跟踪调查。第一部分动态模型。”IEEE航空航天和电子系统,39卷,不。4、1333 - 1364年,2003页。视图:谷歌学术搜索
  4. x r·李和v . p . Jilkov”机动目标跟踪调查。诉多模方法的一部分。”IEEE航空航天和电子系统第41卷。。4、1255 - 1321年,2005页。视图:谷歌学术搜索
  5. g . Bhat m . Danelljan l . Van干傻事,t·拉,“学习”歧视模型预测跟踪,IEEE计算机视觉基础,卷69,不。2、79 - 91年,2020页。视图:谷歌学术搜索
  6. j .布罗姆利盖恩,勒存y . et al .,“签名验证使用“暹罗“延时神经网络”美国的进步ACM的神经信息处理系统美国科罗拉多州,页737 - 744,1994年12月。视图:谷歌学术搜索
  7. 美国Chopra, r·哈德和y LeCun(“学习一种相似性度量有区别地,面对验证与应用程序,”2005年IEEE计算机学会学报计算机视觉与模式识别会议(CVPR ' 05)圣地亚哥,页539 - 546年,CL,美国,2005年6月。视图:谷歌学术搜索
  8. y Taigman, m .杨·m·a·Ranzato et al .,“Deepface:缩小差距以人类性能验证,”《IEEE计算机视觉与模式识别会议哥伦布,页1701 - 1708年,哦,美国,2014年11月。视图:谷歌学术搜索
  9. m . Kristan a . leonardi j . Matas et al .,“第六届视觉物体跟踪vot2018挑战的结果,“大会车间,卷2,p . 2018。视图:谷歌学术搜索
  10. j . Hu l .沈s Albanie g .太阳和大肠,“Squeeze-and-excitation网络,”2017年,arXiv预印本https://arxiv.org/abs/1709.01507视图:谷歌学术搜索
  11. a . Krizhevsky i Sutskever, g·e·辛顿“Imagenet分类与深卷积神经网络,”诉讼进展的神经信息处理系统太浩湖,页1097 - 1105年,ND,美国,2012年12月。视图:谷歌学术搜索
  12. h . Izadinia Saleemi, w·李,m .沙“多人跟踪多个部分,”第12届欧洲计算机视觉学报》上佛罗伦萨,意大利,2012年10月。视图:谷歌学术搜索
  13. k . Simonyan和a . Zisserman”很深的卷积网络大规模图像识别,”2014年,https://arxiv.org/abs/1409.1556视图:谷歌学术搜索
  14. c . Szegedy诉Vanhoucke,美国约飞et al .,“重新考虑初始计算机视觉架构,”《IEEE计算机视觉与模式识别会议拉斯维加斯,页2818 - 2826年,ND,美国,2016年12月。视图:谷歌学术搜索
  15. k . x张,他任美国et al .,“深残余学习图像识别,”《IEEE计算机视觉与模式识别会议拉斯维加斯,页770 - 778年,ND,美国,2016年7月。视图:谷歌学术搜索
  16. 黄g . z . Liu l . Van Der Maaten et al .,“人口回旋的网络连接,”《IEEE计算机视觉与模式识别会议火奴鲁鲁,页4700 - 4708年,美国,2017年7月,你好。视图:谷歌学术搜索
  17. 王n和d . y . Yeung“学习深紧凑的视觉跟踪,图像表示”诉讼进展的神经信息处理系统太浩湖,页809 - 817年,ND,美国,2013年12月。视图:谷歌学术搜索
  18. g ., a . Dehghan o . Oreifej大肠的手,和m .沙”部分基于多人跟踪部分遮挡处理,”会议的程序在计算机视觉和模式识别2012年12月美国普罗维登斯,国际扶轮。视图:谷歌学术搜索
  19. h·高、w·黄和y段,“cloud-edge-based动态重新配置的服务工作流为移动电子商务环境,”ACM网上交易技术,21卷,不。1、ID 6条1,2021页。视图:出版商的网站|谷歌学术搜索
  20. c . Ma j·b·黄x杨et al .,“分层卷积为视觉跟踪特性,”《IEEE计算机视觉国际会议Las conde,页3074 - 3082年,CH,美国,2015年6月。视图:谷歌学术搜索
  21. y气,张,l .秦et al .,“对冲深度跟踪”《IEEE计算机视觉与模式识别会议拉斯维加斯,页4303 - 4311年,ND,美国,2016年6月。视图:谷歌学术搜索
  22. m . Danelljan a·罗宾逊f·s .汗et al .,“除了相关性过滤器:学习连续卷积算子视觉跟踪,”欧洲计算机视觉的诉讼,页472 - 488年,荷兰阿姆斯特丹,2016年8月。视图:谷歌学术搜索
  23. h·庞x气,m .谢c . Liu和z,“目标跟踪在暹罗卷积神经网络基础上,”学报2020年国际会议的IEEE会议上计算机,信息和通信系统(国旅)2020年10月,杭州,中国。视图:出版商的网站|谷歌学术搜索
  24. m . Danelljan g . Bhat f·沙赫巴兹•汗et al。“生态:有效的跟踪、卷积运算符”《IEEE计算机视觉与模式识别会议火奴鲁鲁,页6638 - 6646年,美国,2017年7月,你好。视图:谷歌学术搜索
  25. g . Bhat j . Johnander m . Danelljan et al .,“推出深度跟踪的力量,”计算机视觉的欧洲会议(大会),页483 - 498,德国慕尼黑,2018年9月。视图:谷歌学术搜索
  26. h .南和b汉”,学习多域卷积神经网络视觉跟踪”《IEEE计算机视觉与模式识别会议拉斯维加斯,页4293 - 4302年,ND,美国,2016年6月。视图:谷歌学术搜索
  27. 渡边s Kumarawadu k, k . Kiguchi et al .,“自适应输出跟踪部分使用SoftMax函数已知的机器人系统网络,”《2002国际神经网络联合会议。IJCNN 02(猫。02 ch37290)火奴鲁鲁,页483 - 488年,美国,2002年7月,你好。视图:谷歌学术搜索
  28. l . Bertinetto j . Valmadre j·f·戴安娜et al .,“Fully-convolutional暹罗网络对象跟踪”欧洲计算机视觉的诉讼865年,页850 -阿姆斯特丹,荷兰,2016年10月。视图:谷歌学术搜索
  29. r .道、大肠Gavves和a·w·m . Smeulders“暹罗实例搜索跟踪”《IEEE计算机视觉与模式识别会议拉斯维加斯,页1420 - 1429年,ND,美国,2016年6月。视图:谷歌学术搜索
  30. 吴j . b . Li Yan, w . et al .,“高性能视觉跟踪与暹罗地区建议网络”《IEEE计算机视觉与模式识别会议8980年,页8971 -盐湖城犹他,美国,2018年6月。视图:谷歌学术搜索
  31. h·高,c . Liu和杨x, y . Li”V2VR:可靠hybrid-network-oriented V2V数据传输和路由考虑限制和连接概率,”IEEE智能交通系统,42卷,2020年。视图:出版商的网站|谷歌学术搜索
  32. s, m . Andriluka b·席勒的影子,“检测和跟踪锢囚人,”国际计算机视觉杂志》上,卷110,不。1,58 - 69、2014页。视图:出版商的网站|谷歌学术搜索
  33. y, e . Shelhamer j·多纳休et al .,“快速卷积架构功能嵌入,”2013年,https://arxiv.org/abs/1408.5093视图:谷歌学术搜索
  34. a . n, s . Li Gupta et al .,“强劲的视觉跟踪传递丰富的功能层次,”2015年,https://arxiv.org/abs/1501.04587视图:谷歌学术搜索
  35. l . Wang w·欧阳x王et al .,“与完全卷积网络视觉跟踪,”《IEEE计算机视觉国际会议Las conde,页3119 - 3127年,CH,美国,2015年12月。视图:谷歌学术搜索
  36. h·高旷l ., y, b .郭和k .窦”挖掘消费行为与移动营销应用的个性化推荐,演化”移动网络和应用程序,25卷,不。4、1233 - 1248年,2020页。视图:出版商的网站|谷歌学术搜索
  37. l .黄、赵x和k .黄”Got-10k:通用对象的大型高多样性指标跟踪在野外,”2018年,https://arxiv.org/abs/1810.11981视图:谷歌学术搜索
  38. j . Valmadre l . Bertinetto j . f .戴安娜a . Vedaldi h·菲利普和美国托,“端到端表示学习基于相关滤波器跟踪”学报2017年计算机视觉与模式识别会议火奴鲁鲁,嗨,美国,2017年7月。视图:谷歌学术搜索
  39. c . Ma J.-B。黄、杨x和M.-H。阳,“分层卷积为视觉跟踪特性,”2015年国际会议上计算机视觉学报》上美国拉斯维加斯conde, CH, 2015年12月。视图:谷歌学术搜索
  40. d .举行,美国杜伦,s . Savarese”学习跟踪100 fps与深回归网络,”欧洲计算机视觉的诉讼2016年10月,阿姆斯特丹,荷兰,。视图:谷歌学术搜索
  41. m . Kristan a . leonardi j . Matas et al .,“第六届视觉物体跟踪vot2018挑战的结果,”《欧洲计算机视觉工作室慕尼黑,德国,2018年9月。视图:谷歌学术搜索
  42. m . Danelljan g . Bhat f·s .汗和m . Felsberg“原子:准确跟踪重叠最大化,”会议的程序在计算机视觉和模式识别美国长滩,CL, 2019年9月。视图:谷歌学术搜索
  43. g . Bhat m . Danelljan l . Van干傻事,t·拉,“学习歧视模型预测跟踪,”2019年,https://arxiv.org/pdf/1904.07220.pdf视图:谷歌学术搜索
  44. c .太阳,d . Wang h . Lu, M.-H。杨”,通过共同学习、歧视和可靠性相关跟踪”学报2018年计算机视觉与模式识别会议美国盐湖城,2018年6月。视图:谷歌学术搜索
  45. g . Bhat j . Johnander m . Danelljan f·s .汗和m . Felsberg”揭幕的力量深入追踪,”欧洲计算机视觉的诉讼慕尼黑,德国,2018年8月。视图:谷歌学术搜索
  46. t·徐Z.-H。冯,X.-J。吴,j .难应付的“学习适应性有识别力的相关性过滤器通过时间一致性维护空间特征选择健壮的视觉跟踪,”2018年。视图:谷歌学术搜索
  47. 周x, s, m .曹”的方法来缓解的稀疏问题混合基于协同过滤的推荐:用户评论的产品属性的角度来看,“移动网络和应用程序,25卷,不。2、376 - 390年,2020页。视图:出版商的网站|谷歌学术搜索
  48. j . y . Wu Lim, m·h·杨“对象跟踪基准,”IEEE模式分析与机器智能信息作者,37卷,不。6、2015。视图:出版商的网站|谷歌学术搜索
  49. 崔Yun, j . y .柳,k . Yun j.y.崔和“Action-decision网络视觉跟踪与强化学习,”会议的程序在计算机视觉和模式识别火奴鲁鲁,嗨,美国,2017年6月。视图:谷歌学术搜索
  50. y的歌,c . Ma l .龚j . Zhang r·刘,M.-H。杨“卷积剩余视觉跟踪学习,”《计算机视觉国际会议,威尼斯,意大利,2017年11月。视图:谷歌学术搜索
  51. b . Babenko M.-H。杨,s . Belongie“健壮的对象与在线跟踪多个实例学习”,心肌梗死的主要血管成形术,33卷,不。7,1619 - 1632年,2011页。视图:出版商的网站|谷歌学术搜索

版权©2021叫海波彭日成et al。这是一个开放的分布式下文章知识共享归属许可,它允许无限制的使用、分配和复制在任何媒介,提供最初的工作是正确引用。

相关文章

对本文没有相关内容可用。
PDF 下载引用 引用
下载其他格式更多的
订单打印副本订单
的观点372年
下载396年
引用

相关文章

对本文没有相关内容可用。

文章奖:2020年杰出的研究贡献,选择由我们的首席编辑。获奖的文章阅读