多媒体的发展

PDF
多媒体的发展/2018年/文章
! 一个应改正的错误这篇文章已经发表。查看这篇文章的细节,请点击上面的“勘误表”标签。
特殊的问题

最近机器学习进步在图像分析和理解

把这个特殊的问题

研究文章|开放获取

体积 2018年 |文章的ID 3202495 | https://doi.org/10.1155/2018/3202495

Muhamamd Adnan Syed Zhenjun汉,建斌Zhaoju Li娇, 骗子有弹性的多通道Reidentification度量学习的人”,多媒体的发展, 卷。2018年, 文章的ID3202495, 11 页面, 2018年 https://doi.org/10.1155/2018/3202495

骗子有弹性的多通道Reidentification度量学习的人

学术编辑器:位于拉詹
收到了 2018年1月15日
接受 2018年3月22日
发表 2018年5月03

文摘

亲自reidentification距离度量学习从骗子人遭受巨大的挑战。大多数情况下,距离度量学习积极对之间的相似性最大化对骗子情态动词在不同的变换。此外,这些骗子了画廊视图查询只样本,而画廊样品是完全忽略。在现实世界中,一个给定的查询和画廊体验不同姿势的变化,观点,和照明。因此,只有从骗子画廊视图可以不是最优最大化他们的相似之处。因此,为了解决这些问题,我们提出了一个骗子弹性复合指标(IRM3)。IRM3学到每个模态变换在图像空间和使用冒名顶替者探针画廊视图来有效地限制大量的骗子。学到IRM3然后评估在三个基准数据集,蝰蛇CUHK01, CUHK03,显示了许多以前的方法相比,性能显著改善。

1。介绍

人reidentification (Re-ID)匹配一个给定的人在一个大的不重叠的网络摄像机(1,从根本上是用于跟踪摄像机网络的人。尽管reidentification多年的研究,仍然是一个具有挑战性的问题的数据空间Re-ID是多通道(在我们的工作模态的定义是联合形成的空间组合不同的给定变化对同一个人进行的图像在不同的相机视图)和观察到的图像在不同的视图进行各种不同姿势的变化(2,观点3)、照明(4),背景杂乱,也体验闭塞。

大多数Re-ID方法主要可以分为两类:健壮的特征提取(5- - - - - -13)表示,全球学习距离度量匹配(14,15]。这些全球指标(16- - - - - -19)项目特点为低维子空间,他们倾向于最大化不同人之间的歧视;然而,这些指标仍然遭受巨大的挑战从骗子(一个骗子是一个人,属于另一个人,然而,具有更高的相似性与给定查询正确的画廊样本)样品(20.,21]。然而,在过去的一些努力消除骗子14,20.- - - - - -22),然而,所有这些努力都没有考虑不同的变换reidentification图像谎言的情态动词(23]。这种情况如图1情态动词,我们展示了三个变换 , , 在图像空间。 包含一对积极(查询和画廊)封闭在绿色矩形的度量是后天习得的,虽然有两个对躺在情态动词 ,分别。视图b图像(用红色矩形) 类似于查询 ,因此,骗子的查询示例。在传统的方法(14,20.- - - - - -22),查询和画廊样本之间的度量 学会了使用视点替用特效的样本吗 (度量 )或 (度量 )作为一个约束。因此,当正对的相似度是学到的约束下一个骗子的人躺在一个不同的变换模态除了积极的一对,然后学不会最优匹配的相似性度量函数,从贫穷的检索结果,可以证明Ranklist 1Ranklist 2在图1

此外,在图1以前的方法(14,20.- - - - - -22)使用视点替用特效样品仅供查询样品的画廊视图画廊,而完全忽略了样本。因此,为了解决上述不足之处(14,20.- - - - - -22),我们提出了一个骗子弹性复合度规,称为IRM3,基本上消除了骗子和积极对之间达到一个最佳的匹配。IRM3的目标是最大化匹配的一对积极对消极画廊样本(上天)(样品不骗子和属于不同的人),以及考虑到模态对骗子的一个给定的一对,其负面画廊样本,和骗子驻留。此外,在对比14,20.- - - - - -22),它还考虑骗子样本查询和各自的画廊样本。这条被称为冒名者交叉的观点骗子(CVI)获得了查询和画廊样品从他们相反的看法,有助于进一步最大化给定查询和画廊样本之间的相似性。骗子的贡献弹性复合度量IMR3如下:(我)改善骗子阻力共同利用变换情态动词(23),以及骗子样本探针画廊视图;(2)与我们IMR3方法显著提高性能获得在当地Multikernel Fisher判别分析(MK-LFDA) [44]。

2。方法

2显示我们IRM3的框架。在图2,首先颜色和纹理特征提取每个训练样本;然后,在图像空间中发现不同的情态动词。这些情态动词发现用平方和集群解释的部分2.2。最后,为每个模态交叉观点骗子(CVI)(解释部分2.3)和消极的画廊样本(上天)(部分中解释2.4)生成的训练模态指标 为每个变换模态 在我们的工作中,模态指标 是学会了使用MK-LFDA [44,学习过程中解释部分2.6。最后,在节2.7我们已经解释如何执行测试之间的匹配查询和画廊。

2.1。特征提取

RGB, HSV,实验室、YCbCr SCNCD直方图提取根据类似的设置45使用32箱/通道,设置在12),分别。然后,所有五个功能连接在一起。同样,DenseSIFT SILTP,猪是根据提取的设置在46]、[11),(47),分别连接在一起。维串联后的颜色和纹理特征变得很大,由于Re-ID多视图数据我们使用CCA (48)降低维度。然而,保持本地歧视信息的每个类型的特性应用CCA单独颜色和纹理特征。通过交叉验证毒蛇和CUHK03我们获得最佳尺寸颜色特性是900,700年和纹理特征。最后,减少了颜色和纹理特性连接形成一个特征向量 1600年的大小。

2.2。图像空间分区

是相机视图的图像空间;然后 在哪里 特征表示 的人 人的数量吗 由于图像在 躺在不同变换情态动词,因此,存在明显的集群不同的情态动词 每一个模态集群有自己独特的转换和视觉模式;因此,所有的人属于模态 可以用平方和集群 在哪里 情态动词的数量吗 , 内的散射矩阵变换情态动词, 是协会的 与变换模态 , 的中心吗 变换模态。

在(2),每个模态中心 至关重要的发现不同的、稳定的和非空的情态动词在吗 因此,选择任何样品 为中心 任何给定的模态 ,是必要的,以确保它是正确的选择。为了确保选择模态中心就必须满足两个条件:第一,(我)如果选择样本 模态是一个中心集群 ,然后,所有的人在模态 将被它的邻国,它有最多数量的最近的邻居。第二,(ii)中心 和所有最近的邻国躺在同样的模态;因此,这些邻居将分享相似的中心 在这两个探针画廊的观点。

现在,我们计算的数量最近的邻居每个人考虑在训练集上面的两个条件。为了这个目的,我们使用两个探测器 和画廊 样品的每个人获得四个邻居列表,这是计算从相机视图。获得最可靠的邻居我们只选择top@40(这里的理由选择top@40邻居是保持最大可靠性与最低的时间和内存成本在大型数据集。例如,当我们有 在CUHK03情态动词,然后,在每个模态将会有至少78人培训。现在,获得一个样本的中心 任何模态必须至少有51%的邻居模态,因此,我们把top@40邻居在实际52%比例的培训人员确定模态 中心或不)(top@20毒蛇)从每个列表邻居,然后执行一个十字路口操作在所有四个列表获取基数值,以及IDs的邻居都是常见的吗探针画廊一个给定的人的观点。这个基数值然后得到邻居的id存储在一个矩阵。此外,重复这个过程的剩余 在训练集,然后他们的基数值,以及IDs的邻居,也存储在相同的矩阵。

我们现在将获得使用这个矩阵 最初的中心 模态转换。这些 选为中心 最高的人的邻居。然而,它可能是可能的,两个或两个以上的人可以有相同的基数值,以及最近的邻居共享相同的id。在这种情况下简单的选择 人不会是最好的解决方案;相反,我们只选择那些 人没有任何个人id在他们的邻居列表。此外,对于超过两个人的情况下有相同的基数和共享相同的邻居id,我们随机选择了任何一个人从他们代表模态中心。最后,让 模态中心图像的最优分割空间 通过最小化在转换情态动词散射矩阵的痕迹 尽管图像空间划分 然而,情态动词,以确保获得情态动词是不同的和稳定的(在我们的工作稳定模态时形成它包含至少15%培训人)我们更新了模态中心和进一步重新分区的空间 次了。模态中心更新 在哪里 模态的人数 然后作为 计算初始模态中心计算繁琐的工作,但是,它仍然温和的计算负担。培训的规模 人的复杂性 ,在那里 的迭代次数, 情态动词的数量。

2.3。交叉观点骗子(CVI)

在图像空间中得到不同的情态动词之后 ,我们现在可以获得每个积极对CVI的集合( )躺在模态 从它的探针画廊的观点。我们相信现实世界情况(开集),一双积极总是有限或几个样品;可以利用这些CVI实现微妙和微分信息度量学习能够区分一个给定的一对更有效地对大量的多样的真实世界的骗子,以及消极的画廊样本。这些骗子都是通过比较获得的相似值给定的人对另一个人画廊探针的观点。首先,调查样本的相似度值 和整个计算吗画廊视图使用规 和CCA减少功能 作为 在哪里 CCA减少功能 的人 , 是一个全球学指标与特性 使用K-LFDA [45]。我们使用线性内核为了节省内存和计算时间。同样,画廊的相似度值 得到整个探针认为 这些获得的值 对人 在模态 然后存储到两套吗 在哪里 模态是指人的数量 现在,我们比较每个相似度值与参考这些集合相似度值 给定的一对 获得它的CVI集 作为 的指数是骗子的人, 是计算 此外,使用(6)- (10),CVI集 对所有的 在模态 计算。计算成本,产生跨模态视图骗子 是关于 ,在那里

2.4。负画廊样本(门店)

我们也使用消极的画廊样本(上天)学习指标 的门店,表示 ,人对 从画廊认为只有获得吗 在哪里 进一步的指数是上天,上天的设置吗 对所有 在模态 然后获得使用(11)。

2.5。三重态的形成

CVI的集合 和门店 对所有 在模态 现在我们将生成三联体样本学习指标 因为每个人的积极的样本 太稀缺而负样本的数量,因此,增加数据的协议后(49我们增加每个人对五次。同样,在[协议后39我们为每一对积极生成20个三胞胎。现在,三个一组样本 对人 使用视点替用特效 和消极的画廊 给出了作为 在哪里 从各自的设置 的人

2.6。骗子弹性复合指标(IRM3)

把三胞胎从 ,度量IRM3为模态 是学会了使用MK-LFDA [44];然而,节省计算时间和内存需求我们调整44),并使用三个RBF内核和一个 内核。这些内核的重量为每个数据集全球学习这一次在工作中使用类似的方法在44]。学习全球重量的原因是为了节省时间和计算负担。此外,内核上有大大小小的影响权重;全球甚至权重都学会了。这是由于这样的事实,所有现有的全球空间由情态动词,因此,所有的情态动词在学习全球贡献权重。学习内核提取的所有特性的权重是单独使用,和这些特性的尺寸也分别降低到450年由CCA之前学习权重。在所有的实验中获得的权重毒蛇 , , RBF内核,而重量 内核是 CUHK01和CUHK03 RBF内核的获得权重 , , ,虽然体重 内核是 值在所有三个RBF内核的数据集设置为模态的平均值 ,以及(平均值+ )和(意思是 )。这些值 选择模型中的所有不同模态 , 内核也将模态的平均值 均值在我们的工作是调查和画廊样本之间的相似度值中心 最后,规 学到的是 在矩阵 给出了用相似的方法(44]。现在,(13)然后解决了使用广义特征值问题50)(14)获得第一 = 300最大特征值所对应特征向量的大小

2.7。Reidentification

从图2之间,reidentification测试 首先确定执行变换模态试验对属于使用吗K神经网络分类器。在K神经网络分类器的参数K将图像空间中情态动词的数量;也就是说,在毒蛇的价值K设置为情态动词的数量 。然后,的特点 预计到各自的加权multikernel空间模态,紧随其后的是各自的模态指标 进行匹配,

3所示。实验

我们IRM3评估指标在三个基准数据集:毒蛇,CUHK01, CUHK03。我们遵循评价协议(33测试/火车分裂的毒蛇,CUHK01, CUHK03数据集。然而,在我们的工作我们已经测试了CUHK01 两只,而CUHK03测试贴上标签检测到设置。所有的实验都在进行单发模式,所有的报道累积获得的匹配曲线(CMC)平均20多个试验的结果。

3.1。试验协议

彻底分析的性能IRM3我们设计了三个评价策略。这些策略评估IRM3性能与不同数量的发现了情态动词 ,画廊视图骗子(GVI) (GVI仅从画廊视图是骗子,得到以类似的方式在以往传统指标(14,20.- - - - - -22),以及交叉的观点骗子(CVI)。(我)IRM3只:这是基本的多通道指标,只有学习消极的画廊样品(门店)。(2)IRM3 + GVI ( ):IRM3与冒名顶替者学习画廊视图(GVI),以及门店 是指骗子来自的数量画廊观点,形成三重态样品和有价值 、10和15个,其余三胞胎形成使用门店(3)IRM3 + CVI ( ):IRM3与CVI学,以及门店 是指使用的CVI样本数量形成三胞胎和有价值 、10和15个,其余三胞胎形成使用门店

所有的门店,样本GVI, CVI包含了一个人的最困难的情况下,随机抽样离线的,之前训练指标。在所有上述三种策略中,我们有图像空间分区 5和7的毒蛇,CUHK01我们使用 7和10个分区和CUHK03 、14和16个分区,分别。

3.2。结果毒蛇

与先进的功能。IRM3度量的结果与最先进的三个特点是LOMO [11),高格(25),而 (24)表1。所有的结果在表1获得了 情态动词,我们IRM3 + CVI ( = 15)rank@1获得了52.81 ,超过所有reidentification的三个特性,提供证据,如果度量可以解决多通道变换变化以及有很强的抵抗骗子可以提高匹配精度。我们学会了IRM3 + CVI ( = 15)同时考虑优化所有等级的订单,因此,拥有大量改进rank@5 rank@10。


单发,P=316年
方法 = 1 = 5 = 10

F LOMO [11] 40.0 - - - - - - 80.51
(24] 48.0 76.8 85.4
高格(25] 49.7 79.7 88.7

DF SIR-CIR [26] 35.76 68.38 82.9

静息状态 GS-CNN [27] 37.8 66.9 77.4
DGD [28] 38.6 - - - - - - - - - - - -
LSTM [29日] 42.4 68.7 79.4
MuDeep [30.] 43.03 74.36 85.76
E2E-CAN [31日] 47.2 79.2 89.2
DLPA [32] 48.7 74.7 85.1
Quadruplet-net [33] 49.05 73.10 81.96
JLML [34] 50.2 74.2 84.3

ITL [35] 15.2 34.2 45.9
LAFT [23] 29.6 - - - - - - 69.3
WARCA [36] 37.47 70.78 - - - - - -
听(21] 39.62 69.97 82.9
l - 1图(37] 41.5 - - - - - - - - - - - -
SS-SVM [16] 42.66 70.1 84.27
SCSP [38] 53.54 82.59 91.49
IRM3只 45.92 82.90 91.63
IRM3+GVI( =15) 50.39 85.79 95.73
IRM3+CVI( =15) 52.81 87.95 97.29

与度量学习。我们也将度量IRM3与7个指标。从表1IRM3 + CVI ( = 15)表现优于多通道度量LAFT [23和骗子电阻规听21]。主要区别IRM3和[21,23)是解决两人模态变换的能力,以及能力的进一步最大化匹配对的共同约束交叉观点骗子。所有这些都是巨大的挑战在匹配的行人的原因。在表1只有SS-SVM [16)是一个指标,试图模型转换模态为每个单独的人;然而,它从不注意获得抵抗骗子,因此19.21 rank@1精度低于IRM3 + CVI ( = 15)。尽管IRM3有成功的结果,仍然1.36 rank@1低于SCSP [38]。显然,毒蛇有大量构成、失调和身体部位位移的问题在我们的工作特别不解决,因此,必然是需要改进匹配和主要结果。

比较深的方法。不过,深的特性(DF)和深度(静)没有匹配匹配网络与传统度量学习方法,然而,从结果表1显然很明显如果reidentification的两个主要问题(即。,multimodal transforms, and strong rejection capability against impostors) can be well handled simultaneously, then comparable or even higher performance than deep methods can be attained. Our IRM3 + CVI ( = 15)7.1 4.94 rank@1高于Quadruplet-Net [33]和JLML [34),分别。这些结果表明,对于小数据集像毒蛇深度匹配网络学习有识别力的网络训练样本不足。

最后,图3显示了两个查询的检索结果的比较从毒蛇数据集XQDA [11)和IRM3 + CVI ( )当 使用情态动词。检索的结果查询1对于XQDA找到正确的匹配排名=4封闭在绿色矩形(b),而IMR3找到匹配排名=2在绿色矩形封闭(e)。同样,查询2我们IMR3找到匹配排名=1用绿色矩形(j);相比之下,XQDA找到正确的匹配排名=3用绿色矩形(h)。因此,我们IRM3方法提高了匹配,从而获得更高的排名。

3.3。结果CUHK01

与先进的功能。表2总结了IRM3的结果 = 10情态动词和比较结果与四个(11),高格(25),而 (24]。尽管有识别力的三个特性,然而,我们IRM3方法比这三个特性解决Re-ID的两大挑战,也就是说,多通道行人匹配和骗子阻力。比毒蛇CUHK01以来大训练集,因此,模态变换可以学习,因此,IRM3 + CVI ( = 15)获更大的歧视 (24]。我们IRM3 + CVI ( = 15)15.15 rank@1精度高于 由于固有的美德处理不同的情态动词,人特定的变化,同时和拒绝大量的骗子。


单发, =486年
方法 = 5 = 10

F LOMO [11] 49.2 75.7 84.2
(24] 64.6 84.9 90.6
高格(25] 57.8 79.1 86.2

静息状态 MCP-CNN [39] 53.7 84.3 91.0
DGD [28] 66.6 - - - - - - - - - - - -
E2E-CAN [31日] 67.2 87.3 92.5
DLPA [32] 75.0 93.5 95.7
Quadruplet-net [33] 62.55 83.44 89.71
JLML [34] 69.8 88.4 93.3

CVAML [40] 57.3 81.2 86.5
WARCA [36] 58.34 79.76 - - - - - -
l - 1图(37] 50.1 - - - - - - - - - - - -
IRM3只 68.24 88.71 94.31
IRM3+GVI( =15) 72.91 94.61 97.6
IRM3+CVI( =15) 76.14 96.90 98.35

与度量学习。在表2三个最近提出了度量CVAML [40],WARCA [36),和l - 1图37与我们的IRM3方法)进行比较。所有的三个指标假设单峰intercamera变换,而不是多通道图像空间。尽管WARCA [36)采用硬负样本学习约束,然而,忽略其他的负样本画廊视图学习期间,不考虑一个人模态是受苦受难,达到更高的精度。另一方面,IRM3 + CVI ( )有能力解决所有这些挑战,因此,已达到76.14 rank@1准确性。

比较深的方法。在表2,我们可以看到一些深度匹配网络(静)比传统指标在CUHK01表现多好。只有K-LFDA当训练 (24)比静特性达到类似的性能。然而,积极解决挑战reidentification(即在现实世界。多通道图像空间,多样化的骗子)IRM3 + CVI ( )比MCP-CNN更好的结果(39],E2E-CAN [31日],Quadruplet-Net [33],JLML [34),而我们IRM3 + CVI ( = 15)1.49 rank@1高于DLPA [32]。DLPA提取深度语义调整身体部位的功能,以及整流构成变化。我们相信如果支撑身体部位调整和矫正姿势的变化都包含在我们的IRM3那么结果可以进一步改善。

3.4。结果CUHK03

与先进的功能。表3比较四个(11和高格25]与我们IRM3度量在两个特性贴上标签检测到设置。所有的结果在表3获得了 = 16个情态动词。在表3,结果远高于这两个特性。获得性能的主要原因IRM3对特性(11,25)主要是由于不同的方法。在[11,25)表示一个普遍特征提出了所有不同的人,可能不适合所有的人在同一时间驻留在不同的情态动词;相比之下,我们的动机是基于图像空间中发现不同的情态动词,然后明确地解决每一个模态与赋权的大量的骗子被拒绝。因此,我们IRM3 + CVI ( 在标签设置)= 15)(rank@1的准确性86.17


贴上标签, =One hundred.
方法 = 1 = 5 = 10

F LOMO [11] 52.2 82.23 92.14
高格(25] 67.3 91.0 96.0

DF DCAF [41] 74.21 94.33 97.54

DFM DGD [28] 75.3 - - - - - - - - - - - -
Quadruplet-net [33] 75.53 95.15 99.16
MuDeep [30.] 76.87 96.12 98.41
E2E-CAN [31日] 77.6 95.2 99.3
JLML [34] 83.2 98.0 99.4
DLPA [32] 85.4 97.6 99.4

SS-SVM [16] 57.0 85.7 94.3
零Sp。42] 62.55 90.05 94.80
舰导弹(43] 76.6 94.6 98.0
WARCA [36] 78.38 94.55 - - - - - -
IRM3只 78.83 95.97 98.37
IRM3+GVI( =15) 83.32 98.70 99.54
IRM3+CVI( =15) 86.17 99.02 99.68

检测到, =One hundred.
方法

F LOMO [11] 46.25 78.9 88.55
高格(25] 65.5 88.4 93.7

DF SIR-CIR [26] 52.17 83.7 90.4
DCAF [41] 67.99 91.04 95.36

DFM LSTM [29日] 57.3 80.10 88.3
GS-CNN [27] 68.1 88.1 94.6
E2E-CAN [31日] 69.2 88.5 94.1
MuDeep [30.] 75.64 94.36 97.46
JLML [34] 80.6 96.9 98.7
DLPA [32] 81.6 97.3 98.4

l - 1图(37] 39.0 - - - - - - - - - - - -
SS-SVM [16] 51.2 80.8 89.6
零Sp。42] 54.70 84.75 94.80
舰导弹(43] 72.7 92.4 96.1
IRM3只 72.98 91.7 93.02
IRM3+GVI( =15) 78.68 95.60 98.09
IRM3+CVI( =15) 80.77 96.94 98.67

与度量学习。在表3,最近提议WARCA [36和导弹43与我们的IRM3方法)进行比较。WARCA [36]与我们不同IRM3方法,只有地址难负样本,而导弹(43)不同,它没有测量占不同的模态转换,以及没有抵抗假冒。我们IRM3 + CVI ( 标签设置)= 15)(已超过(36]和[43),并获得9.04 11.1 分别在rank@1准确性。

比较深的方法。有趣的是,在表3所有的方法贴上标签检测到CUHK03上设置有很高的性能。这些高结果表明这一事实CUHK03是最大的数据集在所有,因此,能帮助学习,更有识别力的静。尽管两个JLML [34]和DLPA [32]学习深身体特征与全球和当地的身体部分对齐,以及构成对齐,然而,我们IMR3方法受益与变换特定指标与骗子拒绝授权仍然保持达到更好的结果。我们IRM3同时考虑优化所有等级的订单,因此,在rank@5和rank@10大增益贴上标签设置。

3.5。分析

在表4,我们分析情态动词的数量的影响 毒蛇的测试。最初,我们有图像空间分区 = 5,然后测试它不使用任何骗子样本( = 5, = 0)获得rank@1约45.27%的结果。随着越来越多的情态动词在图像空间中发现,如 ,那么结果得到进一步提高,即使没有使用任何骗子样本( , = 0),rank@1变成了45.92%。这种增量背后的主要原因是现在我们可以匹配更多的测试样本正确利用其实际模态变换时,情态动词中发现


方法 = 1 = 5 = 10

, 45.27 82.16 91.1
, 45.92 82.90 91.63
,GVI 48.88 85.33 95.37
,GVI 50.39 85.79 95.73
,CVI 52.10 87.14 96.87
,CVI 52.81 87.95 97.29

此外,我们还可以看到一个积极的结果当骗子从增量画廊视图还在学习指标。两个( = 5,GVI ( = 15))和( = 7,GVI ( = 15))获得更多的区分能力高于14,20.- - - - - -22),现在,他们可以通过照顾到变换限制骗子情态动词一双积极和骗子经历。

有趣的是,在我们的工作这个骗子电阻可以进一步加强。这是通过使用交叉观点骗子(CVI)。从表4,很明显,即使对于相同数量的情态动词 ,当使用(CVI)的分化能力( = 7,CVI ( 比(= 15))得到进一步加强 = 7,GVI ( = 15))和rank@1变成了52.81%。这个增量rank@1 CVI有能力提供了强有力的证据,以最大限度地提高积极对的相似度超过GVI照顾到变换模态,以及各种不同的变化一个给定的查询和画廊样本进行不同的观点。

最后,在图4我们提供了一个性能比较时rank@1模态中心随机选择,以及何时使用我们的方法获得的中心部分2.2。随机中心获得rank@1准确性很差,因为这些随机中心得到你只需通过选择——顶部 人没有照顾到他们的可靠性、稳定性和id。

3.6。效率

我们的运行时计算IRM3方法使用MK-LFDA [44],XQDA [11],K-LFDA [45)( CUHK03内核)。有1260个训练人员和100测试的身份。所有的算法在MATLAB中实现和服务器机器上运行6个CPU (Xeon (r) e5 - 2620)每个CPU都有6芯和总256 GB的内存大小。在表5、培训时间MK-LFDA [44)比XQDA快(11),但低于K-LFDA [45]。然而,在测试当内核的重量不知道MK-LFDA44比XQDA和K-LFDA更快。这些计时结果支持我们的方法也适用于实时应用程序和在公共场所。


方法 MK-LFDA [44] XQDA [11] K-LFDA [45]

培训 171.26 174.7 160.03
测试 28.8 30.23 32.45

4所示。结论

本文提出一种度量学习方法,利用多通道转换和交叉观点骗子改善的能力度量不同人之间的区分,以及增强抑制能力下降大量现实世界多样化的骗子。在现实世界中大多数行人图像是多通道,在公共场所几个人分享相似的衣服;因此,我们IRM3 reidentification学会解决这些问题,在公共场所人跟踪。广泛的实验三个挑战性的数据集(毒蛇,CUHK01 CUHK03)证明的有效性我们IRM3指标已超过此前的许多先进的指标。此外,我们打算进一步扩展我们的方法用于测试在真实世界场景中,打算解决其他问题的实时实现。

的利益冲突

作者宣称没有利益冲突。

引用

  1. W.-S。郑、美国锣和t,“关联群体,”学报2009年20日英国机器视觉会议,BMVC 20092009年9月,英国。视图:出版商的网站|谷歌学术搜索
  2. r·赵w . Oyang x王,“人鉴定特点学习”,IEEE模式分析与机器智能,39卷,不。2、356 - 370年,2017页。视图:出版商的网站|谷歌学术搜索
  3. s . Bąk s Zaidenberg b·布雷和f . Bremond,“提高鉴定人员的观点线索,”学报》第11届IEEE国际会议在IEEE视频监控,AVSS 2014180年,页175 -韩国,2014年8月。视图:出版商的网站|谷歌学术搜索
  4. j·r·罗摩Varior g . Wang, t·刘,“学习人reidentification不变的颜色特征,”IEEE图像处理,25卷,不。7,3395 - 3410年,2016页。视图:出版商的网站|谷歌学术搜索|MathSciNet
  5. 学术界。郭、美国哈米斯和诉Shet”,人使用语义颜色名称和RankBoost鉴定,”学报2013年IEEE计算机视觉的应用研讨会,WACV 20132013年1月,页281 - 287。视图:出版商的网站|谷歌学术搜索
  6. y,廖,z, d .咦,李和s . z”探索结构信息和人鉴定,融合多个特性”学报2013年IEEE计算机视觉与模式识别会议研讨会、CVPRW 20132013年6月,页794 - 799。视图:出版商的网站|谷歌学术搜索
  7. m . Farenzena l .巴扎尼a . Perina诉Murino和m . Cristani”人鉴定由当地symmetry-driven积累特性,”《IEEE计算机视觉与模式识别会议(CVPR 10)IEEE,页2360 - 2367年,旧金山,美国,2010年6月。视图:出版商的网站|谷歌学术搜索
  8. 下榻的饭店,a Perina诉Murino,“人再次鉴定和特性有区别地选择部分,”课堂讲稿在计算机科学(包括子系列讲义在人工智能和课堂讲稿在生物信息学):前言卷,8927年,第161 - 147页,2015年。视图:出版商的网站|谷歌学术搜索
  9. 美国哈米斯,学术界。郭,诉k·辛格,v . d . Shet l·s·戴维斯,“联合学习attribute-consistent人鉴定,”课堂讲稿在计算机科学(包括子系列讲义在人工智能和课堂讲稿在生物信息学):前言卷,8927年,第146 - 134页,2015年。视图:出版商的网站|谷歌学术搜索
  10. j·罗斯和刘x”,探索联合属性学习的人鉴定,“课堂讲稿在计算机科学(包括子系列讲义在人工智能和课堂讲稿在生物信息学):前言卷,9003年,第688 - 673页,2015年。视图:出版商的网站|谷歌学术搜索
  11. 朱辽,y, x, z s . Li”人鉴定由当地最大的发生表示和度量学习”《IEEE计算机视觉与模式识别会议,CVPR 20152015年6月,页2197 - 2206。视图:出版商的网站|谷歌学术搜索
  12. y杨,杨j . j .燕辽,d .咦,李和s . z”人鉴定,突出颜色名称”课堂讲稿在计算机科学(包括子系列讲义在人工智能和课堂讲稿在生物信息学):前言,卷8689,不。1,第551 - 536页,2014。视图:出版商的网站|谷歌学术搜索
  13. 吴z z明永,c .田z Lei,和h . Lei“高效的人鉴定混合spatiogram和协方差描述符,”《IEEE计算机视觉与模式识别会议研讨会,CVPRW 20152015年6月,页48-56,。视图:出版商的网站|谷歌学术搜索
  14. k问:温伯格和l . k .扫罗,”距离度量学习大利润最近邻分类,“机器学习研究杂志》上,10卷,第244 - 207页,2009年。视图:谷歌学术搜索
  15. m . Kostinger m . Hirzer p . Wohlhart p·m·罗斯和h .女孩,“大规模指标等价约束,学习”《IEEE计算机视觉与模式识别会议(CVPR 12)IEEE,页2288 - 2295年,普罗维登斯,RI,美国,2012年6月。视图:出版商的网站|谷歌学术搜索
  16. y, b . Li h ., a .老大和阮x,“Sample-specific SVM学习人鉴定,”学报2016年IEEE计算机视觉与模式识别会议,CVPR 20162016年7月,页1278 - 1287。视图:谷歌学术搜索
  17. h·史,y, x朱et al .,“人地嵌入深度指标:一项研究对大变化,“课堂讲稿在计算机科学(包括子系列讲义在人工智能和课堂讲稿在生物信息学):前言卷,9905年,第748 - 732页,2016年。视图:出版商的网站|谷歌学术搜索
  18. 研究。陈,W.-S。郑,黄永发。赖,p . c .袁”非对称距离reidentification cross-view特征映射模型的人,”IEEE电路和系统视频技术,27卷,不。8,1661 - 1675年,2017页。视图:出版商的网站|谷歌学术搜索
  19. z d . Chen元,g .华:郑,j·王,“相似性学习地图上显式多项式内核特性鉴定,”《IEEE计算机视觉与模式识别会议,CVPR 20152015年6月,页1565 - 1573。视图:出版商的网站|谷歌学术搜索
  20. m . Hirzer p·m·罗斯和h .女孩,“人鉴定通过高效impostor-based度量学习,”学报2012年IEEE 9日国际会议在IEEE视频监控,AVSS 2012,页203 - 208,中国,2012年9月。视图:出版商的网站|谷歌学术搜索
  21. 朱x, X.-Y。京,吴f . et al .,“远程学习区别对待不同的负样本,利用骗子与对称的三重约束人鉴定,”学报2016年IEEE国际多媒体会议和博览会,ICME 2016,2016年7月。视图:出版商的网站|谷歌学术搜索
  22. 黄m . Dikmen e . Akbas t . s . n . Ahuja,“行人识别学指标,”课堂讲稿在计算机科学(包括子系列讲义在人工智能和课堂讲稿在生物信息学):前言,卷6495,不。4、501 - 512年,2011页。视图:出版商的网站|谷歌学术搜索
  23. w·李和x王“局部对齐功能转换在视图”学报》第26届IEEE计算机视觉与模式识别会议,CVPR 20132013年6月,页3594 - 3601。视图:出版商的网站|谷歌学术搜索
  24. m .郭台铭、o .营地和m . Sznaier”妈妈:意思是鉴定特征时刻的人,”学报2017年IEEE计算机视觉国际会议上车间(ICCVW),第1303 - 1294页,威尼斯,意大利,2017年10月。视图:出版商的网站|谷歌学术搜索
  25. t . Matsukawa t·冈、大肠铃木和y佐藤,“分层高斯描述符人鉴定,”学报2016年IEEE计算机视觉与模式识别会议,CVPR 20162016年7月,页1363 - 1372。视图:谷歌学术搜索
  26. w . f . Wang左,l .林张d, l·张,“联合学习幅图片和cross-image表示的人鉴定,”学报2016年IEEE计算机视觉与模式识别会议,CVPR 20162016年7月,页1288 - 1296。视图:谷歌学术搜索
  27. r·r·Varior m . Haloi g·王,“封闭的暹罗卷积神经网络架构人类再次鉴定,“课堂讲稿在计算机科学(包括子系列讲义在人工智能和课堂讲稿在生物信息学):前言卷,9912年,第808 - 791页,2016年。视图:出版商的网站|谷歌学术搜索
  28. w·t·肖h . Li欧阳,x,“学习深度特性交涉域引导辍学人鉴定,”学报2016年IEEE计算机视觉与模式识别会议,CVPR 20162016年7月,页1249 - 1258。视图:谷歌学术搜索
  29. r·r·Varior帅,j . Lu d .徐和g·王,“暹罗长短期记忆建筑对人类再次鉴定,“课堂讲稿在计算机科学(包括子系列讲义在人工智能和课堂讲稿在生物信息学):前言卷,9911年,第153 - 135页,2016年。视图:出版商的网站|谷歌学术搜索
  30. 江傅钱x, y, y, t,和x天雪,“人鉴定,多尺度深度学习架构”学报2017年IEEE计算机视觉国际会议(ICCV)威尼斯,页5409 - 5418年,2017年10月。视图:出版商的网站|谷歌学术搜索
  31. j . h . Liu, m .气j .江和严,“端到端比较关注网络人鉴定,”IEEE图像处理,26卷,不。7,3492 - 3506年,2017页。视图:出版商的网站|谷歌学术搜索|MathSciNet
  32. l .赵x, y壮族,j .王”Deeply-Learned Part-Aligned表示人鉴定,”学报2017年IEEE计算机视觉国际会议(ICCV)威尼斯,页3239 - 3248年,2017年10月。视图:出版商的网站|谷歌学术搜索
  33. w·陈,陈x, j·张,k .黄”超越三联体损失:深成套网络人鉴定,”学报2017年IEEE计算机视觉与模式识别会议(CVPR)火奴鲁鲁,页1320 - 1329年,2017年7月,你好。视图:出版商的网站|谷歌学术搜索
  34. w·李,朱x和锣,“人地深Multi-Loss分类共同学习,”学报》26日国际联合会议上人工智能澳大利亚墨尔本,页2194 - 2200,,2017年8月。视图:出版商的网站|谷歌学术搜索
  35. w·廖m . y .杨n .詹和b . Rosenhahn“Triplet-Based深相似性学习人鉴定,”学报2017年IEEE计算机视觉国际会议上车间(ICCVW)威尼斯,页385 - 393年,2017年10月。视图:出版商的网站|谷歌学术搜索
  36. c·何塞·f·小花,“可伸缩的度量学习通过加权近似等级成分分析,“课堂讲稿在计算机科学(包括子系列讲义在人工智能和课堂讲稿在生物信息学):前言卷,9909年,第890 - 875页,2016年。视图:出版商的网站|谷歌学术搜索
  37. 傅e . Kodirov t, z,锣,“人无监督鉴定1图学习”,课堂讲稿在计算机科学(包括子系列讲义在人工智能和课堂讲稿在生物信息学):前言卷,9905年,第195 - 178页,2016年。视图:出版商的网站|谷歌学术搜索
  38. d . Chen z元,b . Chen, n .郑”相似学习具有空间约束人鉴定,”学报2016年IEEE计算机视觉与模式识别会议,CVPR 20162016年7月,页1268 - 1277。视图:谷歌学术搜索
  39. d . Cheng y锣,周,j . Wang和n .郑”人鉴定通过多渠道器件CNN改善三联体损失函数,”学报2016年IEEE计算机视觉与模式识别会议,CVPR 20162016年7月,页1335 - 1344。视图:谷歌学术搜索
  40. a . h . Yu吴,w .郑”Cross-View非对称度量学习无人监督的人鉴定,”学报2017年IEEE计算机视觉国际会议(ICCV)威尼斯,页994 - 1002年,2017年10月。视图:出版商的网站|谷歌学术搜索
  41. 张d·李x, z, k .黄”学习深环境敏感特性对人的身体和潜在的部分鉴定,”学报2017年IEEE计算机视觉与模式识别会议(CVPR)火奴鲁鲁,页7398 - 7407年,2017年7月,你好。视图:出版商的网站|谷歌学术搜索
  42. l .张、t .香和锣,“学习人鉴定的区别的零空间,”学报2016年IEEE计算机视觉与模式识别会议,CVPR 20162016年7月,页1239 - 1248。视图:谷歌学术搜索
  43. 美国巴姨,x呗,问:田,“可伸缩的人鉴定监督光滑流形上,”学报2017年IEEE计算机视觉与模式识别会议(CVPR)火奴鲁鲁,页3356 - 3365年,2017年7月,你好。视图:出版商的网站|谷歌学术搜索
  44. m·a·赛义德·j .娇,“Multi-kernel度量学习人鉴定,”学报》第23届IEEE国际会议上图像处理、ICIP 20162016年9月,页784 - 788。视图:出版商的网站|谷歌学术搜索
  45. 熊,m .郭台铭、o .营地和m . Sznaier“人地使用基于度量学习方法,”课堂讲稿在计算机科学(包括子系列讲义在人工智能和课堂讲稿在生物信息学):前言,卷8695,不。7,硕士论文,2014页。视图:出版商的网站|谷歌学术搜索
  46. r·赵w·欧阳,x,“人鉴定,无监督学习突出”学报》第26届IEEE计算机视觉与模式识别会议(CVPR 13)IEEE,页3586 - 3593年,波特兰,矿石,美国,2013年6月。视图:出版商的网站|谷歌学术搜索
  47. g . Lisanti。马西,a . Del女人”匹配的人在相机视图使用内核典型相关分析,”学报》第八届ACM和IEEE国际会议分布式智能相机,ICDSC 2014,意大利,2014年11月。视图:出版商的网站|谷歌学术搜索
  48. d·r·哈同美国Szedmak, j . Shawe-Taylor”典型相关分析:学习与应用程序方法,概述”神经计算,16卷,不。12日,第2664 - 2639页,2004年。视图:出版商的网站|谷歌学术搜索
  49. r . w . Li赵、t·肖和x王”DeepReID:深层过滤组合神经网络人鉴定,”美国27日IEEE计算机视觉与模式识别会议,CVPR 20142014年6月,页152 - 159。视图:出版商的网站|谷歌学术搜索
  50. y应p·李,“距离度量学习和特征值优化”,机器学习研究杂志》上卷。13日,1-26,2012页。视图:谷歌学术搜索|MathSciNet

版权©2018 Muhamamd Adnan Syed等。这是一个开放的分布式下文章知识共享归属许可,它允许无限制的使用、分配和复制在任何媒介,提供最初的工作是正确引用。


更多相关文章

PDF 下载引用 引用
下载其他格式更多的
订单打印副本订单
的观点746年
下载435年
引用

相关文章