复杂性
复杂性
1099 - 0526
1076 - 2787
Hindawi
10.1155 / 2020/9860562
9860562
研究文章
为圆形Reidentification比损失的人
https://orcid.org/0000 - 0003 - 4688 - 1395
杨
赵
1
2
https://orcid.org/0000 - 0002 - 9835 - 2797
刘
公司
1
2
https://orcid.org/0000 - 0002 - 0968 - 1645
刘
领带
1
2
https://orcid.org/0000 - 0002 - 9755 - 5744
王
李
1
2
https://orcid.org/0000 - 0001 - 6572 - 5289
赵
赛
1
2
汗
爱迪
1
电子与通信工程学院
广州大学
广州
中国
gzhu.edu.cn
2
黄埔研究与广州大学的研究生院
广州
中国
2020年
29日
12
2020年
2020年
27
7
2020年
3
12
2020年
7
12
2020年
29日
12
2020年
2020年
版权©2020赵阳et al。
这是一个开放的文章在知识共享归属许可下发布的,它允许无限制的使用,分布和繁殖在任何媒介,提供最初的工作是正确的引用。
人reidentification (re-id)的目的是识别一个特定的行人从交叉监控摄像头的观点。大多数re-id方法执行检索任务通过比较相似的行人特征提取深度学习模型。因此,学习一种区别的特性对人reidentification至关重要。许多工作监督学习模型与一个或多个损失函数来获得特性的辨别力。Softmax损失是一种广泛应用在re-id丧失功能。然而,传统softmax损失本身侧重于特征可分性和不考虑在类特性的密实度。进一步提高re-id的准确性,许多努力进行收缩在课堂差异以及类间相似性。在本文中,我们提出一个鉴定为圆形比损失的人。具体地说,我们正常学习特性和分类权重向量映射的超球面。然后我们把最大组内距离的比值和阶级之间的最小距离客观损失,因此类间可分性和在类密实度可以优化同时在训练阶段。 Finally, with the joint training of an improved softmax loss and the ratio loss, the deep model could mine discriminative pedestrian information and learn robust features for the re-id task. Comprehensive experiments on three re-id benchmark datasets are carried out to illustrate the effectiveness of the proposed method. Specially, 83.12% mAP on Market-1501, 71.66% mAP on DukeMTMC-reID, and 66.26%/63.24% mAP on CUHK03 labeled/detected are achieved, respectively.
中国国家自然科学基金
61501177
61902084
广州大学
YB201712
广东省教育部门
2018年ktscx174
1。介绍
人reidentification旨在获取关注的人不重叠的相机视图中根据给定的人的形象。Re-id是一个重要的终端应用技术在现代智能监控系统,和它变得逐渐重要领域的公共安全。然而,由于工作环境的限制和摄像头设备,在灯饰捕获的图像通常有巨大差异,遮挡,人的姿势,相机视图,等等。这些差异会带来巨大的差异不同的图像的行人re-id整体性能和降解。
传统re-id方法解决上述问题主要有手动功能表示(
1 ,
2 )和度量学习(
3 ,
4 )方法。神经网络的快速发展和大规模的普及re-id数据集近年来,基于深度学习的方法已被广泛应用于人reidentification并获得显著的性能。此外,基于深度学习的方法可以学习和集成特性度量学习在一个端到端的框架。由于各种优势,深度学习方法reidentification主导的研究趋势的人。
基于深度学习的人reidentification方法通常包含两个基本部分:网络架构和损失函数。网络体系结构通常是由卷积神经网络(cnn)由各种网络连接有机层,例如,卷积层、汇聚层,和完全连接层。设计网络架构可以自动从输入图像中提取行人特性。损失函数是用来监督模型训练与一个预定义的约束目标。根据不同的约束目标,损失函数通常可以分为两类:分类损失(
5 - - - - - -
7 )和度量损失(
8 - - - - - -
10 ]。在训练阶段,分类损失鼓励学习的模型特征标签信息获得的特性有特色的类间可分性。而不是只关注标签信息,指标损失以不同行人图像的特征相似度为约束目标指导模型的训练。通过这种方式,学会了在特征空间的分布特性。
诚然,深模型基于卷积神经网络(cnn)是能够提取高度抽象的行人特性,以及大规模re-id数据集可以解决re-id任务与深度学习的方法。然而,重大变化的大规模数据集灯饰,决议,背景遮挡,和相机视图将一些伟大的困难在模型训练,例如,组内差距很大。此外,深模型指导下softmax等传统分类损失损失是我很难完全区别的行人信息。它将使模型变得容易受到这些不良变化,导致缺乏泛化能力。
因此,它成为re-id任务学习的关键区别的特性是健壮的不良变化。为此,在类相似度和类间差异的学习特性应该尽可能大。一个可行的解决方案是改善或设计损失函数,可以有效地鼓励组内密实度和组内的可分性。
在本文中,我们提出一种新的损失函数命名为圆形比损失提高学特性的区别的能力。出于线性判别分析(LDA),寻找一个新的子空间,有最大的年级之间的距离和最小的样本组内距离通过优化这两个距离的比例,我们采取的比值最大组内距离和最小re-id阶级之间的距离为一个约束目标的任务。在特定的,我们首先规范化学习特性和分类这些向量权重项目超球面。之后,我们之间的距离特性及其相应的分类组内距离和重量之间的距离不同分类权重随着年级之间的距离。最后,最大的同类距离和最小的组内的距离选择制定损失比例为圆形。通过最小化损失比例,类间相似性和在课堂差异可以同时缩小,最后学特性的辨别力会改善。图解的解释建议的比例如图
1 。我们使用点和实线用不同的颜色来表示不同类别的特征及其分类权重,分别。该比率的监督下损失,类内方差将减少类之间的差异将扩大;因此,将歧视学习特性。
图1
为圆形的图解解释比率的损失。为简单起见,特征尺寸设置为2的超球面可以表示成一个圆2 d平面。相对应的功能和分类三个类的权重标有点和实线在三个不同的颜色,分别。
d 和
D 代表最大的同类距离和阶级之间的最小距离,分别。通过最小化的比率
d 和
D 蓝色类的,不仅距离同类合同也蓝色类和绿色类的阶级之间的距离增大。损失比例可以有效地提高特征空间分布的模型,帮助学习区别的特征。
本文的其余部分组织如下:部分
2 介绍了有关我们的方法工作。部分
3 详细描述了我们建议的比率的损失。部分
4 提供全面re-id实验证明我们的方法的有效性。部分
5 进一步讨论了参数的影响比损失和我们的方法和一些类似的作品之间的关系。结论是在一节
6 。
2。相关工作
解决人reidentification问题的方法已经被广泛的研究,传统的机器学习方法(
1 - - - - - -
4 ,
11 ),和大量的深度学习框架(
6 - - - - - -
8 ,
12 - - - - - -
15 近年来已得到越来越多的研究。传统的机器学习方法解决re-id问题主要来自两个方面:手动功能表示和度量学习。手动功能表示方法描述个人形象与特征向量回来详尽的描述符。描述符将生成特定的人通过考虑不同的内在特征信息,如颜色分布(
1 )和纹理描述(
11 ),和一些作品将结合多个特性,如枸杞多糖和猪
2 ]和HSV SILTP [
4 ]。度量学习方法寻求分离行人特性的度量空间。使用最广泛的度量学习方法人reidentification包含KISSME [
3 ],XQDA [
4 ),等等。
受益于神经网络的发展,基于深度学习的re-id方法近年来被广泛研究。他们可以学习和集成特性度量学习在一个端到端的框架,实现卓越re-id性能。这些深方法通常包含两个基本要素:网络架构和损失函数。re-id的网络体系结构通常包括CNN骨干网如ResNet [
16 ]或GoogleNet [
17 )和一些定制的网络层像池层,批量标准化层,和L2归一化层。主干高度抽象特征的提取通常是削减和一些定制的网络层被添加到满足re-id任务的要求。除此之外,各种损失函数是用来监督模型在培训过程中学习。在某些情况下,损失函数对re-id性能有至关重要的影响。在大多数现有的re-id作品,它可分为度量损失(
8 - - - - - -
10 ,
13 ,
15 ,
18 )和分类损失(
5 - - - - - -
7 ,
12 ,
14 ,
19 - - - - - -
21 ]。
度规损失优化模型,考虑不同特征的相似性。帮助学习一个区别的特性的模型,度量损失扩大类间特征的可分性,促进在类特性的密实度。一个直观的指标对比损失(损失
9 ]。给定一副图像,对比优化模型通过减少同类距离和损失扩大的阶级之间的距离大于一个预定义的保证金。例如,Varior et al。
10 ]re-id任务执行中使用对比损失的暹罗CNN。而不是直接介绍两两之间的距离约束图像,三联体损失(
15 )约束相对一双消极的和积极的关系。在每个迭代中,三合损失使距离差别消极和积极的对超过一个。实验证明,三联体re-id任务损失是可行的和有效的。例如,程et al。
18 训练一个多通道器件CNN模型结合三联体re-id损失。何曼思et al。
13 )提出了一种改进的三联体损失通过引入样本矿业,因为他们发现,那些硬三胞胎贡献更有识别力的信息模型中优化。此外,Chen等人。
8 )提出了成套的损失来提高模型的泛化能力。诚然,re-id度量方法获得杰出的性能损失。然而,过多关注的距离信息;因此,固有标签信息是不可避免的没那么担心了。
考虑到不同的图像的特征相似,分类损失损失(ID)指导模型根据标签来区分不同的个人信息。典型的ID损失人reidentification softmax损失包括softmax激活和熵的损失函数。将softmax激活一个提取特征转换成向量的元素可能表明当前样本属于某个类。学习正确的分类,叉是用来测量损失估计概率之间的差异和真相的标签信息。所以通过最小化softmax损失,该模型可以逐步学习正确的分类。郑et al。
7 ]应用分类损失训练一个网络基于ResNet-50 re-id。此外,充分利用标签信息,太阳et al。
6 和王et al。
20. 分别]提出了PCB和内侧膝状核,我的部分信息的行人使用分类损失。为了更好的分类效果,许多改进版本的softmax损失(
5 ,
14 ,
19 ,
21 提出了]。风扇等。
12 )使用一种修改softmax函数,提出了人reidentification SphereReID模型。见证了优秀的性能度量和分类损失损失得到re-id任务,一些文学作品
22 - - - - - -
25 ]提出训练模型结合度量和分类损失和损失也在人reidentification任务达到更好的性能。
本文通过考虑,我们建议的方法是密切相关的损失函数,我们只给一个粗略的介绍的人reidentification方法基于损失函数。值得注意的是,许多其他激励方法提出了解决人reidentification任务,例如,pose-guided方法(
26 [],基于交叉模式方法
27 ],[基于无监督学习的方法
28 ]。我们可以了解更详细的信息(
29日 ]。
3所示。方法
在本节中,我们首先回顾softmax损失是广泛用于re-id深度学习框架,然后介绍其改进我们的方法所使用的版本。之后,我们详细提出损失比例为圆形。最后,我们证明了我们的方法的有效性通过基于MNIST玩具实验数据集。
3.1。规范化Softmax损失
Softmax损失由Softmax激活函数和一个叉损失函数。将softmax激活函数解释分类输出线性层相关类的概率,而熵损失函数量化计算分类概率和地面之间的距离真理标签。的典型配方将softmax损失函数可以表示为
(1)
l
年代
=
−
1
n
∑
我
=
1
n
日志
e
w
y
我
T
f
我
+
b
y
我
∑
j
=
1
C
e
w
j
T
f
我
+
b
j
,
在哪里
f
我
特征提取吗
我 th选择在训练集的minibatch人形象。
w
j
是
j th列最终线性层的权向量,也称为分类重量。
b
j
是一种偏见。
y
我
是地面真理的标签
我 th选择人的形象。
C 和
n 代表训练集的类数和样本数量在每个迭代中,分别。softmax损失下的优化,学习特点是配备可分离的特点。然而,原始的softmax损失主要集中在类间的比较;因此,在课堂学习功能不太注意到的紧密性。
解决缺陷所提到的,各样的改进(
5 ,
14 ,
19 ,
21 )进行softmax损失。一个简单但有效的改进是规范分类权重和特征向量映射到超球面。这样,学特征在特征空间更有角度地分离。Softmax损失与规范化是学习好处特性(
21 ),它可以表示如下:
(2)
l
N
年代
l
=
−
1
n
∑
我
=
1
n
日志
e
w
y
我
f
我
因为
θ
y
我
∑
j
=
1
C
e
w
j
f
我
因为
θ
j
=
−
1
n
∑
我
=
1
n
日志
e
年代
·
因为
θ
y
我
∑
j
=
1
C
e
年代
·
因为
θ
j
,
在哪里
年代 代表一个比例因子。值得注意的是一个利润率术语经常被添加到获得一个更强大的约束组间和组内距离的许多研究工作。在本文中,我们使用改进的softmax损失表达(
2 )分类损失和名称规范化softmax损失(
21 ,
30. 从原始softmax损失函数来区分。
3.2。为圆形比损失
分类权重和特征都是标准化的,大小差异消除,学会了在超球面尖瘦地依赖特性。因此,与他们的余弦相似性特征可以直接测量距离。在任务人reidentification,提取的特征应该有足够的歧视。这意味着类间差异应尽可能大,而在课堂密实度应尽可能的紧。受LDA的启发,我们制定我们的损失函数的比率最大的同类距离和阶级之间的最小距离。特征和分类权重归一化以来,学习特性和分类权重分散在一个圆。因此,我们的名字该损失为圆形比损失,及其数学表达式
(3)
l
比
=
1
C
∑
j
=
1
C
马克斯
y
我
=
j
f
我
,
w
j
最小值
k
≠
j
w
k
,
w
j
+
ε
,
在哪里
ε
是一个缓和的因素。考虑到大多数分类权重不能获得满意的分布在最初的训练阶段,这可能会导致损失比例的干扰,我们介绍
ε
因素帮助模型学习顺利。
我们设计比损失两个主要原因。一是特征向量和分类权重向量之间的距离可以有效地测量超球面。另一个是最大的同类距离会逐渐减少,阶级之间的最小距离将逐步扩大通过最小化损失比例。的监督下损失,比学特性有一个分布在嵌入空间中,这有助于提高re-id精度。
3.3。联合训练
规范化softmax可以学习尖瘦地超球面的分离特性。然而,在类约束将逐渐变得松弛和阶级之间的距离的增加。因此,学习不够有识别力的特性。因此我们提出的联合训练规范化softmax损失和损失比re-id任务保持持续约束力的类间差异,在类紧凑性。因此,最终的损失函数是制定如下:
(4)
l
=
l
N
年代
l
+
λ
l
比
=
−
1
n
∑
我
=
1
n
日志
e
年代
·
因为
θ
y
我
∑
j
=
1
C
e
年代
·
因为
θ
j
+
λ
1
C
∑
j
=
1
C
马克斯
y
我
=
j
f
我
,
w
j
最小值
k
≠
j
w
k
,
w
j
+
ε
,
在哪里
λ
是一个平衡参数调整比率的重量损失。作为标准化softmax损失限制超球面的特性和分类权重,损失比例可以有效地优化类间和在类特征的功能。最终的损失可以很容易地优化SGD或亚当Pytorch框架(
31日 ]。
3.4。一个基于MNIST玩具例子
验证该方法的可行性和有效性,我们做一个玩具实验基于MNIST数据集
32 )设计了8层CNN网络采用相同的实验设置(
30. ]。我们设置功能维度2学特性可以在二维平面上,可视化和2000个训练样本的每个类是用来训练模型。原文的可视化softmax,规范化softmax [
30. )是用来比较的影响我们的方法(规范化softmax比损失)在图
2 。
图2
MNIST实验结果与原softmax,规范化softmax,分别和规范化softmax比损失。直观的演示中,我们使用的一个子集MNIST实验和2000个训练样本的每个类是用来训练模型。通过设置最后的输出尺寸功能层,学特性可以在二维可视化空间,在哪里
x 设在和
y 设在对应两个维度的学习功能。在图中,第一行给出了二维分布的原始特征空间和第二行给相应的归一化特性。最好的颜色。(一)原始softmax。(b)规范化softmax。(c)规范化softmax比率的损失。
从实验结果,我们可以大致的结论如下。(1)原始softmax关注分离的样品不同的类,而不是直接学习区别的特征。所以学习功能能够达到更好的可分性的特征空间但引起大在课堂稀疏。(2)规范化softmax消除径向方向的变化优化模型,同时规范分类权重和特征。尖瘦地分离结果,学特性在一个球体和展览收紧在课堂密实度。(3)规范化softmax的基础上,提出比损失可能会进一步提高辨别力的特性通过约束组内和组内的距离的关系。它可以实现一个更严格的在课堂密实度以及比其他两个更明显的可分性损失函数。这些观测结果验证了我们的方法的有效性,为其应用提供实验支持reidentification任务的人。
4所示。实验
在本节中,我们给出了实验的细节,该比率损失人reidentification re-id实验结果进行了比较,数据集,例如,市场- 1501
33 ],DukeMTMC-reID [
34 ],CUHK03 [
35 与一些先进的作品)。所有涉及到的实验Pytorch框架中进行。
4.1。数据集描述
市场- 1501 是一个大型的人reidentification数据集收集到清华大学。1501年市场- 1501数据集,行人被六个摄像头(5 1280×1080 HD,一个720×576 SD), 1501年和32668年边界盒这些行人检测到可变形模型(DPM)的一部分。市场- 1501是由一个训练集和测试集。训练集包含751身份与12936年培训行人图像。测试组包括750与19732画廊行人图像和3368查询身份行人图像。
DukeMTMC-reID 是多目标跟踪摄像机实现数据集的一个子集
36 ]在杜克大学校园户外收集使用8相机同步。通过选择和裁剪人行区域的视频跟踪数据集,DukeMTMC-reID 1404年有36411个行人图像身份。的组织格式DukeMTMC-reID市场- 1501是一样的。具体地说,702年与16522年行人构成训练集训练图像,和其余702行人构成了测试集2228查询图像和17661画廊图片。
CUHK03 re-id数据集收集5双摄像头1467年中大校园,包含14096个行人图像身份。数据集提供了一个版本的行人检测算法检测和行人的手动贴上标签版本。值得注意的是,原始的数据集是为单发的情况而设计的。因此,钟等。
37 )重组CUHK03数据集根据市场- 1501的格式。767年新的培训/测试协议,行人用于培训和其余700行人构成测试集。在我们的实验中,我们使用新的培训/测试协议CUHK03全面评估我们的方法。
4.2。实现细节
4.2.1。准备预处理
首先,所有输入训练图像大小为288×144之前随机裁剪256×128。然后,每个输入图像水平翻转概率为0.5。这个操作有利于模型的泛化能力。此外,我们使用随机清除技巧(
38 )每个输入图像的概率为0.5。这意味着一个小随机矩形区域的行人图像可能会抹去零值的训练过程。这个操作可以提高模型的鲁棒性,使一个小区域的输入图像无形的网络。
4.2.2。网络体系结构
我们构建的网络体系结构基于ResNet-50参数已经pretrained ImageNet数据集(
30. ]。我们移除最后一个完全连接层原始ResNet-50,和其余是骨干,可以自动从输入图像中提取行人特性。此外,我们改变的最后一步ResNet-50从2比1保留更细粒度的行人信息与小额外的计算成本。
使模型更适合re-id任务和促进我们的优化提出损失,我们添加几个骨干网络层。具体地说,我们使用一个全球平均池(GAP)层通过平均总卷积地图操作。然后一批标准化(BN)层是附加到差距缩小内部协变量的转变。随后,一个完全连接(FC)层之后,另一个BN层是用于压缩特征维数到1024年。之后,学习特性和分类权重都是规范化的L2归一化层。最后,另一个完全连接一层一层用作分类的规范化softmax损失和提出比率可以计算损失。训练阶段后,这个俱乐部层将被删除和其余的网络成为评估阶段中使用的特征提取器。整个网络体系结构用于我们re-id实验如图
3 。我们命名规范化softmax损失作为为了简洁起见ID的损失。
图3
人reidentification实验的网络体系结构组成的骨干,全球平均池层,批量标准化层,完全连接层,和L2归一化层。在训练过程中,训练图像是有组织的
P
∗
K 格式的
P 和
K 表示身份和样本数量的数量为每个身份,分别。然后模型学习行人特性ID的监督下损失和损失比例。在测试阶段,最后完全连接层和其余的网络特征提取器中删除。测试图像的特征提取器来获取行人特性,和re-id任务是由比较提取特征之间的相似性。
4.2.3。实验设置
所有实验实现NVIDIA GTX 1080 Ti GPU Pytorch框架。我们使用一个平衡抽样策略
12 在培训过程中。这种策略修正的行人数量
P 和图像数量
K 在每个取样的每个行人。通过比较随机抽样策略,平衡抽样策略可以提高re-id性能以及加快培训过程。在我们的实验中,我们设置
P 和
K 16和4分别,所以minibatch在每个迭代的大小是64。
我们选择亚当优化升级网络的参数。此外,热身的策略是采用初始化学习速度训练的开始。在具体的学习速率的值将从10线性增加−5 到10−3 在第一次20时代。在热身阶段后,学习速率保持不变,直到90年th 时代。然后我们衰变的学习速率0.1 90th 和130年th 分别来调整参数。实验结果证明了热身的策略可以帮助网络实现更好的初始状态re-id问题[
12 ]。培训时期的总数是150,学习速率曲线绘制在图
4 。此外,我们也使用一个在线硬例子矿业(OHEM)计划在计划的方法。在特定的,我们对训练样本在降序排序的值归一化softmax损失在每一次迭代,最后20%的样本将被丢弃。OHEM方案可以有效地缓解压倒性容易造成的模型过度拟合样本。因此,健壮和可以增强学习模型的泛化能力。我们设置了参数
λ
和
ε
率损失1和0.5,分别在我们的实验。比例系数
年代 在规范化softmax设置为14。
图4
学习速率曲线与热身策略。在前20世纪期间,学习速率线性增加从一个小值为10−5 到10−3 ,它在后者70时代保持不变。学习速率是90年0.1腐烂th 和130年th 分别调整网络参数。
4.2.4。评价指标
在评估阶段,我们删除最后FC层从培训网络获得的特征提取器人reidentification任务。测试图像的大小为288×144之前美联储特征提取器。在特定的,我们提取原始输入图像的特征及其水平翻转版本,分别。最后嵌入平均获得的这两个特性。行人图像之间的相似性可以很容易地通过余弦距离测量功能的超球面。
我们使用两个评价指标包括累积特征匹配(CMC)和平均平均精度(mAP)来评估我们的方法的性能。re-id任务CMC作为排名问题评价指标和地图检索问题评价指标。我们报告的累积特征匹配在我们的结果1级。单查询/多孔模式是用于所有实验。
4.3。实验结果
实验结果给出了下面的表。公平地说,我们只做个比较和基于深度学习一些先进的方法,例如,Deep-Person [
39 ]和PCB [
6 ]。此外,模型训练的规范化softmax损失没有OHEM被视为基准的方法。
实验结果对市场- 1501和DukeMTMC-reID列出,分别在表
1 。我们可以发现地图上增加市场——分别为1501人和DukeMTMC-reID时比损失或OHEM方案应用于基准模型。基础上,我们提出的方法最终带来+ 1.47%和+ 0.56%增量比基线的方法分别在两个数据集的映射。除此之外,我们的方法优于地图和1级最先进的方法相比,比如GSRW和PCB。
表1
实验结果和比较了一些先进的适合市场- 1501和DukeMTMC-reID数据集映射和1级。
方法
市场- 1501
DukeMTMC-reID
地图
1级
地图
1级
IDE (
7 ]
46.00
72.54
- - - - - -
- - - - - -
SVDNet [
40 ]
62.1
82.3
56.8
76.7
AACN [
41 ]
66.87
85.90
59.25
76.84
TriNet [
13 ]
69.14
84.92
- - - - - -
- - - - - -
DPFL [
42 ]
72.6
88.6
60.6
79.2
高兴(
43 ]
73.9
89.9
- - - - - -
- - - - - -
HA-CNN [
44 ]
75.7
91.2
63.8
80.5
DuATM [
45 ]
76.62
91.42
64.58
81.82
Deep-person [
39 ]
79.58
92.31
64.80
80.90
PCB (
6 ]
77.4
92.3
66.1
81.8
PCB +齿槽(
6 ]
81.6
93.8
69.2
83.3 -
GSRW [
46 ]
82.5
92.7
66.4
80.7
基线
81.65
92.31
71.10
83.44
基线+比损失
82.14
92.43
71.25
84.16
基线+ OHEM
82.44
92.73
71.61
84.16
基线+比损失+ OHEM(我们的)
83.12
92.64
71.66
84.34
大胆的值显示在每个度量所有方法的效果最好。他们有益于我们提出的方法和其他方法之间的比较。
CUHK03数据集上实验结果根据新的培训/测试协议表中列出
2 。我们观察到该比率损失和OHEM方案可以大大提高模型的性能。最后,与基线的方法相比,我们的方法将+ 6.38%改进地图在地图上标记版本和+ 4.22%检测到版本。此外,我们发现我们的方法的性能超过上市最先进的作品。
表2
实验结果和比较了一些先进的适合CUHK03标记版本和检测版本地图和1级。
方法
标签
检测到
地图
1级
地图
1级
IDE (
7 ]
21.0
22.2
19.7
21.3
SVDNet [
40 ]
37.83
40.93
37.3
41.5
DPFL [
42 ]
40.5
43.0
37.0
40.7
HA-CNN [
44 ]
41.0
44.4
38.6
41.7
锅(
47 ]
35.0
36.9
34.0
36.3
锅+排名(
47 ]
45.8
43.9
43.8
41.9
MLFN [
48 ]
49.2
54.7
47.8
52.8
PCB (
6 ]
- - - - - -
- - - - - -
53.2
59.7
PCB +齿槽(
6 ]
- - - - - -
- - - - - -
56.7
62.8
基线
59.88
61.14
59.02
60.57
基线+比损失
63.47
64.21
61.30
62.86
基线+ OHEM
63.34
64.43
60.36
61.43
基线+比损失+ OHEM(我们的)
66.26
68.57
63.24
65.07
大胆的值显示在每个度量所有方法的效果最好。他们可以清楚地表明,我们的方法达到最好的性能与其他方法相比。
通过分析实验结果,我们观察到该比率可以进一步提高re-id的性能损失,这表明比损失的有效性。与此同时,我们的方法优于大多数上市最先进的工作在三个re-id数据和显示有前途的竞争力。
5。讨论
在本节中,我们首先讨论两个参数的影响
λ
和
ε
比损失修复一个参数和不同。然后我们比较我们的方法有两个类似的作品包括LMCL [
21 ]和ArcFace [
5 ]。
5.1。参数分析
的参数
λ
用于调整比率的重量损失的联合训练。为了观察的影响
λ
re-id性能,我们集
ε
当0.5和改变
λ
从{0.1,0.2,0.5,1.0,1.5,2.0}市场- 1501,DukeMTMC-reID和CUHK03分别。结果在图
5 。从市场- 1501结果,我们发现地图上稍有增加
λ
生长和达到峰值
λ
是1.0,然后逐渐减少更大的吗
λ
。类似的地图可以观察到的趋势在DukeMTMC-reID数据集。我们还发现,地图是极大地影响
λ
在CUHK03数据集。例如,地图上增加从63.82%降至66.87%
λ
在标签版本从0.1增加到1.5。
图5
地图的敏感性
λ
当
ε
设置为0.5。市场- 1501和DukeMTMC-reID地图不太敏感
λ
。然而CUHK03整体的地图显示的增加有上升的趋势
λ
。
的参数
ε
可以防止干扰比损失在最初的训练阶段。同样的,我们修复
λ
1,改变的价值
ε
从0.0到0.5,0.1的步骤。结果如图所示
6 。我们发现
ε
市场- 1501和DukeMTMC-reID影响不大。具体来说,地图是有限的波动0.7%(0.43%为DukeMTMC-reID市场- 1501和0.63%)。然而,地图的波动达到1.67%的标签在CUHK03版本和1.29%检测到版本。我们认为造成这一现象的主要原因是在不同的数据集样本的数量差异。在大规模数据集,如市场- 1501和DukeMTMC-reID大规模样本带来一个相对较小的扰动比损失,这有利于稳定模型的学习。相反,模型训练CUHK03可能波动率风险损失的价值地图相对不敏感
ε
。
图6
地图的敏感性
ε
当
λ
设置为1。市场- 1501和地图DukeMTMC-reID相对稳定的变化
ε
。随着不同的地图CUHK03波动
ε
。
5.2。与类似的工作
近年来,许多优秀作品提出了提高辨别力的学习特性,例如,LMCL [
21 ]和ArcFace [
5 损失函数。他们学习区别的特性,通过引入保证金的余弦角空间和空间,分别。然而,保证金需要的价值选择小心翼翼地因为一个不恰当的值会导致优化困难。在我们提出损失比例,比例配方能有效鼓励类间可分性和在类同时密实度没有额外的保证金。
详细比较,我们对市场进行reidentification实验- 1501,DukeMTMC-reID, CUHK03数据集与我们的方法和两个损失函数。在实验中,所有先前的实验设置保持不变,除了损失函数。LMCL和ArcFace,我们改变参数
米 从{0.01,0.1,0.3,0.5,1.0}寻求最好的结果(
30. ),并记录在表的比较结果
3 。从结果中,我们可以发现我们的方法映射值高于LMCL和ArcFace市场- 1501 DukeMTMC-reID和达到类似的性能。此外,它优于LMCL ArcFace完全数据集CUHK03即使他们是最好的参数。
表3
我们建议的方法的对比与LMCL ArcFace市场- 1501,DukeMTMC-reID, CUHK03数据集。
方法
米
市场- 1501
DukeMTMC-reID
CUHK03标记
CUHK03检测
地图
1级
地图
1级
地图
1级
地图
1级
LMCL [
21 ]
0.01
82.49
92.70
71.87
84.29
63.12
63.71
61.42
63.36
0.1
82.93
93.11
72.32
84.92
63.55
66.50
62.54
63.64
0.3
82.05
92.49
71.43
83.93
63.32
64.64
60.71
62.00
0.5
81.70
93.02
70.68
84.07
62.15
64.21
58.49
60.43
1。0
81.15
92.25
70.51
84.11
61.86
63.50
58.46
59.79
ArcFace [
5 ]
0.01
82.31
92.99
71.19
84.02
63.02
64.21
60.92
63.00
0.1
82.70
92.96
71.28
83.93
64.33
66.50
62.54
64.93
0.3
82.52
92.99
71.09
84.78
65.20
67.57
62.65
63.43
0.5
81.28
92.34
70.54
83.89
64.62
65.86
61.83
63.07
1。0
80.86
91.42
69.60
83.08
62.76
64.14
60.72
61.50
我们的
- - - - - -
83.12
92.64
71.66
84.34
66.26
68.57
63.24
65.07
大胆的值显示在每个度量所有方法的效果最好。他们有益于我们提出的方法和其他方法之间的比较。
6。结论
在本文中,我们提出了一个为圆形比失去学习reidentification区别的特性的人。增强特性可分别,我们首先使用规范化softmax调节特征向量的大小和分类权重向量。通过这种方式,网络将专注于角特征和分类权重之间的关系,和他们的距离可以有效地测量超球面。然后我们以最大组内距离的比值和阶级之间的距离最小为目标的损失,这样同类密实度和组内的可分性可以优化在同一时间。的联合训练规范化softmax并提出比损失,该模型可以学习区别的行人reidentification任务特性的人。广泛的实验市场- 1501、DukeMTMC-reID和CUHK03进行演示我们re-id提出方法的有效性。
数据可用性
我们提交相关的基础数据是公开的研究。
的利益冲突
作者宣称没有利益冲突。
确认
这项研究受到了中国国家自然科学基金(61501177和61501177号),广州大学优秀New-Recruited医生培训项目(没有。YB201712),广东教育的特色创新项目部门授予2018 ktscx174。
[
]1
Kviatkovsky
我。
亚当
一个。
Rivlin
E。
reidentification颜色不变性人
IEEE模式分析与机器智能
2013年
35
7
1622年
1634年
10.1109 / tpami.2012.246
2 - s2.0 - 84878163571
[
]2
李
W。
王
X。
本地视图对齐功能转换
《IEEE计算机视觉与模式识别会议
2013年6月
纽约,美国
3594年
3601年
[
]3
Kostinger
M。
Hirzer
M。
Wohlhart
P。
罗斯
p . M。
女孩
H。
规模度量学习等价约束
《IEEE计算机视觉与模式识别会议
2012年6月
普罗维登斯,美国国际扶轮
2288年
2295年
[
]4
廖
年代。
胡
Y。
朱
X。
李
美国Z。
人鉴定由当地最大的发生表示和度量学习
《IEEE计算机视觉与模式识别会议
2015年6月
波士顿,美国
2197年
2206年
[
]5
邓
J。
郭
J。
雪
N。
Zafeiriou
年代。
ArcFace:添加剂角保证金损失深人脸识别
《IEEE计算机视觉与模式识别会议
2019年7月
美国加利福尼亚州长滩
4685年
4694年
[
]6
太阳
Y。
郑
l
杨
Y。
田
Q。
王
年代。
超出部分模型:人与精炼检索部分池(和一个强大的卷积基线)
欧洲计算机视觉的诉讼
2018年9月
德国慕尼黑
501年
518年
[
]7
郑
l
杨
Y。
豪普特曼
a·G。
人鉴定:过去、现在和未来
2016年
http://arxiv.org/abs/1610.02984
[
]8
程ydF4y2Ba
W。
程ydF4y2Ba
X。
张
J。
黄
K。
超出三联体失:深成套网络人再次鉴定
《IEEE计算机视觉与模式识别会议
2017年7月
美国檀香山,嗨
1320年
1329年
[
]9
哈德
R。
乔普拉
年代。
勒存
Y。
通过学习一个不变的降维映射
《IEEE计算机视觉与模式识别会议
2006年6月
纽约,纽约,美国
1735年
1742年
[
]10
Varior
R R。
Haloi
M。
王
G。
人类再次鉴定的暹罗卷积神经网络架构
欧洲计算机视觉的诉讼
2016年10月
荷兰阿姆斯特丹
791年
808年
[
]11
灰色的
D。
道
H。
观点不变的行人识别合奏的局部特性
欧洲计算机视觉的诉讼
2008年10月
法国马赛的
22
275年
[
]12
风扇
X。
江
W。
罗
H。
范
M。
SphereReID:深超球面流形嵌入人再次鉴定
杂志的视觉传达和图像表示
2019年
60
51
58
10.1016 / j.jvcir.2019.01.010
2 - s2.0 - 85061754604
[
]13
何曼思
一个。
拜尔
l
Leibe
B。
防御的三联体损失鉴定的人
2017年
http://arxiv.org/abs/1703.07737
[
]14
刘
W。
温
Y。
余
Z。
SphereFace:深超球面嵌入人脸识别,
《IEEE计算机视觉与模式识别会议
2017年7月
美国檀香山,嗨
6738年
6746年
[
]15
斯沃夫
F。
Kalenichenko
D。
Philbin
J。
FaceNet:统一嵌入人脸识别和聚类
《IEEE计算机视觉与模式识别会议
2015年6月
波士顿,美国
815年
823年
[
]16
他
K。
张
X。
任
年代。
太阳
J。
深层残留图像识别的学习
《IEEE计算机视觉与模式识别会议
2016年6月
美国内华达州拉斯维加斯
770年
778年
[
]17
Szegedy
C。
刘
W。
贾
Y。
与旋转会更深
《IEEE计算机视觉与模式识别会议
2015年6月
波士顿,美国
1
9
[
]18
程
D。
龚
Y。
周
年代。
王
J。
郑
N。
人鉴定通过多渠道器件cnn改善三联体损失函数
《IEEE计算机视觉与模式识别会议
2016年6月
美国内华达州拉斯维加斯
1335年
1344年
[
]19
刘
W。
温
Y。
余
Z。
杨
M。
大幅度softmax损失卷积神经网络
机器学习的国际会议
2016年6月
纽约,纽约,美国
507年
516年
[
]20.
王
G。
元
Y。
程ydF4y2Ba
X。
李
J。
周
X。
学习区别的特性与多个粒度人再次鉴定
ACM国际会议多媒体学报》上
2018年6月
荷兰阿姆斯特丹
274年
282年
[
]21
王
H。
王
Y。
周
Z。
CosFace:大型保证金余弦损失深人脸识别
《IEEE计算机视觉与模式识别会议
2018年6月
美国犹他盐湖城
5265年
5274年
[
]22
吴
D。
郑
S.-J。
保
W.-Z。
张
X.-P。
元
C.-A。
黄
D.-S。
小说深模型multi-loss人再次鉴定和有效的培训
Neurocomputing
2019年
324年
69年
75年
10.1016 / j.neucom.2018.03.073
2 - s2.0 - 85047728007
[
]23
杨
Y。
刘
X。
叶
Q。
道
D。
整体上优于人鉴定与多个特性表征
复杂性
2018年
2018年
12
5940181
10.1155 / 2018/5940181
2 - s2.0 - 85062822976
[
]24
郑
F。
邓
C。
太阳
X。
金字塔形的人通过multi-loss动态培训鉴定
《IEEE计算机视觉与模式识别会议
2019年6月
美国加利福尼亚州长滩
8514年
8522年
[
]25
钟
W。
江
l
张
T。
霁
J。
熊
H。
结合多层次特征提取和multi-loss学习人再次鉴定
Neurocomputing
2019年
334年
68年
78年
10.1016 / j.neucom.2019.01.005
2 - s2.0 - 85060189621
[
]26
苗族
J。
吴
Y。
刘
P。
丁
Y。
杨
Y。
Pose-guided特性校准锢囚人再次鉴定
《IEEE计算机视觉国际会议
2019年11月
首尔,韩国
542年
551年
[
]27
朱
Y。
杨
Z。
王
l
赵
年代。
胡
X。
道
D。
Hetero-center损失鉴定交叉模式的人
Neurocomputing
2020年
386年
97年
109年
10.1016 / j.neucom.2019.12.100
[
]28
傅
Y。
魏
Y。
王
G。
自相似性分组:一个简单的无监督跨域适应方法人鉴定,
《IEEE计算机视觉国际会议
2019年10月
首尔,韩国
6111年
6120年
[
]29日
罗
H。
江
W。
顾
Y。
强大的基线和批处理标准化的脖子深人地
IEEE多媒体
2020年
22
10.1109 / tmm.2019.2958756
[
]30.
杨
Z。
刘
T。
刘
J。
王
l
赵
年代。
一种新型软保证金损失函数学习深有识别力的嵌入
IEEE访问
2020年
8
202785年
202794年
10.1109 / access.2020.3036185
[
]31日
Pytorch
https://pytorch.org/
[
]32
勒存
Y。
Bottou
l
Bengio
Y。
Haffner
P。
Gradient-based学习应用于文档识别
IEEE学报》
1998年
86年
11
2278年
2324年
10.1109/5.726791
2 - s2.0 - 0032203257
[
]33
郑
l
沈
l
田
l
可伸缩的人鉴定:基准,
《IEEE计算机视觉国际会议
2015年12月
圣地亚哥,智利
1116年
1124年
[
]34
郑
Z。
郑
l
杨
Y。
未标记样本生成的氮化镓改善体外鉴定基准的人
《IEEE计算机视觉国际会议
2017年10月
意大利的威尼斯
3774年
3782年
[
]35
李
W。
赵
R。
肖
T。
王
X。
DeepReID:深层过滤组合神经网络的人再次鉴定
《IEEE计算机视觉与模式识别会议
2014年6月
美国哥伦布,哦
152年
159年
[
]36
Ristani
E。
Solera
F。
邹
R。
Cucchiara
R。
预
C。
性能措施和数据集的多目标、多摄像头跟踪
《欧洲计算机视觉工作室
2016年7月
美国内华达州拉斯维加斯
17
35
[
]37
钟
Z。
郑
l
曹
D。
李
年代。
评估人与k-reciprocal鉴定编码
《IEEE计算机视觉与模式识别会议
2017年7月
美国檀香山,嗨
3652年
3661年
[
]38
钟
Z。
郑
l
康
G。
李
年代。
杨
Y。
随机的擦除数据增加
2017年
http://arxiv.org/abs/1708.04896
[
]39
白
X。
杨
M。
黄
T。
Deep-Person:学习歧视深特性鉴定的人
模式识别
2020年
98年
10.1016 / j.patcog.2019.107036
[
]40
太阳
Y。
郑
l
邓
W。
王
年代。
为行人SVDNet检索
《IEEE计算机视觉国际会议
2017年10月
意大利的威尼斯
3820年
3828年
[
]41
徐
J。
赵
R。
朱
F。
王
H。
欧阳
W。
Attention-aware成分鉴定网络人
《IEEE计算机视觉与模式识别会议
2018年6月
美国犹他盐湖城
2119年
2128年
[
]42
程ydF4y2Ba
Y。
朱
X。
龚
年代。
人地深度学习多尺度表示
《IEEE计算机视觉国际会议上车间
2017年7月
美国檀香山,嗨
2590年
2600年
[
]43
魏
l
张
年代。
姚
H。
高
W。
田
Q。
高兴:global-local-alignment描述符行人检索
ACM国际会议多媒体学报》上
2017年10月
纽约,纽约,美国
420年
428年
[
]44
李
W。
朱
X。
龚
年代。
和谐地关注网络人
《IEEE计算机视觉与模式识别会议
2018年6月
美国犹他盐湖城
2285年
2294年
[
]45
如果
J。
张
H。
李
C。
双重关注网络基于上下文感知特征序列的人再次鉴定
《IEEE计算机视觉与模式识别会议
2018年6月
美国犹他盐湖城
5363年
5372年
[
]46
沈
Y。
李
H。
肖
T。
深group-shuffling鉴定随机漫步的人
《IEEE计算机视觉与模式识别会议
2018年6月
美国犹他盐湖城
2265年
2274年
[
]47
郑
Z。
郑
l
杨
Y。
行人对齐网络大规模的人再次鉴定
IEEE电路和系统视频技术
2019年
29日
10
3037年
3045年
10.1109 / tcsvt.2018.2873599
2 - s2.0 - 85054525203
[
]48
常
X。
Hospedales
t M。
香
T。
多层次factorisation净人再次鉴定
《IEEE计算机视觉与模式识别会议
2018年6月
美国犹他盐湖城
2109年
2118年