受欢迎的步态表示,即步态能量图像(基)作为输入该方法(
6]。它可以计算,首先提取帧序列的单个其次是计算每一帧的轮廓使用背景减法。在最后,所有的轮廓图像序列的一个特定的个人平均和排列形成一个步态能量图像表示。方程(
1)显示基的数学公式:
(1)
基
=
G
x
,
y
=
1
T
∑
t
=
1
T
我
x
,
y
,
t
。
在方程(
1),
G
x
,
y代表产生的基,在那里
我
x
,
y
,
t表示轮廓图像帧数
t和协调
x
,
y,而帧总数为代表
T。这种步态表示的主要优势是更少的存储空间和计算时间。轮廓图像容易产生噪声,处理每个轮廓框架成本太高;因此,盖斯是最有效的步态表示。此外,盖斯也非常敏感,不同的协变量因素,强烈影响基的形状。一些例子的步态能量CASIA-B数据集的图像具有不同条件如图行走
2。
提取所有科目的盖斯后,我们调整和新
240年
×
240年
×
1图像尺寸和给他们作为输入CNN架构。我们使用相同的CNN架构提出的布哈里et al。
4]。卷积在CNN的架构,有四个街区。每一块组成
3
×
3卷积层,其次是
2
×
2max-pooling层来减少输入数据,选择的空间维度最大值从输入地区根据以下方程:
(2)
y
k
。
w
我
=
马克斯
0
≤
一个
,
b
≤
p
x
我
k
×
p
+
一个
,
w
×
p
+
b
。
在上面的方程中,神经元或单位
y
k
。
w
我在抽样层是出现在一个特定的位置
k
,
w在
我
th输出映射。在该地区
p
×
p,最大的价值选择和分配
y
k
。
w
我神经元的
我
th输入地图
x
我。随后,激活函数卷积后使用每个层漏ReLu实现非线性。它是定义在以下方程:
(3)
f
x
=
x
如果
x
>
0
0.01
x
否则
。
在上面的方程中,
x是一个功能从卷积层地图了。如果值
x大于零,保存;否则,他们是乘以一个小值为0.01。这个激活函数是ReLu激活的一种改进形式。在ReLu激活函数的情况,梯度是0输入值小于零,去活化神经元在这一地区,可能导致死亡ReLu问题。另一方面,漏ReLu克服这个问题。在ReLu漏水的情况,而不是将所有负梯度0,它返回一个小的数字乘以0.01倍
x。这个小值地图显示负值的影响特性
x。值越高,影响越低。因此,它还产生输出负值。此外,所有的运算不填充。特征图,卷积的输出层,可以计算由以下方程:
(4)
X
=
b
我
∑
k
=
1
n
W
我
,
j
∗
Y
。
在上面的方程中,
X是输入层和
Y输出层的吗
∗表示卷积的操作,
b
我是偏见,
W
我
j
我
,
j
∈
N是按重量重量优化优化算法,输入数据的大小是用
n。此外,我们建议的体系结构的所有卷积模块负责提取基的语义信息和特性集,是每个基于步态的歧视。最后,使用两个完全连接层。在最后一层神经元的数量等于一系列的类标签或个人出现在数据集紧随其后的是“softmax”激活函数,它返回每个类的概率。
满足了工作的贡献,我们采用了循环生成对抗网络(CCGANs)一致。本研究的主要目的是处理未知的和动态的步行环境。更具体地说,我们寻求重建步态特征,被协变量因素的存在。因此,编译后的形式输入数据为每个主题,盖斯我们创建了CNN模型。这CNN模型训练在正常行走序列(视频)的主题,也就是说,124年。现在,如果其中的一个124人的一个监控摄像头,同时携带一袋进行识别,然后系统由于阻塞表现不佳的袋子,这扰乱了步态特征。因为当一袋放置在身体的某些部位面前,他们成为隐藏起来,因此,重要的信息关于步态的个人风格也失去了。同样的情况与其他携带物品和穿着条件。因此,难以识别。我们也可以认为这是如何识别个人的脸上如果面临被面具覆盖因为面具遮挡,隐藏的特点。 So, a cycle consistent GAN model is deployed to recover/reconstruct the original image or gait features that are affected by these covariate factors. This model was proposed by Zhu et al. for image-to-image translation tasks when the source and target images are not paired [
5]。这种模型的优点是它没有配对图像进行训练。在我们的场景中,我们重建的包和外套盖斯每个相应的正常基功能恢复和人类的识别是可行的和CNN是能够预测对象ID和更准确的结果。此外,CCGANs有效地处理动态协变量条件对模型未知的包和外套;我们火车CNN模型对个人与正常走路风格和验证它个人的行走而携带包,穿着外套。此外,表
1显示所有使用符号或符号来描述关键词。
符号和定义。
符号
定义
D
一个
鉴频器模型的域(探测包/外套)
D
B
鉴频器模型的域B(正常的盖斯)
一个
训练样本的域
一个
我
我
=
1
N
∈
一个
B
训练样本的域B
b
我
我
=
1
N
∈
B
F
b
翻译正常盖斯
l
c
y
c
周期的一致性损失函数
l
G
一个
N
敌对的损失函数
G
翻译的领域
F
域B的翻译
米
我
n
最小化的变量
米
一个
x
最大化的变量
3.3.2。CCGANs的架构和设计机制
周期一致的甘斯的模型架构由两个发电机模型和两个鉴别器模型。发电机模型负责生成所需的图像,和鉴别器模型用于区分真实和虚假图像生成的人工。我们的源域包含的包和外套盖斯(域),而目标域包含个人的正常行走盖斯(域B)。第一个发生器的输入(发电机)是图像域B,也就是说,盖斯与正常走路,和输出是翻译领域一个图像,这是包包和外套盖斯。类似的,第二个发生器的输入(发电机B)是图像域,和输出转换图像域B .每个发电机模型与相应的鉴频器模型。鉴别器将输入图像的包和外套,这是域图像以及人工生成的图像从发电机和预测,图片是真实的还是假的。类似的,第二个鉴别器B需要正常的盖斯和人工生成正常盖斯从发电机B,然后预测是否真实或假的。敌对的零和损失都用来训练发生器和鉴别器模型。发电机模型的主要目的是最好的傻瓜鉴别器模型的帮助下生成的图像,并且学会了鉴别器模型预测和检测的虚假和真实图像域。此外,CCGAN模型使用术语周期,因为在整个生产过程中创建一个循环。发生器的输入B图像域是一个,也就是说,包包和外套,和发电机的输出B是正常的盖斯,这是我们需要翻译。 This output is the input of the generator A to generate images of domain A and hence the cycle is created. Similarly, the identical procedure is followed with generator A.
鉴频器的体系结构配置和发电机模型描述的一样在前面的文献[
5]。鉴频器只是一个CNN,执行图像分类和预测,图像是真实的还是假的。规范化卷积操作,其次是实例而不是批量标准化CCGANs用于鉴别器模型。激活函数用于整个ReLu鉴别器模型是有漏洞的。所有曲线玲珑的卷积核的大小为4
∗4所示。此外,hyperparameters鉴别器模型包括损失函数,即均方损失(MSE),和亚当优化用于优化权值学习速率为0.0002。计算的公式MSE损失在基翻译是由以下方程:
(5)
均方误差
=
1
n
⋅
∑
我
=
1
n
y
我
−
y
^
我
2
,在哪里
y
我和
y
^
我实际和预测模型和类标签
n是类的总数。在另一方面,发电机的结构模型是基于一个encoder-decoder结构。发电机模型首先downsamples形象得到图像的背景下的瓶颈层然后编码这个上下文的帮助下ResNet层使用跳过连接随后upsampling层解码上下文所需的输出图像。
3.3.3。CCGANs培训机制
鉴别器模型的训练包括真实的和人工生成的图像而发电机模型训练的帮助下他们的鉴别器模型。发电机模型使用敌对的损失和更新,减少它的预测鉴别器作为“真实”生成的图像。这鼓励发电机模型生成的图像更接近我们需要的目标域图像,即。,正常的盖斯。此外,使用的其他损失函数发生器模型包括身份损失,损失,并向后损失。敌对的损失,考虑的映射函数包/外套正常基翻译
G
:
一个
⟶
B和鉴别器B的域
D
B,即,normal GEIs, then the objective is expressed in the following equation:
(6)
l
氮化镓
G
,
D
B
,
一个
,
B
=
E
b
∼
p
d
一个
t
一个
b
日志
D
B
b
+
E
一个
∼
p
d
一个
t
一个
一个
日志
1
−
D
B
G
一个
,在哪里
G是一个发电机,学会生成所需的图片吗
G
一个看起来更接近的图像域B,即。,我米一个ges with recovered gait features, while the objective of the discriminator
D
B区分生成的图片吗
G
一个和真实的图片
b。
G试图减少这一目标,而对手
D正寻求最大化。
(7)
最小值
G
马克斯
D
B
l
氮化镓
G
,
D
B
,
一个
,
B
。
同样,映射函数
F
:
B
⟶
一个介绍了类似的对抗性的损失,以及鉴别器
D
一个和计算由以下方程:
(8)
最小值
F
马克斯
D
一个
l
氮化镓
F
,
D
一个
,
B
,
一个
。
此外,向前和向后循环一致性也计算。考虑一个图像
一个从域
一个的步态特征的重建是必要的。发展周期的一致性,整个周期CCGAN形象翻译能带来一个形象
一个原来的形式,
即。
,
一个
⟶
G
一个
⟶
F
G
一个
≈
一个。同样,为了向后循环一致性,我们有实例
b从域
B,
G向后和F还应满足的方程周期的一致性:
b
⟶
F
b
⟶
G
F
b
≈
b。因此,所有周期的一致性损失的机理给出了以下方程:
(9)
l
赛克
G
,
F
=
E
一个
∼
p
d
一个
t
一个
一个
F
G
一个
−
一个
1
+
E
b
∼
p
d
一个
t
一个
b
F
G
b
−
b
1
。
此外,完整的目标是由以下方程:
(10)
l
G
,
F
,
D
一个
,
D
B
=
l
氮化镓
G
,
D
B
,
一个
,
B
+
l
氮化镓
F
,
D
一个
,
B
,
一个
+
λ
l
赛克
G
,
F
。
在上面的方程中,可以控制两个目标的相对重要性
λ。主要目的是解决目标给出了方程(
10):
(11)
G
∗
,
F
∗
=
参数
最小值
马克斯
G
,
F
,
D
一个
,
D
b
l
G
,
F
,
D
一个
,
D
B
。
可以看出这个模型可以被视为培训两个“autoencoders”[
45]。一个汽车编码器
F
∘
G
:
X
⟶
X与第二autoencoder共同学习
G
∘
F
:
Y
⟶
Y。然而,autoencoders都他们的内部结构,用于将图像映射到一个中间表示本身是一个翻译的图像从一个域到另一个域。这些场景可以观察到工作的一个特例“对抗autoencoders”[
46),其中的瓶颈层autoencoder是训练的帮助下敌对的损失来生成任意目标。在我们的例子中,域
B,其中包含正常盖斯不同的主题,是目标autoencoder分布
一个
⟶
一个。
4所示。实验装置和结果4.1。数据集
在计划的工作,我们有一个流行的数据集用于步态识别命名CASIA步态数据集提供的中国科学院(CASIA) [
47]。它由三个主要部分命名CASIA A, B和c的研究,CASIA B被认为是。CASIA B是一个大型的多视图步态数据集与观点从0到180度。对于每一个视角,它由124每个主题都有主题的数据共有十序列可用。十序列,六个序列是正常走序列[nm-01 nm-06),两个序列中走袋(bg-01, bg-02),和两个序列服装条件集中和主题走路穿大衣[cl-01, cl-02]。
4.2。评价指标
评估该模型,性能测量包括精度、F1score,精度和召回被认为是
48]。每个测量下面的细节:
4.2.1。准备精度
正确预测的总数由底层模型从总体预测精度测量,它定义在以下方程:
(12)
精度
=
T
P
+
T
N
T
P
+
T
N
+
F
P
+
F
N
。
4.2.2。精度
精密测量的积极类模型预测的总数实际上是积极类预测,是数学计算以下方程:
(13)
精度
=
T
P
T
P
+
F
P
。
4.2.3。回忆
召回措施积极类的总数由所有积极的情况下,该模型预测,数学计算有以下方程:
(14)
回忆
=
T
P
T
P
+
F
N
。