文摘
步态行走模式是一个自然的生物识别技术的重要研究课题。独特的步态序列的时间信息的保存和使用是一个强大的数据访问。通常有一个深入的灵活性步态序列由于非结构化和不必要的序列,尾巴了必要的序列约束。作者在这部作品提出一个新颖的角度来看,中提取有用的步态参数视为独立的框架和模式。这些模式和参数标志独特的签名为每个主题在访问身份验证。这些信息中提取学会识别相关的模式,形成一个独特的步态特征为每个人根据自己的风格,脚的压力,走路,角弯曲角,加速走,一步一步的距离。这些参数形成一个独特的情节模式下独特的身份访问授权。这个消毒数据的模式进一步传递给一个残余深卷积网络,自动提取步态模式的分层特性签名。最终层包括Softmax分类器分类主体身份的最终预测。这种先进的工作创建一个不同步态访问身份验证,可用于高度保护的前提。 This work was specially designed for Defence Department premises authentication. The authors have achieved an accuracy of 在真正的时间。本文主要侧重于评估步态模式的关键功能和步态模式的分析研究。
1。介绍
指纹和面临着对每个人都是独一无二的1];因此,他们非常适合当前的生物识别系统。同样,步态是指一个人的行走模式,这是一个每个人的独特特点。步态是一个复杂的生物过程和独特的行走方式,无法欺骗或模仿。这些独特的模式使其适合的用户标识和身份验证(2]。一般来说,一个生物系统比较了信息登记身份证明对一个人的当前功能。这对应于一对一的概念匹配,匹配率大于95%。现有解决方案实现一个像样的准确性;然而,欺骗的概念,描述了模拟或真实的模仿原始构成的一个人,访问认证构成威胁。最新的面部识别技术,生物识别技术同样受到威胁的面部恶搞的攻击。许多数据集可能multiple-scenario恶搞攻击CASIA和玫瑰实验室发布的,但仍然是一个回声欺骗的危险。射频识别或访问卡和传感器(3)可以很容易地打破红线在任何身份验证系统。本文的缺陷的克服自然生物识别技术使用一个先进的方法称为步态生物识别技术进行了探讨。
然而,步态特征是纯粹依赖视觉外观,这可能会导致一个问题如果有颜色的轻微变化,相反,行走速度和低分辨率的图像。这些问题很敏感步态池的计算结果。背景颜色导致的破坏和降低计算分类。这些都是一些主要的问题,有助于逐步退使用步态生物识别技术。作者在实现解决面临的问题,解决不必要的功能,如从背景中分离目标,re-resolution low-imagery的转向高帧每秒(FPS)和blur-free运动的速度行走。所有这些技术有助于姿态估计的准确性。步态特征的设计应该是不变的关于服装(色差),观察角度,等等。因此,这项工作的目标是解决步态特征通过隔离目标(步行的人)从视觉外观和将帧转换为背景的高帧率,也就是说,240 FPS blur-free视觉运动以避免像素腐败或失真,这削弱了精度(4,5]。
避免重叠问题涉及人类的步态,现有解决方案使用两级萃取器;第一个是人与一个惟一的ID标记检测提取他/她(6,7]。第二阶段是人类造成的抽取,在边界框。惟一的ID标签会消除造成重叠问题[7,8]。它也表明,步态识别性能明显受到不同的组内差异相关的主题,如阴影、表面行走,角度变化,环境变化,服装,和分割错误(5,9]。
人类的视觉中的一个很常见的因素是,人们往往能够识别熟悉的人从一定距离只是根据他们的行走方式。甚至共同能够模仿一个人的行走方式(10,11]。尽管走路风格可以模仿,微观参数,如腿部压力,角的行走,每一步的距离,不能准确地模仿。因此,已经被越来越多的兴趣自然生物识别技术,研究人员利用其进行身份鉴定。最初,人类无法模拟微观步态特征引起兴趣国防研究获得访问身份验证。每一步似乎是类似风格的宏观的观察;然而,微程序级的愿景,步态参数变化较少。这些微级变化是独一无二的每一帧和位置。这项工作提出了一个端到端的深度学习技术从每一帧的步态和提取时间信息的位置,这是框架水准仪独立从每个轮廓特征提取(12]。
这项工作的主要贡献包括以下:(1)确定注册通过他/她的步态模式“主题”。(2)执行基本的和强大的统计方法等的意思是,中位数,马克斯在注意力机制而不是其他激活层。这是使功能水平尽可能简单因为步态模式经常会有偏见和相似。(3)列车网络与注意力模型,而不是传统的CNN或转移学习高层时空特征提取。
本手稿中使用缩写的列表如表所示1。
2。相关工作
在本部分中,作者将描述步态周期的生物识别技术和基于深度学习模型。
2.1。人体步态分析
2.1.1。步态周期
一个步态周期描述了人类行走姿势的重复模式。连续时间的实例之间的循环概述了姿势foot-to-floor接触。这些接触点相对于某些步态参数为步态分析至关重要。步态周期主要由2阶段周期:(i)立场和(2)。这些贡献大约两个巨大的参数%完成步态运动分析。步态立场覆盖60%的周期,特别是步行运动。然而,当一个人跑,摆动阶段的主要比例。在时域特征提取包括内在属性的变化而走,如速度、运动,身体长度,宽度,和弯曲角。这提供了一个人的步行周期的内在模式,这是极端重要的识别。这就是模式信息提取步行周期。
2.1.2。步态周期的特点
它已经证明,充分证明了人类的步态是每个人独有的。每个单独的模式分化,尤其是功能,如骨盆和胸腔,每个个体是完全不同的。这个时间信息可以用来适应计算机应用生物识别技术没有任何内在的硬件设备。一个主题的步态周期可以大致分为2类:右腿罢工和左腿罢工。时间信息可以从这两个阶段,主要描绘脚跟罢工。这个信息包含更有识别力的信息区分2科目。一个完整的脚跟罢工开始解除鞋跟的前进方向和向后摆动的方向,然后循环重复。
2.1.3。独特性的步态
类似于指纹的唯一性,每个人独特的步态姿势。通常,关注关于恶搞的袭击发生在自然生物识别技术,但准确的模仿目标主题的“步态姿势是不可能的。一个主题的行走方式可以轻易模仿,但只有在宏观的;微程序级特征,如脚的压力,跟罢工的角度,和每一步之间的距离保持,不可能准确地模仿。这一事实是足够的证据对预期的成功步态生物识别技术的全面实施访问身份验证系统。可能有分钟走路姿势的变化,但这不会是一个自然的变化;相反,这将是一个被迫改变相似,当电影明星完全改变他们的姿势13]。
2.2。步态在生物识别技术
不像其他的模型,建立步态并不完全依赖于像素值。指标可以从RGB、RGB-D或二进制帧。指标是纯粹基于像素的结构而不是强度。因此,为更好的结果,作者将帧转换为二进制和计算基于姿态。这些帧通常被称为面具和通过步态能量/熵图像,定义为GEnI [14]。这些图像提取目标的轮廓面具。下一个提取指标是身体运动2 d联合点。传统的缺点,如服装和步行速度,可以通过这种方法来解决给定的高分辨率帧中提取丰富的信息。这种提取方法被证明是健壮的,比如衣服,步行速度,和视角,因为高分辨率帧用于计算。
这项工作正在调查的作者与基于数据的培训模式,而不是完全基于像素特征。这是与CNN模型,提取数以百万计的参数,而不是处理high-computation参数。这个新方法可以用来训练模型对于不同的场景,如模式识别。这项工作涉及到模式和骨干是每个主体的模式从数据中提取。
2.3。解开纠结学习
解开纠结学习是一种新形式的步态的方法在特征提取使用强烈的计算资源。现有的模型大多是潜在语义向量数据(特征)从CNN的架构。解开纠结在计算机视觉领域学习是越来越受欢迎的纯数据驱动的方法。在解开纠结的一个杰出的网络学习是DrNet,它使用构成向量two-encoder架构。信息被删除的内容生成对抗训练。另一种方法,包括市场细分进行分析,温和派前景部分面具的身体部位2 d构成关节使用U-Net体系结构。这些身体部位部分转换为所需的运动与对抗训练。埃塞尔et al。15利用U-Net和变分autoencoders (VAE)解开一个图像到外观和形状。Tran et al。16,17)获得先进的表演pose-invariant面部识别通过显式地解开一个姿势的变化与甘多任务(18,19]。此外,DR-GAN [17]牵连到敌对的训练和体式标签区分功能。
2.4。单一的基于图像的行为识别
班达里et al。20.)实现简单的基于图像的动作识别基于HRNet [21]人类造成估计网络。HRNet [21)代表多任务特性的特征图谱提取图像分辨率和减少订单的渠道(递增的顺序20.]。模型返回热图和人工关节动作识别(14]。
2.5。注意图像特征流
班达里et al。20.和福井等。22)使用注意等机制引起图像特征提取流前景分析。这种方法使用一个关注基于图像特征流(23),它建立在ResNet18 [24]。浅流的协助下跳过连接从提取的特征图谱HRNet [21]。这些特征图连接ResNet18的每个输出(24层使用过渡块。
2.6。Part-Image-Based功能流
准确的动作识别使用每个部分,班达里et al。20.)提出了一个流part-image-based特性。这意味着从HRNet特征提取21),用于分类身体部位通过“姿势估计Conv”块中。然后将这些单个部分美联储ResNet18 [8)分类。
2.7。步态数据集
有许多传统的开源数据集在步态。这些都是大数量和高质量。一些例子是SOTON大型数据库,普遍服务基金,CASIA-B, OU-ISIR, TUM导游25]。作者使用CASIA-B [26custom-collected数据集),这项工作。在这里,建筑性能分析而不是与不同的最先进的技术在不同的数据库中。因此,很大程度上custom-collected数据集用于测试和指标提取。CASIA-B是每个主题的多视图数据集3变化视角而言,衣服和携带。每个主题的数据集包含11种不同角度的走路姿势。CASIA-B数据集的样本图所示1。
2.8。限制
大部分的最先进的方法,如前所述,基于subject-sequence身上进行实验帧图像分类使用传统的卷积神经网络和传输学习方法。大多数这些方法取得了良好的结果但不准确的结果在所有科目。很少人关注使用pretrained传输机制进行学习,而缺乏提取所需的功能,但与提取甚至不需要的特性,这稀释功能学习。上述限制最大集中在单一架构描述图像分类与给定数据集不同的科目。因此,即使轻微的变化观察到主体的角度和距离,预测得出结论为假阴性。
保持上述因素,他们的主要缺点,作者提出了一个独特的架构,考虑所有必要的功能和丢弃不必要的特性在培训阶段,在接下来的章节中详细解释。
3所示。技术方法
在这一节中,作者定义步态规划的技术方法的模型学习歧视信息从步态轮廓。该技术框架如图2。
3.1。问题公式化
该方法主要侧重于part-wise理解步态轮廓图像特征提取(27,28在微程序级)。从CASIA-B训练数据集,其中包含的信息”“人们具有独特的身份 ,即假设步态轮廓的概率分布正比于其身份。所有轮廓的人在一个或多个时间序列可以被视为一组轮廓 ,在哪里 。因此,可以开始一个人的步态识别数学模型如下: 在哪里是卷积层的设置旨在提取特征框架层面上从每个独特的身份步态轮廓。这个函数代表一个排列的不变函数框架水准仪特征映射到一个集合级别的功能从每个主题中提取目标。一组池操作实现这些层。这个函数代表了歧视学习的概率函数 ,这表明集合级别的功能。输入是一个张量与四维:设置维度,图像通道尺寸,图片尺寸,高度和图像宽度尺寸。
3.2。设置池
设置池(27)是专门用于提取步态特征”“身份集。在数学上,它可以制定 ,在哪里表示集合级别的特性和表示框架水准仪特性,给出的 。制定一个更深层次的功能 ,排列不变量函数被定义为 在哪里是排列元素(25]。因为这个方法是部署在实时环境中,功能需要每组的一个人的步态轮廓与任意的基数。使用不变的约束函数中在方程(2),应用于一组维度统计功能。三个强大的统计功能用于计算:马克斯,意思是,中位数。联合函数结合这三个函数如下: “猫”代表了通道的连接尺寸和 代表一个 卷积的层。这三个统计功能,马克斯,意思是,中位数,应用于一组维度。方程(3)和(4)代表学习适当的体重结合这三种提取的信息统计功能。
3.3。注意机制
视觉注意力网络应用于提取时空特性在框架层面,这被证明是提高设置池性能(4,5,7]。
本地信息经常错过一些重要点提取时间从步态模式的特性。因此,作者提出以聪明元素的注意力从步态轮廓提取全球信息的地图。如图3,全球信息收集的首先是统计功能。这些值然后喂 卷积滤波器的特性映射到特征图计算的关注。然而,最终的集合级别的功能27从每一帧从Max函数中提取,用于改进框架水准仪特性(29日]。这种残余结构可以稳定网络的损失函数的收敛性。在这部作品中,作者正在考虑三个强大的统计功能,也就是说,意思是,中位数,和马克斯,因为它们容易计算,通过这些参数很容易分析和结果驱动的步态参数。由于参数的形式从每个参数矩阵,这三个统计功能可以很好地计算和每个主题之间保持距离。
3.4。金字塔的映射
提取的特征分为功能条或特征向量,然后用于人reidentification,提出在8,10]。在许多网络,在这里,图像裁剪和缩放到一个统一的尺寸。区别的部分不同大小从一个到另一个基于摄像机角固定在顶部。傅et al。10)提出了一种水平金字塔映射网络局部和全局特征提取。金字塔网络由4鳞片,帮助网络专注于收集局部和全局特征。扩展这种技术在这种工作,一个完全连接层为每个池特性是用来区别的地图信息。假设金字塔网络年代鳞片。可以被定义为的鳞片 ,特征图在哪里设置池函数提取,然后进一步分成条基于图像高度尺寸。因此,总带可以计算 。全球集中应用于3 d条提取关键信息制定的一维特征向量。对于单个地带 ,在哪里 。在这里,代表每个地带的指数。最后制定全球池是由 ,代表全球最大池和全球平均池,分别。最后一步包括完全连接层的映射功能成一个特征向量的区别的空间。条向量代表不同的描述特性从不同的接受字段在不同空间位置。这些特征向量进一步给完全连接层。卷积层弃用不同的接受字段(30.]。更深层次的提取,接受域将越大,随着身份必须与一个更深的参数,层次越深。
表示特性的像素(特征向量)31日]在浅层次卷积网络主要集中在当地细粒度的信息而不是全局特征信息,以避免不恰当的功能被用于训练。然而,全球隔离特性也是很重要的一个人从框架;因此,深层关注全球和粗粒度的信息。作者实现了一个类似的方法,它在10,27),多层全球管道收集从卷积层集合级别的信息。这些集合级别的特性从不同的层中提取被发送到全球管道。最后一个特性的数学建模映射定义为从全球管道 。这是全球管道到金字塔映射映射的最后一个特性集(向量)10]。
3.5。提出策划
进一步绘制使用的特征向量构成情节和抓住macro-gait特性(32- - - - - -34),如压力、膝角、膝盖压力,步长和步角。这个信息是美联储提出策划网络组成的单一和多个参考取自作者的以前的工作在35,36]。提出策划的管道流如下。
3.5.1。Single-Pose策划
(35]证明了一个纯粹的单人姿势估计量(SPPE)是不可靠的定位错误,混合网络空间变压器对称网络(STN)和一个单人的姿势估计量(SPPE)介绍了完美的人体姿态估计。此外,注重地方特色的特征向量的浅层次,空间对称网络空间detransformer (STN)和网络(SDTN)然后别再交换原始图像生成网格的基础上 。空间仿射变换用于这个姿势预测的特征向量
对称空间变压器网络接收来自全球管道,特征向量和空间detransformer网络生成提出建议。中使用的仿射变换空间对称的网络,如前所述在方程(5)和(6), , ,和向量和 和 的坐标变换。(所15),空间detransformer网络空间的逆操作变压器网络。的操作是由
3.5.2。调整姿势策划
更好的提取human-dominant地区最后一个特征向量的建议后,一个平行single-person-pose估计量(SPPE)添加到构成网络的训练(15),股票与空间变压器的分支网络。所有层的SPPE被冻结在训练阶段和这个分支的重量是固定的,这是进一步作为反向传播机制来调节中心对空间网络变压器构成的错误。如果网络空间的提取造成变压器不是中心,造成大量绘图错误会发生,导致较大误差的反向传播在并行分支。因此,空间变压器网络专注于高质量和占主导地位的区域,估计从全球管道。保持更高的效率,一个平行的姿势估计是关闭在测试阶段,以避免多个重叠。
3.5.3。造成距离情节
距离函数构成情节的调制 。构成的框是 。的软功能然后定义为构成情节
如果在的范围 ;否则,它是0。是周围的框构成情节的中心在哪里 ,每个维度内 ,这是为原来的箱子吗 。然而,可能会有一些实例提出了有信心得分低,可能是不正确的姿势,但不准确的情节的不匹配,即双曲正切操作消除造成信心较低的分数。联合信心得分将接近于1。情节的距离显示关节的数量在一个完整的姿势。每个部分之间的空间距离是策划
结合所有上述方程之间的一个完整的最后距离策划人类构成,它们是铰接 在哪里是两个距离和重量价值 。
对于multihuman姿势,空间detransformer网络是人类用估计贴图构成回到原来的图像坐标系统。为了避免冗余的姿态演绎,nonmaximum抑制网络使用。
3.6。培训细节
CASIA-B数据集用于训练该模型。数据集包含124例有3种不同的步行环境和11个角不同的观点 。每个主题包含6序列为正常状态,2为行走状态序列,和2序列穿着外套/外套。总结所有条件,有110序列为每个主题。由于没有官方分成训练集和测试集,作者将数据集在一个80 - 20的比例。
4所示。实验和结果
4.1。网络建设
该算法由两个主要街区。第一个块与深卷积层(37)是用于火车CASIA-B数据集提取特征向量。它是建立在ResNet18模块。这作为一个人类帧检测器。图片会做调整 在第一块part-image-based流。然后喂缩放图像 Conv矩阵与64过滤器的步幅大小2。然后,马克斯矩阵大小的池 和2的步幅计算。这是进入第一隐层,两层 conv大小和64过滤器复发两次,再交由过渡层 大小与64过滤器。将采样之后在第一层和ReLu非线性。第一层第二层是一样的,但过滤器的大小是128,其次是ReLu激活函数,然后,过渡层后,与一个3×3过滤器尺寸128过滤器。第三层是相同的如上所述,但过滤ReLu函数大小为256,其次是一个过渡层 大小256过滤器,ReLu功能,与512年最后一层过滤之后的过渡层3×3的大小和512过滤器。这种关注网络提供统计层,称为集池层,而不是一个完全连接层与几个类,最后softmax激活函数。
在关注基于图像特征流,网络配置,如表所示2,有额外的过渡层与在场ResNet18模块。这些过渡层特征图 ,由提取的特征,特征向量,这是美联储进一步进入体式估计块中提取统计的功能。在基于动作的特征提取是至关重要的。如表所示2,网络包含4层,每一层包括两个基本conv块。技术架构的图形表示分类模型如图4。进一步阻止姿势估计量,这是取自作为基本参考形式的以前的工作35),6卷积层从VGG pretrained构成模型38]。构成块的每个部位识别和情节构成他们每个人之间的距离对分数的信心。构成块土地所有的关节,一个2 d坐标系统在每一帧和情节构成点和加入关节之间的界限39]。构成坐标将给空间提取宏观关键特性保持独特的每个身份模式值。
4.2。性能指标
提出了网络训练的批量大小16日与亚当优化器(执行和培训40最初的学习速率为0.0001。衰减率因素是维持在0.1第一200时代。培训活动直到36 h和1000 1080 TI Nvidia GPU时代。
模型评价指标,如图5,用于验证表演的平均精度和F1的分数。姿势估计比较预测关节坐标和姿势距离里面(人类地区)根据十字路口在联盟(借据),其参数在每个时代更新。F1分数是用来计算精度和召回的成功率。精度比实际比赛,和回忆的比率被定义为总地面真理的正确预测。然而,无论是足以衡量网络的性能(9,41]。F1的分数计算的精度和召回相关的参数来计算网络的评价数据。F1分数称为真阳性(TP)正确预测,假阴性(FN)假nondetections和假阳性(FP)错误的正确预测(9,41]。上述参数的数学计算如下:
作为一个重量级的模型2的组合pretrained模型,VGG ResNet18, GPU的推理1.5毫秒,CPU、5 s。表3描述了一些关键的步态模式的结果导致步态的身份。定性和定量结果绘制实时视频捕获的测试阶段的训练算法的模型。图6可视化步态模式运动图形,这是独一无二的每个身份主题和主要关注膝盖元素(32,42),如角度、大小和压力。培训期间,该模型提取运动记录序列的每个主题下各自的主题ID。这是美联储作为值特征向量。图7包括测试主题的结果,代表运动图形在饲料。变化的模式,这是一个微程序级波,是独一无二的,每一帧所有科目。图8相比之下,是另一个测试主题的相机更接近主题,构成绘制和显示的步态运动的结果。图8 (b)特别是黑人的框架和可视化图形运动模式。这些步态模式是用来保存重量为每个独特的主题。这些重量是用来分类每个主体根据自己的身份。通过这种方式,该算法把步态生物识别技术基于步态运动模式。
(一)
(b)
(c)
(d)
(e)
的环境设置与正常罗技摄像头拍摄的实时测试是1080 p分辨率;主题图7和8从罗技1080 p的相机。相机放置10米的距离,在正常自然的阳光。实时检测方面所花费的视角角度,以捕捉整个运动腿部运动。额观点有时会稀释的浓度数量有限的腿部运动自腿向后运动将会错过额视图中。因此,侧角的观点被认为是测试实时捕捉所有重要点的腿。另一个实时测试与相机放置靠近主体和不同照明条件如图9。图10代表一个比较2测试对象。图10(一)代表同一个主题有不同的场景,和对象图10(b)是不同的测试对象。
(一)
(b)
4.3。与最先进的方法
比较表已经吸引了如表所示4针对该方法GaitVision。比较是对实时评估。基于外观的方法包括方法完成GEI-SVR [44],步态图像熵(基),提取的轮廓,和能量图像轮廓定义的面具。这种方法吸引了相当大的主要缺点intrasubject外观变化由于协变量如衣服,携带视图角度,行走的速度。(描述的方法43,47]从RGB图像提取步态特征通过条件随机场。Zhang et al。47)是一种CNN-based方法与multicovariates歧视表示的数据。这两种方法的主要缺点是实时性能较低。吴et al。46)是一种低计算成本法可以处理低分辨率图像。衣服的变化,然而,敏感视图角度,和行走速度,使实时部署不合适。胡锦涛et al。(11)提出的观点不变的人体步态识别,但角度而言,GaitNet [47)超过(11]。Kusakunniran的45)方法描述时空信息提取的功能。该方法提取至关重要的时空信息,主题是运动的,但许多错误和不必要的信息可以从数据捕获。Kusakunniran et al。48]提出步态主题识别通过不同角度相关运动。然而,实时视图角度和运动速度使这个方法不可靠。
该方法GaitVision显然超越了所有最先进的方法在不同角度实时处理,不同背景,在体面的运动。大多数当前的方法缺乏实时他们的存在,因为他们限制到特定的环境。尽管方法训练他们的模型与大量的类,他们模仿未能在实时运行。作者在这里提出了一个独特的方式来收集主体运动至少5分钟,训练他们,实时和部署。研究对象收集实时训练和测试各种视图角度和与一个像样的衣服用摄影机运动10米离开主题。图8 (c)代表背景关注主题的隔离一个干净的步态模式的提取。图8 (d)代表身体姿势的相似主题的测试用例。图8(一个)图描绘了膝盖运动(主题的相似性对训练集)相同的测试用例(如图8)。GaitVision演算法的基本优势与不同背景的训练科目的方法和角度。不同的方法46),GaitVision算法可以检测出训练有素的主题不同的衣服和背景。这是可能的因为训练的关键特性和参数提取的运动。该算法的另一个重要组成部分是实时部署,与大多数的步态方法预先录制的视频。因此,使用这些步骤提取步态特征至关重要,GaitVision超过其余的最先进的方法实时部署。
5。结论
该算法是每个主题分类的基础,基于其独特的自然模式。步态运动是一种独特的自然模式,可以用来训练每一个独特的主题在任何身份验证系统。培训使用深层卷积结果随后被美联储特征图提取个人步态运动模式,检测的准确性的训练科目与至少120年代的运动提供不同角度的高。环境不是非常有影响力,受试者最初是转换为灰度和特征图谱从深海中提取层;随后,这个向量表明人类存在的局部区域的估计量,然后情节构成和提取步态运动模式。主要这项工作的核心新颖性在于姿势估计frame-wise其次是姿势的训练模式为每个主题。这从而避免造成不必要的特征的提取。第二个主要部分是提取步态参数的构成模式。这些参数训练frame-wise为每个主题。结合所有给一个更好的结果比相比,最先进的方法。
6。局限性和未来的范围
这项工作的核心目标是进行广泛的研究在非接触式步态生物识别技术使用一个简单的相机。因此,边缘设备将最优情况下将它部署在生产。然而,这项工作使用VGG pretrained网络和ResNet152模块、重量和一些边缘的设备(33)喜欢覆盆子π不适合生产部署。边缘设备应该计算能力超过4 GB的内存。另一个缺点是受限的环境中。在相机angle-wise顶视图角是一个主要的缺点和顶视图角度不合适,因为头部和身体姿势将主宰底部姿势步态参数。自底部姿势步态参数在这项工作中起关键作用,顶视图角度无法获取正确的步态参数。因此,特征提取是困难的顶视图角度和导致假阳性。特征提取的另一个问题是相机的距离。随着照相机的焦点是保持10米以外的主题,运动参数得到合并,导致错误的参数训练,导致重大错误。
Algorithm-wise,主要缺点是FPS。如结果所示部分(数据8和9),最大FPSFPS CPU和GPU,最大的FPS是20 FPS,提供至少4 GB内存,和12 GB RAM,最大的FPS是55 FPS。这项工作中提供的结果已经CPU显示算法的复杂性。
核心愿景将部署算法优势的设备和部署它作为一个独立的;因此,本研究可以用于进一步增强切断计算负载和准备一个简单的轻量级模型边缘部署在生产水平。模型可以进一步通过收集处理大规模数据集在较大的科目至少5分钟的运动在所有可能的角度和运动和训练大规模部署的模式。
数据可用性
从引用调查和收集的数据可以根据要求提供从相应的作者。
伦理批准
手稿中进行道德复杂性日报》建议的方式。
的利益冲突
作者宣称没有利益冲突的任何一方。
确认
作者承认国家研究所的技术支持,印度瓦朗加尔。