文摘
用户身份验证对准确在现代实际应用生物识别系统成为必要。基于生物特征的身份验证系统标识符面孔和指纹等被应用在各种领域的偏好在现有的密码输入方法。面成像是使用最广泛的生物标识符,因为注册和认证过程是无触点简洁。然而,它相对比较容易获取的脸图像,采用SNS等等,通过照片和视频是伪造的问题。为了解决这个问题,面对欺骗检测进行了研究。在本文中,我们提出一个基于卷积神经网络的脸欺骗检测方法使用面部图像的颜色和纹理信息。彩色纹理信息结合亮度和色差通道进行了分析使用局部二进制模式描述符。彩色纹理信息分析使用Cb,年代,V带在颜色空间中。CASIA-FASD数据集被用来验证该方案。该方案表现出更好的性能比先前的研究开发的先进的方法。 Considering the AI FPGA board, the performance of existing methods was evaluated and compared with the method proposed herein. Based on these results, it was confirmed that the proposed method can be effectively implemented in edge environments.
1。介绍
最近,基于生物特征的身份验证系统信息已经应用于各种移动设备,如智能手机,和许多用户执行身份验证使用面部或指纹信息代替现有的密码输入方法。此外,生物认证被应用到银行交易和移动支付应用。因此,研究人员正在开发高性能的身份验证系统有很大兴趣。
用户生物信息中,面对图像是使用最广泛的生物标识符,因为相关的注册和认证过程是无触点和简洁。然而,面对图像很容易获得使用社交网络,等等,和脆弱的反对各种欺骗技术,包括打印照片和视频回放。为了解决这个问题,研究利用软件解决方案已经成为流行,而不是antispoofing硬件解决方案使用额外的传感器。这些软件的方法可以分为基于运动方法和texture-based方法(1]。
动态的假冒人脸检测方法措施眼睛/头部动作,眼睛闪烁,面部表情的变化(2,3]。假冒的人脸检测方法利用眼睛,注意,仍然面临着如在一张照片并不表现出眼睛闪烁或学生运动,而不是真正的人类面孔表现出相对大量的运动。这个方法非常简单和快速。然而,这个方法将一个欺骗的脸只使用眼动,因此不能抵御简单的攻击变化,关注和准确地模仿眼部基于照片。
texture-based欺骗人脸检测方法主要使用照明特点之间出现不同的二维平面和三维立体对象或使用质地细腻欺骗面临数据之间的差异和生活面临数据通过印刷等外部介质(4- - - - - -8]。这个方法主要是使用本地图像描述符如枸杞多糖(局部二进制模式)(9)来表达不同的纹理特征之间的生活和欺骗的脸图像。这种texture-based方法一直在积极研究由于轻松的实现和检测时间短的优点;然而,这些方法很难分类活性在不均匀图像或图像大量的噪音。最近,研究人员一直在致力于发现欺骗面临使用卷积神经网络(cnn) [10,11]。因为这种方法可以有效地获得特性通过学习,其性能得到了改进现有texture-based检测方法。
虽然欺骗人脸检测领域的发展,现有方法主要关注脸图像的亮度信息。更具体地说,其他颜色信息,这类似于亮度信息,欺骗人脸检测中常常被忽视。因此,通过考虑颜色和亮度信息的脸图像,提出了一种方法,独立地从亮度和颜色空间提取纹理特征脸的图像使用枸杞多糖(12]。
区别真正的脸和欺骗的脸是歧视使用描述符(比如LBP)编码比较结果对周围的像素值在一个二进制模式像素位置。然而,由于可以产生高分辨率图像,很难区分真实详细的表面差异和欺骗面孔只使用像素亮度。
在本文中,我们提出一个活性基于卷积神经网络的人脸检测方法利用人脸图像的颜色和纹理信息。该方法分析了结合彩色纹理信息的亮度和色差通道使用枸杞多糖描述符。分析的彩色纹理信息,Cb, S和H乐队使用的颜色空间。
剩下的纸是组织如下。在第二节,相关的关键技术进行了说明。该方案为我们color-texture-based antispoofing提出了第三节。第四节全面介绍了结果和讨论。最后,给出了结论第五节。
2。相关的工作
2.1。面对Antispoofing
传统的脸antispoofing方法通常创建欺骗模式从脸图像进行特征提取。经典的局部描述符如枸杞多糖(13],筛选[14],[冲浪15,猪16),和狗17)是用于提取帧水平函数,而方法如动态纹理(18,微动19),和眼睛闪烁(20.)提取视频特征。
最近,研究了几种基于深度学习方法来防止脸欺骗在帧和视频的水平。在坐标系水平方法(21- - - - - -24],pretrained CNN模型精确提取特征从二进制分类设置25- - - - - -27]。
2.2。颜色空间
RGB颜色空间通常用于传感和显示彩色图像。然而,它的使用在图像分析通常是有限的,因为三种颜色(红、绿、蓝色)是不分开的根据亮度和色差信息。因此,通常此外RGB信息转换成YCbCr和HSV信息之前使用。后面这两个颜色空间是基于亮度和色度信息(28- - - - - -31日]。特别是YCbCr彩色空间分离RGB亮度(Y),色度蓝、色度红色。同样,HSV颜色空间使用色相和饱和度的维度来定义图像的颜色差异,和价值维度对应的亮度。
2.3。枸杞多糖(局部二进制模式)
枸杞多糖(32,33是图像纹理分类的功能开发。从那时起,枸杞多糖用于人脸识别。枸杞多糖是一种操作简单用于图像分析和识别和健壮的歧视和照明的变化。方程(1)是一种枸杞多糖方程:
在这里,范围在扣除中心像素和像素值中心像素方程(1)。在图1,P相邻像素的数量和吗R是圆的半径。图2显示了一个示例枸杞多糖操作的结果应用于一个真正的照片(34]。
(一)
(b)
(c)
3所示。提出方案Color-Texture-Based Antispoofing
RGB颜色空间组件包含三个颜色,红色,绿色和蓝色;颜色YCbCr空间包含亮度和饱和度信息,和HSV颜色空间包含三个组件:色调,饱和度和亮度。每个颜色空间包含不同的信息和有自己的特点。RGB含有丰富的空间信息,最接近的颜色被人类,而YCbCr和HSV颜色空间包含亮度信息更敏感。RGB颜色空间可转化为HSV YCbCr,和具体计算如下:
显示为YCbCr计算公式
在现有的方法中,RGB图像转化为YCbCr和HSV颜色空间,和欺骗图像分类运用每个颜色空间的枸杞多糖。然而,这种方法的计算量增加了,因为它使用一个6通道颜色空间。图3显示了现有的概念图的方法。
三路在这篇文章中,我们使用一个颜色空间组成的Cb,年代,和V,许多面部特征可以派生。该方法的目的是对高速加工和鲁棒性对照明面临antispoofing的变化。图4显示了该方案的概念图。
这种方法的优点总结如下:(1)这方案减少了错误检测三路通过使用彩色空间足够的面部特征信息表达(2)本方案使用更少的内存更少的特征维度,从而使高速处理
4所示。绩效评估
4.1。火车/测试数据集
在本文中,我们进行了欺骗人脸检测测试使用CASIA Antispoofing数据库(CASIA-FASD) [35为绩效评估。CASIA-FASD由真正的视频和假脸视频从50个不同的用户获得。真正的面对视频包含三种类型的视频:低质量,中等质量和高质量。同样,假脸视频包含三种类型的伪造攻击的视频:打印照片的攻击,减少攻击,照片和视频中继攻击。视频20人用于学习,而其余的视频30人用于绩效评估。
我们从CASIA-FASD数据集提取每一帧视频图像的性能评估。总共4577人生活的脸图像,5054年印刷摄影攻击图像,2368削减攻击图像、照片和4429视频再现攻击图像被用于学习。此外,5912住脸图像,7450打印照片攻击图像,4437削减攻击图像、照片和5652视频再现攻击图像被用于评估。表1显示了CASIA-FASD的数据分区的详细信息。
4.2。实验装置
在本文中,我们使用FPGA的性能评估。我们评估该方案的性能通过使用FPGA的AI加速器。FPGA的规范和执行董事会在图所示5。
Zynq®UltraScale +™MPSoC设备提供64位处理器可伸缩性,同时结合实时控制和软、硬引擎图形、视频、波形和包处理。建立在一个共同的实时处理器和可编程logic-equipped平台,三个不同的变体(双重应用处理器(CG)设备,四应用处理器和GPU (EG)的设备,和视频编解码器(EV)设备),为各种应用程序创建大量的可能性等5 g无线,下一代ADAS和工业物联网技术(36]。
葡萄的人工智能是Xilinx开发堆栈AI推理在Xilinx的硬件平台上,包括设备和边缘Alveo卡片。工具,它包含一个优化的IP库,模型和设计实例。葡萄AI设计效率高和易于使用,导致AI潜力巨大加速度在Xilinx FPGA和ACAP [37]。
面对antispoofing检测使用AlexNet基于CNN。AlexNet利用卷积的一层是一个基本的模型,一个汇聚层,和一个完全连接层38]。
卷积AlexNet包括五个层次和三个全接触(FC)层,在最后FC层使用softmax作为一个活跃的功能类别分类。图6显示Alexnet CNN架构。
4.3。实验分析方法
评估拟议的计划,我们测量了ht (CASIA-FASD一半总错误率)数据集。ht是计算使用错误接受率(远)和错误拒绝率(FRR)攻击数据集,这两个定义如下。ht计算给定如下(39]:
远(40)是一种生物识别安全系统的可能错误地接受一个未经授权的用户访问尝试。系统的一般定义是错误的数量比接受的数量除以识别的尝试。
FRR [41)是一种生物识别安全系统的可能错误地拒绝由授权用户访问尝试。系统的FRR通常被定义为假拒绝的数量的比率除以数量的识别。
小ht值表明性能良好,ht只用误分类率定义。此外,无论何时(等于错误率)指FRR和远值收敛的速度,一个小值也显示良好的性能。
无论何时(42)是一种生物识别安全系统算法用于预先确定的阈值和FRR。利率相等时,共同的价值被称为平等的错误率。呃,越低越好生物识别系统的准确性。
ROC曲线(接受者操作特征)是一个图形化的情节,说明了二元分类器系统的诊断能力作为其歧视阈值是不同的。ROC曲线是由策划真正积极率对假阳性(TPR)率(玻璃钢)在不同的阈值设置。
AUC(曲线下的面积)是ROC曲线下的面积。如果AUC值很高,这意味着分类对象的模型具有良好的性能。
4.4。实验结果和讨论
来验证该方案的性能,八个场景比较和测试使用CASIA-FASD攻击数据集。
表2显示HTERs CASIA-FASD数据集根据八个不同的场景。该方法显示打印照片攻击的改进的性能,减少攻击,照片和视频重播攻击。图7显示了CASIA-FASD数据集的性能比较。
表3显示了曾经为CASIA-FASD数据集值根据八个不同的场景。与该方案相比,只有“YCbCr_lbp + HSV_lbp”计划绝对具有良好的性能。
接受者操作特征(ROC)曲线。这些曲线显示了错误的假阳性对真阳性的比例。ROC曲线是最好的用于比较不同系统的性能。数据8和9显示CASIA-FASD ROC曲线为每个场景生成的数据集。
(一)
(b)
(c)
(d)
(一)
(b)
(c)
(d)
表4显示了远、FRR和曲线下的面积(AUC)结果数据集根据CASIA-FASD八个不同的场景。高AUC表明良好的性能。
表5显示了不同的面部欺骗攻击的准确性。YCbCr_lbp + HSV_lbp的精度最高,但该方法显示类似的性能。
本文的总体测试结果如表所示6。现有YCbCr_lbp + HSV_lbp方法相比,该方法提出了改进的性能对打印照片的攻击(0.18%),降低攻击(0.69%)、照片和视频重播攻击(1.52%),0.73%的总体性能改善。此外,犯错很低,而精度值是相同的。总的来说,YCbCr_lbp + HSV_lbp方法显示出类似的性能,但使用六色空间通道,同时该方法只使用三色的空间通道,导致更快的计算速度。
5。结论
在本文中,我们提出了一个脸antispoofing方法利用CNN学习和推理和构造的重要参数,通过枸杞多糖提取纹理信息从图像的颜色空间。CASIA-FASD用作性能验证数据集。图像提取视频和分为打印照片的攻击,减少攻击,照片和视频重播攻击。这些图片从CASIA-FASD中提取数据集是用于培训和评估。确认检测性能是提高了分离脸图像的颜色空间除了Cb,年代,和V的颜色空间,这对于antispoofing非常有用。在先前的研究中,6通道(YCbCr + HSV颜色空间通常使用,导致巨大的计算成本。相反,该方法减少了计算负载,而不是考虑只有三个(Cb S V)颜色空间通道。考虑到人工智能FPGA板,现有方法的性能进行了评估与建议方案。这是证实,该方法可以有效地用于边缘环境。
作为未来的工作,我们要验证性能对另一个著名的脸恶搞数据集。此外,我们计划数据库之间进行性能测试。
数据可用性
发现用于支持的数据都包含在本文。
的利益冲突
作者宣称没有利益冲突。
确认
这项工作是由BK21四(培养优秀大学的研究)(没有。5199990914048),这项研究受到了基础科学研究项目通过韩国国家研究基金会(NRF)由教育部(NRF - 2020 r1i1a3066543)。此外,这项工作得到了Soonchunhyang大学研究基金。