对于人脸识别系统,活性检测可以有效地避免非法欺诈和提高人脸识别系统的安全性。常见的脸攻击包括打印照片和视频重播攻击。本文研究了差异照片,视频,和真正的面孔在静态结构和运动信息,提出了一种生活检测结构基于特征融合和注意力机制,动态和纹理融合网络(DTFA-Net)的关注。我们提出了一个动态的信息融合结构的河道间关注块融合光流的大小和方向提取面部运动特征。此外,对于猪算法复杂光照下的人脸检测失败,我们提出了一个改进的射线图像预处理算法,有效地提高了人脸检测的能力。我们进行了实验CASIA-MFSD和再现攻击数据库。根据实验,DTFA-Net提出了实现ht CASIA曾经6.9%和2.2%在与其他方法的重放攻击。
在识别与人脸识别技术的应用场景,如访问安全检查和付款,攻击和欺诈的方法对人脸识别系统也出现。脸显然是一个更容易的方法盗取身份信息比虹膜、指纹等生物特征。攻击者可以很容易地偷图片或视频的合法用户在社交网站上,然后启动打印或重放攻击的人脸识别系统。一些人脸验证系统使用技术,如跟踪定位要点在脸上,要求用户完成操作如眨眼,摇头,大声朗读文本和使用运动检测来确定当前图像是一个真正的脸。这种方法不适合无声检测场景。此外,一些研究人员使用红外摄像机、深度相机,和其他传感器收集不同的脸图像实现生活模式检测(
真正面对图像通常是直接由摄像机拍摄的,而攻击面对图片收集了许多倍。如图
面对印刷和再现攻击的图像。面对攻击已经收集了许多次,显示纹理特征的区别,光,图像质量,真正的脸。
神经网络权重可视化的一层深度真实的纹理信息提取。面对不同区域在生活中占据不同的权重检测任务。
最假的脸难以模拟真实面孔的生命体征,如头部运动,嘴唇蠕动,闪烁。与此同时,由于背景噪音,皮肤纹理,和其他因素,真正的脸在某些频段的动态特性明显高于欺诈性的脸,它提供了区分真正的脸从欺诈的基础。光流场的变化是这类算法的一个重要基础。然而,运动所产生的动态信息和弯曲的照片会影响生命信号的提取。远程photoplethysmography (rPPG)是另一种有效的非接触生活信号提取方法,它提供了一种依据脸生活检测通过观察图像计算血流量和流速的变化(
这项工作提出了一个网络融合动态和纹理信息代表的脸和检测到的攻击。光流法计算面临的两个相邻帧图像的运动变化。光学流产生的弯曲和运动的照片不同于生成的光流运动的真实面对的方向位移。我们使用一个简单的卷积神经网络具有相同的结构来描述位移的大小和方向。然后,融合功能模块是专为上述两种表示形式的组合,在此基础上,可以进一步提取面部运动特性。此外,RGB图像用于提取脸部区域的纹理信息。通过给不同的注意的部分的脸,我们提高了网络的能力代表生活的面孔。
人脸检测算法广泛应用于活体检测任务,可用于定位的脸,从而消除背景干扰的活体检测的信息。本文对人脸检测场景复杂的照明下,我们提出一种改进的图像预处理算法结合局部对比度面对区域,这有效地提高了人脸检测算法的性能。
生活验证完成通过使用之间的区别真正的面对表面纹理和重放图像,三维结构,图像质量,等等。Boulkenafet et al。
一些研究人员提出了一个面对生活基于动态特性的检测算法通过分析面对运动模式和显示良好的性能在相关数据集(
此外,一些研究人员结合不同的检测设备或系统模块融合不同层次的信息,这有效地提高生活检测的准确性(
为了消除背景干扰的生活信息提取的过程中,有必要对部分区域的图像。传统的检测技术可以分为三类:基于特征的人脸检测、人脸检测基于模板和基于统计的人脸检测。本文运用脸前检测Dlib提供的API,它使用梯度方向直方图特性来实现人脸检测。人脸检测算法基于梯度方向直方图可以保持良好的不变性的图像纹理和光学变形,忽略了轻微的纹理和表达的变化。
面向梯度直方图(猪)是一种方法来描述图像的局部纹理特征。该算法将图像划分为小空间,每个空间计算像素点的梯度。所示的像素点梯度计算以下方程:
猪功能面临地区光条件下的影子。需要初始化的脸图像因为造成的阴影或接触复杂的光可以影响区域梯度信息。
传统的图像灰度校正方法通过选择合适的图像的亮度变化<我t一个lic>
γ我t一个lic>操作符,如下所示:
其中,本地的具体计算过程规范化的特点<我t一个lic>
N我t一个lic>如下:
计算最大像素值<我nline-formula>
计算的平均价值<我nline-formula>
计算的最大价值<我nline-formula>
计算像素的比例(<我t一个lic> x, y我t一个lic>)附近的像素,
我们用算法(
对比(
节
动态和纹理特征融合的关注网络(DTFA-Net)架构。图中省略了ReLU和池层卷积后层,和卷积的id是显示在顶部。颜色代码如下:粉色=卷积;蓝色=融合块;灰色=空间的关注;绿色=完全连接层。
本文生成光学流场变化的地图相邻两帧的脸视频光流方法。光流改变面对地区提取动态特性融合子网在二维位移和大小,和两个维度的特征融合特征融合块提取脸部区域的动态信息。
本文提出的密集的光流法Farneback [
光学流动显示的两个相邻面区域:(a)可视化光学流向的变化:色调=方向的光流,饱和= 255,和价值= 255;(b)级光学流可视化:色调= 255,饱和度= 255,和价值=光流的大小。其中,左侧两个光流的变化真实的脸,和正确的两组照片中的光学流变化的攻击。
融合注意模块的架构。
为了提高模型的描述能力,我们使用SE结构(
Mag_Conv1-5的网络。
| 层 | 输入的大小 | 内核大小 | 过滤器 | 步 |
|---|---|---|---|---|
| Mag_Conv1 | 227年<我nline-formula>
| 11<我nline-formula>
| 96年 | 4 |
| MaxPooo1 | 27<我nline-formula>
| 3<我nline-formula>
| 2 | |
| Mag_Conv2 | 27<我nline-formula>
| 5<我nline-formula>
| 192年 | 1 |
| MaxPool2 | 27<我nline-formula>
| 3<我nline-formula>
| 2 | |
| Mag_Conv3 | 13<我nline-formula>
| 3<我nline-formula>
| 384年 | 1 |
| Mag_Conv4 | 13<我nline-formula>
| 3<我nline-formula>
| 256年 | 1 |
| Mag_Conv5 | 13<我nline-formula>
| 3<我nline-formula>
| 256年 | 1 |
融合注意模块的结构。
| 层 | 输入的大小 | 内核大小 | 过滤器 | 步 |
|---|---|---|---|---|
| GlobalAvgPool | 13<我nline-formula>
| 13<我nline-formula>
| 1 | |
| Fc1 | 512年 | |||
| Fc2 | 32 | |||
| LK_Conv | 13<我nline-formula>
| 3<我nline-formula>
| 256年 | 2 |
| LK_MaxPool | 6<我nline-formula>
| 3<我nline-formula>
| 1 |
FC1图的结构
| 层 | 输入的大小 | 输出的大小 |
|---|---|---|
| FC1_1 | 256年<我nline-formula>
| 256年<我nline-formula>
|
| FC1_2 | 256年<我nline-formula>
| 256年<我nline-formula>
|
| FC1_3 | 256年<我nline-formula>
| 256年<我nline-formula>
|
在特定的,我们输入篮板图像映射到中间特征图谱通过TexConv1-4尺寸384,然后多注意一些地区通过空间注意机制,然后注意模块的输入输出TexConv5和全连接层FC2进行特征提取。卷积的结构层TexConv1-5表所示
FC2-3图的结构
| 层 | 输入的大小 | 输出的大小 |
|---|---|---|
| FC2_1 | 256年<我nline-formula>
| 256年<我nline-formula>
|
| FC2_2 | 256年<我nline-formula>
| 256年<我nline-formula>
|
| FC3_1 | 256年<我nline-formula>
| 256年<我nline-formula>
|
| FC3_2 | 256年<我nline-formula>
| 256年 |
| FC3_3 | 256年 | 2 |
空间的关注。我们介绍这个模块后的卷积层子网提取的静态特性,使不同的当地。
最后,我们利用element-wise产品输入<我t一个lic>
F我t一个lic>
通过以上两个子网,分别得到了动态信息和纹理信息。一系列完全连接层,辍学层,和激活函数,我们完全融合这两个信息,学习的动态和静态特性之间的非线性关系,并获得的二维表示面对生活信息检测,如表所示
我们使用CASIA-MFSD [
CASIA-MFSD预处理后的例子。从左到右:纹理图像,光流大小和光学流方向。其中,(一)假脸和(b)真正的脸。
本实验使用错误接受率(远),错误拒绝率(FRR),平等的错误率(曾经),半总错误率(ht)。面对生活检测算法都是基于这些指标。远指的比值判断假面临真正的脸;FRR指的比值判断真正的面对错误,计算公式如下所示:
该方法实现Pytorch与多变的学习速率(例如,lr = 0.01时时代< 5和lr = 0.001时代≥5)。模型的批量大小是128 num_worker = 100。我们初始化网络通过使用AlextNet100的参数。网络训练与标准为50或100时代SGD特斯拉V100 GPU。我们利用交叉熵损失,输入分辨率为227×227。
我们进行了一次消融实验注意模块的纹理特征提取子网,只有依靠纹理特征对CAISA执行现场检测数据集。我们培训了两个纹理特征提取网络有或没有空间注意块50倍,分别验证了他们在CASIA测试集。图
网损和ROC曲线有或没有空间关注模块:(a)培训损失随着时间步的流逝;(b) ROC曲线。
想象我们的空间注意机制的输入和输出结果模块,如图
体重变化前后热图空间关注模块:(a);(b)。空间关注模块抓好面临的一些功能区域。
我们首先不使用SA训练DTFA网络在某种程度上,然后添加SA结构训练100倍,这样的空间注意模块可以更好的学习面临区域信息,加快模型收敛。图
DTFA-Net epoch49 - 89年培训和评估结果:(a)的损失波动模型训练epoch49 - 89年;(b)的AUC结果模型在测试集epoch49 - 89;(c)的ACC结果模型在测试集epoch49 - 89;(d)的错结果模型在测试集epoch49 - 89。
表
对比我们的方法和其他intradatabase。
| 方法 | CASIA-MFSD | 重放攻击 | |
|---|---|---|---|
| 无论何时(%) | 无论何时(%) | ht (%) | |
| 枸杞多糖( | 18.2 | 13.9 | 13.8 |
| IQA [ | 32.4 | - - - - - - | 15.2 |
| 美国有线电视新闻网( | 7.4 | 6.1 | 2.1 |
| LiveNet [ | 4.59 | - - - - - - | 5.74 |
| DTFA-Net(我们的) | 6.90 | 6.47 | 2.2 |
图
错误和正确检测样品。左:假阴性结果;右:真阳性的情况。
本文分析了照片和视频重播攻击的脸欺骗和建立了一个关注网络结构集成动态纹理特性和设计一个动态信息融合模块,从纹理图像中提取特征基于空间注意机制。同时,提出了一种改进的射线图像优化算法对预处理的图像人脸检测任务在多个灯饰。
CASIA-MFSD数据用于支持本研究的发现是由CASIA许可制,所以不能免费提供。请求访问这些数据应该CASIA通过
作者宣称没有利益冲突。
这项工作得到了中国国家重点研发项目(批准2018 yfb1600600),中国国家自然科学基金(批准51278058),111年汽车基础设施提供商的项目信息传感及其(格兰特B14043),陕西省自然科学基础研究项目(批准号。2019纽约- 163和2020 gy - 018),联合实验室网络的车辆,Education-China部移动通信公司(格兰特213024170015),和特殊的资金基础科学研究中央大学、长安大学、中国(批准号300102329101和300102329101)。