在人脸识别系统中,高度健壮的面部特征表示和良好的分类算法性能会影响在无限制条件下人脸识别的效果。探索卷积神经网络(CNN)的抗干扰性能的深度学习(DL)框架重构图像特征提取(FE)和识别,在论文中,首先,初始结构GoogleNet网络和剩余误差ResNet网络结构相结合构建一个新的深度重建网络算法,随机梯度下降(SGD)和三联体损失函数作为模型优化和分类器,分别在标记应用于人脸识别面临在野外数据库面临伦敦时装周开幕。然后,肖像金字塔分割和地方特征点细分应用图像提取的特征的面孔,和面部特征点的匹配是通过使用欧氏距离和联合贝叶斯方法。最后,使用Matlab软件模拟算法提出并与其他算法进行比较。结果表明,该算法的人脸识别效果最好,当学习速率为0.0004,衰减系数为0.0001,SGD训练方法,和辍学是0.1(精度:99.03%,损失:0.0047、培训时间:352年代,和过度拟合率:1.006),和本文提出的算法最大的意思是平均精度比其他CNN算法。正确的面对特征匹配算法的提出为84.72%,高于LetNet-5, VGG-16,和VGG-19算法,正确的利率是6.94%,2.5%,和1.11%,分别,但低于GoogleNet, AlexNet, ResNet算法。同时,本文提出的算法有更快的匹配时间(206.44秒)和正确匹配率(88.75%)高于联合贝叶斯方法,表明深重建网络算法提出了可用于图像识别,铁、和匹配,它有很强的抗干扰。
FR身份识别技术已被广泛采用,但它主要是用来检测生物特性的脸识别,具有较强的独特性和安全(
深度模型已经应用在许多领域,及其在图像识别中的应用是第一个担心。此外,深度模型用于图像中菲,这远比手动FE,可以有效地应用于领域人工铁并不完美(
剩下的纸是组织如下。部分
神经网络是一种常见的计算机模型,主要是基于传统的统计建模复杂的关系,探索不同数据集之间的关系。神经网络结构在不同的应用领域不同,但神经网络结构与图像相关的领域中最大的应用是CNN。Seeliger等人应用DCNN magnetoencephalogram信号的检测和重建大脑皮层活动模型映射基于源(提取的决议
他们利用软阈值收缩的比例系数优化DCNN,被发现是适用于噪声去除图像中(
图像铁的基本原理是使用计算机提取图像中的信息,然后判断的差异图像是图像中的特征之一。一个图像有限元算法和周提出基于二维经验模态分解和尺度不变的特征变化。验证后,他们发现它可以有效改善铁的速度和准确性
总之,很明显,DCNN广泛用于图像识别。改进的DCNN可以有效地提取图像中的特征。然而,很少有研究的DCNN抗干扰脸上图像识别。因此,提出了基于咖啡的DCNN深度框架。Matlab仿真软件是用来探索不同的参数设置的影响FR通过构造DCNN模型的性能。然后,伦敦时装周的数据库和自我构建数据库本文结合探索的抗干扰性能DCNN模型构建本文的脸在不同的场景中图像识别。本文的结果旨在为提高FR的效率奠定基础。
现有的研究表明,CNN结构的逐步深化,CNN培训结果变得更好,但同时提高的结果,它也将增加网络计算(
在卷积神经网络,5<我nline-formula>
改进的初始结构。
ResNet的结构可以有多达152层(
不同年代的不同网络的结构。左边是一个普通的网络,和在ResNet残余网络。
卷积的卷积层分支<我talic>
F (x, {Wi})剩余的单元可以由多个层,和剩余单位也可以修改扩展的映射分支,卷积核大小、辍学,激活函数的位置。因此,一个新的DCNN网络结构是构建基于GoogleNet网络的初始结构和残余ResNet网络结构,提高网络的计算效率和信息流通的效果。合并后的新网络结构如图
(一)ResNet-Inception-1结构;(b) ResNet-Inception-2结构;(c) ResNet-Inception-3结构。
深度重建网络构造的基本参数摘要如表所示
ResNet-Inception网络结构的基本参数。
| 结构 | 参数 | 输出图像的大小 |
|---|---|---|
| Conv-1 | 3<我nline-formula>
|
147年<我nline-formula>
|
| Conv-2 | 3<我nline-formula>
|
145年<我nline-formula>
|
| Conv-3 | 3<我nline-formula>
|
145年<我nline-formula>
|
| Pool-1 | - - - - - - | 73年<我nline-formula>
|
| Conv-4 | 1<我nline-formula>
|
73年<我nline-formula>
|
| Conv-5 | 3<我nline-formula>
|
70年<我nline-formula>
|
| Conv-6 | 3<我nline-formula>
|
33<我nline-formula>
|
| ResNet-Inception-1 | 5 | 33<我nline-formula>
|
| Reduction-1 | - - - - - - | 16<我nline-formula>
|
| ResNet-Inception-2 | 10 | 16<我nline-formula>
|
| Reduction-2 | - - - - - - | 8<我nline-formula>
|
| ResNet-Inception-3 | 5 | 8<我nline-formula>
|
| Pool-2 | - - - - - - | 1792年 |
| 辍学 |
|
1792年 |
神经网络作为分类器经常使用Softmax深处,和三联体损失函数是一个分类器函数提出了人脸识别cnn谷歌。研究也表明,对伦敦时装周的数据集的识别率达到了99.63%,和YouTube数据集上的识别率也达到95.12% (
此时,三联体损失的数学表达式如下:
在神经网络的训练过程,对应于每个参数的梯度方程如下:
为了提高优化效率的模型,在线方法用于选择三胞胎的结合。同时,为了防止模型落入局部最优解的状态,<我nline-formula>
中心损失可以确保在培训过程中不同类别的样本的分离也确保同一类别的样本之间的聚合特征(
因此,方程预测之间的距离之和越小的特点和功能中心中的每个示例批处理,也就是说,类内距离越小,性能越好。
的<我nline-formula>
然后,网络的误差函数可以定义如下:
在拍照的过程中,人们可能没有完全暴露他们的脸由于相机角度,光线,情绪,和设备。为了检测在不同位置或不同角度的图像,它需要首先改变滑动窗口的规模或输入图像。滑动窗口也需要扫描输入图像按照一定的步长(<我nline-formula>
人脸检测在形象的流程图。
摘要DCNN用于处理每个脸图像位于图像金字塔根据输入订单,和潜在的地区检测到人脸图像在同一时间。坐标点和特定区域的大小脸的图像记录。毕竟图片处理,响应点的所有地区检测到图像相对地映射到原始图像输入的输入层。然后,图像的重叠区域融合得到最终结果。随后,面对矫直阶段执行没有对齐,在不同姿势和脸部特征提取,主要部分图像周围的眼睛,嘴角,和鼻子的顶端面对图像,如图
提取面部特征点和subfigures每个区域。
随后,欧几里得距离(
脸部特征点的匹配过程。
在第一步中,有必要迅速判断很容易判断的样本图像样本匹配的脸。欧几里得距离用于样本之间的相似度,然后,两点之间的绝对距离空间中计算如下:
在第二步中,在保证功能的前提下识别率面对图像,学习算法具有更高的识别率是用来模拟面对图像的特性,和完整的脸特征的相似性匹配实现样品的精制的判断。很明显从图
除此之外,在第二步中,联合使用贝叶斯计算样本之间的相似性。假设两个面孔的联合分布<我talic>
x
在本文中,使用Matlab软件模拟深度重建网络,和LFW数据集用于训练和测试。本文以下实验进行TensorFlow平台Linux作为操作系统和2<我nline-formula>
为了评估算法的效果在面对菲,10140年有1150人从伦敦时装周的数据集的图像选择,和180对正面脸样本和180对负样本和测试样本对随机选择的。然后,建设网络是用于执行面对铁,和最简单的欧几里得距离是用来匹配特性相似。最后,分类精度和匹配精度是用来评估的有效性面临铁。随后,这些10140张照片是用来继续细分。有1050人选择面部特征的图像匹配算法的训练。剩下的100个人的形象,200对正样本和200对负样本是随机选择的验证。识别准确率,阳性样本误差率,负样本错误率,配对正确的速度,和配对的平均时间是用来评估面临的匹配效应特性。
在目标识别和检测和识别领域,地图通常用于评估算法检测和识别的影响(
精确率的计算公式(前)和召回率(召回)如下:
使用精确率作为纵轴和召回率作为横轴,P-R曲线。P-R曲线下的面积平均精度(美联社),和地图是美联社的平均在每个类型的分类任务指标。此外,过度拟合率(或)用来评估算法。或的计算方程如下:
通过调整学习速率<我talic>
η,衰减系数<我nline-formula>
识别精度的比较不同的学习速率。
比较训练不同的学习速率的价值损失。
然后,不同的学习速率的影响人脸识别算法的性能的定量比较。很明显从表
不同的学习速率的影响训练效果的深度重建网络算法。
|
|
Acc (%) | 损失 | 培训时间(年代) | 过度拟合率 |
|---|---|---|---|---|
| 0.0004 | 99.03 | 0.047 | 352年 | 1.006 |
| 0.0005 | 96.74 | 0.059 | 354年 | 1.006 |
| 0.0006 | 93.15 | 0.062 | 368年 | 1.082 |
| 0.0007 | 90.31 | 0.120 | 370年 | 1.005 |
| 0.0008 | 88.07 | 0.115 | 400年 | 1.011 |
| 0.0009 | 86.41 | 0.170 | 398年 | 1.026 |
| 0.001 | 85.05 | 0.206 | 405年 | 1.058 |
不同的衰减系数的影响<我nline-formula>
比较不同衰减系数的识别精度。
培训损失价值的比较不同的衰减系数。
然后,不同的衰减系数的影响人脸识别算法的性能定量比较。很明显从表
不同的衰减系数的影响深度重建网络算法的训练效果。
|
|
Acc (%) | 损失 | 培训时间(年代) | 过度拟合率 |
|---|---|---|---|---|
| 0.0001 | 99.03 | 0.047 | 352年 | 1.006 |
| 0.0009 | 97.63 | 0.048 | 342年 | 1.006 |
| 0.001 | 95.17 | 0.102 | 358年 | 1.037 |
在比较不同训练方法对模式识别的影响率,结果如图
比较六训练方法的识别精度。
比较的训练六个训练方法的价值损失。
然后,不同训练方法对人脸识别的影响,定量比较算法的性能。很明显从表
不同的训练方法训练效果的影响深度重建网络算法。
| 训练方法 | Acc (%) | 损失 | 培训时间(年代) | 过度拟合率 |
|---|---|---|---|---|
| Adadelta | 97.45 | 0.062 | 357年 | 1.010 |
| 亚当 | 97.05 | 0.087 | 388年 | 1.012 |
| 纳丹 | 96.87 | 0.132 | 438年 | 1.016 |
| RMSprop | 96.14 | 0.147 | 351年 | 1.129 |
| SGD | 99.03 | 0.047 | 352年 | 1.006 |
| Adagrad | 94.91 | 0.187 | 422年 | 1.158 |
最后,不同的辍学值对模型的影响识别率比较。结果如图
比较不同的辍学值的识别精度。
比较的培训损失值和不同的辍学值。
然后,不同的辍学值的影响人脸识别算法的性能的定量比较。很明显从表
不同的辍学值对训练效果的影响深度重建网络算法。
| 辍学 | Acc (%) | 损失 | 培训时间(年代) | 过度拟合率 |
|---|---|---|---|---|
| 0.1 | 99.03 | 0.047 | 352年 | 1.006 |
| 0.2 | 98.83 | 0.057 | 347年 | 1.006 |
| 0.3 | 97.20 | 0.087 | 348年 | 1.009 |
| 0.4 | 97.05 | 0.112 | 351年 | 1.017 |
| 0.5 | 96.23 | 0.127 | 340年 | 1.027 |
| 0.6 | 95.93 | 0.153 | 337年 | 1.518 |
它是集<我talic>
η= 0.0004,<我talic>
λ= 0.0001深重建网络,建设SGD选择训练方法,和辍学= 0.1。然后,不同的激活函数对模型的影响识别率比较,如图
比较六激活函数的行为识别的准确性。
比较的行为训练六个激活功能的衰退。
然后,不同的激活函数的影响人脸识别算法的性能的定量比较。很明显从表
不同的激活函数的影响训练效果的深度重建网络算法。
| 激活函数 | Acc (%) | 损失 | 培训时间(年代) | 过度拟合率 |
|---|---|---|---|---|
| 乙状结肠 | 95.17 | 0.091 | 382年 | 1.007 |
| 线性整流函数(Rectified Linear Unit) | 99.03 | 0.047 | 352年 | 1.006 |
| 双曲正切 | 98.52 | 0.053 | 341年 | 1.007 |
| LeakyReLu | 97.11 | 0.073 | 350年 | 1.006 |
| ELU | 96.78 | 0.087 | 349年 | 1.007 |
| MaxOut | 97.45 | 0.082 | 367年 | 1.006 |
基于上述结果,在深度重建网络构建本文<我nline-formula>
比较P-R曲线不同模型的人脸识别性能。
本文提出的人脸识别和有限元算法应用于伦敦时装周的数据提取和匹配特性。结果如图所示
脸图像FE和匹配。不同颜色的圆在同一画面显示不同的提取特性,和同样的颜色在不同的图片在同一组表明匹配相似的特征。
然后,本文构造深度重建网络算法应用于铁和人脸图像中特征匹配,性能与其他模型相比。很明显从表
面部菲比较不同模型的性能。
| 算法 | 正确训练分类的数量 | 训练分类精度(%) | 验证正确的日志 | 验证正确匹配率(%) |
|---|---|---|---|---|
| LetNet-5 | 9028年 | 95.84 | 280年 | 77.78 |
| VGG-16 | 9117年 | 96.78 | 296年 | 82.22 |
| VGG-19 | 9137年 | 97.00 | 301年 | 83.61 |
| GoogleNet | 9239年 | 98.08 | 307年 | 85.28 |
| AlexNet | 9281年 | 98.52 | 310年 | 86.11 |
| ResNet | 9269年 | 98.40 | 312年 | 86.67 |
| 我们的方法 | 9226年 | 97.94 | 305年 | 84.72 |
| LetNet-5 | 9028年 | 95.84 | 280年 | 77.78 |
匹配的人脸图像特征提取的效果比较。总识别率的比较结果如表所示
总识别率的比较不同模型的面部特征。
| 算法 | 识别正确的对数 | 识别正确的日志率(%) | 日志出错率的正样本(%) | 对数错误率的负样本(%) |
|---|---|---|---|---|
| LetNet-5 | 339年 | 84.75 | 13.5 | 17 |
| VGG-16 | 340年 | 85年 | 14.5 | 15.5 |
| VGG-19 | 342年 | 85.5 | 15 | 14 |
| GoogleNet | 350年 | 87.5 | 14 | 11 |
| AlexNet | 352年 | 88年 | 11.5 | 12.5 |
| ResNet | 354年 | 88.5 | 10.5 | 12.5 |
| 我们的方法 | 355年 | 88.75 | 11 | 11.5 |
的影响只使用联合贝叶斯方法和本文算法的匹配效果脸上特性进行比较,结果如表所示
总识别率的比较不同模型的面部特征。
| 算法 | 匹配时间(年代) | 匹配正确的日志 | 正确匹配率(%) |
|---|---|---|---|
| 美国贝叶斯 | 240.15 | 350年 | 87.5 |
| 我们的方法 | 206.44 | 355年 | 88.75 |
之前有研究表明,不同的参数设置会产生某些影响的识别率DCNN模型。在本文中,不同的学习速率的影响,培训方法、衰减系数和辍学的识别算法的性能进行了比较。研究表明,太大学习速率将导致算法在学习过程中出现不稳定,进而影响算法的性能(
面部特征主要分为颜色(肤色),轮廓(椭圆),照明(头发、眼睛和下巴),模板(均值和方差),变换域(表示)的特性,结构(面部对称性),镶嵌(镶嵌规则)和直方图特性(灰色分布)
本文构造一个新的深度重建网络使用GoogleNet网络的初始结构和残余结构ResNet网络,并应用于人脸识别算法的最优参数选择。基于该算法,面对金字塔分割和地方特性应用于构建一个面对有限元算法。发现它有一个铁的效果比一般的DCNN模型。最后,基于该算法,实现人脸特征匹配使用联合贝叶斯方法,验证结果。本文构造的结果表明,该模型能有效地识别脸部图像使用不同的干扰因素。然而,模型训练和验证只有通过数据库中的图像。特定的FR系统需要开发探索其应用效果的视频画像识别。总之,结果帮助后续发展的FR系统基于DCNN和FR的效率的提高。
所需的原始/处理数据复制这些发现也不能在这个时候作为数据共享一个正在进行的研究的一部分。
作者宣称没有利益冲突。