raybet雷竞app|雷竞技官网下载|雷电竞下载苹果

复杂性

1099 - 0526 1076 - 2787

Hindawi

10.1155 / 2021/8391973

8391973

研究文章

下的人脸图像的特征提取和抗干扰分析深度重建网络算法

https://orcid.org/0000 - 0003 - 2070 - 725 x

杨

金

https://orcid.org/0000 - 0001 - 7506 - 1703

赵

宇轩

https://orcid.org/0000 - 0002 - 5048 - 0335

杨

Shihao

https://orcid.org/0000 - 0002 - 1094 - 1555

康

鑫鑫

曹

《中国

曹

Xixin

Zhihan

大学软件与微电子学院的

北京大学

北京102600年

中国

pku.edu.cn

2021年

20. 3 2021年

2021年 19 7 2020年 11 9 2020年 23 9 2020年 20. 3 2021年

2021年

这是一个开放的文章在知识共享归属许可下发布的,它允许无限制的使用,分布和繁殖在任何媒介,提供最初的工作是正确的引用。

在人脸识别系统中,高度健壮的面部特征表示和良好的分类算法性能会影响在无限制条件下人脸识别的效果。探索卷积神经网络(CNN)的抗干扰性能的深度学习(DL)框架重构图像特征提取(FE)和识别,在论文中,首先,初始结构GoogleNet网络和剩余误差ResNet网络结构相结合构建一个新的深度重建网络算法,随机梯度下降(SGD)和三联体损失函数作为模型优化和分类器,分别在标记应用于人脸识别面临在野外数据库面临伦敦时装周开幕。然后,肖像金字塔分割和地方特征点细分应用图像提取的特征的面孔,和面部特征点的匹配是通过使用欧氏距离和联合贝叶斯方法。最后,使用Matlab软件模拟算法提出并与其他算法进行比较。结果表明,该算法的人脸识别效果最好,当学习速率为0.0004,衰减系数为0.0001,SGD训练方法,和辍学是0.1(精度:99.03%,损失:0.0047、培训时间:352年代,和过度拟合率:1.006),和本文提出的算法最大的意思是平均精度比其他CNN算法。正确的面对特征匹配算法的提出为84.72%,高于LetNet-5, VGG-16,和VGG-19算法,正确的利率是6.94%,2.5%,和1.11%,分别,但低于GoogleNet, AlexNet, ResNet算法。同时,本文提出的算法有更快的匹配时间(206.44秒)和正确匹配率(88.75%)高于联合贝叶斯方法,表明深重建网络算法提出了可用于图像识别,铁、和匹配,它有很强的抗干扰。

1。介绍

FR身份识别技术已被广泛采用,但它主要是用来检测生物特性的脸识别,具有较强的独特性和安全( 1]。然而,面对图像的数据集由一个呈现高度非线性分布,如果简单的分类方法,将会出现更高的分类错误由于个体差异( 2]。此外,面对图像将被照明,装饰,场景,拍摄期间和其他因素,这使得FR极其困难的。目前,常用的人脸检测方法包括主成分分析、支持向量机、CNN和活跃的变形模型( 3]。

深度模型已经应用在许多领域,及其在图像识别中的应用是第一个担心。此外,深度模型用于图像中菲,这远比手动FE,可以有效地应用于领域人工铁并不完美( 4]。DL和大多数机器学习的共同特征提取功能的能力。在DL,多层网络结构主要是应用,融合特征在图像形成顶部底部特征( 5]。ImageNet年度ImageNet大规模视觉识别的挑战是最大的和最先进的图像识别竞争的世界。自2012年以来,AlexNET DCNN用来降低识别错误率最高的5 - 16.4%,和DCNN算法采用了在随后的冠军识别模型( 6, 7]。

剩下的纸是组织如下。部分 2讨论了相关工作的DCNN铁技术网络和图像。然后,在节 3、深度重建网络提出了人脸识别和面部有限元算法构造了基于优化深度重建网络。部分 4进行人脸识别的验证和铁和匹配算法提出并比较它们与其它DCNN算法。部分 5本文探讨和分析获得的结果,和本文的结果与他人的相关研究成果。部分 6总结了论文的总结,指出了未来的研究方向。

2。相关工作

神经网络是一种常见的计算机模型,主要是基于传统的统计建模复杂的关系,探索不同数据集之间的关系。神经网络结构在不同的应用领域不同,但神经网络结构与图像相关的领域中最大的应用是CNN。Seeliger等人应用DCNN magnetoencephalogram信号的检测和重建大脑皮层活动模型映射基于源(提取的决议 8]。黄平君和康提出了一个基于CNN滚动轴的故障诊断方法和振动图像基于深度结构,发现该方法不需要有限元技术和嘈杂的环境下具有较高的诊断准确性和鲁棒性( 9]。目前,深度学习在图像分析领域得到了广泛的应用,尤其是面部图像识别,取得了良好的结果。张等人提出了一个基于三级过滤和卷积神经网络模型猪,这是应用于彩色脸图像的识别,获得很好的效果 10]。他等人提出了一个框架:基于深层神经网络的人脸识别和使用特性异常过滤器来检测奇异点。最后,与公共数据验证后,发现该模型由它有很强的人脸识别的鲁棒性 11]。Isogawa等人表示,没有去噪方法DCNN模型中的参数调整的能力。

他们利用软阈值收缩的比例系数优化DCNN,被发现是适用于噪声去除图像中( 12]。Nakazawa和Kulkarni提出一个方法来检测和段异常缺陷模式使用卷积encoder-decoder深处的神经网络结构,最后发现这些模型可以探测隐形缺陷模式从真实图像 13]。

图像铁的基本原理是使用计算机提取图像中的信息,然后判断的差异图像是图像中的特征之一。一个图像有限元算法和周提出基于二维经验模态分解和尺度不变的特征变化。验证后,他们发现它可以有效改善铁的速度和准确性 14]。许等人提出了一个模型来自动提取噪声感知特性基于CNN模型和特征向量,发现该算法提取的速度和精度高在不同噪音水平( 15]。Fieldin等人使用增强的自适应粒子群优化进行深CNN进化,训练和验证之后,他们发现提取错误率为4.78% ( 16]。

总之,很明显,DCNN广泛用于图像识别。改进的DCNN可以有效地提取图像中的特征。然而,很少有研究的DCNN抗干扰脸上图像识别。因此,提出了基于咖啡的DCNN深度框架。Matlab仿真软件是用来探索不同的参数设置的影响FR通过构造DCNN模型的性能。然后,伦敦时装周的数据库和自我构建数据库本文结合探索的抗干扰性能DCNN模型构建本文的脸在不同的场景中图像识别。本文的结果旨在为提高FR的效率奠定基础。

3所示。方法 3.1。设计深度重建网络结构

现有的研究表明,CNN结构的逐步深化,CNN培训结果变得更好,但同时提高的结果,它也将增加网络计算( 17]。因此,《盗梦空间》网络结构提出了GoogleNet网络,它可以充分利用特征提取每一层的网络结构可以增加网络的深度和复杂性,同时保证网络的计算复杂度。,一些网络参数的调整提出了GoogleNet网络的基本结构:(1)特性映射的输入网络的大小应该慢慢地减少了网络中避免瓶颈的特征表示图像中;(2)高维特征更容易获得比低维特征,可以加快训练速度模型;(3)相邻的神经元网络中有密切相关性,可以集成到空间关系在低维空间中。

在卷积神经网络,5<我nline-formula> ∗ 5大小卷积核是25/9 * 3的大小<我nline-formula> ∗ 3卷积。如果大的卷积内核可以叠加的多个3所取代<我nline-formula> ∗ 3大小卷积核,然后它可以使网络有更少的参数在同一视野。因此,研究中提出了一个假设。首先,一个3<我nline-formula> ∗ 3大小采用卷积滤波器处理5<我nline-formula> ∗ 5块大小获得3<我nline-formula> ∗ 3大小输出特性图。卷积后3<我nline-formula> ∗ 3大小卷积核,1<我nline-formula> ∗ 1大小输出。在这个时候,最后计算金额的18/25的直接使用5<我nline-formula> ∗ 5大小卷积核,它可以节省28%的计算量,但是网络也需要正确使用ReLu激活函数输出。在那之后,2<我nline-formula> ∗ 2尺寸采用卷积核取代3<我nline-formula> ∗ 3大小卷积核,可以节省11%的计算,但是使用一个不对称的卷积内核更好。因此,在这项研究中,1<我nline-formula> ∗ 3和3<我nline-formula> ∗ 1大小级联卷积核是用来取代3<我nline-formula> ∗ 3大小卷积核节省33%的计算,所以大卷积内核可以分解以同样的方式。在此基础上,得到一种改进的初始结构,如图 1。

图1

改进的初始结构。

ResNet的结构可以有多达152层( 18]。这个模型添加一个简单的堆叠浅相同的高速通道网络,如图 2。左边的是普通的网络,其输出值<我talic> H (x)代表任何理想的功能转换。右边的残余网络输出值<我talic> H (x) = F (x) + x网络中,需要安装什么残留<我talic> F (x)。网络中添加一个相同的快捷连接欧洲能使网络的输入映射和重叠。的输出公式剩余单位<我talic> y = F (x, {Wi}) + x,在那里<我talic> x代表输入和<我talic> y代表输出,和函数<我talic> F (x, {Wi})是通过学习获得的残余映射。从理论上讲,下面的两个网络可以逼近任意函数。但是如果网络的最优解是靠近身份映射,更容易使用剩余网络优化;如果卷积分支梯度扩散,网络还可以流的特性和梯度的分支机构身份映射,保证信息传输的可靠性。

图2

不同年代的不同网络的结构。左边是一个普通的网络,和在ResNet残余网络。

卷积的卷积层分支<我talic> F (x, {Wi})剩余的单元可以由多个层,和剩余单位也可以修改扩展的映射分支,卷积核大小、辍学,激活函数的位置。因此,一个新的DCNN网络结构是构建基于GoogleNet网络的初始结构和残余ResNet网络结构,提高网络的计算效率和信息流通的效果。合并后的新网络结构如图 3。

图3

(一)ResNet-Inception-1结构;(b) ResNet-Inception-2结构;(c) ResNet-Inception-3结构。

(一) (b) (c)

深度重建网络构造的基本参数摘要如表所示 1,辍学参数<我talic> x和随后的连续调整的参数需要选择最优的辍学生值最后测试。

表1

ResNet-Inception网络结构的基本参数。

结构	参数	输出图像的大小
Conv-1	3<我nline-formula> ∗ 3	147年<我nline-formula> ∗ 147年<我nline-formula> ∗ 32
Conv-2	3<我nline-formula> ∗ 3	145年<我nline-formula> ∗ 145年<我nline-formula> ∗ 32
Conv-3	3<我nline-formula> ∗ 3	145年<我nline-formula> ∗ 145年<我nline-formula> ∗ 64年
Pool-1	- - - - - -	73年<我nline-formula> ∗ 73年<我nline-formula> ∗ 64年
Conv-4	1<我nline-formula> ∗ 1	73年<我nline-formula> ∗ 73年<我nline-formula> ∗ 80年
Conv-5	3<我nline-formula> ∗ 3	70年<我nline-formula> ∗ 70年<我nline-formula> ∗ 190年
Conv-6	3<我nline-formula> ∗ 3	33<我nline-formula> ∗ 33<我nline-formula> ∗ 256年
ResNet-Inception-1	5	33<我nline-formula> ∗ 33<我nline-formula> ∗ 256年
Reduction-1	- - - - - -	16<我nline-formula> ∗ 16<我nline-formula> ∗ 512年
ResNet-Inception-2	10	16<我nline-formula> ∗ 16<我nline-formula> ∗ 512年
Reduction-2	- - - - - -	8<我nline-formula> ∗ 8<我nline-formula> ∗ 1024年
ResNet-Inception-3	5	8<我nline-formula> ∗ 8<我nline-formula> ∗ 1024年
Pool-2	- - - - - -	1792年
辍学	x	1792年

神经网络作为分类器经常使用Softmax深处,和三联体损失函数是一个分类器函数提出了人脸识别cnn谷歌。研究也表明,对伦敦时装周的数据集的识别率达到了99.63%,和YouTube数据集上的识别率也达到95.12% ( 19]。因此,不同的分类器的影响模型的人脸识别速度进行了分析。摘要三胞胎是由一个参考(锚点)的随机样本训练集,一个参考样本(积极的),和不同类别的样本(负)。假设样本特征提取每个样本获得的三胞胎<我nline-formula> f x 1 ,<我nline-formula> f x 2 ,<我nline-formula> f x 3 分别,然后优化的目标如下: (1) f x 1 我 − f x 2 我 2 2 + α < f x 1 我 − f x 3 我 2 2 , ∀ x 1 我 , x 2 我 , x 3 我 ∈ τ , 在这<我nline-formula> α 是同一类别的样本之间的欧氏距离特征或最小间隔不同类别的样本之间的欧氏距离特性。

此时,三联体损失的数学表达式如下: (2) l = ∑ 我 N f x 1 我 − f x 2 我 2 2 − f x 1 我 − f x 3 我 2 2 + α 。

在神经网络的训练过程,对应于每个参数的梯度方程如下: (3) ∂ l ∂ f x 1 我 = 2 f x 3 我 − f x 2 我 , (4) ∂ l ∂ f x 2 我 = 2 f x 2 我 − f x 1 我 , (5) ∂ l ∂ f x 3 我 = 2 f x 1 我 − f x 3 我。

为了提高优化效率的模型,在线方法用于选择三胞胎的结合。同时,为了防止模型落入局部最优解的状态,<我nline-formula> α 删除在选择负样本,所以呢<我nline-formula> x n 我只需要满足 (6) f x 1 我 − f x 3 我 2 2 < f x 1 我 − f x n 我 2 2 。

中心损失可以确保在培训过程中不同类别的样本的分离也确保同一类别的样本之间的聚合特征( 20.]。中心损失可以定义如下:在其中<我nline-formula> c y 我功能的中心吗<我talic> 我th类别。 (7) l C = 1 2 ∑ 我 = 1 米 x 我 − c y 我 2 2 , 在哪里<我talic> l<年代ub>C 是中心的损失。<我talic> C<年代ub>易是i类的功能中心。习是功能完整的连接层之前,和m mini-batch的大小。

因此,方程预测之间的距离之和越小的特点和功能中心中的每个示例批处理,也就是说,类内距离越小,性能越好。

的<我nline-formula> c y 我更新更新样本集在输入网络,和更新规则如下: (8) c u v + 1 = c u v − ∑ 我 = 1 n δ y 我 = u ⋅ c y 我 − x 我 1 + ∑ 我 = 1 n δ y 我 = u , 在这<我nline-formula> δ 属于0或1。

然后,网络的误差函数可以定义如下: (9) 损失 = 损失年代 + λ 损失 c , 在这<我nline-formula> λ 的重量损失函数。当<我nline-formula> λ 是0,Softmax分类器在网络。

3.2。面对菲和匹配基于深度重建网络

在拍照的过程中,人们可能没有完全暴露他们的脸由于相机角度,光线,情绪,和设备。为了检测在不同位置或不同角度的图像,它需要首先改变滑动窗口的规模或输入图像。滑动窗口也需要扫描输入图像按照一定的步长(<我nline-formula> w );作为<我nline-formula> w 增加,判断窗口的数量和计算模型中的网络将减少几何。当输入图像DCNN时,不需要进行预处理的图像。然而,为了更好地检测大小不同的面孔,subacquisition率的原始输入图像在不同尺度缩放,然后,图像金字塔,如图 4。

图4

人脸检测在形象的流程图。

摘要DCNN用于处理每个脸图像位于图像金字塔根据输入订单,和潜在的地区检测到人脸图像在同一时间。坐标点和特定区域的大小脸的图像记录。毕竟图片处理,响应点的所有地区检测到图像相对地映射到原始图像输入的输入层。然后,图像的重叠区域融合得到最终结果。随后,面对矫直阶段执行没有对齐,在不同姿势和脸部特征提取,主要部分图像周围的眼睛,嘴角,和鼻子的顶端面对图像,如图 5。

图5

提取面部特征点和subfigures每个区域。

随后,欧几里得距离( 21)和学习特征匹配算法应用于特征匹配在图像,以及匹配过程如图 6。

图6

脸部特征点的匹配过程。

在第一步中,有必要迅速判断很容易判断的样本图像样本匹配的脸。欧几里得距离用于样本之间的相似度,然后,两点之间的绝对距离空间中计算如下: (10) d u , v = ∑ 我 = 1 n u 我 − v 我 2 。

在第二步中,在保证功能的前提下识别率面对图像,学习算法具有更高的识别率是用来模拟面对图像的特性,和完整的脸特征的相似性匹配实现样品的精制的判断。很明显从图 55名当地价值特征的提取,需要面对形象和获得总共6 160 -维特征向量,拼接成960维面部特征向量。图像的特点是减少到160维度又由PCA降维。

除此之外,在第二步中,联合使用贝叶斯计算样本之间的相似性。假设两个面孔的联合分布<我talic> x₁和<我talic> x₂分别,都服从高斯分布的特性0的意思,那么这两个之间的协方差的数学表达式的脸图片如下: (11) 浸 u 我 , v j = 浸 μ 我 , μ j + 浸 ε 我 , ε j , 在这<我nline-formula> μ 性格和的身份吗<我nline-formula> ε 之间的区别是面对本身(光、表情和姿势)。

3.3。评价指标的检测和识别深层网络重建算法

在本文中,使用Matlab软件模拟深度重建网络,和LFW数据集用于训练和测试。本文以下实验进行TensorFlow平台Linux作为操作系统和2<我nline-formula> ∗ 泰坦<我talic> XGPU。伦敦时装周的数据集共有13233脸图像,分别给出了相应的名字,总共有5749人,大多数人只有一个图片。每个图像的大小是250×250,其中大部分是彩色图像,但也有一些黑色和白色的脸的照片。摘要面对图像数据集的随机分为训练集和验证集。训练集包含10000个脸图像,和验证集包含3233张图像。当训练模型,第一次不同的参数设置(学习速率的影响<我talic> η,衰减系数<我talic> λ、培训优化算法和辍学)模型的训练效果进行了分析,并损失值,精度值,采用过度拟合率和培训时间培训效果的评估。基于该模型最优参数设置,它是应用于验证组,平均精度(mAP)的平均值用于评估模型识别效果。

为了评估算法的效果在面对菲,10140年有1150人从伦敦时装周的数据集的图像选择,和180对正面脸样本和180对负样本和测试样本对随机选择的。然后,建设网络是用于执行面对铁,和最简单的欧几里得距离是用来匹配特性相似。最后,分类精度和匹配精度是用来评估的有效性面临铁。随后,这些10140张照片是用来继续细分。有1050人选择面部特征的图像匹配算法的训练。剩下的100个人的形象,200对正样本和200对负样本是随机选择的验证。识别准确率,阳性样本误差率,负样本错误率,配对正确的速度,和配对的平均时间是用来评估面临的匹配效应特性。

在目标识别和检测和识别领域,地图通常用于评估算法检测和识别的影响( 22]。摘要错误率等基本概念,准确、精密,记得,并首次引入平均精度。出错率和准确率是最常用的测量条款分类评估、错误的错误率是比总样本,样本和准确率的比例是正确的样本总样本。假定样本数据集<我talic> 年代样品被定义为<我talic> 用户界面,样品的类型<我talic> 六世,该算法的预测结果<我talic> f (ui),然后错误率和准确性率的计算公式如下: (12) 错误 f ; 年代 = 1 米 ∑ 我 = 1 米我 f u 我 ≠ v 我 , (13) Acc f ; 年代 = 1 米 ∑ 我 = 1 米我 f u 我 = v 我 = 1 − 错误 f ; 年代。

精确率的计算公式(前)和召回率(召回)如下: (14) 精准医疗 = TP TP + 《外交政策》 , (15) 回忆 = TP TP + FN , TP是真阳性,FP是假阳性,FN假阴性。

使用精确率作为纵轴和召回率作为横轴,P-R曲线。P-R曲线下的面积平均精度(美联社),和地图是美联社的平均在每个类型的分类任务指标。此外,过度拟合率(或)用来评估算法。或的计算方程如下: (16) 或 = TrainAcc ValAcc , 在TrainAcc是训练准确率和ValAcc是验证准确率。

4所示。结果 4.1。基于深度重建网络识别率的比较算法

通过调整学习速率<我talic> η,衰减系数<我nline-formula> λ 、训练方法和辍学,不同参数对精度的影响DCNN模型探讨了识别,数据库是用来训练DCNN模型和最大迭代次数设置为1000。在实验中,网络中的激活函数总是作为ReLU。首先,不同的学习速率的影响<我nline-formula> η 在模型识别率进行了比较。结果如图 7和 8。很明显从图 7,当<我nline-formula> η = 0.0004,算法的识别精度是最高的;当<我nline-formula> η = 0.001,算法的识别精度是最低的。很明显从图 8,当<我nline-formula> η = 0.0004,损失值的算法是最小的,当<我nline-formula> η = 0.001,损失值的算法是最大的。逐步增加<我nline-formula> η ,精度值逐渐降低,损失值逐渐增加。

图7

识别精度的比较不同的学习速率。

图8

比较训练不同的学习速率的价值损失。

然后,不同的学习速率的影响人脸识别算法的性能的定量比较。很明显从表 2,当<我nline-formula> η = 0.0004,该算法精度值最大(99.03%),最小的损失值(0.047),和最短的培训时间(352年代)。当<我nline-formula> η = 0.0007,该算法过度拟合率最低(1.005)。总之,当<我nline-formula> η = 0.0004,算法的性能是最好的,所以在此基础上进行后续测试。

表2

不同的学习速率的影响训练效果的深度重建网络算法。

η	Acc (%)	损失	培训时间(年代)	过度拟合率
0.0004	99.03	0.047	352年	1.006
0.0005	96.74	0.059	354年	1.006
0.0006	93.15	0.062	368年	1.082
0.0007	90.31	0.120	370年	1.005
0.0008	88.07	0.115	400年	1.011
0.0009	86.41	0.170	398年	1.026
0.001	85.05	0.206	405年	1.058

不同的衰减系数的影响<我nline-formula> λ 在模型识别率进行比较。结果如图 9和 10。很明显从图 9,当<我nline-formula> λ = 0.0001,算法的识别精度是最高的;当<我nline-formula> λ = 0.09,算法的识别精度是最低的。很明显从图 10,当<我nline-formula> λ = 0.0001,损失值的算法是最小的;当<我nline-formula> λ = 0.09,损失值的算法是最大的。逐步增加<我nline-formula> λ ,精度值逐渐降低,损失值逐渐增加。

图9

比较不同衰减系数的识别精度。

图10

培训损失价值的比较不同的衰减系数。

然后,不同的衰减系数的影响人脸识别算法的性能定量比较。很明显从表 3,当<我talic> λ= 0.0001,算法的精度值是最大的(99.03%),和损失值是最小的(0.047)。当<我talic> λ= 0.0007,算法的训练时间最短(342年代)。当<我talic> λ= 0.0001和0.0009,过度拟合的算法是最小的(1.006)。总之,当<我talic> λ= 0.0001,算法的性能是最好的,所以后续测试是在此基础上进行的,在这个模型中使用的分类器确定三联体损失函数。

表3

不同的衰减系数的影响深度重建网络算法的训练效果。

λ	Acc (%)	损失	培训时间(年代)	过度拟合率
0.0001	99.03	0.047	352年	1.006
0.0009	97.63	0.048	342年	1.006
0.001	95.17	0.102	358年	1.037

在比较不同训练方法对模式识别的影响率,结果如图 11和 12。很明显从图 11SGD训练方法时,算法的识别精度是最高的;当Adagrad训练方法,算法的识别精度最低。很明显从图 12SGD训练方法时,算法的损失值是最小的;训练方法是Adagrad时,算法的价值是最大的损失。

图11

比较六训练方法的识别精度。

图12

比较的训练六个训练方法的价值损失。

然后,不同训练方法对人脸识别的影响,定量比较算法的性能。很明显从表 4SGD训练方法时,该算法最大的Acc值(99.03%),最小的损失值(0.047),最低的过度拟合率(1.006)。RMSprop训练方法时,该算法的训练时间是最短的(351年代)。总之,SGD训练方法时,算法的性能是最好的,所以后续的测试是在此基础上进行。

表4

不同的训练方法训练效果的影响深度重建网络算法。

训练方法	Acc (%)	损失	培训时间(年代)	过度拟合率
Adadelta	97.45	0.062	357年	1.010
亚当	97.05	0.087	388年	1.012
纳丹	96.87	0.132	438年	1.016
RMSprop	96.14	0.147	351年	1.129
SGD	99.03	0.047	352年	1.006
Adagrad	94.91	0.187	422年	1.158

最后,不同的辍学值对模型的影响识别率比较。结果如图 13和 14。很明显从图 13辍学= 0.1时,该算法的识别精度最高;辍学= 0.6时,算法识别精度最低。很明显从图 14辍学= 0.1时,算法的损失值是最小的,辍学= 0.6时,算法的损失值是最大的。逐渐增加的辍学值,算法的精度值逐渐降低,和损失值逐渐增加。

图13

比较不同的辍学值的识别精度。

图14

比较的培训损失值和不同的辍学值。

然后,不同的辍学值的影响人脸识别算法的性能的定量比较。很明显从表 5辍学= 0.1时,该算法最大的Acc值(99.03%),最小的损失值(0.047),最低的过度拟合率和辍学= 0.2 (1.006)。辍学= 0.6时,该算法的训练时间是最短的(337年代)。总之,辍学= 0.1时,算法的性能是最好的,所以在此基础上进行后续测试。

表5

不同的辍学值对训练效果的影响深度重建网络算法。

辍学	Acc (%)	损失	培训时间(年代)	过度拟合率
0.1	99.03	0.047	352年	1.006
0.2	98.83	0.057	347年	1.006
0.3	97.20	0.087	348年	1.009
0.4	97.05	0.112	351年	1.017
0.5	96.23	0.127	340年	1.027
0.6	95.93	0.153	337年	1.518

它是集<我talic> η= 0.0004,<我talic> λ= 0.0001深重建网络,建设SGD选择训练方法,和辍学= 0.1。然后,不同的激活函数对模型的影响识别率比较,如图 15和 16。很明显从图 15的识别准确率最高ReLu激活函数时,识别准确率是激活函数是乙状结肠时最低。从图 16,很明显,损失值是最低的ReLu激活函数时,和损失价值最高时激活函数是乙状结肠。

图15

比较六激活函数的行为识别的准确性。

图16

比较的行为训练六个激活功能的衰退。

然后,不同的激活函数的影响人脸识别算法的性能的定量比较。很明显从表 6ReLu激活函数时,该算法的Acc价值是最大的(99.03%)、损失值是最小的(0.047),和过度拟合率最低(1.006)。当激活是双曲正切函数,该算法的训练时间是最短的(341年代)。总之,当ReLu激活函数,算法的性能是最好的,所以后续测试基础上进行的。

表6

不同的激活函数的影响训练效果的深度重建网络算法。

激活函数	Acc (%)	损失	培训时间(年代)	过度拟合率
乙状结肠	95.17	0.091	382年	1.007
线性整流函数（Rectified Linear Unit）	99.03	0.047	352年	1.006
双曲正切	98.52	0.053	341年	1.007
LeakyReLu	97.11	0.073	350年	1.006
ELU	96.78	0.087	349年	1.007
MaxOut	97.45	0.082	367年	1.006

基于上述结果,在深度重建网络构建本文<我nline-formula> η = 0.0004,<我nline-formula> λ = 0.0001,训练方法设置为SGD,辍学= 0.1,人脸识别验证,和识别效果与LetNet-5相比,GoogleNet, AlexNet VGG-16 VGG-19, ResNet网络。很明显从图 17P-R曲线下的面积的算法构建本文是最大的;映射的值是最大的。不同模型的映射值排名,结果是论文中的算法> ResNet > AlexNet > VGG-19 > GoogleNet > VGG-16 > LetNet-5。

图17

比较P-R曲线不同模型的人脸识别性能。

4.2。面对菲和匹配验证基于深度重建网络算法

本文提出的人脸识别和有限元算法应用于伦敦时装周的数据提取和匹配特性。结果如图所示 18。很明显,本文提出的算法能有效地提取特征的脸图像,可以完全匹配相同的特性,然后实现相同的识别和检测的脸。

图18

脸图像FE和匹配。不同颜色的圆在同一画面显示不同的提取特性,和同样的颜色在不同的图片在同一组表明匹配相似的特征。

然后,本文构造深度重建网络算法应用于铁和人脸图像中特征匹配,性能与其他模型相比。很明显从表 7当本文的施工方法训练,训练集上的分类准确率为97.94%,高于LetNet-5, VGG-16,和VGG-19算法,准确率是2.1%,0.94%,和1.16%,分别,但低于GoogleNet, AlexNet, ResNet算法的准确率是0.14%,0.58%,和0.46%,分别。验证设置,本文算法构造的正确匹配率为84.72%,高于LetNet-5, VGG-16,和VGG-19算法,正确匹配率是6.94%,2.5%,和1.11%,但低于GoogleNet AlexNet,和ResNet算法,正确匹配率是0.56%,1.39%,和1.95%,分别。

表7

面部菲比较不同模型的性能。

算法	正确训练分类的数量	训练分类精度(%)	验证正确的日志	验证正确匹配率(%)
LetNet-5	9028年	95.84	280年	77.78
VGG-16	9117年	96.78	296年	82.22
VGG-19	9137年	97.00	301年	83.61
GoogleNet	9239年	98.08	307年	85.28
AlexNet	9281年	98.52	310年	86.11
ResNet	9269年	98.40	312年	86.67
我们的方法	9226年	97.94	305年	84.72
LetNet-5	9028年	95.84	280年	77.78

匹配的人脸图像特征提取的效果比较。总识别率的比较结果如表所示 8。之后,很明显,联合使用贝叶斯方法在本文提出的算法,验证集的正确识别日志率最高(88.75%),高于LetNet-5, GoogleNet, AlexNet, VGG-16, VGG-19,和ResNet算法,正确识别利率是4%,1.25%,0.75%,3.75%,3.25%,和0.25%,分别。

表8

总识别率的比较不同模型的面部特征。

算法	识别正确的对数	识别正确的日志率(%)	日志出错率的正样本(%)	对数错误率的负样本(%)
LetNet-5	339年	84.75	13.5	17
VGG-16	340年	85年	14.5	15.5
VGG-19	342年	85.5	15	14
GoogleNet	350年	87.5	14	11
AlexNet	352年	88年	11.5	12.5
ResNet	354年	88.5	10.5	12.5
我们的方法	355年	88.75	11	11.5

的影响只使用联合贝叶斯方法和本文算法的匹配效果脸上特性进行比较,结果如表所示 9。显然,本文提出的算法有更快的匹配时间(206.44秒)和正确匹配率(88.75%)高于联合贝叶斯方法。

表9

总识别率的比较不同模型的面部特征。

算法	匹配时间(年代)	匹配正确的日志	正确匹配率(%)
美国贝叶斯	240.15	350年	87.5
我们的方法	206.44	355年	88.75

5。讨论

之前有研究表明,不同的参数设置会产生某些影响的识别率DCNN模型。在本文中,不同的学习速率的影响,培训方法、衰减系数和辍学的识别算法的性能进行了比较。研究表明,太大学习速率将导致算法在学习过程中出现不稳定,进而影响算法的性能( 23),这与本文的结果是一致的,学习速率算法的性能呈负相关。然后,不同的培训方法的影响识别率的DCNN模型进行了比较。RMSprop-based网络训练方法会增加过度拟合的概率,和madam-based网络训练法将增加Nesterov的动力参数,所以需要更多的训练时间。之前的研究表明,调整辍学丢弃率在许多网络参数可以解决模型过度拟合的问题,但过度增加辍学丢弃率会降低图像分类的类风湿性关节炎,和过度拟合的概率会增加 24),这与本文结果基本上是一致的,辍学是负相关的识别性能构造人脸识别算法。同时,不同的衰减系数的设置的影响相比,该算法的识别性能。发现衰减系数负相关,该算法的识别率。这是因为过度体重衰减系数将会破坏稳定的算法的学习过程,所以选择最小的衰减系数可以确保稳定的人脸识别算法 25]。

面部特征主要分为颜色(肤色),轮廓(椭圆),照明(头发、眼睛和下巴),模板(均值和方差),变换域(表示)的特性,结构(面部对称性),镶嵌(镶嵌规则)和直方图特性(灰色分布) 26]。人脸特征检测的过程中,由于高度非线性分布等因素(如面部表情和色差),装饰品(胡子、眼镜和帽子),表达式(面部肌肉运动),光(亮度和角度),图像质量(分辨率),和一个复杂的场景(面对数量和差距),分类错误引起的( 27]。许等人提出了一个semisupervised FR方法LFW和YTF数据库和发现算法的识别率是98.63%和91.76%,分别为( 28]。本文所构造的深度重建网络应用于菲面对LFW图像数据;该算法相比LetNet-5(后 29日],VGG-16 [ 30.],VGG-19 [ 31日)算法,它是发现,它有一个更高的匹配准确率,但略低于GoogleNet [ 32],AlexNet [ 33],ResNet [ 34)算法。然而,本文提出的算法可以减少模型生成的复杂性,同时防止过度拟合的发生。最后,贝叶斯方法( 35)是用于匹配特性。结果表明,该算法的准确率脸特征匹配是高于LetNet-5, VGG-16, VGG-19, GoogleNet AlexNet, ResNet。同时,与单独联合贝叶斯方法相比,它可以减少时间消耗的特征匹配( 36和提高匹配精度 37),表明本文提出的算法可以快速执行大规模的脸图像特征匹配和与其他DCNN模型相比具有一定的优势。

6。结论

本文构造一个新的深度重建网络使用GoogleNet网络的初始结构和残余结构ResNet网络,并应用于人脸识别算法的最优参数选择。基于该算法,面对金字塔分割和地方特性应用于构建一个面对有限元算法。发现它有一个铁的效果比一般的DCNN模型。最后,基于该算法,实现人脸特征匹配使用联合贝叶斯方法,验证结果。本文构造的结果表明,该模型能有效地识别脸部图像使用不同的干扰因素。然而,模型训练和验证只有通过数据库中的图像。特定的FR系统需要开发探索其应用效果的视频画像识别。总之,结果帮助后续发展的FR系统基于DCNN和FR的效率的提高。

数据可用性

所需的原始/处理数据复制这些发现也不能在这个时候作为数据共享一个正在进行的研究的一部分。

的利益冲突

作者宣称没有利益冲突。

Viccaro

E。

金沙

E。

施普林格

C。

间隔检索使用静态和动态图像提高名脸配对在内识别:阿尔茨海默氏痴呆、血管性痴呆

美国语言语音病理学杂志》上 2019年 28 3 1184年 1197年

_ajslp - 18 - 0131 10.1044/2019

2 - s2.0 - 85071347698

李

专题

p . L。

哈迪德

一个。

人脸识别在欺骗攻击:对策和研究方向

专业生物识别技术 2018年 7 1 3 14

10.1049 / iet-bmt.2017.0089

2 - s2.0 - 85040248991

Starrfelt

R。

Klargaard

美国K。

彼得森

一个。

Gerlach

C。

在发展阅读面孔失认症:证据word和人脸识别之间的分离

神经心理学 2018年 32 2 138年 147年

10.1037 / neu0000428

2 - s2.0 - 85043534192

秦

H。

El-Yacoubi

m·A。

深基础特征提取和恢复手指静脉的验证

IEEE取证和安全信息 2017年 12 8 1816年 1829年

10.1109 / tifs.2017.2689724

2 - s2.0 - 85019254259

王

Z。

首歌

C。

陈

T。

深度学习的基础监测炉燃烧状态和测量的热释放率

能源 2017年 131年 106年 112年

10.1016 / j.energy.2017.05.012

2 - s2.0 - 85019137217

Russakovsky

O。

邓

J。

苏

H。

ImageNet大规模视觉识别的挑战

国际计算机视觉杂志》上 2015年 115年 3 211年 252年

10.1007 / s11263 - 015 - 0816 - y

2 - s2.0 - 84947041871

Krizhevsky

一个。

Sutskever

我。

辛顿

g . E。

ImageNet与深卷积神经网络分类

先进的神经信息处理系统 2012年 23 2 1097年 1105年

Seeliger

K。

Fritsche

M。

Guclu

U。

卷积神经网络编码和解码视觉物体识别的空间和时间

科学杂志。 2017年 180年 253年 266年

黄平君

d . T。

康

h·J。

滚动轴承故障诊断使用卷积神经网络和振动图像

认知系统研究 2018年 53 42 50

张

M。

汗

年代。

杨ydF4y2Ba

H。

深eigen-filters人脸识别:通过无监督学习构建滤波器特性表征

模式识别 2020年 One hundred. 107176年

10.1016 / j.patcog.2019.107176

Goswami炮轰道:

G。

阿加瓦尔

一个。

Ratha

N。

辛格

R。

Vatsa

M。

检测的人脸识别和减轻敌对的扰动

国际计算机视觉杂志》上 2019年 127年 6 - 7 719年 742年

10.1007 / s11263 - 019 - 01160 - w

2 - s2.0 - 85062828919

Isogawa

K。

艾达

T。

Shiodera

T。

深收缩卷积神经网络自适应降噪

IEEE信号处理信件 2017年 25 2 224年 228年

Nakazawa

T。

Kulkarni

d . V。

异常检测和分割为晶圆缺陷模式使用深卷积encoder-decoder神经网络架构在半导体制造业

IEEE半导体制造业 2019年 32 2 250年 256年

10.1109 / tsm.2019.2897690

2 - s2.0 - 85065470244

一个

F.-P。

周

X.-W。

BEMD-SIFT特征提取算法的图像处理应用程序

多媒体工具和应用程序 2017年 76年 11 13153年 13172年

10.1007 / s11042 - 016 - 3746 - y

2 - s2.0 - 84978066637

徐

s P。

刘

T。

张

g . Z。

两级噪声估计使用自动特征提取和映射模型

IEEE信号处理信件 2018年 26 1 179年 183年

菲尔丁

B。

张

发展与增强粒子群优化图像分类架构

IEEE访问 2018年 6 68560年 68575年

10.1109 / access.2018.2880416

2 - s2.0 - 85056595618

张

K。

左

W。

陈

Y。

孟

D。

张

除了高斯降噪:残余学习深cnn的图像去噪

IEEE图像处理 2016年 26 7 3142年 3155年

康

E。

常

W。

柳

J。

叶

j . C。

深卷积framelet通过小波去噪对低剂量ct残余网络

IEEE医学成像 2018年 37 6 1358年 1369年

10.1109 / tmi.2018.2823756

2 - s2.0 - 85045190583

Trigueros

d·s。

孟

哈特尼特

M。

提高卷积神经网络的人脸识别闭塞地图和批处理三联体的损失

图像和视觉计算 2018年 79年

20.

艾伦

J。

郭

F。

安监督Spectral-spatial特征提取和分类的中心高光谱图像

IEEE地球科学和遥感 2019年 57 3 1755年 1767年

氮化镓

X。

海涛

Z。

一个noise-robust semi-supervised降维人脸识别的方法

Optik国际期刊《光与电子光学 2018年 157年 858年 865年

迪克西特

美国D。

Shirdhonkar

m . S。

Face-based文档图像检索系统

Procedia计算机科学 2018年 132年 659年 668年

10.1016 / j.procs.2018.05.065

2 - s2.0 - 85049073110

赵

H。

刘

F。

张

H。

梁

Z。

研究学习的速度与深度学习能源指数

神经网络 2019年 110年 225年 231年

10.1016 / j.neunet.2018.12.009

2 - s2.0 - 85059113855

罗莎

g·h·D。

若昂

P P。

杨

x。

处理辍学概率估计在使用metaheuristics卷积神经网络

软计算 2017年 4 6147年 6156年

Tzelepi

M。

Tefas

一个。

改善性能的轻量级cnn二进制分类使用二次互信息正规化

模式识别 2020年 106年 107407年

10.1016 / j.patcog.2020.107407

阿米娜

T。

艾哈迈德

a . T。

Djamel

年代。

深度学习功能强劲的面部亲属验证

专业形象的过程 2018年 12 12 2336年 2345年

Kraemer

M。

黄齐的

问:B。

Wieczorek

D。

在白人的五官在特发性性烟雾病:第一系统分析

PeerJ 2018年 6 4

e4740

10.7717 / peerj.4740

2 - s2.0 - 85049240825

徐

W。

吴

J。

丁

年代。

梁ydF4y2Ba

曹国伟

H。

从大规模弱标记数据提高人脸识别的新领域

神经处理信件 2019年 49 3 939年 950年

10.1007 / s11063 - 018 - 9839 - z

2 - s2.0 - 85045894697

29日

王

D。

陆

H。

杨

M.-H。

内核协同人脸识别

模式识别 2015年 48 10 3025年 3037年

10.1016 / j.patcog.2015.01.012

2 - s2.0 - 84931566105

30.

朱

F。

香港

X。

傅

H。

田

Q。

Pseudo-positive正规化深人地

多媒体系统 2018年 24 4 477年 489年

10.1007 / s00530 - 017 - 0571 - 8

2 - s2.0 - 85032664979

31日

汉森

m F。

史密斯

m . L。

史密斯

l . N。

对养殖场猪使用卷积神经网络的人脸识别

计算机在工业领域 2018年 98年 145年 152年

10.1016 / j.compind.2018.02.016

2 - s2.0 - 85044155039

N。

陈

J。

棕褐色

J。

手写汉字识别与googlenet使用卷积神经网络

模式识别与人工智能》国际期刊上 2019年 33 11 1940016

10.1142 / s0218001419400160

2 - s2.0 - 85062902717

Aslam

一个。

‘

K。

奥马尔

答:我。

小波卷积神经网络性别分类

电子杂志的成像 2019年 28 1 1

10.1117/1. jei.28.1.013012

2 - s2.0 - 85062607286

陆

Z。

江

X。

科特

一个。

深耦合resnet低分辨率人脸识别

IEEE信号处理信件 2018年 25 4 526年 530年

10.1109 / lsp.2018.2810121

2 - s2.0 - 85042866380

黄

Z。

徐

X。

倪

J。

朱

H。

王

C。

多通道表示学习物联网的建议

IEEE物联网 2019年 6 6 10675年 10685年

10.1109 / jiot.2019.2940709

张

M。

张

D。

姚

H。

张

K。

“人为失误的概率模型评估自治货船关注human-autonomy协作

安全科学 2020年 130年

104838年

胡

F。

吴

G。

分布式卡尔曼滤波器算法的误差修正模型在多传感器融合定位

IEEE访问 2020年 8 93211年 93218年

10.1109 / access.2020.2995170