人脸识别研究的兴趣在过去十年里发展迅速。人脸识别最重要的一个问题是伦理学的识别人。在这项研究中,一个新的深度学习卷积神经网络的目的是创建一个新的模型,可以认识到伦理学的人通过他们的面部特征。伦理学的新数据集的人由3141张图片来自三个不同的民族。我们所知,这是第一个图像数据集收集人们的伦理学,数据集将用于研究团体。与两个最先进的模型相比,新模型VGG和《盗梦空间》V3,验证每个卷积神经网络计算精度。生成的模型通过几个人的图像进行了测试,结果表明,最佳的性能是通过我们的模型验证的准确性为96.9%。
人脸识别领域最近增加的范围。人脸识别是指识别人的能力从一个图像或视频帧。许多技术已经用于人脸识别。第一个方法是使用一个2 d模式识别问题的一个重要的点之间的距离在一个图像用于识别脸部(
另一种技术叫做整体匹配技术完成面临地区考虑到抓脸系统作为输入数据。最重要的研究,使用这种技术是eigenfaces [
基于特征结构技术是另一个技术用于人脸识别的地方特色的脸首先提取及其位置和地方统计数据被送入一个结构分类器。
整体和特征提取技术一起使用,新技术被称为混合动力技术,使用3 d图像。人的脸的图像是在3 d;系统后,将会注意等重要特性曲线或形状的脸。系统后,检测图像是否照片或实时确定的位置的脸,和措施的曲线和形状的重要特征脸,面对转换成数值表示和匹配这个数值表示的数据集的面孔。
人脸识别中最重要的技术,最近出现了使用卷积神经网络(CNN) [
出于这一点,我们提出两个新的模型人脸识别与正规化和没有正规化,他们有能力认识到伦理学和起源的人通过他们的脸的面部。指定,本文的主要贡献是提出了一种人脸识别模型,可以检测的详细特征脸和区分他们使用RGB图像或实时人脸识别。道德不同的人可以通过提取最公认的使用这个模型的详细特性人们的面孔。收集新数据集的目的与高分辨率从三个不同的地区在亚洲。这些图片收集来自像Facebook这样的社交媒体和VK(俄罗斯社交媒体网站)。最后,我们取得了一个有前途的性能测试的另一个数据集收集目的。
本文的其余部分组织如下。部分
人脸识别方法提出了基于网格密度直方图的梯度(猪)
有许多方法在人脸识别具有较高的识别精度,基于深度学习。之一,这些方法有良好的效果在受限环境以及自然环境(
学习的人脸识别提出了另一项研究[
发展有效的特征表示为减少内心的变化而扩大人际差异在另一项研究(人脸识别已经得到解决
提出了另一种方法对人脸识别的卷积神经网络(CNN)和逻辑回归分类器(荣誉奖)相结合
在我们的研究中,我们建立两个模型,辍学,没有辍学层发现在培训这一层的效果。本研究涉及伦理学的认可的人通过他们的面部特征通过这两个模型。我们使用一个新的CNN正规化辍学层和没有正规化找到最准确的性能。在训练中,我们使用亚当优化器(
我们的深度学习层由12层。四个层Conv层,每个随后Maxpooling层,其中一些Conv层也紧随其后辍学层Maxpooling后层提取面部特征。连接层下降后放置四个Conv层之间的分隔符和两个完全连接层。下降的输出连接层传递给平层平输出之前通过第一个完全连接层。两者之间完全连接层,另一个辍学层使用。将softmax输出层用于识别的类。使用辍学层的目的是摆脱期间过度拟合训练。图
。事先层。广场内的小长方体表示每个Conv层的地图窗口大小。
这个网络的输入是一个图像的128×128×3大小(例如,3特征图)。补丁的大小是3×3相同的填充在每个Conv层和跨越1使Conv层大小大致相同的输出作为输入。每个Conv层的输出传递给Max-Pooling层来减小输入大小。之后,每个Maxpooling层的输出是美联储ReLU激活函数。Conv层特性映射方程
每个卷积的输出层传递给Maxpooling。Maxpooling层的公式如下:
的神经元<我nl我ne-formula>
一些Conv输出传递给网络中辍学防止过度拟合。辍学层使用的数量是三个,其中两个用于第二个和第三个Conv层后,第三个是最后两个完全连接层之间使用。
最后一层是两个完全连接层与辍学层之间。这个方程可以表示如下:
事先的输出<我nl我ne-formula>
有时在测试阶段,结果由于训练误差是不准确的。研究人员认为,因为过度拟合的
神经元的培训与辍学。隐藏的神经元与伯努利分布随机辍学<我nl我ne-formula>
输入和输出的每个补丁应用辍学之前计算如下:
第一个网络层组成的12层包括辍学层。这个网络的训练准确率是96.9%,验证准确率是96.9%确认损失0.221这意味着过度拟合已经彻底消除,如图
培训和验证准确性第一网络。
培训和验证准确性第二网络。
尽管有许多大规模的面部图像数据库网上,但所有这些数据库不适当的满足本研究的目标。因此,我们手动收集来自不同资源的3141张照片。我们收集了1081中国面部图像,1021名巴基斯坦面部图像,和1039年俄罗斯的面部图像。在收集的图片,他们从整个提取人脸图像处理。总图像后,被分成两组;第一组被用于训练阶段,我们把整个图像的70%,另外30%的图像作为第二组验证阶段。图
三种不同子集的图片收集来自三个不同的地区。
选择两种最先进的方法,每种方法的最后四层已被冻结和使用我们的完全连接层来确定输出的数量根据数据集的类的数量。这些方法是VGG [
比较我们的方法和两种最先进的方法验证率和验证损失值。
| 方法 | 验证acc。(%) | 损失 |
|---|---|---|
| VGG | 91.48 | 0.23 |
| 《盗梦空间》V3 | 61.92 | 0.81 |
| 我们的网络 | 96.9 | 0.22 |
对比我们的方法和两种最先进的方法VGG和《盗梦空间》V3表所示
培训和验证VGG准确性。
培训和验证准确性初始V3。
表
数字图像的预测与辍学正确和不正确的网络层。
| 国籍 | 总图像 | 正确的预测 | 错误的预测 |
|---|---|---|---|
| 中国 | 540年 | 511年 | 29日 |
| 俄罗斯 | 642年 | 561年 | 81年 |
| 巴基斯坦 | 582年 | 527年 | 55 |
数字图像预测正确和不正确的网络没有辍学层。
| 国籍 | 总图像 | 正确的预测 | 错误的预测 |
|---|---|---|---|
| 中国 | 540年 | 388年 | 152年 |
| 俄罗斯 | 642年 | 467年 | 115年 |
| 巴基斯坦 | 582年 | 498年 | 114年 |
性能指标,被广泛用于评估模型的预测结果精度和召回。结果总结在表
统计每个模型的显著性检验。
| 模型与辍学 | 模型没有辍学 | |
|---|---|---|
| TP | 511年 | 388年 |
| 《外交政策》 | 29日 | 152年 |
| TN | 1088年 | 968年 |
| FN | 81年 | 144年 |
| 回忆(FP) | 0.863176 | 0.729323 |
| FP率 | 0.025962 | 0.136079 |
| 卡巴 | 0.904659 | 0.762491 |
| 准确率 | 90.64626% | 76.70068% |
| 精度 | 0.946296 | 0.718519 |
此外,进行统计显著性检验比较两个模型的结果。从评估,第一个模型与辍学层准确率最高(90.65%),而第二个模型没有辍学层准确率最低(76.70%)。
在这项研究中,我们需要一些辍学层插入一些特定的地方在我们的CNN克服过度拟合的障碍,获得高的结果。很难使用一些cnn架构ResNet或SENet因为他们是沉重的,长时间的训练,和很难控制过度拟合的问题很容易在这样的建筑由于困难改变他们的架构。VGG和《盗梦空间》V3也非常沉重的网络培训,很难改变他们的体系结构来控制过度拟合问题。
本文是基于科恩的方法(
在本文中,我们提出一种新的深度学习卷积神经网络用于创建一个新的模型,可以认识到伦理学的人通过他们的面部特征。与两个最先进的模型相比,新模型VGG和《盗梦空间》V3,验证每个卷积神经网络的计算精度。两个模型的创建提出了卷积神经网络与辍学层和没有辍学层发现正规化的影响性能的模型。
一个新的数据集收集使用在训练阶段通过图像识别人的伦理学从三个不同的区域。这个数据集被认为是伦理学的第一个数据集收集的人,将用于研究团体。另一个看不见的数据集收集评估我们的两种模型的性能,并进行统计显著性检验对两种模型的性能进行评估。
收集到的数据已经上传到以下ULR:
赞助商的资金没有参与这项研究的设计;在收集、分析或解释数据;写的手稿;并决定发表的结果。
作者宣称没有利益冲突有关的出版。
这项工作是支持部分由中国国家自然科学基金(批准号61836009和61836009),信息工程国家重点实验室基金(没有。SKLGIE2018-M-4-3),重点实验室开放基金的智能感知与图像理解教育部(没有。IPIU2019007),湖北省重点实验室基金交通物联网(没有。whutiot - 2019004)和自然资源部门的科研项目湖南省(没有的自然资源。201910)。