研究文章|开放获取
司法夸梅Appati Huzaifa阿布,埃比尼泽奥乌苏,Kwaku Darkwah, ”分析和优化技术的实现人脸识别”,应用计算智能和软计算, 卷。2021年, 文章的ID6672578, 13 页面, 2021年。 https://doi.org/10.1155/2021/6672578
分析和优化技术的实现人脸识别
文摘
在大范围的识别方法,提出了仍然存在的挑战,这些算法不产生最佳的精度对照明,姿势,面部表情。近年来,相当大的注意力一直在群体智能方法的使用,帮助解决一些持久的问题。在这项研究中,主成分分析(PCA)方法的固有财产采用降维特征选择。合成特性进行了优化使用粒子群优化(PSO)算法。为目的的性能比较,合成功能也优化与遗传算法(GA)和人工蜂群(ABC)。优化的功能被用于识别使用欧氏距离(EUD),再(资讯)和支持向量机(SVM)分类器。这些混合模型的实验结果数据集ORL揭示PSO和资讯的准确性为99.25%,其次是ABC和GA 93.72%与87.50%。中央,算法的实验,GA, ABC YaleB数据集的结果在100%的准确率展示其效率先进的方法。
1。介绍
自动化生物特征识别是快速获得承认的最可信赖的安全系统21圣世纪。这可能是由于最近并行处理技术的重大进展并寻找最可靠的安全系统由于全球犯罪急剧增加。最早的生物功能,自动识别包括指纹,独特的脊皮肤模式利用。其他包括视网膜、蝴蝶花、棕榈,皮肤,鼻子尖。指纹、视网膜和虹膜识别系统已知收益率非常准确的结果1),但硬化罪犯,敏感地意识到安全问题,主要是避免被捕获到展示他们的生物特征数据库。因此,自动人脸识别系统现在是显而易见的选择(2),因为人们无法隐藏他们的面部图像从安装闭路电视摄像头。这使得技术最侵入和温床研究领域研究人员继续提出新算法比现有的。
由于自动人脸识别研究是新指纹和其他人相比已经说,与它相关的问题仍然是杰出的。例如,张,罗,阿来,唐3认为面部里程碑式的发现的问题,是系统开发的焦点之一。大部分的人脸检测算法是缓慢而产生贫困的识别精度(毛奥乌苏,詹和,2014)。人脸识别研究中的其他瓦解挑战与闭塞,造成变化,光照归一化,年龄,性别4]。在不受约束的环境中,在识别精度有明显降低,因此很难准确地识别面孔。因此,需要有技术,提高人脸识别在这些环境中。你,李,赵5]试图解决照明问题,提出利用DL-Net和届时方法。然而,这种方法不能充分考虑大规模的归一化反射率图像和人脸识别在野外。另一个挑战在人脸识别研究与测试实验结果的有效性。没有公认的标准数据集研究团体用于测试。使用特定的数据集的选择取决于个人研究员。大部分的数据集是有预谋的,因此并不代表真实的场景中。的民族,是一个挑战。目前,没有数据集是均衡的种族、性别和年龄。
非均匀照明的问题也出现在光照条件变化在不同的角度。因此,反射光的脸的比例是不同的。这种现象会导致个人的错误识别(6]。同样,由于个体随机回转运动也可以导致4 d认识错误分类。一个输入图像和interperson图像可能会出现不同的由于图像的旋转7]。本研究的主要目的是探索流行的技术和带来一种杠杆计算成本的方法。此外,该方法将考虑照明,姿势,面部表情。该方法提高了结果的主成分分析(PCA)方法使用优化技术方法。此外,在本研究变换精度的改善一般改善生物锁的安全性和完整性。
在这项研究中,我们探讨这个问题是最好的或合适的优化算法使用最大化识别。也再次对哪个分类器适合推荐的方法和方法利用更少的计算资源和时间。本研究的方法需要图像的预处理;然后,随后特性研究,并使用主成分分析提取。这将是紧随其后的是增加的功能使用PSO, ABC和GA分类最终整个过程。
2。相关的工作
人脸识别主要是四个阶段进行,visa-a-viz。,feature extraction, face detection, face synthesis, and recognition [8]。Chihaoui et al。9)表示,人脸识别技术主要是三类。首先是使用程序需要使用整张脸作为输入。第二种方法是只考虑一些功能或区域的脸,和最后一个方法是同时使用全局和本地的面部特征。此外,大量的数据集是针对特定人脸识别问题的解决方案,这些数据集是在实验室条件下。然而,也有一些数据集,试图解决多个问题,采取在现实条件下(9]。Fazilov、Mirzaev Mirzaeva [10)研究了一种算法来提高在更高维度的分类对象。该算法形成的一个子集相关图像,然后,一个特性表示当选为构建初等变换模型代表功能的子空间。算法追求的增强识别的准确性,学习时间,最后,对象识别时间。的解决人脸识别精度较低的问题,由于训练样本大样本和有限的可用性被他解决了,吴,太阳,晒黑11)当他们提出交叉模式异构的人脸识别的图像(HRF)。这项研究提出了瓦瑟斯坦CNN框架,利用一个网络项目近红外和欧几里得空间的视觉图像。该方法是一个形态不变的深特性学习NIR-VIS HFR架构。瓦瑟斯坦空间分离近红外光谱和随后力分布计算,然后,相关性是征收缓解过度拟合的连接层小近红外光谱数据集。
同样,Rahimzadeh Arashloo,麻烦的12]解决了地图的优化问题推理使用马尔可夫随机场(MRF)模型,利用GPU的处理能力。多分辨率分析技术、增量次梯度方法和有效的消息传递方法被用来获得最大效率增益。效率提高了使用multiresolutional雏菊特性对遮挡和光照达到不变性。该方法减少了基线的方法相比,计算成本200%。同样,陈等人。13]未遂的问题培训和深度学习网络适应不同的数据和任务。陈等人提出的方法通过图像到一个级联主成分分析(PCA)过滤PCANet培训。PCANet使用MultiPIE随后用于特征提取,扩展YaleB, AR, FERET和LWF数据库。此外,PCANet也复习参考先进的深度学习架构包含大量的图像分类。邓,胡、吴郭(14]提出的创建一张脸图像来减轻不同照明和姿势,分别使用只有一个额脸图像开发扩展通用弹性模型(GEM)和multidepth模型。Pose-aware度量学习(PAML)学会通过线性回归合成相应的度量空间中的每个姿势,它取得了100%的准确性。陈等人。15]另一方面提出了residual-based深面重建神经网络提取的特征从不同的姿态和光照。这种方法改变照明和姿势图片额平均脸图像照明条件。通过比较提出了三重损失和欧几里得损失,试验证明了后者对前者的性能最好。然而,只有一个数据库被用于这项研究中,并没有要比较该方法与结果。
你,李,赵5照明也解决了这个问题,姿势,和表达通过使用DL-Net和标准化网络(届时)。DL-Net清洗照明,然后重建一个反射率图像的输入图像。届时可实现反照率的图像和提取功能监督学习。MultiPIE数据库建立效率增加人脸识别方法的准确性在光照下,表达,不同的姿势。的研究得出结论称,提取的特征可以改善传统的特征提取方法。Zhang et al。16)提出了一种情感识别模型比SOTA模型有更好的精度。他们提取面部表情的七种不同的情绪。提取的图像过滤的组合香农熵和多尺度特征提取,结果分类使用模糊支持向量机(SVM)。该研究使用分层交叉验证的验证指标,因此,总体精度达到了96.77%的准确率。他和Ekenel17)提高了准确性闭塞的情况下,照明,变化和偏差的面部特征通过使用两个深CNN模型,VGG-Face和减轻pretrained大型数据集。这些数据集被用来提取面部特征。他们还使用了5个数据库尝试解决这个问题。AR面临数据集被用来作为分析工具的影响面部阻塞,耶鲁CMU派,和扩展数据集分析照明的变化。颜色FERET数据库用于影响分析视图不变性,最后,FRGC数据集是评价多视图目录。作者使用面部边界框扩展扫描整个头和提取深度特性,从而提高结果。他们比较他们的结果之间的面部边界框扩展到其他方法,和有显著改善的结果18]。然而,张等人优化面临具有里程碑意义的检测利用辅助数据的属性特征。这项研究提出了特征提取使用四个回旋的层。每一个这些层产生几个特征图,使用修正线性单元被激活。层然后用max-pooling耦合产生一个共享的向量。AFLW,多属性面部地标(MAFL)和加州理工学院闭塞的面孔在野外(COFW)受试者平均误差和失败率验证。研究得出结论,辅助任务更有效率的学习动态系数,这反过来,使该方法更健壮的闭塞的面孔和重要观点不变性(19]。
这种方法鼓励丁和道20.]提出对应的姿势规范化方法处理语义对应的损失,闭塞,和非线性面部纹理PIFR包装。该方法首先项目三维面部地标的晶格特征提取到一个二维的脸上。第二,一个最佳的经评估使用对应的纠正纹理变形将带来变化。这是在每个里程碑式的在本地执行补丁。恢复阻挡特性用于人脸识别使用面临建立描述符(20.]。然而,沙玛和Patterh [21)提出了一种技术,即面对由Viola-Jones识别算法。然后,眼睛,鼻子,嘴被发现通过该混合PCA。每一部分的功能随后开采使用枸杞多糖。应用主分量分析特征提取对识别。ORL面临数据集是用于识别率为识别指标。这项研究得出的结论是,有一个更高的识别率提出混合PCA方法不同的面部表情和姿势与SOTA对决时,PCA +小波,CA, 2神龙公司+ DWT,局部二进制模式算法。他们宣称,这种方法可以扩展到照明,年龄,或部分遮挡的问题。Duong,有趣的是,灾区,Quach Bui [22]提供了一个方法深外观模型(坝),准确地捕捉下形状和纹理变化大的变异使用深玻耳兹曼机(DBM)。大坝取代了活动外观模型(AAM)。该方法首先采用使用DBM确定脸上的具有里程碑意义的分发点数据,然后,面部数据矢量化结构模型。两层(形状和纹理)然后通过构造解释和使用高级层。伦敦时装周,海伦和FG-NET数据库被用于实验。的RMSE值方法控制方法(双三次的和AAM)显示显著改善识别率(22]。
段和棕褐色23]提出的方法学习pose-invariant特性的低复杂度的方法而不需要事先带来的信息。该方法消除了从脸形象和构成,通过这样做,提取局部特征。自相似性特点是首先从脸图像生成当它们之间的距离的特点不同的不重叠的块进行求值。然后,线性变换中减去从本地特点,变换矩阵是通过减少之间的距离造成变异特性。这个矩阵创建跨人歧视的信息被保留。不过,辛格,Zaveri Raghuwanshi [24)提出了一个粗略的成员分类器(RMF)构成图像的分类。使用log-Gabor进行特征提取,并计算是用于减少冗余功能。资讯分类器最终应用于减少伽柏特性。ORL、格鲁吉亚面临数据库、CMU派,头部姿势段图像数据库使用类似的性能指标和褐色(23]。这项研究得出结论,该方法最适合于执法的面部照片。此外,它能改善面部图像的识别与闭塞,增强使用建模技术和方法获得改善的结果。然而,使用三种方法进行测试减少了大量提议的方法的最优性与不同的图像数据集。尽管如此,赵、李和刘(25)提出了pose-invariant FR MSA + PCA。首先,使用affine-invariant特性提取多尺度autoconvolution (MSA)转换。此外,这些特征的解相关和MSA的减少比例执行使用主成分分析。最后,最高的主成分特征值进行分类使用资讯。实验指出需要大量的计算,该方法是在MSA特征提取阶段。
Abdalhamid和Jeberson26)提出了一个健全人pose-invariant FR系统通过人工蜂群优化再分类器(ABC-KNN)。方法使用视频转换成帧数作为输入。在转换后的图像的预处理过程中,李自适应滤波器(ALF)申请图像增强通过消除噪音。然后Viola-Jones (VJ)算法用于脸分割从右边的眼睛,鼻子,嘴巴。Complete-LBP (CLBP),中心对称局部二进制模式(CS-LBP)特性,伽柏特性(GF),和梯度方向模式的情况下(诗)描述符用于当怪癖提取分割图像。ABC-KNN应用作为图像分类。识别精度是绩效评估指标。因此,f·张,毛,郭台铭,詹27皮斐尔框架提出一个方法基于功能使用深度学习学习。PCA-Net使用额图片没有标签的学习过程特性。后者因此CNN用于特征映射空间分离nonfrontal和额叶的脸。这部小说描述生成的地图然后用于描述nonfrontal面临实现标准特征来描述任意的面孔。多视图健壮的特性被训练使用单一分类器对不同的姿势。BU-3DFE静态很少被使用在实验阶段和识别性能评价指标。这种技术后与其他技术和框架,提出过程似乎比SOTA技术。此外,该方法可用于构成强劲的特征提取时训练,而不是训练模型对不同姿势的变化。
最后,唱歌,李,赵28PIFR融合纹理和深度)方法使用贝叶斯分类器联合成一个框架。输出然后确定使用相似性估计量之间的输入和数据库。然而,有一个高计算成本面对大型面对数据库图像的识别。此外,实验被广泛用于各种姿势,多个方法并不比当前的方法。
3所示。研究方法
本研究的研究设计包括图像预处理、特征提取与PCA,这些特性的优化使用PSO, ABC和GA,最后使用资讯的分类对象,支持向量机,EUD。这项研究的数据集是YaleB和AT&T俗称ORL。这些数据集选择的理由,他们已经明确的挑战所必需的验证人脸识别算法。后续部分详细解释了研究设计的主要部分。
3.1。特征提取
该组件的设计获得相关生物从一个给定的图像描述符。在这个过程中,大量的数据使其获得必要只选择高贡献描述符。存在一些技术对于这个任务;然而,本研究采用PCA由于在这一领域它的受欢迎程度和效率29日]。
3.1.1。主成分分析
主成分分析的人脸识别的主要目标是高维数据的变换到特征子空间称为eigenface较低。这一特征空间代表了轨迹的协方差矩阵特性地标。尽管它的实用性,他们计算昂贵的高维数据。这需要采用另一种算法具有相似属性和结构(30.作为PCA但相对廉价的称为奇异值分解(计算)。把一个矩阵X与维n x m,主成分分析可以定义为协方差矩阵的特征分解 。这产生一个特征值其对应的特征向量W。这些特征向量作为转换操作符X获得一个新的矩阵T相同的尺寸X所示
方程(1)(即假设所有组件。列),是校长。然而,在实践中,这些组件将冗余;因此,是有序的 。的命令 ,截断可以使用第一个被执行r组件进行分析。这就是说,我们作为一个米通过r矩阵给我们新的转换矩阵Tr所示
如前所述,PCA是昂贵的操作,和圣属性数学与PCA优先实施。方程(3)显示的圣言X。 在哪里是左奇异向量,的共轭转置右奇异向量,然后呢包含奇异值在其对角线。计算的特征值分解XTX与方程(3)获得 ,显而易见,W是一样V,而下令奇异值( )是成正比的 。的财产和V酉矩阵,我们有什么 在哪里我是单位矩阵。从方程(1)和(3),注意W是一样V,我们有
这些方程进一步证明为什么圣言会计算便宜的PCA相比,计算协方差 。的主成分方程(7),我们有
最后,由于需求W而不是特征分解 ,圣言会可以用来有效地计算W。
3.2。功能优化
这项研究的部分描述了群体智能算法用于功能优化。这些方法包括人工蜜蜂殖民地,遗传算法,粒子游优化。
3.2.1之上。人工蜜蜂殖民地
人工蜂群(ABC)是一个群的算法设计与蜜蜂的觅食行为。ABC的四个组件行为模型的主要食物来源,寻找蜜蜂,旁观者蜜蜂,蜜蜂。食物来源表示可能解决聚类问题作为全球侦察蜂进行搜索。这个随机执行搜索,而旁观者和雇佣蜂搜索相邻的解决方案。随后采用蜜蜂评估精度的解决方案之前在内存中存储的解决方案。这些信息是先后传递给旁观者蜜蜂在跳舞。这将确保选择最好的食物来源,而停滞不前食物来源已经设置在一个周期被遗弃了,取而代之的是新来源。重复这个过程直到收敛得到最优解。在数学上,我们有以下步骤。第一步:随机初始化解决方案 ,在哪里代表每个食物来源,FS代表总食物来源。此外,初始化旁观者和使用一个随机函数发生器采用蜜蜂 在哪里 是一个向量的长度D与和表示的最大和最小值jth维度。第二步:迭代找到新的解决方案由每个蜜蜂使用 在哪里 标志着新的解决方案在当地范围内 和 。采样点之间的欧几里得距离的总和及其集群中点是所有候选人来源的健身价值成反比。在资源的选择,采用贪婪算法通过比较新旧的健身价值立场。第三步:概率解决方案的计算使用 在哪里的健身价值吗 旁观者蜜蜂使用这个概率选择new值后通过搜索局部最优而第二步计算健身价值。第四步:如果旁观者和采用蜜蜂无法识别新的和更好的候选解决方案通过后,本地搜索一些预定义的迭代,解决方案被丢弃和取代侦察蜂的新的解决方案。这些侦察蜂使用随机全局选择寻找新的解决方案。第五步:重复2 - 4步,直到满足停止准则定义返回最优输出
3.2.2。遗传算法
另一方面,遗传算法(GA)是基于遗传学和自然选择理论。它是一种随机算法,找到最好的解决方案有效地找到全局最优的一个更大的空间。得到一个负的健身价值使用适应度函数。这个值是用来总结如何接近最优解是全球最好的(Mahmud, Haque Zuhori,朋友,2014)。GA开始通过生成随机数与人口规模(称为染色体)n。每个染色体都有其健身价值计算,停止标准检查。GA等运营商的选择、交叉和变异的染色体向融合进一步解释。
选择。这个操作符创建后代从现有的人口使用过程与自然选择在生物生命形式。选择再一次强调了在人群中个体的更好的性能。这有助于他们的后代的期望拥有的可能性进行连续的一代的遗传信息。因此,收敛性得到极大影响的大小选择的过程。因此,选择标准应该防止过早收敛,保持种群多样性和平衡的交叉和变异操作。
交叉。两个父母之间的交叉算子混合信息的方式匹配的有性生殖。转换过程的目的是给一种改进的“出生”的后代。这是通过探索不同部分的搜索空间。
突变。突变过程变化随机选择的值在每个字符串,从而防止GA停留在基因数据的局部最小值通过散射,因此维持人口的变化。重复这个过程直到获得最优解或代预定数量的消逝。
3.2.3。粒子群优化
粒子群优化(PSO)也是一个优化算法受生物学的影响。它是派生通过观察集体行为和聚集一群飞鸟和鱼的学校(30.]。算法组成的解决方案被称为人口,每个有一系列的参数,它代表的是协调与多个维度空间。此外,这些粒子的集合成为一个人口空间粒子探测搜索来找到最优解。在内存中每个粒子追踪其前最优解,然后标签这些解决方案作为全球个人最好的和最好的。的轨迹我th粒子然后D-multidimensional空间中定义
的人口群
然后粒子迭代更新各自的位置在参数空间搜索最优解时使用 在哪里的速度组件吗我th粒子沿d维空间t和t +1,表明双连续运行的过程。的速度我th粒子中定义方程(15)有三个方面:第一是惯性,阻止粒子大大改变方向,第二项描述粒子的能力回到先前已知的最佳位置,最后一个词描述了粒子移动(群)接近最好的位置: 在哪里个人最好的粒子,是全球最好的,然后呢和 ,在的范围 ,分别为认知和社会系数。最后,R1和R2是两个对角矩阵随机生成的均匀分布在[0,1]。这确保了社会和认知的组件有一个随机影响的速度更新方程(15)。自收敛粒子来自个人和全球最佳解决方案,随机权重的两个加速条款和半随机的轨迹。这就要求方程(14)和(15迭代直到满足停止条件。算法,我们有下面的伪代码。
3.3。PSO算法
(1)N粒子初始化(一)初始化位置 (b)初始化粒子位置的最佳位置 (c)计算每个粒子的适应度,如果 ,初始化全球最好的=xj(0)(2)重复直到条件满足为止(一)更新粒子速度按照方程(15) (b)更新粒子的位置使用方程(14) (c)评估粒子的适应度 (d)如果 ,更新个人最好成绩:= (e)如果 ,全球最佳更新:= 。(3)分配的最佳解决方案最后的迭代过程。3.4。分类
提取的特征向量的优化后,分类建立模型就是为了解决人脸识别的挑战。有无数的预定义的模型对于这个任务给定的特性集,其中包括支持向量机资讯,k - means,欧几里得距离,VGGNet, CNN。其他pretrained面临分类器如VGG-Face也退出,估计脸图像之间的相似性的主题和相关特性选择从图像数据库中。在这项研究中,欧几里得距离(EUD),再(资讯)和支持向量机(SVM)。
4所示。实现的方法
4.1。实现管道
实现管道研究如图1。的图,每一个图像进行一系列的预处理和随后的特征选择和最后功能优化。这些优化功能训练的特征匹配。
4.2。环境设置
本研究人脸识别系统中实现发展,训练,和测试使用Matlab R2018b惠普桌面处理器,英特尔®™核心i7 - 770 t @ 2.90 GHz CPU, Linux Ubuntu 20.04 LTS操作系统。
4.3。图像预处理
在图像分析的第一步是不受欢迎的噪声图像的预处理。这些组件不利于考试的形象,因此通过预处理中。所有图片尺寸超过96————84像素downsampled。这是紧随其后的是所有彩色图像转换成灰度。输出的图像被分成训练集和测试集。百分之八十的图像作为训练集作为测试组为20%。这个预处理实现,这样将减少复杂性和计算时间改善。
4.4。特征提取
本节进一步阐明在这项研究中使用的特征提取方法。本研究的目标之一是实现离线的面部识别系统和一种改进的使用优化技术和健壮的特征提取方法。这种方法将测试使用AT&T和YaleB面临数据集包含面临不同光照、不同的姿势,闭塞的面孔,不同的表情,或它们的组合。的均值计算功能,每张图片的第一主成分的特点被选中。意味着AT&T和YaleB面临数据集数据所示2和3,分别。
4.5。降维特征选择
鉴于意味着面对训练数据,计算二进制单例扩张函数应用以聪明元素运算符。合成的图像分解与单值分解函数降低系数用来描述图像。的累积和对角矩阵的平方计算生产与第一主成分k特征值的组件选择。对特征向量归一化到eigenfaces。这个过程的示例输出在AT&T和YaleB数据集数据所示4和5,分别。
再次,二进制单例扩张函数用于将测试数据通过使用均值的脸。这些改变了训练和测试数据优化更好的分类结果。
5。结果与讨论
本节详细描述了实验的结果和分析结果。此外,对比其他优化方法使用相同的数据库,并将讨论三种不同的分类器。
5.1。数值结果
通常,在记录人脸识别的性能模型,统计指标如准确性、回忆,精度,使用F-measure,等等。一个有效的评价和有效的与现有的研究相比,精度指标被选中。所有分类的识别精度计算方法应用于不同的数据集不同优化方法。表1- - - - - -7显示平均、最大和最小数据集的识别精度有不同的分类方法。这个实验是一千五百(1500)进行迭代的/不考虑优化提取特征。
|
||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||
5.2。讨论
从结果部分所示4.1模型,观察到AT&T的数据集上的性能是相当低的。这可能归因于闭塞,不同的姿势,和表达表现出面对图像使其自然难以模型。相反,模型的性能比较好,因为它只包含图像不同照明。从表1可以看到,它的精度最高资讯YaleB数据集和支持向量机在100%。然而,与GA优化功能资讯分类器的显著下降了70%降低9.8%使用欧氏距离方法如表所示3。没有损失,如表所示2和4资讯和SVM在ABC和PSO优化执行。然而,减少PSO和ABC的4%和5%,分别是指出EUD分类器时使用。因此,有一个大的区别在识别精度使用美国电话电报公司(AT&T)数据库。没有使用优化方法,美国电话电报公司(AT&T)数据库的识别跌至29.94,77.84,和82.05 EUD,资讯,支持向量机,分别如表所示1。然而,使用PSO优化技术看到改善资讯的平均识别精度80.46%。有一个显著的退化在使用支持向量机分类器识别精度平均为59.85%。再次EUD看到28.46%的平均识别精度算法如表所示5。相反,GA和ABC的平均识别精度下降为47.05和66.78,分别在使用资讯和54.86%和35.55%在使用支持向量机可以单独观察表6和7。实验给出的顺序如下。PCA + EUDPCA +资讯PCA +支持向量机PCA +算法+ EDPCA +算法+资讯PCA +算法+ SVMPCA + GA + EDPCA + GA +资讯PCA + GA + SVMPCA + ABC + EDPCA + ABC +资讯PCA + ABC + SVM
通过观察,PCA +算法+ EUD拥有15.19%的识别精度低于79.83%,识别精度的PCA + EUD YaleB数据集。这表明PSO优化的特性与84.81%的实验产生更好的结果。此外,没有变化识别资讯的准确性。这个点算法不减少当执行优化技术成果。相反,支持向量机看到了不到1%的识别精度低于90%。这表明超过99%的结果PCA +算法+ SVM识别精度高于90%与95%的识别精度为100%。因此,减少5% PCA +支持向量机可以被认为是无关紧要的。最后一点,PSO优化EUD和支持向量机。同样,PCA + GA + EUD有超过71%的结果之上,PCA + EUD。然而,资讯和支持向量机的结果大于60%和100%的PCA +资讯和PCA +支持向量机,分别。 Yet still, PCA + GA + KNN shows significant decay of results from its default 100%. SVM, on the other hand, displays a negligible reduction in average recognition accuracy. With this, SVM seems to produce better results than both KNN and EUD with respect to the use of the GA optimization algorithm.
以相似的方式,YaleB数据集的结果PCA + ABC + EUD产生28%的数据高于默认的PCA + EUD的79.83%。然而,美国广播公司优化识别资讯和支持向量机并没有发现重大损失的结果平均资讯和SVM识别精度100%和99.6%,分别。可以建立,优化结果由ABC和机密资讯使用适合YaleB数据集,和ABC优化对资讯和SVM数据集表示。表8显示了前20为算法的实验结果,ABC和GA优化算法使用EUD YaleB数据集上实现,然而,SVM分类器。不过,大幅削减结果观察到当AT&T的数据集使用源于参数识别的增加。AT&T的数据集包含图像是闭塞的,它也有不同的姿势和表情。PCA +算法+ EUD AT&T的人脸数据集产生的结果平均PCA + EUD以下数据库。1500年51%的结果低于默认PCA + EUD为29.94%。总体平均识别的PCA +算法+ EUD AT&T数据库,然而,是28.46%,如表所示5。认为,平均识别的恶化是抵消其他认识的更大价值。48%的上述结果默认29.94%不是微不足道的,但它是一个小比例的考虑。然而,另一方面,有31%的结果高于77.84%的默认识别。不过,平均识别精度为3%高于默认实现。因此,80.46%的平均识别精度与PSO-optimized资讯特性(PCA +算法+资讯的最佳组合是美国电话电报公司(AT&T)数据库,因为没有一个SVM高于82.05%的基线识别结果。再次,PCA + GA + EUD表明28.78%的平均识别精度。这类似于平均结果通过所有3优化方法使用EUD作为分类器。然而,GA和ABC达到平均47.05%和66.78%资讯分类器识别精度,分别。这说明了一个萎缩的结果从77.84%降至47.05%,GA为66.78%,美国广播公司。 GA suffers 30% degradation, while ABC saw an 11% reduction in average recognition accuracy. Moreover, the average recognition accuracy for both GA and ABC for the SVM classifier plummeted further than that of KNN. A 27% reduction in average recognition accuracy using the SVM classifier for GA supersedes that of ABC, which has 46.5% reduction. Thus, it concludes that GA and ABC using SVM as the classifier is not suitable for this approach. The first 20 results are shown in Table9。
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
再次,线性内核用于SVM分类器进行实验时。这个内核的倾向是提高计算时间相对于其它SVM内核,并适用于高维数据(31日]。然而,线性内核在这个实验中似乎牺牲精度计算时间。因此,内核选择不会产生好结果。其他内核,如多项式,高斯径向基函数(RBF),或方差分析可以用于支持向量机在未来的研究中,结果相比,该方法。同样的,表1表明,支持向量机是一种更好的分类器使用线性内核时,当不使用优化算法。因此,美国电话电报公司(AT&T)和SVM YaleB数据集产生最好的结果。现在,比较表2- - - - - -4,认为一个完美的识别精度为100%的最大meta-heuristic算法和分类器。这表明优化方法可以用于YaleB数据库无论分类器。相反,最大的识别精度的算法用于增加给人的印象,然而,分类器是更好的。这意味着PSO +资讯,ABC +资讯,GA +资讯比SVM同行有更好的识别精度。这表明优化算法退化产生的支持向量机分类器的结果。尽管如此,GA的最大认可比默认的SVM (PCA + SVM)。因此,遗传算法与线性SVM分类器时应优先选择的内核。此外,该算法提高了识别精度达到最高EUD分类器。选择,算法作为YaleB理想的优化算法和AT&T的数据集。对比了该方法与其他方法,如表所示10提出的方法比其他SOTA方法是有效的。经过本研究提出建议的优化方法和分类器,给出各自的数据表11。
|
||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||
最后,表12显示了每个实验的时间。看到,PSO试验的最低平均时间1.594,1.592,和55.46年代EUD,然而,和支持向量机。算法+ SVM看到最高的计算成本为55.46 s所有实验。然而,它要求小于2秒PSO + EDU和PSO +资讯试验。随后,美国广播公司和GA meta-heuristic算法PSO产生类似的结果,但算法在计算上比这两个更便宜。
|
||||||||||||||||||||||||||||
6。结论
本研究着眼于如何提高PCA特征选择的优化方法提高人脸识别模型的准确性。提出实现表明,算法的选择作为一个无约束优化方法适用环境的现实世界中,由于姿势,闭塞,和表达主导人脸识别问题中发现的无约束的环境。的默认识别准确性YaleB资讯分类器和支持向量机显示100%的准确率。然而,ORL数据库没有达到完美的识别由于固有的数据集的性质。尽管如此,使用优化算法的选择特性识别精度从82.63%上升为EUD最多100%。这表明所有三个进化算法可以用来提高结果的准确性。然而,由于ORL数据库满足3参数,最大识别没有达到100%,但99.25%承诺使用PSO算法和资讯分类器。最后,PCA +算法+资讯的方法是选择本研究由于其能力来处理参数的增加,也优于其他SOTA算法。这些参数增加移动识别接近真实的人脸识别。向前发展,本研究可以扩展通过观察其他最近的群智能优化模型用于其他字段的属性是不太昂贵,其他私人数据集与更严格的挑战可以用来进一步验证该模型。 This remains a limitation to this study.
数据可用性
第二个数据源用于支持本研究的结果可从美国电话电报公司(AT&T)数据库(https://www.kaggle.com/kasikrit/att-database-of-faces)和YaleB数据库(https://github.com/Suchetaaa/CS663-Assignments/tree/0426d951d0212ed3dd831377a0df11551670ab87/Assignment-4/1/CroppedYale)。
的利益冲突
作者宣称没有利益冲突。
引用
- 李和w·邓“深刻的面部表情识别:一项调查,”2018年,http://arxiv.org/abs/1804.08348。视图:谷歌学术搜索
- r·d·Labati热那亚,e·穆尼奥斯诉Piuri f . Scotti g·斯福尔扎,“生物识别在自动边境控制,”ACM计算调查卷,49号2,1-39,2016页。视图:出版商的网站|谷歌学术搜索
- f·张,y,毛问:,j .郭台铭和詹y,“Pose-robust特性学习面部表情识别,”计算机科学的前沿,10卷,不。5,832 - 844年,2016页。视图:出版商的网站|谷歌学术搜索
- s . Zafeiriou c·张,z,“在人脸检测在野外的一项调查显示:过去、现在和未来,“计算机视觉和图像理解卷,138 - 24,2015页。视图:出版商的网站|谷歌学术搜索
- h .你k·李,赵问:“援助的姿势和表情的人脸识别归一化反射率图像,”ACM国际会议进行系列,93卷,2019年。视图:出版商的网站|谷歌学术搜索
- x, x局域网,g .梁j . Liu和n .郑”Pose-and-illumination-invariant面对通过triplet-loss训练深度重建模型表示,“多媒体工具和应用程序,卷76,不。21日,第22058 - 22043页,2017年。视图:出版商的网站|谷歌学术搜索
- c .叮,c .徐,d .道,“多任务pose-invariant人脸识别,”IEEE图像处理:IEEE信号处理学会的出版物,24卷,不。3、980 - 993年,2015页。视图:出版商的网站|谷歌学术搜索
- c·丁·d·道,“一个全面调查pose-invariant人脸识别,”ACM智能交易系统和技术,7卷,不。3,2016。视图:出版商的网站|谷歌学术搜索
- m . Chihaoui a . Elkefi w . Bellil, c . B . .阿玛,”二维人脸识别技术的调查,“电脑,5卷,不。4,41 - 68,2016页。视图:出版商的网站|谷歌学术搜索
- s . k . Fazilov n . m . Mirzaev, g . r . Mirzaeva”修改识别算法基本转换的基于模型的建设,“Procedia计算机科学卷,150年,第678 - 671页,2019年。视图:出版商的网站|谷歌学术搜索
- r .他,吴x、z太阳和t . Tan“瓦瑟斯坦CNN:学习不变特性NIR-VIS人脸识别,”IEEE模式分析与机器智能第41卷。。7,1761 - 1773年,2019页。视图:出版商的网站|谷歌学术搜索
- 美国Rahimzadeh Arashloo和j .难应付的“快速构成不变的面孔识别使用超级耦合的多分辨率马尔可夫随机域GPU,”模式识别的字母卷,48 49-59,2014页。视图:出版商的网站|谷歌学术搜索
- 郭宏源。Chan k .贾美国高,j . Lu z曾庆红,和y妈,“PCANet:一个简单的深度学习基线图像分类?”IEEE图像处理,24卷,不。12日,第5032 - 5017页,2015年。视图:出版商的网站|谷歌学术搜索
- w·邓,j·胡、吴z和j .郭”从一个到多个:pose-Aware度量学习single-sample人脸识别,”模式识别卷,77年,第437 - 426页,2018年。视图:出版商的网站|谷歌学术搜索
- 沈w z . Chen, y曾庆红,姿势不变的面孔识别稀疏表示,“国际期刊工程造型,30卷,不。1 - 4,37-47,2017页。视图:谷歌学术搜索
- 崔张t . w .郑z,, y宗庆后,j .燕和k .严,“深神经学习的多视点的面部表情识别方法,但,网络驱动下的特性”IEEE多媒体,18卷,不。12日,第2536 - 2528页,2016年。视图:出版商的网站|谷歌学术搜索
- m·m·拉什德和h k Ekenel”,综合分析人脸识别,基于深度学习的表示”《IEEE计算机学会学报计算机视觉与模式识别会议研讨会,页102 - 109,拉斯维加斯,内华达州,美国,2016年7月。视图:谷歌学术搜索
- m·m·拉什德和h . k . Ekenel”情感自动识别在野外使用静态和动态表征的合奏,”学报ICMI 2016 - 18 ACM国际会议的程序在多通道交互,页514 - 521,东京,日本,2016年11月。视图:谷歌学术搜索
- z, p .罗c . c .阿来和x唐,“学习深表示脸对齐辅助属性,“IEEE模式分析与机器智能,38卷,不。5,页918 - 930,2016 d。视图:出版商的网站|谷歌学术搜索
- c·丁·d·道,“与homography-based正常化Pose-invariant人脸识别”,模式识别卷,66年,第152 - 144页,2017年。视图:出版商的网站|谷歌学术搜索
- r·沙玛和m . s . Patterh”,一种新的混合方法使用PCA姿势不变的人脸识别,”无线个人通信,卷85,不。3、1561 - 1571年,2015页。视图:出版商的网站|谷歌学术搜索
- c . n . Duong k并k . g . Quach和t . d . Bui,“深外观模型:深玻耳兹曼机面建模方法,”国际计算机视觉杂志》上,卷127,不。5,437 - 455年,2019页。视图:出版商的网站|谷歌学术搜索
- x段和Z.-H。棕褐色,“基于空间自相似性特征学习的人脸识别方法在不同姿势下,“模式识别的字母卷,111年,第116 - 109页,2018年。视图:出版商的网站|谷歌学术搜索
- 辛格k、m . Zaveri和m . Raghuwanshi”基于粗糙集的姿势不变的面孔识别面部照片图片一样,“《智能与模糊系统,26卷,不。2、523 - 539年,2014页。视图:出版商的网站|谷歌学术搜索
- y赵、l·李和z . Liu”小说为pose-variant人脸识别算法使用affine-invariant特性,”计算机与电气工程,46卷,第230 - 217页,2015年。视图:出版商的网站|谷歌学术搜索
- k . h . Abdalhamid和w . Jeberson Pose-invariant人脸识别的人工蜂群优化资讯分类器,”先进的动力和控制系统研究》杂志上,11卷,不。8,525 - 539年,2019页。视图:谷歌学术搜索
- Y.-D。张,Z.-J。杨,小时。陆et al .,“面部情绪识别基于双正交的小波熵,模糊支持向量机,和分层交叉验证,”IEEE访问4卷,第8385 - 8375页,2016年。视图:出版商的网站|谷歌学术搜索
- g .唱j·李,赵问:2016年,Pose-Invariant通过RGB-D图像人脸识别。
- m . Haghighat s Zonouz, m . Abdel-Mottaleb”CloudID:值得信赖的云计算和跨企业的生物特征识别,”专家系统与应用程序,42卷,不。21日,第7916 - 7905页,2015年。视图:出版商的网站|谷歌学术搜索
- m .女子,a·k·舒克拉。”人脸识别系统的一个实现使用PCA和基于PSO的技术(法尔斯)”,先进的人脸识别,卷211007,不。6,225 - 229年,2016页。视图:谷歌学术搜索
- k . Sasirekha和k . Thangavel优化再使用粒子群优化进行人脸识别,”神经计算和应用没有,卷。31日。11日,第7944 - 7935页,2019年。视图:出版商的网站|谷歌学术搜索
- 艾哈迈迪和m . Rezghi“广义矩阵的低秩近似基于多个转换成对,”模式识别,108卷,2020年。视图:出版商的网站|谷歌学术搜索
- 比比Benuwa、b . Ghansah和e . k . Ansah”基于内核的位置敏感有识别力的稀疏表示人脸识别,”科学的非洲文章ID e00249卷。7日,2020年。视图:出版商的网站|谷歌学术搜索
- l .周w·李,杜y, b . Lei,梁和美国,“自适应illumination-invariant人脸识别通过当地非线性多层对比功能,“杂志的视觉传达和图像表示文章ID 102641卷,64年,2019年。视图:出版商的网站|谷歌学术搜索
- y, z中,j·杨,j .你和d·张,“一个新的区别的稀疏表示的人脸识别方法通过美元l_{2} $正规化,”IEEE神经网络和学习系统,28卷,不。10日,2233 - 2242年,2017页。视图:出版商的网站|谷歌学术搜索
版权
版权©2021正义夸梅Appati等。这是一个开放的分布式下文章知识共享归属许可,它允许无限制的使用、分配和复制在任何媒介,提供最初的工作是正确引用。