文摘

因为人脸识别是极大地受到外部环境因素和面对信息的部分缺乏挑战人脸识别算法的鲁棒性,而现有方法鲁棒性差和低精度面对图像识别,提出了一种图像数字处理和识别基于数据降维算法。基于现有的数据降维的分析和人脸识别方法,根据面部图像输入、功能组成、和外部环境因素,人脸识别和处理技术流,和面部特征提取方法,提出基于非参数子空间分析(NSA)。最后,使用不同的方法在不同的面孔数据库进行比较实验。本文中的结果表明,该方法有更高的正确识别率比现有的方法和对XM2VTS面对数据库具有明显的影响。这种方法不仅提高了现有方法的缺点在处理复杂的脸图像也提供了一定的参考图像特征提取和识别在复杂的环境。

1。介绍

作为一种常见的生物特征识别方法,人脸识别(FR)应用领域的手机解锁,安全支付,智能门锁,等等。人脸识别使用面部特征来识别个人。然而,在这些应用领域,人脸图像中的信息丢失由于阻塞的问题收集脸图像。因此,缺乏一些面临信息将使人脸识别的影响变得更糟。人脸识别广泛应用于图像识别和验证和近年来引起了广泛关注。因为FR算法是准确的和无害的,它们用于应用程序,如访问控制、智能卡、信息安全,执法(1- - - - - -3]。人们主要使用浅或深人脸识别学习。基于特征提取的传统算法使用本地或外地面部特征来训练模型和使用模型识别看不见脸图像(4,5]。此外,在人脸识别中,深度学习的方法是使用整个脸部图像数据库学习和预测看不见脸图像没有生成特定的功能(6]。大多数当前的FR方法假设多个图像相同的脸可用于训练他们的算法(7,8]。事实上,可用的图像的数量相同的一面是有限的,和更多的图片将会增加算法的复杂性和处理时间。然而,当只有一个样本图像可用于系统培训,很难在不同照明条件下识别别人的面孔。因此,人们研究FR通过当地特点和取得更大的成果。Gao提出了一个描述和相似度测量技术的视觉相似性检索(VSR)在一个单一的模型数据库,对孤立点但不使用本地操作使用(DCP)方向角点匹配,与相邻点连接的方向信息显示为类似点(9]。在这些特征的方法,大多数面部特征通常是眼睛,鼻子,嘴巴。因为面部特征点的位置和数量是不固定的,特征向量的数量和位置可以用来表示不同的面部特征不同的面孔。该方法得到的特征点通常是在主要的面部特征和个人的特殊的面部特征。

在人脸识别中,基于稀疏表示分类算法(SRC)也被深入研究10]。稀疏表示方法主要使用图书馆形象构建字典并使用字典的稀疏重建的线性组合来查询图像并完成匹配。然而,稀疏表示有一些缺点。例如,稀疏表示是单独应用于每个输入信号无论图像来自同一类别,所以一些结构信息的图像不能使用。因此,有些人还提出了一种新的面部图像表示方法,即序列的额头,眼睛,鼻子,嘴,下巴,这是类似于稀疏表示,基于特征之间的相似性,从画廊中提取图像面积和查询图像的特征提取11]。在人脸识别的方法,人们用不同的方法来提取音频指纹,如小波变换、傅里叶变换,或基于熵的特征匹配(12- - - - - -15]。这些算法没有干扰环境噪声和体积。这些地方特色的识别是一个方法来创建一个数据库,这不仅可以减少信号的信息,但也保留独特的元素,所以它更容易搜索和在数据库中找到匹配。

同时,多个学习近年来发展迅速(16]。通常情况下,观测数据位于一个低维子流形嵌入在高维环境空间(17]。然后,为了进一步探索这个结构,许多流形学习方法提出了(18- - - - - -21]。这些算法都是基于局部不变性原理,和估计的子流形的几何和拓扑特性的随机采样点数从未知的子流形。例如,如果两个数据点很近的内管汇,它可以推断,他们表示在任何空间也非常接近(22,23]。虽然设计可靠的FR系统需要大量的工作,这些系统仍然面临着一些困难,例如当面对看起来不同的在不同的光线条件下或面部表情。

领域近年来,图像识别,基于子空间学习的传统方法,如主成分分析(PCA),线性判别分析(LDA),和它的扩展版本,广泛应用于低维特征提取的人脸识别(24]。主成分分析是一种无监督方法,旨在获得子空间预测全球最大的方差和维护数据的多样性25]。典型的特征脸方法由PCA K-L变换应用于人脸识别(26]。脸图像的主要特征向量通常代表的形状的脸,所以这种方法不仅可以减少的空间维度,也代表了特征脸。然而,LDA监测方法。这种方法主要是利用人脸图像的标签信息构建组间和组内色散矩阵,使面部数据完整的面部图像识别在一个适当的低维子空间。经典的鱼面临基于LDA也是主流的人脸识别方法,可获得较好的分类在人脸识别27]。

最近,基于低秩表示方法(远程雷达)吸引了太多的关注,因为它的鲁棒性和良好的性能28,29日]。该方法认为面对数据点位于低维子空间,并表示这些数据点低秩矩阵。然而,远程雷达及其子序列的应用是有限的,因为他们不能获得低维子空间。面临的主要问题基于低秩表示方法如何解决最小化问题。一般的解决方案是放松内核规范最小化(NNM)。虽然内核的规范是一个典型的凸逼近最小化问题,内核范数最小化的解决方案完全不同于实际价值(30.]。针对这些情况,本文提出了一种图像特征提取和识别方法基于数据降维算法。非参数子空间分析方法用于块识别图像矩阵和preextract特性。在获得低维新模式而不是原始图像,图像数字化处理和认可。最后,验证了此方法的基于“增大化现实”技术的数据库,ORL数据库,和XM2VTS面对数据库,其识别性能优于其他典型的人脸识别方法。

2.1。数据降维

有效的数据降维技术可以探索原始数据的内部结构和关系。它不仅可以消除数据之间的冗余和简化数据还大大提高计算效率,数据的可理解性,和学习算法的准确性。有效的降维方法的采用可以先压缩数据和减少存储(消除数据冗余将会更加有效,大数据信息压缩到50%的原始尺寸,和一些甚至可以被压缩到20%左右,大大节省存储资源)。简化的数据极大地提高了计算效率,并在此基础上,数据的可理解性(情报)可以表达更方便。其次,使用降维技术使提取的数据特性更准确。很容易和项目低维视觉空间进行分类。这个步骤使我们能够看到的分布数据以更直观的方式和内部结构,即数据可视化。

数据降维可以分为两种类型:特征选择和特征提取25]。前者是通过寻找能够表达原始数据的一个子集,而后者矿山新的原始数据的低维特征。然而,这些特性并不局限于原始特征的子集。一般来说,降维方法用于人脸识别的特征提取。从处理过的数据属性的角度来看,数据降维可以分为线性方法和非线性方法,如图1

从分类的角度信息要处理的数据降维方法可分为无监督方法,semisupervised方法和监督方法。Semisupervised方法是近年来的最新研究成果。nonsupervised和semisupervised之间,如图2

2.2。人脸识别

自法国科学家弗朗西斯·高尔顿打开了人类探索的前奏,对人脸识别的研究,经过近半个世纪的发展,人脸识别的研究领域形成了两个主流方向:基于特征分析和整体分析方法。基于特征分析的方法结合面临的相对比例参考点与其他形状参数可以用来描述脸特征形成了识别的特征向量。这种方法的优点是,它不仅保留了脸组件之间的拓扑关系,同时也保留了大量的关于组件本身的信息。改进的积分投影方法用于提取35-dimensional特征向量由欧几里得距离,然后用于模式分类,包括不仅点之间的归一化距离和比例也组成的二维拓扑的眼睛,鼻子,嘴巴。通过这种方式,总体模式充分考虑的属性。许多专家和学者也提出了各种改进的方法基于这种方法,比如费舍尔脸方法,弹性图匹配方法,RBF网络识别方法、隐马尔可夫模型和隐马尔可夫模型方法,方法。

经过多年的不断探索和研究,人脸识别技术已经取得了一些成就在以下方向:基于相对差异空间的人脸识别方法,基于当地的人脸识别方法,基于全球的人脸识别方法,基于子空间的人脸识别方法。

3所示。方法

3.1。人脸识别和处理

因为面临包含相同的特性,比如眼睛,嘴巴,鼻子,如何有效地识别不同面孔的学者在这一领域研究的主要问题。这些特性在面对的细微差别的位置,形状和颜色。研究表明,人脸检测和人脸识别的区别在于人脸检测概括和nonface区分开来。人脸识别必须区分不同的面孔。因此,如果人脸检测是一个基本问题,人脸识别是一个根深蒂固的问题基于监测。设计和开发的人脸识别系统中,需要解决的问题包括系统的速度和精度检测识别。系统具有可扩展性;也就是说,它可以添加更多的识别对象。典型的人脸识别系统主要由以下五个模块,如图3

脸图像信息可以通过相机或其它数字输入设备获得的。摘要面对图像信息来自于数据库常用的脸。脸图像数字化和预处理模块是人脸检测和识别的一个重要组成部分。脸图像采集的过程中,许多因素会导致图像的采集不够标准,例如,光强度和亮度的习得环境,采集设备的像素的分辨率;有时,有现象等不足对比和噪声干扰的收购。为了确保一致性的面孔图像(人脸位置、大小、图像质量、等),一般需要进行一系列预处理操作表面上的形象。预处理主要包括旋转操作,减少操作,缩放操作,图像增强操作,几何归一化处理,和灰色的归一化处理。为了获得面对图像在正确的位置,有必要整理脸部图像中,为了提高图像的质量,图像增强。采用增强的图像操作,它不仅可以产生一个清晰的视觉形象,也更有利于计算机的处理和识别,减少对图像的影响,并加强光。此外,图像的归一化操作是获得一个标准的脸图像相同的尺寸和相同的灰度值。

在特征提取方面,首先,原始数据的变换是通过实现从脸图像空间映射到特征空间,以获得最好的特性,可以反映分类的本质。这一步为后续的工作提供了一个参考依据(如更好的实现分类的目的)。在特征提取的过程中,我们应该选择适当的功能,根据不同的识别方法。在一个完整的人脸识别系统中,特征提取是最关键的核心部分,也是最大的困难之一。提取的特征的有效性和稳定性直接决定的性能和成功识别的效果。

分类器的设计主要是提取的知识训练序列在无监督或semisupervised和监督方法和获得的分布规律和类训练序列的分布特征,为后续的分类决策提供依据。最后,模式分类是用来完成任务面临歧视和分类,最后得到了歧视的结果。

3.2。特征提取方法

在人脸识别和处理,处理的对象通常是高维脸谱图片。由于这些图像的稀疏分布在高维空间中,很难对这些图像进行分类。因此,特征选择和提取方法通常用于人脸识别,这不仅可以提高识别算法的执行效率,而且实现空间压缩和去噪的目的。重要信息的收集样本通常只集中在一些属性。低维数据可以通过把高维数据样本,以便最有效的特征提取。非参数子空间分析(NSA)可以从脸图像中提取这些重要特性(31日]。

假设有一个包含训练样本集 脸图像,每个样品都是表示为 ,他们属于类 ,并且每个样本图像 维列向量。类的样本的数量 表示为

总平均向量 所有的样品和样本均值向量 分别表示如下: 在哪里

训练样本的组内散射矩阵是类似于组内的散射矩阵 在线性判别分析,表达如下:

组内的色散矩阵 训练样本的表达如下:

在方程(3)和(4), 意味着jth的形象类

在方程(4),权函数 定义如下:

在方程(5), 是一个从零到正无穷变化的参数。它的功能是控制距离的变化速度比重量。 向量的欧氏距离吗

最近邻的意思 定义如下:

在方程(6), 意味着最近邻的距离 - - - - - -脸对脸向量 在课堂上

三个结论可以从各种参数的选择获得全面方程(3)(6)。

首先,如果所有的值 函数设置为整数1和 ,也就是说, 等于类样品的数量 , 最近邻的意思就 (即。,的sample mean of class )。

国家安全局的组内的散射矩阵是由类中心,并不是所有的训练样本。此外,根据定义的 最近邻的意思 ,美国国家安全局方法可以更好地利用不同类型的边界信息。

代入方程(3)和(4)最好的判别函数,表示如下:

在方程(7), 是最优识别投影空间。 转化为一个广义特征值问题。

是可逆的,特征方程解决如下:

相对应的特征向量 最大特征值方程(8)可以作为最优向量的歧视。

通过分析方程(1)(8),如果美国国家安全局算法想获得较高的识别率,最近邻的价值 是特别重要的。

假设 类别的记录 类的数量 样品是 , th类的 图像矩阵 , ,和样品的总数 模块2神龙公司的想法是把矩阵 块矩阵,如下: 其中每个图像矩阵 是矩阵

训练样本的总体散布矩阵定义如下: 在哪里 是所有训练样本均值矩阵的规模和数量的子图象

准则函数定义如下:

其中,相对应的正交特征向量 最大特征值的 , 是最优投影向量组和吗 (最优投影矩阵)表示为 训练样本的特征矩阵投影 表示如下:

模块2神龙公司的过程中,当图像确定阻塞模式,投影轴的数量(例如, )决定特征矩阵的维数(例如, )。

如果该值的 太小,特征矩阵之后会失去一些有利的歧视信息分类。然而,如果该值 太大,将会有大量的冗余信息的特征矩阵,将干扰降维。

3.3。改进算法

基于以上算法,我们可以提高人脸识别的队伍。让 ;然后 的子图象矩阵的平均值 - - - - - -图像样本的类 计算如下:

请注意, 是一组 最近的邻居的类 的意思是 最近的邻居的类

定义组内的散射矩阵如下:

在方程(14),重量 计算如下:

在方程(15), 是一个积极的参数 ,可以控制体重改变距离比速度,和它的距离是 设置

类内散布矩阵 计算如下:

在方程(16), 是类的平均向量 样本。因此,相应的判别函数表示如下:

第一个 最大特征值的特征方程 及其对应的特征向量可以作为最优判别向量。

4所示。实验和分析

基于“增大化现实”技术的数据库上进行了相关实验,ORL数据库,和XM2VTS数据库来验证图像的有价值的信息不会丢失时使用这种方法来提取图像的低维特征。同时,实验还与其他常见的降维压缩这个方法(博士)方法,包括LRE [32],LSDP [25],TNNL [33],LPRR [34],Truncated-LRE [35]。

4.1。评价方法

识别率和标准偏差作为评价指标(33]。首先,我们使用投影矩阵获得的每个方法减少测试数据集的维数,以便测试数据集的维数从1到70的间隔5。因此,每种方法的识别率(rr)在不同的维度可以由以下公式计算: 在哪里 是一组数据预测标签获得测试数据集使用博士的方法, 是实际的标签测试数据集上的一组数据, 是在测试样品的数量数据集,然后呢 是一个函数,计算的数量等于元素在相同的位置吗pl

为了避免随机性,实验重复了五次,平均识别率计算。此外,模型的稳定性评估通过计算标准差(SD)。标准差可以按照下列公式计算: 在哪里 代表重复的次数, 代表每个实验的识别率, 是所有实验的平均识别率。

4.2。实验设计

为了评估该方法的性能,我们验证了这种方法的有效性,评价各种方法的识别率和标准偏差在不同的子空间。

在实验中,我们随机选择l从每一个人的形象面对培训数据库,测试和其他图像。此外,S的值是根据人数的调整在不同的数据库中。年代= 3、4、5分别代表了基于“增大化现实”技术的数据库,年代= 4、5、6分别代表ORL数据库,年代= 5,6,7,分别代表了XM2VTS数据库。细节如表所示1

4.3。示例数据库描述

基于“增大化现实”技术的数据库是一个大脸数据库建立的一个计算机视觉中心在巴塞罗那,西班牙,在1990年代。这座图书馆有120名志愿者。每个志愿者已经26图片,总共3120,男性和女性的比例是一半,和年龄在18岁至45岁之间。图像的大小是100×80。每个图像采集环境不同,光线强度不同,面部表情不同(睁开眼睛,闭上眼睛,张开嘴,闭上嘴,笑,不笑,痛苦,幸福,等等),和穿着配件也不同(围巾、耳环、太阳镜,眼睛,等等)。在这项实验中,基于“增大化现实”技术的脸数据库分为两个部分:提取人脸的子空间的训练集和测试集测试算法的性能。第十张每组作为训练集,最后5张作为测试集。以下是一组拍摄的图像的基于“增大化现实”技术数据,如图4

ORL数据库面临的往往是选择测试和评估提出了人脸识别算法的性能。这个数据库的拍摄时间从1992年到1994年。有400个脸图像在ORL数据库。所有图片在这个数据库的大小是92×112,256的灰度。总共有40个志愿者。每个志愿者需要10图像。所有的志愿者都是学生和教师。最古老的志愿者有81年的历史,最年轻的是18岁,他们中的大多数都在20到35岁之间。有一个大区别男性和女性的数量在数据库中,这是9:1;也就是说,有36个男4女志愿者。 The time period of face image acquisition is different, and various details are also different, such as light intensity (strong light and weak light), facial ornaments (with or without glasses or sunglasses, beard, and hair change), and facial expression (smile, serious, open, close, and squint). In the experiment, the ORL face database is divided into two parts: extract the training set of human face subspace and use the first four images of each person as the training set. The last four pictures of each person were used as the test set. The following is a group of photos taken from the ORL face database, as shown in Figure5

XM2VTS面对数据库也是在人脸识别实验中常用的数据库。总共有295×8图像或视频和音频剪辑在图书馆,灰度图像的分辨率是55×51;的差异包括是否戴眼镜,化妆、表情和姿势。在这个实验中,每个小组的前五表作为训练集,最后五个表作为测试集。下面是一群从数据库XM2VTS脸照片,如图6

4.4。实验结果

为了比较每种方法的实验结果AR脸上数据库和客观地反映了不同方法获得的图像的正确识别率,原始图像矩阵是切成图像子矩阵大小6×4和12×4。两个街区划分后,不同方法的实验结果比较的识别率。比较结果如表所示2

而LRE, LSDP TNNL、LPRR Truncated-LRE,新方法更好。具体地说,基于“增大化现实”技术的数据库中,结果使用LRE, LSDP, TNNL, LPRR,和Truncated-LRE方法是80.46%,78.69%,81.07%,79.63%,和80.26%,分别和最高识别率的方法在本文中是82.83%。

为了比较每种方法的实验结果在ORL数据库和客观地反映了不同方法获得的图像的正确识别率,原始图像矩阵是切成图像子矩阵大小8×6和12×6。两个街区划分后,不同方法的实验结果比较的识别率。比较结果如表所示3

而LRE, LSDP TNNL、LPRR Truncated-LRE,新方法更好。具体来说,在ORL数据库,结果使用LRE, LSDP, TNNL, LPRR,和Truncated-LRE方法是91.46%,90.69%,90.07%,91.63%,和90.26%,分别和最高识别率的方法在本文中是93.53%。

为了比较每种方法的实验结果XM2VTS面部数据库和客观地反映了不同方法获得的图像的正确识别率,原始图像矩阵是切成图像子矩阵大小10×4和16×4。两个街区划分后,不同方法的实验结果比较的识别率。比较结果如表所示4

而LRE, LSDP TNNL、LPRR Truncated-LRE,新方法更好。具体地说,在XM2VTS数据库中,结果使用LRE, LSDP, TNNL, LPRR,和Truncated-LRE方法是92.43%,92.59%,92.17%,91.35%,和92.68%,分别和最高识别率的方法提出了是94.75%。

通过比较该方法的实验结果在不同的数据库,它可以得出结论,该方法具有明显影响XM2VTS面对数据库。

5。讨论

实验统计结果显示表2- - - - - -4,通过比较正确的识别利率通过不同的方法,可以看出,该方法比LRE, LSDP, TNNL, LPRR,和Truncated-LRE方法,但数据库XM2VTS脸上的效果是明显的。此外,如果使用不同的方法在同一数据库,块的方法决定了价值的正确识别率。当面对数据库是相同的和阻塞方法是相同的,训练样本和测试样本的数量产生重大影响的正确识别率,但训练样本越多,识别效果越好。

从上面的结果,与其他方法相比,提出的方法,LRE, TNNL, Truncated-LRE,可以有效地处理原始图像和受损的形象。这无疑证明了低秩正规化的优越性在学习最优人脸的子空间。这主要是因为低秩表示能够准确地捕获原始数据的子空间结构。此外,与LRE相比,提出的方法,TNNL Truncated-LRE,处理受损图像有更好的性能,验证方法可以减少噪音的负面影响。这主要是因为TNNL包含在方法和Truncated-LRE取代了秩函数比内核在LRE规范。然而,这一方法比TNNL改进。关键的原因是方法是监督,而TNNL不是。通过添加线性判别方法充分利用标签信息。因此,低维特征学习的方法区分。总之,我们可以发现,这些方法的方法是最好的。 In addition, it also shows the effectiveness of integrating label information and low-rank minimization into the model.

6。结论

研究人脸识别过程中,特征提取是不仅一个关键的问题,而且其中一个最主要的困难在人脸识别的发展。如何有效地提取特征直接影响面部图像的识别率。针对人脸识别过程中图像处理问题,提出了一种面部图像特征提取和识别方法基于数据降维算法。非参数子空间分析方法用于块识别图像矩阵和preextract特性。在获得低维的模式而不是原始图像,图像数字化处理和认可。最后,通过实验,验证了方法的基于“增大化现实”技术的数据库,ORL数据库,和XM2VTS面临数据库。根据不同的方法,其识别性能优于其他典型的人脸识别方法。

对二维图像,人脸识别技术的困难仍然集中在问题如照度和亮度,人脸表情,和年龄的变化导致的变化。近年来,专家和学者们提出了一个基于三维面部模型的人脸识别方法基于这些紧迫的问题。基于三维面部模型的人脸识别方法将我们的研究在未来几年的重点(33,36- - - - - -38]。

数据可用性

标签数据集用于支持本研究的发现可以从相应的作者。

的利益冲突

作者宣称没有利益冲突。

确认

这部分工作是支持的人文和社会科学总体规划项目重庆市教育委员会”继承和创新发展的对策研究数字保护Bayo女巫的文化”(没有。20 skgh320),重庆市社会科学规划项目“数字资源的可持续发展和应用研究芭蕉女巫文化”(没有。2020 ybys192),重庆工业的重点工程理工学院(没有。GZY2020-KZ-03)。