文摘
提出了两阶段测试样本表示(TPTSR)作为人脸识别的一个有用的分类器。然而,TPTSR方法不能拒绝骗子,所以它应该修改为真实世界的应用程序。本文介绍了阈值TPTSR (T-TPTSR)方法对于复杂对象识别异常值,和两个标准来评估的性能异常排斥和成员分类定义。T-TPTSR方法的性能与修改后的全球表示相比,分别PCA和LDA方法。结果表明,T-TPTSR方法达到最佳的性能根据这两个标准。
1。介绍
对象识别已成为计算机视觉领域的一个热门话题,近年来模式识别,和许多方法已经提出了图像分类与一个给定的数据库。一种方法是减少样本的维数与线性变换方法提取特征向量,如主成分分析(PCA) (1- - - - - -3)和线性判别分析(LDA) (4,5]。PCA方法,训练样本和测试样本从原始样本空间转换成空间的最大方差的所有样本,尽管LDA方法将样本特征空间,不同类别的中心的距离最大化。在这两个转换方法,训练样本和测试样本对应的表示在新的特征空间,分类是基于表征之间的距离进行相关的训练集和测试集。
提出了另一种类型的transformation-based方法专注于训练样本的局部信息。而不是使用整个训练集,这种方法只使用样本的一部分,从分类器的性能通常是有限的一些当地的区域内。通过集中培训的当地分布数据,分类器的设计和测试可以比全球方法更有效6]。典型的当地LDA方法的示例包括多通道投影数据的方法(7,8)和样品的方法使用本地依赖分类(9]。还发现,当地的PCA是更有效的比全球PCA特征提取(10]或样本聚类(11]。
近年来,稀疏表示理论已应用于模式识别问题,吸引了很多关注12- - - - - -21]。的稀疏表示方法也只使用部分训练数据分类的线性表示一个测试样本训练集,和部分线性组合系数设置为零。稀疏表示方法的分类标准是基于样本的最大贡献类在线性表示。
在最近的一项研究中,一个两阶段测试样本(TPTSR)表示方法,提出了人脸识别(22]。在这种方法中,分类过程分为两个步骤:第一步选择最近的邻居用测试样本训练集的线性表示方法和第二步处理选择样品进一步利用线性表示测试样本。分类的结果是基于线性的贡献之间的类最近的邻居TPTSR的第二阶段。通过选择最亲密的邻居从训练集进行进一步处理,TPTSR方法识别本地区域可能包含目标类样本,减少误分类的风险,因为类似的不属预定目标的样本。
甚至TPTSR方法已被证明是非常有用的在脸分类;然而,对于人脸识别应用程序与异常值分类重点不同,性能度量标准也是新的。在人脸识别异常值的问题,如安全登记系统,只有一小和特定组的成员需要分类,而大量的无关紧要的人或入侵者。确定应用程序的通缉犯在机场、火车站等公共场所,也需要分类器识别一个小数量的目标成员来自大量的无关紧要的乘客。在以前的研究中,异常值的模式分类方法包括两个主要的方法,一个是训练分类器只有成员样本,另一个是考虑到少量的离群值作为训练集(一个单独的类23]。然而,上述方法可以保证较低的误警率,同时保持一个合理的识别率为成员。
在本文中,我们进一步发展TPTSR方法通过应用一个阈值的分类过程异常排斥和会员分类,它被称为阈值TPTSR (T-TPTSR)方法。T-TPTSR,测试样本之间的距离和目标类的加权贡献二线性表示测量并与阈值比较,局外人将确定。在这项研究中,我们还提出了两种不同的标准来评估分类器的性能异常排斥以及成员分类,根据这些标准,我们测试全球表示阈值(T-GR)方法,阈值PCA (T-PCA)方法,分别和阈值LDA (T-LDA)方法。试验结果表明,T-TPTSR达到更好的性能在拒绝异常值,同时保持杰出的成员分类率。
在部分2和3本文中,我们将介绍T-TPTSR理论,T-GR, T-PCA和T-LDA分别。部分4提出了我们的实验结果与不同的面孔图像数据库,和最后一个结论将在部分5。
2。阈值两阶段测试样本表示(T-TPTSR)
TTPTSR方法在本部分中,将介绍一个阈值应用于分类过程中第二相的输出。
2.1。第一阶段的T-TPTSR M-Nearest邻居选择
的第一阶段T-TPTSR是选择最近的邻居的训练样本进行进一步处理在第二个阶段,缩小样本空间目标类的局部区域(22]。的最近的邻居选择通过计算测试样本的加权距离每个训练样本。首先,让我们假设类和训练图像,,如果这些图像的th类(),然后是他们的类标签。它也认为一个测试图像可以写在所有训练样本的线性组合的形式,如 在哪里()是每个训练图像的系数。方程(1)也可以用向量的形式操作,如 在哪里,,都是列向量。如果是一个奇异方阵,(2可以通过使用来解决,也可以通过使用来解决,在那里是一个小正的常数和是单位矩阵。在我们的实验中T-TPTSR方法,在解决方案将是0.01。
通过求解(2),我们可以使用的线性组合表示测试图像训练集所示(1),这意味着测试图像本质上是一个近似的加权求和的所有训练图像,和加权图像是一个近似的一部分。为了衡量培训的图像之间的距离和测试图像,一个距离度量的定义是: 在哪里被称为距离函数,它给测试样品的区别和训练样本。很明显,一个更小的值意味着th训练样本接近测试样本,它更可能是目标类的成员。这些最近的邻居选择进一步处理的第二阶段T-TPTSR,最后的决定将在一个更小的样本空间。我们假设最近的邻居被指示为选择,和相应的类标签,在那里。T-TPTSR的第二阶段,如果一个样本不属于的类标签,那么这个类将不会被视为一个目标类,而且只有一个类将被视为一个潜在的目标类。
2.2。第二阶段T-TPTSR的离群值被拒绝
在第二阶段的T-TPTSR方法,最近的邻居从第一阶段选择进一步计算得到最终决定的识别任务。我们代表了测试样本与训练样本的线性组合,但只有最近的邻居从第一阶段选择。如果最近的邻居被指示为选择,他们的近似线性组合测试图像被认为是满意,如 在哪里()系数。在向量操作形式,(4)可以写成 在哪里,。在上面的哲学一样,如果是一个满秩方阵,(5可以解决) 或者,否则,可以解决的 在哪里是一个积极的小值常数,通常设置为0.01,然后呢是单位矩阵。
当我们获得系数对于每一个最近的邻居,每个类的测试图像的贡献将被测量,并分类输出将基于贡献和测试图像之间的距离。如果最近的邻居来自th类(),而近似线性贡献这个类被定义为测试样本 测量测试样本之间的距离类的样本最近的邻居的偏差计算从,如 很明显,一个更小的值意味着一个更好的近似的训练样本测试样本的th类,因此th类将有更高的可能性比其他类目标类。然而,如果离群值被认为是,必须应用于分类输出一个阈值来区分阶级的成员和离群值,如 在哪里是阈值。如果,测试样本将被视为一个异类,因此将被拒绝。只有当,测试样品可以分类到吗类的最小的偏差。
在第二阶段的T-TPTSR,解决方案(6)或(7)发现系数的线性组合最近的邻居近似测试样本,训练类的最小偏差近似将被视为目标类的测试样本。然而,最小偏差的值必须小于阈值。如果测试样本和成员之间的最小距离大于阈值类的近似,测试样例将归类为局外人,因此拒绝了。然而,如果最小偏差的线性组合的价值偏差小于阈值,这个异常值将分为成员类的最小偏差,并将发生错误。同样地,如果一个测试图像属于一个类成员,但最小偏差的线性组合大于阈值的每个类,这种测试图像分类作为一个局外人,和假警报。自从T-TPTSR方法中使用的样本都是在先进的标准化,的价值在(9)将在一定范围内,这样,在那里,因此它是实际来确定一个合适的阈值识别任务前的测试。
3所示。T-GR, T-PCA和T-LDA方法离群值被拒绝
与T-TPTSR方法性能比较,在下一节中,我们也介绍了GR的修改版本,PCA和LDA方法,分别对离群值排斥和成员在人脸识别分类。
3.1。T-GR方法
全球表示阈值(T-GR)方法本质上是T-TPTSR方法与选择的所有训练样本最近的邻居(被选中的所有训练样本的数量),和它也发现了目标类直接通过计算的最佳代表样本类测试图像。
T-GR方法,测试样本是由所有训练样本的线性组合,而且分类不仅仅是基于最小偏差的线性贡献从每个类的测试样本,而且基于最小偏差的价值。如果最小偏差大于阈值,测试样例将确认为一个异类。
3.2。T-PCA方法
PCA方法是基于线性图像空间中投影到低维特征空间,和投影方向得到最大化的总散射所有培训课程(24,25]。再次,我们假设类和训练图像,,每一个都是维空间,。如果一个线性变换引入原始地图维图像空间到一个维特征空间,,新的特征向量可以书面的形式 在哪里与正交矩阵的列。如果总散射矩阵被定义为 在哪里意味着所有的训练样本中,我们可以看到,应用线性变换后,所有的散射转换后的特征向量是,可以最大化通过投影方向,如 在哪里()的集合维的特征向量对应于最大特征值。在识别过程中,测试样本和所有的训练样本投影到新的特征空间通过在它们之间的距离计算,如 阈值的PCA方法,测试样本将分类的类成员最小距离吗,但是这个距离必须低于阈值,这样 测试样品其对应的最小距离小于阈值将归类为局外人,因此拒绝了;否则将会分为类。
3.3。T-LDA方法
LDA是一个职业专用线性降维方法和简单的分类器在降低特征空间26- - - - - -29日]。LDA方法也找到了一个方向,将训练图像和测试图像投射到低维空间,条件是类间的比例分散在类散射是最大化。
同样地,如果有类和训练图像,,每一个都是维空间,,在th类有样品,类间散布矩阵可以写成 和在类可以定义为散射矩阵 在哪里的意思是形象吗th类,是所有样本的均值。需要指出的是,必须满秩为了获得一个最优投影矩阵与正交列最大化的比率预计的行列式和预计,这样 在哪里()的集合维广义特征向量的和对应于最大特征值,如 在哪里()是广义特征值。以来的最大数量非零的广义特征值,最大只能。
测试样本的投影之间的距离和训练样本在新的特征空间计算 如果样品投影到特征空间的最小投影距离的测试样本,测试样例将划分为同一类,这样 在哪里是屏幕的阈值异常值。对于阈值LDA方法,所有目标成员的投影距离必须小于,否则他们将被归类为异常值和拒绝。
4所示。实验结果
在这个实验中,我们测试的性能T-TPTSR, T-GR, T-PCA,和T-LDA异常排斥和成员方法分类,分别。的一个衡量标准来比较这些方法的性能是找到最低总体分类错误率。在分类任务中,一个最优阈值上述方法可以找到整个分类错误率最小。总体分类错误率的计算方法是基于三个分类错误率,如成员的类之间的误分类(当测试样本和一个成员,但并被错误地归类为另一个类),离群值的成员组的误分类(当测试样本是但一员,从而更进一步)和错误分类为离群值(当测试样本是个例外,因此接受了错误的一员)。如果代表整个分类错误率作为阈值的函数,表示分类错误率成员之间发生的错误(错误分类为测试样本记录成员的组织与成员的测试样本组的总数),和是离群值的误分类率(分类错误记录为异常值的测试样本组和测试异常值的总数),他们的关系可以写成 它是指出的价值随阈值,当,需要100%的价值,和一般的价值降低增加,直到达到一个常数分类错误率。离群值的分类错误率也改变其值根据阈值然而,%的时候,其值增加,直到达到了100%。最低的范围之间可以找到和,在那里成为一个常数,或达到100%,这样 的价值是一个重要的标准显示的分类器的性能异常排斥和成员的认可。
另一个测量标准测量阈值分类器的性能是接受者操作特征(ROC)曲线,这是一个图形化的情节真阳性率(TPR)和阈值离群值的阈值分类的应用被拒绝。我们首先定义真阳性检出率为异常值,,可以书面的形式分类错误率的离群值,这样 我们还定义成员的造成的误警率阈值的函数,为分类,这是错误的数量记录成员局外人与测试样本的数量的小组成员。一个最优分类器异常排斥和成员分类需要找到一个合适的阈值这样可以最大化以及可以最小化。因此,下面的函数定义测量,这样吗 很明显,需要最大化这两个离群值的分类器可以优化排斥和会员分类,这样吗 和的值是一个重要的指标来比较异常排斥分析分类器的性能。
总体分类错误率最小和的最大区别真正的积极的例外识别率和虚警率本质上是相同的分类器的性能评估指标异常值被拒绝。所不同的是,整个分类错误率代表成员分类的效率,和显示性能的离群值被拒绝。在接下来的实验中,我们测试和比较整体分类错误率最小和最大T-TPTSR, T-GR、T-PCA T-LDA方法,分别根据这两个标准我们发现异常排斥和成员的最优分类器分类。
在我们的实验中,我们测试和比较的性能Feret人脸图像上面的方法使用在线数据库(30.,31日],ORL [32,基于“增大化现实”技术(33),分别。这些数据库提供面临来自不同面孔的图像有不同的面部表情和面部细节不同照明条件下。Feret数据库提供了1400的脸图像从200个人训练和测试,并有7面对图像的每一个类。在基于“增大化现实”技术的数据库中,从120人,完全有3120的脸图像提供26个不同的面部细节。ORL数据库,有400的脸图像来自40个不同的个体,每一个都有10个脸图像。
在这个实验中,训练集和测试集选择随机从每一个人。为每个数据库,包括分为两类,一个是成员的组,另一个是离群值的组。个人选择的成员的类,训练样本准备从数据库通过选择他们的一些图片,和其他图像的离群值作为测试集。应该是集团外成员,没有训练集的分类,和所有的样本中异常值的组作为测试集。
我们首先测试Feret数据库与上述例外拒绝的方法。Feret数据库分为两组,100名成员从200人随机选择的小组成员,剩下的100人中的异常值测试。每个100个成员的类,随机选择4的图片7作为训练集,剩下的3个图像为测试集。100人离群值的组,所有7图片从他们每个人的测试集的分类任务。1000因此,有400个训练图像和测试图像在该测试中,而且,在测试图像,从成员的组有300张图片和700的图像异常的组。图1显示的一部分成员和离群值的图像从Feret数据库测试,已经调整,所有的图像像素图像通过使用将采样算法(34]。因为在Feret数据库类的数量远远超过ORL和基于“增大化现实”技术的数据库,也训练图像的数量越少,图像的分辨率较低,测试和Feret数据库将更具挑战性,结果通常被认为是更有说服力的。
在测试和Feret T-TPTSR方法的数据库,最近的邻居的数量选择处理的第一阶段60(根据经验数据,最优数量选择约10 ~ 15%的训练样本的数量)。测试使用上面的方法中,阈值从0变化会导致100%的一个常数0.1或0.5的区间,局外人都接受为会员。数据2(一个)~2 (d)显示不同的分类错误率的上面的方法是阈值的功能,分别。可以看出T-TPTSR方法和T-GR方法的价值远远低于T-PCA T-LDA方法,和T-TPTSR曲线和T-GR从100%降低到更低常数比T-PCA T-LDA当阈值增加。表的第二行1列出所有值如图2,我们可以看到T-TPTSR方法达到最低的总体分类错误率。图3显示的ROC曲线T-TPTSR、T-GR T-PCA和T-LDA方法,分别,第三排表1给所有的细节值如图3。可以看出T-TPTSR也有更高的价值比其他方法。
(一)T-TPTSR
(b) T-GR
(c) T-PCA
(d) T-LDA
(一)T-TPTSR
(b) T-GR
(c) T-PCA
(d) T-LDA
测试的基于“增大化现实”技术的数据库,我们随机选择80类的成员和其他40人作为离群值。的每个成员,13图像随机选择从26图像作为训练集,剩下的13个图像都包含在测试集。因此,有1040个2080年训练图像和测试图像在该测试中,测试设备,有1040个成员的图片和1040离群值的图像。图4显示部分的成员和离群值的图像从基于“增大化现实”技术的数据库,和图像进行训练和测试已经成为一个被缩减像素图像(34]。
当我们测试T-TPTSR方法与基于“增大化现实”技术的数据库,最近的邻居的数量选择的是150。表2描述了价值观和值的T-TPTSR T-GR T-PCA, T-LDA方法,分别测试时基于“增大化现实”技术的数据库。这是明显的价值观和值T-TPTSR方法优于T-GR, T-PCA, T-LDA异常排斥和成员分类应用程序中的方法。
我们也测试上述方法ORL人脸图像数据库。有完全40类在ORL数据库中,我们随机选择30类的成员和其他10个人的离群值。在30个成员国中,5图像的每一个成员都是随机选择的训练样本,其余的5图像测试样品。所以在测试中,我们有150 250训练图像和测试图像,在测试集,100年有150成员的图片和离群值的图像。图5显示了一些示例图像从ORL数据库,也调整使用的图像(34]。
最近的邻居的数量选择T-TPTSR方法ORL数据库是40。表3提供的细节价值观和价值观的四个方法,分别。可以看出T-TPTSR方法也显示出更好的性能比所有T-GR T-PCA, T-LDA方法,它被证实,T-TPTSR方法是离群值的最优解其中排斥和成员分类。
指出,在与AR和ORL数据库,测试的性能T-TPTSR, T-GR, T-PCA具有可比性。这是因为,根据冗余和合理的决议样本情况下,T-PCA方法的性能接近T-TPTSR和T-GR方法。然而,当T-PCA方法测试少量的训练样本和低分辨率的图像,像Feret数据库,T-TPTSR方法的优点是很明显的。
我们使用的标准来判断,是否一个示例是个例外,是衡量测试样本之间的距离和所选的目标类。如果这个距离大于阈值,这个示例将归类为局外人。T-TPTPR方法,第一阶段过程发现当地分布接近测试样本在大样本空间中选择最近的样本。T-TPTSR二期处理的方法,测试样本分类是基于测试样本之间的距离最近的类中最近的邻居。如果测试样本是局外人,测量的距离只会在当地有限的样本空间中的分布,和,因此,测量不是困惑与其他训练样本,碰巧靠近离群值。
通过应用一个合适的阈值,分类器可以拒绝异常值和分类的成员整体分类错误率最小和最大差距的孤立点检测率和误警率。T-TPTSR方法线性代表测试样本与训练样本和测试样本之间的距离和目标类测量通过计算测试样本之间的差异和线性加权类的贡献表示。在上面的测试中,T-TPTSR方法达到最好的性能异常排斥以及成员分类。这是因为在T-TPTSR两阶段的线性表示测试样品结果更逼近由训练样本和评估。因此,测试样本之间的距离和目标类可以最小化,测试样本之间的距离和局外人可以最大化,导致一个更好的整体分类率和更大的离群值的比率识别率和误警率。
5。结论
介绍了四个有用的方法在人脸识别的修改版本,T-TPTSR方法,T-GR方法,T-PCA方法,和T-LDA方法,应用程序异常排斥以及成员分类。他们的性能测试人脸图像与三个不同的在线数据库,Feret,基于“增大化现实”技术,分别和ORL数据库。结果表明,T-TPTSR方法达到最低的总体分类错误率以及异常值检测率和虚警率最大的区别。甚至T-PCA方法可能实现类似的性能与T-TPTSR方法在理想样本条件下,测试的结果T-PCA坏样本条件下方法通常是可怜的。T-TPTSR方法达到最好的性能异常排斥以及成员分类由于两相的线性表示测试样本和训练样本。
承认
金融支持高等教育的博士学科点科研基金项目(没有。20122302120072)来启动这个研究项目。