CINgydF4y2Ba 计算智能和神经科学gydF4y2Ba 1687 - 5273gydF4y2Ba 1687 - 5265gydF4y2Ba Hindawi出版公司gydF4y2Ba 10.1155 / 2015/709072gydF4y2Ba 709072年gydF4y2Ba 研究文章gydF4y2Ba 一个高效健壮的眼睛定位通过学习使用眼睛模板卷积分布gydF4y2Ba http://orcid.org/0000 - 0001 - 7540 - 7145gydF4y2Ba 李gydF4y2Ba 宣gydF4y2Ba 1gydF4y2Ba 窦gydF4y2Ba 勇gydF4y2Ba 1gydF4y2Ba 妞妞gydF4y2Ba 鑫gydF4y2Ba 1gydF4y2Ba 徐gydF4y2Ba 嘉庆gydF4y2Ba 1gydF4y2Ba http://orcid.org/0000 - 0002 - 5242 - 2999gydF4y2Ba 肖gydF4y2Ba RuoronggydF4y2Ba 2gydF4y2Ba 陈gydF4y2Ba Ye-ShogydF4y2Ba 1gydF4y2Ba 科学和技术在并行和分布式处理实验室,学校的计算机gydF4y2Ba 国防科技大学gydF4y2Ba 长沙410073gydF4y2Ba 中国gydF4y2Ba nudt.edu.cngydF4y2Ba 2gydF4y2Ba 信息化办公室gydF4y2Ba 国防科技大学gydF4y2Ba 长沙410073gydF4y2Ba 中国gydF4y2Ba nudt.edu.cngydF4y2Ba 2015年gydF4y2Ba 4gydF4y2Ba 10gydF4y2Ba 2015年gydF4y2Ba 2015年gydF4y2Ba 30.gydF4y2Ba 01gydF4y2Ba 2015年gydF4y2Ba 14gydF4y2Ba 04gydF4y2Ba 2015年gydF4y2Ba 4gydF4y2Ba 10gydF4y2Ba 2015年gydF4y2Ba 2015年gydF4y2Ba 版权©2015年宣李et al。gydF4y2Ba 这是一个开放的文章在知识共享归属许可下发布的,它允许无限制的使用,分布和繁殖在任何媒介,提供最初的工作是正确的引用。gydF4y2Ba

眼睛定位在许多面部分析是一个基本的过程。在实际使用中,常常受到照明,头部姿势,面部表情,闭塞,和其他因素。仍很难实现高精度预测时间短,培训成本低。本文提出一种新颖的眼睛定位方法,探索只有单层卷积地图使用BP网络通过眼睛模板。结果表明,该方法鲁棒来处理很多困难的情况。在实验中,精度分别为98%和96%,在BioID LFPW测试集可以实现在10帧预测率只有15分钟的培训成本。与其他的模型相比,该方法可以获得类似的最好的结果大大减少训练时间和高速度的预测。gydF4y2Ba

1。介绍gydF4y2Ba

眼睛定位是至关重要的许多面分析。在分析人类的情绪,眼睛专注和头部姿势,眼睛的位置是必不可少的提取相应的信息(gydF4y2Ba 1gydF4y2Ba]。面对跟踪,眼睛定位往往是必要的。在人脸识别中,面临的许多算法要求对齐图像根据眼睛的位置(gydF4y2Ba 2gydF4y2Ba]。不准确的位置可能会导致故障的识别gydF4y2Ba 3gydF4y2Ba,gydF4y2Ba 4gydF4y2Ba]。gydF4y2Ba

然而,现实世界的眼睛定位充满了挑战。脸照片通常由一投影从三维空间到二维平面。脸图像的外观可能会影响头部姿势,面部表情和光照。眼部结构因此充满了变化。此外,眼睛可以阻挡的东西像眼镜,头发,如图gydF4y2Ba 1gydF4y2Ba。工作在任何意外的情况下,这些影响的算法应该是健壮的。gydF4y2Ba

眼睛定位结果使用我们的方法。gydF4y2Ba

眼睛定位算法的设计在实际运用中,预测精度,速度,和培训成本是最相关的因素。一个健壮的算法应该保持高预测精度与多样的姿态,不同情况下面部表情在复杂环境闭塞,照明的变化。对于实时应用程序,需要预测率高。等一些在线学习系统用于公安,训练时间短的需求也快速算法适应不同工作的地方。培训成本也低效益的优化算法。提高精度在困难的环境中,复杂的模型往往是应用。然而,在复杂的模型会增加培训成本和时间的预测。如何选择一个方法有足够的复杂性达到较高的预测精度,预测率高,培训成本低同时仍然是一个挑战。gydF4y2Ba

眼睛定位方法主要可以分为基于纹理和结构。基于纹理的方法(gydF4y2Ba 5gydF4y2Ba- - - - - -gydF4y2Ba 8gydF4y2Ba)学习图像纹理的特征。为当地的方法探索纹理(gydF4y2Ba 5gydF4y2Ba,gydF4y2Ba 6gydF4y2Ba),高预测率可以通过简单的培训。然而,他们通常不健壮的闭塞和失真,由于有限的信息从本地区域。另一方面,方法如gydF4y2Ba 7gydF4y2Ba,gydF4y2Ba 8gydF4y2Ba]研究整个脸上的全局纹理特征图像卷积网络。高预测精度可以通过这些方法获得较高的预测率。然而,训练变得相当大的成本。长时间的训练是必要的,因为大量的模型参数。正确选择模型的参数往往需要重复测试。基于结构的方法(gydF4y2Ba 9gydF4y2Ba- - - - - -gydF4y2Ba 12gydF4y2Ba]探索预定义的关键面部点。眼睛的位置可以发现主要由结构信息。虽然精度高可以通过一个简单的训练,预测通常涉及到一个迭代优化。和迭代时间和预测精度高度依赖于初始化。因此,预测精度和速率通常是不稳定的。gydF4y2Ba

在这项研究中,发现有规律的反应分布卷积地图上生成的模板。这个分布反映了主要面部对象之间的空间关系。通过一个非线性学习模型,这样的分布可以探索预测眼睛的位置。而不是使用本地响应与传统模板方法,全球信息可以探索根据这样的分布。这样,眼睛的位置可以准确地预测甚至发生阻塞或失真。此外,高预测率有望noniterative预测模型。为此,卷积网络(gydF4y2Ba 7gydF4y2Ba,gydF4y2Ba 8gydF4y2Ba可以探索。然而,传统的卷积网络从原始图像中学习,这可能需要更多的层映射之间的复杂非线性关系面对图像和眼睛的位置。另一方面,卷积地图由眼睛模板包含简洁的分布信息,在不同的面部对象稳定响应模式。因为许多不必要的纹理被忽略,分布可以使用相对肤浅的网络学习和培训时间可以大大缩减。gydF4y2Ba

基于这一原则,一个高效和健壮的眼睛定位算法。卷积算法探索面对地图使用BP网络通过眼睛模板。提高性能的眼睛模板,一种新型模板训练方法提出了噪声抑制控制。此外,基于FFT(快速傅里叶变换),卷积方法旨在进一步提高训练和预测速度。最终,该算法可以实现98%和96%的准确性,分别在BioID [gydF4y2Ba 13gydF4y2Ba]和LFPW [gydF4y2Ba 14gydF4y2Ba)测试集的预测率10 fps。然而,13466年的培训时间只有15分钟样本。gydF4y2Ba

剩下的纸是组织如下。部分gydF4y2Ba 2gydF4y2Ba评论眼睛检测的相关工作。部分gydF4y2Ba 3gydF4y2Ba描述卷积的结果分布。部分gydF4y2Ba 4gydF4y2Ba给出了该方法的详细描述。部分gydF4y2Ba 5gydF4y2Ba讨论了实验和结果。结论部分给出gydF4y2Ba 6gydF4y2Ba。gydF4y2Ba

2。相关工作gydF4y2Ba

眼睛定位技术近年来一直很发达。根据探索功能的属性,方法主要可以分为两类:结构和基于纹理的方法。gydF4y2Ba

基于结构的方法探索一些特定脸上临界点结构模型的预测。典型的基于结构的方法包括ASM [gydF4y2Ba 9gydF4y2Ba和麦gydF4y2Ba 11gydF4y2Ba]。在这些方法中,眼睛的位置估计的结构信息和周围的局部纹理点通过一个迭代的过程。预测精度的迭代时间和初始结构的影响。此外,优化采用最小二乘法,其鲁棒性差阻塞的情况。gydF4y2Ba

基于纹理的方法提取脸部纹理预测眼睛的位置。典型的基于结构的方法包括(gydF4y2Ba 5gydF4y2Ba,gydF4y2Ba 7gydF4y2Ba,gydF4y2Ba 8gydF4y2Ba,gydF4y2Ba 15gydF4y2Ba]。而不是使用有限的临界点的基于结构的方法,整个面部的所有纹理图像可以探索。先前的研究[gydF4y2Ba 7gydF4y2Ba)显示的可靠性面临闭塞和扭曲的纹理。基于纹理的方法通常是noniterative。对纹理特征的提取,方法像卷积(gydF4y2Ba 5gydF4y2Ba,gydF4y2Ba 7gydF4y2Ba),枸杞多糖(gydF4y2Ba 16gydF4y2Ba,猪gydF4y2Ba 17gydF4y2Ba],哈雾[gydF4y2Ba 18gydF4y2Ba)等是常用的。其中,最好的预测精度已报道的基于卷积的方法(gydF4y2Ba 7gydF4y2Ba,gydF4y2Ba 8gydF4y2Ba]。卷积运算也像其他纹理提取、计算密集的因为需要扫描整个图像在纹理窗口。然而,它也发现卷积特征提取可以在频域FFT加速。gydF4y2Ba

目前,主要有两种类型的眼睛定位使用卷积特征提取。方法如(gydF4y2Ba 5gydF4y2Ba,gydF4y2Ba 19gydF4y2Ba,gydF4y2Ba 20.gydF4y2Ba]试图探索的峰值响应一个预定义的模板(如卷积核)与理想模式。自卷积响应其他面部对象眼睛模板的脸颊和嘴唇是很难解释,其余响应映射被忽视的一部分,和眼睛只找到峰值响应。这些方法培训成本较低,较高的预测率。但他们并不健壮的闭塞和人脸姿态变化,由于响应等的眼睛固定眼睛模板将大大减少在这些情况下。预测的峰值响应在这些情况下可能最终失败。与探索的峰值响应复杂眼睛模板,其他方法尝试代码模板表面的基本形象元素,其中大部分是线段。眼睛位置和关系的代码分布的脸还能学到非线性模型。由于全球信息的使用,可以提高预测精度和闭塞和扭曲的姿势变化的影响可能是松了一口气。然而,这些通常是复杂的非线性关系。模型中使用这些方法如深CNN (gydF4y2Ba 7gydF4y2Ba,gydF4y2Ba 8gydF4y2Ba通常有大量的参数,导致昂贵的培训阶段,预测率低。此外,搜索的最优设置这些复杂的模型也很困难。gydF4y2Ba

本文发现有相对稳定的全球分销模式卷积反应生成的眼睛模板和脸的形象。基于这一现象,提出了新颖的眼睛位置的方法。这种方法探索全球面临信息由眼睛模板位置预测,避免武断的决定,只有峰值响应。与此同时,使用特定的眼睛模板而不是随机学习内核,可以大大简化卷积网络只有一层。响应分布的属性描述的新发现将部分gydF4y2Ba 4gydF4y2Ba。部分gydF4y2Ba 5gydF4y2Ba给出了该算法基于这些发现。gydF4y2Ba

3所示。规定由眼睛模板卷积反应地图上gydF4y2Ba

卷积的全球信息响应映射通过眼睛模板一直被忽视,因为面对的响应分布不明确。因此,只有峰值响应的评估表明眼睛的位置,随着眼睛卷积模板通常有最大响应值在眼睛的地方。然而,这些方法通常在实际使用预测精度较低。面部表情,闭塞,和改变姿势会影响眼睛的外观,这将导致更低的响应。此外,它也很难区分左眼睛从右。gydF4y2Ba

然而,在实验中发现,面对图像的卷积响应地图眼睛模板定期全球分销,鼻子和嘴等面部的对象相对稳定的模式。gydF4y2Ba

证明这一现象,一个实验测试响应的相似样本对象进行了相同的面部。KL距离(gydF4y2Ba 21gydF4y2Ba)是用于定量测量这些响应模式的相似之处如下:gydF4y2Ba (1)gydF4y2Ba 吉隆坡gydF4y2Ba pgydF4y2Ba ∥gydF4y2Ba 问gydF4y2Ba =gydF4y2Ba ∑gydF4y2Ba νgydF4y2Ba ∈gydF4y2Ba ΩgydF4y2Ba pgydF4y2Ba νgydF4y2Ba lngydF4y2Ba ⁡gydF4y2Ba pgydF4y2Ba νgydF4y2Ba 问gydF4y2Ba νgydF4y2Ba ,gydF4y2Ba 在哪里gydF4y2Ba pgydF4y2Ba 和gydF4y2Ba 问gydF4y2Ba 是两个测试发行版。KL往往是小的时候gydF4y2Ba pgydF4y2Ba 和gydF4y2Ba 问gydF4y2Ba 是相似的。gydF4y2Ba

在实验中,100正面图像被随机选择从BioID测试集。他们爬到128×128和预处理去除阴影效果Tan-Triggs [gydF4y2Ba 22gydF4y2Ba]。100卷积响应生成的地图进一步pretrained眼睛模板,如图gydF4y2Ba 2gydF4y2Ba(a)。五个比较组(行(b)、(c)、(d), (e)和图(f)gydF4y2Ba 2gydF4y2Ba)定义的剪裁纹理样本在五个不同的地方(颜色广场和中心的点)的左眼(红色),右眼(橙色),鼻子(绿色),左口角落(蓝色),和右嘴巴角落(黑)。纹理样本从每组作为参考比较与其他样品在同一组KL距离。在KL测量,gydF4y2Ba pgydF4y2Ba (在第一列图gydF4y2Ba 2gydF4y2Ba纹理和)是用于参考gydF4y2Ba 问gydF4y2Ba 的纹理样本在同一组。gydF4y2Ba pgydF4y2Ba 和gydF4y2Ba 问gydF4y2Ba 都归一化gydF4y2Ba (gydF4y2Ba 0 1gydF4y2Ba ]gydF4y2Ba 。零值所取代gydF4y2Ba 1gydF4y2Ba 0gydF4y2Ba - - - - - -gydF4y2Ba 9gydF4y2Ba 避免零部。证明样本的相似性在每个面部对象组,一组(行(g)在图gydF4y2Ba 2gydF4y2Ba),随机出现在脸图像纹理也准备比较。额外的组(行(h)图gydF4y2Ba 2gydF4y2Ba)由遮挡的右眼是准备样本研究。颜色被用来提高响应的能见度地图与增值从蓝色到红色。gydF4y2Ba

卷积的反应不同的面部对象。gydF4y2Ba

从图gydF4y2Ba 2gydF4y2Ba、稳定响应的眼睛、鼻子和嘴巴((b) - (g))可以观察到。这些团体的平均KL距离是2.23,2.85,4.35,5.34,和5.38,显著小于随机组gydF4y2Ba TgydF4y2Ba =gydF4y2Ba 12.78gydF4y2Ba 。这表明响应模式的相似的样本相同的面部对象。gydF4y2Ba

从数据gydF4y2Ba 2gydF4y2Ba(b)和gydF4y2Ba 2gydF4y2Ba(c),它可以观察到纹理的分布的左和右眼睛是稳定的单峰。不过两只眼睛之间的相似之处也很明显,这意味着难以区分从左向右只使用峰值响应。鼻子的分布在图的反应gydF4y2Ba 2gydF4y2Ba(d)是多通道的高峰值的一半部分稳定gydF4y2Ba 米gydF4y2Ba 模式。鼻组的平均KL距离相对比眼睛更大,这表明在这方面更多的多样性。(图左边的分布gydF4y2Ba 2gydF4y2Ba(e)(图)和权利gydF4y2Ba 2gydF4y2Ba(f))嘴角还显示常规的单峰变化模式比嘴。如图gydF4y2Ba 2gydF4y2Ba(h)、样本阻挡眼睛有不规则的分布模式和更类似于随机选择补丁集团(g)的平均KL距离8.39。gydF4y2Ba

从上面的实验,它可以指出,一个相对稳定的全球分销模式可以通过使用模板卷积的眼睛。面部的卷积响应对象有独特的和稳定的模式。这些属性可以探索形成一个稳定的空间关系的眼睛位置和其他面部对象的位置。即使面临的一部分的信息是被阻塞或扭曲,眼睛的位置也可以预测从其余的稳定模式。gydF4y2Ba

4所示。体系结构gydF4y2Ba

提出了眼睛位置模式的体系结构主要由3个阶段,即卷积特征提取,将采样,BP neuronetwork如图gydF4y2Ba 3gydF4y2Ba。与许多其他卷积网络,只有一个卷积层是用于我们的工作。此外,pretrained眼睛模板作为卷积核。卷积层的减少可能会简化模型和显著的训练时间短,而特征提取的能力有限。然而,人们发现通过适当的预处理和选择的卷积核,眼睛的位置之间的关系,和卷积的反应可能是由BP网络学习。对图像预处理,Tan-Triggs方法是选择减少照明效果。眼睛模板被提议的Bi-Pupil期亚欧基金训练方法。FFT-based卷积操作实施的方法来进一步减少计算。下面给出这些方法的细节。gydF4y2Ba

拟议中的眼睛定位模型的体系结构。gydF4y2Ba

4.1。眼睛模板训练Bi-Pupil期亚欧基金gydF4y2Ba

眼睛模板由提出训练Bi-Pupil期亚欧基金基于期亚欧基金(gydF4y2Ba 5gydF4y2Ba]。期亚欧基金,一个眼睛模板样本可以给每只眼睛图像样本与特定的响应函数。眼睛模板可以通过平均模板样本强调共同的特性。在眼睛的位置,峰值响应通常可以观察到亚欧模板。有效合成的字符特征提取的左和右眼睛,修改后的响应函数在亚欧基金提出Bi-Pupil次探索。和一套multieye模板来应对规模和旋转的变化。gydF4y2Ba

以下4.4.1。Bi-Pupil响应函数gydF4y2Ba

发现响应生成的地图左和右眼睛有一定的关系。有效地生成响应地图和降低成本的单独训练的两个眼睛,一个Bi-Pupil响应函数提出了代替亚欧基金用于一次。考虑gydF4y2Ba (2)gydF4y2Ba ggydF4y2Ba xgydF4y2Ba ,gydF4y2Ba ygydF4y2Ba =gydF4y2Ba egydF4y2Ba - - - - - -gydF4y2Ba xgydF4y2Ba - - - - - -gydF4y2Ba xgydF4y2Ba lgydF4y2Ba egydF4y2Ba 2gydF4y2Ba +gydF4y2Ba ygydF4y2Ba - - - - - -gydF4y2Ba ygydF4y2Ba lgydF4y2Ba egydF4y2Ba 2gydF4y2Ba /gydF4y2Ba σgydF4y2Ba 2gydF4y2Ba +gydF4y2Ba egydF4y2Ba - - - - - -gydF4y2Ba xgydF4y2Ba - - - - - -gydF4y2Ba xgydF4y2Ba rgydF4y2Ba egydF4y2Ba 2gydF4y2Ba +gydF4y2Ba ygydF4y2Ba - - - - - -gydF4y2Ba ygydF4y2Ba rgydF4y2Ba egydF4y2Ba 2gydF4y2Ba /gydF4y2Ba σgydF4y2Ba 2gydF4y2Ba ,gydF4y2Ba 在哪里gydF4y2Ba xgydF4y2Ba lgydF4y2Ba egydF4y2Ba ,gydF4y2Ba ygydF4y2Ba lgydF4y2Ba egydF4y2Ba ,gydF4y2Ba xgydF4y2Ba rgydF4y2Ba egydF4y2Ba ,gydF4y2Ba ygydF4y2Ba rgydF4y2Ba egydF4y2Ba 分别给左和右眼睛的位置。通过这个函数,可以实现类似的高反应在两个眼睛。卷积响应映射可以作为普通的左和右眼睛模板。然而,培训任务是减少到只有两只眼睛的模板。此外,平均的两只眼睛,模板的耦合对某些样本可能会进一步下降。随着传统期亚欧基金,亚欧基金Bi-Pupil次训练是noniterative眼睛模板。随着训练样本的增加,最终模板是收敛的。因此,训练有素的眼睛模板也可以用于其他数据集。gydF4y2Ba

4.1.2。改变不变Multieye模板集gydF4y2Ba

使模板不变的变化像眼睛关闭,缩放和旋转的实际使用一套multieye模板生成3旋转类型如图3规模水平gydF4y2Ba 4gydF4y2Ba。因此,就制作了9部卷积响应映射代码面对这些情况的担忧。gydF4y2Ba

Multieye模板集。gydF4y2Ba

4.2。FFT-Based卷积方法gydF4y2Ba

在亚欧特征提取为基础,面对眼睛图像和模板的卷积实现通过FFT在频域中点积。虽然FFT能够减少对卷积的计算,它也会带来频率对图像边缘的影响,在响应可能错误地计算周期从另一侧边缘信息。减轻这种影响,余弦窗的方法(gydF4y2Ba 5gydF4y2Ba提出了。然而,发现这种方法可能会失败,由于大大减少眼睛纹理当眼睛并不在中央区域的图像。减少计算卷积操作没有在实际应用中引入额外的错误,修改FFT-based方法提出了如图gydF4y2Ba 5gydF4y2Ba。gydF4y2Ba

FFT-based卷积的过程。gydF4y2Ba

我们用零填充窗口函数来降低频率的影响。余弦窗口方法相比,零填充窗口函数应用于眼睛模板以外的脸图像。这种方法可以避免眼睛纹理的减少发生在余弦窗口的方法。保持特征提取能力和减少频率影响,零填充区域大小的眼睛模板应该谨慎选择。基于我们的经验,这种方法,也就是说,只有保持眼睛纹理,用0填充其他区域模板,是一个不错的选择。在我们的实验中,面对图像的大小是128×128,和眼睛的大小大约是33×33。根据眼睛区域的大小,只有33×33眼的中心区域模板被保留。gydF4y2Ba

眼睛的边缘模板后0、0了眼睛模板和预处理眼影由FFT转换。与传输线两频率点积的地图,一个初始卷积地图可以实现。通过削减了不准确的边缘的宽度16像素,96×96的最后卷积结果。这样的结果是相同的,通过正常的卷积。gydF4y2Ba

展示的效果FFT-based减少卷积的计算方法,给出了计算复杂性分析如下。分析仅基于乘法,因为它是最耗时的操作。鉴于gydF4y2Ba NgydF4y2Ba 面对宽度和形象gydF4y2Ba 米gydF4y2Ba 眼睛模板、乘法的总数在正常在空间域卷积gydF4y2Ba (3)gydF4y2Ba CgydF4y2Ba 年代gydF4y2Ba pgydF4y2Ba 一个gydF4y2Ba tgydF4y2Ba 我gydF4y2Ba 一个gydF4y2Ba lgydF4y2Ba ≈gydF4y2Ba OgydF4y2Ba 米gydF4y2Ba 2gydF4y2Ba NgydF4y2Ba - - - - - -gydF4y2Ba 米gydF4y2Ba +gydF4y2Ba 1gydF4y2Ba 2gydF4y2Ba 。gydF4y2Ba

3 FFT(两个FFT和一个传输线)和复杂的矩阵的乘积在频域乘法的FFT-based卷积gydF4y2Ba (4)gydF4y2Ba CgydF4y2Ba fgydF4y2Ba rgydF4y2Ba egydF4y2Ba 问gydF4y2Ba ≈gydF4y2Ba OgydF4y2Ba 3gydF4y2Ba NgydF4y2Ba 2gydF4y2Ba 日志gydF4y2Ba ⁡gydF4y2Ba NgydF4y2Ba +gydF4y2Ba 4gydF4y2Ba NgydF4y2Ba 2gydF4y2Ba 。gydF4y2Ba

在这个实验中,gydF4y2Ba NgydF4y2Ba =gydF4y2Ba 128年gydF4y2Ba 和gydF4y2Ba 米gydF4y2Ba =gydF4y2Ba 33gydF4y2Ba 卷积,地图,大约10000000乘法需要正常的卷积和40,0000 FFT-based方法。考虑9 multieye地图的模板,减少计算是重要的。训练和预测时间的减少可能受益减少卷积计算。gydF4y2Ba

4.3。BP网络和级联的提高gydF4y2Ba

在进一步处理之前,卷积反应地图首先规范化1.0 0均值和标准差。发现这样的标准化来提高预测精度具有重要意义,因为之间的不平衡响应的分布地图可能会减少。提高提取的特征的不变性,马克斯池来downsample规范化响应映射到16×16。九个downsampled矩阵进一步向量化和加一个向量的长度为2304 BP网络的输入。完全连接BP网络采用乙状结肠激活函数如图gydF4y2Ba 3gydF4y2Ba。作为输出,位置坐标也归一化gydF4y2Ba (gydF4y2Ba 0 1gydF4y2Ba ]gydF4y2Ba 。BP网络是由共轭梯度下降训练与标签之间的最小平方误差和预测误差函数。相比之下,与隐藏的神经元层网络gydF4y2Ba (gydF4y2Ba 30.gydF4y2Ba - - - - - -gydF4y2Ba 20.gydF4y2Ba - - - - - -gydF4y2Ba 20.gydF4y2Ba - - - - - -gydF4y2Ba 10gydF4y2Ba ]gydF4y2Ba 选择考虑预测精度和训练时间。gydF4y2Ba

为进一步提高预测精度,增强二级级联方案提出了如图gydF4y2Ba 6gydF4y2Ba,就像[gydF4y2Ba 7gydF4y2Ba]。第一级为初始位置的眼睛从整个脸的形象。然后,每只眼睛的位置修正在第二层次由初始位置为中心的广场。广场的宽度是四分之一的地区。gydF4y2Ba

二级级联结构的增强。gydF4y2Ba

第二个层次只学习偏差gydF4y2Ba ΔgydF4y2Ba xgydF4y2Ba 预测由第一级和标签之间的位置。因为每个模型在第二级别只学会了一只眼睛,一只眼睛响应函数在初始期亚欧基金是用于生成模板在第二个层次。最后的预言gydF4y2Ba xgydF4y2Ba 是第一级的输出的总和gydF4y2Ba xgydF4y2Ba 1gydF4y2Ba 第二个层次gydF4y2Ba ΔgydF4y2Ba xgydF4y2Ba 。gydF4y2Ba

5。实验gydF4y2Ba

用于实验的数据是一样的gydF4y2Ba 7gydF4y2Ba]。13466年的数据集是由训练和2551个测试图像。从伦敦时装周的训练样本选择gydF4y2Ba 23gydF4y2Ba数据集和互联网。测试集是由完整的BioID和LFPW数据集。BioID数据主要是由常规图像面前,而其他数据收集LFPW等许多复杂的环境包括宽头的变化姿势,照明,规模、清晰和闭塞。因此,一个健壮的算法应该在LFPW高精度数据集。所有的图像都标有面临地区的位置的眼睛,鼻子和两个嘴角。gydF4y2Ba

评估的相对预测误差定义如下:gydF4y2Ba (5)gydF4y2Ba 犯错gydF4y2Ba ⁡gydF4y2Ba =gydF4y2Ba xgydF4y2Ba - - - - - -gydF4y2Ba xgydF4y2Ba tgydF4y2Ba 2gydF4y2Ba +gydF4y2Ba ygydF4y2Ba - - - - - -gydF4y2Ba ygydF4y2Ba tgydF4y2Ba 2gydF4y2Ba lgydF4y2Ba ,gydF4y2Ba 在哪里gydF4y2Ba (gydF4y2Ba xgydF4y2Ba ,gydF4y2Ba ygydF4y2Ba )gydF4y2Ba 和gydF4y2Ba (gydF4y2Ba xgydF4y2Ba tgydF4y2Ba ,gydF4y2Ba ygydF4y2Ba tgydF4y2Ba )gydF4y2Ba 分别是和地面真理和预测的位置gydF4y2Ba lgydF4y2Ba 是biocular距离。基于此错误,算法的准确性可以定义为样本的比例,预测误差小于0.1,整个测试样品。平均误差也用作另一个指标来评估预测在接下来的实验结果。gydF4y2Ba

该算法在Matlab中实现2014,和实验3.3 GHz CPU的台式电脑。gydF4y2Ba

5.1。改进方案的影响gydF4y2Ba

在本节中,将讨论上述改善计划的影响。gydF4y2Ba

5.1.1。对预测精度的影响gydF4y2Ba

在接下来的实验中,Tan-Triggs预处理的方案,Bi-Pupil期亚欧基金眼睛模板培训,规范化卷积的响应图和级联增强方案预测精度进行了测试。发现该模型的方案作为标准配置。显示在表gydF4y2Ba 1gydF4y2Ba配置相比,四是准备:Tan-Triggs所取代gydF4y2Ba lgydF4y2Ba ogydF4y2Ba ggydF4y2Ba xgydF4y2Ba +gydF4y2Ba 1gydF4y2Ba 函数(M1),gydF4y2Ba xgydF4y2Ba 是像素值。Bi-Pupil期亚欧基金被替换为原始期亚欧基金(M2)的训练模板只使用右眼位置,响应映射正常化取代任何行动(M3),和级联增强被唯一的一级原始模型(M4)。gydF4y2Ba

精度的方案。gydF4y2Ba

方法gydF4y2Ba BioIDgydF4y2Ba LFPWgydF4y2Ba
右眼gydF4y2Ba 左眼gydF4y2Ba 右眼gydF4y2Ba 左眼gydF4y2Ba
M1gydF4y2Ba 95.7%gydF4y2Ba 96.6%gydF4y2Ba 95.5%gydF4y2Ba 95.4%gydF4y2Ba
平方米gydF4y2Ba 96.8%gydF4y2Ba 96.1%gydF4y2Ba 94.7%gydF4y2Ba 94.8%gydF4y2Ba
M3gydF4y2Ba 96.7%gydF4y2Ba 96.8%gydF4y2Ba 96.1%gydF4y2Ba 95.8%gydF4y2Ba
M4gydF4y2Ba 94.2%gydF4y2Ba 94.8%gydF4y2Ba 93.2%gydF4y2Ba 92.7%gydF4y2Ba
标准gydF4y2Ba 98.1%gydF4y2Ba 98.2%gydF4y2Ba 96.8%gydF4y2Ba 96.9%gydF4y2Ba

是显示在表gydF4y2Ba 1gydF4y2Ba,所有的方案能有效地提高预测精度。使用Tan-Triggs而不是对数函数减少照明效果可以增加精度约1.5% - -2%。亚欧基金Bi-Pupil次模板可以提高精度约2% - -3%比原来期亚欧基金模板。反应正常化也有利于精度增加约0.5% - -1.5%。与原始模型相比,级联的提高会带来-4%的准确率提高3%。gydF4y2Ba

5.1.2中。加速度由FFT-Based卷积gydF4y2Ba

为了演示FFT-based方法的性能,卷积的脸和眼睛模板示例已经重复了100次。如图gydF4y2Ba 7gydF4y2Ba结果,有轻微区别FFT-based卷积和直接的卷积。然而,这样的差别几乎没有任何影响在进一步分析提取的特征。计算效率,减少操作,FFT-based方法可以产生将近80加速比在这个实验中。用大量的卷积模型,这种方法可以显著减少训练和预测时间。gydF4y2Ba

比较原始的卷积和FFT-Based方法。gydF4y2Ba

5.2。与其他方法相比gydF4y2Ba

验证了该方法的效率,与许多先进的眼睛定位方法包括基于纹理和结构进行了考虑预测精度,预测率,和培训时间。gydF4y2Ba

基于纹理的方法,期亚欧基金,Template-SVR,深CNN (gydF4y2Ba 7gydF4y2Ba)进行比较。深CNN是目前精度最高的最佳方法之一眼位置。期亚欧基金直接使用卷积结果的最大像素位置预测眼睛的位置。Template-SVR方法是由取代了BP网络在该模型nu-SVR由libSVM实现(gydF4y2Ba 24gydF4y2Ba)画一个公平的比较的效率2非线性映射模型。期亚欧基金和Template-SVR在Matlab中实现,而深CNN的结果来自[gydF4y2Ba 7gydF4y2Ba]相同的训练和测试数据。gydF4y2Ba

除此之外,一些主要基于结构的方法像中央商务区gydF4y2Ba 10gydF4y2Ba),博尔曼(gydF4y2Ba 12gydF4y2Ba),一个包括在商业软件LUXAND [gydF4y2Ba 25gydF4y2Ba]本地化也相比。然而,他们的预测结果gydF4y2Ba 7gydF4y2Ba]。测试数据集是相同的使用,但训练数据是未知的。gydF4y2Ba

5.2.1。预测精度gydF4y2Ba

预测精度的比较方法是列在表中gydF4y2Ba 2gydF4y2Ba。前2结果以粗体显示。应该注意的是,LFPW健壮的算法通常具有较高的准确性,因为在这个测试集样本在不同情况下收集。gydF4y2Ba

比较先进的眼睛定位精度的方法。注意LFPW健壮的算法精度高。gydF4y2Ba

方法gydF4y2Ba 精度gydF4y2Ba 平均误差gydF4y2Ba
BioIDgydF4y2Ba LFPWgydF4y2Ba BioIDgydF4y2Ba LFPWgydF4y2Ba
右眼gydF4y2Ba 左眼gydF4y2Ba 右眼gydF4y2Ba 左眼gydF4y2Ba 右眼gydF4y2Ba 左眼gydF4y2Ba 右眼gydF4y2Ba 左眼gydF4y2Ba
我们的方法gydF4y2Ba 98.1%gydF4y2Ba 98.2%gydF4y2Ba 96.8%gydF4y2Ba 96.9%gydF4y2Ba 2.7%gydF4y2Ba 2.4%gydF4y2Ba 3.4%gydF4y2Ba 3.1%gydF4y2Ba
CNN深处gydF4y2Ba 99.9%gydF4y2Ba 100%gydF4y2Ba 99.1%gydF4y2Ba 99.4%gydF4y2Ba 1.7%gydF4y2Ba 1.5%gydF4y2Ba 2.1%gydF4y2Ba 2.0%gydF4y2Ba
期亚欧基金gydF4y2Ba 1.2%gydF4y2Ba 0.2%gydF4y2Ba 2.4%gydF4y2Ba 0.6%gydF4y2Ba 121.4%gydF4y2Ba 88%gydF4y2Ba 81.2%gydF4y2Ba 99.2%gydF4y2Ba
nu-SVRgydF4y2Ba 96.1%gydF4y2Ba 95.9%gydF4y2Ba 92.8%gydF4y2Ba 92.8%gydF4y2Ba 4.2%gydF4y2Ba 4.1%gydF4y2Ba 4.9%gydF4y2Ba 4.9%gydF4y2Ba
博尔曼gydF4y2Ba 79.1%gydF4y2Ba 75.8%gydF4y2Ba 78.2%gydF4y2Ba 92.8%gydF4y2Ba 7.1%gydF4y2Ba 7.8%gydF4y2Ba 7.8%gydF4y2Ba 8.8%gydF4y2Ba
中央商务区gydF4y2Ba 97.7%gydF4y2Ba 98.9%gydF4y2Ba 87.9%gydF4y2Ba 91.9%gydF4y2Ba 4.1%gydF4y2Ba 3.9%gydF4y2Ba 7.2%gydF4y2Ba 7%gydF4y2Ba
LUXANDgydF4y2Ba 98.9%gydF4y2Ba 98.66%gydF4y2Ba 95.6%gydF4y2Ba 96.8%gydF4y2Ba 4.1%gydF4y2Ba 3.7%gydF4y2Ba 5.6%gydF4y2Ba 4.5%gydF4y2Ba

如表所示gydF4y2Ba 2gydF4y2Ba,最好的结果是由CNN。然而,该方法也可以达到类似的高度准确的结果接近深CNN。总体而言,该方法可能是第二个最好的一个。一般地,该方法的准确性只有2%低于用很深的CNN,而平均误差高1.1%。然而,应该注意的是,为了达到这种结果,深CNN方法应该探索信息从5个特征点与一个更复杂的结构,和几个深水平3级联卷积模型与3层每一层。相比之下,该方法只使用两个特征点的2级卷积级联结构单一层模型在每个级别。通过引入更多的参考特征点对应的模型结构,还有很大改进空间。gydF4y2Ba

为其他基于纹理的方法,它可以被发现,没有探索全球信息、亚欧很难在复杂的环境中工作。考虑到监督学习模型,SVR也可以映射响应之间的关系映射和眼睛的位置。然而,nu-SVR大概是4 - 6%的预测精度低于层BP网络的方法。gydF4y2Ba

与基于结构的方法相比,该方法的准确性略低于中央商务区和LUXAND BioID约0.7%。可能因为BioID的样本都是常规的正面形象,这是适合这样的基于结构的方法。而在LFPW构成变化和遮挡普遍存在,该方法比这些方法。此外,该方法的平均误差明显低于基于结构的方法,这也证明了该方法的鲁棒性。gydF4y2Ba

5.2.2。预测率gydF4y2Ba

如前所述,基于结构的方法使用一个迭代预测方法。迭代时间是不稳定的和高度相关的研究情况和初始化。侧面或阻塞的情况,这可能成本秒来处理一个图像。gydF4y2Ba

因此,实验预测率集中在基于纹理的方法。为了简化分析,人脸检测时间,这是高度相关的不同的情况下,在这个实验中没有考虑。计算速度的预测发现脸图像具有相同的大小。预测的Matlab实现期亚欧基金,nu-SVR,该方法记录下来。由于c++编码深度CNN是引用数据。gydF4y2Ba

如表所示gydF4y2Ba 3gydF4y2Ba,没有非线性BP网络,期亚欧基金能达到大约66 fps的预测率最高。由nu-SVR预测率为0.82 fps是最低的。相比之下,通过BP网络,该方法可以达到10.5帧/秒。井优化的C + +深CNN报道预测率为8.3 fps是接近我们的方法。gydF4y2Ba

基于纹理的方法预测利率。gydF4y2Ba

方法gydF4y2Ba 期亚欧基金gydF4y2Ba nu-SVRgydF4y2Ba CNN深处gydF4y2Ba 我们的方法gydF4y2Ba
帧/秒gydF4y2Ba 66.7gydF4y2Ba 0.82gydF4y2Ba 8.3gydF4y2Ba 10.5gydF4y2Ba
5.2.3。培训时间gydF4y2Ba

基于结构的方法,通常是一个结构模型可以通过有限的样本没有太多的训练时间。然而,大多数基于结构的方法不一样健壮的高精度基于纹理的方法。基于纹理的方法快速和简单的模型可以训练。在这项实验中,亚欧培训超过13000只样品成本约200秒。然而,很难取得明显的改善通过广泛的训练对于那些简单的模型。因此,比较专注于高精度基于纹理的方法。gydF4y2Ba

获得上述的准确性,该方法有13466个训练样本只是训练15分钟包括3眼模板和BP网络的训练在2级联模型。培训成本低使得我们的模型容易调整,适合在线学习任务。gydF4y2Ba

相比之下,其他高精度模型的训练非常缓慢。CNN与反向传播的培训成本将大幅度增加额外的层。3级联水平和几个深卷积模型与3层在每一个层面,完全超过160000参数有训练有素的眼睛定位。培训的CNN可能花费几小时,甚至几天。由于培训时间长,选择一个最优的配置(如层数和内核,内核大小,等等)深模型将变得困难。寻找一个最优的配置也会增加培训的成本。nu-SVR模型也是耗时。对于Template-SVR的训练方法,这花费几个小时。因此优化这些模型是困难的。gydF4y2Ba

6。结论gydF4y2Ba

稳定的响应分布的卷积图像模板脸部和眼睛已经被发现了。这种分布模式有利于眼睛的位置。小说的眼睛位置的方法提出了通过学习卷积响应的分布地图。该方法只使用一个卷积层与一个特定的模板和BP网络。与许多先进的方法相比,类似的最好预测精度可以通过该方法预测高速度和减少训练时间。拟议的方法是健壮的姿势变化,扭曲,和阻塞,可以在复杂的环境中使用。已经证明,通过适当的选择模板的卷积核,一个浅褶积模型可以产生类似的准确的结果,通过深卷积模型预测率高和大大减少训练时间。gydF4y2Ba

在未来的工作中,本地化的其他关键面部点建议的方法将研究。内核选择效率卷积网络将进一步分析。gydF4y2Ba

利益冲突gydF4y2Ba

作者宣称没有利益冲突有关的出版。gydF4y2Ba

确认gydF4y2Ba

这项工作主要是由中国国家自然科学基金资助下U1435219, 61125201, 61402507。gydF4y2Ba

为爱勇敢gydF4y2Ba R。gydF4y2Ba ·瑟gydF4y2Ba N。gydF4y2Ba GeversgydF4y2Ba T。gydF4y2Ba 结合头部姿势和眼睛凝视估计的位置信息gydF4y2Ba IEEE图像处理gydF4y2Ba 2012年gydF4y2Ba 21gydF4y2Ba 2gydF4y2Ba 802年gydF4y2Ba 815年gydF4y2Ba 10.1109 / tip.2011.2162740gydF4y2Ba MR2920659gydF4y2Ba 2 - s2.0 - 84856293813gydF4y2Ba 总值gydF4y2Ba R。gydF4y2Ba 贝克gydF4y2Ba 年代。gydF4y2Ba 马修斯gydF4y2Ba 我。gydF4y2Ba 金gydF4y2Ba T。gydF4y2Ba 手册的人脸识别gydF4y2Ba 2005年gydF4y2Ba EkenelgydF4y2Ba h·K。gydF4y2Ba StiefelhagengydF4y2Ba R。gydF4y2Ba 为什么面部闭塞是一个具有挑战性的问题吗?gydF4y2Ba 生物识别技术的进步gydF4y2Ba 2009年gydF4y2Ba 施普林格gydF4y2Ba 299年gydF4y2Ba 308年gydF4y2Ba 克朗gydF4y2Ba B。gydF4y2Ba HanjalicgydF4y2Ba 一个。gydF4y2Ba MaasgydF4y2Ba s·m·P。gydF4y2Ba 眼脸匹配定位:它总是有用的,在什么条件下?gydF4y2Ba 《国际会议上图像和视频检索(CIVR ' 08)gydF4y2Ba 2008年7月gydF4y2Ba ACMgydF4y2Ba 379年gydF4y2Ba 387年gydF4y2Ba 10.1145/1386352.1386401gydF4y2Ba 2 - s2.0 - 57549117105gydF4y2Ba BolmegydF4y2Ba d S。gydF4y2Ba 德雷伯gydF4y2Ba b。gydF4y2Ba 贝弗里奇gydF4y2Ba j . R。gydF4y2Ba 普通的合成的过滤器gydF4y2Ba 《IEEE计算机学会学报计算机视觉与模式识别会议研讨会(CVPR ' 09)gydF4y2Ba 2009年6月gydF4y2Ba IEEEgydF4y2Ba 2105年gydF4y2Ba 2112年gydF4y2Ba 10.1109 / cvprw.2009.5206701gydF4y2Ba 2 - s2.0 - 70450210839gydF4y2Ba 周gydF4y2Ba Z.-H。gydF4y2Ba 耿gydF4y2Ba X。gydF4y2Ba 投影功能检测gydF4y2Ba 模式识别gydF4y2Ba 2004年gydF4y2Ba 37gydF4y2Ba 5gydF4y2Ba 1049年gydF4y2Ba 1056年gydF4y2Ba 10.1016 / j.patcog.2003.09.006gydF4y2Ba ZBL1056.68585gydF4y2Ba 2 - s2.0 - 1842812878gydF4y2Ba 太阳gydF4y2Ba Y。gydF4y2Ba 王gydF4y2Ba X。gydF4y2Ba 唐gydF4y2Ba X。gydF4y2Ba 深卷积网络级联面部点检测gydF4y2Ba 学报》第26届IEEE计算机视觉与模式识别会议(CVPR 13)gydF4y2Ba 2013年6月gydF4y2Ba 美国俄勒冈州波特兰gydF4y2Ba IEEEgydF4y2Ba 3476年gydF4y2Ba 3483年gydF4y2Ba 10.1109 / cvpr.2013.446gydF4y2Ba 2 - s2.0 - 84887364811gydF4y2Ba 周gydF4y2Ba E。gydF4y2Ba 风扇gydF4y2Ba H。gydF4y2Ba 曹gydF4y2Ba Z。gydF4y2Ba 江gydF4y2Ba Y。gydF4y2Ba 阴gydF4y2Ba Q。gydF4y2Ba 广泛的面部地标定位而且卷积网络级联gydF4y2Ba 学报14 IEEE计算机视觉国际会议研讨会(ICCVW 13)gydF4y2Ba 2013年12月gydF4y2Ba IEEEgydF4y2Ba 386年gydF4y2Ba 391年gydF4y2Ba 10.1109 / iccvw.2013.58gydF4y2Ba 2 - s2.0 - 84897479888gydF4y2Ba 傻瓜gydF4y2Ba t F。gydF4y2Ba 泰勒gydF4y2Ba c·J。gydF4y2Ba 库珀gydF4y2Ba d . H。gydF4y2Ba 格雷厄姆gydF4y2Ba J。gydF4y2Ba 活跃的形状就像他们培训和应用程序gydF4y2Ba 计算机视觉和图像理解gydF4y2Ba 1995年gydF4y2Ba 61年gydF4y2Ba 1gydF4y2Ba 38gydF4y2Ba 59gydF4y2Ba 10.1006 / cviu.1995.1004gydF4y2Ba 2 - s2.0 - 0029182228gydF4y2Ba 梁gydF4y2Ba lgydF4y2Ba 肖gydF4y2Ba R。gydF4y2Ba 温gydF4y2Ba F。gydF4y2Ba 太阳gydF4y2Ba J。gydF4y2Ba 通过基于组件的区别的搜索脸对齐gydF4y2Ba 电脑Vision-ECCV 2008gydF4y2Ba 2008年gydF4y2Ba 5303年gydF4y2Ba 柏林,德国gydF4y2Ba 施普林格gydF4y2Ba 72年gydF4y2Ba 85年gydF4y2Ba 在计算机科学的课堂讲稿gydF4y2Ba 10.1007 / 978 - 3 - 540 - 88688 - 4 _6gydF4y2Ba 很酷的gydF4y2Ba t F。gydF4y2Ba 爱德华兹gydF4y2Ba g . J。gydF4y2Ba 泰勒gydF4y2Ba c·J。gydF4y2Ba 主动外观模型gydF4y2Ba IEEE模式分析与机器智能gydF4y2Ba 2001年gydF4y2Ba 23gydF4y2Ba 6gydF4y2Ba 681年gydF4y2Ba 685年gydF4y2Ba 10.1109/34.927467gydF4y2Ba 2 - s2.0 - 0035363218gydF4y2Ba ValstargydF4y2Ba M。gydF4y2Ba 马丁内斯gydF4y2Ba B。gydF4y2Ba BinefagydF4y2Ba X。gydF4y2Ba PanticgydF4y2Ba M。gydF4y2Ba 面部检测使用了回归和图模型gydF4y2Ba 《IEEE计算机学会学报计算机视觉与模式识别会议(CVPR 10)gydF4y2Ba 2010年6月gydF4y2Ba IEEEgydF4y2Ba 2729年gydF4y2Ba 2736年gydF4y2Ba 10.1109 / cvpr.2010.5539996gydF4y2Ba 2 - s2.0 - 77955992642gydF4y2Ba JesorskygydF4y2Ba O。gydF4y2Ba KirchberggydF4y2Ba k·J。gydF4y2Ba FrischholzgydF4y2Ba r·W。gydF4y2Ba 健壮的人脸检测使用的豪斯多夫距离gydF4y2Ba 音频和视频生物识别人的身份验证gydF4y2Ba 2001年gydF4y2Ba 施普林格gydF4y2Ba 90年gydF4y2Ba 95年gydF4y2Ba BelhumeurgydF4y2Ba p . N。gydF4y2Ba 雅可布gydF4y2Ba d . W。gydF4y2Ba KriegmangydF4y2Ba d . J。gydF4y2Ba 库马尔gydF4y2Ba N。gydF4y2Ba 本地化的部分地区面临使用原型的共识gydF4y2Ba 《IEEE计算机视觉与模式识别会议(CVPR 11)gydF4y2Ba 2011年6月gydF4y2Ba IEEEgydF4y2Ba 545年gydF4y2Ba 552年gydF4y2Ba 10.1109 / cvpr.2011.5995602gydF4y2Ba 2 - s2.0 - 80052899249gydF4y2Ba 首歌gydF4y2Ba J。gydF4y2Ba 气gydF4y2Ba Z。gydF4y2Ba 刘gydF4y2Ba J。gydF4y2Ba 一个健壮的眼睛检测方法使用二进制边缘和强度信息相结合gydF4y2Ba 模式识别gydF4y2Ba 2006年gydF4y2Ba 39gydF4y2Ba 6gydF4y2Ba 1110年gydF4y2Ba 1125年gydF4y2Ba 10.1016 / j.patcog.2005.11.015gydF4y2Ba ZBL1096.68730gydF4y2Ba 2 - s2.0 - 33644978218gydF4y2Ba 克朗gydF4y2Ba B。gydF4y2Ba MaasgydF4y2Ba 年代。gydF4y2Ba BoughorbelgydF4y2Ba 年代。gydF4y2Ba HanjalicgydF4y2Ba 一个。gydF4y2Ba 眼睛定位在低标准定义的内容和应用程序来匹配gydF4y2Ba 计算机视觉和图像理解gydF4y2Ba 2009年gydF4y2Ba 113年gydF4y2Ba 8gydF4y2Ba 921年gydF4y2Ba 933年gydF4y2Ba 10.1016 / j.cviu.2009.03.013gydF4y2Ba 2 - s2.0 - 67349088551gydF4y2Ba MonzogydF4y2Ba D。gydF4y2Ba 阿尔比奥尔gydF4y2Ba 一个。gydF4y2Ba 即将gydF4y2Ba J。gydF4y2Ba 精准定位使用猪描述符gydF4y2Ba 机器视觉和应用程序gydF4y2Ba 2011年gydF4y2Ba 22gydF4y2Ba 3gydF4y2Ba 471年gydF4y2Ba 480年gydF4y2Ba 10.1007 / s00138 - 010 - 0273 - 0gydF4y2Ba 2 - s2.0 - 79958827793gydF4y2Ba 马gydF4y2Ba Y。gydF4y2Ba 丁gydF4y2Ba X。gydF4y2Ba 王gydF4y2Ba Z。gydF4y2Ba 王gydF4y2Ba N。gydF4y2Ba 健壮的精确概率框架下眼睛位置gydF4y2Ba 学报第六届IEEE国际会议上自动的脸和手势识别(FGR的04)gydF4y2Ba 2004年5月gydF4y2Ba IEEEgydF4y2Ba 339年gydF4y2Ba 344年gydF4y2Ba 2 - s2.0 - 4544257390gydF4y2Ba Vazquez-FernandezgydF4y2Ba E。gydF4y2Ba Gonzalez-JimenezgydF4y2Ba D。gydF4y2Ba 余gydF4y2Ba L . L。gydF4y2Ba 提高平均合成的过滤器在现实条件下精确的眼睛本地化gydF4y2Ba 专业生物识别技术gydF4y2Ba 2013年gydF4y2Ba 2gydF4y2Ba 1gydF4y2Ba 10gydF4y2Ba 20.gydF4y2Ba 10.1049 / iet-bmt.2011.0006gydF4y2Ba 2 - s2.0 - 84879386617gydF4y2Ba ŠtrucgydF4y2Ba V。gydF4y2Ba 格罗斯gydF4y2Ba j .Ž。gydF4y2Ba PavešićgydF4y2Ba N。gydF4y2Ba 合成的过滤器的主要方向为强大的实时定位gydF4y2Ba 生物识别技术和ID管理gydF4y2Ba 2011年gydF4y2Ba 6583年gydF4y2Ba 施普林格gydF4y2Ba 180年gydF4y2Ba 192年gydF4y2Ba 在计算机科学的课堂讲稿gydF4y2Ba 10.1007 / 978 - 3 - 642 - 19530 - 3 - _17gydF4y2Ba KullbackgydF4y2Ba 年代。gydF4y2Ba kullback-leibler距离gydF4y2Ba 1987年gydF4y2Ba 唐ydF4y2Ba X。gydF4y2Ba 组织gydF4y2Ba B。gydF4y2Ba 的人脸识别的预处理和特征集gydF4y2Ba 7gydF4y2Ba 《IEEE计算机视觉与模式识别会议(CVPR ' 07)gydF4y2Ba 2007年gydF4y2Ba 1gydF4y2Ba 8gydF4y2Ba 黄gydF4y2Ba g . B。gydF4y2Ba MattargydF4y2Ba M。gydF4y2Ba 伯格gydF4y2Ba T。gydF4y2Ba Learned-MillergydF4y2Ba E。gydF4y2Ba 标签面临在野外:数据库为研究人脸识别在不受约束的环境中gydF4y2Ba 2007年gydF4y2Ba 07-49gydF4y2Ba 阿默斯特,美国质量gydF4y2Ba 马萨诸塞大学gydF4y2Ba 常gydF4y2Ba c c。gydF4y2Ba 林gydF4y2Ba C.-J。gydF4y2Ba LIBSVM:支持向量机的库gydF4y2Ba ACM智能交易系统和技术gydF4y2Ba 2011年gydF4y2Ba 2gydF4y2Ba 3、第二十七条gydF4y2Ba 10.1145/1961189.1961199gydF4y2Ba 2 - s2.0 - 79955702502gydF4y2Ba http://www.luxand.com/facesdk/gydF4y2Ba