研究文章|开放获取
宣,勇窦,鑫牛,嘉庆,Ruorong肖, ”一个高效健壮的眼睛定位通过学习使用眼睛模板卷积分布”,计算智能和神经科学, 卷。2015年, 文章的ID709072年, 10 页面, 2015年。 https://doi.org/10.1155/2015/709072
一个高效健壮的眼睛定位通过学习使用眼睛模板卷积分布
文摘
眼睛定位在许多面部分析是一个基本的过程。在实际使用中,常常受到照明,头部姿势,面部表情,闭塞,和其他因素。仍很难实现高精度预测时间短,培训成本低。本文提出一种新颖的眼睛定位方法,探索只有单层卷积地图使用BP网络通过眼睛模板。结果表明,该方法鲁棒来处理很多困难的情况。在实验中,精度分别为98%和96%,在BioID LFPW测试集可以实现在10帧预测率只有15分钟的培训成本。与其他的模型相比,该方法可以获得类似的最好的结果大大减少训练时间和高速度的预测。
1。介绍
眼睛定位是至关重要的许多面分析。在分析人类的情绪,眼睛专注和头部姿势,眼睛的位置是必不可少的提取相应的信息(1]。面对跟踪,眼睛定位往往是必要的。在人脸识别中,面临的许多算法要求对齐图像根据眼睛的位置(2]。不准确的位置可能会导致故障的识别3,4]。
然而,现实世界的眼睛定位充满了挑战。脸照片通常由一投影从三维空间到二维平面。脸图像的外观可能会影响头部姿势,面部表情和光照。眼部结构因此充满了变化。此外,眼睛可以阻挡的东西像眼镜,头发,如图1。工作在任何意外的情况下,这些影响的算法应该是健壮的。
眼睛定位算法的设计在实际运用中,预测精度,速度,和培训成本是最相关的因素。一个健壮的算法应该保持高预测精度与多样的姿态,不同情况下面部表情在复杂环境闭塞,照明的变化。对于实时应用程序,需要预测率高。等一些在线学习系统用于公安,训练时间短的需求也快速算法适应不同工作的地方。培训成本也低效益的优化算法。提高精度在困难的环境中,复杂的模型往往是应用。然而,在复杂的模型会增加培训成本和时间的预测。如何选择一个方法有足够的复杂性达到较高的预测精度,预测率高,培训成本低同时仍然是一个挑战。
眼睛定位方法主要可以分为基于纹理和结构。基于纹理的方法(5- - - - - -8)学习图像纹理的特征。为当地的方法探索纹理(5,6),高预测率可以通过简单的培训。然而,他们通常不健壮的闭塞和失真,由于有限的信息从本地区域。另一方面,方法如7,8]研究整个脸上的全局纹理特征图像卷积网络。高预测精度可以通过这些方法获得较高的预测率。然而,训练变得相当大的成本。长时间的训练是必要的,因为大量的模型参数。正确选择模型的参数往往需要重复测试。基于结构的方法(9- - - - - -12]探索预定义的关键面部点。眼睛的位置可以发现主要由结构信息。虽然精度高可以通过一个简单的训练,预测通常涉及到一个迭代优化。和迭代时间和预测精度高度依赖于初始化。因此,预测精度和速率通常是不稳定的。
在这项研究中,发现有规律的反应分布卷积地图上生成的模板。这个分布反映了主要面部对象之间的空间关系。通过一个非线性学习模型,这样的分布可以探索预测眼睛的位置。而不是使用本地响应与传统模板方法,全球信息可以探索根据这样的分布。这样,眼睛的位置可以准确地预测甚至发生阻塞或失真。此外,高预测率有望noniterative预测模型。为此,卷积网络(7,8可以探索。然而,传统的卷积网络从原始图像中学习,这可能需要更多的层映射之间的复杂非线性关系面对图像和眼睛的位置。另一方面,卷积地图由眼睛模板包含简洁的分布信息,在不同的面部对象稳定响应模式。因为许多不必要的纹理被忽略,分布可以使用相对肤浅的网络学习和培训时间可以大大缩减。
基于这一原则,一个高效和健壮的眼睛定位算法。卷积算法探索面对地图使用BP网络通过眼睛模板。提高性能的眼睛模板,一种新型模板训练方法提出了噪声抑制控制。此外,基于FFT(快速傅里叶变换),卷积方法旨在进一步提高训练和预测速度。最终,该算法可以实现98%和96%的准确性,分别在BioID [13]和LFPW [14)测试集的预测率10 fps。然而,13466年的培训时间只有15分钟样本。
剩下的纸是组织如下。部分2评论眼睛检测的相关工作。部分3描述卷积的结果分布。部分4给出了该方法的详细描述。部分5讨论了实验和结果。结论部分给出6。
2。相关工作
眼睛定位技术近年来一直很发达。根据探索功能的属性,方法主要可以分为两类:结构和基于纹理的方法。
基于结构的方法探索一些特定脸上临界点结构模型的预测。典型的基于结构的方法包括ASM [9和麦11]。在这些方法中,眼睛的位置估计的结构信息和周围的局部纹理点通过一个迭代的过程。预测精度的迭代时间和初始结构的影响。此外,优化采用最小二乘法,其鲁棒性差阻塞的情况。
基于纹理的方法提取脸部纹理预测眼睛的位置。典型的基于结构的方法包括(5,7,8,15]。而不是使用有限的临界点的基于结构的方法,整个面部的所有纹理图像可以探索。先前的研究[7)显示的可靠性面临闭塞和扭曲的纹理。基于纹理的方法通常是noniterative。对纹理特征的提取,方法像卷积(5,7),枸杞多糖(16,猪17],哈雾[18)等是常用的。其中,最好的预测精度已报道的基于卷积的方法(7,8]。卷积运算也像其他纹理提取、计算密集的因为需要扫描整个图像在纹理窗口。然而,它也发现卷积特征提取可以在频域FFT加速。
目前,主要有两种类型的眼睛定位使用卷积特征提取。方法如(5,19,20.]试图探索的峰值响应一个预定义的模板(如卷积核)与理想模式。自卷积响应其他面部对象眼睛模板的脸颊和嘴唇是很难解释,其余响应映射被忽视的一部分,和眼睛只找到峰值响应。这些方法培训成本较低,较高的预测率。但他们并不健壮的闭塞和人脸姿态变化,由于响应等的眼睛固定眼睛模板将大大减少在这些情况下。预测的峰值响应在这些情况下可能最终失败。与探索的峰值响应复杂眼睛模板,其他方法尝试代码模板表面的基本形象元素,其中大部分是线段。眼睛位置和关系的代码分布的脸还能学到非线性模型。由于全球信息的使用,可以提高预测精度和闭塞和扭曲的姿势变化的影响可能是松了一口气。然而,这些通常是复杂的非线性关系。模型中使用这些方法如深CNN (7,8通常有大量的参数,导致昂贵的培训阶段,预测率低。此外,搜索的最优设置这些复杂的模型也很困难。
本文发现有相对稳定的全球分销模式卷积反应生成的眼睛模板和脸的形象。基于这一现象,提出了新颖的眼睛位置的方法。这种方法探索全球面临信息由眼睛模板位置预测,避免武断的决定,只有峰值响应。与此同时,使用特定的眼睛模板而不是随机学习内核,可以大大简化卷积网络只有一层。响应分布的属性描述的新发现将部分4。部分5给出了该算法基于这些发现。
3所示。规定由眼睛模板卷积反应地图上
卷积的全球信息响应映射通过眼睛模板一直被忽视,因为面对的响应分布不明确。因此,只有峰值响应的评估表明眼睛的位置,随着眼睛卷积模板通常有最大响应值在眼睛的地方。然而,这些方法通常在实际使用预测精度较低。面部表情,闭塞,和改变姿势会影响眼睛的外观,这将导致更低的响应。此外,它也很难区分左眼睛从右。
然而,在实验中发现,面对图像的卷积响应地图眼睛模板定期全球分销,鼻子和嘴等面部的对象相对稳定的模式。
证明这一现象,一个实验测试响应的相似样本对象进行了相同的面部。KL距离(21)是用于定量测量这些响应模式的相似之处如下: 在哪里和是两个测试发行版。KL往往是小的时候和是相似的。
在实验中,100正面图像被随机选择从BioID测试集。他们爬到128×128和预处理去除阴影效果Tan-Triggs [22]。100卷积响应生成的地图进一步pretrained眼睛模板,如图2(a)。五个比较组(行(b)、(c)、(d), (e)和图(f)2)定义的剪裁纹理样本在五个不同的地方(颜色广场和中心的点)的左眼(红色),右眼(橙色),鼻子(绿色),左口角落(蓝色),和右嘴巴角落(黑)。纹理样本从每组作为参考比较与其他样品在同一组KL距离。在KL测量,(在第一列图2纹理和)是用于参考的纹理样本在同一组。和都归一化。零值所取代避免零部。证明样本的相似性在每个面部对象组,一组(行(g)在图2),随机出现在脸图像纹理也准备比较。额外的组(行(h)图2)由遮挡的右眼是准备样本研究。颜色被用来提高响应的能见度地图与增值从蓝色到红色。
从图2、稳定响应的眼睛、鼻子和嘴巴((b) - (g))可以观察到。这些团体的平均KL距离是2.23,2.85,4.35,5.34,和5.38,显著小于随机组。这表明响应模式的相似的样本相同的面部对象。
从数据2(b)和2(c),它可以观察到纹理的分布的左和右眼睛是稳定的单峰。不过两只眼睛之间的相似之处也很明显,这意味着难以区分从左向右只使用峰值响应。鼻子的分布在图的反应2(d)是多通道的高峰值的一半部分稳定模式。鼻组的平均KL距离相对比眼睛更大,这表明在这方面更多的多样性。(图左边的分布2(e)(图)和权利2(f))嘴角还显示常规的单峰变化模式比嘴。如图2(h)、样本阻挡眼睛有不规则的分布模式和更类似于随机选择补丁集团(g)的平均KL距离8.39。
从上面的实验,它可以指出,一个相对稳定的全球分销模式可以通过使用模板卷积的眼睛。面部的卷积响应对象有独特的和稳定的模式。这些属性可以探索形成一个稳定的空间关系的眼睛位置和其他面部对象的位置。即使面临的一部分的信息是被阻塞或扭曲,眼睛的位置也可以预测从其余的稳定模式。
4所示。体系结构
提出了眼睛位置模式的体系结构主要由3个阶段,即卷积特征提取,将采样,BP neuronetwork如图3。与许多其他卷积网络,只有一个卷积层是用于我们的工作。此外,pretrained眼睛模板作为卷积核。卷积层的减少可能会简化模型和显著的训练时间短,而特征提取的能力有限。然而,人们发现通过适当的预处理和选择的卷积核,眼睛的位置之间的关系,和卷积的反应可能是由BP网络学习。对图像预处理,Tan-Triggs方法是选择减少照明效果。眼睛模板被提议的Bi-Pupil期亚欧基金训练方法。FFT-based卷积操作实施的方法来进一步减少计算。下面给出这些方法的细节。
4.1。眼睛模板训练Bi-Pupil期亚欧基金
眼睛模板由提出训练Bi-Pupil期亚欧基金基于期亚欧基金(5]。期亚欧基金,一个眼睛模板样本可以给每只眼睛图像样本与特定的响应函数。眼睛模板可以通过平均模板样本强调共同的特性。在眼睛的位置,峰值响应通常可以观察到亚欧模板。有效合成的字符特征提取的左和右眼睛,修改后的响应函数在亚欧基金提出Bi-Pupil次探索。和一套multieye模板来应对规模和旋转的变化。
以下4.4.1。Bi-Pupil响应函数
发现响应生成的地图左和右眼睛有一定的关系。有效地生成响应地图和降低成本的单独训练的两个眼睛,一个Bi-Pupil响应函数提出了代替亚欧基金用于一次。考虑 在哪里,分别给左和右眼睛的位置。通过这个函数,可以实现类似的高反应在两个眼睛。卷积响应映射可以作为普通的左和右眼睛模板。然而,培训任务是减少到只有两只眼睛的模板。此外,平均的两只眼睛,模板的耦合对某些样本可能会进一步下降。随着传统期亚欧基金,亚欧基金Bi-Pupil次训练是noniterative眼睛模板。随着训练样本的增加,最终模板是收敛的。因此,训练有素的眼睛模板也可以用于其他数据集。
4.1.2。改变不变Multieye模板集
使模板不变的变化像眼睛关闭,缩放和旋转的实际使用一套multieye模板生成3旋转类型如图3规模水平4。因此,就制作了9部卷积响应映射代码面对这些情况的担忧。
4.2。FFT-Based卷积方法
在亚欧特征提取为基础,面对眼睛图像和模板的卷积实现通过FFT在频域中点积。虽然FFT能够减少对卷积的计算,它也会带来频率对图像边缘的影响,在响应可能错误地计算周期从另一侧边缘信息。减轻这种影响,余弦窗的方法(5提出了。然而,发现这种方法可能会失败,由于大大减少眼睛纹理当眼睛并不在中央区域的图像。减少计算卷积操作没有在实际应用中引入额外的错误,修改FFT-based方法提出了如图5。
我们用零填充窗口函数来降低频率的影响。余弦窗口方法相比,零填充窗口函数应用于眼睛模板以外的脸图像。这种方法可以避免眼睛纹理的减少发生在余弦窗口的方法。保持特征提取能力和减少频率影响,零填充区域大小的眼睛模板应该谨慎选择。基于我们的经验,这种方法,也就是说,只有保持眼睛纹理,用0填充其他区域模板,是一个不错的选择。在我们的实验中,面对图像的大小是128×128,和眼睛的大小大约是33×33。根据眼睛区域的大小,只有33×33眼的中心区域模板被保留。
眼睛的边缘模板后0、0了眼睛模板和预处理眼影由FFT转换。与传输线两频率点积的地图,一个初始卷积地图可以实现。通过削减了不准确的边缘的宽度16像素,96×96的最后卷积结果。这样的结果是相同的,通过正常的卷积。
展示的效果FFT-based减少卷积的计算方法,给出了计算复杂性分析如下。分析仅基于乘法,因为它是最耗时的操作。鉴于面对宽度和形象眼睛模板、乘法的总数在正常在空间域卷积
3 FFT(两个FFT和一个传输线)和复杂的矩阵的乘积在频域乘法的FFT-based卷积
在这个实验中,和卷积,地图,大约10000000乘法需要正常的卷积和40,0000 FFT-based方法。考虑9 multieye地图的模板,减少计算是重要的。训练和预测时间的减少可能受益减少卷积计算。
4.3。BP网络和级联的提高
在进一步处理之前,卷积反应地图首先规范化1.0 0均值和标准差。发现这样的标准化来提高预测精度具有重要意义,因为之间的不平衡响应的分布地图可能会减少。提高提取的特征的不变性,马克斯池来downsample规范化响应映射到16×16。九个downsampled矩阵进一步向量化和加一个向量的长度为2304 BP网络的输入。完全连接BP网络采用乙状结肠激活函数如图3。作为输出,位置坐标也归一化。BP网络是由共轭梯度下降训练与标签之间的最小平方误差和预测误差函数。相比之下,与隐藏的神经元层网络选择考虑预测精度和训练时间。
为进一步提高预测精度,增强二级级联方案提出了如图6,就像[7]。第一级为初始位置的眼睛从整个脸的形象。然后,每只眼睛的位置修正在第二层次由初始位置为中心的广场。广场的宽度是四分之一的地区。
第二个层次只学习偏差预测由第一级和标签之间的位置。因为每个模型在第二级别只学会了一只眼睛,一只眼睛响应函数在初始期亚欧基金是用于生成模板在第二个层次。最后的预言是第一级的输出的总和第二个层次。
5。实验
用于实验的数据是一样的7]。13466年的数据集是由训练和2551个测试图像。从伦敦时装周的训练样本选择23数据集和互联网。测试集是由完整的BioID和LFPW数据集。BioID数据主要是由常规图像面前,而其他数据收集LFPW等许多复杂的环境包括宽头的变化姿势,照明,规模、清晰和闭塞。因此,一个健壮的算法应该在LFPW高精度数据集。所有的图像都标有面临地区的位置的眼睛,鼻子和两个嘴角。
评估的相对预测误差定义如下: 在哪里和分别是和地面真理和预测的位置是biocular距离。基于此错误,算法的准确性可以定义为样本的比例,预测误差小于0.1,整个测试样品。平均误差也用作另一个指标来评估预测在接下来的实验结果。
该算法在Matlab中实现2014,和实验3.3 GHz CPU的台式电脑。
5.1。改进方案的影响
在本节中,将讨论上述改善计划的影响。
5.1.1。对预测精度的影响
在接下来的实验中,Tan-Triggs预处理的方案,Bi-Pupil期亚欧基金眼睛模板培训,规范化卷积的响应图和级联增强方案预测精度进行了测试。发现该模型的方案作为标准配置。显示在表1配置相比,四是准备:Tan-Triggs所取代函数(M1),是像素值。Bi-Pupil期亚欧基金被替换为原始期亚欧基金(M2)的训练模板只使用右眼位置,响应映射正常化取代任何行动(M3),和级联增强被唯一的一级原始模型(M4)。
|
|||||||||||||||||||||||||||||||||||||||||||||||||
是显示在表1,所有的方案能有效地提高预测精度。使用Tan-Triggs而不是对数函数减少照明效果可以增加精度约1.5% - -2%。亚欧基金Bi-Pupil次模板可以提高精度约2% - -3%比原来期亚欧基金模板。反应正常化也有利于精度增加约0.5% - -1.5%。与原始模型相比,级联的提高会带来-4%的准确率提高3%。
5.1.2中。加速度由FFT-Based卷积
为了演示FFT-based方法的性能,卷积的脸和眼睛模板示例已经重复了100次。如图7结果,有轻微区别FFT-based卷积和直接的卷积。然而,这样的差别几乎没有任何影响在进一步分析提取的特征。计算效率,减少操作,FFT-based方法可以产生将近80加速比在这个实验中。用大量的卷积模型,这种方法可以显著减少训练和预测时间。
5.2。与其他方法相比
验证了该方法的效率,与许多先进的眼睛定位方法包括基于纹理和结构进行了考虑预测精度,预测率,和培训时间。
基于纹理的方法,期亚欧基金,Template-SVR,深CNN (7)进行比较。深CNN是目前精度最高的最佳方法之一眼位置。期亚欧基金直接使用卷积结果的最大像素位置预测眼睛的位置。Template-SVR方法是由取代了BP网络在该模型nu-SVR由libSVM实现(24)画一个公平的比较的效率2非线性映射模型。期亚欧基金和Template-SVR在Matlab中实现,而深CNN的结果来自[7]相同的训练和测试数据。
除此之外,一些主要基于结构的方法像中央商务区10),博尔曼(12),一个包括在商业软件LUXAND [25]本地化也相比。然而,他们的预测结果7]。测试数据集是相同的使用,但训练数据是未知的。
5.2.1。预测精度
预测精度的比较方法是列在表中2。前2结果以粗体显示。应该注意的是,LFPW健壮的算法通常具有较高的准确性,因为在这个测试集样本在不同情况下收集。
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
如表所示2,最好的结果是由CNN。然而,该方法也可以达到类似的高度准确的结果接近深CNN。总体而言,该方法可能是第二个最好的一个。一般地,该方法的准确性只有2%低于用很深的CNN,而平均误差高1.1%。然而,应该注意的是,为了达到这种结果,深CNN方法应该探索信息从5个特征点与一个更复杂的结构,和几个深水平3级联卷积模型与3层每一层。相比之下,该方法只使用两个特征点的2级卷积级联结构单一层模型在每个级别。通过引入更多的参考特征点对应的模型结构,还有很大改进空间。
为其他基于纹理的方法,它可以被发现,没有探索全球信息、亚欧很难在复杂的环境中工作。考虑到监督学习模型,SVR也可以映射响应之间的关系映射和眼睛的位置。然而,nu-SVR大概是4 - 6%的预测精度低于层BP网络的方法。
与基于结构的方法相比,该方法的准确性略低于中央商务区和LUXAND BioID约0.7%。可能因为BioID的样本都是常规的正面形象,这是适合这样的基于结构的方法。而在LFPW构成变化和遮挡普遍存在,该方法比这些方法。此外,该方法的平均误差明显低于基于结构的方法,这也证明了该方法的鲁棒性。
5.2.2。预测率
如前所述,基于结构的方法使用一个迭代预测方法。迭代时间是不稳定的和高度相关的研究情况和初始化。侧面或阻塞的情况,这可能成本秒来处理一个图像。
因此,实验预测率集中在基于纹理的方法。为了简化分析,人脸检测时间,这是高度相关的不同的情况下,在这个实验中没有考虑。计算速度的预测发现脸图像具有相同的大小。预测的Matlab实现期亚欧基金,nu-SVR,该方法记录下来。由于c++编码深度CNN是引用数据。
如表所示3,没有非线性BP网络,期亚欧基金能达到大约66 fps的预测率最高。由nu-SVR预测率为0.82 fps是最低的。相比之下,通过BP网络,该方法可以达到10.5帧/秒。井优化的C + +深CNN报道预测率为8.3 fps是接近我们的方法。
|
|||||||||||||||||||||||||
5.2.3。培训时间
基于结构的方法,通常是一个结构模型可以通过有限的样本没有太多的训练时间。然而,大多数基于结构的方法不一样健壮的高精度基于纹理的方法。基于纹理的方法快速和简单的模型可以训练。在这项实验中,亚欧培训超过13000只样品成本约200秒。然而,很难取得明显的改善通过广泛的训练对于那些简单的模型。因此,比较专注于高精度基于纹理的方法。
获得上述的准确性,该方法有13466个训练样本只是训练15分钟包括3眼模板和BP网络的训练在2级联模型。培训成本低使得我们的模型容易调整,适合在线学习任务。
相比之下,其他高精度模型的训练非常缓慢。CNN与反向传播的培训成本将大幅度增加额外的层。3级联水平和几个深卷积模型与3层在每一个层面,完全超过160000参数有训练有素的眼睛定位。培训的CNN可能花费几小时,甚至几天。由于培训时间长,选择一个最优的配置(如层数和内核,内核大小,等等)深模型将变得困难。寻找一个最优的配置也会增加培训的成本。nu-SVR模型也是耗时。对于Template-SVR的训练方法,这花费几个小时。因此优化这些模型是困难的。
6。结论
稳定的响应分布的卷积图像模板脸部和眼睛已经被发现了。这种分布模式有利于眼睛的位置。小说的眼睛位置的方法提出了通过学习卷积响应的分布地图。该方法只使用一个卷积层与一个特定的模板和BP网络。与许多先进的方法相比,类似的最好预测精度可以通过该方法预测高速度和减少训练时间。拟议的方法是健壮的姿势变化,扭曲,和阻塞,可以在复杂的环境中使用。已经证明,通过适当的选择模板的卷积核,一个浅褶积模型可以产生类似的准确的结果,通过深卷积模型预测率高和大大减少训练时间。
在未来的工作中,本地化的其他关键面部点建议的方法将研究。内核选择效率卷积网络将进一步分析。
利益冲突
作者宣称没有利益冲突有关的出版。
确认
这项工作主要是由中国国家自然科学基金资助下U1435219, 61125201, 61402507。
引用
- r·瓦伦蒂n·t . Gevers,“结合头部姿势和眼睛的位置信息的目光估计,“IEEE图像处理,21卷,不。2、802 - 815年,2012页。视图:出版商的网站|谷歌学术搜索|MathSciNet
- r·格罗斯,美国贝克,马修斯,t·金手册的人脸识别,2005年。
- h . k . Ekenel和r . Stiefelhagen面部阻塞一个具有挑战性的问题是为什么呢?“在生物识别技术的进步施普林格,页299 - 308年,2009年。视图:谷歌学术搜索
- b·克朗a . Hanjalic和s·m·p·马斯河眼脸匹配定位:它总是有用的,在什么条件下?“在《国际会议上图像和视频检索(CIVR ' 08)ACM,页379 - 387年,2008年7月。视图:出版商的网站|谷歌学术搜索
- d . s . Bolme b·a·德雷珀和j·r·贝弗里奇“平均合成的过滤器,”《IEEE计算机学会学报计算机视觉与模式识别会议研讨会(CVPR ' 09)IEEE,页2105 - 2112年,2009年6月。视图:出版商的网站|谷歌学术搜索
- Z.-H。周和耿x”,眼睛检测的投影函数”,模式识别,37卷,不。5,1049 - 1056年,2004页。视图:出版商的网站|谷歌学术搜索|Zentralblatt数学
- x y太阳,小王,x唐“卷积网络级联面部点检测,”学报》第26届IEEE计算机视觉与模式识别会议(CVPR 13)IEEE,页3476 - 3483年,波特兰,矿石,美国,2013年6月。视图:出版商的网站|谷歌学术搜索
- 曹e .周h .粉丝,z, y江,问:阴,“广泛的面部地标定位而且卷积网络级联”学报14 IEEE计算机视觉国际会议研讨会(ICCVW 13)IEEE,页386 - 391年,2013年12月。视图:出版商的网站|谷歌学术搜索
- t . f .笨蛋,c·j·泰勒,d·h·库珀和j·格雷厄姆,“活跃的形状就像他们的训练和应用”计算机视觉和图像理解,卷61,不。1,38-59,1995页。视图:出版商的网站|谷歌学术搜索
- l .梁r·肖f·温,j .太阳,“脸对齐通过基于组件的区别的搜索,”电脑Vision-ECCV 2008卷,5303在计算机科学的课堂讲稿施普林格,页72 - 85年,柏林,德国,2008年。视图:出版商的网站|谷歌学术搜索
- t·f·酷、g·j·爱德华兹和c·j·泰勒,“主动外观模型,”IEEE模式分析与机器智能,23卷,不。6,681 - 685年,2001页。视图:出版商的网站|谷歌学术搜索
- m . Valstar b·马丁内斯x Binefa, m . Pantic“面部点检测使用了回归和图模型,”《IEEE计算机学会学报计算机视觉与模式识别会议(CVPR 10)IEEE,页2729 - 2736年,2010年6月。视图:出版商的网站|谷歌学术搜索
- o . Jesorsky k . j . Kirchberg, r·w·Frischholz“健壮的人脸检测使用的豪斯多夫距离,”音频和视频生物识别人的身份验证施普林格,页90 - 95年,2001年。视图:谷歌学术搜索
- p . n . Belhumeur d·w·雅各布斯,d . j . Kriegman和n . Kumar“本地化部分面临使用原型的共识,”《IEEE计算机视觉与模式识别会议(CVPR 11)IEEE,页545 - 552年,2011年6月。视图:出版商的网站|谷歌学术搜索
- j .歌曲、z Chi和j .刘”一个健壮的眼睛检测方法使用二进制边缘和强度信息相结合,“模式识别,39卷,不。6,1110 - 1125年,2006页。视图:出版商的网站|谷歌学术搜索|Zentralblatt数学
- b·克朗s马斯河s Boughorbel, a . Hanjalic”眼睛定位在低标准定义的内容和应用程序来匹配,”计算机视觉和图像理解,卷113,不。8,921 - 933年,2009页。视图:出版商的网站|谷歌学术搜索
- d . Monzo a·阿尔比奥尔,j .即将“精准定位使用猪描述符,机器视觉和应用程序,22卷,不。3、471 - 480年,2011页。视图:出版商的网站|谷歌学术搜索
- 王x y,叮,z, n . Wang“健壮的精准位置概率框架下,”学报第六届IEEE国际会议上自动的脸和手势识别(FGR的04)IEEE,页339 - 344年,2004年5月。视图:谷歌学术搜索
- 大肠Vazquez-Fernandez、d . Gonzalez-Jimenez和l . l . Yu”提高精准本地化的平均合成的过滤器在现实条件下,“专业生物识别技术,卷2,不。1,10 - 20,2013页。视图:出版商的网站|谷歌学术搜索
- 诉Štruc, j .Ž。格罗斯,n . Pavešić”合成的过滤器的主要方向为强大的实时眼本地化,”生物识别技术和ID管理卷,6583在计算机科学的课堂讲稿施普林格,页180 - 192年,2011年。视图:出版商的网站|谷歌学术搜索
- s . Kullback“kullback-leibler距离”,1987。视图:谷歌学术搜索
- x谭和b区格”,预处理和特征集的人脸识别,”《IEEE计算机视觉与模式识别会议(CVPR ' 07)7卷,1 - 8,2007页。视图:谷歌学术搜索
- 黄g . b . m . Mattar t·伯格和e . Learned-Miller”标签面临在野外:数据库为研究人脸识别在不受约束的环境中,“技术。众议员07-49马萨诸塞大学阿默斯特,质量,美国,2007年。视图:谷歌学术搜索
- c c。Chang和C.-J。林,“LIBSVM:支持向量机的库,”ACM智能交易系统和技术,卷2,不。3、第二十七条,2011年。视图:出版商的网站|谷歌学术搜索
- http://www.luxand.com/facesdk/。
版权
版权©2015李宣等。这是一个开放分布式下文章知识共享归属许可,它允许无限制的使用、分配和复制在任何媒介,提供最初的工作是正确引用。