无线通信和移动计算

在这一页上

文摘介绍结论的利益冲突引用版权相关文章

特殊的问题

众包为移动网络和物联网

把这个特殊的问题

研究文章|开放获取

体积2018年| 文章的ID9729014| https://doi.org/10.1155/2018/9729014

研究快速人脸特征点检测在智能移动设备

张小盒李 ,¹ Xingming张,¹ 和好像王 ¹

学术编辑器: 兆龙宁

收到了 2017年9月01

修改后的 2017年12月12日

接受 2017年12月28日

发表 2018年2月25日

文摘

我们探索如何利用脸部特征点的性能检测移动终端从3方面。首先,我们优化模型中使用SDM通过PCA和谱聚类算法。其次,我们提出一个使用线性区别的分析评价标准选择最好的本地功能描述在特征点检测中扮演着一个关键的角色。第三,我们利用多核架构的移动终端和并行化优化SDM算法进一步提高效率。实验观察表明,最终完成GPC-SDM(改善监督下降法利用谱聚类,PCA和GPU加速)抑制了内存的使用,这是有益的和高效的满足实时的要求。

1。介绍

脸部特征点检测和跟踪是计算机视觉研究领域的一个热门话题。人脸姿态的基础技术评估,脸上表情转让或同步,等等。随着智能移动终端的普及,实时跟踪的面部特征点在移动终端是高度需求。例如,最近设计的移动(1)或车辆(2社交网络需要高质量面部特征点跟踪和检测的安全认证。它也可能受益人群移动传感体系结构中的信息检索(3,4]。然而,由于浮动点移动终端计算能力有限的电池供电,一系列的脸部特征检测算法,在计算机上成功,不能直接在移动终端上实现。因此我们问题如何实现实时检测和跟踪面部特征点的移动终端有限的计算能力。

如今,许多研究面部特征点的检测已经体现在实验探索个人电脑(PC)的一面。根据文献[5),从模型设计、面部特征点的方法检测方法可以分为基于当地的面部特征,全球基于面部特征,混合法结合局部特性和全局特性。与其他方法相比发达国家近年来,四个地方特性的基础算法,如监督下降法(SDM) [6),粗到细的形状搜索(cfs) [7),整体回归树(树)8回归(ESR)[],明确的形状9),取得了出色的表现。令人惊讶的是,尽管这些方法不考虑面部特征点的几何特征,他们仍然表现良好的面部表情阻塞。尽管简单,长效磺胺算法的速度和精度仍然很有竞争力。和级联回归方法首先由SDM不断学习的学者社区(10- - - - - -13直到现在。此外,基于当地的人工神经元的感受野,Baltrusaitis et al。14在CMU提出了一个面部特征点检测的方法,不同光照下表现良好。基于全局和局部特征描述,哈桑et al。15)开发了一种形状回归方法,使一个突破W300测试集。贾斯瓦尔et al。16]提出了基于Gabor-LBP人脸特征检测使用模型选择和支持向量回归。根据实验观察,这种方法具有优越的作用在捕捉脸部特征点局部遮挡和背景杂波。特别,马丁内斯et al。17)打破了传统的常规顺序回归法在这个问题上,提出multivisual线索聚合回归方法。与深度学习在计算机视觉任务的持续成功,Jourabloo和刘13]采用CNN作为形状和真实感三维人脸模型的系数估计量大造成变异脸对齐和它可以估计3 d形状如图所示的实验。

最近,移动设备吸引了极大的关注。崔et al。18)开发了一种人脸特征检测系统实时培训手机。-特雷萨登说道et al。19]介绍了定点方法[20.)和Haar-Like功能活动形状模型(21)(ASM)算法进行实时跟踪的面部特征点。基于层次模型,Jian-kang et al。22)提出了一种检测方法,实现手机更好的结果。江(23)开发了一个基于Android平台的面部特征检测系统。面部点检测在Android平台上,惠普(24)发明了一种3 d人脸姿态估计系统。

尽管大量研究人脸特征检测算法的移动终端,它仍然处于起步阶段,大部分都是基于移动操作系统。在本文中,我们改进的长效磺胺算法(6有两个方面:计算和模型。首先,我们减少了维度的特性需要本地化的面部特征点用谱聚类。第二,我们减少数量的线性模型,利用主成分分析法(PCA)长效磺胺。最后,当地特征提取和SDM模型计算在移动GPU组合和优化,进一步提高长效磺胺算法的性能。由于SDM方法是广泛学习最近发布的脸部特征点检测方法,我们的修改应该也有意义的增加其他方法的性能。

2。解决管道

图1介绍了与手机摄像头采集视频数据的图表。脸部特征点检测是应用于帧从视频流中提取。人脸检测是使用执行中提琴的脸探测器。为了克服光照问题,预处理步骤已经从事这项工作(细节可以在部分3)。当地的图像特征提取算法进行初始特征点分布,使用枸杞多糖、猪(25],筛选[26),等等。特征提取算法实现后GPU的并行设计,即根据像素值复制到共享内存的面对每个计算单元所需的图像。同时,长效磺胺算法模型也是根据计算单元嵌入到共享内存。每个计算单元的计算结果的回归组件人脸形状。

获得回归组件后,我们合并回归组件和更新基于集成回归组件的形状模型。重复这个过程,直到形状模型满足误差要求的培训过程。

3所示。预处理

考虑到真正的视频数据采集,相机可能在昏暗的条件下,噪声导致大型图像梯度或不规则的滤波器响应,这严重影响了检测算法的鲁棒性。我们从两个方面:规范化的脸部图像降噪和亮度的伸展,如图2。

首先,我们进行中值滤波来减少噪音可能造成的低光照条件。然后进行直方图均衡化,以统一的光效应,清除表面暗淡的脸图像的细节,并准备后续步骤。

4所示。优化长效磺胺

4.1。介绍了长效磺胺

长效磺胺算法的核心思想是最小化目标函数(1),旨在找到正确的修改当前位置到地面真理。表达式如下: 在哪里代表的脸部特征点的位置标记;代表脸图像;是当地的描述在特定位置提取;是初始形状。根据牛顿法,最小化(1)的收益率在哪里海赛矩阵的特征提取函数用 ; 的雅可比矩阵。虽然功能构成自病了特征提取功能在实践中通常是未知的,可以新配方吗

由于面部特征点标记在每一个实例, ,初始和最优特征点之间的区别也知道;因此我们有以下线性系统: 让代表了训练图像;是用来解决和在训练阶段。后回归模型 , 获得;我们更新每个每个训练样本的初始形状:

培训完成后获得的回归模型: 。

研究的面部特征点跟踪、长效磺胺算法仍然是适用的。区别面部特征点检测和人脸特征点跟踪初始特征点分布。培训步骤的面部特征点跟踪,每个人最初的面部点位置是随机取样一次或几次的标签吗在95%或20像素重新调节或翻译。然后,跟踪模型得到与上述相同的过程。这是合理的,因为脸型由于视频帧变化缓慢。

4.2。模型的压缩

通过上面的分析,我们可以发现SDM算法使用多个回归实现脸部特征点对齐,及其计算复杂度主要集中在回归模型的计算:

假设是特征点的位置次回归,考虑到我们有66个特征点对齐,我们需要线性模型在每一个回归模型。然而,仔细考虑,我们可以发现,如果两个特征点在形状上不是强相关,当地特性提取不能帮助定位多少。因此,我们分开来 ,使得特征点在同一subshape主要相关,和特征点在不同subshapes贴切地。为了准确估计的数量分类,我们引入光谱聚类进行分析。首先,不同特征点之间的相关系数被定义为

让训练样本的数量,特征点的尺寸,的协方差特征点的尺寸。

我们直接使用相关系数矩阵定义的拉普拉斯算子矩阵:

权重矩阵 , 。根据光谱集群、最小的特征值的数量- 1是目录的数量表示。因此我们可以得到subshapes通过执行——最后第二特征向量特征向量。假设可以分为人脸特征点类、长效磺胺的面部特征点定位算法可以写成

方程(9)使用联盟subshapes的回归模型来确定整个脸的形状。该方法降低了每个线性模型的长度原和放松长效磺胺的计算复杂度。然而,框架的线性模型的长效磺胺算法并没有减少。因此,我们使用主成分分析来进一步简化SDM级联线性模型。流程如下:

假设我们有以下线性模型:

我们执行使用PCA降维这。的主体是和。我们有

如果我们表示 ,这个收益率

从矩阵分解 ,我们有

对角矩阵的特征值对应。因为 ,我们可以知道。(11)可以写成

自是正交的,乘双方(14),我们得到

它可以写成

从上面的分析中,我们可以知道每个线性模型的宽度可以减少的本金。

4.3。GPU加速

SDM算法的设计原则,我们知道,从面部特征点的局部特征提取的鲁棒性有非常重要的影响脸对齐的效果。在实践中,我们发现,特征提取和模型计算消耗一半的时间成本SDM算法,分别。随着计算机视觉的发展,学者们提出了无穷无尽的局部特征描述符。其中,使用最广泛的功能是猪(梯度)的柱状图25),筛选(尺度不变特征转换)26),枸杞多糖(局部二进制模式)27]。然而,这些特性是太耗费时间或难以并行。例如,猪的特性是很难被平行缺乏特征点。原因可能在于重叠的细胞。统计直方图的梯度方向很容易产生冲突在内存中访问的计算单位。在使用平行筛选功能,由于需要获得图像金字塔,它不会节省计算开销但是会降低算法的性能时,特征点的规模很小。因此,GPU加速的主要工作总结如下:挑选合适的图像特征提取算法,易于并行化和健壮的小规模数据。通过移动电话的好处GPU,并行化特征提取面对对齐问题,长效磺胺的计算算法

对于当地的描述特征的判断,我们启发式来自线性鉴别分析(LDA)。给出一个算法,表示 ,我们预期的局部特性提取使用应该在同一特征点小协方差在训练集吗。特征提取在不同特征点应该有足够的差异。应用LDA的算法思想;在同一个班,方差的特性应该尽可能小。相反,类之间的方差应该尽可能大。我们表示当地的特征提取样品的特征点使用算法。的协方差的本地特性可以表示为

在哪里是所有样本的均值特性提取使用算法 , 。

因此,不同的特征点使用的协方差可以计算出

在哪里。我们相信,如果特征提取算法协方差是足够好,应该用相同的特征点,但小的在不同的特征点。因此,我们要评估使用类似的方法用于LDA。尽管特征向量,我们只关心马克斯的一部分特征值:

最后,我们选择算法与最大最大的一部分特征值:

我们分析了最近流行的本地计算机视觉特征提取算法,包括筛选、冲浪(28),猪,短暂的29日],ORB [30.,快31日,狂32],MRLBP [27]。我们发现怪物有更好的性能在脸对齐的问题。节将讨论实验细节5。

长效磺胺脸对齐算法没有足够的数据应用GPU加速。如果我们这样做,我们会让两个GPU-shared频繁访问内存和CPU内存。这不仅会影响算法的性能,而且可以减少内存的生活。因此,促进手机的GPU的体系结构,我们设计一个平行于SDM和特征提取的模式。如图3,我们的方法并行特征提取和模型解决长效磺胺。首先,我们加载子块的像素值在每个特征点在内存中根据每个特征点的位置在最初的形状。请注意,如果子图块的像素值需要访问次,我们将存储共享内存中的像素值的副本。同时,长效磺胺算法应用到模型分数和图像特征在每个补丁,这是存储在共享内存。一旦完成特征提取特征点的计算,在特征点图像的组件特性直接作为贡献整体形状回归。

5。实验结果与讨论

在我们的实验设置中,我们首先评估节中描述局部特征的性能4与。在表1,我们表示(9月)可分分数据(20.),(p / s)作为特征点的数量可以由这些算法处理。评估性能在移动终端中,我们使用高通snapdragon 800系列平台。我们使用的数据集是LFW66的组合(33和海伦34]。

我们可以看到在桌子上1,传统的本地功能算法鲁棒性或运行速度仍然具有一定的优势。最稳定的特征仍然是猪的特征,但最快的算法是枸杞多糖功能。考虑的稳定性和运行速度特性,快速视网膜特征点(反常)提出了近年来更有实用价值。

因此,我们比较原始SDM算法的性能与优化方面的效率和鲁棒性。为了证明每个优化步骤的有效性,整个优化过程分为C-SDM:基于特征点相关聚类优化;PC-SDM:减少维优化基于主成分分析和特征点聚类;GPC-SDM:脸对齐算法,最后提出了增加动态GPU的并行优化。首先,我们比较每一步的优化算法与原长效磺胺。为了量化问题,我们首先定义脸回归算法的准确性

在哪里是在测试集和形象代表了估计的形状。分母是左派和右派之间的距离,用于规范化估计误差。我们定义的成功得分一定精度如下:

在哪里指标指出是否测试样本的估计误差小于和是测试样品的数量。不同的优化的成功率增加如图所示4。

结合数据4和5,我们可以看到,每个阶段的优化对前一阶段有显著提高。与最初的长效磺胺算法相比,C-SDM成功率算法有一个轻微的下降。PC-SDM算法,结合主成分分析和C-SDM,可以进一步提高性能而不影响成功率。虽然基于GPU的GPC-SDM优化应该有相同的成功率与PC-SDM曲线算法,由于过度GPU浮点截断误差,在高精度条件下成功率有所下降。所有的算法,精度条件的放松会导致相同的成功率长效磺胺算法。总之,通过对比实验,我们可以看到,本文提出的优化方案可以实现显著提高性能。

最后,我们比较我们最后的两个修改与先进的面部特征点的检测方法与速度优势。实验交叉数据集用来防止过度拟合现象;如果模型训练数据集,说海伦数据集,它必须与其他数据集评估,说伦敦时装周。因此,精度可能稍微不同的出版物的原创作品。此外,fps以来大大减少实验环境移动到移动终端。为了简化实验,我们选择和比较fps和成功率与最先进的算法:整体回归树(美国东部时间)9),高斯过程回归树(F-cGPRT) [10),本地二进制特征回归(F-LBF) [11),和L1范数点球SDM (SDM (L1)) (12]。

如表所示2、PC-SDM的性能和GPC-SDM提高人脸特征点检测的速度和保持最健壮的成功率SDM算法。其他先进的算法使用回归树或森林和简单的图像特征来提高速度。然而,这些方法不突破长效磺胺提出的计算框架。现在回归树算法很容易overfit训练集,这可以很容易地观察到表中2宣布,虽然他们的方法更精确地说,成功的利率下调和交叉数据集评估。一个成功的修改的长效磺胺SDM (L1) [12),有稀疏的SDM模型和加快算法容易和显著。然而,它也牺牲成功率比较原始长效磺胺与支持向量回归算法。因此,尽管我们的建议并未达到最快的性能即使GPU加速,它有更多的实用价值考虑鲁棒性和实时要求。

6。结论

在这篇文章中,我们移植长效磺胺算法在移动设备上使用以下工作:首先,根据特征点之间的相关分析统计的脸型,我们引入光谱集群和PCA减少模型长效磺胺的大小。第二,当地特性评价方法分类,提出了基于线性歧视,将功能评价和脸对齐算法来促进实验工作。第三,提出了一种基于gpu的SDM模型,它结合了特征提取和模型解决。最后,长效磺胺算法充分利用的潜力,和长效磺胺算法优化和移植到移动终端。

面对对齐算法具有广阔的应用前景,但是这个问题的研究仍处于初级阶段。我们仍然需要提高面对对齐算法的成功率,特别是存在遮挡、光线变化,夜灯,和脸3 d构成的变化。脸对齐和面部特征点跟踪的算法成功率仍然是不够的。学习如何克服这些问题是很重要的在我们的下一步研究工作。

的利益冲突

作者宣称没有利益冲突。

引用

z Ning, x, z . Chen等人“合作quality-aware社会网络服务访问系统的车辆,“IEEE物联网,2017年,页1 - 1。
视图: 出版商的网站 | 谷歌学术搜索
x, t·h·s .楚v c . m .梁大肠学术界。p . Kruchten Ngai, h . c . b . Chan)移动社交网络上的一项调查显示:应用程序平台,系统架构,和未来的研究方向,IEEE通信调查教程17卷,一项调查,在移动社交网络,应用,2015年。
x, t·h·s .楚h . c . b . Chan和v c . m .梁”维塔:crowdsensing-oriented移动cyber-physical系统”,IEEE新兴主题计算,1卷,不。1,第165 - 148页,2013。
视图: 出版商的网站 | 谷歌学术搜索
李x, x,大肠学术界。Ngai, v . c . m .梁和p . Kruchten“多维环境敏感的社交网络架构已被称作移动群体感知,”IEEE通讯杂志,52卷,不。6,78 - 87年,2014页。
视图: 出版商的网站 | 谷歌学术搜索
y亨et al .,一个最近的脸对准方法的实证研究,2015年计算机科学。
x熊和f . De la Torre”,全球监管下降法”《IEEE计算机视觉与模式识别会议(CVPR 15)IEEE,页2664 - 2673年,波士顿,质量,美国,2015年6月。
视图: 出版商的网站 | 谷歌学术搜索
朱,c, c . c .阿来和x唐,“脸对齐,而且形状搜索”《IEEE计算机视觉与模式识别会议,CVPR 2015美国,页4998 - 5006年,2015年6月。
视图: 出版商的网站 | 谷歌学术搜索
诉大使和j·沙利文,”一个毫秒脸对齐的合奏回归树,”《IEEE计算机视觉与模式识别会议(CVPR 14)俄亥俄州哥伦布市,页1867 - 1874,美国2014年6月。
视图: 出版商的网站 | 谷歌学术搜索
曹x, y, f·温,j .太阳,“面对由显式形状对齐回归,”学报2012年IEEE计算机视觉与模式识别会议,CVPR 2012美国,页2887 - 2894年,2012年6月。
视图: 出版商的网站 | 谷歌学术搜索
d·李,h .公园,和c d .柳”脸对齐使用级联高斯过程回归树,”《IEEE计算机视觉与模式识别会议,CVPR 2015美国,页4204 - 4212年,2015年6月。
视图: 出版商的网站 | 谷歌学术搜索
任,曹x, y,和j .太阳,“脸对齐在3000 FPS通过回归本地二进制特征,”美国27日IEEE计算机视觉与模式识别会议,CVPR 2014美国,页1685 - 1692年,2014年6月。
视图: 出版商的网站 | 谷歌学术搜索
问:刘、邓j . d .道,“双重稀疏约束的级联回归的人脸对齐,“IEEE图像处理,25卷,不。2、700 - 712年,2016页。
视图: 出版商的网站 | 谷歌学术搜索 | MathSciNet
a . Jourabloo和x刘Large-pose脸对齐通过CNN-based密集的3 d模型拟合,”学报2016年IEEE计算机视觉与模式识别会议,CVPR 2016,页4188 - 4196,美国,2016年7月。
视图: 谷歌学术搜索
t . Baltrusaitis p·罗宾逊,L.-P。莫伦西”,限制当地强劲的面部神经字段具有里程碑意义的检测在野外,”学报14 IEEE计算机视觉国际会议研讨会(ICCVW 13),页354 - 361年,悉尼,澳大利亚,2013年12月。
视图: 出版商的网站 | 谷歌学术搜索
m·k·哈桑,c . Pal和s . Moalem“本地化面部关键点与全球描述符搜索,邻居校准和局部线性模型,”学报》2013年第14届IEEE计算机视觉国际会议上车间,ICCVW 2013来自,页362 - 369年,2013年12月。
视图: 出版商的网站 | 谷歌学术搜索
贾斯瓦尔,t·r·Almaev和m . f . Valstar”引导模式具体模型的无监督学习面部点检测在野外,”学报》2013年第14届IEEE计算机视觉国际会议上车间,ICCVW 2013来自,页370 - 377年,2013年12月。
视图: 出版商的网站 | 谷歌学术搜索
b·马丁内斯·m·f·Valstar x Binefa,和m . Pantic”当地聚合回归面部点检测证据,”IEEE模式分析与机器智能,35卷,不。5,1149 - 1163年,2013页。
视图: 出版商的网站 | 谷歌学术搜索
k . Choi K.-A。(音),h . Byun“实时训练人脸识别应用在移动设备上,“模式识别,44卷,不。2、386 - 400年,2011页。
视图: 出版商的网站 | 谷歌学术搜索
p . a -特雷萨登说道,m . c . Ionita和t . f .傻瓜”移动设备上实时面部特征跟踪”,国际计算机视觉杂志》上,卷96,不。3、280 - 289年,2012页。
视图: 出版商的网站 | 谷歌学术搜索
w·赫尔曼,Fix-Point方法,1983年统计科学百科全书。
t . f .笨蛋,c·j·泰勒,d·h·库珀和j·格雷厄姆,“活跃的形状就像他们的训练和应用”计算机视觉和图像理解,卷61,不。1,38-59,1995页。
视图: 出版商的网站 | 谷歌学术搜索
d . Jian-kang w . Can-tian l .古诗,“快面临基于层次模型的校准方法和它的应用程序在移动设备上,“计算机科学,12卷,p。65年,2014年。
视图: 谷歌学术搜索
h .江面部特征点定位的研究并实现基于android平台,北京交通大学,2013。
w·l·w·惠普“实时人脸姿态估计基于3 d模型中实现android,”国际期刊的计算机应用程序,2015年。
视图: 谷歌学术搜索
t . b . n .中间人”的梯度直方图的人体检测,”《IEEE计算机学会学报计算机视觉与模式识别会议(CVPR ' 05),1卷,第893 - 886页,2005年6月。
视图: 出版商的网站 | 谷歌学术搜索
d·g·劳”独特的形象特征尺度不变的要点,国际计算机视觉杂志》上,60卷,不。2、91 - 110年,2004页。
视图: 出版商的网站 | 谷歌学术搜索
l . Liu老挝,p . w . Fieguth y郭,x王et al .,“稳健扩展局部二进制模式中值纹理分类,“IEEE图像处理,25卷,不。3、1368 - 1381年,2016页。
视图: 出版商的网站 | 谷歌学术搜索 | MathSciNet
t·h·湾Tuytelaars, l . Van干傻事,“冲浪:加快健壮的特性,”美国在欧洲计算机视觉,2006年。
视图: 谷歌学术搜索
m . Calonder诉Lepetit、c . Strecha和p . Fua“简单:二进制健壮的独立的基本特性,”电脑Vision-ECCV 2010: 11日欧洲计算机视觉,伊拉克里翁,克里特岛,希腊,第5 - 11年9月,2010年,诉讼,第四部分卷,6314在计算机科学的课堂讲稿施普林格,页778 - 792年,柏林,德国,2010年。
视图: 出版商的网站 | 谷歌学术搜索
e . Rublee诉Rabaud、k . Konolige和g . Bradski”ORB:一个有效的替代筛选或冲浪,”《IEEE计算机视觉国际会议(ICCV 11)西班牙巴塞罗那,页2564 - 2571,,2011年11月。
视图: 出版商的网站 | 谷歌学术搜索
s . Leutenegger m . Chli, r . y . Siegwart“快:二进制健壮的不变的可伸缩的要点,”《IEEE计算机视觉国际会议(ICCV 11)西班牙巴塞罗那,页2548 - 2555,,2011年11月。
视图: 出版商的网站 | 谷歌学术搜索
a . Alahi r·奥尔蒂斯,p . Vandergheynst“狂:快速视网膜关键点,”《IEEE计算机视觉与模式识别会议(CVPR 12)2012年6月,页510 - 517。
视图: 出版商的网站 | 谷歌学术搜索
b .黄加里et al。标签面临在野外:数据库为研究人脸识别在无约束的环境中马萨诸塞大学阿默斯特,妈,美国,2007年。
勒。Vuong et al .,“互动面部特征定位”欧洲计算机视觉的诉讼,2012年。
视图: 谷歌学术搜索

版权

PDF 下载引用

下载其他格式

订单打印副本

的观点

2482年

下载

1209年

引用