研究文章|开放获取
穆罕默德Ngadi Aouatif胺,Bouchra Nassih, Hanaa Hachimi, Adnane El-Attar, ”枸杞多糖和NSVC组合应用面临的性能分类”,应用计算智能和软计算, 卷。2016年, 文章的ID8272796, 10 页面, 2016年。 https://doi.org/10.1155/2016/8272796
枸杞多糖和NSVC组合应用面临的性能分类
文摘
在安全领域不断增长的需求导致有趣的方法面对分类的发展。这些作品感兴趣,因为他们开始面对的不变特征提取模型来构建一个简单的易于识别的分类算法。在本文中,我们的目标是开发高效实用的人脸检测方法。提出了一种新的快速、准确的方法基于局部二进制模式(LBP)的提取特性,结合新的分类器相邻的支持向量分类器(NSVC)分类。在不同的自然图像实验结果表明,该方法可以得到很好的结果在很短的检测时间。最好的精度得到LBP-NSVC超过99%。
1。介绍
研究人员表明,认识到,人类使用不同的特性,比如几何、纹理,和颜色的不同部分的脸,眼睛,嘴巴,鼻子,前面,和脸颊。在此基础上观察,几项研究已经开发验证模型是否有可能这种行为方式计算。
本文致力于基于计算机面临的问题分类(1),成为一个受欢迎的和重要的研究课题,近年来由于其许多应用程序索引和搜索图像和视频等安全访问控制、视频监控。尽管许多努力和进步,在最近几年,它仍然是一个悬而未决的问题,仍然被认为是一个最困难的问题在计算机视觉的社区,主要是由于类和类之间的相似之处的变化如遮挡、背景杂乱,角度变化,提出了缩放和照明。现在流行的检测方法是基于描述符和分类器,通常视觉描述符提取图片和视频,然后使用机器学习算法基于执行分类提取的特征。
一般来说,数据的大小可以衡量两个维度:变量和实例的数量。这两个维度可以非常高的值,它可以是一个问题的探索和分析这些数据。在这种背景下,有必要实现一些数据处理工具,使我们能够更好地理解在我们的数据集包含的信息。降维是最古老的方法之一,回答了这个问题。其目标是选择或检索一个最优的子集相关特征根据以前固定的标准。这个选择/萃取允许减少空间的维数的例子,使所有的数据更具代表性的问题。
这减少的双重目的,第一是减少冗余,和第二个允许促进后续治疗(特征提取相应减少所需存储空间,减少了模式识别分类学习时间和加速过程),因此数据解释。
第一步是选择最好的特征提取(2,3)的背景下面临分类的方法。在这种情况下,我们发现枸杞多糖的描述符给出了最优的表示图像。这个描述符的原则是比较每个像素(视为中央像素半径的一个窗口和包含分)其邻国和生成二进制代码(在此基础上比较4]。验证我们的选择,我们做个比较与其他特征的抽取,描述符如离散小波变换(DWT) [5)和面向梯度直方图(猪)6]。
第二步涉及分类函数的选择。我们选择使用方法放在semisupervised分类器的上下文,NSVC。它是基于两个分类器的组合属于两个不同的家庭(nonsupervised分类:模糊c和监督:SVM)。邻近的支持向量分类器的基本思想(NSVC)是构建新的本地的内核函数,通过监督聚类在特征空间。这些本地的内核函数然后用于学习。
最后,我们的实验表明,LBP-NSVC优于所有其他的特征选择和分类算法。用于比较的主要标准分类的准确性和执行时间,没有遗忘的能力训练的分类器有效地管理实际应用数据可能来自不同的环境。
剩下的纸是组织如下。枸杞多糖的简要描述节中给出2。部分3介绍了基于监督NSVC分区的功能空间。实验结果发表在部分4,而部分5对整篇文章进行总结。
2。局部二值模式(LBP)
枸杞多糖的方法可以被视为一个统一的统计和结构纹理分析方法。而不是试图解释的形成纹理像素级,局部模型是每个像素周围形成。每个像素标记与代码的质地最好的地方在他的邻居。因此,每个枸杞多糖的代码的代码可以被看作是最能代表当地附近的像素。因此,枸杞多糖分布既有结构属性:原语的材质和放置这些原语的规则。由于这些原因,枸杞多糖的方法可以成功地用于识别不同的纹理、结构和统计方法是传统的单独应用。
Ojala等人提出的局部二进制模式最初是在1996年(7]。枸杞多糖是简单的概念;提出将二进制代码分配给一个像素根据其社区。这段代码描述当地的纹理区域计算的阈值附近的中央像素级的灰色。为了生成一个二进制模式,所有的邻居会取一个值“1”如果他们的价值大于或等于当前像素和“0”。这个二进制模式的像素然后乘以权重和召唤获得当前像素枸杞多糖的代码。我们因此获得任何图像,像素强度0到255之间的一个普通的8位图像。而不是描述序列图像的LBP代码,一个可以选择纹理描述符使用直方图(图255 -维度1)。
枸杞多糖是扩展后通过使用不同的邻域大小(8- - - - - -10]。在这种情况下,一个圆的半径在中央像素被认为是。的值在圆的边缘被采样点数并与中心像素的值。获得的值点附近采样半径,一个插值是必要的。符号(,)采用定义附近点的半径一个像素。LBPP,半径的枸杞多糖代码吗和邻居的数量。主要的区别在于,必须获得值的插值像素点的圆。枸杞多糖的重要属性的代码,这段代码不变的均匀照明变化,因为一个像素的枸杞多糖只取决于灰度和它的邻国之间的区别。
计算枸杞多糖的代码在一个社区像素半径,一个简单的计数出现的像素上级或等于中央值: 在哪里是符号函数,在哪里和分别是,附近的像素和中央像素灰度吗 多尺度枸杞多糖的概念是基于附近的选择为了计算枸杞多糖代码过程纹理在不同尺度11,12]。社区中心像素是分布在一个圆圈,由两个参数:邻居”的数量“在圆半径”“定义一个中央像素之间的距离和其邻国(图2)。纹理图像的分类是灰度值的联合分布的像素():,对应于中央像素的值,,对应的水平像素定期间隔的一个圆的半径。如果坐标等于,然后坐标是由以下方程:
从社区的定义,作者定义,首先,局部二进制模式,是对任何单调变换的灰度不变,LBPP,。为每个像素,中央像素不用于纹理的特征。事实上,无论附近,像素只描述了一个光强度不一定是有用的(11]。随后,作为一个阈值在以下方式: 因此,计算获得的枸杞多糖代码可以以同样的方式作为基本的枸杞多糖(见(1))。
LBP-based面临表示:每个面图像可以被认为是一篇作文的微型图象可以有效地检测到的LBP算子。哈迪德et al。13]介绍了面部识别LBP-based脸表示。检查脸型信息,他们把脸的图像小不重叠的区域(如图3)。
NSVC是分类器自适应不同的数据集。这是基础,一方面,nonsupervised方法等——或FCM,另一方面,在监督的方法:支持向量机。
3所示。邻近的支持向量分类器(NSVC)
由Vapnik引入支持向量机,首先和他的同事们对问题的分类和回归,可以被视为一个新的训练技术,基于传统的多项式和径向基函数(RBF)。正如之前所讨论的,支持向量机泛化能力引起了相当大的关注,因为他们的高和更高的分类性能相对于其他模式识别算法。
然而,假设训练数据是相同的从未知的概率分布生成可能会限制的应用支持向量机日常生活的问题(14]。
放松的假设相同的分布,NSVC [15- - - - - -17]使用一组附近的核函数的建立基于监督聚类在特征空间中引起的内核。NSVC的基本思想是建立新的本地的核心功能通过监督在特征空间聚类。这些本地的核心功能是用于支持向量机训练。
这种方法包括两个步骤:(我)为监督监督聚类步骤基于SKDA算法(基于确定性退火,用于分区训练数据在不同的本地的区域)。(2)SVM的训练步骤技术用于最小化附近的风险函数(VRM)中定义的约束下基于SKDA聚类步骤。考虑下面的输入输出数据在一起: 在哪里输入数据点的数量和吗输入空间的维数。
附近的功能的数据点是建立如果测试数据点满足两个假设:(我)未知的密度函数光滑在附近的每一个点。(2)函数最小化的功能风险也顺利和对称的每个点的附近。优化问题的原则VRM叫附近的线性支持向量机(18,19)可以作为制定 在哪里是一个重量,是一个常数的惩罚呢,抵消,与测试点附近吗,的条件概率是在输入空间各自的附近。
附近的支持向量机解决方案下面的定理是正确的(见[18证明): 定义系数在哪里一个最大化 在哪里被称为monovicinal内核和的bivicinal内核是本地的支持向量机(18]。
3.1。监督NSVC基于确定性退火
集群训练数据的特征空间是一个证据确凿的话题(20.,21]。它由非线性输入低维空间的观测数据映射到一个高维特征空间使用核函数,便于分离线性数据,表示一个输入空间的非线性变换使用核函数作为一个高维空间 在哪里转换后的点。
所有训练数据点分布燕国/集群特征空间,的重心th居住在附近。这是一个类似表示基于特征空间聚类则: 在哪里是集群的数量,参数是定义的集群技术(SKDA),然后呢表示特征空间中的数据点标记。
数学上定义的分类问题通常是由一个成本函数最小化;对于NSVC情况,这个函数是失真函数。类似于[中使用的符号22),我们让表示关联点的概率映射到集群中心。利用平方距离(15)之间的中心和培训向量,变得失真函数的函数空间 因为没有先验知识分布的数据认为,在所有可能的给一个给定值的分布我们选择的条件夏侬熵最大化的特征空间: 可以新配方优化问题的极小化拉格朗日: 在哪里是拉格朗日乘子。
来确定参数,我们自由能量函数最小化对协会的可能性(22),这是吉布斯分布有关 在哪里大规模的概率th集群: 所以能量函数 的偏导数关于是 相应的 除以由归一化因子 所以, 使用(14)导致 最后,我们获得的表达将用于建设本地的内核NSVC功能:
3.2。NSVC与功能空间分区
基于特征空间划分的优化问题制定如下(18]: 在哪里代表了与质量中心附近在特征空间是各自的条件概率特征空间的附近。根据贝叶斯定理,我们有 通过比较(22)和(25),我们得到 和优化约束 让一个定义mono -和bivicinal内核 在哪里从SKDA集群获得参数的步骤。边界的决定 在哪里的系数最大化双重功能: 为了获得一个稀疏的解决方案成本的额外的聚类过程中,集群的数量的一个好选择。
4所示。实验结果
现在我们将进行深前面提到的评价分类器的。我们首先详细描述数据集,然后所有分类器的分类结果。
4.1。数据集
因素之间的影响或影响人脸检测系统的性能,姿势,照明条件下,面部表情和闭塞。为此我们建立了一个健壮的数据库基于不同的照明条件和不同的颜色和质地的变化,然后,在各种情绪的面部表情,如中性表情,愤怒,尖叫,悲伤,嗜睡,惊讶,眨眼,额叶微笑,额与牙齿微笑,打开或关闭眼睛,面部细节(眼镜/不眼镜,帽子/帽子,帽子/帽)。然后,使用我们的数据库中面对分类,不同的面部图像在不同的照明条件,使分类模型不变的照明。这些照片是采用潜水者不受约束的环境下(图4)。
我们检测到人的脸在我们的数据库使用Viola-Jones算法和归一化的级联检测发现面临的固定大小像素。图5介绍了一些典型的脸的图像数据库。
4.2。结果NSVC
邻近的支持向量分类器的基本思想(NSVC)是构建新的邻近的内核函数,通过监督聚类在特征空间。这些相邻的内核函数用于基于SVM的学习。
使用多项式和RBF内核时,我们使用交叉验证来计算最优学习内核参数。
我们评估的准确性和NSVC每个特征提取方法。获得的结果如表所示1和2。
|
||||||||||||||||||||||||||||||
| ULBP:统一的局部二进制模式。SLBP:简单的局部二进制模式。 |
||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||
要测试该方法的性能,我们比较LBP-NSVC算法的精度与其他组合HOG-NSVC和DWT-NSVC等。
所以,每次我们使用LBP-NSVC在我们的实验中,我们必须考虑多项式内核获得更准确的结果。以下部分显示精度的比较与我们的经验和其他分类器实现。
4.3。演算法的结果
在分类数据库使用演算法,该方法提高尤其有趣,因为我们可以选择分类器的数量以达到所需的错误率在样品的例子。此外,我们观察到的错误率降低指数弱分类器(使用数据的数量6和7)。
图6显示了分类误差对SLBP弱分类器的数目,ULBP与演算法和猪,和SLBP + DWT, SLBP +猪,ULBP + DWT数字7。
4.4。分类器比较
LBP-NSVC给最好的结果数据集。我们试图证明这种方法的性能比较与其他分类方法。
分类器用于我们的比较实验如下:朴素贝叶斯,决策树,最近的邻居(神经网络),线性支持向量机(线性支持向量机),和随机森林。我们比较这五种算法的分类结果与我们的提议NSVC SLBP(图8),ULBP(图9),SLBP + DWT(图10),SLBP +猪(图11),ULBP + DWT(图12)。
数据8- - - - - -12显示的百分比不同匹配算法的分类精度。它清楚地表明,分类精度对大多数算法是最好的。
很明显,这种方法的提出LBP-NSVC产生最好的或等于分类精度比其他方法。
除了其高性能,NSVC分类相结合的一种新的理论方法两种方法分类属于两个不同的家庭(无监督方法:模糊c和监督方法:支持向量机)。
5。结论
我们提出了一个原始的人脸检测方法。我们的系统是基于组合的两种类型的信息:枸杞多糖描述符和描述符DWT和猪等。为了管理这些描述符,并将其组合在一起以一种优化的方式,我们建议使用一个NSVC先进的学习系统。它允许选择通过内核最重要信息权重取决于它们之间的相关性。
在不同的真实图像实验结果表明,该方法可以得到很好的结果。
在不久的将来,我们的目标是继续研究LBP-NSVC测试在不同的数据集从其他研究领域,试图找到最好的精度和执行时间之间的妥协。
相互竞争的利益
作者宣称没有利益冲突。
引用
- s . Zafeiriou c·张,z,“在人脸检测在野外的一项调查显示:过去、现在和未来,“计算机视觉和图像理解卷,138 - 24,2015页。视图:出版商的网站|谷歌学术搜索
- a .胺s Ghouzali m . Rziza, d . Aboutajdine”调查的特征降维DCT /支持向量机人脸识别为基础,”学报13 IEEE计算机和通信(ISCC 08年)研讨会上2008年7月,页188 - 203。视图:出版商的网站|谷歌学术搜索
- a·马吉德,汗,和a . m .殿下”使用离散余弦变换性别分类:比较不同的分类器,”第七届IEEE国际多主题研讨会论文集(INMIC ' 03),页59 - 64年伊斯兰堡,巴基斯坦,2003年12月。视图:出版商的网站|谷歌学术搜索
- t . x x Wang汉,s .严”HOG-LBP人类探测器与部分遮挡处理”《IEEE 12计算机视觉国际会议(ICCV ' 09)2009年9月,页32-39,。视图:出版商的网站|谷歌学术搜索
- o . Jemai m·扎伊c·本·阿玛和m . a . Alimi”快速学习算法基于快速小波变换的小波网络,”模式识别与人工智能》国际期刊上,25卷,不。8,1297 - 1319年,2011页。视图:出版商的网站|谷歌学术搜索|MathSciNet
- n .中间人和b区格”的梯度直方图的人体检测,”《IEEE计算机学会学报计算机视觉与模式识别会议(CVPR ' 05),页886 - 893,圣地亚哥,加利福尼亚州,美国,2005年6月。视图:出版商的网站|谷歌学术搜索
- t . Ojala、m . Pietikainen和d·哈伍德”纹理措施的比较研究与分类特征分布的基础上,“模式识别卷,29号1,51-59,1996页。视图:出版商的网站|谷歌学术搜索
- m . Pietikainen a哈迪德、g .赵和t . Ahonen计算机视觉使用本地二进制模式40卷,施普林格,2011年。视图:出版商的网站|MathSciNet
- t . Ahonen a哈迪德,m . Pietikaainen“人脸识别与本地二进制模式,”电脑Vision-ECCV 2004: 8日欧洲计算机视觉,布拉格,捷克共和国,2004年5月11 - 14号,。程序,我卷,3021在计算机科学的课堂讲稿施普林格,页469 - 481年,柏林,德国,2004年。视图:出版商的网站|谷歌学术搜索
- a . Gunay,诉诉Nabiyev自动与枸杞多糖年龄分类,”学报》第23届计算机和信息科学国际研讨会(isci ' 08),页1 - 4,伊斯坦布尔,土耳其,2008年10月。视图:出版商的网站|谷歌学术搜索
- t . Ojala m . Pietikainen, t . Maenpaa”多分辨率灰度和旋转不变的纹理分类与局部二进制模式,”IEEE模式分析与机器智能,24卷,不。7,971 - 987年,2002页。视图:出版商的网站|谷歌学术搜索
- t . Ojala m . Pietikainen, t . Maenpaa“广义局部二进制模式运营商多分辨率灰度和旋转不变的纹理分类,”2001年的进步模式Recognition-ICAPR:第二次国际会议里约热内卢,巴西,2001年3月11日至14日卷,2013在计算机科学的课堂讲稿施普林格,页399 - 408年,柏林,德国,2001年。视图:出版商的网站|谷歌学术搜索
- A .哈迪德、m . Pietikainen和t . Ahonen”检测和识别人脸的歧视特征空间,”《IEEE计算机学会学报计算机视觉与模式识别会议(CVPR ' 04)美国,华盛顿特区,2004年6月。视图:出版商的网站|谷歌学术搜索
- k·r·穆勒米卡,g . Ratsch k .津田和b . Scholkopf”介绍基于学习算法”,IEEE神经网络,12卷,不。2、181 - 201年,2001页。视图:出版商的网站|谷歌学术搜索
- x, a .曹问:歌曲,g . Schaefer y苏,”附近的支持向量分类器使用基于集群监管,”人工智能在医学上,60卷,不。3、189 - 196年,2014页。视图:出版商的网站|谷歌学术搜索
- a .曹问:歌曲,x,郭和c, s . Liu“乳腺由本地的支持向量机质量检测,”《IEEE国际神经网络联合会议,3卷,第1958 - 1953页,布达佩斯,匈牙利,2004年7月。视图:出版商的网站|谷歌学术搜索
- m . Ngadi A .胺h . Hachimi, A . El-Attar”一种新的优化方法对乳腺癌的诊断分类,“国际期刊的成像和机器人技术,16卷,不。4、技能,2016页。视图:谷歌学术搜索
- v . n . Vapnik统计学习理论的本质施普林格,纽约,纽约,美国,第二版,2000年版。视图:出版商的网站|MathSciNet
- o .薛潘,j·韦斯顿,l . Bottou诉Vapnik,“附近的风险最小化,”第14届神经信息处理系统研讨会论文集(捏' 00),麻省理工学院出版社,2000年12月。视图:谷歌学术搜索
- f . Camastra和A·维利”,小说的内核方法聚类”,IEEE模式分析与机器智能,27卷,不。5,801 - 805年,2005页。视图:出版商的网站|谷歌学术搜索
- j . m . Leski“模糊c-varieties / elliptotypes集群在再生核希尔伯特空间中,“模糊集和系统,卷141,不。2、259 - 280年,2004页。视图:出版商的网站|谷歌学术搜索|MathSciNet
- 英国玫瑰,“确定性退火为集群、压缩、分类、回归,和相关优化问题,“IEEE学报》,卷86,不。11日,第2239 - 2210页,1998年。视图:出版商的网站|谷歌学术搜索
版权
版权©2016年穆罕默德Ngadi等。这是一个开放的分布式下文章知识共享归属许可,它允许无限制的使用、分配和复制在任何媒介,提供最初的工作是正确引用。