文摘

面向梯度直方图(猪)是一个健壮的描述符被广泛使用在许多实际的应用程序,包括人体检测、人脸识别、对象计数,和视频监控。为了提取猪描述符的彩色图像比灰度图像信息是三倍,研究人员目前应用的最大大小选择方法。这种方法使结果图像的信息减少选择的最大震级。然而,在我们提取猪使用未经选择的最大震级的大小选择方法,我们观察到的性能比使用在很多情况下的最大大小。因此,在本文中,我们提出一个新颖的方法等从彩色图像中提取猪组件选择和颜色组件融合。我们还提出了扩展内核为了提高猪的性能。与我们的颜色成分分析的新方法,实验结果的几个面部基准数据集与增量提高3 - 10%的准确性。具体地说,脸上精度达到95.92% AR数据库和75%格鲁吉亚面临数据库。结果与原来的相比是更好的10倍以上猪的方法。

1。介绍

如今,图像分类是计算机视觉中最广泛的领域之一,吸引了许多研究者的关注,因为它在现实生活中广泛的应用,如人体检测、人脸识别、对象分类,在医学诊断疾病。提出了许多当地和全球的图像描述符来处理这个任务(1- - - - - -3]。关键步骤是找到一个健壮的描述符可以歧视类。提出了大量的描述符从图像中提取特征,包括颜色局部二值模式(LBP) (4],尺度不变特征变换(SIFT) [5),面向的柱状图的梯度(猪)6),和要点7]。其中,猪是一个成功的与各种应用程序描述符在现实生活中,包括行人检测、人脸识别、对象分类、安全、和工业检查。例如,丁等。8)保险丝猪特性和全球人类的归一化直方图检测任务的演算法分类器。Qi et al。9]猪申请铁路轨道检测采用区域增长的方法。Qingbo et al。10把猪的特征和区别的Multimanifold分析方法(DMAM)人脸识别的一些学习上下文。在这种方法中,从图像补丁融合面部特征提取,然后应用DMAM变换到低维空间。Chowdhury et al。11]介绍了一种改进的版本的猪对人类检测。Nabila et al。12]目前占用道路汽车检测的优化版本。这种方法是基于形状特征的连接和集成。Aytac et al。13]从胃癌图像提取枸杞多糖和猪的特性。然后,多个还原技术应用于选择最有用的属性。Hmood et al。14]介绍猪的一个改良版本提出了一个近似的窗户,可以覆盖整个对象,即Dynamic-HOG。这种方法需要较少的处理时间和硬币分类达到更高的精度。Jebril et al。15]猪申请手写字符识别从灰度图像从RGB颜色空间转换。作者用R-HOG和C-HOG不同窗口。Uddin等人创建另一个名为T20-HOG的猪版本能够从种子中提取纹理特征进行识别(16]。提出了一种两级分类过程由Chandrakala和井斜与猪相结合描述符(17]。深层神经网络的鲁棒性和猪的优势,挂了猪的杂交组合和CNN HOG-CNN命名方法有前景的结果(18]。

猪的各种进步版本提出了近年来通过合并与卷积神经网络(cnn)。Zaffar et al。19]目前CoHOG基于CNN为了从ROI提取特征的视觉识别。熊等。20.]介绍一个方法来处理基于猪深度信息的图像,即面向深度(HOD)特性的柱状图。该方法适用于行人检测结合彩色图像边缘信息和煤斗。王等人。21)提供了一个方法基于猪和multiorientation计算,即MO-HOG。这种方法结合了两部分的梯度信息来构建MO-HOG和申请面部表情识别。锅(22)结合了猪和CNN的面部表情分类。在这种方法中,猪特性从CNN的浅特性。Joshi et al。23]目前生猪描述符的方法选择最优参数。基于手语图像的多级猪申请几个窗口的大小 王等人。24)连接方法以及泽尼克时刻的地形特征的SAR图像匹配。

此外,猪表现优于其他描述符的分类为灰度图像。然而,当我们从彩色图像中提取猪,性能通常会严重降低。原因是彩色图像包含的信息比灰度图像的三倍。此外,大多数描述符是第一设计执行灰度图像。因此,颜色已经被调查近年来中提取猪的特性。例如,黄平君et al。25)提取局部图像描述符,包括枸杞多糖、猪,依据水稻种子图像识别中的应用。在这种方法中,特征提取独立颜色组件然后融合形成最终的特征向量。阿斯兰等。26)比较HOG-SVM和CNN在闭塞上下文中基于视频的人体跟踪。周et al。27]介绍的方法提取猪特性基于滤色器阵列。然后每个拜耳模式应用于彩色图像转换成三个组件,将采样操作。添加了一个新的扩展本猪,在HSI颜色空间提取消除阴影区。一和黄平君28)提高人脸识别的准确性三个流行特征的融合(枸杞多糖、猪和依据)。Duong和黄平君29日)申请提取水稻种子图像基于特征编码多个颜色空间使用猪描述符。纳杰et al。30.)提高猪对图像描述符的Haar小波变换提高猪对图像分类描述符。最近,z周和y周(31日)处理颜色空间信息提取功能,即CCS-HOG。他们应用组件颜色空间之间的相似性,结合中提取面部特征的猪。这种方法已被证明在亲属关系验证其有效性。范和黄平君提取猪特性的编码面部图像在不同的颜色空间32,33]。最后的功能是通过连接所有功能提取每种颜色组件。Fekri-Ershad Tajeripour分析彩色纹理图像的颜色信息,分类使用混合颜色枸杞多糖(34]。彩色纹理分析也可以使用加权颜色顺序枸杞多糖的分类(35]。

尽管目前研究人员应用最大大小选择方法以选择性地降低彩色图像的信息,这样就可以满足猪的后阶段的需求提取过程,并非完全优化的性能。颜色分量提取特征的影响是第一次提到[36为枸杞多糖描述符。这个问题是广泛调查将颜色信息近年来通过各种方法。它可以通过融合特性提取每种颜色组件独立或联合(4]。具体来说,更好的表演当我们使用未经选择的情况下实现的最大大小选择方法。新方法从彩色图像中提取猪的颜色分量选择和颜色分量融合。此外,我们还升级内核的梯度计算阶段通过扩展它在水平和垂直的维度。目的是找出周围像素之间的关系和计算像素周围的像素是否对输出性能造成任何影响。

本文的其余部分组织如下。部分2.1和部分3介绍猪描述符与颜色组件选择,颜色分量融合和扩展内核。然后,给出了实验结果4。最后,讨论的结论和未来的工作部分5

2。猪和组件选择和颜色描述符组件融合

本节简要介绍了猪的两种提议的方法计算和组件选择(CCS)和颜色分量融合(CCF)猪描述符。

2.1。猪描述符

提取猪特性之前,一个图像 分为三个子图象 , , 这三个颜色的组件吗 接下来,几个图像处理算法应用于这些图像以减少噪声增强性能。预处理步骤后,在每一个图像,每个像素的梯度大小和方向计算通过使用水平和垂直梯度。的梯度计算像素位于坐标 是定义如下6]: 在哪里 是计算像素的灰度值, 代表水平和垂直梯度, 顺序定义梯度大小和梯度方向。

2.2。提出的方法

每张图片然后导致一对矩阵包含一个梯度大小矩阵和一个梯度方向矩阵。所以总共有三种实现对矩阵的 , , 如下步骤只需要一对矩阵,当前的任务是找出哪些应该选择一双矩阵以产生一个最优特征向量。最流行的解决方案是最大的大小选择。这种方法比较三个梯度在每个像素大小。然后,最大的选择最终的像素级。最后的方向也从相同颜色分量中提取选定的大小。最大大小选择的详细方法见图1

选择步骤后,两个最终矩阵得到满足的要求装箱方向的一步。在这一步中,原始图像分为细胞( 每个细胞)和9-bin直方图是建立在每个单元基于内部像素的梯度特性。垃圾箱是无符号梯度范围从0到180度( )和从0到360度的情况下签署了梯度( )。每个像素的梯度大小添加到相应的索引号本的直方图。的索引号 然后计算方程(5)或(6天花板)和使用价值。

在哪里 代表默认的方向直方图的垃圾箱和通常是默认设置为9。 由方程(上面计算4)。

规范化的阶段,然后分为原始图像块(每个块包含 细胞等于 像素)。一个有效的标准化可以降低噪音和取消不良影响。在每一块,50%的周围块重叠所以每个单元可以规范化不止一次除细胞定位在角落里。每一块的直方图连接,然后使用L1-norm规范化,L2-norm或L1-sqrt。最后,所有归一化直方图结合在一起作为一个特征向量。

在实践中,我们观察到的最大大小选择方法不够优化,因为它可能会导致信息丢失。当我们使用的未经选择的值的最大大小选择猪提取、实现结果高于使用几个实验中的最大大小。因此,我们应用组件选择和颜色组件融合方法来提高性能。颜色组件的选择方法,而不是考虑应该选择哪个大小或方向为下一个阶段,我们选择最后对基于颜色分量矩阵。有三个矩阵的九个不同的双矩阵实现。方向顺序装箱阶段适用这些成对进行。最后,九个特征向量对应于九选对了。这些向量然后评估找出最佳的性能。颜色的过程组件选择方法呈现在图2。颜色分量融合需要完全实现向量并将他们连接到一个融合向量。

3所示。对猪提取扩展内核

为了加速梯度计算的过程,研究人员使用内核见图3。通过与这些内核过滤图像,水平梯度 和垂直梯度 计算速度比计算基于方程(1)和(2)。我们定义这些原始的内核是内核 我们按顺序通过水平和垂直维度扩展内核,参数 也增加了。图3具体描述了内核参数 范围从1到4。然后,实现水平和垂直梯度是除以参数

4所示。实验

4.1。数据集描述

拟议的方法评估四种常见面部数据库,包括基于“增大化现实”技术,格鲁吉亚,图表,和MUCT(见图4)。为了实验提出的方法,这些数据库是分成50%的训练,50%的测试。然而,数据库,如格鲁吉亚,图表,和MUCT奇数图像每个类。例如,MUCT数据集包括3图片在每一个类,所以我们决定将一个图像随机培训和其他两个测试为了使培训更具挑战性。1-NN分类器是用来评估的分类性能,和准确性指标是用来衡量测试集上的性能。提出了这些数据库表的总结1

4.2。实验装置

作为我们提出的方法是为了适应每一个三分量的彩色图像,实验我们还在几个著名的颜色空间,包括HSV,多分,I1I2I3, YCbCr。这些空间通常应用于模式识别(4]。根据节2,每一个图像在应用颜色组件选择的结果在10个不同的特征向量,包括9不同向量和一个融合向量提取的颜色组件融合方法。这些结果被部署到1-NN评估分类器。此外,我们设置内核 从1到5,分别比较。实验由Matlab实现2017 b和在电脑上配置一个CPU I3 8100 3.60 GHz和8 gb的内存。

4.3。结果

并给出了实验结果的图表数据5- - - - - -8。通过在许多颜色空间之间的转换和增加参数 ,最大大小选择方法的性能升级。此外,颜色分量选择和颜色分量融合也超过最大大小选择方法根据图表。对于基于“增大化现实”技术的数据库,实现最高精度是95.92%比0.54%最高精度可以通过使用的最大大小选择方法,这结果是通过颜色组件融合 内核,使用颜色空间是伊什。格鲁吉亚数据库,当我们应用颜色组件融合方法结合 内核和YCbCr颜色空间,取得的结果是75.00%。这是所有实验在乔治亚州的最高精度的数据库。更好的性能也获得实验MUCT数据库甚至在实验的CLV数据库是最具挑战性的图像集合。通常,我们观察到最好的结果大多是通过融合方法与其他方法相比,它可以告诉我们提出的承诺表现方法。

最好的几个病例报告在表2- - - - - -5。在这些表中,马克斯级缩写代表最大大小选择方法,融合缩写代表颜色组件融合方法。我们发现最好的基于“增大化现实”技术的准确性得到数据集使用融合方法的95.92%。同样,这种方法达到75.00%,49.77%,93.47%,格鲁吉亚,CLV, MUCT数据集,分别。注意,每个颜色空间的性能是不同的根据特征提取方法。此外,参数的增量 在扩展内核也提高了几个实验结果。在大多数情况下,应用时的准确性 = 5内核比别人高。然而,还有一些情况下,精度达到最高 = 1,所以我们还不能判断参数越高 的内核,我们可以达到的精度高。但我们认为,这些结果是有利的有效性的基础内核大小猪的性能,这让我们学习更深层次的在未来。

5。结论

在本文中,我们提出新方法来提取猪描述符等彩色图像颜色分量选择方法和颜色分量融合为了提高分类的性能。在我们的观察中,我们认识到,该方法比目前的最大大小选择方法在面对分类任务中,特别是颜色组件融合方法。颜色空间转换和扩展内核也有效地提高分类的准确性。然而,在一些情况下,扩展内核仍然导致精度降低。颜色组件选择方法需要很长时间才能完成从每个可用的情况下,提取和颜色组件融合可能会导致计算机内存问题由于其深刻的维度。因此,我们的未来的工作是找出最优双矩阵没有尝试所有情况下提高推理速度。特征选择方法还建议减少向量维数。几个CNN-related作品被认为结合提出了进一步改善的方法。

数据可用性

在生成的数据集和/或分析在当前研究可从相应的作者以合理的要求。

的利益冲突

我们没有利益冲突声明。