文摘

消费者行为已经观察到在很大程度上受到图像数据越来越熟悉的智能手机和万维网。传统技术在互联网浏览产品的品种与文本关键词已逐渐取代了简单的图像数据访问。图像数据的重要性,描述应用取向的稳定增长业务领域不同的图像捕获设备的出现和社会媒体。本文描述了特征提取的图像二值化技术的方法提高识别和检索信息的使用基于内容的图像识别。该算法进行了测试在两个公共数据集,即王数据集和奥利瓦和Torralba (OT-Scene)数据集3688张照片。它以最先进的技术性能测量和显示统计学意义。

1。介绍

图像数据具有较强的影响消费者的注意,向消费者的购买意向1,2]。出现全球化的迅速影响了客户的偏好和需求(3]。消费者满意导致强劲和积极的行为后果与可持续购买(4]。数字业务流程的收入受到不利影响主要不满的消费者由于大量不相关的结果生成从基于文本的查询5]。的客户被剥夺了快乐易腐搜索环境中。这导致了图像数据的流行主要是恢复基于文本关键字搜索。多媒体技术的发展促使商业实践和多媒体的使用改变了我们使用电脑的方式6,7]。图像数据显示越来越重要领域的现代商业环境。作者提出了一种新颖的方法检索与查询图像数据分类的刺激信息识别的性能相比,最先进的技术。统计已经采取措施来验证用户响应的丰硕提出技术和建立这一发现的重要性。

可访问性不同的在线和离线信息产品和服务已经从根本上改变了顾客的偏好(8]。传统方法来定位产品感兴趣的客户是基于文本的查询。然而,方法有大量不相关的结果作为输出。不适当的输出的驱动因素之一,是由于谴责选择关键字的查询。最近的搜索方法强调搜索对象的内容,而不是它的名字作为一个关键字(9- - - - - -12]。基于内容的搜索过程促进了产品形象提供必要的知识所需的产品根据其图像内容和预期的概率较高的过滤掉不想要的结果。各种方法已经进行了特征提取,应用图像二值化的工具表示感兴趣的对象和它的背景,分别为(13- - - - - -15]。阈值的选择是至关重要的,使二值化图像区分对象和它的背景。已经表示,在图像光照不均和不一致的灰色级别及其背景不利影响阈值选择二值化(16- - - - - -18]。阈值的选择可以分为三个不同的类别,即意味着阈值选择,当地阈值选择,和全局阈值的选择。特征提取与均值阈值二值化讨论(19,20.)和位平面切片(21]。在图像光照不均的问题有效的解决当地阈值技术(9,22- - - - - -26]。分散的文献使用措施标准差和方差计算阈值。El Alami 201127),曾与基于颜色和纹理特征的三维颜色直方图和伽柏过滤器。Hiremath Pujari, 200728),计算局部描述符的颜色和质地颜色时刻和伽柏滤波器响应的时刻将图像划分为不重叠的街区。图像显著点的特征是选择Banerjee et al ., 200929日),图像的检索过程。Jalab 2011 (30.),融合的颜色布局描述符和伽柏质地更好的检测图像。沈和吴,201331日),从图像中提取签名处理颜色,质地,和空间结构描述符。Irtaza et al ., 201432),研究了小波包和伽柏过滤器生成特征向量的特征值的图像。拉希米和穆贾达姆,201533),指的是组内和组内的功能利益的有效提取图像的特征。作者提出了一种新颖的基于内容的技术在基于互联网的商业模式和产品识别相同的对象识别与现有技术相比在文献中讨论。提出技术的性能以现有的方法和显示显著改善培养一代相关的结果对于一个给定的产品基于内容的查询。

3所示。我们的方法

拟议的方法被认为是不同的图像类别所指的公司提供的产品品种多样化的本质。光照不均匀的图像退化产品识别过程可以是一个因素。它已经被解决通过作者选择局部阈值二值化。首先,进行了二值化使用Niblack的局部阈值选择方法(9,18]。每个颜色组件派生的一个图像被认为是pixel-wise阈值通过滑动一个矩形窗口组件。当地的的意思是 标准偏差 计算主要的窗口大小( )。是阈值计算 。的价值 是一个常数在0和1之间,被认为是0.6。二值化的质量依赖于滑动窗口的大小和价值的

4所示。特征向量生成

像素是本地分为两个不同的强度值,即较高的强度值和较低的强度值与相应的阈值进行比较。高强度的平均值和标准偏差值像素和低强度值像素被认为是获得高强度特征向量和低强度特征向量,分别。特征提取的过程中一直以图形方式见图1。最初,原始图像显示模式的手机被认为是特征提取,如图1(a)。图像分为红(R),绿色(G),蓝色(B)组件在数据开始1(b) -1(d)。这个过程是紧随其后的是二值化的每个组件的颜色如图Niblack阈值选择方法1(e) -1(g),个别颜色的图像的关键组件有不同色调的黑白清晰可见。两个特征向量的每个颜色组件是高和低强度值计算的关键图像和存储的图像识别,如图1(h)。

该算法在算法1

算法1。
开始(1)输入一个图片我用三种不同颜色分量R, G, B,分别的尺寸 每一个。(2)计算局部阈值 每个像素的颜色组件的R, G, B使用Niblack的方法: 在哪里 / = R, G, B (3)为每个像素计算二进制图像映射为给定的图片: / = R, G, B (4)为每种颜色生成图像特征为给定的图像组件: / = R, G, B

5。复杂性分析

该技术具有分开的图片分成三个颜色分量,即红、绿、蓝。如果总数为每个组件被认为是灰色的水平 然后线性时间 被消费的选择阈值的灰度值在每个组件。因此,三个颜色分量的迭代次数 。因此,推断,特征选择过程的时间复杂度是线性的。传统的特征提取技术具有相同的特征维度的图像的特征提取。因此,一个图像的大小 特征尺寸是 。该方法大大降低了图像的特征尺寸12无论维度。因此,空间复杂度是有效地解决小特征尺寸。

6。检索的体系结构

检索的过程是通过分类查询如图2。传统的检索过程由搜索整个数据集与一个通用的用户查询。相反,检索与分类查询最初将查询图像分为最近的类别的图像。图像的分类检索过程之后,只从感兴趣的类。剩下的图像类别修剪下来的分类查询,因为他们不属于本地查询的类。因此,过程相比,明显提高了识别性能最先进的技术。然而,一个错误的查询分类造成荒凉的特征提取过程会导致零图像检索相关的类会从错误分类类别检索所有图像。通用的查询场景是不同的,在大多数情况下最小数量的图像检索可以预期从感兴趣的类。更高程度的误分类检索查询会对检索性能的不利影响可能被视为一种劣势的技术对现有的方法。不过,它可以避免通过设计有效的鲁棒特征提取技术。

7所示。实验验证

两个不同的数据集,即王数据集(1000类别,图像)和奥利瓦和Torralba (OT-Scene)数据集(2688类别,图像)被认为是评价的目的。数据34有插图的样本数据集用于实验的过程。验证过程进行了10倍交叉验证,9被认为是作为训练集和子集1被认为是为测试组子集。10试验进行了分类器的性能评估。最后的决定是由结合评估后10结果从而获得10倍交叉验证。评估过程进行了使用三种不同的分类器,也就是说, 最近邻( 神经网络,支持向量机(SVM)和人工神经网络(ANN) [36]。 神经网络被认为是基于实例的分类器是基于相似度函数的两个不同的实例。SVM是学习过程的自组织映射(SOM)认为,只有附近的节点相互影响的行为。最后,安是基于一个前馈结构称为多层感知器(MLP)。进行了检索过程使用街区距离作为衡量匹配查询图像与数据库图像。城市街区距离的方程给出 在哪里 是距离, 查询图像, 是数据库的形象。

两个不同的指标被认为是对评估的目的,即精度和召回。精确的概率定义为一个对象被正确分类的实际价值和回忆的概率被认为是分类器产生真正的积极成果。

1给了两个不同的数据集的精度和召回率,即王数据集和OT-Scene数据集下三种不同的分类器环境。王是观察到的数据集的最高精度是0.838和0.837的最高召回是使用ANN分类器。精度最高利率OT-Scene数据集被指出0.753召回率为0.754。

分类的精度和召回率,提出了特征提取技术进一步与最先进的技术,如图5

这显然是观察到的分类与特征提取技术提出优于现有技术。

假设1。分类与特征提取的方法,以现有的技术。

2显示的意义吗 值获得精度比较,因此零假设等精密的算法和现有算法被拒绝了。因此推断,该方法已经能够从根本上提高分类性能。此外,提出了特征提取技术对检索性能进行了测试。性能评估通过比较检索与分类查询和检索通用查询。表3显示类别明智的比较精确的检索的检索技术。比较表3显示,查询检索与分类提高了识别王为每个类别的图像数据集。因此检索的总体性能已大大增加。检索与分类查询的平均精度也比传统的检索技术与通用查询。

假设2。检索与分类查询不能给更高的精度结果相比,与通用的查询检索。

值在表4具有显示意义,因此假设2被拒绝了。从今以后,精度的结果提出的特征提取与分类查询检索技术比较先进的技术的检索表5

假设3。检索与分类查询提出的特征提取技术具有较高的精度比现有技术为产品识别多元化的产品类别。

显然这是显示在表5,该方法有更高的性能比现有技术和超然的类别明智的精度结果为每个现有的技术。检索的统计学意义,提出技术建立了一个配对 以及和结果表6。测试进行了验证精度结果的差异并不是来自人口与零均值。

6已经显示出显著的 值的检索精度的比较提出了特征提取技术对现有的技术。因此假设3被接受的霸权提出了建立了基于内容的图像检索方法。

假设4。基于图像数据查询和文本数据的查询在数码市场上有类似的对消费者满意度的影响。

分析表7显示重要的协会之间的消费者满意度和基于图像数据的查询(似然比= 79.270;φ= 0.734;克莱姆 ;和 )相关产品在多样化的产品类别识别相比,基于文本数据的查询(似然比= 18.577;φ= 0.296;克莱姆 ;和 )。发现基于图像数据的查询是有更大的与消费者满意度相关产品识别与基于文本数据的查询。从今以后,消费者满意度和产品之间的关系查询基于图像数据分析表8

从上面的结果见表8之间的显著相关性,观察消费者满意度和基于图像数据的查询相关产品在多样化的产品类别识别。另一方面是在于消费者满意度之间发现显著的负相关和基于文本的查询数据相关产品在多样化的产品类别。

8。结论

数码市场的模型丰富了公司竞争战略来获得来自竞争对手的技术回报。作者调查了应用程序创新取向信息识别的图像数据。研究解决相关的挑战的结果代客户查询和有效地提出了一个基于内容的搜索方法,相关输出的一代。基于查询的新技术产品标识与图像数据创新构想了一个新的方向和价值在组织发展中使用信息技术。技术赶不上所有最先进的技术,增加了客户满意度在产品来自多个产品类别的识别。它有效地修剪不当为客户查询结果用图像查询公式取代基于文本的搜索过程。工作可以扩展到非结构化数据分析和电子商务和其他分析现代商业活动与消费者收入的过程。

利益冲突

作者宣称没有利益冲突有关的出版。