文摘

随着多媒体技术的发展和不断增长的这些天,使用大量的图片和它的数据集是同样的扩张速度很快。这样的数据集可以用于图像检索的目的。本研究着重于提取相似图像建立在其不同特征的图像检索的目的从巨大的数据集的图像。本文最初,查询图像搜索可用的数据集内,然后,色差直方图(CDH)描述符用来从数据库检索的图像。鼎晖的基本特征是它计数卡在两个不同的标签的颜色区别l 一个 b 颜色空间。该方法在随机试验图像用于各种医疗目的。各种不同特性的图像是通过提取不同距离的方法。精确率、召回率F测量都是用来评估系统的性能。方面的比较分析F测量也都是来检查的最佳距离方法用于检索图像。

1。介绍

在这个现代的社会,创新恢复图像广泛应用于各种领域,它代表了一种可行的解决方案用于检索比较形象的一系列图像。与网络的发展,无数领域的图像现在可用药物治疗,训练、科学、商业、和不同的领域。根据可视化的特点,图像分类。计算机系统搜索图像从一个巨大的数据库被称为一个图像检索系统。搜索任何形象,提供的查询用户的任何短语或一个文件/链接,和另一个标签;接口将提供图片与查询图像(1]。标记、图像颜色分布、区域形状特性,可以使用其他相似性搜索标准。

成像设备的可用性,例如数码相机和扫描仪越来越多,和各种各样的数码摄影的大小也增加。这些设备是支持不同领域的药物,教学和学习,科学和贸易和商业2]。在医学领域和人类医疗保健、不同的图像可以搜索到促进与改善的目的的从业者的工作在指定的工作精度。通过这种方式,图像检索已经演变成一个动态的研究课题在今天的时间。大部分CBIR集中在降低图像的选项。虽然承认不同的视觉感官活动涉及两种颜色在颜色空间距离计算,相关的特定的特征图像被迫更研究[3,4]。色差直方图(CDH)是一个讨论的CBIR描述符。

特征提取在图像检索系统已成为一个重要的特性。Shaila和Vadivel5)提出,根据人类颜色视觉,直方图是为了检索基于图像的内容。为每个像素灰度图像及其颜色估计使用重要的权函数。周和黄(6]阐述了比较各种初始Hu不变矩的变化,这说明并检索二维(2 d)对象与一个循环轮廓区分病理学从传统的大脑。特征提取、汉堡和伯吉斯(7]应用波动熵(RE)和胡锦涛矩不变量(HMI),完成了扫描通过磁共振成像(MRI)。冈萨雷斯和森林8]代表图像提取使用边缘检测技术;该算法中使用的各种技术是信号处理和图像压缩。Bhute和Meshram9)进行的实验进行大范围的图像描述符。颜色直方图表现与其他不同的描述符。Deselaers et al。10)提出了一个占主导地位的颜色描述符(论证提高图像检索的正确性。最小值和程11)描述符描述完全基于颜色代表一个图像的内容后,结合全球和地方特色。Fierro-Radilla et al。12)假设语义特征来自一本小说主要色调。塔利班et al。13)提出了空间主导颜色描述符(SDCD)作为自上而下的描述符。Rejeb et al。14]介绍了鼎晖的方法计算在不同的背景下,两个点之间的感知一致的色差Lab颜色空间。刘、杨(15)提出了创新的方法来完成检索过程采用颜色、纹理和形状。使用的“大礼帽变换”Tajeripour et al。16)识别和作物图像组件基于颜色和形状的信息。Yu et al。17]介绍了一种方法来提高诊断的准确性,并帮助英国为了识别各种类型的病变。分类任务现在包括一个图像检索元素提供一个补充保证预测各类食管病变。Talouki et al。18)提出了一个应用的想法neutrosophic空间图像检索的应用有助于提高平均查全率和查准率比传统方法。

从上面的文献,得出的结论是,不同的方法被用于图像检索系统和我们的意识没有人提供了比较不同距离图像的检索。本文尝试比较不同距离回到图片和我们工作的主要贡献在这篇文章如下:(1)实现色差直方图作为图像检索过程的描述符(2)autocorrelogram HSV直方图、颜色的时刻,和小波时刻颜色特征检索的数据集和查询图像的图像(3)评估的不同颜色,距离连接查询和输出和各种距离的方法,像欧几里得距离曼哈顿距离,和汉明距离(4)不同的性能指标如精度、召回率和F测量不同的距离计算方法(5)比较分析对不同的特点使用不同的性能指标已检查系统的有效性

剩下的文档分为四个部分。第二部分简要的描述材料和流程使用。节3结果进行了讨论。部分4描述了高潮的建议的任务。

2。材料和方法

以下部门包含一个完整的描述方法,提出了检索的图像和数据集用于评估模型。

2.1。数据集

有很多数据库,基于内容的检索进行了。表1提供不同的数据集的描述,结合图片,各种类型和图像的大小。本文在随机图像上执行仿真用于许多医疗用途(19,20.]。

2.2。提出的方法

拟议的方法基本上是集中在基于色差直方图的图像检索方法的流程图如图表示1。从巨大的收集、查询图像上传图片后从数据库中加载。之后,鼎晖实现对图像进行特征提取的应用程序在记录和上传图片。欧几里得、曼哈顿和汉明距离用于计算最近的距离与查询图像相似的图像数据集。适当的图像发现按距离排序并与阈值。最后,不同的性能指标如精密,回忆,F通过检索图像测量计算方法使用特殊的距离。该算法的每个阶段的细节在后续部分中解释。

2.2.1。从数据库加载的图片

随机图像用于收集各种医疗保健的目的。每个图像的大小是128∗192像素(21,24]。这个数据库非常异构本质上包括图像不同的身体部位。最初的实验目的,100图片加载的数据集,包括四个不同类别的图像像眼睛,鼻子,手,耳朵。每个类别包括一组25图片,每个图片的大小计算模拟的时候是187∗126。

2.2.2。调整图像大小

在数字图像处理中,图像调整已经成为一个重要方面和在各领域的应用。所有图片的调整从数据库加载完成,每个图像调整到一个新的384∗256的规模。因此,图像预处理以固定比例如表所示2眼睛和缩放图像是由图表示2(一个)

2.2.3。提取特征的数据集使用鼎晖的图像

鼎晖描述符(22)评估相同的颜色两个点之间的差异在不同的领域方向的边缘和颜色l 一个 b (CIELAB)。这是首选的,因为观察到的链接的颜色视觉差异l 一个 b 颜色是距离测量,而组件相关联的RGB极其连接。因此,彩色细节不直接相关的应用程序。鼎晖也考虑区域的组成没有图像碎片,学习过程,或聚类实现14]。鼎晖的算法实现流程图如图所描述的3并简要解释下面。

(1)图像转换。在实验室的颜色空间中,光被认为是黑色(0)白色(100)l ,从绿色(−)红色(+)一个 ,从蓝(−)黄(+)b RGB图像转换成l 一个 b 颜色空间图像如图2 (b)

l ,一个 ,b 可以评估(1)- (3)分别7,8,14]。

f(u)可以计算为代表 在哪里 ”,xn,ynzn的值是xy和z光源”为代表的(5)(参考白点) = (7,15]。

(2)使用Sobel边缘检测算子。大多数彩色细节将丢失如果计算梯度的大小和形式使用灰度图像。因此,边缘形状识别l 一个 b 使用彩色空间。索贝尔算子适用于检测的目的,因为它是一个减少噪音和计算负荷较低。图像的梯度强度函数的近似计算使用这个操作符。检测到的边缘图像使用梯度法和最大和最小级一阶导数的计算方法。应用灰度或二进制图像在输入返回梯度大小 和梯度方向 是相同的大小等的输入图像和边缘检测图像是由图吗2 (c)。各种边缘检测的步骤如下:1一步:应用图像2nd一步:马克 , 隐含的输入图像3理查德·道金斯一步:梯度以及Sobel算子4th一步:管理 , 离散的输入图像5th步骤:将输出寻找固定的梯度大小 第六步:震级计算被称为边缘作为输出

(3)量化的L 一个 b 颜色空间。颜色量化执行操作,数字转换L 10箱和一个频道 和b 通道3箱。一个颜色的组合获得10 3∗∗3 = 90 (15]。的帮助下量化过程中,颜色的数量减少。

2.2.4。提取的特征图像

一个图像的基本特征是由不同的特征出现在它。在图像处理,特征提取是非常重要的。这些特性分为三类:低,中间,和高水平。颜色和质地是低级特征,而形状是一个中层的特性和语义鸿沟是一个高级功能。的各种特性,如HSV直方图,汽车相关图、颜色的时刻,和小波中提取的时刻提出适用于所有的图像数据集。每个特性的描述中提到的部分。每个特征提取的大小由表所示3

(1)HSV直方图。颜色是一个关键的特征来描述图像的内容。HSV直方图是一种颜色表示方法,代表了特定颜色的比例在一个图像。它提供了HSV颜色空间和RGB颜色空间显示有多少像素的每一种颜色在图像。然后数据库存储为每个图像HSV直方图。据估计显示像素的比例之间的每一种颜色在图像。然后用HSV数据库是存储为每个图像直方图。在搜索过程中,用户可以指定所需的颜色比例或提交参考图像的直方图计算。然后匹配的方法找到图像的颜色直方图最密切匹配查询的形象。大小的HSV直方图计算1∗32。

(2)汽车相关图。颜色信息有一个汽车相关图功能。颜色相关图有几个优点,包括能力说明相关的全球流通的颜色,可以方便地计算。汽车相关图的大小计算64∗。

(3)颜色的时刻。识别图片,颜色时刻使用基于颜色特征。图像之间的相似性可以测量使用这些时刻。对于图像检索,这些相似性值可以比较图像索引数据库值。只有图片中的每一个像素的颜色信息是包含在颜色直方图、颜色的时刻,和颜色。颜色时刻是指标,可以用来区分图像基于颜色特征。它提供了一个测量图像之间的颜色相似,一旦他们被计算。的大小颜色时刻计算1∗6。

(4)小波的时刻。小波图像转化为一个多尺度表示时刻的空间和频率特性。这使得以较低的成本有效的多尺度图像分析计算。小波变换是一种常用方法在计算机视觉和图像处理。许多应用程序已经检查,包括压缩、检测、识别、和图片检索。小波变换用于表示两个形状和纹理。小波的大小计算时刻1∗40。

2.2.5。上传图像查询

所有数据集的图像提取特征后,下一步是上传查询图像从巨大的数据集。用于模拟目的的图像会各种类的眼睛,鼻子,手,耳朵如表所示2。模拟执行在所有的四类图像。

2.2.6款。使用鼎晖查询图像提取特征

图像检索是通过匹配查询和检索图像的各种特征。颜色直方图对图像进行了分析。两个图像的匹配和执行查询的特征向量之间的距离和数据库图像评估和用作相似维数。

2.3。计算所有数据集和查询图像的图像之间的距离

在图像检索系统中,距离的测量是非常重要的。是非常重要的识别图像是如何相互关联的数据集的查询图像和它们是如何相似。不同的下面提到距离用于现在的工作简要解释如下。

(1)欧氏距离。欧氏距离定义为最相关的方法找到两个点之间的距离。假设我们有(u, )的两个点u= (一个1,b1), = (一个2,b2),然后计算这些点之间的欧几里得距离所描述的

但是如果点n维数而不是两个,然后可以广义欧几里得距离

(2)汉明距离。汉明距离可以被认为是可能性的范围,需要修改(损坏)为了显示一个字符串在另一个。它与两个相等字符串的区别如图所示

(3)曼哈顿距离。曼哈顿距离也称为L1距离计算两点之间的绝对差异。如果u= (一个1,b1), = (一个2,b2曼哈顿)是两个点,然后计算这些点之间的距离

但是如果点n维而不是两个,那么曼哈顿距离可以通用

2.4。使用阈值排序的距离和检索图像

不同距离的计算后,图像检索操作执行使用一种基于阈值的方法。这种技术用于检索最相关的图像类似于从数据库查询图像。为了达到这个目标,查询图像检索和图像之间的距离计算按升序排序,然后只距离小于阈值的图像。阈值用于这项工作是由和试验方法。阈值选择的价值计算仿真的目的和以40%的最大距离。

2.5。评价性能指标

有各种各样的方法来评估图像检索系统的性能。描述的精度

召回是指数量的相关图像中提取图像的数据集的总数计算使用

F测量精度和召回的谐波均值定义为

3所示。结果与讨论

提出的实现技术是在MATLAB中执行。上传后的查询图像,类似的图像检索,包括所有的真阳性和假阳性的图片。结果的基础上评估不同距离的方法。计算精度和召回率在40%的阈值对不同特征提取。使用不同的距离值的精度和召回方法申请提取各种特征的眼睛,鼻子,手和耳朵形象如表所示4- - - - - -7分别。

价值评估的基础上,每个距离的方法以图形化的方式表示如图4。数据4(一)- - - - - -4 (d)代表方面的性能F欧氏距离度量,汉明距离,分别和曼哈顿距离。已经观察到如果HSV autocorrelogram特性提取眼睛的图像,F测量计算0.87 40%使用欧氏距离阈值。它也被观察到其他图像的鼻子,手和耳朵,如果所有的四个功能应用单独或结合不同概率,欧几里得距离给出了更精确的性能参数F测量。

比较分析不同距离的值上执行F测量使用性能图表,表示图4。计算这个参数之后,它表明,欧几里得距离提供了最好的结果比其他所有距离方法因为更好的精度和召回率都是欧几里得距离比其他所有距离的方法。

4所示。结论

摘要色差直方图描述符应用于查询图像检索相关的相似图像集合的图像。各种类型的特征提取和不同距离的方法用于检索图像。系统的性能使用精确率表示,召回率,和F -衡量。在目前的工作中,模拟使用鼎晖在小数据集上执行。在未来,大型数据集在图像与不同的疾病和其他身体的不同部位可以用于图像检索。系统的精度也可以改善通过使用各种类型的基于纹理和形状描述符应用单独或组合

数据可用性

数据可以从作者。

的利益冲突

作者宣称没有利益冲突。

确认

这项研究是由塔伊夫大学的研究人员支持项目数量(TURSP-2020/125),塔伊夫大学,塔伊夫,沙特阿拉伯。