应用数学学报

在这一页上

文摘介绍结论和讨论确认引用版权相关文章

特殊的问题

图像和信号处理的数学方法的进步

把这个特殊的问题

研究文章|开放获取

体积2013年| 文章的ID785824年| https://doi.org/10.1155/2013/785824

一本小说,文中针对基于内容的图像检索方法

Manyu肖 ,¹ 江湖路,^1、2 和Gongnan谢 ³

学术编辑器: 峰高

收到了 2013年10月04

接受 2013年12月05

发表 2013年12月22日

文摘

基于内容的图像检索是如今的一个可能的和有前途的解决方案来有效地管理图像数据库。然而,随着大量的图片,还有用户的期望之间存在巨大差异(精度和效率)和真正的图像检索的性能。在这项工作,提出了新的优化策略在词汇树构建、检索和匹配方法。更准确地说,一个新的聚类策略结合分类和传统——方法是首先重新定义。然后一个新的匹配技术是用来消除误差引起的大型尺度不变特征变换(筛选)。此外,提出了一种新的单元机制减少索引时间的成本。最后,数值结果表明,出色的表演得到了精度和效率的基础上,提出了图像检索的改进。

1。介绍

如今,基于内容的图像检索(CBIR)已经越来越多的应用程序,是计算机视觉的核心问题之一。它的功能被Smeulders彻底讨论等。1]。最受欢迎的方法,产生结果的基于内容的图像检索是基于视觉图像的内容。图像的视觉特征,如颜色(2),材质(3),和形状特性(4)都进行了广泛的探索代表和索引图像内容,导致研究原型和商业系统的集合5,6]。因此,CBIR系统的性能主要取决于特定的图像表示和相似性匹配函数采用(7]。由于互联网的快速发展和完善,图像捕获设备和计算机硬件引起图像的存储和操纵的问题(8]。这是原因,谷歌公司(Google inc .)开发的相关技术和百度公司没有充分执行。主要限制检索准确性或实时或有时发生。为了克服这个限制,在这一本小说,文中针对工作方法提出了基于内容的图像检索。首先介绍了传统的图像检索过程,如图1。它可以分为三个部分:词汇树构建,测试图像的存储和检索。简要讨论了这三个部分的描述如下。

1.1。建筑词汇树

在技术发展水平的技术,一个树结构通常是用来存储图像数据库。换句话说,需要一个训练集得到歧视和代表树。训练集是一组图片,首先被转化为筛选[9)(尺度不变特征变换)128 -维描述符向量。筛选功能独特的强劲不变的特性,用于描述和匹配数字图像内容不同的观点的一个场景之一。同时具有旋转和尺度不变,健壮的其他图像变换,图像通常是大型的筛选功能描述和缓慢的计算10(维度)的诅咒。在那之后,词汇树(11必须建立。大型的传统分类特性的图像数据库通常是由分层——(HKM)方法。假设先天的 树枝和的数量树的高度,所有描述符可以聚集成部分,可以获得集群中心在第一级节点,然后最终reclustered为每个部分所有新新的团体节点。重复这个过程,直到聚集的高度和obtention定义一个完整的树。

1.2。测试图像和数据库Information-Inverted文件的存储

一旦一个组织良好的数据结构,数据库可以存储图像。从图像数据库,筛选描述符必须提取(12,13]。对于每一个图像在数据库中,所有的描述符进行相同的分类如下:与欧氏距离的根节点的子节点,然后选择最近的一个新根节点。这个过程必须重复直到到达叶节点。为了匹配和检索的图像在下次搜索时,叶子节点的最短路径的构造。这意味着一个反向文件(11,14,15是需要建立识别图像数据库和测试图像之间的关系。当测试图像的描述符达到一个叶节点,有关倒向文件将记录相应的信息的描述符。

毕竟一个测试图像的描述符存储在词汇树,叶子节点的重量计算基于TF-IDF策略以便准确测试的有效性不同的叶节点由以下公式: 在哪里数据库和图像的数量倒向文件中向量的维数。如果只存在多个图像描述符了和它的值很小,这意味着这是区别的叶子节点。这意味着叶节点是歧视和有一个良好的检索功能。否则,该值将会更大。

1.3。检索和排序

后组织测试图像和数据库图像的信息,可以获得两个向量测试图像和数据库的图像如下。

对于测试图像,

数据库的图像, 在哪里叶子节点的重量,测试图像的数量节点到达th叶子节点,而的数量吗数据库镜像节点中叶节点在建筑形象的基础。

现在,排名结果可以得到以下公式: 通常指- - - - - -规范或- - - - - -规范。

用通常的方法,精度问题经常发生。首先,作为测试图像的数量的增加,越来越多的噪声和杂波带进数据库的信息,这无疑导致减少检索精度。其次,更多的信息在图像数据库中导致更多的时间需要从数据库中搜索类似的图片,通常不能满足实时的要求。最后,几十个试错测试后,发现计算匹配程度的规范不能删除不同的图像的大小筛选数据,揭示了精确度损失。这就是激励提出了详细的以后的改进。

本文的组织结构如下:三个部分中描述的改进2。然后,图像检索应用程序测试部分3,紧随其后的是讨论和结论部分4。

2。三个改进

2.1。提高词汇树的构建

从上述过程,众所周知,树的高度和分支数都是预先定义的,也就是说,一个完整的树(参见图2(一个))。在构建每个聚类之后,所有的描述符将等价划分为几个部分。由于距离不同,可能会有不同数量的描述符在不同的地区,甚至有可能发生,只包括几部分描述符。另一方面,它也可能发生,最大的距离已经在某一部分小,但由于预定义的极限水平和分支,这部分必须不断分裂。这些都不是负担得起的。

(一)

(b)

在实际应用中,大量的信息在不同的测试集是不同的,因此不同的树是必要的。当树甚至不需要一个完整的树,传统的方法肯定会导致一些错误。为了减少甚至消除这些错误,传统——过程和分类组合,以确保词汇树的高度和分支数自动定义。

拟议的技术层次分类方法(HCM)是用两个阈值:一个是描述符的数量在一个部分,另一个用于距离内的部分。这两个阈值可以确定当集群操作终止;因此我们不知道有多少层次树,不知道有多少孩子节点的父节点。两种不同的结构树可以如下所示,分别为(图2 (b)改进的树):这个新模型不仅提供了改进的效率而且在精度。

2.2。短时间检索

在以前的作品,往往是通过欧氏距离分类的根节点的子节点,不是根节点的信息直接在图的左边3。显然,花了太多时间计算。这个距离不大于descriptor-root节点之间的距离之和,从根node-relevant获得子节点的距离。它可以编写如下: 在哪里代表一个描述符,是一个根节点的子节点,根节点。

(一)

(b)

根节点及其子节点之间的距离都是预先计算和保留在根节点位置,提出了集群技术在于找到下一个孩子树使用只有第一项(5)。第二部分是用于下一个聚类等级图所示3 (b)。

定义词汇树的高度,是子节点的数量在每个级别和为每个聚类计算时间。的总时间与传统分类找到最近的叶节点,而改进的方法只需要一个时间;后来的消耗只有所需的时间,大大降低了检索时间。

2.3。改善评分机制

在传统的方法中,通常是规范或规范。然而,对于许多实际的实验中,发现结果不是很合理,因为不同的内存请求。更复杂的图像时,更可能与检索图像的大量特性(128年大量的特征向量的维度)。相反,它是效果不佳的简单的图片。第三改善将集中精力处理这个问题。以下单位标准提出了消除的重量测试图像和不同的数据库图像记忆: 在哪里代表测试图像向量和的数量的数量数据库镜像。这单位标准可以确保不同的图像保持在同一水平;更合理的分数会因此产生。这个新单位标准被称为单位标准。

重要的符号:编程时,可能会有数百万的照片的图像资源,甚至会有超过106的叶节点,而对于索引数据库中的每个图像,将会有成千上万的维向量等于0。为了节省内存空间,提出了动态分配存储。

3所示。测试的例子

Ukbench图像数据库包含2550组图片,每组包括4相似的图像。更准确地说,这四个图像与快照更相似字符图像相同,但是在不同的光照强度和方向。分析用户的期望,采取以下策略:从数据库索引一个图像图像,如果三四个相似图片可以展示排名10个结果,这种图像检索的实现是一个成功的过程。该指数频率计算在哪里是类似的图像的数量排名10所示图片和一个指标的准确性测试图像。

的平均精度最终用于测试不同的有效性单位标准。不同数量的图像检索图所示4。

从图4观察到一个更合理的分数将会获得单位标准(这意味着类似的图像之间的匹配程度较大和较小的无关紧要的)之间。该指数精度那里好多了单位标准而不是规范和规范。

在测试图像基础建设,采取丢弃的战略行动,实现更好的性能如表中列出1。

基于这两个重要的改进,与著名的HKM分类方法的效率和HCM(方法)进行了比较。结果表2表明,该改进更可行的和有效的。

4所示。结论和讨论

在这个工作中,提出了三个改进:在基于内容的图像检索策略在图像分类、机制来计算特征向量的欧氏距离之间的源图像和研究图像,和发展的逆文件。因此,索引可以大大提高准确性。此外,我们可以更快的索引程序,满足实时图像检索的很好。的理论观点,提出技术所需的传统方法需要只有六分之一的时间。在未来的工作中,需要验证的效率提出了改善实际情况的时间是非常短的在上面的例子中。

利益冲突

作者宣称没有利益冲突有关的出版。

确认

这项工作已经基本支持的项目(西北工业大学拨款的基础。JC20120241)和由中国国家自然科学基金(赠款。11302173)。

引用

a·w·m·Smeulders m .不用Santini, a·古普塔和r . Jain,“基于内容的图像检索的早期,“IEEE模式分析与机器智能,22卷,不。12日,第1380 - 1349页,2000年。
视图: 出版商的网站 | 谷歌学术搜索
r·o·Stehling m·a·Nascimento, a . x法尔考,“对基于内容的图像检索、形状的颜色”诉讼ACM国际研讨会上的多媒体信息检索(ACM米尔' 00),第174 - 171页,2000年。
视图: 谷歌学术搜索
m . Flickner h . Sawhney w . Niblack et al .,“查询图像和视频内容:QBIC系统”电脑,28卷,不。9日,23-32,1995页。
视图: 出版商的网站 | 谷歌学术搜索
d . s .张和g .,“通用傅里叶描述符shape-based图像检索”学报IEEE国际会议多媒体和世博会(ICME ' 02)1卷,第428 - 425页,2002年。
视图: 出版商的网站 | 谷歌学术搜索
h . m . f . Jing Li张,张,“有效的提出图像检索框架,”第十届ACM国际多媒体会议学报》上2002年12月,页456 - 465。
视图: 谷歌学术搜索
a·古普塔和r . Jain,“视觉信息检索”ACM的通信,40卷,不。5,71 - 79年,1997页。
视图: 谷歌学术搜索
h·b·Kekre s . d . Thepade a . Athawale沙,p . Verlekar和s . Shirke”能量压缩和图像分割图像检索行和列上使用Kekre变换特征向量,”国际计算机科学杂志和网络安全,10卷,不。1,2010。
视图: 谷歌学术搜索
m . k . Mandal f·伊德里斯,s . Panchanathan”关键评价压缩域的图像和视频索引技术,”图像和视觉计算,17卷,不。7,513 - 529年,1999页。
视图: 出版商的网站 | 谷歌学术搜索
d·劳“独特的形象特征尺度不变的关键点,”国际计算机视觉杂志》上,60卷,不。2、91 - 110年,2004页。
视图: 出版商的网站 | 谷歌学术搜索
d . nist和h . Stewenius“可伸缩的识别词汇树,”《IEEE计算机学会学报计算机视觉与模式识别会议(CVPR 06年),第2168 - 2161页,2006年。
视图: 出版商的网站 | 谷歌学术搜索
p .迪克和r . Motwani近似最近的邻居:删除维度的诅咒,”学报》第30届ACM计算理论研讨会上(98年获得STOC”),第613 - 604页,1998年。
视图: 出版商的网站 | 谷歌学术搜索
j . Sivic和a . Zisserman”视频谷歌:文本检索方法在视频对象匹配,”学报》第九届IEEE计算机视觉国际会议(ICCV ' 03)不错,页1470 - 1477年,法国,2003年10月。
视图: 谷歌学术搜索
j·s·贝和d·g·劳”形状索引使用近似近邻搜索在高维空间中,”《IEEE计算机学会学报计算机视觉与模式识别会议(97年CVPR”)1997年6月,页1000 - 1006。
视图: 谷歌学术搜索
j·祖贝儿,a·莫法特和k . Ramamohanarao“反向文本索引文件和签名文件。”ACM事务在数据库系统,23卷,不。4、453 - 490年,1998页。
视图: 出版商的网站 | 谷歌学术搜索
a·c·伯格、t·l·伯格和j·马利克”形状匹配和对象识别使用低失真通讯”《IEEE计算机学会学报计算机视觉与模式识别会议(CVPR ' 05)2005年6月,页26-33,。
视图: 谷歌学术搜索

版权

PDF 下载引用

下载其他格式

订单打印副本

的观点

1125年

下载

858年

引用