文摘

一个新文档图像检索算法的低效的数字图书馆信息资源的检索。首先,为了准确地描述图像的纹理和增强能力分化,提出了统计特性两棵树复小波的方法。其次,根据统计特征的方法,结合人眼的视觉特性,提取文档中的图像的边缘信息。在此基础上,我们构建有意义的结构特性和使用纹理特征来定义文档图像的特征描述符。以描述符为线索,文档图像的内容特征是有机地相结合,和合适的相似性度量标准用于高效的检索。实验结果表明,该算法不仅具有较高的检索效率,还减少了传统的文档图像检索算法的复杂性。

1。介绍

随着社会科技的快速发展,迅速走进信息阶段,和多媒体技术得到了广泛的应用1]。与此同时,数字图书馆是不断提高其能力,及其应用通常包括文本信息的实时查询。实时查询的大规模图像库,可以想象其检索的实时性能。传统的基于文本信息检索,检索系统往往不能满足日益发展的社会的需要。由于狭窄的形象领域适用于基于文本的图像检索技术信息,基于内容的图像检索技术的发展变得更加重要和迫切2,3]。

从文本描述图像本身是不同的;图像通常含有极其丰富的纹理和信息。目前,广泛使用的图像特征主要包括颜色、形状、纹理,和一些图像的空间关系。这种检索技术基于图像特性,克服了基于文本的检索方法的缺陷,大大提高了检索的速度和效率,并逐渐成为一个热点领域的图像检索。近年来广泛研究了图像检测基于纹特征,及其方法主要概括为统计方法、模型方法、信号处理方法和结构方法(4]。文献[5]提出同现矩阵在图像空间的概念。由于从同现矩阵中提取少量的信息,不能完全表达图像的纹理信息。小波变换方法有很好的本地化能力在空间和频率域和统计纹理特征分析是一种有效的工具(6]。然而,传统的小波方向分辨率差,只包括水平、垂直和对角方向,缺乏良好的平移不变性和方向选择性。它是一个有效的方法来选择一个合理的模型来描述小波系数的分布函数,其中大多数分布接近于零。因此,提出了广义高斯密度函数在文献[7]。文献[8)提出了广义伽马模型建设,和文献[9]应用贝叶斯模型详细的部分波段振幅系数。尽管这些模型很好地描述在零均值的分布系数;然而,仔细观察和分析的小波直方图,它可以发现密度函数的小波系数区域并不完全符合对称分布。从一些纹理图像的小波系数直方图分布尤为突出。

要解决这些问题,本文介绍了广义高斯混合模型的两倍。一种有效的纹理分析的统计特性是通过融合小波子带的系数。其次,根据数字图书馆的文档图像的特点,本文提出了一个有效的信息检索方法基于文档图像的纹理特征。根据纹理的统计特性分析,在文档图像边缘信息提取构造纹理特征,然后,提取纹理特征描述符的相似性检索。实验表明,该算法具有较高的检索效率。

论文的分解如下:部分2提供相关的工作。部分3讨论我们的方法。研究的结果发表在部分4。部分5总结了纸。

纹理可以代表像素社区之间的灰色空间的分布特征。基于纹理特征的图像检索方法大致可以分为空间域、频域、空间域的相互融合,频域和分形模型。魏et al。10)提出了一种新的图像检索算法。该算法将纹理属性分为方向性、对比度、粗糙度、粗糙度,从人类视觉感知的视角和规律性。因此,基于纹理特征的图像检索算法可以实现更好的结果。刘、杨提出了纹理单元的方法(11]。加戈和Dhiman12)的基础上做了进一步改进纹理单元方法并提出了局部二进制模式(LBP)算法。该算法使用一个给定的 窗口中的像素值比较中心模块的每个像素值在周围社区模块确定域像素值。如果像素值小于相比的中心像素值模块,附近的像素值为0;否则,附近的像素值是1。然后,相对应的物品处理像素值模板和体重增加和总结。图像检索算法基于LBP能达到更好的检索结果,但计算复杂度一般大,需要改善。Kugunavar和角色13提出了灰度同现矩阵法。所描述的空间纹理图像纹理特性如惯性矩、惯性,惯性相关系数,分数,和二次矩角。楔环纹理特征提取通过傅里叶变换可以实现更好的检索结果。然而,纹理特征属于频域和不包含空间域信息,具有一定的局限性。Kayhan和Fekri-Ershad14)进行了深入研究分形图像的纹理特征。

伽柏过滤属于空间域法和小波变换属于频域方法。卓和周15)提出了一个基于伽柏的纹理特征提取算法过滤。李等人。16)克服了基于频域的特征提取算法的不足,提出了一种基于小波的纹理特征提取算法。Prasetyo et al。17)提高了特征提取速度的小波纹结构,提出了一种新的基于小波的纹理特征提取算法。Bu et al。18)使用树的纹理特征提取算法小波变换分解的高频部分,它克服了塔式小波变换的缺陷,可以详细描述图像的纹理信息。Madhavi和Patnaik19)提出了一个基于小波的图像检索算法部分波段直方图统计模型。Mistry [20.)提出了一种基于广义高斯模型和纹理检索算法K-L距离。萨那和伊斯兰教(21)提出了一种纹理特征提取算法的基础上,两棵树复小波变换。阿什拉夫et al。22)提出了一种新的基于纹理特征的图像检索算法的复杂旋转小波滤波器。苏雷什和奈克(23)提出了一种新的基于传统小波变换的纹理图像检索算法。Mistry et al。24)提出了一种基于复小波系数的纹理图像检索算法模型。虽然我们已获得许多基于纹理特征的图像检索算法,仍有许多不足需要改进。

3所示。方法

3.1。基于内容的图像检索技术的原理

基于内容的图像检索技术不同于传统的信息检索。它集成了许多先进的技术,如信息科学、图像处理、模式识别、数据库。它还采用了新的数据模型和表示。与此同时,它使用图像本身的一些内容信息由系统自动提取图像的特征。此外,一个合适的相似度测量方法用于检索图像的相似性距离。在很大程度上,它解决的问题“什么是问而不是回答“在图像检索中使用关键词。

基于内容的文档图像检索技术系统如图1。整个系统主要由两部分组成。一部分是图像索引部分,主要提取示例文档的特征图像和文档图像库,并建立相应的索引结构。另一部分是整个过程的文档图像查询。用户输入样例文档图像后进入系统,检索系统会自动根据自己的特征提取算法提取特征并进行相似性匹配,然后输出显示检索到的文档图像相似度计算。

3.2。Double-Broad高斯分布模型的两棵树复小波系数

离散小波变换(DWT) [25- - - - - -27)将产生大量重叠,导致变形。同时,它严重影响纹波系数的能力来描述原始图像的纹理特征。为了克服这些缺点,本文采用零均值double-broad高斯分布来描述两棵树的分布复杂的小波段系数;积极的和消极的部分小波域系数函数拟合,一般高斯密度函数

在哪里 适合峰值的宽度的概率密度函数 模拟函数曲线的速度变化。和 的值是图像像素。由于这个原因, 通常被称为参数和规模 是形状参数。当 ,广义高斯分布是高斯分布。当 ,广义高斯分布的拉普拉斯分布。

2块的图像和它的子带系数直方图。两棵树复小波变换类似于一般的小波变换。大部分的系数分布在零域附近。但是一些纹理图像不完全对称的问题。因此,本文介绍了双广义高斯混合模型以适应广义高斯分布函数的正面和负面的域。

双广义高斯混合模型的具体模型如下:(1)根据DT-CWT原则,进行多层小波变换在图像中提取每个子带的系数的两棵树复小波的图像(2)使用矩阵分解方法分离的正面和负面的系数子带系数矩阵,即 ,在哪里 是原始系数矩阵, 是积极的, 是消极的部分(3)两个矩阵分解系数重构成对称分布,结合 ,的组合 ,形成两个标准对称分布。广义高斯密度分布函数拟合系数

估计算法的复杂性的规模和形状参数的高斯密度函数导致其实际应用的局限性。本文算法的效率得到了很大的改善,通过使用基于counter-function GGD形状参数和尺度参数曲线拟合。因为GGD,对称分布的一阶原点矩是0,所以绝对矩法是用来估计参数和推导

进一步,我们可以得到一个形状参数的估计 :

尺度参数 可以根据方程(2):

使用函数曲线拟合的counter-function快速估计double-broad形状参数和尺度参数的高斯分布模型,实验证明,极大地提高了检索的效率没有影响参数估计的准确性,减少时间复杂度。

3.3。Texture-Based文档图像检索算法

有一些文档图像的检索技术之间的差别和通常的图像检索技术,和检索系统的基本框架是一样的。然而,的重要特征,纹理特征比其他功能更有效。因此,文档图像的纹理特征提取的算法用于相似性检索。

文档图像通常是通过扫描文件,通常有一个很大的噪音,严重影响文档图像的检索精度。因此,有必要做一些减噪处理文档图像,使用直方图均衡化和中值滤波方法锐化边缘,轮廓,相反,等图像增强图像,去除噪声,减少背景信息的影响。为了进一步提高检索效率的文件,有必要重视文档图像和一种新方法提出的文档图像的二进制值是利用块编码的想法。

我们设置 作为一个文档图像和文档图像划分为一系列的子群 大小divalue之前贬值。然后,计算每个子块中所有像素的灰度均值μ。我们比较所有像素的灰度和平均子块;如果灰度值大于μ,将灰度值更改为1或0。通过这种方法,原始图像的二进制和二元图像。二元过程图像如图3

根据人眼的视觉特性,当人类的眼睛迅速地在文档图像,边缘地区的文档图像文档图像的主要方向是最注意到。因此,图像的纹理特征可以被定义为块边缘图像的bivalue过程相结合的产物。二元化图像文档的过程也可以被理解为一些二进制块通过比较每个像素的灰度值和块内的意思。“0”和“1”的分布以二进制块可以反映图像的纹理信息和形状分布信息块本身在某种程度上。

因此,文档图像的纹理特征可以定义这些二进制块。描述复杂的小波变换提出了可以区分不同的纹理。

结合二元化文档图像的过程,新提取纹理特征检索。定义二进制块二值化过程中产生的文档图像的纹理元数据,使用十进制数的二进制数中的两个数字序列自上而下顺序从左到右的序列号(或价值)。数这些纹理的分布元数据文档图像获得的灰度共生矩阵纹理元数据。

假设 是一个文档图像,图像中的纹理元数据值是什么 变量 位于纹理元数据价值 灰度共生矩阵中的元素是基于结构元数据。变量 是图像的像素的数量。

变量η纹理元数据对的数量 ; 是一块four-neighbour纹理块的 和的值 定义如下:

文档的纹理图像共生矩阵纹理所描述的元数据,它反映了综合信息的方向、大小等变化的文档图像的纹理和形状和当地的域。但本身,它不直接提供一些有意义的纹理特征的文档图像检索。因此,一些有效的纹理特征需要进一步提取。的算法,提取以下4个典型统计检索。公式如下:

后提取4统计,得到文档图像的纹理特征描述符。共生矩阵纹理元数据被用来提取特征向量,域方向性信息联盟的方法用于提高算法的抗噪能力,提高算法的检索效果。

3.4。相似的措施

与其他措施相比,欧氏距离的相似性度量是一种很容易理解和应用。它是无量纲的,两个点之间的欧几里得距离是独立于原始数据的计量单位。因此,本文使用欧氏距离。

我们设置 示例文档图像检索, 在图书馆是文档图像库和提取上面的文档图像特征提取的特征提取算法:

特征之间的相似性测量是使用欧氏距离计算,也就是说,

因为提取的4个组件有不同的物理意义,和值的范围是不一样的,相似度匹配,每个组件的重量是不同的,将直接影响匹配结果,算法,使用Gauss-unified内部规范化处理的方法。

4所示。结果与讨论

4.1。数据库和评价准则

为了评估算法的检索性能,Corel-1k数据集,Corel-10k数据集和自建数据库使用。数据库首先构造一个库的文档图像灰度文档在不同的决议。图像库在纯文本文档图像,以及混合图像,包括文字,图片,和表。在实验中,50选择文档图像检索在10类别,50个搜索结果的准确性和检索率的平均值作为算法的最终结果。

4.2。Dual-Broad高斯模型的性能分析

是非常重要的提取图像的纹理特征和每个子带的统计分布特性准确、有效地在多尺度变换域。通过观察系数矩阵密度函数分布直方图、纹理特征的提取提出了基于double-broad高斯混合模型的纹理图像的密度分布的问题系数矩阵不是完全对称的。一些子类的图像不能模仿准确的文献,这个问题的原因是文献26方法需要更高的初始值的选择。估计结果相对准确的只有选择初始值接近真实价值。

使用DT-CWT原则,由两棵树复数小波图像转换,每个图像子带系数的提取。通过使用统计子带系数分布直方图近似概率分布函数的小波系数,它是测试是否概率分布曲线类似于double-broad高斯分布模型和与single-broad高斯密度分布函数曲线。仿真结果如图所示4

通过分析实验结果图5,有一个重要的左右不同的拟合曲线,和分布密度左边的零边界点略大。总之,通过对实验结果的分析,double-broad高斯混合模型可以克服不对称的分布系数小的纹理图像的小波系数,合理描述图像内容信息,充分描述纹理特征。

4.3。纹理特征算法的有效性分析

为了比较各种方法的性能更直观地,精确率、召回率,和地图数据集提出了在这一节中。本文方法的性能曲线都高于其他比较方法,这在一定程度上表明了方法的有效性。

为了客观地分析纹理特征的有效性,本文将基于灰色度热电联产矩量矩阵应用灰度共生矩阵建立()(28),dual-tree复小波变换结灰程度热电联产矩量矩阵(DT-GLCM) [29日),和改进的描述复杂的小波结合gray-degree热电联产矩量矩阵(DT-GGCM) [30.]相对于图像检索结果的算法本文结果如图所示6

从图可以看出6(一),当检索前10的图像,本文算法的平均精度为89%。第一个50图像返回时,检索的准确性为75%。从ROC曲线在图的分布6 (b)可以看出,本文算法的检索速度和准确性比那些比较三组的算法。因此,本文的纹理特征提取的算法确实能够更全面的描述图形的纹理内容,以便计算当前图像的纹理描述有能力改善,从而提高图像的检测方法的准确率。

为了测试当前图像的描述性能的算法,基于灰度共生矩阵的图像检索结果结合颜色特征(GLCM-H) [31日),两棵树复小波变换和灰度共生矩阵结合形状特征(DT-GLCM-Hu) [32- - - - - -34),改进的小波描述复杂结gray-gradient comatrix (DT-GGCM),和本文算法获得的图像检索结果进行了比较。

从图可以看出7(一),当检索前10的图像,本文算法的平均精度高于类似的相关算法。可以看到从图的ROC曲线7 (b)的检索速度和准确性,本文算法比其他三种算法。因此,提出了改进的纹理特征提取算法应用于图书馆图像检索有一定道理。

此外,上述实验涉及库图像的纹理特征。结果表明,算法能够挖掘深度图像的纹理特征。在某种程度上,实现的有效描述图像,提高了图像检索算法的检索性能。来验证这种方法的性能,本节中构建一个比较实验与其他Corel-1k数据集的方法。比较实验的精度和召回率、10图像被随机选择从每个类型的图像的图像检索。

1和图8显示精度、召回率和地图Corel-1k数据集上的不同的方法。表给出的平均检索精度的图像检索当第一个10图像检索。而比较法来获得更高的检索精度,该方法的检索精度数据集上提高了9.6%。与其他方法相比,该方法的召回率已经增长了9.71%。地图的均值的平均精度的图像检索前10的图像。的地图与其他几种方法相比,该方法提高了6.93%。从结果可以看出,我们的方法比其他方法取得了更高的成果,也更好的Corel-1k数据集。

5。结论

理论的基础上,基于内容的图像检索,文档提出了基于纹理特征的图像检索算法。在两棵树复小波变换下,双高斯混合模型是用来确保密度分布的小波系数不完全对称。此外,采用曲线拟合的参数估计方法估计算法的效率得到有效保障。其次,根据统计特征的方法,结合人眼的视觉特性,提取文档中的图像的边缘信息。在此基础上,本文构造有意义的结构特性和使用纹理特征来定义文档图像的特征描述符。在此基础上,提取的特征向量检索,快速和准确的文档图像检索是实现。实验结果表明,该算法具有较好的检索效率特别是包含图表的文档。

文本检索的图像是我们下一步将研究。通过检测图像中的文本,数字图书的数字图书馆的检索可以实现。

数据可用性

使用的数据来支持本研究的发现可以从相应的作者。

的利益冲突

作者宣称没有竞争的经济利益或个人关系可能影响工作报告。

确认

本文的研究成果之一,2020年广州哲学和社会科学规划,“广州在线图书馆建设和青年思想领导关系研究”(项目号2020 gzgj180)。