文摘
随着智能设备和互联网的普及,多媒体数据量快速增长,基于内容的图像检索(CBIR)可以搜索类似的图片从大规模图像来实现数据的利用率。数据所有者,将图像数据的管理和维护外包云服务提供商可以有效地降低成本,但是有一个隐私泄漏的问题。在本文中,我们关注图像特征提取、索引设计、和图像相似度识别方法在双服务器模型与基于内容的图像安全相似性识别为研究主题,提出BOVW等工作(视觉词包)基于特征图像安全相似性识别方案。该计划结合筛选(尺度不变特征变换)功能安全的提取和本地敏感散列算法实现安全开采BOVW特性的图像。保护BOVW图像的特点,设计一种基于词频的反向索引分裂,索引存储在块,和一个图像安全的相似性识别方案基于CNN(卷积神经网络)特性。可伸缩的哈希索引基于空间划分的目的是基于图像CNN功能安全的提取算法。该方案的安全性和性能进行了理论分析和实验验证。根据不同的图像数据集,不同的参数对性能的影响测试的方案,并给出优化参数。实验结果表明,本文提出的方案能有效提高分析的效率相似的植物植物艺术图像相比,现有的计划。
1。介绍
随着互联网的快速发展,信息技术的过程变得越来越快,和大量的图像数据可以生成的每一秒。作为一种重要的信息载体,图像在各个方面有着重要的应用,如分形植物艺术形象相似。图像的数量增加(1),这是一个非常有意义的事情来找出有效的图像资源快速、准确地从这些庞大的图像数据。图像相似度算法的研究在某种程度上可以解决这个问题。由于图像相似度算法的特异性,也没有统一的标准定义图像的相似性,和图像相似性只能用不同的方法学习。大多数当前的图像相似性算法使用低级视觉特征。
尤为重要的是,要获得高质量的图像数据,因为如今,智能生活不能没有图像数据处理。模糊图像数据不仅影响人眼的视觉感知,在重要的场合也可能会增加一些工作量。例如,在火车站的自动售票渠道,相机需要收集清楚脸图像和身份证图像比较,如果相机或环境使收集到的图像模糊,它可能需要手工票通道;监控系统如果不检查了很长一段时间,相机可能是模糊的或由于天气的影响,环境,等导致不清楚监控图像;如果遇到紧急情况,模糊医学图像扮演一个配角在治疗病人的过程中,如果获得人体组织科学图像的质量不高或明确的,它可能会影响医生判断病人的疾病;在各种图像算法的学习研究2),还需要获得高质量的图像数据第一次为了提高研究工作的效率,例如,在工业图像缺陷检测、高质量缺陷图片之前需要先获得后续算法可以进行研究。可以看出,这是相当重要的获得高质量的清晰图像。
作为web资源的提供者和用户,用户尝试使用云计算技术实现图像数据的存储和共享和摆脱的负担造成的本地数据管理。由于网络的开放性和异构性,用户的私人数据面临的威胁和安全相似性识别的图像在外包环境中变成了一个需要研究的问题。当前提出的图像安全相似性识别方案受到计算复杂度高,高用户负载,高的通信开销,和许多交互轮和不支持图像数据的更新;因此,研究图像特征提取、索引结构和图像相似性比较方法在加密图像是重要的,有价值的降低计算复杂度和通信开销的图像安全相似性识别和充分利用云服务器资源具有十分重要的意义和价值3]。
2。相关工作
图像相似度是一个相对抽象的和通用的概念。人类视觉感知的主观性质使得图像的视觉媒介高度模棱两可的,和不同的人可能有不同的理解和看法相同的图像(4]。因此,有多种方法和形式的描述图像之间的相似度的定义。然而,结果和目的都是定量分析和测量图像之间的相似程度。图像的相似性取决于程度的相似图像的具体内容,如相似性进行像素级获得的比较或对比和分析一些具体点的。语义相似性的图像相似度计算得到了一些基本信息(5)对图像进行比较,通过链接图像空间语境和情景语境;这是一个高层次的图像目标实体连锁与高水平的抽象和不成熟的理论。将一个图转换成另一个图的费用计算,即,predefining the set of operations for various transformations and defining the minimum change step between two graphs as the similarity of the two graphs, i.e., the image edit distance [6]。
图像是结构化的,最常见的子图的两个图形使用公式,推导出最大限度地表达了公共信息的两个图,和最大的常见的子图的相似性定义为两个图形(7]。定义一个大型图表,可以包含两个图像同时,称为最大关联图的两个图表,从关联图和最大subcluster获得了代表两个图形的相似。图像分解成几部分,分别计算每个部分的相似度,然后结合得到整幅图像的相似性(8]。
文学形象的搜索引擎,可以根据输入语义或图像,可以发现大量相关或相似的图像语义资源,和相似的识别非常有效。许多学者在国内计算机领域也做了很多工作在图像相似度算法的研究。文献主要是各种算法适用于不同情况下的图像分析图像在不同的相似度算法,和它给什么样的算法应该在什么样的场景中使用;文献使用MapReduce,大数据的分布式计算框架,研究图像的相似性;文献介绍了最大连接组成的地区同样的颜色和它的边缘颜色粗糙度的可获得的图像颜色分布情况,从而弥补不足的颜色直方图算法(9];文献结合两个低级特征的图像,质地,和颜色,提高图像相似度算法的准确性;文学构造他的空间颜色直方图,然后使用一个累计直方图的图像相似度识别可以优化的准确性。文献开发图像搜索引擎(10]。
基于用户上传的图片,快速相似性是许多图像资源相关图像识别。文献使用奇异值分解理论求解图像相似度算法;文献使用Skewed-Split - - - - - -树木;这个树结构快速构建视觉词汇特性集,然后分类图像的基础上,建立词汇特性集;基于文献利用迭代框架(11),这个迭代框架的主要思想是保持记录最后一次的结果,然后根据最后结果,相似度识别图像的大小是不断扩大;因此,相似度识别各种图像资源,满足要求。文献认为,如果两个图片是相似的,他们属于同一Flickr组由算法相结合,可以训练SIKMA最终分类类似的图像(12]。由于特异性的图像数据和图像相似性的不同理解,因此图像相似性的研究从不同的方向有一些缺点,没有标准来研究图像相似。如,从图像颜色特征,利用图像中颜色的数量来计算图像相似度(13),这项研究没有考虑每种颜色的具体分布在整个形象;在一些特殊的情况下,计算图像相似度不匹配的实际情况;空间局部特性的图像来研究图像的相似性,可以使用筛选算法或其他特征点匹配算法来研究图像相似,尽管这些算法的精度是不同的。筛选算法或其他特征点匹配算法可以用来研究图像相似度;虽然这些算法精度高,计算过于复杂。例如,筛选算法需要计算图像的128维向量,这是非常复杂的,不符合人们的期望14]。图像检索的性能不仅取决于提取的图像特征。后的图像特征,如颜色、纹理和形状是提取和索引,图像检索的关键在于相似性度量指标(或距离)函数使用。它直接关系到图像检索效率和检索的结果。基于文本的检索方法使用的确切匹配文本,而基于内容的图像检索系统是一个不准确的匹配,完成的计算之间的视觉特征的相似性查询示例图像和候选人的形象。后像特征,如颜色、纹理和形状提取,形成特征向量,特征向量可以用来描述相应的形象。在图像检索,判断图像是否相似是通过比较这些特征向量是否相似。即比较图像特征向量作为图像相似性比较。一个好的特征向量比较算法在图像检索结果有很大的影响。
3所示。自动生成的分形植物艺术图像相似度的算法功能
3.1。自动生成基于植物图像相似度算法
相似物种的植物,这个算法是用来进行快速识别。灰度直方图是灰度级的函数,它表示图像中每一层的像素数量,反映了图像灰度值的像素的概率分布;它是一个全球性的信息特征的形象,通常表示为一个条形图,计算图像灰度直方图的过程是很容易的,我们定义一个数字图像的直方图与灰色的水平范围内(0-L-1)离散函数,层次灰色的像素的数量(15]。
图像搜索引擎包括(1)基于文本的图像检索:图像信息的特点使它不同于文本信息检索;(2)基于图像内容的图像检索功能:基于内容的图像检索索引和检索主要是基于图像的屏幕内容特征和主体和对象特性(即。图像的实际内容);和(3)图像信息内容的特性,可用于网络检索包括(a)静态图像内容的特征,这些特征包括颜色,形状,质地,结构,和(2)动态图像内容特征。
相似性措施之一,在机器学习领域的重要基础。在许多模式识别和计算机视觉的研究中,有必要测量双样本之间的相似之处,例如,对于许多聚类和分类问题的概念建立在“功能空间,每个样品都是描述一个数值属性特征的向量对应一个点两个点之间的距离反映了两个样本之间的相似性。同样,在图像检索研究中,图像的相似性度量图像特征提取后是重要的一步。当计算查询图像数据集的特性和图像功能,可以使用不同的相似性措施来获得不同的相似度排名,因此不同的检索结果。因此,尤其重要的是定义和使用合适的相似性度量的定义特征空间来有效地完成图像检索任务。在本文中,我们专注于几个距离度量函数常用的相似性度量(16相似,学习方法基于扩散过程。经典的直方图相似性度量是用来计算两个直方图之间的归一化相关系数,这种方法很简单的想法,就是法官相似向量在数学上的区别。所以两个直方图之间的差异距离也可以表示为两幅图像之间的nonsimilarity的程度,和公式的原理
常见的归一化相关系数直方图之间的欧几里得距离,巴克莱的距离,直方图相交距离,卡方检验系数,等等,我们将在下面分别给他们的度量公式。给定两个图像及其直方图H1和H2,两幅图像之间的欧氏距离计算如下。
没有明确定义图像的特征点。它也可以被称为要点,一个图像的兴趣点等。事实上,图像的特征点的位置点图像的识别。的特征点为代表的位置点是最简单的图像特征之一。每个形象都有其特征点,他们代表的是一些更重要的位置在图像,如拐点,图像的角点,或十字路口。图像的点特征是许多计算机视觉算法的基础和在各个领域的使用,如运动目标跟踪、目标识别、三维重建、和图像对齐。和基于特征点的图像匹配方法提取特征点包含重要从匹配的图像特征,然后根据相应的相似性度量匹配的图像特征。
的具体特征筛选算法如下:(1)图像的局部特性保持不变旋转,尺度缩放、亮度变化,和一定程度的稳定视角变化、仿射变换、噪声;(2)独特性好,丰富的信息,适合快速和准确匹配大量特征库;(3)沉重,甚至一些对象可以产生大量的筛选功能;(4)高速度,优化筛选匹配算法甚至可以实现实时的;(5)可扩展性,可以很容易地结合其他特征向量。
常见的图像特征点是哈里斯角点,筛选特征点,等。其中,Harris角点(哈里斯的本地窗口沿着每个方向并产生一个明显的变化在当地的曲率的形象,即。,当地的曲率的形象突然变化)。角点是一个典型的角点检测算法,旋转不变性的优点和局部仿射变化的不变性,但不是对图像几何尺度变化不变性,而筛选算法也被称为尺度不变特征变换,降低旋转和仿射不变的属性,照明和图像变形适应性强;因此,筛选算法成为最常用的图像特征点描述符和图像匹配等用于研究[17]。
3.2。相似度算法的自动生成过程
筛选算法的全名是尺度不变特征变换算法。算法的核心思想是找到极值点在空间规模和提取他们的位置18)、尺度和旋转不变性的图像中检测和描述的本土特色。其重要特性是它不变的形象翻译、旋转、缩放、甚至是仿射变换。它具有良好的稳定性,因此该算法可以很容易地用于图像匹配领域。我们可以确定两个图像相似程度的图像匹配点的数量。筛选算法的步骤可以如图1。
稳定性好,易于计算的明显优势是它的算法,但是每个特征点的计算需要一个特征值的长。这也使得算法更费时,应用程序有一些局限性在处理实时问题[19]。
相似度算法基于特定的理论,这类相似度算法,主要是基于图结构。假设分割图像的区域都是独立的和独特的,那么图像可以描述相应的图结构的属性特征提取和区域空间关系的描述。因此,图结构的相似度计算在一定程度上可以代表图像之间的相似性。计算图形相似,文献提出了这个理论,如果两个图节点有相似的邻近节点,然后这两个节点也类似。换句话说,这两个节点的相似性的一部分是传播到各自的邻居。因此,经过一系列的迭代,整个图,这种相似性传播,因此,我们可以到达最后的两个图形的整体相似度。改进算法的分步图如图2。
因此,根据这种相似性观点,相似矩阵都可以构造图,把这两个图中两个节点之间的相似度矩阵的一个元素,然后最后一个相似度计算公式可以推导出矩阵的相关操作。这个过程可以如下。
关联图的图匹配视图是首次提出解决同态关系结构之间的匹配。他提议建立一个协会图预设两个图形之间的函数映射和找到最大subcluster关联图的匹配,首先建立一个协会图G(两图结构;节点在G由G1 G1和G2 V符合一定的相容性条件,它代表一个节点。相邻的两个节点判断。协会的节点和节点之间的关系图可以得到过滤。一个最大subcluster subcluster节点对的最大数量的关联图,即。,it means that any vertex in a subgraph of the association graph is connected to the other vertices of that subgraph. The structural similarity between two images can be obtained by the higher of the maximum subcluster and thus the similarity of the images. The structure of the image is shown in Figure3。
有关原则的总体相似度之和等于相似的部分,该节点迭代匹配算法提出的图像匹配误差的总和等于节点错误和相应的边缘错误(20.]。倍的算法迭代匹配的过程,这是由图节点的数量。最小的两个图形之间的节点匹配匹配误差可以通过subiterations,及其匹配计算错误。最初的几个必须定义矩阵来表示节点的误差不同,可能的节点匹配对,等等,分别。然后计算的公式节点匹配误差和公式计算边缘匹配误差也必须被定义,最后,这两个图的相似性是基于匹配误差的大小决定的。这张图匹配算法应用于图像相似度识别,并取得了良好的实验结果。图像相似度的定义是各种算法的起点在当前图像的研究中,和理解图像相似性的概念是唯一的方式来定义相似图像的特征匹配的算法和公式替补对象从实用的观点。从相似的概念,介绍了各种算法和以来的分类图像相似性的研究,包括传统相似性理论基于图像像素灰度值和图像特征点,和各种新的相似性理论基于图结构。后者理论与传统理论的不同之处在于,它定义了相似度从一个新的角度,提出了一系列相当丰硕的公式相似度计算,应用到实际研究。
区域由一个像素和邻国。附近的一个像素,这意味着设置像素和相邻的像素组成的,通常有几种社区,邻居和对角线的社区。开始一个图像,一个像素可以被认为代表一个区域,然后邻居像素合并形成一个地区的基于像素之间的某些相似性的判断标准。因此,任何两个像素区域内必须有某些方面相似,必须连接。换句话说,一个区域的像素的集合和连接相似,和它的图像是由一个矩阵,如图4。
4所示。实验结果和分析
4.1。实验结果
在这个实验中,该方法的相似性识别性能实验验证和分析的数据集。首先,我们比较融合功能的有效性提出了一些单一功能的纸进行图像相似度识别验证的有效性熔融特性,和时间,我们也验证了性能的扩散过程相似性识别结合这些不同的特性。图5显示了数据集的比较各自的ARP的指标当相似度识别返回图像 使用不同的图像特性和不扩散过程的优化。
从结果在图中,我们可以看到,融合多种特征提高了描述性和歧视性的能力特性相比,单一的功能,大大提高了图像相似度识别准确;此外,距离优化基于扩散过程可以有效地提高相似度识别的性能,尤其是当结合multifeature融合,这显示了优越的性能。这并不难理解。以单一特征自民党为例,由于其脆弱的特性描述功能,它只能获得平均相似度识别精度为42.7%,导致不准确的初始距离矩阵的相似关系,使空间距离扩散过程在此基础上优化的小。和功能的表达能力的逐步改善,获得初始相似关系也逐渐变得准确,因此,基于更精确的近邻关系扩散过程可以发挥优势和作用。其次,我们比较相似度识别性能本文的方法与其他十多个类似的图像相似度识别方法基于multifeature融合和当20个图像返回列表。列出的各种方法的平均相似度识别精度,和图6显示的比较相似的变化识别性能指标ARP和加勒比海盗当返回的图像数更多的从10到100。
从结果可以看出,最高平均相似度识别精度可以得到几乎只通过使用熔融特性提出了,除了原来的方法。值得强调的是,在文献中提出的相似性识别模型不仅雇佣的融合提出多尺度曲波纹理特性和主要颜色特征,还使用了一个融合匹配模型在图像匹配过程中基于优先级最高最相似(MSHP)融合匹配模式。即便如此,当获得的ARP的熔融特性提出了文本有效结合diffusion-based过程比这种方法高出近4%。
上诉这个算法,提出一种改进的算法,使用基于匹配的目标定位方法的重新排序AML(近似max-pooling本地化)。而AML过程产生大量的候选区域,美白每个区域特征向量计算成本会大大增加。因此,R-MAC方法选择max-pooling聚合特性上的多个区域的地图。在许多方法中,图像相似度识别性能提高了连接形成的聚合向量max-pooling和avg-pooling;尽管两种不同聚合方法可以在一定程度上互为补充,它们也带来特征向量的维数的增加。图7是数据块特征向量的维数的增加。
平均价值大约需要0.95秒,增加并没有带来太多增加时间;Corel5k数据集,当一个亲密关系矩阵的扩散过程进行了优化 ,所需的时间是5.15秒,而当 所需的时间是10.55秒,即。,它增加到超过两次;CorellOk和GHIMlOk数据集,( )在扩散过程中亲密的矩阵,所需要的时间 是15.09秒,它将上升到92.77秒,这是超过5倍。可以看出,对于一个更大的数据集,扩散过程的参数t的发展导致了一个更大的时间消费。
4.2。实验结果分析
这个实验是基于multifeature融合和扩散过程,为着一个崇高的图像相似度排序识别框架来增强图像相似度识别来自两个方面:图像特征表示和图像匹配。不听话的,该方法提出了一种hit-effective multifeature表示方法,有效地融合低层视觉特征,如颜色、纹理和形状的图像。特性描述方法有更好的形象刻画和歧视能力和有一定的稳定性和鲁棒性的图像描述不同的视觉内容和功能,可有效缓解的存在在图像相似度识别”功能语义差异”;其次,结合hit-effective融合特性,我们采用diffusion-based过程。其次,我们使用一个距离优化方法基于图像中的扩散过程:匹配克服传统图像匹配基地距离的限制。这个实验旨在解决CNN基于特征图像安全相似性识别的关键问题。特征提取是一个基本的步骤,各种视觉相似图像分类、图像识别等任务,突出和CNN特性图像相似度识别;然而,卷积神经网络模型通常由多个卷积层,完全连接层,和汇聚层,有复杂的结构和计算量中提取特征,这将导致大量的计算和存储开销在终端设备上。CNN提取任务外包到云服务器可以大大减少计算开销在客户端,和外包特征提取有几种方案。他们不同的效率比较图表对不同方案如图8。
在CNN的提出基于特征图像相似度识别方案,图像加密与部分是一致的3基于现有的分析,众所周知,这种加密方案下的图像内容是安全的。然而,图像的特征可能泄漏的图像内容,所以图像的安全特性主要是下面讨论。安全的图像特征索引构建阶段如下:在索引结构,基于E2LSH,图像CNN的个子维度的哈希结果特性计算,和一个二维向量映射到一个值,因为往往是高维图像CNN特性,这个过程是不可逆的,不泄漏图像特征信息的索引构建阶段privacy-secure图像特性的安全标记图像模式:安全索引结构设计的摘要可以避免云服务器来推断云的相似性和类别图像本身如果云服务器想要准确地确定目标图像1和2是相似的;然后,我们必须知道CNN的图像特征。
然而,在semihonest模型,认为两个云服务器不是同谋。同时,目标图像模式是受保护的,因为索引基于维部门减少的概率相似性的图像在相同的桶,和个子维度的索引图像特征云服务器不知道判断图像是否相似。查询用户查询时,服务器可能执行统计分析历史查询,造成泄漏的数据访问模式,和隐私保护的访问模式是不考虑。一个简单的解决方案是把大量的额外的虚拟每查询服务器查询委托的任务排序候选结果查询用户,但这增加了负担查询用户和交互轮的数量。在这种情况下,需要进行权衡安全与效率之间的相似性识别方案。
5。结论
提出了一种基于语义相似性度量通过引入一个理论,这是完全不同的从传统的图像相似度识别模型。一方面,该方法将原始特征空间映射到一个新的语义空间通过语义概念和取代了传统的完整特性的嵌入空间的方法。方法选择不同样本根据原始图像属性数据的结构和分布,这是更适合描述他们不同的语义特征,从而提高辨别力样本之间的语义特征空间;另一方面,为了克服传统的局限性point-pair-based距离度量指标,当地的近邻关系被认为是在语义相似性度量,它扩展了原始图像之间的相似性度量点对图像集和集合之间的相似性度量,通过捕获底层数据稳定结构,以更准确地描述图像之间的相似性和进一步提高图像相似性关系的稳定性和鲁棒性的描述。这种方法显示了其良好的性能在完成面临相似识别任务,包括低级特征和自然图像相似度识别任务,采用深度特性。基于语义距离度量的有效性提出了本章通过大量的实验验证,同时,基于指标的相似的语义信息识别方法提出了一些hand-designed相比有明显优势特点和深度上优于图片相似度识别方法,它提供了一个基于语义相似图片识别的新主意。在这种方法中,特征提取阶段虽然在离线阶段完成后,完成更高的特征尺寸和更多的照片样本使构建的过程的集合特性在AFS内语义描述框架更费时,这两种改进算法的改进。
本文中使用的算法的发展方向主要是改善算法的识别效率和识别速度。算法的改进是有4个主要步骤:(1)在尺度空间极值检测,在所有尺度空间搜索图像和识别潜在的通过高斯微分的函数常数利息在规模和选择;(2)特征点的位置在每个候选人的位置,一个很好的拟合模型用于确定规模、位置和关键点的选择是基于他们的稳定度;(3)功能方向的任务是根据图像的局部梯度方向和分配给每一个关键位置在一个或多个方向。所有后续操作转换方向,规模和关键点的位置提供这些特性的不变性;和(4)特征点描述在每个特征点附近,当地的梯度图像测量的选择尺度,而这些梯度转换为一个表示,允许相对较大的局部形状变形和照明转换。
数据可用性
使用的数据来支持本研究的发现可以从相应的作者。
的利益冲突
作者宣称他们没有竞争的经济利益或个人关系可能出现影响工作报告。