文摘
本文提出了一种新颖的图像检索方案在加密的云数据,达到高效和机密性。为了提高搜索效率,索引树通常部署在图像检索方案。同时,敏感的云数据的机密性,如外包图片,索引树,和查询请求,也是一个关键问题。首先,一个平衡的二元聚类算法通过综合利用图像特征组成的基本特性,如HSV直方图和DCT直方图,产生一个平衡二叉树(《)。特别是,由于采用平衡索引树,我们的方案可以实现对数搜索时间。其次,安全是用来加密指数向量内积和查询功能。最后,抵制统计攻击频率分布的检索结果,我们复制数据库加密和合并的子树,该剧盲目的搜索结果。安全分析和实验结果表明,该方案是安全的和有效的。
1。介绍
随着云计算的到来,在云安全的图像检索近年来吸引了越来越多的关注(1]。由于高便利和经济储蓄,企业和个人都倾向于采用云存储和管理他们的敏感数据,如相册和个人健康的文档。为了确保外包数据的机密性,常用的方法是加密数据外包给云之前。然而,传统的加密可以基本数据操作不可行,例如,加密数据的信息检索。在密文的情况下,如何实现一个高效的检索同时保护顾客的隐私成为一个具有挑战性的问题。
目前,主要有三个问题限制在加密信息检索领域的发展。第一个问题是实现搜索功能加密数据和精度达到相同的明文数据。当然,幼稚的方法是下载所有的密文解密,并在本地搜索的明文。然而,它将带来沉重的带宽和计算成本。为了解决这个问题,加密技术,如同态加密(2]和多方计算,可以使用加密明文密文数据,支持搜索操作。然而,上述方法是更关心比检索效率、数据机密性和实际应用的成本是昂贵的。相反,一些高效的技术,如保序加密(开放)3,4),随机哈希函数(5- - - - - -7),和不对称scalar-product-preserving加密(方面)8),被广泛采用。原因是他们考虑数据机密性和检索效率。第二个问题是,尽管明文加密数据不泄露的内容在上面的计划,一些统计信息,如请求加密查询的频率(即。、查询模式)或加密的访问频率的结果(即。,访问模式),可能泄漏查询用户的隐私。无视公羊(9)是一个解决方案保护访问模式,但不够实用。第三个问题是一个线性的检索方案效率不可取,因为搜索的时间会增加数据集变大。事实上,安全的信息检索是常用的图像或文档存储在云服务器中。我们详细如下。
一方面,丰富作品提出了实现安全加密文件中检索。例如,布尔搜索基于单一关键词分别提出了对称密钥设置(11)和公共密钥设置(12]。自相似性搜索比布尔搜索更实用,multi-keyword排名搜索(13]研究丰富搜索功能和提高结果的准确性,在每个文档与索引向量。向量的每个元素表示一个关键字是否存在或代表其“词频率(TF)逆文档频率(IDF)。“再然后,通过比较发现查询向量之间的余弦相似性和所有索引向量,线性效率。为了提高检索效率,提出了基于索引树。例如,太阳et al。14]提出了基于树搜索方案,构造索引向量的所有文档作为MDB-tree。它通过设置达到次线性搜索效率预测阈值索引树的每一层。尽管更严格的预测价值可以获得对数搜索效率,结果精度同时牺牲了。此外,夏et al。15)建立KBB-tree自底向上的方法。KBB-tree,内部节点向量的元素的最大价值是它的子节点向量的对应位置。执行“Greedy-Depth-First搜索”算法找到k最相关的叶节点,它存储在一个RList。如果查询之间的相关性得分向量和内部节点向量RList小于最低分数,内部节点的子树不需要搜索。因此,这个计划还可以实现次线性效率。
另一方面,一些作品已经提出了加密的图像检索。在[16),一个privacy-enhanced人脸识别实现的帮助Paillier同态加密(他)。缺点是采用他所带来的沉重的成本计算和通信。实用,陆等人提出了一个安全的基于内容的图像检索(CBIR)计划基于功能/指数随机化(17]或min-Hash [5]。与此同时,同态加密之间的性能比较和distance-preserving随机化研究(18]。由于单向散列码和二进制属性,安全的CBIR,利用哈希函数加密功能是有效的和有效的在大型数据库中(6]。然而,访问模式是泄露在上面的方案。为了解决这个问题,翁et al。7)省略某些查询图像的散列码。因此,云向用户返回所有可能的候选人。因此,查询模式和访问模式受到保护。但所涉及的用户比较候选人的特点和获得一个精确的结果。也很难生成哈希码特征空间中均匀分布。进一步,在向量空间模型中,只有少量的工作,支持高效的索引结构。例如,夏et al。19使用local-sensitive散列(激光冲徊化)构建一个预滤器表,但是候选人的细化结果也是一个线性的比较。因此,它只是达到次线性搜索效率。元等。20.采用k - means构建索引树。由于k - means不是平衡的聚类算法,这是不可避免的生成一个索引树层次结构倾斜。随后,由于索引树的不同部分的深度不均匀,效率往往是次线性搜索。简而言之,在向量空间模型中,要求安全、高效的图像检索机制迄今为止仍然开放。
除了上述方案,基于加密功能,安全提出了直接基于加密的图像检索方案。它是专为广泛使用的JPEG图像。例如,张和程首先使用直流直方图保存在加密的形象特征(21),然后利用AC直方图(22)和一个新的块功能(23)检索。然而,线性比较或基于块的效率比较是不可接受的。因此,建设安全索引树是必要的。
在本文中,我们提出一种有效的图像检索方案在加密的云数据,基于平衡索引树,即。、平衡二叉树(《)。我们引入一个新的平衡的二元聚类(BBC)算法和使用集成特性来构建基础体温。由于这样的事实,本文实现了相似性搜索,我们倾向于利用全局特征(如颜色、形状)而不是准确的本地特性(如筛选、短暂)。因此,我们的集成特性是由广泛使用HSV直方图和DCT直方图5,21,22,24]。我们专注于索引树的建设和保护查询模式和访问模式。至于图像加密,我们采用局部图像加密技术(23,25,26JPEG格式的图像和成熟的加密密码(比如AES)对于其他格式的图像。注意,密钥分发是一个独立的问题,超出了本文的范围。我们的主要贡献在于三个方面:
(1)我们将HSV颜色空间的直方图和DCT变换域中的直方图作为集成特性。为了提高搜索效率,我们构造一个《图像数据库。该剧是由一个自上而下的方法。自从分层索引树大约是平衡的,该方案可以实现对数搜索时间。
(2)通过加入安全内积(即。方面),该剧是加密的安全,该剧(SBBT)由一个秘密密钥,加密和查询功能。图像是由另一个密钥加密的数据库。在那之后,云中的敏感数据保护;同时,可搜索加密的功能特性是仍然有效。此外,查询功能可以盲目的随机数扩展查询模式。
(3)盲目的搜索结果,我们复制数据库和子树重建SBBT合并。减少SBBT和集成特性的加权因素使一个查询图像的搜索结果不是唯一的。因此,查询隐私保护访问模式。
本文的其余部分组织如下。节2介绍系统模型、威胁模型和设计目标。另外,常见的符号定义。节3,我们建议英国广播公司(BBC)算法,使用BBC构建,该剧,采用加密,该剧的方面。部分4提出并讨论了实验结果。最后,我们总结论文部分5。
2。问题公式化
2.1。系统模型
系统包含三方:数据所有者,云服务器和授权用户,如图1。
业主第一次提取特征向量,如HSV直方图和DCT直方图,从每个图像数据库。他们被连接到一个集成的功能。特征提取后,明文图像由一个密钥加密的密文。为提高搜索效率,构建索引树的基础上,综合功能。然后,他利用另一个密钥来加密索引树。安全索引树的叶子节点与加密的图像。之后,业主外包数据库加密的图像和安全指数树到云上。此外,业主将密钥发送给每个授权用户通过一个安全通道。
授权用户提取特征向量从查询图像。获取加密图像的安全索引树,他加密集成查询图像的特征,并将它提交给云。
云存储加密的数据库映像和安全索引树的主人。在收到加密的查询功能,云安全索引树中的执行搜索操作。之后,他返回加密图像检索与叶节点给用户。
2.2。线程模型
我们假设三方遵循semihonest模型,其中任意两个政党不勾结共享信息。然而,即使云不知道加密的内容查询,它可以计算的查询频率相同的加密请求和返回的访问频率相同的结果。因此,根据可用的信息到云,我们考虑两个威胁模型。
已知密文模型。只有云知道加密数据库,查询安全索引树和加密。
已知的背景模型。在这种强大的模型,云背景知识了解查询的频率分布图像。例如,特朗普的照片是非常受欢迎的总统竞选。云可以通过进行统计攻击识别特定图像的访问频率返回图像。
2.3。设计目标
启用安全图像检索加密的云数据在上面的模型中,我们的方案应该实现以下设计目标。
有效性。该计划的目的是支持搜索加密的数据。结果是明文的搜索域一样准确。
效率。在向量空间模型中,我们结构的特征向量作为SBBT图像数据库。而不是线性或次线性搜索效率,我们计划将实现对数搜索时间。
隐私。我们的目标是保护业主和用户的隐私,这是总结如下。(1)数据库及其索引树机密性:即形象和其索引树在云中的密文形式存在。(2)查询隐私:是不可能的,以确定两个请求都来自相同的查询图像。注意,为了缓解计算和通信的过载,我们的目标不完全保护访问模式,即。,SBBT的搜索路径。
2.4。符号
假设图像数据库的总数 。我们常见的符号定义如下:(我) 数据库,即图像的集合(2) 的密文形式存储在云(3) 归一化特性,比如HSV的直方图th形象, ,这是一个维行向量(iv) 归一化特性,如DCT的直方图th形象, ,这是一个维行向量(v) 集成的功能, 、加权因子 (vi) 该剧的指数在每个节点矢量,它是生成的(七) 的高度,该剧对整个图像数据库 , (八) 对应明文密文索引(第九) 的密文形式(x) 查询图像的归一化特征,如HSV直方图(十一) 查询图像的归一化特征,如DCT直方图(十二) 查询向量, 、加权因子 (十三) 加密密钥 是一个随机可逆矩阵, (十四) 相对应的密文查询,明文
再找到查询的形象,我们采用“内在产品相似度”评价之间的距离特性。具体地说,是一个集成的特性数据库的图像,包括HSV直方图和DCT直方图。是查询的图像综合特征。最后的相似性得分了 。基于分数,最相关的图像数据库中返回给用户。
3所示。提出了方案
为了实现对数搜索效率,我们首先建立一个平衡的明文图像数据库的索引树,小说的平衡的二元聚类算法。然后,以确保索引向量的机密性和查询向量 ,安全是用来加密向量内积计算和 。同时,我们采用部分图像加密的加密数据库映像。最后,我们改善方案来增强隐私保护在已知的背景模型。
3.1。BBC算法:平衡的二元聚类
构建平衡索引树,我们需要一个平衡的二元聚类(BBC)算法来找到一个分离向量将每个数据集划分为两个相等(或近相等)集群。然而,传统的k - means旨在发现集群中心,每个点之间的距离的总和及其最近的中心是最大化,而不是相同大小的集群。因此,频率敏感的竞争学习(FSCL) [27]介绍了改进k - means。FSCL是一种良心的算法,将集群作为加权因子的大小使更大的集群不太可能赢得更多下一个迭代点。它可以收敛到局部最小值(28]。尽管集群中心的差异可以作为分离向量 ,FSCL并不确保k集群同样大小的。事实上,它是非常不稳定的在高维向量空间29日]。对比,平衡的k - means (30.]数据集分割成两个大小相同的集群两偶图通过寻找一个完美的匹配。但它不产生分离向量 。因此,我们提出一种新颖的BBC找到分离向量,使得两个集群的大小相等。我们最好的知识,这是第一个工作努力结合FSCL和平衡的k - means达到平衡集群。英国广播公司(BBC)算法的详细阐述了在下面。
鉴于点 ,在th迭代,集群的大小 和集群中心 。英国广播公司(BBC)算法如下。
初始化。我们采用k - means + +选择两个点作为初始中心 。
首先,统一选择一个初始中心从 。
第二,选择下一个初始中心从的概率 , 。
最后,根据初始中心的距离,其他点分为两类 ,这是的大小 。
集群的任务。让新是优化问题的解决方案如下。 在哪里 。一个较小的值 两个向量表示 更相似。
灵感来自于平衡的k - means,我们首先把(1)作为一个线性分配问题(一圈)31日]。矩阵被定义为成本 在哪里 。如果它不是一个方阵,零的列添加到广场。然后,我们采用Volgenant-Jonker (VJ)算法(32,33)找到一个完美的两偶图匹配。最后,如果向量是分配给中心 , 和0。
集群更新。更新聚类中心 ,“选择”变量 ,和集群的大小如下:
集群作业和集群更新重复直到 或 。
输出。上面的三个步骤运行几次与不同初始中心 , 。
由于这样的事实,不同的初始中心可能产生不同的结果,结果两个集群的大小选择最相似的作为最终输出。两个集群的大小相似的定义是
最后,输出 的数据集分可分为两个相等的(几乎相等)集群分离向量 。
3.2。UBBT:未加密的平衡二叉树
在本节中,我们构建《整个数据库。首先,我们生成一个集成的功能为每个数据库中的图像。然后,一个索引向量的根节点或内部节点,该剧是由一个自上而下的方法。英国广播公司(BBC)算法生成单独的图像特征分成两个几乎相同大小的集群,即。, , 。也就是说, 算法1递归地将数据库的特征向量图像分为两个集群,直到没有集群拥有超过两个特征向量。分层索引树如图2。根节点是0和叶节点的水平 。因此,整个索引树的高度 。根节点的子树th索引树的高度 。根和内部节点在我们的《定义如下: 在哪里节点的身份,是索引向量图像在叶节点划分成两个集群和 ,和和是左和右子节点的指针。如果是一个叶节点,它的定义是 在哪里指向的图像。
|
||||||||||||||||||||||||||||||||||||||||||
UBBT的搜索过程从根节点开始。如果 ,我们执行迭代检索左子树,否则在右子树,直到获得叶节点。
3.3。SBBT:安全的平衡二叉树
在UBBT方案中,检索到叶节点的内积的迹象 。为了保护敏感数据和 ,我们使用安全内积(即。方面)(8)加密向量,获得相同的结果作为明文。
首先,主人会生成一个随机可逆矩阵 加密 。用户也使用它来加密 ,即。, 在哪里密文索引和吗是密文查询。此外,JPEG图像是通过部分图像加密(加密的22,25]。因此,索引树是加密的 。的叶子节点与加密的图像。然后,他们外包给云安全的图像检索。检索时,用户提交查询的图像到云上。自 ,云计算可以使用安全索引上执行一个有效的搜索树 。因此,在密文检索结果和效率总是符合明文。注意更多的细节描述方面的(8]。
不幸的是,之间的关系和是确定的。根据同一或 ,云可以计算查询的频率 。此外,根据相同的结果,云也可以访问的频率计数 。因此,如果查询图像和是一个一对一的关系,该方案无法抗拒统计攻击在已知的背景模型。
将查询图像和密文查询之间的一对一的关系 ,我们扩展和如下: 的随机数 , 。因此,相同的查询图像可以生成不同的密文查询通过设置和 。与此同时, 为积极所蒙蔽 。云无法从密文查询可用的统计信息结果 。然而,的标志即使一直保持不变和是不同的,因此检索结果和搜索路径是相同的。请求查询图像的频率可以从相同的访问频率推断返回图像。
为了克服这个问题,我们首先复制图像数据库。店主利用局部图像加密(23)保护明文图像。根据不同的加密密钥,相同的明文图像可以作为不同的加密的加密图像,如图3。同时,业主使用嵌入关键隐藏加密密钥(使用25]。然后,主人与授权用户共享加密密钥和嵌入密钥通过秘密渠道。在获得一个加密的图像,用户使用嵌入提取隐藏数据的关键,选择真正的加密密钥恢复明文图像。
(一)
(b)
(c)
第二,不同的加密图像来自相同的明文图像对应于不同的集成特性。多样性的综合特性,我们使用HSV直方图和DCT直方图作为基本特征。原因是HSV颜色直方图空间和DCT变换域直方图是图像特征从不同的角度。如图4,不同特性的查询图像仍然可以检索相似的图像。为了便于描述,我们定义新的密文数据库 。然后,我们组相应的功能 和对应的功能 。最后,我们使用了BBC算法构建索引树从用人方面作为密文加密明文树树 。
(一)
(b)
(c)
(d)
(e)
(f)
(g)
(h)
进一步增强查询隐私,我们减少索引树的高度和返回多个加密图像查询用户在一个时间。具体来说,我们将内部节点设置为一个新的叶子节点。然后,新的叶子节点包含所有加密图像的内部节点的子树是一个根节点。因为索引树是平衡,减少索引树的叶节点可以指向多个加密图像。请注意,一些图像在子树是相似的,这是一个妥协的有效检索。
3.4。安全分析
我们分析SBBT有关隐私需求在设计目标:
(1)数据库和索引是机密。在SBBT指数向量该剧是加密的由高维随机矩阵是保密到云上。对于数据库中的图像,局部加密可以保护自己的机密性(23,25]。
(2)由于特征向量查询的图像是延长随机数和 ,它可以生成不同的密文查询 。云无法识别相同的查询图像从其不同的密文查询。查询模式是受保护的。
(3)根据不同 ,不同特征的相同查询图像可以检索不同的图像。当等于或 ,不同的结果可以恢复到相同的查询图像。因此,相同的查询图像的检索结果和路径并不是唯一的但检索仍是有效的。云不能链接不同的图像返回相同的查询图像。访问模式是受保护的。
(4)此外,由于SBBT的高度降低,一个叶子节点将指向多个加密图像。它进一步打破之间的一对一的关系查询图像和返回图像。访问模式进一步的保护。
简而言之,SBBT已知密文模型中是安全的,可以抵抗统计攻击在已知的背景模型。
4所示。性能分析
在本节中,我们将展示实验结果和效率的分析,提出方案。当我们知道JPEG是最常用的图像格式和占95%的图片在网络上(34),因此我们采用Corel数据库(10相似性搜索。数据库包含1000 JPEG图像属于10类:非洲、海滩、建筑、公共汽车、恐龙、大象、鲜花、马、山,和食物。他们每个人包括100张图片。(5),我们将图像分成256块和提取色调,饱和度和亮度值的每一块。然后,我们执行分级块聚类特性构建“词袋”模型。视觉单词的使用频率是HSV图像的直方图。(22),图像块的DC / AC系数量化为不同的垃圾箱和量化的DCT直方图是使用频率DC / AC系数。因此,颜色特征和纹理特征是设置为991 -维HSV直方图和780 -维DCT直方图,分别。
4.1。参数设置
首先,我们应该设置参数的和的构建索引树。因为HSV的集成特性组成直方图和DCT直方图,我们首先计算平均直方图相似性的图像在同一类别和不同类别(分别表示为corr-intra和corr-inter),如图5。我们可以看到,corr-intra大于corr-inter的价值;因此,可以区分不同类别的图像直方图。根据corr-intra和corr-inter之间的区别(即。,corr-diff图5),我们组 集成的功能数据库的 。目的是使HSV直方图和DCT直方图对搜索结果有相同的贡献。
为参数的 ,我们希望数据库的索引树可以更好地保护访问模式。我们使用两个不同的指标来衡量隐私保护通过不同 。这两个指标是不同的图像类别的数量在每个子树和每个子树的分类熵。图6显示图像的平均数量类别中包含不同层次的子树。因为根据不同数据库的索引树相同高度的11 (即。,BBC),该算法表现良好。然而,我们可以看到从图6附近的子树的叶子节点包含一个类似数量的图像类别。我们将使用类别熵来衡量隐私。类别熵,定义为 (现有的数量吗一类),是用来衡量图像分类的子树的随机性。从表1,我们知道索引树 最高平均熵在3日至10日级别,甚至类别数在3日至6日平均水平不是最大的图6。因此,我们设置加权系数 集成的功能的数据库 。
4.2。索引树结构
为了证明我们的算法可以分类特征向量以平衡的方式,我们使用平均相似集群大小的比较提出了BBC算法的聚类性能,平衡的k - means (即。Bkmeans), k - means + +, FSCL。平均相似性的基础上(5)被定义为 。从图7,我们可以看到生成的索引树提出了英国广播公司(BBC)算法,Bkmeans, k - means + +的高度和FSCL 11日12日13日和16日。索引树的高度越小表明该算法可以分类特征向量为两个集群索引树的每一层更均匀。图7表明FSCL是最不平衡的集群大小在1日到11日的水平。有两个原因:首先,加权因子的变化会影响聚类结果的稳定性,第二个是价值的加权因子影响集群中心和其他特性之间的距离向量。相反,由于良心加权因子的使用,该算法执行比Bkmeans和k - means + +,结果比FSCL要好得多。原因是两偶图匹配机制约束平衡的两个集群和限制重量的影响因素。简而言之,体重因素仍然是有效地提高集群的平衡。事实上,以上结果也是相似的数据库不同 。
进一步,我们采用邓恩指数(DI) (35)来评估提到的聚类算法。邓恩指数被定义为 的分子是最小距离向量在不同的集群和分母是within-cluster最大的距离。因此,我们可以知道,当分离两个点为两个集群,分母为零和DI是无限的。迪高价值意味着良好的密实度。表2显示了最小DI每个层次的聚类结果。在相同级别的索引树中,BBC的DI小于其他算法(即。Bkmeans k - means + +,和FSCL)。与此同时,BBC的DI的最后水平比其他算法小得多。显然,英国广播公司(BBC)算法,提出集群大小的相似性比集群密实度与更高的优先级。
上面的算法使用MATLAB实现PC与英特尔酷睿i5 3.2 GHz CPU和16 GB的RAM。索引树建设时间消耗如表所示3。特别是,我们执行30倍用随机初始聚类中心和选择得分最高的集群大小相似的结果。Bkmeans是最耗费时间的,因为它不是为了找到一个分裂的矢量数据集均匀。相比之下,提出了BBC成本最少的时间。
4.3。检索性能
评价检索性能,Corel数据库中的每个图像被选中作为查询的形象。检索性能评价平均precision-recall (PR)曲线,即。, 图8(一个)比较了公关曲线根据不同查询的功能值。可以看出,不同的性能实现高精度当回忆属于(0,0.05)。此外,当只有一个图像被返回,即。、回忆= 1%的精度 或0.6是100%。是我们组的原因作为或 。虽然两个查询图像的集成特性不同,检索结果不同的加密版本相同的明文图像。因为查询功能,相应的结果,搜索路径不同,查询图像的统计信息是受保护的。
(一)
(b)
图8 (b)显示的检索性能与不同高度减少索引树。可以看出,精度随索引树的高度,即使是设置为0或1。此外,图9显示的平均最大高度减少索引树,叶子节点包含的查询返回的图像。可以看出,减少索引树的高度是11时是设置为0.1或0.6。如果设置接近0.1或0.6,降低了索引树的高度接近11。高度为9时,最准确的查询图像检索减少索引树和一个搜索返回四(22)图像。幸运的是,如图8 (b)精度约为70%,9日的索引树。因此,检索仍然是有效的。
4.4。隐私保护
我们从两个方面:考虑到隐私保护查询模式和访问模式。因为查询功能是一个综合柱状图,即。, 。不同的对应于不同的查询功能。此外,即使决定,该功能将延长随机数 作为 。因此,加密的功能 。显然,一个查询图像的加密特性并不是唯一的。每个查询的查询模式图像保护。
为了保护访问模式,查询图像的检索结果应该不是独一无二的。我们已经建立了一个索引树基于原始数据库的特点( 复制数据库(的)和特征 )。然后,不同的集成特性用于检索的索引树。我们知道,返回的结果是一个索引树的叶子节点和叶节点表示不同的访问路径。所以,我们定义一个路径隐私评估访问模式的保护水平
可以通过使用不同的搜索路径的查询特征不同 。数据10 ()和10 (b)显示不同的路径的隐私 ,在哪里 和0.6分别基线。可以看出,隐私是100%设置为0.6图吗10 ()和0.1图10 (b)。原因是检索是单独进行向左或向右子树的根节点。图10 ()还显示,搜索路径时在同一根节点的子树设置为0.6,0.8,或1。的搜索路径 或1仍然是不同的 如图10 (b)。同样的,当设置为0,0.0025,0.05,0.075,0.1,0.3,0.35,搜索路径是相同的子树的根节点,但仍然不同。此外,当设置为0.4,搜索遍历根节点的子树。此外,隐私的路径与树的高度增加。简而言之,访问模式可以通过设置不同的保护 。请注意,使用的频率不同可以优化基于查询的频率分布图像。
(一)
(b)
总之,表4比较该方案与其他方案的搜索效率,查询模式保护和访问模式的保护。我们比较不同方案的搜索效率的理论分析,而不是实验。原因是加密的图像检索方案是基于不同的图像数据库根据应用程序。同时,一些方案利用加密图像的特性,但是其他方案采用散列码图像的特性。
计划在向量空间模型中,如元(20.),导致斜索引树 搜索时间。夏(19)使用local-sensitive散列(激光冲徊化)构建一个预滤器表。然后,与相应的图像特征,候选人的云进行细化的结果。因此,它是一个次线性方案。程(22,23不建立索引树,所以检索效率 。翁(6,7)使用一个哈希表来提高搜索效率(即。, )。简而言之,索引树或哈希表是一个空间和效率之间的权衡。尽管翁的计划(7)和方案保护查询模式和访问模式,散列码和特征向量,分别使用。具体来说,翁(7)省略了一些散列码的用户查询图像和返回多个候选人进行细化。用户参与完成检索和获取准确的结果。在我们的方案中,用户可以设置作为或通过不同的路径来检索精确查询图像。与[7),我们的计划不需要用户参与特征比较。然而,为了保护用户的访问模式和减轻计算负担,我们复制图像数据库和花费更多在云中存储空间。幸运的是,检索效率 。
5。结论
介绍了一种安全、有效的图像检索方案在加密的云数据。在这个方案中,我们提出一种新的聚类算法,即。、英国广播公司、建立平衡索引树,即《生活。因此,我们的计划可以实现对数搜索时间。首先,以支持有效的密文图像检索,我们雇佣ASPE加密图像数据库的索引和查询的功能形象。在这种情况下,提出SBBT已知密文模型中是安全的。其次,抵制统计攻击已知的背景模型,我们复制的数据库和建立一个新的SBBT原始数据库和复制的数据库。之后,调整加权系数的综合功能,查询图像的搜索结果是不同的叶节点。最后,通过合并SBBT的子树,新SBBT的叶节点包含多个加密图像。因此,查询图像和返回之间的一对一的关系图像坏了。简而言之,SBBT可以保护查询模式和访问模式。此外,BBC和SBBT可以作为独立的加密文档检索工具。
在未来,我们将改善方面,支持多用户场景中,一个不诚实的用户可能试图揭示其他用户的加密的查询。这也是一个有意义的工作来生成一个通用的、高的语义特征。
的利益冲突
作者宣称没有利益冲突有关的出版。
确认
这项工作得到了国家自然科学基金(U1636206, 61602295, 61525203, 61472235),上海市曙光学者计划(sg36 14日),上海优秀学术领袖计划(16 xd1401200)、福建省自然科学基金(2017 j01502),和福州大学的科学研究基金会(510483)。