文摘

客户使用外包的主要业务挑战计算和存储数据的损失控制和安全。所以加密在不久的将来将成为一种商品。有大扩散上述场景:利用当前应用程序的完整功能同时确保他们仍然保护敏感数据和客户的控制。之前双方取得有效的进展令人满意的工作。但是仍有一些技术上的挑战,比如支持文件或基于位置的应用程序和支持全文和高级搜索。本文基于新颖的安全代理加密数据搜索计划,叫做Enc-YUN提出,透明地建立反向索引在数据流时的安全代理传输到云上。和搜索首先发生在指数对应的映射结构和检索的加密数据在云中代表客户端。使用这种方案,updated-to-date全文搜索技术可以很容易地集成实施最先进的搜索功能,同时,保持最强的级别的数据保护从好奇的供应商或第三方。实验结果表明,Enc-YUN有效大类云应用,性能开销诱导是次要的和可接受的根据用户的感性经验。

1。介绍

专业化和外包使社会更加高效和可伸缩的、和计算是没有不同的。根据思科全球移动数据流量报告1云应用程序),占总移动数据流量的83%,2015年到2019年将占到90%。客户使用外包的主要业务挑战计算和存储数据的损失控制和安全,特别是在关键任务应用程序或隐私的应用程序。

一个有希望的解决方案是加密,只提供加密的数据到云上。然而,存在扩散:利用当前应用程序的完整功能同时确保他们仍然保护敏感数据和客户的控制。以数据搜索为例;客户还能搜索内容基于加密的数据?

针对上面的问题,当前的努力可以概括分为两类:第一种方法关注的是可搜索的加密算法(SE) (2),允许数据所有者委托搜索功能的云提供商没有解密的文件。然而,这种方法应该修改遗留云提供商的接口采用SE图书馆。和关键字粒度的搜索功能是有限的。第二种方法经常使用一个代理,即数据安全代理,而透明的云应用程序和用户之间,拦截关键数据传递到云之前,代之以随机的令牌或加密值云的意义。

本文提出了基于安全代理的体系结构来保护数据隐私和搜索加密的数据,称为Enc-YUN,建立反向索引(3]地图数据传输和数据在云中,索引和搜索首先发生在然后检索相应的加密数据在云中代表客户端。使用这种方案,updated-to-date全文搜索技术可以很容易地集成实施最先进的搜索功能,同时,保持最强的级别的数据保护从好奇的供应商或第三方。

然而,天下没有免费的午餐。使用上面的计划,一些技术挑战仍有待解决,可以总结如下。

在遗留应用程序上没有修改。实际上,重写或修改应用程序为了实现可搜索的数据加密算法为应用程序提供商永远是不可能的。代理位于应用程序和用户之间,它可以拦截之前用户的明文信息转移到应用程序之前,将密文转换为明文的信息发送给用户。用户应该信任代理部署到用户的前提。代理和敏感数据在用户的控制,即使代理通过拦截用户数据云服务。事实上,代理各种云服务透明地提供一个适应能力,无需修改,甚至牺牲可用性。

虽然被Non-Custom-Crafted支持更多类别的应用程序。Enc-YUN,有必要识别应用程序的协议来确定应用程序是否需要加密协议的内容和语义分析获取敏感数据的位置需要加密。然而,大量的各种各样的SaaS应用程序需要分析这是一个巨大的挑战!Enc-YUN应该支持流行的SaaS应用程序尽可能多的但不应该分析协议的应用程序。然后,我们分类的SaaS应用程序,协议分析典型的应用程序在每个类别。如果一个新应用程序需要保护,Enc-YUN找到相应的类别,只需要改变更少的代码。在未来,我们将调查机制,完全自动化分析协议的应用程序和语义内容的协议。

选择性和可搜索的数据加密。首先,如果我们将加密协议的所有内容,这将导致服务器端应用程序解析数据的错误,并且可能导致拒绝服务。和SaaS应用程序数据的格式,如电话号码和电子邮件需要验证了云服务。因此,这些数据也不应该被加密的影响SaaS应用程序的功能。第二,关键词搜索是一种常见的操作在SaaS应用程序中,但它通常是不切实际的客户机上运行,因为它需要大量的数据下载到用户的机器。虽然存在实际加密方案的关键字搜索,他们要求云提供商修改或重写应用程序代码和接口。

Enc-YUN面临的挑战是如何实现有选择性的和可搜索的数据加密。Enc-YUN可以确定哪些数据应该加密策略相关的属性数据。这极大地保留了云服务的可用性和用户体验。

在本节中,先前的工作已经系统化和总结成两部分。第一部分主要是关于搜索的数据加密算法,用户可以搜索文档没有解密。客户端控制搜索加密的数据清晰地阐述了在这一节的第二部分。这种方法通常是由代理叫做实现数据安全代理拦截关键数据传递到云之前,代之以一个随机牌或加密值。

2.1。可搜索的数据加密算法

传统的密文搜索技术可以概括为两种典型类别。

线性搜索依次比较密文的话说来确认关键字是否存在,该关键字的频率计数。例如,歌曲等。4)提出了一个解决方案基于搜索的对称密钥加密(SSKE)计划采用流密码加密方法字符数据。

安全基于索引密文搜索建立一个关键词索引(5)根据文档然后加密上传索引和文档到云上。和关键字将从指数进行比较,而不是整个文档。基于这种方法,Boneh et al。6)提供了一种方法,即公钥加密与关键字搜索(油漆)7,8),这样接收者搜索关键字由发送方发送的文件。和Agrawal et al。9在IBM研究中心提出了一个保序加密方案(op)算法(10]在加密过程中为了保持值。

然而,上述常规密文搜索方法提出基于云提供商的前提需要改变现有的云服务的接口。事实上,供应商很难在实践中要做到这一点。

2.2。客户端控制搜索加密的数据

代理是云提供者和用户之间的中介,加密和保护用户的敏感数据。考虑几个部署的位置代理基于一个简化的典型的SaaS应用程序的体系结构,概述了在图1

2.2.1。在应用程序的客户端和用户之间

代理可以在点(图加密数据1(一))在应用程序代码(包括客户端代码)可以访问它。应用程序可以只使用加密的数据视图。

他等人提出了一个通用的解决方案是ShadowCrypt [11为加密文本数据为现有的web应用程序。ShadowCrypt运行浏览器扩展,替换输入元素与安全页面,孤立的影子投入和安全加密文本,孤立的明文。根据图2在移动应用,ShadowCrypt不能加密数据。和图3显示文件数据由用户上传到Dropbox并不是存储在DOM节点。因此,ShadowCrypt不支持加密文件数据。此外,它只适用于多个web浏览器Chrome和Firefox等PC平台。

模仿“宙斯盾”(12),适用于移动平台不仅提供了隔离,而且保留了用户体验通过创建一个概念层称为层(l - 7.5), 7.5的是介于应用程序(OSI层7)和用户(第8层)。然而,模仿不支持加密文件数据。

2.2.2。在应用程序的客户端和网络之间

代理也可以部署在点(图1(b))来加密数据后应用程序的客户端(即。JavaScript / HTML)将数据发送到云服务。因此,我们可以采用扩展的浏览器和代理的代理。

Virtru [13)提供了一个浏览器插件执行邮件加密,这样网络邮件提供商如Gmail看不到清晰的用户数据。但Virtru少数网络邮件只提供一点解决方案提供商,不推广到其他web应用程序和移动应用程序。

聚酯薄膜(14)是一个扩展的流星JavaScript框架为构建应用程序加密所有数据发送到服务器。开发者需要编写他们的应用程序在流星(影响向后兼容性),告诉聚酯薄膜哪些数据需要加密。

3所示。Enc-YUN:证券经纪人搜索基于加密的数据

有三种不同的政党Enc-YUN:用户,安全代理,和云计算服务。Enc-YUN旨在保护用户的机密数据被黑客攻击或由云提供商拦截。

3.1。体系结构

Enc-YUN如图的架构5。Enc-YUN由下面的五个组件。

解析器。它截获数据发送到从服务器,它负责识别应用协议和分析语义内容之间的协议用户和云服务为了获得哪些数据需要加密或解密。它支持多个应用程序协议和各种数据格式。根据图4,代理也可以拦截用户之间的安全通道,如SSL / TLS和云服务器。客户端设置SSL连接代理,代理建立另一个与云服务器的SSL连接。代表客户的经纪人工作,深受客户信赖,即使它解密客户发送的原始数据。

加密。它支持选择性和可搜索的数据加密和集成等加密算法AES和DES加密要求。从键管理器之前加密或解密密钥,保护用户敏感数据与分布式密钥。

搜索者。它将转换为密文搜索元数据的元数据管理器。搜索器接收来自用户的搜索关键词和搜索内容缓存,存储机密数据,并将结果返回给用户。

发射机。它负责从用户云服务和数据传输加密数据从SaaS应用程序的用户。

键管理器。它执行生成、存储和管理密钥用于加密或解密。

元数据管理器。它存储和管理元数据。

3.2。应用程序分析

Enc-YUN不仅支持流行的SaaS应用程序尽可能多的但也不分析协议的应用程序。关于协议的识别和语义分析SaaS应用时,我们遇到了两个挑战:(我)如何实现自动适应新的应用协议如果有各种协议吗?(2)如何实现协议的匹配时不改变代理协议变化?

SaaS的应用可分为以下类别:电子邮件、云存储、CRM、ERP、office 365,社会类别等等。每个类别的两个典型应用协议的分析,我们可以发现基本协议是一样的。

2提出了协议的内容发送邮件。Enc-YUN可能获得的属性和内容的数据通过分析这个键值的典型格式。例如,“主题”是指邮件主题和“content_html”是指邮件内容。然后Enc-YUN加密邮件的主题和正文的内容。此外,图3显示了云存储应用程序采用多部分格式的文件上传内容。用有限状态机和解析器解析内容,加密数据,组装成新标准多部分的格式,然后将请求转发给应用程序。我们实现了协议适应和语义识别典型的应用程序根据其类别。如果添加新应用程序是必要的,我们只需要找到应用程序属于的类别,实现保护敏感数据的新的应用程序代码修改。

与此同时,我们将维护一个应用特征库更新。表1显示了QQMail在图书馆的一些特性。如果协议的应用程序更改,应用特征库更新的协议特性和规则应用程序的语义分析。和Enc-YUN可以获得敏感数据的新位置,提取数据,加密数据同步功能库。

3.3。选择性和可搜索的数据加密

云服务将返回错误消息当收到请求数据从用户加密或不正确的格式。和传统的关键字搜索加密的数据是无效的。有选择性的和可搜索的数据加密15对Enc-YUN)是另一个挑战。

用户有选择的权利,如果他们想要的数据加密,可以设置一些政策来控制数据应该加密和数据应该保持清晰。Enc-YUN根据相关政策进行选择性加密机密数据的属性。

代理部署在企业或组织的内部网络由用户控制。获得控制敏感数据的加密密钥,允许选择性数据加密的更新策略,和元数据的访问,为用户代理是可信的。Enc-YUN下,用户得到的控制敏感数据存储在SaaS应用程序中。

然后本文提出了一个基于代理的密文搜索方法。密文搜索的架构图所示6:(1)用户关键词搜索请求到云应用程序。(2)代理会拦截这个请求,并接收来自用户的关键字。然后,对本地索引搜索执行查询。(3)本地索引,存储一个反向索引关键字映射和数据在云中,返回所有关联的元数据的代理。(4)代理将结果转发给用户。(5)用户根据元数据检索加密数据或记录ID的身份加密的数据在云应用程序。(6)云应用程序返回加密数据包含关键字到代理。(7)代理截获和解密密文,然后返回明文给用户。

3.4。键和元数据管理

加密用户之间的数据共享变得非常困难,因为用户不分享他们自己的私钥。Enc-YUN解决这一挑战的关键。每个用户都有一个私人/公共密钥对。键管理器存储用户的私钥加密,用户的密码。加密加密敏感数据时,键管理器生成一个随机的文件密钥用于加密数据。和Enc-YUN创建一个包装的关键:一个加密的file-keys用户的公钥。如果爱丽丝想与鲍勃,分享敏感文档需要授权的Enc-YUN获得私钥的爱丽丝打开包装的关键并创建另一个包装关键鲍勃的公钥。因此,鲍勃将明文的文档共享通过爱丽丝打开包装关键与他的私钥。

元数据链接应用程序功能和加密的数据是至关重要的,当用户在Enc-YUN授权Enc-YUN之外的另一个用户来查看加密的邮件和文件。邮件的元数据主要包括组件,如邮件id发送方id,收件人id,附件id、密文id,等等。

4所示。评价

在本节中,我们讨论Enc-YUN的性能开销。我们进行了测试在一个英特尔2.5 GHz×2和2 GB的RAM。和我们做了一些对比测试的情况下,云存储和邮件应用程序之间Enc-YUN和Enc-YUN。测试可以估计的性能Enc-YUN从Enc-YUN带来的耗时。

7显示发送和接收邮件在Enc-YUN比在正常网络网络开销。因为代理的代理成本之间建立连接用户和云服务,Enc-YUN承认协议的时间和分析语义数据从用户在整个请求完成一小部分时间。这表明该算法Enc-YUN协议识别和语义分析的效率。然而,还有其他很耗时的事情除了解析器和加密。的时间可能会被其他模块Enc-YUN。我们相信如果每一个模块的时间成本会减少Enc-YUN具有良好的性能。和图8礼物的时间百分比上传小文件或文档Enc-YUN外接近正常上传文件的时间。但更大的文件,它将消耗的时间。这表明Enc-YUN的性能取决于代理的性能。表2列表输入字段的数量为每个页面需要加密,加密和解析器增加成本的估计时间以微秒为单位。在页面加载浏览器在几百毫秒。Enc-YUN引发的性能开销小,可根据用户的感性经验毫秒级别。

我们还测试了Enc-YUN各种流行的SaaS应用程序,如Salesforce、Gmail、Google Drive。和应用程序的消息是唯一类型的应用程序Enc-YUN不能加密数据,因为应用程序加密的协议供应商。加密数据时总是影响一些应用程序的功能,我们发现,对于一个广泛的应用范围,加密数据仍然突出的功能。从表可以看出3Enc-YUN支持更多的语义丰富的功能,因为Enc-YUN搜索本地索引和保持正常的信息检索的功能。所有的上交所计划关注text-formed数据不管现实中复杂的数据结构。然而,Enc-YUN支持XML、JSON、关系数据库模型,等等。因此,实时搜索Enc-YUN也比公司KPR [16]和KP [17)计划。

5。结论和未来的工作

我们提出Enc-YUN,透明加密机密数据的系统,支持选择性和可搜索的数据加密。没有任何修改的云计算和应用,密文搜索可能发生在Enc-YUN。此外,Enc-YUN有能力支持越来越多的应用程序协议识别和语义分析。

Enc-YUN的贡献在于实现实际的密文搜索提供一个新的视角。Enc-YUN安全的基础设施和使用界面设计提供依据实施各种各样的加密方案。从长远来看,我们将努力提高转换的性能大文件和我们的目标是支持更多自动化协议检查和智能协议分析。

相互竞争的利益

作者宣称没有利益冲突。

确认

本文由中国国家高技术研究发展计划(863计划)资助。2015 aa016001,中国国家自然科学基金批准号下61370068,在山东省创新项目批准号广东省2014 zzcx03411,摘要产学研合作项目批准号下2016 b090921001。