文摘

因为数字取证变得越来越受欢迎,越来越多的受到关注创意和有效性的数据,和数据保护技术应运而生。然而,当前数据保存模型和技术只是加密技术的组合,还有一个被攻击和破裂的风险。和数据保存的过程中,还需要人工参与,这可能会导致数据篡改。解决问题,本文提出了一种基于区块链数据保留模型和多维散列。合同中分散和智能区块链的特点,数据可以自动保存没有人类参与形成一个分支链单位保管的情况下,和区块链antiattack性能好,这是所谓的51%的攻击。与此同时,为了解决数据混乱和难以查询的问题过多造成的情况下,哈希,密码学,和时间戳是用来形成一个序列化的主链的监护权。因为散列和司法审判的冲突问题需要绝对保证数据的真实性和有效性,多维散列是用来取代常规的散列。通过这种方式,数据保存成为一个自动的,nonhuman-interventional过程。实验进行了显示该模型的安全性和有效性。

1。介绍

高智能技术的发展,终端的表现像智能手机和平板个人电脑变得越来越好。在这种情况下,越来越多的罪犯使用这些智能终端来犯罪,导致数字取证的外观。自数字数据很容易创建、存储、传输和使用,数字取证的数据也很容易被修改和改变法医调查;是至关重要的数字证据的原始性和完整性保证。因此,我们需要保证数据的完整性和可信性。

随着技术的发展,像数据保存,如加密、信息隐藏、数字签名、时间戳、数据消化,和编程,数据保护犯罪现场调查近年来增长。例如,数据保护有助于维护司法证据的调查和法院(1]。这项技术也被应用在许多其他领域,如保护隐私数据云应用程序(2)和无线传感器网络应用程序(3]。这种技术可以提供许多优势:证据数据保存完好和冷冻,保存的过程是自动的和不干扰,评估和测量可以独立于犯罪现场进行访问(4]。增加技术的发展,越来越多的技术可以用于数据保护,性能会更好,成本将会更小。

最受欢迎的方法进行数据保存数据加密和数据的结合消化(5]。作者写了一篇关于这种方法(6]。这种方法使用了对称和非对称加密算法加密数据,结合了时间戳信息与数据,然后生成哈希摘要散列算法。通过这种方式,当数据被用于司法目的,调查人员可以使用相同的方法在相反的顺序来验证是否操纵数据。尽管有这些好处,在数据保存方法有一个致命的弱点,那就是所有的调查员,执行的过程,没有人可以保证调查人员不会有意无意犯错。在这一点上,作者访问了执法人员和技术专家在数据保护部门和讨论需要数据保存方法的实际应用。执法人员和技术专家表示,数据保存过程是否能保证数据的原始性和诚信是最重要的。除了在整个生产过程中,人们不能干预也很重要。

因此,在本文中,我们提出一个安全,高度自动化,nonhuman-interventional和可扩展的数据保存为数字取证模型。这个模型使用多维散列算法的信息设备的识别、用户信息和时间戳,形成主链的保管和使用区块链技术形成一个交叉分支的保管链有效地保证数据的安全。

本文的结构如下。相关工作部分介绍了数据保护的研究成果,给出了基本概念和技术背景部分关于技术用于该模型。部分的模型,描述的细节描述和施工过程,评价一节介绍了实验结果证明模型的有效性和效率。

有一些工作区块链进行数据保存,但很少用于数字取证工作。

Kishigami和他的同事们设计了一个基于区块链的内容分发系统,可以保证供应商的原始内容(7]。丹尼斯和欧文提出了一个基于区块链的声誉系统保证用户的声誉评价是基于真实的行为,而不是制造(8]。Ferrag和他的同事们提出了研究领域的安全与隐私问题挑战绿色IoT-based农业、农业他们描述一个分层架构,给了一个分类的威胁模型,并讨论了未来可能的研究方向9]。嗯阿哈提卜和他的同事们写了一本书,区块链技术可以被纳入新系统,以促进现代数字取证和事件响应10]。

瑞和他的同事们想出了一个anticounterfeiting系统基于区块链这写信息到一个anticounterfeiting芯片(11]。气夏只是解决了医学数据共享系统中的访问控制问题,设计一个基于区块链数据共享计划,允许每个人都读取数据从数据共享系统识别后(12]。徐用和他的同事们提出了一个数字版权管理方案基于区块链的网络媒体管理生产、出版和权利(13]。交给梁和他的同事做了一个分散的和可信的云数据起源架构使用区块链来防止数据被篡改(14]。李Zhaosen和李彩虹数字取证(提出一个优化的数据存储方法15]。徐Lei设计了一个分散的、可核实的和antitampering云取证系统(16]。

虽然很多工作已经完成数据保存,没有数字取证模型或方法。所以,问题如下:(1)自动化水平低的过程中保存的数据(2)风险等级高的过程中保存的数据(3)缺乏安全保证数字数据(4)缺乏相互信任

只有解决以上问题,法庭会承认数据的验证,如果有任何可能性,显示了数据可能被操纵,调查人员将失去信誉在法庭上,基本上是不可能回来的。

尽管很多学者一直在研究与数据保护方法,没有一个安全的,自动的,不干扰,nonhuman-interventional保存数据的方法。

3所示。技术背景

本节概述的相关技术进行数据保存,它可以提供足够的背景信息来理解概念和术语。

3.1。区块链

区块链实际上是一个分布式分散的数据库提供拜占庭容错分布式存储、共识机制(17),点对点(p2p)网络,加密算法,等等。与传统的集中式数据库管理相比,例如,通过给完全权威数据库读写一个公司或管理员,区块链允许任何节点能力成为一个因为权力下放和trustfree区块链网络的成员。一旦区块链网络的节点成为一个成员,它有相同的权限读写数据库作为其他节点,和所有的节点保持网络联系在一起。和区块链网络中所有节点同步对方的信息通过协商机制,以保证数据的一致性和可靠性区块链网络。

如今,区块链技术是使用最广泛的领域的金融,和很多的商业银行,金融机构,甚至政府开发区块链技术。国内外最受欢迎的区块链技术包括比特币,Ethereum [18],涟漪[19),和织物20.];他们的主要技术框架和工作流程基本上是相同的;差异是在机制方面的共识,令牌机制、容错、和应用场景。

1比较一些主要区块链架构n代表验证节点的数量。

根据表1,我们可以看到,比特币和涟漪都不支持智能合同,和聪明的合同是非常重要的在我们的模型中,事务可以深信不疑地执行没有第三方参与。没有智能合同区块链可能导致数据保存数字取证的信任问题。和Ethereum不支持试听这意味着数据保存在模型不能被法院在必要的时候。所以,我们选择Hyperledger,也称为织物,区块链的基本结构。

3.2。哈希

哈希表是一种数据消化技术。它可以将任何长度的输入转换成固定长度的输出的散列算法,和输出叫做散列值。从本质上讲,哈希是一个收缩映射函数,这意味着散列值的空间通常远小于输入的空间。

散列广泛用于数据保护,因为它几乎是不可能找到相反的法律。当一个哈希函数或散列算法具有以下特点,我们说函数或算法是安全的。(1)单向计算:对于任何给定的输出,不能计算原始输入(2)防撞攻击:任何两个不同的输入信息,计算后的输出是不平等的

如果输出长度的哈希算法n,安全单向计算的复杂性是2n,防撞攻击的复杂性 然而,哈希冲突不能完全预防。一个已知冲突的CRC32函数得到相同的输出,输入“plumless”和“buckeroo”,在图所示1。这意味着我们需要找出一种方法来减少冲突的哈希函数,将在下一章讨论。

为了避免冲突问题在散列算法,我们替换与多维哈希散列算法。常规的散列算法将目标内容变成一个序列,而多维散列将目标内容变成一群多维序列。定期哈希和二维散列为例,如图转移的进展2。与n维哈希冲突率迅速下降到一个2nth的原始值。

3.3。加密和签名

密码学的一个重要技术时的安全。在数据保存,也使用加密算法,包括对称加密和非对称加密算法DES和RSA。通常,使用对称加密加密数据,以防止他人操纵,和非对称加密使用签名确认的关键数据属于某人或提取一些设备。通过这种方式,可以保证数据的原始性。

数字取证需要处理整个数据在目标设备,这意味着有很多类型的数据需要复杂和多样化的存储类型。也有巨大的数据存储的安全风险,和集中存储无法避免损害和损失的问题,使系统不完全可靠。同时,获取验证结果的时间太长,用户及时得到结果。所有上述情况,我们提出一个基于区块链的数据保护方法和多维哈希解决问题在数据保存数字取证。

4所示。模型

发达数据保存模型通常构建一个基于区块链链的证据保管或加密,这可能存在安全风险51%的攻击。一旦攻击者优惠51%攻击区块链技术的障碍,整个托管数据链是暴露和数据是无效的。

因此,本文提出了一种新的数据保存模型组成的两个相交的证据保管链,一个是主链链,另一个是分支。分支链建立了基于区块链单元的情况下,和每个进程的情况下生成一个节点的分支链。所有头节点的分支链主链形式基于多维散列。的体系结构模型如图3

在图3分支机构保管链中,节点1 - 4表示数据节点生成的原始数据上每个操作之后,这些节点,其他节点,由一个Merkle区块链的树。主要保管链系统中的时间戳的时候生成的节点。

提出了模型的优点是显而易见的。首先,双重保管链加强数字数据保护和确保数据不同的情况下分离和noninterfering。第二,攻击者需要突破主链和支链来获得数据。因为数据不同的病例都与主链,它是比较困难的攻击者定位目标数据。最后,如果攻击者突破了连锁店,他们仍然需要解密数据,只能操作,而其他数据仍然是安全的。

4.1。应用场景

描述了模型之前,我们需要描述数据的应用程序场景保存模型。

该模型可以转换成一个独立的应用程序中,数据安全系统和系统是基于B / S架构如图4。从目标设备提取数据后,原始数据是自动打包和发送到服务器进行进一步的处理和冗余服务器进行备份。和分支链服务器散列数据和其他信息来获取散列集,和散列集是用来建立一个区块链链作为一个分支。所有头节点分支链构成的主链后按时间顺序由加密处理。

4.2。根据区块链分支链

与其他区块链平台架构设计相比,计算能力、应用场景中,在表和合同支持1作为一个财团区块链,Hyperledger(也称为织物)可以支持应用程序更好,所以我们选择织物作为基本区块链结构。然而,织物不支持动态增加节点,所以我们首先需要解决这个问题。

4.2.1。准备网络节点的动态添加

当前织物可以同时工作的验证节点数量是固定的,但网络扩张性能很差。虽然有一个新的验证节点需要加入网络,参与共识,面料需要切断所有共识验证节点活动的活跃,更新配置信息和新节点信息统一验证节点,然后重新启动消息广播,区块链交易的过程,和一致的服务。这种情况下绝对不允许在数据保存数字取证。当验证的共识活动节点切断,攻击者可以利用这段时间来篡改数据,这将导致数据丢失创意和有效性。在这种情况下,我们需要拿出一个解决方案,以避免切断共识的活动。

我们的解决方案,如图5,是治疗动态访问特定类型的事务。当一个新节点申请成为新的验证节点,新节点应该得到注册和验证会员服务管理节点,在那之后,新节点的动态加入和退出由触发某些类型的事务。

根据图5、新节点首先注册和认证会员管理节点。后,新节点与牵引节点建立链接与他人沟通。然后,新节点添加事务信息发送给验证节点触发共识的过程。共识后与其他验证节点,每个节点开始更新信息模块和重建新的广播模块的共识。通过这种方式,新节点获得同步数据,同步后,新节点正式加入区块链网络。

4.2.2。程序的分支链

整个过程如图6

为了将数据与设备更紧密地绑定到证明数据的原始性,模型需要更多的信息,包括设备的唯一标识信息,用户身份信息和操作信息不仅仅是数据和时间戳。

首先,散列数据 ,获得独特的识别信息,如MAC地址或IMEI号码,时间戳,当前用户,和操作信息,结合 所有这些信息转化为一个字符串。根据存储设备和安全需求的实际情况,选择散列算法的尺寸和数量计算哈希值集。图像数据存储在数据服务器的散列值设置为地址。

第二,哈希值发送到分支链服务器设置为一个新事务的数据,然后验证真实性和有效性后,节点将数据区块链上创建一个新节点。

第三,如果节点代表一个全新的情况下,一个案例显示ID生成定义的规则和时间戳。分支链服务器将生成一个新的区块链根据用例ID和时间戳,然后新节点被添加到新区块链。如果新节点属于一个存在情况下,ID和时间戳将获得确认这区块链应该附加到新节点。

最后,当新节点进入区块链网络,动态节点触发方案。节点最终成为某一链的一个节点。

4.3。基于多维散列的主链

主链的建立过程如图7

从图7,我们可以看到,ID和时间戳信息是首先从第一块中提取现有的分支链。和多维应用哈希散列值集。然后,生成一个随机密钥来加密这个信息,加密后,信息存储根据散列值设置。使用公钥基础设施保护随机密钥和执行数字签名。所有这些之后,哈希值集和随机密钥加密相结合,形成一个新节点添加时间戳。最后,新节点插入到主链按时间顺序的时间戳。

为了说明多维散列的好处,我们分析冲突率,失败率和存储效率。

我们假设 是一个n维哈希函数和冲突率的一维哈希函数是什么 ,然后它可以得出的结论是,冲突率的n维哈希函数如下: 在哪里 调整系数,这是由哈希函数之间的相似性。从公式(1),n维哈希冲突 小于一维的散列。

失败率填充率和冲突率有关。我们假设填充率 和冲突率 ,然后失败率

如果一维哈希的填充率也 和冲突率是 ,然后失败率

我们可以(4)和(2)和(3)。

, 只有在 , ,这意味着n维散列在失败率有更好的性能。

存储效率可以度量平均存储时间,和平均存储时间可以表示为 在哪里 计算时间的散列值和吗 是实际的访问和存储时间。如果维哈希的失败率 ,然后平均存储时间

和二维散列的平均存储时间 因为我们已经知道 ,小于 从公式(1)和假设 ,我们可以得到,

结合之前的分析,我们可以得到的 ,这意味着二维散列的平均存储时间是99%的一维散列在最坏的情况下,在最好的情况下,这个数字是1500%。

5。评价

如之前所述,我们选择织物的基本区块链架构,并v0.6.0-preview版本。和实验运行在集群16-node商品。每个节点都有一个核心- i5 - 3365 3 GHz CPU、16 GB的RAM, 1 TB的硬盘驱动器,并运行windows 7和连接到其他节点通过1 GB开关。

首先,我们做一些编码在Visual Studio 2010中测试节点的动态添加,如图所示8

由于模型是用于数据保护,我们专注于模型的容错和安全。评估模型的弹性和可靠程度崩溃失败,我们运行测试织物相比Ethereum和平价和二维和三维散列与c#哈希表函数。

9显示了区块链叉攻击造成的。在100袭击基本上创建网络分区th第二,持续150秒。

从图我们可以看出9,Ethereum和平价叉,享年150岁th其次,主链上的块数量之间的差异和总块数量越来越大随着时间的推移而织物,相反,没有叉子,因为其共识协议的安全性。

然后,我们测试了冲突率,平均存储时间、故障率和散列,如图10- - - - - -12。我们选择随机8位定长字符串从100万年至5000万年作为输入数据和散列算法的性能进行比较时填充率是0.5,0.75和1.0。

应该注意的是,冲突率的固有特征函数和填充率无关。在评价失败率,哈希表是100%,失败是零,所以我们不需要测试失败率时填充率是1.0。

6。讨论

今天,数字犯罪变得更加容易,因为强大的智能终端的性能,这种情况下保持。数字取证技术来处理这种情况。与今天的技术,不难从终端获取的证据是否存在。虽然现在在取证,但问题是如何证明数字数据的原始性和有效性。虽然该模型把一个重要的框架,数据保存,模型只是第一步,而不是包罗万象。

首先,提出的解决方案只是一个模型,大量的工作需要做模型之前付诸实现。在本文中,我们只给一个应用场景的架构,但是开发和实现,整个系统仍然需要大量的工作。

其次,我们以Hyperledge织物为区块链架构,但织物不是专为数字取证,这意味着它不能完全满足数字取证的数据需要保存。在进一步的研究中,我们将继续设计定制的区块链更适合数据保存。

第三,提出模型加密数据散列之前,每个人都知道,加密会占用大量的资源和时间。智能终端的硬盘的容量变得越来越大;从这些终端的数据也越来越多。加密将这个模型的瓶颈。在这种情况下,我们要继续研究部分加密算法,通过它我们可以加密信息我们希望而不是整个图像数据加密。通过这种方式,该模型可以更实际。

7所示。结论

随着数字取证成为广泛应用于法庭上,将会有越来越多的关于数据的原始性和完整性的问题。调查人员需要更多的支持工具、模型和方法不仅仅是资格证书。

在这个角度来看,重要的是提供模型、方法和工具,向调查人员资格,以确保他们的工作的结果是有效的。本文提出一种数据保存数字取证模型基于区块链和多维散列。虽然不是包罗万象,我们希望这项工作能够激励他人保持学习和展示新的更好的模型,这将确保数据的有效性。

数据可用性

图像数据用于支持本研究的发现没有提供,因为数据是实际情况的从嫌疑人的终端。

的利益冲突

作者宣称没有利益冲突。