文摘

反向传播神经网络算法是目前应用最广泛的算法之一的神经网络算法。它使用输出出错率估计错误率的直接前层输出层,这样我们就可以得到每一层的错误率通过逐层反向传播。本文的目的是模拟DES的解密过程与反向传播算法。通过输入大量的明文和密文对,一个神经网络模拟器目标构造密码的解密,解密的密文。摘要如何修改反向传播神经网络分类器,并应用它的建造过程,详细介绍了回归分析模型。实验结果表明,最终结果恢复明文本文构建的神经网络模型是理想的,和拟合率高于90%,真正的明文。

1。介绍

密码学的研究主要包括两个方面,密码设计和密码分析。有独立的以及它们之间相互统一的关系1]。分组密码是对称密码学的一个重要分支。它使用相同的密钥加密和解密和在信息和通信的安全起着非常重要的作用。我们希望使用现有的密码分析方法设计密码分析方法,可以抵御一切密码分析方法。与此同时,我们也希望使用更新的密码分析方法来找到一些安全漏洞在密码分析算法。

现代密码系统通常使用方法扩大密钥空间或增加加密和解密的复杂性,并使用一些数学问题的理论依据,从而大大提高了计算能力的要求加密解密。有时传统的加密解密方法的成本可能超过密码破译的价值。人工神经网络(ANN)是研究信息处理的密码一样的纪律。神经网络算法具有非线性的特点,大规模并行分布式处理和高速信息处理和不确定性具有较强的信息处理能力。用神经网络来解决密码问题将提供一个新的密码学研究的想法。

2008年,Bafghi等人用递归神经网络解决问题找到权值最小的multibranch路径的两个节点之间的微分操作图块密码。主要的想法是减少损失函数的神经网络(2]。2010年,Alallayah等人被认为是神经网络的黑箱特点,结合系统识别技术和自适应技术,模拟了神经的密码分析目标系统模型和可以从给定的密文(猜的关键3]。在2012年,阿兰尼人等人使用了一种新的密码分析攻击DES(数据加密标准)和3 DES加密算法(三重数据加密算法)。实现的攻击是一个已知明文攻击基于神经网络。在这种攻击中,他们训练一个神经网络从密文检索明文没有检索中使用的密钥加密。与其他攻击相比,这种方法需要已知明文的数量减少,减少所需的时间来执行一个完整的攻击(4]。上述方法无法直接恢复明文序列,和实验过程的相关文献大多是基于简化密码加密算法和计算能力有很高的要求。

在本文中,我们选择DES算法作为分组密码的案例研究。我们建议使用BP(反向传播)神经网络算法来模拟密文和明文之间的映射关系。DES加密的密文获得转化为二进制字符串,这是美联储对我们改进的BP神经网络作为输入处理后根据定义的预处理方法。预测输出和真实值之间的差异相比是明文密码分析的目的。与以前的工作相比,明文恢复了这个实验有更好的拟合效果真正的明文。根据本文中定义的出错率,实验误差可以控制在10%以下。

第二部分简要介绍了发展历史和分组密码的基本工作原理。第三部分简要介绍了BP算法的原理和我们修改,从而成功地建立一个回归模型。第四部分介绍我们的实验过程和结果。

2。简要介绍块密码

分组密码是现代密码学的一个重要系统,这是许多密码的一个重要组成部分。块密码通常指一种密码算法只能处理一块数据一定长度的时间。在这里,“块”被称为块。位在一块的数量被称为块长度。具体来说,分组密码的原理是将明文消息序列划分为一组 根据一组固定的加密算法进行加密控制的关键 ,和输出密文 模型如图1

在相同的密钥,分组密码变换输入明文组与长度同样的,所以它只需要研究的转换规则组(5]。

一个密码系统由五个部分组成(明文P,密文C、关键K、加密转换E,和解密变换D)。它满足下列条件(6]:(1) 是一组有限的明文(2) 是一组有限的密文(3) 一组有限的钥匙吗(4) 是一组有限的加密改变规则(5) 是一组有限的解密改变规则(6) ,

DES是一个64位的明文进行加密的方法16轮的56位密钥和加密处理获得64位密文。我们选择DES的分组密码的研究,因为它可以改变加密密钥和网络水平更快,加密速度和减少其他因素的影响。具体描述如下:(1)进入64位的明文并执行初始更换IP(2)把明文分成两部分,每一部分的32位,代表l0R0分别(3)添加的关键之后,执行16轮的操作 (4)16轮之后,左派和右派的长字符串,然后交换连接的逆替换(5)64位的密文输出

3所示。反向传播神经网络

人工神经网络是一个跨学科领域的多学科研究脑科学、神经心理学和信息科学。这是一个近年来在高科技领域的研究热点。其研究目的是探索人类智慧的神秘通过研究构成机制和人类大脑的思维模式,然后让机器有类似人类的智能通过模拟人类大脑的结构和工作方法7]。

BP(反向传播)神经网络通常是指基于误码率的向前多层神经网络反向传播算法和误差反向传播算法速度是迄今为止最成功的神经网络学习算法。它使用错误率输出来估计错误率后直接前任层输出层,然后使用这个错误率估计前一层的错误率。这样一层反向传播后,所有其他层的错误率估计得到[8]。BP神经网络拓扑结构包括一个输入层、隐藏层和输出层。模型如下图所示2

BP神经网络模型通常用于分类。它具有较高的自学习、自适应和容错能力。也就是说,BP神经网络模拟输入和输出之间的映射关系可以通过不断学习,这个过程反映在网络权值和阈值的动态调整。经过反复训练,出错率稳定在可接受的范围内。此时,相应的网络参数可以最后确定达到局部最优。如果当地BP神经网络的神经元受损,它对全球培训结果几乎没有影响9]。

基于上述工作,我们修改基于BP算法的分类器,实现BP神经算法的回归模型。大量的明文对被送入模型输出明文的区别和真正的明文。修改后的模型如下。

3.1。向前传播

3.2。反向传播

在哪里 代表的相应位置矩阵的乘法。

4所示。实验过程

我们使用DES块变量明文和恒定的关键变量纯文本转换为二进制文本,文本存储在不同的文档。每个文档都有一个3.2 million-bit二进制数。我们用它作为明文,DES(电子码模式)加密后,相应的密码。在数据收集阶段,数据来自加州理工学院的加州理工学院- 256数据集选择,和数据到1001年文件明文缝合,和文件的大小是512 KB,十人被选为我们的实验数据10]。截取图像的明文和密文文件通过加密他们分别在图所示34

由于单一文本文档太大,计算机的计算能力是有限的,我们所做的一些相同的处理每个密文密文结构文本和压缩。我们把一个8位二进制数依次从开始到结束,将它转换为一个十进制数,每个密文变成了这样 矩阵。同样,对于每个明文,我们将8位二进制数依次从开始到结束,将它转换为一个十进制数,每个明文变成了这样 矩阵。然后我们输入的所有样品预处理密文和明文到修改后的BP神经网络,得到输出。我们比较这个输出预期的明文进行BP神经网络模拟解密系统。每一个十进制数字转换的神经网络的输出转换成二进制。如果数字的数量是不够的,高位数充满了0,然后都是连接到恢复明文的效果。

我们定义输出的均方误差矩阵和矩阵处理代表真正的明文作为实验效果的评估标准。也就是说,修改后的BP神经网络的输出矩阵 ,处理过的明文文本矩阵 ,和评价标准

实验过程如下。

4.1。输入明文

已知明文(二进制文本)根据des加密(ecb模式)来获取相应的密文,和处理已知密文转换为一种格式,可以送入神经网络;

4.2。神经网络训练

修改BP神经网络模型,改变它的分类模型的回归模型,并不断调整内部参数的神经网络直到达到最好的培训效果。

4.3。输出结果

实验误差率稳定在一个可接受的水平,和改进的模型用于实现明文复苏。

5。结果与讨论

经过反复训练,BP神经网络的参数不断进行调整。我们使用了s形的激活函数,和培训的数量超过1000。错误率可以稳定在10%左右。实验结果如下表所示1:

数据之间的相关性太大,这将不可避免地导致不可靠的和不可预测的网络。因此,我们的输入由DES加密块常数钥匙,但应特别注意控制神经网络训练的数量。过度训练网络,网络会变得过度学习(11,12),所以它可能不可能准确地预测明文在训练集之外,导致过度错误率。

修改后的反向传播BP神经网络优化重量的最陡下降法,连续收敛到局部最小值点在空间的重量。然而,除了在几个不同的体重初始值,没有更好的建议比神经网络的输出的差异(13]。学习速率的正确选择有效地控制步长用来修改的尺寸重量多维空间中的每个重量(14]。如果所选择的学习速率过大,局部最小值可能不断溢出,导致振荡和慢慢地收敛到一个较低的错误率。如果学习速率过低,所需的迭代次数可能太大,导致缓慢的神经网络性能(15]。

6。结论

在这个实验中,我们建议修改后的BP神经网络算法应用于密码分析和实现它。在这里,我们定义分析输出的均方误差。效率可以进一步提高了增加样本的数量用于训练神经网络,调整重量和偏见在每一层的神经元。

尽管DES算法不再使用在新的商业和公共应用程序中,为什么我们选择DES算法DES密码分析是设计结构的算法也反映在其他加密算法,如gost算法和camella算法。此外,许多软件还兼容DES算法,因为没有真正的完全破解DES算法的方法。

在未来,很多工作重量选择和适应(训练)的神经网络仍然需要完成,特别是硬件实现的可能性仍然是一个值得进一步研究的领域。可能会有不同类型的神经网络的密码分析(16),导致意想不到的结果。

数据可用性

使用的数据来支持本研究的结果包括在本文中。每个人都可以免费使用的数据来验证实验结果。

的利益冲突

作者宣称没有利益冲突。

确认

这项工作由国家重点支持研究和开发项目2016 - 2018 (2016 yfe0100600),信息保障技术国家重点实验室开放基金项目(kj - 15 - 008)和国家重点实验室的加密和科学。

补充材料

补充材料包含实验数据,包括10个纯文本数据,共24 MB的大小,和10个密文数据,通过十纯文本数据与DES加密算法,加密的总大小40 MB。纯文本数据来源来自加州理工学院的加州理工学院- 256数据集。(补充材料)