文摘

工业网络安全是一个先决条件,以确保高质量的工业网络的发展。抑制工业网络安全事故的重要方法,防止网络威胁积极有效地控制网络的变化情况。在本文中,我们提出一种新的预测模型基于长期短期记忆(LSTM),方差最小均方准则(MMSVC)和经验模态分解(EMD),目的是有效降噪,预测精度高。为了减少随机噪声的干扰,我们首先删除几个异常值在高频和嘈杂的固有模式函数(货币)通过EMD分解。MMSVC表现良好在识别噪声首先不使用阈值。空白的地方,我们再通过一定重量和相关数据。之后,LSTM模型应用于预测信号去噪。初步实验分析说明降噪与EMD方法可以提供一个显著提高预测性能。

1。介绍

随着互联网产业的快速发展,越来越多的生产服务与互联网结合起来。这意味着许多工业组件R和D,等生产和管理暴露于互联网。数据覆盖的工业网络是多元化和广泛分布。一旦攻击网络,企业的生产和发展将会严重影响。因此,有效的网络安全保护是非常重要的,以确保高质量的工业网络的发展。

网络安全态势感知(NSSA) [1)是最流行的一种网络安全技术。与传统方法相比,基本组件NSSA正在评估网络的网络安全状况和预测趋势特征。面对网络威胁,它可以帮助网络管理员有效地做出决定,将问题扼杀在萌芽状态。网络安全形势可以抽象为一个多维时间序列如方程(1), , , 表示不同的网络特征。网络安全形势预测是这实际上多维时间序列的预测。它统计模型和其他模型适用于分析历史的集网络特征。

如今,人工神经网络(ANN) [2)是最常见的方法用于网络安全形势预测,自学和计算的杰出的优势。寻找最优参数和构造训练模型,历史数据集需要反复训练。预测的准确性很大程度上依赖于是否收集到的数据是有效的。尽管如此,大量的噪声点将不可避免地出现在数据提取过程,导致随机误差。更多的噪声点的存在,更不可靠的预测。EMD滤波是一种新的自适应技术应用于减少随机噪声的风险。对于传统EMD滤波,高频首先将完全丢弃由于噪声点的存在,不仅由噪声点,还包括有效信号。这将导致严重的信号失真。

由于上述问题,我们提出一个预测算法结合EMD和LSTM MMSVC。首先,我们改变了信号从时域到频域,以单独的高频和嘈杂的货币。其次,我们删除噪声点条件下保持有效信号。最后,我们利用LSTM预测数据去噪。

虽然大多数传统EMD-based直接预测方法预测个人货币基金,该方法首先进行降噪,可显著降低噪声对预测的影响。嘈杂的国际货币基金组织(IMF)识别使用MMSVC避免选择不同排列熵的阈值。为了定位和删除噪声点,信号被分成组。离群值在每一组被认为是噪声点。然后,再通过一定的重量与相关数据。与其他方法相比,这种方法的优点是信号本身没有特殊要求,操作方便。

典型的网络安全形势预测方法包括回归分析(3),灰色理论预测模型(4)和人工神经网络。这些算法表现出高性能在某些特定的应用程序,但是也有其局限性。例如,回归分析缺乏实时,因为它描述了常规的数学公式。网络中各种突发事件发生频繁导致回归分析变得更加低效。灰色理论预测模型有显著影响较小的数据集,而预测的准确性大大低于安。可用性的网络安全形势预测使用安已被许多研究证实。例如,刘等人。5)提出了一个方法,应用GM(1, 1)模型和BP神经网络模型。(条6),一个基于BP神经网络的网络安全形势预测方法优化了导引头(SOA)的优化算法。人工神经网络对网络的有效性情况预测可以有效地验证。LSTM应用在这个实验中,更好的性能比递归神经网络(RNN)在长序列(7]。LSTM可以避免信息的干扰衰减由于很长一段时间。然而,数据采集将产生随机噪声不可避免的,这将使学习参数的偏离,导致精度降低8- - - - - -10]。

因此,它是至关重要的,提供通过过滤噪声显著提高预测性能。近年来,已经有越来越兴趣探索降噪的方法,比如使用过滤器,小波变换(WT) [11],EMD [12),和傅里叶变换13]。

(条14signal-filtering),提出了基于经验模态分解方法。著名的滤波方法相比,该方法是一个完全数据驱动的方法没有太多的人工干预。

(条15),作者提出一个high-G校准去噪方法的综合研究。他们提出了一种去噪方法的基础上,结合经验模态分解(EMD)和小波阈值。他们利用小波阈值处理货币基金,过滤取决于分解数量和基函数的选择。

(条16),一种新型水声信号的降噪技术基于完整的集成经验模态分解与自适应噪声(CEEMDAN),方差最小均方准则(MMSVC)和最小均方自适应滤波器(LMSAF)提出的李,王。在他们的方案中,LMSAF是国际货币基金组织用于高频噪声降低,地址选择的问题分解数量和基函数的小波降噪。然而,LMSAF需要在不同的时间输入向量的线性独立。输入信号的相关性会导致重复误差传播,收敛速度慢,可怜的跟踪性能。

在这里,我们的目标是解决噪声问题通过使用一种技术,它改编自EMD和LSTM相结合。

3所示。提出的模型

3.1。EMD的原则

EMD的最大优点是它不需要太多的人工干预。EMD非常简单,方便信号自适应分解(17,18]。

任何信号可以分解为货币基金在不同频率域。不同的特征时间尺度的历史序列集参与不同的货币。EMD的详细过程包括六个步骤,描述如下:

步骤1。所有原始信号的局部最大值和极限 将决定加入上信封吗 和更低的信封 利用三次样条曲线的差异。

步骤2。计算的平均值 这是

步骤3。中值 减去从原始序列获得中间信号 ,

步骤4。判断成为国际货币基金组织得到满足的两个条件:0点的数量之间的差异和极端点的数量不能多于一个;与此同时,上信封,下包络线的均值在任何时候必须为零。如果满足, 将被认为是一个国际货币基金组织和执行步骤5;否则,重复步骤1到步骤4。

第5步。计算剩余 和把 随着新 然后,重复步骤1到步骤4直到信号不会分解。

最后但并非最不重要,原始信号的分解可以表示为方程(2), 是由 是残余信号。

3.2。MMSVC原则

MMSVC用于标识,嘈杂的货币通过EMD分解(16]。MMSVC的详细过程包括三个步骤,描述如下:

步骤1。原始信号 删除第一个 首先构造 , , ,在哪里 货币基金的总数。

步骤2。计算方差平方 :

步骤3。重复步骤2计算任何两个相邻货币基金,并找到最小均方方差,

第一个 首先是嘈杂的货币 是最小值。

3.3。LSTM原则

[的LSTM被Hochreiter首次提出,。施密德胡贝尔表示191997年)。从内部结构,LSTM擅长处理时间序列问题[20.,21]。LSTM的具体结构如图1,由更新的状态值 在时间 ,输出信号(隐藏状态) ,乙状结肠神经网络层 ,双曲正切函数和双曲正切神经网络层。

忘记门是用来模拟遗忘过程通过控制遗忘程度的最后一个存储单元 与权重矩阵 输入信号 到乙状结肠函数,之后,输出 值范围0 ~ 1。如果结果是0,它表明,信息完全消失,而整个数据将存储的结果1。具体计算过程如下:

输入门作用于决定多少信息将被保存到细胞状态 ,可有效避免无关内容的记忆。乙状结肠函数和双曲正切函数,称为活性功能,都表达了方程(4)- (6详细), , 权重矩阵和 是偏见。添加的信息需要被遗忘和需要记忆的信息来更新细胞状态。

输出门操作控制多少信息从细胞状态 将输出 ,这是下次的输入信号。总结,方程(7)和(8)简要描述的操作由一个输出通道。

3.4。EMD-MMSVC-LSTM模型

该算法充分利用EMD的属性,MMSVC, LSTM。我们首先确定的货币基金在嘈杂的货币使用MMSVC和删除一些异常值。其次,空白,我们填补他们一定重量,这是由空白之间的距离和相邻的参考数据。最后,LSTM模型应用于预测去噪信号。算法的具体流程如图2,在那里 被认为是原始时间序列和 被确定为一个新的序列。

不同频率的信号分解成货币基金。信号的随机性逐渐减少。通过删除离群值的高频和嘈杂的货币基金,过滤噪音和预测精度的目的。具体程序如下:

步骤1。信号分解。运用EMD分解网络特征 获得 首先在不同的频率域和一个残余。

步骤2。利用MMSVC获得嘈杂的货币。

步骤3。过滤异常值,在嘈杂的货币。接受IMF1的例子;首先,把IMF1分成 组根据时期 之后,进行排序 采样点的每组按照升序排序。然后,找到因素 排名的百分比 %和因子( )排名的百分比 %。最终,过滤数据不足 和更大的比 在每一个组。(选择 是由数据本身。通过不断的实验,发现这组数据的效果是最好的时候 是90, 是10。)

步骤4。填写空白的地方。空部分是由一定重量与有关数据,只有nonnoise点可以作为参考数据。为噪声点 , 必须有效数据;否则,我们需要寻找附近的有效数据。如果之间的距离 和之间的距离 ,然后 步骤2和步骤3的伪代码表示的算法1在下面。

第5步。重建信号。添加货币基金和残余 逐项新的时间序列

步骤6。信号预测。LSTM利用预测新的时间序列。

1。noise_filter(数据,n): / 参数n指的是包的大小 /
2。长度< -长度的数据
3 . / 组数据 /
4所示。集团[]< -每组包含n个连续信号
5 . / 过滤噪音 /
6。noise_filter_data = []
7所示。goup_data集团
8。low_num < - B的因素排名百分比%
9。high_num < -因子的排名百分比%
10。temp_data = noise_filter_and_replace (goup_data low_num high_num)
11. noise_filter_data.append (tem_data) / 合并所有运用组 /
12。返回noise_filter_data
13。
14。/ 删除离群值和填补空白的地方 /
15。noise_filter_and_replace(数据、low_num high_num):
16。/ 如果噪音点存在于第一个位置或最后一个位置,他们需要单独处理 /
17所示。指数< 1len (data-1)
18岁。如果数据(指标)是噪声点然后
19所示。找到最近的两个非噪声点数据(first_weight)和数据(second_weight)左右
20.计算距离x, y
21。first_weight < - y / (x + y)
22。second_weight < - x / (x + y)
23。(指数)< -数据(first_weight) first_weight +数据(second_weight) second_weight
24。返回数据

4所示。实验和验证

4.1。数据集

本文中的数据提取从赛尔交通统计数据日志收集校园网络,组成各种索引称为ONLINE_USERS, IP_INBPS, IP_OUTBPS TCP_INBPS, TCP_OUTBPS。的时间范围是在3月26日下午,2016年,2016年3月29日18:00。

4.2。基于EMD的噪声过滤

这是承认,原始数据中的噪声将不可避免地减少预测模型的准确性。如图3显示,ONLINE_USERS和IP_INBPS都分解成九货币基金,剩余的EMD。通过光谱分析货币基金,货币基金的频率逐步减少。

MMSVC用于识别噪声首先两个索引。结果被描述在表1。如表1所示, 是ONLINE_用户和的最小值 是IP_INBPS的最小值。因此,对于ONLINE_USERS,前五首先是嘈杂的货币。IP_INBPS,前三个货币基金需要降噪。

过程嘈杂的货币。首先,集团根据时期的数据。第二,过滤异常值排名百分比高于90%,排名在国际货币基金组织每个百分比低于10%。第三,一定重量的空格填入相关数据。如图4显示,噪音压制在一定程度上,保留原始数据的主要形象特征。

4.3。EMD-MMSV-LSTM模型的实验结果

使用LSTM模型预测这两个特征。从26日到28日的数据作为训练数据,剩下的数据作为测试数据。对于传统LSTM模型,在一定程度上,当前时间的预测的值取决于前面的时间,从而导致效率低下。通过将预测结果依赖于真实数据,预测将会有效地改善。

证明的有效性实验,功能命名IP_OUTBPS和TCP_INBPS参与。图5介绍了预测之间的比较原始数据描述和运用数据描述,蓝色折线的观测值和橙色折线预测值。MSE、RMSE和梅在这个实验作为评价指标。见表2为特定的数据。

这个实验的结果进行了总结,在一定程度上可以抑制噪声通过EMD滤波;与此同时,几乎仍主要形象特征。利用过滤噪声通过EMD LSTM预测性能可以提供一个重要的推动作用。

5。结论

在这项研究中,我们提出一种新的预测模型称为EMD-MMSVC-LSTM。与大多数EMD-based预测模型相比,该方法可以大大减少噪声对预测的影响。MMSVC被用来确认嘈杂的货币基金没有阈值的选择。在那之后,每组中删除离群值。这种方法的降噪信号本身没有特殊要求的优点,操作方便。最终,使降噪信号预测。

尽管降噪的方法实现了在这篇文章中,过滤条件相对单一和过滤过程非适应,这将产生足够的过滤。如何提高噪声滤波的有效性和适应性是进一步研究的方向。

数据可用性

使用的数据来支持本研究的发现可以从相应的作者。

的利益冲突

作者宣称没有利益冲突有关的出版。

确认

这部分工作是支持中国的国家重点研究和发展项目,yfb1711000 2020号和2018号yfb08040505。