考虑能源的重要性在我们的生活中及其对其他关键基础设施的影响,本文从大数据的整个生命周期,将能源大数据的安全性和隐私风险因素分为五个阶段:数据收集、数据传输、数据存储、数据使用、数据破坏。集成到云环境的考虑,本文充分分析了每个阶段的风险因素,建立了风险评估指标体系能量大数据的安全和隐私。根据风险的不同程度的影响,使用层次分析法给指标权重,使用遗传算法来优化BP神经网络的初始权值和阈值,然后优化BP神经网络权重和阈值,和评价样本数据库中用于训练它。然后,训练模型是用来评估一个案例来验证模型的适用性。
在大数据时代,大数据技术在能源领域的应用是一种趋势,促进产业发展和创新。两大数据的深度应用的深度集成技术在能源领域和能源生产,消费,和大数据的概念和相关技术革命将会加速能源工业的发展( 与全球能源大数据的实现策略,“互联网+“智能能源的快速发展和智能能源的全面建设布局使能源行业更广泛分布,更多的数据收集点,更多的数据类型,更复杂的业务关系和更广泛的数据使用和用户( 因此,基于能源管理研究大数据已经被世界各地的学者广泛关注。目前,大量的数据和管理在能源行业的特殊性,学者进行数据管理和建筑设计通过各种技术或非技术手段,其中包括建立大数据层存储和处理可再生能源数据( 这大大提高了预测的准确性和评估,但相关文献的回顾表明,分析指标的影响的重要性往往被忽视。因此,本文基于机器学习的考虑,根据风险的不同程度的影响,使用层次分析法来确定指标权重,克服了缺陷的主观考虑在先前的研究
风险评估的过程中,风险发生的概率、损失范围,和其他因素需要考虑全面获取系统风险发生的可能性和程度,确定风险级别,然后决定是否采取相应的控制措施和到什么程度 因此,风险评估指标体系的建设应遵循全面性的原则,科学性、代表性、实用性,选择具有代表性的风险元素从科学的角度来看,基于实用原则,量化风险,努力展示全面、准确的风险管理水平。
数据安全管理是最突出的大数据应用程序所面临的风险。尽管大量的数据集中存储,方便数据分析和处理,但造成的损失和损害的大数据安全管理不当会造成毁灭性的灾难。由于新技术和新业务的发展,隐私的侵权行为不仅限于物理和强制性的入侵,但在一个微妙的方式通过各种派生数据,数据安全和隐私造成的风险,这将是更严重的( 与前面的互联网和计算机技术相比,应用程序利用大数据在云环境中更加明显。大数据平台共享能力强,管理信息的安全使用和提高资源利用的效率。云平台的建设和系统应用程序有严格的标准。云计算技术提供更全面的技术支持,使隐私管理更加合理,这是符合新时期的科技发展水平( 基于文献的徐(
在数据收集方面,能源大数据安全和隐私风险的量化指标,本研究引入了风险的概念。根据风险发生的可能性和损失程度的每个索引,可能性和损失程度的乘积作为参考标准的风险程度量化,和特定的值可以合理漂浮产品。概率和损失的量化程度可分为五个层次:风险很高(5分),风险很高(4分),中等风险(3分),低风险(2分),和非常低的风险(1分)。
在公式( 规范化输入值乘以相应的重量的每个索引作为神经网络的输入进行训练,结合输出值;风险评估水平,如表所示
现有BP神经网络过程的一部分,各种风险因素默认相同程度的影响,没有严格的区别,这是不利于建立神经网络模型。
考虑能源大数据安全的特殊性和隐私风险定量分析方法可能无法合理确定实际影响程度的指标。因此,使用层次分析法给体重指数,和各种因素在复杂的问题划分为相互联系的有序层次,使它们有条不紊。根据一定客观现实的主观判断结构,专家意见和分析师的客观判断结果直接而有效地结合起来,和两两比较的重要性一层元素的定量描述。
因此,成立后的能量大数据安全隐私和风险评估指标体系,根据每个风险因素的影响程度,德尔菲法用于邀请专家来量化它们之间的重要性,和AHP方法用于给22个指标对应的权重。
构造判断矩阵。
判断矩阵<我t一个lic>
一个我t一个lic>= (<我t一个lic>
一个我t一个lic>
计算<我t一个lic>
n我t一个lic>th的根源<我nline-formula>
规范化特征向量的重量。 计算最大特征值,(AW)
一致性指数<我t一个lic>
C.I.我t一个lic>是
一般来说,<我nline-formula>
显然,随着价值的增加<我t一个lic>
n我t一个lic>判断错误将会增加,如此的影响<我t一个lic>
n我t一个lic>时应该考虑一致性判断,和随机一致性比率<我nline-formula>
BP神经网络是一种多层神经网络,由Rumelhart提议在1986年。它是目前应用最广泛的神经网络模型。它可以学习和存储大量的投入产出模式映射关系。它的学习规则是使用最速下降法,不断调整网络的权值和阈值通过反向传播,以减少网络的均方误差。它通常是由输入层、隐藏层和输出层( 神经网络的基本单元是神经元。原理公式见公式( BP神经网络的均方误差<我t一个lic>
E我t一个lic>常用的指数来判断模型的训练性能,所示公式( 训练模型,LM算法的神经网络用于这项研究。减少误差的基本方法如下:
遗传算法(GA)是一种计算机模型模拟达尔文生物进化论的自然选择和遗传机制的理论。一个方法是通过模拟自然进化过程搜索最优解( 利用遗传算法得到最优网络权值和阈值的初始网络权值和阈值随后的神经网络模型不仅可以克服传统BP神经网络的缺陷是容易陷入局部最小值,而且还极大地提高模型的准确性评估,以便优化BP神经网络能够更好地评估样本。遗传算法的元素包括种群初始化、适应度函数、选择算子、交叉算子和变异算子。
与二进制编码相比,真正的编码能够显著减少编码的长度,避免后解码,精度高。一系列的参数进行优化,如连接重量,隐层节点的阈值,阈值和输出层节点,要求真正的矩阵编码的值的范围(−1,1)。
后编码、选择、交叉和变异。这三个操作是基于健身价值计算适应度函数作为评价标准。值越小,更大的健身价值,个体就越好。本研究的适应度函数的倒数均方误差函数,如下: 在选择操作中,最常见的轮盘赌法。每个个体被选中的概率是积极与健身价值成正比。<我t一个lic>
N我t一个lic>代表人口规模,<我t一个lic>
F我t一个lic>
通过使用算术交叉为公式( 变异操作是指单个基因的随机突变的人口,增强算法的局部搜索能力和保持个体的多样性。的变异的操作方法<我t一个lic>
j我t一个lic>基因的<我t一个lic>
我我t一个lic>个人<我t一个lic>
一个我t一个lic>
与传统的BP神经网络相比,GABP模型的过程用遗传算法来优化网络的权值和阈值,这个过程可以优化BP神经网络的预测性能在一定程度上。同时,使用层次分析法来确定指标权重可以更好地定义指标的重要性。流程图如图
使用层次分析法来处理数据。
在阅读文献和案例的安全和隐私风险能量大数据,总共44样本收集,包括8 36个训练样本和测试样本。的一些训练数据如表所示 训练数据输入程序,和遗传算法优化BP神经网络的收敛曲线如图 BP神经网络和遗传优化BP神经网络进行比较,并计算其误差值。最后的实验结果如表所示
Z电网系统使用能源大数据信息提供数据服务与经济发展有关。它可以提供更可靠的数据支持扶贫效果评估、信用评估、普查,污染监测,工作恢复评估。根据能源大数据安全和隐私风险评估指标体系设计,完整的评估步骤的大电网系统的数据安全和隐私风险如下:
使用层次分析法计算指标权重。
在这项研究中,层次分析法是用来为主要和次要指标分配权重,分别。一致性检验后,得到22个指标的最终权重如表所示
在这项研究中,三组相关数据收集的电网系统的选择。培训后,AHP-GABP建立神经网络模型。首先,有必要验证评价模型是否合理。其次,必须对风险进行评估。评价结果如表所示
总而言之,在这个过程中控制能量大数据安全和隐私的风险,每个阶段的风险不容忽视。在全面的前提下考虑到云环境和风险因素,本文把势能大数据安全和隐私的风险,每个阶段尽可能全面根据大数据的生命周期,并利用AHP方法为指标分配权重,它提供了一个参考未来能源大数据研究。同时,本文基于评价优化BP神经网络模型,并试图AHP-GABP方法应用于风险评估的能量大数据安全和隐私,大大降低了风险,初始权值和阈值的随机选择BP算法会导致模型训练很容易陷入局部最小值,并提高神经网络模型的精度评估和预测,实现人工智能的应用在能源领域的相关知识。
AHP-GABP模型应用于评估能源大数据的安全和隐私,以及评价结果是好的。根据情况和专家访谈,总结了以下发展建议共同能源大数据安全和隐私的风险。
能量大数据来源于生产数据和经营管理数据,及其保护应该关注整个生命周期的数据收集、传输、存储、使用和破坏。从政策和系统需求到技术管理和控制,我们应该全面评估关键数据的威胁曝光,使有针对性的保护策略在所有阶段,确保核心数据的安全资产。
能源行业应该建立一个全面的预警技术基于安全的威胁大数据,突破传统模式,更积极地发现潜在的安全威胁。大数据分析技术的引入在威胁检测可以更全面检测攻击数据资产,软件资产、实物资产、人力资产、服务资产,无形资产和其他支持业务( 大数据为能源行业带来了机遇和挑战。越广泛的应用,它带来的价值就越大。安全管理的概念集中在数据安全将会改变传统的思想工作( 随着云计算的快速发展和数字化水平的持续改进,能量大数据安全和隐私风险评价指标体系可以进一步改善。同时,浓缩的数据指标和训练模型,本文提出的模型也可以更好的优化和扩展到其他领域在未来更准确的评估和预测。
使用的数据来支持本研究的发现可以从相应的作者。
作者宣称他们没有利益冲突有关的出版。
这项工作由辽宁财政支持项目L19BXW006哲学社会科学规划办公室。