文摘

“未来的新的石油,”大数据正在成为新经济的主导产业,国家和企业的核心资产,要追求的“新蓝海”,和国家战略开发的所有国家。大数据及其相关技术的发展支持,促进新一轮的技术革新,使新一代的信息安全技术改革和创新,优化带来了机遇和挑战,巩固国家信息安全。在大数据时代,信息安全将面临什么样的挑战和影响?探索反应策略至关重要吗?目前,中国已成为世界上最大的互联网用户数量和人们使用最多的智能手机,但由于中国的信息安全是初始阶段,涉及到信息安全,特别是国家信息安全法律法规并不多,国家社会监督和监测机制并不多,科技应用程序级别的内容是相对落后的,核心技术的专利技术不多,导致大量的网络数据。因此,地下非法“数据产业链”活动猖獗。因此,本文提出了一个有安全意识的模型基于分布式数据分析技术和数据的结合特性。模型使用的数据特性,动态生成一个图书馆的态势异常,迅速有效地解决问题的分析和处理,动态生成的数据流,提高了检测率超过98%,有效地减少错误检测的可能性,对大规模数据集产生好的结果。

1。介绍

在二十一世纪的新技术,如互联网,物联网,云计算发展迅速,和现代社会所产生的数据量正在以前所未有的速度增长;我们现在住在大数据时代(1]。数据的力量让人们直接做决定而不考虑原因,这就是为什么世界上大数据造成严重破坏(2]。2011年,麦肯锡全球研究院的一项研究发现,数据逐渐成为一个重要的生产要素,贯穿于麦肯锡全球研究所成立于2011年,生产数据成为一个重要的因素,大数据是渗透所有行业和企业,,使用大数据预示着新一波的生产率增长和消费者盈余(3),“大数据”是“下一个前沿的创新、竞争、和生产率改进”(4]。

在二十世纪后期,好莱坞演员金凯瑞主演的超现实主义电影楚门的世界,主角杜鲁门所困的从出生在一个巨大的工作室充满了相机,世界各地的人们观看他的真人秀5]。在大数据时代,它长期以来一直是不必要的通过摄像头来监控你的行为,你寻找的产品在淘宝上,优酷的视频你看,你们订的食物在业内,等等。即使你没有连接到网络,服务器记录所有交易通过电脑、平板电脑、手机或智能衣物。你的购物习惯,你的心率,或你的信用评级成为大数据的一部分6]。分析大数据使我们能够做出许多明智的决定:例如,剃须刀和尿布是否出售更好的在一起或台风是否会促进销售vanilla-flavored冰淇淋,等等,但我们的数据的安全是无形损害(7]。

中国目前处于一个快速发展的时期,内部和外部环境正在发生迅速的变化,信息安全的问题吸引了大量的公众注意力(8]。在大数据时代,新时代的信息安全不仅受到来自网络黑客攻击的威胁,还通过轻罪市民意识,向后安全教育体系,等等的原因很多,包括各种因素,如政府、社会、大学、和公众本身(9]。越来越多的电话诈骗,色情照片文档,数据泄漏、门户服务器崩溃,和其他事件近年来揭示中国低水平的安全意识和技能的缺乏应对安全事故的后果和凸显了中国大学生缺乏足够的安全培训。信息技术在中国开始发展到很晚,进入新世纪以来,信息技术在中国的发展非常迅速。虽然有关规定不稳定、安全保证体系并不完美,和安全意识的缺乏和信息技术的落后已经成为限制因素一起影响信息安全在中国(10]。

因此,有必要分析我国信息安全教育的现状,找出其不足的原因,并提出改进的对策,以提高我国信息安全保障水平,确保个人数据的安全,财产、隐私,和其他方面的公众。大学和社会的安全与稳定才能保证如果公共信息安全的保证。只有当环境是稳定的,其安全保证公民可以专注于他们的工作和研究,为国家和社会作出贡献。

人们总是寻找方法让科技服务人民更好,在大数据时代,这个提议人争取回到我们。当我们获得大数据所带来的好处,我们也面临着迄今为止未知的对信息安全的影响。媒体报道的信息安全事件频繁,日益复杂的信息安全威胁,系统的、有效的信息安全教育变得越来越重要。大众的意识和技能的快速发展在信息安全保障也是一个问题,中国迫切需要解决信息安全教育11]。

这是最好的时代

也是最坏的时代。

大数据一直是近年来的一个研究热点,国内外,但没有单一的大数据的定义。根据维基百科,大数据是信息如此庞大,它不能被收集,管理,处理和组织到有效信息在很短的时间内用常规软件工具(12]。麦肯锡全球研究院,在其文章中,“大数据:下一个前沿创新,竞争和生产力,“大数据定义为数据超出传统的数据库软件工具的能力收集、存储、管理和分析(13]。”根据“乔布斯”(IBM的“数字看门人”),网络大数据的时代特征是人们的三重世界的完全整合,机器和事情,前所未有的增长的数据量,和数据的复杂性,这种网络大数据时代的标志14]。McAfee,世界上最大的专业安全技术公司,将大数据视为一个智能活动,旨在将大数据洞察商业优势和分析的先决条件15]。勋伯格的定义更简洁而清晰:大数据是大量的数据(16]。

网络安全是一个体积的5 v特性,品种、准确性、速度,价值(17]。研究[18网络数据的特点是大规模,burstiness,和意外,这使得研究人员很难评估和预测其变化的状态。研究[19]只能充分利用数据,如果数据流控制。研究[20.)提出了数据质量的需求分析模型,考虑许多候选指标和根据需要选择所需的指标。研究[21)解决的问题如何降低存储成本,充分利用计算能力,提高吞吐量,支持分布式非线性优化选择算法。研究[22)指出,数据分析倾向于使用更少的字段,所以列存储率高,业内流行数据库(Bigtable, HBase)实现基于列存储。研究[23)提出了一个混合row-column数据存储结构,解决了快速加载的问题,查询和高效的数据存储。研究[24)开发一种先进的、高度可伸缩的pb级别的分布式数据存储框架而优化的分布式存储结构数据布局,以降低成本和提高效率,从而实现高可用性数据分布式存储系统。研究人员(25]我使用计算技术和分析数据,发现中包含的知识,和学习环境,改变模式,的主要方法和发展趋势,探索数据的深度价值,实现可计算的行为。随着数据的时代,数据的复杂性和规模呈指数级增长,导致严重瓶颈在传统矿业的实用性和性能和计算方法。因此,数据处理技术已经成为一个重要的研究课题。分而治之的策略通常用来处理数据,即。,decompose the data problem into smaller subproblems and combine the solutions of the subproblems to obtain the final solution [26]。

总之,数据分析是数据处理的核心,基于数据的安全意识研究使用数据分析作为一种有效的方法感知各种网络异常行为。目前,与安全性敏感的模型存在一些问题,如低安全性敏感的结果的准确性,预测精度差,评价粒度粗,和较低的感知性能和效率。因此,我们建议的模型集成了数据预处理在知觉和执行关联规则分析基于数据集的情况下理解过程。因此,模型的性能和效率改善安全态势感知过程。

3所示。网络安全体系结构

网络安全态势感知是指环境中提取相关元素在一定时间和空间范围内,这些元素的理解和预测其可能的影响。安全态势感知系统安全状态的认知过程。人们普遍认为,第一阶段是安全形势意识;第二阶段是安全形势的理解;第三阶段是安全形势投影。(图1

2表明,态势感知的第一阶段是在顶部的根节点进行;然后,态势感知的结果判断进入第二阶段的情境的理解;最后,在第三层,情况进行第三阶段的投影,以及最终结果的安全形势。

3表明态势感知和情境的理解进行外围模块;然后,结果情境理解传播态势预测的核心模块。

4所示。改进的随机森林相关算法

引入决策树是在下一节中,通过决策树算法,进一步理解随机森林算法。

熵的计算公式见公式(1):

其中, 代表 理查德·道金斯的价值范畴 , 代表类别的总数量的记录 , 代表一个共 值的类

接下来,我们发现获得的属性 假设属性 总共吗 值,值 属性之一 见公式(2): 在哪里 数量的记录包含吗 在数据集和 数量的记录分为 ;获得的属性 下列公式所示(3):

贝叶斯定理公式所示(4):

如果给定数据集的类别数 ,朴素贝叶斯算法可以用来预测是否一个给定值属于类别与最大后验概率,也就是说,当 预计属于某个类 朴素贝叶斯分类算法,当且仅当。

如果 是最大化,那么类别 与最大 被称为最大后验假设。根据贝叶斯定理,

对所有类别 是平等的,只有最大 可以计算。当预测分类样本 未知的类,通过评估的价值 对应于每个类 ,然后样品 属于类 当且仅当。

因此,大多使用贝叶斯分类方法对场景进行分类。

该算法压缩数据到内存中建立一个书的过程,这样的数据集只需要扫描两次,大大减少了开销 ,因此,在处理大量数据时很有优势。

为了更好地描述整个过程,下面的符号定义, 代表的支持程度。

公式(8)是支持度的计算公式,在其中 包含的属性代表数量的数据记录 假设有5个数据记录,每个包含以下属性:

假设 aboveentioned的关联规则的数据挖掘过程数据记录如下:(1)第一次扫描数据,然后生成一维频繁项目集如下: (2)使用维频繁项集生成FP-tree,生成完整的FP-tree(3)挖掘关联规则生成FP-tree和得到频繁项集由每个属性满足最小支持度阈值。因为某些生成频繁项目集包含冗余重复,简单的冗余删除执行降维后的最终数据记录如下: 为了更好地描述数据匹配过程基于动态时间规整算法,下面的符号定义进行进一步的解释。假定参考模板 , 代表的意思是6属性和 代表他们的标准偏差。同样,测试模板 , 代表的意思是4属性和 代表他们的标准偏差。

模板匹配的具体过程如下:

5。结果

CAIDA中包括数据集是匿名被动监控交通从芝加哥大学的Equinix的高速互联网骨干。实验结果如图所示4

相同的实验环境下使用相同的数据集和相同的四个算法包括在模型中。实验结果如图所示5。在第一种方法中,只有分布式并行聚类算法被用来分析实验数据;在第二个方法中,添加一个降维后的数据集群操作数据。通过这种方式,检出率显著增加。降维的数据是非常有效的。因此,第三种方法使用相同的数据集降维分析数据集的关联规则。第四个方法是一种安全形势用神经网络识别模型。首先,数据清洗和分析态势感知能力。神经系统是用于纠正结果的初步分析,得到最终结果。

为了验证分布式并行模型的加速度,1 - 5节点被选为集群在这个实验中实验。最大的数据“并行和串行时间比较”被选为实验测试数据集。

6显示节点的数量继续增加,加速模型的曲线也会增加。然而,当节点的数量是3到4,曲线的增长速度变得缓慢。这是因为越来越多的节点相互通信的成本增加。节点之间的通信会消耗一定的资源和时间。从实验中可以看出,安全态势感知模型基于神经表现良好的准确性,假检出率,时间和效率。

在图7,三个模型提出了安全态势感知已经大大提高了与第一部分实验相比,和准确率都在90%以上。然而,不同于前两个部分,在这部分实验中,神经和恒星结构的检出率超过了森林模型的检出率。这是因为原始数据有效地预处理后的第一阶段的态势感知,所以神经模型和星数据集的结构模型克服敏感的缺点,因此,检出率较高。

在图8,第二个指标是假的检出率(即,异常数据检测到错误。数据被认为是正常的比例)。从数据图中,不难发现这三个模型的检出率是90%以上,每个异常类型能被探测到,错误检测率低于10%。因此,提出的三种模型用于安全态势感知性能更好。

从图9,我们可以得到的结论是,当处理数据集的大小相同。这一结论是合理的在第三部分第一组实验。由于恒星结构的模型特征,尽管许多外围模块并行处理节点同时,所有数据的情况下投影舞台中央核心处理模块,从而导致性能的时间效率。不如森林模型。每个节点执行树构建的一部分数据的操作,从而形成一个森林模型的整个安全形势。最后,最终的安全形势判断模式的每棵树的结果,这不仅可以避免片面性,也让数据非常有效的处理由于这样的结构特点。

随着节点数量的逐渐增加,处理时间模型之间的比较。在图10集群的规模继续扩大,并参与并行操作的节点数量逐渐增加,但时间节点之间数据通信和传输的消费也会增加。神经模型的节点加速度率相对较低,因为每个节点之间的通信是在误差相对较大调整神经网络的学习过程。集群的规模扩大时,节点并行处理数据的数量也在增加,这使得加工效率的提高不明显,当节点数量的增加。在这部分实验中,节点加速森林的比率模型和星结构具有可比性。就像前面提到过的部分,由于森林模型本身的结构特点,在整个生产过程的安全形势意识,每个节点用于数据处理,如独立构建决策树和相互之间的数据传输是相对较小,所以加速度比很好。恒星的结构是一样的森林模型的前两个阶段安全态势感知能力。每个节点独立处理数据,并行效果很好。只有在第三阶段会有节点之间的数据传输。

11显示了增长曲线的加速度比曲线,曲线下降是规模比曲线。曲线都是近似线性的。实验结果表明,该模型可以实现良好的加速比和规模比在分布式集群。

6。加强网络安全治理的对策和建议在大数据的时代

6.1。提高立法、系统和网络安全的法律意识

法律是一个系统的强制性规范;这是一个制度保障网络安全管理。在缺乏法律的情况下,即使是最先进的技术和管理工具很难管理。网络安全相关法律法规明确警告所有的人以不同的方式在网上什么行为是不可接受的,什么是允许的。虽然法律是一个预防的工具和一个执行工具,网络安全的原因是创建最强大、最可靠的一道防线。

但是。有效的法律和法规有关网络安全改进数据管理

从第一个“法规保护计算机信息系统安全”采用和实施到1994年的第一次重大网络安全法律,在“网络安全法律中华人民共和国”的采用和实施2017年,政府有足够的关注和坚定支持网络安全管理方面的政策和法规。

然而,互联网的发展是不可阻挡的,任何技术上的突破可能会导致剧烈变化。立法,只有稳定和随着时间的推移,掌握互联网的发展的动力和方向,坚持网络安全工作的管理层面的法律支持,及时有效的新兴事物,标准化的管理体系,逐步多元化数据,网络行业的生命线管理系统的范围,那么仔细,只有用这种方法我们才能确保健康,有序,安全设备的网络行业的发展。

6.1.2。提高公众意识,促进网络安全法律法规

尽管网络为人们提供了很多便利,同时也带来了一些网络安全问题。为了确保每个公民的网络安全,必须提高法律意识,网络安全意识,掌握基本的保护技能,防止网络欺诈和盗窃,提高文明上网的质量,自觉规范合法的网络行为。自己虽然都可以工作得很好,他们可以聚在一起在一个强大的美国网络安全的力量。

自2014年以来,全国公共安全机构举行年度9月份现场促销活动,“国家网络安全法律意识周理论日”,有效地提高每个人的意识的安全的互联网使用。太原市公安局网络安全部门也组织大型促销活动期间年度网络安全宣传周和逐步发展从五一市场在城市的不同区域,各种质量的法律广告,反欺诈广告,回答问题,解决问题。

6.1.3。建立一个数据资源安全保护模型适合太原

目前,中国的大数据产业主要集中在发达地区如北,广州和深圳,和许多知名企业如新浪,百度,360和腾讯给这些地区带来顶尖科技人才,使这些地区大数据行业的领导者。此外,西南的大数据行业集中在贵州,研究和建立监管政策体系有利于促进大数据创新和发展,积极引进大数据相关重点企业和人才,导致重大的发展,逐步创建了一个“中国大数据中心。”

在传统的地区,山西是弱势群体由于区域限制,交通、气候、和其他因素;由于山西转型和发展的一个重要时期,全面改革示范区的也是位于太原。我相信太原应该增加大数据的经济投资,积极引进multisector人才,试图抓住发展机遇,继续进行研究和开发,实现技术和经济的发展,实现产业的发展。

6.2。严格的监管互联网犯罪网络环境和清理

总书记习近平高度重视网络安全,强调“网络空间是数亿人的共同知识家庭,“这地方具体要求各级公安机关严格管理网络安全,打击违法犯罪活动使用。公共安全机构,特别是网络安全部门,应该记住他们的目的全心全意为市民服务,离开他们的责任和行动来实现一个机制来快速解决互联网相关案例和事件为公民创造一个安全、透明的网络环境。

6.2.1。加快流程和安全管理工作的效率和及时跟踪并补充相关的措施

由于公安机关的区域授权,许多互联网案件处理在不同的地区,要求公安机关之间的合作在不同的位置。为了加快这一进程的网络安全管理,提高网络安全管理的有效性,有必要加强地区公安机关之间的互连机制,尤其是在网络安全领域。区域公共安全机构的优势“大数据”字段应该共享数据资源帮助打击和惩罚的网络攻击,而相对落后的地区应加强机构能力的人员的调查,预防和控制、检测和监测,等。大数据”将只提供人才和数据相结合。只有天才和数据的结合可以作为“大数据”在这一领域。

国家网络安全应该“棋子”的思想,坚决打破区域壁垒,可以设置公安部,省公安局抓的主要战场和市公安局网络安全形势的主要战场,并执行更多的“清洁网络”,“打击色情和非法的,”等。更多的特种作战网络安全,如“清理网络,”“打击色情和非法活动,”等等,应该实现,基于实际操作培训团队,活力从经验和教训,并利用网络安全信息资源的优势来对抗网络犯罪和保护网络安全保护作为一个强大的力量在打击网络犯罪和网络安全的保护。

6.2.2。最大化的使用大数据资源开发和实施积极的网络安全管理

“为了充分利用大数据,我们必须先看网络安全管理本身的弱点,从自己开始。

鉴于网络安全管理的难度,管理网络访问权限,加强数据加密,和硬化终端而不是失去了作为保护数据安全的有效手段,这些都是不能一劳永逸地进行或进化的“大数据。”因此,充分利用资源的“大数据”实施和执行面向未来网络安全管理,提高网络安全管理人员的技术水平,检查和灌装时间的差距,和更新固件,等等,网络安全管理必须顺利实现克服攻击网络。

6.2.3。提高大数据的预警功能和决策的重要性

所谓的“大数据”不是大数据,而是基于大数据的数据分析,并有很强的预测能力。已经提到了“高中女生怀孕预测”只是一个“大数据的小程序。

当互联网相关事件、事故频繁发生,有必要使用大数据的预警能力准备响应,不仅监视和检测事件和事故发生后也提醒罪犯,提前识别可能的犯罪活动,并消除犯罪的摇篮。

6.3。加强网络安全管理部门的软件和硬件

“没有良好的‘武器’在大数据时代,这当然是不可能赢得网络安全管理的“战斗”。我相信网络的软件和硬件安全管理部门应加强在以下三个方面。

6.3.1。使用高精度的硬件和技术投资增加

与“大数据”在zb的总数和平均年增长率超过25%,传统的电子设备是不可能执行重要任务的安全管理和数据分析,因此需要大力投资于研究和发展。大数据是一种战略资源,它关系到公民个人的权利和利益和国家安全,必须充分保护。技术和设备的研究和开发阶段,必须对其进行全面测试在现实世界和实验室模拟试验。

再。数据发现,删除数据的障碍,和数据共享

数据被认为是一个资源和财富,但他们不应该私有财产。如果现有的数据区域和行业壁垒是合理的数据安全和保护商业利益而言,未来的趋势应该是数据共享和协作开发。

我认为应优先考虑在两个方向移除障碍。首先是国家安全的方向,和人们的生活应该协调,资源应该合理分配,应该分析所有数据放在一起,和中国系统应该更好地在各方面,这样更有助于人的方向。第二,打击和惩罚的方向也应该聚合数据,开发和共享,在“失败”的精神理念,实现维护国家安全。

6.3.3。强化训练大数据专业人员的努力

在中国,网络安全,大数据池,和其他领域的人才相对稀缺。面对大数据时代的迫切要求,我们必须把更多的精力培养大数据专业人员。人才是一个重要的体现国力和人才的缺乏是一个弱点。全球的大数据正在失去动力,我们需要快点,以免被留下。

我认为我们可以用三种方法来改善我们的大数据人才库。首先,国家应该添加在网络安全专业培训项目,大数据,和其他相关领域的人力资源教育,特别是在本科和研究生水平,基于可持续的长期培训的专业人士。第二,无论模型,我们把人才招聘和提高能力的现实社会精英人才的开发、分析和使用大数据。第三,从真正的工作,我们增加人才培养的资金,鼓励创新。第三,从真正的工作,我们增加投资对人才培训和培养实用人才,三个方面的共同努力,加强中国网络安全管理,大数据,和其他领域的共同力量。

7所示。结论

信息安全教育是素质教育的一个重要组成部分。改善公共信息安全教育是非常重要的社会本身的发展和维护国家安全。近年来,政府出台了一系列措施和政策,加强信息安全技术的研究和开发,促进信息安全保护的发展水平;大学逐渐关注信息安全教育和开展相关的学术工作,和公众的信息安全意识教育一直在增加,信息安全教育在中国已经被一个良好的环境支持和保护。根据中国信息安全教育的现状,本文阐明了概念和特点的信息安全教育在大数据时代,然后提出了一种自适应安全态势感知模型处理流数据带来的问题在复杂环境中基于以前的研究的一般理论。模型使用一个自学与误差反馈的自适应学习策略,从而有效地减少错误检测的概率,提高了检测率超过98%,使其能够适用于大规模高维数据流的处理。

数据可用性

使用的实验数据来支持本研究的发现可以从相应的作者。

的利益冲突

作者宣称没有利益冲突。

确认

这项研究是由教育部科技发展中心的生产创新基金中国高校(批准号2020年,A07027)”。