文摘

智能家居带来了新的以人为本的家庭生活经验。然而,边缘设备在这系统正面临着严重的威胁,如数据安全和设备安全。解决上述问题,本文提出了一种基于重复博弈的入侵检测方案。我们第一次使用再邻居(资讯)算法分类边缘设备和装备集群头的入侵检测系统。其次,我们使用遗憾最小化算法来确定一阶博弈的混合策略纳什均衡,然后采取严厉的惩罚策略驯养恶意攻击者。第三,减少入侵检测系统可以检测到恶意攻击者的回报。最后,详细的实验结果表明,该方案可以减少攻击入侵检测系统,然后实现防御攻击者的目的。

1。介绍

物联网(物联网)正进入人们的生活,使人类的生产和生活更加智能和方便。智能家居是物联网的一个典型应用1]。智能家居集成综合布线技术、网络通信技术和是一个有效的管理系统2]。然而,智能家居正面临严重的安全威胁,如数据安全和设备安全(3]。边缘设备的分布过于分散,在智能家居应用安全技术。此外,一些设备使用过时的版本,无法远程升级的弱点和漏洞,使智能家居设备容易受到攻击。例如,设备如相机和智能恒温器收集信息对人们的日常生活,可以直接或间接地回溯到人。一旦偷来的智能家居设备的数据,用户的私人信息将被披露。因此,迫切需要设计一个有效的安全保护计划,以确保用户数据安全的智能家居。

入侵检测技术是一个方法来抵抗攻击者入侵,可以监视、分析和处理各种入侵尽可能在不影响网络性能,提高网络的能力来应对外部威胁。根据所使用的技术,入侵检测技术可以分为三类:异常检测、滥用入侵检测,和混合入侵检测。异常检测技术可以探测到新的入侵,但是很难建立攻击者的行为模式4]。误用检测技术检测精度高,但很难收集和更新入侵信息(5]。混合入侵检测技术结合误用检测和异常检测、继承的优点,提高了检测率,降低假阳性率(6]。综上所述,现有的入侵检测技术主要有以下缺点:太难处理的数据量和数据维数太高,会减少。

灵感来自上面的方案,本文模型攻击者之间的相互作用和入侵检测系统重复博弈,提出了一种入侵检测方案基于重复博弈保护智能家居的安全。主要贡献如下:(1)降低入侵检测系统的装备成本,本文运用再邻居(资讯)算法对边缘进行分类的入侵检测系统设备和装备集群头保护智能家居系统实现的目的。(2)抵御攻击者,我们建立攻击者之间的相互作用和入侵检测系统作为一个重复博弈模型,使用遗憾最小化算法来确定这个游戏的混合策略纳什均衡,并设置严厉的惩罚机制来迫使攻击者采取好的措施。(3)仿真实验的一部分,我们比较方案和赢家,所有的s,所有p,和全r与三个因素:入侵检测率,攻击者的回报,入侵检测系统的回报。实验结果表明,该方案可以抵抗攻击者。

本文的其余部分组织如下:部分2介绍了入侵检测技术的代表性成果。我们提出一个入侵检测在智能家居方案基于重复博弈部分3。部分4显示了入侵检测的性能方案基于重复博弈。最后,部分5总结了可能的扩张和未来的研究方向。

入侵检测技术(7可分为三种类型:异常检测、误用检测和混合入侵检测。本部分主要总结了两种异常检测和误用检测技术。

异常入侵检测(8)的入侵活动异常活动的一个子集,它分为特征选取异常检测、基于贝叶斯推理异常检测和模式prediction-based异常检测。特征选取异常检测是准确预测或分类通过选择指标的一个子集,可以检测到入侵检测入侵(9,10]。然而,指标设置不能涵盖所有的各种入侵类型;和preidentified具体指标集可能入侵小姐独自在一个特定的环境。基于贝叶斯推理的异常检测是判断系统入侵事件通过测量变量(11,12]。然而,这种方法需要的每个变量相关分析确定每个变量和入侵事件之间的关系。模式prediction-based异常检测认为入侵事件的序列及其相关性(13,14),但未被认可的行为模式和异常事件在这个方法判断。

误用入侵检测(15,16通过匹配)检测入侵事件定义的入侵模式与观察到的入侵行为,可分为概率或有滥用入侵检测,状态转换分析滥用入侵检测,和键盘monitoring-based误用入侵检测。概率的误用入侵检测将入侵映射到一个事件序列,然后推断入侵发生通过观察事件(17,18]。然而,在这种方法中,先验概率很难给予,和事件恶果是很难满足的。状态转换分析滥用入侵检测作为攻击的一系列监控系统的状态转换(19,20.]。然而,攻击模式只能描述一系列事件和不适合描述复杂的事件。键盘monitoring-based误用入侵检测假设入侵对应于一个特定的击键序列模式,然后监视用户击键模式和匹配这个模式的入侵模式来检测入侵(21,22]。但这种方法,没有操作系统的支持,缺乏一个可靠的方式来捕获用户的击键,用户可以很容易地欺骗技术通过使用别名命令。

解决上述问题,我们不再检测到攻击者的入侵基于特征但考虑入侵检测系统的回报;也就是入侵检测系统检测到入侵攻击者通过观察其收益减少。

3所示。基于重复博弈的入侵检测方案

本节描述如何入侵检测系统检测到攻击者的恶意行为和恶意攻击者如何教育好策略。符号定义如表所示1

3.1。一阶游戏

在智能家居中,由于大量的边缘设备和有限的服务能力23,24),是不可能每个边缘上的入侵检测系统设备运行,所以我们需要设计一个策略来分配边缘上的入侵检测系统装置。我们第一次使用聚类算法边缘设备划分为多个集群,然后为每个簇首节点配置入侵检测系统在智能家居25,26]。每个集群都有一个簇首节点和若干成员节点。前者主要负责信息转发和执行集群内部的入侵检测程序,而后者负责收集信息和传递信息到簇首节点(27,28]。假设有N边缘设备,分为k集群由资讯算法, 我们假设攻击者可以攻击一个簇头和模型的入侵检测系统之间的相互作用和攻击者作为一阶博弈模型。也就是说, 在哪里P是一阶的玩家游戏,入侵检测系统和攻击者, 是战略空间, ,U是球员的回报。攻击者有四个策略, 指的是事实,攻击者不攻击任何簇头; 是指攻击者攻击的簇首节点 ; 集群是指攻击者攻击的事实 T次; 是指攻击者攻击的簇首节点 同时,入侵检测系统有四个策略, 指的是事实,入侵检测系统不保护任何簇头; 指的是事实,入侵检测系统保护集群 ; 指的是事实,入侵检测系统保护集群 T次; 指的是事实,入侵检测系统保护集群 因此,攻击者的策略配置文件和入侵检测系统可以被定义为

行代表攻击者的策略和列代表了入侵检测系统的策略。假设 是攻击者的回报和入侵检测系统,分别。因此, 在哪里一个是指攻击者d指的是入侵检测系统。策略配置文件 指的是事实,攻击者不攻击集群头,而入侵检测系统保护集群。这个时候,攻击者获得回报0为代价的 , ,和入侵检测系统的成本 获得回报 , 同样,我们可以攻击和入侵检测系统的支付矩阵,如图所示XY: 在哪里 攻击集群头的成本吗 , 攻击集群头的成本吗 T次, 持续的成本保护集群头吗 , 保护簇头的成本吗 T次, 集群攻击正面的回报吗 , 入侵检测系统对攻击的回报。可以看出从支付矩阵不存在纯策略纳什均衡在这个游戏中,和入侵检测系统可以观察到恶意攻击者根据其回报减少。此外,入侵检测系统总是试图确定集群的头被攻击者攻击,然后保护它的回报最大化。因此,我们使用遗憾最小化算法决定了未来的行动的选择方法,根据后悔的程度来确定球员的混合策略纳什均衡。因此,玩策略的概率 在圆形的T定义如下: 在哪里 是入侵检测系统的策略集, 是玩战略的后悔值吗 , 是所有策略的累积后悔值。

3.2。重复博弈

在攻击者之间的相互作用的过程和入侵检测系统,入侵检测系统可以检测到攻击者的入侵通过观察的变化他们的回报。然而,攻击者并没有影响他的当前战略未来的回报,也就是说,他只考虑一个交互的回报;因此,很难防止攻击者在一阶的游戏。但是如果攻击者的入侵检测系统惩罚,攻击者将不得不考虑带来的惩罚成本的重复博弈中的入侵检测系统;如果攻击的惩罚成本超过收益的攻击,攻击者将被迫采取nonattack策略。因此,入侵检测系统不需要实施监督,然后实现的目的,维护整个网络的正常秩序。

在重复博弈,假设 播放器采用的策略吗etth,战略的球员e在前面的T圆是 总回报的球员e可以表示为 在哪里 是折扣因素, 更大的 ,越e注重长期回报;和较小的 是,更多的球员e注重当前的回报。由于入侵检测系统不能检测到攻击者第一次,我们假设入侵检测系统的检测率,攻击者小于1, 攻击者被发现的概率的入侵检测系统k次的攻击 攻击者的总回报

在以前的研究网络安全保护,一旦被攻击者的入侵检测系统,该网络将删除该节点。然而,它将会影响到整个网络,因此没有任何攻击者的控制影响行动。因此,本文设计一种严厉的惩罚机制,教育捕获攻击者进入常规球员。当攻击者发现不合作的时间段k内,T处罚周期, ,攻击者的回报可以被定义为

如果节点检测到在第二次攻击,节点与一段2将受到惩罚T,总回报周期是攻击者的惩罚

攻击者的损失惩罚周期

我们把攻击者的损失处罚周期作为额外奖励的入侵检测系统。因此,入侵检测系统的收益可以被定义为 在哪里 攻击者的损失在点球周期。

通过比较两个点球周期攻击者的回报,可以看出,攻击者的回报与增加背叛的数量减少。除此之外,如果叛变由攻击者的数量超过阈值的入侵检测系统,攻击者将被取消;和簇首节点将不再与攻击者。

4所示。仿真实验

本文运用蟒蛇集成开发工具来验证基于重复博弈的入侵检测方案。首先,我们模拟资讯算法的分类过程,设置四个新添加的节点来证明其有效性。其次,我们比较攻击者的回报和入侵检测系统在处罚周期和常规交互周期验证惩罚机制的有效性。第三,我们确定最优策略,每一轮的攻击和入侵检测系统之间的交互通过遗憾最小化算法。最后,我们比较四种交互策略的方案,赢家(获胜者的策略),所有的s(保持战略剪刀),所有p(保持战略文件)和全r(保持策略的岩石),证明该方案可以提高玩家的收益。实验参数如表所示2

4.1。资讯的分类结果

1描绘了分类结果的资讯算法。图1(一)显示了原始边缘设备节点的分布。图1 (b)显示了分类结果的资讯算法,每个符号代表一个类的边缘设备。

2分析的结果分类新添加的节点,与新添加的节点标记为蓝色。例如,在图2(一个)(新添加的节点),蓝色节点是归类为头等舱。

4.2。攻击者的比较的回报和入侵检测系统的回报

3比较了袭击者的回报在常规交互周期和惩罚周期。正如你所看到的图3(一个)期间,攻击者的回报不会改变常规交互周期,因为入侵检测系统不防御策略。图3 (b)表明攻击者的回报与增加交互的数量逐渐减少。4互动,攻击者的回报趋于零。此外,惩罚周期越长,越快攻击者的回报将会为零,和损失会越大。这是由于惩罚机制。因此,对于一个理性的攻击者,通常必须与入侵检测系统进行交互来最大化其收益。

4比较了入侵检测系统的支付定期交互周期和惩罚周期。从图可以看出4(一)入侵检测系统的回报是−3期间定期互动循环。这是因为攻击入侵检测系统不玩任何有缺陷的策略。图4 (b)表明,入侵检测系统的损失和增加惩罚周期的数量减少;和回报的入侵检测系统时的最低处罚期是5。综上所述,该方案可以减少入侵检测系统时,攻击者发动攻击。

4.3。遗憾最小化算法应用于剪刀-游戏

3定义了石头,剪刀和步这个支付矩阵的两个玩家的游戏。在这个表,行代表球员的策略,列代表玩家B的策略,第一个元素的元组(0,0)代表球员的回报,第二个元素表示玩家B的回报。

4分析如何球员一个决定了它的最优策略基于遗憾最小化算法。例如,在第一回合,玩家和玩家B选择岩石和纸,分别然后球员的后悔值玩剪刀,石头,和纸都是0,2和1,分别;因此玩家玩摇滚的概率、剪刀和纸是0,2/3和1/3。同样的,我们可以获得最优策略的球员在每一轮。

4.4。球员和球员之间的回报比较B

5比较了支付的球员和球员B当球员采用五个策略:遗憾最小化策略(后悔),全r,所有p,所有的s,和冠军,球员B采用一个遗憾最小化的策略。从表可以看出5,当且仅当运动员采用所有p,玩家B采用后悔获得回报低于球员,但回报球员和球员之间的差异很小。然而,在其他几个策略,玩家B获得最高回报的遗憾。这是因为玩家B最大化策略的概率最大后悔值。球员的收益变化曲线如图A和B5。在这个图中,大幅增加和减少回报的球员和球员B是由于球员的调整策略。

5。结论

设计一个高效和安全的保护计划的关键是促进系统的应用程序。本文提出一种基于重复博弈的安全保护方案。在这种情况下,入侵检测系统检测到恶意攻击者通过观察其收益变化和惩罚攻击者采取恶意策略严重教育攻击者采取良好的行动。实验结果表明,该方案可以有效地抵御攻击者。

在未来的研究中,我们将继续探索新的方法来确定球员的有限元模型中的最优策略。

数据可用性

使用的数据来支持本研究的结果包括在本文中。

的利益冲突

作者宣称没有利益冲突。

确认

这项研究得到了国家自然科学基金(批准号下的国家自然科学基金委)下61872205,山东省自然科学基金批准号ZR2019MF018,青岛的源创新项目批准号18-2-2-56-jch。