视交叉上核gydF4y2Ba 安全性和通信网络gydF4y2Ba 1939 - 0122gydF4y2Ba 1939 - 0114gydF4y2Ba HindawigydF4y2Ba 10.1155 / 2019/1362964gydF4y2Ba 1362964gydF4y2Ba 研究文章gydF4y2Ba 基于双向信号的积极防御战略选择方法gydF4y2Ba https://orcid.org/0000 - 0001 - 9446 - 7426gydF4y2Ba 刘gydF4y2Ba 小虎gydF4y2Ba 1gydF4y2Ba 2gydF4y2Ba https://orcid.org/0000 - 0002 - 1649 - 7336gydF4y2Ba 张gydF4y2Ba 恒威gydF4y2Ba 1gydF4y2Ba 2gydF4y2Ba 张gydF4y2Ba 将尝试gydF4y2Ba 1gydF4y2Ba 2gydF4y2Ba 邵gydF4y2Ba 露露gydF4y2Ba 1gydF4y2Ba 汉gydF4y2Ba JihonggydF4y2Ba 1gydF4y2Ba 2gydF4y2Ba NamingydF4y2Ba 阿克巴年代。gydF4y2Ba 1gydF4y2Ba 郑州信息科技学院gydF4y2Ba 郑州450001gydF4y2Ba 中国gydF4y2Ba zznu.edu.cngydF4y2Ba 2gydF4y2Ba 数学工程国家重点实验室和先进的计算gydF4y2Ba 郑州450001gydF4y2Ba 中国gydF4y2Ba lsec.cc.ac.cngydF4y2Ba 2019年gydF4y2Ba 29日gydF4y2Ba 11gydF4y2Ba 2019年gydF4y2Ba 2019年gydF4y2Ba 23gydF4y2Ba 06gydF4y2Ba 2019年gydF4y2Ba 25gydF4y2Ba 09年gydF4y2Ba 2019年gydF4y2Ba 31日gydF4y2Ba 10gydF4y2Ba 2019年gydF4y2Ba 29日gydF4y2Ba 11gydF4y2Ba 2019年gydF4y2Ba 2019年gydF4y2Ba 版权©2019小虎刘et al。gydF4y2Ba 这是一个开放的文章在知识共享归属许可下发布的,它允许无限制的使用,分布和繁殖在任何媒介,提供最初的工作是正确的引用。gydF4y2Ba

大多数网络安全研究基于信号游戏假设攻击者或后卫是信号的发送方,另一方是接收机的信号。攻击和防御过程通常从单向信号传输的角度建模和分析。针对现实的双向信号传输在网络攻击和防御对抗,我们提出一个方法积极防御战略选择基于双向信号游戏。本文构造一个双向信号博弈模型,分析了网络攻击和防御的过程。基于解决方案的完美贝叶斯均衡,防御策略选择算法。该方法的可行性和有效性进行了验证利用现实世界的例子应用程序。此外,欺骗信号的机理进行了分析,结论为指导选择积极防御战略。gydF4y2Ba

中国国家自然科学基金gydF4y2Ba 61521003gydF4y2Ba 61572517gydF4y2Ba 河南省科学技术厅gydF4y2Ba 182102210144gydF4y2Ba
1。介绍gydF4y2Ba

网络信息技术发展迅速,和互连系统正在上升gydF4y2Ba 1gydF4y2Ba]。然而,网络安全事件构成主要和永恒的问题gydF4y2Ba 2gydF4y2Ba]。国防技术由防火墙、入侵检测和反病毒软件提供被动响应防御基于先验知识和攻击特征,但他们无法应对新类型的复杂的网络攻击的一种有效和及时gydF4y2Ba 3gydF4y2Ba]。被申请人可以积极地选择一个有针对性的防御策略,预测攻击者的行为和干扰或阻止攻击过程,同时最大化自己的利益,那么防御可能被称为一个主动防御(gydF4y2Ba 4gydF4y2Ba]。网络安全的本质是一场在进攻和防守之间。防御的有效性不仅取决于自身的战略行动,还影响和受到攻击者的行动gydF4y2Ba 5gydF4y2Ba]。关键的问题是如何选择最优主动防御策略的信息仅限于对抗环境。gydF4y2Ba

相反的目标的特点,战略依赖,网络攻击和防御和非合作的关系符合游戏的核心哲学理论,即最优决策在一个冲突的环境中。一些学者,如参考文献的作者。(gydF4y2Ba 6gydF4y2Ba- - - - - -gydF4y2Ba 11gydF4y2Ba),建立了基于博弈论的网络安全模型,分析了进攻和防御对抗过程,解决了游戏平衡来确定防御策略和指导防御行动。我们分类,分析了现有的研究成果结合这两个因素的游戏信息和行动时机和得出了以下的结论:gydF4y2Ba

在完全信息静态博弈,有许多前提假设和模型很容易建立,证明在裁判。gydF4y2Ba 12gydF4y2Ba]。gydF4y2Ba

在完全信息动态博弈,由于持续的进攻和防御对抗过程中,以前的行动可能是研究影响随后的比赛过程中,裁判所示。(gydF4y2Ba 13gydF4y2Ba]。gydF4y2Ba

在与不完全信息静态博弈中,玩家可以使用静态贝叶斯规则来推断对方的私人信息和突破完全信息的假设,比如在裁判。gydF4y2Ba 14gydF4y2Ba]。gydF4y2Ba

与不完全信息动态博弈,已故的球员所观察到的部分作用早期的球员,即使没有完全理解的行为类型。然而,由于行为类型的依赖,一个可以修改的行为类型的先验判断早期玩家通过使用动态贝叶斯规则,裁判中描述。gydF4y2Ba 15gydF4y2Ba]。自进攻球员和防守球员都不完全理解对方的信息,受到的动态和持续的自然对抗过程中,不完全信息的动态博弈是更符合实际的网络攻击和防御。因此,这种类型的游戏是目前网络安全的重点研究。gydF4y2Ba

信号博弈是一个典型的与不完全信息动态博弈,它提供了一个正式的数学方法来分析如何在cyber-social系统耦合的身份和欺骗。(gydF4y2Ba 16gydF4y2Ba它描述了游戏的战略相互作用过程通过信号传输gydF4y2Ba 17gydF4y2Ba),非常适合学习积极防御战略的选择。在裁判。gydF4y2Ba 18gydF4y2Ba),从动态的角度对抗和有限的信息,构造一个两阶段信号博弈模型得出一个最佳的防御策略。证明在裁判。gydF4y2Ba 19gydF4y2Ba),信号博弈模型可以用来分析移动目标防御。防守端可以改变双方的信息不对称释放动态转换信号,从而扩大自己的利益。在裁判。gydF4y2Ba 20.gydF4y2Ba),DDoS攻击和防御过程建模为多级信号游戏,和找到一个平衡的解决方案。此外,服务器端口跳跃防御策略已经证明是有效的。在裁判。gydF4y2Ba 21gydF4y2Ba),构造多级进攻和防御信号博弈模型的建模不完全信息下的多级动态攻击和防御过程约束。另外,信号衰减的因素是用来量化的影响防守防守方的信号。在裁判。gydF4y2Ba 22gydF4y2Ba),解决鱼叉式网络钓鱼攻击的工业控制系统,建立了多级进攻和防御博弈模型。国防战略选择的基础上,综合考虑收益和成本。最后,裁判。gydF4y2Ba 23gydF4y2Ba]分析了物联网的安全问题通过多级博弈模型并提供了具体的防御策略。gydF4y2Ba

尽管自己的长处,以上研究假设网络攻击和防御过程只涉及单向信号传输,因此,攻击和防御过程建模和分析通过指定攻击者或后卫作为信号发送方和另一方的信号接收器。然而,在实际的网络攻击和防御过程中,攻击者和后卫将有一系列的战略互动。攻击和防御方通常是两个信号的发送者和接收者。如果发送方的传输信号被视为刺激,然后选择的收件人的响应是一个反应。在双向持续刺激反应过程中,后卫和攻击者不断调整和优化各自的策略,从而推动动态进化攻击和防御(gydF4y2Ba 24gydF4y2Ba]。因此,游戏网络攻击和防御应该是一个双向信号发送和接收机制。gydF4y2Ba

为了解决上述问题,我们构建一个双向信号博弈模型来分析网络攻击和防御过程基于双向传导机制的实际攻击和防御信号。基于解决方案的完美贝叶斯均衡,防御策略选择算法。这项工作的主要贡献如下:gydF4y2Ba

双向信号传导机制:进攻和防守方发送方和接收方的发挥双重作用。而影响另一方的战略选择通过释放信号,他们也受到信号发布的另一方的影响。gydF4y2Ba

游戏设置包含真和假信号的信号:为了扰乱对方的认知决策过程,进攻和防守两个方面,在网络对抗的过程中使用信息对策释放真与假信号的混合物。自信号接受者对虚假信号有一定的辨别能力,欺骗性的虚假信号减少攻击和防御游戏的进展。gydF4y2Ba

动态多级游戏过程:进攻和防御对抗仍在多个阶段,双方继续学习和发展基于信号之间的相互作用,动态调整操作策略,最大化其收益。通过一个双向信号传导机制,本文提出的方法能更精确地描述进攻和防御策略冲突的过程。因此,这种方法更接近模型一个实际网络攻击和防御的过程。它也可以作为一个更好的理论参考,在主动防御策略的选择提供实际的指导在动态条件下的不完整的信息。gydF4y2Ba

2。建设一个双向攻击和防御游戏信号模型gydF4y2Ba 2.1。攻击和防御游戏过程的分析gydF4y2Ba 2.1.1。基本信号博弈过程gydF4y2Ba

游戏包含两个玩家的基本信号:信号发送器和信号接收器。首先,根据哈萨尼转换(gydF4y2Ba 25gydF4y2Ba),虚拟球员“自然”选择信号发送者的类型gydF4y2Ba θgydF4y2Ba和转换选择问题不完全信息条件下的选择问题类型条件下的不确定性。信号发送方知道其类型gydF4y2Ba θgydF4y2Ba,但是信号接收机只知道先验概率gydF4y2Ba PgydF4y2Ba(gydF4y2Ba θgydF4y2Ba),发送方属于类型gydF4y2Ba θgydF4y2Ba。信号发送器释放的一个信号gydF4y2Ba HgydF4y2Ba信号接收器,在观察到的信号gydF4y2Ba HgydF4y2Ba使用贝叶斯规则推导出后验概率gydF4y2Ba PgydF4y2Ba θgydF4y2Ba HgydF4y2Ba 从先验概率gydF4y2Ba PgydF4y2Ba(gydF4y2Ba θgydF4y2Ba),然后选择一个行动策略。信号发送者决定自己的行动策略,预测信号接收机的行动策略,和双方努力最大化各自的收益。这个过程的基本信号如图gydF4y2Ba 1gydF4y2Ba。gydF4y2Ba

游戏的基本信号的过程。gydF4y2Ba

2.1.2。双向攻击和防御信号博弈的过程gydF4y2Ba

网络对抗是动态的和持续的。攻击者和后卫顺序采取行动,并每一方选择自己的行动策略后观察对方发布的信号。双向信号游戏过程如图gydF4y2Ba 2gydF4y2Ba。gydF4y2Ba

双向信号博弈的过程。gydF4y2Ba

(1)初始配置(ICN)gydF4y2Ba。后卫充当信号发送器,攻击者作为信号接收器。这名后卫部署网络信息系统和配置网络地形,IP地址和网络分割。自从网络必须向外界提供服务,它的特点是开放共享、互联和互操作性。网络还必须同源、同构、同质信息网络产品的特点。攻击者可以收集信息的初始配置后卫通过各种途径,包括渗透通过社会工程手段,连续扫描和检测、公共信息采集(gydF4y2Ba 26gydF4y2Ba]。这些信息作为基础攻击者发动网络攻击。在这部作品中,被视为一个信号的信息gydF4y2Ba HgydF4y2Ba DgydF4y2Ba发布的后卫。攻击者所观察到的信号gydF4y2Ba HgydF4y2Ba DgydF4y2Ba,纠正先验判断关于后卫的类型,并确定其攻击战略。游戏过程中所示gydF4y2Ba1gydF4y2Ba阶段的图gydF4y2Ba 2gydF4y2Ba。gydF4y2Ba

(2)动态对抗(宽带)gydF4y2Ba。进攻和防守两个方面,不断切换信号发送者的角色和信号接收器。每个阶段的游戏包括一个基本的信号,所示的S2、S3, SgydF4y2Ba 我gydF4y2Ba阶段在图gydF4y2Ba 2gydF4y2Ba。在这个年代gydF4y2Ba2gydF4y2Ba阶段,攻击者选择攻击策略和释放信号gydF4y2Ba HgydF4y2Ba 一个gydF4y2Ba。后卫接收到信号gydF4y2Ba HgydF4y2Ba 一个gydF4y2Ba,纠正先验判断攻击者的类型,并选择相应的防御策略。在这个年代gydF4y2Ba3gydF4y2Ba阶段,后卫释放信号gydF4y2Ba HgydF4y2Ba DgydF4y2Ba和攻击者接收到信号gydF4y2Ba HgydF4y2Ba DgydF4y2Ba再一次纠正先验评估关于后卫的类型来确定攻击策略。动态对抗的过程中,信号在两个方向上传输,进攻和防守两个方面,利用贝叶斯规则逐步纠正他们的估计对方的真实类型。从这名后卫的角度来看,游戏的终止条件是当攻击者停止攻击,不再释放信号。游戏过程中所示gydF4y2Ba ngydF4y2Ba相图gydF4y2Ba 2gydF4y2Ba。gydF4y2Ba

2.2。双向攻防信号博弈模型的定义gydF4y2Ba

信号扮演了一个角色在发送方和接收方之间的战略互动。信号的发送方确定信号的内容和影响通过信号接收方的行动策略。根据网络杀伤链模型(gydF4y2Ba 27gydF4y2Ba),网络侦察的第一阶段是一个情报收集活动,检测和扫描等,这是由攻击者的后卫。这可能被视为接收信号发布的后卫。在对抗的过程中,信号的发送者可能采取欺骗的想法通过释放信号不匹配自己的类型的目的误导对方的判断和扩大自己的获得gydF4y2Ba 28gydF4y2Ba]。因此,信号通过两个进攻和防守方可以分为两种类型:真正的信号和欺骗信号。gydF4y2Ba

定义1(真正的信号(RS))。gydF4y2Ba

一个真正的信号是一个信号,反映了真实类型的球员。玩家根据自己的选择行动策略类型。实施战略的过程中,不可避免地暴露出一些私人信息;这些信息传输到接收方作为一个真正的信号。一个真正的信号是伴随着一个行动策略,和真正的释放信号不需要额外成本。gydF4y2Ba

定义2(欺骗信号(DS))。gydF4y2Ba

欺骗信号的信号不匹配的真实类型的球员。为了掩盖其真正的类型,诱发信号接收机的玩家建立一个错误的修正先验概率的发出一个信号,表明其类型不匹配,从而使接收方进入一个被动的状态。因为信号不会毫无理由的生成,欺骗性的球员必须支付额外的费用来释放假信号(gydF4y2Ba 29日gydF4y2Ba]。例如,如果一个low-defense用户希望恶搞high-defense用户,它必须部署一些伪装工具和支付一定防御成本释放欺骗信号。防守球员防守的释放信号的一个具体表现的主动防御的哲学gydF4y2Ba 30.gydF4y2Ba),符合欺骗性的概念,“当我们能够攻击,我们必须看起来不能;当使用我们的军队,我们必须在孙子的活动”gydF4y2Ba 战争的艺术。gydF4y2Ba

基于上述分析,双向信号游戏(TWSG)模型构造双向传导机制在实际网络攻击和防御对抗的过程。gydF4y2Ba

定义3。gydF4y2Ba

的gydF4y2Ba TWSGgydF4y2Ba模型有十个元素,gydF4y2Ba TWSGgydF4y2Ba =gydF4y2Ba NgydF4y2Ba ,gydF4y2Ba ΘgydF4y2Ba ,gydF4y2Ba HgydF4y2Ba ,gydF4y2Ba TgydF4y2Ba ,gydF4y2Ba σgydF4y2Ba ,gydF4y2Ba ξgydF4y2Ba ,gydF4y2Ba 年代gydF4y2Ba ,gydF4y2Ba PgydF4y2Ba ,gydF4y2Ba PgydF4y2Ba ˜gydF4y2Ba ,gydF4y2Ba UgydF4y2Ba 。gydF4y2Ba

NgydF4y2Ba =gydF4y2Ba NgydF4y2Ba DgydF4y2Ba ,gydF4y2Ba NgydF4y2Ba 一个gydF4y2Ba 是玩家游戏的空间。它包括两名球员:后卫gydF4y2Ba NgydF4y2Ba DgydF4y2Ba和攻击者gydF4y2Ba NgydF4y2Ba 一个gydF4y2Ba。gydF4y2Ba

ΘgydF4y2Ba =gydF4y2Ba θgydF4y2Ba DgydF4y2Ba ,gydF4y2Ba θgydF4y2Ba 一个gydF4y2Ba 是空间的类型。gydF4y2Ba θgydF4y2Ba DgydF4y2Ba 后卫的类型,gydF4y2Ba θgydF4y2Ba DgydF4y2Ba =gydF4y2Ba ϕgydF4y2Ba 我gydF4y2Ba 我gydF4y2Ba =gydF4y2Ba 1、2gydF4y2Ba ,gydF4y2Ba …gydF4y2Ba ngydF4y2Ba ,gydF4y2Ba ngydF4y2Ba ≥gydF4y2Ba 2gydF4y2Ba ,gydF4y2Ba θgydF4y2Ba 一个gydF4y2Ba 攻击者的类型,gydF4y2Ba θgydF4y2Ba 一个gydF4y2Ba =gydF4y2Ba φgydF4y2Ba jgydF4y2Ba jgydF4y2Ba =gydF4y2Ba 1、2gydF4y2Ba ,gydF4y2Ba …gydF4y2Ba 米gydF4y2Ba ,gydF4y2Ba 米gydF4y2Ba ≥gydF4y2Ba 2gydF4y2Ba 。球员的类型是私人信息,由行动策略,和球员类型会影响双方的游戏回报。gydF4y2Ba

HgydF4y2Ba =gydF4y2Ba HgydF4y2Ba DgydF4y2Ba ,gydF4y2Ba HgydF4y2Ba 一个gydF4y2Ba 是信号空间。gydF4y2Ba HgydF4y2Ba DgydF4y2Ba 是防御信号,gydF4y2Ba HgydF4y2Ba DgydF4y2Ba =gydF4y2Ba hgydF4y2Ba DgydF4y2Ba kgydF4y2Ba kgydF4y2Ba =gydF4y2Ba 1、2gydF4y2Ba ,gydF4y2Ba …gydF4y2Ba vgydF4y2Ba ,gydF4y2Ba vgydF4y2Ba ≥gydF4y2Ba 2gydF4y2Ba ,gydF4y2Ba HgydF4y2Ba 一个gydF4y2Ba 是攻击的信号,gydF4y2Ba HgydF4y2Ba 一个gydF4y2Ba =gydF4y2Ba hgydF4y2Ba 一个gydF4y2Ba lgydF4y2Ba lgydF4y2Ba =gydF4y2Ba 1、2gydF4y2Ba ,gydF4y2Ba …gydF4y2Ba wgydF4y2Ba ,gydF4y2Ba wgydF4y2Ba ≥gydF4y2Ba 2gydF4y2Ba 。信号接收器可以估计发送端根据接收到的信号的类型,和信号空间逻辑对应于空间类型。然而,由于欺骗信号的存在,一个特定的信号没有严格的对应关系与攻击者的特定类型或后卫。gydF4y2Ba

TgydF4y2Ba是游戏的阶段,gydF4y2Ba TgydF4y2Ba =gydF4y2Ba 1、2、3gydF4y2Ba ,gydF4y2Ba …gydF4y2Ba ,gydF4y2Ba tgydF4y2Ba ,gydF4y2Ba tgydF4y2Ba ≥gydF4y2Ba 3gydF4y2Ba 。双向信号游戏仍在多个阶段,gydF4y2Ba tgydF4y2Bath游戏表示为TWSG阶段(gydF4y2Ba tgydF4y2Ba)。gydF4y2Ba

σgydF4y2Ba 是欺骗信号衰减的因素。多个攻击者和防御者战略之间的相互作用后,双方彼此越来越熟悉,和欺骗信号的影响逐渐减弱。在生成的后验概率gydF4y2Ba tgydF4y2Bath阶段游戏修改的因素gydF4y2Ba σgydF4y2Ba tgydF4y2Ba 使它更现实,gydF4y2Ba 0gydF4y2Ba ≤gydF4y2Ba σgydF4y2Ba tgydF4y2Ba ≤gydF4y2Ba 1gydF4y2Ba 。初期欺骗信号不衰减。欺骗信号的衰减程度TWSG (gydF4y2Ba tgydF4y2Ba表示为)阶段gydF4y2Ba σgydF4y2Ba tgydF4y2Ba =gydF4y2Ba σgydF4y2Ba tgydF4y2Ba −gydF4y2Ba 1gydF4y2Ba 。一个足够大gydF4y2Ba TgydF4y2Ba,gydF4y2Ba σgydF4y2Ba TgydF4y2Ba =gydF4y2Ba σgydF4y2Ba TgydF4y2Ba −gydF4y2Ba 1gydF4y2Ba ≈gydF4y2Ba 0gydF4y2Ba 和欺骗的影响信号完全消失。相对应的信号和类型构成关系,双向信号退化成一个不完全信息的静态博弈游戏。gydF4y2Ba

ξgydF4y2Ba 获得折扣因素和吗gydF4y2Ba ξgydF4y2Ba 代表了折扣比例增益的gydF4y2Ba tgydF4y2Ba+gydF4y2Ba 1阶段以及获得的gydF4y2Ba tgydF4y2Ba阶段。折扣比率是用来获得未来阶段转化为现值。gydF4y2Ba

年代gydF4y2Ba =gydF4y2Ba 年代gydF4y2Ba DgydF4y2Ba ,gydF4y2Ba 年代gydF4y2Ba 一个gydF4y2Ba 是战略空间。gydF4y2Ba 年代gydF4y2Ba DgydF4y2Ba是防守方的策略,gydF4y2Ba 年代gydF4y2Ba DgydF4y2Ba =gydF4y2Ba dgydF4y2Ba ggydF4y2Ba ggydF4y2Ba =gydF4y2Ba 1、2gydF4y2Ba ,gydF4y2Ba …gydF4y2Ba 和gydF4y2Ba 年代gydF4y2Ba 一个gydF4y2Ba是攻击者一方的策略,gydF4y2Ba 年代gydF4y2Ba 一个gydF4y2Ba =gydF4y2Ba 一个gydF4y2Ba hgydF4y2Ba hgydF4y2Ba =gydF4y2Ba 1、2gydF4y2Ba ,gydF4y2Ba …gydF4y2Ba 。gydF4y2Ba

PgydF4y2Ba =gydF4y2Ba PgydF4y2Ba DgydF4y2Ba ,gydF4y2Ba PgydF4y2Ba 一个gydF4y2Ba 是先验概率空间。gydF4y2Ba PgydF4y2Ba DgydF4y2Ba是后卫的先验概率的集合,它代表了先验概率已知攻击者的类型的后卫,在哪里gydF4y2Ba PgydF4y2Ba DgydF4y2Ba ≠gydF4y2Ba ∅gydF4y2Ba ,gydF4y2Ba PgydF4y2Ba DgydF4y2Ba =gydF4y2Ba pgydF4y2Ba DgydF4y2Ba 1gydF4y2Ba ,gydF4y2Ba pgydF4y2Ba DgydF4y2Ba 2gydF4y2Ba ,gydF4y2Ba …gydF4y2Ba ,gydF4y2Ba pgydF4y2Ba DgydF4y2Ba TgydF4y2Ba 。gydF4y2Ba PgydF4y2Ba 一个gydF4y2Ba攻击者的先验概率,它代表了先验概率后卫的类型已知的攻击者,在哪里gydF4y2Ba PgydF4y2Ba 一个gydF4y2Ba ≠gydF4y2Ba ∅gydF4y2Ba ,gydF4y2Ba PgydF4y2Ba 一个gydF4y2Ba =gydF4y2Ba pgydF4y2Ba 一个gydF4y2Ba 1gydF4y2Ba ,gydF4y2Ba pgydF4y2Ba 一个gydF4y2Ba 2gydF4y2Ba ,gydF4y2Ba …gydF4y2Ba ,gydF4y2Ba pgydF4y2Ba 一个gydF4y2Ba TgydF4y2Ba 。gydF4y2Ba

PgydF4y2Ba ˜gydF4y2Ba =gydF4y2Ba PgydF4y2Ba ˜gydF4y2Ba DgydF4y2Ba ,gydF4y2Ba PgydF4y2Ba ˜gydF4y2Ba 一个gydF4y2Ba 是后验概率空间。gydF4y2Ba PgydF4y2Ba ˜gydF4y2Ba DgydF4y2Ba 是一组后验概率的后卫,这意味着攻击者的类型的后卫的后验评估,在哪里gydF4y2Ba PgydF4y2Ba ˜gydF4y2Ba DgydF4y2Ba φgydF4y2Ba jgydF4y2Ba hgydF4y2Ba lgydF4y2Ba =gydF4y2Ba εgydF4y2Ba DgydF4y2Ba 1gydF4y2Ba ,gydF4y2Ba εgydF4y2Ba DgydF4y2Ba 2gydF4y2Ba ,gydF4y2Ba …gydF4y2Ba ,gydF4y2Ba εgydF4y2Ba DTgydF4y2Ba 。gydF4y2Ba PgydF4y2Ba ˜gydF4y2Ba 一个gydF4y2Ba 攻击者的后验概率集合,这意味着攻击者的后验评估后卫的类型,在哪里gydF4y2Ba PgydF4y2Ba ˜gydF4y2Ba 一个gydF4y2Ba ϕgydF4y2Ba 我gydF4y2Ba hgydF4y2Ba kgydF4y2Ba =gydF4y2Ba εgydF4y2Ba 一个gydF4y2Ba 1gydF4y2Ba ,gydF4y2Ba εgydF4y2Ba 一个gydF4y2Ba 2gydF4y2Ba ,gydF4y2Ba …gydF4y2Ba ,gydF4y2Ba εgydF4y2Ba 在gydF4y2Ba 。gydF4y2Ba

UgydF4y2Ba =gydF4y2Ba UgydF4y2Ba DgydF4y2Ba ,gydF4y2Ba UgydF4y2Ba 一个gydF4y2Ba 是获得空间。gydF4y2Ba UgydF4y2Ba DgydF4y2Ba 和gydF4y2Ba UgydF4y2Ba 一个gydF4y2Ba 代表了后卫的增益和攻击者的增益,分别。gydF4y2Ba

2.3。获得计算gydF4y2Ba

基于双向信号博弈模型的特点,我们提供以下的定义和计算方法返回游戏。gydF4y2Ba

定义4。gydF4y2Ba

系统损害成本署攻击成本(AC)、国防费用(DC),以及相关的定义和计算方法可以在参考文献中找到。(gydF4y2Ba 23gydF4y2Ba,gydF4y2Ba 31日gydF4y2Ba,gydF4y2Ba 32gydF4y2Ba]。其中,发展受到攻击和防御的组合策略和经常被记录为gydF4y2Ba 署gydF4y2Ba dgydF4y2Ba ggydF4y2Ba ,gydF4y2Ba 一个gydF4y2Ba hgydF4y2Ba 代表的价值系统遭受当防御策略gydF4y2Ba dgydF4y2Ba ggydF4y2Ba 和攻击策略gydF4y2Ba 一个gydF4y2Ba hgydF4y2Ba 。gydF4y2Ba

定义5(欺骗成本)。gydF4y2Ba

欺骗防御成本(DDC)是防御方的成本积极发布欺骗干扰信号攻击者。欺骗攻击成本(DAC)是攻击方的成本,积极发布欺骗干扰信号的后卫。gydF4y2Ba

根据成本/奖励计算方法,攻击者的回报是发展曲线和总成本的总和AC和DAC。后卫的成本之和署,直流,监护系统。gydF4y2Ba

折现系数gydF4y2Ba ξgydF4y2Ba 用于未来收益转换成电流增益。进攻和防御方的获得目标函数可以表示,分别如下:gydF4y2Ba (1)gydF4y2Ba UgydF4y2Ba 一个gydF4y2Ba dgydF4y2Ba ggydF4y2Ba ,gydF4y2Ba 一个gydF4y2Ba hgydF4y2Ba ,gydF4y2Ba tgydF4y2Ba =gydF4y2Ba ∑gydF4y2Ba ggydF4y2Ba ,gydF4y2Ba hgydF4y2Ba ,gydF4y2Ba tgydF4y2Ba ξgydF4y2Ba tgydF4y2Ba −gydF4y2Ba 1gydF4y2Ba 署gydF4y2Ba dgydF4y2Ba ggydF4y2Ba ,gydF4y2Ba 一个gydF4y2Ba hgydF4y2Ba −gydF4y2Ba 交流gydF4y2Ba −gydF4y2Ba DACgydF4y2Ba ,gydF4y2Ba UgydF4y2Ba DgydF4y2Ba dgydF4y2Ba ggydF4y2Ba ,gydF4y2Ba 一个gydF4y2Ba hgydF4y2Ba ,gydF4y2Ba tgydF4y2Ba =gydF4y2Ba −gydF4y2Ba ∑gydF4y2Ba ggydF4y2Ba ,gydF4y2Ba hgydF4y2Ba ,gydF4y2Ba tgydF4y2Ba ξgydF4y2Ba tgydF4y2Ba −gydF4y2Ba 1gydF4y2Ba 署gydF4y2Ba dgydF4y2Ba ggydF4y2Ba ,gydF4y2Ba 一个gydF4y2Ba hgydF4y2Ba +gydF4y2Ba 直流gydF4y2Ba +gydF4y2Ba 监护系统gydF4y2Ba 。gydF4y2Ba

根据攻防类型的gydF4y2Ba θgydF4y2Ba 一个gydF4y2Ba 和gydF4y2Ba θgydF4y2Ba DgydF4y2Ba ,攻防策略可分为不同级别,如强化型和常规型。的成本和收益的策略在同一水平上基本上是一样的。例如,如果一个攻击包含总水平gydF4y2Ba hgydF4y2Ba攻击的政策,那么攻击者的概率选择策略gydF4y2Ba 一个gydF4y2Ba hgydF4y2Ba是gydF4y2Ba 1 / hgydF4y2Ba。这种攻击的增益可以表示为平均水平gydF4y2Ba UgydF4y2Ba ¯gydF4y2Ba 一个gydF4y2Ba dgydF4y2Ba ggydF4y2Ba ,gydF4y2Ba 一个gydF4y2Ba hgydF4y2Ba ,gydF4y2Ba tgydF4y2Ba =gydF4y2Ba ∑gydF4y2Ba hgydF4y2Ba UgydF4y2Ba 一个gydF4y2Ba dgydF4y2Ba ggydF4y2Ba ,gydF4y2Ba 一个gydF4y2Ba hgydF4y2Ba ,gydF4y2Ba tgydF4y2Ba /gydF4y2Ba hgydF4y2Ba 。类似地,如果一个防御的总水平gydF4y2Ba ggydF4y2Ba 防守策略,获得的防御水平gydF4y2Ba UgydF4y2Ba ¯gydF4y2Ba DgydF4y2Ba dgydF4y2Ba ggydF4y2Ba ,gydF4y2Ba 一个gydF4y2Ba hgydF4y2Ba ,gydF4y2Ba tgydF4y2Ba =gydF4y2Ba ∑gydF4y2Ba ggydF4y2Ba UgydF4y2Ba DgydF4y2Ba dgydF4y2Ba ggydF4y2Ba ,gydF4y2Ba 一个gydF4y2Ba hgydF4y2Ba ,gydF4y2Ba tgydF4y2Ba /gydF4y2Ba ggydF4y2Ba 。gydF4y2Ba

3所示。双向信号博弈均衡解和国防战略的选择gydF4y2Ba

双向信号组成的游戏是一种有限的几个基本信号的游戏。在游戏中,攻击者和防御者交替充当信号发送方和接收方的和单一角色平衡解决方案不再适用。在本文中,我们首先提出的解决方案过程单程游戏平衡,然后把它应用到一个多级平衡的解决方案。gydF4y2Ba

我们进行计算和分析单级游戏平衡的解决方案,他指的是信号发送者领袖和信号接收器的追随者。相关的参数设置如下:gydF4y2Ba

信号发送者的行动策略gydF4y2Ba lgydF4y2Ba 1gydF4y2Ba ,gydF4y2Ba lgydF4y2Ba 2gydF4y2Ba ,gydF4y2Ba …gydF4y2Ba ,gydF4y2Ba lgydF4y2Ba ngydF4y2Ba

信号接收器的行动策略gydF4y2Ba fgydF4y2Ba 1gydF4y2Ba ,gydF4y2Ba fgydF4y2Ba 2gydF4y2Ba ,gydF4y2Ba …gydF4y2Ba ,gydF4y2Ba fgydF4y2Ba 米gydF4y2Ba

后卫类型空间gydF4y2Ba θgydF4y2Ba DgydF4y2Ba= (gydF4y2Ba ϕgydF4y2Ba DHgydF4y2Ba ,gydF4y2Ba ϕgydF4y2Ba DMgydF4y2Ba )=(增强类型防御,常规类型防御)gydF4y2Ba

后卫的信号空间gydF4y2Ba HgydF4y2Ba DgydF4y2Ba= (gydF4y2Ba hgydF4y2BaDHgydF4y2Ba,gydF4y2Ba hgydF4y2BaDMgydF4y2Ba)=(增强防御信号,普通防御信号)gydF4y2Ba

攻击者类型的空间gydF4y2Ba θgydF4y2Ba 一个gydF4y2Ba= (gydF4y2Ba φgydF4y2Ba 啊gydF4y2Ba ,gydF4y2Ba φgydF4y2Ba 我gydF4y2Ba )=(增强攻击,普通攻击)gydF4y2Ba

攻击者信号空间gydF4y2Ba HgydF4y2Ba 一个gydF4y2Ba= (gydF4y2Ba hgydF4y2Ba啊gydF4y2Ba,gydF4y2Ba hgydF4y2Ba我gydF4y2Ba)=(增强攻击信号,普通攻击信号)gydF4y2Ba

3.1。单级游戏平衡的解决方案gydF4y2Ba 定义6。gydF4y2Ba

TWSG (gydF4y2Ba tgydF4y2Ba)游戏平衡解决方案gydF4y2Ba 情商gydF4y2Ba tgydF4y2Ba =gydF4y2Ba hgydF4y2Ba ∗gydF4y2Ba lgydF4y2Ba ∗gydF4y2Ba ,gydF4y2Ba ΘgydF4y2Ba ,gydF4y2Ba fgydF4y2Ba ∗gydF4y2Ba hgydF4y2Ba ,gydF4y2Ba PgydF4y2Ba ˜gydF4y2Ba FgydF4y2Ba ΘgydF4y2Ba hgydF4y2Ba ,在那里gydF4y2Ba hgydF4y2Ba ∗gydF4y2Ba lgydF4y2Ba ∗gydF4y2Ba ,gydF4y2Ba ΘgydF4y2Ba 战略领导者的信号,缩写为gydF4y2Ba hgydF4y2Ba ∗gydF4y2Ba ΘgydF4y2Ba ,gydF4y2Ba fgydF4y2Ba ∗gydF4y2Ba hgydF4y2Ba 是跟随者的策略,缩写为gydF4y2Ba fgydF4y2Ba ∗gydF4y2Ba hgydF4y2Ba ,gydF4y2Ba PgydF4y2Ba ˜gydF4y2Ba FgydF4y2Ba ΘgydF4y2Ba hgydF4y2Ba 是追随者的后验概率领导者类型,参数在哪里gydF4y2Ba FgydF4y2Ba ∈gydF4y2Ba 一个gydF4y2Ba ,gydF4y2Ba DgydF4y2Ba 表明,追随者可以攻击者或后卫在不同的游戏阶段,缩写为gydF4y2Ba PgydF4y2Ba ˜gydF4y2Ba FgydF4y2Ba ΘgydF4y2Ba 。根据博弈理论,平衡应该满足两个条件:gydF4y2Ba

fgydF4y2Ba ∗gydF4y2Ba hgydF4y2Ba ∈gydF4y2Ba 参数gydF4y2Ba 马克斯gydF4y2Ba fgydF4y2Ba ∈gydF4y2Ba FgydF4y2Ba ∑gydF4y2Ba PgydF4y2Ba ˜gydF4y2Ba FgydF4y2Ba ΘgydF4y2Ba hgydF4y2Ba UgydF4y2Ba FgydF4y2Ba hgydF4y2Ba ∗gydF4y2Ba ΘgydF4y2Ba ,gydF4y2Ba fgydF4y2Ba ,gydF4y2Ba ΘgydF4y2Ba ,表明条件下的后验概率gydF4y2Ba PgydF4y2Ba ˜gydF4y2Ba FgydF4y2Ba ΘgydF4y2Ba hgydF4y2Ba ,追随者的最佳策略是领导者gydF4y2Ba

hgydF4y2Ba ∗gydF4y2Ba ΘgydF4y2Ba ∈gydF4y2Ba 参数gydF4y2Ba 马克斯gydF4y2Ba hgydF4y2Ba ∈gydF4y2Ba HgydF4y2Ba UgydF4y2Ba lgydF4y2Ba hgydF4y2Ba ,gydF4y2Ba fgydF4y2Ba ∗gydF4y2Ba hgydF4y2Ba ,gydF4y2Ba ΘgydF4y2Ba ,这表明追随者的领袖是最优策略gydF4y2Ba

在这里,gydF4y2Ba PgydF4y2Ba ˜gydF4y2Ba FgydF4y2Ba ΘgydF4y2Ba hgydF4y2Ba 领导类型的表示后验概率的计算基于先验概率的追随者gydF4y2Ba PgydF4y2Ba观察到的信号gydF4y2Ba hgydF4y2Ba,自己的策略gydF4y2Ba fgydF4y2Ba ∗gydF4y2Ba hgydF4y2Ba 。gydF4y2Ba

解决完美贝叶斯均衡的步骤比较复杂,整个过程可以分为以下三个步骤:gydF4y2Ba

步骤1gydF4y2Ba。计算最优策略gydF4y2Ba fgydF4y2Ba ∗gydF4y2Ba hgydF4y2Ba 基于信号接收的追随者gydF4y2Ba

步骤2gydF4y2Ba。领导人可以减少最优策略gydF4y2Ba hgydF4y2Ba ∗gydF4y2Ba ΘgydF4y2Ba

步骤3gydF4y2Ba。选择完美平衡的解决方案gydF4y2Ba 情商gydF4y2Ba tgydF4y2Ba =gydF4y2Ba hgydF4y2Ba ∗gydF4y2Ba ΘgydF4y2Ba ,gydF4y2Ba fgydF4y2Ba ∗gydF4y2Ba hgydF4y2Ba ,gydF4y2Ba PgydF4y2Ba ˜gydF4y2Ba FgydF4y2Ba ΘgydF4y2Ba

详细过程见附录。gydF4y2Ba

基于博弈论,完美贝叶斯均衡解决方案是最优策略的球员(gydF4y2Ba 33gydF4y2Ba]。因此,后卫应该确定主动防御策略基于其角色和游戏平衡情商gydF4y2Ba tgydF4y2Ba。gydF4y2Ba

3.2。多级游戏平衡的解决方案gydF4y2Ba

在多级连续对抗过程中,防守一方可能逐步修改攻击者的动机和行为偏好使用刺激反应的学习机制,减少攻击者的欺骗信号的影响,并实施有针对性的主动防御策略来最大化预期回报。gydF4y2Ba

在第一阶段的比赛TWSG(1),领导者是后卫和追随者是攻击者。gydF4y2Ba

基于哈萨尼转换,病毒球员“自然”选择的类型的后卫。类型gydF4y2Ba ϕgydF4y2Ba DHgydF4y2Ba 和先验概率选择吗gydF4y2Ba pgydF4y2Ba1gydF4y2Ba和类型gydF4y2Ba ϕgydF4y2Ba DMgydF4y2Ba 被选中的概率gydF4y2Ba 1gydF4y2Ba −gydF4y2Ba pgydF4y2Ba1gydF4y2Ba。这名后卫释放信号gydF4y2Ba hgydF4y2BaDHgydF4y2Ba和gydF4y2Ba hgydF4y2BaDMgydF4y2Ba。基于观察到的信号,攻击者选择的策略类型gydF4y2Ba φgydF4y2Ba 啊gydF4y2Ba 和gydF4y2Ba φgydF4y2Ba 我gydF4y2Ba 和纠正其先验评估后卫类型。根据单级游戏平衡解决方案过程中部分gydF4y2Ba 3所示。1gydF4y2Ba,游戏的平衡gydF4y2Ba 情商gydF4y2Ba 1gydF4y2Ba =gydF4y2Ba hgydF4y2Ba ∗gydF4y2Ba ΘgydF4y2Ba ,gydF4y2Ba fgydF4y2Ba ∗gydF4y2Ba hgydF4y2Ba ,gydF4y2Ba PgydF4y2Ba ˜gydF4y2Ba 一个gydF4y2Ba ΘgydF4y2Ba 可以获得TWSG (1)。TWSG(1)博弈树图所示gydF4y2Ba 3gydF4y2Ba。gydF4y2Ba

在比赛的第二阶段TWSG(2),领导者是攻击者和追随者是后卫。gydF4y2Ba

根据情商攻击者选择攻击策略gydF4y2Ba1gydF4y2Ba并发送一个信号到后卫。进攻和防守方交换他们作为信号的发送方和接收方的角色。通过TWSG(1)游戏,进攻和防守方面获得了一些相互了解和欺骗信号的衰减现象开始出现。在这一点上,攻击者不再依赖于“自然”选择的类型。相反,选择是由信号衰减系数σ欺骗信号的后验概率gydF4y2Ba 情商gydF4y2Ba 1gydF4y2Ba PgydF4y2Ba ˜gydF4y2Ba 一个gydF4y2Ba ΘgydF4y2Ba 在情商gydF4y2Ba1gydF4y2Ba所表达的gydF4y2Ba σgydF4y2Ba 情商gydF4y2Ba 1gydF4y2Ba PgydF4y2Ba ˜gydF4y2Ba 一个gydF4y2Ba ΘgydF4y2Ba 。攻击者选择gydF4y2Ba φgydF4y2Ba 啊gydF4y2Ba 的概率gydF4y2Ba σgydF4y2Ba 情商gydF4y2Ba 1gydF4y2Ba PgydF4y2Ba ˜gydF4y2Ba 一个gydF4y2Ba ΘgydF4y2Ba 并选择gydF4y2Ba φgydF4y2Ba 我gydF4y2Ba 的概率gydF4y2Ba 1gydF4y2Ba −gydF4y2Ba σgydF4y2Ba 情商gydF4y2Ba 1gydF4y2Ba PgydF4y2Ba ˜gydF4y2Ba 一个gydF4y2Ba ΘgydF4y2Ba 。TWSG(2)博弈树图所示gydF4y2Ba 4gydF4y2Ba。gydF4y2Ba

在第三阶段比赛TWSG(3),领导者是后卫和追随者是攻击者。TWSG(3)博弈树图所示gydF4y2Ba 5gydF4y2Ba。gydF4y2Ba

根据情商后卫选择防御策略gydF4y2Ba2gydF4y2Ba并将一个信号发送给攻击者。攻击和防御角色互换了。在前两个阶段的比赛之后,欺骗信号的衰减效果更加显著,所代表的表达式gydF4y2Ba σgydF4y2Ba 2gydF4y2Ba 情商gydF4y2Ba 2gydF4y2Ba PgydF4y2Ba ˜gydF4y2Ba DgydF4y2Ba ΘgydF4y2Ba 。这名后卫选择gydF4y2Ba ϕgydF4y2Ba DHgydF4y2Ba 的概率gydF4y2Ba σgydF4y2Ba 2gydF4y2Ba 情商gydF4y2Ba 2gydF4y2Ba PgydF4y2Ba ˜gydF4y2Ba DgydF4y2Ba ΘgydF4y2Ba 并选择gydF4y2Ba ϕgydF4y2Ba DMgydF4y2Ba 的概率gydF4y2Ba 1gydF4y2Ba −gydF4y2Ba σgydF4y2Ba 2gydF4y2Ba 情商gydF4y2Ba 2gydF4y2Ba PgydF4y2Ba ˜gydF4y2Ba DgydF4y2Ba ΘgydF4y2Ba 。gydF4y2Ba

在gydF4y2Ba TgydF4y2Ba阶段的游戏TWSG (gydF4y2Ba TgydF4y2Ba),领导是后卫和追随者是攻击者。gydF4y2Ba

TWSG(1)博弈树。gydF4y2Ba

TWSG树(2)游戏。gydF4y2Ba

TWSG(3)博弈树。gydF4y2Ba

节中描述gydF4y2Ba 2.1。2gydF4y2Ba,攻击者和后卫不断交换他们的角色作为信号的发送方和接收方在持续的对抗,而动态调整策略和移动游戏进程。当游戏阶段gydF4y2Ba TgydF4y2Ba足够大,欺骗信号将由另一方及其筛选影响将完全消失。双向信号游戏将退化到不完全信息的静态博弈。这名后卫将继续使用防御措施作为领袖向外界释放信号。攻击者只会终止对抗行为和行为作为追随者接收信号发送的后卫。TWSG (gydF4y2Ba TgydF4y2Ba博弈树如图gydF4y2Ba 6gydF4y2Ba。gydF4y2Ba

TWSG (gydF4y2Ba TgydF4y2Ba博弈树。gydF4y2Ba

3.3。防御策略选择算法和比较结果gydF4y2Ba

算法设计中所示的主动防御策略是算法gydF4y2Ba 1gydF4y2Ba。gydF4y2Ba

<大胆>算法1:< / >大胆主动防御策略选择算法。gydF4y2Ba

输入gydF4y2Ba:双向信号博弈模型gydF4y2Ba

输出gydF4y2Ba:主动防御策略gydF4y2Ba

初始化gydF4y2Ba TWSGgydF4y2Ba =gydF4y2Ba NgydF4y2Ba ,gydF4y2Ba ΘgydF4y2Ba ,gydF4y2Ba HgydF4y2Ba ,gydF4y2Ba TgydF4y2Ba ,gydF4y2Ba σgydF4y2Ba ,gydF4y2Ba ξgydF4y2Ba ,gydF4y2Ba 年代gydF4y2Ba ,gydF4y2Ba PgydF4y2Ba ,gydF4y2Ba PgydF4y2Ba ˜gydF4y2Ba ,gydF4y2Ba UgydF4y2Ba

计算攻击获得gydF4y2Ba UgydF4y2Ba 一个gydF4y2Ba dgydF4y2Ba ggydF4y2Ba ,gydF4y2Ba 一个gydF4y2Ba hgydF4y2Ba ,gydF4y2Ba tgydF4y2Ba ;gydF4y2Ba

计算防御获得gydF4y2Ba UgydF4y2Ba DgydF4y2Ba dgydF4y2Ba ggydF4y2Ba ,gydF4y2Ba 一个gydF4y2Ba hgydF4y2Ba ,gydF4y2Ba tgydF4y2Ba ;gydF4y2Ba

为gydF4y2Ba tgydF4y2Ba =gydF4y2Ba 1gydF4y2Ba ,gydF4y2Ba tgydF4y2Ba ≤gydF4y2Ba TgydF4y2Ba ,gydF4y2Ba tgydF4y2Ba +gydF4y2Ba +gydF4y2Ba

{gydF4y2Ba

初始化gydF4y2Ba PgydF4y2Ba ΘgydF4y2Ba hgydF4y2Ba ;gydF4y2Ba

领导人释放信号gydF4y2Ba HgydF4y2Ba;gydF4y2Ba

{推断计算最优策略的依赖gydF4y2Ba fgydF4y2Ba ∗gydF4y2Ba hgydF4y2Ba 追随者};gydF4y2Ba

{推断计算最优策略的依赖gydF4y2Ba hgydF4y2Ba ∗gydF4y2Ba ΘgydF4y2Ba 领袖};gydF4y2Ba

生成后验的推理gydF4y2Ba PgydF4y2Ba ˜gydF4y2Ba FgydF4y2Ba ΘgydF4y2Ba 基于贝叶斯的追随者规则;gydF4y2Ba

如果gydF4y2Ba PgydF4y2Ba ˜gydF4y2Ba FgydF4y2Ba ΘgydF4y2Ba 和gydF4y2Ba PgydF4y2Ba ΘgydF4y2Ba hgydF4y2Ba 不冲突;gydF4y2Ba

然后,创建gydF4y2Ba 情商gydF4y2Ba tgydF4y2Ba =gydF4y2Ba hgydF4y2Ba ∗gydF4y2Ba ΘgydF4y2Ba ,gydF4y2Ba fgydF4y2Ba ∗gydF4y2Ba hgydF4y2Ba ,gydF4y2Ba PgydF4y2Ba ˜gydF4y2Ba FgydF4y2Ba ΘgydF4y2Ba ;gydF4y2Ba

返回gydF4y2Ba 年代gydF4y2Ba DgydF4y2Ba ∗gydF4y2Ba ;gydF4y2Ba

PgydF4y2Ba ˜gydF4y2Ba FgydF4y2Ba ΘgydF4y2Ba =gydF4y2Ba σgydF4y2Ba tgydF4y2Ba −gydF4y2Ba 1gydF4y2Ba 情商gydF4y2Ba tgydF4y2Ba PgydF4y2Ba ˜gydF4y2Ba FgydF4y2Ba ΘgydF4y2Ba ;gydF4y2Ba

}gydF4y2Ba

结束gydF4y2Ba

如果类型在防御方面的数量gydF4y2Ba ngydF4y2Ba攻击者一边,类型的数量gydF4y2Ba 米gydF4y2Ba的游戏阶段gydF4y2Ba tgydF4y2Ba的防御策略gydF4y2Ba ggydF4y2Ba 和攻击策略的数量gydF4y2Ba hgydF4y2Ba,然后根据参考文献。(gydF4y2Ba 17gydF4y2Ba,gydF4y2Ba 21gydF4y2Ba),主动防御策略选择算法的时间复杂度gydF4y2Ba OgydF4y2Ba 2gydF4y2Ba tgydF4y2Ba 米gydF4y2Ba ngydF4y2Ba +gydF4y2Ba 马克斯gydF4y2Ba ggydF4y2Ba ,gydF4y2Ba hgydF4y2Ba 3gydF4y2Ba 和空间的复杂性gydF4y2Ba OgydF4y2Ba 米gydF4y2Ba ngydF4y2Ba 马克斯gydF4y2Ba ggydF4y2Ba ,gydF4y2Ba hgydF4y2Ba 。gydF4y2Ba

我们的方法的结果与现有研究相比,信号在桌子上gydF4y2Ba 1gydF4y2Ba。gydF4y2Ba

比较研究方法。gydF4y2Ba

参考gydF4y2Ba 信号传导机制gydF4y2Ba 欺骗信号衰减gydF4y2Ba 游戏的过程gydF4y2Ba 模型可扩展性gydF4y2Ba 平衡的解决方案gydF4y2Ba 运营成本gydF4y2Ba 表演gydF4y2Ba
Ref。gydF4y2Ba 16gydF4y2Ba]gydF4y2Ba 单向gydF4y2Ba 没有gydF4y2Ba 单级gydF4y2Ba 平均gydF4y2Ba 详细的gydF4y2Ba 低gydF4y2Ba 可怜的gydF4y2Ba
Ref。gydF4y2Ba 18gydF4y2Ba]gydF4y2Ba 单向gydF4y2Ba 没有gydF4y2Ba 单级gydF4y2Ba 更好的gydF4y2Ba 简单的gydF4y2Ba 低gydF4y2Ba 可怜的gydF4y2Ba
Ref。gydF4y2Ba 19gydF4y2Ba]gydF4y2Ba 单向gydF4y2Ba 没有gydF4y2Ba 多级gydF4y2Ba 平均gydF4y2Ba 简单的gydF4y2Ba 高gydF4y2Ba 媒介gydF4y2Ba
Ref。gydF4y2Ba 20.gydF4y2Ba]gydF4y2Ba 单向gydF4y2Ba 没有gydF4y2Ba 多级gydF4y2Ba 平均gydF4y2Ba 简单的gydF4y2Ba 高gydF4y2Ba 媒介gydF4y2Ba
Ref。gydF4y2Ba 21gydF4y2Ba]gydF4y2Ba 单向gydF4y2Ba 是的gydF4y2Ba 多级gydF4y2Ba 好gydF4y2Ba 详细的gydF4y2Ba 高gydF4y2Ba 媒介gydF4y2Ba
Ref。gydF4y2Ba 22gydF4y2Ba]gydF4y2Ba 单向gydF4y2Ba 是的gydF4y2Ba 多级gydF4y2Ba 好gydF4y2Ba 详细的gydF4y2Ba 高gydF4y2Ba 媒介gydF4y2Ba
本研究gydF4y2Ba 双向gydF4y2Ba 是的gydF4y2Ba 多级gydF4y2Ba 好gydF4y2Ba 详细的gydF4y2Ba 高gydF4y2Ba 好gydF4y2Ba

信号传导机制是指信号传输方向是单向的还是双向的模型。欺骗的衰减信号表明模型特征是否欺骗信号衰减现象。比赛过程是用来区分模型是否有单级或多级分析能力分析能力。模型扩展显示类型和是否攻击和防御的战略模型可以扩展。更好的扩展能力,更广泛的模型的适用范围。模型的均衡解代表游戏的详细程度的均衡解决方案的过程。更详细的解决方案过程,更实用。运营成本而言,它意味着时间复杂性和空间复杂性的防御策略选择算法。运行成本越低越好;更好的性能越好。 Most previous studies use the one-way signal transmission mechanism to model the attack and defense process, and less consideration is given to the phenomenon of deception signal attenuation in the confrontation. Additionally, some studies are limited to single-stage game analysis. In this paper, we conduct an in-depth analysis of the two-way signal transmission mechanism, establish a two-way signaling game model, provide a detailed game equilibrium solution process, and design a defense strategy selection algorithm. In terms of signal transmission mechanisms, deception signal attenuation, and game process, this work comes closer to actual network attack and defense, and the model has better scalability and practicability. By sending deception signals from both the offense and defense sides, the parties seek to control the other party’s strategy selection as well as maximize their own expected returns. This process embodies the confrontational philosophy under the condition of limited information.

朱et al。gydF4y2Ba 34gydF4y2Ba]提出两个迭代的强化学习算法允许后卫来确定最佳的防御。强化学习和信号博弈模型都有自己的优点和缺点,和他们应该适应不同的应用场景。本文的目的是分析网络攻击和防御的过程。强化学习是一个黑盒子。虽然可以获得最佳的防御,但不能可视化分析过程和原则。使用双向信号网络攻防对抗博弈模型进行分析,分析过程和原则可以visulized cleraly。gydF4y2Ba

4所示。实际情况应用程序和结果分析gydF4y2Ba 4.1。实验环境和参数配置gydF4y2Ba

为了验证该方法的可行性和有效性,成立了一个实验性的网络环境进行仿真实验。实验网络是一个典型的业务网络,分为三个方面:外部网络,内部网络和非军事区。攻击和防御的场景设置如下:攻击者位于外部网络区域和试图远程攻击的内部网络区企业内部网。后卫是企业的网络安全管理员根据方法和选择了主动防御策略。地形的实验网络如图gydF4y2Ba 7gydF4y2Ba。gydF4y2Ba

地形的实验网络。gydF4y2Ba

确保企业网络的可用性和安全性,访问控制规则集之间建立网络分区,如表所示gydF4y2Ba 2gydF4y2Ba。其中,gydF4y2Ba ⊕gydF4y2Ba 表明,访问被允许;gydF4y2Ba ×gydF4y2Ba 表明访问不允许;和gydF4y2Ba ∅gydF4y2Ba 表明访问需要一定的权限。gydF4y2Ba

访问控制规则。gydF4y2Ba

网络区域gydF4y2Ba 外部网络gydF4y2Ba 内部网络gydF4y2Ba 非军事区gydF4y2Ba
外部网络gydF4y2Ba ⊕gydF4y2Ba ×gydF4y2Ba ⊕gydF4y2Ba
内部网络gydF4y2Ba ×gydF4y2Ba ⊕gydF4y2Ba ∅gydF4y2Ba
非军事区gydF4y2Ba ⊕gydF4y2Ba ∅gydF4y2Ba ⊕gydF4y2Ba

一般来说,数据库服务器(databaseserver)存储大量的机密数据的企业,所以设置为目标的攻击实验。根据访问控制规则表gydF4y2Ba 2gydF4y2Ba,攻击者不能直接访问databaseserver;然而,通过多个步骤,堡垒服务器的脆弱性在DMZ区域可以用来获得访问内部网络区域,从而实现攻击的目标。gydF4y2Ba

结合常见的漏洞和风险的描述(CVE)信息安全漏洞库中的信息(gydF4y2Ba 35gydF4y2Ba),Nessus漏洞扫描工具被用来检测和发现实验网络中存在的安全漏洞。实验给出了网络安全漏洞的表gydF4y2Ba 3gydF4y2Ba。gydF4y2Ba

实验网络的安全漏洞。gydF4y2Ba

不。gydF4y2Ba 动作的对象gydF4y2Ba CVE代码gydF4y2Ba 威胁类型gydF4y2Ba 威胁等级gydF4y2Ba
1gydF4y2Ba 网络服务器gydF4y2Ba cve - 2015 - 1635gydF4y2Ba 代码注入gydF4y2Ba 极端的风险gydF4y2Ba
2gydF4y2Ba 网络服务器gydF4y2Ba cve - 2017 - 7269gydF4y2Ba 缓冲区溢出gydF4y2Ba 极端的风险gydF4y2Ba
3gydF4y2Ba FTPservergydF4y2Ba cve - 2014 - 8517gydF4y2Ba 操作系统命令注入gydF4y2Ba 高的风险gydF4y2Ba
4gydF4y2Ba BastionservergydF4y2Ba cve - 2014 - 3556gydF4y2Ba 操作系统命令注入gydF4y2Ba 高的风险gydF4y2Ba
5gydF4y2Ba 服务器gydF4y2Ba cve - 2013 - 4730gydF4y2Ba 缓冲区溢出gydF4y2Ba 极端的风险gydF4y2Ba
6gydF4y2Ba DatabaseservergydF4y2Ba cve - 2016 - 6662gydF4y2Ba 授权和访问控制gydF4y2Ba 极端的风险gydF4y2Ba

攻击者使用中存在的安全漏洞和缺陷,企业网络选择策略组成的几个原子攻击的攻击行动。后卫选择包含不同原子的国防战略防御行动目标的方式(gydF4y2Ba 36gydF4y2Ba]。根据林肯实验室的攻击和防御的分类(gydF4y2Ba 37gydF4y2Ba),我们获得了攻击和防御战略和运营成本,如表所示gydF4y2Ba 4gydF4y2Ba。gydF4y2Ba

攻防策略和操作成本。gydF4y2Ba

原子攻击行动gydF4y2Ba φgydF4y2Ba 啊gydF4y2Ba φgydF4y2Ba 我gydF4y2Ba 原子防御行动gydF4y2Ba ϕgydF4y2Ba DHgydF4y2Ba ϕgydF4y2Ba DMgydF4y2Ba
一个gydF4y2Ba1gydF4y2Ba 一个gydF4y2Ba2gydF4y2Ba 一个gydF4y2Ba3gydF4y2Ba 一个gydF4y2Ba4gydF4y2Ba dgydF4y2Ba1gydF4y2Ba dgydF4y2Ba2gydF4y2Ba dgydF4y2Ba3gydF4y2Ba dgydF4y2Ba4gydF4y2Ba
安装监听器程序gydF4y2Ba √gydF4y2Ba √gydF4y2Ba √gydF4y2Ba √gydF4y2Ba 卸载侦听器程序gydF4y2Ba √gydF4y2Ba √gydF4y2Ba √gydF4y2Ba
远程缓冲区溢出gydF4y2Ba √gydF4y2Ba √gydF4y2Ba √gydF4y2Ba 缓冲区溢出保护gydF4y2Ba √gydF4y2Ba √gydF4y2Ba
安装删除木马gydF4y2Ba √gydF4y2Ba 卸载删除木马gydF4y2Ba √gydF4y2Ba √gydF4y2Ba
攻击SSH FTPServergydF4y2Ba √gydF4y2Ba √gydF4y2Ba 重启FTPservergydF4y2Ba √gydF4y2Ba √gydF4y2Ba √gydF4y2Ba
盗取帐号和密码gydF4y2Ba √gydF4y2Ba √gydF4y2Ba √gydF4y2Ba 改变帐号和密码gydF4y2Ba √gydF4y2Ba √gydF4y2Ba √gydF4y2Ba
提高权力gydF4y2Ba √gydF4y2Ba √gydF4y2Ba 删除可疑的账户gydF4y2Ba √gydF4y2Ba √gydF4y2Ba √gydF4y2Ba
远程代码注入gydF4y2Ba √gydF4y2Ba √gydF4y2Ba 识别代码注入gydF4y2Ba √gydF4y2Ba
暴力破解密码gydF4y2Ba √gydF4y2Ba √gydF4y2Ba 增加密码的复杂性gydF4y2Ba √gydF4y2Ba √gydF4y2Ba √gydF4y2Ba √gydF4y2Ba

交流gydF4y2Ba 480年gydF4y2Ba 460年gydF4y2Ba 240年gydF4y2Ba 220年gydF4y2Ba 直流gydF4y2Ba 680年gydF4y2Ba 640年gydF4y2Ba 440年gydF4y2Ba 410年gydF4y2Ba
DACgydF4y2Ba 80年gydF4y2Ba 70年gydF4y2Ba 30.gydF4y2Ba 20.gydF4y2Ba 监护系统gydF4y2Ba One hundred.gydF4y2Ba 80年gydF4y2Ba 40gydF4y2Ba 30.gydF4y2Ba

在参考文献。(gydF4y2Ba 17gydF4y2Ba,gydF4y2Ba 28gydF4y2Ba)、历史统计数据和专家经验结合提供的提交值的不同组合攻击和防御策略,如表所示gydF4y2Ba 5gydF4y2Ba,并设置gydF4y2Ba ξgydF4y2Ba =gydF4y2Ba 0。gydF4y2Ba 5gydF4y2Ba 和gydF4y2Ba σgydF4y2Ba =gydF4y2Ba 0.6gydF4y2Ba 。在第九阶段,gydF4y2Ba ξgydF4y2Ba tgydF4y2Ba −gydF4y2Ba 1gydF4y2Ba =gydF4y2Ba 0.5gydF4y2Ba 8gydF4y2Ba ≈gydF4y2Ba 0.0039gydF4y2Ba ,这表明,这一阶段后,获得非常少的影响总收益计算;因此,将游戏阶段的数量gydF4y2Ba TgydF4y2Ba =gydF4y2Ba 9gydF4y2Ba 。gydF4y2Ba

署值的不同组合攻防策略。gydF4y2Ba

dgydF4y2Ba dgydF4y2Ba1gydF4y2Ba dgydF4y2Ba2gydF4y2Ba dgydF4y2Ba3gydF4y2Ba dgydF4y2Ba4gydF4y2Ba
一个gydF4y2Ba
一个gydF4y2Ba1gydF4y2Ba 署gydF4y2Ba dgydF4y2Ba 1gydF4y2Ba ,gydF4y2Ba 一个gydF4y2Ba 1gydF4y2Ba =gydF4y2Ba 2320年gydF4y2Ba 署gydF4y2Ba dgydF4y2Ba 2gydF4y2Ba ,gydF4y2Ba 一个gydF4y2Ba 1gydF4y2Ba =gydF4y2Ba 2380年gydF4y2Ba 署gydF4y2Ba dgydF4y2Ba 3gydF4y2Ba ,gydF4y2Ba 一个gydF4y2Ba 1gydF4y2Ba =gydF4y2Ba 2640年gydF4y2Ba 署gydF4y2Ba dgydF4y2Ba 4gydF4y2Ba ,gydF4y2Ba 一个gydF4y2Ba 1gydF4y2Ba =gydF4y2Ba 2gydF4y2Ba 6gydF4y2Ba 80年gydF4y2Ba
一个gydF4y2Ba2gydF4y2Ba 署gydF4y2Ba dgydF4y2Ba 1gydF4y2Ba ,gydF4y2Ba 一个gydF4y2Ba 2gydF4y2Ba =gydF4y2Ba 2270年gydF4y2Ba 署gydF4y2Ba dgydF4y2Ba 2gydF4y2Ba ,gydF4y2Ba 一个gydF4y2Ba 2gydF4y2Ba =gydF4y2Ba 2230年gydF4y2Ba 署gydF4y2Ba dgydF4y2Ba 3gydF4y2Ba ,gydF4y2Ba 一个gydF4y2Ba 2gydF4y2Ba =gydF4y2Ba 2520年gydF4y2Ba 署gydF4y2Ba dgydF4y2Ba 4gydF4y2Ba ,gydF4y2Ba 一个gydF4y2Ba 2gydF4y2Ba =gydF4y2Ba 2570年gydF4y2Ba
一个gydF4y2Ba3gydF4y2Ba 署gydF4y2Ba dgydF4y2Ba 1gydF4y2Ba ,gydF4y2Ba 一个gydF4y2Ba 3gydF4y2Ba =gydF4y2Ba 2180年gydF4y2Ba 署gydF4y2Ba dgydF4y2Ba 2gydF4y2Ba ,gydF4y2Ba 一个gydF4y2Ba 3gydF4y2Ba =gydF4y2Ba 2120年gydF4y2Ba 署gydF4y2Ba dgydF4y2Ba 3gydF4y2Ba ,gydF4y2Ba 一个gydF4y2Ba 3gydF4y2Ba =gydF4y2Ba 2280年gydF4y2Ba 署gydF4y2Ba dgydF4y2Ba 4gydF4y2Ba ,gydF4y2Ba 一个gydF4y2Ba 3gydF4y2Ba =gydF4y2Ba 2320年gydF4y2Ba
一个gydF4y2Ba4gydF4y2Ba 署gydF4y2Ba dgydF4y2Ba 1gydF4y2Ba ,gydF4y2Ba 一个gydF4y2Ba 4gydF4y2Ba =gydF4y2Ba 2gydF4y2Ba 1gydF4y2Ba 20.gydF4y2Ba 署gydF4y2Ba dgydF4y2Ba 2gydF4y2Ba ,gydF4y2Ba 一个gydF4y2Ba 4gydF4y2Ba =gydF4y2Ba 2080年gydF4y2Ba 署gydF4y2Ba dgydF4y2Ba 3gydF4y2Ba ,gydF4y2Ba 一个gydF4y2Ba 4gydF4y2Ba =gydF4y2Ba 2210年gydF4y2Ba 署gydF4y2Ba dgydF4y2Ba 4gydF4y2Ba ,gydF4y2Ba 一个gydF4y2Ba 4gydF4y2Ba =gydF4y2Ba 2gydF4y2Ba 26gydF4y2Ba 0gydF4y2Ba
4.2。平衡解决方案和策略选择gydF4y2Ba 4.2.1。准备TWSG(1)游戏平衡和国防战略gydF4y2Ba

“自然”选择类型的防御策略的概率(0.4,0.6)。当战略类型的后卫gydF4y2Ba φgydF4y2Ba DHgydF4y2Ba ,信号gydF4y2Ba hgydF4y2BaDHgydF4y2Ba发送出去。当攻击策略的类型gydF4y2Ba φgydF4y2Ba 啊gydF4y2Ba 总共有四个策略组合:gydF4y2Ba dgydF4y2Ba 1gydF4y2Ba ,gydF4y2Ba 一个gydF4y2Ba 1gydF4y2Ba ,gydF4y2Ba dgydF4y2Ba 1gydF4y2Ba ,gydF4y2Ba 一个gydF4y2Ba 2gydF4y2Ba ,gydF4y2Ba dgydF4y2Ba 2gydF4y2Ba ,gydF4y2Ba 一个gydF4y2Ba 1gydF4y2Ba ,gydF4y2Ba dgydF4y2Ba 2gydF4y2Ba ,gydF4y2Ba 一个gydF4y2Ba 2gydF4y2Ba 。攻防策略的不同组合的提交值表gydF4y2Ba 5gydF4y2Ba。gydF4y2Ba

在第一个策略组合gydF4y2Ba dgydF4y2Ba 1gydF4y2Ba ,gydF4y2Ba 一个gydF4y2Ba 1gydF4y2Ba ,攻击者的恶搞信号DAC = 0。因此,gydF4y2Ba (2)gydF4y2Ba UgydF4y2Ba 一个gydF4y2Ba dgydF4y2Ba 1gydF4y2Ba ,gydF4y2Ba 一个gydF4y2Ba 1gydF4y2Ba ,gydF4y2Ba 1gydF4y2Ba =gydF4y2Ba 署gydF4y2Ba dgydF4y2Ba 1gydF4y2Ba ,gydF4y2Ba 一个gydF4y2Ba 1gydF4y2Ba −gydF4y2Ba 交流gydF4y2Ba −gydF4y2Ba DACgydF4y2Ba =gydF4y2Ba 2320年gydF4y2Ba −gydF4y2Ba 480年gydF4y2Ba −gydF4y2Ba 0gydF4y2Ba =gydF4y2Ba 1840年。gydF4y2Ba

其他三个策略组合的收益可以以同样的方式计算:gydF4y2Ba

UgydF4y2Ba 一个gydF4y2Ba dgydF4y2Ba 1gydF4y2Ba ,gydF4y2Ba 一个gydF4y2Ba 2gydF4y2Ba ,gydF4y2Ba 1gydF4y2Ba =gydF4y2Ba 1810年gydF4y2Ba ,gydF4y2Ba UgydF4y2Ba 一个gydF4y2Ba dgydF4y2Ba 2gydF4y2Ba ,gydF4y2Ba 一个gydF4y2Ba 1gydF4y2Ba ,gydF4y2Ba 1gydF4y2Ba =gydF4y2Ba 1900年gydF4y2Ba ,gydF4y2Ba UgydF4y2Ba 一个gydF4y2Ba dgydF4y2Ba 2gydF4y2Ba ,gydF4y2Ba 一个gydF4y2Ba 2gydF4y2Ba ,gydF4y2Ba 1gydF4y2Ba =gydF4y2Ba 1770年gydF4y2Ba 。gydF4y2Ba

自从概率选择不同的策略在相同的攻击和防御级别是相同的,每个策略组合的概率为0.25,因此平均获得ugydF4y2Ba12gydF4y2Ba攻击者的策略类型gydF4y2Ba φgydF4y2Ba 啊gydF4y2Ba 是gydF4y2Ba (3)gydF4y2Ba ugydF4y2Ba 12gydF4y2Ba =gydF4y2Ba UgydF4y2Ba ¯gydF4y2Ba 一个gydF4y2Ba ϕgydF4y2Ba DHgydF4y2Ba ,gydF4y2Ba φgydF4y2Ba 啊gydF4y2Ba ,gydF4y2Ba 1gydF4y2Ba =gydF4y2Ba 0.25gydF4y2Ba UgydF4y2Ba 一个gydF4y2Ba dgydF4y2Ba 1gydF4y2Ba ,gydF4y2Ba 一个gydF4y2Ba 1gydF4y2Ba ,gydF4y2Ba 1gydF4y2Ba +gydF4y2Ba 0.25gydF4y2Ba UgydF4y2Ba 一个gydF4y2Ba dgydF4y2Ba 1gydF4y2Ba ,gydF4y2Ba 一个gydF4y2Ba 2gydF4y2Ba ,gydF4y2Ba 1gydF4y2Ba +gydF4y2Ba 0.25gydF4y2Ba UgydF4y2Ba 一个gydF4y2Ba dgydF4y2Ba 2gydF4y2Ba ,gydF4y2Ba 一个gydF4y2Ba 1gydF4y2Ba ,gydF4y2Ba 1gydF4y2Ba +gydF4y2Ba 0.25gydF4y2Ba UgydF4y2Ba 一个gydF4y2Ba dgydF4y2Ba 2gydF4y2Ba ,gydF4y2Ba 一个gydF4y2Ba 2gydF4y2Ba ,gydF4y2Ba 1gydF4y2Ba =gydF4y2Ba 1830年。gydF4y2Ba

同样,我们有。gydF4y2Ba

UgydF4y2Ba DgydF4y2Ba dgydF4y2Ba 1gydF4y2Ba ,gydF4y2Ba 一个gydF4y2Ba 1gydF4y2Ba ,gydF4y2Ba 1gydF4y2Ba =gydF4y2Ba −gydF4y2Ba 署gydF4y2Ba dgydF4y2Ba 1gydF4y2Ba ,gydF4y2Ba 一个gydF4y2Ba 1gydF4y2Ba +gydF4y2Ba 直流gydF4y2Ba +gydF4y2Ba 监护系统gydF4y2Ba =gydF4y2Ba −gydF4y2Ba 3000年gydF4y2Ba ,gydF4y2Ba UgydF4y2Ba DgydF4y2Ba dgydF4y2Ba 1gydF4y2Ba ,gydF4y2Ba 一个gydF4y2Ba 2gydF4y2Ba ,gydF4y2Ba 1gydF4y2Ba =gydF4y2Ba −gydF4y2Ba 2950年gydF4y2Ba ,gydF4y2Ba UgydF4y2Ba DgydF4y2Ba dgydF4y2Ba 2gydF4y2Ba ,gydF4y2Ba 一个gydF4y2Ba 1gydF4y2Ba ,gydF4y2Ba 1gydF4y2Ba =gydF4y2Ba −gydF4y2Ba 3020年gydF4y2Ba ,gydF4y2Ba UgydF4y2Ba DgydF4y2Ba dgydF4y2Ba 2gydF4y2Ba ,gydF4y2Ba 一个gydF4y2Ba 2gydF4y2Ba ,gydF4y2Ba 1gydF4y2Ba =gydF4y2Ba −gydF4y2Ba 2870年gydF4y2Ba 。gydF4y2Ba (4)gydF4y2Ba ugydF4y2Ba 11gydF4y2Ba =gydF4y2Ba UgydF4y2Ba ¯gydF4y2Ba DgydF4y2Ba ϕgydF4y2Ba DHgydF4y2Ba ,gydF4y2Ba φgydF4y2Ba 啊gydF4y2Ba ,gydF4y2Ba 1gydF4y2Ba =gydF4y2Ba 0.25gydF4y2Ba UgydF4y2Ba DgydF4y2Ba dgydF4y2Ba 1gydF4y2Ba ,gydF4y2Ba 一个gydF4y2Ba 1gydF4y2Ba ,gydF4y2Ba 1gydF4y2Ba +gydF4y2Ba 0.25gydF4y2Ba UgydF4y2Ba DgydF4y2Ba dgydF4y2Ba 1gydF4y2Ba ,gydF4y2Ba 一个gydF4y2Ba 2gydF4y2Ba ,gydF4y2Ba 1gydF4y2Ba +gydF4y2Ba 0.25gydF4y2Ba UgydF4y2Ba DgydF4y2Ba dgydF4y2Ba 2gydF4y2Ba ,gydF4y2Ba 一个gydF4y2Ba 1gydF4y2Ba ,gydF4y2Ba 1gydF4y2Ba +gydF4y2Ba 0.25gydF4y2Ba UgydF4y2Ba DgydF4y2Ba dgydF4y2Ba 2gydF4y2Ba ,gydF4y2Ba 一个gydF4y2Ba 2gydF4y2Ba ,gydF4y2Ba 1gydF4y2Ba =gydF4y2Ba −gydF4y2Ba 2960年。gydF4y2Ba

同样,以上方法可以用来获得进攻和防御策略的收益在不同组合类型。gydF4y2Ba

使用平衡解决方案算法部分gydF4y2Ba 3所示。3gydF4y2Ba池平衡解,TWSG (1)。有两种可能的组合策略类型:gydF4y2Ba

选项1:后卫选择策略类型gydF4y2Ba ϕgydF4y2Ba DHgydF4y2Ba 和释放的信号gydF4y2Ba hgydF4y2BaDHgydF4y2Ba,攻击者选择的策略类型gydF4y2Ba φgydF4y2Ba 我gydF4y2Ba 。这一次,gydF4y2Ba UgydF4y2Ba11gydF4y2Ba2960年=−gydF4y2Ba UgydF4y2Ba12gydF4y2Ba= 1830。gydF4y2Ba

选项2:后卫选择策略类型gydF4y2Ba ϕgydF4y2Ba DMgydF4y2Ba 和释放的信号gydF4y2Ba hgydF4y2BaDHgydF4y2Ba,攻击者选择的策略类型gydF4y2Ba φgydF4y2Ba 我gydF4y2Ba 。在这个时候,gydF4y2Ba UgydF4y2Ba11gydF4y2Ba=−2727.5和gydF4y2Ba UgydF4y2Ba12gydF4y2Ba= 2037.5。gydF4y2Ba

因此,后卫选择选项2防御策略,指定为gydF4y2Ba ϕgydF4y2Ba DMgydF4y2Ba ,gydF4y2Ba hgydF4y2Ba DHgydF4y2Ba 。攻击和防御的博弈树是图所示gydF4y2Ba 8gydF4y2Ba。gydF4y2Ba

博弈树的攻击和防御。gydF4y2Ba

4.2.2。TWSG(2)游戏平衡和国防战略gydF4y2Ba

TWSG(1)平衡解决方案过程中,攻击者可能选择的策略类型gydF4y2Ba φgydF4y2Ba 啊gydF4y2Ba 或gydF4y2Ba φgydF4y2Ba 我gydF4y2Ba 的后卫的后验概率,因此攻击者修改为(0.5,0.5)。使用均衡方案中描述的算法部分gydF4y2Ba 3所示。3gydF4y2BaTWSG的解决方案(2)仍然是一个池平衡。有两种可能的组合策略:gydF4y2Ba

攻击者选择的策略类型gydF4y2Ba φgydF4y2Ba 啊gydF4y2Ba 和释放的信号gydF4y2Ba hgydF4y2Ba我gydF4y2Ba,和后卫选择策略类型gydF4y2Ba ϕgydF4y2Ba DMgydF4y2Ba

攻击者选择的策略类型gydF4y2Ba φgydF4y2Ba 我gydF4y2Ba 和释放的信号gydF4y2Ba hgydF4y2Ba我gydF4y2Ba,和后卫选择策略类型gydF4y2Ba ϕgydF4y2Ba DMgydF4y2Ba

因此,后卫选择常规类型策略,指定为gydF4y2Ba ϕgydF4y2Ba DMgydF4y2Ba 。gydF4y2Ba

4.2.3。游戏平衡和国防战略阶段三到九gydF4y2Ba

使用上面的方法,每一阶段的游戏平衡是解决了顺序。gydF4y2Ba

通过六个阶段三,如表所示gydF4y2Ba 6gydF4y2Ba,游戏平衡解决方案仍然是一个池平衡,但欺骗信号逐渐减弱。7到9分阶段,欺骗信号完全衰减,游戏发展成一个不完全信息静态博弈,而池均衡解决方案变成了分离均衡解决方案。在这一点上,后卫选择增强gydF4y2Ba ϕgydF4y2Ba DHgydF4y2Ba 作为战略类型和发布一个增强的信号gydF4y2Ba hgydF4y2BaDHgydF4y2Ba,指定为gydF4y2Ba ϕgydF4y2Ba DHgydF4y2Ba ,gydF4y2Ba hgydF4y2Ba DHgydF4y2Ba 。gydF4y2Ba

国防战略的不同阶段和攻防的回报。gydF4y2Ba

游戏舞台gydF4y2Ba 防御的作用gydF4y2Ba 平衡型gydF4y2Ba 防御策略gydF4y2Ba 攻击者返回gydF4y2Ba 后卫返回gydF4y2Ba
TWSGgydF4y2Ba 1gydF4y2Ba 领袖gydF4y2Ba 池平衡gydF4y2Ba ϕgydF4y2Ba DMgydF4y2Ba ,gydF4y2Ba hgydF4y2Ba DHgydF4y2Ba 2037.5gydF4y2Ba −2727.5gydF4y2Ba
TWSGgydF4y2Ba 2gydF4y2Ba 追随者gydF4y2Ba 池平衡gydF4y2Ba ϕgydF4y2Ba DMgydF4y2Ba 2053.5gydF4y2Ba −2785.5gydF4y2Ba
TWSGgydF4y2Ba 3gydF4y2Ba 领袖gydF4y2Ba 池平衡gydF4y2Ba ϕgydF4y2Ba DMgydF4y2Ba ,gydF4y2Ba hgydF4y2Ba DHgydF4y2Ba 2079.5gydF4y2Ba −2833.5gydF4y2Ba
TWSGgydF4y2Ba 4gydF4y2Ba 追随者gydF4y2Ba 池平衡gydF4y2Ba ϕgydF4y2Ba DMgydF4y2Ba 2112.5gydF4y2Ba −2894.5gydF4y2Ba
TWSGgydF4y2Ba 5gydF4y2Ba 领袖gydF4y2Ba 池平衡gydF4y2Ba ϕgydF4y2Ba DMgydF4y2Ba ,gydF4y2Ba hgydF4y2Ba DHgydF4y2Ba 2145.5gydF4y2Ba −2920.5gydF4y2Ba
TWSGgydF4y2Ba 6gydF4y2Ba 追随者gydF4y2Ba 池平衡gydF4y2Ba ϕgydF4y2Ba DMgydF4y2Ba 2069.5gydF4y2Ba −2956.5gydF4y2Ba
TWSGgydF4y2Ba 7gydF4y2Ba 领袖gydF4y2Ba 分离均衡gydF4y2Ba ϕgydF4y2Ba DHgydF4y2Ba ,gydF4y2Ba hgydF4y2Ba DHgydF4y2Ba 2011年gydF4y2Ba −2460gydF4y2Ba
TWSGgydF4y2Ba 8gydF4y2Ba 追随者gydF4y2Ba 分离均衡gydF4y2Ba ϕgydF4y2Ba DHgydF4y2Ba 2038年gydF4y2Ba −2492gydF4y2Ba
TWSGgydF4y2Ba 9gydF4y2Ba 领袖gydF4y2Ba 分离均衡gydF4y2Ba ϕgydF4y2Ba DHgydF4y2Ba ,gydF4y2Ba hgydF4y2Ba DHgydF4y2Ba 2089年gydF4y2Ba −2536gydF4y2Ba
4.3。实验分析gydF4y2Ba

基于上述实验和数据分析,可以得出以下结论的一般分析进攻和防御游戏平衡,获得不考虑特定的参数值。gydF4y2Ba

欺骗信号可以提高攻击和防御性能。gydF4y2Ba

游戏平衡解决方案阶段通过六个池平衡解决方案,表明,在初始阶段的进攻和防御游戏,后卫可能采用常规类型的防御策略gydF4y2Ba ϕgydF4y2Ba DMgydF4y2Ba 和迷惑和误导攻击者通过释放欺骗信号gydF4y2Ba hgydF4y2BaDHgydF4y2Ba。通过破坏攻击者的认知,后卫的获得可以在一个小成本最大化。欺骗信号的有效性,因此应该充分利用积极发布欺骗信号。同时,识别攻击党的欺骗信号的能力要加强,这样攻击者的动机和偏好可以尽早识别和有针对性的主动防御策略可以实现。gydF4y2Ba

欺骗信号的作用是有限的。gydF4y2Ba

随着游戏的进行,欺骗信号变得逐渐减弱。在七到九阶段的游戏,游戏平衡解决方案成为分离均衡解决方案,表明欺骗信号的功能已经完全消失了。后卫不再发布欺骗信号,而是增加了防守输入和采用一个增强的防御策略gydF4y2Ba ϕgydF4y2Ba DHgydF4y2Ba 打击网络攻击。因此,在选择策略时,应该避免欺骗信号的局限性和衰减过程应该推迟通过改善欺骗信号的质量。同时,应注意收集威胁信息和信号放大的局限性攻击者的欺骗。gydF4y2Ba

欺骗攻击速度信号延迟和减少攻击的突然性。gydF4y2Ba

的分析首先通过第九阶段的游戏节目欺骗信号发布的后卫可以延迟网络杀伤链的形成和获得一些反应时间的后卫。欺骗信号可以部分抵消不对称优势,第一步的优势被攻击者。然而,由于欺骗信号的局限性,单纯依赖欺骗信号本身不能完全抵御网络攻击。因此,防守一方应该根据游戏发展的过程和使用其他防御手段来动态调整防御策略来最大化自己的回报。gydF4y2Ba

安全损失减少增强防御能力。gydF4y2Ba

我们分析玩家返回时采用不同的策略类型。在第一个通过第六阶段,后卫采用常规类型的防御战略和平均回报−2853。在七到九阶段,后卫选择增强防御策略类型和后卫的平均回报−2496。这表明,当面对连续高强度的网络攻击,防守一方应增加安全投资,提高其防御能力,减少其安全损失。gydF4y2Ba

5。结论gydF4y2Ba

主动防御是一个主题的前沿研究领域的网络安全。战略选择是防御效果的关键。攻防对抗的条件下,信息是有限的,防御方的最优策略是很难确定;然而,信号博弈模型是一种有效的方法来解决这个问题。解决这一问题,单向信号传输不符合网络攻击和防御的实际问题,我们分析了双向信号传输过程中,构建了一个双向信号博弈模型,提供了一个多级完美贝叶斯均衡解决方案的过程,并设计了一个主动防御策略选择算法。该方法的可行性和有效性是通过应用示例验证和分析。通过分析实验结果,我们确定了驱动机制的有效性和局限性欺骗信号和总结四个结论指导主动防御策略的选择。与现有的研究相比,本文提出的双向信号博弈模型更准确地代表了进攻和防御策略冲突过程和更像一个实际的网络攻击和防御的过程。因此,我们的工作作为基础,并提供参考,主动防御策略动态不完全信息条件下的选择过程。gydF4y2Ba

附录gydF4y2Ba 示例解决方案的完美贝叶斯均衡gydF4y2Ba

本文基于参数设置,攻击方和维护方各有两种战略类型和释放两种类型的信号。领导者类型所代表的符号gydF4y2Ba lgydF4y2Ba HgydF4y2Ba和gydF4y2Ba lgydF4y2Ba 米gydF4y2Ba,代表了信号空间gydF4y2Ba HgydF4y2Ba韩gydF4y2Ba和gydF4y2Ba HgydF4y2BaLMgydF4y2Ba,追随者类型所代表的符号gydF4y2Ba FgydF4y2Ba HgydF4y2Ba和gydF4y2Ba FgydF4y2Ba 米gydF4y2Ba,{gydF4y2Ba ugydF4y2Ba11gydF4y2Ba,gydF4y2Ba ugydF4y2Ba21gydF4y2Ba,gydF4y2Ba ugydF4y2Ba31日gydF4y2Ba、…gydF4y2Ba ugydF4y2Ba81年gydF4y2Ba}的获得是领袖,{gydF4y2Ba ugydF4y2Ba12gydF4y2Ba,gydF4y2Ba ugydF4y2Ba22gydF4y2Ba,gydF4y2Ba ugydF4y2Ba32gydF4y2Ba、…gydF4y2Ba ugydF4y2Ba82年gydF4y2Ba}的获得是追随者。单级信号博弈树图所示gydF4y2Ba 9gydF4y2Ba。gydF4y2Ba

单级信号博弈树。gydF4y2Ba

步骤1。gydF4y2Ba

跟随者的策略计算。gydF4y2Ba

首先,我们假设后验推理不同的信号集的单级博弈树gydF4y2Ba PgydF4y2Ba FgydF4y2Ba ΘgydF4y2Ba hgydF4y2Ba 。然后我们计算的最大回报gydF4y2Ba 马克斯gydF4y2Ba fgydF4y2Ba ∈gydF4y2Ba FgydF4y2Ba ∑gydF4y2Ba PgydF4y2Ba FgydF4y2Ba ΘgydF4y2Ba hgydF4y2Ba UgydF4y2Ba FgydF4y2Ba hgydF4y2Ba ∗gydF4y2Ba ΘgydF4y2Ba ,gydF4y2Ba fgydF4y2Ba ,gydF4y2Ba ΘgydF4y2Ba 。gydF4y2Ba

当gydF4y2Ba HgydF4y2Ba=gydF4y2Ba hgydF4y2Ba韩gydF4y2Ba,gydF4y2Ba (.)gydF4y2Ba 马克斯gydF4y2Ba fgydF4y2Ba ∈gydF4y2Ba FgydF4y2Ba ∑gydF4y2Ba PgydF4y2Ba FgydF4y2Ba ΘgydF4y2Ba hgydF4y2Ba UgydF4y2Ba FgydF4y2Ba hgydF4y2Ba ∗gydF4y2Ba ΘgydF4y2Ba ,gydF4y2Ba fgydF4y2Ba ,gydF4y2Ba ΘgydF4y2Ba =gydF4y2Ba 马克斯gydF4y2Ba UgydF4y2Ba FgydF4y2Ba hgydF4y2Ba 韩gydF4y2Ba ,gydF4y2Ba FgydF4y2Ba HgydF4y2Ba ,gydF4y2Ba lgydF4y2Ba HgydF4y2Ba ×gydF4y2Ba PgydF4y2Ba ˜gydF4y2Ba lgydF4y2Ba HgydF4y2Ba hgydF4y2Ba 韩gydF4y2Ba +gydF4y2Ba UgydF4y2Ba FgydF4y2Ba hgydF4y2Ba 韩gydF4y2Ba ,gydF4y2Ba FgydF4y2Ba HgydF4y2Ba ,gydF4y2Ba lgydF4y2Ba 米gydF4y2Ba ×gydF4y2Ba PgydF4y2Ba ˜gydF4y2Ba lgydF4y2Ba 米gydF4y2Ba hgydF4y2Ba 韩gydF4y2Ba ,gydF4y2Ba UgydF4y2Ba FgydF4y2Ba hgydF4y2Ba 韩gydF4y2Ba ,gydF4y2Ba FgydF4y2Ba 米gydF4y2Ba ,gydF4y2Ba lgydF4y2Ba HgydF4y2Ba ×gydF4y2Ba PgydF4y2Ba ˜gydF4y2Ba lgydF4y2Ba HgydF4y2Ba hgydF4y2Ba 韩gydF4y2Ba +gydF4y2Ba UgydF4y2Ba FgydF4y2Ba hgydF4y2Ba 韩gydF4y2Ba ,gydF4y2Ba FgydF4y2Ba 米gydF4y2Ba ,gydF4y2Ba lgydF4y2Ba 米gydF4y2Ba ×gydF4y2Ba PgydF4y2Ba ˜gydF4y2Ba lgydF4y2Ba 米gydF4y2Ba hgydF4y2Ba 韩gydF4y2Ba =gydF4y2Ba 马克斯gydF4y2Ba ugydF4y2Ba 12gydF4y2Ba ⋅gydF4y2Ba vgydF4y2Ba 韩gydF4y2Ba +gydF4y2Ba ugydF4y2Ba 32gydF4y2Ba ⋅gydF4y2Ba vgydF4y2Ba LMgydF4y2Ba ,gydF4y2Ba ugydF4y2Ba 22gydF4y2Ba ⋅gydF4y2Ba vgydF4y2Ba 韩gydF4y2Ba +gydF4y2Ba ugydF4y2Ba 42gydF4y2Ba ⋅gydF4y2Ba vgydF4y2Ba LMgydF4y2Ba ,gydF4y2Ba 和条件gydF4y2Ba vgydF4y2Ba 韩gydF4y2Ba +gydF4y2Ba vgydF4y2Ba LMgydF4y2Ba =gydF4y2Ba 1gydF4y2Ba 是满意的。gydF4y2Ba

假设gydF4y2Ba ugydF4y2Ba 12gydF4y2Ba ⋅gydF4y2Ba vgydF4y2Ba 韩gydF4y2Ba +gydF4y2Ba ugydF4y2Ba 32gydF4y2Ba ⋅gydF4y2Ba vgydF4y2Ba LMgydF4y2Ba =gydF4y2Ba ugydF4y2Ba 22gydF4y2Ba ⋅gydF4y2Ba vgydF4y2Ba 韩gydF4y2Ba +gydF4y2Ba ugydF4y2Ba 42gydF4y2Ba ⋅gydF4y2Ba vgydF4y2Ba LMgydF4y2Ba ,gydF4y2Ba

我们解决并获得gydF4y2Ba vgydF4y2Ba 韩gydF4y2Ba ∗gydF4y2Ba =gydF4y2Ba ugydF4y2Ba 42gydF4y2Ba −gydF4y2Ba ugydF4y2Ba 32gydF4y2Ba /gydF4y2Ba ugydF4y2Ba 12gydF4y2Ba −gydF4y2Ba ugydF4y2Ba 22gydF4y2Ba −gydF4y2Ba ugydF4y2Ba 32gydF4y2Ba +gydF4y2Ba ugydF4y2Ba 42gydF4y2Ba ,gydF4y2Ba vgydF4y2Ba 韩gydF4y2Ba ∗gydF4y2Ba ∈gydF4y2Ba 0 1gydF4y2Ba 。gydF4y2Ba

为gydF4y2Ba 0gydF4y2Ba ≤gydF4y2Ba vgydF4y2Ba 韩gydF4y2Ba ≤gydF4y2Ba vgydF4y2Ba 韩gydF4y2Ba ∗gydF4y2Ba ,gydF4y2Ba 3gydF4y2Ba =gydF4y2Ba ugydF4y2Ba 12gydF4y2Ba ⋅gydF4y2Ba vgydF4y2Ba 韩gydF4y2Ba +gydF4y2Ba ugydF4y2Ba 32gydF4y2Ba ⋅gydF4y2Ba vgydF4y2Ba LMgydF4y2Ba 和gydF4y2Ba fgydF4y2Ba ∗gydF4y2Ba hgydF4y2Ba =gydF4y2Ba FgydF4y2Ba HgydF4y2Ba 。gydF4y2Ba

为gydF4y2Ba vgydF4y2Ba 韩gydF4y2Ba ∗gydF4y2Ba ≤gydF4y2Ba vgydF4y2Ba 韩gydF4y2Ba ≤gydF4y2Ba 1gydF4y2Ba ,gydF4y2Ba 3gydF4y2Ba =gydF4y2Ba ugydF4y2Ba 22gydF4y2Ba ⋅gydF4y2Ba vgydF4y2Ba 韩gydF4y2Ba +gydF4y2Ba ugydF4y2Ba 42gydF4y2Ba ⋅gydF4y2Ba vgydF4y2Ba LMgydF4y2Ba 和gydF4y2Ba fgydF4y2Ba ∗gydF4y2Ba hgydF4y2Ba =gydF4y2Ba FgydF4y2Ba lgydF4y2Ba 。gydF4y2Ba

同样的,我们获得gydF4y2Ba wgydF4y2Ba 韩gydF4y2Ba ∗gydF4y2Ba =gydF4y2Ba ugydF4y2Ba 82年gydF4y2Ba −gydF4y2Ba ugydF4y2Ba 72年gydF4y2Ba /gydF4y2Ba ugydF4y2Ba 52gydF4y2Ba −gydF4y2Ba ugydF4y2Ba 62年gydF4y2Ba −gydF4y2Ba ugydF4y2Ba 72年gydF4y2Ba +gydF4y2Ba ugydF4y2Ba 82年gydF4y2Ba 。gydF4y2Ba

为gydF4y2Ba 0gydF4y2Ba ≤gydF4y2Ba wgydF4y2Ba 韩gydF4y2Ba ≤gydF4y2Ba wgydF4y2Ba 韩gydF4y2Ba ∗gydF4y2Ba ,gydF4y2Ba fgydF4y2Ba ∗gydF4y2Ba hgydF4y2Ba =gydF4y2Ba FgydF4y2Ba HgydF4y2Ba 。gydF4y2Ba

为gydF4y2Ba wgydF4y2Ba 韩gydF4y2Ba ∗gydF4y2Ba ≤gydF4y2Ba wgydF4y2Ba 韩gydF4y2Ba ≤gydF4y2Ba 1gydF4y2Ba ,gydF4y2Ba fgydF4y2Ba ∗gydF4y2Ba hgydF4y2Ba =gydF4y2Ba FgydF4y2Ba lgydF4y2Ba 。gydF4y2Ba

通过重复上述过程,我们计算gydF4y2Ba fgydF4y2Ba ∗gydF4y2Ba hgydF4y2Ba 为gydF4y2Ba HgydF4y2Ba =gydF4y2Ba hgydF4y2BaLMgydF4y2Ba。gydF4y2Ba

步骤2。gydF4y2Ba

领袖的策略计算。gydF4y2Ba (a)gydF4y2Ba 马克斯gydF4y2Ba hgydF4y2Ba ∈gydF4y2Ba HgydF4y2Ba UgydF4y2Ba lgydF4y2Ba hgydF4y2Ba ,gydF4y2Ba fgydF4y2Ba ∗gydF4y2Ba hgydF4y2Ba ,gydF4y2Ba ΘgydF4y2Ba 。gydF4y2Ba

为gydF4y2Ba ΘgydF4y2Ba =gydF4y2Ba lgydF4y2Ba HgydF4y2Ba ,当gydF4y2Ba 0gydF4y2Ba ≤gydF4y2Ba vgydF4y2Ba 韩gydF4y2Ba ≤gydF4y2Ba vgydF4y2Ba 韩gydF4y2Ba ∗gydF4y2Ba 和gydF4y2Ba 0gydF4y2Ba ≤gydF4y2Ba wgydF4y2Ba 韩gydF4y2Ba ≤gydF4y2Ba wgydF4y2Ba 韩gydF4y2Ba ∗gydF4y2Ba ,gydF4y2Ba (a)gydF4y2Ba 马克斯gydF4y2Ba hgydF4y2Ba ∈gydF4y2Ba HgydF4y2Ba UgydF4y2Ba lgydF4y2Ba hgydF4y2Ba ,gydF4y2Ba fgydF4y2Ba ∗gydF4y2Ba hgydF4y2Ba ,gydF4y2Ba ΘgydF4y2Ba =gydF4y2Ba 马克斯gydF4y2Ba UgydF4y2Ba lgydF4y2Ba hgydF4y2Ba 韩gydF4y2Ba ,gydF4y2Ba FgydF4y2Ba HgydF4y2Ba ,gydF4y2Ba lgydF4y2Ba HgydF4y2Ba ,gydF4y2Ba UgydF4y2Ba lgydF4y2Ba hgydF4y2Ba LMgydF4y2Ba ,gydF4y2Ba FgydF4y2Ba HgydF4y2Ba ,gydF4y2Ba lgydF4y2Ba HgydF4y2Ba =gydF4y2Ba 马克斯gydF4y2Ba ugydF4y2Ba 11gydF4y2Ba ,gydF4y2Ba ugydF4y2Ba 51gydF4y2Ba ,gydF4y2Ba

我们获得gydF4y2Ba hgydF4y2Ba ∗gydF4y2Ba lgydF4y2Ba HgydF4y2Ba 。gydF4y2Ba

同样的,我们获得gydF4y2Ba hgydF4y2Ba ∗gydF4y2Ba lgydF4y2Ba HgydF4y2Ba 为不同的部分gydF4y2Ba vgydF4y2Ba 韩gydF4y2Ba 和gydF4y2Ba wgydF4y2Ba 韩gydF4y2Ba 。gydF4y2Ba

通过重复上述过程,我们计算gydF4y2Ba hgydF4y2Ba ∗gydF4y2Ba lgydF4y2Ba HgydF4y2Ba 为gydF4y2Ba ΘgydF4y2Ba =gydF4y2Ba lgydF4y2Ba 米gydF4y2Ba 。gydF4y2Ba

步骤3。gydF4y2Ba

计算平衡的解决方案。gydF4y2Ba

我们获得gydF4y2Ba fgydF4y2Ba ∗gydF4y2Ba hgydF4y2Ba 和gydF4y2Ba hgydF4y2Ba ∗gydF4y2Ba ΘgydF4y2Ba 在步骤1和步骤2,分别结合先验概率PL和获得后验概率gydF4y2Ba PgydF4y2Ba ˜gydF4y2Ba FgydF4y2Ba ΘgydF4y2Ba 。如果计算值gydF4y2Ba PgydF4y2Ba ˜gydF4y2Ba FgydF4y2Ba ΘgydF4y2Ba 不冲突的前提假设呢gydF4y2Ba PgydF4y2Ba ΘgydF4y2Ba hgydF4y2Ba ,然后平衡解决方案gydF4y2Ba 情商gydF4y2Ba =gydF4y2Ba hgydF4y2Ba ∗gydF4y2Ba ΘgydF4y2Ba ,gydF4y2Ba fgydF4y2Ba ∗gydF4y2Ba hgydF4y2Ba ,gydF4y2Ba PgydF4y2Ba ˜gydF4y2Ba FgydF4y2Ba ΘgydF4y2Ba 。gydF4y2Ba

数据可用性gydF4y2Ba

使用的数据来支持本研究的发现可以从相应的作者。gydF4y2Ba

的利益冲突gydF4y2Ba

作者宣称他们没有利益冲突有关的出版。gydF4y2Ba

作者的贡献gydF4y2Ba

小虎刘和张恒威的贡献同样这项工作。gydF4y2Ba

确认gydF4y2Ba

这部分工作是支持由中国国家自然科学基金批准号。61521003和61521003下,部分由河南科技研究项目批准号182102210144。gydF4y2Ba

田gydF4y2Ba Z。gydF4y2Ba 史gydF4y2Ba W。gydF4y2Ba 王gydF4y2Ba Y。gydF4y2Ba 基于证据推理网络实时横向运动检测边缘的计算环境gydF4y2Ba IEEE工业信息gydF4y2Ba 2019年gydF4y2Ba 15gydF4y2Ba 7gydF4y2Ba 4285年gydF4y2Ba 4294年gydF4y2Ba 10.1109 / tii.2019.2907754gydF4y2Ba 田gydF4y2Ba Z。gydF4y2Ba 李gydF4y2Ba M。gydF4y2Ba 邱gydF4y2Ba M。gydF4y2Ba 太阳gydF4y2Ba Y。gydF4y2Ba 苏gydF4y2Ba 年代。gydF4y2Ba Block-DEF:一个安全的数字证据框架使用区块链gydF4y2Ba 信息科学gydF4y2Ba 2019年gydF4y2Ba 491年gydF4y2Ba 151年gydF4y2Ba 165年gydF4y2Ba 10.1016 / j.ins.2019.04.011gydF4y2Ba 沙玛gydF4y2Ba r·K。gydF4y2Ba 伊萨克gydF4y2Ba B。gydF4y2Ba KalitagydF4y2Ba h·K。gydF4y2Ba 入侵检测和响应系统的灵感来自植物的防御机制gydF4y2Ba IEEE访问gydF4y2Ba 2019年gydF4y2Ba 7gydF4y2Ba 52427年gydF4y2Ba 52439年gydF4y2Ba 10.1109 / access.2019.2912114gydF4y2Ba 丹宁gydF4y2Ba d E。gydF4y2Ba 多萝西gydF4y2Ba E。gydF4y2Ba 活跃的网络防御的框架和原则gydF4y2Ba 电脑与安全gydF4y2Ba 2014年gydF4y2Ba 40gydF4y2Ba 108年gydF4y2Ba 113年gydF4y2Ba 10.1016 / j.cose.2013.11.004gydF4y2Ba 2 - s2.0 - 84892959189gydF4y2Ba 黄gydF4y2Ba 年代。gydF4y2Ba 张gydF4y2Ba H。gydF4y2Ba 王gydF4y2Ba J。gydF4y2Ba 黄gydF4y2Ba J。gydF4y2Ba 马尔可夫网络防御决策的微分对策方法gydF4y2Ba IEEE访问gydF4y2Ba 2018年gydF4y2Ba 6gydF4y2Ba 39621年gydF4y2Ba 39634年gydF4y2Ba 10.1109 / access.2018.2848242gydF4y2Ba 2 - s2.0 - 85048599248gydF4y2Ba 做gydF4y2Ba c . T。gydF4y2Ba TrangydF4y2Ba n . H。gydF4y2Ba 在香港gydF4y2Ba C。gydF4y2Ba 博弈理论对网络安全和隐私gydF4y2Ba ACM计算调查gydF4y2Ba 2017年gydF4y2Ba 50gydF4y2Ba 2gydF4y2Ba 1gydF4y2Ba 37gydF4y2Ba 10.1145 / 3057268gydF4y2Ba 2 - s2.0 - 85019898776gydF4y2Ba FarrajgydF4y2Ba 一个。gydF4y2Ba HammadgydF4y2Ba E。gydF4y2Ba 达乌德gydF4y2Ba 答:一个。gydF4y2Ba KundurgydF4y2Ba D。gydF4y2Ba 游戏理论分析网络切换的智能电网系统的攻击和缓解gydF4y2Ba IEEE智能电网gydF4y2Ba 2016年gydF4y2Ba 7gydF4y2Ba 4gydF4y2Ba 1846年gydF4y2Ba 1855年gydF4y2Ba 10.1109 / tsg.2015.2440095gydF4y2Ba 2 - s2.0 - 84931025979gydF4y2Ba 胡gydF4y2Ba H。gydF4y2Ba 刘gydF4y2Ba Y。gydF4y2Ba 张gydF4y2Ba H。gydF4y2Ba 锅gydF4y2Ba R。gydF4y2Ba 最优的网络防御基于不完全信息进化博弈策略选择gydF4y2Ba IEEE访问gydF4y2Ba 2018年gydF4y2Ba 6gydF4y2Ba 29806年gydF4y2Ba 29821年gydF4y2Ba 10.1109 / access.2018.2841885gydF4y2Ba 2 - s2.0 - 85047792020gydF4y2Ba 黄gydF4y2Ba J。gydF4y2Ba 张gydF4y2Ba H。gydF4y2Ba 王gydF4y2Ba J。gydF4y2Ba 马尔可夫进化游戏网络防御策略的选择gydF4y2Ba IEEE访问gydF4y2Ba 2017年gydF4y2Ba 5gydF4y2Ba 19505年gydF4y2Ba 19516年gydF4y2Ba 10.1109 / access.2017.2753278gydF4y2Ba 2 - s2.0 - 85030652838gydF4y2Ba LeigydF4y2Ba C。gydF4y2Ba 马gydF4y2Ba D.-H。gydF4y2Ba 张gydF4y2Ba H.-Q。gydF4y2Ba 最优策略选择基于马尔可夫的移动目标防御游戏gydF4y2Ba IEEE访问gydF4y2Ba 2017年gydF4y2Ba 5gydF4y2Ba 156年gydF4y2Ba 169年gydF4y2Ba 10.1109 / access.2016.2633983gydF4y2Ba 2 - s2.0 - 85018513975gydF4y2Ba 田gydF4y2Ba Z。gydF4y2Ba 高gydF4y2Ba X。gydF4y2Ba 苏gydF4y2Ba 年代。gydF4y2Ba 邱gydF4y2Ba J。gydF4y2Ba 杜gydF4y2Ba X。gydF4y2Ba GuizanigydF4y2Ba M。gydF4y2Ba 评估网络声誉管理方案基于进化博弈论的车辆gydF4y2Ba IEEE车辆技术gydF4y2Ba 2019年gydF4y2Ba 68年gydF4y2Ba 6gydF4y2Ba 5971年gydF4y2Ba 5980年gydF4y2Ba 10.1109 / tvt.2019.2910217gydF4y2Ba 刘gydF4y2Ba 杨绍明。关铭gydF4y2Ba 冯gydF4y2Ba D.-G。gydF4y2Ba 吴gydF4y2Ba L.-H。gydF4y2Ba 丽安gydF4y2Ba Y.-F。gydF4y2Ba 绩效评估的蠕虫攻击和防御策略基于静态贝叶斯博弈gydF4y2Ba 软件学报gydF4y2Ba 2012年gydF4y2Ba 23gydF4y2Ba 3gydF4y2Ba 712年gydF4y2Ba 723年gydF4y2Ba 10.3724 / sp.j.1001.2012.03997gydF4y2Ba 2 - s2.0 - 84863383821gydF4y2Ba WangqungydF4y2Ba lgydF4y2Ba 王gydF4y2Ba H。gydF4y2Ba 嘉鸿gydF4y2Ba lgydF4y2Ba 网络安全主动防御技术研究基于非合作动态博弈理论gydF4y2Ba 计算机研究与发展》杂志上gydF4y2Ba 2011年gydF4y2Ba 48gydF4y2Ba 2gydF4y2Ba 306年gydF4y2Ba 316年gydF4y2Ba Jin-DonggydF4y2Ba W。gydF4y2Ba 积极防御战略选择基于静态贝叶斯博弈gydF4y2Ba 西安电子科技大学学报gydF4y2Ba 2016年gydF4y2Ba 43gydF4y2Ba 1gydF4y2Ba 144年gydF4y2Ba 150年gydF4y2Ba 10.3969 / j.issn.1001-2400.2016.01.026gydF4y2Ba 2 - s2.0 - 84962734411gydF4y2Ba LeigydF4y2Ba C。gydF4y2Ba 张gydF4y2Ba H.-Q。gydF4y2Ba 王ydF4y2Ba L.-M。gydF4y2Ba 刘gydF4y2Ba lgydF4y2Ba 马gydF4y2Ba D.-H。gydF4y2Ba 不完全信息马尔可夫场理论方法生成移动目标防御策略gydF4y2Ba 计算机通信gydF4y2Ba 2018年gydF4y2Ba 116年gydF4y2Ba 184年gydF4y2Ba 199年gydF4y2Ba 10.1016 / j.comcom.2017.12.001gydF4y2Ba 2 - s2.0 - 85043571547gydF4y2Ba 凯西gydF4y2Ba W。gydF4y2Ba 科尔纳gydF4y2Ba 一个。gydF4y2Ba MemarmoshrefigydF4y2Ba P。gydF4y2Ba 莫拉莱斯gydF4y2Ba j . A。gydF4y2Ba MishragydF4y2Ba B。gydF4y2Ba 欺骗,身份,和安全gydF4y2Ba ACM的通信gydF4y2Ba 2018年gydF4y2Ba 62年gydF4y2Ba 1gydF4y2Ba 85年gydF4y2Ba 93年gydF4y2Ba 10.1145 / 3190836gydF4y2Ba 2 - s2.0 - 85059643895gydF4y2Ba 徐gydF4y2Ba H。gydF4y2Ba 弗里曼gydF4y2Ba R。gydF4y2Ba ConitzergydF4y2Ba V。gydF4y2Ba DughmigydF4y2Ba 年代。gydF4y2Ba TambegydF4y2Ba M。gydF4y2Ba 信号在贝叶斯stackelberg游戏gydF4y2Ba 国际联合会议上自治代理诉讼和多重代理系统,AAMASgydF4y2Ba 2016年1月gydF4y2Ba 新加坡gydF4y2Ba 150年gydF4y2Ba 158年gydF4y2Ba JihonggydF4y2Ba H。gydF4y2Ba DingkungydF4y2Ba Y。gydF4y2Ba 国防政策基于攻防对抗信号博弈模型的选择方法gydF4y2Ba 杂志在通信gydF4y2Ba 2016年gydF4y2Ba 36gydF4y2Ba 4gydF4y2Ba 121年gydF4y2Ba 132年gydF4y2Ba 冯gydF4y2Ba X。gydF4y2Ba 郑gydF4y2Ba Z。gydF4y2Ba CansevergydF4y2Ba D。gydF4y2Ba 阁下gydF4y2Ba 一个。gydF4y2Ba MohapatragydF4y2Ba P。gydF4y2Ba 一个移动目标防御信号博弈模型gydF4y2Ba 学报2017年IEEE计算机通讯大会上,一家2017年gydF4y2Ba 2017年5月gydF4y2Ba 亚特兰大,乔治亚州,美国gydF4y2Ba 1gydF4y2Ba 9gydF4y2Ba 高gydF4y2Ba X。gydF4y2Ba 朱gydF4y2Ba Y。gydF4y2Ba 基于信号博弈模型的DDoS防御机制分析gydF4y2Ba 学报2013年第五届国际会议上智能人机系统和控制论gydF4y2Ba 2013年8月gydF4y2Ba 杭州,中国gydF4y2Ba 414年gydF4y2Ba 417年gydF4y2Ba 恒威gydF4y2Ba Z。gydF4y2Ba 道gydF4y2Ba lgydF4y2Ba 近东以gydF4y2Ba W。gydF4y2Ba JihonggydF4y2Ba H。gydF4y2Ba 最优主动防御使用动态多级信号游戏gydF4y2Ba 中国通信gydF4y2Ba 2015年gydF4y2Ba 12gydF4y2Ba 2gydF4y2Ba 114年gydF4y2Ba 122年gydF4y2Ba 程ydF4y2Ba X。gydF4y2Ba 刘gydF4y2Ba X。gydF4y2Ba 张gydF4y2Ba lgydF4y2Ba 唐gydF4y2Ba C。gydF4y2Ba 最佳的防御策略选择鱼叉式网络钓鱼攻击基于多级信号游戏gydF4y2Ba IEEE访问gydF4y2Ba 2019年gydF4y2Ba 7gydF4y2Ba 19907年gydF4y2Ba 19921年gydF4y2Ba 10.1109 / access.2019.2897724gydF4y2Ba 2 - s2.0 - 85062450970gydF4y2Ba 杨gydF4y2Ba Y。gydF4y2Ba 切gydF4y2Ba B。gydF4y2Ba 曾gydF4y2Ba Y。gydF4y2Ba 程gydF4y2Ba Y。gydF4y2Ba 李gydF4y2Ba C。gydF4y2Ba MAIAD:多级信息不对称攻击和防御模型基于进化博弈论gydF4y2Ba 对称gydF4y2Ba 2019年gydF4y2Ba 11gydF4y2Ba 2gydF4y2Ba 215年gydF4y2Ba 229年gydF4y2Ba 10.3390 / sym11020215gydF4y2Ba 2 - s2.0 - 85061858560gydF4y2Ba 歌词gydF4y2Ba m . O。gydF4y2Ba basargydF4y2Ba T。gydF4y2Ba 欺骗是国防cyber-physical框架系统gydF4y2Ba 2019年gydF4y2Ba https://arxiv.org/abs/1902.01364gydF4y2Ba 哈萨尼gydF4y2Ba j . C。gydF4y2Ba 游戏和不完整的信息由“贝叶斯”球员gydF4y2Ba 博弈理论gydF4y2Ba 1982年gydF4y2Ba 荷兰多德雷赫特gydF4y2Ba 施普林格gydF4y2Ba 154年gydF4y2Ba 170年gydF4y2Ba 朱gydF4y2Ba Q。gydF4y2Ba 博弈论的网络欺骗:教程gydF4y2Ba 2019年gydF4y2Ba https://arxiv.org/abs/1903.01442gydF4y2Ba 克莱奥gydF4y2Ba 年代。gydF4y2Ba 网络杀伤链基于威胁分类及其应用共同运营的网络图片gydF4y2Ba 《2018年国际会议上网络态势感知gydF4y2Ba 2018年6月gydF4y2Ba 格拉斯哥,苏格兰gydF4y2Ba 数据分析和评估(网络SA)gydF4y2Ba 1gydF4y2Ba 8gydF4y2Ba PawlickgydF4y2Ba J。gydF4y2Ba 科尔伯特gydF4y2Ba E。gydF4y2Ba 朱gydF4y2Ba Q。gydF4y2Ba 建模和分析漏水的欺骗利用信号游戏的证据gydF4y2Ba IEEE取证和安全信息gydF4y2Ba 2019年gydF4y2Ba 14gydF4y2Ba 7gydF4y2Ba 1871年gydF4y2Ba 1886年gydF4y2Ba 10.1109 / tifs.2018.2886472gydF4y2Ba 2 - s2.0 - 85058651620gydF4y2Ba Al-ShaergydF4y2Ba E。gydF4y2Ba 魏gydF4y2Ba J。gydF4y2Ba 凯文gydF4y2Ba W。gydF4y2Ba HamlengydF4y2Ba 王gydF4y2Ba C。gydF4y2Ba 自治网络欺骗gydF4y2Ba 2019年gydF4y2Ba 柏林,德国gydF4y2Ba 施普林格国际出版gydF4y2Ba 张gydF4y2Ba T。gydF4y2Ba 黄gydF4y2Ba lgydF4y2Ba PawlickgydF4y2Ba J。gydF4y2Ba 朱gydF4y2Ba Q。gydF4y2Ba 网络欺骗博弈论的分析:以证据为基础的战略和动态风险缓解gydF4y2Ba 2019年gydF4y2Ba https://arxiv.org/abs/1902.03925gydF4y2Ba 宇卓gydF4y2Ba W。gydF4y2Ba JianyegydF4y2Ba Y。gydF4y2Ba 温gydF4y2Ba Q。gydF4y2Ba 网络群体行为进化博弈模型和分析方法gydF4y2Ba 中国电脑杂志gydF4y2Ba 2015年gydF4y2Ba 38gydF4y2Ba 2gydF4y2Ba 282年gydF4y2Ba 300年gydF4y2Ba 魏gydF4y2Ba J。gydF4y2Ba Bing-XinggydF4y2Ba F。gydF4y2Ba 国防战略选择基于攻防博弈模型gydF4y2Ba 计算机研究与发展》杂志上gydF4y2Ba 2014年gydF4y2Ba 47gydF4y2Ba 12gydF4y2Ba 714年gydF4y2Ba 723年gydF4y2Ba FudenberggydF4y2Ba D。gydF4y2Ba •gydF4y2Ba J。gydF4y2Ba 完美贝叶斯均衡和序贯均衡gydF4y2Ba 《经济理论gydF4y2Ba 1991年gydF4y2Ba 53gydF4y2Ba 2gydF4y2Ba 236年gydF4y2Ba 260年gydF4y2Ba 10.1016 / 0022 - 0531 (91)90155 - wgydF4y2Ba 2 - s2.0 - 0000090836gydF4y2Ba 朱gydF4y2Ba M。gydF4y2Ba 胡gydF4y2Ba Z。gydF4y2Ba 刘gydF4y2Ba P。gydF4y2Ba 强化学习算法对heartbleed自适应网络防御gydF4y2Ba 学报2014年第一届ACM研讨会论文集移动目标Defense-MTD 14gydF4y2Ba 2014年11月gydF4y2Ba 美国斯科茨代尔,基于“增大化现实”技术gydF4y2Ba 国家信息安全漏洞数据库,gydF4y2Ba https://nvd.nist.gov/gydF4y2Ba 唐ydF4y2Ba Q。gydF4y2Ba 高gydF4y2Ba Y。gydF4y2Ba 史gydF4y2Ba J。gydF4y2Ba 王gydF4y2Ba X。gydF4y2Ba 方gydF4y2Ba B。gydF4y2Ba 田gydF4y2Ba Z。gydF4y2Ba 对全面了解eclipse tor隐藏服务的攻击gydF4y2Ba IEEE物联网gydF4y2Ba 2019年gydF4y2Ba 6gydF4y2Ba 2gydF4y2Ba 1584年gydF4y2Ba 1593年gydF4y2Ba 10.1109 / jiot.2018.2846624gydF4y2Ba 2 - s2.0 - 85048531653gydF4y2Ba 戈登gydF4y2Ba lgydF4y2Ba 勒布gydF4y2Ba M。gydF4y2Ba LucyshyngydF4y2Ba W。gydF4y2Ba 理查森gydF4y2Ba R。gydF4y2Ba CSI /联邦调查局计算机犯罪和安全调查gydF4y2Ba 计算机安全协会学报》上gydF4y2Ba 2015年gydF4y2Ba 旧金山,加州,美国gydF4y2Ba 48gydF4y2Ba 64年gydF4y2Ba