TY -的盟,将尝试盟——刘Jing PY - 2019 DA - 2019/12/23 TI -最优决策方法为网络安全防御使用博弈理论和智能学习SP - 3038586六世- 2019 AB -基于随机网络攻防对抗分析游戏的现有方法采用完全理性的假设,但在实际的网络攻防对抗,双方的攻击者和防御者很难满足高要求的完整的合理性。对于这个目标,分析了有限理性对攻防随机游戏的影响。我们构造一个随机博弈模型。针对状态爆炸的问题,当网络节点数量的增加,我们设计的攻防图压缩状态空间和提取网络状态和防御策略。在此基础上,介绍了智能学习算法WoLF-PHC进行学习和改进策略。然后,国防决策算法和在线学习能力设计,这有助于选择最佳的防御策略的最大回报从候选策略集。获得的策略优于之前的进化均衡策略之前,因为它不依赖于数据。通过引入资格跟踪改善WoLF-PHC,学习速度进一步提高和国防及时性显著提升。SN - 1939 - 0114 UR - https://doi.org/10.1155/2019/3038586 - 10.1155 / 2019/3038586摩根富林明安全和通信网络PB - Hindawi KW - ER