TY -的A2郭Yanhui盟——吴Zenan盟——田Liqin AU -王,燕盟——谢Jianfei AU - Du,玉泉盟,张易PY - 2021 DA - 2021/12/16 TI -基于随机游戏网络安全防御决策方法和深度强化学习SP - 2283786六世- 2021 AB -针对现有网络攻击和防御游戏随机模型,其中大部分是基于完全信息的假设,导致模型的适用性差的问题。基于实际的建模需求的网络攻击和防御过程,网络防御决策模型结合不完全信息随机游戏和深度提出了强化学习。这个模型认为攻击者的不完全信息和后卫作为后卫攻击者的不确定性的类型和使用的双重深Q-Network算法来解决这个问题的难度决定网络状态转换概率,所以网络系统可以动态地调整防御策略。最后,对该模型进行仿真实验。结果表明,在相同的实验条件下,本文提出的方法有更好的收敛速度比其他方法在解决防御均衡策略。这个模型是传统的方法和人工智能技术的融合,并提供新的研究思路的应用人工智能领域的网络安全。SN - 1939 - 0114 UR - https://doi.org/10.1155/2021/2283786 - 10.1155 / 2021/2283786摩根富林明安全和通信网络PB - Hindawi KW - ER