raybet雷竞app|雷竞技官网下载|雷电竞下载苹果

TY -的A2 Monterola克里斯托弗·p·盟——太阳,剑盟-李,杰PY - 2018 DA - 2018/02/07 TI -一个稳定的分布式神经控制器通过在线强化物理耦合网络离散时间系统学习SP - 5950678六世- 2018 AB -大规模,时间不同,和多样化的物理耦合的网络基础设施,如电网和交通系统导致控制器设计的复杂性,实现,和扩张。应对这些挑战,我们建议一个在线分布式强化学习与单层神经网络控制算法为每个子系统或称为代理适应变化的网络基础设施。每个控制器包括一个评论家网络和行动网络近似策略效用函数和期望的控制律。避免大量的试验和改进稳定,行动网络介绍的培训监督学习机制长期成本的减少。控制系统的稳定性与学习算法进行了分析;跟踪误差的上界和神经网络权重也估计。提出的控制器的有效性,仿真说明了;结果表明通信延迟和扰动下的稳定性。SN - 1076 - 2787你——https://doi.org/10.1155/2018/5950678——10.1155 / 2018/5950678 JF - PB - Hindawi KW - ER -复杂性