研究文章

控制磁操纵者使用基于强化学习的逐步适应当地的线性模型

图8

控制器的控制性能的例子基于SNGP 10模型。