机器人杂志

机器人杂志/2020/文章/图8

研究文章

基于深度强化学习的轮式机器人斜坡地面动态路径规划研究

图8

训练曲线 目标网络损耗函数。每个点是每十epoch所达到的平均损失函数值。y轴为损失函数值,x轴为迭代历元。(a)培训的初始阶段。(b)训练的衔接阶段。
(一)
(b)

我们致力于尽快分享与COVID-19相关的发现。我们将对接受的研究论文、病例报告和COVID-19相关病例系列提供不受限制的出版费用减免。评论文章不包括在本弃权政策之内。注册在这里作为审稿人,帮助快速跟踪新提交的内容。