研究文章

无偏Model-Agnostic Metalearning视觉导航算法学习目标导向政策

算法3

本地/全球模型:meta-adapting阶段。
(1)
(2) 不聚合
(3) 收集轨迹 使用
(4) 评估 使用方程(2)
(5) 更新
(6) 结束时