研究文章

无偏Model-Agnostic Metalearning视觉导航算法学习目标导向政策

算法1

当地的模型:metatraining阶段。
要求: :一步hyperparameters
(1) 随机初始化
(2)
(3)
(4) 示例批处理的任务
(5) 所有
(6) 收集 轨迹 使用
(7) 评估 使用方程(2)
(8) 计算与梯度下降法调整参数:
(9) 收集轨迹 使用
(10) 结束了
(11) 更新 使用方程(2)
(12) 结束时