TY -的A2 -卡里尔,艾哈迈德Mostafa盟——雪,Tianfang AU - Yu,海滨PY - 2021 DA - 2021/12/08 TI -无偏Model-Agnostic Metalearning视觉导航算法学习目标导向政策SP - 5620751六世- 2021 AB -深强化学习方法在视觉导航领域已经取得了很大的进步,metalearning-based算法获得更多的关注,因为他们极大地提高了移动代理的可扩展性。根据metatraining机制,通常一个初始模型是由现有的训练作为metalearner导航任务,成为在新场景通过递归试验相对较少。然而,如果metalearner训练过度的前任务,它可能很难实现泛化在陌生的环境中导航作为初始模型是比较偏向前环境配置。为了培养一个公正的导航模型和提高其泛化能力,我们提出一个无偏Model-Agnostic Metalearning (UMAML)算法对目标导向视觉导航。灵感来自entropy-based方法,最大化输出标签分类任务的不确定性,我们采取不平等措施用于经济学作为一个简洁的度量来计算损失偏差在不熟悉的任务。简洁地最小化任务损失的不平等,一个公正的导航模型没有偏离剧本表演尤其可以学会根据场景类型Model-Agnostic Metalearning机制。探索代理符合一个更平衡的更新规则,能够收集导航经验培训环境。进行了实验,结果表明,我们的方法优于其他先进的metalearning导航方法的泛化能力。SN - 1687 - 5265 UR - https://doi.org/10.1155/2021/5620751 - 10.1155 / 2021/5620751摩根富林明计算智力和神经科学PB - Hindawi KW - ER