关键词:
物体目标导航
具身人工智能
视觉自主探索
视觉物体重排布
摘要:
近年来随着计算机视觉和人工智能领域的不断发展,具身人工智能(embodied AI)受到国内外学术界和工业界的广泛关注.具身人工智能强调具身智能体通过与环境进行情景化的交互来主动获取物理世界的真实反馈,并通过对反馈进行学习使具身智能体更加智能.作为具身人工智能具体化的任务之一,物体目标导航要求具身智能体在事先未知的、复杂且语义丰富的场景中搜寻并导航至指定的物体目标(例如:找到水槽).物体目标导航在辅助人类日常活动的智能助手方面有着巨大的应用潜力,是其他基于交互的具身智能研究的基础和前置任务.系统地分类和梳理当前物体目标导航相关工作,首先介绍环境表示和视觉自主探索相关知识,从3种不同的角度对现有的物体目标导航方法进行分类和分析,其次介绍两类更高层次的物体重排布任务,描述逼真的室内仿真环境数据集、评价指标和通用的导航策略训练范式,最后比较和分析现有的物体目标导航策略在不同数据集上的性能,总结该领域所面临的挑战,并对发展前景作出展望.