关键词:
自主探索
深度强化学习
物体感知
模块化框架
摘要:
针对如何在未知室内场景的探索中高效感知物体的问题,提出一种机器人自主探索与物体感知算法.利用深度强化学习让机器人通过与环境交互的方式学会利用场景的布局规律和语义信息获得更加高效、高质量的探索策略.算法使用模块化的方式解决强化学习训练困难的问题,分为同时定位与地图构建模块、全局探索模块、路径规划模块和局部探索模块.首先同时定位与地图构建模块根据传感器所得数据构建地图;然后全局探索模块根据当前地图决策长期目标点,规划机器人将要探索的区域;接着路径规划模块根据机器人当前位置和长期目标点规划行进路径;最后局部探索模块基于机器人周围的局部地图信息规划每一步行进时传感器的朝向并更新地图.在Habitat仿真环境中与SC和ANS这2种先进算法在Gibson和Matterport3D公开数据集上进行实验的结果表明,所提算法在小、中、大和超大场景中的物体感知率分别为0.942, 0.866, 0.652和0.506,表现出对场景良好的感知性能.