关键词:
视觉重定位
室内服务机器人
卷积神经网络
多级特征融合
角点特征
摘要:
视觉重定位技术是室内服务机器人关键技术之一,其主要目的是精确确定机器人在场景中的六自由度位姿。在室内环境中,稀疏纹理区域的普遍存在对视觉重定位的精度构成了挑战,因为这些区域中的相似图像块会大幅干扰定位准确性。此外,现有的视觉重定位网络往往忽视图像中角点的重要性,限制了卷积神经网络在编码场景信息时的能力,因为角点中蕴含着丰富的几何特征。为此,提出一种结合元素级注意力机制和角点特征的视觉重定位网络。为了解决相似图像块的问题,提出元素级注意力机制,通过预测元素级注意力加权系数来评估特征图中每个元素的重要性。该方法可有效融合多级特征图,利用低级特征图中的几何结构信息与高级特征图中的语义信息来提升相似图像块的区分度。针对角点特征被忽视的问题,提出一种角点特征整合模块,利用角点提取网络SuperPoint提取大量角点进行聚类,并选择距离聚类中心最近的角点来保证其均匀地分布在图像中。该网络将提取的角点特征整合进高维特征图中,从而保证网络充分地提取角点中所包含的图像几何特征,进而提升网络的场景解析能力。在7-Scenes数据集上的实验结果表明,在包含大量稀疏纹理的室内场景中,提升相似图像块间的区分度并整合角点特征可有效提升视觉重定位精度,使该方法实现了0.025 m的中值平移误差、0.83°的中值旋转误差以及87.43%的重定位准确率。