关键词:
同时定位与建图
状态估计
机器人学
多传感器融合
可观性分析
视觉惯性导航
激光雷达里程计
机器人运动学
深度神经网络
摘要:
同时定位与地图构建(Simultaneous Localization and Mapping,SLAM)是移动机器人应用中的核心技术之一,在学术界和工业界受到了广泛关注。近年来,这一领域蓬勃发展并取得了很多令人瞩目的进展,但SLAM的鲁棒应用仍存在严峻挑战。一方面,复杂的外界环境,如恶劣天气、光照快速变化、剧烈运动、纹理缺失、场景结构退化等,会导致算法性能显著降低甚至失败。另一方面,机器人平台自身对算法的计算量、精度、状态估计的一致性、时效等有特殊的要求。此外,SLAM需要从仅关注低维几何特征过渡到能够理解和利用更高层次的信息,更加智能化。针对上述问题和挑战,本文研究如何通过融合多源信息的方式来提高定位与建图算法的鲁棒性、感知能力和精度,同时保持其实时性。本文采用的可融合信息源包括多模态传感器、高维几何特征、来自环境或者机器人平台的物理信息、以及神经网络推理等。主要内容和研究成果如下:(1)本文提出了先验激光地图辅助的实时视觉惯导里程计(Visual-Inertial Odometry,VIO),旨在融合多模态传感器的异质信息,以实现低成本传感器上的高精度位姿估计。基于标准的MSCKF(Multi-State Constraint Kalman Filter)VIO框架,在线使用低成本的双目相机和IMU传感器,通过稀疏视觉特征点观测和IMU测量来进行局部的位姿估计。本方法从双目图像中恢复半稠密视觉点云,并与先验激光点云地图进行配准以获得来自地图的约束。配准结果作为一种全局测量在滤波器中对估计状态进行更新,从而有效地抑制里程计的位姿漂移。实验结果表明融合先验激光地图可显著提高VIO的位姿估计精度。(2)针对光照快速变化、剧烈运动、弱纹理、结构退化等挑战,本文在滤波器框架中融合了多模态传感器和多种几何特征,提出了 一种紧耦合的轻量级激光雷达-惯导-相机里程计,进行高精度且鲁棒的6DoF(Degreesof Freedom)位姿估计。本方法在线标定不同传感器之间的时空外参,并联合估计视觉点特征和高维激光平面特征,拓展了算法的适用性。为了对激光雷达点云进行可靠的数据关联并避免缓慢的迭代更新,提出了一种高效且可靠的滑动窗口平面特征跟踪算法,并以概率的方式剔除异常的数据关联。本文还对激光雷达-惯导-相机系统,尤其是激光雷达-惯导子系统,进行了详细的可观性分析并确定了导致其外参不可观的退化情况。实验结果表明本方法能提供高精度的一致状态估计,且具有很强的鲁棒性。(3)针对地面机器人的高精度位姿估计,本文提出了融合环境中运动流形的位姿估计器,并研究了运动流形的参数化表示及估计方法。运动流形是一种物理信息,用于表示地面机器人运动所在的表面。基于优化的滑动窗口估计器框架,本文设计了一个为地面机器人定制的高精度位姿估计器,融合了轮速计和感知外部环境的传感器测量,同时估计导航状态和运动流形。与使用轮速计测量只能进行3DoF平面运动积分的传统方法相比,本研究提出了仅使用轮速计测量进行6DoF运动积分的方法。此外,本文还提出了周期性地重参数化运动流形的方法,显著降低了位姿估计误差。(4)为了提高应用在滑移转向机器人上定位与建图算法的鲁棒性和精度,降低由机械结构变形、地形变化、轮胎压力变化、机器人重心变化、轮子打滑等因素带来的算法性能下降的风险,本文融合了机器人平台自身的运动学特性(物理信息),提出了一种针对滑移转向机器人的运动学参数和位姿估计方法。本文采用基于瞬时旋转中心的机器人运动学模型,在基于优化的滑动窗口估计器中融合轮速计、单目相机和可选的IMU进行状态估计。针对不同的传感器和设计配置,进行了深入的可观性分析,为实现合理的算法设计提供了理论支撑。实验结果表明运动学模型的引入显著提高了算法的鲁棒性和精度,有利于机器人长期执行任务。(5)针对在某些应用中深度传感器缺失的问题,本文提出了一种融合神经网络推理的视觉惯导定位与建图方法。本文使用了能推理出稠密深度的神经网络,并与VIO紧耦合,实现了实时的定位与建图。针对从单目图像无法恢复出真正尺度的稠密深度问题,本方法把来自VIO的稀疏深度和单目图像输入到轻量级条件变分自编码器(CVAE)中,预测出有尺度的稠密深度。同时,为了快速调整稠密深度,CVAE把高维度的稠密深度编码成低维度的潜变量(称为深度码)。在基于滤波的VIO中,本方法仅使用稀疏测量来更新深度码和导航状态,以提高推理出的稠密深度质量。为保证实时性,本文提出基于有限差分的神经网络雅可比计算方法,其速度比基于链式法则的雅可比计算方法快一个数量级,且仅使用第一估计雅可比(FEJ),无需进行重线性化。此外,由于深度神经网络耦合了不会发生过拟合的状态估计器,本方法在完全未知的数据集上有很强的泛化性。针对以上核心问题和研究成果,本文在真实场景数据集上和仿真环