关键词:
单目三维目标检测
深度引导
多尺度通道注意力机制
2D-3D
自动驾驶
摘要:
针对无法从缺少空间线索的单目图像中准确估计三维边界框问题,本文提出了一种基于深度信息引导和多尺度通道注意力机制的单目三维目标检测算法。为了引入三维信息并有效地获取和利用不同尺度特征图的空间信息,在特征提取模块中利用多尺度分割注意力算法,分别从单目图像和深度图中提取多尺度预处理特征图,利用通道注意力算法进行权重标定,丰富了特征图的表征能力。通过深度引导动态局部卷积网络,将包含多尺度信息的深度图特征作为单目图像特征的特定卷积核,引入三维信息作为指导,减少直接融合的误差累积,并解决单目视觉中近大远小的尺度敏感问题。选择了不同的评估指标对模型的性能进行评价与比较。试验结果表明,本文提出的单目三维目标检测方法,在自动驾驶数据集具有代表性的汽车中等类别下,相对其他先进算法有最佳的检测精度。