关键词:
三维目标检测
注意力机制
ConvNeXt V2
损失函数
激光雷达点云
自动驾驶
摘要:
针对PointPillars算法中存在识别与定位不准确的问题,提出一种GCR-PointPillars三维目标检测模型,该模型首先在Pillar特征网络中引入全局注意力机制,学习点云特征之间的相关性,增强伪图特征的全局信息交互能力;其次,基于ConvNeXt V2重新构建特征提取网络,提取更加丰富的语义信息,从而有效提升网络的学习能力;最后引入RDIoU来联合引导分类和回归任务,有效缓解分类和回归不一致的问题。文中模型在KITTI数据集中与基准网络相比,汽车类别在简单、中等、困难三种难度级别下分别提高了2.69%、4.29%、4.84%,并且推理速度达到25.8 f/s。实验结果表明,文中模型在保持实时性速度的同时,检测效果也有明显提升。