关键词:
6D位姿估计
多目标单阶段网络
多分支特征提取解码器
特征选择
合成数据
摘要:
为解决传统方法采用单一对象CNN模型的扩展性差、通用性低及计算成本高的问题,以及优化多目标方法的性能,本文提出一种面向多目标6D位姿估计的单阶段网络架构,设计一种多分支特征提取解码器,有效地捕捉并聚合细节特征。本文提出特征优化与筛选模块,该模块对输入特征进行筛选以提取多尺度特征。以上两者结合,设计一种新的特征金字塔结构,提升网络的整体性能,提升对遮挡情况的位姿估计效果。实验在合成数据集LINEMOD及Occluded LINEMOD上进行。结果显示,本文方法在处理遮挡物体场景时取得了较显著的提升,与PyraPose、SD-Pose和CASAPose等现有最先进方法相比,本文方法在ADD/S-Recall指标上分别提高了43.1%、16.1%和12%。在目标数量较少时表现更佳,目标数量为4个时,性能提升17%。消融实验进一步验证了各模块的有效性。本文提出的单阶段多目标网络架构通过引入多分支特征提取解码器、特征优化与筛选模块以及特征金字塔结构,仅需训练一个网络即可处理任意数量的目标,在合成数据条件下,可以更好地完成6D位姿估计。实验结果验证了本文方法的有效性。