关键词:
计算机视觉
多目标跟踪
特征增强
通道注意力机制
空间注意力机制
卷积混合注意力机制
摘要:
基于检测的多目标跟踪方法在复杂场景问题上达到了较好的效果,但已有研究大多关注于时空特征关联而忽视了提高检测性能所能带来的全局跟踪收益.据此,提出一种卷积混合注意力机制,该模块结合动态稀疏通道注意力和空间位置注意力:在处理通道注意力时,整合空间上下文信息,动态调整通道权重;在处理空间注意力时,结合不同通道特征评估空间区域的重要性,旨在优化注意力分配并提升检测精度.进一步地,提出一种两阶段多目标跟踪方法 ——CHAMTrack,通过在运动目标检测阶段使用该注意力机制,增强算法在复杂场景中对关键信息的捕捉能力,提升不同尺度目标的跟踪效果,降低跟踪过程中漏检和ID切换的发生率.在MOT17和MOT20数据集上的实验结果表明, CHAMTrack在MOTA指标上分别提升28%和20.5%,显著提升了多目标跟踪算法在复杂场景中的效果和鲁棒性.