关键词:
高效目标检测
航空图像
注意力机制
卷积神经网络
摘要:
针对航空图像目标检测中普遍存在的图像尺寸过大、目标密集分布等关键难题,本文开创性地引入了目标图像块激活策略,不仅解决了传统方法在处理航空图像时效率低下的问题,而且显著提升了复杂场景下的精度表现,对推动航空图像目标检测技术的发展具有重要意义.现有的航空图像目标检测技术通过简单裁切图像块的方式进行处理,不仅效率低下,还因大量无效图像块的检测导致资源浪费与误检率上升.因此,本文提出了一种目标图像块激活模块(TIBAM),该模块通过引入卷积注意力机制,使检测器能够专注于包含目标物的有效图像块,从而减少在无效图像块上的资源浪费,实现了对潜在有效图像块的智能识别与处理.TIBAM的引入,为检测器带来了超过17%的推理速度提升,还实现了检测精度的稳定提升,为高效、精准的航空图像目标检测提供了创新性的解决方案.本文通过在主流的一阶段检测器Retinanet和两阶段检测器Faster-RCNN中集成TIBAM模块,以及在Visdrone航空图像数据集上进行验证,充分展示了该模块的实际应用价值与广泛适用性.