关键词:
飞机目标检测
深度学习
YOLOv5网络
注意力机制优化
特征融合
摘要:
由于飞机目标的大小和形状差异、遮挡、密集分布以及复杂背景等因素,现有模型在检测过程中存在较多的错检和漏检。为此,提出一种基于改进YOLOv5的飞机目标检测模型,称为AT YOLOv5。首先在主干网络中融合坐标注意力模块,增强模型的特征提取能力,然后针对FPN在特征融合时多尺度表征能力降低的问题,提出了注意力特征融合网络,该结构基于注意力权重可以实现不同尺度特征的自适应融合。最后,改进小目标检测层,并在所有检测层中加入Swin Transformer模块,以增强网络模型获取全局信息和关联目标信息的能力。实验部分采用DOTA和RSOD数据集来验证模型的有效性及泛化能力。实验结果表明,提出的检测算法在DOTA数据集下AP 50相对于YOLOv5s网络提高了3.9%,AP 50:95提高了1.0%,对高分辨率遥感影像的FPS可达到64,在RSOD数据集下的AP 50也可以达到96.7%。本文算法可以有效实现飞机目标检测任务,具有较好的检测精度、实时性和鲁棒性。