关键词:
YOLOv5
小目标检测
Wise IoU
大型可分离核注意力
归一化Wasserstein距离
摘要:
针对小目标图像像素低、背景复杂和特征难提取等问题,提出改进的YOLOv5小目标检测模型.首先,为扩大感受野,增强模型多尺度特征提取能力,基于CSP(Cross Stage Partial)思想,在YOLOv5s模型的SPPF模块中,引入相似性注意力(Similarity-based Attention Mechanism,SimAM)和大型可分离核注意力(Large Separable Kernel Attention,LSKA),组成大核注意力的金字塔池化方法(LK-SPPF);其次,为解决锚框质量和位置偏差的问题,使用能聚焦普通质量锚框的WIoU损失函数,在此基础上,增加归一化Wasserstein距离NWD(Normalized Wasserstein Distance)指标,即WIoU-NWD损失函数;最后,为进一步增强检测头表示能力,获取更有用的小目标特征,在检测头使用融入自注意力的大尺度特征图.本模型在VisDrone2019数据集上进行实验,结果显示,与YOLOv5s相比,该模型的F1-score、mAP@0.5和mAP@0.5:0.95分别提高了8.6%、9.9%和7.2%,表明该模型能准确地对小目标进行检测.