关键词:
深度学习
目标检测
遥感图像
多尺度特征融合
摘要:
针对遥感图像背景复杂、特征冲突以及目标尺度多变等问题,以YOLOv8s为基线模型,提出一种基于多尺度特征融合的遥感图像目标检测方法。将RepVGG网络作为模型的特征提取网络,提高模型的特征提取能力,有效实现全局语义信息的捕获;在颈部网络提出了一种三极综合性融合模块(tripolar integrative fusion,TIF),通过位置信息和语义信息的有效融合,提高对各个尺度目标的检测精度;将SlideLoss滑动损失函数作为模型的分类损失函数,增强模型对困难目标的检测能力,从而提高目标检测的准确性。实验结果表明,改进后的模型在NWPU VHR-10、RSOD和UCAS-AOD数据集上分别取得了94.4%、93.0%和95.5%的检测精度,相较基线模型分别提升了5.1、6.0、4.4个百分点,在准确性方面优于其他方法,能更好地完成遥感图像目标检测任务。