摘要:
多波段图像目标检测识别是重要的多模态基础任务之一,旨在通过不同传感器的成像特性补充完善目标特征来提高目标感知效果,对提升交通、医疗、军事等领域智能化程度具有重要的现实意义。针对目标检测识别中广泛存在的因光照、遮挡、复杂背景导致的检测识别效果不佳的问题,提出一种动态自适应聚合的可见光红外图像目标检测识别方法,通过设计通道注意力混合和二次动态权重连接的动态聚合结构以及语义空间信息交互的多路径扩展Neck结构,充分挖掘多波段图像的互补性,来提升困难场景下多波段图像目标融合检测的平均准确率。经公开数据集测试,相较于不采用动态聚合结构和多路径扩展Neck结构的对比模型,本方法的平均准确率(mean average precision, mAP)提高4个百分点以上。
摘要:
针对交通路口图像复杂,小目标难测且目标之间易遮挡,天气和光照变化又引发颜色失真、噪声多和模糊等问题,提出一种基于YOLOv9(You Only Look Once v9)的交通路口图像的多目标检测算法ITD-YOLOv9。首先,设计CoT-CAFRNet(Chain-of-Thought Prompted Content-Aware Feature Reassembly Network)图像增强网络,提升图像质量,优化输入特征。其次,加入通道自适应特征融合(iCAFF)模块,增强小目标及重叠遮挡目标的提取能力。然后,提出特征融合金字塔结构BiHSFPN(Bi-directional High-level Screening Feature Pyramid Network),增强多尺度特征融合能力。最后,设计IF-MPDIoU(Inner-Focaler-Minimum Point Distance based Intersection over Union)损失函数,通过调整变量因子,聚焦关键样本,增强泛化能力。实验结果表明:在自制数据集和SODA10M数据集上,ITD-YOLOv9的检测精度分别为83.8%和56.3%,检测速度分别为64.8frame/s和57.4frame/s。与YOLOv9算法相比,检测精度分别提升3.9和2.7个百分点,有效实现交通路口下的多目标检测。