摘要:
针对交通路口图像复杂,小目标难测且目标之间易遮挡,天气和光照变化又引发颜色失真、噪声多和模糊等问题,提出一种基于YOLOv9(You Only Look Once v9)的交通路口图像的多目标检测算法ITD-YOLOv9。首先,设计CoT-CAFRNet(Chain-of-Thought Prompted Content-Aware Feature Reassembly Network)图像增强网络,提升图像质量,优化输入特征。其次,加入通道自适应特征融合(iCAFF)模块,增强小目标及重叠遮挡目标的提取能力。然后,提出特征融合金字塔结构BiHSFPN(Bi-directional High-level Screening Feature Pyramid Network),增强多尺度特征融合能力。最后,设计IF-MPDIoU(Inner-Focaler-Minimum Point Distance based Intersection over Union)损失函数,通过调整变量因子,聚焦关键样本,增强泛化能力。实验结果表明:在自制数据集和SODA10M数据集上,ITD-YOLOv9的检测精度分别为83.8%和56.3%,检测速度分别为64.8frame/s和57.4frame/s。与YOLOv9算法相比,检测精度分别提升3.9和2.7个百分点,有效实现交通路口下的多目标检测。