关键词:
深度学习
YOLOv8
损失函数
注意力机制
网络结构改进
VOC数据集
检测速度
精确率
摘要:
为解决目前你只看一次版本8(you only look once version 8,YOLOv8)算法的改进方法数量多、种类繁杂,缺少在同一数据集基准下目标检测效果对比的问题,基于视觉对象类别(visual object classes,VOC)(2007+2012)公开数据集,选取参数量较小的YOLOv8纳米型(YOLOv8 nano,YOLOv8n)算法作为基准模型,从注意力机制、主干网络、颈部网络、探测头以及损失函数5个方面进行改进,通过平均精确率均值(mean average precision,mAP)和检测速度筛选出最佳单一改进模块。进一步通过组合实验,得出mAP值最高、检测速度最快的2个组合模型。结果表明,相较于基准模型,效果最好的主干网络、颈部网络、探测头模块的mAP值分别提升了2.50%(Repvit)、1.75%(CGDown)、1.75%(DyHead),检测速度分别提升了12.85%(RGCSPELAN)、2.60%(WaveletPool)、20.22%(LSCD),效果最好的注意力机制模块的mAP值提升了1.88%(CAFM),而损失函数对mAP值和检测速度均无明显提升。相较于基准模型,mAP值最高的组合模型的mAP值提高了3.13%(YOLOv8n+CAFM+CGDown+DyHead),检测速度最快的组合模型的检测速度提高了31.11%(YOLOv8n+RGCSPELAN+LSCD);前者适用于高精确率目标检测场景,后者适合部署在对实时性要求较高的边缘计算设备中。该研究能为YOLOv8算法的改进提供参考。