关键词:
目标检测
卷积神经网络
多尺度目标检测
感受野
特征金字塔网络(FPN)
摘要:
针对多尺度目标检测中主干网络实际感受野远远小于理论感受野,感受野分布稀疏,以及特征金字塔网络(feature pyramid network,FPN)在横向连接过程中统一通道数会丢失通道信息等影响模型性能的问题,提出一种扩增实际感受野和多特征融合改进FPN的多尺度目标检测算法ResFPN。针对主干网络实际感受野远远小于理论感受野的问题,设计了多分支膨胀卷积(multi-branch dilated convolutional,MBD)模块和多分支池化(multi-branch pooling,MBP)模块,通过学习不同尺度空间特征融合,扩增感受野。针对感受野分布稀疏问题,提出轻量级通道交互融合(channel interactive fusion,CIF)模块,通过双分支结构并在每一分支叠加不同数量深度可分离卷积学习像素间的依赖关系增强特征表示。针对FPN通过1×1卷积统一通道数会丢失通道信息的问题,尝试利用SubPixel卷积提取C5层输出特征,保留原始丰富语义信息的同时引出额外双向路径对FPN通道信息进行补充,但这可能会产生冗余信息。因此,在额外双向路径后引入全局上下文(global context,GC)模块,利用GC瓶颈转换模块进一步融合特征信息,减少信息冗余。实验表明,提出的ResFPN有效解决了感受野分布稀疏问题,并将主干网络感受野增大为原来的一倍,同时提出的改进FPN通道丢失问题的方法也在多尺度目标检测中获得了良好的性能。与典型的网络Faster R-CNN相比,大、中、小物体检测平均精度在具有挑战性的MS COCO数据集上分别提高了2.2、1.6、2.0个百分点,与其他检测器相比检测效果也有提升。