摘要:
开放世界目标检测(Open World Object Detection, OWOD)的主要任务是检测已知类别和识别未知目标。此外,模型在下一个训练阶段中逐步学习已知新类。针对OW-DETR(Open-World Detection Transformer)中未知类召回率偏低、密集目标与小目标漏检等问题,提出了一种UBA-OWDT(UCSO,BiStrip and AFDF of Open-World Detection Transformer)开放世界目标检测网络。针对未知类召回率偏低的问题,对未知类评分优化(Unknown Class Scoring Optimization,UCSO),将生成的浅层类激活图与聚合类激活图融合,获取细粒度特征信息,提高未知类的目标评分,进而提升未知类的召回率;针对小目标漏检问题,将双条状注意力(Spatial attention based on Strip pooling and Strip convolution,BiStrip)应用于输入特征图,捕获长程依赖,保留目标精确的位置信息,增强感兴趣目标的表征,以检测小目标;针对密集目标漏检问题,采用自适应特征动态融合(Adaptive Feature Dynamic Fusion,AFDF),根据目标大小和形状,获得不同的感受野,动态分配注意力权重,关注目标的重要部分,融合不同层级的特征,以检测密集目标。在OWOD数据集的实验结果表明,未知类召回率增值范围在0.7%-1.5%, mAP增值范围在0.6%-1.2%,与现有的开放世界目标检测方法相比, 在召回率偏低、密集目标与小目标漏检问题上具有一定的优势。