您的常用邮箱:*
您的手机号码:*
问题描述:
关键词: 户外导盲 目标检测 轻量化 通道剪枝 YOLOv8n
摘要: 针对户外导盲场景中道路目标检测存在的复杂背景干扰及关键语义信息需求,当前目标检测算法在道路目标检测中表现出较低的准确性以及容易出现漏检的问题,为此提出一种基于YOLOv8n的道路目标检测算法OD-YOLO。首先,基于FasterNet和SPPF构建主干网络;使用FasterNet以增强特征提取能力,在SPPF模块中引入可分离大核注意力机制(Large Separable Kernel Attention,LSKA)以提高算法对道路目标整体的感知能力。其次,提出一种新的C2f模块GAC2f,在减小模型计算量的同时提高其特征捕获能力,同时通过使用多样分支模块(Diverse branch block,DBB)中结构重参数化思想优化GAC2f,在不损失模型性能的前提下,融合多种特征信息以显著提高模型精度,另一方面使用卷积门控线性单元(Convolutional Gated Linear Unit,Convolutional GLU)改进LarK中的大核卷积以优化GAC2f,使模型能够捕获更多上下文信息。最后,提出一种轻量级非对称检测头PADH,在提高模型性能的同时减少参数量,并使用PIoUv2改进原有的损失函数,通过基于层自适应稀疏度的量级剪枝(Layer-adaptive Sparsity for the Magnitude-based Pruning,LAMP)操作进一步优化算法模型。实验结果表明,在公共人行道路目标数据集WOTR上,OD-YOLO与YOLOv8n相比,经过剪枝后模型参数量同为3M,但mAP@0.5、mAP@0.5:0.95分别提升3.4%和4.1%,证明算法OD-YOLO在面向户外导盲场景的道路目标检测中可以达到预期的效果。
关键词: X射线图像 风格迁移 目标检测 细粒度分类模块 基准数据集
摘要: 图像目标检测技术辅助提高了安检工作效率,进一步保障了公共安全。然而不同型号的安检机成像的差异性、X射线图像的复杂性、昂贵的数据标注成本,制约了X射线安检图像目标检测技术的深入研究。针对不同安检机厂商相同物质X射线成像颜色的差异,基于风格迁移算法进行数据集扩充,从而提高目标检测算法的泛化性;针对X射线图像中同类待识别物品尺寸的明显差异,提出一种细化的特征金字塔结构用来提取更加丰富的不同层次的语义信息;为了进一步提高检测精度,提出了一个易于集成的细粒度分类模块,该模块能很好地适配主流的目标检测模型。同时,构造了一个大规模的基准数据集,该数据集包含56659张X射线图像,37种违禁品,每张图像均进行高质量标注。据我们所知,这是迄今为止包含违禁品种类最多、图片数量最多的公开X射线图像数据集。基于该X射线违禁品数据集进行对比实验,提出的模型结构较基线模型mAP提高约8%。
关键词: 目标跟踪 感知化交并比 注意力机制 低通滤波器
摘要: 为提升跟踪任务中网络跟踪精度及运行速度,提出了一种改进的注意力机制跟踪算法(MFATrack)。针对复杂背景对网络跟踪目标产生的干扰,使用深度可分离卷积、ECA与低通滤波器相结合的动态跟踪模块(MFAM)提升网络目标判别性特征的发掘能力。并设计了基于MFAM跟踪头网络,减少深层网络信息损耗并提升其稳定性,提升网络的运行速度。损失函数中,将分类与回归损失相融合,分类损失融合了感知化交并比,回归中采用广义交并比损失,使得网络在训练中更加关注于被跟踪目标。实验结果表明,相比基础算法,在GOT-10k数据集上准确率上涨了4.1%,在数据集OTB中心误差值提升了1.9%,在UAV123的跟踪成功率上升了2.6%。
关键词: 目标检测 智能建造 建材计数 EasyDL
摘要: 随着建筑行业智能建造需求的推进,施工建材有了基于计算机视觉的智能管理新方式,但现有方法大多聚焦于圆形或方形等规则截面,相关思路和方法无法直接用于异形截面建材的智能计数任务。此外,大模型的迅猛发展,也为建材智能管控研究与应用提供了新的思路和方式。为此,文中通过建立专用模型和基于大模型二次开发两种方式,对比研究了异形截面建材智能计数问题。首先,实地拍摄并标注了大量的角钢与轮扣图片,结合图片增强构建了基础数据集。进而,通过对经典YOLOv8框架引入SE注意力机制、WIoU损失函数、动态蛇形卷积以及轻量化网络架构改进等措施,实现了对密集异形截面建材的高精度计数,在现场环境下本文模型对角钢与轮扣的检测平均精度分别能达到91.8%与99.4%,具有很好的实际应用效果。随后,采用相同的数据集在大模型平台EasyDL上进行了异形截面检测模型的二次开发。对比结果表明,目前基于大模型平台二次开发模型的检测精度、训练效率与展示效果清晰度均低于专用模型,但由于其开发技术门槛低、建模便捷且通用性强,在未来通用类计数任务的开发中仍一种非常有前景的方式。
关键词: 遥感图像 目标检测 特征金字塔网络 上下文信息 注意力机制
摘要: 针对遥感图像目标检测存在复杂背景干扰、目标多尺度差异等问题,提出一种融合岛式双向特征金字塔网络的遥感图像目标检测算法(IFD-YOLOv8s)。首先设计岛式双向特征金字塔网络,增强模型对目标尺度变化的适应性,减少多层次特征融合过程中信息丢失,有助于深层语义和细粒度信息的高效传播;然后提出特征上下文增量模块,对地物目标特征进行更全面的捕获,提高模型检测能力;最后设计双线池化注意力模块,抑制非目标噪声干扰,增强遥感目标特征可辨别性。在公共数据集RSOD和NWPU VHR-10上进行消融和对比实验,平均准确率均值分别为98.2%和91.4%,相较于基线算法YOLOv8s分别提升1.8%和2.1%。与主流目标检测算法相比,IFD-YOLOv8s对复杂背景目标和多尺度目标的检测更有效。在公共数据集DOTA上进行泛化实验,平均准确率均值为78.7%,相比原模型提高1.8%。
关键词: 目标跟踪 孪生跟踪网络 注意力机制 Transformer 双维度特征增强
摘要: 孪生跟踪网络是目标跟踪主流框架之一,其包括骨干网络、融合网络和定位网络三个模块。对于融合网络模块,Transformer网络又是较新且有效融合网络实现方法。Transformer的编码器和解码器中使用了自注意力机制对CNN特征进行增强。然而,对自注意力机制仔细分析可知,自注意力机制仅能从空间维度进行增强,未能考虑到从通道维度进行增强。为了使得Transformer的自注意力网络同时对特征的空间维度和通道维度进行双维度的增强,为目标定位网络提供准确的相关性信息,基于孪生跟踪框架提出了一种基于双维度特征增强的Transformer跟踪器,对Transformer融合网络进行改进。首先,采取骨干网络的第三和第四阶段特征作为输入,在Transformer编码器与解码器的自注意力模块,先通过CAE-Net网络进行通道维度的特征增强,用于增强通道上的重要性。然后通过SAE-Net网络,实现两阶段特征的加权融合与线性变换,获取自注意力因子Q、K和V,最后通过自注意力运算实现空间维度特征增强。这样Transformer融合网络不仅能够对特征空间维度进行增强,还能够对通道维度进行增强。本文方法在主流的五个公开基准数据集上的实验结果表明,改进后的Transformer特征融合模块可以用极小的速度代价促进跟踪器的跟踪性能。
关键词: 航空遥感图像 小目标 YOLOv7 空洞卷积 多尺度卷积
摘要: 航空遥感成像具有广泛的军事和民用应用。航空遥感图像中的微小目标检测是遥感图像领域的一个具有挑战性的问题。通用的目标检测方法对小目标不敏感,对于背景复杂、目标特征信息量少的航空遥感图像检测精度较低。为解决上述问题,本文首次提出了一种用于航空遥感图像的小目标检测网络ARST-YOLOv7。首先,针对遥感图像背景复杂,且目标特征较弱,提出一种新的特征增强模块DSPPCFF(dilated spatial pyramid pooling convolution feature fusion),增强模型的特征表达能力。其次,提出一种新的特征金字塔结构(DC-FPN),来解决级联特征图之间的语义差异问题。此外,为了让网络保留更多的空间信息,提出了DCA(dilated convolution attention)模块,增强网络对重要目标的关注,从而提高检测的鲁棒性。在NWPU VHR-10数据集、RSOD数据集和HRRSD数据集上与当前先进的检测方法比较结果表明,本文方法对于航空遥感小目标检测更有效。
关键词: 目标检测 无人机图像 YOLOv8 特征增强 细粒度特征
摘要: 针对无人机视角图像中目标尺度变化大、小尺寸目标占比高并且背景噪声干扰严重等问题,提出一种基于特征信息增强与补充的无人机视角图像目标检测算法。首先,为利用高层语义信息捕捉更加丰富的多尺度信息,提出一种多元融合空间金字塔池化(MFSPPF)方法。其次,设计了多分支语义增强(MBSE)模块,可以通过多个分支提取丰富的多尺度特征并构建多尺度特征之间的联系,从而在特征融合传递信息时防止重要特征信息丢失。另外提出细节特征补充(DFC)模块,将低层特征信息提取细化后得到丰富细粒度特征信息,经过特征融合传递实现对高层特征中细节信息的补充。最后通过在VisDrone2021数据集上进行实验,改进后算法相较于基线方法YOLOv8m,AP、AP50、AP75、APs、APm、APl分别提高3.7%、5.4%、3.9%、3.1%、4.0%、7.9%。并且改进方法在YOLOv8其他模型中同样适用。与其他方法相比,所提出方法在不同IOU阈值标准下和不同尺寸目标检测下都具有优异的检测效果,同时保持较快的检测速度,能够适用于无人机视角图像检测任务。
关键词: 绝缘子缺陷检测 无人机航拍图像 深度学习 计算机视觉
摘要: 依托计算机视觉和深度学习技术,从海量的无人机航拍图像中实现绝缘子缺陷检测,已经成为电力运维工作亟待解决的问题。近年来,深度学习方法在绝缘子缺陷检测任务中表现出了优异的性能。该文综述了无人机航拍图像中绝缘子缺陷检测的深度学习方法研究进展。首先,简述了基于深度学习的输电线路巡检研究现状;其次,阐述了基于深度学习的绝缘子缺陷检测方法,主要从目标检测模型、轻量化网络模型、级联检测模型以及其他方法进行归纳总结,按照深度学习算法的发展历程,阐明了基于双阶段、单阶段、Anchor-free的目标检测算法,概述了轻量化网络、级联检测在绝缘子缺陷检测中的应用;然后,介绍了用于绝缘子缺陷检测的公开和自建数据集;最后,指出了深度学习技术在绝缘子缺陷检测应用中存在的问题,并对未来研究工作进行了展望。
关键词: 煤矿智能化 目标检测 深度学习 数字孪生 具身智能
摘要: 随着深度学习理论的研究与发展,基于深度学习的目标检测技术在智能化矿山领域取得了显著进展,目标检测已成为人工智能技术在煤矿应用场景的典型范式和研究热点。然而深度学习目标检测对标注数据集依赖性强,存在模型可解释性差、计算复杂等问题,如何提高矿井目标检测精度、模型自适应性和计算效率,是矿山人工智能领域亟待解决的研究课题。本文对煤矿井下智能目标检测技术及其研究进展进行综述。首先,简要概述了目标检测技术,介绍了基于深度学习的目标检测技术演进过程和算法分类,并分析比较了基于CNN和Transformer的目标检测网络。然后,重点研究了矿井智能目标检测的数据增强、超分辨率重建、特征提取等关键技术,并围绕煤矿“人-机-环”应用需求,详细阐述了基于深度学习的目标检测在井下人员安全监测、矿井设备智能检测、工况环境感知等方面的研究进展。最后,指出了煤矿应用场景下智能目标检测技术在数据集构建、模型优化、多源异构数据融合等方面仍存在挑战,讨论了煤矿智能目标检测技术的发展趋势。并提出未来应致力于将目标检测技术与小样本学习和多模态融合、模型轻量化和边缘计算、数字孪生和具身智能等新兴技术相结合,以此促进智能检测技术与煤矿安全生产的深度融合与应用,为矿井智能目标检测技术体系构建提供理论参考。