您的常用邮箱:*
您的手机号码:*
问题描述:
关键词: 目标检测 无人机 MobileViT CCFM ECA
摘要: 针对无人机航拍中目标物体小、分布密集、互相遮挡等问题引发的误检和漏检现象,本文提出了MCEW-YOLO无人机目标检测算法。该算法首先使用MobileViT作为主干网络,通过融合CNN和ViT的优势,增强了网络对局部与全局信息结合能力;其次在Neck部分加入ECA通道注意力机制,捕捉长距离依赖关系,有效地融合了多尺度信息,同层借鉴了CCFM结构思想,加入四个卷积调整通道数并跨通道信息整合,促进多尺度特征融合;最后本文采用基于动态非单调聚焦机制的边界框损失函数(Wise-IoUv3),使用离群度对锚框质量进行评估,优化了边界框回归性能。实验结果表明:在VisDrone2019数据集上,MCEW-YOLO算法的mAP@50达到了39.1%,mAP@50:95达到了23.3%,同时模型的参数量为2.4M,相较于基线模型YOLOv8n精度分别提升了7.0%、4.0%,参数量降低了19.4%。综上所述,MCEW-YOLO算法能够有效应对无人机航拍下的目标检测挑战,满足性能要求。
关键词: 遥感图像 半监督学习 SAM 图像分割
摘要: 针对遥感图像中目标分辨率低、背景复杂且获取高质量旋转框标注费用高、耗时长等问题,本文提出了一种多尺度标签优化的半监督学习遥感目标检测方法。使用SoftTeacher模型能够充分利用大量未标注且多样化的数据,同时还能发现原始数据集中未标注的目标。借助SAM(Segment Anything Model)模型可实现基于深度学习的图像分割,并通过基于掩码的优化生成高质量的标签。该方法首先通过半监督学习生成伪标注,对伪标注中的标签特征框进行多尺度处理后输入SAM(Segment Anything Model)模型进行优化,使用优化后的标注扩充原数据集样本重新用于全监督训练。实验结果表明,所选用的半监督目标检测模型Soft Teacher能够展现出优于全监督目标检测模型的性能,经过优化后的数据集样本能够展现相比原本伪标注数据集更精确的效果。在使用扩充后的数据集进行全监督训练时,原先的平均精度均值(mean Average Precision,mAP)从51.4%提升到53.5%。此外,全监督训练阶段使用现有的常用目标检测器进行了对比实验,进一步验证了本文提出的方法可以有效提高遥感目标检测在标注不足情况下的准确性。
关键词: 目标检测 YOLOv5 位置感应 损失函数 注意力机制 钢材缺陷
摘要: 为了提高钢材缺陷检测精度,提出一种基于YOLOv5s的缺陷检测算法YOLOv5s-NFCE。首先,在骨干特征提取网络中加入新型NAMAttention注意力机制,提高对目标的感知和区分能力;并提出新型的C3-Faster,通过减小内存访问和冗余计算更有效地提取特征;在特征融合网络和输出端引入位置卷积CoordConvs,增强目标的语义感知能力和全局感知能力;最后,引入新的损失函数Focal-EIoU,以加快收敛速度,提高回归精度。实验结果表明,YOLOv5s-NFCE算法在钢材表面缺陷数据集上的均值平均精度达到了75.1%,比原始YOLOv5s提高了1.7%,检测速度则提升了1.2倍,证明了该算法在钢材缺陷检测中能够有效提升检测速度和检测精度。
关键词: 目标检测 YOLOv8m 目标遮挡 注意力机制 误差放大效应
摘要: 对道路目标的准确检测是保证自动驾驶车辆安全行使的一项关键技术。针对图像中被遮挡目标和远距离目标所存在的特征模糊的问题,提出一种改进型YOLOv8m的道路目标检测算法。该文在YOLOv8m的基础上引入可变形卷积,提高模型捕获目标实际边界的能力。同时引入双层路由注意力机制,以稀疏感知的方式使模型聚焦于图像中的关键目标区域。此外构造小目标检测层提升模型对远距离小目标的检出能力,并针对误差放大效应对模型推理性能造成的影响,设计分阶段学习策略稳定模型训练过程。基于KITTI数据集和Waymo数据集的实验结果显示,所提出算法的mAP50相较于基准模型分别提高了4.6%和4.9%,有效提升了道路目标检测的精度。
关键词: 行人检测 目标检测 深度卷积 迁移学习 自注意力机制
摘要: 密集行人检测是行人检测领域的一大研究热点。针对密集行人检测场景中被遮挡目标及小目标行人易产生漏检的问题,提出一种改进DETR的目标检测算法Pe-DETR。本算法采用基于多头自注意力机制的Dino-DETR作为基准模型,针对自注意力机制缺少捕获局部特征的能力导致密集行人检测效果较差的问题,对FFN进行多种改进与实验,提出DWSEFFN使模型可以提取到更多局部细节特征;针对ResNet-50骨干网络对重要特征提取效率较低的问题,采用Swin Transformer-L作为特征提取网络,提升骨干网络对重要特征的提取能力,同时使Pe-DETR完全基于注意力机制搭建,结构中不包含深度卷积结构;针对密集行人场景中目标数量多与DETR检测器中的稀疏匹配矛盾的问题,应用密集不同查询有效应对行人密集的场景,且不会引入无效的相似查询。在CrowdHuman密集行人检测数据集上进行实验,所提行人检测算法领先DINO算法3.7%的AP50准确率和4.5%的mAP准确率,实验结果表明在密集行人检测任务中改进后方法的准确率明显优于其他端到端模型。
关键词: YOLOv8n 小目标检测 无人机视角 注意力机制 可变形卷积
摘要: 随着低空经济的迅速发展,无人机在环境监测、农业植保、应急救援等多个领域展现出广阔的应用前景。然而,无人机航拍图像中的小目标检测问题一直是限制其广泛应用的技术瓶颈之一。针对无人机航拍图像视角广、目标小且背景复杂的特点,提出了一种改进的YOLOv8n目标检测算法,以提高无人机视角下小目标的检测精度。首先,为了更好地捕捉无人机视角下不同视距下的目标的形状特征,引入了可变形卷积核。其次,增加了P2小目标检测头,并在Neck部分的C2f模块中引入了空间通道注意力机制,提升模型对不同区域目标的区分能力。最后,提出了自适应边界损失函数,使其在处理小目标时生成更优的边界框。实验结果表明,在MDMT(Multi-Drone Multi-Target)数据集上,该算法在小目标检测精度上显著优于基线模型原生YOLOv8n、YOLOv5和Faster-RCNN等模型,mAP50达到了61.0%,分别提升了13.7%、14%、50.8%。
关键词: 目标检测 无人机 注意力机制 光伏板巡检
摘要: 随着太阳能光伏板的广泛应用,光伏板的隐患及故障缺陷检测变得越发重要。为了提高光伏板的巡检效率和缺陷检测的准确性,设计了一种基于注意力机制目标检测算法并结合无人机技术提出了一套完整的光伏板巡检方案。该方法利用无人机搭载的高分辨率相机进行图像采集,并通过注意力机制的目标检测和无人机技术相结合的方式进行光伏板缺陷的检测和识别。实验结果表明,所提方法在光伏板巡检方面具有较高的准确性和可靠性,平均精度均值(mAP)达到 83.2%,F1得分为84.5%,有效提升了光伏板巡检的质量和效果,具有很高的实用价值。
关键词: 特征蒸馏 模型轻量化 卷积神经网络 计算机视觉 深度学习 掩膜策略 自适应特征连接
摘要: 针对现有特征蒸馏方法中存在教师-学生之间特征连接依靠人工设计,且难以确定特征之间的蒸馏强度导致学生模型学习无用信息的问题,文中提出了一种随机掩膜和自适应特征知识蒸馏(Random Mask and Adaptive Feature Distillation, MAFD)算法。该算法通过引入自注意力机制来自适应地确定教师-学生候选特征层之间的蒸馏强度。在学生特征生成阶段,引入随机像素掩膜策略使教师模型指导学生特征生成,以提高剩余像素的代表性,从而增强学生网络的表征能力。实验结果表明,该知识蒸馏网络在CIFAR100和ImageNet数据集上使学生模型相对基线性能提升2.0%~6.2%,在任务CUB-200、indoor、Actions和Dogs上相对于基线分别提高27.27%、14.75%、25.55%和12.55%。验证了对RetinaNet模型在COCO-2017数据集上的性能提升,说明MAFD能够更好地减少教师模型和学生模型之间的知识转移损失,并取得了竞争性的结果。
关键词: 半监督 作物 图像处理 目标检测 图像分割 图像分类
摘要: 半监督学习通过结合少量标注数据和大量未标注数据,显著减少数据标注需求和成本,同时提高模型的泛化能力和性能,为深度学习和机器学习在资源受限环境中的发展提供了新的路线。随着半监督学习在图像处理领域取得突破性进展,本综述以现代农业为调查对象,探讨半监督学习方法在农业生产中的作用。首先,根据半监督基础定义和假设提出半监督概念模型,同时按照利用监督信号的差异将半监督学习分为伪标签和无监督正则化。其次,从目标检测、图像分割、图像分类和多任务联合学习出发,对农业作物管理、杂草管理、水果检测、植物健康、植物表型和叶片分类等具体任务进行全面回顾。最后,分析并讨论了半监督学习在农业图像处理领域的未来研究方向。
关键词: 事件相机 目标检测 多模态特征融合 注意力机制
摘要: 将事件数据和帧数据多模态融合的方法在交通领域目标检测中的应用日益广泛。然而,目前大多方法使用的帧数据主要来源于事件相机直接输出的灰度图像,这限制了其在识别交通信号灯等复杂环境中区分目标的能力。对此,提出了一种新颖的多模态目标检测方法,该方法结合了RGB帧和事件帧,包含一个特征融合模块AddWithBAM,结合了通道注意力和空间注意力机制,并在C3模块中引入了第四代可变形卷积网络(Deformable Convolutional Networks, DCNv4),以增强对复杂几何形状和大尺度变化的感知,同时利用可变形卷积实现轻量化设计。基于公共数据集PKU-DDD17-CAR和MVSEC的实验结果显示,平均精度mAP分别达到了94.5%和96.7%。由于缺乏包含RGB帧和事件帧的公共交通数据集,构建了一个新的交通数据集,在该数据集上进行的消融实验显示,mAP提升了6.2%,模型参数减少了9.1%。在实际场景的检测实验中,平均推理时间为13.7ms。所提的多模态双流网络架构有效提升了在复杂交通环境中的目标检测性能。