您的常用邮箱:*
您的手机号码:*
问题描述:
关键词: 小目标检测 多尺度特征融合 自适应融合
摘要: 小目标检测在驾驶辅助、智慧医疗、无人机巡检等任务中具有重要的理论和实践意义。多尺度特征学习是设计小目标检测网络经常采用的策略之一。其中,经典的特征金字塔结构通过融合不同层级的特征图,实现多尺度信息的传递,从而在不同分辨率的特征图上都能捕捉到小目标的关键信息。然而,在进行不同尺度特征图融合时,语义信息冲突往往不可避免,进而造成梯度计算不一致,导致小目标信息被淹没。为此,提出了一种步进式自适应特征融合网络模块(Step-by-step Adaptively Feature Fusion Module, SAFF),将特征融合过程划分为三个阶段依次进行,通过步进式地融合相邻尺度特征图,解决特征图融合过程中的语义信息冲突问题。同时,在每个阶段中,通过自适应计算融合权重,缓解梯度计算不一致问题。在此基础上,将SAFF模块与通用目标检测网络结合,形成用于小目标检测的SAFF-RCNN和Cascade-SAFF-RCNN网络。实验结果表明,所提出的网络模型的小目标检测性能均有显著提升,达到或超越了其它主流的小目标检测模型,证明了SAFF模块用于小目标检测时的有效性。
关键词: 目标检测 三维坐标 手眼标定 机械臂 深度相机
摘要: 对YOLO模型进行算法改进,提出一种可以有效替换特征提取主体的模块C2fmk,并引入注意力机制等模块,得到具有泛化性的目标检测模型ECASC_YOLO。该模型有效降低了网络计算量和参数量,完成了模型检测精度的超越,并且保证了在边缘设备上对目标的实时检测。后续通过ZED2i深度相机获取目标视频流和点云信息,利用“眼在手上”的标定方式,结合机械臂末端姿态信息实现了无人机的自动有效抓取,为单轴无人机的回收抓取提供了一个可行的实现方法。实验表明,该检测算法可以为机械臂抓取提供实时精确的视觉引导,整个机械臂系统可以完成对无人机的有效自动抓取回收。
关键词: 关注目标检测 时空推理 注意力机制 卷积长短时记忆网络 多特征融合
摘要: 现有的个体关注目标检测主要是利用面部信息进行,难以应对因人脸部分遮挡、人脸模糊或隐私保护等情况导致面部精细信息缺失的场景,并且忽视时间信息也会一定程度上影响方法在视频任务中的效果。提出基于多特征融合的时空推理网络,利用卷积神经网络分别提取个体的头部外观与面部信息、个体姿态信息以及相关场景信息的关键特征,通过空间推理编码器的注意力机制和自定义的模型训练策略,学习不同特征的重要程度并降低对单个特征的过分依赖,实现空间特征加权融合。采用卷积长短时记忆网络整合视频帧序列中的时空信息,用于视频任务中的个体关注目标检测工作。实验结果表明,在GazeFollow数据集和VideoAttentionTarget数据集上反映方法整体性能的AUC值分别达到了0.936和0.902。与现有最好的研究方法相比,该方法在相同两个数据集上的AUC值分别提高了1.7和3.2个百分点,在个体关注目标检测任务中具有更好的准确性和鲁棒性,能用于更复杂的现实场景。
关键词: 焊缝缺陷 图像处理 边缘检测 Hough变换 OTSU算法
摘要: 焊缝缺陷检测是工业环节中极其重要的一环,焊接的质量直接影响着工程的质量,因此对于焊缝缺陷的检测相当重要。针对传统人工检测存在效率低、误判率高、细微缺陷检测准确率低以及工作强度大等明显的缺陷问题,本文提出了一种基于连通域分析的钢管焊缝缺陷检测方法。首先,利用X射线成像系统得到焊缝原始图像;然后,经过Canny边缘检测、Hough变换和筛选条件提取完整的焊缝区域;之后,通过OTSU算法、梯度法和连通域分析填充缺陷内部获取完整的焊缝缺陷;最后,计算缺陷位置的平均灰度并根据筛选条件选择真正的焊缝缺陷,自动检测并标记焊缝原始图像中的缺陷,有效地降低了焊缝缺陷检测的漏检率和误报率。实验测试了1000幅左右的焊缝原始图像,验证了本文所提出算法的正确性与有效性。本文算法识别率可达95.3%,漏报率为2.1%,误报率为2.6%。对比其他算法结果表明,本文所提出的算法对于缺陷类型不敏感,检测速度快且识别率高,具有较强的适应性和通用性。
关键词: 深度学习 图像分割 工笔画 提示增强 计算机视觉
摘要: 由于缺乏带有像素级标注的公开工笔画数据集,使得图像分割技术在工笔画领域的发展严重受阻。工笔画具有物象与背景颜色纹理相似、使用晕染渐变导致物象边界模糊等特性,给图像分割带来了挑战,SAM的出现为解决这些挑战带来新的可能性。尽管SAM在自然图像领域里展现出惊人分割能力和零样本泛化能力,但在处理工笔画图像时存在对物象不敏感、前景背景混淆等问题。针对上述问题,首先建立了一个包含403幅图像的花鸟主题工笔画数据集SegTCRP,其中包含5类前景对象。随后,采用LoRA方法对SAM进行微调,使其适应工笔画图像的特点。此外,提出了一种新的SAM边界框提示增强方法BPA-SAM,通过借助U-Net在边界框提示范围内基于一定策略辅助生成额外点提示来改善SAM前景背景混淆的问题。最终,实验验证了BPA-SAM较原始SAM在边界框提示条件下的分割性能提升了7.1%,为SAM在工笔画领域的图像分割应用奠定了基础。
关键词: 图像语义分割 深度学习 刀具磨损 图像处理 形态学滤波 定量评价
摘要: 刀具磨损状态的鲁棒评价对于保证加工效率提高产品供给质量具有重要的作用。针对于现有刀具磨损状态直接评价方法难以自适应进行磨损区域划分的问题,提出了一种结合图像语义分割与形态滤波的铣削刀具磨损状态智能评价方法。首先,通过引入压缩-激励结构,融合U-Net网络编码与解码过程中对应特征信息,提高模型的语义分割性能,实现小样本条件下刀具图像的像素级分割。为进一步改善网络输出效果,提出一种分段处理的优化策略,针对于不同磨损阶段的刀具图像采用不同的结构元进行形态学滤波处理。最终,通过统计形态学滤波后分割区域面积实现刀具磨损状态的定量评价。实验结果表明,较之经典U-Net结构,提出方法可提高识别准确率10%左右,论证了所提出方法的有效性。提出方法针对刀具图像逐像素进行磨损状态的自适应判断,可广泛适用于不同刀具类型的磨损状态评价过程。
关键词: 电气设备红外图像 目标检测 轻量级网络 通道注意 池化
摘要: 提出一种适合边缘计算设备的轻量级卷积神经网络(LightweightES)用于识别热像中的电气设备及其异常发热故障。为达到减少模型参数的同时提升检测精度的目标,对经典SSD进行改造,首先利用MobileNetV3轻量级网络作为特征提取骨干网络,快速高效地提取图像特征;然后引入高效通道注意模块ECA,提高网络的检测精度;最后采用软池化(SoftPool)方法以减少池化信息损失,提高网络的分类精度。建立并标注了10 516张电气设备红外图像数据集,含电流互感器、避雷器、绝缘子、隔离开关、断路器、套管等6种户外变电站设备。实验结果表明LightweightES算法mAP达93.8%,较SSD提高了7.5百分点,参数量仅为SSD的1/5,检测帧率达55fps,能够实时准确地识别电气设备及其局部温度异常故障,适用于算力有限的智能现场监测终端。
关键词: 目标检测 YOLOv5 位置感应 损失函数 注意力机制 钢材缺陷
摘要: 为了提高钢材缺陷检测精度,提出一种基于YOLOv5s的缺陷检测算法YOLOv5s-NFCE。首先,在骨干特征提取网络中加入新型NAMAttention注意力机制,提高对目标的感知和区分能力;并提出新型的C3-Faster,通过减小内存访问和冗余计算更有效地提取特征;在特征融合网络和输出端引入位置卷积CoordConvs,增强目标的语义感知能力和全局感知能力;最后,引入新的损失函数Focal-EIoU,以加快收敛速度,提高回归精度。实验结果表明,YOLOv5s-NFCE算法在钢材表面缺陷数据集上的均值平均精度达到了75.1%,比原始YOLOv5s提高了1.7%,检测速度则提升了1.2倍,证明了该算法在钢材缺陷检测中能够有效提升检测速度和检测精度。
关键词: 遥感图像 半监督学习 SAM 图像分割
摘要: 针对遥感图像中目标分辨率低、背景复杂且获取高质量旋转框标注费用高、耗时长等问题,本文提出了一种多尺度标签优化的半监督学习遥感目标检测方法。使用SoftTeacher模型能够充分利用大量未标注且多样化的数据,同时还能发现原始数据集中未标注的目标。借助SAM(Segment Anything Model)模型可实现基于深度学习的图像分割,并通过基于掩码的优化生成高质量的标签。该方法首先通过半监督学习生成伪标注,对伪标注中的标签特征框进行多尺度处理后输入SAM(Segment Anything Model)模型进行优化,使用优化后的标注扩充原数据集样本重新用于全监督训练。实验结果表明,所选用的半监督目标检测模型Soft Teacher能够展现出优于全监督目标检测模型的性能,经过优化后的数据集样本能够展现相比原本伪标注数据集更精确的效果。在使用扩充后的数据集进行全监督训练时,原先的平均精度均值(mean Average Precision,mAP)从51.4%提升到53.5%。此外,全监督训练阶段使用现有的常用目标检测器进行了对比实验,进一步验证了本文提出的方法可以有效提高遥感目标检测在标注不足情况下的准确性。
关键词: 目标检测 YOLOv8m 目标遮挡 注意力机制 误差放大效应
摘要: 对道路目标的准确检测是保证自动驾驶车辆安全行使的一项关键技术。针对图像中被遮挡目标和远距离目标所存在的特征模糊的问题,提出一种改进型YOLOv8m的道路目标检测算法。该文在YOLOv8m的基础上引入可变形卷积,提高模型捕获目标实际边界的能力。同时引入双层路由注意力机制,以稀疏感知的方式使模型聚焦于图像中的关键目标区域。此外构造小目标检测层提升模型对远距离小目标的检出能力,并针对误差放大效应对模型推理性能造成的影响,设计分阶段学习策略稳定模型训练过程。基于KITTI数据集和Waymo数据集的实验结果显示,所提出算法的mAP50相较于基准模型分别提高了4.6%和4.9%,有效提升了道路目标检测的精度。