您的常用邮箱:*
您的手机号码:*
问题描述:
关键词: 感受野 多尺度特征 无人机 小目标 YOLOv10
摘要: 针对无人机小目标检测任务中复杂背景干扰和多尺度目标的挑战,本文提出了一种基于DBBYOLOv10s的网络模型。该模型使用YOLOv10s作为基线系统,在结构中引入膨胀卷积(DC2f)以拓展感受野、双向特征金字塔(BiFPN)实现多尺度特征融合,以及BAM注意力机制增强模型对目标区域的聚焦能力。通过在VisDrone2021数据集上的实验验证,本算法在平均检测精度(m AP41.8%)和推理速度(148 FPS)方面展现了卓越的性能,同时将模型参数量控制在6.59 M,具备了较强的实用性。与现有YOLO模型及其改进版本相比,本文模型不仅在复杂场景下保持了较高的检测准确性,还在实时性和计算效率之间取得了平衡,适用于嵌入式系统及无人机实时监控任务。研究结果表明,该算法在复杂场景中的检测能力和泛化性均有显著提升。
关键词: YOLOX ByteTrack 注意力机制 小目标检测层 多目标跟踪 行人检测
摘要: 针对行人多目标检测跟踪中易出现遮挡和小目标检测失效的问题,提出一种基于YOLOX的改进行人多目标跟踪算法。在YOLOX中增加小目标检测层(Small Target Detection Layer, STDL)以增强小目标特征,使用新的损失函数,提升目标定位精度。为了强化通道间差异,引入坐标注意力机制(Coordinate Attention, CA),综合提升YOLOX的目标检测精度,并对检测目标采用动态匹配阈值数据关联方法提升跟踪性能。为了验证所提算法的性能,将其与Sort算法、DeepSort算法及ByteTrack算法进行对比,实验结果表明,在MOT17数据集下,跟踪准确度(Multiple Object Tracking Accuracy, MOTA)提升了1.6%,跟踪稳定性(Identification F1, IDF1)提升了2.4%,身份切换(ID Switches, IDs)降低了22%。所提算法可以有效地应对遮挡和小目标失效问题,能够提升检测跟踪稳定性和准确性。
关键词: 电力安全工器具 YOLOv5 目标检测 实时检测 电力安全
摘要: 在变电站内进行施工和日常的安全巡检过程中,工作人员的安全问题非常重要。现场使用的安全工器具是否准备齐全,直接关系到人员的生命安全。本文使用计算机视觉进行识别的方案,提出一种基于YOLOv5的改进安全工器具的神经网络识别方法,用于电力现场的安全工器具检测,首先在原版YOLOv5中加入坐标注意力模块,提升对小目标特征提取的能力;其次用加权双向特征金字塔网络结构替换原有特征金字塔网络结构,进一步提升特征提取的能力。实验结果表明:改进的算法改善了原版网络对小目标容易漏检、误检的问题,且保持了对中大型目标的较高识别精度,具有较强的实用性,也能满足实时检测的要求,对现场实际施工和运维起到了安全保障作用。经实验对比,该方法对于安全工器具的实时检测有着良好的实际效果。
关键词: 交通管理 状态监测 卷积神经网络 目标检测 多尺度
摘要: 针对现有高速公路运行监测时无法实现广域检测且小目标检测性能较低的问题,提出了一种基于遥感技术的高速公路交通运行状态监测模型。设计一种改进的CNN网络,以多尺度特征图和多尺度上下文信息增强小目标检测性能。仿真结果表明,与Faster-RCNN和YOLOX相比较,所提模型具备多尺度融合特征以及多尺度上下文信息,可充分学习小目标特征,ACC和PRE指标分别为93.57%和89.44%。
关键词: 深度修复 多任务学习 图像处理 深度图像 图像识别
摘要: 深度图像修复旨在从稀疏深度图像中恢复出稠密的深度图像,然而目前许多深度修复算法所修复出的深度图像往往存在细节结构缺失、深度不连续和边界模糊等问题。针对这些问题,文章提出了一个基于边界预测辅助的稀疏深度修复方法:以深度图像修复为主任务、边界预测为辅助任务,通过建立交叉引导模块实现主任务与辅助任务间的信息交互,通过辅助任务的学习为修复主任务提供有效的边界约束,同时由网络的中间特征提取模块进行多感受野特征的提取和学习,以更好地获取上下文信息。利用室内数据集NYUv2和户外数据集KITTI进行一系列实验,其结果表明,所方法是有效的,并在定性与定量比较方面优于一些主流的深度修复方法。
关键词: 机器视觉 拉伸性能 图像处理 动态形变 特征提取
摘要: 为丰富织物拉伸力学评价指标,从机器视觉角度出发,可视化动态表征织物拉伸形变差异,论证织物非接触式测量方法的可行性。依据拉伸速度,等效抽取视频帧,自动分割织物所在区域,提取出轮廓,构建形态学特征;分析不同处理方式对织物拉伸动态形变特征的影响。结果表明:由伸长量、泊松比所构建的应力-应变曲线与拉伸测量应力-应变曲线趋势一致;伸长量对材料的区分度优于最窄处收缩量,且不同处理方式对织物的伸长量和最窄处收缩量影响差异显著。该结果论证了非接触式测量方法在织物特征分析中的可行性,为今后相关测试方法标准及设备的研制提供了参考。
关键词: 砂质黏土 干缩裂隙 生态纤维 图像处理
摘要: 砂质黏土保水性较弱,在蒸发作用下容易发生显著的干缩裂隙,加剧了其边坡的降水入渗,容易导致失稳。为了研究不同生态纤维对砂质黏土干缩裂隙的抑制作用,通过图像处理技术,分别对黄麻纤维、稻杆纤维改良作用下砂质黏土的水分蒸发、表面裂隙发展、演变和结构形态进行定量分析。研究结果表明:生态纤维与土颗粒有较强的黏结性,可通过延缓土体水分蒸发和加筋作用,有效抑制砂质黏土的干缩裂隙,且随着纤维掺量的增加,抑制干缩裂隙的效果增强;在0.6%(质量分数)的掺量下,黄麻纤维和稻杆纤维的改良效果最为显著,裂隙率分别下降了30.6%和23.8%,平均裂隙宽度分别下降了66.64%和70.86%。黄麻纤维、稻杆纤维的改良方法,为砂质黏土填筑工程的干缩裂隙治理提供了新思路和理论依据。
关键词: 深度学习 智能识别 全卷积神经网络 桥梁结构 裂缝检测 图像处理
摘要: 伴随我国经济的高速增长,公路与铁路网络的里程数不断攀升,桥梁作为交通路网的关键节点,亦实现了显著的发展与扩张。同时,由于桥梁结构会受到应变、温湿度等侵蚀和损毁,经常会造成桥梁结构产生裂缝病害。因此,基于上述的原因需要对桥梁结构的裂缝病害进行检测,以合理安排人员对桥梁进行维护和保养。本文构建了一个全卷积神经网络模型,利用裂缝图像数据集对其进行训练与验证,旨在实现高精度的裂缝识别,确保识别结果具备较高的准确性与召回率。利用该全卷积神经网络模型可对三种桥梁裂缝病害的形态进行识别,并且与其他裂缝识别方法相比,具有很大的检测优势。本文的理论分析和针对桥梁裂缝病害的识别检测技术对相关研究具有积极的指导意义和应用价值。
关键词: 图神经网络 视觉图神经网络 视觉骨干网络 图像分类 目标检测 实例分割
摘要: 近年来,视觉图神经网络在计算机视觉领域引起了研究人员的广泛关注,其中构图是视觉图神经网络的重要建模方式。目前流行的K近邻构图方法尺度单一、具有二次计算复杂度并且难以建模图像的局部和多尺度信息。为了解决该问题,提出一种尺度稀疏图建图方法——MSSG。该方法将K近邻建图沿通道分解为三个不同尺度的稀疏子图,具有线性的计算复杂度并实现了图像局部信息和多尺度信息的有效建模。为了增强模型的全局建模能力,提出一种全局和局部多尺度信息融合策略。基于以上创新,提出一种新颖的视觉骨干网络——MSViG。在ImageNet-1K数据集上进行的图像分类实验结果表明,所提出的视觉架构优于传统的视觉图神经网络。例如,与视觉神经网络ViG-T相比,所提MSViG-T的Top-1分类准确率提高了2.1个百分点,并且在目标检测和实例分割这种视觉下游任务上相比传统视觉图神经网络取得了较大的性能提升。
关键词: POMDP Tube-based-MPC 航路规划 强化学习 目标跟踪
摘要: 无人机在未知环境中自主飞行时,定位与感知层面存在着难以消除的不确定性因素。因此,开展航路规划方面的研究对不确定性因素的干扰下增强航路的有效性进而提升无人机的目标跟踪能力具有重要意义。当前,名义信念状态优化(NBO)为目标跟踪的不确定性提了供理论依据,基于管道的MPC(Tube-based-MPC)为规划和控制分离架构提供了支持,实现了将MPC应用到实时航路规划系统的目的。基于此,本文提出一种在线航路规划方法以解决未知环境下的目标跟踪,避障问题。首先,将航路规划问题抽象成一个部分可观测马尔科夫(POMDP)模型,并运用卡尔曼滤波对置信状态进行估计,将目标定位的不确定性度量融入到框架中。其次,基于简化的三维运动模型构造了基于管道的MPC(Tube-based-MPC)优化框架对POMDP进行求解,通过构建包含置信状态和未知障碍物的非线性优化问题,实现未来一定连续时间跨度的航路规划。然后,在优化问题中充分考虑无人机和障碍物形状,并引入全维度避障距离度量,显著拓展优化问题的可行域。最后,引入Q-Learning强化学习框架,以MPC作为策略函数逼近器,提升目标跟踪的闭环性能。仿真实验和硬件在环实验验证了所提框架的有效性。