您的常用邮箱:*
您的手机号码:*
问题描述:
关键词: 汽车驾驶
ISBN: (纸本)9787122452153
摘要: 本书主要内容包括面向自动驾驶目标检测技术概述、类脑目标检测技术国内外研究状况分析、面向自动驾驶的目标检测模型训练与测试数据集的构建等。 本书的主要创新点是从生物体关键的高效感知机理出发,仿视觉感知皮层设计了一种高抗扰性、高精度的轻量化目标检测模型。同时,引入视觉注意机制,降低模型输入中的干扰信息和冗余信息,聚焦主体目标。
关键词: 卷积神经网络(CNN) 视觉Transformer 混合模型 图像处理 深度学习
摘要: 卷积神经网络(CNN)与视觉Transformer是目前图像处理领域中两大重要的深度学习模型,两者经过多年来不断的研究与进步,已在该领域取得了非凡的成就。近些年来,CNN与视觉Transformer的混合模型正在逐步兴起,广泛的研究不断克服两种模型存在的弱项,高效地发挥出各自的亮点,在图像处理任务中表现出优异的效果。基于CNN与视觉Transformer混合模型进行深入阐述。总体概述了CNN与Vision Transformer模型的架构和优缺点,并总结混合模型的概念及优势。围绕串行结构融合方式、并行结构融合方式、层级交叉结构融合方式以及其他融合方式等四个方面全面回顾梳理了混合模型的研究现状和实际进展,并针对各种融合方式的主要代表模型进行总结与剖析,从多方面对典型混合模型进行评价对比。多角度叙述了混合模型在图像识别、图像分类、目标检测和图像分割等实际图像处理特定领域中应用研究,展现出混合模型在具体实践中的适用性和高效性。深入分析混合模型未来研究方向,并为后续该模型在图像处理中的研究与应用提出展望。
关键词: 深度学习 目标检测 头盔检测 卷积神经网络
摘要: 随着电动车数量的增加,与电动车有关的交通事故也越来越多.由于头部伤害导致的死亡是电动车使用者的首要死因,所以佩戴安全头盔能有效保障其人身安全.针对当前国内外关于电动车骑行者头盔识别方面的研究文献较少,因此以深度学习为基础,在分析其优势和不足的基础上归纳和总结了近几年来在电动车骑行者头盔检测方面的研究成果,并对其存在的问题进行了分析和展望.
关键词: 动静结合 候选框互学习 正样本对齐 工序检测识别 目标检测
摘要: 近年来,国内工业智能化浪潮势不可挡,预制梁场的工序检测识别自动化也应紧随其后。针对预制梁场位置偏远、场景复杂、光线不足以致于数据采集困难、背景干扰、画质受损等问题,提出了一种基于动静结合互学习的预制梁工序检测方法。在单阶段目标检测模型上建立互学习框架,分别使用数据扩增技术在空间和时间上对样本干扰的能力,构造动静结合的双分支子网络,向网络中引入基于归一化的注意力通道子模块动态地调整通道权重,以适应真实场景下的环境光照复杂性和噪声干扰随机性。为充分发挥两支子网络各自的优势,利用目标检测模型一个真实值的预测边界框不唯一的特性,提出了正样本对齐策略,实现了边界框数量及表征分布的双重对齐。构建了一个基于真实场景的预制梁工序数据集,在自制数据集上验证了所提方法的有效性,精确率和均值平均精度达到了97.2%和97.7%,推理速度达到了78,在满足工业落地应用需求的同时,为预制梁工序检测识别问题提供了一种有效且可靠的解决方案。
关键词: 无人机 航拍图像 小目标检测 注意力机制 损失函数
摘要: 针对无人机航拍视角下目标尺寸小且密集、检测场景复杂、目标被遮挡导致检测精度不高的问题,提出了一种基于SSD的目标检测算法。首先,用SE-ResNet50网络代替VGG16作为主干网络,通过学习自适应的通道权重,使模型更加关注有用的通道信息。而后修改了浅层网络的锚框参数,提高小目标的检测性能。在浅层网络中使用SE+SAM和CBAM两种组合,从通道和空间两个维度对图像进行关注。最后,使用EIoU代替传统IoU来计算交并比,选择FocalL1损失函数,整合EIoU和FocalL1损失函数,得到最终的Focal-EIoU。实验采用VisDrone2019数据集进行验证,相较传统SSD算法,精确率、召回率、mAP、帧率分别提升了11.7%,11.2%,9.8%,5,验证了该算法对目标检测的有效性。
关键词: SLAM 目标检测 动态特征点剔除 定位建图精度
摘要: 针对SLAM系统在动态场景中因物体快速移动导致特征匹配性能降低的问题,本文在ORB-SLAM2框架上提出基于改进YOLOv8s的动态视觉SLAM算法.使用轻量级网络Fasternet替换YOLOv8s主干网络,使用RT-DETR中的Transformer Decoder Head改进检测头.结合几何与语义信息实现动态特征点的高效剔除.在TUM数据集上的实验表明,本算法在动态场景下的定位与建图精度比ORB-SLAM2提高约96.06%,并且具有良好的实时性.
关键词: 分布式光纤传感技术 布里渊散射 信噪比 信号处理 图像处理 机器学习
摘要: 分布式布里渊光纤传感技术在基础设施、轨道交通、海底光缆等领域的工程监测中逐步应用。布里渊解调系统光电信号的衰减与噪声影响导致长距离传感信噪比下降,限制了测量精度。研究者通过光脉冲编码、拉曼放大等方法提升信噪比,取得较好的效果,也增加了系统复杂度和设备成本。通过后端信号处理的方式提升系统性能,可降低硬件成本且易于迭代升级。本文回顾了近十年国内外布里渊光纤传感系统使用信号处理方式提高信噪比的方法,包括一维信号降噪、图像视频降噪和深度学习降噪技术,对这些技术进行了讨论分析,并对每种技术对系统性能的提升效果进行了对比,最后对分布式布里渊光纤传感技术信噪比提升技术发展前景进行了展望。
关键词: 路侧目标检测 多尺度序列 特征融合 轻量级 YOLOv8
摘要: 针对城市交通场景下的路侧目标检测任务中,小目标和受遮挡目标的检测精度低和模型参数量大的问题,提出基于多尺度序列融合的轻量级路侧目标检测算法MQ-YOLO。设计多分支特征提取D-C2f模块,提高算法特征表达能力的同时保持检测速度。构造多尺度序列融合PSF模块对特征融合层进行重构,增强多尺度序列的特征图的信息的融合,提高对小目标的特征提取能力。引入多重注意力机制的检测头,加强对遮挡目标的显著语义信息的关注。引入基于归一化Wasserstein距离的损失函数,增强模型的检测性能。在DAIR-V2XI路侧数据集上实验表明,MQ-YOLO与基准YOLOv8n相比,mAP50提高3.9%,mAP50-95提高6%,参数量为3.96M。在DAIR-V2X-SPD-I数据集上实验表明,具有良好的泛化性。在路侧端部署时,检测速度可以达到62.5帧/s,满足城市交通场景下的路侧目标检测和边缘部署需求。
关键词: 3D打印混凝土 目标检测 ShuffleNetv2 自注意力机制 多尺度特征融合
摘要: 目前3D打印混凝土领域仍存在诸多问题制约其大规模工业化生产与应用,而孔隙为最常见缺陷,故极需发展相关检测技术以提高打印质量。针对现有的3D打印混凝土孔隙检测方法主要依赖人的主观实际经验,且存在耗时长、耗费高和资源耗费量大的问题,引入目标检测算法提出一种轻量级的3D打印混凝土界面孔隙智能化检测方法。首先利用传统图像处理方法对3D打印混凝土界面孔隙数据进行预处理,并构建适用于目标检测算法的3D打印混凝土界面孔隙数据集,针对3D打印混凝土界面孔隙数据集特点对自适应锚框聚类算法进行优化,获取更适合界面孔隙目标的锚框,使检测准确度得到一定提升;其次在主干网络中利用ShuffleNetv2网络进行多尺度特征提取,轻量级网络具有更易于部署在3D打印混凝土机器上的优点,并去掉部分网络以降低网络深度,减少计算参数量,提高目标检测效率;最后在特征提取网络中融合极化自注意力机制模块,在保持高分辨率的同时增强对孔隙目标的关注度,提高检测方法精度。实验结果表明,3D打印混凝土界面孔隙检测方法具有较好性能,通过与多种检测算法相比,该方法的多个评价指标均有所提升,能够完成3D打印混凝土环境下界面孔隙的智能化检测,解决3D打印混凝土孔隙检测方法过于依赖人力、耗时长和花费高的问题。
关键词: 接触网 异物检测 目标检测 YOLO 损失函数 注意力机制
摘要: 接触网是为列车行驶提供电力的输电线路,附着在接触网的塑料袋等异物会对列车运行造成安全隐患。针对目前人工检查效率低下、劳动成本高等问题,提出一种基于YOLOv7改进的接触网异物检测YOLO-CDBW模型。首先,在特征提取阶段构建一种使用残差瓶颈结构和深度分离卷积层的特征提取模块,避免因网络深度增加造成的小目标特征丢失问题,并降低网络运算量;其次,颈部改用BiFPN结构,捕捉多尺度信息,改善细节特征丢失问题。同时嵌入BiFormer注意力机制,重新分配融合后特征图的权重,提高网络对异物的关注度;最后,使用WIoU损失函数优化模型,通过动态聚焦机制,将注意力聚集在普通质量锚框上,提高预测精准度。经实验,YOLO-CDBW模型平均精度均值mAP0.5达到87.1%,检测速度FPS达到66.5f/s,较YOLOv7模型分别提高5.0%和10.8%,满足接触网异物检测需求。