您的常用邮箱:*
您的手机号码:*
问题描述:
关键词: 藏药材植物 深度学习 目标检测 轻量化算法 YOLOv8
摘要: 由于藏药生长环境恶劣,人工识别藏药材植物非常困难,提出了一种基于改进YOLOv8的轻量级检测算法LTP-YOLO检测户外环境中的藏药材植物。首先,利用MobileViT替换YOLOv8特征提取网络来减少算法参数量和计算量。其次,引入内容感知特征重组上采样算子CARAFE帮助算法在上采样时感知上下文信息。再次,提出多尺度融合注意力机制MFA建立局部跨通道交互提升算法检测精度。实验表明,所提算法将参数量从3.02 MB减少到1.28MB,计算量从8.2 GFLOPs减少到5.8 GFLOPs,在自建的藏药植物图像数据集上mAP@.5相较于YOLOv8更优,证明了该算法可满足移动设备的高精度、低计算部署需求,并在各种密集植物检测任务中显示出广阔的应用前景。
关键词: 目标检测 双模态 特征融合 梯度算子 注意力机制
摘要: 红外与可见光图像具有很好的互补特性,可以利用这两种模态图像的融合来适应自动驾驶等领域对于目标检测高精度和高鲁棒性的要求。现有多模态目标检测算法往往模型庞大,推理耗时长,无法在边缘设备上部署,而采用直接融合等方法又无法充分发挥不同模态的优势,因此我们提出了一种基于梯度算子和注意力机制的融合目标检测算法。引入梯度算子设计定制化卷积来捕获图像纹理;红外支路引入坐标注意力发挥其目标定位优势;引入权重生成网络对两个模态的特征进行自适应加权融合。算法结构模块化,轻量化,适合部署在边缘设备上。在数据集上实验,得到mAP@0.50和mAP@0.5:0.95指标值比可见光单模态检测提升了6.3%和7.2%,比红外提升了11.3%和9.8%。推理帧率可达22.7,满足实时性要求。
关键词: 输电线路 金具 深度学习 目标检测 小目标 密集遮挡
摘要: 针对输电线路航拍图像的金具目标尺寸小与密集遮挡问题,提出了基于级联查询-位置关系的输电线路多金具检测方法(CQPR)。首先提出了级联稀疏查询模块,通过小尺度特征图上小目标的粗略位置来查询大尺度特征图中的小目标精确位置,提高小目标金具检测的准确性。接着,提出了位置特征关系模块(PRM),通过利用图像中不同金具之间的位置关系建立PRM,提取金具位置关系,丰富遮挡区域的特征,进而优化了密集遮挡下的金具检测效果。在多个基线模型上的实验结果表明,将CQPR应用到基线检测框架时,Faster R-CNN、Cascade R-CNN、Libra R-CNN、Dynamic R-CNN的准确率分别达到82.9%,82.4%,83.7%和77.3%,优于其他先进目标检测模型,对其中小目标金具和存在遮挡情况的金具检测准确率的提高较为明显,推理速度也有一定的提高,兼顾定位精度与检测实时性。
关键词: 目标检测 小样本学习 元学习 查询引导原型 语义增强
摘要: 针对元学习范式中原型关键信息欠缺和对查询图像适应性不足的问题,以及检测器对新类方差敏感导致误分类的问题,提出了一种基于查询引导策略和语义增强机制的小样本目标检测方法。其中,查询引导模块(Query Guidance Module)通过学习查询与支持特征之间的相关性,将查询感知信息有条件地耦合到支持特征中,旨在为每个查询图像生成特定且具有代表性的原型。而视觉语义增强模块(Visual Semantic Enhancement Module)从文本语义信息中蒸馏与新类视觉特征相匹配的知识,并自适应的对这些特征增强,提高其可判别性,缓解方差敏感,以更好地分类。此外,将分类和回归任务解耦,在分类分支上执行语义增强,以促进模型对目标语义的理解。实验结果表明,相较于目前已知最新的SMPCCNet方法,所提出的方法在PASCAL VOC数据集上的nAP平均提升了2.2%,在MS COCO数据集上的AP平均提升了1.0%,证明了其有效性。
关键词: 激光雷达 彩色图像 多模态融合 自动驾驶
摘要: 针对当前三维目标检测由于数据增强导致点云和图像无法有效对齐,点与点对齐方法会丢失图像特征以及定位和分类置信度不一致的问题,提出一种多模态融合的三维目标检测方法。首先,采用PointNet++提取点云的特征;采用卷积神经网络提取图像特征;其次,在点云与图像融合阶段,采用语义对齐方法以及图像球特征,实现点云与图像更好的跨模态对齐。同时采用基于注意力的方法来指导点云与图像特征的融合,以获取更可靠的图像特征;最后引入DIoU损失来平衡置信度不一致的问题。实验结果表明:所采用的方法明显优于baseline,在简单、中等和困难任务下,Car类别的mAP达85.6%。
关键词: 小目标检测 注意力机制 特征提纯 计算机视觉
摘要: 近年来,基于深度学习的目标检测算法在准确率和鲁棒性等方面取得了巨大的进步,并且在工业界已经取得了广泛的应用。但是,在小目标检测领域,当前的目标检测算法仍然存在着漏检率高和误检率高的问题。因此,本文提出一种基于SCConv和BSAM注意力机制的YOLO小目标检测算法—BS-YOLO。首先,针对特征提取网络存在大量的冗余信息的问题,利用SCConv重构主干网络,提出一种新的模块C3SC,将提取到的特征图在空间和通道两方面减少冗余信息,提升主干网络提取到的特征图质量,从而提高检测精度。其次,基于CBAM注意力机制,结合Biformer自注意力机制提出一种新的注意力机制BSAM,在空间和通道两方面合理分配权重,使特征图更加关注有效信息,抑制背景的干扰。另外,为了解决小目标检测存在的难易样本分布不均匀的问题,利用Slideloss优化损失函数,提高小目标检测的质量。基于RSOD数据集的小目标检测实验表明,BS-YOLO算法的准确率为94.2%,召回率R为91.6%,均值平均精度mAP(交并比0.5)为95.9%;相对于原始的YOLOv5算法分别提高了3.3%,0.1%,3.6%;结果验证了BS-YOLO算法可以有效提高小目标检测的精度,降低漏检率。
关键词: YOLOv8 无人机 小目标检测 特征融合 模型剪枝
摘要: 针对无人机图像中小目标实例多、目标间存在遮挡所导致的漏检、误检等现象,提出了一种基于改进YOLOv8的轻量化无人机图像小目标检测算法。在颈部引入三特征编码器、尺度序列特征融合模块,增强了网络对不同尺度特征的提取能力;同时,设计了小目标检测层,并与改进的颈部特征提取网络进行融合,在头部引入一个额外的检测头,减小小目标特征的损失,增强网络对小目标的识别能力;此外,针对CIoU的缺陷,结合Wise-IoU、inner-IoU和MPDIoU,提出了一种回归损失算法Wise-inner-MPDIoU;最后,为了实现算法在移动端和嵌入式场景下的轻量化应用需求,进行了基于幅度的层自适应稀疏化剪枝,在保证模型精度的同时,进一步压缩了模型的大小。实验结果表明,改进后的模型相比于原YOLOv8s模型,在mAP50提高6.8%的同时,参数量下降76.1%,计算量下降17.1%,模型大小降低73.5%,达到了优秀的提升模型检测精度及轻量化效果,具有很强的实用意义。
关键词: 深度学习 计算机视觉 行人搜索 目标检测 粒计算 数据处理 特征提取 生成对抗网络 对齐
摘要: 现有行人搜索方法着重于从有限的标注场景图中学习有效的行人表征,虽然这些方法取得了一定的效果,但学习更具有身份辨别力的行人表征通常依赖于大规模的标注数据,而获取大规模的标注数据是一个资源、劳动密集型的过程。为此,该文提出了一种场景图多粒度遮挡特征增强算法,对原始场景图进行多粒度随机遮挡,扩充训练数据,并从遮挡后的场景图中生成具有多样化信息的虚拟特征,最后利用生成的虚拟特征增强真实特征中的行人表征。进一步,基于生成对抗学习,该文设计了多粒度特征对齐模块,用于对齐遮挡图像特征和原始图像特征,保持两者语义一致性。实验结果表明,在CUHK-SYSU和PRW数据集上,该算法能够显著提升行人搜索任务的搜索精度。
关键词: 深度学习 目标检测 文字检测 压印文字 YOLOv8
摘要: 针对轮胎胎侧压印文字区域受到深色背景干扰,现有算法无法准确执行检测任务的难题,本文提出一种改进YOLOv8s的轮胎胎侧压印文字区域检测算法TireYOLO。首先,提出一种轻量化特征提取模块RepNCSPELAN4_CAA,用于替换YOLOv8s原有主干网络的C2f模块,通过CAA注意力机制更好地捕捉上下文特征信息,在提高模型精度的同时降低计算代价。其次,采用一种动态采样的轻量化大感受野特征融合颈部结构DyLKVHSPAN,通过改进HSFPN网络结构,提出一种高效特征融合网络HSPAN,同时通过Dysample上采样算子进行动态采样,并且提出一种大感受野的特征融合模块UniLKVoVCSP,使DyLKVHSPAN在保持轻量化的同时利用大感受野更好融合特征。最后,提出一种低计算量检测头DWLHead,重新设计原有检测头的结构,在降低计算量的基础上提高检测性能。实验结果表明,与YOLOv8s相比,TireYOLO算法在轮胎胎侧关键信息所在区域目标检测的mAP@0.5~0.95 提高2.5个百分点,参数量降低48.4%,计算量降低49.6% ,验证了本文所提出的算法在检测轮胎侧文字区域方面的优越性。
关键词: 高光谱图像 目标检测 降维 K-means聚类 RX算法
摘要: 本文研究高光谱方法在小目标检测应用中的一些关键技术点,从高光谱的数据形式切入,应用高光谱数据中存在的高度的谱间相关性和空间相关性,在博兹瓦纳和Dioni两个数据集上做了仿真计算,验证了高光谱的谱间、空间数据高度相关的特性。用PCA算法对高光谱图像进行降维后进行图像分类实验,并结合传统目标检测RX算法和K-means聚类算法,研究了RX算法与K-means结合的算法。通过仿真实验发现,经过PCA处理后的图像分类,和RX算法与K-means结合的算法不仅提高了检测精度,而且大大降低了检测耗时。