您的常用邮箱:*
您的手机号码:*
问题描述:
关键词: 深度学习 目标检测 医学影像 注意力机制
摘要: 肝癌是一种恶性肿瘤,对其进行早期筛查和准确检测是提高治疗效果、延长患者生存期的关键。针对使用单期相计算机断层扫描(Computed Tomography, CT)图像难以准确检测复杂多变的肝癌的问题,本文提出一种基于FCOS(Fully Convolutional One-Stage Object Detection)的双期相CT肝癌检测方法。首先构建了双期相肝脏CT四元组网络,并利用其匹配双期相肝脏CT切片,确保不同期相之间肝脏位置的一致性,为后续肝癌检测奠定基础。其次改造了FCOS网络以接收双期相CT图像的输入,设计并插入AFF(Attention-based Feature Fusion)模块进行带混合注意力的特征融合,以提高肝癌检测的准确性。实验结果表明,改进算法在本文数据集上的AP达到了78.56%,相比于单期相FCOS网络提高了4.9%,展现出更优越的性能。
关键词: 目标检测 异物检测 YOLOv8n 坐标注意力机制 高分辨率网络 WIoU损失函数
摘要: 针对当前隧道内异物检测存在人工巡检成本高、效率低等问题,提出一种基于改进YOLOv8n的隧道内异物检测算法。首先,提出了C2f_CA模块,该模块融入了坐标注意力机制,通过将位置信息嵌入到通道注意力中,增强网络对图像空间上特征分布的关注,从而提升网络特征提取能力;其次,借鉴高分辨率网络的思想,提出新的特征融合模块HRNet_Fusion,将提取的不同分辨率特征图作为4个并行分支输入到网络中,并经过多次上、下采样和融合操作得到全面和准确的特征信息,显著提升了在小目标检测和特征信息融合方面的性能;最后,引入WIoU损失函数来降低低质量样本对网络的不良梯度影响,进一步提高模型检测精度。实验结果表明,在隧道异物数据集上,改进后的算法的检测精度为79.9%,模型大小为6.0 MB,与YOLOv8n算法相比,检测精度提升了6个百分点,模型大小减少了0.2MB,模型参数量减少了0.386×106。
关键词: 水坝 难分负样本 大清河流域 CenterNet网络 目标检测
摘要: 水坝的检测对于城市规划、生态环境评估等有着重要意义。目前基于遥感的水坝检测研究主要是基于样本集的算法改进或在小区域上的检测,缺乏在大尺度地学区域的实践应用。而在大区域中,水坝分布稀疏,地表存在更多的桥梁等地物会对水坝的检测形成显著干扰。为应对这一问题,该文以大清河流域为例,研究大尺度区域内的水坝遥感检测。该文研究主要分为两个阶段,第一阶段是将容易与水坝混淆的桥梁作为难分负样本(即容易产生假阳性的样本)参加训练,基于DIOR公开数据集改进适合于水坝提取的神经网络结构;第二阶段是基于优化后的网络以及大区域多源样本数据进行微调训练获取模型,并实现大清河区域的水坝检测。优化后的模型模型在第一阶段测试得到了78.3%的水坝检测精度,在第二阶段大清河流域检测得到了330处水坝,其结果与现有公开的水坝空间分布数据集GRandD相符,且更为详细。结果表明,结合桥梁样本优化训练后的模型可以有效避免对桥梁的误提取,从而提高检测精度。
摘要: 近年来,我国出台了一系列政策和规划,旨在加速人工智能技术的研发和应用.其中,2017年国务院印发的《新一代人工智能发展规划》明确提出,到2030年,中国的人工智能理论、技术与应用总体将达到世界领先水平,成为世界主要的人工智能创新中心.计算机视觉技术作为人工智能领域的重要分支,已在多个行业展现出巨大的潜力和广泛的应用前景.从自动驾驶、医疗诊断到智能安防和人机交互,计算机视觉正逐步改变我们的生活方式和工作模式.
关键词: 计算机视觉 人体姿态估计 关键点检测 图卷积
摘要: 人体姿态估计是人机交互等领域的关键技术之一。高自由度的肢体常构成各种复杂的姿态,其中极易产生关键点被遮挡的现象,定位遮挡关键点是人体姿态估计的难点之一。为此,本文提出了一种图结构引导并强化关键点位置信息的人体姿态估计方法。该方法在高分辨率网络中融入位置信息强化模块,用于提升可见关键点空间位置信息的表征精度。在主干网络并行支路中引入视觉图神经模块,引导网络提取包含人体关键点的相关特征,在像素坐标空间中挖掘关键点之间局部和全局的拓扑连接关系,以便推测被遮挡关键点的位置信息。最后结合关键点热图聚合单元和语义图卷积网络,在语义空间中更新各关键点间的亲和力权重,表示躯干结构约束下关键点之间的拓扑依赖关系,进一步优化被遮挡关键点的估计。本文提出的模型在COCO2017测试集上的平均精度达到78.1,能够精准估计复杂姿态中易被遮挡的关键点。
关键词: 羊群 群体决策 同步 智慧畜牧 目标跟踪
摘要: 随着畜牧养殖数字智能化监控技术的产业化应用,进一步提升畜禽养殖的分类施策精细化管理,成为现代畜牧业的精细高效养殖管理的新需求。采用固定机位、多角度视频采集技术,实时记录羊群牧食过程中的游走行为;针对羊群游走视频中易出现遮挡的复杂情况,设计了基于YOLO v5模型的羊群多目标检测模型,羊群游走过程中的多目标实时跟踪识别率可达90.63%;采用羊群游走多目标轨迹跟踪DeepSORT算法,通过提取羊目标的深度表观特征,计算出羊群游走轨迹和变化节拍规律。结果表明,羊的游走过程通常为慢走、快走和疾走3种不同方式,单只羊的游走过程通常是不固定的随机组合。在中大规模羊群中,由于亲缘关系结构的复杂性,羊群往往分化为多个小群体,这使得从整体上观察和分析羊群行为变得异常困难。为此,聚焦于小规模羊群进行研究,通过羊群散列、聚集和同步3个游走过程的实证分析,初步验证了羊群游走节拍周期上的同步现象。
标准号: GB/T 44020-2024
摘要: 本文件定义了一个用于表示和控制MAR场景中的单个LAE或多个LAE的参考模型和基本构成,定义了概念、参考模型、系统框架、功能以及如何集成2D/3D虚拟世界和LAEs以及它们之间的接口,以便为MAR应用程序提供LAEs的接口,还定义了在基于LAE的MAR应用程序之间传输和存储LAE相关数据所需的交换格式。本文件具体说明了以下功能:a) MAR中LAE的定义书b) LAE的表示;c) LAE属性的表示;d) LAE在物理世界的感知;e)将LAE集成到2D/3D虚拟场景中;f)在2D/3D虚拟场景中LAE与对象之间的交互;g)在MAR场景中传输与LAE相关的信息。本文件定义了一种基于LAE表示的MAR应用的参考模型,用于MAR场景中2D/3D虚拟场景中的LAE相关的数据的表示和交换。它没有定义操作LAE所必需的特定物理接口,也就是说,它没有定义特定应用程序如何在MAR场景中实现特定LAE的方式,而是定义了用于表示能在MAR应用程序之间互换使用LAE的通用功能接口。
关键词: 毫米波雷达 多目标检测 3D-FFT IOMP
摘要: 为提高毫米波雷达目标检测精度,本文在3D-FFT算法的基础上,针对低chirp数和低接收阵元数下毫米波雷达测速与测角精度低的问题,提出了一种基于3D-FFT和改进正交匹配跟踪(Improved Orthogonal Matching Pursuit,IOMP)相融合的雷达多目标检测算法。通过仿真数据和实测数据分别进行目标检测验证,结果表明,该算法在测速精度与测角精度方面均得到提升。此外算法还具有更低的算法复杂度,为后续进行雷达目标跟踪的工程应用奠定了基础。
关键词: 路面工程 路面病害 目标检测 YOLOV7 轻量化 注意力机制 损失函数
摘要: YOLOV7用于路面病害检测存在参数冗余、检测效率较低、模型体量过大等问题.为了解决上述问题,利用MobileOne网络代替原有主干特征提取网络;引入轻量坐标注意力模块Coordinate Attention(CA)到网络中;提出了基于GSConv的YOLOV7 Slim-Neck,并通过重参数思想融合模型运算过程;使用Focal-EIoU Loss替代CIoU Loss以解决样本分类不均衡的问题.研究结果表明:引入Focal-EIoU Loss后能够平衡样本的不均匀性,加快模型的收敛;MobileOne网络在减少模型参数的同时提高了模型的精度;CA模块加强了模型的特征提取能力;Slim-Neck在保证学习能力的同时,大幅减少模型参数;相较于传统的YOLOV7架构,所提出的模型参数量减少了78%,图像处理速度是原来的3倍,mAP性能指标上升1.71%,F分数上升0.022.该轻量化模型便于移动平台部署,具有明显的工程应用优势.