您的常用邮箱:*
您的手机号码:*
问题描述:
关键词: 计算机视觉 立体匹配 病态区域 自适应空间卷积 GRU优化
摘要: 双目立体匹配作为计算机视觉领域的研究热点,在自动驾驶、医学影像、机器人导航等诸多场景中有着广泛的应用。针对图像序列中病态区域匹配效果不佳的问题,本文提出了一种基于自适应空间卷积的立体匹配算法。首先,在上下文网络中引入自适应空间卷积块,通过加权聚合多个卷积核的响应,增强上下文网络在捕捉复杂场景中病态区域的特征提取能力,实现精确的特征表达。然后沿通道维度获取输入特征的注意力图。随后,算法采用多尺度GRU网络结构对初步视差结果进行优化,并利用自适应空间卷积生成的注意力图对GRU的输出结果进行加权,有效抑制噪声干扰,进一步提升视差估计的准确性。实验表明,本文算法在SceneFlow数据集上进行测试,平均端点误差为0.46像素,比基准方法误差降低了14.81%。在KITTI数据集上进行测试,在全部区域的3像素误差比例指标上达到了1.40%,与基准方法比降低了15.66%,取得了更优的视差估计效果。特别是在遮挡、光照反射等病态场景中,该算法能够有效保留图像的细节特征。
关键词: 光栅周期 测量 图像处理 误差分析
摘要: 衍射光波导作为实现增强现实的一种方案具有体积小、重量轻等优势。光栅波导表面的亚波长光栅的周期对成像质量有很大的影响,因而需要实现对亚波长光栅周期快速准确的测量。李特洛衍射法具有成本低、非破坏性的优势。然而李特洛衍射法对光栅样品的位姿有严格的要求,测量前需要反复调节位姿,不利于实现快速测量。针对这个问题,我们对光栅未对准的情况下的衍射特性进行了分析,提出了基于图像处理计算失配角并修正误差的方法。本方法可以在光栅位姿不严格对准的条件下精确测量光栅周期,提高测量的效率,有望实现增强现实光栅波导的快速检测。
关键词: 生成式人工智能 飞行器技术 空气动力设计 航迹预测 目标检测
摘要: 在自然语言处理和计算机视觉领域取得颠覆性应用的生成式模型正成为数智化的新型技术基座,是未来驱动飞行器技术智能化发展的重要引擎。本文综述了生成式模型赋能飞行器技术应用进展情况。首先,总结了生成式模型架构的发展历程,详细介绍了变分自编码器、生成对抗网络、扩散模型、Transformer等基本原理架构和改进方向。其次,归纳了生成式模型在飞行器空气动力学、航迹预测和目标检测等领域的典型应用和变革情况;关注了参数化建模、气动预测模型、反设计等飞行器空气动力设计关键技术的发展趋势;探讨了实时航迹预测、完整航迹预测、协同航迹预测和预测误差补偿的智能实现方法;从现有目标检测方法改进角度分析了生成式模型在多尺度融合、超分辨率增强和数据增强中的作用。最后,从模型方法和应用场景拓展角度展望了生成式模型赋能智能飞行器技术未来的研究方向,针对构建可解释的通用大模型和推动垂直领域应用等方面提出了发展建议。
关键词: 跨域小样本目标检测 域适应 多尺度特征融合 上下文引导 解耦目标检测
摘要: 为解决跨域小样本目标检测(CD-FSOD)场景下目标域数据稀缺,源域和目标域之间数据不平衡导致模型容易对有限的目标域数据过度拟合的问题,提出了一种域适应增强和多尺度特征融合的跨域小样本目标检测方法(DAMFF-Net)。提出采用域适应图像级数据增强方法,利用不同域图像之间的前景背景混合增强,同时利用跨域分布距离度量函数选择与目标域样本分布相近的增广数据,提高了增强数据的多样性和合理性;引入双分支的多尺度特征对齐融合模块,有效避免了传输过程中的信息丢失;提出基于上下文引导的解耦检测头,将物体分类和定位在原始基础上进行解耦,并结合了局部特征、周围上下文提取以及全局特征细化等操作,增强特征的上下文感知能力,提升模型在跨域小样本目标检测任务中的精确性和鲁棒性。在Sim10K→Cityspaces和KITTI→Cityspaces数据集上与最优的跨域小样本目标检测算法(AsyFOD)相比,平均精度(AP50)分别提高了6.2%和9.9%。实验结果表明,本文的算法具有更好的优越性。
关键词: 辣椒苗 移栽机 YOLOv8n 作业质量检测 目标检测 智能农业
摘要: 目的:针对田间辣椒苗移栽作业中传统人工检测方法的耗时和低效、无法满足实时性和精确性需求的问题,以提升检测精度,实现高效、实时的辣椒苗移栽质量监测,满足复杂环境下农业现代化的需求。方法:提出了基于改进YOLOv8n的轻量化辣椒苗移栽质量检测模型。首先,使用C2f-Faster-EMA模块替换YOLOv8n模型骨干网络中的C2f模块,以减少模型参数量并提升检测效率;其次,在颈部网络中融合BiFPN(双向特征金字塔网络)和全局-局部自注意力(Global-local Self-attention)模块,增强特征的语义与位置信息,提高多尺度特征的融合能力;最后,采用Focal-SIoU(Scaled Intersection over Union)损失函数代替原损失函数,优化边界框回归性能,增强对小目标的检测效果。结果:在自然田间环境下采集的辣椒苗数据集中,改进后的模型参数量和模型大小较原YOLOv8n基线模型分别降低了42.96%和37.70%,召回率和平均精度分别提高了5.19%和1.99%。结论:为辣椒苗移栽质量检测的智能化和实时应用提供了有力支持,适合在农业无人机和便携式设备上的进一步部署。
关键词: 三维目标跟踪 对象嵌入匹配 运动预测 多维特征联合亲和矩阵 数据关联
摘要: 三维目标跟踪是自动驾驶领域的研究热点之一,目前大多数三维目标跟踪方法仅使用交并比或运动特征作为依据进行数据关联,忽略了目标的3D形态特征与位置特征,导致匹配误差较大。针对此问题本文提出了基于点云多维特征联合的三维目标跟踪方法。首先,基于3D检测骨干网络构建对象嵌入匹配模块来提取目标3D特征,得到更有判别性的特征。其次,添加了运动预测模块以捕获运动特征,结合目标历史轨迹预测目标位置,提高目标在帧间的一致性。最后,构建多维特征联合亲和矩阵,结合距离目标3D形态特征、运动特征和中心点位置特征等多维特征进行数据关联,增加轨迹和检测关联的可靠性。在公开数据集nuScenes上的验证结果表明,所提出的三维目标跟踪方法在跟踪性能方面表现更优,AMOTA(Averagemulti-objecttrackingaccuracy)提升了4.4%,IDS(IdentitySwitches)降低了322,在ID切换次数上有较好的抑制效果,证明了该方法的有效性。
关键词: 目标跟踪 等式约束 线性随机系统 状态估计 深度学习
摘要: 针对等式约束跟踪系统中多约束并存且当前约束信息不确定下状态估计问题,提出基于深度学习的联合等式状态约束辨识与递推滤波算法。利用门控循环单元构建约束判别网络,借助雷达量测实现当前时刻等式状态约束的在线辨识;在递推滤波框架下基于级联门控循环单元构建增益学习网络,实现概率模型与数据学习联合驱动的目标状态自适应估计;通过滤波投影联合约束判别网络辨识的约束信息和增益学习网络输出的状态估计,获得满足当前时刻等式状态约束的高精度目标状态估计。典型多道路目标跟踪实验结果表明:所提算法相比卡尔曼滤波、交互式多模型(基于不同运动模型构建模式集/不同状态等式约束构建模式集)和KalmanNet等算法在不同量测噪声水平下具有更高的跟踪精度和更好的鲁棒性。
关键词: 目标跟踪 状态估计 交互式多模型 粒子流滤波
摘要: 为了提高机动目标跟踪中状态估计的性能,提出一种交互式多模型粒子流滤波(Interactive Muti-Model particle flow filtering, IMM-PFF)算法。该算法采用多模型描述目标的机动过程,利用粒子流滤波算法进行目标状态估计,交互输出滤波结果。避免单一模型造成的估计误差,同时克服了卡尔曼滤波和粒子滤波的局限性,有效提升状态估计精度。仿真实验结果证明本文新滤波算法的有效性和鲁棒性中文
关键词: 计算机视觉 注意力机制 复杂图像背景 前景拉索 DeepLabV3+网络
摘要: 在应用基于计算机视觉的方法进行拉索振动测量时,背景图像中物体的运动会影响拉索振动识别精度。因此,本文提出一种引入ECA注意力机制改进DeepLabV3+网络的方法用于去除复杂图像背景,提取图像前景拉索目标。在DeepLabV3+网络的编码阶段增加一个特征提取模块,增强拉索图像深层特征,以获得更精细的拉索边缘;在解码阶段引入一个浅层特征模块(ECM),过滤背景信息,减少细节信息的丢失。在采集的离散拉索图像数据上对模型的精确度进行了评估,结果表明改进DeepLabV3+网络(Net-Ⅳ)的平均交互比(MIoU)、类别像素精度(PA)和平均像素精度(MPA)分别达到99.01%、99.84%和99.49%,其中MIoU相比于比改进前DeepLabv3+提高了1.71%,“cable”类别的交并比(Iou)值提高了4.21%。在可视化结果中,改进DeepLabV3+网络的拉索像素识别精度更高,背景图像的分割更完全,实验结果验证了所提方法可有效去除拉索复杂图像背景。
关键词: 输电线路场景 目标检测 多目标跟踪 YOLOv5s ByteTrack
摘要: 在输电线路巡检任务中,采用深度学习技术实现施工机械运动目标的有效跟踪对智能电网建设至关重要。针对目标间遮挡干扰、误检漏检造成多目标跟踪性能显著下降的问题,提出一种改进YOLOv5s与优化ByteTrack相结合的多目标跟踪算法。在目标检测部分,首先,采用轻量级的Ghost卷积和无参注意力(SimAM)构建SGC3模块,提高特征利用率,减少模型冗余计算;其次,在主干网络深层提出卷积引导的三重注意力模块(R-Triplet),利用多分支结构增强模型跨维度信息交互,抑制不相关背景信息以提高目标关联能力;最后,在特征融合部分添加多分支感受野模块(MRB),利用空洞卷积扩大目标感受野,增强多尺度目标全局特征信息复用。在目标跟踪部分,在ByteTrack算法的基础上,根据施工机械的运动特点,提出一种自适应计算噪声尺度的NSA卡尔曼滤波算法,用于缓解低质量检测框对滤波算法性能的影响;并在数据关联部分引入GSI高斯平滑插值算法,进一步完善多目标跟踪效果。实验结果表明,所提CRM-YOLOv5s算法平均精度均值(mAP)达到了97.4%,与基线算法相比提升了3.8个百分点,参数量和浮点运算量分别减少了0.3M和1.8GFLOPs,在多种应用场景下泛化能力更强;同时与改进后的ByteTrack相结合,相较于原YOLOv5s+ByteTrack跟踪算法,多目标跟踪准确度(MOTA)提升了4.5个百分点,目标身份切换次数(IDs)减少了15次,且获得了较高的推理速度,能够满足输电线路场景下施工机械多目标跟踪任务。