计算机视觉-专题定制-重庆大学图书馆

基于改进YOLO v5的轻量化苹果检测方法

温彬彬张华孟祥龙

河北工业职业技术大学河北石家庄054000河北农业大学河北保定071000

来源详细信息

FMA-DETR:一种无编码器的Transformer目标检测方法

周全倪英豪莫玉玮康彬张索非

南京邮电大学通信与信息工程学院江苏南京210003南京邮电大学物联网学院江苏南京210003

来源详细信息

关键词： 目标检测 Transformer 编码器 DETR 混合注意力

摘要： DETR是第一个将Transformer应用于目标检测的视觉模型。在DETR结构中,Transformer编码器对已高度编码的图像特征进行再编码,这在一定程度上导致了网络功能的重复。此外,由于Transformer编码器具有多层深度堆叠的结构和巨大的参数量,导致网络优化变得困难,模型收敛速度缓慢。本文设计了一种无编码器的Transformer目标检测网络模型。由于不需要引入Transformer编码器,本文的模型比DETR参数量更小、计算量更低、模型收敛速度更快。但是,直接去除Transformer编码器将降低网络的表达能力,导致Transformer解码器无法从数量庞大的图像特征中关注到包含目标的图像特征,从而使检测性能大幅降低。为了缓解这个问题,本文提出了一种混合特征注意力(fusion-feature mixing attention,FMA)机制,它通过自适应特征混合和通道交叉注意力弥补检测网络特征表达能力的下降,将其应用于Transformer解码器可以减轻由于去除Transformer编码器带来的性能降低。在MS-COCO数据集上,本文网络模型(称为FMA-DETR)实现了与DETR相近的性能表现,同时本文的模型拥有更快的收敛速度、更小的参数量以及更低的计算量。本文还进行了大量消融实验来验证所提出方法的有效性。

基于改进YOLO v5的苹果采摘机器人目标检测方法

胡仕林陈伟张境锋魏庆宇金学广

江苏科技大学电子信息学院江苏镇江212003常州信息职业技术学院江苏常州213164

来源详细信息

新工科人工智能创新人才培养的教学设计与实践——以计算机视觉课程为例

赵丽玲孙玉宝李军侠陈逸菲

南京信息工程大学自动化学院江苏南京210044南京信息工程大学计算机学院江苏南京210044无锡学院自动化学院江苏无锡214105

来源国家哲学社会科学学术...

详细信息

人视街景图像和机器学习结合的城市街道适老性水平空间效应研究

李海薇陈崇贤刘欣宜吴伊童陈斯璐

华南农业大学林学与风景园林学院广州510642

来源详细信息

关键词： 广州街道街景图像计算机视觉空间效应机器学习适老性景观环境感知人机对抗评分

摘要： 城市街道与老年人的日常活动密切相关,探讨街道环境适老性水平的空间分布特征及其关键影响因素,对老年友好型城市公共空间建设有重要指导作用。然而,既有研究难以贴近真实的人本视角、快速、大规模且精准地评估街道适老性水平的地理空间效应。因此,本研究从人行视角采集街景图像,结合语义分割和目标检测技术提取环境要素,利用人机对抗众包评价与残差神经网络50(ResNet50)技术测度街道环境适老性水平,采用莫兰指数(Moran's I)、普通最小二乘回归模型(OLS)、空间滞后模型(SLM)和空间误差模型(SEM)综合分析街道适老性水平的地理空间异质性及其影响因素;最后,选取了老龄化程度明显、街道环境多样的广州天河核心区为例进行实证研究。研究发现:①本研究结合了人视街景图像、机器学习和空间统计学方法,能够快速、有效地开展街道适老性水平评价,揭示其空间效应特征和关键影响因素;②街道适老性水平指标在研究区存在中等偏高程度的空间聚集性,商业型街道和靠近住宅区的街道、滨水街道差异大。水平较高的是商业型街道和靠近低密度住宅区的街道,较低的是靠近高密度住宅区的街道。老年人在滨水街道的活动性和安全感高,但愉悦感低;对靠近住宅区街道的归属感低;③不同街道环境要素对适老性水平的影响存在差异。绿视率、开敞度和围合度对街道适老性水平的影响较强,拥挤度、人行道占比与场景多样性几乎无影响。研究有助于为精细化、具身性的城市街道适老化空间研究与实践提供参考和理论依据。

农业割草机器人全区域覆盖路径规划研究--基于计算机视觉技术

吴蓓李霞李进

武汉工程科技学院武汉430200武汉纺织大学传媒学院武汉430073

来源详细信息