关键词:
脉冲神经网络
学习算法
目标检测方法
事件驱动的仿真计算方法
直接反馈对齐
摘要:
近年来,以深度学习为代表的人工神经网络算法在图像识别、自然语言处理及人机对弈等领域取得了显著进展,引领人类社会步入全新的人工智能时代。然而,随着深度神经网络应用范围的拓展,其高昂的计算成本、能量消耗以及鲁棒性和可解释性不足等问题逐渐成为制约其进一步发展的核心障碍。神经形态计算以其模拟生物感知和处理信息的方式,为突破这些难题提供了新的思路,吸引了广大研究者的关注。脉冲神经网络(Spiking Neural Network,SNN),被誉为“第三代神经网络模型”,因其生物学合理性、强大的时空信息处理能力和高效的能量效率,在神经形态计算领域中占据了举足轻重的地位。然而,由于脉冲神经元和突触复杂的时空动力学特性,目前尚未形成公认的核心训练算法和技术体系。现有的SNN学习算法存在训练耗时过长、学习性能与能量效率不够高、缺乏通用性强的事件驱动仿真计算方法等问题,这些因素极大地限制了SNN的广泛应用和普及。
针对上述挑战,本文深入研究了SNN学习算法及其应用,论文主要贡献和创新成果包括:
(1)为了加快学习算法训练速度,提出了基于直接反馈对齐的精确脉冲时间(PREcise Spike Timing based on Direct Feedback Alignment,PREST-DFA)学习规则。受脉冲分层误差再分配学习算法的启发,PREST-DFA采用基于脉冲卷积差的误差信号定义形式,通过输出层迭代计算误差值,并借助基于直接反馈对齐(Direct Feedback Alignment,DFA)的误差传输机制,将误差信号广播至隐藏层神经元,进而实现突触权值的更新。本文成功实现了时间驱动的PREST-DFA学习算法,设计了精确脉冲时间学习能力验证、学习性能比较和训练速度比较三组实验,通过实验验证了PREST-DFA具备精确脉冲时间学习能力,能以较低的推理延迟实现有竞争力的学习性能,与采用同样学习规则使用反向传播的学习算法相比能加快训练速度。本文不仅首次验证了基于DFA机制的学习规则能在深层网络中控制脉冲的精确发放时间,表明DFA机制可用于设计基于脉冲时间的学习算法,还展示了PREST-DFA学习规则不需要逐层误差反向传播,计算简单,能加快训练速度,易于硬件实现,有良好的生物学合理性和学习性能。
(2)针对现有学习算法缺乏良好通用性的事件驱动仿真计算方法的问题,提出了聚合事件驱动的仿真计算方法。通过深入研究事件驱动的仿真计算过程,本文发现逐事件计算的直接事件驱动方法中存在同时间戳问题,可能导致神经元输入总突触电流计算错误。聚合事件驱动的方法通过修改神经元发放检查时机,将单个事件聚合成一批事件统一计算,从而有效避免了计算错误。本文选择已在图像和手势识别领域成功应用的精确脉冲驱动(Precise-Spike-Driven,PSD)学习规则,实现了聚合事件驱动的PSD学习算法。通过计算复杂度分析和仿真计算时间比较实验,证明聚合事件驱动的方法计算复杂度和仿真计算时间优于时间驱动的方法。本文还设计了神经形态数据集和静态图像数据集目标分类比较实验,通过实验验证了聚合事件驱动的PSD学习算法能够以较少的参数和神经元数量实现良好的学习性能,训练速度和学习性能均优于时间驱动的PSD学习算法。本文提出的聚合事件驱动的仿真计算方法具有良好的通用性,能加快训练速度提高学习性能,可应用于SNN和其他学习算法的仿真计算。
(3)为了提高学习算法在目标检测任务中的检测性能和能量效率,提出了基于多维注意力机制的端到端直接训练的脉冲神经网络目标检测方法。该方法在脉冲YOLO模型基础上,构建了一个融合多维注意力机制的端到端直接训练的新SNN模型(SpikingYOLO based on Multidimensional Attention,MA-Spiking-YOLO),通过不发放的LIF(Leaky Integrate and Fire,LIF)神经元膜电位来构造损失函数,采用代理梯度计算误差信号和梯度值,利用随时间反向传播方法对网络进行训练。通过多维注意力机制有效性验证、检测精度比较和能量效率比较三组实验,本文验证了引入多维注意力机制后的MA-Spiking-YOLO模型提高了检测精度,可实现有竞争力的检测性能,尤其是在能量消耗方面,实现了高达28%的降幅。因此,MA-Spiking-YOLO模型能够在提升检测精度的同时,显著降低能量消耗,具有精度提升不依赖于推理时间延长的特点。
(4)为了验证上述算法在真实场景中的有效性,设计并实现了一个面向神经形态视觉的目标识别和检测系统。该系统由八大模块组成,包括事件流录制和保存、事件流预处理、目标识别、目标检测、识别和检测结果输出、事件流可视化、事件数据标注和事件数据集存储。本文采用运动感知的特征提取方法、时空反向传播算法