关键词:
脉冲神经网络
智能信息处理
神经元动力学多样性
异质网络结构
序列信息处理模型
摘要:
近年来,人工神经网络(Artificial Neural Networks,ANNs)飞速发展,并日益成为智能处理图像、语言和音乐等信息的主流模型。然而ANN模型需要大量的计算资源作为支撑,难以满足在能量受限的移动和边缘设备进行轻量化部署的要求。脉冲神经网络(Spiking Neural Networks,SNNs)以具有特定膜电压动力学机制的脉冲神经元为计算单元,模拟了真实生物神经计算体系的运行机制,并能够更好地结合基于人类神经系统的认知机制。由于采用稀疏激活与二值化信息传输机制,脉冲神经网络相比于人工神经网络有明显的功耗优势,有极大的潜力部署在各种移动和边缘设备上,实现实时低延迟的智能信息处理。然而目前脉冲神经网络的研究涉及到的神经元动力学机制比较单一,其所能处理的信息也主要局限于静态图像。为此,本文拟结合神经元的多样化动力学机制和人类神经系统认知机制,探索全新的基于脉冲神经网络的模型和算法,以应用于更为广泛的智能信息处理领域,其主要的内容如下:
(1)受生物神经系统中动力学多样性机制和生物神经振荡机制的启发,本文提出了一种基于脉冲神经元模型的稀疏脉冲词语编码方案。该编码方案实现了直接将词向量中的正负数值信息转换为脉冲序列,解决了先前方案无法有效编码和利用预训练词向量中负数值信息的问题,并避免了先前编码方案需要预先将词向量转换为非负值向量再进行编码所造成的转换损失。该编码方案尝试采用三种动力学差异性的神经元作为脉冲编码模型,其中基于共振LRF神经元的编码模型生成的词语脉冲序列编码在词意相似度、句意相似度和自然语言理解等相关语言任务上展现出了明显优于先前的脉冲编码研究的性能,并能达到甚至超过原始预训练词向量的水平。
(2)受大脑皮层中存在积分和共振两类动力学互补性神经元的启发,本文提出了由动力学差异化的离散脉冲神经元构建的异质(Heterogeneous)脉冲神经网络模型,并通过文本分类任务进行了性能验证。当前现有的脉冲神经网络大都采用单一积分动力学机制的LIF神经元构成,这类同质(Homogeneous)网络模型大都需要采用较为复杂的多层网络结构以提升性能。本文提出了具有全新动力学机制的离散型的共振LRF神经元,使得脉冲神经网络可以采用动力学差异性的神经元构成异质结构,并通过动力学多样性拓展信息表示空间以提升模型性能。通过网络结构与参数优化,本文探索出了以LIF神经元为隐藏层LRF神经元为分类层的最优化网络结构。结合本文提出的基于LRF神经元的脉冲编码模型,该异质脉冲神经网络模型在文本分类实现中性能明显优于与之具有相同拓扑结构的同质脉冲神经网络模型。同时,该模型也以简单的双层全连接网络结构和较少的时间步长,展现出了优于先前基于卷积结构的同质脉冲神经网络模型的文本分类性能。
(3)受人类神经系统对序列信息进行多时间尺度感知的启发,本文提出了多尺度共振脉冲神经网络(Multiscale Resonant Spiking Neural Network,MSRSNN)序列分类模型。该模型利用时间敏感的LRF神经元构建多尺度共振编码器,用以提取时序信息输入中不同时间尺度的特征,并表示为脉冲序列。而后利用基于强度敏感的LIF神经元的残差网络结构和分类器,对类别相关的时间特征作进一步提取和强度累积,并最终做出分类决策。在文本和音乐两种序列信息数据集上的实验结果表明,MSRSNN能够充分提取并利用序列信息中的各种尺度的时序依赖关系,并进一步做出具有较高准确性的分类决策。由于采用内在的动力学多样性进行了时序特征提取能力的拓展,MSRSNN相比于现有采用额外特征提取结构的同质序列脉冲神经网络模型,也呈现出明显的轻量化优势。
(4)受人类神经系统对音乐具有层次时序感知力,并能依据有限长度碎片化的音乐信息做出实时高准确性分类决策的启发,本文提出了卷积层次时序脉冲神经网络模型(Convolutional Hierarchical Temporal Spiking Neural Network,CHTSNN),以及能赋予CHTSNN实时分类决策的能力的随机可变长分批次(Stochastic Variable Length Batch-wise,SVLB)序列学习算法。该模型充分发挥了脉冲神经网络对于循环神经网络的低功耗轻量化替代性优势,将具有时序循环计算结构和时序信息层次提取结构的异质脉冲神经网络,与具有空间信息提取能力的卷积神经网络相结合。实验结果表明,在具有CNN-SNN杂化网络模型功耗优势的前提下,CHTSNN能够在处理完整长度音乐信号时达到与现有CNN-RNN杂化网络模型相当的分类性能,并同时能够在实时处理有限长度的音乐片段时仍然保持较高的分类准确性。