关键词:
注意力机制
脉冲时序依赖可塑性
脉冲神经网络
颜色拮抗
摘要:
在人工智能高速发展的当下,脉冲神经网络(Spiking Neural Network,SNN)凭借仿生程度高和计算速度快等特性,吸引了众多学者的关注。在其现有的无监督训练算法中,脉冲时序依赖可塑性(Spike Timing Dependent Plasticity,STDP)是最主流的一种方法。然而,目前大部分基于STDP的SNN只关注图像的轮廓信息,忽视了对图像分类任务同样重要的颜色信息,虽有少数研究试图从颜色拮抗角度提升网络精度,但对于生物视觉系统的模拟仍不够深入,生物可解释性也较差。针对上述问题,本文首先提出了一种无监督SNN训练算法——颜色拮抗机制(Color Opponent Mechanism,COM),该方法能够与STDP协同训练SNN。其具体步骤是:首先根据经典感受野的拮抗机制将颜色信息组合为拮抗信息,然后将其与距离参数卷积核进行卷积,以此整合不同通道的颜色信息,最终将卷积结果用于权重的更新。该机制使得网络能够以仿生的方式提取并学习图像中的颜色信息,从而提升网络精度。在ETH-80、Fish和Caltech-101数据集上,基于COM的SNN可以达到88.9%、86.4%和45.4%的分类精度,优于使用现有无监督学习算法或有监督学习算法训练的SNN的精度。然后,由于特征图中同时包含颜色通道和轮廓通道,因此本文尝试使用通道注意力机制给特征图中的不同通道分配权重。但是基于STDP的SNN无法使用梯度,也就无法使用现有的注意力机制方法。为此,本文提出了一种适用于无监督SNN的注意力机制,其根据突触前后神经元的脉冲信息计算特征图的权重,使得网络对特征图中的不同信息表现出不同偏好。其具体步骤是:首先使用输入特征图与卷积核中的对应通道进行二维卷积,并计算特征图中每个通道的平均脉冲时刻;然后,根据平均脉冲时刻的先后次序计算注意力权重,并对其进行归一化;最后,将注意力权重乘回输入图像的对应通道。在三个数据集上,本文提出的注意力机制使得SNN的分类精度分别从88.9%、86.4%和45.4%提高到93.9%、90.1%和53.7%,该实验结果证明了注意力机制的有效性。最后,为了进一步验证COM和注意力机制的有效性,本文尝试将其应用到基于STDP的多层SNN中。但由于在多个卷积层中COM只能使用一次,且COM要求输入的特征图中存在颜色特征图,所以COM的位置会影响SNN的结构。对此,本文提出了基于单通路和基于双通路的三层SNN:单通路SNN在第一个卷积层处使用COM;而双通路SNN在最后一个卷积层使用COM整合颜色和轮廓信息。在三个数据集上,此前方法达到的最高精度分别为89.9%、87.9%和45.6%,而基于单通路和基于双通路的三层SNN达到了更高的精度:在ETH-80上的精度分别为94.2%和94.5%;在Fish上的精度分别为91.3%和91.5%;在Caltech-101上的精度分别为55.1%和55.7%。此外,相比于单通路SNN,双通路SNN在分类精度、参数量和训练迭代次数方面都更有优势。