关键词:
可重复性分析
功能性磁共振成像
独立成分分析
张量分解
张量聚类
摘要:
功能性磁共振成像(functional Magnetic Resonance Imaging,fMRI)是脑科学无创研究的关键技术,盲源分离(Blind Source Separation,BSS)算法广泛应用于fMRI数据处理中。独立成分分析(Independent Component Analysis,ICA)和张量典范因子分解(Canonical Polyadic Decomposition,CPD)等BSS算法大都是迭代算法,这些算法理论上可以收敛至全局最优解,但实际计算中由于噪声等因素的影响这些算法往往收敛于不同的局部最优解。因此衡量BSS算法提取的fMRI成分的可重复性显得至关重要。当前衡量BSS算法结果可重复性技术多数基于所提取fMRI成分的单个维度进行研究,忽略了数据的两个或多个维度之间交互作用所带来的可重复性研究复杂性。为了从两个和多个维度分析BSS算法所估计fMRI成分的可重复性,本论文提出了通过张量聚类算法进行可重复性研究,开展工作如下:(1)为衡量ICA算法(假设源成分相互独立)结果可重复性,本文提出了基于相关的张量聚类算法(Correlation-Based Tensor Clustering,CBTC)。对于给定 ICA 算法,本文对同一个fMRI数据矩阵进行K次分解(每次初始化均不相同),每次提取R个成分;将每个成分通过系数矩阵反投影形成秩一矩阵,该矩阵包含成分和系数所对应的估计脑网络空间和时间两个维度的信息;所有秩一矩阵组成的待聚类样本特征是一个张量(多维数组),因此需要采用张量聚类算法在张量空间进行聚类;由于独立源成分具有成分之间相互独立的特点,相关系数可以准确刻画成分之间的距离,所以本文提出了基于相关的张量聚类算法,对R×K个秩一矩阵进行聚类,类的数量为R。当R类的类内相似度减去类间相似度的平均值越接近于1则说明估计结果可重复性越强,否则反之。通过仿真和实际数据验证了这一算法的有效性。基于对ICA算法的可重复性分析,找到了糖尿病患者与正常被试之间可靠性高的差异脑区。(2)ICA算法广泛应用于fMRI数据处理中,现有的ICA算法应用模式并不能将所有的脑网络都估计出来且估计结果准确性也比较低。本文在可重复性分析的基础上,提出了一种新的fMRI组分析模式,即迭代相减ICA(Iterative Subtraction ICA,IS-ICA)算法。在IS-ICA算法中,首先使用工作(1)中提出的fMRI组分析方法评估估计结果的可重复性;再通过随机分块级联 ICA(Randomly Partition Concatenated ICA,RPC-ICA)算法提升可重复性高的成分的准确度;然后将可重复性高的成分反投影结果从待分解矩阵中减去,形成新的待分解矩阵;重复上述过程,直到不能提取出可重复性高的成分为止。IS-ICA算法通过去除可重复性高的成分(脑网络、伪迹),使得通过ICA算法可以估计出能量较低的成分,从而估计到更多有效脑网络成分。在IS-ICA算法中为了克服通过主成分分析(Principle Component Analysis,PCA)降维带来的缺点、提高估计结果准确度,本文提出了 RPC-ICA算法,该算法对待分解矩阵分块运算,每块数据不降维进行ICA分解;将可重复性高的成分作为参考,迭代应用基于参考的ICA算法于每个待分解块,从而提高估计脑网络的准确性。相比于传统ICA算法,IS-ICA算法可以提取更多更准确的成分。使用IS-ICA算法估计到脑网络的空间分布更清晰,噪声点更少,具有更强的非高斯性,对阈值及参数的选择更不敏感等优点。(3)为衡量以CPD为代表的相关源成分可重复性,本文提出了张量谱聚类算法(Tensor Spectral Clustering,TSC)。该算法对同一个M维度的fMRI数据张量进行K次分解(每次初始化均不相同),每次提取R个成分,对于每一个成分将M个分量外积运算形成秩一张量,进而采用TSC对R×K个秩一张量进行聚类分析。在TSC算法中,首先将不同维度的可重复性信息通过矩阵外积构造出融合多维度可重复性信息的转移张量;由于样本之间没有独立性的约束,采用高阶奇异值分解对转移张量进行降维,进而结合层级聚类实现了对相关源成分的可重复性分析;在聚类结果中,类内相似度越接近1表示该成分可重复较高,反之则说明该成分可重复性较低。本文将所提方法应用于无约束的CPD算法以及带有稀疏约束的非负张量分解算法的可重复性研究。这些方法在自然刺激诱发的fMRI数据以及时频域静息态fMRI数据等多种神经影像数据分析与处理中展现了优异的效果。