关键词:
大规模张量分解
随机化
典范多因子分解
耦合分解
块采样
摘要:
由于获取及存储信息的技术手段飞速发展,观测数据总是表现出高维度大尺寸的特性,大规模数据的分析和处理成为当今信息处理技术的核心和关键。相比于传统的基于矩阵的处理方法,张量(即多维数组)更加适合这种高维度数据的表示和分析,它不仅能够直观描述高阶数据之间的多线性结构,还具有模型精简、可唯一辨识性强等良好特性,因此近年来被广泛用于多维数据的表示和处理中。然而,传统的张量分解算法在处理大规模数据时会面临内存占用及计算复杂度过高的问题。现有的利用部分数据重构原始参数模型的大规模张量分解算法,通常结合块采样、随机化的思想,通过挖掘张量模型在整体和局部的一致性,利用采样数据对模型参数进行学习更新。然而这种处理方式忽视了来自同源的不同采样数据块之间固有的耦合结构,并且对于实际信号中的先验信息未加以考虑,从而在运算效率和分解精度方面存在短板。综上所述,本文结合随机化、块采样等现有大规模张量分解的核心技术,将“耦合分解”的思想融入其中,更好地挖掘采样样本之间的内在耦合结构,提出耦合块采样方案,和相应的具有高运算效率的大规模张量分解算法,并结合部分实际信号中的先验信息讨论其在多个大规模信号处理问题中的应用,具体内容概括如下:(1)提出了一种典范多因子分解框架下的基于耦合块采样的大规模张量分解算法。首先,基于随机化、块采样、耦合分解等思想,提出耦合块采样方法,该方法能够采样一组尺寸较小、涵盖原张量全部模型参数,且相互间具有特定耦合关系的张量块。此外,利用现有的耦合典范多因子分解算法,一次性对上述采样张量块联合求解;最后,通过对耦合张量块分解的结果进行融合,解决其存在的幅度和顺序不一致问题,实现对原大张量模型的完整恢复,并通过数值仿真实验研究了算法性能。此外,考虑类核磁共振成像(f MRI)仿真数据,利用所提出的方法对之进行成分分离从而验证算法的有效性。(2)将所提出的方法应用至两个典型的大规模数据处理应用之中。首先,考虑阵列波达方向估计问题,将阵列空域因子矩阵的范德蒙结构有机嵌入至所提出的大规模张量分解算法之中,从而提取阵列波达方向。其次,考虑MIMO无线信道数据分解和补全问题,利用所提出算法结合频率维的范德蒙结构对多时刻的“空-频”信道数据进行分解,分析频率维的时变特性,并对测量获得的单用户部分频带上的“空-时-频”信道数据进行分解,利用频率维的范德蒙结构将部分频带的测量数据补全至全频带,从而获取当前时刻的全频带数据。上述两个个典型应用均证明了本文所提出的方法的有效性。