关键词:
重尾张量数据
协方差估计
KPCP分解
带状结构
锥形结构
摘要:
协方差矩阵估计是高维数据分析中的一项重要内容,而高维数据又很容易产生维度较高而样本量小的超高维度现象.小样本张量数据常常呈现重尾情况,传统的协方差矩阵估计方法(如样本协方差矩阵)对于其估计有时并不准确.在重尾高维数据以张量形式(多维数组)显示时,利用张量固有结构对其进行降维是非常好的选择.为此,本文提出了用于估计小样本重尾张量值数据协方差的新型结构正则化方法.首先将重尾张量数据进行截断化处理,而后计算截断后的样本协方差矩阵,再利用典型多项式分解(Canonical Polyadic decomposition,CP分解)来寻找截断样本协方差矩阵的多个矩阵克罗内克积(Kronecker Product,KP)形式的逼近,最后对每个分解得到的小矩阵施加带状或者锥形结构.模拟结果显示,针对不同重尾程度以及不同样本量情况,本文所提出的估计量有着优异的表现.同时,对于一组呈现重尾分布的异常温度数据集,使用本文提出的估计方法进行了分析.