关键词:
张量环
低秩分解
低秩张量补全
摘要:
低秩张量补全(Low Rank Tensor Completion,LRTC)因其在计算机视觉、知识图谱补全、电力数据恢复等多个领域的应用而受到了广泛的关注。LRTC问题旨在从不完整的数据中预测或恢复缺失的数据,其中的关键在于寻求原始数据最优的低秩近似。传统的张量补全方法往往考虑的是张量展开矩阵的低秩性,这些方法破坏了原始张量的多路结构,最终会导致性能降低。因此,如何找到原始高维数据更为紧凑的低秩表示,是张量补全领域的一个重要研究课题。近些年来,张量环(Tensor Ring,TR)分解由于在高阶数据表示方面的优越性,能在保证高阶数据质量的同时以更高的压缩比对高阶数据进行压缩,因而受到了许多学者的青睐。在运用张量环分解解决LRTC问题中,对张量环因子的低秩性的挖掘程度往往直接影响最终的效果,而这方面的研究仍处于起步阶段。因此本课题基于张量环分解,进一步研究其核心因子的低秩性,构建原始数据更为紧凑的分解模型,并应用于多维数据的恢复中。具体表现在:1.由于较大的非零奇异值会显著影响核范数但并不能真正影响起关键作用的秩,本文定义了张量环截断核范数,通过最小化张量环截断核范数来挖掘张量环因子的低秩性。较大的奇异值往往起主导作用,对研究张量环因子的低秩性意义不大,因此通过截断核范数可以减弱大奇异值的影响,从而找到更优的低秩近似。此外,本文将张量环截断核范数运用到多维数据恢复中,提供了相应的定理来辅助求解张量环截断核范数的优化问题,并设计了基于交替方向乘子法(Alternating Direction Method of Multipliers,ADMM)的优化算法框架。2.针对高阶多维数据,本文提供了一种分层分解的策略,以更低的参数量保存原始数据的低秩结构。在第一层中,利用TR的低秩性对原始数据进行紧凑张量环表示;在第二层,利用每个张量环核心因子的低秩性来寻求张量环核心因子的紧凑表示,从而挖掘到原始数据更为紧凑的低秩表示。此外,本文也将上述策略运用到张量补全问题中,并提出了基于块坐标下降(Block Coordinate Decent,BCD)的优化算法。通过该分层分解模型,原始张量各模态的低秩性可以得到充分利用,从而获得较好的张量补全性能。以上基于ADMM及BCD算法的收敛性都存在相应的理论保障,而且在后续的实验中也证明了所提出的算法均能收敛到一个平稳点。此外,大量的仿真数据、图像和视频数据的恢复实验表明,相比同类型的补全算法,本文提出的张量补全算法能获得更好的恢复效果和更高的处理效率。