关键词:
张量环分解
低秩张量补全
LP范数
TR因子
交替方向乘子法
摘要:
随着计算机网络和人工智能的高速发展,数据量在成倍增长的同时,很多领域的数据呈现出高阶化的特点,比如图像恢复和社交网络等,分析这些数据自身复杂的结构特性和其中蕴含的物理意义,能够带来很有价值的信息。然而数据在采集或传输的过程中会面临着数据丢失的问题,如何恢复高阶缺失数据已成为信息技术领域的研究热点之一。张量分解作为处理高阶数据的典型代表,有着独特的天然优势,许多基于低秩张量表示的模型相继被提出,并广泛的应用于人工智能、模式识别和图像分类等领域。近年来,由于张量环分解(Tensor Ring Decomposition,TR)在数据维数较大的情况下能更为充分的挖掘张量的低秩表示,保留原有张量数据的空间结构信息,而且可以有效避免高阶数据的维度灾难问题,受到众多学者们的讨论和研究。针对高阶数据缺失的问题,本文在张量环分解的基础上,研究出非凸优化的低秩张量环补全模型。具体地,本文提出两种基于L范数约束的张量环秩最小化模型,分别设计两种对应的高效优化算法,将其应用于张量数据的补全任务中,对比其他张量补全模型来验证本文提出方法的高效性。张量环核范数的模型对TR秩的近似有一定的误差,这种方法对每个奇异值都一视同仁,忽略了其物理意义,在实际应用中往往导致解的次优性。为了缓解这一缺陷,本文选取比核范数更为逼近的L范数作为秩最小化的替代,提出了一种基于张量L范数的非凸张量环秩最小化(L)模型。具体地,该方法在TR展开矩阵上施加了L范数约束,使得模型能够更加准确的逼近TR秩。与此同时,将加权奇异值阈值算法应用其中,更好的促进模型求解的低秩性。为了有效地求解所提出的非凸模型,本文采用交替方向乘子法(ADMM)对该模型实现更新优化。在大量的彩色图片和视频补全实验中,对比了多种张量补全算法,实验结果表明本文提出的L模型的补全性能指标均优于同类型的算法。此外该方法具有足够的通用性,可以推广到其他张量分解中,从而开发出更加有效和鲁棒的算法。为解决大规模张量补全时的高计算损耗问题,本文提出了基于潜在TR因子的L范数张量环(L)补全模型,将张量环秩最小化问题转化到尺度小得多的潜在TR核心上,大规模地降低了张量环秩最小化的计算损耗。具体来说,该方法通过张量环分解的操作,对每个张量TR因子展开的矩阵进行L范数的低秩约束,建立了高效的张量环秩最小化模型,有效地解决了手动地选择张量环秩的难题。与此同时,本文采用交替方向乘子法对该模型实现更新优化,在大量不同类型的数据补全实验结果和数据表明,本文提出的L算法相对于其他张量补全方法具有较优的补全效果。