关键词:
张量鲁棒主成分分析
低秩张量补全
张量奇异值分解
非局部先验
离散余弦变换
摘要:
随着多媒体技术的飞速发展,视觉数据作为信息的载体,在人们的生产生活中发挥着越来越重要的作用,如医疗诊断、遥感探测、安全监控等。然而,受采集设备、传输线路及自然环境等外界干扰因素的影响,所获得视觉数据经常被噪声破坏或者出现像素缺失的问题。因此,如何准确复原损坏的视觉数据是计算机视觉领域中一个亟待解决的问题。通常视觉数据中包含着大量的冗余信息,这意味着视觉数据内部具有较强的相关性。因此,视觉数据可以用低秩张量来近似表示。受此启发,许多研究采用低秩张量模型对损坏的视觉数据进行修复。其中,张量鲁棒主成分分析和低秩张量补全是两类较为重要的模型。前者可以去除含噪视觉数据中的噪声,后者可以填充不完整视觉数据中的缺失像素值。尽管这两类方法在视觉数据修复中已经取得了较好的性能,但它们仍然存在一些不足。例如,忽略了张量奇异值之间的差异、没有充分利用视觉数据的非局部冗余、无法准确地刻画张量的低秩性等。为了解决上述问题,本文提出两种新的低秩张量复原模型,并将其应用到视觉数据复原任务当中。具体的工作如下:(1)通过研究不同张量奇异值所代表信息的特点,提出了一种非凸张量鲁棒主成分分析(N-TRPCA)模型。不同于传统的张量鲁棒主成分分析,N-TRPCA可以自适应地使用不同阈值来收缩张量奇异值,从而更好地保留视觉数据中的重要信息。此外,张量鲁棒主成分分析假设整个数据张量是低秩的,而在自然视觉数据当中,这一假设很难得到满足。这在一定程度上限制了张量鲁棒主成分分析从含噪视觉数据中恢复边缘和纹理细节的能力。为了解决这个问题,本文在N-TRPCA的基础上引入了非局部先验,进一步构建出基于非凸非局部正则化的张量鲁棒主成分分析模型(NNTRPCA)。大量的实验结果表明,相较于新近的张量鲁棒主成分分析模型,N-TRPCA和NN-TRPCA在彩色图像和灰度视频去噪任务中都取得了很好的性能。(2)进一步地,本文提出了一种基于离散余弦变换的加权张量Schatten p-范数,并将其应用到低秩张量补全模型当中。该范数不仅区别地对待了张量奇异值,还采用了离散余弦变换(DCT)代替张量奇异值分解中的离散傅里叶变换。这就使模型在保留视觉数据中重要信息的同时,充分捕捉张量的低秩性。此外,实际应用中的视觉数据往往会同时出现像素缺失和被噪声污染的问题,而大多数低秩张量补全模型仅能够填充不完整张量中的缺失像素值,却未能很好地抑制噪声。为了解决这个问题,本文引入一个稀疏约束项到低秩张量补全模型中,并提出一种基于DCT的非凸鲁棒张量补全(CN-RTC)模型。大量的实验结果证明该模型在视觉数据补全任务中优于其他的补全模型。上述模型是基于张量奇异值分解框架的非凸低秩张量复原模型。它们通过非凸范数不同程度地收缩张量奇异值,从而保留了视觉数据中的重要信息,并进一步提升了低秩张量复原的性能。其中,NN-TRPCA利用非局部自相似性,更好地修复了视觉数据中的边缘和纹理细节;CN-RTC将DCT作为张量奇异值分解中的变换,获得更低秩的张量用于视觉数据复原。虽然上述模型都在视觉数据复原任务中表现出优异的性能,但它们只关注于三维视觉数据,在面对更高维视觉数据时仍存在挑战。因此,文章最后分析了上述模型在未来的可能扩展方向。