关键词:
张量
分布式
张量链
并行化
增量式
奇异值分解
摘要:
在信息化时代背景下,数据变得尤为重要,不同种类的数据层出不穷,数据量的急剧增长使得单机处理数据的效率难以满足现代应用的需求,因此数据分布式处理成为了一种必要的选择。其中,数据分布式处理中的关键问题之一是如何对数据进行有效的划分和分配,以保证处理效率和数据质量。同时,数据增长速度也越来越快,如何处理快速增加的数据也是一个亟需解决的问题。在此背景下,本文利用并行处理思想对张量链式分解问题进行研究,主要做了以下三个方面的工作:(1)提出了一种基于分块并行SVD的张量链式分解算法(BPTTD)。传统的张量链式分解算法需要存储大量的中间结果和计算过程,导致算法的运行效率较低,特别是对于高维大规模数据而言,算法的运行会受到严重阻碍。为了解决上述张量链式分解算法面临的问题,本文设计了一种新的张量链式分解算法。该算法首先将张量数据按列分块,然后将数据发送到计算机的不同计算核中分别处理,使得所能处理的数据量变得更多,同时可以提高Cache命中率,通过合理制定数据分配策略提高了算法的执行效率。实验结果表明,与传统张量链式分解算法相比,本章所提算法能够处理更大规模的张量,并且具有良好的并行效率。(2)提出了一种基于模态增长的增量式张量链式分解算法(MGITTD)。与传统算法相比,BPTTD算法具有一些优点,例如时间复杂度更小、处理张量规模更大等,但其也存在一定的局限性,例如难以处理增量数据、扩展性有上限等问题。为了解决这些问题,首先本文采用分布式系统来实现算法,使其具有良好的可扩展性,然后设计了增量式的SVD算法和基于模态的张量展开算法,以处理增量数据最后设计了子张量块奇异值分解的归并树,以合并中间结果。实验结果表明,该算法具有良好的扩展性,并且能够稳定处理增量数据。(3)本文以基于张量链的数据分布式处理方法为基础,设计并实现了一个完整的基于张量链式分解的轴承故障诊断系统,并阐述了该系统的模块构成以及模型架构。首先,介绍了系统的整体架构和每个层级的功能,然后按照不同功能模块分别介绍了系统的具体功能。最后,在系统上进行实验,结果表明,系统可以有效地对轴承数据进行故障诊断,并且可以输出诊断结果和故障类型。