关键词:
皮肤癌预测
高维多目标优化
张量分解
局部张量分解
摘要:
随着分子生物学和皮肤癌预测技术的交叉协同发展,皮肤癌的早期诊断得到了长足的进步。微型核糖核酸分子(mi RNAs)作为潜在的无创预测和疾病诊断工具,使得预测mi RNAs与皮肤癌之间的关联成为有效的皮肤癌预测方法,虽然,其早期的二元关联预测具有较高的精度,但在面临高维数据时难以捕获不同类型皮肤癌中mi RNAs的高阶特征差异。为在保护数据完整性的同时提升预测性能,张量分解技术将高维数据完整地保存为张量形式并填补其中的缺失值,从而达到预测的目的。现有基于张量分解的mi RNAs与皮肤癌之间关联预测的研究主要集中在利用全局张量分解模型作为内核并结合相似性约束来学习数据的整体结构。然而,全局张量分解模型难以精确捕获张量的局部结构,同时忽略了数据之间普遍存在的局部相似性,并且大多数研究忽略了实际应用中患者和医生对预测结果可信度和多样性的需求。针对上述问题,本文旨在探寻准确、全面,可信的张量分解方法,提出了高维多目标局部张量分解方法,设计高效的高维多目标优化算法对模型进行求解。全文主要贡献为:
(1)考虑到全局张量分解模型难以精确捕获张量的局部结构和数据的局部相似性,本章设计了维度分片策略,对全局张量进行切片再重组来构造高维多目标局部张量分解模型,同时优化准确性、全面性、可信度和多样性四个目标。针对该模型的求解,提出了一种修正策略,以修正进化过程中出现的不适用于模型的个体,对比多个基线张量分解方法验证本文所设计的模型在四个预测目标上具有更好的性能表现。
(2)维度分片只考虑了单一维度上的相似信息,为了充分利用数据局部相似性进而提升局部张量分解性能,本章设计了灵活分块策略驱动的高维多目标局部张量环分解模型,通过对全局张量的3-模态纤维聚类再重组,改善了维度分片重组的局部子张量未能充分捕获数据局部相似性的问题。此外,TR分解能通过灵活的环状结构极大程度的捕获高阶张量的低阶特征,因此本文第三章采用TR分解代替传统局部张量分解方法中的CP分解。为增强模型对局部张量结构的表示能力,本章引入了类内相似性目标,并同时优化准确性、全面性、可信度、多样性和类内相似性五个目标。在真实数据集上验证了该模型的有效性。
(3)在求解上述高维多目标优化模型的过程中,遗传算法由于目标空间维度的增加逐渐丧失选择压力,导致解集的收敛性与多样性难以保障。本文针对这一问题,提出了一种多种群高维多目标粒子群优化算法,通过融合螺旋搜索策略和麻雀警戒策略改进粒子群优化算法,并将其与协同多种群多目标框架相集成,使该算法在高维多目标问题上具有较好的寻解能力。实验结果表明,该算法在基准测试集上有显著优势,且在求解本文提出的高维多目标局部张量分解模型时也有更好的表现。