关键词:
影像基因组学
亚型诊断
数据融合
预后模型
摘要:
非小细胞肺癌(Non-Small Cell Lung Cancer,NSCLC)构成了肺癌病例的主体,而晚期非小细胞肺癌病例的生存率不足5%,严重威胁人类生命健康。肺癌亚型的精准诊断是制定治疗方案的基础,也是指导生存预后的关键因素。当前,深度学习在医学影像组学、基因组学等单一领域内已取得显著进展,但多模态、多组学的数据融合方法才是如今的主流,为肺癌诊断开辟了新的途径。然而,多组学数据融合方法也面临着数据的复杂异质性、高维稀疏性和易缺失性,以及数据隐私性等问题,均需要一一解决。
针对上述存在的问题,本文结合多中心数据资源,运用生物信息学与深度学习技术,探究多组学对非小细胞肺癌的亚型分类与生存预后问题,取得了以下关键成果:
(1)提出一种融合影像基因数据的非小细胞肺癌亚型分类方法(Multimodal Imaging and Genomic Data Integration for Subtyping Non-Small Cell Lung Cancer,MISM)。该方法利用改进的Efficient Net-V1网络,从影像病理数据ROI区域中提取具有区分度的特征;接着,通过生成对抗网络提取基因组学数据中的重要突变特征;随后,将通过两种特征数据进行拼接融合,借助交叉注意力机制突出与肺癌亚型分类最相关的特征,增强模型对分类决策的可解释性。结果显示,在TCGA肺癌数据集上,实现更精准的肺癌亚型诊断。
(2)提出一种基于多组学的非小细胞肺癌生存预后方法(Medical Imaging and Genomic Survival Analysis,MIGS)。该方法构建双分支特征模型,分别从CT影像中提取全局语义和局部细节特征,将其拼接为融合特征;同时,利用自动编码器从基因表达数据中提取重要的基因特征进行降维;最后,通过Cox风险评分计算每个患者的两个风险评分,结合临床风险因素构建一个融合生存模型。结果表明,多组学数据融合能够提高患者的生存预后效果。
(3)开发一套多组学的肺癌亚型智能诊断系统(Intelligent Diagnosis System for Lung Cancer Subtypes based on Multi-Omics Analysis,IDS-LCMA),采用微内核、可插拔的架构,集成包括MISM和MIGS在内的多种方法,实现肺癌亚型的诊断。