关键词:
线粒体自噬
类风湿关节炎
机器学习算法
加权基因共表达网络分析
预测模型
外部验证
免疫细胞
生物学功能风险
摘要:
背景:类风湿关节炎发病机制至今尚未完全清晰,近来有研究表明线粒体自噬与类风湿关节炎存在关联性,但关键机制有待深入探究。目的:利用多机器学习算法鉴定和验证类风湿关节炎中线粒体自噬过程的核心互作基因并解析其免疫调控过程。方法:从GEO数据库整理类风湿关节炎转录组表达数据集GSE15573作为独立训练集,GSE97779和GSE55235合集作为独立验证集。利用训练集筛选类风湿关节炎差异表达基因,同时进行“WGCNA”分析。然后从“MitoCarta3.0”数据库下载线粒体自噬相关基因,将其与类风湿关节炎差异基因和“WGCNA”分析模块基因取交集获得类风湿关节炎-线粒体自噬相关基因,将相关基因进行功能富集分析以明确细胞通路。随后利用“Random Forest”和“LASSO”2种机器学习算法分别筛选特征基因,利用“GMM”机器学习算法对前2种机器学习算法筛选的交集基因拟合验证,以获得类风湿关节炎-线粒体自噬核心互作基因。进一步建立预测模型,并利用外部验证集验证。最后,采用“CIBERSORT”进行免疫浸润分析此过程中免疫细胞亚群占比及亚群之间关联性,采用“ssGSEA”分析类风湿关节炎-线粒体自噬核心互作基因与免疫细胞亚群间关联性,同时分析核心互作基因的相关“GO”“KEGG”生物学通路。结果与结论:(1)差异分析获得807个类风湿关节炎差异表达基因,“WGCNA”分析筛选出2个特征模块含1 208个基因,线粒体基因数据库整理出1 136个基因,三部分基因取交集获得53个基因为类风湿关节炎-线粒体自噬相关基因;(2)相关基因的功能富集分析结果显示细胞过程主要与线粒体自噬、过氧化物酶体代谢、细胞衰老、坏死性凋亡相关;(3)3种机器学习算法鉴定出4个类风湿关节炎-线粒体自噬核心互作基因(DNAJA3、C12orf65、AKR7A2、PDHB);(4)预测模型的风险评分受试者工作特征曲线下面积为0.989,外部患者样本的工作特征曲线验证类风湿关节炎-线粒体自噬核心互作基因的曲线下面积均大于0.7;(5)免疫调控分析显示类风湿关节炎中线粒体自噬过程与记忆B细胞、M0型巨噬细胞、活化的记忆性CD4 T细胞、静息态记忆性CD4 T细胞密切相关;(6)生物学通路分析结果显示核心互作基因与821条“GO”通路强相关(|cor|> 0.8,P <0.001),与48条“KEGG”通路强相关(|cor|> 0.8,P <0.001),其中关键生物学过程与线粒体DNA代谢、线粒体DNA修复、线粒体DNA复制、线粒体基因组维护、线粒体去极化的正向调控和参与凋亡信号通路的线粒体外膜通透性的正向调控有关;(7)上述结果证实,DNAJA3、C12orf65、AKR7A2、PDHB是类风湿关节炎中线粒体自噬过程的核心互作基因,通过参与特定免疫过程在疾病进展中发挥关键作用,对类风湿关节炎的诊断具有精准预测效果。