关键词:
肺腺癌
SHOX2
RASSF1A
甲基化
侵袭性
摘要:
目的 探讨基于SHOX2和RASSF1A甲基化水平的机器学习算法预测早期肺腺癌病理类型的准确性。方法 回顾性分析2021年1月—2023年1月在南通大学附属医院接受肺部肿瘤切除手术患者的石蜡包埋(formalin-fixed paraffin-embedded,FFPE)标本。根据肿瘤的病理学分类,将患者分为3组:良性肿瘤/原位腺癌(benign tumor/adenocarcinoma in situ,BT/AIS)组、微浸润腺癌(minimally invasive adenocarcinoma,MIA)组和浸润性腺癌(invasive adenocarcinoma,IA)组。使用LungMe试剂盒通过甲基化特异性PCR(MS-PCR)测量FFPE标本的SHOX2和RASSF1A甲基化水平。以SHOX2和RASSF1A的甲基化水平为预测变量,采用机器学习算法(包括逻辑回归、XGBoost、随机森林、朴素贝叶斯)预测不同的肺腺癌病理类型,并构建网络服务器供临床使用。结果 共纳入272例患者,BT/AIS组、MIA组和IA组患者的平均年龄分别为57.97岁、61.31岁和63.84岁;女性患者占比分别为55.38%、61.11%和61.36%。基于SHOX2和RASSF1A甲基化水平建立的早期肺腺癌预测模型中,随机森林与XGBoost模型在预测各病理类型时表现良好。随机森林模型的C统计量在BT/AIS组、MIA组和IA组分别为0.71、0.72和0.78。XGBoost模型的C统计量在BT/AIS组、MIA组和IA组分别为0.70、0.75和0.77。朴素贝叶斯模型仅在IA组表现较为稳健,C统计量为0.73,具有一定的预测能力。逻辑回归模型在各组中的表现最差,对各组均无预测能力。通过决策曲线分析,随机森林模型在BT/AIS和MIA病理类型的预测中展示了较高的净收益,表明其在临床应用中具有潜在价值。结论 基于SHOX2和RASSF1A甲基化水平的机器学习算法预测早期肺腺癌病理类型具有较高的准确性。