关键词:
结直肠癌
机器学习
炎症生物标志物
列线图
生存模型
摘要:
目的 利用可解释性轻度提升机(LightGBM)算法及炎症生物标志物构建结直肠癌(CRC)患者术后的生存预测模型,为CRC患者的预后提供参考。方法 回顾性收集并分析了2016年1月-2023年1月克拉玛依市中心医院收治的437例CRC患者的相关实验室及临床资料,采用7:3的比例将研究对象分为训练集和验证集,其中训练集305例,验证集132例。采用LASSO回归算法进行初步变量筛选,使用LightGBM和Shapley加性解释(SHAP)进行进一步特征选取,并通过Cox回归模型构建列线图。最终通过区分度、校准度对模型效能进行评估,并绘制Kaplan-Meier风险分层曲线确定组间差异。结果 总生存期(OS)模型纳入变量为是否转移、年龄、格拉斯哥预后指数(GPS)、肠梗阻及血红蛋白(HB);肿瘤特异性生存期(CSS)模型为是否转移、肠梗阻、GPS、癌胚抗原(CEA)及年龄。Cox回归结果显示,OS模型中是否转移(HR:4.71,P<0.01)、年龄(HR:1.82,P<0.01)、GPS(HR:1.64,P<0.01)、肠梗阻(HR:1.64,P<0.05)、HB(HR:0.45,P<0.01);CSS模型中是否转移(HR:8.16,P<0.01)、肠梗阻(HR:1.73,P<0.05)、CEA(HR:1.69,P=0.06)、GPS(HR:1.63,P<0.01)、年龄(HR:1.76,P<0.01)。一致性指数(C指数)、受试者工作特征(ROC)曲线和时间依赖性的曲线(ROC曲线下面积AUC)结果显示模型在不同时间下均具有较好的区分度。校准曲线显示不同时间模型曲线与理想预测线均接近,显示出较好的校准度。生存曲线显示高风险组的生存概率显著低于低风险组(P<0.001)。结论 本研究构建了方便、直观且高效的CRC生存列线图模型,在CRC患者生存预测方面表现出优秀的性能,有助于临床医生为CRC患者提供准确地个体化预后评估,辅助制定科学的康复随访计划。