关键词:
人工智能
肝硬化
肝性脑病
血红蛋白类
摘要:
目的用机器学习算法构建肝硬化相关肝性脑病(HE)的预测模型并验证,评价该模型的预测效能。方法收集2018年1月—2019年12月吉林大学第一医院病历系统及实验室信息系统中肝硬化患者(4537例)的临床资料进行回顾性分析。根据纳入和排除标准,最终474例患者纳入研究。数据集1纳入2018年1—12月肝硬化无HE患者(113例)和肝硬化并发HE患者(108例),用于对肝硬化并发HE风险预测模型进行特征筛选、模型建立、最优算法选择和内部验证;数据集2纳入2019年1—12月肝硬化无HE患者(133例)和肝硬化并发HE患者(120例),用于外部验证。使用Lasso回归筛选特征变量,并采用极度梯度提升(XGBoost)、轻量级梯度提升(LightGBM)、随机森林(RF)及支持向量机(SVM)4种机器学习算法进行模型建立和内部验证,采用DeLong检验比较4种模型对HE的预测效能,结合特异度或敏感度选择最优算法。用受试者工作特征(ROC)曲线、校准曲线和临床决策曲线评价4种模型的预测效能,预测概率的准确性及临床实用性。结果提取数据集1中数据缺失率<30%的46个检验项目作为建模待选变量,使用Lasso回归筛选得到7个特征变量,包括血红蛋白、总胆汁酸、胆碱酯酶、总胆红素、肌酐、凝血酶原活动度及血小板。LightGBM算法建立的预测模型(HE-Lab7模型)预测HE的曲线下面积(AUC)为0.880,均高于XGBoost、RF和SVM算法(P均<0.05),敏感度为0.825、特异度为0.836。校准曲线Brier分数为0.147,表明该模型的预测概率与实际发生概率吻合良好。临床决策曲线表明该模型具有较高的临床效益。数据集2中,HE-Lab7模型预测HE的AUC为0.775,敏感度为0.927,特异度为0.758。结论利用检验大数据以4种机器学习算法为基础,基于最优LightGBM算法开发得到的肝硬化相关HE风险预测模型的预测效能良好,为早期预测与识别肝硬化相关HE提供参考依据。