关键词:
机器学习
图神经网络描述符
离子液体
二氧化碳
亨利系数
摘要:
CO2排放是气候变化的主要推动因素之一,有效的CO2捕集与储存技术的开发迫在眉睫.然而,设计高效的吸收过程的一个关键挑战是准确预测CO2在各种离子液体(ionic liquids, ILs)中的亨利系数.本文提出了一种结合图神经网络(graph neural network, GNN)和机器学习(machine learning, ML)框架用于预测CO2在ILs中的亨利系数.我们采用图卷积网络(graph convolutional networks GCN)、图注意力网络(graph attention networks, GAT)、图同构网络(graph isomorphism networks, GIN)和图样本聚合评估器(graph sample and aggregate networks, GraphSAGE)等四种图神经网络生成描述符,并将其与多种机器学习算法(K-nearest neighbors(KNN)、support vector regression(SVR)、random forest(RF)、gradient boosting regression trees(GBRT)、extreme gradient boosting(XGBoost))相结合,系统比较了这些组合在HLC预测中的表现.研究结果表明,图神经网络与树模型算法(如GBRT、XGBoost、RF)的结合显著优于KNN和SVR组合.其中, GNN+GBRT在训练集上的表现最佳,而GNN+XGBoost在测试集上表现最优.此外, GCN生成的描述符整体性能略优,这证明了GCN在处理复杂分子结构数据方面的强大能力,可以用来构建高精度的CO2亨利系数预测模型.该框架在CO2亨利系数预测中的成功应用为CO2捕集技术的优化提供了有力支持,从而推进了环境技术与可持续工程的发展.