关键词:
机器学习
二维共价有机框架
高维神经网络势
晶体群
蛙跳算法
摘要:
纵观历史,每一次科学技术的革命都离不开新材料的发现,可以说材料推动着人类社会进步。传统的材料研发方式主要依赖于试错法,即通过大量基于经验的实验反复尝试,其局限性使得新材料研发的周期长、成本高,因此如何找到一种高效、节能的新方法是新材料研发中的关键科学问题。随着量子力学的建立以及计算机的出现,人们开始利用计算机来进行材料设计并对其物理、化学性质进行模拟,并且依据模拟结果为实验合成提供思路。
虽然随着计算机硬件技术的发展,计算模拟在材料研发方面的应用越来越广泛,但它仍然存在着不足,那就是快与准不可兼得。经验模型虽然计算速度较快但其计算精度较差,例如经典分子动力学,底层模型虽然计算精度较高但其计算速度较慢,例如第一原理方法。此外,随着材料数据爆炸式增加,人们渴望获得这些已知材料中所感兴趣的物理或化学性质并从中找到符合自己要求的材料。然而,采用传统的计算模拟方法对几千甚至上万种材料进行计算无论是对计算资源还是时间都是巨大的消耗。为了解决这些问题,人们开始采用一种新的方法,这种方法就是机器学习。本文的主要内容就是介绍机器学习如何解决以上的这些问题,并展示其在材料结构与电子性质预测方面的潜力。
第1章中,我们首先介绍了目前机器学习在材料科学领域的应用以及本文所采用的机器学习方法。由于本文中大部分数据是通过基于密度泛函理论的第一性原理计算得到的,因此,本章的第二部分介绍了密度泛函理论以及相关的交换关联泛函。
第2章中,我们构建一个工作流对二维COF的带边能级位置(VBM和CBM)进行预测。首先,基于图神经网络方法,利用组成二维COF的分子基元的轨道能量和二维COF拓扑构型构建描述元,对PBE泛函下二维COF的VBM和CBM进行预测。随后,基于线性回归与岭回归方法得到PBE泛函和HSE06杂化泛函计算结果之间的线性关系。结合上述两个机器学习模型,得到预测二维COF带边能级位置(VBM与CBM)的工作流,并且基于该工作流筛选得到可用于全光解水与深紫外光电探测器的二维COF体系。
第3章中,我们介绍了高维神经网络势的构建。首先介绍了高维神经网络势的基本框架,以及如何采用对称函数描述体系中每个原子周围的化学环境,并将其作为描述元用于高维神经网络势的输入。最后,以包含60个硼原子的体系为例,介绍了高维神经网络势的实现与应用。基于训练集的结果表明,高维神经网络势能够拟合体系的原子结构与第一性原理计算得到的体系能量之间的关系,即与经典分子动力学相比,经过充分的训练,那么利用高维神经网络势就可以获得媲美第一性原理计算的结果。
第4章中,基于深度学习方法,我们建立了通过化学组成来预测其稳定化合物晶体群的模型。本章中,我们建立了两个预测模型,一个模型是从230个晶体群中预测给定的稳定化合物所属的晶体群,另一个模型则是从18个数据集中出现频率最多的晶体群以及剩余晶体群所组成的新标签中预测给定的稳定化合物所属的标签。结果表明,我们可以利用深度学习在化学组成与所形成的稳定化合物所属的晶体群之间搭建一个桥梁,从而可以通过化学组成预测其所形成的稳定化合物最可能属于的晶体群。
第5章中,我们对所有工作进行了总结,同时我们指出了我们工作目前的局限性,并对未来的工作进行了展望。
在附录A中,我们研究了蛙跳算法在晶体结构搜索中的应用,介绍了蛙跳算法的原理以及在晶体结构搜索应用的实现。之后,通过对Si晶体的结构搜索说明了蛙跳算法的有效性。最后,我们指出高维神经网络势、晶体群预测的深度学习模型以及蛙跳算法的结合可以提高晶体结构搜索效率。
在附录B中,我们将采用DFT计算的PBE泛函下二维COF的VBM与CBM以及采用机器学习预测的HSE06泛函下二维COF的VBM与CBM总结成一张图表来进行展示。
在附录C中,我们介绍了为储存我们在第2章的工作中通过DFT计算与机器学习预测所得到的数据而建立的二维COF数据库,并且我们对二维COF数据库未来的发展进行了展望。