关键词:
气体敏感材料
材料数据库
敏感性
机器学习
摘要:
得益于“大数据”时代,以及高通量制备和表征技术的发展,加速材料研发已然成为材料科学研究者关注的热点,基于大数据下的材料数据库平台更是材料基因工程发展的重点。因此,建立材料数据库平台,并利用机器学习模型对气敏材料的敏感性进行预测对于缩短新材料研发周期、高效管理并利用已有数据资源具有重要意义。气体敏感材料性能的影响条件多变,基于不同敏感机制的测试方法各不相同,尤其缺乏获得大样本气敏性能数据的高通量测试平台,造成目前气敏材料性能数据库研究处于起步阶段。本研究从课题组自主研制的气敏材料并行合成和高通量性能筛选平台获得的大样本数据量为基础,结合高通量测试和筛选试验中涉及的材料类型、工作温度、目标气体种类等可变参量,从气敏材料数据的内容与特点出发,基于灵活的实体-属性-值模式设计了数据库整体结构,构建了气体敏感材料性能数据库。主要研究内容如下:(1)数据库前台查询系统使用HTML、CSS、JS、JS render等技术,后台管理系统使用PHP框架Laravel,以My SQL为数据库,构建了气体敏感材料性能数据库系统。分为前端操作系统与后台管理系统,前端操作系统实现了对气敏数据常规属性查询和性能信息查询,后台操作系统实现了对数据和用户的管理。(2)采用Python设计程序,实现批量处理高通量测试平台生成气敏数据,自动上传与响应值的计算,简化了数据入库的繁杂过程,极大的提高了气敏材料数据收集及计算效率,目前已存有效气敏数据21.46万条,促进了气敏材料数据资源的挖掘与共享。(3)利用数据库收集到的数据集,利用随机森林(random forest)、多层感知机(Multilayer Perceptron,MLP)、XGBoost回归等模型对气敏材料敏感性进行预测,综合Score、RMSE、Time等模型判断标准,XGBoost回归模型以决定系数Score值0.863、均方根误差RMSE值26.412、Time值39.1,评价为最优气敏材料敏感性预测模型。