关键词:
恶劣天气
CatBoost
特征工程
电网设备故障
预测模型
摘要:
恶劣天气对电网设备故障的发生有着显著影响,进而威胁电网的安全运行。综合气象特征与地理信息特征,提出一种恶劣天气下基于CatBoost(分类数据提升树)算法的电网设备故障预测模型。首先收集故障信息、实时气象和地理信息等原始数据,并使用MICE Forest(多重插补随机森林)算法填补缺失值;然后根据数据特征属性进行特征衍生得到时间、气象等方面的8个新特征,并利用递归特征消除方法结合交叉验证方法,评估特征的重要度,选取重要度最高的特征作为输入来构建模型;接着以最高准确率为优化目标,使用贝叶斯算法得到模型最优参数;最后在测试集上对模型准确率、精确率和调和均值F1进行验证。结果表明:提取得到的新特征有助于提高模型的预测精度,并且,与其他模型相比具有更高的预测精度,其准确率为0.831,精确率为0.858,调和均值为0.756。