关键词:
不平衡样本
CatBoost
故障诊断
SHAP
可解释性
摘要:
针对变压器故障数据分布不平衡而导致的故障诊断模型分类性能下降和模型诊断结果不可解释的问题,提出一种基于Borderline-SMOTE-CatBoost-SHAP的变压器故障诊断方法。首先,利用Borderline-SMOTE算法在保留少数类样本分布特征的同时对数据进行均衡化处理,解决故障数据分布不平衡造成的偏倚问题;然后,构建CatBoost变压器故障诊断模型,利用变压器的实际故障数据进行仿真实验,与不同数据均衡化方法和其他变压器故障诊断模型进行对比;最后,引入SHAP模型对CatBoost故障诊断模型进行可解释性分析,解决“黑箱模型”可解释性差的问题。实验表明,基于Borderline-SMOTE-CatBoost-SHAP的变压器故障诊断模型总体诊断准确率为92.99%,F1分数为0.91,Kappa系数为0.91,同时可视化输入特征对决策的影响程度与过程,验证了所提方法的有效性。