关键词:
电力变压器
故障诊断
机器学习
不平衡数据
模型融合
摘要:
变压器是电力系统中承担电能转换的关键设备,其运行状态直接影响电力系统的正常运行,一旦发生运行故障,可能对电力系统产生极大的威胁,造成巨大的经济损失。随着智能电网建设不断推进,机器学习在变压器故障智能诊断方面表现出了强大的泛化能力,为变压器故障诊断研究提供更加科学、可靠的发展途径和技术方案。本文基于机器学习算法,对数据预处理、样本平衡处理、超参数优化进行重点研究,并提出改进Stacking融合模型进行变压器故障智能诊断。首先,针对原始数据特征表征能力不足问题,本文融入比值计算规则进行特征衍生,增强机器学习算法的数据处理和推断能力。在此基础上,对数据进行归一化处理,利用互信息计算样本特征与标签的相关性,验证特征衍生的可行性,筛选出重要特征,减少模型的计算复杂度。由于变压器故障状态的分布特性,数据集中存在严重的类别不平衡问题。本文设计条件生成对抗网络,进行数据平衡处理,改善传统采样算法噪声干扰带来的缺陷,采用传统采样算法中的SMOTE、Borderline-SMOTE、ADASYN进行对比实验,利用KS检验定量评估生成样本的质量。对比实验结果显示,条件生成对抗网络能根据真实数据的多维特征生成高质量样本,具有较强的稳定性和可靠性。其次,针对机器学习算法复杂的超参数问题,本文使用TPE超参数优化算法不断搜索最优参数组合。将平衡后的训练集分别输入到随机森林、XGBoost、Light GBM、Cat Boost四种机器学习算法模型,进行变压器故障诊断。根据超参数的重要性排行分析结果,设定更加科学的参数范围和空间,显著提高优化搜索效率。经过多轮迭代训练后,计算出模型最佳性能时的超参数取值,大幅度提高了超参数的搜索效率和算法模型的整体性能。对比实验结果显示,未优化前,随机森林、XGBoost、Light GBM、Cat Boost的故障诊断准确率分别为73.33%、82.15%、82.58%、82.37%。经TPE超参数优化后,故障诊断准确率提升至80.22%、88.39%、88.60%、88.82%。最后,针对单一算法模型容易陷入局部最优解、鲁棒性差的问题,本文采用四种多模型算法融合策略进行对比实验。其中,Stacking融合表现最好,准确率为89.46%。在Stacking融合的基础上,利用数据原始特性,本文设计改进Stacking融合模型,对变压器故障逐级进行诊断。第一层Stacking分类器对正常、放电故障和过热故障三种广义标签进行训练,将输出广义标签概率与原始输入进行特征融合,输入到下一层Stacking分类器进行训练,并诊断出七种具体状态类型,准确率提升至92.26%。经多组对比实验证明,本文所设计的改进Stacking融合模型性能有显著提升,为具有复杂层次结构的变压器故障诊断问题提供了一种有效的解决方案。