一种基于粒子群寻优XGBoost的油浸式变压器故障诊断方法-好方法网

技术摘要：
本发明涉及变压器检测技术领域，具体涉及一种基于粒子群寻优XGBoost的油浸式变压器故障诊断方法，包括步骤：A）收集油浸式变压器故障数据，获得样本数据集S；B）对数据进行预处理，将样本数据集S划分为训练数据集L和测试数据集T；C）建立CART弱分类器模型，训练并测试全部
背景技术：
在油浸式变压器绝缘老化的过程中会产生少量气体溶解在绝缘油中，油中气体的组成成分以及各种成分之间的比例关系能够反映变压器不同的故障状态。溶解气体分析 (Dissolved Gas Analysis,DGA)方法是最为重要的变压器状态检测和故障诊断方法之一。近年来，不少学者将机器学习的方法应用于变压器故障诊断模型的建模中，如BP神经网络、支持向量机、贝叶斯网络等，取得了较好的诊断效果。上述方法改进了传统模型的计算速度和精度，但也存在问题：例如BP神经网络学习能力强，但易陷入局部最优,需要大量参数，且收敛速度较慢；支持向量机本质为二分类器，在处理变压器故障诊断这种多分类问题时效率较低；贝叶斯网络要求条件属性较多等。因而需要寻找一种效率和准确率兼顾的变压器故障诊断技术。中国专利CN101587155A，公开日2009年11月25日，一种油浸式变压器故障诊断方法，该方法首先获取样本，对样本中的5种气体浓度数据进行归一化处理，形成训练样本集和测试样本集；确定基本核函数的个数及每个基核的参数，使用交叉验证的方法确定最优的惩罚参数；根据最优惩罚参数，利用训练样本和多分类多核学习方法得到相应的分类模型；利用训练好的分类模型对验证集中的待测试样本进行故障诊断。其能够获得较好的诊断准确率，但其模型采用参数过多，效率低下，且容易出现震荡和不收敛。
技术实现要素：
本发明要解决的技术问题是：目前缺乏兼顾效率和准确率的变压器故障诊断技术。提出了一种基于粒子群寻优XGBoost的油浸式变压器故障诊断方法，本方法使用改进的分类器模型，提高了变压器故障诊断的效率和准确率。为解决上述技术问题，本发明所采取的技术方案为：一种基于粒子群寻优XGBoost 的油浸式变压器故障诊断方法，包括步骤：A)收集油浸式变压器故障数据，并关联故障标签，获得样本数据集S；B)对样本数据集S中的数据进行预处理，将样本数据集S划分为训练数据集L和测试数据集T；C)建立CART弱分类器模型，采用加法学习方式训练弱分类器，并使用测试数据集T测试，直到预测正确率达到预设值，得到油浸式变压器的XGBoost故障诊断模型；D)利用步骤C)获得的油浸式变压器的XGBoost故障诊断模型对待测油浸式变压器数据进行预测，得到故障诊断结果。通过建立CART弱分类器模型，并进行训练，获得能够识别变压器故障的分类模型，通过对数据进行预处理能够提高弱分类器模型训练的效率和准确度，最终提高变压器故障检测的效率和准确度。作为优选，步骤1中将油浸式变压器故障时特征气体H2、CH4、C2H6、C2H4、C2H2的浓度的比值关系作为油浸式变压器故障数据，用作故障模型的输入特征。在油浸式变压器绝 4 CN 111612036 A 说　明　书 2/4 页缘老化的过程中会产生少量气体溶解在绝缘油中，油中气体的组成成分以及各种成分之间的比例关系能够反映变压器不同的故障状态。作为优选，所述油浸式变压器故障数据包括ρ(CH4)/ρ(H2)、ρ(C2H4)/ρ(C2H2)、ρ (C2H4)/ρ(C2H6)、ρ(C2H2)/ρ(C1 C2)、ρ(H2)/ρ(H2 C1 C2)、ρ(C2H4)/ρ(C1 C2)、ρ(CH4)/ρ (C1 C2)、ρ(C2H6)/ρ(C1 C2)以及ρ(CH4 C2H4)/ρ(C1 C2)，ρ()表示气体浓度。申请人通过经验积累，发现仅仅依靠浓度作为特征参数进行故障的诊断，并不能准确的反映变压器的故障，不同故障导致变压器油老化析出的气体成分不同，通过跟踪气体成分的比例，能够更加准确的判断变压器油主要析出的气体成分，进而推断出相应的故障。作为优选，步骤A)中油浸式变压器的故障标签包括低温过热、中温过热、高温过热、局部放电、低能放电、高能放电、低能放电兼过热以及高能放电兼过热。能够全面的反映变压器的各种故障，提高检测结果的参考价值。作为优选，步骤B)中，将样本数据集S划分为训练数据集L和测试数据集T的方法为：从样本数据集S中随机抽取90％作为训练数据集L，余下的10％数据作为测试数据集T。作为优选，步骤B)中，对样本数据集S中的数据进行预处理的方法为：式中，x、y为样本集S中的数据，lrdk(x)为数据x的局部可达密度，lrdk(y)为数据y的局部可达密度，Nk(x)为数据x的k距离邻域距离，设定局部离群因子的阈值LOFth，将LOFk(x)大于阈值LOFth的数据判定为离群点并剔除，k为设定常数。通过局部可达密度的特征，能够有效发现和剔除离群点，提高分类的准确性。作为优选，步骤C)中，为CART弱分类器模型建立的评价函数L(φ)为：其中，为第i个输入训练样本的预测结果，yi为第i个输入训练样本的标签值，为损失函数，t为已输入训练样本的数量，Ω(fi)为正则项， Ω0为预设常数项，ωi为第i个输入的训练样本。通过加法训练方法，提高分类器训练的效率，通过添加正则项，避免过拟合，提高分类器的准确度。作为优选，步骤C)中，采用加法学习方式训练弱分类器的方法为：从一个常数预测开始，每次向模型中加入一个新的函数，学习当前的模型，即：其中，为第i个样本在第t次训练中的预测值。作为优选，第t次训练模型预测值等于(t-1)次训练模型预测值加上ft，即： 5 CN 111612036 A 说　明　书 3/4 页将上式进行二阶泰勒展开，其中，为损失函数的一阶、二阶梯度数据，移除常数项，得到第t次训练模型的简化的目标函数：本发明的实质性效果是：通过建立CART弱分类器模型，并进行训练，获得能够识别变压器故障的分类模型，实现变压器故障的快速识别；在油浸式变压器绝缘老化的过程中会产生少量气体溶解在绝缘油中，油中气体的组成成分以及各种成分之间的比例关系能够反映变压器不同的故障状态，提高分类器训练的效率和准确度。附图说明图1为实施例一油浸式变压器故障诊断方法流程框图。

相关推荐