摘要:近幾年,對于變壓器故障診斷的研究逐漸增加,提高其診斷準(zhǔn)確率具有明確的價(jià)值。以往常用的診斷方法雖然具有一定準(zhǔn)確率,但效率較低,缺乏時(shí)效性。隨著對于機(jī)器學(xué)習(xí)的相關(guān)研究不斷深入,其在變壓器故障診斷中的應(yīng)用逐漸被發(fā)現(xiàn)。基于機(jī)器學(xué)習(xí),分別在K鄰近(K-NearestNeighbors,KNN)算法、決策樹(DecisionTree,DT)算法、支持向量機(jī)(SupportVectorMachine,SVM)算法3方面搭建了診斷模型,并進(jìn)行了縱橫交叉優(yōu)化(CrisscrossOptimization,CSO)算法的超參數(shù)優(yōu)化模型搭建。最后,經(jīng)過仿真實(shí)驗(yàn)驗(yàn)證可知,經(jīng)CSO優(yōu)化后,3種診斷模型的準(zhǔn)確率和平均診斷時(shí)間均得到了有效提高。
關(guān)鍵詞:機(jī)器學(xué)習(xí)變壓器故障診斷優(yōu)化模型
ResearchonTtransformerFaultDiagnosisMethodBasedonMultipleMachineLearningAlgorithms
CHENGRongsen
XinyangAgricultureandForestryUniversity,Xinyang,He’nanProvince,464000China
Abstract:Inrecentyears,researchontransformerfaultdiagnosishasgraduallyincreased,andimprovingitsdiagnosticaccuracyhasclearvalue.Thecommonlyuseddiagnosticmethodsinthepasthaveacertainaccuracy,buttheirefficiencyislowandlacktimeliness.Withthecontinuousdeepeningofresearchonmachinelearning,itsapplicationintransformerfaultdiagnosisisgraduallybeingdiscovered.Thisarticlebuildsdiagnosticmodelsbasedonmachinelearninginthreeaspects:theK-NearestNeighbors(KNN)algorithm,theDecisionTree(DT)algorithm,andtheSupportVectorMachine(SVM)algorithm,andconstructsahyperparameteroptimizationmodelbyusingtheCrisscrossOptimization(CSO)algorithm.Finally,itwasverifiedthroughsimulationexperimentsthattheaccuracyandaveragediagnostictimeofthethreediagnosticmodelswereeffectivelyimprovedafterCSOoptimization.
KeyWords:Machinelearning;Transformer;Faultdiagnosis;Optimizationmodel
目前來說,變壓器故障診斷方法主要有三比值法、三查法、特征氣體法等,但也存在故障診斷效率不高、診斷實(shí)時(shí)性不強(qiáng)等問題。機(jī)器學(xué)習(xí)被認(rèn)為是目前實(shí)現(xiàn)人工智能最為可行的方法,將其應(yīng)用于變壓器故障診斷中,對于加強(qiáng)變壓器故障診斷準(zhǔn)確率有著極為重要的現(xiàn)實(shí)意義。
1變壓器故障類型
1.1變壓器熱性故障
變壓器熱性故障是由溫度異常升高引起的故障類型,通常是由絕緣材料老化、過載運(yùn)行或冷卻系統(tǒng)失效等原因?qū)е?。按照過熱位置溫度,可將變壓器熱性故障分成3種類型,如表1所示。
1.1.1低溫過熱
低溫過熱通常發(fā)生在過熱位置溫度不超過500℃(t≤500℃)的情況下,此類故障多由絕緣油老化、輕微過載或冷卻系統(tǒng)部分失效引起[1]。低溫過熱雖然不會(huì)立即導(dǎo)致變壓器的嚴(yán)重?fù)p壞,但長期運(yùn)行可能加速絕緣材料的老化,影響變壓器的使用壽命。對于低溫過熱故障的診斷,常用的技術(shù)包括油中溶解氣體分析和局部放電檢測。
1.1.2中溫過熱
中溫過熱發(fā)生在過熱位置溫度大于500℃且小于等于800℃的情況下(500℃<t≤800℃),通常由較嚴(yán)重的過載運(yùn)行、絕緣材料老化程度較高或冷卻系統(tǒng)效率顯著下降引起。
1.1.3高溫過熱
高溫過熱是指過熱位置溫度超過800℃(t>800℃)的情況,這種故障通常由嚴(yán)重的過載運(yùn)行、大面積絕緣損壞或冷卻系統(tǒng)完全失效引起。高溫過熱會(huì)導(dǎo)致絕緣材料快速分解,可能引發(fā)嚴(yán)重的電氣故障甚至火災(zāi)。
1.2變壓器電性故障
變壓器電性故障主要是在高電壓作用下,絕緣材料在劣化情況下發(fā)生的擊穿放電現(xiàn)象。從化學(xué)機(jī)理的角度來看,變壓器的電性故障與熱故障的機(jī)理基本相同,都是由于化學(xué)鍵的斷裂和重新結(jié)合所導(dǎo)致。然而,電性故障和熱故障在能量形式和表現(xiàn)特征上存在顯著差異。具體來說,在電性故障過程中,高電壓導(dǎo)致的電場作用會(huì)使絕緣材料中的分子鍵發(fā)生斷裂,形成自由基和離子,這些帶電粒子在電場作用下迅速運(yùn)動(dòng)并引發(fā)進(jìn)一步的分解反應(yīng),最終導(dǎo)致絕緣材料的擊穿和放電。而在熱故障過程中,主要是由于過高的溫度引起絕緣材料的熱分解,導(dǎo)致分子結(jié)構(gòu)的變化和劣化。
在不同類型的故障情況下,變壓器產(chǎn)生的典型故障特征成分和速率也會(huì)有所不同。在不同故障類型下,故障氣體的相對含量和生成規(guī)律也有所不同,這為變壓器故障診斷提供了重要的依據(jù)[2]。根據(jù)放電故障強(qiáng)度,將變壓器電性故障分為以下3類,如表2所示。
2基于機(jī)器學(xué)習(xí)的變壓器故障診斷方法
無論是熱故障還是其他常見故障,傳統(tǒng)的診斷方法在變壓器故障檢測中往往存在準(zhǔn)確率低和實(shí)時(shí)性差的問題。針對這一情況,本文提出了基于機(jī)器學(xué)習(xí)的變壓器故障診斷方法,研究了K近鄰(K-NearestNeighbors,KNN)算法、決策樹(DecisionTree,DT)算法和支持向量機(jī)(SupportVectorMachine,SVM)算法3種機(jī)器學(xué)習(xí)算法在變壓器故障診斷中的應(yīng)用,以提高變壓器故障診斷的準(zhǔn)確性和實(shí)時(shí)性。
2.1K近鄰算法
KNN算法是一種簡單且直觀的監(jiān)督學(xué)習(xí)算法,被廣泛用于分類和回歸任務(wù)。其基本原理是通過計(jì)算待分類樣本與訓(xùn)練集中所有樣本的距離,選擇距離最近的K個(gè)樣本(鄰居),然后根據(jù)這些鄰居的類別或數(shù)值進(jìn)行預(yù)測。KNN算法具有無需訓(xùn)練過程、實(shí)現(xiàn)簡單、效果直觀的優(yōu)點(diǎn),但在面對高維數(shù)據(jù)或樣本量較大時(shí),計(jì)算復(fù)雜度和存儲(chǔ)需求較高。為了提高效率,常使用KD樹、球樹等數(shù)據(jù)結(jié)構(gòu)進(jìn)行優(yōu)化。
在本文中,在m個(gè)特征向量的特征矩陣可設(shè)為:
其中n維特征向量為:
對應(yīng)m個(gè)樣本的標(biāo)簽為:
而對于樣本點(diǎn)之間的距離可采取Minkowskidistance定義,則二者間的距離定義為
式中:a表示為該算法的超參數(shù),a≥1。如果a數(shù)值處于2時(shí),則確定歐式距離,即:
由于KNN算法在計(jì)算各特征間的距離時(shí)需要保持相同的權(quán)重,所以,為了保證每個(gè)特征的計(jì)算距離一致,必須對每個(gè)特征進(jìn)行歸一化處理,以消除數(shù)據(jù)的量綱差異。
2.2決策樹算法
DT算法是一種常用的監(jiān)督學(xué)習(xí)算法,適用于分類和回歸任務(wù)。它通過構(gòu)建樹狀模型來進(jìn)行決策,使數(shù)據(jù)可以被逐層細(xì)化并歸類。DT的每個(gè)節(jié)點(diǎn)代表一個(gè)特征或?qū)傩?,每個(gè)分支代表該特征的一個(gè)可能值,葉節(jié)點(diǎn)則代表最終的預(yù)測結(jié)果或類別。DT的構(gòu)建過程涉及選擇最優(yōu)特征進(jìn)行數(shù)據(jù)分割,以最大程度地減少數(shù)據(jù)的不純度。
DT的優(yōu)點(diǎn)包括易于理解和解釋、不需要數(shù)據(jù)歸一化、能夠處理多類別數(shù)據(jù)及在處理大型數(shù)據(jù)集時(shí)的高效性。然而,DT也存在一些缺點(diǎn),如容易過擬合、對數(shù)據(jù)噪聲敏感及在數(shù)據(jù)維度較高時(shí)表現(xiàn)較差。因此,為了克服以上缺點(diǎn),本次使用剪枝技術(shù)來簡化樹結(jié)構(gòu)。
2.3支持向量機(jī)算法
SVM算法是一種經(jīng)典的二分類機(jī)器學(xué)習(xí)算法,其核心思想是尋找一個(gè)最優(yōu)超平面作為決策邊界,使決策邊界與兩類最近的樣本點(diǎn)之間的距離最大化,從而提高模型的泛化能力。距離決策邊界最近的這些樣本點(diǎn)被稱為支持向量,各樣本點(diǎn)到?jīng)Q策超平面的距離表示為d[3]。則,假設(shè)樣本點(diǎn)線性可分,如圖1所示。
使用n維空間中的距離計(jì)算公式,將圖1中支持向量的樣本點(diǎn)x到?jīng)Q策超平面的距離表示為
式中,為權(quán)重w的膜,b為超平面截距,可定義為
按照這一定義,可以將圖1中決策邊界上方的樣本點(diǎn)標(biāo)記為y=1,下方的樣本點(diǎn)標(biāo)記為y=-1,因此,所有樣本點(diǎn)xi與決策邊界的距離必然大于d,簡化后,可得到。綜上,結(jié)合SVM算法核心思想,列出以下有條件最優(yōu)化問題:
在結(jié)合上述優(yōu)化目標(biāo)函數(shù)的基礎(chǔ)上,SVM算法的首要任務(wù)是確保決策超平面可以完全區(qū)分兩類特征樣本,然而,這樣會(huì)限制模型的泛化能力。為了解決這一問題,以及處理數(shù)據(jù)樣本的線性可分性,可以通過求解拉格朗日對偶問題來優(yōu)化目標(biāo)函數(shù),轉(zhuǎn)化為以下形式:
優(yōu)化后,公式大大增加了數(shù)據(jù)點(diǎn)線性可分概率。在SVM算法中,常用函數(shù)包括有限性核函數(shù)、多項(xiàng)式核函數(shù)與高斯核函數(shù)。在使用高斯核函數(shù)時(shí),y與C作為模型超參數(shù),可使用智能優(yōu)化算法解決。
3仿真結(jié)果分析
通過利用CSO算法對這3種機(jī)器學(xué)習(xí)算法的超參數(shù)進(jìn)行優(yōu)化,并通過仿真實(shí)驗(yàn)驗(yàn)證了這些優(yōu)化模型的有效性[4]。在使用CSO算法對原模型進(jìn)行優(yōu)化前,可借助實(shí)例化模型將訓(xùn)練數(shù)據(jù)集平均劃分為5份,計(jì)算這5份驗(yàn)證集的平均誤差,并輪流使用,得到的差異值與實(shí)驗(yàn)數(shù)值作為實(shí)驗(yàn)度函數(shù)。在仿真實(shí)驗(yàn)中,分別建立了KNN算法、DT算法、SVM算法變壓器故障診斷模型,并與傳統(tǒng)三比值法的診斷準(zhǔn)確率進(jìn)行對比,得到F1分?jǐn)?shù)對比,如表3所示。
由表3可知,基于機(jī)器學(xué)習(xí)的3種模型在故障診斷準(zhǔn)確率和F1分?jǐn)?shù)方面明顯優(yōu)于傳統(tǒng)的三比值法。其中,DT算法模型的診斷準(zhǔn)確率最高,比三比值法高出9.53%;在F1分?jǐn)?shù)方面,3種機(jī)器學(xué)習(xí)模型均顯著提升,約提高了30%。這些數(shù)據(jù)表明,與三比值法相比,基于機(jī)器學(xué)習(xí)的3種模型在不同評價(jià)指標(biāo)下均表現(xiàn)出更優(yōu)越的故障診斷性能[5]。
4結(jié)論
本文基于機(jī)器學(xué)習(xí)算法構(gòu)建了KNN算法、DT算法和SVM算法3種變壓器故障診斷模型,通過理論研究與仿真實(shí)驗(yàn),得出以下結(jié)論。為了應(yīng)對傳統(tǒng)變壓器診斷準(zhǔn)確率低、實(shí)時(shí)性差的問題,本文提出了一種基于機(jī)器學(xué)習(xí)的故障診斷模型。仿真實(shí)驗(yàn)表明,這些模型具有較高的診斷精度和快速的診斷速度,能夠有效滿足實(shí)際工程需求。此外,針對機(jī)器學(xué)習(xí)算法在特征穩(wěn)定性和提取能力方面的不足,本文采用CSO算法對3種模型進(jìn)行了優(yōu)化,優(yōu)化后的變壓器故障診斷模型在診斷準(zhǔn)確率和F1分?jǐn)?shù)方面均有顯著提升。
參考文獻(xiàn):
[1]李強(qiáng),張睿智,范曉丹,等.基于特征氣體和比值準(zhǔn)則的RAPO植物油變壓器故障診斷方法[J].高壓電器,2023,59(9):294-303.
[2]劉國柱.基于自注意力機(jī)制與1D-CNN的變壓器故障診斷方法[J/OL].重慶工商大學(xué)學(xué)報(bào)(自然科學(xué)版),1-8[2024-05-28].http://kns.cnki.net/kcms/detail/50.1155.N.20230726.1802.006.html.
[3]王爽,羅倩,唐波,等.考慮樣本類內(nèi)不平衡的CHPOA-DBN變壓器故障診斷方法[J].中國電力,2023,56(10):133-144.
[4]萬可力,馬宏忠,崔佳嘉,等.基于Mel-GADF與ConvNeXt-T的變壓器鐵心松動(dòng)故障診斷方法[J].電力自動(dòng)化設(shè)備,2024,44(3):217-224.
[5]宋輝,苑龍祥,郭雙權(quán).基于數(shù)據(jù)增強(qiáng)和特征注意力機(jī)制的灰狼優(yōu)化算法-優(yōu)化殘差神經(jīng)網(wǎng)絡(luò)變壓器故障診斷方法[J].現(xiàn)代電力,2024,41(2):392-400.