高國(guó)磊,李英娜,段效琛,李 川
(昆明理工大學(xué) 信息與自動(dòng)化學(xué)院,云南 昆明 650500)
隨著國(guó)民經(jīng)濟(jì)和我國(guó)電力工業(yè)的快速持續(xù)發(fā)展,社會(huì)上各行各業(yè)對(duì)電力的需求不斷增加。近幾年來(lái),我國(guó)高壓及特高壓級(jí)別的變壓器發(fā)生故障的頻率越來(lái)越高,雖然我國(guó)在變壓器監(jiān)測(cè)與維修領(lǐng)域的技術(shù)有了明顯提高,但是整體上仍有不足[1]。因此,加強(qiáng)變壓器日常監(jiān)測(cè)與維護(hù),深入研究故障的預(yù)防性實(shí)驗(yàn),才能有效提高對(duì)變壓器各類(lèi)故障的預(yù)防、修復(fù)能力。由此可見(jiàn),使用合理有效的變壓器故障診斷方法,對(duì)變壓器狀態(tài)的監(jiān)測(cè)以及變壓器故障診斷有著重要的實(shí)際意義[2]。
目前基于油中溶解氣體分析技術(shù)(Dissolved Gases Analysis,DGA)的變壓器故障診斷研究主要有傳統(tǒng)診斷法和智能診斷法兩類(lèi)[3]。文獻(xiàn)[4]采用入模糊理論來(lái)構(gòu)造變壓器狀態(tài)診斷模型,存在編碼涵蓋范圍小、不可擴(kuò)展等不足。文獻(xiàn)[5]建立了可增擴(kuò)新規(guī)則的專(zhuān)家系統(tǒng),提出可擴(kuò)展的油中溶解氣體成分的變壓器故障診斷專(zhuān)家系統(tǒng),但是訓(xùn)練樣本少,分類(lèi)準(zhǔn)確率不高。文獻(xiàn)[6]提出支持向量機(jī)、粗糙集和屬性約簡(jiǎn)集選擇的變壓器故障診斷模型,但忽視了局部放電性故障。文獻(xiàn)[7]提出利用微分進(jìn)化優(yōu)化神經(jīng)網(wǎng)絡(luò),但是模型訓(xùn)練時(shí)間長(zhǎng),需要樣本量大。
針對(duì)DGA技術(shù)在變壓器故障診斷中的需求與應(yīng)用,在分析傳統(tǒng)故障診斷方法以及人工智能故障診斷方法存在不足的基礎(chǔ)上,通過(guò)改進(jìn)的核主元分析方法(Kernel Principal Component Analysis,KPCA)剔除異常離群值,利用蟻群算法(Ant Colony Optimization,ACO)優(yōu)化參數(shù),將最小二乘支持向量機(jī)(Least Squares Support Vector Machine,LS-SVM)引入變壓器故障診斷中,對(duì)幾種變壓器故障進(jìn)行分類(lèi)。
由于變壓器整體結(jié)構(gòu)復(fù)雜,發(fā)生故障時(shí)往往是并發(fā)的故障,引起故障的原因也是多種多樣的,很難根據(jù)某種數(shù)據(jù)判斷故障的類(lèi)型。變壓器故障類(lèi)型的劃分有不同的標(biāo)準(zhǔn),按照故障性質(zhì)來(lái)分,可分為過(guò)熱性故障和放電性故障[1]。
根據(jù)溫度的范圍不同,過(guò)熱故障分為低溫過(guò)熱(150~300 ℃)、中溫過(guò)熱(300~700 ℃)和高溫過(guò)熱(700 ℃以上)3種類(lèi)型。變壓器的放電性故障是由高電應(yīng)力引起的絕緣劣化,根據(jù)放電密度的不同分為局部放電、低能放電和高能放電[1]。不同的變壓器故障產(chǎn)生氣體種類(lèi)如表1所示。
表1 變壓器故障類(lèi)型產(chǎn)氣種類(lèi)
由表1得出變壓器故障的相關(guān)指數(shù)都跟溶解在變壓器油中的氣體組分和含量有著密切關(guān)系,因此利用油中氣體和故障的映射關(guān)系來(lái)分析檢測(cè)變壓器的故障是可行的。方法研究對(duì)象為低溫過(guò)熱、中溫過(guò)熱、高溫過(guò)熱、局部放電、低能放電、高能放電這6個(gè)典型故障類(lèi)型和正常狀態(tài),選取CH4、C2H4、C2H2、H2、C2H6這5種特征氣體作為故障類(lèi)型診斷的參量[8-9]。
傳統(tǒng)的變壓器故障分類(lèi)方法在對(duì)數(shù)據(jù)進(jìn)行特征提取的過(guò)程中,未考慮部分異常數(shù)據(jù)對(duì)提取過(guò)程的影響[10]。為了剔除部分異常數(shù)據(jù),采用改進(jìn)的KPCA方法進(jìn)行特征提取后將故障樣本數(shù)據(jù)輸入分類(lèi)器,能夠輸出較好的分類(lèi)結(jié)果。引入特征空間信號(hào)重構(gòu)的最小誤差準(zhǔn)則方法找出異常數(shù)據(jù),降低異常數(shù)據(jù)對(duì)結(jié)果的影響。
假設(shè)故障樣本數(shù)據(jù)為X={x1,x2,x3…xN},設(shè)y=WTx,則有u=Wy作為原樣本數(shù)據(jù)x的重構(gòu)信號(hào),即e=x-u,則樣本數(shù)據(jù)的誤差重構(gòu)函數(shù)如式1所示:
(1)
由于誤差重構(gòu)函數(shù)優(yōu)化的目的是在樣本數(shù)據(jù)降維后盡可能降低信號(hào)損失,誤差重構(gòu)函數(shù)J(W)最小則意味著W等同于樣本輸入數(shù)據(jù)X的PCA子空間,即為X的主成分。因此,對(duì)誤差函數(shù)的重構(gòu)可以用來(lái)判斷隨機(jī)樣本數(shù)據(jù)是否為離群值。
在此輸入空間,給定閾值ε>0,用以判斷識(shí)別空間異常值,如式2所示。
e(xi)=‖xi-WWTxi‖2>ε
(2)
樣本數(shù)據(jù)集在經(jīng)過(guò)KPCA非線性映射到高維空間后的數(shù)據(jù)集采用特征空間信號(hào)重構(gòu)的最小誤差準(zhǔn)則判斷是否出現(xiàn)異常值。高維空間數(shù)據(jù)集Φ(x)帶入式(3)。
e(Φ(xi))=‖Φ(xi)-WWTΦ(xi)‖2
(3)
式(3)中,非線性函數(shù)Φ(xi)形式是未知的,不能直接進(jìn)行誤差重構(gòu)[11]。將式(3)平方展開(kāi)并引入核函數(shù)K(xi,xj)=Φ(xi)·Φ(xi)結(jié)果如式4所示。
e(Φ(xi))=Φ(xi)Φ(xi)-2WWTΦ(xi)Φ(xi)+
(WWT)(WWT)Φ(xi)Φ(xi)=K(xi,xi)-
2WWTK(xi,xi)+(WWT)K(xi,xi)
(4)
由此,改進(jìn)的KPCA方法通過(guò)核函數(shù)求出重構(gòu)誤差大小并判斷離群值。
LS-SVM算法在保證分類(lèi)精度的同時(shí)大大降低了計(jì)算復(fù)雜性,提高了求解效率[12]。在系統(tǒng)樣本不充足的情況下,解決對(duì)非線性特征的樣本數(shù)據(jù)優(yōu)化難以達(dá)到全局最優(yōu)和高維數(shù)的問(wèn)題,因此在故障診斷方面應(yīng)用廣泛。
LS-SVM算法核心就是采用核函數(shù)的方法對(duì)樣本空間進(jìn)行數(shù)學(xué)上的投影,因此,選擇合適的核函數(shù)直接影響了LS-SVM算法的優(yōu)劣[13]。定義核函數(shù)K(x,xi)=Φ(x),…,Φ(xi):如果存在從Rn到Hilbert空間H的變換
(5)
K(x,x′)=[φ(x)·φ(x)′]
(6)
式(6)中,[φ(x)·φ(x)′]表示空間中內(nèi)積,則稱(chēng)Rn×Rn上的函數(shù)K(x,x′)是核函數(shù)。高斯徑向基核函數(shù)
K(x,xi)=exp(-‖x-xi‖2)/2σ2
(7)
式(7)中,x是輸入向量,x′是第i個(gè)RBF函數(shù)的中心,這里x和x′有相同的維數(shù);σ是常數(shù),表示RBF函數(shù)圍繞中心點(diǎn)的寬度。高斯徑向基核函數(shù)具有將原始空間映射為無(wú)窮維空間的特點(diǎn),從而使它成為目前應(yīng)用最多的核函數(shù)。
ACO是一種全局優(yōu)化的算法[14-15]。它的基本思想:設(shè)置兩組蟻群,一組對(duì)核函數(shù)參數(shù)σ尋優(yōu),另一組對(duì)懲罰系數(shù)C尋優(yōu)。每只螞蟻選擇路徑的同時(shí)利用式8對(duì)信息素進(jìn)行更新,再對(duì)兩組螞蟻計(jì)算其目標(biāo)函數(shù)值,得出此次迭代的最小函數(shù)值。然后在獲得函數(shù)值最小的路徑上按照式9增加信息素,這樣就完成了一次循環(huán)。重復(fù)上述步驟,直到滿(mǎn)足設(shè)定的結(jié)束條件。最后從每次迭代的最小值中選出最小的函數(shù)值,以及此時(shí)的σ和C即為所求參數(shù)。當(dāng)螞蟻遍歷完所有的城市后,各城市之間線路上的信息素濃度為
(8)
(9)
式9中,Q為信息素常數(shù),代表每只螞蟻完成遍歷釋放的信息素總量;Lk為螞蟻k到達(dá)所有城市后所經(jīng)過(guò)的線路總長(zhǎng)度。
蟻群優(yōu)化與最小二乘支持向量機(jī)方法(ACO-LSSVM)的具體步驟如下:
(1)初始化數(shù)據(jù)。首先利用改進(jìn)的KCPA特征提取方法剔除樣本中的異常數(shù)據(jù),然后對(duì)故障樣本進(jìn)行歸一化預(yù)處理;
(2)初始化參數(shù)。設(shè)置蟻群算法的初始信息素、信息素蒸發(fā)系數(shù)、信息素重要程度參數(shù)、隨機(jī)路徑選擇路徑的概率;
(3)路徑選擇。用式8對(duì)路徑信息素進(jìn)行更新,每只螞蟻完成一次路徑選擇后解碼該路徑,得到兩組自變量值,將這兩個(gè)值帶入交叉驗(yàn)證的LS-SVM模型中,得到目標(biāo)函數(shù)。再對(duì)兩組螞蟻計(jì)算其目標(biāo)函數(shù)值,得出此次迭代的最小函數(shù)值;
(4)獲得函數(shù)值最小的路徑。用式(9)增加信息素,這樣就完成了一次循環(huán)。如果當(dāng)前的迭代次數(shù)滿(mǎn)足最大的函數(shù)評(píng)估次數(shù)或者算法在迭代中沒(méi)有任何改善時(shí),則停止迭代,輸出最優(yōu)解,否則。轉(zhuǎn)到步驟(3);
(5)獲取此次最優(yōu)的LS-SVM的核函數(shù)參數(shù)σ以及懲罰系數(shù)C;
(6)將已經(jīng)選取好的訓(xùn)練樣本集和經(jīng)交叉驗(yàn)證得到的σ、C一起訓(xùn)練并優(yōu)化一對(duì)已組合分類(lèi)的LS-SVM模型;
(7)重復(fù)步驟(6)直至模型滿(mǎn)足精度要求,得到ACO-LSSVM模型;
(8)最后用測(cè)試樣本集驗(yàn)證診斷的準(zhǔn)確性。
實(shí)驗(yàn)DGA樣本集中共有165個(gè)樣本數(shù)據(jù),選取110組樣本數(shù)據(jù)作為訓(xùn)練樣本集,55組樣本數(shù)據(jù)作為測(cè)試樣本集。首先利用的改進(jìn)KPCA特征提取方法,剔除這165組故障樣本數(shù)據(jù)中的異常數(shù)據(jù),發(fā)現(xiàn)該故障樣本中第155行高溫過(guò)熱故障數(shù)據(jù)是異常數(shù)據(jù),有3個(gè)特征變量的值出現(xiàn)異常。
由于變壓器油中特征氣體的濃度含量的數(shù)量級(jí)差異性很大,直接將特征氣體含量作為模型的輸入會(huì)導(dǎo)致診斷結(jié)果不準(zhǔn)確。經(jīng)過(guò)歸一化處理之后,數(shù)據(jù)樣本分布在[0,1]空間內(nèi),作為模型的輸入特征向量。
實(shí)驗(yàn)采用110組訓(xùn)練樣本集和55組測(cè)試樣本集對(duì)蟻群優(yōu)化最小二乘支持向量機(jī)的變壓器故障診斷模型的故障分類(lèi)準(zhǔn)確率進(jìn)行實(shí)驗(yàn)。
首先使用改進(jìn)的KPCA算法對(duì)故障樣本的異常數(shù)據(jù)進(jìn)行剔除,再將數(shù)據(jù)進(jìn)行歸一化得到五種特征氣體體積含量占總氣體體積含量的百分比,將蟻群算法優(yōu)化得到的兩個(gè)LS-SVM的參數(shù):核函數(shù)參數(shù)σ2=1.238以及懲罰系數(shù)C=4.074,帶入ACO-LSSVM模型,得到故障分類(lèi)的效果如圖1所示。
圖1 ACO-LSSVM中故障樣本分類(lèi)效果
使用改進(jìn)的KPCA算法對(duì)故障樣本的異常數(shù)據(jù)進(jìn)行剔除,再將數(shù)據(jù)進(jìn)行歸一化得到5種特征氣體體積含量占總氣體體積含量的百分比,未經(jīng)蟻群優(yōu)化LS-SVM的參數(shù),計(jì)算得到核函數(shù)參數(shù)σ2=1.138 3以及C=1.802 1,帶入LS-SVM模型,得到故障分類(lèi)的效果如圖2 所示。
表2 故障樣本錯(cuò)誤分類(lèi) μL/L
圖2 LS-SVM中故障樣本分類(lèi)效果
模型故障類(lèi)型樣本總數(shù)ACO-LSSVM分類(lèi)錯(cuò)誤樣本數(shù)LS-SVM分類(lèi)錯(cuò)誤樣本數(shù)總體正確率/%ACO-LSSVM低溫過(guò)熱51192.57LS-SVM中溫過(guò)熱80283.14高溫過(guò)熱1313局部放電600低能放電710高能放電1015正常500
觀察表2和表3,針對(duì)實(shí)驗(yàn)收集的165組故障樣本數(shù)據(jù)經(jīng)過(guò)異常數(shù)據(jù)剔除后進(jìn)行不斷的訓(xùn)練,得出變壓器正常運(yùn)行狀態(tài)和6種典型的變壓器故障類(lèi)型的分類(lèi)情況。ACO-LSSVM模型得到的變壓器故障分類(lèi)準(zhǔn)確率比LS-SVM模型得到的變壓器故障分類(lèi)準(zhǔn)確率提高了9.43%。
改進(jìn)的KPCA方法剔除異常數(shù)據(jù),并引入ACO優(yōu)化LS-SVM參數(shù)對(duì)變壓器進(jìn)行的故障診斷研究。結(jié)果表明:該模型以變壓器油中溶解的各種氣體產(chǎn)氣量為評(píng)價(jià)指標(biāo),經(jīng)過(guò)訓(xùn)練的ACO-LSSVM模型能對(duì)變壓器故障數(shù)據(jù)樣本進(jìn)行正確分類(lèi),總體準(zhǔn)確率為92.57%,分類(lèi)準(zhǔn)確性和有效性明顯優(yōu)于LS-SVM方法,為變壓器故障檢測(cè)提供了依據(jù)。
[1] 國(guó)家電網(wǎng)公司運(yùn)維檢修部.變壓器類(lèi)設(shè)備典型故障案例匯編:2006-2010年[M].北京:中國(guó)電力出版社,2012.
[2] 張遠(yuǎn)博.油紙絕緣變壓器局部放電產(chǎn)氣特征的模擬研究[D].哈爾濱:哈爾濱理工大學(xué),2013.
[3] Gao W,Bai C,Liu T.A dynamic integrated fault diagnosis method for power transformers[J].The Scientific World Journal,2015(7):459268-45977.
[4] 焦振毅,任建文,陳鵬.基于模糊理論的變壓器故障診斷模型研究[J].電力科學(xué)與工程,2012,28(6):39-43.
[5] 師瑞峰,史永鋒,牟軍,等.油中溶解氣體電力變壓器故障診斷專(zhuān)家系統(tǒng)[J].電力系統(tǒng)及其自動(dòng)化學(xué)報(bào),2014,26(12):49-54.
[6] 吳立帥,葛玻,宋書(shū)中.基于粗糙集與支持向量機(jī)的變壓器故障診斷[J].電源技術(shù),2014,38(4):768-770.
[7] 劉卓,黃純,李波.利用微分進(jìn)化優(yōu)化神經(jīng)網(wǎng)絡(luò)的變壓器故障診斷[J].電力系統(tǒng)及其自動(dòng)化學(xué)報(bào),2011,23(2):54-58.
[8] 王健一,李金忠,凌愍,等.新版電力行業(yè)標(biāo)準(zhǔn)《變壓器油中溶解氣體分析判斷導(dǎo)則》解讀[J]. 變壓器,2014,51(12):49-53.
[9] Alamuru V.Hybrid diagnosing techniques for analyzing dissolved gases in power transformers[J].IEEE Transactions on Computer Scienc,2015,7(2):32-43.
[10] 楊廷方,張航,黃立濱,等.基于改進(jìn)型主成分分析的電力變壓器潛伏性故障診斷[J].電力自動(dòng)化設(shè)備,2015,35(6):149-153.
[11] 唐勇波.改進(jìn)特征樣本方法的KPCA變壓器故障檢測(cè)模型[J].計(jì)算機(jī)工程與應(yīng)用,2014, 50(21):4-7.
[12] Kisi O.Least squares support vector machine for modeling daily reference evapotranspiration[J]. Irrigation Science,2013,31(4):611-619.
[13] 王逸萍.基于最小二乘支持向量機(jī)的變壓器故障診斷[J].電工電氣,2016(6):24-27.
[14] 鄧玉梅.基于蟻群優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)目標(biāo)威脅估計(jì)方法[J].電子科技,2016,29(7):33-35.
[15] 杜博,夏春蕾,戴曙光.融合改進(jìn)蟻群和粒子群算法的路徑搜索應(yīng)用[J].電子科技,2016, 29(9):4-6.