祝海寧,丁云飛
(1.上海電機(jī)學(xué)院 資產(chǎn)與實(shí)驗(yàn)室管理處,上海 201306; 2.上海電機(jī)學(xué)院 電氣學(xué)院,上海 201306)
斷路器是一種常見的廣泛應(yīng)用于電力系統(tǒng)中重要電力設(shè)備,不僅基數(shù)大,經(jīng)濟(jì)上的投入也很大.斷路器能夠根據(jù)電力運(yùn)行狀態(tài)進(jìn)行切換或通斷,其可靠性直接關(guān)系到整個(gè)電網(wǎng)的安全穩(wěn)定性.它自身的故障狀態(tài)往往會(huì)引發(fā)電力系統(tǒng)的較大事故,產(chǎn)生較大的社會(huì)和經(jīng)濟(jì)方面的影響.因此,針對(duì)斷路器的工作狀態(tài)進(jìn)行準(zhǔn)確高效的故障診斷分析,對(duì)于電力系統(tǒng)的安全運(yùn)行以及電網(wǎng)質(zhì)量的穩(wěn)定都具有重要的意義.
故障診斷技術(shù)是通過對(duì)提取的故障數(shù)據(jù)樣本建立故障診斷模型,然后通過模型對(duì)待測(cè)樣本進(jìn)行模式識(shí)別和分類.目前應(yīng)用較多的故障診斷方法都是基于人工智能的方法.專家系統(tǒng)通常是通過對(duì)故障信息建立專家知識(shí)庫(kù)和推理規(guī)則,或者與其他方法結(jié)合如小波分析等進(jìn)行診斷[1-3].神經(jīng)網(wǎng)絡(luò)模型容易建立,在斷路器的部分故障狀態(tài)下仍可應(yīng)用于其他單元診斷[4-5],與其他優(yōu)化算法如粒子群[6]、貝葉斯決策[7]和主成分分析方法[8]相結(jié)合可提高斷路器的故障診斷正確率.近來,支持向量機(jī)(Support Vector Machine,SVM)作為一種核方法廣泛應(yīng)用在斷路器故障診斷領(lǐng)域,它還可以結(jié)合核主成分分析、因子分析、粒子群優(yōu)化等方法來簡(jiǎn)化輸入特征樣本,優(yōu)化算法收斂,提高分類準(zhǔn)確率[9-11].
然而這些方法在對(duì)斷路器故障進(jìn)行診斷時(shí),會(huì)存在一些難點(diǎn).比如基于專家智能系統(tǒng)的診斷方式的難點(diǎn)是如何建立和更新非常依賴于專家經(jīng)驗(yàn)的知識(shí)庫(kù),以及如何解釋推理機(jī)制;將遺傳算法和神經(jīng)網(wǎng)絡(luò)引入到故障診斷中可使診斷模型更加復(fù)雜,模型訓(xùn)練時(shí)需要盡可能多樣本來提高精度,計(jì)算量也隨之增大.基于SVM的算法雖然實(shí)現(xiàn)了非線性映射,但模型還是需要大量支持向量,隨著樣本增加,運(yùn)算量增加也很大.
在實(shí)際運(yùn)行中,斷路器故障原因比較復(fù)雜.當(dāng)斷路器處于非正常工作狀態(tài)時(shí),斷路器設(shè)備所在的回路以及設(shè)備本身會(huì)伴隨著一些與故障明顯相關(guān)的特征,即有關(guān)的電氣量波動(dòng)明顯,而相關(guān)的非電氣量也會(huì)發(fā)生很大變化.本文針對(duì)SF6氣體斷路器,通過一種基于核的分層貝葉斯故障診斷方法提取分析相關(guān)電氣量以及非電氣量信息,從而能使斷路器故障時(shí)快速報(bào)警和診斷,并降低誤報(bào)的頻次,盡可能保證電網(wǎng)的安全可靠供電.
KPCA是一種核方法,是主成分分析(Principal Component Analysis,PCA)的一種延伸.首先,定義一個(gè)樣本空間X及其在高維空間的映射φ(X)為
然后定義一個(gè)核函數(shù)K,對(duì)于任意xi,xj∈X都有如下等式成立:
(1)
目前,應(yīng)用較多的核函數(shù)有多項(xiàng)式核、高斯核、Sigmoid核、B樣條核等.KPCA先將樣本輸入空間里的X轉(zhuǎn)換到高維向量空間;然后對(duì)高維空間中線性可分的映射樣本進(jìn)行PCA,提取主要成分對(duì)應(yīng)的特征向量;再對(duì)原樣本集進(jìn)行特征提取和降維處理.用C表示高維空間的協(xié)方差矩陣,則有
(2)
其特征值λ和特征向量v需要滿足:
(3)
式(3)通過點(diǎn)積可以變?yōu)?/p>
(4)
由式(4)可推出
(5)
根據(jù)式(1)的定義,式(5)可以簡(jiǎn)化為
(6)
對(duì)式(6)求解就可以得到λ和v.而特征向量在高維空間的映射變?yōu)?/p>
(7)
KPCA還需要對(duì)高維空間進(jìn)行預(yù)處理,則核矩陣可以通過下式完成中心化:
(8)
分層貝葉斯模型是基于貝葉斯概率分析的一種監(jiān)督學(xué)習(xí)方法[12].通過對(duì)兩層先驗(yàn)參數(shù)的分布進(jìn)行設(shè)定,能令模型中的部分參數(shù)系數(shù)減少到0,根據(jù)需求調(diào)節(jié)模型的復(fù)雜度,提高運(yùn)行時(shí)間.給定N個(gè)數(shù)據(jù)的一個(gè)輸入訓(xùn)練集合D={(x1,y1),(x2,y2),…,(xN,yN)},這里xi∈(1,2,…,N)為D維輸入向量,yi∈(1,2,…,N)為一個(gè)二值輸出向量.給定N×M維矩陣H=[h(x1),h(x2),…,h(xN)]T,M為所選基函數(shù)個(gè)數(shù).于是可以得到含有潛變量z的模型
(9)
式中:z=(z1,z2,…,zN)T;w為符合高斯分布的零均值的單位誤差向量,可以表示為p(w)=φ(w|0,1);β為需要估計(jì)的參數(shù).
模型根據(jù)z≥0時(shí)y=1,以及z<0時(shí)y=0來進(jìn)行分類,即滿足
(10)
對(duì)z求取似然函數(shù)如下:
(11)
為了便于對(duì)β求取參數(shù)的估計(jì)值,令βi滿足
(12)
模型中z和新引入的τ=[τ1,τ2,…,τM]T都是未知數(shù)據(jù),這里將模型分層能夠容易通過期望極大(Expectation Maximization algorithm,EM)方法實(shí)現(xiàn)對(duì)參數(shù)的估計(jì).將Jeffreys分布引入到τ上能夠減少額外參數(shù)參與到運(yùn)算中[13],從而簡(jiǎn)化參數(shù)估計(jì)模型.由式(11)、式(12)能夠得出
(13)
通過EM算法,求出對(duì)Υ的期望值V和z的期望值s,這里t是迭代次數(shù),從而得出
(14)
(15)
聯(lián)立式(13)~式(15),可以求得參數(shù)β為
(16)
為了避免迭代過程中除以零的出現(xiàn),新定義一矩陣
(17)
則式(16)可以變?yōu)?/p>
(18)
本文所提出的故障診斷方法,首先采用KPCA對(duì)原數(shù)據(jù)進(jìn)行特征值提取,從而找出訓(xùn)練樣本在高維映射中的特征向量.其次,將核方法引入分層貝葉斯模型中,這里的核函數(shù)都選擇相同的高斯核函數(shù).同時(shí),由于該分層貝葉斯分類器只能解決兩類分類問題,而生產(chǎn)過程中出現(xiàn)的故障往往是多于兩類的.本文采用故障樹中的二叉樹理論,建立一系列對(duì)應(yīng)不同故障類別的二分類器,進(jìn)行組合診斷.整體故障診斷如圖1所示.
圖1 基于核的分層貝葉斯故障診斷框圖Fig.1 Kernel based hierarchical Bayesian framework for fault diagnosis
具體的故障診斷算法步驟如下:
步驟1對(duì)歷史訓(xùn)練數(shù)據(jù)和待測(cè)數(shù)據(jù)標(biāo)準(zhǔn)化,并對(duì)模型參數(shù)進(jìn)行初始化和設(shè)定迭代終止條件.
步驟2利用高斯核函數(shù)如下所示,計(jì)算核矩陣K,即
(19)
式中:δ為核寬參數(shù),可以由交叉尋優(yōu)方法來確定.
步驟3按照式(8)修正核矩陣得到K′.
步驟4根據(jù)系統(tǒng)要求,按照式(7)計(jì)算特征向量的投影tk,從而得到映射后的訓(xùn)練數(shù)據(jù)集X.
步驟5利用核方法對(duì)X重新定義,并求取設(shè)計(jì)矩陣,于是H中的向量變?yōu)?/p>
(20)
步驟6將H代入到分層貝葉斯模型中,通過式(15)和式(17)分別求得s(t)和Q(t)值.
步驟7利用式(18)求得新的參數(shù)向量β(t+1).
步驟8重復(fù)步驟6和7,直到滿足算法終止條件.
步驟9對(duì)待測(cè)樣本進(jìn)行分類診斷.
步驟10判斷故障類別數(shù)c是否等于2.如果是,則輸出診斷結(jié)果;如果不是,則采用二叉樹的方法構(gòu)建多類分類器:首先將故障種類中最經(jīng)常發(fā)生的故障作為第一類,將其他(c-1)類故障看作另一類,重復(fù)步驟5~9,建立第1個(gè)二分類模型;然后在(c-1)類故障中重復(fù)前面的分類,建立第2個(gè)二分類模型,直到得到(c-1)個(gè)二分類器.待測(cè)樣本通過這些分類器得到最后的多分類故障.
實(shí)驗(yàn)以某電氣公司3AP1FG型SF6氣體斷路器在線監(jiān)測(cè)系統(tǒng)進(jìn)行數(shù)據(jù)的采集.該系統(tǒng)包括傳感器(如壓力傳感器PMR300和溫度傳感器PT100等)、數(shù)據(jù)處理系統(tǒng)、通訊網(wǎng)絡(luò)(RS485總線)和監(jiān)控主機(jī).監(jiān)控主機(jī)通過提取分析大量斷路器故障或非正常工作時(shí)相關(guān)電氣量以及非電氣量歷史信息,利用所提出的故障診斷方法在Matlab上對(duì)其進(jìn)行離線訓(xùn)練;然后使用訓(xùn)練好的故障診斷模型對(duì)斷路器故障進(jìn)行在線分析,快速診斷出結(jié)果,判斷屬于哪類故障,并在人機(jī)界面上直觀展示出來.
高壓斷路器SF6的故障診斷主要依賴于對(duì)采集數(shù)據(jù)的分析.實(shí)驗(yàn)選取能夠?yàn)镾F6氣體斷路器故障診斷提供重要的參考信息的8個(gè)非電氣量,包括SF6氣體微水量、SF6氣體密度、導(dǎo)電接觸部分溫度、絕緣電阻、接觸電阻、分合閘線圈電流、線圈電壓、分合閘時(shí)間.這里主要考慮SF6斷路器的常見的4種故障,包括氣體泄漏、機(jī)械卡澀、絕緣閃絡(luò)和二次回路故障.為驗(yàn)證所提出的故障診斷算法的有效性,選取故障實(shí)驗(yàn)訓(xùn)練樣本400個(gè),其中每種故障樣本為100個(gè).另外取100個(gè)樣本作為待測(cè)數(shù)據(jù)集,其中每種故障樣本為25個(gè).訓(xùn)練樣本標(biāo)準(zhǔn)化后通過核主元分析其樣本閾值對(duì)主元數(shù)據(jù)樣本的關(guān)系如圖2所示.從圖2中曲線可以看出:KPCA對(duì)原訓(xùn)練樣本的縮減效率,當(dāng)閾值增加時(shí),縮減的數(shù)據(jù)組數(shù)則減少,也就是說為了達(dá)到某一閾值所需要的樣本數(shù)量增加了;關(guān)系圖的斜率在閾值取0.96~0.98時(shí)最大,此時(shí)在此閾值區(qū)間內(nèi)對(duì)應(yīng)的縮減樣本所含原信息量在保持一定的縮減成本之下是最大的,即核主元轉(zhuǎn)換效率最高.所以最優(yōu)的閾值設(shè)為0.97,對(duì)應(yīng)的新的樣本數(shù)為280組.
圖2 KPCA閾值與主元樣本量關(guān)系圖Fig.2 The relationship KPCA between threshhold and remained samples
將新訓(xùn)練樣本通過二叉樹訓(xùn)練出3個(gè)基于核的分層貝葉斯模型,然后將100個(gè)測(cè)試數(shù)據(jù)分類.在相同的初始條件下,該方法與其他另外兩種廣泛應(yīng)用的方法進(jìn)行了比較.① KPCA通過統(tǒng)計(jì)方法求取T2和平方預(yù)測(cè)誤差(Squared Prediction Error,SPE)統(tǒng)計(jì)量,判斷樣本的顯著誤差,從而進(jìn)行故障診斷.② 將SVM和二叉樹結(jié)合實(shí)現(xiàn)的斷路器的多類故障診斷.其分類結(jié)果如表1所示.
表1 故障診斷結(jié)果Tab.1 The result of fault diagnosis
表1中:F1~F4表示4類故障中每類故障所對(duì)應(yīng)的錯(cuò)分樣本數(shù)目;正確率是針對(duì)整個(gè)測(cè)試樣本的正確分類的準(zhǔn)確率;nsv表示3個(gè)二分類模型需要的支持向量的平均個(gè)數(shù).從表1中可以看出:分層貝葉斯的分類準(zhǔn)確率比其他兩個(gè)方法都高些,KPCA較低,并且它是基于統(tǒng)計(jì)的方法來判斷故障類別,所以沒有具體的支持向量個(gè)數(shù).然而對(duì)于SVM而言,它的平均nsv為42個(gè),但分層貝葉斯只需要19個(gè).這說明在分類精度相差不大,甚至更好的情況下,后者所建立的模型參數(shù)個(gè)數(shù)比前者少一半左右,模型的結(jié)構(gòu)要更為簡(jiǎn)單,計(jì)算效率相應(yīng)更高.
本文針對(duì)電力系統(tǒng)中常見的斷路器設(shè)備的故障,提出了一種基于核的分層貝葉斯故障診斷方法.該方法利用斷路器的8個(gè)故障特性參數(shù)為輸入樣本,利用KPCA對(duì)原故障訓(xùn)練集合進(jìn)行縮減,并最大限度地保留原始數(shù)據(jù)集的信息.然后在新數(shù)據(jù)樣本的基礎(chǔ)上,訓(xùn)練已經(jīng)利用核方法改進(jìn)的分層貝葉斯模型.這樣就可以通過核函數(shù)隱式映射為高維線性關(guān)系,實(shí)現(xiàn)非線性故障診斷.根據(jù)故障類別數(shù),結(jié)合二叉樹進(jìn)行多類故障診斷.通過實(shí)例分析,該故障診斷方法與另外兩種方法KPCA和SVM的故障診斷結(jié)果比較表明,所提出的基于核的分層貝葉斯故障診斷方法在數(shù)據(jù)樣本縮減、模型參數(shù)簡(jiǎn)化、分類準(zhǔn)確率上都好于另外兩種方法,從而驗(yàn)證了本文方法的有效性.