唐勇波
1.宜春學(xué)院物理科學(xué)與工程技術(shù)學(xué)院,江西宜春 336000
2.中南大學(xué)信息科學(xué)與工程學(xué)院,長(zhǎng)沙 410083
改進(jìn)特征樣本方法的KPCA變壓器故障檢測(cè)模型
唐勇波
1.宜春學(xué)院物理科學(xué)與工程技術(shù)學(xué)院,江西宜春 336000
2.中南大學(xué)信息科學(xué)與工程學(xué)院,長(zhǎng)沙 410083
針對(duì)核主元分析(KPCA)監(jiān)控模型由于建模樣本不純而導(dǎo)致故障檢測(cè)失效問題,提出基于改進(jìn)特征樣本方法的KPCA故障檢測(cè)模型并應(yīng)用于變壓器故障檢測(cè)中。利用特征值變化信息,設(shè)計(jì)出異常樣本剔除算法以避免異常樣本被選入特征樣本集;采用特征樣本方法提取建模樣本集,建立KPCA監(jiān)控模型,采用復(fù)合統(tǒng)計(jì)量對(duì)變壓器運(yùn)行狀態(tài)進(jìn)行檢測(cè),實(shí)驗(yàn)結(jié)果驗(yàn)證了改進(jìn)特征樣本算法的有效性,表明提出的方法具有較高的故障敏感性和檢測(cè)效率。
電力變壓器;故障檢測(cè);核主元分析;特征樣本
油中溶解氣體分析(Dissolved Gas Analysis,DGA)是大型油浸式電力變壓器內(nèi)部潛伏性故障檢測(cè)和診斷的有效手段之一。由于累積效應(yīng),采用油中溶解氣體的注意值[1-2](即含量限值)來監(jiān)視變壓器運(yùn)行狀況,并不是達(dá)到注意值就能確定變壓器存在某種故障,而是應(yīng)該注意跟蹤分析。在實(shí)際應(yīng)用中,注意值的設(shè)定非常重要,規(guī)定得太低也是不經(jīng)濟(jì)的,太高是不安全的,通常注意值的設(shè)定需要結(jié)合安全性和經(jīng)濟(jì)性來考慮,具有較大的主觀因素,而且,注意值的設(shè)定與變壓器制造水平有關(guān),制造水平不同,注意值也不相同[3]。
主元分析[4-6](Principal Component Analysis,PCA)為線性降維方法,當(dāng)用于非線性過程監(jiān)控時(shí)其性能會(huì)大大降低[6]。核主元分析(Kernel Principal Component Analysis,KPCA)能有效地提取非線性特征[7-9]。KPCA監(jiān)控不適合應(yīng)用于大樣本情況,因?yàn)橛?jì)算和存儲(chǔ)的核矩陣維數(shù)為訓(xùn)練樣本的數(shù)目。針對(duì)這種情況,文獻(xiàn)[10-11]提出特征樣本(Feature Sample,F(xiàn)S)方法解決了核矩陣的計(jì)算問題。但是,文獻(xiàn)[10-11]均認(rèn)為原始樣本集中的樣本是正常的,不存在異常樣本。由于測(cè)量手段的局限性、存在測(cè)量誤差等原因,實(shí)際上所采集到的原始樣本存在不純的問題,即含有其他工況數(shù)據(jù)或潛伏性故障樣本,直接采用特征樣本方法而不首先剔除這類異常數(shù)據(jù),該類數(shù)據(jù)更容易被選為特征樣本,導(dǎo)致監(jiān)控模型失效。因此,在應(yīng)用FS算法提取建模樣本之前,十分有必要進(jìn)行建模數(shù)據(jù)純化,剔除異常樣本。文獻(xiàn)[12]提出Fisher判別分析結(jié)合可能性C均值聚類的KPCA故障檢測(cè)算法,但算法較復(fù)雜,較難應(yīng)用。
因此,本文提出改進(jìn)的特征樣本方法,利用特征值變化信息設(shè)計(jì)出異常樣本剔除算法,然后采用特征樣本算法提取KPCA建模樣本集。變壓器DGA實(shí)驗(yàn)驗(yàn)證了本文提出的基于改進(jìn)特征樣本方法的KPCA檢測(cè)模型的有效性。
KPCA的基本思想是引入非線性映射φ將輸入空間Xn×m映射到高維特征空間F,在高維特征空間中對(duì)映射數(shù)據(jù)φ(xi)的協(xié)方差矩陣進(jìn)行特征向量分析,找到主元。協(xié)方差矩陣可以表示為:
CF的特征矢量v可表示為:
其中,ai是相關(guān)系數(shù);定義核函數(shù)矩陣K=[Kij]n×n,Kij=<φ(xi),φ(xj)>,則公式(2)轉(zhuǎn)化為求解矩陣K的特征值問題:
由K的特征向量a即可求出協(xié)方差矩陣CF的特征向量v,即為特征空間的主元方向。通過計(jì)算映射數(shù)據(jù)在特征向量vk上的投影來計(jì)算主元,即
其中,<x,y>表示x與y的點(diǎn)積,k為保留主元數(shù),通常采用方差累積百分比(Cumulative Percent of Variance,CPV)來選取。這樣,特征空間又可分為主元空間和殘差空間。KPCA的求解過程參見文獻(xiàn)[7]。
核函數(shù)常選用高斯徑向基函數(shù):
其中,σ為核寬度。
類似于PCA方法,在主元空間和殘差空間中建立KPCA過程統(tǒng)計(jì)模型可以實(shí)現(xiàn)多變量過程監(jiān)測(cè)。
主元空間中的T2統(tǒng)計(jì)量定義為:
雖然T2和SPE統(tǒng)計(jì)量在統(tǒng)計(jì)過程監(jiān)控中應(yīng)用廣泛,但有時(shí)會(huì)出現(xiàn)監(jiān)測(cè)結(jié)果不一致,不利于進(jìn)行故障分析。文獻(xiàn)[13]結(jié)合T2和SPE統(tǒng)計(jì)量,提出一種統(tǒng)一形式的復(fù)合統(tǒng)計(jì)量。
其中,λc為調(diào)整參數(shù),一般可選λc=λk/2;為統(tǒng)計(jì)量D的控制限,由核密度估計(jì)方法[14]求得。
3.1 改進(jìn)特征樣本方法
改進(jìn)的特征樣本提取方法(Modified Feature Sample,MFS)分兩階段:第一階段,對(duì)原始正常樣本集提純,剔除可能含有其他工況或含有潛伏性故障等異常樣本;其基本思想是利用KPCA模型中最大特征值變化信息來剔除異常樣本。簡(jiǎn)述為:建立n個(gè)建模樣本的KPCA模型,得到第一個(gè)最大特征值λ1(n),并計(jì)算n個(gè)樣本的D統(tǒng)計(jì)量,剔除D統(tǒng)計(jì)量最大的樣本;重新建立n-1個(gè)樣本的KPCA模型,得到特征值λ1(n-1)和D統(tǒng)計(jì)量,判斷特征值λ1的變化量Δλ1=|λ1(n)-λ1(n-1)|<λ1(n)/n成立,算法結(jié)束;否則,繼續(xù)剔除D統(tǒng)計(jì)量最大的樣本。第二階段,采用特征樣本提取方法提取特征樣本集。
MFS算法具體步驟如下:
步驟1輸入原始正常樣本集Xn×m,n為樣本數(shù),m為變量數(shù)。
步驟2將數(shù)據(jù)集進(jìn)行標(biāo)準(zhǔn)化后,按式(6)計(jì)算核矩陣K,并按式(10)作均值化處理:
其中,En是元素為1/n的n×n常數(shù)方陣。
步驟3按式(4)解決的特征值問題,得到第一最大特征值記為λ1(n)。
步驟4按CPV>85%選取主元數(shù)k,并標(biāo)準(zhǔn)化ak,使λ<ak,ak>=1。
步驟5按式(5)提取各樣本的非線性主元,并按式(7)和式(8)分別計(jì)算各樣本的T2和SPE統(tǒng)計(jì)量,再按式(9)計(jì)算各樣本的D統(tǒng)計(jì)量。
步驟6剔除D統(tǒng)計(jì)量最大的樣本,令n=n-1,重復(fù)步驟2至步驟5,剔除一個(gè)樣本后按式(4)解決的特征值問題得到最大特征值記為λ1(n-1)。
步驟7計(jì)算特征值的變化量如果Δλ1<λ1(n)/n成立,則結(jié)束;否則轉(zhuǎn)至步驟6。
剔除異常樣本過程結(jié)束后,采用FS算法求取特征樣本集,過程如下:
步驟8從數(shù)據(jù)集任選一個(gè)樣本到特征樣本集S中,令d=1,按式(6)計(jì)算相應(yīng)的核矩陣。
步驟9逐個(gè)檢驗(yàn)樣本,按式(11)計(jì)算Δ,設(shè)定一個(gè)較小的閾值ε>0,如果Δ<ε,則該樣本不加入樣本集S,否則加入S,令d=d+1,修改相應(yīng)的核矩陣。
步驟10所有樣本檢驗(yàn)完畢后,得到特征樣本數(shù)d和特征樣本集S。
3.2 變壓器故障檢測(cè)KPCA建模
DGA是檢測(cè)變壓器早期潛伏性故障的重要手段,DGA檢測(cè)主要有甲烷(CH4)、乙烷(C2H6)、乙烯(C2H4)、乙炔(C2H2)、氫氣(H2)這五種特征氣體。變壓器運(yùn)行過程中積累了大量的DGA數(shù)據(jù),反映了變壓器運(yùn)行狀態(tài)的豐富信息,對(duì)變壓器的故障檢測(cè)和診斷具有重要價(jià)值。傳統(tǒng)的注意值判據(jù)存在注意值選擇和難以解決油中溶解氣體濃度的累積效應(yīng)等問題,難以滿足日益增長(zhǎng)的變壓器故障檢測(cè)和診斷的需求。KPCA能有效地提取非線性特征,構(gòu)建統(tǒng)計(jì)量能夠?qū)崿F(xiàn)過程監(jiān)控,在工業(yè)過程監(jiān)控領(lǐng)域應(yīng)用廣泛。因此,本文基于DGA數(shù)據(jù),提出變壓器故障檢測(cè)的MFS-KPCA建模,步驟描述如下:
步驟1按3.1節(jié)提出的MFS方法剔除原始正常樣本集中的異常樣本,并獲得特征樣本集S。
步驟2以特征樣本集S作為建模樣本集,標(biāo)準(zhǔn)化后按式(6)計(jì)算核矩陣K∈Rd×d,并對(duì)核矩陣K按式(10)作均值化處理。
步驟3按式(4)解決的特征值問題,按CPV>85%選取主元數(shù)k,并標(biāo)準(zhǔn)化ak,使λ<ak,ak>=1。
步驟4按式(5)提取各建模樣本的非線性主元,并按式(9)計(jì)算各建模樣本的D統(tǒng)計(jì)量。
步驟5采用核密度估計(jì)方法對(duì)建模樣本D統(tǒng)計(jì)量進(jìn)行估計(jì),取置信度為99%時(shí)得到D統(tǒng)計(jì)量控制限δ2D。
步驟6輸入測(cè)試樣本集XTE,并標(biāo)準(zhǔn)化。
步驟7對(duì)標(biāo)準(zhǔn)化后的每一測(cè)試樣本xte,計(jì)算其內(nèi)核向量Kte=<xte,xi>,按式(12)均值化處理;xi為建模樣本,i=1,2,…,d。
其中,Ed是元素為1/d的d×d常數(shù)方陣,Id是元素為1/d的d維行向量。
步驟8按式(5)提取測(cè)試樣本的非線性主元,并按式(9)計(jì)算各測(cè)試樣本的D統(tǒng)計(jì)量。
步驟9將測(cè)試樣本的D統(tǒng)計(jì)量與控制限作比較,如果D≤,正常;否則,故障。
實(shí)驗(yàn)選用的變壓器DGA樣本均為220 kV或500 kV大型油浸式變壓器檢測(cè)樣本,其中,原始正常樣本(陰性)550例,取自某供電局所轄主變DGA檢測(cè)樣本;故障樣本(陽性)275例,部分取自現(xiàn)場(chǎng),部分來自公開發(fā)表的文獻(xiàn)。故障檢測(cè)本質(zhì)為二分類問題,采用以下指標(biāo)評(píng)價(jià)檢測(cè)性能。
故障敏感性,即陽性樣本的分類正確率:
其中,|FN|表示陽性樣本分類為陰性的個(gè)數(shù),|TP|表示陽性樣本分類為陽性的個(gè)數(shù)。
陰性樣本的分類正確率:
其中,|FP|表示陰性樣本分類為陽性的個(gè)數(shù),|TN|表示陰性樣本分類為陰性的個(gè)數(shù)。
全局的分類正確率:
幾何均值Gmean綜合考慮了陽性和陰性樣本的分類結(jié)果。
在這些檢測(cè)性能評(píng)價(jià)指標(biāo)中,最為關(guān)注的是故障敏感性和幾何均值。
經(jīng)多次實(shí)驗(yàn),核參數(shù)σ=8的性能較好。采用MFS算法對(duì)原始正常樣本集提取特征樣本集,剔除了15個(gè)異常樣本,表1為MFS算法剔除的異常樣本,當(dāng)ε=10-6時(shí),提取88個(gè)特征樣本;而采用FS算法,當(dāng)ε=10-6時(shí),得到84個(gè)特征樣本,在這84個(gè)特征樣本中,有13個(gè)樣本為純化算法剔除的異常樣本,這表明異常樣本不先剔除更容易被FS算法選為特征樣本。由表1可見,被剔除的樣本除14號(hào)樣本外,至少有一個(gè)變量超過注意值。分別采用MFS和FS方法提取的特征樣本集建立PCA和KPCA模型,PCA和KPCA模型的分析結(jié)果見表2。由表2可見,MFS-PCA的前4個(gè)主元的CPV=95.17%,而FS-PCA的前4個(gè)主元的CPV=87.55%;MFS-KPCA的前4個(gè)主元的CPV=93.78%,而FS-KPCA的前4個(gè)主元的CPV=85.33%;并且,取相同的主元數(shù),MFS算法選取的特征樣本集建立的PCA或KPCA模型主元捕獲數(shù)據(jù)的變動(dòng)信息均比FS算法選取的特征樣本集建立的PCA或KPCA模型多。可見,MFS算法比FS算法選取的特征樣本集更能表征數(shù)據(jù)特征。
表1 MFS算法剔除的DGA樣本(uL·L-1)
表2 PCA和KPCA模型分析結(jié)果
以剔除異常樣本剩余的正常樣本535例和故障樣本275例作為測(cè)試樣本集,應(yīng)用于MFS-KPCA,F(xiàn)S-KPCA和MFS-PCA,F(xiàn)S-PCA,其中PCA監(jiān)控采用文獻(xiàn)[15]提出的復(fù)合統(tǒng)計(jì)量。表3為這幾種檢測(cè)模型的分類性能結(jié)果。由表3可見,F(xiàn)S-KPCA雖然tn最高,達(dá)到98.69%,但故障敏感性tp卻為86.55%,幾何均值為92.42%,甚至低于注意值判據(jù),這是由于FS-KPCA的建模樣本集中包含較多的異常樣本,導(dǎo)致監(jiān)控模型失效。MFS-KPCA除tn稍低于FS-KPCA和FS-PCA,其他性能指標(biāo)均為最優(yōu),故障敏感性tp達(dá)到94.91%,幾何均值為96.42%。比較而言,采用MFS提取特征樣本集建模的,無論是PCA還是KPCA,均優(yōu)于FS提取特征樣本集建模。充分說明MFS算法能夠有效地剔除異常樣本,所得到的特征樣本集建模優(yōu)于特征樣本方法。
表3 檢測(cè)結(jié)果統(tǒng)計(jì)表
另外,閾值ε的選取影響特征樣本集的規(guī)模,進(jìn)而影響MFS-KPCA的檢測(cè)性能,由于KPCA的計(jì)算效率取決于建模樣本數(shù)量,定義KPCA建模效率:
其中,nm為特征樣本數(shù),n0為剔除異常樣本后的正常樣本集的樣本數(shù)。
顯然,特征樣本數(shù)越小,計(jì)算效率越高,另一方面,特征樣本數(shù)越小,對(duì)數(shù)據(jù)集的特征描述越不充分。圖1為閾值ε與γ,tp,Gmean之間的關(guān)系圖。由圖1可見,隨ε越小,計(jì)算效率γ越低,故障敏感性tp和幾何均值Gmean先是逐步增加,在ε=10-6時(shí)到達(dá)最大值,后降低。綜合考慮計(jì)算效率和檢測(cè)效率,閾值ε可選范圍在[10-6,10-3]較為適宜。
圖1 γ,tp,Gmean與閾值ε的關(guān)系曲線
本文針對(duì)變壓器故障檢測(cè)中由于建模樣本不純而導(dǎo)致KPCA故障檢測(cè)模型失效問題,提出了基于改進(jìn)特征樣本的KPCA變壓器故障檢測(cè)模型。利用特征值變化信息提出的改進(jìn)特征樣本方法可以有效剔除異常樣本,達(dá)到凈化建模樣本的目的,解決了因異常樣本建模導(dǎo)致的檢測(cè)模型失效問題。MFS-KPCA,F(xiàn)S-KPCA和MFS-PCA,F(xiàn)S-PCA對(duì)比實(shí)驗(yàn)表明改進(jìn)特征樣本方法的可行性和有效性。MFS-KPCA的故障敏感性和幾何均值分別為94.91%和96.42%,高于FS-KPCA的故障敏感性和幾何均值分別達(dá)8個(gè)和4個(gè)百分點(diǎn),驗(yàn)證了MFSKPCA變壓器故障檢測(cè)建模的有效性。
[1]GB/T7252-2001變壓器油中溶解氣體分析和判斷導(dǎo)則[S].北京:國家質(zhì)量監(jiān)督檢驗(yàn)檢疫總局,2001.
[2]廖瑞金,廖玉祥,楊麗君,等.多神經(jīng)網(wǎng)絡(luò)與證據(jù)理論融合的變壓器故障綜合診斷方法研究[J].中國電機(jī)工程學(xué)報(bào),2006,26(3):119-124.
[3]操敦奎.變壓器油中氣體分析診斷與故障檢查[M].北京:中國電力出版社,2005:19-20.
[4]章宗標(biāo).一種基于PCA-BP神經(jīng)網(wǎng)絡(luò)的示例優(yōu)選方法[J].計(jì)算機(jī)工程與應(yīng)用,2013,49(19):108-111.
[5]唐勇波,桂衛(wèi)華,彭濤,等.基于重構(gòu)貢獻(xiàn)和灰關(guān)聯(lián)熵的變壓器診斷方法[J].儀器儀表學(xué)報(bào),2012,33(1):132-138.
[6]Dong D,Mcavoy T J.Nonlinear principal component analysis based on principal curves and neural networks[J]. Computers and Chemical Engineering,1996,20(1):65-78.
[7]Lee J M,Yoo C,Choi S W,et al.Non-linear process monitoring using kernel principal component analysis[J]. Chemical Engineering Science,2004,59(1):223-234.
[8]唐勇波,桂衛(wèi)華,彭濤.代價(jià)敏感核主元分析及其在故障診斷中的應(yīng)用[J].中南大學(xué)學(xué)報(bào):自然科學(xué)版,2013,44(6):2324-2330.
[9]唐勇波,桂衛(wèi)華,歐陽偉.基于KPCA和CPSO的故障檢測(cè)方法[J].計(jì)算機(jī)工程,2012,38(24):244-246.
[10]付克昌,吳鐵軍.基于特征子空間的KPCA及其在故障檢測(cè)與診斷中的應(yīng)用[J].化工學(xué)報(bào),2006,57(11):2664-2669.
[11]Bo Cuimei,Zhang Shi,Zhang Guangming,et al.Fault identification of Tennessee Eastman process based on FS-KPCA[J].Journal of Chemical Industry and Engineering,2008,59(7):1783-1789.
[12]祝志博,宋執(zhí)環(huán).融合FDA-PCMC樣本分類的KPCA故障檢測(cè)新算法[J].控制與決策,2010,25(4):542-545.
[13]Choi S W,Lee I B.Nonlinear dynamic process monitoring based on dynamic kernel PCA[J].Chemical Engineering Science,2004,59(24):5897-5908.
[14]Chen Q,Wynne R J,Goulding P.The application of principal component analysis and kernel density estimation to enhance process monitoring[J].Control Engineering Practice,2000,8(5):531-543.
[15]Yue H H,Qin S J.Reconstruction-based fault identification using a combined index[J].Industrial and Engineering Chemistry Research,2001,40(20):4403-4414.
TANG Yongbo
1.School of Physical Science and Engineering,Yichun University,Yichun,Jiangxi 336000,China
2.School of Information Science and Engineering,Central South University,Changsha 410083,China
In order to handle the invalidation problem of fault detection when Kernel Principal Component Analysis(KPCA)modeling sample is impure,a new KPCA monitoring model for power transformer fault detection based on Modified Feature Sample(MFS)method is proposed.A new purification algorithm is proposed to eliminate abnormal samples from original database by using eigenvalue variation.Then a Feature Sample(FS)method is adopted to extract modeling samples of KPCA;compound statistics is used to verify the state of power transformer.Experimental results show effectiveness of the modified feature sample algorithm and the proposed method has high fault sensitivity and diagnosis accuracy.
power transformer;fault detection;Kernel Principal Component Analysis(KPCA);feature sample
A
TP277;TM411
10.3778/j.issn.1002-8331.1402-0262
TANG Yongbo.Kernel Principal Component Analysis model for transformer fault detection based on modified feature sample.Computer Engineering and Applications,2014,50(21):4-7.
國家科技支撐計(jì)劃項(xiàng)目(No.2012BAK09B04)。
唐勇波(1975—),男,博士,副教授,研究領(lǐng)域?yàn)橹悄芸刂?,故障診斷等。E-mail:tybcsu@163.com
2014-02-24
2014-05-04
1002-8331(2014)21-0004-04
CNKI出版日期:2014-05-22,http://www.cnki.net/kcms/doi/10.3778/j.issn.1002-8331.1402-0262.html