陳昊藍, 靳冰瑩, 劉亞東, 錢慶林 王 鵬, 陳艷霞, 于希娟, 嚴英杰
(1. 上海交通大學(xué) 電子信息與電氣工程學(xué)院,上海 200240; 2. 國網(wǎng)青海省電力公司,西寧 810008; 3. 國網(wǎng)北京市電力公司,北京 100031)
配電網(wǎng)作為電力系統(tǒng)的最終環(huán)節(jié),與用戶體驗息息相關(guān).相比于主網(wǎng),配電網(wǎng)具有設(shè)備多、范圍廣的特點,且設(shè)備成本遠低于主網(wǎng).因此,不同于成熟的主網(wǎng)故障預(yù)警技術(shù),配電網(wǎng)的維護往往采用事后搶修的方式.近年來隨著用戶對供電質(zhì)量的要求越發(fā)提高,配電網(wǎng)自身改革和發(fā)展的需求越發(fā)迫切[1-2].如果能有效建立配電網(wǎng)故障辨識機制,在故障發(fā)生時及時發(fā)現(xiàn)故障設(shè)備及原因,故障搶修工作量將大大減少,運維效率和質(zhì)量將大大提升[3].
配電網(wǎng)故障辨識仍然存在較多研究難點.首先,訓(xùn)練樣本少[4].盡管近年來配電網(wǎng)故障波形采集裝置逐步普及,暫態(tài)波形被大量收集,但波形背后的故障原因難以確認,需要人員現(xiàn)場勘察,由于配電網(wǎng)設(shè)備多、覆蓋面廣,往往只能確認少部分異常事件.其次,故障種類多.盡管目前有不少文獻[5-7]提出暫態(tài)故障、永久性故障、暫態(tài)干擾的分類方法,故障辨識的最終結(jié)果還需要落實到故障設(shè)備及原因上,以便運維人員對設(shè)備進行檢修.不同設(shè)備故障波形往往存在一定相似性,人工判斷往往需要大量經(jīng)驗,因而準確率并不穩(wěn)定.綜上所述,急需提出一種數(shù)據(jù)依賴度低、適用各種故障類型的配電網(wǎng)故障辨識方法.
模型驅(qū)動方法需要搭建故障電路模型[7-8],對于不同故障類型需重新進行仿真,且存在個別類型難以仿真的缺點,因此不進行重點討論.數(shù)據(jù)驅(qū)動方法則根據(jù)數(shù)據(jù)推導(dǎo)波形和事件類別之間的關(guān)系,具有較強的自適應(yīng)性,在配電網(wǎng)故障辨識這一小樣本學(xué)習(xí)任務(wù)中,只需減少方法的數(shù)據(jù)依賴性即可.現(xiàn)有數(shù)據(jù)驅(qū)動方法無法處理上述場景的原因主要在于模型表達能力和對數(shù)據(jù)需求量之間的矛盾.文獻[9]中使用 Logistic 算法識別配電網(wǎng)故障,但實驗中使用的數(shù)據(jù)量較大,算法擬合能力也不強,只能用于二分類任務(wù);文獻[10]中首先利用局部特征尺度分解法構(gòu)造波形時頻矩陣,再利用支持向量機(SVM)區(qū)分時頻矩陣的奇異譜,從而區(qū)分故障類別,該方法同樣未考慮小樣本學(xué)習(xí)問題,且不具備遷移能力;文獻[11]中使用小波分解濾除波形中的諧波和非周期分量,將剩余的工頻信息作為輸入訓(xùn)練神經(jīng)網(wǎng)絡(luò),從而判斷故障短路相,由于模型只使用工頻信息,所以對于暫態(tài)故障識別效果較差,且模型對數(shù)據(jù)需求仍然較大.綜上所述,在現(xiàn)有數(shù)據(jù)驅(qū)動方法中,高復(fù)雜度模型的表達能力較強,能處理多種類型故障,但對數(shù)據(jù)需求量較高;而簡單模型則犧牲部分表達能力以減少對訓(xùn)練樣本的需求.
配電網(wǎng)故障辨識任務(wù)中的波形數(shù)據(jù)本質(zhì)為時間序列,對于時序數(shù)據(jù),需要考慮不同時刻間的相關(guān)性,而自然語言處理領(lǐng)域有較多關(guān)于序列相關(guān)性建模的研究[12-14],其中門控循環(huán)網(wǎng)絡(luò)(GRU)能更好地捕捉時間序列中的長距離依賴,即較大時間間隔的時刻間相關(guān)關(guān)系,因此受到廣泛關(guān)注.不僅如此,近些年提出的模擬人類認知的視覺注意力機制[15]同樣能有效降低數(shù)據(jù)依賴度.盡管上述方法在其他領(lǐng)域中一定程度上解決了模型數(shù)據(jù)需求量過大的問題,但在配電網(wǎng)故障辨識中還未得到充分應(yīng)用.配電網(wǎng)故障辨識任務(wù)中波形數(shù)據(jù)獨有的特征,如數(shù)據(jù)具備周期性、信息密度小、不同相的電壓電流波形間存在對應(yīng)關(guān)系等,使得針對這一場景的特定開發(fā)和改進策略成為關(guān)鍵.
針對上述問題,提出一種基于門控循環(huán)注意力網(wǎng)絡(luò)(GRAN)的配電網(wǎng)故障辨識方法,該模型基于注意力機制捕捉波形中的關(guān)鍵信息,從而降低對訓(xùn)練數(shù)據(jù)的需求,同時借助循環(huán)神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)存儲波形記憶,有效處理序列數(shù)據(jù).具體實現(xiàn)思路如下:對于關(guān)注的信息,利用非線性映射獲得對應(yīng)的權(quán)重向量,通過加權(quán)運算實現(xiàn)關(guān)鍵區(qū)域提取;對于波形序列信息,傳遞不同階段的隱含層信息作為記憶,該記憶信息和當(dāng)前階段的輸入共同決定當(dāng)前階段的輸出.基于仿真數(shù)據(jù)和實際數(shù)據(jù)的實驗均表明,該方法明顯優(yōu)于其余幾種常用的分類模型,為配電網(wǎng)故障辨識研究提供了一種全新的思路.
配電網(wǎng)故障波形辨識存在關(guān)鍵區(qū)域,即人類在認知波形時往往會關(guān)注波形發(fā)生變化的周期和其中故障出現(xiàn)或消失的時刻.由于上述注意力機制,人類能夠憑借少量樣本學(xué)習(xí)波形中的重點特征,實現(xiàn)故障類型辨識.利用數(shù)學(xué)模型引入這一注意力機制,提取波形關(guān)鍵區(qū)域,減少訓(xùn)練樣本量需求.
注意力機制可以被視為一種加權(quán)運算[15]:
xout=w°xin
(1)
式中:xin、xout∈Rn×c分別為輸入特征和輸出特征,其中n為特征維度,c為通道數(shù);w∈Rn為權(quán)重向量;算符°表示逐元素相乘.對于被重點關(guān)注的特征維度i,其對應(yīng)權(quán)重wi幅值遠大于其余維度.
對于不同應(yīng)用場景,權(quán)重向量計算是算法設(shè)計的關(guān)鍵.配電網(wǎng)故障波形辨識主要關(guān)注波形畸變所在周期,而常用的畸變捕捉算法為小波分解[5,16].對于故障波形,小波分解得到的高頻細節(jié)系數(shù)d反映了波形的突變情況,細節(jié)系數(shù)越高意味著突變情況越嚴重.以工頻下單個基波周期作為單位長度,該周期內(nèi)的畸變情況D可表示為單位長度內(nèi)細節(jié)系數(shù)幅值之和.對于歸一化后的畸變情況,利用非線性映射f可獲得最終的權(quán)重向量w,該模塊的實現(xiàn)可采用兩層全連接神經(jīng)網(wǎng)絡(luò),其中權(quán)重向量的長度等于波形周期數(shù).上述過程可寫作:
(2)
w=f(Norm(D))
(3)
式中:Tl為特征維度集合;Norm為歸一化操作.綜合上述等式,可以獲得波形關(guān)鍵區(qū)域提取框架,如圖1所示.
圖1 波形關(guān)鍵區(qū)域提取框架Fig.1 Framework of key region extraction in waveform
相較于目前流行的卷積神經(jīng)網(wǎng)絡(luò)(CNN)模型,循環(huán)神經(jīng)網(wǎng)絡(luò)[17]能更好地處理序列信息,即前一階段的輸入和后一階段的輸入存在聯(lián)系的信息.配電網(wǎng)故障波形作為序列數(shù)據(jù),其不同周期間存在極強的關(guān)聯(lián)性.循環(huán)神經(jīng)網(wǎng)絡(luò)處理序列信息的方式是傳遞隱含層數(shù)據(jù),即前一階段的隱含層數(shù)據(jù)傳遞到下一階段,與下一階段的輸入共同決定下一階段的輸出.這一隱含層信息可以理解為人類認知中的記憶信息,這種信息在長序列傳遞過程中存在嚴重的衰退和丟失問題,即數(shù)學(xué)意義上的梯度消失和爆炸.為了解決這一問題,門控機制被提出[18-19],其中更新門負責(zé)捕捉序列中的長期記憶,重置門負責(zé)捕捉序列中的短期記憶,二者計算方式如下:
zt=σ(Wzxt+Uzht-1)
(4)
rt=σ(Wrxt+Urht-1)
(5)
式中:zt、rt分別為更新門和重置門的輸出;Wz、Uz分別為更新門中當(dāng)前階段輸入xt和前一階段隱含層狀態(tài)ht-1對應(yīng)的權(quán)重;Wr、Ur分別為重置門中當(dāng)前階段輸入xt和前一階段隱含層狀態(tài)ht-1對應(yīng)的權(quán)重;σ為sigmoid激活函數(shù).
更新門和重置門的輸出本質(zhì)是一種控制信號,其中重置門決定是否重置之前存儲的隱含層信息,計算表達式為
(6)
而更新門決定如何更新當(dāng)前階段的隱含層信息,即長期記憶和短期記憶所占權(quán)重,計算表達式為
(7)
對于配電網(wǎng)中的一次異常事件,其故障類別需要綜合三相電壓、電流波形進行判斷.首先討論單一波形中的信息處理,單一波形中包含多個周期,且每個周期內(nèi)包含不同的信息.基于單個周期的類別預(yù)測可由當(dāng)前階段的隱含層信息表示:
yt=σs(Woht)
(8)
式中:yt∈RK為第t個周期內(nèi)波形對應(yīng)的預(yù)測概率,即yt, k∈[0, 1]為該周期內(nèi)波形屬于第k個類別的概率,K為類別數(shù);Wo為當(dāng)前階段隱含層信息ht對應(yīng)的權(quán)重矩陣;σs為softmax函數(shù).
由于單一波形中包含多個周期,所以需要綜合考慮各周期對應(yīng)的預(yù)測概率.在1.2節(jié)中提取了波形關(guān)鍵區(qū)域,獲得了各周期對應(yīng)的權(quán)重向量,因此將兩者結(jié)合,如圖2所示,獲得最終的預(yù)測概率:
(9)
式中:Y∈RK為最終事件預(yù)測概率,即Yk∈[0, 1]為該波形屬于第k個類別的概率;wt∈R為基于注意力的第t個周期對應(yīng)的權(quán)重;T為周期總數(shù).
圖2 GRAN框架Fig.2 Structure of gated recurrent attention network
前文討論了基于單一波形的故障類別判別,下面考慮多波形,即三相電壓、電流條件下的信息綜合.通常情況下,配電網(wǎng)瞬時性故障類別根據(jù)故障相電流進行判斷[5],但發(fā)生多相故障時,綜合考慮多相電流波形更為合理.此外,由于模型的輸入為故障點處的測量波形,此時的電壓波形同樣能幫助判斷故障類型.首先考慮單相故障,單相故障條件下的相關(guān)波形為故障相電壓U、電流I,利用GRAN分別對兩組波形進行運算即可獲得單波形下的類別預(yù)測概率YU、YI∈RK,其中YU為基于故障相電壓波形的類別預(yù)測概率,YI為基于故障相電流波形的類別預(yù)測概率,此時電壓、電流波形使用的網(wǎng)絡(luò)參數(shù)各自獨立.最終概率YE為兩組概率YU、YI的平均值.對于多相故障或故障相未知的情況,需要綜合考慮三相電壓、電流波形.對于配電網(wǎng)故障,不同相對應(yīng)的權(quán)重取決于該相故障嚴重程度,而這一指標往往與該相電流最大幅值相關(guān)[20].因此,利用注意力機制可以求得三相波形對應(yīng)的權(quán)重向量并獲得最終預(yù)測概率:
wY=fY([mIAmIBmIC])
(10)
(11)
訓(xùn)練時直接使用交叉熵作為誤差函數(shù)L,利用誤差反向傳播即可更新各個部分的權(quán)重矩陣,從而獲得最佳權(quán)重,組成最佳預(yù)測模型.
(12)
考慮到數(shù)據(jù)完備性和真實性,采集的數(shù)據(jù)分為兩部分:仿真數(shù)據(jù)和實際數(shù)據(jù).使用仿真數(shù)據(jù)的目的在于獲得各種工況下的數(shù)據(jù),由于實際數(shù)據(jù)較少,所以必須利用仿真獲取;使用實際數(shù)據(jù)的目的在于驗證模型性能,由于仿真數(shù)據(jù)和實際數(shù)據(jù)存在偏差,所以有必要在兩種數(shù)據(jù)下同時進行測試.
在電磁暫態(tài)仿真軟件PSCAD/EMTDC中搭建配電網(wǎng)10 kV架空線路仿真系統(tǒng),該系統(tǒng)基于IEEE 13節(jié)點模型[21],系統(tǒng)結(jié)構(gòu)如圖3所示,并采用非直接接地方式.其中,系統(tǒng)頻率為50 Hz,采樣頻率為 4 096 Hz,采樣長度為16個周波.仿真事件類型包含瞬時性故障、永久性故障和暫態(tài)干擾3種.仿真中隨機選取參數(shù)以模擬各種條件下的配電網(wǎng)故障數(shù)據(jù).變化參數(shù)包含噪聲強度、短路電阻、故障起始角、故障位置、故障距離、故障電弧參數(shù)、負載參數(shù)、線路參數(shù).此外,各種子類型均考慮在內(nèi),如不同故障相數(shù)(單相接地、相間、多相接地)和不同暫態(tài)干擾類型(負載變化、電容器投切).仿真數(shù)據(jù)中瞬時性故障、永久性故障和暫態(tài)干擾事件各120起,共計360起.
圖3 配電網(wǎng)10 kV架空線路模型Fig.3 Overhead line model in a 10 kV-class power distribution system
具體參數(shù)和條件設(shè)置如下.
(1) 噪聲級別:仿真中使用不同信噪比的白噪聲.
(2) 電弧模型和參數(shù):采用Kizilcay的電弧模型模擬瞬時故障,該模型下的電弧公式可寫為
(13)
(14)
式中:τ為任意時刻;g(τ)為電弧電導(dǎo)率;if(τ)為電弧電流;uf(τ)為電弧電壓;ct為電弧時間常數(shù);uo為特征電弧電壓;ro為特征電弧阻抗.各參數(shù)對應(yīng)的取值范圍為ct=0.2~0.4 ms,uo=300~4 000 V,ro=0.01~0.015 Ω.每次仿真隨機設(shè)定上述參數(shù)值.
(3) 故障電阻、起始角和距離:短路電路中除電弧以外還設(shè)置了其他的故障電阻.每次仿真時隨機選定故障電阻設(shè)定值、故障起始角設(shè)定值以及故障距離設(shè)定值.
(4) 故障位置、電容投切位置和負載變化位置:每次仿真隨機選定故障位置、電容投切位置以及負載變化位置.
(5) 線路參數(shù)(單位長度電阻、電感和電容)與負載參數(shù)(有功功率和無功功率):每次仿真隨機選定線路參數(shù)設(shè)置值以及負載參數(shù)設(shè)置值.
整個數(shù)據(jù)集包含4種類型的設(shè)備:避雷器、變壓器柔性電纜、變壓器肘型頭和架空線.其中故障原因包含雷擊引起避雷器本體炸裂擊穿、避雷器上引線觸碰橫擔(dān)、接地故障引起變壓器柔性電纜燒毀、接地故障引起變壓器肘型頭絕緣擊穿、架空線樹線矛盾.除了展示波形,還給出各種事件類型對應(yīng)的數(shù)量:避雷器故障有24起,變壓器柔性電纜故障有18起,變壓器肘型頭故障有61起,架空線故障有22起,共計125起.
現(xiàn)場運行數(shù)據(jù)由配電網(wǎng)10 kV架空線路上故障檢測裝置采集,其中電壓采集原理為空間電容分壓,電流采集原理為印制電路板羅氏線圈[22].該裝置采樣頻率為 4 096 Hz,每條記錄長度為16個周波,包含4~5個周波的觸發(fā)前信號和11~12個周波的觸發(fā)后信號,觸發(fā)方式為電壓或電流波形幅值出現(xiàn)異常.圖4為各種設(shè)備故障的典型波形.
圖4 各種設(shè)備故障的典型波形Fig.4 Typical waveforms of different equipment
將GRAN模型同另外3種常用的分類器: SVM、梯度提升決策樹(GBDT)、CNN進行比較,以體現(xiàn)本文方法的優(yōu)越性.
使用仿真數(shù)據(jù)和實際數(shù)據(jù)進行實驗,每種實驗進行20次,每次隨機劃分訓(xùn)練集、驗證集和測試集,劃分比例為3∶1∶1,以消除事件類型分布的影響.輸入波形數(shù)據(jù)首先經(jīng)過小波去噪以及幅值歸一化處理.門控循環(huán)單元數(shù)量與周期數(shù)一致,對于仿真數(shù)據(jù)和實際數(shù)據(jù)而言均為16,每一階段輸入特征維度等于單周期采樣點數(shù),對于仿真數(shù)據(jù)和實際數(shù)據(jù)而言均為82.模型訓(xùn)練在訓(xùn)練集中進行,超參數(shù)確定在驗證集中進行,最終性能測試在測試集中進行.
實驗中使用的評價指標說明如下:分類任務(wù)需要綜合考慮準確率p和召回率r,兩者的調(diào)和平均數(shù)即F1分數(shù)[23]通常作為模型評價指標.其定義如下:p為模型判斷為正的樣本中分類正確率,r為實際正樣本中模型對應(yīng)的檢出率.對于多分類問題,平均F1分數(shù)取各類別F1分數(shù)的平均值.
對比3種常用的分類模型:SVM、GBDT[24]和CNN[25].SVM模型的本質(zhì)是通過核函數(shù)將樣本映射至線性可分特征空間,并尋找可以最大化類間間隔的分類超平面.GBDT的核心思想是利用模型疊加不斷減小預(yù)測誤差來最終達到最佳效果.CNN模型是一種深層前饋神經(jīng)網(wǎng)絡(luò),在通過線性加權(quán)和激活函數(shù)擬合非線性映射的同時,利用卷積操作減少參數(shù)量,達到增加網(wǎng)絡(luò)深度、提升模型性能的目的.由于SVM和CNN使用的是標準結(jié)構(gòu),所以只給出GBDT的模型結(jié)構(gòu),如圖5所示.由圖可見,該模型本質(zhì)為簡單決策樹的集成學(xué)習(xí).
圖5 GBDT模型結(jié)構(gòu)Fig.5 Structure of GBDT model
各模型實現(xiàn)細節(jié)如下:SVM模型在MATLAB環(huán)境中進行,使用工具為libsvm軟件包[26],SVM類型為C分類,核函數(shù)選擇多項式函數(shù),核函數(shù)中的gamma值和懲罰因子通過交叉驗證確定.GBDT在python環(huán)境中進行,使用工具為xgboost軟件包[27],每棵隨機采樣的特征的占比(colsample_bytree)參數(shù)為0.7,最小子節(jié)點權(quán)重為3,學(xué)習(xí)率(eta)為0.1.SVM方法參考文獻[16],首先利用3層db4小波基函數(shù)對波形進行分解,提取近似系數(shù)和細節(jié)系數(shù)的每個周期內(nèi)最大幅值作為輸入特征向量,由于存在多組波形,所以將每個波形的輸入特征向量拼接得到最終輸入特征.CNN在python環(huán)境中進行,使用tensorflow框架,其結(jié)構(gòu)參數(shù)如下:假設(shè)采樣總長度為N,則輸入層尺寸為(1,N,6).對于基于實際數(shù)據(jù)的實驗,由于訓(xùn)練數(shù)據(jù)較少,所以使用了基于仿真數(shù)據(jù)的預(yù)訓(xùn)練網(wǎng)絡(luò).
表中事件類別說明如下:仿真類別1、2、3分布代表暫態(tài)故障、永久性故障和暫態(tài)干擾,實驗類別1、2、3、4分別代表避雷器故障、變壓器柔性電纜故障、變壓器肘型頭故障和架空線樹線矛盾.首先對比不同模型的F1分數(shù)(見表1),可以看到,GRU的分類準確率優(yōu)于其余3種模型.這是因為GRU考慮了不同階段的輸入之間的關(guān)系,對不同周期間的相關(guān)性進行有效建模.而其余幾種模型只是單純將不同周期內(nèi)的特征視作不同輸入屬性.其次,相比于SVM和GBDT,GRU和CNN在實際數(shù)據(jù)上的表現(xiàn)更好,這是因為后兩個模型使用了基于仿真數(shù)據(jù)的預(yù)訓(xùn)練網(wǎng)絡(luò).預(yù)訓(xùn)練網(wǎng)絡(luò)中保留的權(quán)重對應(yīng)特征提取層,通過較多的仿真數(shù)據(jù)可以獲得較好的特征提取效果,再通過實際數(shù)據(jù)微調(diào)網(wǎng)絡(luò)參數(shù)就可以大大降低模型的數(shù)據(jù)依賴性.
表1 不同模型F1分數(shù)對比Tab.1 Comparison of F1 score of different models
其次,對比不同模型的平均F1分數(shù)分布情況(見圖6),這一結(jié)果體現(xiàn)了模型的性能穩(wěn)定性,即事件類型分布對模型性能的影響程度.可以看到,所提方法最適合在配網(wǎng)故障辨識這一場景中使用.這是因為GRAN的分類準確率在平均值附近波動,較為穩(wěn)定.相比之下,SVM和GBDT的準確率整體水平較低,無法應(yīng)用于實際場景中,CNN參數(shù)量高、數(shù)據(jù)需求大,其準確率受數(shù)據(jù)類型分布影響大.
圖6 不同模型平均F1分數(shù)分布Fig.6 Distribution of average F1 score of different models
對比GRU和所提GRAN.GRAN訓(xùn)練流程如下:首先,利用3層dB4小波基函數(shù)對原始波形進行分解,利用最后一層細節(jié)系數(shù)計算畸變向量,再利用兩層全連接神經(jīng)網(wǎng)絡(luò)對畸變向量進行映射獲得權(quán)重向量;然后,將波形輸入GRAN輸出類型預(yù)測結(jié)果.由于單起事件中存在三相電壓、三相電流共6組波形,所以需要對每組波形進行上述運算,再對每組波形預(yù)測概率進行加權(quán)平均.需要說明的是,每組波形使用不同的網(wǎng)絡(luò)參數(shù),即本次實驗一共訓(xùn)練6個GRAN,分別用于處理三相電壓和三相電流數(shù)據(jù).同時,由于實際數(shù)據(jù)量太小,利用真實數(shù)據(jù)進行實驗時使用的是基于仿真數(shù)據(jù)的預(yù)訓(xùn)練模型.對每個波形而言,畸變向量到權(quán)重向量的非線性映射擬合采用兩層全連接神經(jīng)網(wǎng)絡(luò),兩層隱含層神經(jīng)元個數(shù)均為周期數(shù).對于每個事件而言,電流幅值向量到三相權(quán)重向量的非線性映射擬合采用兩層全連接神經(jīng)網(wǎng)絡(luò),兩層隱含層神經(jīng)元個數(shù)均為相數(shù).這里畸變向量到權(quán)重向量的非線性映射在同類型波形間共享,電流幅值向量到三相權(quán)重向量的非線性映射在所有事件中共享.
表2給出GRAN和GRU的性能,仿真類別1、2、3分布代表暫態(tài)故障、永久性故障和暫態(tài)干擾,實驗類別1、2、3、4分別代表避雷器故障、變壓器柔性電纜故障、變壓器肘型頭故障和架空線樹線矛盾.可以看到,該模型適用于仿真數(shù)據(jù)和實際數(shù)據(jù)中的各種事件類型,即具備良好的泛化性能.同時,注意力機制使得模型相較于GRU性能進一步提升.
表2 本文所提模型在不同事件類別下的F1分數(shù)
以基于單波形的故障類別判別為例,在綜合各周期預(yù)測概率階段,注意力機制使得畸變較為嚴重的周期對應(yīng)的權(quán)重更高,這導(dǎo)致最終預(yù)測結(jié)果主要參考畸變較為嚴重的周期.這一基于領(lǐng)域知識的機制有效提高了預(yù)測準確率.這里稱畸變較為嚴重的周期為關(guān)鍵周期,其余周期為非關(guān)鍵周期.不同類型故障在非關(guān)鍵周期差異不大,因此預(yù)測概率趨近于各類別均勻分布.但在關(guān)鍵周期,通過波形特征能很好地判斷故障類型,此時預(yù)測概率集中分布在目標類別.賦予關(guān)鍵周期預(yù)測結(jié)果更高的權(quán)重,使得最終綜合預(yù)測結(jié)果更加準確.另外,由于關(guān)鍵周期對應(yīng)權(quán)重更高,誤差反向傳播時,GRU參數(shù)更新主要在關(guān)鍵周期對應(yīng)的階段進行.這一現(xiàn)象可近似看作截取關(guān)鍵周期波形數(shù)據(jù)訓(xùn)練網(wǎng)絡(luò),數(shù)據(jù)維度下降,模型對數(shù)據(jù)需求量相應(yīng)減少.上述分析基于單波形條件下的故障類別判別,對于多波形條件下的故障類別判別,所提模型同樣利用注意力機制確定了主要故障相,最終預(yù)測結(jié)果也主要參考主要故障相下的電壓、電流信息.此外,作為所提框架的基礎(chǔ),GRU能夠有效處理序列數(shù)據(jù),建立起不同階段間的依賴關(guān)系,對提升準確率同樣起到關(guān)鍵作用.上述實驗結(jié)果及分析表明,該模型為解決配電網(wǎng)故障識別中小樣本學(xué)習(xí)這一關(guān)鍵問題提供了一種全新且有效的思路.
在配電網(wǎng)故障辨識任務(wù)中,樣本收集困難,降低模型數(shù)據(jù)需求量成為研究關(guān)鍵.GRAN借助注意力機制和循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)有效提取序列中的關(guān)鍵信息,進而準確識別配電網(wǎng)故障類型.其中,注意力機制本質(zhì)是一種加權(quán)運算,通過輸入關(guān)注信息經(jīng)由非線性映射獲得權(quán)重向量;循環(huán)神經(jīng)網(wǎng)絡(luò)則是通過傳遞隱含層狀態(tài),建立起不同階段輸入、輸出之間的關(guān)系,進而有效處理序列信息.基于仿真數(shù)據(jù)和實際數(shù)據(jù)的實驗表明,該方法在配電網(wǎng)不同設(shè)備故障識別任務(wù)中準確率明顯優(yōu)于其余幾種常用分類方法,推進了配電網(wǎng)智能化進程.