佳木斯電機(jī)股份有限公司哈爾濱技術(shù)研發(fā)分公司 宮 洵 哈爾濱電氣國際工程有限責(zé)任公司 關(guān) 悅
麥肯食品(哈爾濱)有限公司 陳 陽
干式空心電抗器由于其結(jié)構(gòu)簡單,自投入使用后一直被認(rèn)為是免維護(hù)設(shè)備,其運(yùn)維技術(shù)的發(fā)展一直處于滯后狀態(tài)。由于檢修技術(shù)處于初級階段,主要是人力定期檢修。隨著電網(wǎng)規(guī)模的擴(kuò)大和智能化水平的提升,定期檢修模式暴露出越來越多的問題:資源浪費(fèi)嚴(yán)重、檢修標(biāo)準(zhǔn)具有較強(qiáng)的主觀性以及影響電網(wǎng)運(yùn)行等,因此該模式已不能滿足電網(wǎng)和電力設(shè)備的管理要求。
對于運(yùn)行在電力系統(tǒng)中的電抗器而言,需對電抗器的運(yùn)行狀態(tài)和故障類型進(jìn)行實(shí)時(shí)監(jiān)測,可使用一個(gè)特定的模型進(jìn)行判斷。當(dāng)電抗器存在故障并通過模型判斷出電抗器的故障類型后進(jìn)一步使用特定的故障位置識別模型對故障位置進(jìn)行識別。
本文提出一種基于CNN的分層診斷模型,連續(xù)識別電抗器的運(yùn)行狀態(tài)、故障類別以及故障位置。分層診斷模型由兩層CNN級聯(lián)組成,第一層用于識別電抗器的運(yùn)行狀態(tài)及故障類型,以準(zhǔn)確識別電抗器的故障。第一層輸出結(jié)果用于第二層故障位置識別模型的選擇,進(jìn)一步對電抗器該故障類型下的故障位置進(jìn)行判斷?;贑NN的分層診斷模型具有較強(qiáng)的靈活性和可移植性,該分層模型最大限度的實(shí)現(xiàn)了模型內(nèi)部參數(shù)的解耦,可根據(jù)具體的需求將其重新配置以實(shí)現(xiàn)設(shè)備的故障診斷,避免了內(nèi)部參數(shù)高度耦合造成的模型準(zhǔn)確率降低的問題,且該分層模型的方法可應(yīng)用于其余電氣設(shè)備的故障診斷中,這種靈活性打破了傳統(tǒng)故障診斷方法的局限性[1]。
本文使用的電抗器故障數(shù)據(jù)是通過MATLAB軟件進(jìn)行數(shù)值仿真計(jì)算得到的準(zhǔn)穩(wěn)態(tài)故障數(shù)據(jù)、是非時(shí)序數(shù)據(jù),實(shí)際電力系統(tǒng)中通過分布式傳感器測量得到的是一系列時(shí)序分布式數(shù)據(jù)。在考慮理想情況下各傳感器性能上沒有太大的偏差,特別是對于各電氣量的測量時(shí)沒有相位誤差,即所有傳感器幾乎在同一時(shí)間點(diǎn)對電氣數(shù)據(jù)進(jìn)行測量。由此可將MATLAB軟件計(jì)算得到的準(zhǔn)穩(wěn)態(tài)故障數(shù)據(jù)轉(zhuǎn)化為時(shí)序數(shù)據(jù),時(shí)序數(shù)據(jù)所使用的采樣頻率為1000Hz,即一個(gè)工頻周期的采樣數(shù)為20個(gè)點(diǎn)。
本文主要通過CNN模型實(shí)現(xiàn)對電抗器故障的識別。為表現(xiàn)CNN模型在數(shù)據(jù)特征提取上的優(yōu)越性,CNN的卷積核使用無數(shù)據(jù)特征的“空核”,在CNN分類器訓(xùn)練的過程中前饋不斷更新該卷積核,使其卷積核具有電抗器不同故障類型數(shù)據(jù)、某種故障類型下不同故障位置數(shù)據(jù)的主要特征。模型的分類器在電抗器未發(fā)生故障時(shí)則輸出“無故障”,而電抗器發(fā)生故障時(shí)則可輸出電抗器的故障類型、故障位置。CNN模型通常包括卷積層、池化層和全鏈接分類器,由于卷積層和池化層不參與分類器的訓(xùn)練,因此在一定程度上可將卷積層和池化層看作電抗器故障數(shù)據(jù)的特征提取器,把數(shù)據(jù)特征進(jìn)行分類識別的是帶有Softmax激活函數(shù)的全鏈接層,可將其看作分類器[2]。
對于分布式電流數(shù)據(jù),使用卷積核在信號進(jìn)行卷積運(yùn)算并得到故障數(shù)據(jù)的卷積特征表示。每個(gè)卷積核是一個(gè)尺寸為的矩陣,當(dāng)進(jìn)行卷積操作時(shí),卷積核沿著數(shù)據(jù)熱圖的時(shí)間維度平行移動(dòng),和預(yù)期重合部分的信號進(jìn)行點(diǎn)積運(yùn)算,得到該時(shí)間步上對應(yīng)三個(gè)線圈支路的數(shù)據(jù)特征,卷積核移動(dòng)的步長記為,當(dāng)卷積核移動(dòng)到右端頂邊時(shí)下跳一格重復(fù)此操作。設(shè)置卷積核的填充數(shù)為個(gè)單位、尺寸為的電抗器運(yùn)行數(shù)據(jù),通過卷積核的卷積計(jì)算得到的特征張量(圖像)尺寸:Qc=(Ic-Dc+Lc)/ls。
需注意的是,在CNN進(jìn)行訓(xùn)練過程中,由于卷積核進(jìn)行了歸一化操作,此處與卷積核發(fā)生點(diǎn)積運(yùn)算的信號塊也進(jìn)行該操作,這樣能更好地提取數(shù)據(jù)信號的故障特征。卷積操作時(shí)的卷積層有k個(gè)卷積核,每個(gè)信號熱圖(電抗器運(yùn)行數(shù)據(jù))可相應(yīng)得到k個(gè)特征表示矩陣,由于該數(shù)據(jù)熱圖的尺寸小,因此該卷積操作的計(jì)算量是極小的,整個(gè)卷積計(jì)算的時(shí)間自然也就很短。
整個(gè)基于卷積神經(jīng)網(wǎng)絡(luò)的電抗器故障識別模型內(nèi)有三個(gè)子模型,分別是故障類型診斷模型(模型A)、匝間短路故障位置判斷模型(模型B1)、單匝斷路故障位置判斷模型(模型B2),三個(gè)子模型的思路及構(gòu)建方法一致,其內(nèi)部參數(shù)會(huì)因?yàn)榉诸悩?biāo)簽、分類個(gè)數(shù)的不同而存在一定的差異。
CNN:定義一次完整的卷積學(xué)習(xí)為輸入數(shù)據(jù)依次經(jīng)過卷積層、激活函數(shù)、池化層,卷積學(xué)習(xí)的輸出為單次卷積學(xué)習(xí)的特征。本節(jié)所采用的CNN模型結(jié)構(gòu)如圖1,使用卷積對提取特征的操作進(jìn)行三次卷積學(xué)習(xí)過程。第一次卷積學(xué)習(xí)過程的輸入為40×41的二維熱圖,使用的卷積核的尺寸大小為3×3,卷積核個(gè)數(shù)為8個(gè),卷積學(xué)習(xí)得到的特征使用激活函數(shù)進(jìn)行激活,池化層所使用的池化尺寸為2×2,因此,該次卷機(jī)學(xué)習(xí)過程輸出的結(jié)果為20×20×8的特征表示。第二次和第三卷積學(xué)習(xí)過程卷積核尺寸仍為3×3,但其卷積輸出分別設(shè)置為16和32,經(jīng)過函數(shù)激活,尺寸為2×2的池化層進(jìn)行池化后,最終得到5×5×32的特征表示。
圖1 故障類型識別模型的訓(xùn)練表現(xiàn)
Softmax分類器:由于故障數(shù)據(jù)CNN卷積學(xué)習(xí)后得到32個(gè)特征表示,且每個(gè)池化后的卷積特征表示的尺寸為5×5,將其展開后長度為25,因此Softmax分類器的輸入大小設(shè)置為800,權(quán)重衰減參數(shù)Si為0.0001。對于模型A,Softmax激活函數(shù)的輸出為一個(gè)長度為3的向量,對應(yīng)為該數(shù)據(jù)為何種故障種類的概率表現(xiàn);對于模型B1和B2,Softmax激活函數(shù)的輸出為一個(gè)長度為41的向量,對應(yīng)為該數(shù)據(jù)為對應(yīng)故障概率位置。
模型的訓(xùn)練過程中涉及到對訓(xùn)練參數(shù)的調(diào)節(jié),對參數(shù)設(shè)置及調(diào)整策略將對模型的訓(xùn)練效果造成直接的影響。梯度下降是針對單個(gè)參數(shù)進(jìn)行優(yōu)化最常用的方法,其基本思路是沿著梯度下降速度最大的方向進(jìn)行探索,在其基礎(chǔ)上衍生出了隨機(jī)梯度下降算法,解決了梯度下降易陷入局部最優(yōu)值無法“逃出”的問題,并加快了算法的訓(xùn)練速度,但這一類算法都無法實(shí)現(xiàn)對大規(guī)模樣本的復(fù)雜模型進(jìn)行訓(xùn)練。Adam(Adaptive Moment Estimation)算法是一種計(jì)算梯度的一階與二階矩估計(jì)改良神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程中參數(shù)的方法,集中了適應(yīng)性梯度與均方根傳播算法的優(yōu)點(diǎn),能自動(dòng)選擇參數(shù)的學(xué)習(xí)率來改善梯度的稀疏水平,同時(shí)能較好的處理非穩(wěn)態(tài)在線的問題[3]。
另外,學(xué)習(xí)率較大時(shí)可使得模型的訓(xùn)練速度更快,但易造成不收斂的情況;學(xué)習(xí)率較小不僅使得訓(xùn)練速度變慢,還易進(jìn)入局部最優(yōu)解。因此,對于學(xué)習(xí)率的設(shè)置采用了學(xué)習(xí)率衰減的方法來加快模型訓(xùn)練,隨著訓(xùn)練的不斷深入,學(xué)習(xí)率不斷衰減使模型的訓(xùn)練更優(yōu)化。本文采用的學(xué)習(xí)率衰減策略為每隔一定的訓(xùn)練代數(shù),學(xué)習(xí)率減小一個(gè)數(shù)量級。
對于故障類型識別模型的訓(xùn)練,設(shè)置學(xué)習(xí)率(LR)為0.01,訓(xùn)練代數(shù)(Epoch)設(shè)置為10,批量大?。˙atch size)設(shè)置為64,學(xué)習(xí)率衰減步數(shù)為2個(gè)訓(xùn)練代,衰減率為0.1時(shí)其訓(xùn)練結(jié)果如圖1所示。模型在第一代訓(xùn)練的初始準(zhǔn)確率不到80%,經(jīng)過4代的訓(xùn)練,訓(xùn)練準(zhǔn)確率和測試準(zhǔn)確率均到達(dá)了100%,且訓(xùn)練損失函數(shù)在第7代訓(xùn)練后低至0.0027。測試集準(zhǔn)確率對于訓(xùn)練集準(zhǔn)確率具有很好的跟隨性且一直保持一致,不存在測試集準(zhǔn)確率低于訓(xùn)練集準(zhǔn)確率的情況,因此對于故障類型識別模型不存在過擬合現(xiàn)象。
同樣地,對于短路故障位置識別模型訓(xùn)練參數(shù)的設(shè)置與故障類型識別模型的參數(shù)一致(LR為0.01、Epoch為10、Batch size為64、衰減步數(shù)為2、衰減率為0.1),訓(xùn)練結(jié)果如圖2。模型的訓(xùn)練初始準(zhǔn)確率為85.67%,經(jīng)過4代訓(xùn)練,訓(xùn)練準(zhǔn)確率和測試準(zhǔn)確率也達(dá)到了100%,兩者也保持了非常好的跟隨性,不存在過擬合現(xiàn)象。
圖2 短路故障位置識別模型的訓(xùn)練表現(xiàn)
斷路故障位置識別模型的訓(xùn)練參數(shù)的設(shè)置與調(diào)整與前兩者不一樣,其初始學(xué)習(xí)率為0.01,訓(xùn)練代數(shù)為20、批量大小設(shè)置為64、學(xué)習(xí)率衰減步數(shù)設(shè)置為5、衰減率為0.1。訓(xùn)練結(jié)果如圖4,模型的訓(xùn)練初始準(zhǔn)確率只有2.47%,經(jīng)過11代的訓(xùn)練,訓(xùn)練結(jié)果到達(dá)100%,模型初始損失函數(shù)值也高達(dá)3.7,最終降至0.06。同樣地,斷路故障位置識別模型也不存在過擬合現(xiàn)象,訓(xùn)練準(zhǔn)確率和測試準(zhǔn)確率一直保持一樣。
圖3 斷路故障位置識別模型的訓(xùn)練表現(xiàn)
圖4 模型在在線監(jiān)測場景下的故障類型識別結(jié)果
將三個(gè)模型按照CNN的結(jié)構(gòu)連接,使用測試集對整個(gè)故障診斷系統(tǒng)進(jìn)行測試,當(dāng)系統(tǒng)對測試集某一條數(shù)據(jù)進(jìn)行判斷,其正確率的表示如下式,含義為只有當(dāng)故障類型和故障位置均識別正確時(shí)才視其結(jié)果為正確,否則視為對該數(shù)據(jù)的識別錯(cuò)誤。在仿真得到的分布式數(shù)據(jù)中再隨機(jī)抽取20%的數(shù)據(jù)作為試驗(yàn)集,對訓(xùn)練的到的模型進(jìn)行驗(yàn)證。模型的識別準(zhǔn)確率達(dá)到100%,驗(yàn)證了通過模型分層的故障識別方法的有效性。
在上述研究中,用于學(xué)習(xí)特征和訓(xùn)練分類器的波形信號段對應(yīng)的是相同的時(shí)間范圍(即使用的訓(xùn)練數(shù)據(jù)都是以故障發(fā)生時(shí)間作為起點(diǎn))。但在實(shí)際應(yīng)用過程中,模型的輸入量包含了非故障數(shù)據(jù)和故障數(shù)據(jù)的模糊區(qū)域,模糊區(qū)域可能會(huì)使得模型對故障的判斷出現(xiàn)誤判或漏判的情況。鑒于此,在本節(jié)使用不同時(shí)間范圍內(nèi)的數(shù)據(jù)形成訓(xùn)練集,另外由于電抗器在發(fā)生故障后幾乎沒有暫態(tài)過程、直接進(jìn)入故障準(zhǔn)穩(wěn)態(tài),故障波形在模糊區(qū)域是逐步出現(xiàn),在故障發(fā)生的早期模型無法準(zhǔn)確的提取處故障特征進(jìn)行故障識別。因此本節(jié)探究非故障和故障混合的數(shù)據(jù)中故障時(shí)長占整個(gè)時(shí)間窗口的比例對故障識別模型的影響。
利用ANSYS Maxwell仿真軟件對電抗器的故障進(jìn)行仿真,得到含有電抗器故障暫態(tài)過程的分布式電流數(shù)據(jù),最終通過遍歷不同的參數(shù)取值可得到5043條數(shù)據(jù)樣本,包含2952條短路故障和2091條斷路故障的暫態(tài)過程數(shù)據(jù),暫態(tài)過程數(shù)據(jù)包括三個(gè)工頻周期的正常運(yùn)行數(shù)據(jù)和兩個(gè)工頻周期的故障后準(zhǔn)穩(wěn)態(tài)數(shù)據(jù)。每條數(shù)據(jù)的采樣頻率為1000Hz,時(shí)間窗口長度為100。在數(shù)據(jù)劃分時(shí),選取的訓(xùn)練窗口長度為40(兩個(gè)工頻周期),設(shè)定非故障和故障混合的數(shù)據(jù)中故障時(shí)長占訓(xùn)練窗口時(shí)長比例大于P定義為“有故障”,小于P定義為“無故障”。
具體而言,含有80個(gè)點(diǎn)的暫態(tài)過程數(shù)據(jù),故障開始點(diǎn)為第40個(gè)點(diǎn)(對應(yīng)時(shí)間為t,單位ms),則第零點(diǎn)時(shí)間為t-40,第80點(diǎn)的時(shí)間為t+40,當(dāng)故障時(shí)長占訓(xùn)練時(shí)間窗口比例P設(shè)為20%時(shí),兩個(gè)工頻周期數(shù)據(jù)中,故障數(shù)據(jù)時(shí)長8ms,正常數(shù)據(jù)時(shí)長32ms,即窗口時(shí)間可表示為[t-32,t+8]。起始時(shí)間低于t-32的窗口數(shù)據(jù)均為“無故障”,起始時(shí)間晚于t-32的窗口數(shù)據(jù)為“有故障”。由此可得到302580條數(shù)據(jù)。隨機(jī)將80%的數(shù)據(jù)分入訓(xùn)練數(shù)據(jù)集(242064個(gè)樣本),剩余的20%則分入測試數(shù)據(jù)集(60516個(gè)樣本)。
繪制CNN模型在在線監(jiān)測場景下對故障類型識別的結(jié)果。由于故障起始時(shí)間為20ms,且訓(xùn)練數(shù)據(jù)中設(shè)定故障時(shí)長占比為P>12.5%的為故障數(shù)據(jù)。因此在檢測到故障之前,每個(gè)樣本的輸出結(jié)果均為“無故障”。為清楚地展示每個(gè)信號樣本的輸出結(jié)果,在圖中將各個(gè)樣本的結(jié)果隨機(jī)地上移或下移了一定的距離。
在對模型的輸出進(jìn)行后處理后,各種類型故障對應(yīng)的樣本均可得到穩(wěn)定的故障選相結(jié)果,且結(jié)果在故障發(fā)生后基本不發(fā)生變化,尤其是在訓(xùn)練樣本不覆蓋的30ms至60ms時(shí)間范圍內(nèi)也沒有觀察到選相錯(cuò)誤。所有故障類型的故障檢測時(shí)間基本上在10ms以內(nèi)。考慮到在模型的實(shí)現(xiàn)中將包含故障后波形比例低于12.5%(對應(yīng)5ms)的信號段歸入“無故障”類別,這樣的響應(yīng)速度是較為迅速的。另外,觀察到在22.5~27.5ms的時(shí)間范圍內(nèi)會(huì)存在誤判的情況,但在5ms后其判定基本穩(wěn)定,因此可在在線監(jiān)測場景下設(shè)置當(dāng)模型連續(xù)3次判斷到故障時(shí)則最終判定故障。以此,也能在故障發(fā)生后的10ms(半個(gè)工頻周期)內(nèi)將故障識別出來。