彭志遠(yuǎn),谷湘煜,周仁彬,鮮開義,楊利萍,梁洪軍,鄒 娟
(深圳市朗馳欣創(chuàng)科技股份有限公司,深圳 518000)
變電站設(shè)備種類和數(shù)量眾多,且為了提高防護(hù)性和安全性,大多安放在密閉箱柜、溝道等封閉空間[1]。隨著機(jī)器人技術(shù)的快速發(fā)展,巡檢機(jī)器人在日常的巡檢工作中得到了廣泛應(yīng)用,但是現(xiàn)有的機(jī)器人系統(tǒng)難以有效進(jìn)入封閉空間,并且需要后臺人員實時監(jiān)控數(shù)據(jù)變化,無人化程度較低。為了提高系統(tǒng)無人化程度,邵慶祝等[2]基于長短期記憶網(wǎng)絡(luò)(long short term memory,LSTM)模型對配電網(wǎng)單相接地故障進(jìn)行故障辨識;徐家慧等[3]則使用網(wǎng)絡(luò)復(fù)雜度更低的門控循環(huán)單元(gated recurrent unit,GRU)網(wǎng)絡(luò)對電網(wǎng)告警信息進(jìn)行了分類;楊濟(jì)海等[4]為了提高效率,對傳統(tǒng)LSTM模型進(jìn)行改進(jìn),使用并行的F-LSTM網(wǎng)絡(luò)進(jìn)行了故障預(yù)測;王磊[5]則使用混動蟻群優(yōu)化算法對LSTM網(wǎng)絡(luò)進(jìn)行優(yōu)化,完成對高壓斷路器故障的預(yù)測;Peng等[6]使用3 dB的小波對故障信號進(jìn)行分解,基于稀疏自編碼神經(jīng)網(wǎng)絡(luò)構(gòu)建深度學(xué)習(xí)網(wǎng)絡(luò),計算出子帶能量作為深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的參數(shù),完成對電力線纜的故障診斷。但是這些方法大多集中在網(wǎng)絡(luò)的或者算法的研究,與實際問題結(jié)合不夠緊密。
以自研的一套變電站巡檢系統(tǒng)(系統(tǒng)結(jié)構(gòu)如圖1所示)為基礎(chǔ),首先分析了變電站密閉箱柜、溝道中設(shè)備的巡檢需求以及相應(yīng)的物聯(lián)網(wǎng)終端構(gòu)建方式;其次,確立了各項傳感數(shù)據(jù)的采集、處理和標(biāo)注方法;再次,為了提高收斂速度,獲取最優(yōu)解,基于GRU網(wǎng)絡(luò)結(jié)合粒子群優(yōu)化(particle swarm optimization,PSO)優(yōu)化算法構(gòu)建基于PSO-GRU網(wǎng)絡(luò)的變電站各項設(shè)備故障的智能判斷方法。最后,通過實驗對LSTM、GRU和PSO-GRU網(wǎng)絡(luò)進(jìn)行了對比,證明了算法兼顧了快速性和準(zhǔn)確性。
變電站日常的箱柜巡檢主要是對端子箱、檢修電源箱、匯控柜、開關(guān)機(jī)構(gòu)箱、刀閘機(jī)構(gòu)箱、滅火裝置柜等進(jìn)行巡檢;溝道巡檢主要對通信、控制、信號、電源、動力線纜等線纜情況進(jìn)行巡檢??傮w來說,可以分為參數(shù)類檢測和設(shè)備狀態(tài)類檢測兩大類,具體如表1所示。
表1 日常巡檢需求及分類
對于參數(shù)類數(shù)據(jù),通過諸如溫濕度傳感器、紅外測溫儀、觸點(diǎn)開關(guān)、水位傳感器等終端進(jìn)行采集;對于狀態(tài)類數(shù)據(jù),使用可見光相機(jī)進(jìn)行圖片采集,結(jié)合圖像處理算法獲取相應(yīng)參數(shù)值。
通過上述物聯(lián)網(wǎng)終端設(shè)備的反饋數(shù)據(jù)構(gòu)建D={Hi,Tj,Sk,Wm,Cn},其中H、T、S、W、C分別表示濕度值向量、溫度值向量、觸點(diǎn)開關(guān)開合狀態(tài)向量、水位高度值向量和狀態(tài)類數(shù)據(jù)向量;i、j、k、m、n分別表示對應(yīng)各類傳感器個數(shù),即向量的維度。狀態(tài)類數(shù)據(jù)向量通過現(xiàn)有的圖像處理、圖像顯著性檢測方法[7-8]等獲取被測物體的完整性、脫落、積塵、銹蝕、絕緣老化、指示燈、分合閘等狀態(tài)均轉(zhuǎn)換為異常情況概率P∈[0,1],通過現(xiàn)有圖像識別算法[9-10]識別儀器儀表的各項參數(shù)值。通過此流程,即可獲取一組完整的數(shù)據(jù)值。
以時間間隔θ進(jìn)行一組完整數(shù)據(jù)的采集。多次采集完成后,以時間維度對數(shù)據(jù)進(jìn)行z-score[10]標(biāo)準(zhǔn)化,計算公式為
(1)
由于所使用算法為有監(jiān)督學(xué)習(xí)方法,因此需要對數(shù)據(jù)進(jìn)行標(biāo)注。通過專家經(jīng)驗對采集的數(shù)據(jù)進(jìn)行標(biāo)注,因為故障的出現(xiàn)有相關(guān)性并且其嚴(yán)重程度有區(qū)別,因此一組z-score規(guī)范化后的數(shù)據(jù)標(biāo)注為4維向量Tag={f1,f2,f3,l},其中,f1、f2、f3為最有可能的故障類型的前3種,l∈{非常嚴(yán)重,嚴(yán)重,一般,可能}為嚴(yán)重程度。為了便于后續(xù)網(wǎng)絡(luò)訓(xùn)練的應(yīng)用,從0開始依次對故障類型f進(jìn)行編號,對嚴(yán)重程度同樣從0依次編號,并對二者進(jìn)行Embedding編碼,對每個故障類型和嚴(yán)重程度編碼為8位嵌入詞向量,因此Tag將轉(zhuǎn)換為含有32個元素的向量。
封閉箱體和溝道內(nèi)各個傳感設(shè)備的參數(shù)以時間軸為序列排布,且故障的發(fā)生與前一段時間內(nèi)各項參數(shù)有密切聯(lián)系。循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network, RNN)是處理時間序列數(shù)據(jù)的一種有效的網(wǎng)絡(luò)結(jié)構(gòu)[11], LSTM網(wǎng)絡(luò)是RNN的一種擴(kuò)展,可以有效解決常規(guī)RNN的梯度消失和梯度爆炸問題[12],其中含有輸入門、遺忘門和輸出門的門控機(jī)制分別控制輸入值、記憶值和輸出值,GRU模型[13]中只有更新門和復(fù)位門,因此結(jié)構(gòu)更加簡潔,參數(shù)更少,訓(xùn)練速度更快。GRU典型結(jié)構(gòu)如圖2所示。
圖2 GRU單元結(jié)構(gòu)
xt、ht分別為GRU單元的輸入和輸出,ht-1為上個單元的輸出。各參數(shù)的推導(dǎo)公式分別為
更新門:
zt=σ(Wz[ht-1,xt])
復(fù)位門:
rt=σ(Wr[ht-1,xt])
(2)
記憶:
ht=tanh[W(rtht-1,xt)]
(3)
輸出:
(4)
粒子群優(yōu)化算法[14]是基于個體之間信息的共享和協(xié)助來進(jìn)行整體的迭代更新,尋找最優(yōu)解。可以進(jìn)行如下的描述:存在一個搜索空間M,維度為m,存在一個種群X={x1,x2,…,xn|xi=(xi1,xi2,…,xim)},在時刻t時,種群的位置、速度以及個體、全局的最優(yōu)位置分別為
(5)
根據(jù)個體和全局最優(yōu)位置,粒子群依據(jù)式(6)、式(7)進(jìn)行更新。
t+1vid=ωtvid+r1c1(tpid-txid)+r2c2(tPid-txid)
(6)
t+1xid=txid+t+1vid
(7)
式中:ω為慣性因子,是一個非負(fù)值;r∈(0,1)為隨機(jī)數(shù);c為學(xué)習(xí)因子;vid∈[Vmin,Vmax];xid∈[Xmin,Xmax]用于保證速度和位置不會超限。式(6)中ωtvid用于記憶上次速度的大小和方向;r1c1(tpid-txid)為個體當(dāng)前位置與最好位置的位矢,表示個體自身經(jīng)驗;r2c2(tPid-txid)為個體到種群最好位置的位矢,表示種群的協(xié)同合作。
慣性因子關(guān)乎尋優(yōu)能力的強(qiáng)弱,值越大,全局尋優(yōu)能力強(qiáng),但局部尋優(yōu)能力弱,反之亦然。因此為了平衡二者,使用線性遞減權(quán)值(linearly decreasing weight, LDW)方法[15],可表示為
ωt=(ωinit-ωend)(K-k)/K+ωend
(8)
式(8)中:ωinit、ωend分別為初始權(quán)值和最終權(quán)值,一般分別取0.9和0.4;K為總迭代數(shù);k為當(dāng)前迭代數(shù)。
由于封閉箱體和溝道內(nèi)傳感設(shè)備眾多,人為的很難設(shè)定GRU的單元個數(shù)、時間窗口和批處理數(shù)據(jù)大小的最優(yōu)值,因此通過PSO方法,將此三者作為一個粒子群,尋求最優(yōu)解。網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示。
圖3 PSO-GRU模型結(jié)構(gòu)
PSO算法尋求最優(yōu)解的適應(yīng)度函數(shù)f定義為
(9)
算法流程如下。
Step 1將2中采集的數(shù)據(jù)分為訓(xùn)練集和測試集。
Step 2以GRU單元個數(shù)、批處理數(shù)據(jù)大小、時間窗口為優(yōu)化對象,隨機(jī)初始化每個粒子和慣性因子。
Step 3根據(jù)式(9)評估所有粒子的最優(yōu)位置p,得到全局最優(yōu)位置P。
Step 4while not stop根據(jù)式(6)、式(7)更新粒子的速度和位置,根據(jù)式(6)更新慣性因子。依據(jù)圖3的網(wǎng)絡(luò)結(jié)構(gòu)構(gòu)建PSO-GRU網(wǎng)絡(luò)模型,其中超參數(shù)使用更新后的粒子;從訓(xùn)練集中隨機(jī)平均抽樣少量數(shù)據(jù)訓(xùn)練GRU網(wǎng)絡(luò)直至收斂;根據(jù)式(9)計算f,如果f在可接受范圍內(nèi),退出循環(huán),保存網(wǎng)絡(luò)模型即為最優(yōu)超參數(shù)網(wǎng)絡(luò)模型。
Step 5根據(jù)保存的PSO-GRU網(wǎng)絡(luò)模型,使用全量數(shù)據(jù)進(jìn)行訓(xùn)練至模型收斂。保存收斂后模型進(jìn)行后續(xù)實際工作中的故障判別。
為了驗證所提方法的可行性和有效性,使用兩種方法建立數(shù)據(jù)集用于訓(xùn)練PSO-GRU網(wǎng)絡(luò)。在某實際場景中,各類傳感器個數(shù)i、j、k、m、n分別取值45、45、469、36、753。因此訓(xùn)練集每條數(shù)據(jù)維度為 1 348,時間間隔θ取5 s。依據(jù)專家經(jīng)驗,本場景中常見故障有:表計異常、指示燈狀態(tài)異常、二次線接觸狀態(tài)異常、器件標(biāo)識及狀態(tài)異常、箱柜密封異常、柜內(nèi)觸點(diǎn)即設(shè)備發(fā)熱異常、柜內(nèi)積水、柜內(nèi)溫濕度超過預(yù)警值、溝道線路外觀破損、溝道完整性異常、氧氣含量超過預(yù)警值、硫化氫含量超過預(yù)警值和甲烷含量超過預(yù)警值,共13種異常場景,根據(jù)其中對故障嚴(yán)重程度的劃分,故障類型共52種。對一類故障在一個時刻發(fā)生的前后采集不少于30次的數(shù)據(jù)并進(jìn)行z-score歸一化,打上故障類型的標(biāo)簽,作為數(shù)據(jù)庫的一條數(shù)據(jù)。最終,經(jīng)過篩選,確定數(shù)據(jù)庫共10 000條數(shù)據(jù),涵蓋所有類型故障及正常運(yùn)行情況下,隨機(jī)平均抽樣500條數(shù)據(jù)作為最終GRU網(wǎng)絡(luò)的測試集,剩余9 500條作為GRU網(wǎng)絡(luò)訓(xùn)練集。
基于Tensorflow1.14.0構(gòu)建網(wǎng)絡(luò)模型,使用4張NVIDA P40顯卡作硬件資源進(jìn)行實驗并與LSTM網(wǎng)絡(luò)和GRU網(wǎng)絡(luò)進(jìn)行對比。PSO-GRU的各項超參數(shù)設(shè)置如表2所示,LSTM網(wǎng)絡(luò)和GRU網(wǎng)絡(luò)的超參數(shù)根據(jù)經(jīng)驗設(shè)定。
表2 實驗參數(shù)設(shè)置
首先從9 500條GRU網(wǎng)絡(luò)訓(xùn)練集中隨機(jī)平均抽樣500條數(shù)據(jù)使用PSO優(yōu)化算法訓(xùn)練GRU網(wǎng)絡(luò)最優(yōu)超參數(shù),此處訓(xùn)練是較為簡單的優(yōu)化問題,因此僅需少量訓(xùn)練數(shù)據(jù)即可。每次更新超參數(shù)后的GRU網(wǎng)絡(luò)經(jīng)過1 200次左右的迭代可以完成收斂,最終PSO優(yōu)化算法經(jīng)過640次左右循環(huán)得到的GRU網(wǎng)絡(luò)最優(yōu)超參數(shù),此時適應(yīng)度f最小約為1.5,3層GRU隱含層節(jié)點(diǎn)數(shù)分別為36、42、28;時間窗口大小為25;批處理大小為88。適應(yīng)度f的變化如圖4所示。
圖4 PSO算法獲取最優(yōu)GRU參數(shù)訓(xùn)練過程
依據(jù)最優(yōu)GRU超參數(shù),使用全量訓(xùn)練集訓(xùn)練GRU網(wǎng)絡(luò),經(jīng)過約8 440次迭代,GRU網(wǎng)絡(luò)完成收斂,其損失函數(shù)的變化如圖5所示。
圖5 最優(yōu)超參數(shù)下GRU訓(xùn)練過程
LSTM網(wǎng)絡(luò)、GRU網(wǎng)絡(luò)及PSO-GRU網(wǎng)絡(luò)的各項指標(biāo)對比結(jié)果如表3所示,可以看出,PSO-GRU網(wǎng)絡(luò)由于需要使用500條訓(xùn)練數(shù)據(jù)不斷的進(jìn)行小規(guī)模的訓(xùn)練,尋求最優(yōu)超參數(shù),因此耗時較長。但是其核心的模型評價指標(biāo)均方根誤差(root mean square error,RMSE)[13]與平均絕對誤差(mean absolute error,MAE)[14]均有明顯下降,基本達(dá)到LSTM網(wǎng)絡(luò)和GRU網(wǎng)絡(luò)的1/2。RMSE和MAE的計算公式分別為
表3 3種方法的對比結(jié)果
(10)
(11)
式中:n為采樣次數(shù);h為觀測值;y為真實值。
由于PSO算法為GRU網(wǎng)絡(luò)訓(xùn)練了更為合理的各項超參數(shù),相比于人為根據(jù)經(jīng)驗設(shè)定的超參數(shù)的GRU網(wǎng)絡(luò),其故障判定耗時有13.1%的下降。由此可以證明,本文方法在故障判定的準(zhǔn)確性和耗時方面有明顯提升。
以提升變電站智能化水平為目的,挖掘現(xiàn)有的變電站智能巡檢系統(tǒng)的痛點(diǎn)以變電站密閉箱體或溝道的故障判定為研究課題展開。首先分析巡檢需求,依托物聯(lián)網(wǎng)終端數(shù)據(jù)構(gòu)建數(shù)據(jù)集,介紹了數(shù)據(jù)集的采集、處理和標(biāo)注方式;其次在介紹GRU網(wǎng)絡(luò)、PSO優(yōu)化算法的基礎(chǔ)上提出了基于PSO-GRU的故障判定方法,介紹了網(wǎng)絡(luò)結(jié)構(gòu)和相應(yīng)算法。最后通過實驗對比了傳統(tǒng)LSTM網(wǎng)絡(luò)、GRU網(wǎng)絡(luò)及本文方法之間的各項指標(biāo)參數(shù)。實驗表明,本文方法在故障判定的準(zhǔn)確性和快速性上均有提升。