汪 洋, 黎恒烜, 鄂士平, 王成智, 張侃君
(國網(wǎng)湖北省電力有限公司 a.設(shè)備管理部, b. 電力科學(xué)研究院, 武漢 430000)
隨著電網(wǎng)的大規(guī)模建設(shè),變電站也在不斷進(jìn)行升級、改造,但電網(wǎng)的調(diào)度與控制安全仍面臨著巨大挑戰(zhàn)[1].為了避免誤調(diào)度和誤操作的發(fā)生,一鍵順控作為一種新的智能變電運檢技術(shù)正在逐漸推廣應(yīng)用[2-3].
變電站為了實現(xiàn)設(shè)備狀態(tài)的切換,使用倒閘操作將設(shè)備切換至檢修、熱備用、冷備用和運行四種狀態(tài)[4].但變電站通常存在較高的電壓,在倒閘操作中出現(xiàn)誤操作不僅會危害人身與設(shè)備安全,嚴(yán)重的更會導(dǎo)致電力系統(tǒng)的崩潰[5].一鍵順控即操作人員在一體化信息平臺下達(dá)任務(wù),可按順序一次性實現(xiàn)操作項目軟件預(yù)制、任務(wù)模塊搭建、設(shè)備狀態(tài)識別和操作步驟一鍵啟動與執(zhí)行的指令[6].傳統(tǒng)的一鍵順控系統(tǒng)使用遙信采集的信號來判斷設(shè)備的運行狀態(tài),并使用智能防護(hù)系統(tǒng)來判斷程序化操作是否到位.然而,在實際變電站的一鍵順控停、送電操作中,由于操作不當(dāng),容易出現(xiàn)錯誤的投退操作.而傳統(tǒng)的信號監(jiān)測方法,難以及時發(fā)現(xiàn)這些錯誤[7].
基于深度學(xué)習(xí)的數(shù)據(jù)分析方法作為人工智能的重要研究領(lǐng)域,正廣泛應(yīng)用于工程的各個方面.如文獻(xiàn)[8]提出使用深度學(xué)習(xí)算法自動分析變電站設(shè)備的周圍環(huán)境,實現(xiàn)防火、防盜以及變電站的無人值守;文獻(xiàn)[9]使用深度學(xué)習(xí)算法設(shè)計目標(biāo)檢測網(wǎng)絡(luò),實現(xiàn)輸變電設(shè)備異常發(fā)熱點紅外圖片的檢測;文獻(xiàn)[10]使用基于深度學(xué)習(xí)的分類算法,實現(xiàn)發(fā)電機故障狀態(tài)的挖掘;文獻(xiàn)[11]使用長短時記憶(LSTM)網(wǎng)絡(luò)、門循環(huán)單元(GRU)神經(jīng)網(wǎng)絡(luò)和棧式自編碼器(SAE)實現(xiàn)電力負(fù)荷預(yù)測.
為了解決一鍵順控系統(tǒng)中不能精確判斷目標(biāo)設(shè)備工作的狀態(tài)及硬壓板狀態(tài)監(jiān)視可靠性低的問題,本文提出了一種基于圖像識別的“雙確認(rèn)”方式.該方法使用監(jiān)控系統(tǒng)采集的目標(biāo)設(shè)備圖像信息進(jìn)行判別處理,使用一個多任務(wù)神經(jīng)網(wǎng)絡(luò)同時完成硬壓板位置檢測、投切狀態(tài)檢測和硬壓板標(biāo)識檢測三個任務(wù).
為了有效檢測與識別出不同的硬壓板,本文提出一個多任務(wù)學(xué)習(xí)網(wǎng)絡(luò).該網(wǎng)絡(luò)不僅需要檢測出硬壓板區(qū)域,且需要根據(jù)硬壓板下面的唯一文字描述對硬壓板進(jìn)行標(biāo)識區(qū)分.圖1為本文方法的整體框架,對于給定的輸入圖片,該網(wǎng)絡(luò)首先使用一個共享卷積層提取出共享特征;然后使用一個文字檢測網(wǎng)絡(luò)檢測并識別出文字,采用一個識別框檢測出硬壓板區(qū)域,并對其投切狀態(tài)進(jìn)行分類識別.
圖1 硬壓板檢測與識別整體框架Fig.1 Overall framework of detection and recognition of hard platens
由于硬壓板與其下面的文字標(biāo)識位置上存在關(guān)聯(lián)關(guān)系,因此本文基于多任務(wù)學(xué)習(xí)的硬壓板檢測與識別網(wǎng)絡(luò),使用一個特征共享網(wǎng)絡(luò)提取表達(dá)能力更強的特征,其具體架構(gòu)如圖2所示.圖2中,f表示特征,conv block 64,/2表示含有64個通道的卷積層,并進(jìn)行2倍下采樣;up sampling表示上采樣,×2為2倍上采樣層;3×3表示卷積核大小為3×3;concat表示數(shù)組合并.
圖2 特征共享網(wǎng)絡(luò)架構(gòu)Fig.2 Architecture of feature sharing network
特征共享網(wǎng)絡(luò)使用ResNet-50作為基礎(chǔ)網(wǎng)絡(luò),并使用特征金字塔結(jié)構(gòu)(FPN)融合高、低分辨率的特征來整合全局與局部信息.特征融合過程滿足
(1)
(2)
式中:gi與hi分別為待融合特征圖和融合后的特征圖;unpool為上采樣操作;conv為卷積層操作.在特征融合時為了保證特征圖的大小一致,將最后一個階段的特征圖進(jìn)行上采樣操作,增加一倍的尺寸;隨后,將其與當(dāng)前層的特征進(jìn)行串接,并使用一個1×1卷積層來減小特征通道數(shù);最后,使用一個3×3卷積操作得到融合的結(jié)果.
進(jìn)行上述特征提取與特征融合操作后,將提取出的共享特征分別送入硬壓板檢測網(wǎng)絡(luò)與文字檢測網(wǎng)絡(luò)進(jìn)行硬壓板和文字的檢測與識別.
本文使用EAST網(wǎng)絡(luò)進(jìn)行文字的檢測,該網(wǎng)絡(luò)可以準(zhǔn)確、有效地檢測各種場景下的文字目標(biāo).EAST網(wǎng)絡(luò)消除了不必要的網(wǎng)絡(luò)操作,能夠直接預(yù)測任意方向的文本行.
圖3為本文檢測分支網(wǎng)絡(luò)的具體架構(gòu).該分支使用FPN提取的特征作為輸入,使用一個1×1卷積層將輸出分支劃分為一個得分通道和預(yù)測通道.得分通道用來預(yù)測每一個文字框中的特征是正樣本的可能性,預(yù)測通道用來指示檢測框的相對橫、縱坐標(biāo)值.得到每個檢測框的得分與相對坐標(biāo)后,即可使用非極大值抑制來搜索出局部極大值,再抑制非極大值結(jié)果,最終保留一個最理想的檢測框.因此,文本檢測網(wǎng)絡(luò)的目標(biāo)函數(shù)可以表示為
Ldt=λsLs+λregLreg
(3)
式中:Ls與Lreg分別為得分通道和預(yù)測通道的損失;λs與λreg分別為兩損失的權(quán)重,本文將其值直接設(shè)為1.
圖3 EAST檢測分支架構(gòu)Fig.3 Architecture of EAST detection branch
得分通道的損失函數(shù)為交叉熵?fù)p失,其表達(dá)式為
(4)
(5)
式中,Y∈Y*為隨機采樣樣本.
(6)
為了便于對文字進(jìn)行識別,本文首先使用放射變換層對檢測出的文字區(qū)域進(jìn)行變換,以得到軸對稱的檢測結(jié)果.這一操作需要保證輸出高度固定,且檢測結(jié)果的長寬比不變.放射變換主要包括兩個步驟:1)使用檢測框的預(yù)測坐標(biāo)來計算放射參數(shù);2)對所有特征區(qū)域進(jìn)行放射變換,以得到標(biāo)準(zhǔn)水平的特征.其中,第1)步的計算操作為
(7)
式中:M為要求的放射變換矩陣;ht、wt為變換后輸出的高和寬;(t,b,l,r)為文本框左上、左下、右上和右下四個坐標(biāo);θ為文本方向角度.
使用變換矩陣M,即可實現(xiàn)所有區(qū)域的放射變換,即
(8)
對文本區(qū)域進(jìn)行放射變換后,本文使用文字識別分支對檢測框中的文本進(jìn)行識別.考慮到文字識別分支檢測的文本框中包含的文字長度不同,本文使用LSTM網(wǎng)絡(luò)沿著原始圖像的共享特征進(jìn)行識別.文中文字識別網(wǎng)絡(luò)包含一個雙向LSTM層、一個全連接層和一個CTC解碼層.
(9)
式中,B為所有可能帶有空格的標(biāo)簽到e*的多對一映射.
文字識別網(wǎng)絡(luò)的目的是最大化式(9)求和的對數(shù)概率,損失函數(shù)可表示為
(10)
本文使用Faster R-CNN構(gòu)建硬壓板的檢測和分類網(wǎng)絡(luò),并直接將硬壓板的投切狀態(tài)作為硬壓板的類別信息.
硬壓板檢測與識別網(wǎng)絡(luò)的輸入為特征共享層提取的特征,輸出為硬壓板的坐標(biāo)值.對于給定的共享特征,首先采用3×3的滑動操作得到9個錨框,這9個錨框具有3種不同的面積:1 282、2 562和5 122.得到錨框特征后,該網(wǎng)絡(luò)再使用1×1×256×18和1×1×256×36兩個卷積層分別得到一個18維的向量和一個36維的向量,進(jìn)而得到硬壓板的類別與坐標(biāo)值,檢測與識別網(wǎng)絡(luò)架構(gòu)如圖4所示.
圖4 硬壓板檢測與識別網(wǎng)絡(luò)架構(gòu)Fig.4 Network architecture of detection and recognition of hard platens
為了優(yōu)化硬壓板檢測與識別網(wǎng)絡(luò),本文對候選檢測框及其類別進(jìn)行Softmax二分類,并設(shè)計了目標(biāo)函數(shù)為
(11)
(12)
(13)
本文使用手工標(biāo)注的9 000張硬壓板目標(biāo)屏圖片訓(xùn)練所提出的檢測與識別網(wǎng)絡(luò).在標(biāo)注圖片中,每一個硬壓板下面包含一段文字框來描述硬壓板的具體信息.同時,每個硬壓板根據(jù)其投切狀態(tài)標(biāo)記為1(開)、0(合)兩個狀態(tài).圖5為本文采集的硬壓板圖片,本文從9 000張圖片中隨機選擇7 200張作為訓(xùn)練數(shù)據(jù)集,剩下的1 800張作為測試集.文中使用Pytorch框架實現(xiàn)所提出的網(wǎng)絡(luò),并使用Adam進(jìn)行網(wǎng)絡(luò)優(yōu)化.設(shè)置初始學(xué)習(xí)率為0.001,每個訓(xùn)練Batch的大小為1,共訓(xùn)練50個周期.
圖5 硬壓板圖片F(xiàn)ig.5 Images of hard platens
為了評估所提出方法的性能,本文使用精確度P、召回率R和平均性能F三個指標(biāo)來表示網(wǎng)絡(luò)性能.其中,精確度與召回率從漏檢和誤檢的角度對性能進(jìn)行評估,而平均性能是對精確度與召回率的加權(quán)平均,即從總體性能上對算法進(jìn)行評估.三個指標(biāo)的具體定義為
(14)
式中:q為檢測值;G為真實硬壓板/文本框的集合;D為網(wǎng)絡(luò)輸出結(jié)果的集合.檢測結(jié)果與真實目標(biāo)的匹配規(guī)則為
(15)
式中:σij=(Gi∩Dj)/Gi;τij=(Gi∩Dj)/Dj.根據(jù)多次試驗結(jié)果設(shè)置T1=0.8,T2=0.2.
本文使用上述采集的數(shù)據(jù)集對所提出的算法進(jìn)行性能評估,表1為不同算法對硬壓板檢測與定位的精度比較結(jié)果.CTPN結(jié)合CNN與LSTM深度網(wǎng)絡(luò),能有效檢測復(fù)雜場景的橫向分布的文字,SSTD為二值圖像數(shù)字水印算法.從表1中可以看出,所提出的算法相對于其他單獨的檢測算法具有更高的精度.
表1 不同算法在測試集上的檢測與識別精度Tab.1 Detection and recognition accuracy on test set with different algorithms %
圖6為本文硬壓板二次確認(rèn)具體實現(xiàn)效果圖.從圖6中可以看出,使用本方法能夠有效地對硬壓板位置進(jìn)行檢測,并實現(xiàn)硬壓板投切狀態(tài)的識別,提升了一鍵順控的操作精度.
圖6 硬壓板二次確認(rèn)具體實現(xiàn)效果圖Fig.6 Actual implementation effect diagram of secondary confirmation of hard platens
本文提出了一種基于深度學(xué)習(xí)的變電站硬壓板狀態(tài)檢測與識別算法.該算法采用一個多任務(wù)學(xué)習(xí)網(wǎng)絡(luò),同時完成了硬壓板位置、投切狀態(tài)和硬壓板標(biāo)識檢測.其中,硬壓板位置檢測用于確定并提取出硬壓板坐標(biāo);硬壓板標(biāo)識識別采用基于文字檢測與識別算法對硬壓板進(jìn)行區(qū)分;投切狀態(tài)檢測用于對檢測出的硬壓板狀態(tài)進(jìn)行分類,即開或合.測試結(jié)果表明,所提出的方法能夠提升硬壓板狀態(tài)識別精度,同時也保證了一鍵順控操作的安全性.