李雪寒, 劉沁怡, 楊曉彤, 胡海敏, 王哲銘, 周文強, 盧 武
(1.上海電力大學(xué), 上海 200090; 2.國網(wǎng)上海市電力公司浦東供電公司, 上海 200122;3.國網(wǎng)上海市電力公司市區(qū)供電公司, 上海 200080)
變壓器是變電設(shè)備的核心,而套管是其重要組成部分,擔(dān)任著固定引線和與外界絕緣的作用。根據(jù)2015年國際大電網(wǎng)會議(CIGRE)A2.37工作組統(tǒng)計的變壓器故障起因報告,電壓等級越高,由套管引起的變壓器故障比例越大,當(dāng)電壓等級為500 kV及以上時,該比例達到27.8%[1]。套管一旦出現(xiàn)故障便會導(dǎo)致變壓器停運,嚴重時甚至?xí)l(fā)火災(zāi)爆炸,因此套管運行狀態(tài)的準確評估對保證電力設(shè)備的安全運行起著至關(guān)重要的作用。
常用的套管故障檢測方法包括介質(zhì)損耗法[2]、超高頻法[3]以及紅外圖像診斷法[4]等。介質(zhì)損耗法需要在變壓器停運的條件下進行預(yù)防性試驗,缺乏可靠性和時效性,而超高頻法則不易實現(xiàn)故障定位。由于設(shè)備故障時溫度會快速升高,基于這一特點,紅外圖像診斷法可以將套管快速從背景中識別出來,進而準確地實現(xiàn)套管故障狀態(tài)診斷。
近年來,國內(nèi)外學(xué)者展開的基于紅外圖像缺陷智能診斷研究主要包括目標識別和目標狀態(tài)診斷兩方面。目標識別主要利用區(qū)域分割[5]、閾值分割[6]等算法實現(xiàn)紅外圖像中目標與背景的分割,但只適用于簡單背景。深度學(xué)習(xí)理論為研究人員帶來了新思路。李文璞等人[7]利用Faster R-CNN(Region-based Comolutional Neural Networks)算法聯(lián)合溫度閾值算法實現(xiàn)了變電設(shè)備紅外圖像缺陷識別;王萬國等人[8]利用Faster R-CNN算法識別無人機巡檢圖像中的電力設(shè)備部件等。目標狀態(tài)診斷主要在紅外圖像識別的基礎(chǔ)上結(jié)合深度學(xué)習(xí)實現(xiàn)故障診斷。例如廖志偉等人[9]利用紅外圖像處理技術(shù)分割提取絕緣子串,之后引入K-means聚類算法和BP(Back Propation)神經(jīng)網(wǎng)絡(luò)實現(xiàn)對絕緣子串低零值故障和污穢故障的診斷。
目前,針對套管的目標識別,現(xiàn)有的圖像處理算法已經(jīng)可以實現(xiàn)對目標的框選,但由于分割框包含范圍較大,易導(dǎo)致對小目標和多目標識別精度不佳。對此本文采用基于Faster R-CNN改進而來的Mask R-CNN模型,實現(xiàn)對目標快速準確地識別和對套管的精細化掩模分割。同時,針對紅外圖像中“色-溫”關(guān)系不對應(yīng)的問題,提出選取灰度值作為特征值。然后,使用粒子群優(yōu)化(Particle Swarm Optimization,PSO)算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)(PSO-BP),對套管特征進行分類識別。最后,在實際應(yīng)用中驗證了方法的可行性與準確性,為變電設(shè)備紅外圖像識別及其狀態(tài)評估問題提出了解決方案。
本文采用基于紅外圖像的變壓器套管進行故障診斷,算法的框架流程如圖1所示。其中,CNN表示卷積神經(jīng)網(wǎng)絡(luò),RPN表示區(qū)域生成網(wǎng)絡(luò)(Region Proposal Network,RPN)。整個算法主要包含套管輪廓提取算法和變壓器套管狀態(tài)診斷模型兩部分。其中,套管輪廓提取算法基于Mask R-CNN算法對變壓器套管進行識別和精細化掩模分割;變壓器套管狀態(tài)診斷模型先對套管分割圖像進行特征提取,再利用PSO-BP神經(jīng)網(wǎng)絡(luò)對其進行聚類分析,建立聚類模型,實現(xiàn)套管的狀態(tài)診斷。
圖1 基于紅外圖像的變壓器套管狀態(tài)診斷算法
Mask R-CNN算法是對Faster R-CNN算法的改進,增加了掩模分支,可以同時實現(xiàn)目標檢測和掩模分割,具有魯棒性強、識別精度高的特點[10]。該網(wǎng)絡(luò)由特征提取模塊、RPN模塊、感興趣區(qū)域(Region of Interest,ROI)模塊和輸出預(yù)測模塊4部分組成[11]。
其中,特征提取模塊由ResNet殘差網(wǎng)絡(luò)和特征金字塔網(wǎng)絡(luò)(Feature Pyramid Networks,FPN)組成。ResNet殘差網(wǎng)絡(luò)將輸入與經(jīng)過卷積層處理后的輸出進行特征值相加;FPN可以將底層信息和高層語義特征信息進行融合[12]。之后利用RPN掃描ResNet50-FPN生成的多層特征圖以提取ROI。在Faster R-CNN算法中采用ROI池化法(ROI Pooling)將上一步提取到的ROI映射到特征圖上,但這些ROI的大小不一致,無法直接進行后續(xù)處理,此時需要ROI Pooling層將其轉(zhuǎn)為固定尺寸大小,當(dāng)無法整除時就采用四舍五入法,導(dǎo)致位置回歸生成的候選框與目標真實位置存在偏差,影響了算法對目標物體的識別精度。為了消除這種誤差,在Mask R-CNN算法采用的ROI聚集法(ROI Align)中取消量化操作,使用雙線性插值算法,從而能更好地對齊原圖上的ROI區(qū)域,使算法對小目標的定位和識別更加精確。其原理如圖2所示。
圖2 ROI Align雙線性插值算法原理
圖2中,P點為整個ROI中任意一點,點1~點4為P點最鄰近的4個點。
雙線性插值算法的公式為
(1)
式中:f(x,y)——待求點P的像素值;(x1,y1)、(x1,y2)——點1和點2的坐標;(x2,y1)、(x2,y2)——點3和點4的坐標;f(1)、f(2)、f(3)、f(4)——點1~點4的像素值。
輸出預(yù)測模塊包含了類別、位置和掩模預(yù)測層。在Mask R-CNN訓(xùn)練時,該網(wǎng)絡(luò)的多任務(wù)損失函數(shù)L定義為
L=Lcls+Lbox+Lmask
(2)
Lcls(p,u)=-logpu
(3)
(4)
(5)
式中:Lcls、Lbox、Lmask——分類損失、回歸損失、平均二值交叉熵損失;
p、u、t、v——目標對象、目標類別標簽、預(yù)測邊界框回歸的偏移、邊界框回歸目標;
pu——邊界框被預(yù)測為含有目標的概率;
SmoothLi——平滑損失函數(shù);
(i,j)——像素坐標。
本文利用BP神經(jīng)網(wǎng)絡(luò)對變壓器套管進行狀態(tài)診斷。BP神經(jīng)網(wǎng)絡(luò)是以輸入層、隱藏層和輸出層為主要結(jié)構(gòu)的前饋神經(jīng)網(wǎng)絡(luò),非線性映射能力強,網(wǎng)絡(luò)結(jié)構(gòu)靈活,在聚類分析領(lǐng)域具有廣泛應(yīng)用。
PSO算法是對BP神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值進行優(yōu)化的常用方法。PSO-BP算法流程如圖3所示。PSO算法的本質(zhì)是全局尋優(yōu),整個過程通過個體運動狀態(tài)的不斷反饋來尋找最優(yōu)解。對每個個體設(shè)置適應(yīng)度值,其中個體極值指單個的歷史最優(yōu)解,群體極值指所有個體尋找的適應(yīng)度值最優(yōu)位置[13]。
圖3 PSOBP算法流程
PSO-BP算法中PSO優(yōu)化算法原理如下:全局尋優(yōu),假設(shè)粒子總數(shù)為n,則第l個粒子的位置和速度以及對應(yīng)的個體極值和群體極值為
Xl=[Xl1,Xl2,…Xld,…,XlD]T,Xld∈[Ld,Ud]
(6)
Vl=[Vl1,Vl2,…Vld,…,VlD]T,Vld∈[-Vmax,Vmax]
(7)
Pl=[Pl1,Pl2,…Pld,…,PlD]T
(8)
Pg=[Pg1,Pg2,…Pgd,…,PgD]T
(9)
式中:Xl、Vl——粒子的位置、速度;Ld、Ud——空間的下界和上界;Vmax——粒子飛行的最大速度;Pl、Pg——個體極值、群體極值;PlD——第l個粒子在D維空間中迄今為止搜索到的最優(yōu)位置;
PgD——整個粒子群在D維空間中迄今為止搜索到的最優(yōu)位置。
粒子的速度和位置的迭代更新公式如下:
(10)
(11)
式中:ω——慣性權(quán)重;k——當(dāng)前迭代次數(shù);c1、c2——加速度因子,分別控制飛往最優(yōu)個體和群體的距離,通常取2;
r1、r2——分布在[0,1]的隨機值。
本文使用的原始數(shù)據(jù)來自國網(wǎng)上海市供電公司的彰武站、余姚站和鳳陽站等110 kV等級變壓器套管的紅外圖像庫。套管正常和典型故障狀態(tài)圖像如圖4所示。圖像類型包括正常、介質(zhì)損耗故障、接頭故障、漏油故障。介質(zhì)損耗故障由絕緣油中的水分或局部放電引起,導(dǎo)致整個套管體溫度升高。接頭故障通常是由接頭連接不良引起,導(dǎo)致接頭上過熱。漏油大多由機械密封不良引起,會導(dǎo)致套管底部溫度高于頂部溫度。
圖4 套管圖像
目標識別類模型的準確性需要大量的實驗樣本,但實際應(yīng)用中,直接獲取海量的圖像數(shù)據(jù)較困難。因此,在對Mask R-CNN模型進行訓(xùn)練之前,需要對原始數(shù)據(jù)進行擴增,本文采用數(shù)據(jù)增廣算法。數(shù)據(jù)增廣是一種有效的正則化方法,通過對原有數(shù)據(jù)進行變換操作,可產(chǎn)生大量與原數(shù)據(jù)相似的數(shù)據(jù),使模型獲得更好的泛化性[14]。為解決各種故障類型圖像與正常圖像之間比例的不均衡容易造成訓(xùn)練的過擬合問題,本文在數(shù)據(jù)增廣時使各種類別樣本的數(shù)量相同。常用的數(shù)據(jù)增廣方法有鏡像、旋轉(zhuǎn)、增減噪聲等。按8∶2的比例劃分為訓(xùn)練集和驗證集。數(shù)據(jù)增廣后的各類型圖像數(shù)量和效果如表1和圖5所示。由表1可知,原圖共284張,擴增圖像280張,擴增后圖像共564張。
表1 數(shù)據(jù)增廣后各類型圖像數(shù)量 單位:張
圖5 數(shù)據(jù)增廣效果
大量研究表明,紅外圖像處理的最終效果與原始圖像的色彩分布緊密相連。為了能呈現(xiàn)更多細節(jié),紅外成像設(shè)備一般會對溫度和圖像顏色進行自適應(yīng)調(diào)整,且溫度矩陣源文件也較難獲取,這就導(dǎo)致紅外圖像“色-溫”不一致問題的出現(xiàn)。針對這一問題,本文選取灰度值作為輸變電設(shè)備紅外圖像的狀態(tài)特征。
加權(quán)平均法是轉(zhuǎn)變?yōu)榛叶葓D像常用的方法之一。原理是對紅、綠、藍3個顏色通道R、G、B賦予不同的權(quán)重Wr、Wg、Wb,令R=G=B=WrR+WgG+WbB。權(quán)重不同,得到的結(jié)果不同,但由于人眼對綠色敏感度最高、紅色次之、藍色最低,因此通常Wg>Wr>Wb。經(jīng)過多次的實驗驗證,當(dāng)Wr=29.9%,Wg=58.7%,Wb=11.4%時得到的圖像最為合理。同時0.299+0.587+0.114=1,剛好是滿偏,按此比例加權(quán)平均能夠得到較合理的灰度圖像。因此,灰度值Gray的公式如下
Gray=R·0.299+G·0.587+B·0.144
(12)
在Mask R-CNN算法分割出的圖像區(qū)域中,
(13)
式中:P(I)——灰度為I圖像區(qū)域中一階直方圖;
n(I)——灰度為I的像素數(shù)量;
N——像素總數(shù)。
若將中心線上每一點的灰度值進行提取,會包含大量冗余信息,所以等間距選取10個中心線灰度值;另外,灰度方差表示離散程度,異常狀態(tài)導(dǎo)致相對溫差較大,因此,還需要選取平均灰度、灰度方差、灰度最高值和最低值。中心線特征值提取過程如圖6所示。
圖6 中心線特征值提取過程
精確率(Precision)P和召回率(Recall)R可以作為衡量模型性能的指標,其計算公式如下
(14)
(15)
式中:TP——正確檢測的套管個數(shù);FP——背景被誤預(yù)測的套管個數(shù);FN——未被識別的套管個數(shù)。
本文設(shè)置判斷預(yù)測結(jié)果正確與否的閾值為0.5,使用平均精度均值(Mean Average Precision,mAP)來評估模型整體精度。
P-R曲線如圖7所示,以召回率R為橫軸,精確率P為縱軸,將不同閾值下的精確率和召回率連接起來形成一條曲線,其表達式為P(R)。
圖7 PR曲線
通過對P-R曲線進行積分,可以計算mAP,即
(16)
當(dāng)M為無窮大時,
(17)
本文采用基于Mask R-CNN算法的實例分割模型對套管紅外圖像進行分割,采用的網(wǎng)絡(luò)環(huán)境配置如表2所示。
表2 網(wǎng)絡(luò)環(huán)境配置
本文采用Mask R-CNN算法對構(gòu)建的數(shù)據(jù)集進行訓(xùn)練,初始學(xué)習(xí)率為0.001,對其訓(xùn)練30輪和50輪,損失函數(shù)變化曲線如圖8所示。由圖8可以看到,訓(xùn)練50輪后的損失值明顯低于訓(xùn)練30輪時,此時的損失值可以達到0.119 9。
圖8 損失函數(shù)變化曲線
對測試集進行迭代訓(xùn)練后,將模型用于不包含訓(xùn)練集中的圖像進行目標分割測試。部分變壓器套管分割結(jié)果如圖9所示。
圖9 部分變壓器套管分割結(jié)果
結(jié)果表明,Mask R-CNN算法能夠?qū)δ繕诉M行快速準確地識別,完成目標輪廓的分割并生成掩模,其平均精度均度mAP可以達到0.91。
圖10 PSOBP算法迭代誤差變化過程
由圖10可知:在設(shè)定初始權(quán)值和閾值的條件下,PSO-BP算法在迭代大概15次時,誤差急劇下降;在大約15次迭代后,PSO算法的適應(yīng)度值達到穩(wěn)定,體現(xiàn)了該算法缺陷識別的高效性。
同時,將108組測試集的特征參數(shù)作為輸入,對套管的狀態(tài)進行預(yù)測。測試數(shù)據(jù)的混淆矩陣如圖11所示,預(yù)測結(jié)果如表3所示。
表3 PSOBP算法的預(yù)測結(jié)果
圖11 測試數(shù)據(jù)的混淆矩陣
27張測試樣本中有4處識別錯誤,其中3處接頭故障被誤分為漏油故障,1處漏油故障被誤分為接頭故障。表3的結(jié)果表明,該方法可以對變壓器套管的不同故障狀態(tài)進行準確識別,故障診斷的平均準確率可達93.518%。為了進一步驗證本文算法的優(yōu)勢,將其與傳統(tǒng)BP算法和支持向量機(Support Vector Machine,SVM)算法進行對比。BP算法和SVM算法都是常見的故障診斷算法,使用的都是經(jīng)Mask R-CNN算法分割后的相同訓(xùn)練數(shù)據(jù)。預(yù)測結(jié)果對比如表4所示。
由表4可知,SVM算法的故障診斷平均準確率為87.963%,而在同樣的條件下,傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)算法只有72.773%,二者均遠低于PSO-BP算法的93.518%??偟膩碚f,PSO-BP算法在很大程度上提高了預(yù)測的精度。
針對目前紅外診斷檢測效率低、背景干擾多等問題,本文提出了一種基于Mask R-CNN的變壓器套管故障診斷方法,實現(xiàn)目標物體的像素級分割。選取灰度值作為特征值解決紅外圖像中“色-溫”關(guān)系不對應(yīng)問題,使用PSO-BP神經(jīng)網(wǎng)絡(luò)對套管4種典型圖像類型進行分類識別,故障診斷準確率可達93.518%,優(yōu)于傳統(tǒng)算法。因此,該算法在電力設(shè)備紅外圖像分割領(lǐng)域具有良好的應(yīng)用前景,可以極大地提高電力設(shè)備故障分析工作的效率和準確率。