崔鳳新,盧思佳,邱仕達(dá)
(1.福州大學(xué)至誠學(xué)院電氣工程系,福建 福州 350002;2.福州大學(xué)電氣工程與自動(dòng)化學(xué)院,福建 福州 350108)
變壓器作為電力系統(tǒng)向用戶供電的重要設(shè)備,在電能輸送、分配等環(huán)節(jié)都起著要的作用,其運(yùn)行狀況直接影響電力系統(tǒng)的安全、穩(wěn)定運(yùn)行[1-3].變壓器故障主要來自鐵芯和繞組,變壓器本體振動(dòng)包含鐵芯和繞組所在運(yùn)行狀態(tài)下的豐富信息[4-5].利用振動(dòng)分析法對(duì)其運(yùn)行狀態(tài)進(jìn)行辨識(shí)行之有效.文獻(xiàn)[6]通過交叉小波變換提取變壓器本體振動(dòng)數(shù)據(jù)主成分,將其幅值和頻率作為幅頻特征量來診斷具體故障類型.文獻(xiàn)[7]利用變分模態(tài)分解法對(duì)振動(dòng)信號(hào)進(jìn)行分解,對(duì)每個(gè)變分固有模態(tài)函數(shù)實(shí)施希爾伯特變換,提取時(shí)頻信息作為特征量.文獻(xiàn)[8]利用經(jīng)驗(yàn)小波變換對(duì)變壓器振動(dòng)信號(hào)進(jìn)行分解,并對(duì)分解后的各分量實(shí)施希爾伯特變換.為了量化特征,提取分量的多尺度熵,最后利用Fisher判別器完成故障分類.文獻(xiàn)[9]利用無標(biāo)簽數(shù)據(jù)逐層訓(xùn)練堆棧自編碼器(stacked auto-encoder,SAE),再使用有標(biāo)簽數(shù)據(jù)對(duì)模型進(jìn)行微調(diào),最后將提取的特征輸入到隨機(jī)森林中進(jìn)行故障辨識(shí).
上述處理方法在噪聲干擾下分解效果不理想,主要表現(xiàn)為:交叉小波變換分解效果受小波基選擇的影響,在提取高頻分量特征時(shí)效果不好;經(jīng)驗(yàn)小波變換需預(yù)先設(shè)置分解個(gè)數(shù),在信號(hào)極值點(diǎn)的干擾下會(huì)導(dǎo)致頻帶劃分不恰當(dāng).本研究使用順序統(tǒng)計(jì)濾波包絡(luò)法無需設(shè)置分解個(gè)數(shù)即可自適應(yīng)分解信號(hào),解決信號(hào)頻帶劃分過密問題;使用K-L散度篩選分解后的信號(hào),剔除信號(hào)中包含的直流分量、噪聲等干擾成分;引入樽海鞘群算法(salp swarm algorithm,SSA)[10]實(shí)現(xiàn)SAE關(guān)鍵參數(shù)的自適應(yīng)尋優(yōu).
針對(duì)經(jīng)驗(yàn)小波變換[11]需預(yù)先設(shè)置分解個(gè)數(shù)、在極值點(diǎn)干擾下信號(hào)頻段劃分不恰當(dāng)?shù)膯栴},做如下改進(jìn),得到改進(jìn)經(jīng)驗(yàn)小波變換(improve empirical wavelet transform,IEWT).
1) 對(duì)輸入信號(hào)f(n)進(jìn)行傅里葉變換,得到傅里葉頻譜.
2) 用順序統(tǒng)計(jì)濾波包絡(luò)法[12]中的最大值濾波器計(jì)算傅里葉頻譜包絡(luò)線.
3) 使用大津算法[13]對(duì)頻譜進(jìn)行自適應(yīng)閾值提取,將頻譜劃分為兩段,第一段為前景,第二段為背景.當(dāng)兩段的類間方差達(dá)到最大值時(shí),將其定義為頻譜閾值T.利用T對(duì)包絡(luò)線進(jìn)行修正,大于T的部分保持不變,小于T的部分直接置0.
4) 采用高斯加權(quán)移動(dòng)平均濾波器對(duì)頻譜包絡(luò)線進(jìn)行平滑處理,去除包絡(luò)線中的平頂部分,使包絡(luò)線變得平滑,不存在一階不可導(dǎo)點(diǎn).
5) 統(tǒng)計(jì)局部極大值個(gè)數(shù),將其設(shè)置為要分解經(jīng)驗(yàn)小波分量(empirical wavelet function,EWF)的個(gè)數(shù).定位兩個(gè)局部極大值中間局部極小值的位置,并將其位置頻率按升序排序,作為頻譜劃分的依據(jù).
6) 在每個(gè)頻段內(nèi)構(gòu)造經(jīng)驗(yàn)尺度函數(shù)和經(jīng)驗(yàn)小波函數(shù),后續(xù)處理與普通EWT一致,公式見文獻(xiàn)[11].
K-L(Kullback-Leibler)散度[14]可定義為
(1)
其中:P代表原始樣本;Q表示經(jīng)過IEWT分解后的經(jīng)驗(yàn)小波函數(shù)組;Q(i)是其中的第i個(gè)EWF.
K-L散度值越小,表明兩個(gè)信號(hào)關(guān)系越近,該分量是信號(hào)的有效成分;反之,則是信號(hào)的干擾成分.振動(dòng)信號(hào)經(jīng)過分解后,解析出有效成分和一些無效的直流、噪聲分量.通過比較分解后信號(hào)與原始信號(hào)間關(guān)系的遠(yuǎn)近,選取出較佳的分量,達(dá)到剔除無效成分的目的.
SAE[9]由多個(gè)自編碼器(auto-encoder,AE)堆疊而成.采用SAE進(jìn)行分類的步驟為:
1) 訓(xùn)練第1個(gè)AE.通過編碼器提取特征,再通過解碼器重構(gòu)輸入向量,當(dāng)輸入和輸出達(dá)到最小重構(gòu)誤差時(shí),即完成AE的訓(xùn)練,獲得網(wǎng)絡(luò)的權(quán)重和偏差.此過程中采用的損失函數(shù)為:
(2)
2) 將上一個(gè)AE的低維輸出向量作為下一個(gè)AE的輸入,利用步驟1) 的方法完成其余AE的訓(xùn)練.
3) 堆疊各AE編碼部分,將前一層輸出的特征作為下一層輸入,構(gòu)成特征逐層壓縮提煉的SAE網(wǎng)絡(luò).
4)利用帶標(biāo)簽數(shù)據(jù)對(duì)誤差進(jìn)行反向傳播來更新整個(gè)網(wǎng)絡(luò)參數(shù),實(shí)現(xiàn)對(duì)SAE網(wǎng)絡(luò)參數(shù)的微調(diào).
首先利用前期初步訓(xùn)練獲得的各層權(quán)重和偏差,計(jì)算各個(gè)節(jié)點(diǎn)的殘差:
(3)
其次,利用殘差計(jì)算權(quán)重和偏差的改變值,如下式所示,逐層對(duì)其進(jìn)行反向更新,即可完成微調(diào).
(4)
式中:μ為微調(diào)學(xué)習(xí)率.
5) SAE訓(xùn)練完成后通過Softmax分類層完成分類.
SAE模型訓(xùn)練過程中,存在預(yù)訓(xùn)練學(xué)習(xí)率(λ)和微調(diào)訓(xùn)練學(xué)習(xí)率(μ)兩個(gè)參數(shù)需要設(shè)定.λ的大小將影響預(yù)訓(xùn)練產(chǎn)生的權(quán)重及偏差,μ決定目標(biāo)函數(shù)是否能快速地收斂到局部最小值,二者對(duì)整個(gè)模型的訓(xùn)練具有關(guān)鍵作用,而手動(dòng)調(diào)參繁瑣且可能無法找到最優(yōu)值.為了尋找到合適的參數(shù)值,本算法使用帶啟發(fā)式的SSA實(shí)現(xiàn)這兩個(gè)參數(shù)的尋優(yōu).
樽海鞘群算法(SSA)通過模擬樽海鞘的覓食和運(yùn)動(dòng)行為建立一種啟發(fā)式模型,以解決優(yōu)化問題[10].在參數(shù)尋優(yōu)過程中,領(lǐng)導(dǎo)者帶領(lǐng)著追隨者在空間中移動(dòng)并尋找食物,進(jìn)行全局尋優(yōu);追隨者利用自身的自由性進(jìn)行局部探索,減少陷入局部最優(yōu)的情況.SSA的主控制參數(shù)僅有1個(gè),易調(diào)節(jié),可避免傳統(tǒng)啟發(fā)式尋優(yōu)算法因參數(shù)調(diào)節(jié)不當(dāng)而找不到最優(yōu)值的問題.在本應(yīng)用中,實(shí)現(xiàn)步驟如下:
1) 初始化SSA參數(shù),如種群規(guī)模、初始迭代次數(shù)、最大迭代次數(shù)等參數(shù),設(shè)置種群的初始位置.
2) 初始化SAE兩個(gè)參數(shù)的初始值及尋優(yōu)范圍[bl,j,bu,j],bl,j為參數(shù)尋優(yōu)的下限,bu,j為上限.
3) SSA算法對(duì)SAE的參數(shù)進(jìn)行尋優(yōu),領(lǐng)導(dǎo)者和追隨者的位置更新利用下式完成,
(5)
4) 在相應(yīng)參數(shù)值下利用1.3節(jié)中SAE訓(xùn)練方法訓(xùn)練分類器模型.
5) 計(jì)算各組參數(shù)對(duì)應(yīng)的分類器模型的目標(biāo)函數(shù)值,更新并保留目前最優(yōu)的目標(biāo)值函數(shù).
6) 判斷尋優(yōu)結(jié)果是否滿足結(jié)束條件(測(cè)試集分類準(zhǔn)確率達(dá)到期望值或達(dá)到最大迭代次數(shù)),若是,則保留當(dāng)前最優(yōu)參數(shù)并退出尋優(yōu)過程;否則,返回步驟3繼續(xù)迭代,直到滿足條件.
1) 采集變壓器振動(dòng)信號(hào),構(gòu)建變壓器多狀態(tài)樣本數(shù)據(jù)庫,并按比例隨機(jī)分成訓(xùn)練集和測(cè)試集.
2) 采用IEWT對(duì)樣本進(jìn)行分解,獲得一組經(jīng)驗(yàn)小波分量.
3) 計(jì)算每個(gè)EWF與原始樣本的K-L散度,選散度值較小的前n階分量構(gòu)成該樣本的有效成分分量.
4) 將所有訓(xùn)練集樣本(數(shù)量為N)所提取的有效成分分量聚合成輸入矩陣X(維度為N× (x×n),其中x是單個(gè)樣本的數(shù)據(jù)長度),并給每個(gè)樣本打上對(duì)應(yīng)的標(biāo)簽,生成標(biāo)簽矩陣Y(維度為1 ×N).
5) 用X和Y訓(xùn)練SAE診斷模型,此過程包括模型的預(yù)訓(xùn)練、模型微調(diào)整、SSA尋優(yōu)確立模型參數(shù),具體步驟可見1.4節(jié).
6) 最后用測(cè)試集評(píng)估模型辨識(shí)精度.
圖1 實(shí)驗(yàn)裝置圖Fig.1 Experimental device
選用油浸式10 kV變壓器(S11-M-315/10)作為研究對(duì)象,實(shí)驗(yàn)裝置如圖1所示.振動(dòng)信號(hào)采集裝置包含NI-USB6212采集模塊和LC0156A加速度傳感器(量程為0~±3 g,靈敏度為1.491 Vg-1).文獻(xiàn)[15]指出,油浸式變壓器最佳的測(cè)量位置位于低壓側(cè)中部.為此,將傳感器通過磁鐵吸附在圖1的2位置.實(shí)驗(yàn)中采樣頻率為1 kHz,采樣時(shí)間窗口為0.7 s,每個(gè)樣本包含了700個(gè)數(shù)據(jù)點(diǎn).實(shí)驗(yàn)數(shù)據(jù)均從廣東省某變壓器廠實(shí)測(cè)獲得,主要模擬的變壓器運(yùn)行狀態(tài)包括正常運(yùn)行、鐵芯兩點(diǎn)接地、繞組螺絲松動(dòng)、繞組變形等4種,分別稱為類1~類4,實(shí)驗(yàn)過程參考文獻(xiàn)[9].4種狀態(tài)各采集200個(gè)樣本,總實(shí)驗(yàn)樣本為800個(gè).
圖2為一組變壓器振動(dòng)信號(hào)的原始波形.從圖中可以發(fā)現(xiàn),繞組變形時(shí)波形的幅值較小,形狀接近于正弦波,與其他3種狀態(tài)存在較大的差異;其余3種狀態(tài)的波形幅值和形狀都相近,肉眼難以分辨.此外,原始波形中包含了大量干擾成分,僅從時(shí)域波形無法看出信號(hào)特征.因此需要對(duì)信號(hào)進(jìn)行分解,剔除無用成分,并從時(shí)域、頻域等不同角度來提取特征.
圖3為經(jīng)IEWT分解后得到的傅里葉頻譜及頻帶劃分圖.從圖中可見,在0 Hz處,每個(gè)信號(hào)頻譜都有較大的能量分布,說明不同運(yùn)行狀態(tài)的振動(dòng)信號(hào)頻譜中存在較大的直流分量,原因在于傳感器自身測(cè)量誤差和測(cè)量操作方式不同造成隨機(jī)誤差,與變壓器自身運(yùn)行狀態(tài)無關(guān).
圖2 各狀態(tài)類別的原始波形圖Fig.2 Original waveform of each category
圖3 各狀態(tài)類別的頻譜分割圖Fig.3 Spectrum segmentation results of all categories
從圖中還可以看出,除去直流分量,信號(hào)在不同頻帶的幅值變化明顯.IEWT可以根據(jù)信號(hào)自身特性自適應(yīng)設(shè)置分解個(gè)數(shù)并劃分頻段,因此各信號(hào)的頻帶劃分的范圍和個(gè)數(shù)都不盡相同.這很好地避免了由于分解個(gè)數(shù)設(shè)置過少導(dǎo)致的分解不充分,以及分解個(gè)數(shù)設(shè)置過多導(dǎo)致過度分解問題.在100 Hz基頻處,不同狀態(tài)的信號(hào)都有能量分布,其中正常時(shí)最大,而異常時(shí)倍頻分量,如200、300 Hz等頻率分布處的能量會(huì)有所增加.相比于原始波形,經(jīng)IEWT分解后4種信號(hào)間的區(qū)別較大,表達(dá)更為直觀.
為了剔除振動(dòng)信號(hào)中包含的直流分量、噪聲等干擾成分,同時(shí)考慮減少計(jì)算量,利用K-L散度來篩選有效分量.不同類別的振動(dòng)信號(hào)經(jīng)IEWT分解后各分量與原信號(hào)之間的K-L散度值列于表1中.從表中可以看出,4種類別樣本的EWF2分量與原信號(hào)的K-L散度值最小,而EWF1的散度值最大.這說明EWF2與原信號(hào)的關(guān)系最近,是有效成分;EWF1與原信號(hào)關(guān)系最遠(yuǎn),是無用成分.
表1 各類別樣本的K-L散度值Tab.1 K-L divergence value of each category sample
表2 重構(gòu)信號(hào)與原信號(hào)相似度值Tab.2 Similarities of reconstructed signal and original signal (%)
對(duì)于類4,即繞組變形,IEWT分解的分量個(gè)數(shù)為4,剔除含直流等干擾成分的EWF1,剩余3個(gè)分量.因此,選取K-L散度值較低的前1~3階分量進(jìn)行重構(gòu).重構(gòu)信號(hào)與原信號(hào)的相似程度如表2所示.
當(dāng)使用前1階有效分量進(jìn)行重構(gòu)時(shí),類2(兩點(diǎn)接地狀態(tài))和類3(繞組螺絲松動(dòng)狀態(tài))的相似度較低,只有78.25%和62.24%,不足以表征原信號(hào).而使用前3階分量進(jìn)行重構(gòu)時(shí),每個(gè)類別的相似度均達(dá)到了95%以上,足以表征原信號(hào).因此,選取K-L散度值較低的前3階分量作為特征.
將所有的樣本經(jīng)特征提取后,按3∶1的比例隨機(jī)分成訓(xùn)練集和測(cè)試集,即600個(gè)訓(xùn)練樣本,200個(gè)測(cè)試樣本.訓(xùn)練集樣本輸入到一個(gè)7層SAE(結(jié)構(gòu)為700-600-500-250-100-50-4)進(jìn)行特征的二次挖掘,并訓(xùn)練一個(gè)具有4分類的分類器,此過程利用SSA進(jìn)行參數(shù)尋優(yōu).
將預(yù)訓(xùn)練學(xué)習(xí)率和微調(diào)學(xué)習(xí)率設(shè)為待尋優(yōu)參數(shù),即x1和x2,尋優(yōu)范圍為[0,1],迭代次數(shù)為20,以訓(xùn)練集分類錯(cuò)誤率為目標(biāo)函數(shù),尋優(yōu)過程及結(jié)果如圖4所示.
圖4 尋優(yōu)過程及結(jié)果Fig.4 Optimization process and result
圖4(a)展示尋優(yōu)過程中目標(biāo)函數(shù)值在參數(shù)空間中的變化,最低點(diǎn)是目標(biāo)函數(shù)的最小值,在圖中用黑點(diǎn)標(biāo)注.此時(shí)分類錯(cuò)誤率為0%,對(duì)應(yīng)的x1和x2分別為0.7和0.1.圖4(b)展示尋優(yōu)過程中訓(xùn)練集的分類準(zhǔn)確率.可以看出,迭代一次后準(zhǔn)確率達(dá)65%;再次迭代后準(zhǔn)確率可達(dá)90%~96%;經(jīng)過5次迭代,準(zhǔn)確率可保持在99%;迭代8次后,準(zhǔn)確率達(dá)100%,此時(shí)目標(biāo)函數(shù)為0,為最優(yōu)值,將此最優(yōu)模型保存.
圖5 測(cè)試集分類結(jié)果Fig.5 Classification results of test set
測(cè)試集共有200個(gè)樣本,各個(gè)類別的樣本數(shù)量是隨機(jī)的,將其輸入到訓(xùn)練好的模型中進(jìn)行驗(yàn)證,其分類結(jié)果的混淆矩陣如圖5所示.圖5中僅有1個(gè)樣本出現(xiàn)誤判,測(cè)試集的分類準(zhǔn)確率可達(dá)99.50%,充分驗(yàn)證了本故障診斷算法的有效性.
圖5中最后一行的前4個(gè)量表示分類準(zhǔn)確率,類別1總共有59個(gè),其中58個(gè)預(yù)測(cè)為類別1,有1個(gè)錯(cuò)誤的預(yù)測(cè)為類別2,分類準(zhǔn)確率為98.31%,其余3類的分類準(zhǔn)確率都為100%.通過查看該錯(cuò)判樣本的原始波形及頻譜圖發(fā)現(xiàn),該樣本的頻譜圖和鐵芯兩點(diǎn)接地狀態(tài)十分相似,相應(yīng)頻率處的能量分布更接近鐵芯兩點(diǎn)接地狀態(tài),這與該樣本取自于剛上電時(shí)刻,鐵芯環(huán)流較小,諧波含量不大有關(guān).
最后一列的前4個(gè)量表示分類精準(zhǔn)率,即每個(gè)類別分類結(jié)果中正確分類的占比.由于存在1個(gè)類別1樣本誤判為類別2,導(dǎo)致類別2的分類精準(zhǔn)率下降,但也達(dá)到了97.83%,其余3類的分類精準(zhǔn)率都為100%.
表3 不同方法對(duì)比結(jié)果Tab.3 Comparison results of different approaches
為了驗(yàn)證算法性能,與文獻(xiàn)[8]和[9]中的方法進(jìn)行比較,結(jié)果如表3所示.相比于其他兩種方法,本方法的分類準(zhǔn)確率更高,盡管訓(xùn)練時(shí)間長,但測(cè)試時(shí)間適中,且與文獻(xiàn)[8]的結(jié)果差異不大.這里的訓(xùn)練時(shí)間指利用訓(xùn)練集樣本訓(xùn)練模型需要的時(shí)間,測(cè)試時(shí)間指辨識(shí)1個(gè)測(cè)試集樣本所花費(fèi)的時(shí)間.它們是在具有i7-5500U的CPU、4 GB內(nèi)存和Intel (R) HD Graphics 550集成顯卡的運(yùn)行環(huán)境中計(jì)算獲得.文獻(xiàn)[8]數(shù)據(jù)分解后直接提取多尺度熵進(jìn)行故障辨識(shí),不需要迭代訓(xùn)練網(wǎng)絡(luò),所以花費(fèi)的時(shí)間較少;本方法采用SSA參數(shù)尋優(yōu),且訓(xùn)練1個(gè)7層的SAE花費(fèi)時(shí)間較長,但當(dāng)訓(xùn)練完成后,調(diào)用模型進(jìn)行測(cè)試是十分迅速的;而文獻(xiàn)[9]要訓(xùn)練1個(gè)4層的SAE和隨機(jī)森林分類器模型,其訓(xùn)練和測(cè)試過程都相對(duì)比較漫長.
受儀器精度限制和環(huán)境的影響,振動(dòng)信號(hào)通常含有一定量噪聲,隨著噪聲強(qiáng)度的增加,診斷算法的誤判可能性會(huì)增加.將具有不同信噪比(SNR)的高斯白噪聲添加到測(cè)試集數(shù)據(jù)中[16],進(jìn)一步研判3種方法的抗干擾能力和可靠性,結(jié)果如表4所示.所添加噪聲的強(qiáng)度通過調(diào)整信噪比來控制[17].
表4 抗干擾實(shí)驗(yàn)結(jié)果Tab.4 Results of anti-interference experiment
表4表明,當(dāng)SNR從50 dB變化到10 dB時(shí),本方法分類準(zhǔn)確率從99.5%降為98.0%,僅降低了1.5%,說明本方法的抗干擾能力出色.這得益于本方法通過IEWT分解出不同頻率的信號(hào)分量,并應(yīng)用K-L散度剔除直流和噪聲等干擾成分,使得其在強(qiáng)噪聲環(huán)境下依然具有很強(qiáng)的可靠性.文獻(xiàn)[9]的抗干擾性最差,SNR在30~50 dB之間準(zhǔn)確率高于86.0%,當(dāng)SNR降到20 dB或10 dB時(shí),其準(zhǔn)確率大大降低.
對(duì)配電變壓器漸變性、潛伏性故障進(jìn)行診斷是近年的研究熱點(diǎn).基于此,本研究通過采集振動(dòng)信號(hào)構(gòu)建IEWT-SAE算法對(duì)配電變壓器運(yùn)行狀態(tài)進(jìn)行監(jiān)測(cè),進(jìn)而實(shí)現(xiàn)潛伏性故障診斷.經(jīng)對(duì)比分析,結(jié)果表明:該方法分類準(zhǔn)確率可達(dá)99.5%,明顯高于文中的對(duì)比方法;單個(gè)樣本的診斷時(shí)間為0.181 s,滿足現(xiàn)場(chǎng)診斷需求;同時(shí)還具有強(qiáng)抗干擾性、自適應(yīng)特征學(xué)習(xí)及參數(shù)尋優(yōu)等特點(diǎn),大大減少人為因素干擾.