郭云峰 楊曉梅
(四川大學(xué)電氣工程學(xué)院 四川 成都 610065)
Disturbance classification
提供可靠、優(yōu)質(zhì)的電力已成為現(xiàn)代電力行業(yè)主要的發(fā)展目標(biāo)之一。電能質(zhì)量擾動(dòng)主要包括干擾設(shè)備正常運(yùn)行的電壓、電流或基頻的偏差,如果未得到及時(shí)處理,可能會(huì)造成重大的損失。為改善供電質(zhì)量,需要對(duì)擾動(dòng)信號(hào)進(jìn)行更智能的分類識(shí)別,以采取合理的措施來預(yù)防擾動(dòng)事件的發(fā)生。
多數(shù)電能質(zhì)量擾動(dòng)為非平穩(wěn)信號(hào),常采用不同的特征提取與分類器相結(jié)合的方法來解決電能質(zhì)量擾動(dòng)分類問題。特征提取的主要方法有:S變換(S transform,ST)[1-2]、離散小波變換(discrete wavelet transform,DWT)[3-4]、短時(shí)傅里葉變換(short-time Fourier transform,STFT)[5]以及希爾伯特-黃變換(Hilbert-huang transform,HHT)[6]等。使用的分類器主要有:支持向量機(jī)(support vector machine,SVM)[7]、人工神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN)[8]及決策樹[9-10]等。其中ANN雖然分類效果較好,但是計(jì)算量較大,耗費(fèi)時(shí)間較多;決策樹算法簡單,但受噪聲影響較大,魯棒性不強(qiáng),分類效果欠佳。SVM具有較強(qiáng)的自適應(yīng)學(xué)習(xí)能力,使用核函數(shù)可以解決非線性樣本的分類問題。在樣本類型較少且分類特征選擇適當(dāng)時(shí),SVM分類效果較好;但當(dāng)樣本類型較多時(shí),部分?jǐn)_動(dòng)信號(hào)的波形相似,使得單一SVM分類準(zhǔn)確率較低。
針對(duì)單一SVM分類準(zhǔn)確率較低的缺點(diǎn),本文提出了雙層SVM的分類方法,該分類方法采用兩層SVM組成分類器。首先利用TQWT對(duì)擾動(dòng)信號(hào)進(jìn)行5層分解并提取特征,使用經(jīng)粒子群算法優(yōu)化后的SVM進(jìn)行第一次分類,然后根據(jù)分類結(jié)果,結(jié)合小波去噪算法和TQWT提取特征,使用優(yōu)化后的SVM對(duì)分類準(zhǔn)確率較低的部分類別信號(hào)進(jìn)行第二次分類,以達(dá)到提高分類準(zhǔn)確率的效果,并通過仿真實(shí)驗(yàn)驗(yàn)證了所提方法的有效性。
SVM算法[11]采用結(jié)構(gòu)風(fēng)險(xiǎn)最小化原理,具有良好的泛化能力,通過構(gòu)造超平面對(duì)樣本進(jìn)行分類,基本思想如圖1的樣本二分類情況所示。
圖1 最優(yōu)超平面
圖1中,“+”和“-”分別代表不同訓(xùn)練樣本,D為最優(yōu)分類面,邊界D1和D2是根據(jù)兩類樣本離D最近的點(diǎn)確定的。
設(shè)訓(xùn)練樣本為(xi,yi),i=1,2,…,n,xi∈Rd為樣本數(shù)據(jù),yi∈{+1,-1}為樣本標(biāo)簽,n是樣本數(shù)量,d是輸入維數(shù)。當(dāng)訓(xùn)練樣本如圖1線性可分時(shí),最優(yōu)分類超平面為:
wx+b=0
(1)
(2)
一般而言,樣本為線性不可分的,此時(shí)使用松弛變量ξi≥0將優(yōu)化問題轉(zhuǎn)變?yōu)椋?/p>
(3)
式中:C為正則化常數(shù)。在式(3)使用拉格朗日乘子法求得最優(yōu)決策函數(shù)為:
(4)
式中:α是拉格朗日系數(shù)。根據(jù)K-T條件,上述優(yōu)化問題的解滿足如下約束條件:
αi[yi(wxi+b)-1]=0
(5)
為處理非線性分類問題,通常SVM使用核函數(shù)K(xi,xj)將樣本從原空間映射到高維特征空間。常用的核函數(shù)有線性核、多項(xiàng)式核和高斯核等,本文采用的是高斯核函數(shù)。依照Mercer條件,引入核函數(shù)之后的最優(yōu)決策函數(shù)為:
(6)
SVM最初是針對(duì)二分類問題提出的,在處理多分類問題時(shí),需要將多分類問題轉(zhuǎn)化成二分類問題處理。目前對(duì)于處理多分類問題的常見算法有:一對(duì)一和一對(duì)多算法。本文使用的SVM采用的是一對(duì)一算法[12],下面簡單介紹一下該算法的基本原理。
設(shè)有k類數(shù)據(jù),其主要思想是構(gòu)建k(k-1)/2分類器,其中每個(gè)分類器都使用來自兩個(gè)類的數(shù)據(jù)進(jìn)行訓(xùn)練。選擇第i類數(shù)據(jù)和第j類數(shù)據(jù)構(gòu)造一個(gè)分類器,解決式(7)所示的二分類問題。
(7)
式(7)滿足如下約束條件:
(8)
然后采用投票法解決上述問題。若判斷x屬于第i類,則第i類票數(shù)加1;若判斷x屬于第j類,則第j類票數(shù)加1。最后x屬于票數(shù)最多的類。
TQWT是一種強(qiáng)有力的分解方法,具有廣泛的應(yīng)用領(lǐng)域,其是傳統(tǒng)的單Q因子小波變換的改進(jìn)[13]。TQWT與離散小波變換類似,采用雙通道多速率濾波器組,具有低通濾波器和高通濾波器。主要有三個(gè)參數(shù):Q因子、過采樣率R和分解層數(shù)J。
輸入信號(hào)Sig[m]在每一層被分解為低通子帶(Lsig)和高通子帶(Hsig),采樣率分別為αfs和βfs(α和β分別是低通和高通縮放因子,fs是輸入信號(hào)的采樣率)。低通子帶和高通子帶由低通濾波器h0(w)和高通濾波器h1(w)得到,高通子帶在下一層分解中被進(jìn)一步分解為低通子帶和高通子帶,如圖2所示。h0(w)和h1(w)計(jì)算公式如式(9)和式(10)所示。
(9)
(10)
式中:θ(w)為具二階消失矩的Daubechies規(guī)范正交基。TQWT中的參數(shù)Q、R、J與α和β的關(guān)系如式(11)所示。
(11)
圖2 TQWT分解信號(hào)過程
本文根據(jù)IEEE Std[14]建立7種單一電能質(zhì)量擾動(dòng)數(shù)學(xué)模型,分別為電壓暫降(C1)、電壓暫升(C2)、電壓中斷(C3)、諧波(C4)、暫態(tài)振蕩(C5)、暫態(tài)脈沖(C6)和電壓閃變(C7)。在此基礎(chǔ)上生成7種復(fù)合電能質(zhì)量擾動(dòng)信號(hào),分別為諧波+脈沖(C8)、諧波+振蕩(C9)、諧波+閃變(C10)、暫降+脈沖(C11)、諧波+暫升(C12)、諧波+暫降+脈沖(C13)、諧波+暫降+振蕩(C14)。擾動(dòng)信號(hào)的基波頻率為50 Hz,采樣頻率為6.4 kHz,信號(hào)長度為1 280。在TQWT的參數(shù)設(shè)置中,R參考文獻(xiàn)[15]設(shè)置為3,根據(jù)實(shí)驗(yàn)分析設(shè)置Q為1.1,對(duì)信號(hào)進(jìn)行5層TQWT分解,利用小波系數(shù)進(jìn)行重構(gòu)得到信號(hào)在各尺度上的重構(gòu)信號(hào)。本文考慮了峰峰值、均方根值、均值、相對(duì)模式能量比、瞬時(shí)幅值、信息熵、峰值因數(shù)、峭度、希爾伯特變換[4]后的包絡(luò)幅值、熵范數(shù)、頻譜最大值和最小值共12個(gè)特征,根據(jù)實(shí)驗(yàn)分析,選擇了分類效果最好的峰值(F1)、均方根值(F2)、峭度(F3)、頻譜最大值(F4)和希爾伯特變換后的包絡(luò)幅值(F5)共5個(gè)特征,對(duì)6層重構(gòu)信號(hào)求取這5個(gè)特征值,每個(gè)信號(hào)構(gòu)成一個(gè)30維的特征。峭度的計(jì)算式為:
(12)
式中:Cij為i層上重構(gòu)信號(hào)的第j個(gè)數(shù)值,N為信號(hào)長度,σ和s為Cij的標(biāo)準(zhǔn)差和均值。
包絡(luò)幅值的計(jì)算式為:
(13)
式中:hij為Cij經(jīng)希爾伯特變換后的模值。
根據(jù)數(shù)學(xué)模型通過MATLAB 2016分別生成信噪比為20 dB、30 dB、40 dB的14類電能質(zhì)量擾動(dòng)信號(hào),每類300個(gè)樣本,隨機(jī)選取其中200個(gè)作為訓(xùn)練樣本,100個(gè)作為測(cè)試樣本,分別進(jìn)行5層TQWT分解提取特征,其中信噪比為30 dB的C1、C9和C14擾動(dòng)信號(hào)的TQWT分解如圖3所示。本文所使用的分類器模型如圖4所示,第一層SVM對(duì)信號(hào)進(jìn)行第一次分類,第二層SVM對(duì)錯(cuò)誤樣本集中的類別進(jìn)行第二次分類。
圖3 不同擾動(dòng)信號(hào)TQWT分解
圖4 分類器模型
SVM中懲罰參數(shù)C和高斯核參數(shù)g的正確選取,是擾動(dòng)信號(hào)能否被正確分類的關(guān)鍵。本文使用信噪比為20 dB的樣本通過粒子群算法[16]對(duì)SVM進(jìn)行參數(shù)尋優(yōu),設(shè)定懲罰參數(shù)C∈[0.1,1 000],高斯核參數(shù)g∈[0.01,10],最大進(jìn)化代數(shù)為50,種群數(shù)量為20,參數(shù)局部和全局搜索能力初始值c1和c2均取為2,慣性權(quán)重k為0.6,采用準(zhǔn)確率適應(yīng)度函數(shù)作評(píng)價(jià)指標(biāo)。尋優(yōu)得到最優(yōu)參數(shù)C=650.870 4,g=0.085 587,分類器模型中的所有SVM的高斯核參數(shù)和懲罰因子均取相同值。
以含20 dB噪聲的樣本為例,說明本文提出的分類方法的運(yùn)作過程。經(jīng)過第一次分類后,得知暫降(C1)和中斷(C3)、暫升(C2)和閃變(C7)、諧波+脈沖(C8)和諧波+暫降+脈沖(C13),以及諧波+閃變(C10)和諧波+暫升(C12)信號(hào)容易分類混淆。對(duì)于第一次SVM分類之后判定為閃變(C7)的樣本,用TQWT對(duì)暫升(C2)和閃變(C7)的訓(xùn)練樣本進(jìn)行5層分解提取特征訓(xùn)練SVM,再將第一次分類判定為閃變(C7)的樣本作為測(cè)試集進(jìn)行第二次分類。對(duì)于第一次分類之后判定為諧波+閃變(C10)的樣本處理過程相同。
對(duì)于第一次分類判定為中斷(C3)的樣本,因?yàn)椴糠謺航敌盘?hào)的暫降部分波形接近于中斷,且噪聲覆蓋了信號(hào)的特征,直接使用TQWT分解提取特征進(jìn)行第二次分類并不能取得較好的效果。本文用小波去噪算法[17]對(duì)暫降(C1)和中斷(C3)的訓(xùn)練樣本進(jìn)行濾波,濾波后信號(hào)幅值在-1到1之間,將-1到1以0.1為單位分為20個(gè)子區(qū)間,計(jì)算每個(gè)子區(qū)間內(nèi)的采樣點(diǎn)數(shù),如圖5所示,再將每個(gè)子區(qū)間內(nèi)的采樣點(diǎn)數(shù)除以總采樣點(diǎn)數(shù)1 280,最后每個(gè)信號(hào)得到一個(gè)20維的特征,以此訓(xùn)練SVM再進(jìn)行分類[18]。
(a) 電壓暫降(C1)
對(duì)于第一次分類判定為諧波+脈沖(C8)的樣本,采用小波去噪算法對(duì)諧波+脈沖(C8)和諧波+暫降+脈沖(C13)的訓(xùn)練樣本進(jìn)行濾波,經(jīng)TQWT分解之后提取特征訓(xùn)練SVM,將第一次分類判定為諧波+脈沖(C8)的樣本作為測(cè)試集,得到第二次分類的結(jié)果。在信噪比為20 dB時(shí),單層SVM和雙層SVM部分類別的混淆矩陣如表1和表2所示。
表1 單層SVM的混淆矩陣
表2 雙層SVM的混淆矩陣
本文使用單層SVM和雙層SVM分別對(duì)不同信噪比的信號(hào)進(jìn)行了分類,結(jié)果如表3和表4所示。由表3和表4可知,信噪比為20 dB時(shí),雙層SVM分類準(zhǔn)確率比單層SVM分類準(zhǔn)確率高了1.29%,在30 dB和40 dB情況下分別高出1.5%和1.07%,由此證明了所提方法的有效性。
表3 不同噪聲強(qiáng)度下單層SVM的分類結(jié)果
續(xù)表3
表4 不同噪聲強(qiáng)度下雙層SVM的分類結(jié)果
續(xù)表4
為了進(jìn)一步驗(yàn)證本文特征提取方法和分類器構(gòu)造方法的合理性,本文使用TQWT對(duì)信號(hào)進(jìn)行5層分解并提取特征,以BP神經(jīng)網(wǎng)絡(luò)和隨機(jī)森林(random forest,RF)作為分類器,對(duì)比分類效果,結(jié)果如表5所示。由表5可知,在不同噪聲背景下,本文所提出的分類方法準(zhǔn)確率均高于其他兩種分類器,體現(xiàn)了本文所提出方法的優(yōu)越性。
表5 分類結(jié)果對(duì)比
為了解決單一SVM分類準(zhǔn)確率較低的問題,本文提出了一種雙層SVM的電能質(zhì)量信號(hào)分類模型。主要工作如下:
(1) 首先采用TQWT對(duì)信號(hào)進(jìn)行5層分解并提取特征,使用SVM進(jìn)行第一次分類。
(2) 根據(jù)第一次分類得到的結(jié)果,結(jié)合小波去噪算法和TQWT提取信號(hào)特征,針對(duì)錯(cuò)誤樣本集中的類別進(jìn)行第二次分類。
相對(duì)于單層SVM,雙層SVM能夠?qū)﹀e(cuò)誤分類的信號(hào)進(jìn)行二次分類,提高了信號(hào)的分類準(zhǔn)確率。通過對(duì)14種單一和復(fù)合擾動(dòng)的分類實(shí)驗(yàn)證明了該方法具有分類準(zhǔn)確率高、抗噪能力強(qiáng)的優(yōu)點(diǎn),具有較高的實(shí)用價(jià)值。
通過實(shí)驗(yàn)表明本文仍有較大的改進(jìn)空間,例如在使用SVM對(duì)信號(hào)進(jìn)行第一次分類之后,部分諧波+振蕩(C9)信號(hào)被判定為諧波(C4)信號(hào),因?yàn)槊總€(gè)信號(hào)樣本振蕩部分的幅度不同,且噪聲覆蓋了信號(hào)的振蕩特征,導(dǎo)致振蕩幅度較小的信號(hào)被錯(cuò)誤分類,目前通過二次分類也不能得到滿意的結(jié)果。此外,在對(duì)各類信號(hào)進(jìn)行第二次分類時(shí)也未能完全正確分類,因此未來工作需要查閱更多的文獻(xiàn),研究能更好地提取信號(hào)特征的方法,實(shí)現(xiàn)信號(hào)進(jìn)行二分類時(shí)準(zhǔn)確分類。