錢 歡, 蔣 沅, 王海濤
(1. 南昌航空大學(xué) 信息工程學(xué)院,南昌 330063; 2. 中建一局集團(tuán)第二建筑有限公司,北京 102600)
現(xiàn)實(shí)生活中的信號(hào)絕大部分都是非線性、非平穩(wěn)信號(hào),處理這類信號(hào)最行之有效的方法是時(shí)頻分析法,常用的傳統(tǒng)時(shí)頻分析法如Fourier 變換、小波變換、Gabor 變換和Winger-Ville 分布在處理信號(hào)時(shí),通常認(rèn)為信號(hào)是線性的、平穩(wěn)的。為了解決上述方法的局限性,Norden E. Huan 等[1]創(chuàng)造性地提出了經(jīng)驗(yàn)?zāi)B(tài)分解法,經(jīng)驗(yàn)?zāi)B(tài)分解法是一種基于原始信號(hào)自身特征量進(jìn)行分解的自適應(yīng)時(shí)頻信號(hào)處理方法。因而廣泛應(yīng)用于結(jié)構(gòu)損傷檢測、機(jī)械故障診斷[2]和濾波降噪等領(lǐng)域[3]。在進(jìn)行EMD分解時(shí),采用精度較高的3 次樣條插值法對(duì)信號(hào)的極值點(diǎn)進(jìn)行擬合求取信號(hào)的上、下包絡(luò)線。由于極值點(diǎn)分布不均以及無法確定信號(hào)端點(diǎn)處是否為極大值點(diǎn)或極小值點(diǎn),產(chǎn)生了非均勻點(diǎn)擬合的現(xiàn)象,導(dǎo)致擬合的包絡(luò)線在信號(hào)的端點(diǎn)處發(fā)生形變,產(chǎn)生“過沖”和“欠沖”的現(xiàn)象[4],使得包絡(luò)線無法將整個(gè)信號(hào)完全“包住”,最終導(dǎo)致所求包絡(luò)線的均值誤差較大。而第一個(gè)IMF 是原始信號(hào)減去包絡(luò)線均值后再進(jìn)行迭代處理所得,由于包絡(luò)線均值存在誤差導(dǎo)致誤差最終傳遞到IMF 上。在接下來每次分解產(chǎn)生的新的IMF 時(shí)誤差不斷累積加大,最終導(dǎo)致得到的各個(gè)固有模態(tài)分量不能準(zhǔn)確反映原始信號(hào)的組成成分,分解的完備性遭到破壞。為了有效抑制端點(diǎn)效應(yīng)造成的失真問題,總結(jié)國內(nèi)外學(xué)者的研究方法主要可以分為以下幾類:1)首先是基于原始信號(hào)的波形特征進(jìn)行處理,如黃大吉的鏡像閉合延拓法[5],通過設(shè)置鏡面把原始信號(hào)延拓成一個(gè)沒有端點(diǎn)的閉合信號(hào)環(huán),然而該方法對(duì)于信號(hào)的對(duì)稱性要求較高,適用范圍有限;2)其次是基于數(shù)學(xué)預(yù)測模型的方法,通過使用特殊的數(shù)學(xué)模型對(duì)原始信號(hào)兩端進(jìn)行延拓,如程軍圣的自回歸滑動(dòng)平均模型[6],該方法對(duì)于平穩(wěn)信號(hào)和常見的非平穩(wěn)信號(hào)處理效果良好,但是對(duì)于復(fù)雜的非平穩(wěn)信號(hào)處理精度不高;3)最后是基于神經(jīng)網(wǎng)絡(luò)的方法,郝如江使用支持向量機(jī)[7]對(duì)數(shù)據(jù)進(jìn)行預(yù)測延拓,但是該方法也存在核函數(shù)和最優(yōu)參數(shù)選擇的問題。以上諸多方法對(duì)于抑制端點(diǎn)效應(yīng)起到了一定的作用,但由于方法過于單一,在處理復(fù)雜信號(hào)和短時(shí)序信號(hào)等特殊信號(hào)[8-10]時(shí)效果不夠理想。對(duì)此本文提出一種基于灰色預(yù)測和加窗函數(shù)的改進(jìn)處理方法,針對(duì)短時(shí)序、小樣本信號(hào),通過引入灰色均值GM(1,1)預(yù)測模型對(duì)短時(shí)序信號(hào)進(jìn)行精確預(yù)測,在原始信號(hào)兩端各延拓出若干極值點(diǎn),然而即使這樣我們依然無法準(zhǔn)確判斷信號(hào)的端點(diǎn)情況,因此還需結(jié)合矩形窗和漢寧窗這兩種窗函數(shù),即一方面通過矩形窗強(qiáng)化中部原始數(shù)據(jù),保護(hù)原始信號(hào)不失真,另一方面對(duì)兩端的延拓部分施加漢寧窗讓信號(hào)平緩過渡,使端點(diǎn)處的值趨于零,擬合的包絡(luò)線最終也收斂于端點(diǎn)處,因此信號(hào)的端點(diǎn)情況得到確認(rèn),使包絡(luò)擬合時(shí)不再出現(xiàn)形變發(fā)散的問題,從而實(shí)現(xiàn)抑制端點(diǎn)效應(yīng)的目的。
NASA 科學(xué)家Norden E. Huan[1]早期在處理海洋波信號(hào)時(shí)假設(shè)多分量信號(hào)都是由一系列基于時(shí)間特征尺度的固有模態(tài)分量相互疊加而成,將非線性、非平穩(wěn)信號(hào)按局部頻率由高到底篩分出固有模態(tài)分量和一個(gè)單調(diào)的趨勢項(xiàng)分量,實(shí)質(zhì)上是對(duì)信號(hào)中不同波動(dòng)特性的分量進(jìn)行分離,將各個(gè)固有模態(tài)分量經(jīng)希爾伯特變換得到解析信號(hào)和瞬時(shí)頻率,同時(shí)Huang[1]論證了EMD 滿足完備性、正交性和調(diào)制性等特點(diǎn)。其中滿足IMF 分量的2 個(gè)條件如下:1)極值點(diǎn)數(shù)和過零點(diǎn)數(shù)之差等于0 或者1;2)極大值和極小值所構(gòu)成包絡(luò)線的均值為0。EMD 算法實(shí)現(xiàn)過程如下:
(1)對(duì)原始信號(hào)x(t)的極值點(diǎn)進(jìn)行3 次樣條插值擬合上下包絡(luò)線a(t) 和b(t), 包絡(luò)線均值記作m1(t):
(2)從原始信號(hào)中去除低頻分量m1(t),剩余的記作h1(t):
(3)判斷h1(t)是否滿足成為IMF 的條件,如果滿足條件則認(rèn)定h1(t)就是第一個(gè)IMF,并讓c1(t)=h1(t)。
(4)如果不滿足條件則將h1(t)作 為新的x(t)重復(fù)上述過程,在迭代k次后滿足條件后成為IMF1,記作h1,k(t)并 且c1(t)=h1,k(t),迭代的終止是篩選門限S D∈[0.2,0.3], 門限S D計(jì)算公式如下:
(5)令r1(t)=x(t)?c1(t), 把r1(t)作 為新的x(t)重復(fù)上述過程,得到剩余的IMF,其中殘余分量記作rn(t) , 當(dāng)rn(t)為常數(shù)或單調(diào)函數(shù)時(shí),EMD 過程結(jié)束,x(t)如式(4)所示:
在EMD 分解的迭代過程中,需要多次使用3 次樣條插值對(duì)信號(hào) 的極大值和極小值點(diǎn)進(jìn)行擬合求取上、下包絡(luò)線,受制于無法準(zhǔn)確判定端點(diǎn)是否為極值點(diǎn)的問題,導(dǎo)致擬合的包絡(luò)線在端點(diǎn)處發(fā)生偏移甚至發(fā)散,進(jìn)而導(dǎo)致包絡(luò)線均值失真,擬合的上包絡(luò)線無法將原始信號(hào)完全包住,導(dǎo)致第一個(gè)IMF 分量和原始信號(hào)的高頻分量之間存在較大誤差,隨著EMD 迭代分解的不斷進(jìn)行,使得端點(diǎn)出現(xiàn)的失真問題,不斷向中間數(shù)據(jù)進(jìn)行傳導(dǎo),導(dǎo)致整個(gè)數(shù)據(jù)序列都受到“污染”,最終結(jié)果是所得各IMF 分量無法準(zhǔn)確表征原始信號(hào)。
當(dāng)前的預(yù)測方法在樣本較少時(shí)的預(yù)測誤差都比較大,灰色預(yù)測模型通過關(guān)聯(lián)分析判斷系統(tǒng)內(nèi)部動(dòng)態(tài)發(fā)展趨勢,灰色生成關(guān)聯(lián)性較強(qiáng)的數(shù)據(jù)序列,從而預(yù)測樣本的發(fā)展趨勢?;疑A(yù)測模型在不改變?cè)行盘?hào)的基礎(chǔ)上具有預(yù)測精度高、計(jì)算簡單等優(yōu)點(diǎn),相較于ANN 預(yù)測,不需要大規(guī)模的訓(xùn)練,具有計(jì)算量小,耗時(shí)短的優(yōu)點(diǎn);相較于SVM 預(yù)測,不存在核函數(shù)選取和參數(shù)設(shè)定困難的問題。因而針對(duì)小數(shù)據(jù)、貧信號(hào)預(yù)測的灰色預(yù)測模型逐漸成為灰色系統(tǒng)領(lǐng)域研究的熱點(diǎn)方向,其中基于灰色預(yù)測模型及其組合方法應(yīng)用成果顯著,如王守相等[11]運(yùn)用灰色預(yù)測模型和神經(jīng)網(wǎng)絡(luò)組合算法實(shí)現(xiàn)光伏出力情況預(yù)測;如劉思峰等[12]提出基于灰色關(guān)聯(lián)度和GM(1,1)灰色組合預(yù)測模型的GDP 預(yù)測。其中GM(1,1)模型是由單變量的一階灰色微分方程構(gòu)成的模型,能在不改變信號(hào)原有特性情況下對(duì)復(fù)雜的不確定性信號(hào)進(jìn)行有效預(yù)測,并且該模型只需要4 個(gè)以上樣本點(diǎn)便可以實(shí)現(xiàn)對(duì)數(shù)據(jù)的預(yù)測,對(duì)短時(shí)序的貧信號(hào)預(yù)測效果明顯,GM(1,1)相較于其它灰色模型還具有計(jì)算簡便適、適合實(shí)時(shí)預(yù)測等優(yōu)勢,灰色動(dòng)態(tài)模型算法實(shí)現(xiàn)過程如下:
窗函數(shù)也稱計(jì)權(quán)函數(shù),常見的窗函數(shù)有指數(shù)窗、矩形窗、海明窗和平頂窗等[13]。我們一方面希望原始信號(hào)加窗后所擬合的包絡(luò)線更加貼合原始信號(hào),降低包絡(luò)線在端點(diǎn)處的發(fā)散程度;但另一方面在加窗后,原始信號(hào)的起始位置和結(jié)束位置的計(jì)權(quán)結(jié)果為零,導(dǎo)致原始信號(hào)兩端出現(xiàn)幅值失真,因此為了降低加窗函數(shù)后對(duì)原始信號(hào)的影響,需要先對(duì)原始信號(hào)進(jìn)行延拓,讓加窗函數(shù)造成的失真發(fā)生在延拓部分同時(shí)也要保證原始信號(hào)本身所受影響最小。加窗函數(shù)從本質(zhì)上來說是原始信號(hào)和計(jì)權(quán)函數(shù)相乘的[14]過程,為實(shí)現(xiàn)上述目標(biāo),本文將矩形窗和漢寧窗結(jié)合使用,對(duì)原始信號(hào)乘以一個(gè)計(jì)權(quán)權(quán)重為1 的矩形窗不改變?cè)夹盘?hào),對(duì)兩端的延拓部分加漢寧窗讓延拓部分趨于0,這樣擬合出的包絡(luò)線會(huì)收斂端點(diǎn)處而不再發(fā)散,兩種窗函數(shù)如式(15)和式(16)所示。
對(duì)原始信號(hào)建立GM(1,1)灰色動(dòng)態(tài)預(yù)測模型,在原始信號(hào)兩端延拓出兩個(gè)以上極值點(diǎn),再對(duì)延拓的信號(hào)加漢寧窗,對(duì)延拓的左端信號(hào)和窗函數(shù)的左上升沿做內(nèi)積,右端信號(hào)和窗函數(shù)的右下降沿做內(nèi)積,加窗后兩端處值趨于零從而能擬合出更加平滑的包絡(luò)線,對(duì)中部的原始信號(hào)部分和矩形窗在做內(nèi)積,不改變?cè)夹盘?hào)特征,最后對(duì)處理后的數(shù)據(jù)進(jìn)行EMD 分解,在分解后的IMF 分量中去舍棄掉延拓部分,剩下部分則是所求的真正IMF 分量。
分解處理后需對(duì)端點(diǎn)效應(yīng)的抑制效果進(jìn)行評(píng)價(jià)以此來證明本算法的有效性,本節(jié)使用均方根誤差發(fā)和相似系數(shù)法兩個(gè)指標(biāo)來對(duì)分解效果進(jìn)行量化分析。均方根誤差法通過比較得到的各IMF 分量和原始信號(hào)對(duì)應(yīng)組成分量之間的均方根誤差[15]進(jìn)行判斷,均方根誤差值越小,則說明IMF 在端點(diǎn)處的發(fā)散程度就越小,分解的效果就越好,均方根誤差計(jì)算公式如下:
相似系數(shù)用于比較分解后各IMF 分量和原始信號(hào)對(duì)應(yīng)組成分量之間的相似程度,相似度越高,表示分解的效果越好,相似系數(shù)計(jì)算公式如下:
圖1 對(duì)合成信號(hào)直接進(jìn)行EMD 分解
所示,在分解結(jié)果的端點(diǎn)出現(xiàn)了發(fā)散現(xiàn)象存在明顯的端點(diǎn)效應(yīng),并且隨著分解的進(jìn)行還出現(xiàn)了虛假分量IMF3,本文改進(jìn)方法處理y(t)后如圖2 所示,EMD分解結(jié)果如圖3 所示,相較于直接進(jìn)行EMD 的處理結(jié)果可以發(fā)現(xiàn)IMF 分量的端點(diǎn)效應(yīng)得到有效抑制,而且虛假分量IMF3 也消失了。
圖2 本文算法處理后的合成信號(hào)
圖3 本文方法處理后的信號(hào)進(jìn)行EMD 分解
分別將幾種不同算法處理后得到的IMF1 和IMF2 與組成分量作比較(如圖4a、圖4b)。通過對(duì)比圖可以看出經(jīng)端點(diǎn)處理后得到的IMF 分量和未經(jīng)處理得到的IMF 分量相比更接近原始信號(hào)分量,其中紅色波形曲線和其它方法的波形曲線相比,和信號(hào)分量更加貼近。為了對(duì)比這幾種方法對(duì)信號(hào)處理效果,分別采用相似系數(shù)法和均方根誤差法量化評(píng)價(jià)分解結(jié)果,使用均方根誤差法分別對(duì)IMF1 和x1(t)、 IMF2 和x2(t)求均方根誤差以及計(jì)算IMF 分量和信號(hào)組成分量之間的相似系數(shù)。結(jié)果如表1 所示,結(jié)果也說明本文改進(jìn)算法對(duì)EMD 過程中的端點(diǎn)效應(yīng)有相對(duì)更好的抑制效果。
表1 IMF 分量與原始信號(hào)的均方根誤差和相似系數(shù)
圖4 各種算法處理后IMF1 和IMF2 的局部放大圖
本文采用美國西儲(chǔ)大學(xué)的故障軸承振動(dòng)加速度信號(hào)作為處理對(duì)象,數(shù)據(jù)由加速度傳感器對(duì)驅(qū)動(dòng)端的軸承SKF6025 進(jìn)行采集,采樣頻率為12 KHz,由于數(shù)據(jù)量較大,使用的采樣點(diǎn)數(shù)量為800 個(gè)。圖5 所示直接進(jìn)行EMD,圖6 和圖7 所示為采用本文改進(jìn)方法,先在信號(hào)兩端進(jìn)行預(yù)測延拓和加窗處理后再進(jìn)行EMD,處理后的所得IMF 分量的發(fā)散現(xiàn)象得到有效抑制,起到了抑制端點(diǎn)效應(yīng)的目的。
圖5 振動(dòng)信號(hào)直接進(jìn)行EMD 分解的結(jié)果
圖6 本文方法處理后的振動(dòng)信號(hào)
圖7 本文方法處理后進(jìn)行EMD 分解的結(jié)果
1) 本文提出一種基于灰色預(yù)測模型和加窗函數(shù)相結(jié)合的改進(jìn)處理方法,對(duì)原始信號(hào)加矩形窗保持信號(hào)不變,對(duì)兩端延拓信號(hào)加漢寧窗抑制兩端波形突變,使擬合的包絡(luò)線能完全包絡(luò)信號(hào)。
2) 文末通過信號(hào)分析對(duì)比改進(jìn)方法處理前后端點(diǎn)的發(fā)散情況,以及使用均方根誤差法量化評(píng)價(jià)相似性,發(fā)現(xiàn)該方法明顯優(yōu)于一般地EMD 分解,可以有效地抑制端點(diǎn)效應(yīng)導(dǎo)致的失真問題。
3) 然而灰色預(yù)測模型在處理復(fù)雜信號(hào)時(shí)存在預(yù)測精度不夠,對(duì)隨機(jī)震蕩序列預(yù)測效果不好等問題,還需要不斷地優(yōu)化和完善。