范津瑋 劉曉波
(貴州大學電氣工程學院,貴州 貴陽 550000)
EMD 方法是由美國的NASA 的Huang 等人所提出, 由于該方法具有良好的時頻特性和自適應性,被許多專家學者廣泛應用于各個方面。 例如,在結構分析領域應用到橋梁監(jiān)測和模態(tài)響應分析,在自然科學領域應用于海洋、大氣、天體等的觀測和地球物理分析,在生物學領域應用于心率變換和肺部血壓信號分析,在故障診斷領域應用于旋轉(zhuǎn)機械信號分析[1]和電力系統(tǒng)暫態(tài)故障信號分析[2]。
由于EMD 分解的終止條件、 插值誤差和端點效應等影響,常常會出現(xiàn)分解過度的現(xiàn)象。 這會導致分解得到的IMF 分量個數(shù)大于原有信號的組成個數(shù),而多余的IMF 分量便是虛假分量。這些分量與原信號相關性較小,不能準確反映原信號的特征,所以需要準確識別出虛假分量。
EMD 分解是一種新的自適應處理非平穩(wěn)信號分析方法,適用于處理非線性、非平穩(wěn)性的時間序列數(shù)據(jù)。 某信號使用經(jīng)驗模態(tài)分解(EMD)對其進行分解后可以得到不同時間尺度的IMF 分量。 EMD 的基本公式為:
其中,x(t)為原始數(shù)據(jù)信號,IMFi為第 i 個 IMF 分量,res 為不能再分解的剩余分量。
下面以某一信號x(t)為例說明EMD 分解過程中產(chǎn)生的虛假分量問題。
其中,采樣頻率 1 000 Hz,采樣點數(shù) 1 000 點。 其波形圖如圖1 所示。對該信號進行EMD 分解,結果如圖2 所示。 進一步求各階IMF 的傅里葉頻譜圖,結果如圖3 所示。
圖1 仿真信號波形圖
圖2 EMD 的分解結果圖
圖3 各IMF 分量的傅里葉頻譜圖
從圖3 可以看出, 第一個IMF 與第二個IMF 的頻率成分與原始信號的兩個頻率成分50 Hz 和10 Hz是相符合的。第三個、第四個IMF 與剩余分量res 的頻率分量在原信號中都沒有出現(xiàn), 故由此可推斷出,除前兩個IMF 外其他均為虛假分量。
目前, 虛假分量的消除方法有相關系數(shù)法、K-S檢驗法。 下面介紹這兩種方法的優(yōu)缺點。
相關系數(shù)法是通過計算各IMF 分量與原信號之間的相關系數(shù)。 若兩者之間相關系數(shù)較大則判定為是有效的IMF 分量,若兩者之間相關系數(shù)較小,則判定為虛假分量。 但文獻[3]通過使用相關系數(shù)法對虛假分量的識別過程中發(fā)現(xiàn)兩個問題:(1)只有第一個IMF 分量的相關系數(shù)很大,其他分量的相關系數(shù)很?。唬?)通過人為設定閾值大小來界定IMF 分量是否為虛假分量,存在將真實分量誤判為虛假分量的可能。
K-S 檢驗法的全稱為Kolmogorov-Smirnov 擬合優(yōu)度檢驗法。 該方法通過計算各IMF 分量與原信號的累積分布函數(shù)之間的差異。若某一IMF 分量與原信號直接的相似概率接近1,則認為該IMF 分量有效,若相似概率接近0,則認為該IMF 分量為虛假分量。 但文獻[4]指出該方法所需方差比率較大,因此適用性較低。
本文所提的能量比值法是通過比較某一IMF 分量的能量與所有IMF 的能量之和的比值來對虛假分量進行判別。
由于終止條件和插值誤差等因素的影響,會造成EMD 在分解過程中,無法完全一模一樣地分解出組成原信號的各分量,這會導致在整個數(shù)據(jù)序列的某些個點上會產(chǎn)生一定微小誤差。 從公式(2)可知第一個IMF 分量應始終為幅值1 的正弦函數(shù),但在實際分解得到的圖2 中第一個IMF 分量的某些波峰處幅值不為1,由于誤差很小所以肉眼難以從圖中直接看出。
由于端點效應問題的存在,故會采用一些方法去抑制端點效應,但是再好的方法也不能完全消除端點處因缺少極值點而導致的包絡線擬合不符合信號內(nèi)生規(guī)律帶來的影響,這會使得分解出來的IMF 分量在端點處的數(shù)值產(chǎn)生一定的誤差。 從圖2 中第一和第二個IMF 分量的左右兩端均可以看出,兩端局部的數(shù)據(jù)點的數(shù)值與公式(2)中幅值為1 和0.5 的正弦函數(shù)數(shù)值有一定誤差。
EMD 分解的終止條件、插值誤差和端點效應處理方法等問題共同導致了虛假分量的產(chǎn)生,但這些誤差要么很微小要么也只是在端點處產(chǎn)生。 從圖2 中第三個IMF 分量可以看出虛假分量在兩端的數(shù)據(jù)點上存在一定的數(shù)值且數(shù)值會小于有效分量的幅值,中間的數(shù)據(jù)點的數(shù)值均圍繞在0 左右。 所以虛假分量的能量比起有效分量的能量小得多, 數(shù)量級至少相差二,對比明顯,不會造成誤判。
能量是信號的特征常量,假設有限長信號序列x(t),信號的能量特征可以用能量密度來表示它表示在t 時刻每單位時間內(nèi)信號的能量強度。 信號總能量定義為:
其中,x(n)為信號的離散形式,能量定義為各數(shù)值點幅值的平方和。第i 個IMF 分量的能量與所有IMF 分量能量之和的比值定義為公式(4),n 為IMF 的個數(shù)。
為了檢驗能量比值法的可行性,以信號y(t)為例,采樣頻率10 000 Hz,采樣點數(shù)5 000 個點。
y(t)=0.6cos(640×π×t)+cos(320×π×t)+0.5sin(80×π×t) (5)
對公式(5)的信號進行EMD 分解,結果如圖4所示。
采用能量比值法對圖4 中的各IMF 分量分別進行計算,結果列于表1 中。
圖4 信號的EMD 分解圖
表1 各IMF 分量的能量比值表
從表1 中可以得到,前三個有效分量的能量比值均較大,其余虛假分量的能量比值較小,他們之間相差兩個數(shù)量級,有的甚至高達三個數(shù)量級,能量對比明顯,可對虛假分量進行準確識別。
首先本文對EMD 方法及其虛假分量問題進行了詳細的分析,并指出了現(xiàn)有處理方法的優(yōu)缺點。接著由于虛假分量主要是因為停止準則、 插值誤差和端點效應的問題而產(chǎn)生,故虛假分量的幅值和頻率較低,能量較小。 最后根據(jù)分析結果提出能量比值法,并進行數(shù)值仿真驗證, 仿真結果表明該方法具有可行性。