趙晨熙
(1.頁巖油氣富集機(jī)理與有效開發(fā)國家重點(diǎn)實(shí)驗(yàn)室,北京 100101;2.中國石化石油工程技術(shù)研究院,北京 100101)
在科學(xué)研究和實(shí)際工業(yè)生產(chǎn)過程中,掌握設(shè)備的運(yùn)行和服役狀態(tài)是保障設(shè)備運(yùn)行安全的重要手段。設(shè)備狀態(tài)信號的獲取往往需要經(jīng)采集、轉(zhuǎn)換和傳輸?shù)冗^程,在這個(gè)過程中往往會(huì)受到傳感器、設(shè)備、環(huán)境等因素的影響,導(dǎo)致獲取的設(shè)備狀態(tài)信號中不可避免地包含了大量的噪聲信號,甚至真實(shí)信號完全湮沒在噪聲信號中,因此如何對獲得信號進(jìn)行降噪,就成為真實(shí)掌握設(shè)備運(yùn)行和服役狀態(tài)的關(guān)鍵科學(xué)和技術(shù)問題之一[1-2]。
近年來,信號降噪的研究獲得了世界范圍內(nèi)的廣泛關(guān)注,國內(nèi)外的專家學(xué)者提出了不同的信號降噪算法,并且在實(shí)際工程應(yīng)用中取得了一定的效果。其中比較典型的方法包括局部投影降噪、小波降噪、相空間重構(gòu)、形態(tài)學(xué)方法。文獻(xiàn)[3]研究了相空間重構(gòu)的降噪算法,將振動(dòng)信號的吸引子在相空間重構(gòu),然后利用奇異值分解法對重構(gòu)后的吸引子進(jìn)行計(jì)算,并利用奇異譜特性來提高信號的信噪比。文獻(xiàn)[4]研究了加權(quán)相空間的降噪方法,將一維時(shí)間序列延拓到高維相空間,可以獲得信號在高維相空間的吸引子,從而實(shí)現(xiàn)對振動(dòng)信號降噪。文獻(xiàn)[5]研究了基于相空間重構(gòu)的局部投影降噪算法,并且進(jìn)一步提出了鄰域自適應(yīng)選取的局部投影非線性降噪方法[6]。文獻(xiàn)[7]研究了柔性形態(tài)濾波及形態(tài)濾波方法,并應(yīng)用于軸承故障診斷。文獻(xiàn)[8]對小波降噪開展了大量的研究工作,并在機(jī)械設(shè)備狀態(tài)監(jiān)測和故障診斷領(lǐng)域得到應(yīng)用。此外,還有很多高校、科研院所的專家學(xué)者對信號降噪方法進(jìn)行了大量研究。
相空間重構(gòu)法是典型的降噪算法,以局部投影和奇異譜為代表,這些算法不需預(yù)知混沌動(dòng)力學(xué)方程,但矩陣運(yùn)算的計(jì)算量大。相空間重構(gòu)算法包含的二個(gè)重要參數(shù)是嵌入維數(shù)和時(shí)間延遲,這兩個(gè)參數(shù)僅僅只是理論上證明了其存在性,尚未給出具體的表達(dá)式,而且在噪聲的干擾下,參數(shù)不僅計(jì)算困難而且難以選取,導(dǎo)致算法的應(yīng)用受到極大的限制。小波降噪算法作為應(yīng)用范圍較廣的傳統(tǒng)降噪方法,對于信號的局部特征具有較強(qiáng)的探測能力,但同樣面臨參數(shù)選取難的問題,影響了降噪效果。數(shù)學(xué)形態(tài)學(xué)降噪方法需要選取合適的結(jié)構(gòu)元素類型和長度,并且對沖擊信號降噪更為敏感,在實(shí)際應(yīng)用中具有一定的局限性。
因此,提出了一種基于拉普拉斯譜圖理論的隨機(jī)游走信號降噪方法,避免了現(xiàn)有算法參數(shù)多、閾值選難、要很強(qiáng)的前提假設(shè)或者大量的先驗(yàn)知識(shí)等問題。仿真試驗(yàn)表明,在相同的試驗(yàn)條件下,提出的降噪算法與小波降噪、自適應(yīng)降噪和奇異譜降噪算法相比,能夠獲得更好的信噪比,具有更強(qiáng)的降噪效果。
譜圖理論[9]是微分幾何領(lǐng)域的一個(gè)分支理論,在高維數(shù)據(jù)降維以及聚類等領(lǐng)域得到了廣泛的應(yīng)用。譜圖理論主要涉及圖的鄰接矩陣譜和圖的Laplacian矩陣譜,通過鄰接矩陣和Laplacian矩陣的表示方法,計(jì)算矩陣的特征值和特征向量,依據(jù)一定的規(guī)則選擇特征向量,實(shí)現(xiàn)數(shù)據(jù)的低維嵌入。
任意特定空間的點(diǎn)集都可以用無向圖G來表示,假設(shè)其中V表示頂點(diǎn)集合,E表示邊的集合,則G=(V,E)。假設(shè)數(shù)據(jù)的樣本集為X,在數(shù)據(jù)點(diǎn)和圖的頂點(diǎn)之間建立一一對應(yīng)關(guān)系,在這里定義成對數(shù)據(jù)點(diǎn)的相似度為圖中的邊,根據(jù)數(shù)據(jù)點(diǎn)建立與之對應(yīng)的圖。
隨機(jī)游走(Random Walk)是隨機(jī)過程的重要組成部分,給定出發(fā)點(diǎn)和圖,隨機(jī)地選擇鄰居節(jié)點(diǎn),并且移動(dòng)到鄰居節(jié)點(diǎn)上,其特點(diǎn)是隨機(jī)游走是一種不規(guī)則的變動(dòng)形式,而且每一步都是隨機(jī)的。然后把當(dāng)前的鄰居結(jié)點(diǎn)作為出發(fā)點(diǎn),不斷地重復(fù)上述過程,被隨機(jī)選出的結(jié)點(diǎn)構(gòu)成了一個(gè)在圖上的隨機(jī)游走過程[10]。在給出圖上的隨機(jī)游走的定義前,需要給出如下的符號和說明。
(1)頂點(diǎn)度對角陣
(2)圖G的容量(Volume)
由于這里的隨機(jī)游走方法建立在圖上,所以,首先定義一個(gè)圖 G=(V,E):
(1)V={v1,v2,…,vn}表示頂點(diǎn)集,其元素 vi表示第 i個(gè)頂點(diǎn),n為頂點(diǎn)數(shù);
(2)E={e1,e2,…,en}表示邊集,元素ek=(vi,vj)為表示連接頂點(diǎn) vi和 vj的邊,且 E?V×V。
在譜圖理論中包括鄰接矩陣和Laplacian矩陣,選擇鄰接矩陣來描述。
鄰接矩陣:設(shè) G 的頂點(diǎn)集 V(G)={v1,v2,…,vp},令:
由元素Wij(i,j=1,2,…,p)構(gòu)成的p階矩陣為圖G的鄰接矩陣(adjacent matrix),記作 W(G)。
圖上頂點(diǎn)的度數(shù)表示為D(vi):
因此,可以定義圖上的隨機(jī)游走:將圖上的頂點(diǎn)vi作為隨機(jī)粒子,并從該點(diǎn)出發(fā),以正比于這兩點(diǎn)之間邊的權(quán)重概率,從這一點(diǎn)轉(zhuǎn)移到它的領(lǐng)域點(diǎn)vj。定義其轉(zhuǎn)移概率如下:
即:P=D-1W
在圖G上引入離散的拉普拉斯算子Δ如下:
即:Δ=I-D-1W=I-P
此時(shí),我們可以定義圖上的微分方程如下:
式中:λ—λ>0的常數(shù)。
利用隱式歐拉公式(Implicit Euler-Scheme)對微分方程(5)進(jìn)行求解:
采用k近鄰的方法構(gòu)建鄰接圖(Weighed k-NN Graph),同時(shí)為了保證鄰接矩陣具有更好正定性,采用熱核函數(shù)進(jìn)行計(jì)算,構(gòu)造如下:
式中:h(Xi)—k-NN 距離。
基于拉普拉斯譜圖上的隨機(jī)游走算法的步驟,如表1所示。
表1 算法步驟Tab.1 Steps of Algorithm
具體的流程圖,如圖1所示。
圖1 算法流程圖Fig.1 Flowchart of Algorithm
采用sinc函數(shù)和方波函數(shù)進(jìn)行方法有效性驗(yàn)證,sinc函數(shù)y=sinx/x+N(0,σ2),x∈[-10,10],在 x的范圍內(nèi)分別取 500 個(gè)點(diǎn)作為訓(xùn)練樣本,噪聲方差分別為σ2=0.2和σ2=0.4(高斯白噪聲);方波為周期T=1.5,幅值為2的函數(shù),噪聲方差為σ2=0.4,對該兩組函數(shù)進(jìn)行實(shí)驗(yàn),并與小波降噪、自適應(yīng)濾波降噪(LMS)、奇異譜降噪(SVD)等方法進(jìn)行對比。
首先對sinc函數(shù)進(jìn)行降噪實(shí)驗(yàn),如圖2~圖9所示。其中,t—隨機(jī)游走步數(shù)。利用信噪比衡量數(shù)據(jù)降噪后的效果,即SNR(Signal to Noise Ratio),單位為:db(分貝)。
圖2 噪聲δ2=0.2的sinc函數(shù)隨機(jī)游走降噪結(jié)果Fig.2 Denoise Result of Random Walk of Sinc δ2=0.2
圖3 噪聲δ2=0.4的sinc函數(shù)隨機(jī)游走降噪結(jié)果Fig.3 Denoise Result of Random Walk of Sinc δ2=0.4
圖4 噪聲δ2=0.2的sinc函數(shù)小波降噪結(jié)果Fig.4 Denoise result of Wavelet Analysis of Sinc δ2=0.2
圖5 噪聲δ2=0.4的sinc函數(shù)小波降噪結(jié)果Fig.5 Denoise result of Wavelet Analysis of Sinc δ2=0.4
圖6 噪聲δ2=0.2的sinc函數(shù)LMS降噪結(jié)果Fig.6 Denoise Result of LMS of Sinc δ2=0.2
圖7 噪聲δ2=0.4的sinc函數(shù)LMS降噪結(jié)果Fig.7 Denoise Result of LMS of Sinc δ2=0.4
圖8 噪聲δ2=0.2的sinc函數(shù)奇異譜降噪結(jié)果Fig.8 Denoise Result of Singular Spectrum of Sinc δ2=0.2
圖9 噪聲δ2=0.4的sinc函數(shù)奇異譜降噪結(jié)果Fig.9 Denoise Result of Singular Spectrum of Sinc δ2=0.4
對方波函數(shù)進(jìn)行降噪實(shí)驗(yàn)(圖略)。其中,t為隨機(jī)游走步數(shù)。利用信噪比衡量數(shù)據(jù)降噪后的效果,即SNR(SignaltoNoiseRatio),單位為:db(分貝)。具體的比較結(jié)果,如表2所示。
表2 算法比較結(jié)果Tab.2 Compare Result of Algorithm
從實(shí)驗(yàn)結(jié)果可知,基于圖上的隨機(jī)游走降噪方法普遍優(yōu)于其他方法,而且隨著游走步數(shù)的增加,降噪效果逐漸增大。小波算法在進(jìn)行信號降噪時(shí),需要專家經(jīng)驗(yàn)或窮舉試湊的方法找到合適的分解層數(shù)和閾值,特別是閾值的選取對信號的降噪效果影響較大,不同的信號類型,需要采用不同的閾值選取方法;LMS算法是基于最小均方誤差準(zhǔn)則和最陡下降法,其步長因子、濾波的階數(shù)、特征權(quán)矢量初始值等對降噪效果有直接影響,特別是濾波的階數(shù),在信號濾波之前,LMS算法的階數(shù)是未知的,若給定的階數(shù)小于真實(shí)的階數(shù),對LMS的估計(jì)會(huì)帶來很大的誤差,若高于真實(shí)的階數(shù),則會(huì)導(dǎo)致訓(xùn)練時(shí)間太長,甚至無法收斂;奇異譜降噪首先將信號進(jìn)行相空間重構(gòu),然后對重構(gòu)后的信號進(jìn)行SVD分解,保留分解后對角陣的前k個(gè)奇異值,該方法的關(guān)鍵是確定對角陣的有效k個(gè)奇異值,常用的方法是包括試湊法或閾值法,都依賴于經(jīng)驗(yàn),大大影響降噪效果。基于拉普拉斯譜圖理論的隨機(jī)游走方法,把在高維空間中呈現(xiàn)高度復(fù)雜的數(shù)據(jù)集,在低維空間中恢復(fù)其內(nèi)在結(jié)構(gòu),挖掘數(shù)據(jù)集的本質(zhì)規(guī)律。將一維的信號數(shù)據(jù)構(gòu)建連接圖,根據(jù)連接圖計(jì)算出拉普拉斯譜圖,在譜圖利用隨機(jī)游走方法對原始信號降噪處理,更好的還原出真實(shí)的信號,實(shí)驗(yàn)結(jié)果充分說明了這里方法的有效性。但是,這里算法也存在一個(gè)缺陷,就是隨機(jī)游走的步數(shù)難以確定,需要通過實(shí)驗(yàn)獲得,通過上面3組實(shí)驗(yàn)可知,降噪效果隨著游走的步數(shù)增加而增大,步數(shù)達(dá)到50時(shí),算法基本趨于穩(wěn)定。
提出一種基于拉普拉斯譜圖理論的隨機(jī)游走信號降噪方法,通過將基于拉普拉斯譜圖的流行學(xué)習(xí)方法和隨機(jī)游走方法相結(jié)合,能給提取出了信號中的本質(zhì)信息,較好的去除了干擾噪聲,通過和小波降噪、LMS和SVD算法比較,這里方法具有更高的信噪比,從理論和實(shí)驗(yàn)上均證明了這里方法的有效性和優(yōu)越性。