趙立權(quán),齊厚穎
(東北電力大學(xué)信息工程學(xué)院,吉林吉林132012)
盲源分離(Blind Source Separation,BSS)是指在信源信號(hào)和信道參數(shù)都未知的條件下,從觀測到的混合信號(hào)中估計(jì)出信源信號(hào),被廣泛用于多種信號(hào)處理和分析領(lǐng)域。目前的研究仍然主要集中于線性瞬時(shí)混合信號(hào)的盲源分離問題,但在許多的實(shí)際系統(tǒng)中,非線性混合模型更為常見。為此,近年來許多學(xué)者提出了非線性盲源分離問題。非線性盲源分離是一種針對(duì)非線性混合信號(hào)的盲源分離方法,已經(jīng)被廣泛應(yīng)用于醫(yī)學(xué)信號(hào)處理、通信信號(hào)處理、圖像處理及故障診斷等方面[1-4]。目前具有代表性的非線性盲源分離方法主要有以下幾類:一是基于互信息最小化的非線性盲源分離方法[5-7],采用互信息作為衡量相互獨(dú)立性的標(biāo)準(zhǔn),互信息越小,分離效果越好;二是基于貝葉斯的非線性盲源分離方法[8-9],成功利用貝葉斯網(wǎng)絡(luò)理論處理非線性混合模型中各個(gè)變量和參數(shù)間的關(guān)系;三是基于參考信號(hào)的非線性盲源分離方法[10-11],是一種運(yùn)用信源信號(hào)的先驗(yàn)信息作為參考信號(hào)的分析方法以及基于線性盲源分離的非線性盲源分離方法,該方法是通過對(duì)觀測數(shù)據(jù)進(jìn)行高維映射,將非線性問題轉(zhuǎn)化成線性問題[12-13]。
維納系統(tǒng)被應(yīng)用于信號(hào)處理、生物、金融、社會(huì)以及心理分析等多方面,針對(duì)盲源分離問題,研究學(xué)者提出了基于非線性盲源分離的維納系統(tǒng)BSS方法[14-15],該方法采用基于互信息最小化的非線性盲源分離方法對(duì)維納系統(tǒng)中的信號(hào)進(jìn)行盲源分離。為了克服固定步長非線性盲源分離算法收斂性能差的問題,本文提出基于變步長和馬爾可夫原理的后置非線性盲源分離算法,提高維納系統(tǒng)BSS的性能。
假設(shè)n個(gè)相互獨(dú)立的未知源信號(hào)s(t)=[s1(t),s2(t),…,sn(t)]T,首先經(jīng)過未知的線性混合矩陣 A(n×n維),得到線性混合信號(hào) x(t)=[x1(t),x2(t),…,xn(t)]T=As(t),再將 x(t)分別通過一個(gè)非線性混合系統(tǒng) f=[f1,f2,…,fn]T,得到觀測信號(hào)e(t):
盲源分離中的解混和混合是一個(gè)互逆的過程。此非線性混合系統(tǒng)的解混由兩部分組成:第一部分是對(duì)非線性混合函數(shù)f的求逆,即它是一個(gè)非線性反變換函數(shù) g=[g1,g2,…,gn]T,用來補(bǔ)償混合過程中的非線性失真;第二部分為線性解混矩陣B,用來補(bǔ)償混合過程中的線性失真。系統(tǒng)的輸出信號(hào)y(t)可以定義為
式中,g(·)=f-1(·),B= ΛMA-1,Λ 為對(duì)角矩陣,M為置換矩陣,則非線性解混系統(tǒng)為
后置非線性BSS混合-分離如圖1所示。
圖1 后置非線性BSS混合-分離結(jié)構(gòu)框圖Fig.1 Mixing and separating structure diagram of post nonlinear blind source separation
非線性盲源分離算法的關(guān)鍵是根據(jù)分離信號(hào)y的相互統(tǒng)計(jì)獨(dú)立性來對(duì)非線性函數(shù)f和矩陣A求逆。
基于后置非線性BSS的維納系統(tǒng)將后置非線性BSS的線性混合矩陣A用一個(gè)線性濾波器來代替,其信號(hào)混合和分離數(shù)學(xué)模型如圖2所示[14-15],s(t)是信源信號(hào),h()是未知可逆濾波器,f()是未知的可逆無記憶非線性函數(shù),e(t)是觀測信號(hào),g()是解混非線性函數(shù),B是解混矩陣,y(t)是對(duì)s(t)的估計(jì)。
則維納系統(tǒng)的輸出e(t)為
馬爾可夫過程是一典型的隨機(jī)過程,設(shè)x(t)是一個(gè)隨機(jī)過程,當(dāng)過程在時(shí)刻t0所處的狀態(tài)為已知時(shí),時(shí)刻t(t>t0)所處的狀態(tài)與過程在t0時(shí)刻之前的狀態(tài)無關(guān),這個(gè)無后效性的隨機(jī)過程稱為馬爾可夫過程。由于后置非線性混合過程中觀測信號(hào)e(t)是一個(gè)瞬時(shí)的混合過程,因此也滿足馬爾可夫過程。本文以最小化互信息作為衡量相互獨(dú)立的標(biāo)準(zhǔn),它被定義為
對(duì)于q階馬爾可夫模型,條件互信息I可以表示為
式中,E(·)表示均值。因?yàn)楦怕拭芏葷M足
式中,gi'(θi,ei(t))是解混系統(tǒng)中非線性反變換函數(shù)對(duì)ei(t)的求導(dǎo),θi是非線性函數(shù)gi的調(diào)節(jié)變量,所以推得[15]
式中,E{lgpe[e(t)|e(t-1),e(t-2),…,e(tq)]}不依賴于矩陣B及非線性函數(shù)g的參數(shù),所以被省略。目標(biāo)函數(shù)變?yōu)?/p>
盲源分離算法的相互統(tǒng)計(jì)獨(dú)立性判據(jù)是互信息量傳輸最小化原則,所以通過對(duì)參數(shù)B和θ的調(diào)整,使輸出的信號(hào)互信息盡可能小,進(jìn)而達(dá)到最佳的分離效果。采用梯度下降方法對(duì)參數(shù)進(jìn)行優(yōu)化時(shí),算法的性能受步長參數(shù)影響較大,大的步長收斂速度比較快,但最小均方誤差較大;相反,小的步長收斂速度比較慢,但最小均方誤差較小。為了提高算法的收斂性能,本文提出采用基于非線性函數(shù)的變步長方法對(duì)代價(jià)函數(shù)進(jìn)行優(yōu)化[16],代價(jià)函數(shù)梯度較大時(shí)使其步長也較大,加快收斂速度;梯度較小時(shí),誤差較小接近收斂點(diǎn),因此使其步長較小,避免收斂振蕩,同時(shí)也能夠減小收斂誤差。采用變步長方法對(duì)參數(shù)B進(jìn)行更新,其公式為
式中,
κB(t)如果選取得太大,對(duì)分離算法的穩(wěn)定性會(huì)造成很大的影響,根據(jù)自適應(yīng)信號(hào)處理中算法的收斂因子應(yīng)小于輸入信號(hào)的最大特征值導(dǎo)數(shù)的原則,這里取誤差陣列第一次迭代時(shí)同行元素的絕對(duì)值最大元素近似輸入信號(hào)的特征值,κB(t)的最大值近似為1/2max(|E[ψu(yù)T]+BT(t)-1|)。同理,采用變步長優(yōu)化方法對(duì)參數(shù)θ進(jìn)行優(yōu)化可得
式中,
為了驗(yàn)證本文算法的有效性,選取一個(gè)隨機(jī)信號(hào)作為源信號(hào),其波形如圖3所示。源信號(hào)先后經(jīng)過一個(gè)濾波器(H(z)=1-0.8z-1)得到一個(gè)延時(shí)信號(hào),延時(shí)信號(hào)和原始信號(hào)作為兩個(gè)信源信號(hào),經(jīng)過一個(gè)非線性系統(tǒng)(f(x)=x3)后得到兩個(gè)觀測信號(hào),其中非延時(shí)觀測信號(hào)如圖4所示,β=0.05,α=3。
圖3 源信號(hào)的波形圖Fig.3 Waveform of source signal
圖4 觀測信號(hào)的波形圖Fig.4 Waveform of mixied signal
本文通過變步長算法分離出的信號(hào)波形如圖5所示。對(duì)比圖5與圖3的波形圖可以看出:兩信號(hào)波形基本一致,說明了該算法很好地分離出了源信號(hào)。
圖5 分離出的信號(hào)波形圖Fig.5 Waveform of separated signal
為定量地驗(yàn)證所提算法的性能,用最小均方誤差(Minimum Mean Square Error,MMSE)評(píng)價(jià)分離效果,其值越接近于零,說明算法的分離性能越好。圖6是基于非線性函數(shù)的變步長算法與文獻(xiàn)[15]采用的固定步長算法的MMSE比較圖,圖中結(jié)果是兩種算法運(yùn)行50次得到的平均誤差。
圖6 最小均方誤差性能對(duì)比圖Fig.6 Performance comparison of minimum mean squared error
由圖6可知,固定步長算法分離出源信號(hào)需要更新199次左右,而變步長算法只需130次左右,收斂速度明顯加快,收斂速度提高了53%。采用固定步長算法收斂時(shí)的最小均方誤差為1.331 3,而變步長算法的最小均方誤差為0.733 5,可見誤差性能有很大的改善,誤差減少了45%。變步長算法與固定步長算法相比,分離效果有了明顯的改善。
維納系統(tǒng)盲源分離算法采用固定點(diǎn)梯度方法對(duì)代價(jià)函數(shù)中的參數(shù)進(jìn)行優(yōu)化,導(dǎo)致收斂速度和穩(wěn)態(tài)誤差矛盾增加。為了解決該問題,提出采用梯度絕對(duì)值為變量的非線性變步長方法對(duì)非線性盲源分離中的參數(shù)進(jìn)行優(yōu)化,步長與梯度絕對(duì)值的平方成正比,在收斂初期加快了收斂速度,收斂后期減慢收斂速度,避免了振蕩誤差。相對(duì)原算法,該方法總體誤差更小,收斂速度更快。對(duì)于變步長的最大值范圍本文僅給出近似值,還缺少理論推導(dǎo),今后可對(duì)此進(jìn)行深入研究。
[1]任東曉,葉茂,殷英.基于互信息最小的非線性混合胎兒心電信號(hào)提取方法[J].電子測量與儀器學(xué)報(bào),2010,24(7):680 -685.REN Dongxiao,YE Mao,YIN Ying.FECG extraction from nonlinear mixture based on minimization of mutual information[J].Journal of electronic measurement and instrument,2010,24(7):680 -685.(in Chinese)
[2]Diamantaras K,Papadimitriou T,Vranou G.Blind separation of multiple binary sources from one nonlinear mixture[C]//Proceedings of 2011 IEEE International Conference on Acoustics,Speech and Signal Processing.Prague:IEEE,2011:2108 -2111.
[3]Almeida M,Almeida L.Nonlinear separation of show through image mixtures using a physical model trained with ICA[J].Signal Processing,2012,29(4):872 -884.
[4]王曉偉,石林鎖.自適應(yīng)非線性BSS及其在齒輪故障診斷中的應(yīng)用[J].振動(dòng)與沖擊,2012,31(10):45 -48.WANG Xiaowei,SHI Linsuo.Adaptive nonlinear blind source separation and its application in gear faults diagnosis[J].Journal of Vibration and Shock,2012,31(10):45-48.(in Chinese)
[5]Almeida L B.Linear and nonlinear ICA based on mutual information—the MISEP method[J].Signal Processing,2004,84(2):231 -245.
[6]Sun Z L.An extension of MISEP for post- nonlinearlinear mixture separation[J].IEEE Transactions on Circuits System,2009,56(8):654 -658.
[7]Duarte L T,Jutten C.A mutual information minimization approach for a class of nonlinear recurrent separating systems[C]//Proceedings of 2007 IEEE Workshop on Machine Learning for Signal Processing.Thessaloniki:IEEE,2007:122 -127.
[8]Chen Wei,Li C K,Wai L W,et al.Post- nonlinear underdetermined ICA by Bayesian statistics[C]//Proceedings of ICA 2006.Charleston,SC,USA:IEEE,2006:773 -780.
[9]Duarte L T,Jutten C,Moussaoui S.A Bayesian Nonlinear Source Separation Method for Smart Ion-Selective Electrode Arrays [J].Sensors Journal,2009,9(12):1763 -1771.
[10]Ren D X,Mao Y S.Extracting post- nonlinear signal with reference[J].Computers and Electrical Engineering,2011,37(6):1171 -1181.
[11]Ren D X,Mao Y S.Extracting post- nonlinear signal with specific kurtosis range[J].Applied Mathematics and Computation,2012,218(9):5726 -5738.
[12]Hameling S,Ziehe A,Kawanabe A.Kernel based nonlinear blind source separation[J].Neural Computation,2013(15):1089-1124.
[13]禹華鋼,高俊,黃高明.基于批處理和核函數(shù)的非線性盲源分離算法[J].電訊技術(shù),2011,51(10):35 -40.YU Huagang,GAO Jun,HUANG Gaoming.Nonlinear blind source separation algorithm based on batch and kernel function[J].Telecommunication Engineering,2011,51(10):35 -40.(in Chinese)
[14]SUN Zhangli,HUANG Deshuan,ZHENG Chunhou,et al.Blind inversion of wiener system for single source using nonlinear blind source separation[C]//Proceedings of 2005 IEEE International Joint Conference on Neural Networks.Killarney,Ireland:IEEE,2005:1235 -1238.
[15]Casals J S,Jutten C.Quasi- nonprarmetric blind inversion of wiener systems[J].IEEE Transactions on Signal Processing,2001,59(5):917 -924.
[16]高鷹,謝勝利.一種變步長LMS自適應(yīng)濾波算法及分析[J].電子學(xué)報(bào),2001,29(8):1094 -1097.GAO Ying,XIE Shengli.A variable step size LMS adaptive filtering algorithm and its analysis[J].ACTA Electronica Sinica,2001,29(8):1094 -1097.(in Chinese)