鐘麗莉,熊興中
(四川理工學院自動化與電子信息學院,四川自貢643000)
基于峭度的獨立分量算法的性能分析研究
鐘麗莉,熊興中
(四川理工學院自動化與電子信息學院,四川自貢643000)
獨立分量算法是一種應用非常廣泛的盲信號處理算法。而峭度作為一種重要的信號分析工具,可以有效地進行優(yōu)化分析。然而,對于各種不同類型的算法的對比分析目前還少有介紹,所以有必要對基于峭度的FastICA和RobustICA兩種獨立分量算法進行對比分析研究。理論分析及實驗結(jié)果表明,魯棒獨立分量法RobustICA在魯棒性、收斂性和復雜度方面整體優(yōu)于快速定點獨立分量法FastICA,從而為實際應用提供一定的參考價值。
峭度;快速定點獨立分量法;魯棒獨立分量法;魯棒性;收斂;復雜度
盲源分離(BSS)[1]是指在不知曉源信號和理論模型的情況下,從混迭信號即觀測信號中恢復出各源信號的過程。獨立分量分析(ICA)[2-3]基于源信號間的統(tǒng)計獨立性,目的是將觀察到的隨機向量分離成統(tǒng)計獨立變量。在眾多應用中,當假設(shè)源信號獨立時,ICA是盲源分離瞬時線性混合信號最自然的工具。相對于經(jīng)典分離技術(shù),比如基于二階統(tǒng)計量的主成分分析(PCA),基于高階統(tǒng)計量的ICA可以處理即使不是由正交列組成的一般混合結(jié)構(gòu)。
1997年,芬蘭學者Aapo Hyv?rìnen等人提出基于峭度的快速定點算法FastICA[4],由于其無須設(shè)置參數(shù),算法簡單,收斂速度快,分離效果好,是ICA最常用的方法。但FastICA也存在不少缺陷,比如不能有目的性地提取想要的信號、弱信號提取不理想、串行分離易傳遞誤差、存在偽局部極值和鞍點。2004年,Zarzoso A和Comon P等人改進了FastICA的缺陷,提出了一種魯棒性更好的依然基于峭度的RobustICA[5],理論分析及大量仿真實驗表明,該算法在實值和復值源信號的情況下,綜合性能表現(xiàn)都優(yōu)于FastICA。
以往的文獻提出了許多ICA的對比函數(shù),大都基于信息理論的原則,可以分為基于最大似然、基于相互信息、基于邊際熵、基于負熵以及基于相關(guān)非高斯等方面。這些對比函數(shù)中,峭度kurtosis反映信號分布特性的數(shù)值統(tǒng)計量,是歸一化的四階邊際累積量,由于采用高階累積量比采用二階統(tǒng)計量能提取到更多的有用信息,因此峭度是ICA中最常用的對比函數(shù)之一。它通過計算有效迭代技術(shù)進行優(yōu)化,這種技術(shù)在搜索方向每次迭代中計算代數(shù)步長(適應系數(shù))和全局優(yōu)化對比度。
將零均值隨機變量y的峭度定義為:
Kurt(y)等于零時,隨即變量y為高斯分布,小于零時為亞高斯分布,大于零時為超高斯分布,三種分布如圖1所示。
由中心極限定理可知,N個不同分布信號的聯(lián)合分布高斯化會加強,因此,信號的非高斯性正是盲源分離模型中估計分離矩陣的關(guān)鍵。將峭度作為對比函數(shù),是衡量信號的非高斯性簡單合理的指標[6]。
隨機變量y經(jīng)過標準化處理后,E{y2}=1,(1)式可簡化為:
峭度還具有線性和比例兩個簡化特性。設(shè)有兩個隨機變量y1和y2,參數(shù)a,則峭度滿足:
峭度的主要優(yōu)點在于,當無噪聲觀測模型實現(xiàn)后,采樣量無限大也不會出現(xiàn)偽局部極值。這個特點引出了全局收斂源提取算法。通過這種算法,即使在卷積多輸入多輸出(MIMO)情況下,使用某種形式的降階步驟,也可以進行完整的源分離。雖然峭度作為對比函數(shù)在統(tǒng)計效率和對抗野值的魯棒性這兩點的基礎(chǔ)上的缺點不能忽視,但由于它數(shù)學上易于處理、計算方便和有限采樣時具有魯棒性等優(yōu)點,而得到了廣泛的應用。
2.1 基于峭度的FastICA算法
其中,E{·}表示數(shù)學期望。易看出,這個定義對尺度不敏感,即,k(λw)=k(w),?λ≠0。由于這種尺度的不確定性通常并不重要,在不失一般性的前提下,可以令歸一化,從而簡化數(shù)值。這個基于對比度的峭度最大化(KM)定義使用普遍,因為它不要求對觀測信號預白化,并且不做修改就能在實值和復值信號應用。
為了簡化源提取,基于峭度的FastICA算法首先要進行預白化處理,利用單位化協(xié)方差矩陣變換觀測信號[7],I。在實值的情況下,公式(1)中的對比函數(shù)就相當于四階距定義:
其中λ是拉格朗日乘數(shù)。在實值情況下,(w)的Hessian矩陣近似為:
因此,基于峰度FastICA的迭代減少為[8]:
由▽M(w)=4E{x(wTx)3},式(7)基本是梯度下降的更新規(guī)定:
在基于峭度的FastICA算法復值情況擴展中,由式(1)中的y可得更新規(guī)定[9]:
2.2 基于峭度的RobustICA算法
近年來出現(xiàn)了一種比FastICA更簡明自然的替代算法RobustICA,它不需要簡化假設(shè),進行絕對峭度對比函數(shù)式(1)的精確線性搜索[10]:
搜索方向g通常是梯度,由g=▽wK(w)得:
在每次迭代中,RobustICA執(zhí)行最優(yōu)步長(OS),包括步驟[11-12]:
(1)計算OS多項式系數(shù)。對于峭度對比函數(shù),OS多項式為:
(3)沿搜索方向使對比函數(shù)絕對最大化的根:μopt=,式(8)。
(5)進行正交化。
對比函數(shù)式(1)的一般性保證了RobustICA能夠分離沒有經(jīng)過處理的實值和復值信號。利用特定的峭度符號ε鎖定信號,RobustICA就可以很容易被改動用于處理只需要提取小部分源信號的情況。計算步長多項式的根后,式(8)可以簡化為:
步驟(4)后,更新的提取矢量被限制于之前發(fā)現(xiàn)的提取矢量正交子空間中。在降階式(10)的線性回歸方法中,搜索算法收斂后,估計信號^s與觀測信號的誤差可以通過線性回歸問題x=^h^s的最小均方誤差求得[13]。在搜索下一個源信號重新初始化算法前,由x=^h^s得到x,從而將觀測信號降階。
相對于基于峭度的FastICA和它的變形,RobustICA在實際應用中有很多顯著優(yōu)點[14]:
(1)實值和復值的信號由完全相同的算法處理。二者可以在給定的混合信號中同時出現(xiàn)。復值源信號不需要循環(huán)。無論什么類型的源信號,混合矩陣系數(shù)可以是實數(shù)也可以是復數(shù)。
(2)因為不需要預白化,所有能避免強加的性能限制。在實際中,由于跳過預白化這一步,從而提高了漸近性能。在這種情況下,可以通過線性回歸進行順序提?。ń惦A)。
(3)根據(jù)用戶提供的峭度符號向量定義的順序,RobustICA可以以亞高斯和超高斯源信號為分離目標。如果提前知曉想要得到的源信號的高斯特性,就能避免全部分離和隨之增加的復雜度與估計誤差。
(4)在對比函數(shù)中,當處理短數(shù)據(jù)量時,容易出現(xiàn)鞍點和偽局部極值,而最優(yōu)步長技術(shù)可以增強RobustICA的魯棒性。
(5)綜合考慮源信號提取質(zhì)量和運算操作數(shù)量,RobustICA顯示出了非常高效的收斂速度。
仿真實驗以Matlab為平臺,隨機產(chǎn)生四類循環(huán)和非循環(huán)源信號S,如圖2所示,采樣頻率為1000,采樣長度為100:
產(chǎn)生隨即混合矩陣,將仿真出的源信號混合,得到觀測信號X,如圖3所示。
用FastICA對混合信號進行分離,得到的估計信號SF與源信號S進行對比,如圖4所示。
用RobustICA對混合信號進行分離,得到的估計信號SR與源信號S進行對比,如圖5所示。
圖5可以直觀看出,RobustICA分離得到的估計信號與源信號重疊較好,顯現(xiàn)的藍色較少。采用信號均方誤差衡量兩種算法的分離效果,SMSE越小,效果越好。本次實驗采用兩種算法提取每條信號所產(chǎn)生的SMSE,如圖6所示。從6中可看出,8次提取中,藍色的FastICA在2、3、4、6、7、8六次的提取中SMSE都小于紅色的RobustICA。FastICA的平均SMSEF=-23.3582 dB,RobustICA的平均SMSER=-24.609 dB。由SMSEF>SMSER可知,RobustICA的整體分離效果比FastICA好。
計算復雜度由總的迭代次數(shù)和每次迭代的計算量決定。本次實驗得到的兩種算法的迭代次數(shù)數(shù)據(jù)見表1。
由表1知,雖然在每次迭代中,基于峭度的RobustICA每次迭代的計算復雜度要大于基于峭度的FastICA,如表2所示,其中L為源信號個數(shù),T為采樣長度。但由于RobustICA每次的迭代方案都更有效,在同樣的提取精度要求下,迭代次數(shù)減小,最終整體收斂速度和計算復雜度都要優(yōu)于FastICA。此外,在某些情況下,比如超高斯源信號或者采樣點數(shù)較少時,F(xiàn)astICA還達不到RobustICA所能達到的精度[15]。
無論是源信號是實值還是復值、循環(huán)或者非循環(huán)、亞高斯或者超高斯,又或者是否已經(jīng)預白化處理,峭度一直被認為是在瞬時和卷積線性混合信號中提取獨立源的有效對比函數(shù)。該對比函數(shù)在整個搜索方向的全局最大化,可以用代數(shù)方法在每次提取濾波更新迭代時獲得,這也提升本文所研究的RobustICA的性能。由于基于峭度函數(shù),RobustICA可以不需要預白化,就能處理實值和復值源信號。其結(jié)果就是,在對待常在短數(shù)據(jù)量出現(xiàn)的這類殘留源相關(guān)性,RobustICA比基于白化的算法容忍度更大。除此之外,最優(yōu)步長法加強了RobustICA在初始化和鞍點方面的魯棒性,特別是在小觀測窗口時。達到給定源提取質(zhì)量的計算復雜度是衡量BSS/ICA最自然最客觀的手段。由于沒有二階預處理(白化)所帶來的性能限制,與流行的、具有漸近立方全局收斂性的FastICA和它的一些最新變形比較后,RobustICA被證明計算速度更快,更效率。
[1]張發(fā)啟,張斌,張喜斌.盲信號處理及應用[M].西安:電子科技大學出版社,2006.
[2]Hyvarinen A.Karhunen J.oja E.Independent Component Analysis[M].New York:John w iley&Sons,2001.
[3]Hyv?rinen A,Karhunen J,Oja E.Independent Component Analysis[M].New York:John W iley&Sons,2001.
[4]Hyv?rinen A,Oja E.A fast fixed-pointalgorithm for independent component analysis[J].Neural Computation, 1997,9(7):1483-1492.
[5]Zarzoso V,Comon P.Robust independent component analysis for blind source separation and extraction w ith application in electrocardiography[C].//In proc.EMBC-2008,20th Annual International Conference of the IEEE Engineering in Medicine ahd Biology Society,Vancouver, BC,Canada,2008:3344.
[6]王峻峰.基于主分量、獨立分量分析的盲信號處理及應用研究[D].武漢:華中科技大學,2005.
[7]高巧玲,劉輝.一種FastICA的改進算法[J].計算機技術(shù)與發(fā)展,2010(11):20-11.
[8]Zarzoso V,Comon P.Comparative speed analysis of FastICA[C].//In Proc.ICA-2007,7th International Conference on Independent Component Analysis and Signal Separation,London,UK,2007:293-300.[C].//In Proc.EMBC-2008,30th Annual International Conference of the IEEE Engineering in Medicine and Biology Society,Vancouver,BC,Canada,2008:3344-3347.
[9]Hyv?rinen A.Fast and robust fixed-point algorithms for independent component analysis[J].IEEE Transactions on Neural Networks,1999,10(3):626-634.
[10]Zarzoso V,Comon P.Robust independent component analysis[EB/OL].I3S Laboratory,University of Nice-Sophia Antipolis,CNRS,Tech.Rep.I3S/RR-2009-02-FR,Mar.2009.
[11]趙陶鈺,邵鵬華.基于峭度的一種RobustICA算法[J].電腦開發(fā)與應用,2012(8):25-28.
[12]鄭茂,張銀濤,鄭林華.一種穩(wěn)健的基于峰度的獨立分量分析算法[J].航天電子對抗,2010(5):26-30.
[13]Zarzoso V,Comon P.Robust Independent Component Analysis by Iterative Maximization of the Kurtosis Contrast w ith A lgebraic Optimal Step Size[J].IEEE Transactions on Neural Networks,2010,21(2):248-261.
[14]姚文坡.基于健壯獨立分量分析及其改進方法的胎兒心電信號提取的研究[D].南京:南京郵電大學,2013.
[15]吳微,彭華.FastICA和RobustICA算法在盲源分離中的性能分析[J].計算機應用研究,2014(2):31-32.
Research on Performance Analysis of Independent Component Algorithm Based on Kurtosis
ZHONG Lili,XIONG Xingzhong
(School of Automation and Electronic Information,Sichuan University of Science&Engineering,Zigong 643000,China)
Independent component analysis algorithm is a widely used algorithm for blind signal processing.As an important signal analysis tool,kurtosis can be effective for optimization and analysis.However,there is little introduction to the comparison and analysis for various types of algorithms currently.Therefore,it is necessary to research and analyze the comparison between FastICA and RobustICA based on kurtosis.The theoretical analysis and the simulation results indicate that the robustness,convergence and complexity of RobustICA are better than that of FastICA on the whole.Thus it provides the reference for practical applications.
kurtosis;FastICA;RobustICA;robustness;convergence;complexity
TN911.72
A
1673-1549(2014)04-0043-05
10.11863/j.suse.2014.04.11
2014-02-11
四川省杰出青年基金項目(2011JQ0034);四川省省屬高校科研創(chuàng)新團隊建設(shè)計劃基金項目(13TD0017);人工智能四川省重點實驗室基金項目(2012RYJ05)
鐘麗莉(1989-),女,四川自貢人,碩士生,主要從事信號盲分離方面的研究,(E-mail)381340169@qq.com
圖1峭度與分布的關(guān)系