張守成
(廣西民族師范學(xué)院 數(shù)理與電子信息工程學(xué)院, 廣西 崇左 532200)
獨(dú) 立 分 量 分 析 ( Independent Component Analysis,ICA)是20 世紀(jì)90 年代后期發(fā)展起來的一項(xiàng)新的信號分解技術(shù),目前已成功應(yīng)用在語音分析、特征提取、生物醫(yī)學(xué)工程等領(lǐng)域[1-2]。 傳統(tǒng)ICA 方法以分離出所有源信號為目標(biāo),往往同時(shí)分離出所有的源信號[3-6],而在很多實(shí)際應(yīng)用中,可能僅對其中某一個(gè)源信號感興趣。
在此背景下,Lu 等學(xué)者[7-8]提出了參考獨(dú)立成分分析(ICA-R)算法,利用期望提取信號的波形先驗(yàn)信息構(gòu)造出參考信號,將其引入到傳統(tǒng)的ICA 算法中,通過優(yōu)化算法提取出在一定量度下與參考信號最接近的輸出作為期望源信號,具有直接高效的優(yōu)點(diǎn),并且參考信號的引入能提高期望源信號的分離質(zhì)量和精度。 但該方法計(jì)算相對繁瑣。 本文通過對ICA-R 算法的原理進(jìn)行分析,利用峭度作為度量,巧妙調(diào)整目標(biāo)函數(shù),并利用蜂群優(yōu)化算法處理目標(biāo)函數(shù),得到一種計(jì)算簡單、分離性能好的ICA-R算法。 最后通過仿真實(shí)驗(yàn)證明了該算法的有效性。
德國生物學(xué)家Frisch 發(fā)現(xiàn)在自然界中,雖然各組織內(nèi)不同職能的蜜蜂只能完成單一的任務(wù),但蜜蜂通過搖擺舞、氣味等多種信息交流方式,使得整個(gè)蜂群能夠迅捷地發(fā)現(xiàn)優(yōu)良蜜源,實(shí)現(xiàn)自組織行為[9]。 Seeley 在1995 年最先提出了蜂群的自組織模擬模型;Teodorovic 于2003 年進(jìn)一步提出了蜂群優(yōu)化算法(Artificial Bee Colony, ABC)[10-12]。 ABC算法是一種新興的仿生智能優(yōu)化算法,具有全局收斂能力強(qiáng)、設(shè)置參數(shù)少、適用范圍廣等特點(diǎn),ABC 已被應(yīng)用于許多科學(xué)工程領(lǐng)域。 例如,文獻(xiàn)[11]將ABC 算法應(yīng)用于盲信號分離代替了傳統(tǒng)的梯度法,克服了梯度法收斂速度慢、易陷入局部極值點(diǎn)等缺點(diǎn),提高了盲源分離算法的分離精度和穩(wěn)定性。
線性瞬時(shí)混合ICA 模型通常表示為[1]:x(t)=As(t),其中s(t)=[s1(t),…,sM(t)]T是M個(gè)假設(shè)為統(tǒng)計(jì)獨(dú)立的未知源信號,A是一個(gè)未知的N × M混 合 矩 陣 ( 一 般 假 設(shè)N≥M),x t( )=[x1(t) ,…,xN(t) ]T是源信號經(jīng)A線性混合后得到的N個(gè)觀測信號。
ICA 的目標(biāo)是估計(jì)一個(gè)最佳的M × N解混矩陣W,使得觀測信號經(jīng)過W變換后得到的M個(gè)輸出信號y(t)=Wx(t) 是獨(dú)立的,從而作為源信號s(t)的估計(jì)。 一般情況下不可能直接求得解混矩陣的解,需要通過基于目標(biāo)函數(shù)的自適應(yīng)方法求解,具體過程是:首先對實(shí)際問題的源信號和信道傳輸過程進(jìn)行分析,然后根據(jù)源信號的隨機(jī)特征確定度量輸出源分離結(jié)果的測度,如非高斯性、稀疏性等測度方法,根據(jù)測度理論構(gòu)造目標(biāo)函數(shù),并選擇合適的優(yōu)化方法。 常用的優(yōu)化算法有基于梯度的隨機(jī)梯度算法和牛頓方法等。 在進(jìn)行優(yōu)化后,最終獲得解混矩陣,輸出估計(jì)的源信號。 因此ICA 的核心問題可以表示為:ICA 方法=目標(biāo)函數(shù)+優(yōu)化算法[12]。
而ICA-R 算法一般利用期望源信號的波形先驗(yàn)信息構(gòu)造出其參考信號r(t), 隨后將輸出信號y(t) 與r(t) 的某個(gè)接近性量度ε(y,r) 作為先驗(yàn)約束引入到傳統(tǒng)ICA 的學(xué)習(xí)中,算法收斂后得到一個(gè)最優(yōu)權(quán)向量w*(解混矩陣W的一行),將y =w*Tx(t) 作為期望源信號的估計(jì)信號。
以上就是ICA-R 算法的基本原理,文獻(xiàn)[7]選擇負(fù)熵作為信號非高斯性的度量,并據(jù)此構(gòu)造目標(biāo)函數(shù),利用擬牛頓方法得到了一種ICA-R 算法。 但由于涉及復(fù)雜的二階導(dǎo)數(shù)計(jì)算,效率較低。
峭度作為信號非高斯性的度量也被廣泛使用,基于ICA-R 算法的原理,本文選取輸出信號峭度的絕對值作為輸出信號非高斯型的度量,假定K(y) 有M個(gè)局部或全局最優(yōu)解wi(i=1,…,M),相應(yīng)給出M個(gè)源信號的估計(jì)。 則輸出信號與參考信號的接近性量度ε(y,r)當(dāng)且僅當(dāng)輸出y =w*Tx是期望源信號時(shí)取得最小值,即有:
由此可知,一定存在一個(gè)閾值參數(shù)ξ滿足以下不等式, 當(dāng)且僅當(dāng)輸出信號y =w*Tx時(shí)使得g(w)=ε(y,r) -ξ≤0 成立。 將g(w) ≤0 作為一個(gè)對K(y) 的約束,則算法的優(yōu)化框架為:
(1)最大化。 研究推得的公式為:
(2)約束。 研究推得的公式為:
其中,等式約束h(w)=0 用于保證K(y) 和w有界。
將觀測數(shù)據(jù)x進(jìn)行白化,用表示白化后數(shù)據(jù),并對權(quán)向量w每次更新后歸一化。 則有E(y2)=,其中R~x~x =I是的協(xié)方差矩陣。 上式保證了h(w)=E(y2) - 1=0恒成立,從而算法的優(yōu)化框架簡化為:
(1)最大化。 研究推得的公式為:
(2)約束。 研究推得的公式為:
由ICA-R 算法設(shè)計(jì)的基本原理可知,在約束g(w) ≤0 下最大化得到最優(yōu)權(quán)向量w*, 此時(shí)接近性量度ε(y,r) 也取得最小值,則- ε(y,r) 取得最大值,從而可將最大化的目標(biāo)函數(shù)調(diào)整為K(y) 和- ε(y,r) 的乘積,即:
其中,ε(y,r)=E[(y - r)2]。
通過最大化M(y) 得到最優(yōu)權(quán)向量w*的優(yōu)化算法選擇較多,鑒于ABC 算法具有全局收斂性強(qiáng)、收斂速度快的特點(diǎn),采用ABC 算法對目標(biāo)函數(shù)M(y) 進(jìn)行優(yōu)化得到最優(yōu)權(quán)向量w*,就可以實(shí)現(xiàn)目標(biāo)源信號的提取。
為了驗(yàn)證本文改進(jìn)算法的有效性,對合成數(shù)據(jù)進(jìn)行仿真實(shí)驗(yàn)。取4 個(gè)零均值單位方差的獨(dú)立源信號:S1,S2為確定性信號,S3,S4為隨機(jī)信號。 樣本數(shù)據(jù)為2 000個(gè),經(jīng)白化后的源信號如圖1 所示(為方便觀察,只繪出前300 個(gè)樣本點(diǎn))。 用一個(gè)隨機(jī)生成的高斯矩陣對源信號進(jìn)行混合,得到的混合信號如圖2 所示。 用各源信號相應(yīng)的符號函數(shù)序列作為提取的對應(yīng)參考信號,如圖3 所示。 采用本文所提算法對各源信號進(jìn)行抽取,收斂后抽取的信號如圖4 所示。 直觀上比較圖4 與圖1,波形基本一致,表明算法很好地實(shí)現(xiàn)了對各個(gè)信號的盲抽取。
圖1 源信號Fig. 1 Source signal
圖2 混合信號Fig. 2 Mixed signal
圖4 抽取信號Fig. 4 Extracted signal
為進(jìn)一步說明分離效果,采用量化指標(biāo)IPI(Individual Performance Index)對分離性能進(jìn)行評價(jià)[1]:
其中,pj表示全局分離變量p =wTA的第j個(gè)元素。IPI越接近于零,表明算法分離性能越好。
對上述信號采用本文算法進(jìn)行150 次蒙特卡洛實(shí)驗(yàn),每次都隨機(jī)產(chǎn)生混合矩陣。 實(shí)驗(yàn)結(jié)果顯示,算法每次都能抽取成功,表明算法在不需要閾值參數(shù)選擇的情況下收斂性能穩(wěn)定。
150 次提取信號后的平均IPI值見表1。
表1 算法收斂的平均IPI 值Tab. 1 Average IPI of the algorithm
表1 顯示在成功抽取時(shí)采用本文算法有低IPI值,說明算法對各源信號的抽取性能優(yōu)異。
通過巧妙調(diào)整目標(biāo)函數(shù)并采用蜂群優(yōu)化算法有效避免了閾值選擇問題,簡化了計(jì)算。 計(jì)算機(jī)仿真實(shí)驗(yàn)表明了本文算法收斂性能穩(wěn)定,可有效實(shí)現(xiàn)對信號的盲提取。 當(dāng)然,對實(shí)際應(yīng)用中不同的提取信號,如何構(gòu)造合適的參考信號是需要進(jìn)一步探討的課題。