馬 誠,李云紅,陳錦妮
(西安工程大學 電子信息學院,陜西 西安 710048)
盲信號分離又稱盲源分離,是現(xiàn)代信號處理領域的一個新熱點。近20年來,盲信號分離問題得到了國內外學者的廣泛關注,它是指不依賴任何有關混合矩陣的先驗信息,從多個傳感器觀測到的混合信號中恢復未觀測到的信號源。根據(jù)源信號經(jīng)過傳輸信道的混合方式不同劃分為三種:線性瞬時混合模型、線性卷積混合模型、非線性混合模型。截至目前,研究最多的是線性瞬時混合模型,本文提出的盲信號分離算法也是針對該模型。
獨立分量分析(Independent Component Analysis,ICA)是在源信號服從非高斯分布的條件下,以各維信號之間的獨立性作為其準則函數(shù),并進行算法優(yōu)化,分解成各個獨立分量,完成信號的盲分離。Kernel ICA算法是在獨立分量分析方法中引入核函數(shù),將信號從低維空間映射到高維特征空間,然后對映射數(shù)據(jù)采用獨立分量分析方法。該算法的分離效果較好,但是計算復雜度往往較高,難以滿足實際在線的需要,并且該算法的魯棒性較差。高斯混合模型是一種經(jīng)典的語音信號模型,在語音識別、語音轉換等領域被廣泛應用。對此,本文提出基于高斯混合模型的自適應盲信號分離算法,該算法由于在線估計混合信號的評價函數(shù),因而模型更為精確,分離效果較好,并且可以用于非平穩(wěn)信號的分離,算法的實用性提高。高斯混合模型還可以逼近任意源的概率密度函數(shù),提高算法的魯棒性,使得盲信號分離效果較好。
假設=[,,…,x]為通過傳感器接收到的觀測信號,為傳感器的個數(shù);為×混合矩陣;源信號為個相互獨立的未知信號。因此,線性瞬時信號的數(shù)學模型可表示為:
盲信號分離就是在只知混合信號的前提下,尋找分離矩陣,使得輸出信號=盡可能逼近源信號。
最小互信息盲信號分離算法的代價函數(shù)為:
由式(2)可知,只有當(y)=[ ln p(y)]時,才可以實現(xiàn)信號的準確分離。本文采用基于高斯核函數(shù)的概率密度函數(shù)估計理論,直接估計混合信號的評價函數(shù)。
假定y為混合信號,=1,2,…,,為信號的維數(shù),樣本個數(shù)為,其邊緣概率密度函數(shù)可表示為:
式中:表示核函數(shù)窗寬;表示高斯核函數(shù),即:
Y為:
式中表示混合信號的第個樣本。對于一個給定的隨機信號,上述基于高斯核函數(shù)的估計邊緣概率密度函數(shù)等于真實的概率密度函數(shù)。為了求得概率密度函數(shù)的導數(shù),上述概率密度函數(shù)的梯度形式如下:
則對于給定的數(shù)據(jù),其概率密度函數(shù)形式為:
求解式(2)的評價函數(shù),對于給定的數(shù)據(jù)集,則式(2)可寫為:
將式(8)第一項用-()代替,則式(8)可寫為:
式(9)中()的形式如下:
因此,盲信號分離問題就轉化為式(11)所述的優(yōu)化問題:
對于給定的信號,=1,2,…,,式(11)實質上是一個非線性優(yōu)化問題,也可經(jīng)過預白化處理,實現(xiàn)信號的零均值、單位方差處理,從而簡化運算。
式(11)實際上是關于分離矩陣的優(yōu)化求解問題:
為了描述方便,定義下面的公式:
則式(12)中的?()可以寫為:
式中:
對優(yōu)化函數(shù)式(11)中的約束條件做歸一化處理,如下所示:
根據(jù)式(16),分離矩陣可以寫為:
式中:
因此,優(yōu)化函數(shù)式(11)中l(wèi)n ||det可寫為:
則式(19)對w的微分如下:
如果是正交矩陣,有:
根據(jù)上面的計算,則式(10)的微分形式為:
式中:
為了驗證本文算法的有效性,選取輕拖尾與輕拖尾、重拖尾與重拖尾、重拖尾與輕拖尾三組混合信號進行分離。
1)輕拖尾與輕拖尾混合信號的分離
圖1代表源信號(橫軸為采樣點數(shù),縱軸為幅度),4個源信號依次是正弦信號(周期為20 s)、鋸齒波信號(周期為100 3 s)、高斯白噪聲和正弦信號(周期為80 s),歸一化峭度分別為:-1.301,-1.102,0和-1.926,采樣點數(shù)為1 000。
圖1 源信號(一)
圖2是線性混合信號,混合矩陣為服從區(qū)間[0,1]上均勻分布的4×4隨機矩陣。
圖2 混合信號(一)
圖3是采用本文提出的盲信號分離算法對混合信號的分離結果。從圖3中可直觀地看出,該算法能對輕拖尾混合信號進行盲分離,分離效果較好。
圖3 分離信號(一)
2)重拖尾與重拖尾混合信號的分離
圖4中源信號依次是3個重拖尾信號和1個高斯白噪聲信號。3個重拖尾信號來自于一段真實的語音信號。4個源信號的歸一化峭度分別為:0.291,0.261,0.037和0,樣本點取1 000。
圖4 源信號(二)
圖5是線性混合后的信號。混合矩陣為服從區(qū)間[0,1]上均勻分布的4×4隨機矩陣。
圖5 混合信號(二)
圖6是本文算法對重拖尾混合信號的盲分離結果。對比圖4和圖6可直觀看出,分離信號的波形形狀和源信號的基本一致,說明該算法能對重拖尾混合信號有效分離。
圖6 分離信號(二)
3)重拖尾與輕拖尾混合信號的分離
圖7中源信號依次是1個正弦信號(周期為80 s)、1個重拖尾信號、高斯白噪聲信號和1個正弦信號(周期為100/3 s)。這個重拖尾信號來自一段真實的語音信號。4個源信號的歸一化峭度分別為:-0.678,0.261,0和-1.926。樣本點個數(shù)為1 000個。
圖7 源信號(三)
圖8是線性混合后的信號?;旌暇仃嚍榉膮^(qū)間[0,1]上均勻分布的4×4隨機矩陣。
圖8 混合信號(三)
圖9為本文提出的高斯混合模型盲信號分離算法對重拖尾與輕拖尾混合信號的分離結果,從圖9可直觀看出,混合信號分離前后的信號基本一致,算法能對重拖尾與輕拖尾混合信號有效分離。
圖9 本文算法分離信號
圖10為Kernel ICA算法對重拖尾與輕拖尾混合信號的分離結果,從圖中可直觀地看出,Kernel ICA基本可以恢復原始信號,但是分離效果差。
圖10 Kernel ICA方法的分離信號
選取源信號和恢復信號?兩者之間的差之比作為恢復信號的信噪比,衡量分離效果,即:
式中:s代表源信號;?代表恢復信號。當恢復信號與源信號越接近時,信噪比值越大,則恢復效果越好。
為了驗證本文提出算法的分離效果,對重拖尾信號(取自一段真實的語音信號)和輕拖尾信號(正弦信號,周期為80 s)的混合信號進行分離,樣本數(shù)目由小到大共5個級別,采用Monte Carlo方法進行100次仿真實驗。選取基于廣義高斯模型的盲信號分離算法、經(jīng)典的擴展最大熵算法(Extend-InforMax)、Kernel ICA算法進行對比。圖11是4種算法分離性能對比圖,從圖中可以看出,本文提出的高斯混合模型的盲信號分離算法的分離效果最佳。
圖11 算法性能分析效果圖
盲信號分離算法性能的好壞取決于信號概率密度函數(shù)的估計準確度。本文采用高斯混合模型對信號的概率密度函數(shù)進行估計,使得信號的估計概率密度函數(shù)等于真實的概率密度函數(shù),從而提高了算法的分離準確率。為了定量評價該算法的分離效果,選取分離信噪比作為評價指標。仿真結果證明,本文提出的盲信號分離算法分離信噪比較高,具有較好的分離效果。