彭賽陽(yáng),王振華,朱元清
(空軍預(yù)警學(xué)院, 武漢 430019)
?
盲源分離現(xiàn)狀及發(fā)展
彭賽陽(yáng),王振華,朱元清
(空軍預(yù)警學(xué)院, 武漢 430019)
盲源分離(BBS)作為一門(mén)與信息理論、信號(hào)處理、人工神經(jīng)網(wǎng)絡(luò)、概率論等學(xué)科均有交叉的新興研究領(lǐng)域,得到了研究學(xué)者們的熱切關(guān)注。闡述了盲源分離的概念,介紹了其分類(lèi),分析了其應(yīng)用領(lǐng)域,歸納了盲源分離的國(guó)內(nèi)外發(fā)展近況及趨勢(shì),并對(duì)未來(lái)進(jìn)行了展望。
盲源分離;信號(hào)處理;多輸入多輸出
在現(xiàn)代愈見(jiàn)復(fù)雜的信號(hào)環(huán)境下,從復(fù)雜繁多的信號(hào)中提取對(duì)自己有用的信號(hào)越來(lái)越困難。人們接收到的信號(hào)往往是一些未知的、經(jīng)過(guò)混合得到的觀(guān)察信號(hào),然而以傳統(tǒng)方式難以準(zhǔn)確地得出所需的信號(hào)。在這樣的背景下,盲源分離的問(wèn)題被提出。盲源分離(BSS) 作為信號(hào)處理等研究方向中新出現(xiàn)的重點(diǎn)、熱點(diǎn)、難點(diǎn)問(wèn)題,自20世紀(jì)80年代以來(lái)得到了迅猛的發(fā)展。盲源分離在很多領(lǐng)域都取得了大力的研究和發(fā)展,如通信語(yǔ)音信號(hào)處理、生物醫(yī)學(xué)信號(hào)處理、圖像信號(hào)處理、陣列信號(hào)處理等。
盲源分離源自于“雞尾酒會(huì)”問(wèn)題:在一個(gè)雞尾酒會(huì)上,在不同的位置放置了幾個(gè)麥克風(fēng),有不同的聲音通過(guò)麥克風(fēng)接收,比如房間內(nèi)的音樂(lè)聲、窗外的鳴笛聲、不同人的說(shuō)話(huà)聲等等,而我們需要將這些不同的聲音在混合的情況下分離出所需要的聲音,盲源分離便是為解決此類(lèi)問(wèn)題而產(chǎn)生的。
盲源分離是指僅從若干觀(guān)測(cè)到的混合信號(hào)中提取、恢復(fù)(分離)出無(wú)法直接觀(guān)測(cè)的各個(gè)原始信號(hào)的過(guò)程,這里的“盲”是指源信號(hào)未知(不可觀(guān)測(cè)),并且混合系統(tǒng)特性也事先未知或只知其少量先驗(yàn)知識(shí)(如非高斯性、循環(huán)平穩(wěn)性、統(tǒng)計(jì)獨(dú)立性等)這2個(gè)方面[1]。更一般的表述為:盲源分離是通過(guò)多輸入多輸出(MIMO)系統(tǒng)中檢測(cè)到的觀(guān)測(cè)信號(hào),找到一個(gè)解混系統(tǒng)B,利用解混后得到的輸出信號(hào)推斷,重構(gòu)出其系統(tǒng)的混合系統(tǒng)A及源信號(hào),如圖1所示。
圖1 盲源分離模塊圖
按照源信號(hào)通過(guò)信道的混合方式分類(lèi),可以分為線(xiàn)性瞬時(shí)混合模型、卷積混合模型和非線(xiàn)性混合模型,與之對(duì)應(yīng)的有3類(lèi)盲源分離方法[2-4]。這幾類(lèi)模型中最早開(kāi)始進(jìn)行研究的是線(xiàn)性瞬時(shí)混合模型,它也是至今為止研究成果最為成熟的模型,其他模型均在此基礎(chǔ)上進(jìn)行研究與發(fā)展。
按照源信號(hào)與輸出信號(hào)的數(shù)量關(guān)系分類(lèi),可以分為確定型(源信號(hào)與輸出信號(hào)數(shù)量相等)、欠定型(源信號(hào)數(shù)量大于輸出信號(hào)數(shù)量)、超定型(源信號(hào)數(shù)量小于輸出信號(hào)數(shù)量)。目前研究最多的是確定型盲源分離問(wèn)題,但基于現(xiàn)實(shí)情況中確定型問(wèn)題較少發(fā)生,大部分情況都是屬于欠定型問(wèn)題,學(xué)者們?cè)谇范ㄐ蛦?wèn)題上也取得了稍許成果。
按照算法的性能要求分類(lèi),可以分為自適應(yīng)在線(xiàn)處理方式和離線(xiàn)批處理方式等。自適應(yīng)在線(xiàn)處理方式是基于對(duì)單次觀(guān)測(cè)數(shù)據(jù)進(jìn)行不斷地迭代、更新,計(jì)算量低,計(jì)算耗時(shí)短,適用于對(duì)實(shí)時(shí)性要求較高的情況。然而離線(xiàn)批處理方式能夠充分利用大部分的觀(guān)測(cè)信號(hào)數(shù)據(jù),可以得到較為精確的結(jié)果,但是計(jì)算復(fù)雜,計(jì)算耗時(shí)長(zhǎng),并且對(duì)存儲(chǔ)空間的要求較高。
下面具體介紹按照源信號(hào)通過(guò)信道的混合方式分類(lèi)的3種模型。
3.1 線(xiàn)性瞬時(shí)混合模型
線(xiàn)性瞬時(shí)混合模型是最基礎(chǔ)、最簡(jiǎn)單的盲源分離模型,也是目前為止研究成果最多且最為成熟的一種模型。假設(shè)有1組n維的未知統(tǒng)計(jì)獨(dú)立源信號(hào)s(k)=[s1(k),s2(k),…,sn(k)]T,經(jīng)過(guò)線(xiàn)性瞬時(shí)混合被m個(gè)傳感器接收,得到的觀(guān)測(cè)信號(hào)x(k)=[x1(k),x2(k),…,xm(k)]T是這n維信號(hào)的線(xiàn)性組合。由于傳輸信道和傳感器陣列包含噪聲,因此在實(shí)際應(yīng)用中常需考慮加性噪聲n(k)=[n1(k),n2(k),…,nm(k)]T,混合矩陣A∈Rm×n,線(xiàn)性瞬時(shí)混合模型可以表示為:
x(t)=As(t)+n(t)
(1)
對(duì)于線(xiàn)性瞬時(shí)混合模型,應(yīng)用最廣的分離算法為獨(dú)立成分分析(ICA),是基于信號(hào)高階統(tǒng)計(jì)特性的分析方法,可以分解出相互獨(dú)立的各信號(hào)分量。而實(shí)現(xiàn)獨(dú)立分量分離需要假設(shè)下列幾個(gè)條件:
(1) 觀(guān)測(cè)信號(hào)要大于或等于源信號(hào)個(gè)數(shù),且矩陣A為滿(mǎn)秩矩陣,以保證盲源分離問(wèn)題可解。
(2) 源信號(hào)s(t)中各個(gè)分量之間是互相統(tǒng)計(jì)獨(dú)立的,并且至多一個(gè)高斯信號(hào)。因?yàn)榉母咚狗植嫉碾S機(jī)變量經(jīng)過(guò)線(xiàn)性混合之后依然服從高斯分布,如果源信號(hào)中服從高斯分布的分量不止一個(gè)時(shí),混合信號(hào)中服從高斯分布的分量也不止一個(gè),這樣便求解不出。
(3) 噪聲信號(hào)n(t)可以忽略不計(jì),或者n(t)為零均值的且與源信號(hào)s(t)相互獨(dú)立,即把噪聲也當(dāng)作源信號(hào)。
3.2 卷積混合模型
卷積混合模型是目前盲源分離研究的一個(gè)熱點(diǎn)方向,在實(shí)際情況中,傳播環(huán)境復(fù)雜,觀(guān)測(cè)信號(hào)很多都是信道衰落和時(shí)延的結(jié)果[5]。卷積混合模型是跟實(shí)際環(huán)境更為接近的混合模型,在不考慮噪聲影響的條件下,設(shè)n維源信號(hào)s(k)=[s1(k),s2(k),…,sn(k)]T通過(guò)遲延為p的混合矩陣H(p)產(chǎn)生m維混合信號(hào)x(k)=[x1(k),x2(k),…,xm(k)]T,該卷積混合系統(tǒng)可以寫(xiě)成:
(2)
(3)
式中:hij(p)為從第i個(gè)源信號(hào)到第j個(gè)混合信號(hào)之間的沖激響應(yīng)。
當(dāng)l=1的時(shí)候,此模型就等效于瞬時(shí)混合模型。
卷積混合模型在語(yǔ)音信號(hào)、衛(wèi)星圖像、水聲信號(hào)等方向均有廣泛的應(yīng)用。文獻(xiàn)[6]對(duì)卷積混合模型進(jìn)行了詳細(xì)的介紹和研究,有興趣的可以進(jìn)行詳細(xì)研讀。
3.3 非線(xiàn)性混合模型
在實(shí)際情況中,觀(guān)測(cè)信號(hào)大部分都是經(jīng)過(guò)非線(xiàn)性混合得到。解決非線(xiàn)性混合信號(hào)的盲源分離問(wèn)題通常具有較大的難度,因此可通過(guò)對(duì)非線(xiàn)性失真函數(shù)f的限制,例如將f限制于某個(gè)變換集,或者增加源信號(hào)的一些可利用先驗(yàn)信息[7]。非線(xiàn)性混合模型其實(shí)可看作是線(xiàn)性模型的一個(gè)自然拓廣。x(k)=[x1(k),x2(k),…,xm(k)]T是M維觀(guān)測(cè)信號(hào)向量;s(k)=[s1(k),s2(k),…,sn(k)]T是n維未知源信號(hào)向量;n(k)=[n1(k),n2(k),…,nm(k)]T是m維加性噪聲,且與信號(hào)統(tǒng)計(jì)獨(dú)立;f:RN→RM為未知的可逆實(shí)值非線(xiàn)性混合函數(shù)。表示如下:
x(l)=f[s(l)]+n(t)
(4)
而目前研究較為廣泛的3種非線(xiàn)性混合模型分別為后非線(xiàn)性混合模型、后非線(xiàn)性-線(xiàn)性混合模型及Mono混合模型,在此不再贅述。
(1) 通信語(yǔ)音信號(hào)的分離與識(shí)別
盲源分離技術(shù)最初的應(yīng)用領(lǐng)域便是語(yǔ)音信號(hào)的分離與識(shí)別,即雞尾酒會(huì)問(wèn)題。2002年,Douglas運(yùn)用卷積盲源分離方法從一段無(wú)伴奏合唱錄音中分離出了2種單獨(dú)的聲音[8]。
(2) 生物醫(yī)學(xué)信號(hào)處理
盲源分離在生物醫(yī)學(xué)領(lǐng)域中的應(yīng)用方向廣泛,如對(duì)心電圖、腦電圖、核磁共振圖像的分析等等。其中對(duì)腦電圖的信號(hào)分離應(yīng)用研究較為深入[9-11],如對(duì)孕婦的腦電圖檢測(cè),孕婦的腦電圖其實(shí)是胎兒和孕婦腦電圖的混合信號(hào),可運(yùn)用盲源分離技術(shù)單獨(dú)提取出胎兒的;從腦電圖和核磁共振掃描記錄中消除噪聲和干擾;從肺聲信號(hào)中消除心臟聲信號(hào)等等。
(3) 圖像信號(hào)處理
盲源分離在圖像信號(hào)處理中已經(jīng)廣泛應(yīng)用于人臉識(shí)別[12]、數(shù)字水印、圖像恢復(fù)[13]、圖像去噪等方向。比如拍照時(shí)由于相機(jī)抖動(dòng)、鏡頭模糊等因素導(dǎo)致圖像模糊不清,扭曲等情況便可通過(guò)盲源分離技術(shù)將圖像復(fù)原。
(4) 陣列信號(hào)處理
在雷達(dá)探測(cè)、海洋聲納探測(cè)等軍事應(yīng)用方面,也都大量地運(yùn)用到了盲源分離技術(shù)[14]。雷達(dá)陣列傳感器中接到的混合信號(hào),便是源信號(hào)及混合系統(tǒng)均是“盲”的典型例子。
盲源分離的應(yīng)用領(lǐng)域十分廣泛,還包括遙感數(shù)據(jù)處理、地質(zhì)勘探檢測(cè)、水體污染研究、機(jī)械故障診斷等等,其所應(yīng)用領(lǐng)域已經(jīng)遠(yuǎn)遠(yuǎn)超出了信號(hào)處理的范圍。
1986年,法國(guó)學(xué)者Herault.J和Jutten.C在美國(guó)舉行的神經(jīng)網(wǎng)絡(luò)計(jì)算機(jī)會(huì)議上發(fā)表了題為Space or time adaptive signal processing by neural network model的研究報(bào)告,提出了遞歸神經(jīng)網(wǎng)絡(luò)模型和基于Hebb學(xué)習(xí)律的學(xué)習(xí)算法,可以對(duì)混合的獨(dú)立源信號(hào)進(jìn)行盲分離。自此盲源分離問(wèn)題的研究受到了國(guó)內(nèi)外廣泛關(guān)注,隨著研究的深入,理論和實(shí)際應(yīng)用均得到了長(zhǎng)足的發(fā)展。
國(guó)際上,對(duì)于盲源分離問(wèn)題研究較有成就的學(xué)者有:法國(guó)學(xué)者Comon和Cardoso,美國(guó)學(xué)者Sejnowsk和Bell,芬蘭的Oja,日本的Amari和Cichowski等等。在他們的個(gè)人主頁(yè)上有他們發(fā)表的關(guān)于盲分離以及相關(guān)的文章和MATLAB代碼以及所使用的信號(hào)。1986年,JH和CJ第1次提出了盲源分離[15]這一概念,自此學(xué)者們便開(kāi)始了盲源分離的研究。1989年,在美國(guó)舉行的ICA研究領(lǐng)域相關(guān)的高階譜分析國(guó)際會(huì)議上,Cardoso 和Comon各自發(fā)表了在ICA發(fā)展史上里程碑式的論文[16-17],提出了“源信號(hào)在統(tǒng)計(jì)上相互獨(dú)立”這個(gè)框架式的條件,從此ICA逐漸開(kāi)始完善發(fā)展。近年來(lái),盲源分離發(fā)展迅速,如2005年,Georgiev提出了源信號(hào)的稀疏程度與可分離之間的關(guān)系[18]。2009年,Kim提出了一種基于搜索單源時(shí)頻點(diǎn)的方法,提高了抗噪能力[19]。2012年,Hoffmann在頻域卷積算法中對(duì)基于統(tǒng)計(jì)信息理論來(lái)實(shí)現(xiàn)聚類(lèi)去模糊進(jìn)行了深入研究[20]。
國(guó)內(nèi)對(duì)于盲源分離的研究相對(duì)較晚,但在較短的時(shí)間內(nèi)也取得了不錯(cuò)的成績(jī)。清華大學(xué)的張賢達(dá)在其1996年出版的《時(shí)間序列分析——高階統(tǒng)計(jì)量方法》一書(shū)中,介紹了有關(guān)盲分離的理論基礎(chǔ),并且給出了相關(guān)的算法,后國(guó)內(nèi)對(duì)盲源分離的研究逐漸多了起來(lái)。2005年3月20日,博士生張智林在成都電子科技大學(xué)領(lǐng)導(dǎo)成立了中國(guó)第1個(gè)盲源分離的研究小組,意味著中國(guó)盲源分離的研究向前邁進(jìn)了一大步。2005年11月26日,在研學(xué)論壇(http://bbs.matwav.com)上也成立了盲信號(hào)處理專(zhuān)版,大大方便了中國(guó)盲源分離研究的學(xué)者。近年來(lái),國(guó)內(nèi)學(xué)者們也取得了不錯(cuò)的成果。如,2008年,劉琨利用源信號(hào)在時(shí)頻域上的稀疏特性,可以同時(shí)實(shí)現(xiàn)混合矩陣的估計(jì)和源信號(hào)的恢復(fù)[21];2010年,方勇運(yùn)用平面聚類(lèi)勢(shì)函數(shù)法,在有噪情況下,估計(jì)混合矩陣、恢復(fù)源信號(hào)[22];2011年,歐世峰通過(guò)引入滑動(dòng)參數(shù),自適應(yīng)地組合2個(gè)不同步長(zhǎng)的盲源分離系統(tǒng),提出了一種自適應(yīng)組合型盲源分離算法,其可在2個(gè)系統(tǒng)并向運(yùn)行的同時(shí),自適應(yīng)地選取最優(yōu)的分離系統(tǒng)進(jìn)行在線(xiàn)分離[23];2014年,熊坤來(lái)針對(duì)傳統(tǒng)盲分離算法對(duì)寬帶信號(hào)不適用的問(wèn)題,提出了一種基于陣列接收模型的寬帶盲源分離算法,能夠有效地分離寬帶信號(hào),且可準(zhǔn)確恢復(fù)出信號(hào)幅度[24]。
盲源分離問(wèn)題近年來(lái)已經(jīng)成為國(guó)際上信號(hào)處理等學(xué)科領(lǐng)域的一個(gè)熱點(diǎn)問(wèn)題,它在諸多領(lǐng)域的應(yīng)用具有十分重要的實(shí)用價(jià)值。雖然盲源分離剛開(kāi)始發(fā)展不久,但是可以看出其十分有發(fā)展前景。然而快速的發(fā)展離不開(kāi)理論突破與實(shí)際應(yīng)用的結(jié)合,在此方面,仍有許多問(wèn)題需要進(jìn)一步的研究,比如:
(1) 信號(hào)源個(gè)數(shù)問(wèn)題。個(gè)數(shù)問(wèn)題即超定、欠定問(wèn)題,現(xiàn)實(shí)情況中,大部分都是源信號(hào)個(gè)數(shù)與觀(guān)測(cè)信號(hào)個(gè)數(shù)不相等,而現(xiàn)在發(fā)展的較為成熟的是確定型問(wèn)題,即源信號(hào)和觀(guān)測(cè)信號(hào)個(gè)數(shù)相等的情況。超定、欠定型目前也有一些研究成果,但是完全支撐通信偵察還需進(jìn)一步加深研究。
(2) 算法的收斂速度及魯棒性抗噪性。對(duì)于通信偵察而言,通信信號(hào)都是非合作性信號(hào),信號(hào)變化快,實(shí)時(shí)性強(qiáng),而且離不開(kāi)噪聲環(huán)境,要求盲分離算法魯棒性強(qiáng),收斂速度快,抗噪性強(qiáng)。
(3) 算法的動(dòng)態(tài)適應(yīng)性。由于距離和目標(biāo)特性的差異,實(shí)際觀(guān)測(cè)到的通信信號(hào)通常是幅度相差懸殊的信號(hào)混合,研究具有大動(dòng)態(tài)范圍適應(yīng)性的盲分離算法也是亟需解決的問(wèn)題。
由于盲源分離可運(yùn)用的范圍廣,實(shí)用性強(qiáng),現(xiàn)在國(guó)內(nèi)外都在積極進(jìn)行更深度的研究,盲源分離的發(fā)展將為今后的學(xué)術(shù)研究提供更多新的觀(guān)點(diǎn)、思路。
[1] 余先川,胡丹.盲源分離理論與應(yīng)用[M].北京:科學(xué)出版社,2011.
[2] 馬建倉(cāng),牛奕龍,陳海洋,等.盲信號(hào)處理[M].北京:國(guó)防工業(yè)出版社,2006.
[3] AMARI S,DOUGLAS S C,CICHOCKI A,et al.Multichannel blind deconvolution and equalization using the natural gradient[C]//Proceedings of The First Signal Processing Workshop on Signal Processing Advances in Wireless Communications,1997:101-104.
[4] HYVARINEN A,KARHUNEN J,OJA E.Independent Component Analysis[M].New York:John Wiley&Sons,2001.
[5] LI Y, YANG Z.Blind source separation based on convolution mixture speech signals the 6th international conference on wireless[C]//Communications Networking and Mobile Computing,2010:1-4.
[6] PEDERSEN M S,LARSEN J,KJEMS U,et al.A survey of convolutive blind source separation methods[J].Speech Processing Handbook,2007(6):1065-1084.
[7] LEONARDO T D,CHRISTIAN J.A mutual information minimisation approach for a class of nonlinear recurrent separating systems[C]//IEEE Workshop on Machine Learning for Signal Processing,2007:122- 127.
[8] DOUGLAS S C.Blind Signal Separation and Blind Deconvolution [M].New York:Academic Press,2002.
[9] CICHOCKI A,AMARI S.Adaptive Blind Signal and Image Processing: Learning Algorithms and Applications [M].LTD:John Wiley and Sons,2002.
[10]CHOI S.Blind source separation and independent component analysis: a review [J].Neural Information Processing Letters and Reviews,2005,6(1):1-57.
[11]MOGHAWEMI M,MEHRKANOON S.Detection of the onset of epileptic seizuresignal from scalp EEG using blind signal separation[C]//Biomedical Engineering——Applications,Basis and Communications,2009:287-290.
[12]胡英.盲源分離算法研究及其在圖像處理中的應(yīng)用[D].上海:上海交通大學(xué),2003.
[13]TULKR M,PENTLAND A.Face recognition using eigenfaces[C]// Proceedings of IEEE Conferences on Computer Vision and Patten Recognition,1991:586- 591.
[14]張安清,秋天爽.章新華.擴(kuò)展聯(lián)合對(duì)角化法的水聲信號(hào)盲分技術(shù)[J].統(tǒng)工程與電子技術(shù),2003,25(9):1058- 1083.
[15]HERAULT J,JUTTEN C.Space or time adaptive signal processing by neural network models[C]//Proceedings of The AIP Netural Networks for Computing,1986:206-211.
[16]CARDOSO J F.Source separation using higher order moments[C]//Acoustics,Speech and Signal Processing,1989 International Conference on IEEE,1989:2109- 2112.
[17]COMON P.Separation of sources using higher-order cumulants[C]//33rd Annual Techincal Symposium.International Society for Optics and Photonics,1989:170-183.
[18]GEORGIEV P,THEIS F,CICHOCKI A.Sparse component analysis and blind source separation of underdetermined mixtures[J].IEEE Transactions on Netural Networks,2005,16(4):992-996.[19]KIM S G, YOO C D. Underdetermined blind source separation based on subspace representation[J].IEEE Transactions on Signal Processing,2009,57(7):2604- 2614.
[20]HOFFMANN E,KOLOSSA D,BERT K,et al.Using information theoretic distance measures for solving the permutation problem of blind source separation of speech signals[J].European Association for Signal Processing Journal on Audio,Speech and Music Processing,2012,14(1):1-14.
[21]劉琨,杜利民,王勁林.基于時(shí)頻域單源主導(dǎo)區(qū)的盲源欠定分離方法[J].中國(guó)科學(xué):E輯,2008,38(8):1284- 1301.
[22]張燁,方勇.基于平面聚類(lèi)勢(shì)函數(shù)法的欠定混合信號(hào)盲分離[J].高技術(shù)通訊,2010(8):810-815.
[23]歐世峰,高穎,趙曉暉.自適應(yīng)組合型盲源分離算法及其優(yōu)化方案[J].電子與信息學(xué)報(bào),2011(5):1243- 1247.
[24]熊坤來(lái),柳征,姜文利.基于陣列接收模型的寬帶盲源分離算法[J].系統(tǒng)工程與電子技術(shù),2014,36(4):613- 618.
Present Situation and Development of Blind Source Separation
PENG Sai-yang,WANG Zhen-hua,ZHU Yuan-qing
(Air Force Early Warning Academy,Wuhan 430019,China)
As a new research field intersecting with information theory,signal processing,artificial neural network,probability theory and other subjects,blind source separation (BSS) gets eager attention of scholars.This paper expatiates the concept of BBS,introduces its classification,analyzes its application field,summarizes its development status and trend at home and abroad,and prospects the future of BSS.
blind source separation;signal processing;muli-input multi-output
2015-11-02
TN971.1
A
CN32-1413(2016)03-0054-04
10.16426/j.cnki.jcdzdk.2016.03.014