劉柏森,蘇凌峰,葉樹江
(1.黑龍江工程學院 電氣與信息工程學院,黑龍江 哈爾濱150050,2.中船重工第七研究院,北京100192)
為了在強噪聲環(huán)境下,從含噪語音信號中獲得盡可能純凈的語音信號,提高語音處理系統(tǒng)的穩(wěn)定性,降低噪聲對系統(tǒng)的影響,目前切實可行的辦法就是對信號進行語音增強,來減少噪音對系統(tǒng)的干擾[1]。語音增強可以提高語音處理系統(tǒng)的抗噪聲能力和輸入信號的信噪比,它是語音信號處理與識別系統(tǒng)的重要組成部分,而且在解決噪聲干擾、改進帶噪語音信號的質(zhì)量、提高語音的可懂度等方面發(fā)揮著非常重要的作用。因此,尋求一種有效的語音增強算法對帶噪語音信號進行處理具有重要的研究價值。
采用極值域均值模式分解算法[2]進行語音增強處理是一種很有效的方法。如果信號間的能量和頻率比例過大,極值域均值模式分解算法不能分解出正確的單一分量,會使噪聲能量的集中性變差,出現(xiàn)多個固有模態(tài)分量都與噪聲有一定的最大相似度,噪聲能量分散使得濾波處理時可能出現(xiàn)過濾波情況。因此,提出一種極值域均值模式分解與獨立分量分析相結(jié)合的增強算法。該算法不僅可以利用極值域均值的自適應分解及分解后信號的窄帶特性,構(gòu)建欠定盲源情況的虛擬通道,解決欠定盲源情況。還可以通過對各固有模態(tài)分量進行獨立分量分析,構(gòu)造與噪聲更相近的另一路噪聲,使得處理后得到的部分獨立分量具有更大的噪聲最大相似度,更有利于噪聲的濾除,從而提高復雜環(huán)境下低信噪比語音信號的增強效果。該方法對于高斯噪聲尤其有效,中心極限定理指出:在自然界與生產(chǎn)中,一切現(xiàn)象受到許多相互獨立的隨機因素的影響,如果每個因素所產(chǎn)生的影響都很微小時,總的影響可以看作是服從正態(tài)分布,所以提高高斯噪聲干擾下的低信噪比語音信號信噪比有著重要的意義。
獨立分量分析(Independent Component Analysis,ICA)是一種較為有效的盲源分離算法,它廣泛應用于語音信號處理、信號分析、通信、陣列信號處理、生物醫(yī)學信號處理及過程控制的信號去噪和特征提取等領(lǐng)域,還可以用于數(shù)據(jù)挖掘?;镜莫毩⒎至糠治鍪侵笍亩鄠€源信號的線性混合信號中分離出源信號的技術(shù)。除了已知源信號是統(tǒng)計獨立外,無其他先驗知識。但是獨立分量分析的主要假設(shè)條件是:觀測信號的數(shù)目一定要大于等于源信號數(shù)目,這種情況稱之為非欠定情況。一方面這種假設(shè)與分離的“盲”性是沖突的;另一方面,在許多實際問題中,如語音傳輸、識別等情況下,都屬于欠定盲源情況。
1.1.1 獨立分量分析基本問題
設(shè)A是一個M×N維矩陣,一般稱為混合矩陣(Mixing Matrix)。設(shè)有N 個未知的源信號si(t),i=1~N,構(gòu)成一個列向量S(t)=[s1(t),s2(t),…,sN(t)]T,其中t是離散時間點,取值為0,1,2,…。設(shè)x(t)=[x1(t),x2(t),…,xM(t)]T是由 M 個可觀測信號xi(t)構(gòu)成的列向量,這里i=1~M,且滿足方程[3-5]:
對任何時刻t,在A未知的條件下,根據(jù)已知的x(t)求未知的S(t),這就是BSS命題。這樣就構(gòu)成了一個無噪聲的盲信號分離問題。由于不能直接觀察到分量si(t),所以式(1)中的As(t)是一種統(tǒng)計“隱藏變量”模型,si(t)是隱藏的變量。
獨立分量分析就是按照以下基本假設(shè)條件來解決BSS問題。這些基本假設(shè)條件是[6]:
1)各源信號之間統(tǒng)計獨立,si(t)均為0均值、實隨機變量;
2)源信號中至多只能有一個信號源是高斯型信源;
3)觀測信號數(shù)N不小于源信號數(shù)M,即N≤M,這時混合矩陣A是一個確定且未知的N×N維方陣;
4)關(guān)于各源信號的概率密度略有一些先驗知識;
5)各觀測器噪聲很小,可以忽略不計。用式(1)描述源信號與觀測信號之間的關(guān)系。
1.1.2 獨立分量分析主要思路
設(shè)置一個N×N維反混合矩陣B,x(t)經(jīng)過B變換后得到N 維列向量輸出y(t)=[y1(t),y2(t),…,yN(t)],這是ICA的思路,即
通過學習,如果可以實現(xiàn)BA=I(I是N×N維單位陣),則y(t)=s(t),從而源信號分離的目標得以實現(xiàn)。這一學習只能是自組織的,因為沒有任何參照目標。由于是自組織的,那么建立一個以B為變元的目標函數(shù)J(B),如果某個^Β能使J(B)達到極大或極小值,該B即為所需的解,這是它的過程的第一步[7]。第二步即是用一種有效的算法求^Β,也稱優(yōu)化算法[8]。
只有一路有效的觀測信號,即一路低信噪比語音信號,從理論上來說是不能應用獨立分量分析來處理的。為了得到足夠的觀測信號,首先對已檢測的語音信號進行極值域均值模式分解。得到一組固有模態(tài)分量和一個殘余分量,由于這組固有模態(tài)分量與信號源、噪聲源都存在一定的關(guān)系。故初步嘗試將該組固有模態(tài)分量作為觀測信號。為驗證極值域均值模式分解得到的固有模態(tài)分量是否滿足獨立分量分析的假設(shè)條件,將這幾個固有模態(tài)分量進行相關(guān)運算,通過相關(guān)系數(shù)觀察其獨立性。
測試語音為“聲源1”,各模態(tài)分量的相關(guān)系數(shù)為CC(Correlation Coefficient),含噪語音信號(S1)與各固有模態(tài)分量之間的相關(guān)系數(shù)見表1。
表1 含噪語音信號與各固有模態(tài)分量的相關(guān)系數(shù)
而通過表1可以看到,含噪語音信號與各模態(tài)分量的相關(guān)系數(shù)有的較大,有的較小,它們的獨立性較弱。據(jù)此,可以推斷各固有模態(tài)分量滿足獨立分量分析的假設(shè)條件——各源信號之間統(tǒng)計獨立。
下面分析各固有模態(tài)分量與純凈語音信號(S0)和噪聲信號(Noise)與各固有模態(tài)分量的相關(guān)系數(shù)。通過表2可以看出,不是所有固有模態(tài)分量都與純凈語音信號相關(guān)系數(shù)很大,只有中間幾個相關(guān)系數(shù)較大。從表3可以看出,第一個和第二個固有模態(tài)分量與噪聲相關(guān)系數(shù)較大。如果對IMF1、IMF2、IMF3直接進行濾波處理,雖然可以起到降低噪聲的目的,但同時也會誤處理語音信號。為了盡可能減少誤處理情況,進一步集中噪聲能量,對某些固有模態(tài)分量進行獨立分量分析。
表2 純凈語音信號與各固有模態(tài)分量的相關(guān)系數(shù)
表3 噪聲信號與各固有模態(tài)分量的相關(guān)系數(shù)
由于在處理實際信號時,無法實現(xiàn)準確地得到摻雜在語音段的噪聲信號,所以在選取獨立分量的觀測量時,還是要通過最大相似度進行選取,即通過表4選取。
表4 噪聲信號與各固有模態(tài)分量的最大相似度
在選取固有模態(tài)分量時,并不是將所有固有模態(tài)分量作為觀測量,因為雖各固有模態(tài)分量都有可能存在噪聲分量,但通過最大相似度篩選出部分噪聲成分較多的固有模態(tài)分量作為觀測量,這里選擇前4個作為觀測量。這樣處理的另外一個好處是可以減少獨立分量分析的運算量,有效防止無法收斂現(xiàn)象的發(fā)生。
通過表5可以看出,ICA1、ICA2與IMF1、IMF4的最大相似度差別不大,但ICA3的最大相似度顯著提高,ICA4的最大相似度顯著下降,這意味著有一個分量的噪聲能量顯著上升,一個顯著下降。在濾波過程中,可以對ICA4不作處理,這樣可以有效地保留語音信號,對ICA1、ICA2、ICA3進行時域濾波處理。由于獨立分量分析的結(jié)果具有幅值和位置的不確定性,而且對于語音增強而言,不能只觀察噪聲的變化規(guī)律,還要保證語音信號的重構(gòu),故這里對獨立分量分析的結(jié)果進行逆變換,重構(gòu)固有模態(tài)分量,再利用重構(gòu)的固有模態(tài)分量和未處理的固有模態(tài)分量重構(gòu)語音信號,即兩度重構(gòu)。
表5 獨立分量分析結(jié)果與噪聲的最大相似度
根據(jù)以上分析,制定基于極值域均值模式分解與獨立分量分析的語音增強步驟:
1)對檢測到的含噪語音信號進行極值域均值模式分解;
2)設(shè)定閾值,選取部分固有模態(tài)分量作為獨立分量分析的觀測信號;
3)對觀測信號進行獨立分量分析(fastICA算法[9-10]);
4)對獨立分量分析的結(jié)果進行最大相似度計算,篩選出需要處理的分量;
5)對篩選出的分量進行時域閾值濾波;
6)對經(jīng)處理后的獨立分量分析結(jié)果進行兩度重構(gòu),得到增強后信號。
在高斯噪聲環(huán)境下,基于極值域均值模式分解與獨立分量分析相結(jié)合的增強算法來進行實驗,結(jié)果如圖1所示。
圖1 當SNR=0dB時語音增強結(jié)果
通過圖1~圖3可以看出本文方法的有效性,再從客觀評價的角度進一步分析一下本文方法。通過表6可以看出,輸入信噪比為0dB情況下,經(jīng)本文方法增強處理后信噪比提高了近11dB,在輸入信噪比為-8dB情況下,提高了12dB。
表6 基于改進的方法分析語音增強結(jié)果
圖4是基于極值域均值模式分解與獨立分量分析相結(jié)合的方法同基于極值域均值模式分解最大相似度語音增強方法、改進小波算法的對比圖。橫坐標是輸入信噪比,縱坐標是增強后的輸出信噪比?!皁”代表本文提出的方法,“x”代表基于極值域均值模式分解最大相似度語音增強方法,“*”代表改進小波的方法??梢钥闯霰疚奶岢龅姆椒ㄍㄟ^對固有模態(tài)進行獨立分量分析后,提高了某些固有模態(tài)與噪聲的最大相關(guān)度,這十分有利于噪聲的濾除。通過實驗結(jié)果證實了這一算法的效果,本文方法在增強結(jié)果上略優(yōu)于基于極值域均值模式分解最大相似度語音增強方法,優(yōu)于改進的小波算法。但是由于引入了獨立分量分析,故在計算速度上有所降低,而且獨立分量分析存在不收斂的風險。
圖4 高斯噪聲環(huán)境下3種增強方法
通過引入獨立分量分析算法,增加了極值域均值模式分解后部分模態(tài)分量的獨立性,構(gòu)造了與噪聲相似度更高的分量,從而克服了對固有模態(tài)分量的過濾波。在選取觀測量時,通過最大相似度采用部分選取的方式,這樣即提高了效率,又降低了獨立分量分析有可能存在不收斂的風險。實驗表明,該算法可以實現(xiàn)分解后噪聲能量比較分散情況下的低信噪比語音增強,同時該算法還可以有效提高高斯噪聲等環(huán)境下的增強效果。
[1]Beritelli F.,Casale S.,Serrano S..Adaptive Robust speech processing based on acoustic noise estimation and classification.Proceedings of the Fifth IEEE International Symposium on Signal Processing and Information Technology[C].2005:773-777.
[2]S.D.Hawley,L.E.Atlas,H.J.Chizeck.Some Properties of an Empirical Mode Type Signal Decomposition Algorithm.IEEE Signal Processing Letters[C].2010,17(1):24-27.
[3]ChengM Y,Su K H,Wang S F.Contourerror reduction for free form contour following tasks of biaxial motion control system.Robotics and Computer Integrated Manufacturing[M].2009,25:323-333.
[4]Lee T W,Girolami M,Sejnowski T J.Independent component analysis using an extended infomax algorithm for mixed subgaussian and supergaussian sourees[J].Neural Computation,1999,11:417-441.
[5]劉據(jù),何振亞.利用高階累積量和獨立分量分析網(wǎng)絡(luò)進行盲均衡與系統(tǒng)辨識[J].數(shù)據(jù)采集與處理,1998,13(3):201-205.
[6]P.Comon.Independent component analysis.Internat.Signal Processing workshop on High-order Statistics[M].Chamrousse,F(xiàn)ranee,1991(7):111-120.
[7]Du X,Li Y,Zhu Y,et al.Removal of artifacts from EEG signal.Sheng Wu Yi Xue Gong Cheng Xue Za Zhi[J].2008,25(2):464-467,471.
[8]Hyvarinen A and Oja E.A fast fixed-point algorithm for independent component analysis.Neural Computation[J].1997,9(7):1483-1492.