徐進(jìn),趙益波,郭業(yè)才
1.南京信息工程大學(xué)電子與信息工程學(xué)院,南京210044 2.江蘇省大氣環(huán)境與裝備技術(shù)協(xié)同創(chuàng)新中心,南京210044
一種新的麥克風(fēng)陣列自適應(yīng)語音增強(qiáng)方法
徐進(jìn)1,2,趙益波1,2,郭業(yè)才1,2
1.南京信息工程大學(xué)電子與信息工程學(xué)院,南京210044 2.江蘇省大氣環(huán)境與裝備技術(shù)協(xié)同創(chuàng)新中心,南京210044
在復(fù)雜的語音環(huán)境中,利用麥克風(fēng)陣列語音增強(qiáng)技術(shù)能有效地拾取目標(biāo)語音信號并消除噪聲干擾,但傳統(tǒng)的麥克風(fēng)陣列波束形成的加權(quán)系數(shù)是固定的.為了能靈活地控制麥克風(fēng)陣列波束的形成方向以及消除其波束旁瓣帶來的殘余噪聲,提出了一種基于麥克風(fēng)陣列的自適應(yīng)語音增強(qiáng)技術(shù).該技術(shù)將自適應(yīng)濾波器和麥克風(fēng)陣列相結(jié)合形成波束可控的廣義旁瓣消除器,然后在廣義旁瓣消除器后面續(xù)接一個(gè)改進(jìn)的譜減法,并加入契比雪夫窗函數(shù).仿真實(shí)驗(yàn)結(jié)果表明,所提出的語音增強(qiáng)方法能有效去除語音信號中的噪聲干擾,相比于傳統(tǒng)廣義旁瓣消除器,信噪比大約提高了3.5 dB.
麥克風(fēng)陣列;自適應(yīng)濾波;改進(jìn)廣義旁瓣消除器;譜減法;語音增強(qiáng)
在語音通信過程中,實(shí)際環(huán)境中的干擾噪聲會(huì)嚴(yán)重影響目標(biāo)語音信號的獲取,致使得到的信號不再是純凈的語音信號.如果干擾噪聲的幅度過大,拾取的語音信號就變得模糊不清并夾有刺耳的噪聲,從而影響聽覺效果.這時(shí)可以利用語音增強(qiáng)方法來去除背景噪聲和干擾,以獲取較純凈的目標(biāo)語音信號.
麥克風(fēng)陣列能夠充分利用語音信號的空域、時(shí)域和頻域信息,同時(shí)具有高空間分辨率、高信號增益與較強(qiáng)的抗干擾能力等特點(diǎn).目前,已經(jīng)形成了較成熟的麥克風(fēng)陣列語音增強(qiáng)技術(shù),如固定波束形成法[1]、廣義旁瓣對消法[2]等.在傳統(tǒng)的麥克風(fēng)陣列技術(shù)基礎(chǔ)上引入自適應(yīng)濾波[3]可靈活而有效地實(shí)現(xiàn)波束控制,進(jìn)一步改善語音增強(qiáng)效果.自適應(yīng)濾波是至今為止最廣泛、最有效的語音增強(qiáng)方法之一,該方法只需要很少的或根本不需要任何關(guān)于信號和噪聲統(tǒng)計(jì)特性的先驗(yàn)知識,僅憑觀測信息就能實(shí)時(shí)估計(jì)信號和噪聲的統(tǒng)計(jì)特性,自動(dòng)調(diào)節(jié)權(quán)系數(shù)達(dá)到最佳濾波的要求.
在自適應(yīng)濾波算法中,最小均方算法(least meansquare,LMS)是一種最典型的自適應(yīng)算法,雖然較遞歸最小二乘法(rcursive least squares,RLS)的收斂速度慢,但是簡單而便于實(shí)時(shí)實(shí)現(xiàn).經(jīng)自適應(yīng)濾波后的語音信號還伴有背景噪聲或其他難以去除的噪聲,這些噪聲可用譜減法加以消除.譜減法[4]作為一種單通道語音增強(qiáng)方法,因具有簡單方便和計(jì)算量小等優(yōu)點(diǎn)而在語音增強(qiáng)中很受歡迎,但在去除背景噪聲的同時(shí)會(huì)產(chǎn)生刺耳的難以消除的“音樂”噪聲.它的存在嚴(yán)重影響聽覺效果,甚至造成語音內(nèi)容的誤解,故應(yīng)避免用傳統(tǒng)方法來估計(jì)噪聲功率.文獻(xiàn)[5]則利用改進(jìn)譜減法估計(jì)噪聲功率,減少了音樂噪聲,改善了聽覺效果.
本文提出一種基于麥克風(fēng)陣列技術(shù)的語音增強(qiáng)方法,該方法結(jié)合自適應(yīng)濾波與譜減法,同時(shí)加入了契比雪夫窗函數(shù)[6],對不同入射角度的期望信號實(shí)現(xiàn)波束控制,可以通過后續(xù)的譜減法進(jìn)一步去除殘余噪聲,因此提高了信噪比,改善了語音質(zhì)量.
麥克風(fēng)陣列對獲取的多路信號進(jìn)行分析處理,使陣列形成的波束主瓣指向期望信號的來波方向而在干擾信號方向形成零陷,于是在獲取目標(biāo)信號的同時(shí)又可以最大程度地抑制干擾,提高了信號輸出信噪比.波束方向圖與主瓣波束寬度、麥克風(fēng)的間距、數(shù)目、擺放位置、聲源的入射角度及采樣頻率有關(guān).利用麥克風(fēng)陣列波束形成技術(shù)不僅解決了在使用單個(gè)麥克風(fēng)時(shí)需要人為不斷調(diào)節(jié)麥克風(fēng)指向性的問題,而且大大提高了輸出信噪比,也不必人工干預(yù)調(diào)節(jié)麥克風(fēng),因此很容易獲取純凈的目標(biāo)信號[7].
1.1基于延時(shí)-累加的麥克風(fēng)陣列語音增強(qiáng)
延時(shí)-累加方法實(shí)現(xiàn)語音增強(qiáng)是通過對目標(biāo)聲源到達(dá)每個(gè)麥克風(fēng)的時(shí)間進(jìn)行估計(jì)的,根據(jù)到達(dá)每個(gè)麥克風(fēng)的時(shí)間差對各路信號進(jìn)行時(shí)延補(bǔ)償,經(jīng)補(bǔ)償后的各路信號是同步的.然后通過固定加權(quán)系數(shù)乘積累加得到輸出,此時(shí)麥克風(fēng)陣列形成的波束方向指向期望信號,對期望信號進(jìn)行最大程度的獲取,并削弱噪聲和其他語音信號干擾的影響.
1.2后置維納濾波的麥克風(fēng)陣列語音增強(qiáng)
為了進(jìn)一步消除經(jīng)固定波束形成法處理后語音中的非相干噪聲,文獻(xiàn)[8]提出了在波束形成器后增加后置維納濾波的結(jié)構(gòu).維納濾波器的權(quán)系數(shù)是根據(jù)各麥克風(fēng)接收信號間的自相關(guān)和互相關(guān)得到的,即維納濾波器的權(quán)系數(shù)隨接收信號的變化而變化.
1.3麥克風(fēng)陣列自適應(yīng)語音增強(qiáng)
基于麥克風(fēng)陣列自適應(yīng)語音增強(qiáng)方法依據(jù)陣列接收到的信號統(tǒng)計(jì)特性的變化來自適應(yīng)地調(diào)整濾波器權(quán)系數(shù),使得麥克風(fēng)陣列的波束主瓣始終對準(zhǔn)期望信號方向,“零點(diǎn)”指向干擾噪聲的方向.自適應(yīng)方法的應(yīng)用提高了麥克風(fēng)陣列的適應(yīng)性,能夠?qū)崿F(xiàn)時(shí)變語音環(huán)境下純凈語音信號的提取.
利用自適應(yīng)波束形成方法來實(shí)現(xiàn)語音增強(qiáng)是目前最常用的一種方法.最早的自適應(yīng)波束形成算法是由文獻(xiàn)[9]提出的線性約束最小方差(linearly constrained minimum variance,LCMV)波束形成器,其基本原理是在一些約束條件下(目標(biāo)信號為單位增益約束,其他干擾信號方向形成零陷)使陣列的輸出功率最小,即輸出信號中干擾噪聲的功率最小.在此基礎(chǔ)上,文獻(xiàn)[10]提出了廣義旁瓣抵消器(generalized sidelobe canceller,GSC),其結(jié)構(gòu)原理如圖1所示.
圖1 GSC系統(tǒng)框圖Figure 1 System block diagram of GSC
利用廣義旁瓣抵消器結(jié)構(gòu)來實(shí)現(xiàn)多通道目標(biāo)語音信號增強(qiáng)是目前使用較廣泛的一種方法,很多現(xiàn)有的自適應(yīng)陣列語音增強(qiáng)技術(shù)都是基于此結(jié)構(gòu)進(jìn)行改進(jìn)的.圖2為本文提出的改進(jìn)型廣義旁瓣抵消器,主要由延時(shí)-累加波束形成器、阻塞矩陣、改進(jìn)的多通道噪聲抵消器和譜減法組成.
延時(shí)-累加波束形成器對期望方向的目標(biāo)語音信號進(jìn)行增強(qiáng),而對其他方向的干擾噪聲進(jìn)行抑制.阻塞矩陣對目標(biāo)信號進(jìn)行阻塞使其輸出為干擾和噪聲信號的組合,并為延時(shí)-累加波束形成器輸出信號中的殘余噪聲提供參考信號.改進(jìn)的多通道噪聲抵消器根據(jù)噪聲參考信號估計(jì)出延時(shí)-累加波束輸出信號中的噪聲信號,以此獲得較純凈的目標(biāo)語音信號.改進(jìn)的譜減法可以進(jìn)一步去除期望方向上殘余的干擾噪聲信號,以實(shí)現(xiàn)目標(biāo)信號的增強(qiáng).
圖2 改進(jìn)GSC系統(tǒng)框圖Figure 2 System block diagram of the improved GSC
在圖2中,上支路輸出為
式中,A=C(CHC)-1f為權(quán)系數(shù)向量,C為約束矩陣,f為對應(yīng)的約束響應(yīng)向量.權(quán)系數(shù)向量A隨目標(biāo)信號方向的變化而變化.下支路結(jié)構(gòu)中含有一個(gè)阻塞矩陣和一個(gè)自適應(yīng)K階FIR濾波器.經(jīng)過時(shí)延補(bǔ)償后,每個(gè)通道中的信號在時(shí)間上是同步的,要實(shí)現(xiàn)阻塞矩陣輸出信號中不含期望信號,只要保證阻塞矩陣中每一行元素之和為0即可.經(jīng)阻塞矩陣處理后的輸出信號為
式中,bm為阻塞矩陣B中的第m列元素向量,對于所有的m值,滿足式(3)
式中,bm是相互線性獨(dú)立的,阻塞矩陣輸出信號U(n)最多由M-1個(gè)線性獨(dú)立的元素組成.經(jīng)阻塞矩陣處理后的輸出信號再經(jīng)自適應(yīng)FIR濾波器處理,得到輸出信號
式中,WK=[w1(n),w2(n)···wK(n)]T,U(n)=[u1(n),u2(n)···uK(n)]T.上支路的輸出減去下支路的輸出,便可以得到處理后較純凈的語音信號為
由于y1(n)中不含期望信號而只是干擾和噪聲信號的組合,麥克風(fēng)陣列結(jié)構(gòu)對語音信號的處理都集中在yc(n)中.于是尋找合適的濾波器權(quán)系數(shù)Wk(n),使得最終的輸出功率最小.改進(jìn)的LMS自適應(yīng)濾波算法的權(quán)矢量按式(6)和(7)進(jìn)行調(diào)整
圖2中改進(jìn)的LMS算法由式(4)~(9)給出,相比于圖1中固定步長的傳統(tǒng)LMS算法,本文提出的改進(jìn)LMS算法不但具有更快的收斂速度,而且兼顧了穩(wěn)態(tài)失調(diào)信號,從而使最終的去除噪聲效果更好.處理隨機(jī)噪聲時(shí),改進(jìn)的LMS算法可以快速更新權(quán)系數(shù)來實(shí)時(shí)跟蹤隨機(jī)信號,并不斷對帶噪隨機(jī)信號進(jìn)行濾波,即改進(jìn)的LMS算法在一定程度上適用于非平穩(wěn)隨機(jī)信號的去噪處理.
為了進(jìn)一步去除殘余噪聲,在提取的輸出信號y2后續(xù)接一個(gè)譜減法.譜減法基于短時(shí)平穩(wěn)假定對帶噪語音信號進(jìn)行傅里葉變換和重疊分幀處理,將每幀信號功率減去估計(jì)的噪聲功率得到純凈語音信號功率,并根據(jù)人耳對語音信號的幅度比較敏感而對語音的相位不敏感這一特性,就可以用含有噪聲的語音信號的相位代替純凈語音信號的相位;然后對純凈語言信號進(jìn)行傅里葉逆變換即可得到增強(qiáng)后的語音信號,具體實(shí)現(xiàn)框圖見圖3.
圖3 譜減法系統(tǒng)框圖Figure 3 System block diagram of the spectral subtraction
在利用譜減法對y2進(jìn)行進(jìn)一步去噪時(shí),最重要的是估計(jì)每一幀噪聲功率.最常用的估計(jì)方法是假設(shè)帶噪語音信號的前幾幀是只含有噪聲而不含期望信號的.對這幾幀信號取功率平均作為整個(gè)語音段的噪聲功率,但最終的實(shí)驗(yàn)效果并不好,會(huì)產(chǎn)生“音樂”噪聲,影響聽覺效果.利用一階低通濾波器得到噪聲的功率為
式中,0<σ<1,K為帶噪語音總幀數(shù).通過估計(jì)得到每幀噪聲功率后便可求得每幀純凈語音功率
式中,α>1,β?1.在噪聲段保留一定的噪聲,可以取得較好的降噪及抑制純音噪聲的效果,改善聽覺效果.
仿真實(shí)驗(yàn)是在MATLAB7.10.0環(huán)境中進(jìn)行的.為了驗(yàn)證本文方法的有效性和優(yōu)越性,比較本文方法與經(jīng)典GSC語音增強(qiáng)算法.仿真實(shí)驗(yàn)時(shí),內(nèi)容為男生朗讀的“第1課認(rèn)識新同學(xué)”,加入方向性干擾噪聲的同時(shí)還考慮接收過程中的隨機(jī)噪聲.假設(shè)期望信號方向?yàn)?0?,干擾方向?yàn)?0?,得到的仿真結(jié)果如圖4~10所示.其中,圖4~6分別給出了純凈語音信號、方向性干擾信號和麥克風(fēng)接收信號.圖7和8分別為GSC與改進(jìn)GSC處理后的信號.圖9和10分別為GSC與本文方法波束比較圖和本文方法處理后的方向圖(加入契比雪夫窗函數(shù)).
由仿真實(shí)驗(yàn)結(jié)果可以看出,純凈的語音信號進(jìn)入麥克風(fēng)陣列時(shí)會(huì)受到方向性干擾和噪聲的影響,同時(shí)還伴有來自麥克風(fēng)的隨機(jī)噪聲,因此麥克風(fēng)陣列接收到的語音信號受到了很大干擾.從圖7中可以看出,GSC雖然去除了方向性干擾噪聲,但是還有殘留的背景噪聲無法去除,而本文改進(jìn)的GSC結(jié)構(gòu)不但去除了方向性干擾噪聲信號,同時(shí)還進(jìn)一步去除了背景噪聲和與期望信號同方向的干擾噪聲.對比圖7和8可以明顯看出,本文改進(jìn)的GSC結(jié)構(gòu)去噪能力比傳統(tǒng)GSC提高了很多,降噪效果更好.加入的契比雪夫窗函數(shù)可以進(jìn)一步降低旁瓣.從圖9和10中可以看出,10?方向的目標(biāo)信號可以完全接收,而其他方向的信號增益很小或幾乎為零.
圖4 純凈語音信號Figure 4 Pure speech signal
圖5 方向性干擾信號Figure 5 Directional interference signal
圖6 麥克風(fēng)接收信號Figure 6 Received signal of the microphone
圖7 GSC處理后的信號Figure 7 Processed signal via the GSC
圖8 改進(jìn)GSC處理后的信號Figure 8 Processed signal via the improved GSC
圖9 GSC與本文方法波束比較圖Figure 9 Beam comparison graph between GSC and the proposed method
圖10 改進(jìn)后的方向圖Figure 10 Improved pattern
本文研究了麥克風(fēng)陣列自適應(yīng)語音增強(qiáng)方法,在麥克風(fēng)陣列技術(shù)基礎(chǔ)上引入自適應(yīng)濾波和譜減法,相比于傳統(tǒng)麥克風(fēng)陣列GSC噪聲消除法,本文方法可以針對任意角度信號,后續(xù)譜減法可以進(jìn)一步去除殘余噪聲提高了系統(tǒng)整體去噪能力.仿真結(jié)果表明,本文方法比傳統(tǒng)GSC方法更優(yōu)越,信噪比提高了大約3.5 dB.
[1]耿慧慧.基于麥克風(fēng)陣列語音增強(qiáng)研究[D].邯鄲:燕山大學(xué),2013:13-15.
[2]SEUNGHO H,JUNGPYO H,SANGBAE J.Robust GSC-based speech enhancement for human machine interface[J].IEEE Transactions on Consumer Electronics,2010,56(2):965-970.
[3]CHIH C Y.Adaptive microphone array based flter in the speech enhancement[C]//Networked Computing and Advanced Information Management,7th International Conference on IEEE,2011,23(3):237-242.
[4]KULDIP P,KAMIL W,BELINDA S.Single-channel speech enhancement using spectral subtraction in the short-time modulation domain[J].Speech Communication,2010,52(5):450-475.
[5]TAKAHSHI Y,AKATANI T,OSAKO K.Blind spatial subtraction array for speech enhancement in noisy environment[J].IEEE Transactions on Audio,Speech and Language Processing,2009,17(4):650-644.
[6]楊國裕.線性相位契比雪夫數(shù)字濾波器的時(shí)窗函數(shù)[J].數(shù)據(jù)采集與處理,1995,29(4):12-19. YANG G Y.Window function of linear phase Chebyshev digital flter[J].Journal of Data Acquisition&Processing,1995,29(4):12-19.(in Chinese)
[7]ADAM B.Signal subspace approach for psychoacoustically motivated speech enhancement[J]. Speech Communication,2010,53(2):210-219.
[8]GANNOR S,COHEN L.Speech enhancement based on the general transfer function GSC and post-fltering[J].IEEE Transactions on Speech and Audio Processing,2004,12(6):561-571.
[9]HABEST E A P,BENSETY J,GANNOT S.On the application of the LCMV beamformer to speech enhancement[J].IEEE Applications of Signal Processing to Audio and Acoustics,2009,10:18-21.
[10]HAN S,HONG J,JEONG S,HAHN M.Robust GSC-based speech enhancement for human machine interface[J].IEEE Transactions on Consumer Electronic,2010,56(2):965-970.
(編輯:王雪)
Adaptive Speech Enhancement for Microphone Array
XU Jin1,2,ZHAO Yi-bo1,2,GUO Ye-cai1,2
1.School of Electronic&Information Engineering,Nanjing University of Information Science and Technology,Nanjing 210044,China 2.Jiangsu Collaborative Innovation Center on Atmospheric Environment and Equipment,Nanjing 210044,China
In a complex speech environment,microphone array speech enhancement techniques can efectively extract target speech signals and eliminate noise.In a conventional microphone array,the beam forming weighting coefcients are fxed.To fexibly control the beam forming direction of the microphone array and eliminate residual noise due to side-lobes,this paper presents an adaptive enhancement technique for microphone array speech.A microphone array with an adaptive flter is used to form a controllable generalized sidelobe canceller(GSC),followed by improved spectral subtraction with a Chebyshev window function.Simulation results show that the proposed method can efectively remove noise,improving the performance by about 3.5 dB with respect to the ordinary GSC.
microphone array,adaptive flter,improved generalized sidelobe canceller(GSC),spectral subtraction,speech enhancement
TN912
0255-8297(2015)02-0187-07
10.3969/j.issn.0255-8297.2015.02.008
2014-10-08;
2014-12-06
國家自然科學(xué)基金(No.51077057);江蘇高校優(yōu)勢學(xué)科建設(shè)工程項(xiàng)目基金;江蘇省高校自然科學(xué)基金(No.14KJB120007);南京信息工程大學(xué)基金預(yù)演項(xiàng)目基金(No.2013x007);優(yōu)秀博士論文作者專項(xiàng)資金(No.27122)資助
趙益波,博士,講師,研究方向:非線性電路系統(tǒng)與自適應(yīng)信號處理.E-mail:yibozhaodn@163.com