国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

麥克風陣列的協同自適應濾波語音增強方法

2019-05-09 06:46趙益波楊蕾嚴濤李春彪
現代電子技術 2019年8期
關鍵詞:麥克風高斯濾波器

趙益波,楊蕾,嚴濤,李春彪

(1.南京信息工程大學 電子與信息工程學院,江蘇 南京 210044;2.江蘇省大氣環(huán)境與裝備技術協同創(chuàng)新中心,江蘇 南京 210044)

0 引言

單麥克風只能拾取一路信號,一般不能隨聲波一起運動,而且由于說話人的一些運動,使得基于單麥克風的語音增強效果并不理想[1]。麥克風陣列具有空間選擇性,可以用“電子瞄準”的方式從所需的聲源位置獲得高品質的信號,同時抑制其他說話人的干擾聲音和環(huán)境噪聲,可以取得明顯的消噪效果[2]。麥克風陣列不要求在聲源本地放置傳感器,也不會隨著說話人的移動來移動麥克風位置以改變接收方向[3]。這些特性有利于其獲得多個或移動聲源,并且可用于一些特殊的場合[4]。

自適應濾波具有自適應性,在系統(tǒng)辨識、語音信號處理、圖像處理等方面有著廣泛的應用[5]?;趶V義旁瓣抵消器(Generalized Sidelobes Canceller,GSC)的麥克風陣列自適應語音增強方法是將麥克風陣列和自適應濾波技術結合起來的語音增強方法。該方法根據麥克風陣列接收的信號統(tǒng)計特性的變化來調整濾波器的系數[1],對目標信號以外的信號進行濾除;同時提高了麥克風陣列的自適應性,能夠在時變的語音環(huán)境中仍能實時跟蹤目標信號[6]。在實際應用中,除了高斯白噪聲,還可能存在非線性噪聲,如脈沖噪聲[7]。在這種情況下,僅基于線性自適應濾波的麥克風陣列語音增強方法難以獲得好的去噪效果[8]。為此,本文提出一種新的麥克風陣列自適應濾波語音增強方法。此方法用協同自適應濾波取代線性自適應濾波,根據誤差函數同時導出線性、非線性濾波器權值系數和協同因子的更新算法;能有效地消除語音信號中的瞬時脈沖噪聲和高斯噪聲,比傳統(tǒng)的GSC優(yōu)越得多。

1 自適應GSC語音增強

圖1為麥克風陣列自適應GSC語音增強原理框圖,其由“上”“下”兩個處理模塊組成。

圖1 麥克風陣列自適應GSC語音增強原理框圖Fig.1 Principle block diagram of adaptive GSC speech enhancement based on microphone array

通過麥克風陣列采集的語音信號會出現一定的時延現象。先通過時延估計模塊對其進行時延估計,然后利用時延補償將采集到的信號進行同步,同步后的信號為X(n)=[x1(n),x2(n),…,xN(n)]T?!吧稀蹦K中加權矩陣對同步后的信號進行加權,加權系數是固定非自適應的,“上”模塊的輸出為:

式中,A=[ɑ1,ɑ2,…,ɑN]T∈RN是權系數向量,為簡單起見,滿足:

“下”模塊由阻塞矩陣和自適應濾波器構成,同步后信號經過阻塞矩陣后的輸出信號為:

阻塞矩陣相當于空間陷波器,目的是將目標信號濾除,剩下的就是干擾和噪聲部分。設表示阻塞矩陣第m行元素向量,且需滿足:

由于bm是彼此線性獨立,所以U(n)最多由N-1個線性獨立元素組成,也就是說,阻塞矩陣B的行的維數一定不超過N-1。自適應濾波輸出為:

式中,W(n)=[w1(n),w2(n),…,wN-1(n)]T。利用LMS自適應濾波算法對權值矢量進行更新:

最后輸出部分為增強后的語音信號:

式(1)~式(7)為基于線性自適應濾波的自適應GSC算法。ys(n)一般在高斯白噪聲時估計效果較好,但對于具有顯著尖峰脈沖狀波形的非線性噪聲時效果并不好,原因是線性自適應濾波在估計ys(n)過程中的非線性噪聲時存在很大局限性。

2 協同自適應濾波語音增強

實際信號在獲取和傳輸過程中會受到不同噪聲的影響而產生變化。這些噪聲除了干擾、加性的高斯噪聲外還可能存在脈沖噪聲。脈沖噪聲具有非線性特性,而線性濾波器對脈沖噪聲的平滑效果較差,非線性自適應濾波在處理這類非線性噪聲方面具有明顯的優(yōu)勢[9];但是當系統(tǒng)非線性噪聲級可忽略時,純非線性自適應濾波在處理高斯白噪聲方面退化了系統(tǒng)行為,從而產生非優(yōu)化濾波。為此,本文提出一種將線性濾波器與非線性濾波器協同組合的麥克風陣列語音增強方法。該方法既能保持線性自適應濾波處理白噪聲的優(yōu)點,也能更好地處理非線性脈沖噪聲。圖2是本文提出的麥克風陣列的協同自適應濾波麥克風陣列語音增強系統(tǒng)框圖。

圖2 麥克風陣列的協同自適應濾波語音增強系統(tǒng)框圖Fig.2 Block diagram of speech enhancement system with collaborative adaptive filtering and microphone array

在“上”模塊中,經過時延估計后進行補償使信號同步,同步后的信號仍記為X(n)=[x1(n),x2(n),…,xN(n)]T。分別對經過阻塞矩陣后的噪聲信號進行線性與非線性的濾除。雙曲正切函數tanh(?)是作為一個將輸入信號映射到范圍為(0,1)的單值函數的激活函數,目的是保證Legendre多項式自適應濾波的收斂條件[10]。激活函數tanh(?)通過后信號向量為:

向量S(n)經Legendre多項式擴展后為:

式中:

i=0,1,2,…,M為第i階Legendre多項式函數;M為Legendre多項式擴展的階數。零階、一階Legendre多項式分別為L0(x)=1,L1(x)=x,其余項由公式(10)導出。

非線性濾波器的輸出為:

式中:c0,j(n)為對應L0[sj(n)]的權值系數;ci,j(n)是對應Legendre多項式Li[sj(n)]的權值系數;i=1,2,…,M;j=1,2,…,N-1。

本文利用NLMS對自適應濾波權值進行更新,可導出權值系數遞推公式為:

式中:e(n)=d(n)-y(n)為誤差信號;d(n)為目標信號(干凈語音信號);y(n)為系統(tǒng)輸出包括“上”模塊和“下”模塊的差值;mu為調節(jié)因子;α是為了避免[sj(n)]·Li[sj(n)]過小而設定的參數,0<α<1。

分別對線性濾波器與非線性濾波器的輸出進行協同組合,自適應濾波總輸出為:

式中:ys1為線性自適應濾波器輸出;ys2為非線性自適應濾波器輸出;λi是協同因子,取:

式中μ為迭代步長。

最后處理后的增強語音輸出為:

3 仿真實驗

仿真實驗是在Matlab R2016a環(huán)境中進行的。為了證明麥克風陣列的協同自適應濾波的語音增強效果比GSC的語音增強效果好,在相同的環(huán)境中對兩種方法增強后的語音效果進行對比。其中仿真用的干凈語音信號內容為:“第一課認識新同學”,同時加入方向性干擾。期望信號的方向是30°,干擾方向為80°。由于在實際生活中,觀察到的信號除了有高斯噪聲以外,還有的信號是非高斯的,并伴有顯著的脈沖特性。為了營造較為真實的模擬環(huán)境,還加入了固定的脈沖噪聲進行測試。分別利用不同信噪比的高斯噪聲來進行仿真實驗。圖3、圖4分別為干凈語音信號和方向性干擾信號,麥克風陣列接收到的加入SNR=20 dB的高斯噪聲和脈沖噪聲的信號如圖5所示。

圖3 干凈語音信號Fig.3 Clean speech signals

圖6為加入SNR=20 dB的高斯噪聲后GSC處理后的增強語音信號。圖7為加入SNR=20 dB的高斯噪聲后麥克風陣列的協同自適應濾波增強的語音信號。對比圖6和圖7兩張圖可以看出,GSC處理后的增強語音信號中仍殘留著脈沖噪聲,而用本文所提方法處理后的增強語音信號中對脈沖進行了有效增強,效果明顯。

圖4 方向性干擾Fig.4 Directional interference

圖5 麥克風陣列接收到的帶有脈沖噪聲的信號(加入SNR=20 dB的高斯噪聲)Fig.5 Signals with impulse noise and Gaussian noise(SNR=20 dB)received by microphone array

圖6 GSC處理后的增強語音信號(一)Fig.6 Enhanced speech signals after GSC processing(Ⅰ)

圖7 麥克風陣列的協同自適應濾波處理后的增強語音信號(一)Fig.7 Enhanced speech signals after collaborative adaptive filtering processing based on microphone array(Ⅰ)

圖8為麥克風陣列接收到加入SNR=25 dB的高斯噪聲和相同脈沖噪聲的信號。圖9為加入SNR=25 dB的高斯噪聲后GSC處理的增強語音信號。圖10為加入SNR=25 dB的高斯噪聲后麥克風陣列的協同自適應濾波增強的語音信號。進一步對比圖9和圖10兩張圖可以看出,GSC處理后的增強語音信號中仍殘留著脈沖噪聲;而用本文所提方法處理后的增強語音信號中對脈沖進行了有效抑制,增強效果明顯。

圖8 麥克風陣列接收到的帶有脈沖噪聲的信號(加入SNR=25 dB的高斯噪聲)Fig.8 Signals with impulse noise and Gaussian noise(SNR=25 dB)received by microphone array

圖9 GSC處理后的增強語音信號(二)Fig.9 Enhanced speech signals after GSC processing(Ⅱ)

圖10 麥克風陣列的協同自適應濾波處理后的增強語音信號(二)Fig.10 Enhanced speech signals after collaborative adaptive filtering processing based on microphone array(Ⅱ)

上述兩組仿真均表明了所提方法的語音增強效果明顯優(yōu)于傳統(tǒng)的GSC,為了更直觀地表明本文所用方法的增強效果,用PESQ對增強后的語音進行評估。

PESQ是基于感知模型的語音質量客觀評價標準[11]。對于正規(guī)的主觀測試,得分[12]在1.0~4.5之間;在失真情況嚴重時,得分可能會低于1.0,但這種情況很少見;當語音結果與目標信號一致時,得分為4.5,也就是說得分越高,處理后的語音效果越好,清晰度也就越高。兩種方法的語音增強效果PESQ評估值如表1所示。

表1 語音增強效果PESQ評估Table 1 PESQ assessment of speech enhancement effects

從表1可以看出,所提方法相比較于GSC方法的增強能力更強,對于脈沖信號也有更強的韌性。對比圖6與圖7,GSC處理后的語音信號PESQ得分為1.709 7,而用本文方法處理后的語音信號的PESQ得分為2.178 0,整體提高0.468 3。同時對比圖9與圖10,GSC處理后的語音信號PESQ得分為2.021 5,而用本文方法處理后的語音信號的PESQ得分為2.328 9,整體提高0.307 4。

4 結論

本文提出一種麥克風陣列的協同自適應濾波語音增強方法,在麥克風陣列GSC語音增強方法的基礎上引入協同自適應濾波,將線性濾波與非線性濾波協同組成新的自適應濾波器。仿真實驗結果表明,麥克風陣列的協同自適應濾波語音增強方法比GSC方法具有更好的去除脈沖噪聲能力,語音增強的效果也更好。

猜你喜歡
麥克風高斯濾波器
數學王子高斯
天才數學家——高斯
Binaural Rendering based on Linear Differential Microphone Array and Ambisonic Reproduction
從濾波器理解卷積
基于數字麥克風的WIFI語音發(fā)射機
開關電源EMI濾波器的應用方法探討
麥克風的藝術
基于Canny振蕩抑制準則的改進匹配濾波器
基于TMS320C6678的SAR方位向預濾波器的并行實現
麥克風
湘阴县| 岢岚县| 伊金霍洛旗| 乌恰县| 灵川县| 宜黄县| 鸡西市| 白河县| 徐汇区| 陇西县| 栾川县| 英吉沙县| 明水县| 九江市| 韶关市| 仁怀市| 阿拉尔市| 石景山区| 乾安县| 库伦旗| 景德镇市| 宿州市| 威宁| 施秉县| 淮滨县| 故城县| 乌鲁木齐县| 通渭县| 修武县| 彰武县| 临夏市| 潢川县| 肃南| 通许县| 汉中市| 金坛市| 永安市| 乐业县| 习水县| 马山县| 类乌齐县|