常雅婷 于玲
摘要:傳統(tǒng)的廣義旁瓣抵消(Generalized Sidelobe Canceller,GSC)算法中,由于主通道采用的算法是固定波束形成(Fixed Beamformer,F(xiàn)BF)算法,其權(quán)值不隨語音信號的改變而變化,導致算法適應性較差,因此,干擾和噪聲在固定波束形成類算法中抑制效果不明顯。針對這一問題,該文將傳統(tǒng)的GSC算法中主通道的固定波束形成模塊改為自適應LCMV波束形成模塊,并引入對角載入量的控制,通過調(diào)整對角載入量,使其可以自適應輸出最優(yōu)權(quán)值,有效地抑制干擾和噪聲。得到的剩余帶噪語音信號經(jīng)過輔助通道的阻塞矩陣和自適應噪聲抵消模塊進行噪聲的二次估計,從而得到目標語音;再針對非相干噪聲,采用維納后置濾波算法進行降噪處理,通過這兩步處理,獲得更具魯棒性的GSC-LCMV自適應波束形成算法。仿真結(jié)果表明,該文算法對噪聲和干擾的抑制效果更優(yōu),波束圖可以形成更低的旁瓣,輸出具有更高信噪比的語音信號。
關(guān)鍵詞:語音增強;麥克風陣列;自適應波束形成;對角載入量;維納濾波
中圖分類號:TP18? ? ? 文獻標識碼:A
文章編號:1009-3044(2022)15-0068-04
近年來,語音增強方法[1-2]在語音交互中具有十分重要的角色。語音增強技術(shù)分為三大類[3-5],其中,多通道語音增強利用麥克風陣列[6-8]獲取空域信息,再利用自適應濾波或波束形成[9-11]等算法對語音信號進行處理,抑制噪聲和干擾,從而達到增強目標語音信號的目的。波束形成準則使其在理想方向形成一個增益最大的波束。自適應波束形成算法因可以根據(jù)語音信號的變化而自適應更新權(quán)值,更受學者們青睞。自適應波束形成算法的兩個典型原型為線性約束波束形成(LCMV)算法和廣義旁瓣相消(GSC)算法[12]。其中GSC結(jié)構(gòu)主要由固定波束形成模塊,阻塞矩陣模塊以及噪聲抵消模塊構(gòu)成。
在噪聲抵消模塊中,最小均方算法方法簡單,便于實現(xiàn),最為常見。但由于其穩(wěn)態(tài)誤差與收斂速度相互影響,算法的性能有待提高;固定波束形成中固定不變的權(quán)值對噪聲和干擾抑制能力不足。針對以上問題,本文將固定波束形成模塊改為自適應的LCMV波束形成模塊,引入對角載入量,提出GSC-LCMV波束形成算法;在輔助通道的噪聲抵消模塊中采用新的變步長lms算法。仿真結(jié)果表明,本文算法可以有效抑制噪聲和干擾信號,波束圖中形成更低的旁瓣,輸出更高的語音信噪比,提高后續(xù)基于語音的應用效果。
1麥克風陣列語音信號模型
麥克風陣列的語音信號處理中,首先要明確語音信號為何種模型。其判斷準則為:
[L>2d2λ,符合遠場模型L≤2d2λ,符合近場模型]? ? ? ? ? ? ? ? ? ? ? ? ? ?(1)
其中[L]為聲源到參考陣元的中心點距離,[d]為陣列的總間距,[λmin]為當前語音波長。圖1為麥克風陣列語音信號的遠場模型與近場模型。
在a)近場模型中,語音信號被看作球面波入射,計算過程中需要計算各麥克風之間的信號幅度差問題。
在b)遠場模型中,語音信號的傳播看作平面波信號,信號傳播過程中產(chǎn)生的幅度衰減可以忽略不計,只需考慮每個麥克風間的時延差值。
對于2N+l個麥克風構(gòu)成的均勻直線麥克風陣列,語音信號的入射方向與y軸的夾角為[θ],兩個相鄰麥克風間的距離為D,時延為零的參考麥克風為陣列最中心的麥克風,則第n個麥克風的時延為:
[τn=nDcos(θ)c,n∈0,1,2,3...]? ? ? ? ? ? ? ? ?(2)
2 自適應波束形成語音增強算法
2.1 傳統(tǒng)的廣義旁瓣抵消算法
傳統(tǒng)的廣義旁瓣抵消算法主要由三個模塊組成:固定波束成形模塊,阻塞矩陣模塊和噪聲抵消模塊。
如圖2所示為傳統(tǒng)的GSC算法結(jié)構(gòu)圖,假設(shè)信號的入射角為[θ],麥克風數(shù)量為[N],固定波束形成主要采用延遲相加波束形成算法(DSB),主通道采用的算法為固定波束成形算法,權(quán)值不因語音信號的變化而自適應改變,但對于語音信號的到達方向的估計,影響著語音信號的增強方向,若目標語音信號進入阻塞矩陣中,則形成語音失真。因此,傳統(tǒng)的GSC算法并不完善,對于噪聲的抑制效果也不理想。
2.2 LCMV自適應波束形成算法
線性約束最小方差(LCMV)波束形成器的約束方程表達式為:
[Wopt=argminwWHRxW]? ? ? ? ? ? ? ? ? ? ? ? (3)
[s.t.WHC=f]? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? (4)
其中:C——約束矩陣;f——約束矢量。
假設(shè)[x1(n),x1(n),…,xN-1(n)]是陣列的采樣快拍,則信號的聯(lián)合概率密度表達式為:
[p(x1(n)…xN-1(n))=n=1Nexp[-xH(n)R-1xx(n)]πdet(Rx)] ? ? ?(5)
對于協(xié)方差矩陣的最大似然估計的求解,第一步對聯(lián)合概率密度函數(shù)取對數(shù),第二步求矩陣梯度,又稱為采樣協(xié)方差矩陣:
[Rx=1Kn=1Kx(n)xH(n)]? ? ? ? ? ? ? ? ? ? ? (6)
利用拉格朗日算法解得最優(yōu)權(quán)矢量:
[wLCMV=RxC[CHRxC]-1f]? ? ? ? ? ? ? ? ? ? ? ? ? (7)
若信號為統(tǒng)計獨立同分布的高斯白信號:
[wq=C[CHRxC]-1f]? ? ? ? ? ? ? ? ? ? ? ? ? ?(8)
經(jīng)過LCMV波束形成器輸出的語音信號:
[b(n)=wqx(n)]? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?(9)
2.3改進的GSC-LCMV波束形成器
Tian等利用 RLS 算法在高斯噪聲下實現(xiàn)了二次不等式約束的 LCMP 波束形成[13]。受文獻[13]的啟發(fā),為提高算法的抗干擾能力和降噪能力,本文將LCMV最優(yōu)波束形成器通過GSC結(jié)構(gòu)實現(xiàn),采用LCMV波束形成器代替?zhèn)鹘y(tǒng)GSC結(jié)構(gòu)中的固定波束形成器,同時引入對角載入量,將合適的正數(shù)添加在協(xié)方差矩陣的對角線上,以得到較小的特征值分散程度,對LCMV波束形成器的權(quán)值進行二次約束,輸出最優(yōu)權(quán)值,同時降低波束形成的旁瓣。圖3為改進的GSC-LCMV波束形成結(jié)構(gòu)圖。
如圖3所示,假設(shè)[θ]為信號的入射角度,陣列由[N]個陣元組成,[[x0(n),x1(n),...xN-1(n)]]為陣列接收到的信號,信號首先通過時延估計計算出每個麥克風的時延,接下來,通過時延補償將信號對齊;信號經(jīng)過主通道的自適應LCMV波束形成器求得可以自適應更新的最優(yōu)權(quán)矢量:
[wq=C[CHRxC]-1f]? ? ? ? ? ? ? ? ? ? ? ? ? ?(10)
加入對角載入量,得到較小特征值的分散程度,降低波束形成的旁瓣,得到新的表達式:
[wq=C[CH(Rx+λI)C]-1f]? ? ? ? ? ? ? ? ? ? ? ?(11)
[wHqwq=CHfH[CH(Rx+λI)C]-2f]? ? ? ? ? ? ? ? (12)
關(guān)于[λ] 求導:
[ddλwHqwq=-2CHfH[CH(Rx+λI)C]-2f]? ? ? ? ? (13)
因此[ddλwHqwq<0],[wHqwq]關(guān)于對角載入量是單調(diào)遞減,此時隨著對角載入量[λI]的改變,[wq]的模值發(fā)生改變,使得自適應權(quán)值滿足二次約束,通過調(diào)整對角載入量可以得到最優(yōu)權(quán)矢量。
主通道得到語音的參考信號表達式為:
[ys(n)=wq?x(n)] (14)
下通道阻塞矩陣B表達式:
[B=1-10…01-1?????0…010?0-1]? ? ? ? ? ? ? ? ? ? ?(15)
則經(jīng)過阻塞矩陣處理后的信號為:
[z(n)=BH?x(n)]? ? ? ? ? ? ? ? ? ? ? ? ? ? (16)
經(jīng)過阻塞矩陣輸出的信號[z(n)]只包含噪聲信息,進入噪聲抵消部分[14]的自適應濾波器過濾掉阻塞矩陣中的目標語音,對于濾波器系數(shù)的求解,使用一種新的變步長LMS算法[15]進行迭代求解。其具體如下:
[y(n)=WT(n)X(n)e(n)=d(n)-y(n)=d(n)-WT(n)X(n)α(n)=e(n)e(n-1)2β(n)=λβ(n-1)+(1-λ)Δe(n)μ(n)=β(n)1+e-α(n)e(n)-0.5 W(n+1)=W(n)+μX(n)e(n) ] (17)
式(17)中,[μ]是迭代步長,[X(n)]是輸入的信號,[e(n)]是誤差信號,由期望信號與輸出信號相減得到,[W(n)]為當前時刻下濾波器的權(quán)系數(shù),[W(n+1)]是下一時刻濾波器的權(quán)系數(shù)。
經(jīng)自適應濾波器得到的噪聲信號表達式:
[y1(n)=W(n+1)*μ(n)]? ? ? ? ? ? ? ? ? ? ? ?(18)
改進后的算法主通道LCMV波束形成器輸出的信號與噪聲抵消部分得到的噪聲估計作差,最終得到目標語音信號:
[y(n)=ys(n)-y1(n)]? ? ? ? ? ? ? ? ? ? ? ? ? ?(19)
2.4后置維納濾波算法
GSC算法對于非相干噪聲的處理效果有限,將GSC算法與維納濾波器結(jié)合起來,針對非相干噪聲的處理本文采用維納濾波器:
[W(ω)=2N(N-1)Rei=1N-1j=i+1N?xixj(ω)1Mi=1N?xi(ω)]? ? ? ?(20)
式中:[?xixj]——表示第[i]個陣元和第[j]個陣元接收到的信息的互功率譜;[?xi]——第i個陣元接收到的信息的自功率譜;[N]——陣元個數(shù)。
互功率譜與自功率譜的求解表達式為:
[φxixj(ω)=FFT(xi(n),N)FFT?(xi(n),N)2/N] (21)
[φxi(ω)=FFT(xi(n),N)2/N]? ? ? ? ? ? ? ? ?(22)
式中:[FFT(xi(n),N)]——對第[i]個麥克風的數(shù)據(jù)作N點FFT運算;*——共軛運算符。
相關(guān)系數(shù)由求解Wiener-Hopf方程得到:
[n∈lw(n)Rxx(l-n)=Rss(n),l∈I]? ? ? ? ? ? ? (23)
式中[Rxx(n)]——陣列接收信號的自相關(guān)函數(shù);[Rss(n)]——語音信號在陣列接受信號中的自相關(guān)函數(shù)。
3算法仿真與分析
為驗證本文算法的語音增強性能,本文選取均勻直線分布的麥克風構(gòu)成麥克風陣列。麥克風個數(shù)N為8,相鄰麥克風間距D為0.5m,語音信號的入射方向為[40°],干擾信號方向為[-40°],干噪比30db,語音信號的采樣頻率8kHz。
如圖4為原始語音信號波形圖:
將5dB的信噪比和零均值的高斯白噪聲加入原始語音信號中后,得到帶噪語音信號波形圖,如圖5所示。
Y.Gu[16]利用稀疏性重構(gòu)了干擾加噪聲協(xié)方差矩陣,使自適應波束形成器輸出最優(yōu)值。如圖6所示,為LCMV算法、Y.Gu算法與本文算法的方向圖仿真,仿真結(jié)果表明,本文算法在信號的入射方向[40°]對應最大信號增益的同時,其他方向具有更低的旁瓣。說明該算法對干擾信號抑制效果更好,從而達到增強目標語音信號的目的。
如圖7所示,為改進后的GSC算法與后置維納濾波相結(jié)合后的輸出語音波形圖,可以看出,噪聲幅度在改進后算法的波形圖中明顯減小,因此改進后的算法具有更好抑制噪聲的能力。
將5dB的信噪比和零均值的高斯白噪聲加入原始語音信號中后,各算法性能比較如表1所示。
由表1可知,傳統(tǒng)廣義旁瓣相消算法由于主通道采用了權(quán)值固定的固定波束形成器,對噪聲的抑制能力有限,整體算法輸出的語音信噪比為9.0740,語音可懂度為2.6704。采用文獻[16]算法輸出語音信噪比15.7491,語音可懂度3.0142。本文改進后的算法的輸出語音信噪比為17.4471,語音可懂度為3.0269。結(jié)果表明,相比于前兩種算法,本文算法兩項指標都有明顯提高,相干噪聲和非相干噪聲在改進后的算法中均被明顯抑制,使得降噪后的語音極大地消除了加性噪聲的影響。
4 結(jié)束語
本文針對傳統(tǒng)廣義旁瓣相消算法進行改進,將傳統(tǒng)算法中主通道采用的固定波束形成器改為LCMV波束形成器,并引入對角載入技術(shù),通過調(diào)整對角載入量,得到最優(yōu)的權(quán)值,使其對噪聲和干擾有明顯抑制作用。輔助通道麥克風陣列接收到的信號進入阻塞矩陣,阻塞掉語音信號,輸出剩余噪聲信號,接著進入基于新的變步長的lms算法的自適應濾波器進行噪聲的二次估計。針對非相干噪聲,將改進算法與后置維納濾波器相結(jié)合抑制非相干噪聲。仿真結(jié)果表明,對照原始語音信號波形圖,本文改進后的算法語音波形圖與其基本保持一致,輸出的語音信噪比也有明顯提高。證明改進后的算法具有更好地抑制噪的能力,為語音增強算法提供了新的思想。
參考文獻:
[1] Griffiths L,Jim C.An alternative approach to linearly constrained adaptive beamforming[J].IEEE Transactions on Antennas and Propagation,1982,30(1):27-34.
[2] Ali R,van Waterschoot T,Moonen M.Correction to:an integrated MVDR beamformer for speech enhancement using a local microphone array and external microphones[J].EURASIP Journal on Audio,Speech,and Music Processing,2021,2021:15.
[3] Sun J Y,Sun C L,Hong Y.A new speech enhancement method based on nonnegative low-rank and sparse decomposition[J].Journal of Physics:Conference Series,2021,1848(1):012090.
[4] Kammi S.Single channel speech enhancement using an MVDR filter in the frequency domain[J].International Journal of Speech Technology,2019,22(2):383-389.
[5] Wang X F,Guo Y M,F(xiàn)u Q,et al.Speech enhancement using multi-channel post-filtering with modified signal presence probability in reverberant environment[J].Chinese Journal of Electronics,2016,25(3):512-519.
[6] Nossier S A,Wall J,Moniri M,et al.An experimental analysis of deep learning architectures for supervised speech enhancement[J].Electronics,2020,10(1):17.
[7] 續(xù)嬌.基于自適應波束成形的語音增強算法研究與實現(xiàn)[D].北京:北京交通大學,2019.
[8] 王兆陽.基于波束形成算法的麥克風陣列語音處理研究與實現(xiàn)[D].哈爾濱:哈爾濱工業(yè)大學,2015.
[9] 鄭毅豪.基于差分麥克風陣列的波束形成技術(shù)研究[D].武漢:湖北工業(yè)大學,2020.
[10] 閆姝,權(quán)建軍.基于麥克風陣列的語音增強算法研究[J].自動化儀表,2019,40(9):59-62.
[11] 張蒙.室內(nèi)環(huán)境下基于麥克風陣列的語音增強算法研究[D].深圳:深圳大學,2016.
[12] 李連,李鈮.基于麥克風陣列的嘈雜環(huán)境下的魯棒語音增強算法[J].電子制作,2020(15):51-53,46.
[13] Tian Z,Bell K L,van Trees H L.A recursive least squares implementation for LCMP beamforming under quadratic constraint[J].IEEE Transactions on Signal Processing,2001,49(6):1138-1145.
[14] Wang R G,Wang Y X,Han C,et al.Robust adaptive beamforming based on interference covariance matrix reconstruction and steering vector estimation[J].2021 IEEE International Conference on Signal Processing,Communications and Computing (ICSPCC),2021:1-5.
[15] 景源,汪洪濤.一種新的變步長LMS算法及在自適應波束形成中的應用[J].遼寧大學學報(自然科學版),2018,45(4):326-330.
[16] Gu Y J,Leshem A.Robust adaptive beamforming based on interference covariance matrix reconstruction and steering vector estimation[J].IEEE Transactions on Signal Processing,2012,60(7):3881-3885.
【通聯(lián)編輯:唐一東】