王元昊,王宏強,楊 琪,鄧 彬,羅成高
(國防科技大學(xué) 電子科學(xué)學(xué)院, 湖南 長沙 410073)
太赫茲指的是頻率在0.1~10 THz之間的電磁波,太赫茲雷達(dá)就是指工作在太赫茲頻段下的雷達(dá)。相比于傳統(tǒng)微波頻段雷達(dá),太赫茲雷達(dá)在精度方面具有天然的優(yōu)勢,使其在拓展傳統(tǒng)雷達(dá)應(yīng)用領(lǐng)域上具有巨大的潛力。聲音活動檢測(Voice Activity Detection,VAD)指從包含聲音的信號中確定出聲音的起點及終點,即確定待處理信號是否為有效聲音信號,是聲音信號預(yù)處理的重要一環(huán)。對于后續(xù)的聲音增強,聲音識別等處理具有重要意義。目前的VAD算法多采取基于信號特征的形式進行聲音或非聲音的判別,常用的特征有能量、頻域、倒譜、諧波等。但這些特征都依賴于所獲得信號中的噪聲分量具有和聲音分量顯著的特征差異,基于深度學(xué)習(xí)的VAD方法也基本建立在特征值的提取上[1-2],顯著的特征差異對于識別算法起著至關(guān)重要的作用,獲取聲音信號的方式對于特征值的獲取也有著至關(guān)重要的作用。
目前,麥克風(fēng)方式是發(fā)展最為成熟[3]、應(yīng)用最為廣泛的一種聲音信號獲取方式,但是利用麥克風(fēng)存在一些弊端,導(dǎo)致其應(yīng)用受限:一是抗干擾能力差,即面對所期望得到的聲音湮沒在噪聲中或傳輸路徑中存在干擾聲源時該方法難以取得良好的性能。二是作用距離近,因為聲音信號在空氣中的衰減較大,所以一般都會放置在聲源米量級內(nèi)的位置來獲得最佳的效果。但若在麥克風(fēng)接收路徑上存在其他聲源的聲音干擾,則即便是信道噪聲不強,在進行VAD時也會存在較大的誤差。因此,探索一種新的VAD手段具有重要意義。探測聲波本質(zhì)上是探測物體的振動信息,而雷達(dá)天然地具有測距能力。王健琪團隊在2016年提出基于94 GHz雷達(dá)的生物聲音獲取系統(tǒng)[3-4],利用毫米波雷達(dá)對人聲帶振動信號進行遠(yuǎn)程檢測從而得到聲音信號。Khanna等在2019年提出基于多普勒雷達(dá)的聲音識別系統(tǒng)[5],該系統(tǒng)放置在離人咽喉很近的地方。相比于麥克風(fēng),雷達(dá)獲取聲音信號的方式可以認(rèn)為是遠(yuǎn)程直接探測聲源表面的振動,可以有效地避免傳輸路徑上其余聲音干擾帶來的影響。但是上述對于雷達(dá)聲音獲取技術(shù)的研究仍然存在不具備目標(biāo)選擇能力以及多目標(biāo)同時獲取能力不足的問題。
為此,本文提出一種基于載波頻率為120 GHz的寬帶太赫茲雷達(dá)的VAD技術(shù),綜合利用太赫茲雷達(dá)頻段高和帶寬大的特性,實現(xiàn)多聲音信號活動檢測,同時通過譜減-小波聯(lián)合去噪方法提升雷達(dá)獲取聲音信號的質(zhì)量。
聲音信號本質(zhì)上是由物體振動產(chǎn)生的機械波。假設(shè)一個無向聲源,該聲源的振動方程為f(x,t)|x=0。根據(jù)傅里葉變換原理,聲音信號可以分解為不同頻率、幅度的正弦信號的線性疊加,因此,f(x,t)|x=0可以重寫為:
(1)
式中,Aω是頻率分量為ω的諧波所對應(yīng)的振幅,φω是其相應(yīng)的相位值。
考慮M個主要頻率分量以及因路徑傳播所帶來的延遲,式(1)可以重寫為:
(2)
式中,Aωi是頻率分量為ωi的諧波所對應(yīng)的振幅,φωi是對應(yīng)的相位,λ表示波長。
當(dāng)聲波傳遞到硬質(zhì)介質(zhì)表面時,會引發(fā)該介質(zhì)的振動,考慮振動方程:
(3)
式中,δ為阻尼系數(shù),ω0表示物體本振頻率,m表示該物體質(zhì)量。
假設(shè)M=1,求解式 (3) 可得:
(4)
分析式(4)可得,含有e-δt的前兩個振動項為自由振動,會隨著時間迅速衰減,而只有最后一項為受迫振動,該受迫振動項將以與聲源頻率相同的頻率振動且振幅與聲源振幅A呈線性關(guān)系。
設(shè)太赫茲雷達(dá)發(fā)射調(diào)頻連續(xù)波,記發(fā)射信號為:
(5)
式中,f0是中心頻率,γ是調(diào)頻率。
假設(shè)目標(biāo)有N個散射中心,可以得到回波信號表達(dá)式為:
(6)
設(shè)參考信號為:
(7)
式中,c為光速,Rref為參考距離。
將回波信號r(t)和參考信號sref(t)相乘,得到去斜后信號:
(8)
進一步利用相位測距[6-7]原理可得到目標(biāo)位移如下:
Δφ=angle[r′(t+Δt)-r′(t)]
(9)
(10)
在得到位移變化序列后進一步通過聯(lián)合譜減算法[8-9]以及小波去噪[10]提升信號質(zhì)量。
譜減法是從含噪信號功率譜中減去噪聲功率譜,要求噪聲與純凈聲音信號不相關(guān)。純凈聲音信號與噪聲的相關(guān)性決定了去噪后聲音信號的質(zhì)量。然而,由于有色噪聲的分布特點,去除噪聲的效果并不理想。但是有色噪聲的功率很低,可以采用小波去噪的方法。因為小波去噪的基本思想是對信號進行小波變換,通過選擇合適的閾值來保留較大的小波系數(shù),從而保留了信號的主要分量。
記通過相位測距處理得到的位移序列y[n]={R(t),R(t+T),…,R(t+mT)},其可以認(rèn)為是含噪信號,假設(shè)純凈聲音信號和噪聲是不相關(guān)的。
含噪信號可以表示為:
(11)
其中,x(n)表示干凈信號,dcgn(n)表示有色噪聲,dwgn(n)表示白噪聲。
將式(11)轉(zhuǎn)換到頻域,可以表示為:
(12)
其中,Y[k]、X[k]、Dcgn[k]和Dwgn[k]分別是y[n]、x[n]、dcgn(n)和dwgn[n]的傅里葉變換。
進一步轉(zhuǎn)換成功率譜可得:
(13)
通過選擇不含聲音信號的一部分來估計純凈信號:
(14)
最后,通過小波降噪的方法進一步去除dcgn[n],從而得到干凈聲音信號x[n]。信號處理框圖如圖1所示。
圖1 太赫茲雷達(dá)聲音活動檢測信號處理框圖Fig.1 Signal processing flow of VAD system for terahertz radar
本文所設(shè)計太赫茲雷達(dá)聲音活動檢測系統(tǒng)主要由原始數(shù)據(jù)獲取前端和數(shù)據(jù)精細(xì)化處理后端組成。其結(jié)構(gòu)框圖如圖2所示。原始數(shù)據(jù)獲取前端主要是一部太赫茲雷達(dá),其發(fā)射波形為調(diào)頻連續(xù)波,中心頻率為120 GHz,帶寬為0.1~4 GHz(可調(diào)節(jié)),掃頻周期為0.1~1 ms(可調(diào)節(jié))。數(shù)據(jù)精細(xì)化處理后端主要由一臺上位機組成,其作用是控制雷達(dá)參數(shù)、接收雷達(dá)數(shù)據(jù)并處理。
因為雷達(dá)的距離分辨率為Rres=c/(2B),帶寬B選擇為500 MHz可以區(qū)分目標(biāo)聲源與干擾聲源。掃頻周期選擇為0.5 ms,掃頻周期的倒數(shù)對應(yīng)于實際對聲源信號的采樣率,0.5 ms對應(yīng)采樣率為2 000 Hz,可以基本滿足對于檢測聲音活動的需求。
圖2 太赫茲雷達(dá)聲音活動檢測系統(tǒng)框圖Fig.2 Block diagram of VAD system for terahertz radar
設(shè)計實驗場景如圖3所示,實驗環(huán)境為微波暗室和戶外,選取兩個藍(lán)牙音箱分別作為目標(biāo)聲源和干擾聲源,目標(biāo)聲源播放聲音“電子科學(xué)學(xué)院”,聲音信號獲取系統(tǒng)選擇麥克風(fēng)和太赫茲雷達(dá),麥克風(fēng)系統(tǒng)主要用來與太赫茲雷達(dá)對比所獲得聲音信號的VAD性能。
(a) 實驗室環(huán)境(a) Laboratory environment
(b) 戶外環(huán)境(b) Outdoor environment圖3 實驗場景Fig.3 Experimental environment
實驗室環(huán)境下太赫茲雷達(dá)測得的聲音信號如圖4所示。對于目標(biāo)聲源,雷達(dá)通過相位測距方式得到的原始信號、經(jīng)過譜減法降噪后的聲音信號、譜減法與小波去噪結(jié)合降噪后的聲音信號的信噪比分別為7.53 dB、20.69 dB和36.55 dB。 對于干擾聲源,該數(shù)值分別為9.69 dB、20.10 dB和29.38 dB。從圖4和計算的信噪比可以看出,譜減-小波聯(lián)合降噪算法具有明顯的信噪比改善。
(a) 目標(biāo)聲源(a) Desired speech signal
(b) 干擾聲源(b) Interference speech signal圖4 實驗室環(huán)境下的太赫茲雷達(dá)探測聲音信號結(jié)果Fig.4 Results of acoustic signal acquired by terahertz radar in laboratory environment
同樣給出戶外測試的結(jié)果,如圖5所示。從圖5中可以看出,相比于實驗室環(huán)境,戶外環(huán)境下原始提取信號的幅度抖動十分劇烈,通過所提譜減-小波聯(lián)合降噪方法可以有效抑制噪聲,保留聲音信號。
(a) 目標(biāo)聲源(a) Desired speech signal
(b) 干擾聲源(b) Interference speech signal圖5 戶外環(huán)境下的太赫茲雷達(dá)探測聲音信號結(jié)果Fig.5 Results of acoustic signal acquired by terahertz radar in outdoor environment
麥克風(fēng)在實驗室環(huán)境中采集的聲音信號的結(jié)果如圖6所示。由于麥克風(fēng)不能區(qū)分不同位置處的聲源,采集到的聲音信號存在嚴(yán)重混疊現(xiàn)象。
圖6 麥克風(fēng)采集聲音信號VAD結(jié)果Fig.6 VAD result of microphone
從圖6中可以看出,麥克風(fēng)所采集聲音信號無法區(qū)分聲音信號來源是目標(biāo)物體還是干擾物體;當(dāng)在傳輸信道中施加干擾聲源后,麥克風(fēng)采集聲音信號難以正確判斷目標(biāo)物體是否進行聲音活動。
圖7展示了基于太赫茲雷達(dá)所采集聲音信號的VAD結(jié)果。因為雷達(dá)天然地具有距離分辨的能力,所以首先通過距離分辨選擇目標(biāo)所在的距離單元數(shù)據(jù)進行進一步分析,可以有效地避免采集到來自干擾聲源的信號。通過對比圖6可以明顯看出,基于太赫茲雷達(dá)采集的聲音信號的VAD效果明顯優(yōu)于麥克風(fēng)方式。
圖7 雷達(dá)采集聲音信號VAD結(jié)果Fig.7 VAD result of terahertz radar
進一步,通過聲源與雷達(dá)的距離來對該系統(tǒng)的應(yīng)用場景進行評估,以信噪比作為評判標(biāo)準(zhǔn),捕捉最初無聲音信號播放時的雷達(dá)數(shù)據(jù)作為噪聲樣本,得到結(jié)果如圖8所示。
圖8 探測聲音信號信噪比與作用距離的關(guān)系Fig.8 Relationship between signal to noise ratio and operating distance of sound signal
從圖8中可以看出,該系統(tǒng)的探測性能隨距離下降十分明顯,但該性能的下降可以通過提升雷達(dá)功率的方式來得以改善。
本文提出了一種太赫茲雷達(dá)多聲音檢測方法。太赫茲雷達(dá)憑借其頻率高、 波長短的特點,在相位測距精度上有著顯著的優(yōu)勢。本文采用太赫茲雷達(dá)進行聲音信號獲取并進行聲音活動檢測,同時在相同環(huán)境下也設(shè)置了麥克風(fēng)進行聲音信號獲取來進行對比。實驗結(jié)果表明,太赫茲雷達(dá)聲音檢測方法在面臨傳輸路徑上存在聲源干擾時,對目標(biāo)聲源的聲音活動仍然有良好的判斷性能,在一定程度上可以彌補基于麥克風(fēng)的聲音信號采集系統(tǒng)的不足,該方法為在復(fù)雜環(huán)境下聲音信號的探測提供了一種新的思路。