尤俁良 國(guó)洪燦 王 雪
(南京信息工程大學(xué)電子與信息工程學(xué)院 南京 210044)
無線信號(hào)波達(dá)方向(Direction of Arrival,DOA)估計(jì)是一種應(yīng)用于移動(dòng)通信和各種雷達(dá)系統(tǒng)中的用戶定位技術(shù)。近幾十年來,用天線陣代替窄帶波束天線進(jìn)行DOA 估計(jì)已成為普遍現(xiàn)象。為了提高DOA 估計(jì)的精度,研究人員在傳統(tǒng)算法基礎(chǔ)上進(jìn)行改進(jìn),引入更精確的數(shù)學(xué)模型和優(yōu)化方法,不斷在提高精度、超分辨率和適應(yīng)低信噪比場(chǎng)景方面取得了顯著的進(jìn)展,也提出了許多信號(hào)處理技術(shù),如波束形成、Capon、空間交替廣義期望最大化(Space Alternating Generalized Expectation Maximization,SAGE)[1]、協(xié)方差矩陣增廣(Covariance Matrix Augmentation,CMA)[2]、空間交替廣義期望最大化(Space-Alternating Generalized Expectation-maximization,SAGE)[3]等。
最近,深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Networks,DNN)展示了其對(duì)語(yǔ)音信號(hào)處理的強(qiáng)大功能,例如語(yǔ)音分離[4]、自動(dòng)語(yǔ)音識(shí)別(Automatic speech recognition,ASR)[5]等。隨后,DNN 也用于DOA 估計(jì),Takeda 和Komatani 使用具有7 個(gè)隱藏層的DNN 通過判別訓(xùn)練方法來預(yù)測(cè)DOA[6]。輸入特征是每個(gè)頻點(diǎn)處相關(guān)矩陣的特征向量,實(shí)驗(yàn)結(jié)果表明,該方法對(duì)混響敏感。廣義互相關(guān)(Generalized Cross Correlation,GCC)被用作一個(gè)隱藏層感知器神經(jīng)網(wǎng)絡(luò)的特征,結(jié)果表明,它對(duì)高電平噪聲和強(qiáng)烈的混響具有魯棒性[7]。引入卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)技術(shù),從而為解決DOA 估計(jì)問題帶來新的方法,其中將短時(shí)傅立葉變換(Short-time Fourier Transform,STFT)的相位分量用作CNN 的特征[8]?;贑NN 的方法顯示了對(duì)噪聲的魯棒性和麥克風(fēng)位置的小擾動(dòng)。隨著互質(zhì)陣列技術(shù)的應(yīng)用,功率信號(hào)成為新的信號(hào)源。然而,它們是相干的,而通常用于估計(jì)DOA 的MUSIC 算法要求源是非相干的。盡管空間平滑技術(shù)可用于去相干源,但它通常應(yīng)用于均勻數(shù)據(jù)。傳統(tǒng)互質(zhì)陣列的差分共陣列存在“空洞”[9],即缺少一些虛擬陣列元素。
為了解決這個(gè)問題,本文提出一種基于殘差網(wǎng)絡(luò)(Residual Network,ResNet)的和差共陣(Sum and difference co-array,SD-CPA)DOA 估計(jì)算法。該算法將和差共陣輸出的空間平滑矩陣經(jīng)過數(shù)據(jù)預(yù)處理后生成的特征數(shù)據(jù)輸入殘差網(wǎng)絡(luò)中,將DOA 估計(jì)轉(zhuǎn)變?yōu)樘卣鲾?shù)據(jù)和DOA 之間的非線性映射關(guān)系,通過ResNet對(duì)信號(hào)分類來實(shí)現(xiàn)DOA估計(jì)。
傳統(tǒng)的互質(zhì)陣列[9]由兩個(gè)均勻的線性子陣列組成,它們的陣列間距分別為M和N,如圖1 所示。第一個(gè)子陣列中有N個(gè)傳感器,第二個(gè)子陣列中有M個(gè)傳感器。M和N是互質(zhì)整數(shù),即gcd(M,N)=1,d為陣元之間的距離。為避免空間混疊,d通常設(shè)置為λ/2,其中λ是入射信號(hào)的波長(zhǎng)。傳統(tǒng)互質(zhì)陣列中的傳感器放置如下所示:
圖1 互質(zhì)均勻線陣
式中,0 ≤n≤N-1,0 ≤m≤M-1。由于這兩個(gè)均勻線性子陣列的第一個(gè)傳感器位于同一位置,因此傳統(tǒng)的互質(zhì)陣列中的傳感器總數(shù)為M+N-1。
在互質(zhì)陣列中,兩個(gè)均勻線性子陣的方向向量可以表示為
式中,θk是每個(gè)信號(hào)的DOA。結(jié)合式(2)和式(3)可得,互質(zhì)陣列的方向向量和方向矩陣為
假設(shè)圖1 中互質(zhì)陣列接收的信號(hào)為X(t)=AS(t)+N(t),接收信號(hào)的協(xié)方差矩陣為Rxx=,對(duì)Rxx進(jìn)行矢量化處理,得
式中,RSS為聲源的協(xié)方差矩陣,I為單位矩陣轉(zhuǎn)化后的列向量,p為,vec(?)為將矩陣轉(zhuǎn)化為列向量的操作,?表示克羅內(nèi)克乘積,⊙表示Khatri-Rao積。
差分陣是互質(zhì)陣列中兩個(gè)子陣的實(shí)際陣元位置之間的位置間距的集合,它關(guān)于原點(diǎn)對(duì)稱。差分陣是互質(zhì)陣列經(jīng)過虛擬化之后產(chǎn)生的,它是PC中的任意兩個(gè)元素作差得到的虛擬陣列。
傳統(tǒng)互質(zhì)陣列的差分共陣列存在“空洞”,即缺少一些虛擬陣列元素。為了解決這個(gè)問題,采用延伸的互質(zhì)陣列來讓差分共陣列獲得更長(zhǎng)的連續(xù)均勻線陣。延伸的互質(zhì)陣列和傳統(tǒng)互質(zhì)陣列具有相似的陣列布置,只是在第二子陣列中放置更多的傳感器,如圖2所示。
圖2 延伸的互質(zhì)陣列
通常,經(jīng)過計(jì)算陣列輸出的協(xié)方差矩陣可以獲得差共陣,而和共陣作為主動(dòng)傳感中的虛擬陣列自然產(chǎn)生[9~10]。延伸后的互質(zhì)陣列產(chǎn)生的和差共陣的數(shù)目為2MN+2M+2N-1。但是,此和共陣僅包含交叉和項(xiàng),而未包含自和項(xiàng)。假設(shè)信號(hào)的功率為的K個(gè)實(shí)值源從[θ1θ2…θK]方向撞擊陣列,則在陣列的方向矩陣可表示為
在陣列信號(hào)處理中,差共陣是在計(jì)算接收數(shù)據(jù)之間的自相關(guān)等二階矩時(shí)自然形成的,通過分析式(2~6),令B=A*⊙A,可得
式中,b(θk)和B分別為陣列經(jīng)過矢量化后得到差共陣的方向向量和方向矩陣。同時(shí),也可以計(jì)算出正和共陣Rxx2和負(fù)和共陣Rxx3以及他們的矢量化。
由此,我們可以輕松地集成三個(gè)新生成的接收數(shù)據(jù)向量:
式中,z1、z2、z3分別是差共陣、正和共陣和負(fù)和共陣的矢量化。
同時(shí),也能得到一個(gè)較大的對(duì)應(yīng)陣列流形矩陣:
式中,B1、B2、B3分別是差共陣、正和共陣和負(fù)和共陣的方向矩陣。由于向量中存在冗余和無序陣元,必須刪除并重新排序一些陣元來重建z,以形成新的向量z',從而使其對(duì)應(yīng)的B'具有與連續(xù)虛擬ULA 的流形相同的表達(dá)式。重建的向量z'可以表示為
將新接收到的數(shù)向量z'劃分為多個(gè)向量,將其對(duì)應(yīng)的虛擬ULA 陣列劃分為多個(gè)重疊的子陣列,然后計(jì)算每個(gè)分割的接收的向量的自相關(guān)矩陣,同時(shí)取所有自相關(guān)矩陣的平均值,則空間平滑矩陣Rsd:
式中,DOF為所有子陣列的數(shù)量,經(jīng)過空間平滑技術(shù)后,可用的DOF為MN+M+N,可以將空間平滑矩陣Rsd的上三角陣作為神經(jīng)網(wǎng)絡(luò)的輸入,則其輸入特征是通過式(12)得到,將式(12)中的上三角陣按照實(shí)部與虛部分別展開,得到特征組合序列:
式中,Im(?)為虛部,Re(?)為實(shí)部。
在傳統(tǒng)的DOA 估計(jì)方法中,MUSIC 算法被認(rèn)為是一種經(jīng)典典范。該方法在角度域內(nèi)尋找譜峰,以確定信號(hào)源的方向。與其他方法如最大似然法(Maximum Likelihood Method,ML)和加權(quán)子空間擬合(Weighted Subspace Fitting,WSF)相比,MUSIC算法在計(jì)算方面具有較小的復(fù)雜性,這使得其成為一種受歡迎的選擇。隨著互質(zhì)陣列技術(shù)的應(yīng)用,功率信號(hào)成為新的信號(hào)源。然而,它們是相干的,而通常用于估計(jì)DOA 的MUSIC 算法要求源是非相干的。盡管空間平滑技術(shù)可用于去相干源,但它通常應(yīng)用于均勻數(shù)據(jù)。針對(duì)這些問題,本文提出了基于ResNet的DOA估計(jì)算法[10~11]。
本文提出的算法將ResNet 應(yīng)用到DOA 估計(jì)中,通過和差共陣與ResNet 相結(jié)合,能有效解決傳統(tǒng)互質(zhì)陣列中差分共陣缺少一些虛擬陣列元素的問題,該算法將DOA 估計(jì)任務(wù)轉(zhuǎn)化為輸入和輸出之間的映射關(guān)系,從而實(shí)現(xiàn)對(duì)信號(hào)源方向的精確估計(jì)。該算法不受陣列形狀的限制,同時(shí)還增強(qiáng)在各種不同麥克風(fēng)陣列設(shè)置下的適應(yīng)性。
CNN 是一類深度神經(jīng)網(wǎng)絡(luò),具備卷積層、池化層和全連接層等不同網(wǎng)絡(luò)組件[12]。CNN 通過堆疊更多網(wǎng)絡(luò)層,可以更好地從數(shù)據(jù)集中提取不同級(jí)別的特征。然而,CNN模型很難訓(xùn)練,隨著網(wǎng)絡(luò)深度的增加,訓(xùn)練精度越來越飽和,之后開始迅速下降[13~14]。為了克服退化,ResNet 網(wǎng)絡(luò)被提出來促進(jìn)CNN 模型的訓(xùn)練。與其他CNN 網(wǎng)絡(luò)模型相比,ResNet 網(wǎng)絡(luò)通過添加身份映射來解決退化問題,如圖3 中的曲線所示。
圖3 ResNet的網(wǎng)絡(luò)模型圖
相比其他的CNN 網(wǎng)絡(luò),ResNet 網(wǎng)絡(luò)多了殘差塊,殘差塊是ResNet 網(wǎng)絡(luò)的主要基礎(chǔ)元素,如圖4所示。隨著我們深入到具有大量層的網(wǎng)絡(luò)中,計(jì)算變得更加復(fù)雜。這些層相互疊加,每一層都試圖學(xué)習(xí)所需函數(shù)的一些底層映射。圖4 中,x作為第一層的輸入,G(x)表示從第一層輸入到堆疊層輸出的映射。在模型訓(xùn)練期間,學(xué)習(xí)所需映射G(x)的問題可以轉(zhuǎn)化為學(xué)習(xí)殘差映射函數(shù)F(x),其中F(x)=G(x)-x。鑒于原始映射函數(shù)變?yōu)镕(x)+x,對(duì)應(yīng)于F(x)的堆疊層的權(quán)重可以為零,以模擬層與層之間的“快捷連接”。通過利用殘差網(wǎng)絡(luò),即使層數(shù)增加到1202,也可以優(yōu)化CNN 模型,但是使用這種更深的網(wǎng)絡(luò)往往會(huì)因?yàn)檫^擬合而導(dǎo)致較低的測(cè)試精度。
圖4 殘差塊的結(jié)構(gòu)圖
所提出的基于ResNet的DOA 估計(jì)可以看作是一個(gè)陣列輸出信號(hào)和DOA 之間的映射函數(shù),如圖5所示。將DOA 估計(jì)分為兩個(gè)階段:在第一階段中,對(duì)通過和差共陣獲得的空間平滑矩陣Rsd進(jìn)行數(shù)據(jù)預(yù)處理來獲得特征數(shù)據(jù)y;第二階段中,將特征數(shù)據(jù)y與生成的物理DOAθk形成訓(xùn)練數(shù)據(jù)集,作為訓(xùn)練樣本輸入基于注意力機(jī)制的ResNet,獲特征數(shù)據(jù)y與生成的物理DOAθn之間的映射函數(shù),即
圖5 基于ResNet的DOA估計(jì)
式中,θk為訓(xùn)練角,y為特征數(shù)據(jù)。因此,通過訓(xùn)練DOA 估計(jì)網(wǎng)絡(luò),從而掌握陣列輸出與相應(yīng)DOA之間的非線性聯(lián)系。
為了獲得估計(jì)的DOAθk,選擇ReLU函數(shù)作為激活函數(shù),損失函數(shù)基于交叉熵概念,即
式中,M表示類別數(shù),為符號(hào)函數(shù)(0 或1),pic為觀測(cè)樣本i屬于類別c的預(yù)測(cè)概率。
本實(shí)驗(yàn)采用均方根誤差(Root Mean Square Error,RMSE)作為評(píng)估標(biāo)準(zhǔn),將MUSIC算法和采用的算法進(jìn)行對(duì)比,以評(píng)估算法的準(zhǔn)確性和穩(wěn)定性。RMSE的公式表達(dá)為
式中,N表示為數(shù)據(jù)樣本總數(shù),表示為入射方向的估計(jì)值,xn表示為入射方向的真實(shí)值。
實(shí)驗(yàn)仿真設(shè)置在一個(gè)尺寸為5.5m×2.3m×3.3m 的消音室中進(jìn)行,如圖6 所示,采用M=4 和N=5 的均勻線性互質(zhì)陣列,則物理傳感器的總數(shù)為M+N-1=8,生成的和差共陣的數(shù)目為2MN+2M+2N-1=57,經(jīng)過空間平滑技術(shù)后,可用的DOF為MN+M+N=29,陣元之間的間距設(shè)置為0.17m。仿真在TensorFlow 平臺(tái)上實(shí)現(xiàn),其中ResNet的學(xué)習(xí)率設(shè)置為0.001,訓(xùn)練周期為1000。
圖6 仿真環(huán)境
本實(shí)驗(yàn)首先比較MUSIC 算法和本文采用算法在和差共陣中DOA 估計(jì)的性能。設(shè)置信噪比SNR為0 dB,快照數(shù)為100。圖7 和圖8 分別為MUSIC算法和本文采用算法的頻譜圖,可以發(fā)現(xiàn)和差共陣可以識(shí)別頻譜中的所有源,這證明了其使用數(shù)量少得多的物理傳感器識(shí)別大量源的有效性。通過對(duì)比圖7 和圖8 可以發(fā)現(xiàn),本文采用的算法能更為精確地識(shí)別所有的源。
圖7 MUSIC算法頻譜圖
圖8 本文采用算法的頻譜圖
接著分析SNR 和快照數(shù)的變化對(duì)本文采用算法的影響。圖9 和圖10 分別為SNR 的變化和快照數(shù)的變化對(duì)MUSIC 算法、SVR 算法以及本文算法的DOA 估計(jì)的影響。圖9 中,SNR 以2.5 dB 為步長(zhǎng)在-10 dB~10 dB之間變化。從圖示可知,在SNR高于-1.2 dB 時(shí),MUSIC 算法表現(xiàn)出稍高的估計(jì)精度;然而,在低信噪比情況下,基于SVR 算法和本文提出的方法的DOA 估計(jì)性能更佳,特別在較低信噪比下,本文算法展現(xiàn)出優(yōu)異的抗干擾能力。
圖9 SNR的影響
圖10 快照數(shù)的影響
圖10 為快照數(shù)的變化對(duì)MUSIC 算法、SVR 算法以及本文算法的DOA 估計(jì)的影響,采樣點(diǎn)數(shù)以50 為步長(zhǎng)在0~400 之間變化。隨著采樣點(diǎn)數(shù)的增加,三種算法的RMSE 逐漸減小,這表明隨著樣本數(shù)量的增加,DOA估計(jì)的性能得到了提升。
本文采用ResNet 與和差共陣結(jié)合的方法來解決傳統(tǒng)互質(zhì)陣列的差分共陣存在“空洞”的問題。通過仿真可以得出,采用基于ResNet 的和差共陣的DOA估計(jì)技術(shù)能夠有效提高了DOA估計(jì)的準(zhǔn)確性和適應(yīng)性,同時(shí)也能減少對(duì)于陣列陣元的需求。然而,本文中采用的DOA 估計(jì)算法在神經(jīng)網(wǎng)絡(luò)的訓(xùn)練階段中,數(shù)據(jù)需求較大,在后期還需不斷改進(jìn)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)或采用更適宜的神經(jīng)網(wǎng)絡(luò),減少數(shù)據(jù)需求。