李 賀,劉志紅,儀垂杰
(1.青島理工大學(xué) 信息與控制工程學(xué)院,山東 青島266520;2.青島理工大學(xué) 工業(yè)流體節(jié)能與污染控制教育部重點實驗室,山東 青島266520)
基于麥克風(fēng)陣列進(jìn)行聲源方位估計是噪聲源識別、水聲通信和語音識別中的關(guān)鍵科學(xué)問題。在麥克風(fēng)數(shù)目受限時,存在分辨率低、虛假聲源抑制性差、精確定位多個聲源難等問題。為解決這一系列問題,研究者一方面對麥克風(fēng)陣列進(jìn)行陣列結(jié)構(gòu)優(yōu)化,提高聲陣列性能,以采集更多的有效聲信息;另一方面不斷改進(jìn)聲源方位估計算法,充分利用聲信息對聲源方向進(jìn)行定位。
傳統(tǒng)陣列結(jié)構(gòu)大多是規(guī)則陣列(如:均勻線陣、矩形(方陣)、均勻圓形陣列、十字形陣列等),具有結(jié)構(gòu)簡單,搭建方便,結(jié)構(gòu)容易調(diào)整等優(yōu)點。但是這種陣元等間隔布放模式在使用波束形成算法進(jìn)行聲源方位識別時會產(chǎn)生測量空間分辨率受限、易發(fā)生串?dāng)_和精確定位多個聲源難[1-2]等問題;在陣列性能方面體現(xiàn)為陣列方向圖的主瓣寬度較寬、旁瓣值較大[1]等問題。為改善陣列性能,降低最大旁瓣過大造成的頻譜泄露問題,研究者在規(guī)則陣列基礎(chǔ)上,稀疏優(yōu)化選擇有限個數(shù)陣元的位置。Haupt等[3]首先提出利用遺傳算法對以中心點對稱的線陣陣列進(jìn)行稀疏優(yōu)化;劉小忠等[4]利用改進(jìn)粒子群優(yōu)化算法對對稱線陣進(jìn)行稀布;陳客松等[5]將陣列結(jié)構(gòu)改變?yōu)榉菍ΨQ結(jié)構(gòu),進(jìn)一步降低了陣列的最大旁瓣值;黃超等[6]通過采用保留最優(yōu)個體和自適應(yīng)交叉和變異算子相結(jié)合的方式,獲得了更低的峰值旁瓣水平。但是,遺傳算法、粒子群優(yōu)化算法等全局優(yōu)化算法計算量巨大,耗時較多,同時減小峰值旁瓣對其它算法是否能提高角度分辨率不確定。Chiariotti等[7]對波束形成算法中聲陣列的性能參量和陣列形成算法進(jìn)行了系統(tǒng)的研究,指出通過對規(guī)則陣列進(jìn)行稀疏化的方法仍然不能去除空間周期性采樣的影響。本研究考慮采用隨機(jī)陣列,隨機(jī)陣列是由陣元隨機(jī)布放形成,這種布放隨機(jī)性可徹底避免因結(jié)構(gòu)周期性而導(dǎo)致的陣列性能變差問題,獲得更大的陣列孔徑和更小的峰值旁瓣級[8],有效提高聲源分辨率。
聲源方位估計方法中,典型算法包括常規(guī)波束形成(common beamforming,CBF)、最小方差無失真響應(yīng)(minimum variance distortionless response,MVDR)算法[9]、多重信號分類(multiple signal classification,MUSIC)算法[10]和旋轉(zhuǎn)不變子空間(estimating signal parameter via rotational invariance techniques,ESPRIT)算法[11]等。CBF算法空間分辨率不能超過瑞利限,且動態(tài)響應(yīng)范圍受旁瓣的影響,存在計算時間長、易出現(xiàn)負(fù)聲源或假聲源等問題;MVDR算法、MUSIC算法 和ESPRIT算法等子空間類算法在高信噪比、信源不相干和多快拍數(shù)情況下表現(xiàn)良好,但受信噪比影響較大,無法處理相干信號,對快拍數(shù)的依賴性比較強(qiáng)。自2005年Malioutov等[12]從稀疏信號重構(gòu)角度基于傳聲器陣列對信源進(jìn)行定位之后,壓縮感知被廣泛應(yīng)用在聲源方位識別中。Li等[12]通過壓縮采樣基于單次快拍數(shù)對信源方向進(jìn)行識別,克服了對信號相干性的限制,同時也大大減小了所需信號快拍數(shù);Zhu等[13]在信號稀疏理論框架下采用了協(xié)方差矩陣、內(nèi)插矩陣和波束空間三種壓縮感知模型對信源方向進(jìn)行估計,對單信源和多信識別的角度分辨率優(yōu)于傳統(tǒng)算法;Das等[14]發(fā)現(xiàn)在識別相干多徑信號波達(dá)方向時,壓縮感知(compressed sensing,CS)算法優(yōu)于MVDR算法。但這些應(yīng)用都基于均勻線陣進(jìn)行信號采集,孔徑受限,空間周期性采樣導(dǎo)致采集到的聲信息具有重復(fù)性,這種因陣列結(jié)構(gòu)引起的有效聲信息不足嚴(yán)重影響識別的空間分辨率,通常無法分辨同頻相近聲源。Xenaki等[15]發(fā)現(xiàn)基于隨機(jī)陣列可提高角度分辨率,并且分析了在特定結(jié)構(gòu)的隨機(jī)線性陣列基礎(chǔ)上,分辨率隨入射角度的變化,但沒有對如何產(chǎn)生隨機(jī)陣列以及識別方法中信號相關(guān)參數(shù)與分辨率的關(guān)系進(jìn)行深入探討。為解決這一問題,本研究提出利用陣元位置坐標(biāo)符合均勻分布的隨機(jī)陣列結(jié)構(gòu),結(jié)合壓縮感知重構(gòu)算法對聲源方位進(jìn)行識別的方法。并以隨機(jī)線性陣列為例,為避免串?dāng)_而保持陣元間距大約半波長的限制,形成多約束均勻分布線性陣和壓縮感知相結(jié)合的聲源方位估計方法(multiple constraints uniform distributed random linear array+compressed sensing,MC-Uni-RLA+CS)。仿真結(jié)果表明:本方法可提高聲源方位識別角度分辨率;同時研究了不同信噪比、入射信號個位數(shù)情況下算法的性能,對均勻線陣和壓縮感知結(jié)合(uniform linear array compressed sensing,ULA+CS)方法和本方法在不同入射角度范圍內(nèi)的識別精度進(jìn)行了比較。
壓縮感知是近年來出現(xiàn)的新的信號采集理論,以遠(yuǎn)小于奈奎斯特采樣定理要求的采集數(shù)據(jù)大概率恢復(fù)原始信號。主要包括信號稀疏性驗證、測試矩陣設(shè)計和信號重建算法三個部分。壓縮感知可應(yīng)用的條件包括:①信號具有稀疏性;②測試矩陣與信號基空間具有不相干性。這些也是原始信號可重構(gòu)的條件。
對信號x∈RN,如果它可以用N×1維正交基向量線性表示:
其中si是投影系數(shù),s是對應(yīng)的向量形式。如果只有k 個系數(shù)不為零,或者k 個系數(shù)遠(yuǎn)遠(yuǎn)大于其他系數(shù),并且k?N,就可以說信號x 在Ψ 域是稀疏的或者近似稀疏的。信號具有稀疏性是進(jìn)行壓縮感知的前提條件,常見正交變換如FFT變換、DCT變換和wavelet變換等對信號進(jìn)行變換后如果只需要少量系數(shù)表達(dá),信號在新的域中將具有稀疏性。
對稀疏信號x 進(jìn)行壓縮采樣不同于時域測量時記錄信號在某個時刻的值,是對原始信號利用觀測矩陣Φ 進(jìn)行投影的過程。即測量值:y=Φx=ΦΨs。令A(yù)CS=ΦΨ,稱為感知矩陣。從測量結(jié)果y(y∈RM)中恢復(fù)信號,可通過用求解P1問題完成。
P1問題是L1范數(shù)下的凸優(yōu)化問題,如果信號足夠稀疏,感知矩陣ACS滿足受限正交性質(zhì)(restricted isometry property,RIP)[16]是存在確定解的充要條件。
RIP條件:
定義等距常數(shù)δk:對每個整數(shù)k=1,2,…,K,定義矩陣A 的等距常數(shù)δk為滿足以下條件的最小數(shù)值:
其中,稀疏向量x 為K 稀疏的。如果δk不太接近1,則認(rèn)為矩陣ACS滿足RIP條件。
但是RIP條件不易判定是否實現(xiàn),文獻(xiàn)[17]指出可通過測量矩陣和稀疏信號正交基之間是否相干確定信號的可重構(gòu)性能,如果二者不相干,則矩陣ACS可大概率滿足RIP條件。同時,根據(jù)相關(guān)性理論,不相干條件還可以等價為ACS中任意兩列線性無關(guān)。根據(jù)[15],利用Gram 矩陣C(C=|AHA|)中主對角線之外的元素值,可直觀表示矩陣任意兩列相關(guān)性,Gij值越小,相干性越小。其中,Gram 矩陣的元素Gij是矩陣A 第i行和第j列對應(yīng)列的L2范數(shù)內(nèi)積。
基于聲陣列進(jìn)行聲源方位估計的模型可表示為:
其中,y(t)是陣列輸出矢量,A 是線陣對應(yīng)的M×K 陣列流型,矩陣中元素:aij=e-j2π/λ·disinθj(i=1,2,…,M;j=1,2,…,K),M 表示陣元數(shù)量,K 為聲信號入射角度個數(shù),λ 為入射信號波長,di是第i個麥克風(fēng)陣元與最左端參考點的距離,θj是第j 個聲信號入射角;s(t)=[s1,s2,…,sK]為聲信號矢量,表示從K 個不同方向入射的聲信號;n(t)表示長度為M 的測試噪聲向量。聲源方位估計就是從麥克風(fēng)輸出向量y(t)中估計聲信號入射角(θ1,θ2,…θK)的過程。
在選用線性陣列情況下,入射角可定義為聲源傳播方向與陣列法線的夾角,范圍為[-90°,90°],將該范圍分為N 個區(qū)域,每個區(qū)域?qū)?yīng)一個方位角,則每個角度都可能是聲信號的來波方向,K 個聲源入射角度對應(yīng)了N 個方位角中K 個不為0的值。因聲源信號數(shù)K?N,入射信號可視為空間稀疏度為K 的N 維稀疏向量,聲源信號滿足空間稀疏性。
對應(yīng)于壓縮感知理論,如果信號是K 稀疏的,可以采用與Ψ 不相關(guān)的測量矩陣ΦM×N(M?N)對信號x 進(jìn)行壓縮觀測,矩陣Φ 中每一行等效為一個傳感器,通過與Φ 相乘,得到少量測量值,y=Φx。將x 表達(dá)式代入,得到M×1的測量向量y:
聲源方位估計模型可表示為:
這樣,把原始陣列流形A(M×K)擴(kuò)展為過完備的感知矩陣ACS(M×N),實現(xiàn)基于CS理論的聲源方位估計模型的建立。其中,ACS對應(yīng)的Gram 矩陣元素值的大小反映了從聲陣列測試數(shù)據(jù)進(jìn)行聲源方位估計估計的能力。
根據(jù)前述內(nèi)容,影響聲源方位估計的主要因素為感知矩陣ACS,而在有限麥克風(fēng)數(shù)量條件下,影響矩陣ACS陣列流形的關(guān)鍵因素是麥克風(fēng)數(shù)量、陣元間隔和陣列孔徑。根據(jù)文獻(xiàn)[17],觀測矩陣Φ 的向量在正交空間均勻分布時,Φ 與Ψ 將具有更低的相干性,與此對應(yīng),本研究選擇線陣位置坐標(biāo)隨機(jī)均勻分布在整個坐標(biāo)空間;同時,為保證測試向量的正交性和避免串?dāng)_,選擇陣元間隔大于信號半波長[18]。為綜合以上限制,引入MC-Uni-RLA為基礎(chǔ)陣,且采用連續(xù)位置坐標(biāo)優(yōu)化保證陣元位置均勻隨機(jī)分布。具體生成過程為:設(shè)陣列孔徑L 的線陣上有M 個陣元,為保證孔徑不變,陣列兩端各固定一個陣元,剩余M-2個陣元隨機(jī)放置,即r0和rM-1固定,對r1,…,rM-2進(jìn)行優(yōu)化。由于要滿足最小陣元間隔dc=0.5λ,首先獲得均勻連續(xù)分布在[0,L-(M-1)×dc]范圍內(nèi)的坐標(biāo)[l1,…,lM-2],此處使得l1<l2<…<lM-2,然后再把[l1,l2,…,lM-2]分別增加[dc,2dc,…,(M-2)×dc]得到[r1,r2,…,rM-2],具體可由式(8)計算。
根據(jù)前述分析,感知矩陣ACS滿足RIP條件等效為列向量之間不相干,可由對應(yīng)的Gram 矩陣值進(jìn)行衡量。因此,可計算不同陣列結(jié)構(gòu)及參數(shù)的聲陣列所對應(yīng)Gram 矩陣,作為評判算法重構(gòu)性能的依據(jù)。Gram矩陣元素值越小,說明感知矩陣的列相關(guān)性越小,正確恢復(fù)原信號的概率越大。
分別在相同陣元數(shù)目和相同陣列孔徑下,對比均勻線陣和隨機(jī)均勻分布線陣在不同參量條件下的Gram 矩陣。仿真參數(shù)具體設(shè)置見表1。
表1 仿真參數(shù)Tab.1 Simulation parameters
1)陣元數(shù)量相同
設(shè)置陣元個數(shù)m=8,對ULA,根據(jù)空間采樣定理,選擇陣元間隔0.5λ,對應(yīng)Gram 矩陣如圖1(a)所示;對MC-Uni-RLA,采用孔徑L=10λ,對應(yīng)Gram 矩陣如圖1(b)所示。
圖1 陣元個數(shù)相同時,聲陣列對應(yīng)Gram矩陣Fig.1 Grim matrix of arrays under the same number of elements
從圖1可以看出,對于ULA,當(dāng)陣元間距為0.5λ 時,陣列孔徑較小,L=3.5λ,Gram 矩陣元素值較大,感知矩陣列相關(guān)性較強(qiáng);而MC-Uni-RLA對應(yīng)Gram 矩陣元素取值均較小,在[-60°,60°]范圍內(nèi)低于0.3。說明MC-Uni-RLA感知矩陣列相關(guān)性小于ULA,對信號重構(gòu)條件滿足更好。
2)陣列孔徑大小相同
要保持ULA 與MC-Uni-RLA 孔徑大小相同(L=10λ),ULA 需增加陣元個數(shù)到21 個,Gram 矩陣元素大小如圖2,與圖1(b)比較可知,ULA增加陣元個數(shù)后,對應(yīng)感知矩陣的列相關(guān)性依然大于8個陣元構(gòu)成的MC-Uni-RLA 的列相關(guān)性,對信號重構(gòu)條件的滿足情況比MC-Uni-RLA差。
假設(shè)聲源處于遠(yuǎn)場入射,為了驗證本方法性能與優(yōu)勢,在相同麥克風(fēng)陣元數(shù)目下對多聲源入射角度進(jìn)行識別。
1)聲源角度分辨率比較
當(dāng)兩個聲源入射時,比較不同信噪比和快拍數(shù)下,不同算法的識別結(jié)果,如圖3所示。
從圖3中可以看出,當(dāng)快拍數(shù)足夠多(256)、信噪比較高(20 dB)時,對于間隔為6°入射的信號,CBF角度分辨率最差,已經(jīng)不能正確區(qū)分,MVDR次之,MUSIC算法、ULA+CS方法和MC-Uni-RLA+CS方法可以正確區(qū)分;當(dāng)快拍數(shù)減少時,MVDR算法和MUSIC算法識別效果開始變差,當(dāng)快拍數(shù)減少到一定程度時,二者完全不能識別入射角度,而ULA+CS方法和MC-Uni-RLA+CS方法還可以區(qū)分,說明使用CS算法對聲源角度進(jìn)行識別,可以不受快拍數(shù)減少的影響;當(dāng)入射角度間隔減小到2°時,以均勻線陣為基礎(chǔ)的ULA+CS方法失效,以采用的多約束隨機(jī)線陣為基礎(chǔ)的MC-Uni-RLA+CS方法可以正確識別聲源入射角度;保持其他參數(shù)不變,將信噪比減小到SNR=10 dB,依然可以正確識別。所提方法可以在低信噪比、少快拍數(shù)下實現(xiàn)更高的角度分辨率。
圖2 與MC-Uni-RLA孔徑大小相同的ULA陣列對應(yīng)G矩陣圖形,陣元個數(shù)m=21Fig.2 Grim matrix of ULA with the same aperture as MC-Uni-RLA,m=21
圖3 雙聲源識別結(jié)果對比Fig.3 Comparison of double source recognition results
2)誤差隨信噪比變化
當(dāng)兩個聲源入射角度差固定時,識別結(jié)果的均方根誤差(root mean square error,RMSE)隨信號SNR的變化情況,如圖4所示。
從圖4可知,入射角度為[0°,2°]時,信噪比大于6 dB,識別結(jié)果RMSE為0,具有較高角度分辨率;入射角度為[0°,6°]時,信噪比大于0 dB,識別結(jié)果RMSE為0。入射角度間隔越小,角度分辨率越高,要達(dá)到正確識別對信噪比要求也越高。
3)誤差隨入射聲源個數(shù)變化
不同入射聲源個數(shù)的RMSE的變化規(guī)律。假定多個聲源之間角度間隔固定為1°,考察當(dāng)聲源個數(shù)增加時,聲源識別結(jié)果RMSE隨聲源個數(shù)的變化,如圖5所示。
圖4 當(dāng)兩個聲源入射方向固定時,識別結(jié)果RMSE隨信噪比變化Fig.4 RMSE of identification results changes with SNR when two incident signal angles are fixed
當(dāng)聲源入射角度間隔為1°時,從圖5發(fā)現(xiàn),信源數(shù)較少時,RMSE為0,可以把間隔為1°的信源區(qū)分開,RMSE 隨聲源個數(shù)增多而增大,當(dāng)增大到陣元個數(shù)M 附近時,識別結(jié)果RMSE大幅惡化,算法不能應(yīng)用。說明本方法在處理欠定DOA估計問題時,具有良好的識別能力,可實現(xiàn)超分辨的DOA估計。
4)算法適用角度范圍
考察在不同角度范圍識別聲源入射角的RMSE變化情況。對單聲源角度進(jìn)行有效角度范圍測試,比較相同孔徑大小(L=10λ)條件下MC-Uni-RLA(麥克風(fēng)數(shù)目為m=8個)和ULA(麥克風(fēng)間距為d=0.5λ,麥克風(fēng)數(shù)目為m=21個)對應(yīng)的識別結(jié)果以及適用角度范圍。對單聲源入射角估計,分別運行100次CS信號重構(gòu)算法,將多次識別結(jié)果RMSE作為算法識別效果的衡量參數(shù),結(jié)果如圖6所示。
圖5 識別結(jié)果RMSE隨聲源個數(shù)的變化,間隔為1°Fig.5 RMSE of identification results changes with the number of sources when the interval angle is 1°
圖6 陣列孔徑為:L=10λ,估計結(jié)果RMSEFig.6 The aperture:L=10λ,RMSE of results
從圖6可以看出,當(dāng)陣列孔徑固定時,MC-Uni-RLA+CS比ULA+CS識別效果好,在[-50°,50°]角度范圍內(nèi)100次算法運行結(jié)果RMSE為0,可以全部識別正確,而ULA識別結(jié)果僅在0°角度附近RMSE為0。該結(jié)果與前文ULA對應(yīng)Gram 矩陣元素值比本方法?。▓D1(b)和圖2)相對應(yīng)。本方法在麥克風(fēng)數(shù)目減少(從21減少到8個)情況下,在更廣泛的角度范圍達(dá)到比相同孔徑大小的均勻線性陣列更好的識別精度。
為提高聲源方位估計精度,增大聲陣列孔徑和角度分辨率,提出了多約束隨機(jī)陣的壓縮感知聲源方位估計方法,主要研究結(jié)論如下:
1)在相同麥克風(fēng)數(shù)目、低信噪比和少快拍數(shù)條件下,多約束隨機(jī)線陣的應(yīng)用提高了角度分辨率。MCUni-RLA+CS方法比CBF、MVDR、MUSIC和均勻線陣壓縮感知(ULA+CS)方法角度分辨率高。
2)本算法可以在低信噪比情況下取得較高分辨率。入射信號角度間隔越小,角度分辨率越高,要達(dá)到正確識別對信噪比要求也越高。
3)本算法適用于多聲源入射角度識別。當(dāng)入射信號數(shù)目小于麥克風(fēng)數(shù)目時,算法基本可正確識別來波信號入射角度,構(gòu)建了隨機(jī)線性陣構(gòu)型與聲源方位間的定量關(guān)系。
4)采用隨機(jī)線陣結(jié)構(gòu),本算法可以在少數(shù)麥克風(fēng)數(shù)目(陣元M=8)情況下,比同等大小孔徑均勻線陣(陣元M=21)在更寬的角度范圍內(nèi)取得更高的角度識別正確率。