国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于TDOA和AOA算法的聲源定位模型的研究

2021-07-18 07:12黃子豪牛啟光王譯晨李鑫
電子制作 2021年12期
關(guān)鍵詞:聲源麥克風(fēng)形狀

黃子豪,牛啟光,王譯晨,李鑫

(山東科技大學(xué),山東濟(jì)南,250031)

0 引言

聲源定位是聽(tīng)覺(jué)系統(tǒng)對(duì)發(fā)聲物體位置的判斷過(guò)程,它包括水平聲源定位和垂直聲源定位以及與發(fā)聲者距離的識(shí)別。對(duì)聲源方位的識(shí)別是人和動(dòng)物對(duì)環(huán)境感知的一種基本方法,有利于動(dòng)物捕捉獵物、尋找配偶和躲避危險(xiǎn)。在聽(tīng)覺(jué)言語(yǔ)交流過(guò)程中,有助于人們將注意力轉(zhuǎn)向或回避某聲源。在多聲源的復(fù)雜聲場(chǎng)中,聲源定位功能有助于從背景聲中鎖定聲學(xué)目標(biāo),分離有用信息。

1 問(wèn)題背景

麥克風(fēng)陣列是指由若干個(gè)麥克風(fēng)按照一定的幾何形狀組合而成的陣列,相對(duì)于單個(gè)麥克風(fēng)而言,具有定位準(zhǔn)確,識(shí)別率高的特點(diǎn)。不僅可以提高聲源的接收信號(hào),還具有定位跟蹤識(shí)別的特點(diǎn)。如今對(duì)麥克風(fēng)陣列的研究依然是聲源定位系統(tǒng)的研究熱點(diǎn),但是傳統(tǒng)的麥克風(fēng)陣列定位系統(tǒng)存在誤差大、受噪音干擾大的特點(diǎn),因此進(jìn)一步提高聲源定位準(zhǔn)確性,將聲源定位應(yīng)用于更廣泛的領(lǐng)域,仍然需要突破傳統(tǒng)方法的弊端。

2 問(wèn)題分析

首先確定麥克風(fēng)陣列的最佳幾何形狀。將二元基陣、三元基陣、四元及其多元基陣構(gòu)成的麥克風(fēng)樹(shù)幾何形狀對(duì)聲源定位的準(zhǔn)確性進(jìn)行比較,根據(jù)分析可知,最佳的幾何形狀為正三角形時(shí),定位的準(zhǔn)確度最高且計(jì)算更為簡(jiǎn)便。

建立基于TDOA 算法和AOA 算法改進(jìn)的聲源定位模型,給定封閉大廳的具體長(zhǎng)寬高,在此基礎(chǔ)上計(jì)算出聲源距離麥克風(fēng)的角度范圍和各個(gè)麥克風(fēng)到達(dá)聲源的距離范圍,最后根據(jù)所構(gòu)建模型求解出聲源的具體坐標(biāo)。

圖1 問(wèn)題分析示意圖

3 構(gòu)建麥克風(fēng)陣列仿真模型

確定麥克風(fēng)樹(shù)的幾何排列形狀,為了更好地用麥克風(fēng)陣列,對(duì)聲源進(jìn)行識(shí)別。本文針對(duì)不同的陣列形狀對(duì)聲源識(shí)別性能展開(kāi)對(duì)比,可以得到最佳的麥克風(fēng)陣列幾何形狀。麥克風(fēng)樹(shù)組成的二維坐標(biāo)系中的平面基陣模型如圖2 所示。

圖2 麥克風(fēng)平面基陣示意圖

聲源坐標(biāo)為p(x,y,z),聲速為常數(shù)c,聲波的傳播形式以直線傳播為主,聲源距離原點(diǎn)得距離是:平面基陣模型是由若干個(gè)陣元Si 組成。S0 為坐標(biāo)原點(diǎn)并且是參考陣元,組成的平面基陣圖中得幾何關(guān)系進(jìn)行定量表示為:

經(jīng)過(guò)化簡(jiǎn)可得:

二元基陣是在平面基陣的基礎(chǔ)之上,坐標(biāo)原點(diǎn)仍然為參考陣元,其中另一陣元s1 的坐標(biāo)設(shè)置為(x1,y1)。

在平面基陣的基礎(chǔ)上,可以列出二元基陣的時(shí)延估計(jì)方程為:

由上述式子可以看出,在二元基陣中對(duì)聲源進(jìn)行定位時(shí),在一個(gè)方程中出現(xiàn)了兩個(gè)未知量,因此這表明當(dāng)使用二元基陣對(duì)聲源進(jìn)行定位時(shí),聲源位置的結(jié)果將會(huì)呈現(xiàn)線性分布狀態(tài)。

■3.1 三元基陣

和上述前提相似,同樣將坐標(biāo)原點(diǎn)作為參考陣元,而在二元基陣的基礎(chǔ)上,新增陣元s3 的坐標(biāo)為(x3,y3),并且s0,s1,s2,s3 不在同一條直線上,在平面基陣的基礎(chǔ)上,三元基陣的表達(dá)式為:

由三元基陣方程可以得,可以通過(guò)求解矩陣方程準(zhǔn)確的確定聲源的具體位置。但是在實(shí)際當(dāng)中,由于受到環(huán)境因素的影響,定位的結(jié)果和實(shí)際的聲源位置會(huì)產(chǎn)生一定的出入。而經(jīng)過(guò)不同學(xué)者通過(guò)對(duì)數(shù)值模擬進(jìn)行計(jì)算分析,得到了不同形狀下特征三元陣的目標(biāo)定位誤差。得出了下面結(jié)論,如果要使整個(gè)平面的定位準(zhǔn)確度不會(huì)出現(xiàn)較大的誤差,那么就應(yīng)該優(yōu)先考慮使用正三元基陣結(jié)構(gòu),也就是正三角形基陣結(jié)構(gòu)。

■3.2 四元基陣及其多元基陣

坐標(biāo)原點(diǎn)s0 依舊為參考陣元,其余三個(gè)陣元依舊不在同一條直線上,由平面基陣模型可得四元基陣的定位方程式為:

在上述方程組當(dāng)中可以看出該式子存在約束條件。因此也就是說(shuō),在實(shí)際的定位計(jì)算過(guò)程當(dāng)中,對(duì)兩兩不同的方程組進(jìn)行求解時(shí)將會(huì)出現(xiàn)不同的解。這也將會(huì)使它的定位結(jié)果會(huì)偏離實(shí)際的聲源位置,會(huì)產(chǎn)生使定位結(jié)果面積擴(kuò)大,也就是誤差增大的現(xiàn)象。

■3.3 對(duì)比分析確定陣列形狀

麥克風(fēng)陣列有時(shí)會(huì)以某種規(guī)則的形式進(jìn)行排列,而有時(shí)則是隨機(jī)的散布在某些區(qū)域當(dāng)中。陣列的選取對(duì)聲源定位的精度影響非常大。常見(jiàn)的陣列形式主要是有直線形和十字形,還有線型。其中線型結(jié)構(gòu)較為簡(jiǎn)單,通過(guò)適當(dāng)?shù)挠?jì)算可以準(zhǔn)確的檢測(cè)出聲源的位置。

分別采用由二元,三元,四元及多元基陣組成的直線形三角形矩形和圓形麥克風(fēng)數(shù)進(jìn)行聲源定位識(shí)別測(cè)試。采用二元、三元、四元及其多元基陣組成的形狀分別為直線型、三角形、矩形和圓形對(duì)聲源進(jìn)行識(shí)別。假設(shè)采樣時(shí)間為20s,采樣間隔為0.5s,運(yùn)用MATLAB 求得多元基陣的聲源定位特點(diǎn)和準(zhǔn)確度。

由表1 可以看出,由二元基陣構(gòu)成的直線型陣列成線性分布,這也同時(shí)驗(yàn)證了二元基陣推導(dǎo)式的正確性,四元基陣組成的矩陣陣列相較于二元基陣構(gòu)成的直線形陣列的聲源定位功能更準(zhǔn)確,偏移距離更小,誤差更小。因此四元及多元基陣組成的矩形陣列比二元基陣組成的直線形陣列更有優(yōu)勢(shì)。

表1

而以三元基陣組成的正三角形陣列和其他三種基陣陣列相比,偏移距離更小,聲源定位區(qū)域更精確。因此三元基陣組成的正三角形陣列結(jié)構(gòu)是聲源識(shí)別定位中最穩(wěn)定,最準(zhǔn)確的基陣.三元麥克風(fēng)的幾何排列形狀如圖3 所示。

圖3 三元麥克風(fēng)基陣排列圖形

4 構(gòu)建基于TDOA 和AOA 算法改進(jìn)的聲援定位模型

TDOA 法又稱為雙曲線定位法,通過(guò)監(jiān)測(cè)信號(hào)到達(dá)麥克風(fēng)的時(shí)間可以算出麥克風(fēng)和聲源的距離。利用聲源到各個(gè)麥克風(fēng)之間的距離,可以計(jì)算出聲源的具體坐標(biāo)。

而無(wú)論是采用TDOA 法還是AOA 算法,都會(huì)存在定位過(guò)程中測(cè)量值誤差較大的問(wèn)題。因此單獨(dú)使用聲源定位方法對(duì)目標(biāo)進(jìn)行定位時(shí),都達(dá)不到理想的定位精度。為了更好更精確地計(jì)算出聲源的具體位置,可以將定位方法的某些結(jié)合起來(lái)使用,用一種定位方法的優(yōu)勢(shì)之處來(lái)填補(bǔ)另外一種定位方法的不足,從而達(dá)到互補(bǔ)的效果,以取得更精確的定位結(jié)果。

將TDOA 定位方法與AOA 定位方法結(jié)合起來(lái),假設(shè)各個(gè)麥克風(fēng)的坐標(biāo)分別為:mic1(x1,y1),mic2(x2,y2),mic3(x3,y3)。

分別測(cè)試聲源到達(dá)各個(gè)麥克風(fēng)的距離和到達(dá)參考麥克風(fēng)的距離差,計(jì)算出聲源和麥克風(fēng)角度。

為了將人和麥克風(fēng)的位置范圍限制在房間內(nèi),我們采用AOA 定位與TDOA 定位結(jié)合使用的方法構(gòu)建模型。假定封閉空間的具體長(zhǎng)寬高分別為20m、10m、10m。

極限情況1:假設(shè)聲源位于(10,20,0)時(shí),麥克風(fēng)1位于(0.05,0.15,1.8),麥克風(fēng)2 位于(0.1,0,1.8),麥克風(fēng)3 位于(0,0,1.8)時(shí),取得最大AOA 角85.4°。此時(shí)聲源與麥克風(fēng)1 之間的距離為22.26 米,與麥克風(fēng)2 之間的距離為22.36 米,與麥克風(fēng)3 之間的距離為22.43 米,此時(shí)可以明顯看出,麥克風(fēng)1 與聲源距離最短,因此為基準(zhǔn)麥克風(fēng)。則聲源到達(dá)麥克風(fēng)2 與到達(dá)基準(zhǔn)麥克風(fēng)的距離之差為0.1 米,聲源到達(dá)麥克風(fēng)3 與到達(dá)基準(zhǔn)麥克風(fēng)的距離之差為0.17 米。

極限情況2:當(dāng)聲源位于麥克風(fēng)樹(shù)正下方時(shí),仍設(shè)麥克風(fēng)1 位于(0.05,0.15,1.8),麥克風(fēng)2 位于(0.1,0,1.8),麥克風(fēng)3位于(0,0,1.8),此時(shí)聲源應(yīng)位于(0.05,0.05,0),此時(shí)取得最小AOA 角0°。計(jì)算求得聲源與麥克風(fēng)1 之間的距離為1.803 米,與麥克風(fēng)2 之間的距離為1.803 米,與麥克風(fēng)3 之間的距離為1.803 米。

以上考慮了當(dāng)AOA 角處于極限大小的兩種情況,在MATLAB 實(shí)際仿真中,當(dāng)限制麥克風(fēng)樹(shù)與人的范圍為假定房間的長(zhǎng)寬高時(shí),首先得出AOA 角的有效范圍能對(duì)人的位置做出更加精準(zhǔn)的判斷。在假定情況下,我們實(shí)際算得,當(dāng)AOA 角為85.4°時(shí),聲源的估計(jì)位置為(8.77,17.96,0)。當(dāng)AOA 角為0°時(shí),聲源的估計(jì)位置為(8.77,17.96,0)。這與實(shí)際位置的偏差值為6%左右,在誤差允許范圍內(nèi),對(duì)于其他位置均可結(jié)合AOA 角與TDOA 算法進(jìn)行較為精準(zhǔn)的位置估計(jì)。

最終求解出當(dāng)AOA 角最小為0 時(shí)的聲源坐標(biāo)為(0.026,0.015,0),當(dāng)AOA 角最大為85.4 度時(shí)的聲源坐標(biāo)為(8.77,17.96,0)。

5 模型的優(yōu)缺點(diǎn)

■5.1 模型的優(yōu)點(diǎn)

將TDOA 算法和AOA 算法相結(jié)合,取長(zhǎng)補(bǔ)短,彌補(bǔ)了各自算法的短板,將兩個(gè)算法進(jìn)行結(jié)合。減免了計(jì)算過(guò)程的冗長(zhǎng)復(fù)雜,有效地節(jié)省了數(shù)據(jù)的傳輸量和傳輸時(shí)間。不僅提高了運(yùn)算效率,而且也提高了運(yùn)算準(zhǔn)確度。為后續(xù)的聲源定位算法奠定了堅(jiān)實(shí)的基礎(chǔ)。

■5.2 模型的缺點(diǎn)

采用的聲源定位方法,其定位準(zhǔn)確度主要取決于定位過(guò)程當(dāng)中距離差的大小和范圍以及角度的范圍。這造成了麥克風(fēng)陣列的空間分辨率不足可導(dǎo)致生源的混疊。從而造成對(duì)生源未知的錯(cuò)誤估計(jì)。

使用的麥克風(fēng)陣列定位算法計(jì)算量大且不便于移植。再者由于互相關(guān)函數(shù)是建立模型的基礎(chǔ) 并且是在沒(méi)有環(huán)境噪音的影響下產(chǎn)生的。因此對(duì)實(shí)際環(huán)境的考慮不全面,所求的數(shù)值較為理想,忽略了環(huán)境因素對(duì)聲源定位的影響。

6 模型的推廣

(1)對(duì)TDOA 模型算法進(jìn)行改進(jìn)之后,由于其在實(shí)際過(guò)程當(dāng)中不受麥克風(fēng)陣列位置的不確定性影響,故可以將三元麥克風(fēng)陣列應(yīng)用到移動(dòng)機(jī)器人聲源定位過(guò)程中。

(2)改進(jìn)后的模型具有敏感性大的特點(diǎn)??梢岳酶兄畔?duì)特定目標(biāo)進(jìn)行識(shí)別和跟蹤。這不僅是機(jī)器人領(lǐng)域的內(nèi)容,同時(shí)也是軍事領(lǐng)域關(guān)注的重要熱點(diǎn)。

(3)由于模型可以準(zhǔn)確地獲取目標(biāo)聲源的位置信息,包括方位角、俯仰角和距離。而在實(shí)際應(yīng)用過(guò)程當(dāng)中,傳感器的噪聲干擾和聲源目標(biāo)本身都具有較強(qiáng)的不確定性和未知性,這給定位精度帶來(lái)很大的困難。而改進(jìn)后的模型恰好巧妙地避免了這一缺點(diǎn)。因此可以將模型運(yùn)用到對(duì)聽(tīng)覺(jué)感知的研究和語(yǔ)音辨別理解等領(lǐng)域上。

7 結(jié)束語(yǔ)

聲源定位技術(shù)不論是在日常生活中或是工業(yè)生產(chǎn)中應(yīng)用都十分廣泛,可以用于聲音的識(shí)別和噪聲聲源的定位等問(wèn)題,目前聲學(xué)產(chǎn)品也進(jìn)入大規(guī)模的研發(fā)模式,聲源檢測(cè)和定位系統(tǒng)也逐漸成為熱門的研究課題,這對(duì)于我國(guó)聲學(xué)領(lǐng)域的研究起到了積極的推動(dòng)作用。

猜你喜歡
聲源麥克風(fēng)形狀
虛擬聲源定位的等效源近場(chǎng)聲全息算法
一種基于麥克風(fēng)陣列用于分離單極子和偶極子聲源的方法
近場(chǎng)相干聲源三維定位MUSIC算法?
室內(nèi)聲音導(dǎo)航系統(tǒng)
麥克風(fēng)的藝術(shù)
訊飛輸入法也能離線語(yǔ)音輸入
火眼金睛
讓重力控制麥克風(fēng)
分一半
麥克風(fēng)