經(jīng)若楠
(華北電力大學(xué)(保定),河北 保定 071000)
隨著科技的發(fā)展與進(jìn)步,傳聲器陣列技術(shù)當(dāng)前已被廣泛地應(yīng)用到音頻與視頻會議、汽車的安全以及語音增強(qiáng)等多個領(lǐng)域[1]。陣列信號處理的一個主要的任務(wù)就是聲源定位,它是空間濾波技術(shù)實現(xiàn)的基礎(chǔ)?;跁r延估計的聲源定位方法主要有兩步,最主要的就是要對信號到達(dá)不同的傳聲器之間的時間差(TDOA)來進(jìn)行估計,然后再利用幾何關(guān)系來確定聲源的位置[2]。20世紀(jì)70年代開始逐漸有各種TDOA的方法被提出,比如自適應(yīng)最小均方、基于聲門脈沖激勵的方法、基于基音周期的方法等。一個好的時延估計方法要同時具備良好的抗噪聲與抗混響性能和較小的運算量[3]。
國外對于聲源定位技術(shù)的研究起步相比國內(nèi)而言更早一些,但是曾經(jīng)一度因為其他種類的傳感技術(shù)的興起聲源定位技術(shù)被邊緣化了。隨著當(dāng)前科學(xué)技術(shù)的發(fā)展與進(jìn)步,聲源定位技術(shù)又由于其所具有的隱蔽性好、成本低等優(yōu)勢條件顯露出來,從而重新進(jìn)入到人們的視野中?,F(xiàn)在許多國家都對于聲源定位技術(shù)進(jìn)行了大量的實驗研究與應(yīng)用。
目前許多的西方國家的軍隊中都已經(jīng)應(yīng)用了聲源定位系統(tǒng),并且聲源定位系統(tǒng)在其中發(fā)揮了,非常重要的作用。比如以色列所研制出的AEWS系統(tǒng)主要用來進(jìn)行聲測預(yù)警,它能夠檢測到飛機(jī)的信息同時可以將定位的數(shù)據(jù)發(fā)送給指揮中心。在2005年時,美國的軍方通過利用Crossbow公司研制的傳感器節(jié)點來實現(xiàn)了槍聲定位系統(tǒng),用它來對目標(biāo)建筑范圍內(nèi)的突發(fā)事件比如槍聲或者爆炸聲的位置來進(jìn)行監(jiān)測。2011年,德國的萊茵金屬公司制造出了一款新型的車載聲學(xué)狙擊定位系統(tǒng)(如圖1所示),該系統(tǒng)由綜合的電子分析設(shè)備以及與它相連的擴(kuò)音器的天線,還有安裝在裝甲車內(nèi)部的控制設(shè)備與顯示設(shè)備。當(dāng)該系統(tǒng)能夠探測到有武器的射擊時,就會用聲音和圖像或者時以視頻的形式發(fā)出警告,同時在控制設(shè)備與顯示設(shè)備上顯示對于敵人的分析所得出來的信息。
聲源定位技術(shù)的定位算法有四種,分別是:基于可控波束形成的聲源定位方法,基于高分辨率譜估計得定位方法,基于聲壓幅度比得定位算法,基于聲達(dá)時間差(TDOA)的定位算法。這里主要對于最后一種方法進(jìn)行介紹,它一般被分成時延估計和聲源定位兩個部分。
時延估計定位方法是當(dāng)前聲源定位系統(tǒng)設(shè)計經(jīng)常使用的算法。時延估計算法在實際的應(yīng)用中價值非常高,在數(shù)字信號處理領(lǐng)域的活躍度特別高。時延估計算法分為兩部分,分別是延遲估計和位置估計。
時延估計算法的基本原理:利用傳聲器陣列來對實時的信號進(jìn)行接收,并對這些數(shù)據(jù)進(jìn)行處理從而獲得在不同陣列間的延遲值。然后再用這個得出的時延值來計算不同的傳聲器與目標(biāo)聲源之間的距離差,并且將距離差代入到傳聲器陣列的幾何模型所推導(dǎo)出的位置公式中,最終得到具體的聲源坐標(biāo)。時間延遲(TDOA)指的是由同一聲源出發(fā),但是由于傳輸路徑的不同最終導(dǎo)致兩個傳聲器接收到的信號存在的時間差。延遲估計還可以確定目標(biāo)的距離、方向以及速度等參數(shù)。
基于時延估計的定位算法有多個互相關(guān)聯(lián)的算法,因此當(dāng)聲源只有一個時定位的效果是最好的,而在聲源較多的情況下,定位的效果并不是很好有時可能直接無法定位。在相對復(fù)雜的環(huán)境中,在聲音信號進(jìn)行傳播的過程中通常會發(fā)生反射現(xiàn)象,并且可能會有較強(qiáng)的噪聲源存在,這樣就給時間延遲的準(zhǔn)確性計算帶來了相當(dāng)大的難度,因此使得定位的精度大大降低。所以,時延估計算法通常被用到一些噪聲強(qiáng)度較小與聲音信號反射比較少的地方,在這些環(huán)境條件下,算法計算起來難度相對較低,只需要對時延估計算法進(jìn)行很小的改進(jìn)就可以獲得比較準(zhǔn)確的時延值。同時,時延估計算法對于硬件設(shè)備的要求并不高,很簡單的設(shè)備就可以實現(xiàn),設(shè)備的成本相對較低,方便推廣使用。
傳聲器和聲源位置關(guān)系的幾何模型如圖2,連接著兩個傳感器,分別為M1和M2,將它們的中點當(dāng)作遠(yuǎn)點,它們之間的連線就是X軸,τ12就是聲源信號在兩個傳感器的時間時延。分別用m1和m2來表示這兩個傳聲器所出的位置,用rs這個矢量來表示聲源所在的位置,那么聲源S就應(yīng)該滿足下列方程式:
||rs-m1-||rs-m2||=τ12c
(1)
其中c表示聲音的傳播速度。由雙曲面的定義知,能夠符合該方程的解一定會在雙曲線上。把聲源S(r,θ,φ)的極坐標(biāo)表示轉(zhuǎn)化成直角坐標(biāo)的形式,如下:
(2)
將(2)式以及m1=(|m1-m2|/2,0,0)與m2=(-|m1-m2|/2,0,0)共同帶入到(1)式中,并且對其兩端同時進(jìn)行平方得到下式:
(3)
若處在遠(yuǎn)場模型中,聲源與傳聲器二者之間的距離會相對遠(yuǎn)一些,也就是說,當(dāng)r的取值非常大時,1/4r2將會接近0,則上式就可以近似表示為
(4)
在三維立體空間中,要想確定某個聲源的位置,就需要有三個相互獨立的時延估計值,所以在傳聲陣列中至少需要有四個單元,即四元的十字陣,平面四元十字陣如圖3所示。在陣列中四個傳聲器的坐標(biāo)分別為M1(d/2,0,0),M2(0,d/2,0),M3(-d/2,0,0),M4(0,-d/2,0),聲源目標(biāo)S所處位置的坐標(biāo)為(x,y,z),r是聲源目標(biāo)S與原點之間的距離,θ是其俯角,φ為其方位角,d則是兩傳聲器之間的距離。如果r遠(yuǎn)大于d,那么我們能夠做出這樣的假設(shè),陣列接收到的信號以平面波的形式來進(jìn)行傳播。如果對于M1來說,聲源信號到達(dá)其他三個位置的時延分別是τ21、τ31、τ41,到達(dá)三點與M1之間的聲差分別是d21、d31、d41。
最終得出聲差的公式,聲源方位角φ(0°≤φ≤360°),俯角θ(0°≤θ≤90°)以及聲源S與傳聲器陣列的中心之間的距離r。
(5)
(6)
(7)
(8)
當(dāng)前聲源定位技術(shù)在軍事領(lǐng)域以及日常生活中已經(jīng)被廣泛地應(yīng)用,未來還需要加大對其研究的力度,使得定位更加的精準(zhǔn)快速,應(yīng)用到更多的領(lǐng)域中,推動社會的發(fā)展與進(jìn)步。