冷先帥, 汪華俊, 朱亞萍
(杭州電子科技大學(xué) 浙江省物聯(lián)感知與信息融合技術(shù)重點(diǎn)實(shí)驗(yàn)室,浙江 杭州 310018)
基于非同步采集方式小型聲源定位系統(tǒng)設(shè)計(jì)*
冷先帥, 汪華俊, 朱亞萍
(杭州電子科技大學(xué)浙江省物聯(lián)感知與信息融合技術(shù)重點(diǎn)實(shí)驗(yàn)室,浙江杭州310018)
利用非同步采集設(shè)備,通過廣義互相關(guān)(GCC)時(shí)延估計(jì)算法,估算出通道間的相對(duì)時(shí)延;對(duì)非同步采集方式產(chǎn)生的時(shí)延誤差進(jìn)行軟件補(bǔ)償;利用基于到達(dá)時(shí)間差(TDOA)聲源定位算法的雙步定位特性,估算出聲源的位置。分別設(shè)計(jì)了四元均勻線陣系統(tǒng)和四元平面十字陣列系統(tǒng)對(duì)以上方法進(jìn)行驗(yàn)證,系統(tǒng)能夠較準(zhǔn)確地實(shí)現(xiàn)對(duì)聲源方位的估計(jì)。
非同步采集; 聲源定位; 廣義互相關(guān); 到達(dá)時(shí)間差; 補(bǔ)償時(shí)延差
聲源定位技術(shù)[1~4]廣泛應(yīng)用于各個(gè)領(lǐng)域中,軍事上對(duì)低空飛機(jī)、炮彈、潛艇、機(jī)器人等的定位;民用上應(yīng)用于視頻會(huì)議系統(tǒng)、智能監(jiān)控系統(tǒng)等。在聲源定位系統(tǒng)中,希望以較低設(shè)計(jì)成本達(dá)到較高的聲源方位估計(jì)精度。實(shí)際中,聲源定位的實(shí)現(xiàn)多數(shù)建立在昂貴的多通道同步采集設(shè)備基礎(chǔ)上,系統(tǒng)硬件成本較高。若采用非同步采集設(shè)備,可大幅度削減硬件成本,但輪回采集方式使得通道間存在時(shí)延誤差。
本文基于到達(dá)時(shí)延差(time delay of arrival,TDOA)的聲源定位具有運(yùn)算量小、實(shí)時(shí)性高、定位精度高等優(yōu)點(diǎn),利用其雙步定位特性,首先補(bǔ)償非同步采樣產(chǎn)生的時(shí)延差,再將聲源與麥克風(fēng)陣元之間幾何關(guān)系,分別運(yùn)用于四元均勻線陣和平面十字陣列中,實(shí)現(xiàn)對(duì)聲源方位的估計(jì)。整個(gè)系統(tǒng)簡(jiǎn)單小巧、成本低、定位精度較高。
采集系統(tǒng)[5~7]主要由駐極體麥克風(fēng)陣列、放大電路、ART USB2810非同步數(shù)據(jù)采集卡、處理平臺(tái)構(gòu)成,系統(tǒng)框架如圖1所示。
圖1 采集系統(tǒng)框架
麥克風(fēng)陣列指一組按照一定拓?fù)浣Y(jié)構(gòu)排列的若干個(gè)麥克風(fēng)組成的陣列,其構(gòu)建需要考慮陣列的幾何結(jié)構(gòu)、陣元間距、陣元個(gè)數(shù)和采用的麥克風(fēng)的類型等因素。均勻直線陣列和平面陣列在特定的區(qū)域內(nèi)定位性能優(yōu)越,系統(tǒng)數(shù)學(xué)模型簡(jiǎn)單,運(yùn)算復(fù)雜度較低,適用于絕大多數(shù)基于時(shí)間序列的算法,可選擇性大,并且陣列實(shí)現(xiàn)成本低。因此,定位系統(tǒng)設(shè)計(jì)采用四麥克風(fēng)的均勻線陣和十字平面陣分別實(shí)現(xiàn)。
圖2四元均勻線陣中,M1,M2,M3,M4分別為4個(gè)等間距麥克風(fēng),其陣元間距為d,S為聲源。選M2作為參考陣元,l1,l2,l3,l4分別為聲源S到麥克風(fēng)M1,M2,M3,M4的距離,4個(gè)麥克風(fēng)陣元在平面直角坐標(biāo)系中的位置分別為M1(-d,0),M2(0,0),M3(d,0),M4(0,2d)。聲源S到參考陣元的距離為l=l2,與x軸方向夾角為θ,即聲源方位角。圖3中平面四元十字陣列中,4個(gè)麥克風(fēng)陣元在空間直角坐標(biāo)系中的位置分別為M1(d,0,0),M2(0,d,0),M3(-d,0,0),M4(0,-d,0)。聲源S到原點(diǎn)的距離為l,聲源方位角為θ,俯仰角為φ。
圖2 四元均勻線陣幾何定位模型
圖3 平面四元十字陣列幾何定位模型
駐極體麥克風(fēng)輸出電壓為毫伏(mV)級(jí)別,需要設(shè)計(jì)音頻前置放大電路,將麥克風(fēng)輸出的電壓信號(hào)放大到A/D設(shè)備能夠采集的電壓范圍內(nèi)。圖4為麥克風(fēng)前置放大電路的電路原理。采用集成運(yùn)算放大器LA3210,具有較寬的線性工作區(qū),放大信號(hào)改善信噪比,另外前置放大電路匹配阻抗防止信號(hào)衰減、差分放大降低了共模電噪聲。
圖4 麥克風(fēng)前置放大電路
在采集的聲音信號(hào)中,夾雜著電子噪聲或者背景信號(hào),對(duì)聲源信號(hào)造成污染。抑制噪聲信號(hào)對(duì)聲源定位的影響,需要對(duì)信號(hào)進(jìn)行預(yù)處理。首先進(jìn)行帶通濾波,采用巴特沃斯型有限沖擊響應(yīng)(finite impulse response,FIR)數(shù)字濾波器,抑制聲源頻率范圍之外的其它頻率信號(hào),防止混疊干擾,同時(shí)軟件濾波有利于節(jié)約成本;其次分幀處理,采用幀與幀之間重疊的方法,相鄰兩段數(shù)據(jù)重疊70%,避免失幀;再次加窗處理,設(shè)計(jì)中使用漢明窗,取窗函數(shù)h(n)和聲源信號(hào)s(n)的乘積,保持信號(hào)的連續(xù)性,并可以有效地抑制旁瓣。漢明窗表達(dá)式如下(N為一幀數(shù)據(jù)序列的長(zhǎng)度)
h(n)=0.54-0.46cos(2πn/(N-1)),
n=0,1,2,…,N-1
(1)
最后計(jì)算短時(shí)能量E和短時(shí)過零率Z,若E小于門限值可認(rèn)為是噪聲;否則,進(jìn)入下一步驟。同樣若Z在門限內(nèi),則表示檢測(cè)到語(yǔ)音。E和Z的計(jì)算方法如下
(2)
s(n-1)]|}
(3)
本文采用基于TDOA的聲源定位方法:1)估計(jì)出同一聲源信號(hào)到達(dá)各麥克風(fēng)對(duì)之間的相對(duì)時(shí)延;2)在己獲得時(shí)延的基礎(chǔ)上,通過結(jié)合麥克風(fēng)陣元間的幾何關(guān)系確定聲源的位置。此方法的關(guān)鍵是估計(jì)聲源到達(dá)各麥克風(fēng)對(duì)的相對(duì)時(shí)延,每得到一個(gè)時(shí)延值即可得到唯一的一個(gè)雙曲面,因此,多個(gè)麥克風(fēng)對(duì)即可得到多個(gè)時(shí)延值,多個(gè)時(shí)延值即可得到多個(gè)雙曲面,聲源的次優(yōu)估計(jì)即為雙曲面的交集。
設(shè)計(jì)中采用廣義互相關(guān)(generalized cross correlation,GCC)法估計(jì)時(shí)延[8,11]。通過求兩信號(hào)之間的互功率譜,并在功率譜域內(nèi)給予一定的加權(quán),來對(duì)信號(hào)和噪聲進(jìn)行白化處理,增強(qiáng)信號(hào)中信噪比較高的頻率成分,抑制噪聲的功率,然后再反變換到時(shí)域得到廣義互相關(guān)函數(shù),從而在一定程度上銳化互相關(guān)函數(shù)的峰值,提高時(shí)延估計(jì)的精度。圖5為GCC原理框圖。
圖5 GCC原理框圖
麥克風(fēng)接收到的聲源信號(hào)數(shù)學(xué)模型
xi(k)=αis(k-τi)+Ni(k)
(4)
式中xi(k)為第i個(gè)麥克風(fēng)接收到的聲源信號(hào);s(k)為聲源信號(hào);τi,αi,Ni(k)分別為聲源信號(hào)到達(dá)第i個(gè)麥克風(fēng)時(shí)的時(shí)延值、衰減系數(shù)和加性高斯噪聲。
廣義相關(guān)函數(shù)
(5)
(6)
此時(shí)GCC函數(shù)法稱為GCC-PHAT[3]法,相對(duì)于其他GCC函數(shù)法,該方法對(duì)混響的抑制效果更佳。
本文采用ART USB2810采集卡,采集方式為多通道輪回采集,其應(yīng)用的時(shí)間交替順序采樣技術(shù)不同通道之間有一定的時(shí)延,但時(shí)延時(shí)間固定,可以利用軟件補(bǔ)償?shù)姆椒ㄊ垢鱾€(gè)通道達(dá)到近似同步采集的效果。在圖2和圖3的四元麥克風(fēng)陣列中,以M2為參考陣元,其他陣元相對(duì)于M2接收
(7)
時(shí)延估計(jì)中,M1,M3,M4接收信號(hào)與M2接收信號(hào)時(shí)延差
(8)
綜上,在時(shí)延估計(jì)階段整個(gè)流程為通過GCC-PHAT法分別獲得3對(duì)通道時(shí)延點(diǎn)數(shù)n21,n23,n24估算出對(duì)應(yīng)的時(shí)延值;利用得到時(shí)延點(diǎn)數(shù)除以A/D的采樣率得到相對(duì)時(shí)延值τ
圖6 時(shí)延估計(jì)流程
在圖2四元均勻線陣中,由陣列與聲源之間對(duì)應(yīng)的幾何關(guān)系,利用聲速c和兩陣元間的距離關(guān)系
(9)
可得如下方程組
(10)
根據(jù)均勻線陣的特性,可以得到3組聲源位置的估計(jì)值分別為
(11)
(12)
(13)
最終的聲源位置取該3組值的平均值
(14)
同理,在圖3平面四元十字陣中根據(jù)幾何關(guān)系有
(15)
結(jié)合式(9)可得聲源位置為
(16)
實(shí)驗(yàn)在實(shí)際聲場(chǎng)環(huán)境下采集聲音數(shù)據(jù),以驗(yàn)證系統(tǒng)的實(shí)際效果。選擇空曠的室內(nèi)作為聲場(chǎng)環(huán)境,聲源選擇正弦波聲源,分別對(duì)四元均勻線陣和平面十字陣系統(tǒng)進(jìn)行測(cè)試。2個(gè)系統(tǒng)的測(cè)試結(jié)果如表1和表2所示。
表1 均勻線陣聲源定位實(shí)驗(yàn)結(jié)果
表2 平面四元十字陣聲源定位實(shí)驗(yàn)結(jié)果
由以上的實(shí)驗(yàn)結(jié)果可以看出,在室內(nèi)混響和噪聲較弱條件下,基于非同步采樣時(shí)延補(bǔ)償?shù)姆椒軌驅(qū)崿F(xiàn)對(duì)聲源位置的有效估計(jì)。
當(dāng)前基于麥克風(fēng)陣列的聲源定位技術(shù)廣泛應(yīng)用于室內(nèi)會(huì)議系統(tǒng)。本文應(yīng)用非同步采樣設(shè)備,結(jié)合TDOA聲源定位的方法,利用TDOA雙步定位的特性,首先做時(shí)延估計(jì),通過軟件補(bǔ)償非同步采樣造成的采集通道之間的時(shí)延差,其次利用聲源與麥克風(fēng)陣元之間幾何位置關(guān)系分別實(shí)現(xiàn)了四元均勻線陣和平面十字陣列對(duì)聲源位置的確定,經(jīng)過實(shí)驗(yàn)驗(yàn)證,該方法能夠較為準(zhǔn)確地實(shí)現(xiàn)對(duì)聲源位置的確定,并且整個(gè)系統(tǒng)相對(duì)實(shí)現(xiàn)成本較低,簡(jiǎn)單小巧。
[1] 李大偉,慈林林,李 釗,等.聲源定位在Micaz節(jié)點(diǎn)上的實(shí)現(xiàn)[J].無線電工程,2008,38(2):38-40.
[2] 吳 曉,靳世久,李一博.基于麥克風(fēng)陣列聲音信號(hào)定位方法的研究[J].傳感技術(shù)學(xué)報(bào),2010,23(5):682-686.
[3] 劉云武,楊衛(wèi).基于傳聲器陣列聲源定位系統(tǒng)設(shè)計(jì)[J].壓電與聲光,2014,36(2):314-316.
[4] 王 楷,宗志亞,孫小惟.改進(jìn)的自適應(yīng)特征值分解聲源定位算法研究[J].儀器儀表學(xué)報(bào),2013,34(6):1241-1246.
[5] 張大威,鮑長(zhǎng)春,夏丙寅.復(fù)雜環(huán)境下基于時(shí)延估計(jì)的聲源定位技術(shù)研究[J].通信學(xué)報(bào),2014(1):183-190.
[6] Akbari F,Moghaddam S S,Vakili V T.MUSIC and MVDR DOA estimation algorithms with higher resolution and accuracy[C]∥International Symposium on Telecommunications,2010:76-81.
[7] 羅中明,邴哲松.運(yùn)動(dòng)控制系統(tǒng)中數(shù)據(jù)實(shí)時(shí)采集的實(shí)現(xiàn)[J].自動(dòng)化技術(shù)與應(yīng)用,2008,27(7)56-58.
[8] 范卓立,黃根春.基于傳聲器陣列的聲源定位算法與誤差分析[J].傳感器與微系統(tǒng),2014,33(10):108-110.
[9] 馬 馳,陳建峰,葉 永.基于四元十字陣的分布式聲源定位實(shí)驗(yàn)研究[J].傳感器與微系統(tǒng),2013,32(11):52 -54.
[10] Pengcheng M U,Dan L I,Yin Q Y,et al.Robust MVDR beamforming based on covariance matrix reconstruction[J].Science China Information Sciences,2011,56(4):1-12.
[11] 楊 鵬,邢鈺姣,孫 昊,等.基于BP神經(jīng)網(wǎng)絡(luò)的正四面體陣列聲源定向研究[J].傳感器與微系統(tǒng),2012,31(5):8-9.
Designofsmallsoundsourcelocalizationsystembasedonasynchronousacquisitionmode*
LENG Xian-shuai, WANG Hua-jun, ZHU Ya-ping
(KeyLaboratoryforIOTandInformationFusionTechnologyofZhejiangProvince,HangzhouDianziUniversity,Hangzhou310018,China)
Use non-synchronous sampling equipment,by generalized cross correlation(GCC) time delay estimation algorithm to estimate the relative delay between channels.Second,compensate delay time error generated by non-synchronous collection method by software.Third,the location of sound source is estimated by the two-step localization feature of time difference of arrival(TDOA) sound source location algorithm.Four element uniform linear array and planar four element cross array system are designed to verify the above methods,the results prove the method can more accurately realize the estimation of the sound source orientation.
asynchronous acquisition; sound source localization; generalized cross correlation(GCC); time delay of arrival(TDOA); compensating time delay difference
10.13873/J.1000—9787(2017)10—0073—04
2016—10—24
國(guó)家自然科學(xué)基金資助項(xiàng)目(61427808)
TN 401
A
1000—9787(2017)10—0073—04
冷先帥(1990-),男 ,碩士研究生,主要研究方向?yàn)橹悄芙煌?、嵌入式系統(tǒng)集成與開發(fā)。