鐘小麗 明芳 謝菠蓀
(1.華南理工大學(xué) 物理系,廣東 廣州 510640;2.華南理工大學(xué) 亞熱帶建筑科學(xué)國家重點(diǎn)實(shí)驗(yàn)室,廣東 廣州 510640)
虛擬聽覺技術(shù)采用頭相關(guān)傳輸函數(shù)(HRTF)合成雙耳聲信號(hào),并通過耳機(jī)重放,在傾聽者雙耳處重構(gòu)出與真實(shí)聲源情況一致的雙耳聲壓,從而使傾聽者產(chǎn)生相應(yīng)的空間聽覺感知[1-2].近20 多年,隨著計(jì)算機(jī)軟硬件技術(shù)以及數(shù)字信號(hào)處理技術(shù)的迅猛發(fā)展,虛擬聽覺技術(shù)在科學(xué)研究(例如聽覺機(jī)理研究)、工程技術(shù)(例如通信、虛擬現(xiàn)實(shí)等)以及消費(fèi)電子等領(lǐng)域得到了廣泛的應(yīng)用.
在虛擬聽覺的耳機(jī)重放過程中,合成的雙耳聲信號(hào)通過耳機(jī)重放,并經(jīng)由外耳(包括耳廓和耳道)傳輸?shù)竭_(dá)鼓膜.由于耳機(jī)本身的非理想頻響特性以及耳機(jī)和外耳的耦合作用,耳機(jī)到鼓膜的傳輸并不理想,從而影響了虛擬聽覺重放中雙耳聲壓的準(zhǔn)確重構(gòu).根據(jù)信號(hào)處理理論,耳機(jī)到鼓膜的聲傳輸可視為一個(gè)線性時(shí)不變的過程,其特性由耳機(jī)到鼓膜傳輸函數(shù)完全描述.為了消除耳機(jī)重放階段非理想傳輸?shù)挠绊?,確保雙耳聲信號(hào)的準(zhǔn)確重構(gòu),需要采用耳機(jī)到鼓膜的逆?zhèn)鬏敽瘮?shù)對(duì)雙耳聲信號(hào)進(jìn)行均衡處理,即耳機(jī)均衡.但對(duì)于真人受試者,耳機(jī)到鼓膜傳輸函數(shù)的測(cè)量比較困難且危險(xiǎn).M?ller 等[3-4]已經(jīng)證明,由于耳道內(nèi)的一維聲學(xué)傳輸特性,可以采用耳機(jī)到耳道內(nèi)任意一點(diǎn)(從封閉或開放耳道入口到鼓膜)的傳輸函數(shù)的逆進(jìn)行耳機(jī)均衡處理.該傳輸函數(shù)稱為耳機(jī)到耳道傳輸函數(shù)(HpTF).其中,當(dāng)測(cè)量點(diǎn)選在封閉耳道入口時(shí),HpTF 比較容易測(cè)量.雖然封閉耳道入口測(cè)得的HpTF 不包含耳道傳輸?shù)奶匦?,但不影響耳機(jī)均衡的效果[3].耳機(jī)均衡已被廣泛應(yīng)用于虛擬聽覺重放實(shí)驗(yàn)[5-6].在實(shí)際的均衡信號(hào)處理和濾波器設(shè)計(jì)中,通常將HpTF 近似為最小相位函數(shù)和一個(gè)純延時(shí),以確保其逆函數(shù)均衡處理是滿足因果性、穩(wěn)定性和可準(zhǔn)確實(shí)現(xiàn)的[7-8].雖然HpTF 的最小相位近似已被廣泛采用,但目前尚無文獻(xiàn)對(duì)HpTF 的最小相位特性進(jìn)行系統(tǒng)的分析和驗(yàn)證.此外,在較高的聲波頻率,生理結(jié)構(gòu)(主要是耳廓)對(duì)聲波的聚焦反射作用使得HpTF 經(jīng)常含有非最小相位的零點(diǎn).因此,HpTF 最小相位特性理應(yīng)與頻率有關(guān),然而現(xiàn)有的文獻(xiàn)缺乏相關(guān)的研究工作.
HpTF 是耳機(jī)與外耳耦合的綜合結(jié)果.耳機(jī)的整體電聲性能和受試者的外耳結(jié)構(gòu)都對(duì)HpTF 有影響,任何一個(gè)因素都有可能影響HpTF 的最小相位特性.文中主要研究科研實(shí)驗(yàn)所用耳機(jī)HpTF 的最小特性問題.首先,挑選科研實(shí)驗(yàn)常用的3 款典型的耳罩式耳機(jī),通過測(cè)量得到了20 名受試者的HpTF數(shù)據(jù);然后,采用相關(guān)系數(shù)為物理判據(jù),系統(tǒng)研究了HpTF 的最小相位特性,得到了HpTF 最小相位近似假設(shè)成立的頻率范圍;最后,采用標(biāo)準(zhǔn)的心理聲學(xué)實(shí)驗(yàn)進(jìn)行了聽覺驗(yàn)證.
按照信號(hào)處理的理論,HpTF 可在頻率域分解為最小相位函數(shù)Hmin(f)、全通相位函數(shù)exp[jψall(f)]和線性相位函數(shù)exp[-j2 fT]的乘積[9]:
式中:H(f)代表原始測(cè)量HpTF;f 代表聲波頻率;ψall(f)代表全通函數(shù)的相位;T 為純延時(shí),大致對(duì)應(yīng)耳機(jī)到耳道測(cè)量點(diǎn)的傳輸延遲.如果全通相位函數(shù)可以忽略,則式(1)簡(jiǎn)化為
這就是HpTF 的最小相位近似,其中Hm(f)代表最小相位近似后的HpTF.式(1)和(2)表明原始測(cè)量HpTF 和最小相位近似HpTF 具有相同的幅度譜和不同的相位譜,而不同的相位譜將引起兩者在時(shí)間域的形狀差異.
選用3 款典型的耳罩式耳機(jī)(森海塞爾Sennheiser HD250、森海塞爾Sennheiser HD650 和拜耳動(dòng)力Bayer Dynamic DT770),對(duì)20 名真人受試者進(jìn)行了HpTF 的實(shí)驗(yàn)測(cè)量.實(shí)驗(yàn)場(chǎng)地為華南理工大學(xué)理學(xué)院物理系聲學(xué)研究所控制室,本底噪聲不大于30 dB(A).圖1 是測(cè)量原理圖.采用計(jì)算機(jī)軟件產(chǎn)生的8191 點(diǎn)的最大長度序列(MLS)作為測(cè)量信號(hào)(采樣頻率為44.1 kHz),同時(shí),為了提高信噪比,對(duì)測(cè)量信號(hào)進(jìn)行了10 次周期重復(fù)(共81910 點(diǎn)),再對(duì)測(cè)量結(jié)果取平均.該方法可將信噪比提高10 dB.MLS 信號(hào)通過聲卡(UGM96)和耳機(jī)放大器饋給耳機(jī)播放,由固定在封閉耳道入口處的微縮傳聲器(DPA4060 Binaural Microphone)撿拾聲信號(hào),經(jīng)適調(diào)放大器(B&K 2690A 0S4)和聲卡送回計(jì)算機(jī).最后,采用自行編制的軟件進(jìn)行解卷積和時(shí)間域截?cái)?,得?12 點(diǎn)長度的測(cè)量HpTF.對(duì)于每款耳機(jī),每名受試者進(jìn)行20 次重復(fù)測(cè)量,共得到120 組(3 種耳機(jī),20 名受試者,左耳和右耳)HpTF 測(cè)量數(shù)據(jù).統(tǒng)計(jì)分析表明:對(duì)于受試者的20 次重復(fù)測(cè)量,HpTF 對(duì)數(shù)幅度譜在0.1~5 kHz 頻段的平均標(biāo)準(zhǔn)差都小于0.5 dB;在5~12 kHz 頻段,大部分受試者平均標(biāo)準(zhǔn)差在1 dB 左右;在12~20 kHz頻段,大部分受試者的平均標(biāo)準(zhǔn)差在1~2 dB 之間.因此,測(cè)量的重復(fù)性比較好,測(cè)量數(shù)據(jù)可靠有效.
圖1 HpTF 測(cè)量原理的方框圖Fig.1 Block diagram of principle of HpTF measurement
為了研究最小相位近似的合理性,先采用相關(guān)分析的方法,研究最小相位近似前后HpTF 的相似性.假設(shè)H(f)的時(shí)間域?yàn)閔(t),Hm(f)的時(shí)間域?yàn)閔m(t),兩者的歸一化互相關(guān)函數(shù)為
或利用傅里葉變換,將式(3)轉(zhuǎn)換到頻域計(jì)算,得到
對(duì)于每款耳機(jī)i(i=1,2,3,分別代表森海塞爾HD250、森海塞爾HD650 和拜耳動(dòng)力DT770)和每名受試者s(s=1,2,…,20),分別對(duì)其左耳和右耳的20 次HpTF 測(cè)量數(shù)據(jù)進(jìn)行最小相位近似重構(gòu),然后利用式(4)計(jì)算HpTF 最小相位近似前后的相關(guān)系數(shù).進(jìn)一步,求出20 次重復(fù)測(cè)量以及雙耳的平均相關(guān)系數(shù)rmean(i,s).為了研究HpTF 最小相位特性和頻率的關(guān)系,最小相位近似運(yùn)算分別在0~20 kHz和0~12 kHz 進(jìn)行,相應(yīng)的結(jié)果見圖2.
圖2 表明,在可聽聲全頻段范圍0~20 kHz 內(nèi),HpTF 最小相位近似前后的相似性不是很高.對(duì)于3 款耳機(jī),最小rmean(i,s)分別為0.53 ±0.03、0.70 ±0.03、0.83 ±0.01.由于相應(yīng)的標(biāo)準(zhǔn)偏差處于合理數(shù)值范圍,所以排除實(shí)驗(yàn)測(cè)量的不穩(wěn)定性,較小的rmean(i,s)反映了0~20 kHz 頻段最小相位近似前后HpTF 較差的相似性,HpTF 最小相位近似不太合理.從物理上看,HpTF 主要表征耳機(jī)輻射聲波和外耳復(fù)雜的相互作用,它是頻率的函數(shù),其最小相位近似的合理性隨頻段變化.通常,在高頻段,特別是10~12 kHz 以上,由于耳廓的聚焦反射,耳道入口處的直達(dá)聲和反射聲干涉增強(qiáng)或者抵消比較明顯,表現(xiàn)為HpTF 幅度譜中的峰和谷,而且很難保證這些峰谷對(duì)應(yīng)的HpTF 的極點(diǎn)和零點(diǎn)都在單位圓內(nèi),因此導(dǎo)致最小相位近似前后HpTF 的相似性較差.考慮到和聽覺相關(guān)的定位因素主要處于12 kHz 以下的頻段,進(jìn)一步在0~12 kHz 頻率范圍內(nèi)進(jìn)行最小相位近似前后HpTF 的相關(guān)分析,見圖2.相對(duì)于0~20 kHz 頻段的情況,0~12 kHz 頻段的rmean(i,s)明顯提高,3 款耳機(jī)的最小rmean(i,s)分別為0.77 ±0.05、0.92 ±0.02、0.86 ±0.02.進(jìn)一步,3 款耳機(jī)rmean(i,s)對(duì)20 名受試者的平均值分別為0.92、0.96和0.96,這意味著3 款耳機(jī)的總體平均相關(guān)系數(shù)(即再對(duì)耳機(jī)i 進(jìn)行平均)達(dá)到了0.95.因此,在0~12 kHz 頻段范圍內(nèi),若以平均相關(guān)系數(shù)不小于0.95為判據(jù),HpTF 可以近似認(rèn)為是最小相位函數(shù).圖3是編號(hào)18 的受試者左耳HpTF 在0~12 kHz 頻段范圍內(nèi)進(jìn)行最小相位近似前后的HpTF 脈沖響應(yīng)圖,其中rmean(i=2,s=18)=0.93.
圖2 測(cè)量HpTF 和最小相位近似HpTF 的平均相關(guān)系數(shù)和標(biāo)準(zhǔn)差Fig.2 Mean correlation coefficients along with standard deviations between measured and minimum-phase approximated HpTFs
圖3 森海塞爾HD650 耳機(jī)的HpTF 對(duì)應(yīng)的脈沖響應(yīng)Fig.3 Impulse responses of HpTFs for Sennheiser HD650 headphone
需要指出的是,3 款耳機(jī)的生產(chǎn)時(shí)間和使用狀況有一定的差異,這也許是最小rmean(i,s)存在差異的一個(gè)可能原因.然而,就平均值而言,3 款耳機(jī)(森海塞爾HD250,森海塞爾HD650 和拜耳動(dòng)力DT770)的rmean(i,s)對(duì)20 名受試者的平均值分別為0.92、0.96 和0.96,沒有顯著差異.文中采用的3 款耳機(jī)是較高端的產(chǎn)品,且被廣泛應(yīng)用于聲學(xué)的各類聽音實(shí)驗(yàn),同時(shí)3 款耳機(jī)的購置和使用狀況也有一定差別,所以文中的結(jié)果具有較好的普遍性.
進(jìn)一步,通過主觀辨別的心理聲學(xué)實(shí)驗(yàn)驗(yàn)證0~12 kHz 頻段范圍內(nèi)HpTF 最小相位近似的合理性.考慮左右對(duì)稱性,實(shí)驗(yàn)中虛擬的目標(biāo)聲源方位選取水平面(與受試者雙耳平齊)上的7 個(gè)方位角:0°、30°、60°、90°、120°、150°、180°,其中0°、90°和180°分別指向受試者的正前、正右和正后方.
雙耳虛擬聲信號(hào)的合成步驟如下:
步驟1 從自行測(cè)量的KEMAR 人工頭頭相關(guān)傳輸函數(shù)HRTF 數(shù)據(jù)庫中[10]選取虛擬聲源對(duì)應(yīng)方位的HRTF 數(shù)據(jù).
步驟2 將選取的HRTF 數(shù)據(jù)與12 kHz 低通濾波后的單通路白噪聲(長度為3 s)進(jìn)行頻率域?yàn)V波運(yùn)算.
步驟3 對(duì)于特定的受試者,選取其單耳20 次重復(fù)測(cè)量的平均HpTF 作為耳機(jī)均衡函數(shù).將步驟2得到的信號(hào)進(jìn)一步和耳機(jī)均衡HpTF 的逆函數(shù)進(jìn)行頻域?yàn)V波運(yùn)算,得到最終的聽音實(shí)驗(yàn)信號(hào).
步驟4 對(duì)左、右耳分別進(jìn)行上述步驟1 -3步,得到雙耳虛擬聲信號(hào).
步驟5 對(duì)7 個(gè)虛擬目標(biāo)聲源方位逐個(gè)進(jìn)行上述步驟.
采用三間隔、兩強(qiáng)制選擇(3I 2AFC)的標(biāo)準(zhǔn)心理聲學(xué)實(shí)驗(yàn)方法,其中參考信號(hào)A 采用H(f)進(jìn)行耳機(jī)均衡,而檢驗(yàn)信號(hào)B 采用Hm(f)進(jìn)行耳機(jī)均衡.每次重放的信號(hào)包含3 段,第1 段為參考信號(hào)A,第2和第3 段分別是參考信號(hào)A 和檢驗(yàn)信號(hào)B,按AAB和ABA 兩種順序隨機(jī)播放,每段信號(hào)之間的間隔為1 s.受試者判斷第2 段和第3 段中哪段信號(hào)與第1 段參考信號(hào)A 在聽覺上不同(包括虛擬聲源方向、音色等);若不能做出判斷,則以隨機(jī)方式進(jìn)行強(qiáng)制選擇.對(duì)于每名受試者,每個(gè)虛擬聲源方向重復(fù)判斷6次.參加HpTF 測(cè)量的20 名受試者中有10 人(5 男5 女)參加了主觀辨別實(shí)驗(yàn).因此,每個(gè)方位有60 次判斷結(jié)果(10 人,6 次重復(fù)).
受試者的每次判斷用隨機(jī)變量x 表示,判斷正確時(shí)記為xi=1,反之記為xi=0.對(duì)于每個(gè)虛擬聲源方向,得到了60 個(gè)獨(dú)立觀測(cè)值(x1,x2,…,x60).x 可看成是一個(gè)服從(0 -1)分布或二項(xiàng)式分布的隨機(jī)變量,記為x~B(1,p),p 是判斷的正確率.如果受試者無法區(qū)分A 信號(hào)和B 信號(hào),即測(cè)量HpTF 和最小相位近似HpTF 的均衡處理不存在主觀聽覺差異,在α=0.05 的顯著性水平下,受試者的判斷正確率p 應(yīng)落在區(qū)間[0.38,0.62]內(nèi)[11].圖4 是3 款耳機(jī)在7 個(gè)方向的判斷正確率p,圖中的兩條水平線表示p=0.38 和0.62.圖中顯示所有的實(shí)際判斷正確率p 都落入接受域[0.38,0.62]內(nèi).因此,H(f)和Hm(f)均衡之間無顯著主觀聽覺差異,在0~12 kHz頻段范圍內(nèi)對(duì)HpTF 進(jìn)行最小相位近似在聽覺上是合理的.
圖4 3I 2AFC 聽音實(shí)驗(yàn)的平均正確率Fig.4 Mean correct ratio of 3I-2AFC listening experiments
文中采用相關(guān)分析和主觀辨別實(shí)驗(yàn)系統(tǒng)地研究了虛擬聽覺重放中耳機(jī)均衡函數(shù)HpTF 的最小相位特性.結(jié)果表明,HpTF 的最小相位特性隨頻率變化,在0~12 kHz 的頻段,最小相位近似前后HpTF的平均相關(guān)系數(shù)達(dá)到0.95,且最小相位近似不會(huì)帶來可感知的聽覺變化.因此,在0~12 kHz 的頻段對(duì)HpTF 進(jìn)行最小相位近似是合理的,相應(yīng)的濾波器設(shè)計(jì)(包括濾波器長度和穩(wěn)定性)和信號(hào)處理可得以簡(jiǎn)化和優(yōu)化.
[1]Blauert J.Spatial hearing (Revised edition)[M].Cambridge:MIT Press,1997.
[2]謝菠蓀.頭相關(guān)傳輸函數(shù)與虛擬聽覺[M].北京:國防工業(yè)出版社,2008.
[3]M?ller H.Fundamentals of binaural technology[J].Applied Acoustics,1992,36(3/4):171-218.
[4]M?ller H,Hammersh?i D,Jensen C B,et al.Transfer characteristics of headphones measured on human ears[J].Journal of the Audio Engineering Society,1995,43(4):203-217.
[5]Wightman F L,Kistler D J.Headphone simulation of freefield listening(II):psycho-physical validation[J].Journal of the Acoustical Society of America,1989,85(2):868-878.
[6]Zhong X L,Xie B S.Maximal azimuthal resolution needed in measurements of head-related transfer functions[J].Journal of the Acoustical Society of America,2009,125(4):2209-2220.
[7]Ryan C,F(xiàn)urlong D.Effects of headphone placement on headphone equalisation for binaural reproduction[C]∥the AES 98th Convention.Paris:Audio Engineering Society,1995.
[8]M?ller H,S?rensen M F,Jensen C B,et al.Binaural technique:do we need individual recordings?[J].Journal of the Audio Engineering Society,1996,44(6):451-469.
[9]Oppenheim A V,Schafer R W,Buch J R.Discrete-time signal processing[M].Second Edition.Englewood Cliffs:Prentice-Hall,1999.
[10]鐘其柱.高空間分辨率頭相關(guān)傳輸函數(shù)數(shù)據(jù)庫的建立及分析[D].廣州:華南理工大學(xué)理學(xué)院物理系,2011.
[11]莊楚強(qiáng),何春雄.應(yīng)用數(shù)理統(tǒng)計(jì)[M].3 版.廣州:華南理工大學(xué)出版社,2007.