梅鐵民,苑麗蘋
(沈陽理工大學(xué)信息科學(xué)與工程學(xué)院,遼寧 沈陽 110168)
混響效應(yīng)是由聲音在封閉空間中經(jīng)內(nèi)部各個反射面多次連續(xù)反射而產(chǎn)生的。描述混響效應(yīng)強弱的一個重要參數(shù)是混響時間(reverberation time,RT)。根據(jù)國際標(biāo)準 ISO 3382-1:2009(E)(acoustics-measure ment of room parameters,part 1:performance spaces)§3.5,在一個封閉空間中,聲源停止發(fā)聲后,聲能密度的空間均值衰減60dB所需時間定義為混響時間[1]。
混響時間做為描述封閉空間內(nèi)聲音衰減快慢程度的物理量,是建筑物音響效果設(shè)計中的一個重要的客觀評價參數(shù)。在現(xiàn)代語音信號處理中,混響時間還是語音場景分析、錄音環(huán)境識別、去混響等研究中的重要參數(shù)[2-3]。根據(jù)混響時間對未知錄音環(huán)境進行辨識技術(shù)將在刑偵、反恐、版權(quán)保護等領(lǐng)域有著重要應(yīng)用。
賽賓(Sabine)經(jīng)過大量實驗,第一個給出了混響時間計算公式[4-5],指出了混響時間與房間的體積、內(nèi)部反射面的面積及反射面吸聲系數(shù)之間的關(guān)系。當(dāng)聲反射較弱時,賽賓公式誤差較大,因此Eyring提出一個修正公式[6-7]。為了更準確描述混響問題,還有很多研究者提出進一步的修正,如文獻[8-9]所給出的算法。
由賽賓等人的公式可見,混響時間是一個與聲源及聲接收器位置無關(guān)的量,它僅依賴于房間的幾何尺寸(容積及內(nèi)表面積)及聲學(xué)屬性(吸聲系數(shù)),因此混響時間又是一個表征封閉空間幾何結(jié)構(gòu)與聲學(xué)屬性的重要參數(shù)。
近年來,盲混響時間估計問題已經(jīng)引起人們越來越多的重視[2,10]:在聲源信號未知的情況下,只根據(jù)一段錄音信號來估計錄音房間的混響時間。
混響時間估計的一個重要方法為施羅德法[11]?;诜块g沖激響應(yīng)的施羅德法估計的混響時間依賴于聲源及接收器在房間中的相對位置,因此在國際標(biāo)準ISO 3382-1&2:2009(E)中規(guī)定進行多點測量并取均值。這種方法并不能完全消除測量結(jié)果對聲源(接收器)位置的依賴關(guān)系。如何消除這種依賴關(guān)系將是本文研究的重點。
當(dāng)對一個給定房間進行混響時間測量時,通常并不是從賽賓等人的公式出發(fā),即通過測量房間的體積及總吸聲量來間接地計算混響時間,而是通過用聲源激勵房間,并根據(jù)接收到的聲音信號來估計混響時間。這是一種直接測量方法,比賽賓等人的計算公式更準確。在國際標(biāo)準ISO 3382-1&2:2009(E)中詳細地介紹了聲源激勵下房間混響時間的測量方法:噪聲信號突然中斷法和沖激響應(yīng)積分法(即施羅德方法)[1,10]。
由此得到T60所滿足的方程為
這就是混響時間的施羅德反向積分算法。
在實踐中,采用施羅德方法,通常選取能量衰減曲線的近似線性衰減部分,用最小二乘法進行直線擬合,延長擬合直線至與-60dB水平線相交,交點所對應(yīng)的時間即為估計的混響時間RT。
在仿真實驗中,選取3個不同尺寸的矩形房間(長×寬×高):房間A為15 m×7 m×3 m;房間B為11 m×7 m×3m;房間 C 為 9m×7m×3m。標(biāo)準坐標(biāo)系下,聲源位于 S(3m,2m,1.2m);20 個接收器位置如下(單位:m):房間沖激響應(yīng)由聲學(xué)鏡像法仿真而得[12]。
理論上,聲源與接收器位置互換,沖激響應(yīng)是不變的,故在本實驗中,聲源位置固定而改變接收器的位置。在仿真中,由于能量衰減曲線線性部分的分貝值變化較大(這可能與房間沖激響應(yīng)聲學(xué)鏡像模型有關(guān)),所以直接取其線性部分進行最小二乘直線擬合并延長該直線至-60dB而得到不同房間的RT值及其標(biāo)準差,見表1。從表1可見,3個房間RT的標(biāo)準差比較大,這反映了接收器(聲源)位置對RT的影響。圖1為房間A的20條能量衰減曲線及相應(yīng)的擬合直線,直觀地反映了施羅德方法估計的RT值對接收器(聲源)位置的依賴關(guān)系。房間B、C給出類似結(jié)果。
表1 3個不同大小房間混響時間的施羅德方法結(jié)果
圖1 房間A的能量衰減曲線及其線性部分擬合直線
顯然,本仿真結(jié)果與混響時間不依賴于聲源及接收器位置的理論相矛盾。為解決這一問題,將對施羅德方法進行修正。
通過仿真研究發(fā)現(xiàn),施羅德方法中不同接收器(聲源)位置所對應(yīng)的能量衰減曲線的擬合直線幾乎平行,但卻很分散,如圖1所示,從而影響到混響時間的估計。能量衰減曲線的分散性是由零時刻接收器接收信號的平均功率上下波動所引起的。接收器零時刻的接收信號是聲源直達信號與零時刻之前的所有反射波的疊加,其平均功率可能大于聲源功率,也可能小于聲源功率,這完全取決于接收器(聲源)所在位置。但是在聲源停止發(fā)射后的短暫時間內(nèi),聲波經(jīng)過若干次反射后,整個空間中聲波將趨于均勻分布,與聲源及接收器所在位置無關(guān),任意點的接收信號的統(tǒng)計平均功率都相同,并且只依賴于聲源信號的強弱。正因為接收器零時刻的接收信號平均功率隨接收器(聲源)位置的這種波動,導(dǎo)致施羅德方法給出的能量衰減曲線將隨接收器(聲源)位置變化而上下偏移,從而導(dǎo)致所估計的混響時間也隨接收器(聲源)位置而上下波動。
對于一個平穩(wěn)的聲源信號,其平均功率與接收器(聲源)位置無關(guān),因此在修正的施羅德方法中,定義能量衰減曲線為麥克風(fēng)接收信號的平均功率與聲源信號的平均功率之比的對數(shù),即:
采用同樣一組數(shù)據(jù),修正的施羅德方法的仿真結(jié)果列于表2中。由表2可見,對同一個房間不同聲源(接收器)位置的混響時間估計值的標(biāo)準差很小,說明混響時間幾乎不依賴于聲源(接收器)位置。在圖2中給出了房間A修正的施羅德方法的能量衰減曲線p′(t)。由圖2可見,修正的能量衰減曲線的線性部分幾乎重合,說明聲源(接收器)位置對混響時間估計沒有影響。此外,由圖2也看到,在t=0時刻,p′(0)的值有正有負,說明由于房間內(nèi)各種反射面反射信號的存在,接收點信號可能得到加強或消弱,但這只是一個短暫的過程。當(dāng)經(jīng)過若干次反射之后,整個房間中聲波趨于均勻分布,因而聲源(接收器)位置對它的影響很快消失,從而所有p′(t)趨于一致。為比較起見,在圖2中給出了圖1中所有擬合直線的平均位置(圖中虛線),此圖說明施羅德方法中的空間平均只能部分地消除聲源(接收器)位置影響。
表2 3個不同大小房間混響時間的修正施羅德方法結(jié)果
圖2 房間A的修正施羅德方法的能量衰減曲線及其線性部分的擬合直線
對比表1和表2,A、B、C 3個房間的施羅德算法RT相對于修正施羅德算法RT′的偏差分別為58.3ms、-6.2ms和-33.2ms。對于這一偏差,解釋如下:
首先,比較式(1)和式(3),得到
在能量衰減曲線的線性部分,兩者的擬合直線的斜率相等(差別非常小,見圖1)且均為k,縱軸截距之差為
所以由兩者得到的混響時間之差為
對于給定房間,斜率k值恒定,因此平均混響時間偏差等于
計算結(jié)果列于表3,與直接由表1和2計算的偏差值一致。
表3 修正前后兩種方法估計RT的偏差計算
在施羅德方法中,接收器信號平均功率衰減60 dB是相對于其零時刻的平均功率,而這一平均功率依賴于接收器(聲源)位置,因而提出接收器信號平均功率相對于源信號的平均功率衰減60dB作為混響時間的定義。仿真實驗表明,本文提出的修正的施羅德方法可以有效地消除接收器(聲源)位置對房間混響時間估計的影響。
[1]ISO 3382-1:2009(E)Acoustics—Measurement of room acoustic parameters—Part 1:Performance spaces[S].2009.
[2]Yilmaz E.Algorithms for estimating reverberation characteristics for single channel dereverberation [D].Aachen:RWTH Aachen University,2010.
[3]Larsen E,Schmitz C D,Lansing C R,et al.Acoustic scene analysis using estimated impulse responses[C]∥IEEE Proc the Thirty-Seventh Asilomar Conference on Signals,Systems and Computers 2003(1):725-729.
[4]孫廣榮.混響時間百年研究[J].電聲技術(shù),2008(6):4-5.
[5]李敏毅,孫海濤,吳杰歆,等.混響時間及測量方法簡介[J].中國測試技術(shù),2005,31(1):18-20.
[6]Eyring C F.Reverberation time in‘dead’rooms[J].Journal of Acoustical Society of America,1930(1):217-241.
[7]張武威.關(guān)于室內(nèi)混響時間的計算問題[J].電聲技術(shù),2005(3):17-20.
[8]Fitzroy D.Reverberation formulae which seems more accurate with non-uniform distribution of absorption[J].Journal of the Acoustical Society of America,1959(31):893-897.
[9]Neubauer R O.Estimation of reverberation time in rectangular rooms with non uniformly distribued absorption using a modified Fitzroy equation[C]∥Proc of the Seventh International Congress on Sound and Vibration,2000:1709-1716.
[10]Ratnam R,Jones D L,Wheeler B C,et al.Blind estimation of reverberation time[J].Journal of the Acoustical Society of America,2003,114(5):2877-2892.
[11]Schr?der M R.New method of measuring reverberation time[J].Journal of the Acoustical Society of America,1965(3):409-412.
[12]Allen J B,Berkley D A.Image method for efficiently simulating small-room acoustics[J].Journal of the Acoustical Society of America,1979,65(4):943-950.