王鑫,郝欣言,王元中
(中國(guó)傳媒大學(xué),北京市100024)
隨著計(jì)算機(jī)仿真技術(shù)的不斷發(fā)展,可聽(tīng)化技術(shù)已經(jīng)廣泛的應(yīng)用于聲場(chǎng)建模及VR音頻。可聽(tīng)化技術(shù)首先對(duì)聲場(chǎng)以及聲源建立物理模型,通過(guò)聲學(xué)仿真獲取雙耳房間脈沖響應(yīng)函數(shù)(BRIR),并與消聲室信號(hào)進(jìn)行卷積而實(shí)現(xiàn)對(duì)聲學(xué)廳堂音質(zhì)的預(yù)聽(tīng)功能。在可聽(tīng)化技術(shù)中,聲源指向性對(duì)可聽(tīng)化效果有很大的影響。饒丹通過(guò)對(duì)比不同聲源指向性對(duì)可聽(tīng)化的影響,發(fā)現(xiàn)采用與實(shí)際聲源指向性較為接近的聲源會(huì)提升可聽(tīng)化效果[1]。許多國(guó)外的學(xué)者也都得出類似的結(jié)論[2-4]。因此如何采用有效的方法表征聲源指向性,提升可聽(tīng)化質(zhì)量,成為許多學(xué)者研究的熱點(diǎn)。有些學(xué)者采用定義聲源指向性的方法,例如Giron提出逆球諧函數(shù)變換(ISHT)的方法仿真聲源的指向性特征[5]。而Ridel等人在2004年開(kāi)始研究多通道可聽(tīng)化的方式來(lái)表征聲源的指向性信息[6-8]。多通道可聽(tīng)化技術(shù)首先通過(guò)Odeon等聲學(xué)仿真軟件進(jìn)行聲場(chǎng)建模,然后將聲源聲輻射區(qū)域劃分成多個(gè)通道,分別獲取相應(yīng)的雙耳脈沖響應(yīng)函數(shù)(BRIR),再與對(duì)應(yīng)區(qū)域錄制的消聲室信號(hào)進(jìn)行卷積,并最終混合成多通道可聽(tīng)化信號(hào)。該方法不再使用每件樂(lè)器時(shí)不變的指向性數(shù)據(jù),而是采用在消聲室不同位置錄制的多通道聲頻信號(hào)來(lái)采集聲源的指向性信息。與之前的技術(shù)相比,該方法可以捕捉聲源在旋律進(jìn)行中指向性的時(shí)變信息,表征的指向性數(shù)據(jù)更加真實(shí)。Ridel等人對(duì)單簧管、長(zhǎng)笛和小提琴進(jìn)行了單通道、四通道和十三通道的可聽(tīng)化實(shí)驗(yàn),結(jié)果表明隨著聲道數(shù)量的增加,所有樂(lè)器的真實(shí)感都在增加,但是感知到的聲源寬度并不一致。該論文在討論部分提出采用聲源感知寬度作為評(píng)價(jià)術(shù)語(yǔ)可能不夠準(zhǔn)確,而且在消聲室錄制不同方向的樂(lè)器音色時(shí),僅考慮到水平面和垂直面,覆蓋的空間不夠全面。
這種多通道可聽(tīng)化技術(shù)是否適用于中國(guó)樂(lè)器,實(shí)驗(yàn)結(jié)論是否存在差異呢?本論文將以中國(guó)民族樂(lè)器二胡和梆笛為研究對(duì)象,采用Ridel等人提出的多通道可聽(tīng)化技術(shù),通過(guò)對(duì)比單通道、五通道、十通道和十五通道的可聽(tīng)化信號(hào),探究該方法是否可以提升中國(guó)樂(lè)器的真實(shí)度及聲源指向性音色,并與以西方樂(lè)器為研究對(duì)象所得結(jié)論進(jìn)行對(duì)比分析。
本實(shí)驗(yàn)仿真的廳堂是中國(guó)傳媒大學(xué)綜合樓報(bào)告廳,可以容納1500人左右,主要用于學(xué)校大型文藝演出與大型會(huì)議。本文采用Odeon 9對(duì)該廳堂進(jìn)行建模,整個(gè)模型包含270個(gè)面,總表面積為5758.87m2,如圖1所示。吸聲材料的設(shè)置以廳堂實(shí)際材料為基準(zhǔn),并根據(jù)多個(gè)不同測(cè)試點(diǎn)的平均實(shí)測(cè)混響時(shí)間T30進(jìn)行調(diào)整。圖2顯示了多個(gè)測(cè)試點(diǎn)的位置,聲源位于舞臺(tái)中心。表1顯示了在廳堂中實(shí)測(cè)T30與Odeon中仿真值的對(duì)比結(jié)果。從對(duì)比結(jié)果可以看出,除了125Hz和8kHz頻段的混響時(shí)間偏差略大,其他頻段的仿真結(jié)果都較為理想。
圖1 中國(guó)傳媒大學(xué)報(bào)告廳Odeon模型
圖 2 多個(gè)測(cè)試點(diǎn)的位置
表1 實(shí)測(cè)混響時(shí)間T30與仿真結(jié)果的對(duì)比
本實(shí)驗(yàn)在消聲室錄制了梆笛和二胡的34通道信號(hào)。實(shí)驗(yàn)在中國(guó)計(jì)量科學(xué)研究院力學(xué)與聲學(xué)計(jì)量研究所消聲室中進(jìn)行。測(cè)量采用了同期多軌錄音的方式,以樂(lè)器的幾何中心為球中心,設(shè)置一個(gè)半徑為1.5米的傳聲器球型陣列支架,傳聲器數(shù)量為34支,傳聲器距離聲源的實(shí)際距離為1.4米,傳聲器的空間方位角見(jiàn)表2。表中傳聲器空間方位采用垂直角(-22.5°≤φ≤90°)和水平角(-120°≤θ≤120°)表示。在水平面上(φ=0°),θ=-90°,0°和90°分別表示樂(lè)器的正左、正前和正后方。鑒于傳聲器數(shù)量有限,多通道信號(hào)并未全部覆蓋360°三維空間,主要缺少樂(lè)器后部及底部的信息。測(cè)試的詳細(xì)過(guò)程請(qǐng)參見(jiàn)文獻(xiàn)[9]。在接下來(lái)的可聽(tīng)化實(shí)驗(yàn)中,分別采用了長(zhǎng)度約為15s的梆笛和二胡旋律進(jìn)行聽(tīng)音實(shí)驗(yàn)。
表2 34支傳聲器的空間方位角設(shè)置
之所以選取二胡和梆笛作為實(shí)驗(yàn)信號(hào),是因?yàn)檫@兩個(gè)樂(lè)器的聲輻射特性存在較大差異,分別如圖3和4所示。從每個(gè)圖例右側(cè)的變化范圍條形帶可以看出,梆笛的最大值與最小值之間的差距更大,梆笛的聲輻射特性更加尖銳,二胡的聲輻射特性更加平緩。
圖 3 梆笛的聲輻射特性
圖4 二胡的聲輻射特性
根據(jù)在消聲室得到的多通道實(shí)驗(yàn)素材,在Odeon軟件中對(duì)聲源的輻射區(qū)域進(jìn)行單通道、五通道、十通道及十五通道的均勻區(qū)域劃分,用于獲取雙耳脈沖響應(yīng)函數(shù)(BRIR),并最終合成可聽(tīng)化信號(hào)。不同通道聲源的輻射區(qū)域范圍及對(duì)應(yīng)的消聲室信號(hào)如表3所示。
在Odeon軟件中根據(jù)表3對(duì)不同聲源的聲輻射區(qū)域進(jìn)行設(shè)置,圖5至圖8分別顯示了單通道、五通道正前方、十通道正前方、五通道正前方的聲源指向性圖。設(shè)置好聲源的輻射特性后,在Odeon中獲取BRIR,需要分別設(shè)置房間脈沖函數(shù)的計(jì)算參數(shù)和選取頭部相關(guān)函數(shù)(HRTF)。在進(jìn)行房間脈沖響應(yīng)函數(shù)計(jì)算時(shí),Odeon采用虛聲源法處理早期反射,聲線跟蹤法計(jì)算更高階反射聲的混合算法。本實(shí)驗(yàn)在計(jì)算時(shí),采用的轉(zhuǎn)換階數(shù)為二階。根據(jù)用戶手冊(cè),脈沖響應(yīng)的長(zhǎng)度應(yīng)該至少達(dá)到混響時(shí)間的2/3,因此根據(jù)表1中混響時(shí)間的數(shù)據(jù),采用了Odeon精細(xì)計(jì)算模式下默認(rèn)的沖擊響應(yīng)長(zhǎng)度10000ms。同時(shí)最大反射次數(shù)的設(shè)置也是軟件默認(rèn)值2000,保證了仿真過(guò)程中判斷停止的首要條件為沖擊響應(yīng)的長(zhǎng)度。聲線數(shù)量的設(shè)置與房間的幾何形狀和容積大小有關(guān),本實(shí)驗(yàn)使用了Odeon給出的默認(rèn)聲線數(shù)量24525。關(guān)于HRTF函數(shù),本實(shí)驗(yàn)使用了軟件默認(rèn)的Subject_021,這是封閉耳道Kemar仿真頭測(cè)試的結(jié)果。在Odeon中,還根據(jù)聽(tīng)音實(shí)驗(yàn)所使用的監(jiān)聽(tīng)耳機(jī)型號(hào)進(jìn)行了修正。
表3 不同通道聲源的輻射區(qū)域劃分
續(xù)表
圖5 單通道聲源輻射圖
圖6 五通道正前方聲源輻射圖
圖7 十通道正前方聲源輻射圖
圖8 十五通道正前方聲源輻射圖
BRIR的聲源及接收點(diǎn)如圖9所示。圖中圓點(diǎn)6是接收點(diǎn)的位置,位于略微偏離正中央的位置,藍(lán)色十字光標(biāo)為聲源的位置,位于臺(tái)唇后兩米處。
圖9 聲源及接收點(diǎn)位置
聽(tīng)音實(shí)驗(yàn)要求被試分別對(duì)梆笛和二胡單通道、五通道、十通道和十五通道可聽(tīng)化實(shí)驗(yàn)信號(hào)的真實(shí)度和聲源指向性音色兩個(gè)參數(shù)進(jìn)行打分。真實(shí)度是指聽(tīng)感上與樂(lè)器在廳堂中演奏的相似程度。聲源指向性音色來(lái)自于英文“Directional Tone Color”(DTC),是Vigeant在文獻(xiàn)[9]中推薦用DTC取代聲源感知寬度。理論上來(lái)講,由于樂(lè)器的聲輻射特性不均勻,在不同的位置拾音會(huì)得到不同的音色。將這些不同的音色進(jìn)行疊加,可以使樂(lè)器整體的聲音變得更加立體。因此DTC可以解釋為樂(lè)器的立體感。主觀實(shí)驗(yàn)方法借鑒了MUSHRA的方法[10]。被試針對(duì)每個(gè)實(shí)驗(yàn)信號(hào)在0到100之間評(píng)分,評(píng)分區(qū)間被均等分成五個(gè)等級(jí),分別是優(yōu)、良、中、差、劣。被試參照等級(jí)標(biāo)準(zhǔn),給出相應(yīng)的分值。所有被試年齡都在20-30歲之間,均有一定的音樂(lè)學(xué)習(xí)背景且經(jīng)過(guò)專業(yè)的音質(zhì)主觀評(píng)價(jià)訓(xùn)練,共20人,其中13位男生,7位女生。所有實(shí)驗(yàn)采用重復(fù)測(cè)試來(lái)進(jìn)行一致性信度檢驗(yàn),如果被試兩次評(píng)分結(jié)果超過(guò)10分則認(rèn)為信度不合格。
在正式實(shí)驗(yàn)前,所有被試都接受了簡(jiǎn)單的輔導(dǎo)說(shuō)明,能夠正確了解實(shí)驗(yàn)的過(guò)程,清楚評(píng)價(jià)術(shù)語(yǔ)的含義。聽(tīng)音實(shí)驗(yàn)分為兩組,第一組為二胡,第二組為梆笛??陕?tīng)化素材的格式均為Wave文件,筆記本ThinkPad T430u外接聲卡Focusrite 2i4,通過(guò)監(jiān)聽(tīng)耳機(jī)Sennheiser HD6重放,重放聲壓級(jí)控制在75dBA左右。實(shí)驗(yàn)的測(cè)試界面采用幻燈片的形式,可聽(tīng)化素材以插入的形式對(duì)應(yīng)于帶有序號(hào)的按鈕,被試可以隨時(shí)切換不同序號(hào)的音頻并在不同的時(shí)間點(diǎn)進(jìn)行播放。被試完成每個(gè)素材聽(tīng)辨后,在被試表格上給出相應(yīng)的分值。在所有聽(tīng)音實(shí)驗(yàn)完成后,對(duì)被試進(jìn)行實(shí)驗(yàn)后問(wèn)卷調(diào)查,寫(xiě)明真實(shí)度和DTC評(píng)分較高或較低的原因。
經(jīng)過(guò)重復(fù)信度檢驗(yàn)后,對(duì)有效數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,實(shí)驗(yàn)結(jié)果如圖10-11所示。從圖10的結(jié)果可以看出,二胡的真實(shí)度隨著通道數(shù)的增加始終呈上升的趨勢(shì)。其中單通道到五通道,五通道到十通道的變化幅度基本相同,而十通道到十五通道則基本保持不變只有很小的上升。在DTC方面,除了五通道,其余通道的DTC均高于單通道,整體上DTC呈上升趨勢(shì)。從圖11的結(jié)果可以看出,梆笛的真實(shí)度和DTC隨通道數(shù)的增加都呈現(xiàn)先上升再下降的趨勢(shì)。除了五通道的真實(shí)度和DTC在單通道基礎(chǔ)上有所提升以外,其他多通道可聽(tīng)化信號(hào)并未呈現(xiàn)出優(yōu)化的趨勢(shì),甚至出現(xiàn)裂變的情況。
圖10 二胡主觀評(píng)價(jià)結(jié)果
圖11 梆笛主觀評(píng)價(jià)結(jié)果
對(duì)比梆笛與二胡的實(shí)驗(yàn)結(jié)果發(fā)現(xiàn),二者差異較大。為了究其原因,對(duì)不同通道的可聽(tīng)化信號(hào)進(jìn)行分析。多通道可聽(tīng)化信號(hào)是由不同輻射方向的聲源生成的BRIR與對(duì)應(yīng)消聲室信號(hào)卷積疊加而成,通道數(shù)量越多,采用BRIR越多。通過(guò)對(duì)比發(fā)現(xiàn),聲源的輻射區(qū)域越偏離接收點(diǎn),得到的BRIR混響越大,表4列出了五通道、十通道和十五通道指向接收點(diǎn)和偏離接收點(diǎn)90°時(shí),BRIR倍頻程T30結(jié)果。從表格中可以看出,正向和側(cè)向聲源輻射導(dǎo)致BRIR的T30參數(shù)會(huì)有0.2s~0.3s的差異。因此通道數(shù)量越多,混響時(shí)間較長(zhǎng)的BRIR使用越多,導(dǎo)致可聽(tīng)化信號(hào)的混響感越大。
表4 不同通道正向與側(cè)向聲源生成BRIR的T30結(jié)果對(duì)比
有學(xué)者對(duì)中國(guó)樂(lè)器的最佳混響感做過(guò)相關(guān)研究,發(fā)現(xiàn)不同樂(lè)器的最佳混響感存在差異,即使相同樂(lè)器不同樂(lè)曲的最佳混響感也存在差異[11,12]。對(duì)于本實(shí)驗(yàn)的二胡多通道可聽(tīng)化信號(hào),隨著通道數(shù)量的增加,混響感隨之增強(qiáng),可能正好符合二胡的聽(tīng)音感受。而對(duì)于梆笛而言,五通道的信號(hào)可能剛好既保證一定的混響感,又不影響清晰度,因此真實(shí)度得分最高。而隨著聲道數(shù)量的增加,混響感過(guò)大,影響清晰度,導(dǎo)致真實(shí)度下降。對(duì)被試問(wèn)卷調(diào)查結(jié)果的分析也證實(shí)了這一點(diǎn)。大多數(shù)被試指出隨著通道數(shù)量的提升,混響太大,失去了梆笛原有的音色和辨識(shí)度,會(huì)丟失音色的細(xì)節(jié)。因此多通道可聽(tīng)化技術(shù)確實(shí)可以提升樂(lè)器的真實(shí)度,但是不同樂(lè)器的最佳可聽(tīng)化通道數(shù)量存在差異,可能與樂(lè)器的最佳混響感有關(guān)。
對(duì)于DTC,雖然梆笛和二胡在獲得最佳DTC時(shí),使用的通道數(shù)量不同,但是都能發(fā)現(xiàn)多通道可聽(tīng)化技術(shù)會(huì)比傳統(tǒng)的單通道獲得更好的DTC。通過(guò)對(duì)被試問(wèn)卷調(diào)查的分析發(fā)現(xiàn),被試主要從音色清晰度和體積感兩個(gè)方面對(duì)DTC進(jìn)行評(píng)價(jià)。梆笛隨著通道數(shù)量的增加,混響感增大,清晰度降低,因此DTC的得分也相對(duì)較低。此外,由于不同樂(lè)器在不同頻率的指向性變化程度不同,通路增加時(shí),會(huì)使聲輻射變化尖銳的樂(lè)器在某個(gè)頻段的信息增加過(guò)多而導(dǎo)致樂(lè)器體積過(guò)大或過(guò)小,過(guò)遠(yuǎn)或過(guò)近。由前文分析可知,梆笛的聲輻射變化更加尖銳,可能會(huì)更容易影響樂(lè)器的體積感,從而影響DTC的判斷。從本實(shí)驗(yàn)的DTC結(jié)果可以看出隨著通道數(shù)量的增加可以改善樂(lè)器的立體感,因此今后可以嘗試將多通道可聽(tīng)化技術(shù)應(yīng)用于虛擬現(xiàn)實(shí)中,增加聲音的三維效果。
圖12和圖13分別顯示了Vigeant等人對(duì)小提琴、長(zhǎng)笛和長(zhǎng)號(hào)的可聽(tīng)化實(shí)驗(yàn)結(jié)果。從他們的結(jié)果可以看出,三種樂(lè)器的真實(shí)度都隨著聲道數(shù)量的增加而提升。但是通道數(shù)量對(duì)不同樂(lè)器的聲源寬度感知影響不同,沒(méi)有統(tǒng)一的結(jié)論。將本實(shí)驗(yàn)的結(jié)果與西洋樂(lè)器的結(jié)果比較發(fā)現(xiàn),二胡真實(shí)度的結(jié)果與西洋樂(lè)器結(jié)果較為一致,都隨著聲道數(shù)量的增加而提升,且與小提琴的趨勢(shì)十分接近。但是梆笛真實(shí)度的結(jié)果存在較大出入。
圖12 真實(shí)度感知結(jié)果
圖13 聲源寬度感知結(jié)果
Vigeant在實(shí)驗(yàn)中采用了聲源寬度作為評(píng)價(jià)術(shù)語(yǔ),由于實(shí)驗(yàn)結(jié)果不存在明顯規(guī)律,因此在論文中建議采用DTC作為評(píng)價(jià)參數(shù)來(lái)代替聲源感知寬度和清晰度。結(jié)合西洋樂(lè)器聲源寬度實(shí)驗(yàn)結(jié)果與本實(shí)驗(yàn)DTC的結(jié)果,發(fā)現(xiàn)被試能清楚的感受到不同指向性聲源所帶來(lái)的音色感知,且這種感知程度隨著通道數(shù)量的增加而更加明顯。但是DTC與通道數(shù)量關(guān)系的規(guī)律還需更多的實(shí)驗(yàn)進(jìn)行驗(yàn)證。
本文以梆笛和二胡為研究對(duì)象,探究了多通道可聽(tīng)化技術(shù)可否優(yōu)化樂(lè)器的聽(tīng)感。實(shí)驗(yàn)結(jié)果表明對(duì)于梆笛和二胡而言,多通道可聽(tīng)化技術(shù)可以提升樂(lè)器的真實(shí)度,但是不同樂(lè)器最佳真實(shí)度的通道數(shù)量存在不同,可能與不同樂(lè)器的最佳混響感有關(guān)。多通道可聽(tīng)化技術(shù)也可以提升這兩個(gè)樂(lè)器的立體感,但是最佳立體感的通道數(shù)量也存在差異,可能與樂(lè)器聲輻射特性的尖銳程度有關(guān)。今后可以考慮將多通道可聽(tīng)化技術(shù)應(yīng)用于虛擬現(xiàn)實(shí)中,增加聲源的三維立體感。此外,多通道可聽(tīng)化技術(shù)對(duì)樂(lè)器真實(shí)度的改變是否與最佳混響感有關(guān),以及通道數(shù)量與DTC的關(guān)系,都還需進(jìn)一步的實(shí)驗(yàn)來(lái)進(jìn)行驗(yàn)證。
中國(guó)傳媒大學(xué)學(xué)報(bào)(自然科學(xué)版)2020年3期