冀飛
作者單位:中國人民解放軍總醫(yī)院耳鼻咽喉頭頸外科;解放軍總醫(yī)院耳鼻咽喉研究所;聾病教育部重點實驗室;聾病防治北京市重點實驗室;軍事聲損傷防護實驗室 北京 100853
言語測聽(speech audiometry)作為輔助診斷和效果評估的重要方法,在耳科學和聽力學臨床實踐中的應用越來越廣泛。根據(jù)不同的測試目的,衍生出了多種不同的言語測聽材料和言語測聽方法。除了經(jīng)典的安靜測試條件下的言語識別率和言語識別閾,噪聲下言語識別閾、信噪比損失等新的測試指標越來越多地應用于聽力學干預的效果評估甚至預估[1-4]。在言語測聽的實施過程中保證信號強度的可靠量化非常重要。這涉及到設備的校準、測試材料的標準化以及測試過程中的強度控制等環(huán)節(jié)。國家標GB/T7341.2-1998《電聲學 測聽設備 第2部分:語言測聽設備》規(guī)定了對言語聽力計的要求,這一標準旨在保證符合該標準的不同聽力計,以標準化的方式給受試者提供言語聲信號[5]。該標準的新版本在本文撰寫時尚在修訂中,對于“speech”的稱謂仍沿用“語言”。在2017年新頒布的國家標準GB/T 16296.3-2017《聲學 測聽方法 第3 部分:言語測聽》中已經(jīng)改為“言語”。后者對標準化言語材料的編制和錄制要求以及言語測聽方法做了規(guī)定[6]。本文主要簡述言語測聽操作中的信號的發(fā)送方法,以及為保證結(jié)果的準確性,依據(jù)國家標準進行的強度計量控制操作方法,為言語測聽的臨床操作提供參考。
言語信號是指特定語言中攜載信息的聲信號。言語信號可以是發(fā)音人錄制的語聲信號,也可以是合成的模擬語聲信號[5,6]。言語信號可以是單音節(jié)字、雙音節(jié)詞、句子等。為實現(xiàn)可比較的測試結(jié)果,言語信號應具有良好的可復現(xiàn)性,并應準確量化。符合標準的言語信號可以內(nèi)置于言語聽力計中,也可以不包括在言語聽力計中,而是以其他載體通過各種形式的播放器復現(xiàn)。對于前者,其信號控制依賴于聽力計本身的校準和增益,較為簡單,但受制于言語材料,靈活性較差,這一缺點在中文言語測聽中尤為突出。對于不包括在言語聽力計中的言語信號材料,可以:①在聲級計監(jiān)控下實時口語發(fā)音;②使用CD、MP3、PC電腦等音頻播放器播放測試材料,同時用聲級計監(jiān)控強度;③使用具有線路輸出(Line OUT)的CD播放器或PC電腦播放測試材料,并且使用言語聽力計的外接測試信號功能進行測試強度控制。比較而言,使用言語聽力計對信號強度控制最為精確和標準,此時需要在聽力計的輸入端進行外部信號的強度定標。
言語測聽的信號可以通過氣導耳機、骨振器或聲場下的揚聲器發(fā)送給受試者。在干預效果評估中用到的最多的就是揚聲器輸出。特別是噪聲下言語測聽,使用不同的揚聲器輸出組合,可靈活實現(xiàn)多種測試目的[7]。
噪聲條件下言語測聽在臨床評估中應用越來越廣泛。在國家標準GB/T 16296.3-2017中將言語識別測試中播放的額外附加的聲音統(tǒng)稱為競爭聲[6],也就是通常意義上所說的噪聲條件下言語測聽中的噪聲。優(yōu)先推薦使用已錄制在母版標準錄聲中且提供了言語識別基準值的競爭聲[6]。國家標準GB/T 7341.2-1998中規(guī)定了可用作競爭聲的經(jīng)頻率計權(quán)的非調(diào)制的無規(guī)則噪聲[5],此種噪聲內(nèi)置于言語聽力計中,可直接使用。也可使用其他干擾信號作為噪聲下言語測聽的競爭聲,包括調(diào)制噪聲、非調(diào)制噪聲、各種人類言語錄聲等。使用這類噪聲時,測試結(jié)果的變異度較大,而用計權(quán)無規(guī)噪聲所得結(jié)果的變異度較小。
1.2.1 調(diào)制噪聲 其幅度調(diào)制與單人講話或多人講話時相似,較為典型的例子是代表了一名干擾者語音的平均長時語譜和時間構(gòu)型的ICRA 5噪聲[8]。長時平均語譜(long term average speech spectrum,LTASS)噪聲也是經(jīng)常用到的調(diào)制噪聲,對較長一段時間(至少2 min以上)的言語信號進行平均頻譜測量,匹配言語能量的頻譜分布情況。正常嗓音強度下,LTASS在低頻(元音)具有更多的能量,高頻(輔音)能量較少。
1.2.2 非調(diào)制噪聲 沒有或僅有很小的幅度調(diào)制,通常代表用于言語識別測試的言語材料的平均長時語譜。典型例子為CCITT噪聲和ICRA1噪聲[6]。一些言語測聽材料中也提供了相應的非調(diào)制噪聲,其頻譜與言語測試項相匹配[1,2]。
1.2.3 人類言語錄聲 可以是單人語聲或多人(4人、8人等)混疊而成的嘈雜噪聲(babble noise)。這些噪聲具有不同程度的調(diào)制和信息掩蔽[6]。此外還可使用國際言語測試聲信號(international speech test signal,ISTS),該信號由6種語言的女性發(fā)音人錄制。將錄音分割成短片段(500 ms)并以隨機順序重新組合。
在耳機測試中,競爭聲由用于播放言語測試信號的同一耳機發(fā)送。在聲場測聽中,應規(guī)定所使用到的所有揚聲器的位置。國家標準建議播放言語的揚聲器位于聆聽者前方0°入射角。競爭聲由另外兩個位置對稱、入射角為±45°的揚聲器發(fā)出[6]。實際工作中,根據(jù)不同的臨床或研究需要,競爭聲的入射角度可進行靈活組合。
如同其他聽力學測試信號,言語信號通常也以“級(level)”的概念來表達,單位是相對于參考強度的分貝(dB)[7,9,10]。言語信號可以兩種方式計量,即言語級(speech level)和言語聽力級(hearing level for speech)[11]。言語級的單位是dB SPL,基準為20μPa,也就是聲壓級。言語級指的是按IEC61672-1以C頻率計權(quán)在適當?shù)鸟詈掀?、仿真耳和聲場中測定的言語材料的等效連續(xù)聲壓級(equivalent continuous level,Lp.T)。由于言語信號的幅度隨時間波動較大,不像純音和窄帶噪聲那樣穩(wěn)定,故在測量其言語級時有所區(qū)別。此處測量的實際上是整個測試材料的平均能量,且不包括言語材料測試項之間的無聲間隔時段。言語聽力級的單位是dB HL speech。對足夠量的耳科正常人,以指定的言語材料和指定的信號發(fā)送方式,得出的言語識別閾級的中位數(shù)稱為基準語言識別閾級(即0 dB HL speech)。言語級減去相應的基準語言識別閾級即為言語聽力級(以 dB HL speech表示)。言語級與言語聽力級之間的關(guān)系可比照純音測聽中聲壓級與聽力級之間的關(guān)系[9]。圖1給出了這種對應關(guān)系的說明。言語測聽的報告中必須標明言語信號采用的校準單位是dB SPL還是dB HL speech。
圖1 言語聽力級和言語級與聽力級和聲壓級對應關(guān)系
與言語信號類似,競爭聲或噪聲的強度計量也有兩種方式。第一種與言語級(dB SPL)對應,即采用聲壓級dB SPL計量。競爭聲聲壓級指的是按IEC 61672-1中的C頻率計權(quán),在適當?shù)鸟詈掀?、仿真耳或聲場中測得的競爭聲的等效連續(xù)聲壓級。第二種與言語聽力級(dB HL speech)對應,強調(diào)噪聲的掩蔽效能,采用有效掩蔽級dB EML計量,這類似于純音測聽中掩蔽噪聲的計量[9]。
噪聲條件下言語側(cè)聽中一個重要的概念是言語噪聲比,也就是信噪比,指的是言語級和競爭聲級之差。這一概念對于噪聲下言語識別能力的評估至關(guān)重要。需要特別注意的是,計算信噪比時,言語信號與競爭噪聲的計量單位應該相對應。言語級(dB SPL)對應噪聲聲壓級(dB SPL);言語聽力級(dB HL speech)對應有效掩蔽級(dB EML)。這兩種計量方式不可混淆。
在實際當中,不同頻譜的噪聲針對相同的言語材料、相同的噪聲針對不同言語材料的掩蔽效能均不同,因此有效掩蔽級很難統(tǒng)一給出。特別是當采用母版標準錄聲中未包含的其它競爭聲時,并沒有基準有效掩蔽級存在。因此,國家標準中推薦使用dB SPL計量言語和競爭聲的聲級以計算信噪比[6]。固定言語級測試時推薦用65 dB SPL,大致相當于正常會話時的言語聲級。
上文提到,言語信號可以言語級(dB SPL)和言語聽力級(dB HL speech)兩種計量標度進行校準。需要特別說明的是關(guān)于基準語言識別閾級(即0 dB HL speech)的校準。在現(xiàn)行國家標準GB/T 7341.2-1998的第9章提到,基準識別閾級對單耳氣導耳機是20 dB SPL[5]。在最新的IEC標準IEC 60645-1:2017中也提到了使用dB SPL和dB HL speech校準的差值為20 dB。但是這一基準語言識別閾級是根據(jù)較容易識別的材料(如雙音節(jié)詞)得出的,而實際中的測試材料多種多樣,各種材料的0 dB HL speech并不像純音信號一樣有統(tǒng)一的值[6,11-13]。全國聲學標準化技術(shù)委員會等同采用國際標準化組織ISO公布的ISO 389系列標準,形成了關(guān)于校準測聽設備基準零級的系列標準GB/T 4854,其中并不包括言語測聽的基準等效閾級。因此,在臨床實際中使用dB HL speech作為輸出標定單位時,嚴謹?shù)淖龇ㄊ鞘褂梅蠘藴实难哉Z測聽材料提供的其本身的0 dB HL speech進行零級校準。這在研究純音聽閾與言語識別閾之間的關(guān)系時非常重要。
對于噪聲下言語測聽,當言語信號使用dB HL speech校準時,同樣需要所使用的測聽材料提供每種競爭聲的基準有效掩蔽級(0 dB EML)方可完成競爭聲的dB EML校準。言語信號使用dB SPL校準時,競爭聲也應使用dB SPL校準。
實際測試中的強度控制通過校準實現(xiàn)。由于言語信號是時變的信號,因此在校準中需要使用校準音代表言語測聽材料的整體信號強度。校準信號的聲級應與特定言語材料的全部測試項的平均言語級相差不超過±0.5 dB。計量校準信號聲級,應采用與計量言語級時一致的頻率和時間計權(quán)。
言語聽力計均內(nèi)置GB/T 7341.2-1998中規(guī)定的非調(diào)制的計權(quán)無規(guī)噪聲,可直接用于內(nèi)置的言語材料的校準[5]。
對于不包括在言語聽力計中的言語測聽材料,國家標準規(guī)定,每一錄聲成品除包括言語測試材料之外,還應包括:(1)時程不少于60 s的用于校準言語測聽設備的信號,校準信號應為符合GB/T 7341.2-1998中規(guī)定的計權(quán)無規(guī)噪聲,或中心頻率為1kHz 的、帶寬為1/3倍頻程的帶通噪聲;或帶寬不少于1/3倍頻程的1 kHz調(diào)頻音,調(diào)制信號應為重復率在4~20 Hz范圍內(nèi)的正弦或三角波。(2)為檢測言語聽力計和錄放設備的頻響而用的信號,時程應不短于15 s,包括符合ISO 266規(guī)定的125~8000 Hz頻率范圍內(nèi)以各優(yōu)選1/3倍頻程頻率為中心頻率的1/3倍頻程通帶內(nèi)的白噪聲。
無論言語測聽材料是否內(nèi)置于言語聽力計,在進行校準時,都應使校準音的信號電平位于一個可控制的參考位置。言語聽力計提供一個信號電平指示器,用以監(jiān)測所有的校準和言語輸入信號的電平。這個指示器可以是VU表的形式,也可以是節(jié)段計的形式等。無論哪一種形式的指示器,都具有微調(diào)旋鈕,通常都可補償輸入信號電平20 dB。在校準時,應保證校準音的輸入電平在參考指示位置(通常是0 dB)。需要注意的是,此處提到的0 dB僅就電平指示器本身的示數(shù)而言,并不是指的聽力計增益控制面板上的dB。調(diào)節(jié)信號電平指示器的過程是為了使用聽力計進行準確的輸出增益控制,因此無論是進行dB HL speech的校準還是dB SPL的校準,這一過程都非常重要。這一過程也可稱作信號定標。對于未包含在聽力計中的言語材料,由于其錄聲材料電平可能與內(nèi)置的校準音電平不一致,此時使用材料自帶的校準音進行外接信號定標顯得尤為重要。
言語測聽材料傳遞給受試者的過程,本質(zhì)上是發(fā)音人的物理言語聲信號轉(zhuǎn)換成電聲信號,經(jīng)過控制和調(diào)整,再由電聲信號轉(zhuǎn)換成物理言語聲。言語聽力計及其換能器起到了量化控制強度的功率放大器和播放器的作用。對于內(nèi)置于言語聽力計的言語測聽材料,設備連接與純音測聽一樣。
大部分情況下,所使用的言語測聽材料錄制在CD或數(shù)字音頻文件中,需要使用具有線路輸出(Line OUT)的播放器如CD機、MP3播放器或PC電腦等輸出,將信號饋入言語聽力計的外接測試信號接口,經(jīng)過聽力計的定標之后,可以將外接信號的強度與表盤所示的聲壓級或者聽力級對應起來,此時聽力計就起到了精準控制外部信號強度的作用,使得最后的測試結(jié)果具有可靠的量化指標。圖2給出了這種情況的設備連接圖。需要注意輸入信號具有左右兩個聲道(LA和RA),輸出端也有左右兩個聲道(LB和RB),這就提供了多種信號通路:LA-LB、LA-RB、RA-RB、RALB、(LA+RA)-LB、(LA+RA)-RB、(LA+RA)-(LB+RB)等。也就是說,發(fā)送給受試者的信號,可以是左右對應的單聲道的輸入信號,可以是左右翻轉(zhuǎn)的單聲道輸入信號,也可以是左右輸入信號的混合。在噪聲下言語識別測試時,分辨言語信號和噪聲的輸出信號通路對于控制信噪比至關(guān)重要。
圖2 外接言語信號連接言語聽力計
設備連接示意圖見圖2(a)。輸入信號具有左右兩個聲道(LA和RA),輸出端也有左右兩個聲道(LB和RB),這提供了多種信號通路:LA-LB、LA-RB、RA-RB、RA-LB、(LA+RA)-LB、(LA+RA)-RB、(LA+RA)-(LB+RB)等。設備連接實物圖見圖2(b)。A為外接信號輸入端,白色為左聲道,紅色為右聲道。B為信號的揚聲器輸出端。
噪聲條件下言語測聽的信號發(fā)送比安靜條件下稍微復雜一些。這是因為涉及到信號和噪聲兩者的相互關(guān)系。這種相互關(guān)系及包括強度上的,也報包括空間和時間上的。
上文提到的信噪比是描述信號和噪聲強度關(guān)系的指標,指的是言語級和競爭聲級之差。計算信噪比時應注意兩點:(1)言語信號與競爭噪聲的計量單位應該相對應。言語級(dB SPL)對應噪聲聲壓級(dB SPL);言語聽力級(dB HL speech)對應有效掩蔽級(dB EML)。但由于有效掩蔽級通常較難得到,多推薦使用dB SPL計量言語和競爭聲的聲級用于計算信噪比。(2)言語信號與競爭噪聲輸出通道獨立。對于非固定信噪比如采用自適應方式進行信噪比調(diào)整的測試,信噪比的變化既可通過改變言語級實現(xiàn),也可通過改變噪聲級實現(xiàn)。此時言語信號和噪聲必須從不同的聲道(通道)輸出,也就是獨立控制增益。
在聲場下測試時,言語信號與噪聲信號可以來自同一方向,也可以來自不同方向??臻g上的相對關(guān)系以入射角度來描述。下文詳述。
在時間上,噪聲與言語信號的播放方式不同。對于門控噪聲,噪聲須開始于言語信號前若干毫秒(例如500 ms)并結(jié)束于言語信號后若干毫秒。對于持續(xù)噪聲,其播放應貫穿整個測試過程。
在聲場測聽中,應規(guī)定所使用到的所有揚聲器的位置。入射角通常定義為揚聲器參考軸與受試者矢狀面在耳部高度上的夾角。建議播放言語的揚聲器位于聆聽者正前方0°入射角(圖3)。聲場言語測聽可根據(jù)其測試目的加或不加競爭噪聲。噪聲可以與言語信號來自同一方向,也可來自不同的入射角。常用的是噪聲由兩個位置對稱、入射角為±45°的揚聲器發(fā)出(圖3a)。如果競爭聲是由兩個或更多的揚聲器發(fā)送,應為非相關(guān)的。也可采用其他噪聲入射角如±90°入射角(圖3b)
圖3 聲場下言語測聽的言語和噪聲入射角度
言語0°入射,噪聲由兩個位置對稱、入射角為±45°的揚聲器發(fā)出,見圖3(a);言語0°入射,噪聲入射角±90°,見圖3(b)。
對于聲場下言語測聽的校準,同樣可使用dB HL speech和dB SPL兩種方式。通常揚聲器輸出級應以在參考軸上1m距離的測量結(jié)果為準。對于前者的零級校準,目前校準規(guī)范采用的是用言語噪聲0°入射校準,聽力計輸出70dB HL,聲場參考點位置的聲壓級為(83±2)dB SPL,也就是基準言語識別閾級為13 dB SPL[14]。與氣導耳機類似,這同樣并不嚴謹?shù)胤厦恳环N測試材料。同時,由于聲場中競爭聲下的言語識別可能受到測試房間聲學特征的影響,因此每一特定測試環(huán)境下都需要給出基準數(shù)據(jù)。所以,更便于應用的方法,是對言語和噪聲均使用dB SPL校準。