唐舒巖
(人民教育電子音像出版社有限公司錄音編輯部,北京 100081)
錄音教材產(chǎn)品后期制作中的語音信號(hào)預(yù)處理
唐舒巖
(人民教育電子音像出版社有限公司錄音編輯部,北京 100081)
詳細(xì)論述了錄音教材產(chǎn)品編輯加工中使用數(shù)字音頻工作站對(duì)語音信號(hào)進(jìn)行預(yù)處理的對(duì)象、類型以及方法,為高質(zhì)量的錄音教材產(chǎn)品后期編輯加工提供了有力的理論依據(jù)與技術(shù)手段。
錄音;預(yù)處理;信號(hào);刪除;修復(fù);失真
高質(zhì)量的錄音教材產(chǎn)品的前期錄制可以有效地控制錄音信號(hào)中的噪聲以及其他無效信號(hào)成分的比例,同時(shí)減少錄音中不良聲學(xué)效應(yīng)對(duì)音質(zhì)產(chǎn)生的不良影響,但是某些信號(hào)噪聲和不良聲學(xué)效應(yīng)的產(chǎn)生在實(shí)際錄制過程中是很難完全避免的,這可能與語言素材在前期錄制中傳聲器的擺位、教材文本的內(nèi)容類型以及錄制方式等諸多因素相關(guān)。這些問題會(huì)導(dǎo)致前期錄音的素材在后期編輯中無法直接進(jìn)行剪輯加工,所以,應(yīng)預(yù)先對(duì)其做必要的優(yōu)化處理。錄音教材產(chǎn)品后期編輯加工中的語音信號(hào)預(yù)處理主要包括采用音頻技術(shù)手段對(duì)前期語言錄音素材進(jìn)行技術(shù)處理、去除信號(hào)中的噪聲和多余無效成分、減少錄音中不良聲學(xué)效應(yīng)的影響,使之符合錄音產(chǎn)品對(duì)語音信號(hào)聲音質(zhì)量的基本要求,便于對(duì)其進(jìn)行后期剪輯加工。
隨著多軌錄音工藝以及計(jì)算機(jī)數(shù)字音頻工作站在錄音教材制作中的廣泛應(yīng)用,越來越多的技術(shù)手段可以被應(yīng)用于語音信號(hào)的音頻預(yù)處理。而充分合理的語音信號(hào)預(yù)處理可以彌補(bǔ)前期錄音中的技術(shù)漏洞,提高錄音素材的聲音質(zhì)量,并為后期剪輯加工提供良好的信號(hào)素材基礎(chǔ)。
根據(jù)預(yù)處理對(duì)象的類型及其成因的不同,語音信號(hào)的預(yù)處理主要包括信號(hào)的刪除、修復(fù)和改善。信號(hào)的刪除主要是針對(duì)那些在錄制過程產(chǎn)生的無效和棄用的音頻素材;信號(hào)的修復(fù)主要指的是對(duì)于錯(cuò)誤信號(hào)的糾正和重建;而信號(hào)的改善則主要針對(duì)信號(hào)音色中不良成分的刪除和優(yōu)化。以下將對(duì)這三種類型信號(hào)預(yù)處理的對(duì)象以及方式進(jìn)行分別論述。
通常情況下,由于拾音方式以及聲源本身的原因,在語言前期錄音中會(huì)產(chǎn)生大量最終不需要的音頻信號(hào),其中包括聲道串音、聲源雜音以及無用素材,這些信號(hào)通常和正常語音信號(hào)混雜在一起,在對(duì)語音信號(hào)進(jìn)行后期剪輯之前,應(yīng)將其與正常信號(hào)區(qū)分出來,并加以刪除。
1.1 聲道串音
典型的聲道串音一般發(fā)生在采用同期多軌錄音方式的前期錄音素材中,在雙人或多人錄音時(shí),由于同時(shí)使用多支傳聲器對(duì)不同的聲源進(jìn)行拾音,拾取各自語音信號(hào)的傳聲器也會(huì)拾取到其他傳聲器拾取對(duì)象的語音信號(hào),從而產(chǎn)生一定的聲道串音。由于拾音距離較遠(yuǎn),傳聲器串音的直混比較低,含有大量房間反射聲,直接合成就會(huì)影響原有信號(hào)的清晰度。同時(shí),聲道串音也會(huì)由于與原有信號(hào)的聲程差而產(chǎn)生較為明顯相位干涉,形成梳狀濾波效應(yīng)。
通常情況下,當(dāng)多個(gè)語音聲源同時(shí)發(fā)聲時(shí),聲道串音無法通過后期處理完全去除,只能通過前期錄音時(shí)的傳聲器設(shè)置進(jìn)行有效的聲道隔離,從而減少聲道串音的不良影響,如采用同期多軌錄音時(shí)兩支傳聲器拾取的信號(hào)之間產(chǎn)生聲道串音,如圖1中的圈內(nèi)部分。單一聲源發(fā)聲時(shí),聲道串音是可以去除的,此類情況常見于教材文本中情景對(duì)話的錄制。
1.2 聲源雜音
聲源雜音主要來自于錄制主體本身,由于播音者本身的發(fā)聲以及呼吸習(xí)慣,在錄音時(shí)可能會(huì)產(chǎn)生口唇部位的雜音和不自然的呼吸聲,同時(shí),錄制過程中翻閱錄音文本時(shí)產(chǎn)生的雜音也會(huì)被傳聲器拾取到。此類雜音常常產(chǎn)生于較短的語音信號(hào)間隙中,并與語音信號(hào)結(jié)合得比較緊密,如圖2圈內(nèi)部分。因此,聲源雜音在前期錄音中往往容易被忽視,甚至有時(shí)在后期音頻加工中也還需要對(duì)錄音信號(hào)的波形圖進(jìn)行放大并反復(fù)監(jiān)聽后才能鑒別到。
1.3 無用素材
當(dāng)播音員出現(xiàn)誤讀、錯(cuò)讀、漏讀錄音文稿,以及在朗讀文本的間隙翻看錄音文稿時(shí),會(huì)產(chǎn)生大量無用素材,一般情況下在前期錄音中需要停機(jī)進(jìn)行必要的刪除。這種剪輯式與插入式的錄音模式主要適用于那些素材文本篇幅較短的前期錄制,這樣可以減少后期剪輯加工的工作量;而在錄音教材文本篇幅較長、錄音內(nèi)容較多的情況下,為了節(jié)省前期素材錄制的時(shí)間以提高錄音的效率,實(shí)際錄音中往往采用不停機(jī)錄音的錄制模式,此時(shí),錄音技術(shù)編輯往往很難實(shí)時(shí)進(jìn)行精確的素材剪輯,有時(shí)在教材文本存在多種讀音方式的情況下,還可能會(huì)在前期錄音時(shí)留下多個(gè)素材以便后期選擇使用。因此,較大部分的無用素材會(huì)存留在錄音信號(hào)中,而需要在后期編輯加工的流程中刪除。無用素材在前期錄音信號(hào)中占有的比重主要取決于播音員的專業(yè)水準(zhǔn)以及對(duì)錄音文本的熟悉程度,在前期錄音的審聽中,教材文本的內(nèi)容編輯需要做好錄音記錄,對(duì)無用素材的錄音位置進(jìn)行標(biāo)注,以便有效地引導(dǎo)后期編輯加工。如圖3所示:無用素材在錄制波形的形態(tài)上與正常使用的素材波形十分接近,在后期編輯加工時(shí)應(yīng)注意觀察和監(jiān)聽,以免形成漏刪和誤刪信號(hào)。
1.4 信號(hào)刪除的方式
無論是聲道串音、聲源雜音還是無用素材,都需要通過刪除操作從原始信號(hào)中去除。使用數(shù)字音頻工作站對(duì)信號(hào)進(jìn)行刪除的方式一般有兩種,即有損編輯刪除和無損編輯刪除。語音信號(hào)的預(yù)處理應(yīng)選擇有效而安全的信號(hào)刪除方式,既保證有效的信號(hào)刪除操作,又不會(huì)漏刪噪聲信號(hào)或誤刪有用的信號(hào)。
1.4.1 有損編輯刪除
有損編輯刪除是指通過使用軟件的有損編輯方式對(duì)信號(hào)進(jìn)行破壞性刪除操作的方法,一般是對(duì)音頻信號(hào)的波形進(jìn)行不可逆的刪除,亦可稱為“靜音”。如圖4顯示了同一信號(hào)素材在經(jīng)有損編輯刪除前后的波形圖示。有損編輯刪除具有不可撤銷的特點(diǎn),一旦保存文件后誤刪信號(hào)就無法進(jìn)行恢復(fù),但此種方式使用時(shí)并不破壞音頻事件的完整性以及相互關(guān)系,比較適用于去除素材信號(hào)中波形特征較為明顯的聲道串音以及聲源雜音。
1.4.2 無損編輯刪除
在后期編輯加工中,無損編輯方式進(jìn)行信號(hào)刪除常被用于大段的無用素材。由于采用非破壞性的刪除操作,原始音頻數(shù)據(jù)仍記錄在軟件的素材庫中,當(dāng)出現(xiàn)誤操作時(shí),可以及時(shí)恢復(fù)原來的數(shù)據(jù)。在數(shù)字音頻工作站中,無損編輯刪除一般通過兩種方式實(shí)現(xiàn):音頻事件的刪除與音量自動(dòng)化刪除。音頻事件的刪除指直接刪除無效信號(hào)所在區(qū)域的音頻事件。由于只是刪除音頻事件而非對(duì)原始波形進(jìn)行破壞性修改,因此,該方式可以通過恢復(fù)音頻事件來進(jìn)行糾錯(cuò)。如圖5所示,通過音頻事件刪除原始錄音素材中的兩處無用素材,信號(hào)波形周圍的實(shí)線區(qū)域顯示了該音頻事件的大小。
而音量自動(dòng)化的刪除方式在操作上較為復(fù)雜,這種方式是通過音頻工作站的音量自動(dòng)化功能在無效素材相應(yīng)的時(shí)間區(qū)域繪制音量變化曲線,使得在該區(qū)域內(nèi)的音頻信號(hào)電平最小化,進(jìn)而達(dá)到去除此處音頻信號(hào)的目的。繪制音量曲線需要耗費(fèi)一定的時(shí)間,但操作結(jié)果十分直觀,方便檢查是否出現(xiàn)刪除錯(cuò)誤,當(dāng)出現(xiàn)誤操作時(shí),可以通過恢復(fù)自動(dòng)化曲線來達(dá)到糾錯(cuò)的目的。圖6顯示了在兩處無用素材信號(hào)的時(shí)間區(qū)域內(nèi)繪制的相應(yīng)的音量自動(dòng)化曲線。使用此種方式進(jìn)行信號(hào)刪除時(shí)需要注意將音頻事件軌道與自動(dòng)化軌道相互關(guān)聯(lián),以防止由于音頻事件移動(dòng)導(dǎo)致其在時(shí)間上無法與相應(yīng)的自動(dòng)化曲線對(duì)應(yīng)。
信號(hào)的過載失真常發(fā)生于前期錄音中,其中主要包括由于傳聲器瞬態(tài)過載和模數(shù)轉(zhuǎn)換過程中信號(hào)的削波失真。過載失真信號(hào)所產(chǎn)生的噪聲會(huì)嚴(yán)重破壞錄音信號(hào)的質(zhì)量,甚至造成正常語音信號(hào)的缺失。在通常情況下,前期錄音時(shí)應(yīng)及時(shí)調(diào)整傳聲器的設(shè)置以及前置放大器的增益,以避免此類噪聲的產(chǎn)生,一旦出現(xiàn)問題應(yīng)及時(shí)暫停錄制并進(jìn)行必要的重錄和補(bǔ)錄。但是,由于此類噪聲一般發(fā)生在較短時(shí)間內(nèi),特別是傳聲器瞬態(tài)失真產(chǎn)生的過載噪聲,十分容易被遺漏而滯留在前期錄音素材中。在無法進(jìn)行補(bǔ)錄的情況下,常常需要在后期編輯加工中對(duì)此類信號(hào)成分進(jìn)行必要的修復(fù)。
2.1 傳聲器的瞬態(tài)過載失真
當(dāng)傳聲器膜片距離播音者較近時(shí),播音者的某些發(fā)音會(huì)產(chǎn)生較強(qiáng)的氣流聲,這種氣流會(huì)使傳聲器振膜出現(xiàn)瞬態(tài)失真,從而形成中低頻段的“噴口”噪聲?!皣娍凇痹肼曉谇捌阡浺糁械陌l(fā)生具有不確定性,一般會(huì)出現(xiàn)在一些語言發(fā)音中的爆破音,如:在英語發(fā)音中,帶有p、t、k、f等輔音字母的單詞發(fā)音很容易造成傳聲器的瞬態(tài)過載。傳聲器的瞬態(tài)過載失真可通過在前期錄音中改變拾音距離和拾音角度的方式加以避免,但有時(shí)少量的瞬態(tài)失真容易被忽略,需要在后期編輯中對(duì)失真進(jìn)行修復(fù)。如圖7所示,“噴口”噪聲通常會(huì)隱藏在正常的信號(hào)中,從信號(hào)波形上看呈不規(guī)律的形狀,放大后類似連續(xù)的脈沖信號(hào)。
2.2 數(shù)字削波失真
數(shù)字削波失真信號(hào)的噪聲主要指由于在前期錄音時(shí)傳聲器輸入增益過大,位于峰值部分的信號(hào)超過了數(shù)字系統(tǒng)的最大滿刻度數(shù)字電平,從而產(chǎn)生了采樣波形的缺失,最終形成一種中高頻的刺耳噪聲。數(shù)字削波失真的發(fā)生通常與數(shù)字系統(tǒng)的電平動(dòng)態(tài)儲(chǔ)備有關(guān),通過降低傳聲器的前置增益和使用信號(hào)壓縮器的方式可以有效避免數(shù)字失真。但有時(shí)仍有少量的削波失真會(huì)被留在錄音信號(hào)中,如圖8所示,這就需要對(duì)已經(jīng)產(chǎn)生削波失真的信號(hào)進(jìn)行有效的還原修復(fù)。
2.3 信號(hào)修復(fù)的方式
在數(shù)字音頻工作中,信號(hào)修復(fù)主要是通過音頻軟件實(shí)現(xiàn)的,包括頻率修復(fù)和振幅修復(fù)兩種方式。頻率修復(fù)方式主要應(yīng)用于傳聲器瞬態(tài)失真的信號(hào)修復(fù),而振幅修復(fù)方式則用于數(shù)字削波失真的信號(hào)重建。
2.3.1 頻率修復(fù)方式
頻率修復(fù)方式指的是通過特定截止頻率的高通濾波軟件,對(duì)傳聲器瞬態(tài)失真信號(hào)進(jìn)行處理,去除其中的“噴口”噪聲。根據(jù)語音信號(hào)的頻譜范圍,采用截止頻率在150 Hz以內(nèi)的高通濾波處理,不會(huì)對(duì)原有信號(hào)的音質(zhì)產(chǎn)生過多的影響。圖9顯示了帶有“噴口”噪聲的原始素材信號(hào)以及通過帶有150 Hz截止頻率的高通濾波器去除“噴口”噪聲之后的素材信號(hào)。
2.3.2 振幅修復(fù)方式
振幅修復(fù)方式主要是通過音頻插件對(duì)原有信號(hào)的振幅進(jìn)行修復(fù),使之恢復(fù)正常的信號(hào)形態(tài)。這種方式主要用于消除錄音中由于信號(hào)在輸入端過載而產(chǎn)生數(shù)字削波失真噪聲。在數(shù)字音頻工作站中具備過載信號(hào)修復(fù)功能的軟件可以實(shí)現(xiàn)對(duì)于削波失真信號(hào)的修復(fù)以及噪聲的去除。如圖10所示,利用音頻修復(fù)軟件將一處過載信號(hào)進(jìn)行修復(fù)以消除失真噪聲。需要注意的是,這種利用軟件實(shí)現(xiàn)的修復(fù)刪除只是通過軟件內(nèi)部對(duì)音頻信號(hào)的振幅進(jìn)行還原運(yùn)算,模擬了原始波形,從而達(dá)到去除噪聲的目的。在實(shí)際工作中,在前期錄音中控制好錄音電平才是避免信號(hào)在模數(shù)轉(zhuǎn)換中過載失真的合理方式。
錄制清晰的語音信號(hào)以便于聽者學(xué)習(xí),是語言錄音教材產(chǎn)品錄制加工的首要目的,信號(hào)音質(zhì)的改善可以有效地提高語音信號(hào)的清晰度和可懂度。在語音信號(hào)的預(yù)處理中,對(duì)信號(hào)的改善是指緩解和消除前期錄音中的不良聲學(xué)效應(yīng)對(duì)信號(hào)音質(zhì)產(chǎn)生的不利影響,主要包括近講效應(yīng)與嘶聲的消除。
3.1 近講效應(yīng)
近距離拾音可以捕捉聲音的細(xì)節(jié),從而大大提高拾取信號(hào)的清晰度,特別是對(duì)于錄音教材的錄制來說,清晰的語音信號(hào)可以提高語言的可懂度,從而幫助學(xué)習(xí)者更好地學(xué)習(xí)語言的發(fā)音,理解語言的含義。但為了避免產(chǎn)生過多的聲道串音,同時(shí)盡可能少地拾取房間反射聲,語音信號(hào)的前期錄音中常用到以心形指向傳聲器為代表的復(fù)合式傳聲器。因此,近距離拾音所產(chǎn)生的近講效應(yīng)在前期錄音時(shí)難以避免。由近講效應(yīng)所引起的語音信號(hào)中低頻成分的過度增強(qiáng),會(huì)削弱近距離拾音所帶來的信號(hào)清晰度。如圖11所示,某語音信號(hào)由于拾音距離較近而產(chǎn)生近講效應(yīng),可以看到該信號(hào)在低頻段60 Hz~250 Hz之間有明顯的提升。為了緩解近講效應(yīng)對(duì)語音信號(hào)清晰度的破壞,應(yīng)進(jìn)行必要的信號(hào)預(yù)處理,消除近講效應(yīng)的不利影響。
3.2 嘶聲
嘶聲是指在錄音過程中播音者發(fā)音氣流與其牙齒及口唇摩擦產(chǎn)生的高頻雜音。嘶聲的產(chǎn)生與播音者的發(fā)聲特點(diǎn)密切相關(guān),通常情況下女聲多于男聲;此外,它還與發(fā)音的內(nèi)容相關(guān),如:漢語中帶有聲母z、c、s的漢字,在發(fā)音時(shí)容易產(chǎn)生嘶聲,如圖12。嘶聲的產(chǎn)生并不會(huì)影響語音信號(hào)的清晰度,但語音信號(hào)中過多的高頻成分會(huì)惡化音質(zhì),刺耳的語音信號(hào)會(huì)導(dǎo)致聽音者在短時(shí)間內(nèi)產(chǎn)生聽覺疲勞,對(duì)語言的學(xué)習(xí)非常不利。此外,語音信號(hào)中過多的高頻分量還會(huì)導(dǎo)致后期制作中進(jìn)行信號(hào)響度提升時(shí)產(chǎn)生的失真,這種失真有時(shí)只有通過采用四倍過采樣技術(shù)的EBU R128標(biāo)準(zhǔn),其真正峰值表才能被檢測(cè)到。
3.3 信號(hào)改善的方式
采用均衡器對(duì)語音信號(hào)進(jìn)行處理,可以有效地緩解近講效應(yīng)帶來的影響,改善語音信號(hào)的音質(zhì)。對(duì)于近講效應(yīng)較為嚴(yán)重的信號(hào),可采用截止頻率為100 Hz的高通濾波進(jìn)行處理,必要時(shí)可增加中心頻率為200 Hz~300 Hz的峰型均衡衰減,衰減量可視情況而定,一般在3 dB~6 dB;對(duì)于近講效應(yīng)影響較輕的語音信號(hào),則可采用轉(zhuǎn)折頻率為100 Hz的低頻擱架式均衡衰減,衰減量可在6 dB~12 dB。
消除語音嘶聲同樣可以使用高頻擱架式均衡,通常可采用的轉(zhuǎn)折頻率為8 kHz,衰減量在3 dB~6 dB。但單一的高頻衰減容易破壞高次諧波分量較為豐富的語音信號(hào),影響語音信號(hào)的清晰度??刹捎脤S玫乃宦曄浖―eEsser)對(duì)帶有嘶聲的信號(hào)進(jìn)行處理,如圖13所示。使用此類軟件處理可以在保證不破壞原有信號(hào)音質(zhì)的前提下,有效地去除語音信號(hào)中的嘶聲,達(dá)到改善音質(zhì)的目的。
前期錄音中語音信號(hào)的預(yù)處理,是保證語言類錄音教材產(chǎn)品后期編輯加工的先決條件,其目的并不是美化信號(hào),而是對(duì)語音素材信號(hào)進(jìn)行規(guī)范化。在處理的過程中應(yīng)盡可能地保證原始錄音素材中內(nèi)容的完整性、語言表達(dá)的流暢性以及音色的統(tǒng)一性,以不破壞聲音的自然屬性為原則。
保證內(nèi)容的完整性主要指在信號(hào)刪除處理時(shí)做到“聽”與“看”相結(jié)合,仔細(xì)地監(jiān)聽、鑒別應(yīng)刪除信號(hào)的位置,認(rèn)真地觀察信號(hào)波形的形態(tài),避免無效信號(hào)與保留的錄音文本內(nèi)容信號(hào)之間出現(xiàn)混淆,導(dǎo)致漏刪噪聲信號(hào)或誤刪有用信號(hào),在必要時(shí)盡量使用無損刪除方式,最大程度地保留原始數(shù)據(jù),為修改留出余地。在實(shí)際操作時(shí),由于大部分需要?jiǎng)h除的信號(hào)以及應(yīng)保留信號(hào)的音頭和音尾信號(hào)都屬于低電平信號(hào),常因計(jì)算機(jī)音頻工作站軟件的波形顯示精度不夠而無法顯示明確,此時(shí),可將原始素材信號(hào)的波形幅度顯示適當(dāng)放大,看清所需刪除信號(hào)的邊界后再進(jìn)行操作。如圖14所示,同一素材信號(hào)的波形在經(jīng)過振幅顯示放大后可以清晰地看到聲源雜音所在位置(箭頭所指處)。
保證語言表達(dá)的流暢性主要指在刪除操作時(shí)不破壞原有語言表達(dá)的呼吸,保持自然的語言節(jié)奏。原則上說,語音間隙的自然呼吸信號(hào)應(yīng)盡量保留,刪除信號(hào)時(shí),在保留信號(hào)的開始與結(jié)束的位置,要留出一定的空間來保證原有的呼吸不被刪除;在不得不破壞原有語言呼吸節(jié)奏的情況下,應(yīng)使用“淡入”和“淡出”功能盡可能地減少人為編輯加工的痕跡。如圖15所示,以刪除某錄音素材中的聲道串音信號(hào)為例,圖15(1)顯示信號(hào)中原有聲道串音的形態(tài);圖15(2)中直接采用了音頻事件刪除的方法去除了該素材信號(hào)中聲道串音,同時(shí)在各個(gè)音頻事件的頭尾保留了一定的長度,保證了音頭和音尾的自然呼吸;圖15(3)則是使用了音頻事件的“淡入”和“淡出”功能部分刪除語言呼吸信號(hào),結(jié)果顯得更為自然。
另外,在使用效果軟件對(duì)信號(hào)進(jìn)行修復(fù)和改善時(shí),由于原有信號(hào)的頻譜產(chǎn)生了改變,會(huì)導(dǎo)致信號(hào)的相位失真以及音色的改變,為了保證前后信號(hào)在音色上的統(tǒng)一,在實(shí)際操作時(shí),應(yīng)盡可能地縮小信號(hào)濾波和修復(fù)的范圍,以減少處理的痕跡。在對(duì)信號(hào)做頻率和振幅的改變操作時(shí),應(yīng)明確只做“減法”、不做“加法”,即只做衰減處理、不做增益處理,這樣可以最大程度地保證信號(hào)的原始形態(tài),并為之后的編輯加工留出一定的余地。
唐舒巖,碩士,高級(jí)編輯,現(xiàn)就職于人民教育電子音像出版社有限公司錄音編輯部,主要從事音樂和語言錄音產(chǎn)品的錄制和后期編輯工作。
(編輯 薛云霞)
Preprocessing in Post Production of Language Teaching Materials
TANG Shu-yan
(Record Editing Department, People's Education Electronic Audio and Video Press Co., Ltd., Beijing 100081, China)
This paper discusses the object, type and methods of preprocessingin post production of language teaching materials with digital audio work station in detail. It provides a strong theoretical basis and technical means for the high quality of language t eaching materials products.
recording; preprocess; signal; delete; repair; frequence; distortion
10.3969/j.issn.1674-8239.2015.06.006