陳維娜, 曾慶發(fā)
(1.中國人民公安大學(xué)刑事科學(xué)技術(shù)學(xué)院, 北京 100038; 2.鄭州市公安局, 河南鄭州 450000)
錄音環(huán)境具有多樣性,錄音環(huán)境的不同對人的發(fā)音有一定的影響。在復(fù)雜多變的環(huán)境中能否確定檢材錄音與樣本錄音中的說話人系同一人,是聲紋鑒定實踐工作中的一道難題。
為確定不同錄音環(huán)境對語音特征的改變,評估這些改變對聲紋鑒定的檢驗結(jié)果的影響,通過實驗的方式來分析和探討,以期為聲紋鑒定中語音的錄制和鑒定意見的出具提供參考。
1.1.1 錄音對象
實驗邀請了5位在大學(xué)校園廣播站從事播音主持工作的同學(xué)作為發(fā)音對象,這些同學(xué)的發(fā)音標(biāo)準(zhǔn)、穩(wěn)定,抗干擾能力較強,發(fā)音人基本情況見表1。錄音的內(nèi)容包括試音材料和語段《北風(fēng)和太陽》,其中包括豐富的單元音及復(fù)合元音。
表1 發(fā)音人基本信息
1.1.2 錄音環(huán)境
實驗選擇宿舍、教室、食堂、操場4個場所進行錄音。宿舍面積約20 m2,高度3.2 m,關(guān)閉門窗后封閉性較好,外界噪聲小,基本沒有混響效果。教室面積約70 m2,高度3.5 m,相對空曠,有一定外界噪聲和回聲。操場面積較大,比較空曠,常伴隨有鳥鳴、風(fēng)聲、行人噪聲等。食堂面積約500 m2,高度約4.5 m,噪聲和混響效果較強。
1.2.1 錄音
發(fā)音人熟悉錄音語料后分別來到指定的4個錄音場所,使用普通話較為自然、流暢地表達語料內(nèi)容;同時用“聲麗SM-008”麥克風(fēng)連接聯(lián)想Y480筆記本電腦進行錄音,發(fā)音人與麥克風(fēng)距離約為10 cm;將錄音分類標(biāo)注后保存成WAV格式并備份。
1.2.2 記錄和分析語音特征
首先,從聽覺上感受并判斷同一人在不同錄音環(huán)境下的語音差異;然后,通過PRAAT軟件制作語音的寬帶語圖,觀察并分析共振峰走向、音節(jié)間和音節(jié)內(nèi)過渡音征等形態(tài)特征,記錄下基頻曲線、振幅曲線的分布特征;最后,提取元音共振峰頻率值對語音特征的聲學(xué)參數(shù)進行測量和分析。
1.2.3 得出實驗結(jié)果
根據(jù)語音特征的記錄和分析,總結(jié)歸納不同錄音環(huán)境對語音特征的影響,確定不易受環(huán)境因素影響的語音特征、容易受到影響而發(fā)生變化的語音特征,為聲紋鑒定實踐提供依據(jù)。
2.1.1 宿舍環(huán)境
發(fā)音人在宿舍發(fā)音時,聲音清脆,吐字清晰,語速相對平穩(wěn),音量適中;聲音純凈但稍顯干澀。
2.1.2 教室環(huán)境
發(fā)音人在教室發(fā)音時,有一定的混響效果,聲音渾厚;在教室發(fā)音人會不自覺地降低音量,加快語速,吐字清晰度相對宿舍下降。
2.1.3 操場環(huán)境
發(fā)音人在操場發(fā)音時,音調(diào)提高,有拖音現(xiàn)象;聲音清脆,吐字清晰,圓潤感增強,干澀感降低。操場中常有多種噪聲,如鳥鳴、行人腳步聲、風(fēng)聲等,使得錄音略微嘈雜。
2.1.4 食堂環(huán)境
發(fā)音人在食堂發(fā)音時,語速加快,音量也有明顯提高,吐字急促,清晰度下降,混響效果明顯。
同一人在上述4種不同的錄音環(huán)境下朗讀相同內(nèi)容的語料,得到的錄音樣本在聽感上存在差異,這些差異表現(xiàn)在語速、音強、音高、清晰度、飽滿度等方面。其中,語速、音強、音高的不同是由于發(fā)音人在不同環(huán)境下的心理和生理主觀感受不同所導(dǎo)致的;而語音的清晰度、飽滿度等方面的差異主要是由于在不同錄音環(huán)境下混響和噪聲因素的干擾造成,是由于外部條件變化所致。
2.2.1共振峰走向特征
共振峰走向特征是指共振峰中心線在頻率——時間平面上的曲線形態(tài),它反映語音及其共振峰的動態(tài)特性。選擇發(fā)音人在宿舍、教室、操場、食堂錄制的4段語音中“太”、“北”、“叫”3個音節(jié)中的復(fù)合元音[ai]、[ei]、[iao]作為研究對象,觀察同一發(fā)音人不同錄音環(huán)境中的這些復(fù)合元音寬帶語圖共振峰走向特征是否存在差異,如圖1~12所示。
圖1~12是發(fā)音人M1在4種不同錄音環(huán)境下復(fù)合元音共振峰走向的寬帶語圖,從中可以看出:在4種空間環(huán)境下,被檢復(fù)合元音的共振峰走向特征反映均比較清晰;F1、F2的共振峰走向特征雖有細微變化,但總體比較穩(wěn)定,而高次共振峰的走向呈現(xiàn)出不同程度的變化,其他4位發(fā)音人的共振峰走向特征也符合此規(guī)律。這說明受到不同錄音環(huán)境下發(fā)音人發(fā)音狀態(tài)、環(huán)境噪聲和混響的影響,高次共振峰的走向特征容易產(chǎn)生變化,而低次共振峰的抗干擾能力較強,特征表現(xiàn)比較穩(wěn)定。
2.2.2 音節(jié)間過渡音征
選擇“大學(xué)”、“無錫”兩個詞語中首音節(jié)元音[a]、[u]到下一音節(jié)輔音[x]的過渡段來分析音節(jié)間過渡音征。對錄音人在宿舍、教室、操場、食堂中的錄音進行音節(jié)間過渡音征的觀察和比較分析,根據(jù)過渡段的平穩(wěn)性、連貫性,界限是否清晰,升降過程中是否出現(xiàn)明顯斷層等特點來判斷同一人在不同錄音環(huán)境下語音的過渡音征是否穩(wěn)定,其語圖是否有明顯差異,如圖13~20所示。
從寬帶語圖中可以看出,發(fā)音人F2的“大學(xué)”[a-x]過渡音征中[a]音向[x]音的攀升式過渡特點在不同環(huán)境中表現(xiàn)較為相似;但在宿舍和操場的錄音環(huán)境下這種過渡的界限較為清晰、連貫,而在教室和食堂的錄音環(huán)境下這種攀升式過渡的表現(xiàn)不顯著、不連貫。從圖中還能夠發(fā)現(xiàn),發(fā)音人F2的“無錫”[u-x]過渡音征中元音[u]向輔音[x]的攀升式過渡特點在不同環(huán)境中保持高度一致。這從一定程度上說明了同一人在不同場所發(fā)音時,音節(jié)間元音向輔音的過渡音征表現(xiàn)具有一定的穩(wěn)定性,不易受到錄音環(huán)境的干擾而發(fā)生較大的變化。這一規(guī)律在其他4位發(fā)音人的語音中也有所體現(xiàn)。
2.2.3 音節(jié)內(nèi)過渡音征
對錄音人在宿舍、教室、操場、食堂4種環(huán)境下語音中的音節(jié)內(nèi)過渡音征進行分析。以音節(jié)“他”[ta]為例,分析音節(jié)內(nèi)輔音[t]到元音[a]之間的過渡段走向形態(tài),根據(jù)過渡段的平穩(wěn)性、連貫性、是否界限清晰及其升降過程中是否出現(xiàn)明顯斷層等特點來確定同一人在不同錄音環(huán)境下語音的音節(jié)內(nèi)過渡音征是否也能保持穩(wěn)定。結(jié)果顯示同一人在不同環(huán)境下發(fā)“他”[ta]音節(jié)時,音節(jié)內(nèi)輔音到元音的過渡音征基本保持一致,其過渡段較明顯、清晰,沒有明顯的變化,如圖21~24所示。
2.2.4 基頻曲線
基音頻率是單位時間內(nèi)聲帶開閉的次數(shù),也就是基音周期的倒數(shù),簡稱為基頻?;l是發(fā)音的重要因素之一,在不同錄音環(huán)境下,基頻曲線是否具有穩(wěn)定性是值得探究的。提取3位男性發(fā)音人M1、M2和M3在不同錄音環(huán)境下說的同一句話“有一回,北風(fēng)和太陽在那爭論誰的本事大”的基頻曲線進行比較分析,結(jié)果如圖25~36所示。
圖1~12 發(fā)音人M1 4種錄音環(huán)境下復(fù)合元音共振峰走向
從圖25~36中可以看出發(fā)音人在宿舍和操場錄音環(huán)境下的基頻曲線比較相近,與在教室和食堂錄音環(huán)境下的基頻曲線存在一定差異。這說明,不同錄音環(huán)境對發(fā)音人的基頻曲線特征表現(xiàn)是有一定影響的,但這種影響在宿舍和操場這兩類一個相對封閉、較小,一個相對開闊、較大的環(huán)境中卻表現(xiàn)的不十分明顯。
2.2.5 振幅曲線
同樣選擇“有一回,北風(fēng)和太陽在那爭論誰的本事大”這句話作為研究對象,分析比對3位男性發(fā)音人M1、M2和M3在不同錄音環(huán)境下語音的能量曲線分布情況,結(jié)果見圖37~48。
從圖37~48中可以看出,同一發(fā)音人在不同環(huán)境中說同一段話語的能量分布均存在差異,無論是聲強的絕對數(shù)值位置,還是曲線走向上都沒有普遍的相同規(guī)律。分析這種現(xiàn)象產(chǎn)生的原因應(yīng)該是在不同的環(huán)境下,錄音人的說話狀態(tài)、發(fā)音音量均不相同,導(dǎo)致了其音強曲線分布存在差異。
選取錄音人在4種不同環(huán)境下發(fā)音中的“大”、“衣”、“足”3個音節(jié)的單元音[a]、[i]、[u]進行聲學(xué)參數(shù)定量分析,提取其共振峰頻率數(shù)值,測量3次后取平均值再進行統(tǒng)計分析,結(jié)果見表2。
從不同錄音環(huán)境下同一人發(fā)[a]、[i]、[u]3個單元音共振峰的峰值、均值、標(biāo)準(zhǔn)差和變異系數(shù)中可以看出錄音環(huán)境對共振峰的峰值有一定的影響:對[a]音的影響較小,其共振峰峰值的變異系數(shù)均小于10%;對[i]音的F1影響較大,其變異系數(shù)超過10%,對[i]音的其他共振峰峰值影響較??;對[u]音的F1、F2影響較大,其變異系數(shù)均超過10%,F(xiàn)2的變異系數(shù)甚至超過了20%,對[u]音的F3、F3峰值影響較小。
圖13~20 發(fā)音人F2 4種錄音環(huán)境下音節(jié)間過渡音征形態(tài)
圖21~24 發(fā)音人M2 4種錄音環(huán)境下音節(jié)內(nèi)過渡音征形態(tài)
通過實驗研究發(fā)現(xiàn),不同的錄音環(huán)境對聲紋鑒定有一定的影響,這些影響表現(xiàn)在:
(1) 不同錄音環(huán)境下同一人的發(fā)音在聽感上存在差異,如語音的清晰度、飽滿程度等,在一定程度上影響了語音的聽覺分析。
(2) 在不同錄音環(huán)境下,同一人的共振峰走向特征表現(xiàn)存在一定差異,其中復(fù)合元音的低次共振峰走向頻譜特征F1、F2表現(xiàn)穩(wěn)定,高次共振峰走向頻譜特征F3、F4富于變化。
(3) 同一人在宿舍、教室、操場、食堂4種不同錄音環(huán)境下的語音,其音節(jié)內(nèi)、音節(jié)間過渡音征形態(tài)特征基本穩(wěn)定,受環(huán)境的影響不大。
(4) 同一人、相同內(nèi)容的發(fā)音在不同錄音環(huán)境下的基頻曲線特征存在差異;其中,基頻曲線在宿舍和操場錄音環(huán)境中表現(xiàn)相近,而在其他錄音環(huán)境中存在明顯差異。
(5) 不同錄音環(huán)境對同一人發(fā)音的振幅曲線具有較大影響;即使發(fā)音內(nèi)容相同,在不同錄音環(huán)境下語音的振幅曲線也存在著較大的差異。
(6) 定量分析同一人發(fā)音中的[a]、[i]、[u]單元音共振峰頻率,發(fā)現(xiàn)不同錄音環(huán)境對[i]音的F1影響較大,[u]音的F1、F2影響較大;對[a]音,[i]音的其他共振峰,[u]音的高次共振峰雖有影響,但變異系數(shù)均在10%以內(nèi)。
圖25~36 不同發(fā)音人4種錄音環(huán)境下基頻曲線
圖37~48 不同發(fā)音人4種錄音環(huán)境下能量曲線
表2 同一發(fā)音人4種錄音環(huán)境下單元音共振峰頻率
從實驗中能夠發(fā)現(xiàn),不同錄音環(huán)境因空間、場所的配置不同,影響其錄制的語音在聽覺分析、視譜比較和聲學(xué)參數(shù)等語音特征的反映,這種影響會對聲紋鑒定造成一定障礙,甚至影響到最終的鑒定結(jié)果。但是,在司法實踐中,受到條件限制,不可能總是保證檢材錄音和樣本錄音是在同一空間環(huán)境下錄制形成,這就要求鑒定人員在對這類案件進行檢驗之前要充分掌握待檢錄音的錄制環(huán)境和條件,熟悉不同錄音環(huán)境對語音特征的影響,盡量選用穩(wěn)定的語音特征進行檢驗、鑒定,對易受到影響的振幅曲線特征、高次共振峰走向特征等慎重使用,以期科學(xué)、客觀地得出鑒定意見。當(dāng)然,在條件容許的情況下,應(yīng)該盡可能地使檢材錄音和樣本錄音在相同環(huán)境下錄制,如果條件有限,可以參考上述實驗結(jié)果,選擇無混響的環(huán)境,如面積較小的宿舍、辦公室或開闊、噪音較小的操場、室外進行。