張紅兵
(中國刑警學(xué)院 遼寧 沈陽 110035)
電聲偽裝語音的音高模式比對研究
張紅兵
(中國刑警學(xué)院 遼寧 沈陽 110035)
偽裝語音是司法語音檢驗(yàn)領(lǐng)域常見的檢材形式,給話者鑒別帶來諸多困難。本文針對電聲偽裝語音,通過圖譜和數(shù)據(jù)分析的方法得出多個語音庫變聲前后的基頻變化規(guī)律,結(jié)果表明變聲前后的基頻存在著線性關(guān)系,可借助漢語音高模式比對的方法實(shí)現(xiàn)電聲偽裝語音的話者鑒別。
偽裝語音 音高模式 歸一化 話者鑒別
基頻作為語音檢驗(yàn)領(lǐng)域最為重要的聲學(xué)特征之一,在話者鑒別工作中有著不可或缺的應(yīng)用價值。漢語是聲調(diào)語言,聲調(diào)是具有區(qū)別意義的音高變化,音高的不同不會引起聲調(diào)的變化,音高變化的不同才會引起聲調(diào)的變化。由于不同人的音域不同,并且在具體的司法語音檢驗(yàn)過程中,由于檢材的易偽裝性以及所附帶的信道信息、話音提取方式等因素不同,話者基頻極易發(fā)生某種程度上的變異,從而否定了基頻數(shù)據(jù)的可比性。其中偽裝語音作為司法語音檢驗(yàn)領(lǐng)域常見的檢材形式,對其進(jìn)行話者鑒別尤為困難,電聲偽裝是目前比較典型的個性化語音偽裝方式之一。
通過變聲軟硬件技術(shù)對說話人的自然語音進(jìn)行個性化偽裝,導(dǎo)致一般的受話者很難識別發(fā)音人的身份、年齡甚至性別,嚴(yán)重影響了司法語音檢驗(yàn)的鑒定效果,給司法鑒定工作帶來很大麻煩。本文針對電聲偽裝方式,重點(diǎn)研究變聲前后語音特征的變化規(guī)律,根據(jù)這一聲學(xué)特征變化規(guī)律,并結(jié)合漢語音高模式理論,深入分析話者變聲前后基頻數(shù)值變化的規(guī)律性,進(jìn)而比對兩者音高模式曲線是否存在差異。通過比對音高模式為此類語音的話者鑒別提供科學(xué)有效的方法。
普通話中的音高變化不同,形成了普通話的四個聲調(diào),漢語的音高變化承載了豐富的語音、語言學(xué)信息,這些復(fù)雜的變化,也反應(yīng)了說話人的音高特點(diǎn)。一般用調(diào)形和調(diào)值來描寫漢語聲調(diào),調(diào)形是聲帶顫動時基頻變化形態(tài)的反映,從聲調(diào)的最低音到最高音是基頻的變化范圍,即聲調(diào)調(diào)域。漢語音高的變化存在著諸多的內(nèi)部差異,為了分析其各種個性特征,有必要對音高變化做詳細(xì)的分解,這樣才能得出個體聲調(diào)的具體差異。
話者基頻由于偽裝發(fā)生某種程度上的變異,從而否定了基頻數(shù)據(jù)的可比性。針對上述問題,對于話者音高特點(diǎn)的比較,研究者曾經(jīng)提出聲調(diào)格局的理論,即通過測量不同測量點(diǎn)的基頻數(shù)據(jù),進(jìn)行歸一和相對分析,用曲線表征話者四種聲調(diào)的變化格局,從而在一定程度上避免了外界因素對基頻的干擾。
1.1 基頻獲取與處理
目前關(guān)于基頻提取的方式方法有很多,個別采用簡單地直接選取音節(jié)區(qū)域求平均值,或者測量某次諧波頻率值,再除以諧波數(shù)后作數(shù)據(jù)分析;要么是利用復(fù)雜的算法提取基頻,并考慮抗噪性等諸多因素。前者操作雖然簡單,但測量誤差較大,對于基頻比較意義不大;后者提取精度較高,但需要復(fù)雜的算法運(yùn)算以及后期大量的數(shù)據(jù)處理,況且無論采用哪一種算法所求得的基音周期軌跡,都與真實(shí)基音軌跡不可能完全吻合?;诖?,筆者采用Praat軟件對基頻進(jìn)行標(biāo)注和測量分析,同時對所得到的曲線做人工調(diào)整,保證曲線的平滑。
圖1 Praat基頻標(biāo)注分析圖
在經(jīng)過抽取和平滑后的音高曲線上平均選取10個采樣點(diǎn),分別測量其基頻數(shù)值。針對同一聲調(diào),用長度平均值(L)做歸一化處理,選取L±20%長度范圍內(nèi)的曲線作為測量對象,以避免基頻時長問題帶來的影響。
圖中圓點(diǎn)表示程序分析出來的該時點(diǎn)的基頻值,如果基頻值較為工整,沒有突起突落的現(xiàn)象,基本可以認(rèn)定分析結(jié)果是正確的;如果有基頻點(diǎn)游離于整體之外,需要特別注意和修改,基頻值提取錯誤通常發(fā)生在基頻段的起始和結(jié)束位置附近,另外如果基頻比較低或者周期性不明確,需要事先對可疑點(diǎn)的基頻值進(jìn)行核查,以保證其誤差在4Hz以內(nèi),同時輔助以窄帶語圖進(jìn)行準(zhǔn)確測量。
直接測量的基頻數(shù)據(jù)有一定的浮動范圍,不符合話者整體發(fā)音的音高特點(diǎn),目前較科學(xué)的方法是結(jié)合趙元任的五度標(biāo)調(diào)法以及聲調(diào)格局的T值計(jì)算公式,把各基頻數(shù)據(jù)歸一化到5度值范圍內(nèi)。在對基頻進(jìn)行曲線平滑過程中發(fā)現(xiàn),除了陰平曲線外的其他幾類曲線都出現(xiàn)斷點(diǎn)區(qū)域,因此以陰平均值作為基準(zhǔn)參考值來形成音高曲線模型較為準(zhǔn)確。
1.2 音高模式曲線擬合
通過數(shù)據(jù)測量以及五度歸一化處理后,所生成的基頻數(shù)據(jù)可以直接通過Excel軟件進(jìn)行多次擬合,以解決極值、拐點(diǎn)以及最小曲率半徑等問題,從而形成平滑的音高模式曲線。通過對音高模式圖直觀的觀察比較,可以很容易地總結(jié)話者的音高水平和特點(diǎn)。除了比較其整體形態(tài)變化外,還可以通過參數(shù)描述等方式來具體比對分析,例如:模式中音高上限值、下限值、陰平均值、各曲線的起始值、曲線上升段和下降段的斜率等。另外需要特別注意的是曲線的“彎頭段”和“降尾段”,考慮到發(fā)音起始點(diǎn)和結(jié)束端穩(wěn)定性問題,在比對分析的時候需要做適當(dāng)修正。
通過選擇不同話者進(jìn)行不同聲調(diào)語料庫的正常與偽裝發(fā)音,分析偽裝前后基頻數(shù)值的變化規(guī)律,并利用各自語料庫擬合出音高模式曲線,利用比較分析音高模式曲線形態(tài)和音高模式參數(shù)的方法,研究分析音高模式曲線形態(tài)的穩(wěn)定性,以及利用音高模式進(jìn)行話者鑒別的可行性。
2.1 實(shí)驗(yàn)語料及設(shè)計(jì)
實(shí)驗(yàn)選擇3男一女四個發(fā)音人,分別針對四個聲調(diào)各100個音節(jié)進(jìn)行正常發(fā)音和電聲偽裝發(fā)音,建立8個各400庫容的語料庫,A、B、C、D、AW、BW、CW、DW。錄音環(huán)境選擇專業(yè)錄音棚,以保證較高的信噪比。
利用前面所述方法分別擬合出8語料庫的音高模式曲線,然后進(jìn)行話者自身和話者間的模式形態(tài)及參數(shù)比較。
2.2 實(shí)驗(yàn)結(jié)果分析
2.2.1 不同話者相同語料內(nèi)容的音高模式比較。圖2為從四個話者正常發(fā)音語料庫中抽取的音高模式曲線。
圖2 四個話者正常發(fā)音音高模式曲線
表1 四個語料庫的音高模式參數(shù)
比較四個模式圖可以看出不同話者的模式曲線有一定的差異。A、C相對于B、D在上聲結(jié)尾處有彎曲,表現(xiàn)出前兩位話者在上聲結(jié)尾處有收音現(xiàn)象;A、C相對于B、D的陽聲與去聲交叉點(diǎn)有明顯差異,前者在4值以上,其中C更高,而后兩者在4值以下,D尤為明顯,表現(xiàn)出他們陽聲的上升速度或去聲的下降速度有差異;另外各個話者陽、上、去四線交叉組成的空白區(qū)形狀也有較明顯差異。上述分析結(jié)果證明話者間的音高模式曲線存在本質(zhì)差異。
2.2.2 偽裝前后基頻數(shù)值分析
使用變聲器分別對四個發(fā)音人變低聲和高聲,測量變聲前后基頻數(shù)值并進(jìn)行統(tǒng)計(jì)分析,統(tǒng)計(jì)標(biāo)準(zhǔn)差均在0.05以下。結(jié)果表明變聲偽裝語音前后基頻值有很強(qiáng)的相關(guān)性,之間存在很強(qiáng)的線性比率關(guān)系,變聲后可以通過倍數(shù)關(guān)系恢復(fù)到原聲水平。
表2 四個話者變聲后基頻數(shù)值變化表
2.2.3 同一話者相同語料偽裝前后的音高模式比較。圖3、圖4分別是從B和BW語料庫分別抽取的音高模式曲線。
圖3 正常音高模式
圖4 偽裝音高模式
兩模式圖雖然存在些許差異,但從整體形態(tài)和各音高模式參數(shù)的比較分析來看,偽裝前后的音高模式未發(fā)生質(zhì)的改變,曲線形狀基本相同,曲線間的相對位置關(guān)系也較為相似,模式中音高上下限(音域)基本都處于6.1-1.7之間,各曲線的起始值基本相同;上聲和去聲結(jié)束端有一定差異,是由于話者發(fā)音時尾音穩(wěn)定性不夠以及測量誤差等原因。兩個模式曲線各方面特征表現(xiàn)一致,說明話者偽裝前后各聲調(diào)發(fā)音的變化規(guī)律相同。因此,利用音高模式進(jìn)行話者鑒別的方法適用于變聲偽裝語音。
漢語作為聲調(diào)語言,對其音高的相關(guān)比對分析,是司法語音檢驗(yàn)過程中實(shí)施話者鑒別工作的重要方面,特別是針對偽裝語音時,漢語音高模式的比較分析更能客觀準(zhǔn)確地體現(xiàn)話者的音高變化規(guī)律。
本文結(jié)合五度標(biāo)調(diào)法和聲調(diào)格局理論,通過Praat和Excel等常規(guī)軟件實(shí)現(xiàn)了話者音高模式的測量和擬合抽取。在對各語料庫變聲前后基頻數(shù)值統(tǒng)計(jì)分析的基礎(chǔ)上,分析得到變聲前后語音基頻存在較強(qiáng)的線性比率關(guān)系,進(jìn)而在變聲前后的曲線形態(tài)和模式參數(shù)等方面分別比較了同一話者相同語料偽裝前后的音高模式。綜合分析實(shí)驗(yàn)結(jié)論,總結(jié)出話者自身音高模式存在著相對穩(wěn)定性,不同話者間存在著明顯的音高模式差異性,可以通過比對音高模式曲線形態(tài)和參數(shù)差異的方法,輔助進(jìn)行電聲偽裝語音的話者鑒別。
1.江太輝.一種改進(jìn)的語音基頻輪廓提取算法[J].五邑大學(xué)學(xué)報(bào)(自然科學(xué)版),2002年6月
2.焦立為.漢語方言聲調(diào)格局的類型學(xué)研究[J].南開語言學(xué)刊,2007年第2期
3.宋蔚巍,杜新宇.三次曲線擬合的一種簡便方法[J].信息技術(shù),2008年6月
4.馮青青.哈爾濱方言聲調(diào)格局的實(shí)驗(yàn)研究[J].遼寧工程技術(shù)大學(xué)學(xué)報(bào)(社會科學(xué)版),2008年5月
5.張桂清,金怡珠,劉紅偉,崔效義.電子偽裝語音的變聲規(guī)律研究[J].證據(jù)科學(xué),2010年10月