国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

電聲偽裝語音的音高模式比對研究

2012-04-24 10:37:57張紅兵
關(guān)鍵詞:變聲基頻聲調(diào)

張紅兵

(中國刑警學(xué)院 遼寧 沈陽 110035)

電聲偽裝語音的音高模式比對研究

張紅兵

(中國刑警學(xué)院 遼寧 沈陽 110035)

偽裝語音是司法語音檢驗(yàn)領(lǐng)域常見的檢材形式,給話者鑒別帶來諸多困難。本文針對電聲偽裝語音,通過圖譜和數(shù)據(jù)分析的方法得出多個語音庫變聲前后的基頻變化規(guī)律,結(jié)果表明變聲前后的基頻存在著線性關(guān)系,可借助漢語音高模式比對的方法實(shí)現(xiàn)電聲偽裝語音的話者鑒別。

偽裝語音 音高模式 歸一化 話者鑒別

基頻作為語音檢驗(yàn)領(lǐng)域最為重要的聲學(xué)特征之一,在話者鑒別工作中有著不可或缺的應(yīng)用價值。漢語是聲調(diào)語言,聲調(diào)是具有區(qū)別意義的音高變化,音高的不同不會引起聲調(diào)的變化,音高變化的不同才會引起聲調(diào)的變化。由于不同人的音域不同,并且在具體的司法語音檢驗(yàn)過程中,由于檢材的易偽裝性以及所附帶的信道信息、話音提取方式等因素不同,話者基頻極易發(fā)生某種程度上的變異,從而否定了基頻數(shù)據(jù)的可比性。其中偽裝語音作為司法語音檢驗(yàn)領(lǐng)域常見的檢材形式,對其進(jìn)行話者鑒別尤為困難,電聲偽裝是目前比較典型的個性化語音偽裝方式之一。

通過變聲軟硬件技術(shù)對說話人的自然語音進(jìn)行個性化偽裝,導(dǎo)致一般的受話者很難識別發(fā)音人的身份、年齡甚至性別,嚴(yán)重影響了司法語音檢驗(yàn)的鑒定效果,給司法鑒定工作帶來很大麻煩。本文針對電聲偽裝方式,重點(diǎn)研究變聲前后語音特征的變化規(guī)律,根據(jù)這一聲學(xué)特征變化規(guī)律,并結(jié)合漢語音高模式理論,深入分析話者變聲前后基頻數(shù)值變化的規(guī)律性,進(jìn)而比對兩者音高模式曲線是否存在差異。通過比對音高模式為此類語音的話者鑒別提供科學(xué)有效的方法。

1 漢語音高模式

普通話中的音高變化不同,形成了普通話的四個聲調(diào),漢語的音高變化承載了豐富的語音、語言學(xué)信息,這些復(fù)雜的變化,也反應(yīng)了說話人的音高特點(diǎn)。一般用調(diào)形和調(diào)值來描寫漢語聲調(diào),調(diào)形是聲帶顫動時基頻變化形態(tài)的反映,從聲調(diào)的最低音到最高音是基頻的變化范圍,即聲調(diào)調(diào)域。漢語音高的變化存在著諸多的內(nèi)部差異,為了分析其各種個性特征,有必要對音高變化做詳細(xì)的分解,這樣才能得出個體聲調(diào)的具體差異。

話者基頻由于偽裝發(fā)生某種程度上的變異,從而否定了基頻數(shù)據(jù)的可比性。針對上述問題,對于話者音高特點(diǎn)的比較,研究者曾經(jīng)提出聲調(diào)格局的理論,即通過測量不同測量點(diǎn)的基頻數(shù)據(jù),進(jìn)行歸一和相對分析,用曲線表征話者四種聲調(diào)的變化格局,從而在一定程度上避免了外界因素對基頻的干擾。

1.1 基頻獲取與處理

目前關(guān)于基頻提取的方式方法有很多,個別采用簡單地直接選取音節(jié)區(qū)域求平均值,或者測量某次諧波頻率值,再除以諧波數(shù)后作數(shù)據(jù)分析;要么是利用復(fù)雜的算法提取基頻,并考慮抗噪性等諸多因素。前者操作雖然簡單,但測量誤差較大,對于基頻比較意義不大;后者提取精度較高,但需要復(fù)雜的算法運(yùn)算以及后期大量的數(shù)據(jù)處理,況且無論采用哪一種算法所求得的基音周期軌跡,都與真實(shí)基音軌跡不可能完全吻合?;诖?,筆者采用Praat軟件對基頻進(jìn)行標(biāo)注和測量分析,同時對所得到的曲線做人工調(diào)整,保證曲線的平滑。

圖1 Praat基頻標(biāo)注分析圖

在經(jīng)過抽取和平滑后的音高曲線上平均選取10個采樣點(diǎn),分別測量其基頻數(shù)值。針對同一聲調(diào),用長度平均值(L)做歸一化處理,選取L±20%長度范圍內(nèi)的曲線作為測量對象,以避免基頻時長問題帶來的影響。

圖中圓點(diǎn)表示程序分析出來的該時點(diǎn)的基頻值,如果基頻值較為工整,沒有突起突落的現(xiàn)象,基本可以認(rèn)定分析結(jié)果是正確的;如果有基頻點(diǎn)游離于整體之外,需要特別注意和修改,基頻值提取錯誤通常發(fā)生在基頻段的起始和結(jié)束位置附近,另外如果基頻比較低或者周期性不明確,需要事先對可疑點(diǎn)的基頻值進(jìn)行核查,以保證其誤差在4Hz以內(nèi),同時輔助以窄帶語圖進(jìn)行準(zhǔn)確測量。

直接測量的基頻數(shù)據(jù)有一定的浮動范圍,不符合話者整體發(fā)音的音高特點(diǎn),目前較科學(xué)的方法是結(jié)合趙元任的五度標(biāo)調(diào)法以及聲調(diào)格局的T值計(jì)算公式,把各基頻數(shù)據(jù)歸一化到5度值范圍內(nèi)。在對基頻進(jìn)行曲線平滑過程中發(fā)現(xiàn),除了陰平曲線外的其他幾類曲線都出現(xiàn)斷點(diǎn)區(qū)域,因此以陰平均值作為基準(zhǔn)參考值來形成音高曲線模型較為準(zhǔn)確。

1.2 音高模式曲線擬合

通過數(shù)據(jù)測量以及五度歸一化處理后,所生成的基頻數(shù)據(jù)可以直接通過Excel軟件進(jìn)行多次擬合,以解決極值、拐點(diǎn)以及最小曲率半徑等問題,從而形成平滑的音高模式曲線。通過對音高模式圖直觀的觀察比較,可以很容易地總結(jié)話者的音高水平和特點(diǎn)。除了比較其整體形態(tài)變化外,還可以通過參數(shù)描述等方式來具體比對分析,例如:模式中音高上限值、下限值、陰平均值、各曲線的起始值、曲線上升段和下降段的斜率等。另外需要特別注意的是曲線的“彎頭段”和“降尾段”,考慮到發(fā)音起始點(diǎn)和結(jié)束端穩(wěn)定性問題,在比對分析的時候需要做適當(dāng)修正。

2 實(shí)驗(yàn)及其分析

通過選擇不同話者進(jìn)行不同聲調(diào)語料庫的正常與偽裝發(fā)音,分析偽裝前后基頻數(shù)值的變化規(guī)律,并利用各自語料庫擬合出音高模式曲線,利用比較分析音高模式曲線形態(tài)和音高模式參數(shù)的方法,研究分析音高模式曲線形態(tài)的穩(wěn)定性,以及利用音高模式進(jìn)行話者鑒別的可行性。

2.1 實(shí)驗(yàn)語料及設(shè)計(jì)

實(shí)驗(yàn)選擇3男一女四個發(fā)音人,分別針對四個聲調(diào)各100個音節(jié)進(jìn)行正常發(fā)音和電聲偽裝發(fā)音,建立8個各400庫容的語料庫,A、B、C、D、AW、BW、CW、DW。錄音環(huán)境選擇專業(yè)錄音棚,以保證較高的信噪比。

利用前面所述方法分別擬合出8語料庫的音高模式曲線,然后進(jìn)行話者自身和話者間的模式形態(tài)及參數(shù)比較。

2.2 實(shí)驗(yàn)結(jié)果分析

2.2.1 不同話者相同語料內(nèi)容的音高模式比較。圖2為從四個話者正常發(fā)音語料庫中抽取的音高模式曲線。

圖2 四個話者正常發(fā)音音高模式曲線

表1 四個語料庫的音高模式參數(shù)

比較四個模式圖可以看出不同話者的模式曲線有一定的差異。A、C相對于B、D在上聲結(jié)尾處有彎曲,表現(xiàn)出前兩位話者在上聲結(jié)尾處有收音現(xiàn)象;A、C相對于B、D的陽聲與去聲交叉點(diǎn)有明顯差異,前者在4值以上,其中C更高,而后兩者在4值以下,D尤為明顯,表現(xiàn)出他們陽聲的上升速度或去聲的下降速度有差異;另外各個話者陽、上、去四線交叉組成的空白區(qū)形狀也有較明顯差異。上述分析結(jié)果證明話者間的音高模式曲線存在本質(zhì)差異。

2.2.2 偽裝前后基頻數(shù)值分析

使用變聲器分別對四個發(fā)音人變低聲和高聲,測量變聲前后基頻數(shù)值并進(jìn)行統(tǒng)計(jì)分析,統(tǒng)計(jì)標(biāo)準(zhǔn)差均在0.05以下。結(jié)果表明變聲偽裝語音前后基頻值有很強(qiáng)的相關(guān)性,之間存在很強(qiáng)的線性比率關(guān)系,變聲后可以通過倍數(shù)關(guān)系恢復(fù)到原聲水平。

表2 四個話者變聲后基頻數(shù)值變化表

2.2.3 同一話者相同語料偽裝前后的音高模式比較。圖3、圖4分別是從B和BW語料庫分別抽取的音高模式曲線。

圖3 正常音高模式

圖4 偽裝音高模式

兩模式圖雖然存在些許差異,但從整體形態(tài)和各音高模式參數(shù)的比較分析來看,偽裝前后的音高模式未發(fā)生質(zhì)的改變,曲線形狀基本相同,曲線間的相對位置關(guān)系也較為相似,模式中音高上下限(音域)基本都處于6.1-1.7之間,各曲線的起始值基本相同;上聲和去聲結(jié)束端有一定差異,是由于話者發(fā)音時尾音穩(wěn)定性不夠以及測量誤差等原因。兩個模式曲線各方面特征表現(xiàn)一致,說明話者偽裝前后各聲調(diào)發(fā)音的變化規(guī)律相同。因此,利用音高模式進(jìn)行話者鑒別的方法適用于變聲偽裝語音。

3 結(jié)論

漢語作為聲調(diào)語言,對其音高的相關(guān)比對分析,是司法語音檢驗(yàn)過程中實(shí)施話者鑒別工作的重要方面,特別是針對偽裝語音時,漢語音高模式的比較分析更能客觀準(zhǔn)確地體現(xiàn)話者的音高變化規(guī)律。

本文結(jié)合五度標(biāo)調(diào)法和聲調(diào)格局理論,通過Praat和Excel等常規(guī)軟件實(shí)現(xiàn)了話者音高模式的測量和擬合抽取。在對各語料庫變聲前后基頻數(shù)值統(tǒng)計(jì)分析的基礎(chǔ)上,分析得到變聲前后語音基頻存在較強(qiáng)的線性比率關(guān)系,進(jìn)而在變聲前后的曲線形態(tài)和模式參數(shù)等方面分別比較了同一話者相同語料偽裝前后的音高模式。綜合分析實(shí)驗(yàn)結(jié)論,總結(jié)出話者自身音高模式存在著相對穩(wěn)定性,不同話者間存在著明顯的音高模式差異性,可以通過比對音高模式曲線形態(tài)和參數(shù)差異的方法,輔助進(jìn)行電聲偽裝語音的話者鑒別。

1.江太輝.一種改進(jìn)的語音基頻輪廓提取算法[J].五邑大學(xué)學(xué)報(bào)(自然科學(xué)版),2002年6月

2.焦立為.漢語方言聲調(diào)格局的類型學(xué)研究[J].南開語言學(xué)刊,2007年第2期

3.宋蔚巍,杜新宇.三次曲線擬合的一種簡便方法[J].信息技術(shù),2008年6月

4.馮青青.哈爾濱方言聲調(diào)格局的實(shí)驗(yàn)研究[J].遼寧工程技術(shù)大學(xué)學(xué)報(bào)(社會科學(xué)版),2008年5月

5.張桂清,金怡珠,劉紅偉,崔效義.電子偽裝語音的變聲規(guī)律研究[J].證據(jù)科學(xué),2010年10月

猜你喜歡
變聲基頻聲調(diào)
融合CNN和Transformer編碼器的變聲語音鑒別與還原
語音同一認(rèn)定中音段長度對基頻分析的影響
聲調(diào)符號位置歌
基于時域的基頻感知語音分離方法?
聲調(diào)歌
橋面鋪裝層對中小跨徑橋梁基頻影響分析
木星地
江南詩(2020年3期)2020-06-08 10:20:40
坐著轎車學(xué)聲調(diào)
單韻母扛聲調(diào)
基于深度學(xué)習(xí)算法的真人變聲設(shè)備的設(shè)計(jì)與實(shí)現(xiàn)
電子制作(2019年15期)2019-08-27 01:11:58
竹溪县| 洛隆县| 达尔| 赤城县| 东乡| 平远县| 彭水| 惠来县| 沙湾县| 七台河市| 东明县| 紫阳县| 吉木萨尔县| 罗平县| 阿克苏市| 罗源县| 长泰县| 正镶白旗| 固安县| 扎囊县| 恩平市| 通榆县| 高清| 色达县| 卢氏县| 古交市| 万州区| 徐汇区| 拉孜县| 长兴县| 安康市| 当涂县| 什邡市| 沽源县| 威海市| 哈巴河县| 二连浩特市| 梁山县| 安仁县| 临邑县| 莱西市|