馬 英,石小榮, 李海新
摘 要:在語(yǔ)音信號(hào)分析中,只有分析出可表示語(yǔ)音信號(hào)本質(zhì)特征的參數(shù),才有可能利用這些參數(shù)進(jìn)行高效的語(yǔ)音通信、語(yǔ)音合成和語(yǔ)音識(shí)別等處理。因此對(duì)語(yǔ)音信號(hào)采用CEP和LPC譜提取語(yǔ)音信號(hào)基音周期的異同進(jìn)行了研究,并采用Matlab實(shí)現(xiàn)了仿真分析。從中可以看出,LPC譜估計(jì)基音周期的算法運(yùn)算量較大,而CEP 譜算法更直觀,且在少部分情況下基音峰會(huì)變得更突出一些, CEP譜具有更加廣闊的應(yīng)用前景。
關(guān)鍵詞:同態(tài)分析;線性預(yù)測(cè)分析(LPC);基音周期;Matlab
中圖分類號(hào):TP274文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1004-373X(2009)20-150-02
Speech Signal Extraction Method of Pitch Based on CEP and LPC Spectrum
MA Ying,SHI Xiaorong,LI Haixin
(Qinghai Nationality College,Xining,810000,China)
Abstract:In voice signal analysis,by analysing the voice signal substantive characteristics′ parameter,these parameters can be used to carry on high effective processing and voice communication,speech synthesis and speech recognition.Therefore,difference between speech signal extraction of pitch by CEP and speech signal extraction of pitch by LPC spectrum are analysed,and Matlab is used to realize the simulation analysis.LPC spectrum is used toestimate tone cycle's algorithm which has big calculation,but the CEP spectrum algorithm is more direct-viewing,and the tone summit becomes prominent,CEP spectrum has widely application prospect.
Keywords:analysis of same state;LPC;pitch;Matlab
0 引 言
語(yǔ)音信號(hào)的分析,就是提取語(yǔ)音產(chǎn)生模型的各種參數(shù)(語(yǔ)音的特征參數(shù)),應(yīng)用于語(yǔ)音的編碼、識(shí)別和合成等。不論是分析怎樣的參數(shù)以及采用什么分析方法,在按幀進(jìn)行語(yǔ)音分析,提取語(yǔ)音特征參數(shù)前,有一些經(jīng)常使用的、共同的短時(shí)分析技術(shù)必須預(yù)先進(jìn)行,如語(yǔ)音信號(hào)的數(shù)字化、預(yù)加重、加窗和分幀等。經(jīng)過(guò)這些處理,語(yǔ)音信號(hào)就被分割成一幀一幀加過(guò)窗函數(shù)的短時(shí)信號(hào),然后再把每一個(gè)短時(shí)語(yǔ)音幀看成平穩(wěn)的隨機(jī)信號(hào),利用數(shù)字信號(hào)處理技術(shù)提取語(yǔ)音特征參數(shù)。
在進(jìn)行處理時(shí),按幀從數(shù)據(jù)區(qū)中取出數(shù)據(jù),處理完后再取下一幀。最后得到由每一幀參數(shù)組成的語(yǔ)音特征參數(shù)的時(shí)間序列?;糁芷谑钦Z(yǔ)音信號(hào)最重要的參數(shù)之一,它描述了語(yǔ)音激勵(lì)源的一個(gè)重要特征。因?yàn)闈h語(yǔ)言是一種有調(diào)語(yǔ)言,基音的變化模式稱為聲調(diào),它攜帶著非常重要的具有辨意作用的信息,有區(qū)別意義的功能,所以基音周期的提取和估計(jì)對(duì)漢語(yǔ)言更是一個(gè)十分重要的問(wèn)題。
1 同態(tài)分析
1.1 同態(tài)信號(hào)處理的原理
同態(tài)信號(hào)處理也稱為同態(tài)濾波,實(shí)現(xiàn)將卷積關(guān)系和乘積關(guān)系變換為求和關(guān)系的分離處理。將非線性信號(hào)處理變?yōu)榫€性信號(hào)處理的過(guò)程。語(yǔ)音信號(hào)x(n)可視為聲門激勵(lì)信息u(n)及聲道沖擊響應(yīng)h(n)的卷積:x(n)=u(n)*h(n);通過(guò)處理可將語(yǔ)音信號(hào)的聲門激勵(lì)信息及聲道沖擊響應(yīng)信息分離開(kāi)來(lái),從而求得聲道共振特征和基音周期。卷積同態(tài)系統(tǒng)可分為三個(gè)子系統(tǒng)[3]:
第一個(gè)子系統(tǒng)特征系統(tǒng)D*[] 完成將卷積信號(hào)轉(zhuǎn)化為加性信號(hào)的運(yùn)算,對(duì)x(n)=x1(n)硏2(n)進(jìn)行如下處理:
Z[x(n)]=X(z)=X1(z)X2(z)(1)
ln X(z)=ln X1(z)+ln X2(z)=
1(z)+2(z)=(z)(2)
Z-1[(z)]=Z-1[1(z)+2(z)]=
1(n)+2(n)=(n)(3)
第二個(gè)子系統(tǒng)對(duì)加性信號(hào)進(jìn)行所需要的線性處理(滿足線性疊加原理等):
(n)=LTI[(n)]=LTI[1(n)+2(n)]
第三個(gè)子系統(tǒng)是逆特征系統(tǒng)D-1*[],使其恢復(fù)為卷積性信號(hào)。對(duì)(n)=1(n)+2(n)進(jìn)行如下處理:
Z[(n)]=(z)=1(z)+2(z)(4)
exp[(z)]=Y(z)=Y1(z)Y2(z)(5)
y(n)=Z-1[Y1(z)Y2(z)]=y1(n)硑2(n)(6)
1.2 倒譜
設(shè)X(ejω)=|X(ejω)|ejarg[X(ejω)],對(duì)其取對(duì)數(shù)得:
(ejω)=ln|X(ejω)|+j arg[X(ejω)]
(ejω)仍然是復(fù)數(shù),只考慮其實(shí)部。令:
c(n)=IDTFT[ln|X(ejω)|]
c(n)=IDFT[ln|X(k)|]
式中:c(n)是序列x(n)對(duì)數(shù)幅度譜的傅里葉逆變換,稱為倒頻譜,簡(jiǎn)稱為倒譜,有時(shí)也稱為對(duì)數(shù)倒頻譜,其量綱為時(shí)間。c(n)就是要求取得語(yǔ)音信號(hào)倒譜特征[4]。因此,設(shè)信號(hào)為s(n),則其倒譜為:
c(n)=IDFT{ln|DFT[s(n)]|}
1.3 倒譜的作用
倒譜的作用為:
(1) 區(qū)分清/濁音;
(2) 求濁音的基音周期,可以得到濁音的激勵(lì)信號(hào);
(3) 得到聲道沖擊響應(yīng)[5]h(n)。
2 基于LPC系數(shù)的倒譜
由于語(yǔ)音樣點(diǎn)之間存在相關(guān)性,所以可以用過(guò)去的樣點(diǎn)值預(yù)測(cè)現(xiàn)在或未來(lái)的樣點(diǎn)值。這是線性預(yù)測(cè)分析的基本思想。通過(guò)使實(shí)際語(yǔ)音x(n)和線性預(yù)測(cè)結(jié)果x′(n)之間的誤差e(n){e(n)=x(n)- x′(n)} 在某個(gè)準(zhǔn)則下達(dá)到最小值來(lái)決定惟一的一組預(yù)測(cè)系數(shù)ak。這組系數(shù)就能反映語(yǔ)音信號(hào)的特性,可以作為語(yǔ)音信號(hào)特征參數(shù)用于語(yǔ)音編碼、語(yǔ)音合成和語(yǔ)音識(shí)別等應(yīng)用中去。語(yǔ)音信號(hào)的倒譜特征系數(shù)與語(yǔ)音信號(hào)的LPC參數(shù)有密切關(guān)系。LPC系數(shù)是線性預(yù)測(cè)分析的基本參數(shù),它可以表示整個(gè)LPC系統(tǒng)沖激響應(yīng)的復(fù)倒譜。
預(yù)測(cè)誤差e(n)就是激勵(lì)信號(hào)G?u(n),預(yù)測(cè)系數(shù){ak}就是聲道濾波器的系數(shù){dk}。線性預(yù)測(cè)分析可以對(duì)生成模型的增益參數(shù)G和濾波器系數(shù){dk}進(jìn)行直接和高效率的計(jì)算。這樣,結(jié)合清濁音的判斷和基音周期的估計(jì),可得到語(yǔ)音信號(hào)生成模型的全部參數(shù),實(shí)現(xiàn)語(yǔ)音的產(chǎn)生。
3 Matlab仿真及基音周期提取
具體步驟如下:
(1) 打開(kāi)Matlab軟件,在命令窗口中利用wavread函數(shù)打開(kāi)語(yǔ)音信號(hào)的波形文件,得到抽樣頻率fs,n bits的值以及語(yǔ)音信號(hào)的二維圖形。實(shí)驗(yàn)仿真是對(duì)一男聲“沙地”的語(yǔ)音信號(hào)進(jìn)行分析,其采樣頻率為8 kHz[6]。
(2) 對(duì)該語(yǔ)音信號(hào)截取一幀的長(zhǎng)度,幀長(zhǎng)為20 ms。
(3) 定義窗函數(shù),在此選用漢明窗。
(4) 對(duì)截取的一幀語(yǔ)音信號(hào)AMP(見(jiàn)圖1)進(jìn)行加窗處理。
圖1 一幀語(yǔ)音信號(hào)
(5) 對(duì)截取加窗后的一幀語(yǔ)音信號(hào)AMP進(jìn)行CEP和LPC譜分析,觀察波形圖,估計(jì)基音周期。如圖2,圖3所示。
圖2 LPC譜
圖3 CEP譜
4 LPC譜(左)和CEP譜(右)的討論
對(duì)一幀語(yǔ)音信號(hào)做CEP譜和LPC譜都能準(zhǔn)確地分析出語(yǔ)音信號(hào)的基音周期。LPC譜圖波峰位置恰好對(duì)應(yīng)CEP譜圖中的波谷位置;波形基本上關(guān)于橫軸對(duì)稱;LPC譜估計(jì)基音周期,可以采用離開(kāi)原點(diǎn)的第一個(gè)波谷出現(xiàn)的樣值點(diǎn)除以采樣頻率;而用CEP譜圖估計(jì)基音周期,可以采用離開(kāi)原點(diǎn)的第一個(gè)波峰出現(xiàn)的樣點(diǎn)值除以采樣頻率[7]。
但是,在語(yǔ)音信號(hào)分析過(guò)程中窗長(zhǎng)的選擇對(duì)于語(yǔ)音特征參數(shù)的選擇是非常重要的,如果窗長(zhǎng)很大,當(dāng)語(yǔ)音信號(hào)通過(guò)時(shí),反映波紋細(xì)節(jié)的高頻部分被阻礙,短時(shí)能量隨時(shí)間變化很小,不能真實(shí)地反映語(yǔ)音信號(hào)的幅度變化;反之,窗長(zhǎng)太小,短時(shí)能量隨時(shí)間有急劇的變化,不能得到平滑的能量函數(shù),因此應(yīng)該根據(jù)不同的需要選擇合適的窗長(zhǎng),否則提取特征參數(shù)會(huì)產(chǎn)生很大的誤差[8]。
此外,采用LPC譜估計(jì)基音周期的方法,其算法的運(yùn)算量較大,而CEP 譜算法簡(jiǎn)單,概念更直觀,且在少部分情況下基音峰會(huì)變得更突出,基音周期的估計(jì)值更加準(zhǔn)確;在實(shí)際的基音周期檢測(cè)算法中,CEP譜的應(yīng)用更為廣泛,因此基于CEP譜的改進(jìn)算法是進(jìn)一步需要研究的理論。
參考文獻(xiàn)
[1]陳洪立.一種基音周期估計(jì)方法[J].江西通信科技,2004(2):8-10.
[2]王文延,曾慶寧.一種噪聲環(huán)境下的語(yǔ)音端點(diǎn)檢測(cè)方法[J].聲學(xué)技術(shù),2007,26(3):435-441.
[3][美]夸特爾瑞.離散時(shí)間語(yǔ)音信號(hào)處理(原理與應(yīng)用)[M].趙勝輝,譯.北京:電子工業(yè)出版社,2000.
[4]王洪海,劉剛,郭建軍.基于滑動(dòng)倒譜的自動(dòng)語(yǔ)言識(shí)別[J].智能系統(tǒng)學(xué)報(bào),2008(4):336-341.
[5]李躍強(qiáng),孫星明,周天亮.基于復(fù)倒譜變換的數(shù)字音頻水印研究[J].計(jì)算機(jī)工程,2006,32(23):145-148.[6]叢玉良.數(shù)字信號(hào)處理及其Matlab實(shí)現(xiàn)[M].北京:電子工業(yè)出版社,2004.
[7]拉賓納,謝弗.語(yǔ)音信號(hào)數(shù)字處理[M].朱雪龍,譯.北京:科學(xué)出版社,1993.
[8]劉建,鄭方,吳文虎.基于混合幅度差函數(shù)的基音提取算法[J].電子學(xué)報(bào),2006,34(10):1 925-1 928.
[9]周文,侯阿臨.基于自適應(yīng)濾波和小波變換的基音檢測(cè)[J].電聲技術(shù),2006,30(10):41-43.
[10]歐貴文,程新榮,杜劍峰.一種基于時(shí)域的基音周期提取方法[A].第五屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C].1998.