湯霖,黃建中,尹俊勛
(1.江門職業(yè)技術(shù)學(xué)院電子與信息技術(shù)系,廣東江門529090;2.華南理工大學(xué)電子與信息學(xué)院,廣東廣州510641)
在連續(xù)語音識(shí)別系統(tǒng)的研制過程中,人們首先面對(duì)識(shí)別基元的選取問題,對(duì)于漢語來說,一個(gè)自然的選擇就是音節(jié)。目前廣泛使用的HMM模型及其改進(jìn)模型,通過Viterbi解碼或幀同步算法給出狀態(tài)解碼序列,借助語音模型和語法模型給出識(shí)別的句子,它面臨著搜索路徑組合爆炸問題和狀態(tài)解碼序列錯(cuò)配問題,如果能事先進(jìn)行必要的音節(jié)切分,這些問題就迎刃而解。因此,人們不斷進(jìn)行音節(jié)切分實(shí)驗(yàn)[1-6],提出了很多方法。目前的自動(dòng)語音切分方法大致可分成兩類。
第一類是通過求取的穩(wěn)健的音節(jié)切分特征或?qū)嵱玫乃惴▉磉M(jìn)行切分。如張紅等[1]根據(jù)聽覺感知系統(tǒng)對(duì)于動(dòng)態(tài)語音特征的響應(yīng)特點(diǎn),提出了半波差分譜特征。王帆等[2]提出將普通分形維數(shù)擴(kuò)展為多尺度分形維數(shù)作為切分特征。王卓[3]等用高階譜作語音端點(diǎn)特征,在各種噪聲環(huán)境下取得了好的語音端點(diǎn)檢測(cè)效果。還有人用子帶能量映射、小波變換域子帶能量變化等特征作切分實(shí)驗(yàn)。W ilpon[7]和Van Hemert等[8]提出了利用語音信號(hào)幀與幀之間的頻譜變化特點(diǎn)進(jìn)行切分的方法。但此類方法存在邊界劃分不可靠和計(jì)算復(fù)雜度高等問題。Greenberg[9]則提出了利用時(shí)域特征進(jìn)行語音切分的思想,該方法適合于與語言無關(guān)的語音分段,或作為語種辨識(shí)的前端處理,但也存在邊界插入和缺失錯(cuò)誤以及倒置失真的問題。Prasad等[10]提出了一種利用語音信號(hào)的能量來構(gòu)造具有最小相位函數(shù)的語音特征信號(hào),然后通過計(jì)算該信號(hào)的群延遲函數(shù)達(dá)到切分語音音節(jié)的目的的新算法。顧明亮等[11]對(duì)該算法進(jìn)行了改進(jìn),根據(jù)漢語語音特點(diǎn)和統(tǒng)計(jì)自適應(yīng)方法提出了一種新的統(tǒng)計(jì)切分算法。賈磊等[12]提出的檢測(cè)熵變化趨勢(shì)的跳變點(diǎn)檢測(cè)語音分割點(diǎn),取得了較好的語音與非語音的分割效果。在漢語語音切分方法中,人們還提出了基于歸并的音節(jié)切分自動(dòng)機(jī)[4]、基于神經(jīng)網(wǎng)絡(luò)切分算法[13]、模糊切分算法[14]、支持向量機(jī)切分算法[6]等,這些算法對(duì)提高漢語的切分精度進(jìn)行了有益的探索,但計(jì)算的工作量和復(fù)雜性較高。
第二類是利用語言學(xué)知識(shí)進(jìn)行切分,如Rabiner等[15]根據(jù)語言學(xué)中音素的先驗(yàn)知識(shí)進(jìn)行劃分。張文軍等[5]在基于隱馬爾科夫模型的語音切分基礎(chǔ)上,融合了不受噪聲干擾的先驗(yàn)切分模型,提出了基于貝葉斯方法的語音切分方法。
在進(jìn)行普通話水平客觀測(cè)試系統(tǒng)的研究中,因普通話水平測(cè)試的5個(gè)項(xiàng)目里,除了在朗讀項(xiàng)要評(píng)測(cè)語音的流利程度、停連、節(jié)奏等韻律因素外,主要是測(cè)試語音中各音節(jié)的聲、韻、調(diào)的準(zhǔn)確程度,這就需要將測(cè)試中的多音節(jié)字詞項(xiàng)和朗讀項(xiàng)的語音切分成一個(gè)一個(gè)的音節(jié)來進(jìn)行評(píng)測(cè)。音節(jié)切分的準(zhǔn)確程度極大地影響后續(xù)評(píng)測(cè)的準(zhǔn)確率。
在普通話水平評(píng)測(cè)中,由于測(cè)試編排的特點(diǎn),語音文件都有標(biāo)準(zhǔn)文本可以依賴,這給音節(jié)切分提供了先驗(yàn)知識(shí),在充分運(yùn)用這些先驗(yàn)知識(shí)和分析漢語語音結(jié)構(gòu)特點(diǎn)的基礎(chǔ)上,本文提出了一種基于隸屬度的二級(jí)切分算法。實(shí)驗(yàn)結(jié)果表明,該方法的音節(jié)切分準(zhǔn)確率達(dá)98.3%。
傳統(tǒng)的音節(jié)切分采用的特征為短時(shí)能量和過零率以及它們的變種,如能零積和能零比等。這些參數(shù)在信噪比較高時(shí),能取得比較好的性能。但是,在環(huán)境噪聲比較大的情況下,系統(tǒng)性能就急劇下降。通過實(shí)驗(yàn)比較,目前具有較好抗噪性能的特征參數(shù)有基于幀的Teager能量和平滑累計(jì)能量等,下面分別介紹這兩種參數(shù)的計(jì)算。
設(shè)Xw(n)為加窗語音采樣序列,首先對(duì)其進(jìn)行N點(diǎn)短時(shí)傅立葉變換:
然后用頻率的平方值對(duì)功率譜進(jìn)行加權(quán):
最后計(jì)算幀的Teager能量:
其中求和的范圍從250H z到3 750Hz,范圍以外的功率譜值設(shè)為零。從公式中不難發(fā)現(xiàn)Teager能量[16]不僅與信號(hào)的幅度有關(guān),還與相應(yīng)頻率有關(guān)。該方法之所以能夠檢測(cè)出低幅度的摩擦音和爆破音是因?yàn)檫@些發(fā)音能量分布在高頻范圍內(nèi)。
設(shè)信號(hào)為X(i),其平滑累積能量[9]為:
普通話水平客觀評(píng)測(cè)中的音節(jié)切分任務(wù)有兩個(gè):一個(gè)是進(jìn)行多音節(jié)字詞的切分,另一個(gè)是進(jìn)行朗讀語音的切分。由于被切分的語音是對(duì)照文本朗讀的,所以在進(jìn)行切分的過程中,可用已知語音文本的先驗(yàn)知識(shí)來引導(dǎo)切分過程。
多項(xiàng)研究結(jié)果[17-20]表明:人與人之間的平均音節(jié)時(shí)長(zhǎng)變化比較大,但同一人的發(fā)音中,在常規(guī)語速下同一聲母的時(shí)長(zhǎng)比較穩(wěn)定,同時(shí),聲母之間和韻母之間的相對(duì)時(shí)長(zhǎng)基本保持比例關(guān)系等特點(diǎn)。因此,聲韻母時(shí)長(zhǎng)是一個(gè)穩(wěn)定的可提供先驗(yàn)知識(shí)的特征。
3.1.1 普通話聲韻母時(shí)長(zhǎng)統(tǒng)計(jì)
齊士鈐、張家騄等[19]對(duì)雙音節(jié)詞中漢語普通話輔音音長(zhǎng)進(jìn)行了統(tǒng)計(jì)分析,得出如下結(jié)論:1)輔音音長(zhǎng)與送氣狀態(tài)有直接關(guān)系,不送氣塞音最短,送氣塞擦音最長(zhǎng)。各種發(fā)音方式之間有一定的音長(zhǎng)比值。而音長(zhǎng)與發(fā)音部位關(guān)系不大。2)輔音音長(zhǎng)與聲調(diào)、全音節(jié)長(zhǎng)度關(guān)系不大,但送氣塞擦音受后接元音影響,元音開口度大音長(zhǎng)短。3)在連讀中,前后兩音節(jié)中的輔音長(zhǎng)度與所在前后位置無關(guān)。
陳肖霞等[21],對(duì)3個(gè)發(fā)音人的連續(xù)語音進(jìn)行切分標(biāo)注,統(tǒng)計(jì)了語料中的聲母音長(zhǎng)與韻母聲長(zhǎng)。見表1和表2。
表1 聲母的平均時(shí)長(zhǎng)(ms)
表2 韻母的平均時(shí)長(zhǎng)(ms)
在連續(xù)語音中,“的、地、得”和“了”基本上是讀輕聲“de”和“l(fā)e” ,“de”的時(shí)長(zhǎng)平均為 88m s,比從表 1和表2組合出來的要短15m s左右?!發(fā)e”的平均時(shí)長(zhǎng)為72m s,比從表 1和表 2組合出來的要短約83m s左右,因此,在遇到這兩個(gè)輕聲時(shí),采用輕聲時(shí)長(zhǎng)。
3.1.2 參試者的聲韻母時(shí)長(zhǎng)估計(jì)
聲韻母時(shí)長(zhǎng)統(tǒng)計(jì)需要進(jìn)行語音的聲韻切分,但目前的自動(dòng)切分技術(shù)還不完善。因此,只能采用借助前面的統(tǒng)計(jì)結(jié)果,以及普通話水平測(cè)試第一項(xiàng)“單音節(jié)字詞”中的聲韻母時(shí)長(zhǎng)信息,進(jìn)行聲韻母時(shí)長(zhǎng)估計(jì)。
在聲韻切分中,單音節(jié)字詞中的以擦音作為聲母的音節(jié)的自動(dòng)切分最容易也最準(zhǔn)確。因此,以參試者的普通話水平測(cè)試第一項(xiàng)“單音節(jié)字詞”中得到的較少誤讀的s和x的時(shí)長(zhǎng)平均值作為標(biāo)準(zhǔn),按前面的統(tǒng)計(jì)結(jié)果的聲母時(shí)長(zhǎng)比例,就可以得到參試者的聲母時(shí)長(zhǎng)估計(jì)值。
將“單音節(jié)字詞”中的每個(gè)詞的時(shí)長(zhǎng)減去剛得到的聲母時(shí)長(zhǎng)就是該詞的韻母時(shí)長(zhǎng)(不考慮過渡段)。對(duì)各個(gè)韻母時(shí)長(zhǎng)分別求平均就形成了參試者的韻母時(shí)長(zhǎng)估計(jì)值。
具體的統(tǒng)計(jì)方法如下:
1)在“單音節(jié)字詞”語音文件中查找所有s和x所對(duì)應(yīng)的音節(jié),對(duì)這些音節(jié)進(jìn)行聲韻切分,計(jì)算聲母的時(shí)長(zhǎng)平均值L1。
計(jì)算就得到參試者的聲母時(shí)長(zhǎng)估計(jì)值。
3)用每個(gè)音節(jié)的時(shí)長(zhǎng)減去剛得到的對(duì)應(yīng)聲母的時(shí)長(zhǎng)得到該音節(jié)的韻母時(shí)長(zhǎng),對(duì)各個(gè)韻母時(shí)長(zhǎng)分別求平均就形成了參試者的韻母時(shí)長(zhǎng)估計(jì)值。
4)對(duì)于沒出現(xiàn)過的韻母,在表2中查找與該韻母時(shí)長(zhǎng)最接近的出現(xiàn)過的韻母時(shí)長(zhǎng)值替代。
對(duì)由語音端點(diǎn)檢測(cè)得出的語音段進(jìn)行音節(jié)切分,采用兩級(jí)切分:第一級(jí)切分出明顯的語音段,而且確保切分準(zhǔn)確,第二級(jí)再對(duì)第一級(jí)切分出來的語音段進(jìn)行詳細(xì)確定端點(diǎn),必要時(shí)進(jìn)行再切分。
采用的切分特征為從小波變換后的數(shù)據(jù)中提取出的3種平滑累計(jì)能量參數(shù),以及Teager參數(shù)。
對(duì)語音信號(hào)進(jìn)行四級(jí)二進(jìn)小波變換后,重構(gòu)第3級(jí)、第4級(jí)細(xì)節(jié)數(shù)據(jù)和第4級(jí)近似數(shù)據(jù)。按公式(4)求其平滑累計(jì)能量,得到3組曲線,然后以64點(diǎn)為一幀計(jì)算其平均值,再對(duì)其歸一化,得到3種參數(shù) ,分別記為 Ed3(i)、Ed4(i)、Ea4(i)。
3.2.1 第一級(jí)切分
3.2.1.1 語音段中音節(jié)數(shù)的確定
2)考試或者提交機(jī)器人作品??梢宰灾鬟x擇其中的一種考核方式。設(shè)計(jì)制作機(jī)器人作品要求學(xué)生有很好的理論基礎(chǔ),學(xué)生需要獨(dú)立完成設(shè)計(jì)、制作的整個(gè)過程。這種方式注重培養(yǎng)學(xué)生實(shí)際動(dòng)手操作的能力,提升創(chuàng)新思維,同時(shí)可以鍛煉學(xué)生在突發(fā)情況下分析、解決問題的能力。
1)多音節(jié)字詞項(xiàng)的語音段中音節(jié)數(shù)的確定。
在多音節(jié)字詞項(xiàng)的測(cè)試中,每個(gè)詞組之間的無音段時(shí)長(zhǎng)遠(yuǎn)大于詞組內(nèi)的無音段時(shí)長(zhǎng),因此,可以作為詞組之間的分割點(diǎn),也就可以確定語音段與文本的對(duì)應(yīng)關(guān)系。
2)朗讀項(xiàng)的語音段中音節(jié)數(shù)的確定。
首先,由文本文件通過查已經(jīng)經(jīng)單音節(jié)字詞項(xiàng)話者適用過的音節(jié)時(shí)長(zhǎng)表得到文本的總體累計(jì)經(jīng)驗(yàn)時(shí)長(zhǎng)Stw,其中的聲母累計(jì)時(shí)長(zhǎng)Siw和韻母累計(jì)時(shí)長(zhǎng)Sfw=Stw-Siw。統(tǒng)計(jì)語音文件的累計(jì)語音時(shí)長(zhǎng)Stv。從上一節(jié)的分析中,知道每個(gè)人的普通話語音的聲母時(shí)長(zhǎng)基本不隨語境而變化,由此,可計(jì)算語音文件的韻母時(shí)長(zhǎng)Sfv=Stv-Siw。得到語音文件與文本文件的韻母時(shí)長(zhǎng)比:R=Sfv/Sfw。
其次,以文本中的每個(gè)標(biāo)點(diǎn)符號(hào)作為分割點(diǎn),在語音文件中逐段查找時(shí)長(zhǎng)值大于100m s的無音段,按下面方法確定本段文本對(duì)應(yīng)的語音段。
設(shè)目前進(jìn)行文本中的第k段對(duì)應(yīng)語音段的搜索,而語音文件的大語音段(指無音段時(shí)長(zhǎng)大于200m s之間的語音段)已到m段,該段的語音時(shí)長(zhǎng)為Ym。查表得到第k段文本文件的聲母時(shí)長(zhǎng)W ik和韻母時(shí)長(zhǎng)Wfk。求:
則認(rèn)為m到n段語音段對(duì)應(yīng)第k段文本。
接著,從語音文件第m段語音段中的第一小段Vm1開始,設(shè)其時(shí)長(zhǎng)為Sm1,嘗試由第k段文本文件的第一個(gè)音節(jié)Wk1查表得到它的聲母時(shí)長(zhǎng)Sik1和韻母時(shí)長(zhǎng)S fk1。如果,|Sm1-(Sik 1+Sfk1×R)|≤30,就認(rèn)為Vm1與Wk1對(duì)應(yīng),進(jìn)行Vm2段的匹配。否則,在Wk1的基礎(chǔ)上增加音節(jié)Wk2,再判斷|Sm1-[Sik1+Sik 2+(Sfk1+Sfk2)×R]|≤30是否成立,成立就認(rèn)為Vm1與Wk1和Wk2對(duì)應(yīng)。否則,繼續(xù)添加音節(jié)直至條件成立,如果誤差越來越大,就認(rèn)定誤差最小的那個(gè)為對(duì)應(yīng)音節(jié)串。繼續(xù)運(yùn)行到m段中所有小段都匹配完畢,開始m+1段,重復(fù)以上工作,直到第n段匹配結(jié)束,再開始文本文件的第k+1段文本與語音文件的匹配,一直運(yùn)行到語音文件結(jié)尾。
3.2.1.2 第一級(jí)切分
1)如果本段語音對(duì)應(yīng)的音節(jié)數(shù)為1,不必切分,進(jìn)行下一語音段的切分。
2)從Ed3(i)和Ed4(i)曲線中,查找小于Eth1(為域值,本文中設(shè)為 0.005)的區(qū)域,如果有,則認(rèn)為該區(qū)域的起點(diǎn)為音節(jié)的切分點(diǎn),將語音段一分為二,按先驗(yàn)音長(zhǎng)知識(shí)確定前后段語音應(yīng)包含的音節(jié)數(shù)?;氐降?步。
3)從Ed4(i)中檢測(cè)語音段中超過Eth2(為域值,本文中設(shè)為0.1)的孤立段,比較段數(shù)是否與本段語音所對(duì)應(yīng)的音節(jié)數(shù)相同,按先驗(yàn)音長(zhǎng)知識(shí)確定各段在語音段中的位置是否在范圍內(nèi),是則根據(jù)以下原則確定切分點(diǎn):
如果該對(duì)應(yīng)音節(jié)是零聲母、濁輔音聲母或是不送氣塞音聲母,則該音節(jié)的起點(diǎn)為該段曲線前沿的具有大于0.035以上3點(diǎn)差分值的最低點(diǎn),同時(shí)該點(diǎn)也是前一音節(jié)的終點(diǎn)。
否則,取前一段的后沿的具有大于0.035以上3點(diǎn)負(fù)差分值的最低點(diǎn)作為本音節(jié)的起點(diǎn)。同時(shí)也是前一音節(jié)的終點(diǎn)。
處理完所有孤立段,跳第二級(jí)切分繼續(xù)進(jìn)行音節(jié)切分。
如果不存在合格孤立段,用Ed3(i)替換Ed4(i)再執(zhí)行本步驟。
3.2.2 第二級(jí)切分
對(duì)第一級(jí)切分還存在沒切分出來的音節(jié)的語音段,繼續(xù)在本級(jí)進(jìn)行切分。首先采用確定音節(jié)數(shù)時(shí)用的辦法,利用語音時(shí)長(zhǎng)的先驗(yàn)知識(shí)大概確定各音節(jié)的切分點(diǎn),根據(jù)以下原則在該點(diǎn)的±32ms內(nèi)確定本段中音節(jié)的切分點(diǎn)。
如果該音節(jié)是以濁輔音開始,檢測(cè)Ed4(i)中的3點(diǎn)差分大于等于0.035的點(diǎn),其中值最小的點(diǎn)作為音節(jié)切分點(diǎn)。
如果該音節(jié)是以零聲母開始,則檢測(cè)Ea4(i)中的最低點(diǎn)作為音節(jié)切分點(diǎn)。
其他的,則在 teager曲線中,找V 型反轉(zhuǎn)點(diǎn),該點(diǎn)必需為最低點(diǎn)。
從語音數(shù)據(jù)庫中,選擇了5男5女的測(cè)試數(shù)據(jù)作為音節(jié)切分的實(shí)驗(yàn)數(shù)據(jù)。這些數(shù)據(jù)中,沒有漏讀和重讀,總共包含1 000個(gè)單音節(jié)字詞,含1 000個(gè)音節(jié)的多音節(jié)詞語,以及含4 056個(gè)音節(jié)的10篇短文。這些數(shù)據(jù)都進(jìn)行了人工端點(diǎn)確定。對(duì)多音節(jié)詞語和短文也進(jìn)行手工音節(jié)切分。
音節(jié)切分實(shí)驗(yàn)結(jié)果如表3所示,音節(jié)切分正確與否是以系統(tǒng)切分出來的音節(jié)端點(diǎn)與人工確定的音節(jié)端點(diǎn)誤差是否在1幀之內(nèi)為判斷準(zhǔn)則。
表3 音節(jié)切分實(shí)驗(yàn)結(jié)果
從實(shí)驗(yàn)結(jié)果看,本文提出的方法比傳統(tǒng)的基于小波變換域子帶能量的雙域值法音節(jié)切分正確率高6%以上,也比半波差分譜法音節(jié)切分正確率高4%,證明本方法是準(zhǔn)確可靠的。
朗讀項(xiàng)的切分錯(cuò)誤同樣主要出現(xiàn)在輕聲音節(jié)的尾端點(diǎn)上,因其輕短,與后面音節(jié)的過渡段比較長(zhǎng),其尾端點(diǎn)切分困難。還有前音節(jié)是非鼻韻尾,而后一音節(jié)以零聲母開始或元音開始的情況,也比較難切分。
在充分利用文本信息和語音時(shí)長(zhǎng)信息,以及利用改進(jìn)了的語音小波變換后的幾個(gè)分量的累計(jì)能量等特征的基礎(chǔ)上,提出使用話者語音統(tǒng)計(jì)信息進(jìn)行音節(jié)切分的算法,該算法使音節(jié)切分精度最少達(dá)98.3%。
在利用文本信息進(jìn)行語音段音節(jié)數(shù)確定時(shí),如果遇到朗讀出現(xiàn)漏讀和重讀時(shí),將會(huì)出現(xiàn)系統(tǒng)性錯(cuò)誤,在后續(xù)的研究中要重點(diǎn)加以研究。
[1] 張紅,黃泰翼,李治.基于半波差分譜的語音信號(hào)音節(jié)切分[J].聲學(xué)學(xué)報(bào)(中文版),2000,25(4):323-328.
[2] 王帆,鄭方,吳文虎.基于多尺度分形維數(shù)的漢語語音聲韻切分[J].清華大學(xué)學(xué)報(bào)(自然科學(xué)版),2002,42(1):68-71.
[3] 王卓,蘇牧,李鵬,等.噪聲環(huán)境下基于高階譜的端點(diǎn)檢測(cè)算法[J].中文信息學(xué)報(bào),2004,18(5):70-77.
[4] 張繼勇,鄭方,杜術(shù),等.連續(xù)漢語語音識(shí)別中基于歸并的音節(jié)切分自動(dòng)機(jī)[J].軟件學(xué)報(bào),1999,10(11):1212-1215.
[5] 張文軍,謝劍英,李聰.基于貝葉斯方法的魯棒語音切分[J].數(shù)據(jù)采集與處理,2002,17(3):260-264.
[6] 齊峰巖,鮑長(zhǎng)春.一種基于支持向量機(jī)的含噪語音的清/濁/靜音分類的新方法[J].電子學(xué)報(bào),2006,34(4):605-611.
[7] W ilpon J.G.;Juang B.H.;Rabiner L.R.An investigation on the use ofacoustic sub-w ord units for automatic speech recognition[C]//Proc.of IEEE Internat.Conf.on A coustic,Speech,and Signal Processing.1987:821-824.
[8] Van Hernert J.P.Automatic segmentation of speech[J].IEEE Trans.Signal Process,1991,39(4):1008-1012.
[9] G reenberg S.Speaking in short hand:asy llable-centric perspective for under standing pronunciation variation[J].Speech Communication,1999,29(2):159-176.
[10] Prasad V.K.;Nagarajan T.;Murthy H.A.Automatic segmentation of continuous speech using m inimum phase group delay functions[J].Speech Communication,2004,42(3-4):429.
[11] 顧明亮,代春倩.一種新的漢語連續(xù)語音統(tǒng)計(jì)切分算法[J].徐州師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2005,23(4):45-49.
[12] 賈磊,穆向禺,徐波.廣播語音的音頻分割[J].中文信息學(xué)報(bào),2002,16(1):37-42.
[13] 胡瑞敏,薛東輝,姚天任,等.BP人工神經(jīng)元網(wǎng)絡(luò)與漢語語音的音節(jié)切分[J].華中理工大學(xué)學(xué)報(bào),1996,24(S2):25.
[14] 劉宇紅,劉橋,任強(qiáng).基于改進(jìn)的模糊ART的語音信號(hào)端點(diǎn)檢測(cè)與切分[J].系統(tǒng)工程與電子技術(shù),2004,26(8):147.
[15] Rabiner L.R.;Rosenberg A.E.;W ilpon J.G.,et al.A bootstrapping training technique for obtaining dem isy llab le reference patterns[J].J.Acoustic Soc.Amer.,1982,71(6):1588-1595.
[16] Ying G.S.;M itchell C.D.;Jam ieson L.H.Endpoint Detection of Isolated U tterances Based on a Modified Teager Energy Measurement[C]//Proc.ICASSP,1992:732-735.
[17] 馮隆.北京話語流中聲韻調(diào)的時(shí)長(zhǎng)[M].北京語音實(shí)驗(yàn)錄,北京:北京大學(xué)出版社,1985.
[18] 馬大猷,沈豪,等.聲學(xué)手冊(cè)[M].北京:科學(xué)出版社,1983.
[19] 齊士鈐,張家騄.漢語普通話輔音音長(zhǎng)分析[J].聲學(xué)學(xué)報(bào),1982,7(1):5.
[20] 吳宗濟(jì),曹劍芬.普通話輔音聲學(xué)特征的幾個(gè)問題[C]//1979第二屆全國(guó)聲學(xué)學(xué)術(shù)會(huì)議論文摘要.
[21] 陳肖霞,祖漪清.基于連續(xù)話語語料庫的語音音段的初步統(tǒng)計(jì)分析[R].語音研究報(bào)告,1998.