国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

一種HMM的藏語安多方言文本分析方法

2021-07-24 14:00
新一代信息技術 2021年3期
關鍵詞:安多藏語韻母

蘇 麗

(山東外事職業(yè)大學,山東 威海 264504)

0 引言

藏族是我國少數(shù)民族之一,藏語是一門古老的語言,分為安多方言、拉薩方言、康方言。其中,安多方言是保留藏語古面貌較多的方言,有其特殊的語言現(xiàn)象。藏族豐富的古籍著作文化僅次于漢族,漢語和藏語同屬于漢藏語系,如果能夠借助語言技術分析研究安多方言,可促進漢藏語言的交流,對保護藏族文化,推動藏族科技、經(jīng)濟、社會、文化的發(fā)展具有重要意義。

目前,安多方言主要從語言學進行研究,例如,安多語料的設計;安多方言音調習得的研究[2];安多方言農(nóng)區(qū)話的研究[3];安多尖扎話的音位的研究[4]等。但是,從工程語言的角度對藏語安多方言進行建模分析的研究比較欠缺。

將目前語音合成的[5-9]發(fā)展技術運用于藏語的合成中,加快藏族的快速發(fā)展。

1 基于HMM的藏語安多方言的合成原理

將文本信息通過計算機轉換成自然流暢的語音是語音合成的基本原理。語音合成包括三個系統(tǒng)模塊,即文本分析、韻律預測和語音合成。文本分析是將文本進行預處理、規(guī)范語法信息;韻律預測是控制語音的重音、時長等信息。HMM語音合成的框架圖如圖1所示。

圖1 HMM 語音合成的框架圖Fig.1 Framework of HMM speech synthesis

基于隱馬爾可夫模型(Hidden Markov Model,HMM)的語音合成系統(tǒng)的設計中,通過對藏語安多方言文本進行文本分析,得到安多方言文本的單因素(聲韻母)標注信息和上下文標注信息;在合成階段將單因素標注信息、上下文標注信息進行轉換合成輸出語音。單因素標注是提取藏語安多方言的聲韻母信息;上下文標注主要標注了每個基元上下文的相關信息,主要指其位置信息。我們的研究思路是:通過對藏語安多方言文本的字丁分解和拉丁轉型[10]的優(yōu)化,實現(xiàn)其聲韻母的分離(如圖2所示),從而獲得藏語安多方言文本的聲韻母信息;再通過藏語安多方言書寫的特殊分隔符,得到詞、短語、句子的分割信息;最后通過設計標注信息算法生成標注信息,提供語音合成的必要參數(shù)。如圖3所示,此過程主要包括訓練和合成兩個階段[11-17]。

圖2 SAMP A-ADT轉換流程圖Fig.2 Flow chart of SAMPA-ADT conversion

圖3 基于HMM的統(tǒng)計參數(shù)語音合成原理圖Fig.3 Schematic diagram of statistical parameter speech synthesis based on HMM

2 安多方言文本分析

2.1 安多方言的SAMPA分析

國際通用的機讀音標 SAMPA(Speech Assessment Methods Phonetic Alphabet),可表示音標所有符號,藏語和漢語屬于漢藏語系,根據(jù)漢語音標,標注安多方言音標。

根據(jù)漢語國際音標 SAMPA-SC[18](Speech Assessment Methods Phonetic Alphabet for standard-Chinese),設計安多出音標 SAMPA-ADT(Ando dialect Tibetan)漢語和藏語中部分語法相同[19]。音標一致時直接轉寫,不一致時利用鍵盤上已有的符號,設計安多方言的SAMPA-ADT進行標記。其流程圖如4所示。

圖4 SAMP A轉寫規(guī)則Fig.4 The rules of SAMPA's transliteration

2.1.1 聲母的SAMPA-ADT設計

藏語安多方言中,聲母有55個,包括27個單輔音與28個復輔音,其中有19個單輔音與漢語音標相同,有7個單輔音與28個復輔音與漢語國際音標不同。

聲母SAMPA-ADT的設計如下:(1)漢語國際音標可直接用ASCII字符表示。安多方言聲母的SAMPA-ADT機讀音標與漢語國際音標一致的可直接進行表示,輔音聲母 b、x、g、z、d、dz在SAMPA-ADT中與國際音標字母相同,其對應的機讀音標 SAMPA-ADT 分別標記為/b/、/x/、/g/、/z/、/d/、/dz/;(2)其他藏語安多方言音標,在漢語國際音標的基礎上用鍵盤上其它符號表示與其關聯(lián)的 SAMPA-ADT;(3)送氣與不送氣的發(fā)音效果不同,為區(qū)別這一特征,定義了送氣符號。例如,/sh/所定義的具體機讀音標 SAMPA-ADT則標記為/s_h/。

2.1.2 韻母SAMPA-ADT的設計

安多方言中共有35個韻母,其中包含6個單元音韻母/a/、/o/、/i/、/u/、/?/、/e/,3 個復元音韻母/ao/、/ai/、/eo/ 以及26個帶輔音韻尾的韻母。元音中帶韻尾的韻母分別為/e/、/o/、/a/、/?/與韻尾 l、p、?、m、n、r相結合所形成,而/u/、/i/這兩個元音與任何韻尾都不能相結合。

安多方言中除/o/、/a/、/e/、/i/、/u/這 5 個可直接輸入,/?/SAMPA-ADT設計為“^”我們分兩步設計元音和帶輔音韻尾的韻母。安多方言韻母的設計方式與拉薩方言的基本一致。

綜上可知,國內外學者對人力資本與企業(yè)價值關系的研究大多采用單一維度的時間序列數(shù)據(jù)或截面數(shù)據(jù),聚焦于具體的行業(yè)或企業(yè)進行分析。由此,本文針對商業(yè)銀行這一特殊金融服務行業(yè),采用包含時間序列與截面兩個維度的面板數(shù)據(jù)進行建模分析。

2.2 文本分析

文本分析模塊是對輸入的文本信息進行處理,使其成為計算機可理解的語言,其主要工作是對文本規(guī)范化處理。分析文本中的詞邊界、句子邊界信息,是將文本或文字中約定俗成的書寫形式,轉化成標準書寫形式,確定其正確讀音。因此,通過語法規(guī)范知識庫對文本進行規(guī)范化處理,可轉換成為標準書寫格式,如濾除系統(tǒng)不能識別的字符,全角轉換成半角,檢查字符的規(guī)范性等。

2.3 韻律處理

韻律處理主要是對句子的重音、時長、停頓、語調以及韻律結構的處理。對語音韻律的時長、基頻、普參數(shù)等信息進行處理,可確定經(jīng)文本分析后語句的輕重音、停頓以及具體發(fā)音,將每個特征參數(shù)存儲形成語音庫。

2.4 上下文相關標注格式設計

基于HMM的語音合成系統(tǒng)中,需準備訓練的標注文件。文本標注是將語言環(huán)境的信息符號化處理,主要是不同位置音節(jié)的重音、時長等語境信息,利用文本分析程序自動生成標注文件,需對上下文標注格式進行設計。我們選取安多方言的所有聲韻母為合成基元。設計安多方言的上下文標注格式。共6層,分別是聲韻母層、音節(jié)層、字層、詞層、短語層和語句層。各層描述分別如下:

聲韻母層:描述當前聲韻母、前一聲韻母、后一聲韻母的信息。

音節(jié)層:描述當前音節(jié)、前一音節(jié)、后一音節(jié)的信息及音節(jié)的位置。

字層:描述當前字、前一字、后一字的信息及字在詞、詞組中的位置。

詞層:當前詞、前一詞、后一詞的信息、詞的個數(shù);當前詞組中詞的位置。

短語層:描述當前短語、前一短語、后一短語的信息及聲調信息。

將各層描述的信息用符號表示,用程序識別,如表1所示。

標注中還涉及停頓和靜音的相關標注。表 2是對停頓和靜音的表示。

標注的文本分析程序,自動生成單因素標注文件和上下文相關的標注文件。HTS訓練合成過程中,mono.lab(單因素的標注文件)及 full.lab(上下文相關的標注文件),與wav(音頻)文件是相對應的。單因素文件是文本語料所包含的所有音素信息,上下文相關的標注文件是各層級的相關語境信息。圖5和圖6分別是mono.lab文件和full.lab文件的部分示例。

表1 上下文的相關標注格式Tab.1 Context-r elated annotation formats

表2 停頓和靜音符號表Tab.2 Symbol table of pause and mute

圖5 m ono.lab(單音素標注文件)部分示例Fig.5 Some examples of mono.lab(monophone labeling file)

圖6 full.lab(上下文相關的標注文件)部分示例Fig.6 Some examples of full.lab(context-related annotation labeling file)

由圖5可得,單因素的標注文件中,記錄了每句中的聲韻母信息,其中sil為靜音段,pau為句中停頓。圖6得出fuii.lab文件中記錄了音節(jié)、詞、短語句子上下文相關信息。

3 合成語音測評

我們采用合成語音的 MOS(Mean Opinion Score)評估法對合成安多方言的自然度進行了測評,利用 DMOS(Degradation Mean Opinion Score)評估法對合成安多方言的的相似度進行測評。測評者對每個語句的語音質量按5分制打分,其評測標準及測評結果分別如表3及圖7、圖8所示。

圖7為MOS評分的測評結果中,隨著訓練語句的增加得分都明顯提高。30句 MOS得分 1.8分,100句MOS得分3.2分,300句是3.8分,500句是 3.9分,對比可知自然度明顯提升,總的來說合成的語音自然度較高。由實驗可以說明隨著訓練語句的增加,合成效果越來越好。

表3 MOS測評等級Tab.3 MOS evaluation level

圖7 MOS評測等級Fig.7 MOS evaluation level

圖8 DMOS評測等級Fig.8 DMOS evaluation level

從圖8中DMOS評測結果可以看出,訓練語句為30句得分是2.3分,100句時得分3.4分,300句評分4.1稍微比500評分4.0高一些。我們可以得到結論,隨著訓練語句的增加,語音的相似度增加,語音合成效果優(yōu)良。

4 結論

本文總結了藏語安多方言的聲韻母特性,設計了安多方言的機讀音標(SAMPA-ADT),設計出安多方言文本分析的標注文件。進一步地,分別采用MOS和DMOS評估法對合成語音的自然度和相似度進行了測評,測評結果表明,語音合成效果優(yōu)良。實現(xiàn)了藏語安多方言文本分析的研究,能夠很好合成藏語安多方言。

猜你喜歡
安多藏語韻母
聲母韻母
安多“南木特”藏戲研究文獻綜述
淺談藏語中的禮儀語
一個精神行者的感知和領悟——關于梅卓散文集《走馬安多》的一種解讀
單韻母扛聲調
淺析青海安多藏語影視譯制網(wǎng)系統(tǒng)
安多藏戲表演的審美特征及其傳承
《湘水韻》及其編撰原理要點
藏語拉達克話的幾個語音特征
藏語地理分布格局的形成原因