周丹
摘 要:掌上氣象客戶端智能語音播報系統(tǒng)依托TTS技術(shù),在手機(jī)上實現(xiàn)語音播報天氣信息的功能。TTS技術(shù),又稱文語轉(zhuǎn)換技術(shù),它將計算機(jī)、手機(jī)自己產(chǎn)生的、或外部輸入的文字信息轉(zhuǎn)變?yōu)榭梢月牭枚?、流利的漢語口語輸出的技術(shù)。
關(guān)鍵詞:TTS 語音合成 智能播報
中圖分類號:TN912.3文獻(xiàn)標(biāo)識碼:A文章編號:1003-9082(2020)06-000-01
引言
TTS技術(shù)關(guān)鍵的就是韻律控制、符號數(shù)字、多音字、構(gòu)詞方面有較多的問題,需要不斷研究,使得語音合成的自然化程度提高。掌上氣象客戶端智能語音播報系統(tǒng)使用語音合成技術(shù)(TTS),來進(jìn)行天氣情況的智能播報。
一、TTS技術(shù)簡介
TTS是語音合成應(yīng)用的一種,使計算機(jī)、手機(jī)等設(shè)備,具有類似于人一樣的說話能力,是當(dāng)今時代信息產(chǎn)業(yè)的重要競爭技術(shù)。TTS是Text To Speech的縮寫,即“從文本到語音” [1]。語音合成,又稱文語轉(zhuǎn)換,目的是讓設(shè)備說話。文語轉(zhuǎn)換過程是先將文字序列轉(zhuǎn)換成音韻序列,再由系統(tǒng)根據(jù)音韻序列生成語音波形。如:將文本文件內(nèi)容等文字信息按語音處理規(guī)則轉(zhuǎn)換成語音信號輸出, 使設(shè)備流利地讀出文字信息, 使人們通過“聽”就可以知曉信息的內(nèi)容。
TTS技術(shù)對文本文件進(jìn)行實時轉(zhuǎn)換,轉(zhuǎn)換時間之短可以秒計算。在其特有智能語音控制器作用下,文本輸出的語音音律流暢,使得聽者在聽取信息時感覺自然,毫無機(jī)器語音輸出的冷漠與生澀感。
二、掌上氣象客戶端文語轉(zhuǎn)換系統(tǒng)
文本分析、韻律控制和語音合成這三個模塊是文語轉(zhuǎn)換系統(tǒng)的三個核心部分[2]。其結(jié)構(gòu)如下圖所示(如:圖示1)
(圖示1)
1.文本及文本分析
語音播放的文本由掌上氣象客戶端對所接收到的天氣信源,進(jìn)行拼接處理后生成。
對輸入文本進(jìn)行語言學(xué)分析,逐句進(jìn)行詞匯的、語法的和語義的分析,以確定句子的低層結(jié)構(gòu)和每個字的音素的組成。
2.韻律控制
合成音質(zhì)(Qualityof Synthetic Speech)是指語音合成系統(tǒng)所輸出的語音的質(zhì)量,一般從清晰度(或可懂度)、自然度和連貫性等方面進(jìn)行主觀評價。掌上氣象客戶端依據(jù)普通人說話的韻律特征,并對語音播報效果進(jìn)行反復(fù)調(diào)試,從而制定了一套韻律控制機(jī)制,用于控制語音的停頓以及聲調(diào)大小等。
3.語音數(shù)據(jù)庫
掌上氣象客戶端智能語音系統(tǒng)采取自行錄制語音文件的方式,通過將天氣、地名、日期、風(fēng)向、風(fēng)力、關(guān)鍵詞等詞句片段錄制成語音文件,并依據(jù)詞句信息進(jìn)行編號入庫,生成掌上氣象客戶端專有的語音數(shù)據(jù)庫。
4.語音合成模塊
語音合成模塊最主要功能實現(xiàn)文本拆分、語音合成兩個模塊。文本拆分使用遍歷方式,將輸入語音文本分割成語音片段;語音合成采用語音二進(jìn)制流,將分割完畢的語音片段進(jìn)行合并。
//以下代碼為文本切割偽代碼片段
[textArray removeAllObjects];
NSString *textCopy = text;
NSString *key = nil;
NSInteger length = [text length];
int i = 0;
while (i < length)
{//遍歷所有文本
textCopy = [text substringFromIndex:i];
for (int j=0; j<[[textLib allKeys] count]; j++)
{
key = [[textLib allKeys] objectAtIndex:j];
if ([textCopy hasPrefix:key])
{//匹配某個語音片段
[textArray addObject:key];// 保存語音片段
i = i + [key length] - 1;// 遍歷下一條語音片段
break;
}
}
i++;//如果沒有匹配,跳過這個單詞
}
//以下代碼為語音合成偽代碼片段
Stream *outStream;
for (NSInteger i=0; i<語音片段長度; i++)
{
outStream? += 語音片段數(shù)組(i).toStream();
}
return outStream;
5.輸出語音
目前主流手機(jī)終端ios/android/wp7/symbian,將語音二進(jìn)制流放到播放緩沖中,即可實現(xiàn)語音播放。
//以下為偽代碼
//申請播放器內(nèi)存
mediaPlay *play = new mediaPlay();
//將二進(jìn)制流放入播放緩存
play.playAudio(outStream);
//play.pause();暫停播放
三、總結(jié)
TTS即語音合成技術(shù)(Text To Speech)在掌上氣象客戶端平臺上的應(yīng)用,涉及到聲學(xué)、語言學(xué)、數(shù)學(xué)信號處理技術(shù)、多媒體技術(shù)等多個學(xué)科技術(shù)領(lǐng)域,是中文信息處理領(lǐng)域的一項前沿技術(shù),實現(xiàn)了把手機(jī)中讀取的文字信源轉(zhuǎn)換成自然流暢的語音輸出。
基于TTS技術(shù)的掌上氣象客戶端智能語音系統(tǒng),實現(xiàn)“以人為本”的人性化氣象服務(wù),圖文聲并茂,打造出最具權(quán)威和科技含量的手機(jī)氣象客戶端服務(wù)系統(tǒng)。
參考文獻(xiàn)
[1]顧海峰.基于中文TTS技術(shù)研究[J].電腦知識與技術(shù):學(xué)術(shù)交流,2007,(5).
[2]馬強(qiáng).嵌入TTS技術(shù)開發(fā)語音合成軟件[J].電腦開發(fā)與應(yīng)用,2004,(4).