摘 要:陸空通話是空中交通管制員從業(yè)上崗的基礎(chǔ),也是在日常工作中時刻使用的標(biāo)準(zhǔn)語言。其使用是否標(biāo)準(zhǔn)將直接影響空中交通安全,因此各類專業(yè)人員需要不斷訓(xùn)練,提高陸空通話能力。文章在陸空通話英語標(biāo)準(zhǔn)發(fā)音的基礎(chǔ)上,設(shè)計發(fā)音模板,并進(jìn)行語音識別,輔助專業(yè)人員進(jìn)行陸空通話英語練習(xí)。
關(guān)鍵詞:空中交通管理;陸空通話;語音識別;教學(xué)輔助
陸空通話具有標(biāo)準(zhǔn)的發(fā)音規(guī)則,區(qū)別于日常用語[1-2]。本文提取陸空通話數(shù)據(jù)并進(jìn)行整理,通過MATLAB制作成標(biāo)準(zhǔn)的陸空通話模板。同時針對個體發(fā)音需要進(jìn)行語音比對,測量其標(biāo)準(zhǔn)性,進(jìn)而可以實現(xiàn)語音識別功能。
1 模板設(shè)計的意義
進(jìn)行語音識別的關(guān)鍵是設(shè)計合適的發(fā)音模板,依據(jù)此模板對個別發(fā)音進(jìn)行評價,評定出發(fā)音所代表的含義??展荜懣胀ㄔ挷煌谄胀ǖ挠⒄Z,其發(fā)音具有明顯的行業(yè)特點(diǎn),如字母A的發(fā)音不是/ei/而是/a:lf/、B的發(fā)音不是/bi:/而是/|brɑ:|v?藜?尬/,因此由于針對性非常強(qiáng),因此需要根據(jù)標(biāo)準(zhǔn)單獨(dú)制作發(fā)音模板,在行業(yè)內(nèi)推廣使用。
2 模板提取方法
本文采用陸空通話標(biāo)準(zhǔn)用語教材中的發(fā)音作為標(biāo)準(zhǔn)進(jìn)行參考,一般的錄音頻率為44k Hz,如字母A的發(fā)音振幅如圖1(a)所示。雖然原始語音信號精度較高,但是后期實現(xiàn)語音識別的時候,需要對上百句模板進(jìn)行一一對比,判定最相似的一個為其識別出來的語音,這樣算法運(yùn)行時會耗費(fèi)大量的時間,實時性難以保證,因此我們對語音模板進(jìn)行離散取點(diǎn),通過實驗,將其頻率降為2000Hz時,依然可以保證識別的準(zhǔn)確性,如圖1(b)所示。這樣,我們對經(jīng)常使用的字母、數(shù)字以及一些常用的陸空通話用語提取了發(fā)音模板,其形式為雙精度的數(shù)字序列。
3 語音識別方法實現(xiàn)
由于所設(shè)計的語音模板標(biāo)準(zhǔn)性非常強(qiáng),其應(yīng)用就是為了避免日常英語中發(fā)音的混淆,因此我們采用最為簡單有效的DTW(Dynamic Time Warping,動態(tài)時間歸整)算法進(jìn)行語音識別[3-4]。DTW算法是一種衡量兩個長度不同的時間序列的相似度的方法,模板的設(shè)計便不需要考慮時間的長短,即采樣序列的數(shù)量,可以有效提高應(yīng)用的效率。
本文使用MATLAB中DTW工具箱進(jìn)行模擬仿真,同樣以字母A為例輸入的語音波形如圖2所示。經(jīng)過DTW算法,其發(fā)音與部分字母模板的對照如表1所示,可以看到此發(fā)音與模板A的距離最短,為7.1926,識別正確。
4 結(jié)束語
本文對陸空通話的標(biāo)準(zhǔn)語音數(shù)據(jù)進(jìn)行了整理,提取出發(fā)音模板用語課堂輔助訓(xùn)練,通過語音識別方法準(zhǔn)確識別具體的發(fā)音。項目進(jìn)一步的研究目標(biāo)是將模板應(yīng)用于Android系統(tǒng)中,實現(xiàn)移動端的訓(xùn)練軟件開發(fā)。
參考文獻(xiàn)
[1]劉萬鳳,胡軍,袁偉偉.陸空通話標(biāo)準(zhǔn)用語(英語)的語音指令識別技術(shù)研究[J].計算機(jī)科學(xué),2013,40(7):131-137.
[2]王博,李振宇.無線電陸空通話英語特點(diǎn)與教學(xué)策略[J].沈陽航空航天大學(xué)學(xué)報,2010,27(6):61-64.
[3]韋春麗,霍春寶.基于DTW的語音識別在MATLAB中的實現(xiàn)方法淺析[J].數(shù)字技術(shù)與應(yīng)用,2011(12):184-185.
[4]肖利君.基于DTW模型的孤立詞語音識別算法實現(xiàn)研究[D].中南大學(xué),2010.
作者簡介:孫禾(1988-),男,助理實驗師,研究方向:空中交通管理。