李春蘭
摘 要: 針對傳統(tǒng)的英語發(fā)音自動校對系統(tǒng)中語音識別混亂的問題,設(shè)計一種英語口語自動發(fā)音校對系統(tǒng)。引進(jìn)滅錯計算進(jìn)行語音的識別校對,通過滅錯計算的語音信息能夠進(jìn)行高階識別,避免傳統(tǒng)的識別校對方法中出現(xiàn)的數(shù)據(jù)進(jìn)階誤差,同時優(yōu)化了反饋控制系統(tǒng),提高系統(tǒng)的識別語音的能力。為了驗證所設(shè)計的英語口語自動發(fā)音校對系統(tǒng)的有效性,設(shè)計了對比仿真試驗。試驗數(shù)據(jù)表明,設(shè)計的英語口語自動發(fā)音校對系統(tǒng)能夠有效地解決語音識別混亂問題。
關(guān)鍵詞: 英語口語; 自動發(fā)音校對系統(tǒng); 滅錯計算; 高階識別
中圖分類號: TN911?34; TN273 文獻(xiàn)標(biāo)識碼: A 文章編號: 1004?373X(2017)24?0059?03
Abstract: In view of the problem of speech recognition confusion in the traditional automatic English pronunciation proofreading system, an automatic pronunciation proofreading system for spoken English was designed. The fault clearing calculation is introduced to perform English speech recognition and proofreading. The speech information after the fault clearing calculation can be used for high?order recognition, which avoids data order error in the traditional recognition and proofreading method and optimizes the feedback control system, so that the speech recognition capability of the system can be improved. In order to verify the validation of the automatic pronunciation proofreading system for spoken English, the contrast simulation experiment was designed. The experimental data shows that the designed automatic pronunciation proofreading system for spoken English can effectively resolve the problem of speech recognition confusion.
Keywords: spoken English; automatic pronunciation proofreading system; fault clearing calculation; high?order recognition
0 引 言
隨著計算機(jī)識別技術(shù)的高速發(fā)展,計算機(jī)語音識別系統(tǒng)的研究已經(jīng)進(jìn)展到非常高的程度[1?2]。其中使用最為廣泛的是英語語音校對系統(tǒng)。語音校對系統(tǒng)主要是針對發(fā)音質(zhì)量進(jìn)行評價計算以及進(jìn)行發(fā)音錯誤檢測[3?4]。對發(fā)音質(zhì)量進(jìn)行評價計算,根據(jù)國內(nèi)外很多算法進(jìn)行校對計算還是比較容易的,并且計算的水平以及準(zhǔn)確度也比較高[5]。但在針對語音識別過程的數(shù)據(jù)信息干擾以及語音混淆,通過發(fā)音質(zhì)量進(jìn)行評價計算是無法進(jìn)行消除的,只有通過特定的算法才能有效地進(jìn)行消除[6?7]。但是在提取的過程中攜帶音頻屬性是惟一的,進(jìn)行參照比對的可能性就會大大降低,造成語音識別混亂的問題[8]。針對上述問題,本文設(shè)計一款英語口語自動發(fā)音校對系統(tǒng)。并進(jìn)行試驗分析,結(jié)果表明,本文設(shè)計的英語口語自動發(fā)音校對系統(tǒng)能夠有效地解決語音識別混亂問題。
1 英語口語自動發(fā)音校對系統(tǒng)設(shè)計方案
1.1 硬件設(shè)計
本文設(shè)計的英語口語自動發(fā)音校對系統(tǒng)主要依靠識別器進(jìn)行英語口語校對識別。英語口語自動發(fā)音校對系統(tǒng)主要由錄制系統(tǒng)、語音識別系統(tǒng)及評價系統(tǒng)三個板塊組成。本文設(shè)計英語口語自動發(fā)音校對系統(tǒng)的音頻采集器選用高頻介子振幅采集器,同過采集的數(shù)據(jù)對比錄制好數(shù)據(jù)編碼,進(jìn)行校對評價,其架構(gòu)如圖1所示。
1.2 引進(jìn)滅錯計算進(jìn)行校對
引進(jìn)滅錯計算能夠保證本文設(shè)計的英語口語自動發(fā)音校對系統(tǒng),能有效進(jìn)行高準(zhǔn)確度語音口語校對計算,想要使用滅錯計算,首先需要進(jìn)行數(shù)據(jù)的填充處理以及屬性規(guī)劃,如下:
式中:為英語口語的震動音頻;為震動的波峰極值;為震動的波谷極值;為音頻的有效周期律;為介子傳輸?shù)恼穹?;為英語口語的標(biāo)準(zhǔn)振幅;為恒定頻率參數(shù),是保證進(jìn)行數(shù)字轉(zhuǎn)變的基礎(chǔ)參量。
通過上述方法將采集的英語口語語音進(jìn)行“標(biāo)準(zhǔn)化”處理,并進(jìn)行口語信息的填充,計算式為:
式中:為英語口語進(jìn)行填充處理過程中的函數(shù)離散值;為填充最大化的權(quán)值函數(shù)差;代表兩個音頻節(jié)點(diǎn)之間的跳數(shù);代表音頻中節(jié)點(diǎn)和節(jié)點(diǎn)之間的最短路徑。填充處理的數(shù)據(jù)便可以進(jìn)行屬性規(guī)劃,如下:
式中:是衡量音頻的指標(biāo);是恒定音頻固有周期的參量。其屬性已經(jīng)被標(biāo)定進(jìn)行滅錯校對計算,公式為:
式中:表示音頻的固有斜動性,是衡量音符的參量;為音頻屬性的合集熵,是進(jìn)行音頻校對的函數(shù)參量;為對應(yīng)音頻的匹配系數(shù);表示進(jìn)階音頻所含有的高程權(quán)值;表示音頻滅錯校對極限值。
1.3 優(yōu)化反饋控制系統(tǒng)提高語言識別能力endprint
對本文設(shè)計的英語口語自動發(fā)音校對系統(tǒng)中的反饋控制系統(tǒng)進(jìn)行優(yōu)化,可以最大程度上提高校對的能力,同時可以從根本上解決出現(xiàn)的語音識別混亂的問題。優(yōu)化反饋控制器首先改變反饋的路徑,路程計算公式為:
式中:為反饋音頻的承接算子;為百世拼音的信道焓值系數(shù);為音頻類型參數(shù)代碼。通過上述公式可以改變反饋的路徑,以及對反饋渠道進(jìn)行參數(shù)設(shè)定。假設(shè)為英語口語的音頻失效值,通過序列計算可以對音頻的失效情況進(jìn)行描述,這樣可以進(jìn)行更好的音頻對照,公式為:
式中:表示英語口語的音頻識別碼;表示對應(yīng)音頻的渠道權(quán)值。通過上述公式可以對數(shù)字化的音頻信號進(jìn)行有序的排列,增加校對準(zhǔn)確率,識別能力。反饋對比公式為:
式中:為對音頻衡量最有效的參數(shù);為一個區(qū)域函數(shù)能說明音頻校對的準(zhǔn)確性;分別表示音頻信號的頻率、周期。假設(shè)英語口語的準(zhǔn)確頻率為,實(shí)際發(fā)音為,可得對應(yīng)專函關(guān)系為:
為了保證本文設(shè)計的英語口語自動發(fā)音校對系統(tǒng)能夠在反饋過程中進(jìn)行準(zhǔn)確的校正,還需要進(jìn)行反饋系統(tǒng)的魯化計算,公式為:
式中:的4個對應(yīng)值分別為反饋控制系統(tǒng)的魯化上極限值、下極限值、載量極限值、傳輸極限值;表示英語口語音頻的律動性;表示屬性涵蓋內(nèi)置函數(shù)。魯化計算能夠說明系統(tǒng)的使用情況,還需要對影響限制,保證系統(tǒng)能夠進(jìn)行正常的工作,公式為:
式中:為學(xué)習(xí)因子;為迭代次數(shù);為音頻采集權(quán)值;為音頻節(jié)點(diǎn)間的間隔;為音頻輸出值;為音頻采集速度;為對應(yīng)的實(shí)測音頻節(jié)點(diǎn)。上階函數(shù)、下階函數(shù)已經(jīng)得到限制,通過該算法對音頻極限進(jìn)行限制能夠有效解決語音識別混亂問題。
綜上所述,本文設(shè)計的英語口語自動發(fā)音校對系統(tǒng),引進(jìn)滅錯計算進(jìn)行語音的識別校對,通過滅錯計算能夠有效地提高英語口語的識別能力,避免傳統(tǒng)的識別校對方法中出現(xiàn)的數(shù)據(jù)進(jìn)階誤差,提高了系統(tǒng)的識別語音的能力,且從根本上解決語音識別混亂問題。
2 仿真實(shí)驗分析
2.1 參數(shù)設(shè)定
為了保證設(shè)計的英語口語自動發(fā)音校對系統(tǒng)能夠準(zhǔn)確地對英語口語進(jìn)行校對,設(shè)置英語口語的震動音頻E在[-80,80]值域內(nèi);設(shè)置實(shí)際上對音頻衡量的最有效的參數(shù)為8.5。為了保證系統(tǒng)英語口語校對的準(zhǔn)確性,設(shè)置maxX的4個極限值分別為3.6,3.2,3.0,3.5。
2.1.1 語料庫的準(zhǔn)備
所用的英語詞典中一共有186 780個詞,是由人民大學(xué)出版社出版,其中包含58篇口語適讀文章,以及20篇的測試資料。
2.1.2 評價指標(biāo)
一般情況下,衡量語音校對系統(tǒng)的好壞主要有三個指標(biāo):
2.2 結(jié)果分析
在實(shí)驗過程中,對傳統(tǒng)方法與本文方法的試驗結(jié)果進(jìn)行記錄,如表1所示。分析表1得知,本文設(shè)計的英語口語自動發(fā)音校對系統(tǒng)能夠進(jìn)行準(zhǔn)確的校對,通過這三個數(shù)值可以看出本文設(shè)計英語口語自動發(fā)音校對系統(tǒng)能夠有效地對英語口語進(jìn)行校對。
圖2為魯棒性試驗結(jié)果。分析圖2結(jié)果得知,本文設(shè)計英語口語自動發(fā)音校對系統(tǒng)的魯棒性極高,說明系統(tǒng)非常穩(wěn)定。
3 結(jié) 語
本文設(shè)計了一款英語口語自動發(fā)音校對系統(tǒng),引進(jìn)滅錯計算進(jìn)行語音的識別校對,通過滅錯計算能夠有效地提高英語口語的識別能力,避免了傳統(tǒng)識別校對方法中出現(xiàn)的數(shù)據(jù)進(jìn)階誤差,同時優(yōu)化了反饋控制系統(tǒng),提高了系統(tǒng)識別語音能力,且從根本上解決了語音識別混亂問題。希望通過本文研究能對英語口語自動發(fā)音校對系統(tǒng)的應(yīng)用提供良好的理論依據(jù)。
參考文獻(xiàn)
[1] 郭鴻杰,周芹芹,王夢嬌.英語強(qiáng)化詞變異特征探討:一項基于倫敦英語口語語料庫的研究[J].解放軍外國語學(xué)院學(xué)報,2016,39(6):54?62.
[2] 閔閱.十年口語大賽 創(chuàng)造輝煌舞臺 時代語言英才 成就職業(yè)夢想:全國高職高專實(shí)用英語口語大賽項目的研究與實(shí)踐[J].中國職業(yè)技術(shù)教育,2015(22):89?94.
[3] 趙晨輝.高職院校實(shí)用交際英語口語訓(xùn)練的一本好書:評《用英語介紹中國》[J].江西社會科學(xué),2017(1):3.
[4] 張穎,付蕊.移動學(xué)習(xí)技術(shù)在英語口語教學(xué)中的應(yīng)用:評《信息技術(shù)與英語教學(xué)》[J].中國教育學(xué)刊,2017(4):60.
[5] 韓亞文,崔雅瓊,湯一梅.工作記憶容量和任務(wù)頻次對中國英語學(xué)習(xí)者口語產(chǎn)出的影響[J].外語與外語教學(xué),2017(2):90?98.
[6] 薄婷.自主學(xué)習(xí)理論在英語口語教學(xué)中的應(yīng)用:評《多維視角下的英語口語教學(xué)研究:理論與實(shí)踐》[J].大學(xué)教育科學(xué),2016(6):54.
[7] 曹潤宇,路靜.英漢語體差異與中國大學(xué)生英語寫作口語化傾向的關(guān)聯(lián)分析[J].山東社會科學(xué),2016(z1):490?491.
[8] 王子賢,劉悅梅,靳相如.商務(wù)英語口語教學(xué)對大學(xué)生人際溝通能力的培養(yǎng)[J].河北農(nóng)業(yè)大學(xué)學(xué)報(農(nóng)林教育版),2016,18(2):117?120.endprint