冀寶仙+王勝正+施朝健+孫振
摘要:為實現(xiàn)VTS值班人員適任能力培訓(xùn)和評估的自動化、智能化,確保評估結(jié)果客觀、公正和合理,構(gòu)建VTS模擬器情景對話的智能評估系統(tǒng)。該系統(tǒng)通過建立標(biāo)準(zhǔn)航海通信用語語料庫提高在線語音識別系統(tǒng)的精確性。引入基于語法規(guī)則的匹配分析模型對由語音識別系統(tǒng)得到的文本字符串進(jìn)行匹配分析。詳細(xì)介紹基于加權(quán)的實操評估準(zhǔn)則制定方法。該系統(tǒng)利用智能技術(shù)能實現(xiàn)部分VTS情景對話的自動化評估,減輕評估人員的負(fù)擔(dān),且能避免人工評估的主觀性和不公平性。
關(guān)鍵詞: 船舶交通管理系統(tǒng)(VTS); 智能評估系統(tǒng); 標(biāo)準(zhǔn)航海通信用語; 智能語音識別; 實操評估準(zhǔn)則
中圖分類號: U691.1 文獻(xiàn)標(biāo)志碼: A
Abstract: To realize the automation and intelligence of the competency training and evaluation for VTS duty officers, and to ensure that the evaluation results are objective, fair and reasonable, the intelligent evaluation system of situational dialogues in the VTS simulator is built. A corpus database of standard marine communication phrases is established to improve the accuracy of the online speech recognition system. The matching analysis model based on the grammar rules is proposed to carry out the matching analysis on text strings obtained by the speech recognition system. The formulation method of practical operation evaluation criteria based on weighting is introduced. By the intelligent technology, this system can partially implement the automatic evaluation on the VTS situational dialogues, reduce the burden of the evaluators, and avoid the subjectivity and unfairness due to manual evaluation.
Key words: Vessel Traffic Services (VTS); intelligent evaluation system; standard marine communication phrase; intelligent speech recognition; practical evaluation criterion
0 引 言
VTS模擬器培訓(xùn)是提高VTS工作人員基本素質(zhì)和專業(yè)技能的有效途徑,也是更加全面提高海上交通管理水平的有效方法。VTS模擬器培訓(xùn)在我國已經(jīng)得到了很好的應(yīng)用,由上海海事大學(xué)與中國海事局共同研制開發(fā)的VTS模擬器已經(jīng)得到成功的應(yīng)用與推廣[1],目前已完成對3 000余人次VTS值班人員的培訓(xùn)和考試,并于2016年9月通過國際航標(biāo)協(xié)會(IALA)官方認(rèn)證。然而,目前VTS值班人員適任能力評估依然采用教練員一對一的測評方法,不僅消耗大量人力、物力,評估效率低下,而且不同水平教練員的測試標(biāo)準(zhǔn)難以統(tǒng)一,導(dǎo)致評估過程存在一定的不公平性。因此,提出使用智能評估方法解決上述問題具有非常重要的意義。盡管航海教育領(lǐng)域也針對各種航海智能評估系統(tǒng)開展了廣泛的應(yīng)用研究[2-5],但是VTS模擬器與其他航海模擬器在智能評估方式和內(nèi)容上有較大差別,因此不能簡單借鑒或復(fù)制一般航海模擬器的智能評估方式。
VTS模擬器實操評估一般包括VTS系統(tǒng)操作技能評估和情景對話評估兩大類。操作技能評估的主要目的是評估VTS值班人員對VTS軟件操作的熟悉程度,評估學(xué)員操作行為的正確性,這與一般航海模擬器的操作評估類似。情景對話評估是評估值班人員如何利用恰當(dāng)?shù)恼Z言通過語音通信工具與船員進(jìn)行快速有效的溝通,從而合理地為船舶提供助航服務(wù),并有效組織港區(qū)和航道的船舶航行活動。在情景對話評估中,中英文標(biāo)準(zhǔn)航海通信用語中包含大量的專用名詞和習(xí)慣用法,導(dǎo)致通用的語音識別方法準(zhǔn)確率較低,無法直接利用語音識別系統(tǒng)來評估語言服務(wù)的正確性。因此,情景對話評估成為整個VTS模擬器智能評估中的核心和關(guān)鍵技術(shù)問題。
本文結(jié)合當(dāng)前VTS模擬器的技術(shù)條件,通過引入科大訊飛在線語音識別平臺,在現(xiàn)有語音識別模塊的基礎(chǔ)上進(jìn)行二次開發(fā),構(gòu)建一種VTS值班人員適任能力智能評估系統(tǒng)。首先根據(jù)《IMO標(biāo)準(zhǔn)航海通信用語》(以下簡稱SMCP)建立基于VTS標(biāo)準(zhǔn)航海通信用語的語料庫,并上傳到語音識別服務(wù)器,為現(xiàn)有語音識別平臺補(bǔ)充詞庫,提高語音向文本轉(zhuǎn)換的準(zhǔn)確性;其次構(gòu)建VTS通信用語的語法規(guī)則庫,以便解決通用的在線語音識別平臺專業(yè)用語識別上存在的精度較差的問題;最后設(shè)計VTS情景對話實操評估規(guī)則,為獲得客觀的VTS模擬器實操評估結(jié)果提供一種有效的評估準(zhǔn)則。
1 VTS模擬器智能評估系統(tǒng)關(guān)鍵技術(shù)
1.1 航海通信用語語料庫的建立
由于海事業(yè)務(wù)具有全球性,船員通常具有不同的文化、語言背景,VTS信息、助航和交通組織服務(wù)與一般性信息服務(wù)有所區(qū)別,VTS服務(wù)用語必須充分發(fā)揮信文標(biāo)識的作用,同時必須注意語句的簡潔性、用詞的準(zhǔn)確性、語意的完整性、表達(dá)的規(guī)范性以及指導(dǎo)的適度性[6]。常用的語音識別開發(fā)工具包中的語音識別模塊對航海領(lǐng)域的專業(yè)性詞匯或術(shù)語的識別不準(zhǔn)確,因此本系統(tǒng)采用由相關(guān)領(lǐng)域?qū)<腋鶕?jù)航海國際公約、IMO決議及通函、IALA指南及建議等構(gòu)建的包含一般術(shù)語、VTS專用術(shù)語、外部通信術(shù)語(如遇險通信術(shù)語、安全通信術(shù)語、VTS服務(wù)標(biāo)準(zhǔn)用語等)等的完整的航海專用中英文雙語語料庫。endprint
表1所示為VTS模擬器的典型情景對話實操訓(xùn)練和考試題實例。從情景對話內(nèi)容可以看出,在通常的對話內(nèi)容中,除包含“太行山”“紅浮”等地名或?qū)S妹~之外,還會出現(xiàn)很多數(shù)字、中英文夾雜在一起的情況,例如“京港VTC”“1.5 n mile”“臨1號浮”等。對于這種情景對話,標(biāo)準(zhǔn)的訊飛Web語音識別平臺的識別率不到80%,這顯然無法滿足情景對話實操評估的要求。因此,根據(jù)IALA V-103建議,按有關(guān)VTS值班人員適任能力培訓(xùn)示范課程目錄及培訓(xùn)標(biāo)準(zhǔn)、SMCP、《全國VTS實操培訓(xùn)大綱》、我國的VTS模擬器實操評估題庫編制評估項目與內(nèi)容,采用純文本utf8格式編輯用戶詞庫表,例如:VTS,VTC,洋山港[枚舉全國所有港口名稱],船名[枚舉題庫中涉及到的所有船舶名稱],北航道[枚舉題庫中涉及到的所有航道名稱],雷達(dá),紅浮,綠浮……在使用語音識別系統(tǒng)進(jìn)行識別時,上傳該通信用語語料庫到識別服務(wù)器平臺,補(bǔ)充詞庫,提高語音識別準(zhǔn)確度。
1.2 基于音、詞和語法規(guī)則的混合匹配分析模型
海事通信用語在表達(dá)上力求科學(xué)、準(zhǔn)確、簡潔和清晰。因此,本系統(tǒng)中嚴(yán)格根據(jù)SMCP和《全國VTS實操培訓(xùn)大綱》要求編制了雙語語料庫[7],構(gòu)建了基于混合語法規(guī)則的匹配分析模型[8-10],以便對語音識別得到的文本進(jìn)行匹配分析,得到客觀準(zhǔn)確的評估結(jié)果。
因為漢語中存在近義詞、同音字等現(xiàn)象,容易發(fā)生混淆,所以中文文本的匹配分析比英文文本的匹配分析更為復(fù)雜。本系統(tǒng)中采用拼音、語法規(guī)則和關(guān)鍵詞規(guī)則匹配分析的混合匹配分析模型對語音識別結(jié)果進(jìn)行評估,計算評估成績。
語法規(guī)則匹配,即基于命令詞識別指定關(guān)鍵詞組合的詞匯或固定說法的短句,是中文文本匹配分析中最重要的一步。本系統(tǒng)中首先根據(jù)訊飛平臺《ABNF語法編寫指南》構(gòu)建標(biāo)準(zhǔn)航海用語文法規(guī)則文件,為VTS模擬器實操評估中信息服務(wù)、交通組織服務(wù)、助航服務(wù)和應(yīng)急處置等4大類23個場景的題庫材料編制相應(yīng)的文法規(guī)則。文法等同于正則表達(dá)式,它定義了一個句子集合,例如一個用來匹配“船舶呼叫VTS中心”的對話的文法規(guī)則如下:
#ABNF 1.0 UTF-8;
root task_final;
#ABNF HEAD-END;
$vts_name = 京港VTS | 京港VTC
$ship_name = 太行山 | 太行山輪 |太行山輪船 |太行山船;太行山號;
$call= 呼 | 叫 |呼叫;
$task_final = $vts_name, $ship_name $call;
上述文法規(guī)則涵蓋了實現(xiàn)海事專業(yè)通信用語的多種說法:
京港VTS,太行山呼
京港VTS,太行山輪呼
京港VTS,太行山輪呼叫
京港VTS,太行山輪船呼叫
京港VTS,太行山號呼叫
京港VTC,太行山呼
……
基于混合語法規(guī)則進(jìn)行匹配分析的過程中,首先將語音識別得到的文本以字為單位轉(zhuǎn)換成對應(yīng)的拼音字符,并與標(biāo)準(zhǔn)答案的拼音進(jìn)行模糊匹配,如標(biāo)準(zhǔn)答案是“太行山”,則拼音是“tai hang shan”“tai han san”“tai han shan”或“tai hang san”都判別為識別正確,消除了同音字、卷舌音、前后鼻音等口音問題造成的影響;然后加載已編輯好的文法規(guī)則,采用語法規(guī)則匹配方法對語音識別得到的文本進(jìn)行修訂,如語音識別結(jié)果是“太行山呼”,而標(biāo)準(zhǔn)答案是“太行山號呼叫”,在上述通信用語的多種說法中包含了“太行山呼”的說法,則基于模糊拼音判別進(jìn)行語法規(guī)則匹配可以判定該文本匹配正確,并將語音識別得到的文本修訂為“太行山號呼叫”,以便進(jìn)行關(guān)鍵詞規(guī)則匹配。類似地,循環(huán)遍歷所有語音識別結(jié)果,最終統(tǒng)計所有匹配正確的文本數(shù)目。
關(guān)鍵詞規(guī)則匹配分析是在考試題的標(biāo)準(zhǔn)答案中
圖1 VTS模擬器中情景對話智能評估流程設(shè)置關(guān)鍵詞作為考試答案匹配的主要對象,也是評估成績的主要依據(jù)。在編輯標(biāo)準(zhǔn)答案時會對關(guān)鍵詞進(jìn)行標(biāo)注,例如標(biāo)準(zhǔn)答案“太行山號,能見度不良天氣,請注意使用安全航速航行”,其中關(guān)鍵詞是“*能見度*不良*安全航速*”,然后在修訂過的文本中遍歷查找與標(biāo)注的關(guān)鍵詞匹配的詞組,并累計匹配正確的關(guān)鍵詞數(shù)目。最終循環(huán)遍歷,直至完成所有文本的關(guān)鍵詞規(guī)則匹配。圖1是VTS模擬器中情景對話智能評估流程。
英文語句以單詞為最小結(jié)構(gòu)單元,以空格為分隔標(biāo)記,且英文具有嚴(yán)格的語序[11-12],因此英文文本匹配分析比中文文本匹配分析簡單。英文文本匹配分析流程與中文文本類似。本系統(tǒng)中根據(jù)SMCP編制了相應(yīng)的關(guān)鍵詞語法規(guī)則,由于英文本身就是字符串組合,不需要進(jìn)行拼音字符轉(zhuǎn)換過程,可以直接進(jìn)行語法和關(guān)鍵詞規(guī)則匹配分析。
1.3 基于加權(quán)的情景對話實操評估規(guī)則
本系統(tǒng)中采用基于加權(quán)的方法計算評估結(jié)果。經(jīng)拼音和語法規(guī)則匹配分析后判定為正確的文本數(shù)目,記為n1;待匹配分析的文本長度,記為N1;累計匹配正確的關(guān)鍵詞數(shù)目,記為n2;標(biāo)準(zhǔn)答案中關(guān)鍵詞總數(shù),記為N2。因此,兩種判別方式的分值計算可以表示為SCi=niNi×100, i=1,2
2 VTS值班人員適任能力智能評估系統(tǒng)構(gòu)架和實現(xiàn) 圖2為VTS模擬器智能評估系統(tǒng)的架構(gòu),主要包括智能評估教練員指揮控制端、智能評估客戶端、VHF通信設(shè)備、智能評估服務(wù)器端和Web語音識別云服務(wù)平臺等5個部分。
智能評估教練員指揮控制端主要由客戶端參數(shù)設(shè)置、VTS操作技能評估管理、VTS信息服務(wù)標(biāo)準(zhǔn)化用語評估管理、評估過程實時動態(tài)監(jiān)控和評估過程記錄與回放管理等5個功能模塊構(gòu)成。智能評估客戶端主要由用戶登錄界面、VHF語音采集器和學(xué)員操作指令拾取與傳遞模塊組成。智能評估服務(wù)器端進(jìn)行數(shù)據(jù)存儲與處理,它與Web語音識別云服務(wù)平臺聯(lián)接[13],提供語音識別服務(wù)。智能評估系統(tǒng)的工作原理框圖見圖3。endprint
根據(jù)本文提出的VTS模擬器智能評估系統(tǒng)架構(gòu)與關(guān)鍵技術(shù),利用Visual C#.NET開發(fā)了智能語音評估系統(tǒng)模塊,見圖4。
圖4a)提供評估內(nèi)容編輯和評分規(guī)則編輯功能,評估內(nèi)容支持中文和英文2種語言。在評估前,首先添加評估考試內(nèi)容,如圖4a)所示添加了“信息服務(wù)”評估情景,在情景規(guī)則交互界面上添加了評估具體內(nèi)容,并針對評估內(nèi)容設(shè)置了關(guān)鍵詞。
圖4b)提供了評估過程監(jiān)控功能,評估員可以動態(tài)監(jiān)控評估過程,了解評估情況。當(dāng)開始進(jìn)行評估時,考官自動發(fā)送消息,如“京港VTC,‘太行山輪呼叫”,學(xué)員端即可以收聽到該段語音播報;隨后服務(wù)端等待學(xué)員的語音回復(fù);服務(wù)端收到學(xué)員語音后,即利用本文前述語音識別方法,對學(xué)員的語音回復(fù)進(jìn)行翻譯,并存儲在服務(wù)端數(shù)據(jù)庫中。依此循環(huán),直到該情景對話結(jié)束。
圖4c)提供了評估結(jié)果,在完成了所有情景項目后,系統(tǒng)根據(jù)本文提出的評分規(guī)則自動進(jìn)行分?jǐn)?shù)計算。
圖4d)提供了評估結(jié)果對比分析,既可以進(jìn)一步了解學(xué)員的知識掌握情況,又可以驗證本文方法的準(zhǔn)確性。系統(tǒng)設(shè)置了10套評估題,對30位VTS值班人員隨機(jī)選取一套題進(jìn)行自動評估,統(tǒng)計其評估結(jié)果,平均絕對誤差為8%,遠(yuǎn)低于直接采用訊飛平臺的平均絕對誤差19%。這充分說明建立航海通信用語語料庫和進(jìn)行文法規(guī)則處理對VTS情景對話評估的有效性。
3 結(jié)束語
VTS值班人員適任能力智能評估系統(tǒng)彌補(bǔ)了傳統(tǒng)VTS值班人員適任能力人工測評工作量大、主觀評判缺乏公正性的不足,為VTS值班人員訓(xùn)練評估提供了新的方法,在一定程度上促進(jìn)了我國VTS值班人員訓(xùn)練評估的發(fā)展。VTS值班人員適任能力智能評估系統(tǒng)不僅適用于VTS值班人員操作技能和信息服務(wù)標(biāo)準(zhǔn)化用語的培訓(xùn)和評估,同時也可用于船員、引航員等海事領(lǐng)域相關(guān)工作人員的專業(yè)技能水平培訓(xùn)和評估,還可用于水上交通事故預(yù)測與分析、新的規(guī)則和章程的測試等領(lǐng)域。該系統(tǒng)能夠從整體上提高海事領(lǐng)域相關(guān)工作人員專業(yè)技能水平和航海通信用語標(biāo)準(zhǔn)化水平,提高船舶交通組織、管理、服務(wù)水平,有助于改善港口水域環(huán)境、通航環(huán)境,也有助于船舶的安全操縱,有利于船舶的航行安全,具有非常高的實際應(yīng)用價值。
參考文獻(xiàn):
[1] 王勝正, 張英英, 黃玉貴, 等. VTS與船舶操縱綜合模擬器構(gòu)建關(guān)鍵技術(shù)[J]. 上海海事大學(xué)學(xué)報, 2014, 35(2): 1-5. DOI: 10.13340/j.jsmu.2014.02.001.
[2] 方誠, 任鴻翔. 航海模擬器智能評估方法綜述[J]. 中國航海, 2015, 38(4): 48-52.
[3] 楊曉, 金一丞, 任鴻翔, 等. 航海儀器操作智能評估系統(tǒng)的設(shè)計與實現(xiàn)[J]. 中國航海, 2013, 36(4): 28-33.
[4] 陳麗寧, 任鴻翔, 金一丞. 船舶雷達(dá)/ARPA智能考試系統(tǒng)的研究[J]. 重慶交通大學(xué)學(xué)報(自然科學(xué)版), 2011, 30(5): 1049-1053. DOI: 10.3969/j.issn.1674-0696.2011.05.0036.
[5] 蔣效彬, 任鴻翔, 王德龍, 等. 航海模擬器的錨泊操縱自動評估系統(tǒng)[J]. 上海海事大學(xué)學(xué)報, 2016, 37(1): 82-86. DOI: 10.13340/j.jsmu.2016.01.015.
[6] 張美紅, 梁小成. 標(biāo)準(zhǔn)航海通信用語(SMCP)在VTS服務(wù)中的應(yīng)用[J]. 中國水運(yùn), 2009, 9(9): 143-144.
[7] 羅衛(wèi)華. 海事英語及其語料庫研究[M]. 大連: 大連海事大學(xué)出版社, 2008.
[8] 朱國華. 文本信息處理中漢語句法分析方法研究[D]. 大連: 大連理工大學(xué), 2005.
[9] 邵剛. 基于中文的句法分析系統(tǒng)的研究與實現(xiàn)[D]. 西安: 西安科技大學(xué), 2008.
[10] 過冰. 智能語音對話系統(tǒng)中基于規(guī)則和統(tǒng)計的語義識別[D]. 北京: 北京郵電大學(xué), 2013.
[11] 劉文慧. 標(biāo)準(zhǔn)海事通信用語與日常英語口語的差異分析[J]. 大連海事大學(xué)學(xué)報(社會科學(xué)版), 2010, 9(6): 106-108.
[12] BILLE P, GRTZ I L, VILDHJ H W. String matching with variable length gaps[J]. Theoretical Computer Science, 2012, 443: 25-34.
[13] 劉琳茜, 李永康, 索紅軍. 云服務(wù)安全平臺研究開發(fā)與語音識別應(yīng)用[J]. 軟件導(dǎo)刊, 2014, 13(1): 7-8.
(編輯 賈裙平)endprint