湯麗拿
基于“人工智能+”的語言服務行業(yè)創(chuàng)新技術研究*
湯麗拿
(浙江長征職業(yè)技術學院,浙江 杭州 310023)
人工智能技術的興起給語言服務行業(yè)的發(fā)展帶來了新挑戰(zhàn)。旨在分析人工智能背景下的語言服務行業(yè)發(fā)展趨勢,在結合國內外語言服務需求的基礎上,對語言服務中的創(chuàng)新技術應用和策略進行研究,尋找有效的互聯(lián)網(wǎng)翻譯技術及語言服務解決方案,推進大數(shù)據(jù)、人工智能與語言服務的協(xié)同創(chuàng)新發(fā)展。
人工智能;語言服務;翻譯技術;語音識別
隨著社會語言服務需求的不斷增長,人們對語言服務行業(yè)發(fā)展的研究不僅包含國家層面上的總體戰(zhàn)略規(guī)劃,并且逐漸開始向社會層面的各專業(yè)和業(yè)務領域深度發(fā)展研究延伸。語言服務行業(yè)涉及翻譯服務、本地化服務、語言技術工具開發(fā)與應用(機器翻譯MT與計算機輔助翻譯CAT)、語言教學與培訓等眾多業(yè)務領域。
人工智能語言服務的出現(xiàn),突顯了全球化大數(shù)據(jù)背景下的語言信息特點以及翻譯智能技術平臺時代的來臨,未來即將是“一帶一路”的專業(yè)化語言服務和智能化翻譯需求激增的時代。目前國內語言服務行業(yè)的發(fā)展趨勢和現(xiàn)狀是:語言服務人才市場供求失衡,語言服務人才培養(yǎng)體系不完善,翻譯技術和軟件運用不足,語言類服務企業(yè)和高校的創(chuàng)新協(xié)同合作有待深入,網(wǎng)絡翻譯平臺的開發(fā)與應用研究需要新技術和新實踐等。
知識增長和技術發(fā)展往往呈現(xiàn)交替加速發(fā)展的特點,當今尤其以云計算、大數(shù)據(jù)、人工智能、物聯(lián)網(wǎng)、5G等為代表的新技術正逐漸改變著人類生活的各個領域。人工智能技術正改變著智能制造、金融貿易、教育培訓、公共事業(yè)、醫(yī)療應用等各個行業(yè),并成為變革社會的重要推動力。世界各國都高度重視發(fā)展人工智能,加強人工智能領域的技術研發(fā)和創(chuàng)新。2017年國務院發(fā)布的《新一代人工智能發(fā)展規(guī)劃》將發(fā)展人工智能作為國家重點發(fā)展戰(zhàn)略之一。2018年教育部印發(fā)的《高等學校人工智能創(chuàng)新行動計劃》中指出要加快人工智能在教育領域的創(chuàng)新應用。
人工智能的應用開始涉及各行各業(yè)。目前,中國的人工智能在金融、安防、客服等行業(yè)領域已得到廣泛運用。人工智能在語言服務行業(yè)的應用主要是自然語言處理技術(NLP),它是計算機科學、人工智能、語言學關注計算機和人類(自然)語言之間的相互作用的領域,主要包括機器翻譯和語音識別技術。機器學習、語音識別、語義識別、圖像識別技術等不同形態(tài)的語言產(chǎn)品將不同程度地融入新的智能技術平臺,未來語言服務業(yè)的發(fā)展無疑會進入“語言智能+”的時代。語言智能的目標是實現(xiàn)自然語言與機器語言的連續(xù)交互,是人工智能的高級階段,在未來人工智能的應用上有著非常重要的作用。
人工智能翻譯技術的應用在語言服務業(yè)中發(fā)揮著越來越重要的作用。傳統(tǒng)的簡單機械的人工翻譯模式已經(jīng)無法適應快速發(fā)展的市場需求,今后會逐漸被機器翻譯、語音識別技術和同步多語字幕翻譯技術、神經(jīng)網(wǎng)絡機器翻譯技術所取代。
在新一代技術的影響下,翻譯產(chǎn)品也發(fā)生著巨大的變化。2018年底由騰訊AILab研制出的人工智能輔助翻譯產(chǎn)品TranSmart在業(yè)內引起轟動。騰訊交互翻譯TranSmart是一款面向人工翻譯場景的機器翻譯產(chǎn)品,也是業(yè)內首個落地的交互式機器翻譯產(chǎn)品。該產(chǎn)品結合了騰訊AILab自主研發(fā)的神經(jīng)網(wǎng)絡機器翻譯、交互式機器翻譯、翻譯輸入法、翻譯記憶片斷復用技術,配合億級雙語數(shù)據(jù),幫助用戶更快、更好地完成翻譯任務。針對人工翻譯市場現(xiàn)狀,特別加強了常見專業(yè)領域的翻譯性能,對于教育、合同、法律和專利等領域的文本效果尤為出色。
另外,針對2020年初的突發(fā)性全球新冠肺炎疫情,很多語言服務行業(yè)人士運用自己的語言技能,服務于抗疫戰(zhàn)役,將中國寶貴的抗疫經(jīng)驗通過多國文字及時地傳遞給全世界,讓更多的人能夠積極參與防疫抗疫。
一個機器翻譯矩陣Tmxmall為了給更多正在為抗疫出力的翻譯團隊及相關人士提供技術便利,及時上線了聚焦于醫(yī)療的垂直領域機器翻譯引擎——阿里醫(yī)療機器翻譯。阿里醫(yī)療引擎是阿里云達摩院機器翻譯產(chǎn)品,能為譯者提供更加專業(yè)和準確的醫(yī)療翻譯結果。該系統(tǒng)支持中英、英中、中日、日中及多語種互譯,并且支持YICAT企業(yè)版/團隊版、Tmxmall MT Plugin、SDL Trados、memoQ中應用。本次疫情期間,阿里也在不間斷地使用優(yōu)質的疫情雙語語料來訓練醫(yī)療機器翻譯引擎,幫助大家更加輕松高效地完成新冠肺炎疫情及醫(yī)療相關的翻譯工作。未來,翻譯服務也將從通用領域的機器翻譯:谷歌翻譯、有道翻譯、云譯、騰訊翻譯君、搜狗翻譯、aws、阿里翻譯、小牛翻譯、DeepL、百度翻譯、Bling、Yandex等,拓展到更精準更專業(yè)化方向的垂直領域機器翻譯。未來幾年,智能化的翻譯技術必將加速推進語言服務行業(yè)的發(fā)展。人工智能背景下的語言服務必將是專業(yè)領域和業(yè)務領域深度融合發(fā)展的語言服務。
語音識別作為自然語言處理的關鍵技術,被逐漸運用于移動終端,各種語音識別產(chǎn)品層出不窮。語音識別是以語音為研究對象,通過語音信號處理和模式識別讓機器自動識別人類口述的語言。
本次研究以大數(shù)據(jù)采集、抽取樣本的研究方法研究語音識別技術的創(chuàng)新應用。以杭州好云教育科技有限公司提供的MyET語音識別軟件在浙江省高?;ヂ?lián)網(wǎng)聽說比賽系統(tǒng)中的運用為實證研究,以大數(shù)據(jù)評價學生學習習慣的養(yǎng)成和在實踐過程中口語能力的變化情況。MyET自動語音分析診斷技術(ASAS?,Automatic Speech Analysis System),擁有中國、英國、法國、德國、日本等九個國家及地區(qū)的發(fā)明專利(中華人民共和國專利第ZL02160031.7)。系統(tǒng)會根據(jù)語言學習四個要素——發(fā)音、語調、流利度、音量去分析學習者在口語上的問題,并提出有效的口語改善建議。比賽收集的數(shù)據(jù)和報表包括以下幾種。
詳細成績報表(Score Details)數(shù)據(jù)內容:在比賽期間中,系統(tǒng)會完整詳實記錄選手歷次進行比賽刷分的信息,包含每次比賽刷分成績、比賽刷分次數(shù)、登錄比賽刷分時間點及每次完成比賽所花的時間。數(shù)據(jù)意義為教師可以從詳盡的成績數(shù)據(jù)中,了解每一位學生對大賽的投入程度,并看出學生在大賽實踐過程中口語能力(成績)的變化。
統(tǒng)計報表(Statistics 1)比賽總時長(Contest Duration)數(shù)據(jù)內容:在比賽期間中,系統(tǒng)會自動偵測每位選手每次進入比賽與完成比賽當中實際操作所花的時間,計算出選手實際投入在比賽模塊的總在線時間。數(shù)據(jù)意義為教師可以了解每位學生總共花了多少時間在進行比賽,看出通過大賽是否能有效激發(fā)學生的學習熱情,啟發(fā)學習的積極主動性。
課程學習總時長(Accumulated Learning Time)數(shù)據(jù)內容:每位參賽選手將獲得一組MyET課程包,選手可在比賽期間進行課程練習,系統(tǒng)會自動偵測并計算每位選手使用課程內各學習模塊(包含單句練習、角色扮演、強化練習、自我檢定、跟讀、復誦等)進行自主學習的總體時間。數(shù)據(jù)意義為教師可以了解每位學生在課堂外,花了多少時間在進行口語課程的自主學習,有效增加了多少口語學時。
以學校為單位的分析報表(Analysis by school)數(shù)據(jù)內容:在比賽期間中,同一場比賽里,報表會呈現(xiàn)每所參賽學校的總參賽人數(shù)、每所學校參賽選手總刷分次數(shù)、每所學校參賽選手總刷分時間。數(shù)據(jù)意義為教師可以了解在比賽中,各學校對比賽投入程度及自己學校的學生在比賽的總體表現(xiàn)程度。
刷分時段分析報表(Analysis by Time Slots)數(shù)據(jù)內容:在比賽期間中,報表會呈現(xiàn)全體選手刷分時段的分布統(tǒng)計。數(shù)據(jù)意義為教師可以了解學生上線時間分布,看出學生習慣在哪些時間段內學習,體現(xiàn)通過大賽是否有效地幫助學生養(yǎng)成學習習慣及妥善運用碎片化時間學習。
在人工智能語言服務改變人類經(jīng)濟社會生活方式的新形勢下,抓住機遇,努力進行技術創(chuàng)新變革,逐步建立語言服務行業(yè)規(guī)范及標準,培養(yǎng)新一代創(chuàng)新技術應用人才是當前語言服務行業(yè)發(fā)展的當務之急。
[1]蔡自興.人工智能及其應用[M].北京:清華大學出版社,2016.
[2]羅華珍,潘正芹,易永忠.人工智能翻譯的發(fā)展現(xiàn)狀與前景分析[J].電子世界,2017(21):21-23.
[3]王華樹.語言服務的協(xié)同創(chuàng)新與規(guī)范發(fā)展——2016中國語言服務業(yè)大會暨中國譯協(xié)年會綜述[J].中國翻譯,2017(1):85-88.
[4]2016中國語言服務行業(yè)發(fā)展報告[R].中國翻譯協(xié)會,2016.
2095-6835(2020)20-0125-02
H059
A
10.15913/j.cnki.kjycx.2020.20.053
湯麗拿(1979—),女,浙江杭州人,碩士研究生,副教授,研究方向為課程與教學論。
2018年上海外語教育出版社全國高校外語教學科研項目“人工智能背景下語言服務行業(yè)發(fā)展策略研究”(編號:2018ZJ0038B)課題成果
〔編輯:嚴麗琴〕