你認(rèn)為 AI 會干掉人類同聲傳譯嗎?當(dāng)AI在圍棋領(lǐng)域橫掃人類后,人類對自己的職業(yè)技能似乎越來越?jīng)]有自信,總擔(dān)心自己的“飯碗”不保。
9月20日,2018年世界人工智能大會剛落幕,科大訊飛卻陷入“AI同傳造假”的風(fēng)波。一位同傳譯員在知乎上發(fā)文稱,在上海的一場會議中,訊飛的翻譯其實為人工同傳,并非機器智能翻譯,并且譯文由機器進行朗讀。這容易讓觀眾產(chǎn)生“都是人工智能翻譯”的錯覺,而忽略背后同傳譯員們的勞動成果。
對此,科大訊飛董秘、高級副總裁江濤接受《21世紀(jì)經(jīng)濟報道》采訪時表示:“盡管機器翻譯獲得發(fā)展,明年能達到英語專業(yè)8級的水平,但依然沒辦法代替同傳。科大訊飛沒有提到AI同傳,并沒有造假吹牛,目前的情況是一個誤會。”
一句“誤會”雖然無法判斷整個事件孰是孰非,但可以讓人類的同傳譯員安心上班了。
同聲傳譯是指譯員在不打斷講話者的情況下,不間斷地將講話者的內(nèi)容翻譯后復(fù)述給聽眾。傳譯員通過同傳設(shè)備提供即時準(zhǔn)確無誤的翻譯,這種翻譯方式適用于大型的權(quán)威研討會和國際性會議。
同聲傳譯這個職業(yè)曾被譽為世界上最高薪酬的工作,他們的工資不是按照“月”計算,而是以“每小時”乃至“每分鐘”作為計量單位。這個“日進千金”的行業(yè)看似風(fēng)光,實則每次傳譯員出一次任務(wù)都是一場風(fēng)暴似的腦力壓榨。
目前國際情況,世界上95%的國際高端會議都會采用同聲傳譯的方式進行。但“同聲傳譯”的歷史并不久,第二次世界大戰(zhàn)結(jié)束后,德國紐倫堡國際軍事法庭在審判法西斯戰(zhàn)犯時,才首次采用同聲傳譯。
創(chuàng)新工場董事長兼首席執(zhí)行官李開復(fù)認(rèn)為,一項本來由人從事的工作,如果可以在5秒鐘內(nèi),對工作中需要思考和決策的問題做出相應(yīng)決定,那么,這項工作就有非常大的可能被人工智能全部或部分取代。
按照這一說法,同聲傳譯則是被人工智能取代的危險工種之一,但目前來看結(jié)果并不理想。
今年4月9日,的博鰲亞洲論壇上,騰訊的AI翻譯產(chǎn)品“翻譯君”就出了不小的翻譯事故。當(dāng)天,在博鰲分論壇會場兩側(cè)的大屏幕上,各國嘉賓的演講內(nèi)容被騰訊翻譯君實時識別,并翻譯成中英雙語字幕進行投屏展示。同時,現(xiàn)場觀眾不斷利用微信小程序?qū)钨e演講的雙語同傳內(nèi)容進行回看、收聽和記錄。除了一些無意義重復(fù)的低級錯誤外,AI對“一帶一路”等專有詞匯也不太了解,翻譯成“中國的一條公路和一條腰帶”。
這不是機器翻譯第一次鬧笑話,科大訊飛、搜狗等都因為機器翻譯犯過錯,就連谷歌也不例外。據(jù)中國新聞網(wǎng)報道,今年 2 月 4 日,在韓國平昌冬奧會上,為了給121名運動員備餐,挪威隊主廚用號稱是神經(jīng)網(wǎng)絡(luò)翻譯的谷歌翻譯訂購1500個雞蛋,卻因翻譯錯誤收到15000個雞蛋。收到這么多雞蛋,主廚內(nèi)心應(yīng)該是絕望的:到底什么時候能吃完?
AI翻譯出錯,最高興的要數(shù)人類譯員,畢竟兩者是“搶飯碗”的敵對關(guān)系。
2017年6月,科大訊飛發(fā)布全球首款實時中英互譯神器——曉譯翻譯機。當(dāng)時許多宣傳文章稱,這款產(chǎn)品“可以讓人工同傳消亡”,“是同聲傳譯終結(jié)者”。這些夸大的字眼引起廣大同傳工作者的不滿。
今年3月,微軟宣布“其研發(fā)的機器翻譯系統(tǒng)首次在通用新聞翻譯的漢譯英達到人類專業(yè)水平,超越業(yè)余譯者,實現(xiàn)自然語言處理里程碑突破”,結(jié)果引起諸多吐槽、分析和評測,并一度掀起了對AI翻譯到底能否媲美甚至超越人類,AI翻譯的進展到底會對人類翻譯員產(chǎn)生什么影響等問題的討論。
在本屆世界人工智能大會上,訊飛聽見和騰訊同傳兩家語音轉(zhuǎn)文字產(chǎn)品同臺亮相。馬化騰當(dāng)天在主題演講時表示“騰訊同傳現(xiàn)場采用依靠機器完成,而不是人機協(xié)作”;隨后上臺演講的科大訊飛董事長劉慶峰則說:“我們希望用機器幫助頂尖同傳更好的發(fā)展他的能力,機器和人未來必須是協(xié)同的?!?/p>
在產(chǎn)品表現(xiàn)方面,兩家公司最后打了個平手:從英文流利程度來看,似乎騰訊同傳更勝一籌。每逢嘉賓進行演講語種切換,而科大訊飛的現(xiàn)場反應(yīng)速度需要更長時間。
直到一位名叫Toshio Fukuda的日本科學(xué)院院士上臺演講,騰訊同傳直接“罷工”,科大訊飛則將現(xiàn)場人類同傳的中文語音轉(zhuǎn)文字繼續(xù)工作。也因此,科大訊飛被同傳工作人員視為“造假”。日式英語一直都是很“酸爽”的存在,看來在AI這也沒能避免。
而此時,沒有噱頭也沒有出錯的人類,更像是當(dāng)天同傳工作的主角。和以往一樣,同傳工作人員被安排在所有座位后方的一間口譯室中,輪流透過耳機接收講者的信息,然后對著麥克風(fēng)進行翻譯。坐于會場中的聽眾通過特殊的音訊接收設(shè)備,收聽著同聲傳譯員的翻譯。
在大型會議上,使用AI同傳為什么總是出錯?最根本的原因,同傳本就比文本翻譯難多了。
能做到同傳的人,無疑是語言方面的天才。讓AI去做同傳,則是讓人工智能處理自然語言,但人工智能顯然不具備“天賦”——簡單地說,AI做翻譯,靠的是海量分析數(shù)據(jù)和幫助AI進行學(xué)習(xí)的模型及優(yōu)化算法。
就好比AI已經(jīng)徹底“打敗”人類的圍棋,后者就可以算是最規(guī)整的數(shù)據(jù)了——棋盤上只有361個位置可以下,也只有黑白兩種棋子。更不要提人類上千年來保留的數(shù)以千萬計的棋譜。在AlphaGo最后超越人類那一步時,甚至還開始通過自我對弈來生成全新的數(shù)據(jù)。
翻譯其實也是一個擁有很多“優(yōu)質(zhì)數(shù)據(jù)”的內(nèi)容——因為世界上很多的文學(xué)作品,都有不同語種的譯本。更不要提在線翻譯服務(wù)中海量的使用和反饋記錄了,所以文本翻譯這件事,也算是AI最早有所進展的領(lǐng)域了。
然而,同傳并不只是翻譯,更準(zhǔn)確地說是“轉(zhuǎn)寫+翻譯”。相比格式規(guī)范,字母、單詞書寫方式都一樣的實體內(nèi)容,英語的口語發(fā)音實際上要復(fù)雜的多。要知道,英語這種國際通用語言,在結(jié)合各國的口音后,已經(jīng)衍生出一大堆變化。除了日式英語,印度、俄羅斯等地區(qū)的英語也頗具特色。在B站上,還有一段67種英語口音的匯總視頻。
口語還沒有標(biāo)點符號來標(biāo)記句子,缺少了必要的聲調(diào)和停頓,就很容易造成句子的歧義。而模糊的指令對AI來說,極有可能出現(xiàn)滿屏的亂碼。
國際會議的現(xiàn)場同傳,更要考慮會場噪音、每個人口音、停頓語氣詞等語音信號會對后面的翻譯產(chǎn)生影響;會議對于及時性要求更高,不可預(yù)知情況很難控制,很難給機器足夠的自我調(diào)整時間,要解決機器翻譯對未知困難的自適應(yīng)性,相對較難。此外,會議現(xiàn)場專業(yè)度高、覆蓋度廣,AI對特殊場景的理解還不夠。場景對于語義具有至關(guān)重要的影響,相同的一句話在不同場景里有不同意思。
事實上,就連人類同傳無法做到百分百傳譯,根據(jù) AIIC(國際會議口譯員協(xié)會)的規(guī)定,同傳譯員只要翻譯出演講者內(nèi)容的80%就已經(jīng)算是合格。這意味著AI工作量減少嗎?當(dāng)然不,正是這種模糊的東西使得AI同傳更加困難。
去年6月,科大訊飛在公司公上發(fā)文稱,AI翻譯已經(jīng)取得非常大的進步,在衣食住行等常用生活用語上的中英翻譯可以達到大學(xué)六級的水平,能夠幫助人們在一些場景處理語言交流的問題,但距離會議同傳及高水平翻譯所講究的“信、達、雅”還存在很大差距。
該文章稱,科大訊飛一直所努力的,是希望通過語音轉(zhuǎn)寫和翻譯技術(shù)幫助同傳提高工作效率、減少失誤,形成人機耦合的同傳新模式。
目前,AI已經(jīng)能夠完成絕大部分英語比較好、口音不重的轉(zhuǎn)寫和翻譯任務(wù)。人類同傳只需要應(yīng)對日式英語、俄式英語這樣更棘手的任務(wù)。對于AI來說,一旦集中資源訓(xùn)練出一個“神經(jīng)網(wǎng)絡(luò)”,剩下的事情無非就是把這個“神經(jīng)網(wǎng)絡(luò)”復(fù)制,添加更多硬件算力。
但同時,AI同傳在可預(yù)期的時間內(nèi)(十?dāng)?shù)年)又不能達成完全超越人類的能力。最終形成一個極度“尷尬”的境地——AI和人工各有所長,經(jīng)濟和模式趨勢“逼迫”兩者必須合作。
在人類與AI“合作”的過程中,人類或許很難進一步提升自我,AI卻會進一步成長、逼近。機器對此自然不會帶有情感,但人類卻會面對低等級的勞動力不斷被取代的“壓迫感”。所以不夸張地說,我們是時候提前想想自己怎么和AI一起工作下去了。
資料來源:虎嗅網(wǎng)、億歐網(wǎng)、澎湃新聞等