国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于語料庫的谷歌與有道翻譯對比分析
——以Gone with the wind為例

2020-11-13 02:37:32
文化創(chuàng)新比較研究 2020年24期
關(guān)鍵詞:句法語料庫譯文

徐 行

(南京郵電大學(xué),江蘇南京 210023)

1 概述

機(jī)器翻譯就是利用計(jì)算機(jī)把一種語言(源語言,source language)翻譯成另外一種語言 (目標(biāo)語言,target language),實(shí)現(xiàn)各種自然語言之間的自動(dòng)轉(zhuǎn)換,是人工智能和自然語言處理領(lǐng)域的重要研究方向之一。雖然機(jī)器翻譯已經(jīng)發(fā)展多年,但現(xiàn)實(shí)中仍存在許多問題。我國學(xué)者馮志偉先生提出:“從已經(jīng)推出的實(shí)用化MT系統(tǒng)的譯文質(zhì)量來看,還不十分令人滿意,對于一些稍長的句子,或結(jié)構(gòu)稍復(fù)雜的句子,譯文質(zhì)量就不能令人滿意,有時(shí)簡直不可卒讀?!倍遥坝?jì)算機(jī)翻譯不適用于文學(xué)性很強(qiáng)或文化味很濃的文本,而適用于科普文獻(xiàn),金融商業(yè)交易,行政管理備忘錄,法律文件,說明書,農(nóng)業(yè)及醫(yī)學(xué)材料,工業(yè)專利,宣傳冊,報(bào)紙報(bào)道等[1]。”

因此,本文以谷歌與有道翻譯關(guān)于Gone with the wind的譯文為例,分析MT的錯(cuò)譯類型,并進(jìn)行兩種翻譯引擎之間的對比。

2 機(jī)器譯文錯(cuò)誤類型對比分析

2.1 語料來源和研究方法[2]

本次研究中使用的語料為Gone with the wind第一章的部分節(jié)選以及谷歌翻譯和有道翻譯對應(yīng)的中文譯文,對比的人工譯文為上海文藝出版社的陳良廷譯本——《亂世佳人》。在對機(jī)器譯文和人工譯文展開全面的平行對比中,對機(jī)器譯文出現(xiàn)的各種錯(cuò)誤根據(jù)前人總結(jié)的機(jī)器譯文錯(cuò)誤類型(表1)加以標(biāo)注,并對錯(cuò)誤的發(fā)生頻率進(jìn)行統(tǒng)計(jì),得到圖1所示的谷歌與有道譯文錯(cuò)誤率和圖2所示的谷歌與有道譯文三大類型錯(cuò)誤率。其中錯(cuò)誤譯文指機(jī)器譯文中至少包含表1所列錯(cuò)誤類型中的一種錯(cuò)誤,錯(cuò)誤率為出現(xiàn)錯(cuò)誤的機(jī)器譯文總句數(shù)/機(jī)器譯文總句數(shù)*100%。對同一句子中多次出現(xiàn)的同一類型機(jī)器譯文錯(cuò)誤(如詞匯詞性錯(cuò)誤),只進(jìn)行一次標(biāo)注和統(tǒng)計(jì)。下文將對譯文對比中觀察到的部分機(jī)器譯文錯(cuò)誤現(xiàn)象加以對比描述。

表1

圖1

圖2

2.2 機(jī)器翻譯詞匯錯(cuò)譯分析[3]

詞匯是組成句子的最基本要素,所以也是衡量機(jī)器翻譯質(zhì)量的關(guān)鍵。由圖2可以看出,谷歌與有道翻譯在詞匯錯(cuò)譯所占比例較大,且谷歌遠(yuǎn)遠(yuǎn)高于有道翻譯。在對譯文進(jìn)行對比分析的過程中,發(fā)現(xiàn)在二級錯(cuò)誤中,詞匯詞性錯(cuò)譯、詞匯漏譯和詞匯形容詞錯(cuò)譯所占比重較大。下面將進(jìn)行舉例說明。

(1)But it was an arresting face, pointed of chin, square of jaw.

有道:但這是一張引人注目的臉,尖下巴,方下巴。

谷歌: 但這是一張令人震驚的臉,指向下巴,下巴直角。

人工:不過這張臉還是挺引人注目,尖尖的下巴頦兒,方方的牙床骨兒。

首先,關(guān)于“arresting”,牛津詞典的解釋是“very attractive”,而谷歌卻翻譯成“令人震驚的”,不禁讓讀者對女主人公的外貌產(chǎn)生極大的誤解。而“pointed”和“square”在原文中是作為形容詞來修飾后面的名詞的,谷歌卻分別作為動(dòng)詞和名詞來翻譯。關(guān)于“chin”和“jaw”的區(qū)別,“chin”的柯林斯詞典中的解釋為“the part of your face that is below your mouth and above your neck”,而對“jaw”的一種解釋為“A person’s or animal’s jaws are the two bones in their head which their teeth are attached to”。 但是兩種翻譯引擎都簡單地翻譯成了“下巴”。

(2)...their bodies clothed in identical blue coats and mustard-colored breeches, they were as much alike as two bolls of cotton.

有道:身上穿著一模一樣的藍(lán)色外套和墨綠色的馬褲,像兩團(tuán)棉花。

谷歌:他們的身體穿著相同的藍(lán)色外套和芥末色的馬褲,十分相似作為兩個(gè)棉鈴。

人工:身穿一模一樣的藍(lán)上衣,一模一樣的芥末色馬褲,哥兒倆活像兩個(gè)一模一樣的棉桃。

這里原文之所以將兩個(gè)人比作棉桃,是為了強(qiáng)調(diào)他們作為穿著一樣的衣服的孿生兄弟是多么的相似,而有道的譯文只翻譯出了棉花,卻漏譯了他們的相似,谷歌就直接字字對應(yīng)地翻譯,將應(yīng)理解成“像”、“如同”的“as”,翻譯成了“作為”,產(chǎn)生了歧義。另外,谷歌將“bodies”直接譯成“身體”,讀來十分生硬。

(3)The boys looked uncomfortable,recalling their mother's conduct three months ago when they had come home, by request, from the University of Virginia.

有道:兩個(gè)孩子看上去很不自在,回想起三個(gè)月前他們應(yīng)弗吉尼亞大學(xué)的要求回家時(shí)母親的舉動(dòng)。

谷歌:這些男孩看上去不舒服,回想起三個(gè)月前他們應(yīng)弗吉尼亞大學(xué)的要求回家時(shí)母親的行為。

人工:哥兒倆想起三個(gè)月前他們從弗吉尼亞大學(xué)被請回家時(shí)他們母親的管教方式,臉色頓時(shí)不大自在。

這里的“uncomfortable”應(yīng)該理解為“anxious,embarrassed or afraid and unable to relax”,有道翻譯比較符合,而谷歌卻按“not feeling physically relaxed”理解,翻譯成了“不舒服”,與原文不符。而且谷歌對“the boys”的處理也沒有聯(lián)系上文的語境,有道處理地較為恰當(dāng)。

另外,關(guān)于對人名、地名等專有名詞的處理,有道大多數(shù)翻譯恰當(dāng),而谷歌常常不譯或者錯(cuò)譯。對一些指代詞的處理,谷歌往往無法結(jié)合語境,例如“poor Cracker neighbors”中的“Cracker”應(yīng)理解為“an offensive word for a poor white person with little education from the southern US”,有道翻譯成“窮鄰居”較為符合,而谷歌翻譯成“貧窮的餅干小鄰居”,令人啼笑皆非。

2.3 機(jī)器翻譯句法錯(cuò)譯分析

英語具有“形合”的特征,句法是其“形合”實(shí)現(xiàn)的重要方式,是組織零散詞匯構(gòu)成句子的手段,嚴(yán)重的句法錯(cuò)誤可能使整個(gè)句子變得凌亂不堪,不知所云。由圖2可以看出,無論是谷歌還是有道翻譯,在句法錯(cuò)譯都占了較大的比例[4]。在分析對比的過程中,發(fā)現(xiàn)二級錯(cuò)誤中的句法動(dòng)詞短語和介詞短語錯(cuò)譯出現(xiàn)較為頻繁,下面將舉例分析。

(4)He'll never get finished at this rate.

有道:照這樣下去,他永遠(yuǎn)也完不成。

谷歌:他永遠(yuǎn)不會(huì)以這樣的速度完成任務(wù)。

人工:這樣的話他可休想畢業(yè)了。

這句話在原文中是說因?yàn)閮尚值芸偸潜粚W(xué)校開除,連累他們的哥哥也不能呆在學(xué)校,因此完不成學(xué)業(yè)。介詞短語“at this rate”是“照此情形”、“如此下去”的意思,谷歌卻將“rate”直接翻譯成了“速度”。有道翻譯雖然較為符合,但“完不成”后面的賓語卻沒有表達(dá)完整。

(5)“Not going to be any war! ” cried the twins indignantly, as though they had been defrauded.

有道:“不會(huì)有戰(zhàn)爭!”孿生兄弟憤怒地喊道,仿佛他們被騙了似的。

谷歌:“不會(huì)發(fā)生任何戰(zhàn)爭!”這對雙胞胎怒不可遏地哭了起來,好像他們已經(jīng)被騙了一樣。

人工:“什么仗也不會(huì)打!”哥兒倆憤憤地喊道,仿佛他們上了當(dāng)似的。

在原文中只是三個(gè)朋友因?yàn)閷?zhàn)爭的看法不同發(fā)生了一點(diǎn)爭吵,沒有到“憤怒”或“怒不可遏”的程度,用“憤憤地”更能表達(dá)出兩兄弟雖然不滿但是為了不讓女主人公生氣只得停止討論戰(zhàn)爭的心情?!癱ry”在這里是“to shout loudly”,谷歌譯成“哭”,脫離了原文的意思。

(6)She was hot-tempered and easily plagued by the frequent scrapes of her four sons, and while no one was permitted to whip a horse or a slave, she felt that a lick now and then didn't do the boys any harm.

有道:她脾氣暴躁,四個(gè)兒子經(jīng)常用鞭子抽打她,這使她很難受。雖然家里不許任何人抽打馬或奴隸,但她覺得偶爾打一下對孩子們并沒有什么害處。

谷歌:她脾氣暴躁,容易被四個(gè)兒子的經(jīng)常擦傷所困擾,雖然沒有人被允許鞭打馬匹或奴隸,但她感到時(shí)不時(shí)舔舔?qū)δ泻]有任何傷害。

人工:她是個(gè)火爆性子,動(dòng)不動(dòng)就給這四個(gè)經(jīng)常惹是生非的兒子煩死,盡管她不準(zhǔn)誰鞭打奴隸和馬,可她覺得時(shí)常抽孩子幾下對他們倒沒害處。

“scrape”在這里是名詞,表示“(old-fashioned)a difficult situation that you have caused yourself”,同義詞有“predicament”,“trouble”,“difficulty”等,而兩種翻譯引擎分別理解成了“用鞭子抽打”和“擦傷”,嚴(yán)重曲解了原意。而“l(fā)ick”一詞除了“舔”的意思之外,在柯林斯詞典中還解釋為“If you lick someone or something, you easily defeat them in a fight or competition.” 同義詞有“beat”,“defeat”,“overcome”等,而谷歌的翻譯與原文的語境嚴(yán)重不符。

3 結(jié)語

本次語料庫數(shù)據(jù)統(tǒng)計(jì)得出的圖1顯示,與谷歌翻譯相比,有道翻譯的準(zhǔn)確譯文比例較高,錯(cuò)誤譯文比例較低;圖2顯示,在詞匯錯(cuò)譯、句法錯(cuò)譯和其他類型中,谷歌錯(cuò)誤率高于有道翻譯[5]。另外,在對譯文二級錯(cuò)誤進(jìn)行對比分析時(shí),發(fā)現(xiàn)有道翻譯整體譯文質(zhì)量高于谷歌翻譯。谷歌偏向于字對字的直譯,而有道翻譯有時(shí)可以轉(zhuǎn)換句式,不囿于原有的英文句式。并且對于人名、地名等專有名詞的翻譯,有道翻譯更加靈活準(zhǔn)確,而谷歌翻譯對一些習(xí)語的處理也比較生硬,建議谷歌翻譯借助自身的搜索引擎在互聯(lián)網(wǎng)中搜索相關(guān)的信息作為翻譯的參考。當(dāng)然,有道翻譯也存在著許多的問題,在結(jié)合語境、加大自身語料庫建設(shè)方面還有進(jìn)一步完善的空間。針對谷歌和有道翻譯存在的問題,筆者認(rèn)為可以從以下方面改進(jìn)翻譯引擎質(zhì)量:進(jìn)一步加大自身語料庫建設(shè),可以通過開放性輸入平臺的方式最大程度收集雙語固定表達(dá)形式及對應(yīng)意思,以盡可能多的識別習(xí)語、慣用語等;借助互聯(lián)網(wǎng)對需要進(jìn)行翻譯的語句進(jìn)行模糊匹配搜索,找出其他網(wǎng)頁或者數(shù)據(jù)庫中的關(guān)聯(lián)信息,作為翻譯的參考;通過海量分析識別具有類型化和高重復(fù)性特征的錯(cuò)誤,在下一次錯(cuò)誤觸發(fā)時(shí)進(jìn)行準(zhǔn)確糾錯(cuò)[6]。

最后,作為語言學(xué)習(xí)者,我們不能過度依賴翻譯工具,而應(yīng)將自己扎實(shí)的語言能力作為基礎(chǔ),正確使用翻譯軟件,找準(zhǔn)翻譯技巧,提高翻譯效率,讓工具真正為我們的語言學(xué)習(xí)服務(wù)。

猜你喜歡
句法語料庫譯文
Stem cell-based 3D brain organoids for mimicking,investigating,and challenging Alzheimer’s diseases
句法與句意(外一篇)
中華詩詞(2021年3期)2021-12-31 08:07:22
述謂結(jié)構(gòu)與英語句法配置
《語料庫翻譯文體學(xué)》評介
譯文摘要
句法二題
中華詩詞(2018年3期)2018-08-01 06:40:40
詩詞聯(lián)句句法梳理
中華詩詞(2018年11期)2018-03-26 06:41:32
把課文的優(yōu)美表達(dá)存進(jìn)語料庫
I Like Thinking
基于JAVAEE的維吾爾中介語語料庫開發(fā)與實(shí)現(xiàn)
語言與翻譯(2015年4期)2015-07-18 11:07:45
潞西市| 延川县| 桦川县| 遂昌县| 陈巴尔虎旗| 阿巴嘎旗| 开阳县| 扎兰屯市| 南澳县| 宜宾市| 车险| 额尔古纳市| 通江县| 湟源县| 临海市| 胶州市| 丹棱县| 吉首市| 大竹县| 莱阳市| 泰顺县| 巨鹿县| 内丘县| 潞西市| 东至县| 墨江| 贵州省| 连江县| 固原市| 沁阳市| 应用必备| 青川县| 漾濞| 绍兴市| 德令哈市| 霞浦县| 天峻县| 秀山| 红河县| 中方县| 庆云县|