国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

機(jī)器翻譯過程中詞匯層面的譯前編輯方法

2021-03-14 02:48:52樊飛飛
關(guān)鍵詞:原文譯文詞匯

陳 蓉,樊飛飛,王 曉

(西安郵電大學(xué) 人文與外國語學(xué)院,陜西 西安 710121)

機(jī)器翻譯是指無需人工翻譯,借助機(jī)器將源語言翻譯成目標(biāo)語言。早期機(jī)器翻譯基于規(guī)則與統(tǒng)計(jì)模型,隨著人工智能的發(fā)展,基于深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯開始有了突破性的進(jìn)展,提高機(jī)器翻譯的質(zhì)量成為數(shù)字經(jīng)濟(jì)時(shí)代迫切的需求。

國外研究方面,提出了在使用機(jī)器翻譯前對源文本進(jìn)行譯前編輯的想法,并總結(jié)出簡化寫作的十條規(guī)則[1],但其中的大部分建議是基于句子層面的考慮。對研究英語新聞標(biāo)題的機(jī)器翻譯,提出可在機(jī)器翻譯系統(tǒng)中添加譯前編輯模塊。將英語新聞標(biāo)題自動(dòng)改寫成普通文本后再進(jìn)行機(jī)器翻譯,以提高翻譯質(zhì)量[2],但這一過程的譯前編輯主要是對文本進(jìn)行改寫,操作較為復(fù)雜。文獻(xiàn)[3]提出以人工評估方法發(fā)現(xiàn)翻譯錯(cuò)誤,創(chuàng)建自動(dòng)的譯前編輯模式。文獻(xiàn)[4]對基于日語和英語的機(jī)器翻譯譯前編輯系統(tǒng)進(jìn)行了研究。此外,還從行業(yè)和學(xué)術(shù)研究的角度描述了源文本機(jī)器翻譯的譯前編輯和譯后編輯[5]。上述研究雖然就譯前編輯做了一些探討,但是都沒有提出較為具體和可行的譯前編輯方法。

相比之下,國內(nèi)研究更注重譯前編輯策略的研究。文獻(xiàn)[6]以真實(shí)的項(xiàng)目案例,結(jié)合理論分析了人工干預(yù)對機(jī)器翻譯的重要性,總結(jié)出人機(jī)共譯可以提高翻譯效率和質(zhì)量,通過案例分析了譯前編輯策略[7-10]。以上研究都認(rèn)為譯前編輯對提升譯文質(zhì)量有幫助,但其案例分析樣本有局限性,并且多采用主觀分析對譯文效果進(jìn)行評價(jià)。

傳統(tǒng)的機(jī)器翻譯在設(shè)計(jì)模型時(shí)通常根據(jù)語言學(xué)知識進(jìn)行架構(gòu),而端到端的神經(jīng)機(jī)器翻譯,其內(nèi)部全部使用向量表示,從語言學(xué)的角度看可解釋性較差。因此,在設(shè)計(jì)新結(jié)構(gòu)時(shí)融入語言學(xué)知識成為新的問題。針對機(jī)器翻譯過程中譯前編輯的有效性缺乏客觀評價(jià),譯前編輯策略與方法的研究較為籠統(tǒng)等問題,擬提出基于詞匯層面的譯前編輯方法。采用雙語評估替換方法(Bilingual Evaluation Understudy,BLEU)對基于詞匯層面的譯前編輯效果進(jìn)行質(zhì)量評估。以Google在線翻譯為工具,通過BLEU對原始的機(jī)器翻譯譯文與譯前編輯后的機(jī)器翻譯譯文進(jìn)行比較,從而驗(yàn)證譯前編輯方法的有效性。

1 問題描述

隨著神經(jīng)網(wǎng)絡(luò)與人工智能的飛速發(fā)展,機(jī)器翻譯的譯文質(zhì)量得到提高,翻譯速度和效率遠(yuǎn)超傳統(tǒng)的人工翻譯。在充分利用文本特征,借助人工干預(yù),并用客觀有效的設(shè)計(jì)提高譯文質(zhì)量方面,人工智能和深度學(xué)習(xí)為實(shí)現(xiàn)這一目標(biāo)提供了切實(shí)可行的思路。

1.1 機(jī)器翻譯

利用機(jī)器進(jìn)行翻譯的想法最早出現(xiàn)于20世紀(jì)30年代早期,受當(dāng)時(shí)技術(shù)發(fā)展水平和條件限制,翻譯機(jī)器未能被成功開發(fā)。1949年,美國科學(xué)家韋弗正式提出機(jī)器翻譯的思想[11]。2013年提出了機(jī)器翻譯的“解碼-編碼框架”[12],其以遞歸神經(jīng)網(wǎng)絡(luò)作為解碼器,卷積神經(jīng)網(wǎng)絡(luò)作為編碼器。先將源語言映射為一個(gè)連續(xù)、稠密的向量,再將此向量轉(zhuǎn)化為目標(biāo)語言。神經(jīng)機(jī)器翻譯在2016年取得重大突破,翻譯性能和翻譯質(zhì)量大幅提高,取代了統(tǒng)計(jì)機(jī)器翻譯的優(yōu)勢地位。同年,Google推出神經(jīng)機(jī)器翻譯系統(tǒng),將句子而非短語作為翻譯單元,提高翻譯的準(zhǔn)確度和流暢度[13]。

然而,機(jī)器翻譯也存在著諸多弊端和問題。文獻(xiàn)[14]通過對機(jī)器翻譯譯文中出現(xiàn)的錯(cuò)譯進(jìn)行標(biāo)注和統(tǒng)計(jì),歸納分析了各類句法錯(cuò)譯的典型形式,如動(dòng)詞錯(cuò)譯、短語錯(cuò)譯及從句錯(cuò)譯等,減輕了對語言進(jìn)行形式化處理的工作。文獻(xiàn)[15]以科技文本為例,整理出11種機(jī)器翻譯錯(cuò)誤類型,包括術(shù)語翻譯錯(cuò)誤、形式錯(cuò)誤、格式錯(cuò)誤、短語順序錯(cuò)誤、過譯和欠譯等。文獻(xiàn)[16]歸納總結(jié)出基于實(shí)例的機(jī)器翻譯尚且存在3類典型錯(cuò)誤,分別是語內(nèi)詞項(xiàng)、語內(nèi)結(jié)構(gòu)性關(guān)系以及語外因素導(dǎo)致的識別錯(cuò)誤。以上研究均表明機(jī)器翻譯存在缺陷,譯文效果未能達(dá)到預(yù)期目標(biāo),并且都從譯后編輯的角度提出關(guān)于提高譯文質(zhì)量的相應(yīng)策略,對關(guān)注譯前編輯在提高譯文質(zhì)量方面的應(yīng)用方面欠缺。

1.2 譯前編輯

譯前編輯,即在人工干預(yù)、編輯和修改源語文本的前提下,運(yùn)用機(jī)器翻譯軟件對源語文本進(jìn)行翻譯處理,最終生成目的語譯文文本的過程[7]。具體而言,在譯前編輯工作中,需要對源文本中不易識別和理解的詞匯、句型表達(dá)方式等進(jìn)行處理,使機(jī)器能夠正確地識別和理解。文獻(xiàn)[7]先通過人工評測的方法選擇機(jī)器翻譯引擎,再對源語文本進(jìn)行詞級和句級的譯前編輯,以提升譯文質(zhì)量。文獻(xiàn)[8]對源文本分別進(jìn)行了譯前編輯、譯后編輯以及譯前譯后結(jié)合等3種人工干預(yù),在結(jié)論部分未能提供明確的數(shù)據(jù)支撐,雖然表明了譯文質(zhì)量的提高,但缺乏科學(xué)性。文獻(xiàn)[9]設(shè)計(jì)的翻譯質(zhì)量對比實(shí)驗(yàn)也是通過人工評測進(jìn)行結(jié)果詮釋,缺乏客觀性。

綜上所述,聚焦詞匯層面,借助BLEU,嘗試探索機(jī)器翻譯的譯前編輯方法在提高機(jī)器翻譯譯文質(zhì)量方面的應(yīng)用。

2 研究工具和語料選取

譯前編輯方法有助于機(jī)器翻譯得到質(zhì)量更高的譯文。具體來看,文獻(xiàn)[7]中提出常見的譯前編輯工作包括對原文進(jìn)行格式轉(zhuǎn)換、拼寫、標(biāo)點(diǎn)符號檢查、語法檢查、句子調(diào)整及使用受控自然語言等。文獻(xiàn)[17]提到譯前編輯通常涉及格式處理和語言處理兩部分。文獻(xiàn)[18]總結(jié)出的譯前編輯方法包括對原文進(jìn)行結(jié)構(gòu)調(diào)整、增減、提前翻譯術(shù)語、歧義消解以及補(bǔ)充標(biāo)點(diǎn)符號。文獻(xiàn)[19]中主要的譯前編輯指導(dǎo)包括詞法與句法層次的切分,離合詞的語義整合,語素詞的語義切分,名詞性短語、動(dòng)詞性短語、形容詞性短語、主謂短語等的短語切分,長句的意群切分和斷句等。此外,ACCEPT(Automated Community Content Editing PorTal)系統(tǒng)的譯前編輯方法在文獻(xiàn)[20]中主要涉及對語體的拼寫、語法、形態(tài)變化、格式以及專有名詞等的調(diào)整。經(jīng)上述文獻(xiàn)比對研究之后,總結(jié)出詞匯的增刪、替代以及術(shù)語提前是詞匯層面較為理想的譯前編輯方法。

2.1 研究工具

目前,主流的翻譯評測方法主要是人工評測和機(jī)器自動(dòng)評測??紤]譯文的表達(dá)沒有絕對正確或絕對錯(cuò)誤的標(biāo)準(zhǔn),人工評測時(shí),其評測結(jié)果會因不同的人在認(rèn)知、經(jīng)驗(yàn)和思維方式等方面存在差異而帶有很強(qiáng)的主觀性,為避免這一影響,采用機(jī)器自動(dòng)評測方法。BLEU是一種基于N元語法的機(jī)器翻譯自動(dòng)評測方法[21],其基于文本相似度對譯文質(zhì)量進(jìn)行評估,結(jié)果較為客觀,總體評價(jià)表達(dá)式為

其中:B表示懲罰因子;pn是指出現(xiàn)在參考譯文中的n元詞組占機(jī)器翻譯譯文中n元詞語組總數(shù)的比例,ωn=1/N,N為最大的n元語法階數(shù)。

采用BLEU對譯文進(jìn)行評價(jià),用譯文中出現(xiàn)的N元組和參考譯文中出現(xiàn)的N元組相比,計(jì)算匹配的N元組個(gè)數(shù)與機(jī)器翻譯譯文的N元組總個(gè)數(shù)的比例,即將機(jī)器翻譯產(chǎn)生的譯文與人工譯者提供的參考譯文相比較,越接近,則機(jī)器翻譯譯文的正確率越高。

2.2 語料選取

在使用BLEU工具對譯前編輯方法進(jìn)行有效性驗(yàn)證時(shí),需要選取權(quán)威可靠的參考譯文對機(jī)器翻譯結(jié)果進(jìn)行比對。何剛強(qiáng)的《筆譯理論與技巧》以及武峰的《十二天突破英漢翻譯》是通用筆譯培訓(xùn)教材,其中的翻譯實(shí)例堪作范例。典型多元的翻譯實(shí)例也便于根據(jù)其機(jī)器翻譯結(jié)果選擇適合的譯前編輯方式展開有效性研究。

2.3 研究過程

Google翻譯是一款基于瀏覽器的翻譯軟件,兼容性很強(qiáng),是目前業(yè)內(nèi)使用最廣泛的翻譯引擎,其基本翻譯原理如圖1所示。

圖1 GNMT處理英漢翻譯的原理

Google翻譯采用了一種可以進(jìn)行深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)翻譯系統(tǒng)(Google’s Neutral Machine Translation,GNMT),通過對句子進(jìn)行整體翻譯,提高了翻譯的準(zhǔn)確性和流暢度。與此同時(shí),Google還在其中建立了一個(gè)端到端的學(xué)習(xí)系統(tǒng),使整個(gè)翻譯系統(tǒng)能夠獨(dú)立地進(jìn)行學(xué)習(xí)和訓(xùn)練,從而提高了翻譯水平。

采用Google翻譯作為機(jī)器翻譯引擎,具體翻譯步驟如下。

步驟1將原文輸入到Google翻譯引擎中,得到第一組譯文。

步驟2針對第一組譯文所出現(xiàn)的問題,對原文進(jìn)行基于詞匯層面的譯前編輯,包括詞類增補(bǔ)、刪除、替代以及術(shù)語提前等4個(gè)方面。

步驟3將經(jīng)過譯前編輯的文本輸入到Google翻譯引擎中,得到第二組譯文。

步驟4通過對比兩組譯文的BLEU值,判斷基于詞匯層面的譯前編輯效果是否顯著。

3 應(yīng)用結(jié)果與分析

漢語與英語屬于不同的語系,二者在書寫規(guī)則、語義對比及句法結(jié)構(gòu)等方面有很大的差別。根據(jù)以往的實(shí)踐經(jīng)驗(yàn)來看,機(jī)器翻譯的結(jié)果對譯者只能起到輔助性的作用,譯者的有效介入是譯文翻譯過程中的重要環(huán)節(jié)。譯前編輯方法在輸入原文之前,譯者可以根據(jù)原文的特征對其進(jìn)行增補(bǔ)、刪減、替代和術(shù)語提前等相應(yīng)的處理,從而使機(jī)器翻譯能夠更好地識別原文的內(nèi)容,提高譯文質(zhì)量。

3.1 增補(bǔ)

翻譯時(shí),譯者可以根據(jù)英漢兩種語言的邏輯結(jié)構(gòu)和表達(dá)方式的不同,添加一些詞句,使譯文的意思表述更準(zhǔn)確。因此,在對原文本進(jìn)行詞匯層面的譯前編輯時(shí),在原文中增添詞語也是提高譯文質(zhì)量的方法之一。

例1原文:Man,was,is and always will be trying to improve his living conditions.

參考譯文:無論是在過去、現(xiàn)在還是將來,人們總是在盡力改善生活條件。

譯文:過去,現(xiàn)在,將來將永遠(yuǎn)努力改善他的生活條件。

譯前編輯后:Man,no matter was,is and always will be trying to improve his living conditions.

譯前編輯后譯文:人,無論過去,現(xiàn)在還是將來都將努力改善他的生活條件。

第一組譯文的BLEU值為22.01,第二組為38.21,在經(jīng)過譯前編輯之后,BLEU值提高了16.2。在例1中,過去、現(xiàn)在和將來包含一種條件關(guān)系,第一組譯文不僅沒有翻譯出這種條件關(guān)系,而且主語也被忽略。因此,在譯前編輯時(shí)對這種條件關(guān)系進(jìn)行補(bǔ)充,得到的第二組譯文就更為完善和精確。

此外,在英文原文中沒有表達(dá)邏輯關(guān)系的詞語,但根據(jù)上下文可以判斷出其隱含的邏輯關(guān)系,如轉(zhuǎn)折、假設(shè)、讓步和因果關(guān)系等。在譯前編輯時(shí),也可以適當(dāng)?shù)卦诰渲谢蚓渥又g補(bǔ)充關(guān)聯(lián)詞,如例2所示。

例2原文:Ice is not as dense as water and it floats.

參考譯文:冰的密度比水小,因此能浮在水面上。

譯文:冰的密度不如水,它會漂浮。

譯前編輯后:Ice is not as dense as water and so it floats.

譯前編輯后譯文:冰的密度不及水,因此它會漂浮。

在例2中,譯前編輯時(shí)增加了隱含的因果關(guān)系詞“so”,機(jī)器翻譯結(jié)果就得到了改善,BLEU值由16.91增長到22.77。

例3原文:These concepts,values and objectives provide a solid foundation and clear guidance for our mutually beneficial and pragmatic cooperation.

參考譯文:這些理念、價(jià)值觀和目標(biāo)為我們的互利務(wù)實(shí)合作奠定了堅(jiān)實(shí)的基礎(chǔ),并給予明確的指導(dǎo)。

譯文:這些概念,價(jià)值觀和目標(biāo)為我們互利,務(wù)實(shí)的合作奠定了堅(jiān)實(shí)的基礎(chǔ)和明確的指導(dǎo)。

譯前編輯后:These concepts,values and objectives provide a solid foundation and give clear guidance for our mutually beneficial and pragmatic cooperation.

譯前編輯后譯文:這些概念,價(jià)值觀和目標(biāo)為我們互利,務(wù)實(shí)的合作奠定了堅(jiān)實(shí)的基礎(chǔ),并提供了明確的指導(dǎo)。

在未進(jìn)行譯前編輯時(shí),所獲得的譯文中出現(xiàn)了動(dòng)賓搭配不當(dāng)?shù)那闆r,如“奠定明確的指導(dǎo)”,在譯前編輯時(shí)就需要添加相應(yīng)的動(dòng)詞“give”,BLEU值也隨之增長了5.04,表明譯文質(zhì)量得到改善。因此,在譯前編輯時(shí),根據(jù)上下文的具體意義,需要在某些名詞之前或之后增加相應(yīng)的動(dòng)詞搭配。這里所說的動(dòng)詞不僅指的是句子前面出現(xiàn)過而后省略的動(dòng)詞,還包括原文中沒有的動(dòng)詞,才能使譯文的意思明確完整,讀起來也較通順自然,符合漢語的表達(dá)習(xí)慣。

例4原文: We don’t retreat,we never have and never will.

參考譯文:我們不后退,我們從沒有后退,將來也絕不會后退。

譯文:我們不撤退,我們永遠(yuǎn)也不會。

譯前編輯后:We don’t retreat,we never have retreated and never will.

譯前編輯后譯文:我們不撤退,我們從未撤退,也永遠(yuǎn)不會撤退。

第一組譯文中,機(jī)器翻譯未完全傳達(dá)出原文的全部內(nèi)容,影響原文理解。同時(shí),漢語常使用重復(fù)性的表述增強(qiáng)語氣,例4便是如此。在譯前編輯時(shí),對原文句意中重復(fù)的內(nèi)容進(jìn)行添加,得到的第二組譯文便表達(dá)出了原文中的含義,BLEU值也相應(yīng)增加了10.93。在例4中,詞匯增補(bǔ)使譯文在內(nèi)容表達(dá)上與原文相同,避免了翻譯錯(cuò)誤。同樣,采用此類譯前編輯方法還可以使翻譯出來的句子在文化背景、詞語聯(lián)想方面與原文本保持一致,不影響原文理解。

例5原文:To explore the moon’s surface,rockets were launched again and again.

參考譯文:為了探測月球的表面,人們一次又一次地發(fā)射火箭。

◎益生菌 金雙歧、培菲康、媽咪愛都可以。培菲康,膠囊的便宜,和袋裝的劑量一樣。媽咪愛,相對來說有點(diǎn)怪味道,寶寶不反對的話也可以用。

譯文:為了探索月球表面,火箭一次又一次地發(fā)射出去。

譯前編輯后:To explore the moon’ surface,rockets were launched again and again by people.

譯前編輯后譯文:為了探索月球表面,人們一次又一次地發(fā)射了火箭。

在例5中,“火箭發(fā)射”這一動(dòng)作是被動(dòng)發(fā)生的,但在未經(jīng)譯前編輯時(shí),譯文中缺少相應(yīng)的邏輯主語,對主語進(jìn)行添加后,譯文的BLEU值從46.54增長到68.36,句子成分也變得相對完整,具有邏輯性。此外,考慮表達(dá)習(xí)慣的不同,漢語語言表達(dá)與分析重意不重形,句子中即使沒有人稱或非人稱,沒有主語或動(dòng)詞,讀者也可以意會到主動(dòng)或被動(dòng)[22]。

在譯前編輯時(shí),可以根據(jù)不同的語境情況對原句進(jìn)行補(bǔ)充,增補(bǔ)類BLEU值如圖2所示。

圖2 增補(bǔ)類BLEU值

3.2 刪減

刪減與增補(bǔ)法相對應(yīng),是指將原文中不符合目的語表達(dá)習(xí)慣以及重復(fù)贅余等詞匯刪去,或者不在譯文中進(jìn)行翻譯,但譯文給讀者的感受和原文相同。刪減的原則是不能影響原文意思的完整性,并且要符合漢語表達(dá)規(guī)范。在此原則下,凡違反漢語表達(dá)習(xí)慣的詞語都應(yīng)予以刪去,使譯文簡潔。

例1原文:The more he tried to hide his mistakes,the more he revealed them.

譯文:他越想隱藏自己的錯(cuò)誤,就越能揭示它們。

譯前編輯后:The more he tried to hide his mistakes,the more he revealed.

譯前編輯后譯文:他越想掩飾自己的錯(cuò)誤,就越能揭示出來。

第一組譯文將“them”翻譯成“它們”,而例1中想表達(dá)的“越能揭示出來”的內(nèi)容就是他自己的錯(cuò)誤。因此,譯文中不必再用“它們”體現(xiàn),其語意在譯文中是不言而喻的。在譯前編輯時(shí)將代詞“them”刪去,機(jī)器翻譯就可以獲得不違背漢語語言習(xí)慣的譯文。其中,第一組譯文的BLEU值為34.78,第二組為51.12,譯前編輯效果顯著。此外,機(jī)器翻譯譯文中均使用了“揭示”這一動(dòng)詞,完整的動(dòng)賓搭配即為“揭示錯(cuò)誤”,而“揭示”是使人看清原來不易看出的事理,一般不和錯(cuò)誤搭配使用。因此,此處需要譯后編輯進(jìn)行調(diào)整。

例2原文:I had many wonderful ideas,but I only put a few into practice.

參考譯文:我有很多美妙的想法,但只有少數(shù)付諸實(shí)踐了。

譯文:我有很多很棒的主意,但我只付諸實(shí)踐。

譯前編輯后:I had many wonderful ideas,but only put a few into practice.

譯前編輯后譯文:我有很多很棒的想法,只有一些付諸實(shí)踐。

在例2中,未經(jīng)譯前編輯時(shí),“a few”被忽略,沒有翻譯,造成整個(gè)句子意思表示的不完整。根據(jù)漢語的表達(dá)習(xí)慣,前句出現(xiàn)一個(gè)主語,后句如果仍為同一主語,就不必再次出現(xiàn)。第一組譯文的表述違背了這一原則,而在譯前編輯時(shí),將“I”刪去,得到的第二組譯文在內(nèi)容表達(dá)上基本與原文本一致,且符合漢語的表達(dá)習(xí)慣,BLEU值也從26.71增長到37.15。

例3原文:We have made some achievements,and we must guard against complacency.

參考譯文:我們?nèi)〉昧艘恍┏煽?,但還要防止自滿情緒。

譯文:我們已經(jīng)取得了一些成就,我們必須防止自滿。

譯前編輯后:We have made some achievements,and must guard against complacency.

譯前編輯后譯文:我們?nèi)〉昧艘恍┏删停仨氈?jǐn)防自滿。

未經(jīng)譯前編輯的譯文與例2一樣,同屬于不符合漢語的表達(dá)習(xí)慣。因此,將后半句的主語“we”刪去,得到的第二組譯文BLEU值就得到提升,由38.09增長為40.52。

例4原文:A domestic appliance,for instance,a domestic refrigerator or a household smoke exhaust ventilator,can electrify itself.

參考譯文:家用電器可能帶電,比如電冰箱或抽油煙機(jī)等。

譯文:家用電器,如家用冰箱或家用排煙呼吸機(jī)可以使自己通電。

譯前編輯后:A domestic appliance,for instance,a domestic refrigerator or a household smoke exhaust ventilator,can electrify.

譯前編輯后譯文:家用電器,例如家用冰箱或家用排煙通風(fēng)機(jī),可以帶電。

在英語中,有些作賓語的代詞,不論前文是否提到過,翻譯時(shí)往往可以省略不譯。在例4中,“itself”作為“electrify”的賓語,在第一組譯文中被機(jī)器翻譯處理成有實(shí)際意義的成分,從而造成了翻譯錯(cuò)誤。因此,在譯前編輯時(shí)將其刪去,原文的內(nèi)容在第二組譯文中被忠實(shí)表達(dá)。第一組譯文的BLEU值為13.85,第二組譯文的BLEU值為17.27,經(jīng)過譯前編輯翻譯質(zhì)量得到了提高。

例5原文:Cold rolling enables the operators to produce rolls of accuracy and uniformity,and with a better surface finish.

參考譯文:冷軋可以生產(chǎn)出精度高、均勻性好、表面光潔度高的軋制品。

譯文:冷軋使操作員能夠生產(chǎn)出準(zhǔn)確而均勻的軋輥,并具有更好的表面光潔度。

譯前編輯后:Cold rolling enables to produce rolls of accuracy and uniformity,and with a better surface finish.

譯前編輯后譯文:冷軋能夠生產(chǎn)出準(zhǔn)確,均勻且具有更好表面光潔度的軋輥。

在例5中,“enable”的賓語“operators”,在原文中的前后邏輯關(guān)系被暗含在句意中,翻譯時(shí)可以不必翻譯出來,目的是在不改變原文思想內(nèi)容的基礎(chǔ)上使譯文更加通順流暢。因此,在譯前編輯時(shí)可以將其刪去,第二組譯文的BLEU值也相應(yīng)增加了3.8,表明譯前編輯有效。在前后兩組譯文中的“accuracy”都被譯為“準(zhǔn)確”,但在這個(gè)語境中其要表達(dá)的含義是“精度高”,需要譯者在譯后編輯時(shí)加以調(diào)整。刪減類BLEU值如圖3所示。

圖3 刪減類BLEU值

3.3 替代

用替代的形式代替上文或句子中已出現(xiàn)過的詞語或內(nèi)容,以避免重復(fù)連接上下文,這是英語說話或者寫作的一項(xiàng)重要原則[18]??紤]英文多用代詞或具有引申用法的詞匯,在翻譯時(shí)要靈活還原文中所表示的內(nèi)容。在一些語境中,機(jī)器很難區(qū)分代詞所指代的內(nèi)容究竟是哪一部分,翻譯時(shí)容易出錯(cuò),而且不能翻譯出詞匯的引申含義。因此,在譯前編輯時(shí),可以對相應(yīng)的指代詞進(jìn)行替換,消除歧義。

例1原文:I chose three modules in the first year because I also had a part-time job.

參考譯文:我第一年選擇了三門課程,因?yàn)槲疫€有一份兼職。

譯文:第一年我選擇了三個(gè)模塊,因?yàn)槲乙灿幸环菁媛毠ぷ鳌?/p>

譯前編輯后:I chose three courses in the first year because I also had a part-time job.

譯前編輯后譯文:第一年我選擇了三門課程,因?yàn)槲乙灿幸环菁媛毠ぷ鳌?/p>

在例1中,未經(jīng)譯前編輯時(shí),機(jī)器翻譯將“modules”譯為“模塊”,根據(jù)對原文的理解,此處應(yīng)該表示“課程”。因此,在譯前編輯時(shí)將其替換為“course”。如果在上下文中多次出現(xiàn),在譯者熟悉原文這一步驟時(shí),亦可將其都進(jìn)行替換,從而減少了譯后編輯的工作。第一組譯文的BLEU值為40.57,第二組譯文的BLEU值為64.33,增加了23.76。

例2原文:Your analysis of current political situation really hits the nail on the head.

參考譯文:你對當(dāng)前政治局勢的分析真是一針見血。

譯文:您對當(dāng)前政治局勢的分析確實(shí)觸動(dòng)了頭腦。

譯前編輯后:Your analysis of current political situation is really sharp.

譯前編輯后譯文:您對當(dāng)前政治局勢的分析確實(shí)很敏銳。

例2中,“hit the nail on the head”的引申義為正中要害、說得中肯恰當(dāng),而機(jī)器翻譯未能正確理解其引申的含義。第一組譯文也只是根據(jù)字面逐字進(jìn)行翻譯,和原文所要表達(dá)的內(nèi)容相差甚遠(yuǎn)。在譯前編輯時(shí),直接對這一詞組指代的引申含義進(jìn)行整體替換,得到的第二組譯文的表述符合這個(gè)語境,BLEU值相應(yīng)提高了3.22。

例3原文:The radio wasn’t working because of a loose connection in the wires.

參考譯文:因線路接觸不良,收音機(jī)不響了。

譯文:由于電線連接松動(dòng),收音機(jī)無法正常工作。

譯前編輯后:The radio wasn’t working because of a bad connection in the wires.

譯前編輯后譯文:由于電線接觸不良,收音機(jī)無法正常工作。

在例3中,“l(fā)oose connection”在未經(jīng)譯前編輯時(shí)機(jī)器翻譯將其譯為“連接松動(dòng)”,而在漢語中,一般使用接觸不良泛指家用電器中由于電路連接而出現(xiàn)的故障。根據(jù)第一組譯文的表述,機(jī)器翻譯側(cè)重于“l(fā)oose”的含義。因此,在譯前編輯時(shí)將其替換為“bad”,從而獲得符合漢語表達(dá)習(xí)慣的第二組譯文,BLEU值由14.58增長到38.76。

例4原文:This standard does not purport to address all of the safety concerns,if any,associated with its use.

參考譯文:本標(biāo)準(zhǔn)未提及同標(biāo)準(zhǔn)使用有關(guān)的所有安全問題。

譯文:本標(biāo)準(zhǔn)并非旨在解決與使用相關(guān)的所有安全問題。

譯前編輯后:This standard does not purport to address all of the safety concerns,if any,associated with its standard use.

譯前編輯后譯文:本標(biāo)準(zhǔn)并不旨在解決與標(biāo)準(zhǔn)使用有關(guān)的所有安全問題。

例4中,未經(jīng)譯前編輯時(shí),機(jī)器翻譯將“its”指代的內(nèi)容漏譯,造成句意缺失,甚至改變了整個(gè)免責(zé)條款的適用范圍。譯前編輯時(shí)對“its”的指代含義進(jìn)行補(bǔ)充,從而限定了句意范圍,得到的第二組譯文內(nèi)容更加準(zhǔn)確,BLEU值也提高了16.19。

例5原文:Everybody has a responsibility to the society of which he is a part and through this to mankind.

參考譯文:每個(gè)人都對他所屬的社會負(fù)有責(zé)任,并且通過對社會負(fù)責(zé)任,而對人類負(fù)有責(zé)任。

譯文:每個(gè)人都應(yīng)對他所參與的社會負(fù)責(zé),并由此對人類負(fù)責(zé)。

譯前編輯后:Everybody has a responsibility to the society of which he is a part and through taking a responsibility to mankind.

譯前編輯后譯文:每個(gè)人都有責(zé)任對他所參與的社會負(fù)責(zé),并通過社會對人類負(fù)責(zé)。

例5中的“this”指代前面的“a responsibility to the society”,如果只是譯成“這個(gè)”,則會造成語義不明。譯前編輯時(shí)將“it”替換成“taking a responsibility”,并添加動(dòng)詞,使語意更加連貫、通順。其中,第一組譯文的BLEU值為26.20,第二組譯文的BLEU值為32.41,譯前編輯效果顯著。替代類BLEU值如圖4所示。

3.4 術(shù)語提前

機(jī)器翻譯的程序規(guī)則是根據(jù)語言的基本規(guī)則,通過語料庫中的數(shù)據(jù)計(jì)算出相應(yīng)的譯文,對于某些新詞匯、新技術(shù)及新政策等術(shù)語的收集未必完全。因此,譯者可在譯前編輯時(shí)直接翻譯出術(shù)語,以降低機(jī)器翻譯的誤出率。

例1原文:Non-equilibrium is always fluctuating around the centerline of the equilibrium,thus promoting the economy to move forward and to be infinitely close to the goal of balanced growth.

參考譯文:非均衡始終圍繞均衡的中心線上下波動(dòng),推動(dòng)經(jīng)濟(jì)不斷向前發(fā)展,無限接近均衡增長的目標(biāo)。

譯文:非平衡總是在平衡的中心線附近波動(dòng),從而促進(jìn)經(jīng)濟(jì)向前發(fā)展并無限接近平衡增長的目標(biāo)。

譯前編輯后:Non均衡is always fluctuating around the centerline of the 均衡,thus promoting the economy to move forward and to be infinitely close to the goal of balanced growth.

譯前編輯后譯文:非均衡總是圍繞均衡的中心線波動(dòng),從而促進(jìn)經(jīng)濟(jì)向前發(fā)展并無限接近平衡增長的目標(biāo)。

“equilibrium”指的是經(jīng)濟(jì)活動(dòng)中的均衡,是一種相對穩(wěn)定的狀態(tài),而“平衡”從某種意義上來說是一種數(shù)學(xué)概念,二者存在明顯的區(qū)別。因此,在譯前編輯時(shí)將其直接翻譯替換,得到的第二組譯文BLEU值增長了10.43。

例2原文:While the new plant manager has extensive experience improving productivity,many of the workers aren’t ready to hand him a blank check.

參考譯文:雖然新廠長在提高生產(chǎn)力方面很有經(jīng)驗(yàn),但是很多工人還是不愿意凡事由他全權(quán)處理。

譯文:新任工廠經(jīng)理在提高生產(chǎn)力方面擁有豐富的經(jīng)驗(yàn),但許多工人還沒有準(zhǔn)備好給他一張空白支票。

譯前編輯后:While the new plant manager has extensive experience improving productivity,many of the workers aren’t ready to hand him 全權(quán)處理.

譯前編輯后譯文:新來的工廠經(jīng)理在提高生產(chǎn)率方面擁有豐富的經(jīng)驗(yàn),但許多工人還沒有準(zhǔn)備好交給他全權(quán)處理。

例2中的“a blank check”是一種英文的慣常表示方式,字面意思就是一張空白支票。經(jīng)過意義延伸,“a blank check”又可以解釋為全權(quán)授命、全權(quán)處理的意思。根據(jù)理解,在這個(gè)語境中便是如此,經(jīng)過譯前編輯,兩組譯文的BLEU值由29.38增長到32.39。

例3原文:Valve regurgitation was assessed according to American Society of Echocardiography recommendations.

參考譯文:按照美國超聲心動(dòng)描記術(shù)學(xué)會的建議評價(jià)心臟瓣膜返流。

譯文:瓣膜返流是根據(jù)美國超聲心動(dòng)圖學(xué)會的建議進(jìn)行評估的。

譯前編輯后:Valve regurgitation was assessed according to American Society of超聲心動(dòng)描記術(shù) recommendations.

譯前編輯后譯文:根據(jù)美國超聲心動(dòng)描記術(shù)協(xié)會的建議評估瓣膜返流。

“Echocardiography”指的是“超聲心動(dòng)描記術(shù)”,在譯前編輯時(shí),提前進(jìn)行翻譯替換,得到的第二組譯文的BLEU值增加了16.56。

例4原文:Science only learnt why in the 1940s with the discovery of rejection. When human organs are transferred from person to person,the immune system attacks and destroys what it sees as a foreign substance.

參考譯文:直到20世紀(jì)40年代發(fā)現(xiàn)了排異反應(yīng)后,科學(xué)家才明白了導(dǎo)致器官移植失敗的原因。當(dāng)人體器官從一個(gè)人移植到另一個(gè)人時(shí),受體的免疫系統(tǒng)即將其視作外來物質(zhì)進(jìn)行攻擊和破壞。

譯文:科學(xué)直到1940年代才發(fā)現(xiàn)排斥的原因。人體器官在人與人之間轉(zhuǎn)移時(shí),免疫系統(tǒng)會攻擊并摧毀被視為異物的物質(zhì)。

譯前編輯后:Science only learnt why in the 1940s with the discovery of 排異反應(yīng) When human organs are transferred from person to person,the immune system attacks and destroys what it sees as a foreign substance.

譯前編輯后譯文:科學(xué)只是在1940年代發(fā)現(xiàn)了排異反應(yīng),才了解了為什么當(dāng)人體器官在人與人之間轉(zhuǎn)移時(shí),免疫系統(tǒng)會攻擊并破壞他視為異物的物質(zhì)。

“rejection”具有一詞多義的特征,被廣泛應(yīng)用于不同的專業(yè)領(lǐng)域,其含義及表達(dá)均有所不同。在本例的語境中屬于醫(yī)學(xué)術(shù)語,意為“排斥反應(yīng)”。因此,在譯前編輯時(shí)進(jìn)行替換翻譯,第一組譯文的BLEU值為13.97,第二組譯文的BLEU值為23.36,譯文質(zhì)量得到提升。

例5原文:The calculation result shows that the maximum stress appeared at the edge weld seam.

參考譯文:根據(jù)計(jì)算結(jié)果顯示,最大應(yīng)力預(yù)計(jì)在端接焊縫處。

譯文:計(jì)算結(jié)果表明,最大應(yīng)力出現(xiàn)在邊緣焊縫處。

譯前編輯后:The calculation result shows that the maximum stress appeared at the 端接焊縫.

譯前編輯后譯文:計(jì)算結(jié)果表明,最大應(yīng)力出現(xiàn)在端接焊縫處。

“edge weld seam”在未經(jīng)譯前編輯時(shí)被機(jī)器翻譯譯為邊緣焊縫,與其實(shí)際含義存在較大差異。因此,譯前編輯時(shí)將其替換譯為“端接焊縫”,BLEU值相應(yīng)提高了15.06。術(shù)語提前類BLEU值如圖5所示。

圖5 術(shù)語提前類BLEU值

4 結(jié)語

機(jī)器翻譯過程中,采用譯前編輯對源文本進(jìn)行預(yù)處理,能夠有效地提升機(jī)器翻譯譯文質(zhì)量。運(yùn)用BLEU自動(dòng)評測方法對基于詞匯層面的譯前編輯方法的有效性進(jìn)行了驗(yàn)證。根據(jù)BLEU自動(dòng)評測方法的計(jì)算,經(jīng)過譯前編輯之后,BLEU值均有不同程度的提升。其中,增補(bǔ)方法平均提高了11.97,刪減為7.28,替代效果最為顯著,平均提高了14.71,術(shù)語提前則為10.89。

通過對英譯漢文本詞匯層面譯前編輯策略的4個(gè)方面各選取5個(gè)例句進(jìn)行具體分析,結(jié)論如下。

1)詞匯增補(bǔ)方面。當(dāng)把隱含的邏輯關(guān)系詞、動(dòng)賓搭配的動(dòng)詞和主語補(bǔ)充到原文中時(shí),可以提高機(jī)器翻譯的譯文質(zhì)量,得到更標(biāo)準(zhǔn)、通順、忠實(shí)的譯文。

2)詞匯刪減方面。刪去原文中可有可無或影響句意表達(dá)的冗余詞語,使譯文更通順流暢,符合漢語的譯文習(xí)慣。

3)詞匯替代方面。把影響機(jī)器理解原文的詞匯替換成其指代不清或存有歧義的原文本,將便于翻譯,從而提高翻譯質(zhì)量。

4)術(shù)語提前方面。在譯前編輯時(shí)直接將術(shù)語翻譯出來,可以減少機(jī)器翻譯的錯(cuò)誤率。但是研究發(fā)現(xiàn),在涉及到視角轉(zhuǎn)換的情況下,也存在使用不符合語境的動(dòng)詞或名詞搭配的情況,此時(shí),仍需要譯后編輯進(jìn)行調(diào)整。

高效的訓(xùn)練文本可以用于翻譯引擎進(jìn)行深度學(xué)習(xí)。盡管深度學(xué)習(xí)已在自然語言處理等諸多領(lǐng)域得到了廣泛的應(yīng)用,然而神經(jīng)機(jī)器翻譯對訓(xùn)練文本的利用程度還有很大的提升空間。基于詞匯層面的譯前編輯方法,將文本詞匯方面的特征信息與端對端的神經(jīng)機(jī)器翻譯有效結(jié)合,使用經(jīng)過譯前編輯的文本作為訓(xùn)練語料,提升了神經(jīng)機(jī)器翻譯系統(tǒng)的性能。

考慮所選文本存在著一定的局限性,數(shù)量有限且僅適用于沒有視角差異的情況下基于詞匯層面的譯前編輯策略,無法對譯前編輯策略進(jìn)行較詳盡且全面的探討。因此,有必要緊跟機(jī)器翻譯和其他相關(guān)科技的發(fā)展動(dòng)態(tài),不斷更新對這一議題的研究。

猜你喜歡
原文譯文詞匯
Stem cell-based 3D brain organoids for mimicking,investigating,and challenging Alzheimer’s diseases
本刊可直接用縮寫的常用詞匯
一些常用詞匯可直接用縮寫
譯文摘要
本刊可直接用縮寫的常用詞匯
讓句子動(dòng)起來
I Like Thinking
嘗糞憂心
賣身葬父
Performance of a double-layer BAF using zeolite and ceramic as media under ammonium shock load condition
搜索| 潜江市| 博罗县| 舒城县| 定结县| 延津县| 西充县| 馆陶县| 仁怀市| 辉南县| 丽江市| 乾安县| 怀来县| 仙桃市| 河南省| 清涧县| 土默特右旗| 马龙县| 长阳| 韶关市| 泸定县| 鹤峰县| 荆门市| 辽宁省| 沧州市| 仪陇县| 朝阳县| 渭源县| 钟祥市| 马尔康县| 务川| 榆树市| 上思县| 广德县| 兴安盟| 广安市| 扎囊县| 日土县| 西宁市| 那坡县| 丘北县|