国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

阿里翻譯Alynx平臺(tái)機(jī)器翻譯及譯后編輯:問題、成因與對(duì)策
——以“Country Reports on Terrorism 2014”等文本的機(jī)譯為例①

2023-02-06 23:42:02余靜良
語言與文化論壇 2023年2期
關(guān)鍵詞:譯員譯文機(jī)器

余靜良

1. 引言

自20世紀(jì)40年代W. 韋弗(W. Weaver)提出機(jī)器翻譯構(gòu)想以來,機(jī)器翻譯歷經(jīng)挫折與挑戰(zhàn),取得了顯著的成績(jī)與進(jìn)步。尤其是21世紀(jì)以來,計(jì)算機(jī)技術(shù)與互聯(lián)網(wǎng)發(fā)展進(jìn)入快車道,同樣促使機(jī)器翻譯技術(shù)不斷更迭。

近年來,隨著人工智能(AI)、大數(shù)據(jù)與5G技術(shù)的發(fā)展,機(jī)器翻譯又迎來了新的機(jī)遇與挑戰(zhàn)。2014年,神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯(Neural Machine Translation,簡(jiǎn)稱NMT)模型成功問世,標(biāo)志著機(jī)器翻譯的譯文質(zhì)量又得到了進(jìn)一步提升。機(jī)器翻譯及譯后編輯模式的運(yùn)用極大地提高了翻譯速度與質(zhì)量,翻譯生產(chǎn)力得以迅猛增長(zhǎng)?,F(xiàn)如今,機(jī)器翻譯及譯后編輯在語言服務(wù)行業(yè)所占比重越來越大,發(fā)揮著至關(guān)重要的作用。例如,阿里翻譯及譯后編輯在商品名稱與簡(jiǎn)介翻譯方面表現(xiàn)卓越、成績(jī)斐然,為中外貿(mào)易往來提供了技術(shù)支持。

Alynx是阿里翻譯旗下智能協(xié)同翻譯平臺(tái),致力于為有自主人工翻譯需求的用戶提供高效管理翻譯項(xiàng)目的平臺(tái),賦能用戶快速完成翻譯需求。隨著神經(jīng)網(wǎng)絡(luò)翻譯技術(shù)、大數(shù)據(jù)、人工智能以及5G技術(shù)的不斷更新迭代,現(xiàn)如今,阿里翻譯已擁有先進(jìn)的技術(shù)、穩(wěn)定的系統(tǒng)、源源不斷的客戶以及良好的口碑。

本研究依托南京策馬集團(tuán)譯后編輯在線實(shí)習(xí)項(xiàng)目,借助Alynx翻譯平臺(tái),通過選取“Country Reports on Terrorism 2014”(《2014年全球恐怖主義形勢(shì)報(bào)告》)等文本中近20萬字語料進(jìn)行機(jī)器翻譯,再利用Alynx平臺(tái)進(jìn)行譯后編輯。通過對(duì)機(jī)器翻譯與人工譯后編輯文本進(jìn)行對(duì)比分析發(fā)現(xiàn),機(jī)器翻譯譯文正確率雖已大幅提升,但仍存在類似詞匯、句法和符號(hào)等層面的翻譯錯(cuò)誤。此外,通過反思此次機(jī)器翻譯及譯后編輯,發(fā)現(xiàn)機(jī)器翻譯與譯后編輯等人機(jī)交互模式中仍存在機(jī)器翻譯語料來源不明、機(jī)器翻譯及譯后編輯譯文版權(quán)歸屬問題、“忠實(shí)原文與否”以及責(zé)權(quán)不清等倫理問題。

基于此,本文將對(duì)機(jī)器翻譯平臺(tái)譯文翻譯的錯(cuò)誤類型與翻譯倫理問題進(jìn)行深入剖析,以期廓清Alynx平臺(tái)機(jī)器翻譯的錯(cuò)誤類型,并對(duì)相關(guān)錯(cuò)誤進(jìn)行修改,總結(jié)譯后編輯原則。此外,本研究還將針對(duì)機(jī)器翻譯及譯后編輯出現(xiàn)的翻譯倫理問題進(jìn)行歸納,探索機(jī)器翻譯錯(cuò)誤和翻譯倫理問題的成因,并提出相應(yīng)對(duì)策,從而為今后機(jī)器翻譯及譯后編輯提供學(xué)理參考,為機(jī)器翻譯平臺(tái)技術(shù)研發(fā)提供鏡鑒,以期提高機(jī)器翻譯譯文的質(zhì)量與效率,實(shí)現(xiàn)人機(jī)協(xié)作的合理、健康發(fā)展。

2. 機(jī)器翻譯及譯后編輯

2.1 機(jī)器翻譯

計(jì)算機(jī)翻譯通常被稱為機(jī)器翻譯,即全自動(dòng)高質(zhì)量機(jī)器翻譯(Fully Automatic High Quality Machine Translation,簡(jiǎn)稱 FAHQMT或MT)(張政,2004)。機(jī)器翻譯即為:利用計(jì)算機(jī)系統(tǒng)將一種自然語言(源語言)轉(zhuǎn)化成另一種自然語言(目標(biāo)語)。

機(jī)器翻譯是計(jì)算語言學(xué)的一個(gè)分支,具有重要的科學(xué)研究?jī)r(jià)值。1946年,人類制造出世界上第一臺(tái)電子計(jì)算機(jī)。1949年,美國(guó)科學(xué)家韋弗在《翻譯備忘錄》中首次正式提出“機(jī)器翻譯”的概念與構(gòu)想,標(biāo)志著機(jī)器翻譯的誕生。通過梳理機(jī)器翻譯與計(jì)算機(jī)發(fā)展史可知,機(jī)譯系統(tǒng)可劃分為基于規(guī)則(rule-based)與基于語料庫(kù)(corpus-based)2個(gè)種類。機(jī)器翻譯目前是語料庫(kù)翻譯學(xué)應(yīng)用較為成功的領(lǐng)域之一,翻譯平行語料庫(kù)使得機(jī)器翻譯如虎添翼(張繼光,2016)。而基于語料庫(kù)的機(jī)譯方法又可分為基于統(tǒng)計(jì)(statistics-based)的方法和基于實(shí)例(example-based)的方法。

2013年以來,隨著深度學(xué)習(xí)的研究取得顯著進(jìn)步,基于人工神經(jīng)網(wǎng)絡(luò)的機(jī)器翻譯逐漸興起和繁榮。2016年谷歌宣布人工水平英漢翻譯后,神經(jīng)機(jī)器翻譯以井噴式的發(fā)展將翻譯行業(yè)從人力驅(qū)動(dòng)帶入數(shù)據(jù)驅(qū)動(dòng)(楊玉婉,2020)。

然而,雖然各在線翻譯平臺(tái)技術(shù)日趨成熟,但機(jī)器翻譯始終無法達(dá)到專業(yè)譯員的翻譯水準(zhǔn),仍存在翻譯譯文質(zhì)量層次不齊、翻譯質(zhì)量與效率之間的不平衡以及相關(guān)術(shù)語庫(kù)、記憶庫(kù)仍待加強(qiáng)與更新等問題。由是觀之,需要采用人機(jī)交互模式,通過人工對(duì)機(jī)器翻譯的譯文進(jìn)行譯后編輯,從而達(dá)到相應(yīng)的翻譯標(biāo)準(zhǔn),進(jìn)而實(shí)現(xiàn)翻譯效率與翻譯質(zhì)量的動(dòng)態(tài)平衡。

2.2 譯后編輯

業(yè)界不同學(xué)者對(duì)譯后編輯曾有不同的定義。魏長(zhǎng)宏和張春柏(2007)認(rèn)為,譯后編輯(post-editing,簡(jiǎn)稱PE)是對(duì)機(jī)器翻譯系統(tǒng)把源語言轉(zhuǎn)化為目標(biāo)語后生成的譯文進(jìn)行的編輯操作。崔啟亮(2014)表示,譯后編輯是“檢查和修正機(jī)器翻譯的輸出”。而筆者認(rèn)為,馮全功和張慧玉(2015)對(duì)譯后編輯所作的定義更為全面、詳細(xì)與精準(zhǔn),即“所謂譯后編輯是指根據(jù)一定的目的對(duì)機(jī)器翻譯的原始產(chǎn)出進(jìn)行加工與修改的過程,包括更改翻譯(語言)錯(cuò)誤、提高機(jī)譯產(chǎn)出的準(zhǔn)確性與可讀性等。其中,編輯加工的程度由多種因素而定,如翻譯目的、客戶需求、客戶報(bào)價(jià)、文檔類型、機(jī)譯產(chǎn)出質(zhì)量、文檔使用壽命等”。一般情況下,可將譯后編輯分為輕度譯后編輯和完全譯后編輯。由是觀之,譯后編輯即為根據(jù)(客戶)特定需求對(duì)機(jī)器翻譯原始譯文進(jìn)行加工處理,以期提高譯文的準(zhǔn)確性和可讀性,從而大幅提升翻譯速度與質(zhì)量的過程。

美國(guó)卡門森斯咨詢公司(Common Sense Advisory)的《2016全球語言服務(wù)市場(chǎng)報(bào)告》顯示,2016年譯后編輯業(yè)務(wù)占整個(gè)語言服務(wù)行業(yè)市場(chǎng)的3.94%,有25.39%的語言服務(wù)供應(yīng)商提供譯后編輯服務(wù),并認(rèn)為該項(xiàng)服務(wù)前景光明(馮全功 等,2018)??梢?基于機(jī)器翻譯的譯后編輯仍大有可為。

3. 翻譯倫理

《現(xiàn)代漢語詞典》(第七版)對(duì)“倫理”一詞的定義為“人與人相處的各種道德準(zhǔn)則”。漢語中“倫理”一詞在英語中對(duì)應(yīng)的詞為ethics。而《牛津高階英漢雙解詞典》(第九版)對(duì)ethics一詞的解釋為motivation based on ideas of right and wrong以及the philosophical study of moral values and rules。由此可見,倫理學(xué)重點(diǎn)聚焦人與人之間的道德準(zhǔn)則與是非觀。

翻譯倫理(ethics of translation)一詞始于1895年美國(guó)學(xué)者約翰·S. 諾倫(John S. Nollen)于《當(dāng)代語言論叢》發(fā)表的署名文章“The ethics of translation”。中外學(xué)者都曾對(duì)“翻譯倫理”或“翻譯倫理學(xué)”給予過定義。例如,王大智(2009)認(rèn)為:“翻譯倫理就是翻譯行為事實(shí)該如何規(guī)律以及翻譯行為該如何規(guī)范,它既面向翻譯行為也面向翻譯行為的主體?!痹摱x并未將中間人,即除譯者以外的翻譯需求方、出版商和贊助商等因素考慮在內(nèi)。因此,彭萍(2013)將“翻譯倫理學(xué)”定義為:“翻譯倫理學(xué)就是關(guān)于翻譯活動(dòng)、翻譯理論研究、翻譯批評(píng)、翻譯教學(xué)等的道德或倫理規(guī)范研究,即從倫理的視角來審視翻譯的方方面面?!?/p>

于是,翻譯倫理學(xué)不僅是有關(guān)譯者本身的倫理規(guī)約,還涉及語言服務(wù)供應(yīng)商、出版商和贊助人,甚至還關(guān)乎翻譯項(xiàng)目管理、機(jī)器翻譯及譯后編輯與本地化和國(guó)際化等多方面。翻譯活動(dòng)不再僅囿于切斯特曼(Chesterman)總結(jié)的再現(xiàn)倫理、服務(wù)倫理、交際倫理、基于規(guī)范的倫理與承諾倫理5種倫理模式,還延伸至約納斯(Jonas)所提出的“責(zé)任倫理”。翻譯活動(dòng)不僅聚焦“怎么譯”的問題,還要關(guān)注“譯不譯”“為誰譯”“誰來譯”“譯后結(jié)果如何”及“譯文責(zé)任主體”等問題。

隨著翻譯技術(shù)時(shí)代的來臨,在譯后編輯等人機(jī)耦合的過程中,勢(shì)必會(huì)碰撞出翻譯倫理問題的“火花”。2019年,中國(guó)翻譯協(xié)會(huì)正式發(fā)布國(guó)內(nèi)首部《譯員職業(yè)道德準(zhǔn)則與行為規(guī)范》。該文件的發(fā)布表明,中國(guó)翻譯職業(yè)化得到進(jìn)一步推進(jìn),職業(yè)譯員道德倫理規(guī)范、倫理選擇、信任危機(jī)及責(zé)權(quán)不清等倫理問題日益凸顯,翻譯倫理已成為機(jī)器翻譯及譯后編輯等人類與翻譯技術(shù)深度交融過程中不可回避的問題,亟待擴(kuò)充翻譯倫理模式,拓展翻譯倫理應(yīng)用場(chǎng)景,從而更好地促進(jìn)人機(jī)交互的健康與可持續(xù)發(fā)展。

4. 機(jī)器翻譯及譯后編輯的研究現(xiàn)狀

通過在中國(guó)知網(wǎng)按主題搜索“機(jī)器翻譯”發(fā)現(xiàn),機(jī)器翻譯研究成果達(dá)13696項(xiàng)(1)本文所有源自中國(guó)知網(wǎng)的數(shù)據(jù)檢索時(shí)間均為2022年7月7日。。搜索“譯后編輯”可知,譯后編輯研究成果達(dá)641項(xiàng)。同時(shí)搜索“機(jī)器翻譯、譯后編輯”發(fā)現(xiàn),該詞條下研究成果達(dá)389項(xiàng)??梢?國(guó)內(nèi)學(xué)界對(duì)機(jī)器翻譯研究較為深入,研究成果不勝枚舉,對(duì)譯后編輯的研究成果也相對(duì)較多。如劉群(2003)對(duì)統(tǒng)計(jì)機(jī)器翻譯方法進(jìn)行了總結(jié),并對(duì)自然語言處理原則進(jìn)行了歸納整理。然而,對(duì)機(jī)器翻譯及譯后編輯進(jìn)行研究的相關(guān)成果卻相對(duì)較少。例如,崔啟亮(2014)對(duì)機(jī)器翻譯及譯后編輯的應(yīng)用與研究、發(fā)展動(dòng)力、應(yīng)用領(lǐng)域與實(shí)踐準(zhǔn)則進(jìn)行了深度剖析,為機(jī)器翻譯發(fā)展前景提供了有價(jià)值的參考。

此外,在中國(guó)知網(wǎng)按主題搜索“機(jī)器翻譯、倫理”,顯示國(guó)內(nèi)對(duì)機(jī)器翻譯中倫理問題進(jìn)行研究的相關(guān)成果只有51項(xiàng),尚顯匱乏,與機(jī)器翻譯及譯后編輯相關(guān)研究成果數(shù)量形成鮮明對(duì)比。其中,任文(2019)對(duì)翻譯倫理、機(jī)器翻譯倫理與翻譯技術(shù)倫理等概念加以廓清,提出將責(zé)任倫理原則與其他翻譯倫理五原則相結(jié)合,從而應(yīng)對(duì)機(jī)器翻譯中所產(chǎn)生的新的翻譯倫理問題與挑戰(zhàn)。

5. 機(jī)器翻譯及譯后編輯:問題、成因與對(duì)策

本文依托南京策馬集團(tuán)譯后編輯實(shí)習(xí)項(xiàng)目,借助阿里翻譯Alynx翻譯平臺(tái)對(duì)“Country Reports on Terrorism 2014”等文本進(jìn)行機(jī)器翻譯,再利用該平臺(tái)對(duì)機(jī)器翻譯譯文進(jìn)行人工譯后編輯。通過比對(duì)機(jī)器翻譯與譯后編輯譯文發(fā)現(xiàn),雖然神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯正確率已顯著提升,效率與便捷性大大提高,但仍不可避免存在諸多不同類型的翻譯錯(cuò)誤。同時(shí),譯員在進(jìn)行譯后編輯過程中,由于不同客戶需求、原文與機(jī)器翻譯譯文對(duì)譯員的影響以及翻譯技術(shù)的更新優(yōu)化,難免會(huì)觸發(fā)翻譯倫理問題。譯者不僅面臨“怎么譯”的問題,且還需面對(duì)“譯不譯”“為誰譯”“誰來譯”“忠實(shí)與否”以及“譯后結(jié)果如何”等問題。鑒于此,本研究將利用上述平臺(tái),借助翻譯文本總結(jié)相關(guān)機(jī)器翻譯錯(cuò)誤類型與翻譯倫理問題,分析其背后成因,并提出相應(yīng)對(duì)策,以期為機(jī)器翻譯技術(shù)研發(fā)人員、機(jī)器翻譯研究學(xué)者提供相應(yīng)參考。

5.1 機(jī)器翻譯錯(cuò)誤類型

5.1.1 詞匯層面

例①:詞義誤譯。

原文:Location/Area of Operation。

機(jī)器譯文:操作位置/區(qū)域。

譯后編輯:行動(dòng)位置或區(qū)域。

分析:operation在英語中既意為“操作;經(jīng)營(yíng);手術(shù)”,又意為“行動(dòng)”。而在上述文本中,重點(diǎn)是為了強(qiáng)調(diào)各恐怖組織行動(dòng)或活動(dòng)的位置或區(qū)域。因此,這里機(jī)器顯然是對(duì)英語中operation一詞的詞義進(jìn)行了錯(cuò)誤匹配,誤將該語境下的詞義理解為了“操作”。因此,該譯文將使得讀者對(duì)此疑惑不解。而事實(shí)上,原文是為了引出下文,從而對(duì)恐怖組織的活動(dòng)區(qū)域與范圍進(jìn)行更為詳細(xì)的介紹。所以,這里應(yīng)當(dāng)譯為“行動(dòng)”。同樣,這也反映出機(jī)器翻譯,特別是在線翻譯平臺(tái)在詞義辨析、術(shù)語庫(kù)以及語料庫(kù)的更新完善與發(fā)展方面還亟待提高。

例②:增詞減詞(主語指代不明)。

原文:Ansar al-Dine (AAD) was designated as a Foreign Terrorist Organization on March 22, 2013.

機(jī)器翻譯:安薩爾·丁 (AAD) 于2013年3月22日被指定為外國(guó)恐怖組織。

譯后編輯:2013年3月22日,美國(guó)將安薩爾·丁組織確認(rèn)為境外恐怖組織。

分析:本文所有案例均選自“Country Reports on Terrorism 2014”,該報(bào)告是由美國(guó)國(guó)務(wù)院發(fā)布的。因此,該報(bào)告中各組織的名稱均由美國(guó)國(guó)務(wù)院等組織機(jī)構(gòu)認(rèn)定,原文中的主語應(yīng)為美國(guó)或美國(guó)國(guó)務(wù)院。而機(jī)器翻譯譯文將原文中的被動(dòng)語態(tài)直接原封不動(dòng)地譯為漢語中的被動(dòng)語態(tài)。翻譯中由于受到源語的影響和省力原則的操縱,英語被動(dòng)句多被翻譯為“被”字句(朱一凡 等,2014)。而在未受英語語法與句法所影響的漢語中,被動(dòng)語態(tài)的使用頻率遠(yuǎn)遠(yuǎn)小于英語中被動(dòng)語態(tài)的使用頻次。由是觀之,若欲將原文譯為地道的漢語表達(dá)法,則需增加主語,將原文譯為主動(dòng)語態(tài)。因此,譯后編輯譯文增加了主語“美國(guó)”,從而讓句意更加直觀清晰,也不會(huì)引起句意的模糊與歧義。

5.1.2 句法層面

例①:句子語序問題。

原文:AAD has fractured and its members have been largely scattered by the French intervention in Mali.

機(jī)器翻譯:AAD已經(jīng)破裂,其成員在很大程度上被法國(guó)對(duì)馬里的干預(yù)所分散。

譯后編輯:安薩爾·丁組織已支離破碎,法國(guó)對(duì)馬里實(shí)施干預(yù),該組織成員很大程度上因此而“軍心渙散”。

分析:對(duì)比分析機(jī)器譯文與譯后編輯譯文發(fā)現(xiàn),機(jī)器翻譯譯文語內(nèi)邏輯結(jié)構(gòu)混亂,組織名稱即術(shù)語翻譯前后不一致,被動(dòng)語態(tài)翻譯僵化。更為重要的是,機(jī)器譯文也并未將原因前置,結(jié)果后置,很可能導(dǎo)致譯入語讀者對(duì)原文所要傳達(dá)的信息和內(nèi)涵一頭霧水,感到不知所云。因此,在譯后編輯譯文中,將“軍心渙散”的原因前置,把被動(dòng)語態(tài)翻譯為主動(dòng)語態(tài),從而增強(qiáng)譯文的可讀性,使得譯文語序合理清晰。

例②:從句翻譯錯(cuò)誤。

原文:The first attack took place when a bomber blew himself up outside a hotel in Sousse, Tunisia, resulting in no other fatalities.

機(jī)器翻譯:第一次襲擊發(fā)生在一名炸彈襲擊者在突尼斯蘇塞的一家旅館外炸死自己,沒有造成其他死亡。

譯后編輯:第一次襲擊中,一名炸彈襲擊者在突尼斯蘇塞的一家旅館外引燃炸彈,自己被炸死,所幸沒有造成其他人員死亡。

分析:通過對(duì)比分析原文、機(jī)器譯文與譯后編輯譯文不難發(fā)現(xiàn),機(jī)器譯文邏輯混亂,含義模糊,讓人不知所云。與此同時(shí),機(jī)器譯文也并未正確地將when引導(dǎo)的時(shí)間狀語從句譯出。而譯后編輯譯文則就較為準(zhǔn)確地傳遞出原文中“自己被炸死”的含義,且與原文語序保持了一致,通過增詞的增譯手段,使得原文信息實(shí)現(xiàn)了較好的傳遞。

5.1.3 符號(hào)層面

例①:術(shù)語符號(hào)錯(cuò)誤。

機(jī)器翻譯:2006年12月,ETC爆炸了一枚巨大的汽車炸彈,炸毀了馬德里巴拉哈斯國(guó)際機(jī)場(chǎng)的大部分有蓋停車場(chǎng)。

譯后編輯:2006年12月,巴斯克祖國(guó)與自由組織引爆了一枚巨型汽車炸彈,導(dǎo)致馬德里巴拉哈斯國(guó)際機(jī)場(chǎng)有蓬停車場(chǎng)的大部分區(qū)域被毀。

分析:通過深入分析機(jī)器譯文與譯后編輯譯文可以發(fā)現(xiàn),機(jī)器翻譯譯文將ETA組織誤譯為了我們?nèi)粘I钪谐R姷腅TC(電子不停車收費(fèi)系統(tǒng))。因此,筆者認(rèn)為,譯員在進(jìn)行譯后編輯時(shí),需格外注意術(shù)語翻譯的準(zhǔn)確性與一致性。不能因?yàn)橐粋€(gè)字母之差而造成翻譯上的重大失誤。

例②:標(biāo)點(diǎn)符號(hào)格式錯(cuò)誤。

原文:It was a moment ago, and I didn’t get a chance to—when he was describing Chinese investments and so forth...

機(jī)器譯文:就在剛才,當(dāng)他描述中國(guó)投資等等的時(shí)候,我沒機(jī)會(huì)……

譯后編輯:剛剛,他談及中國(guó)投資等話題時(shí),我并沒機(jī)會(huì)……

分析:英漢語標(biāo)點(diǎn)符號(hào)既有相似性,又有差異性。例如,漢語中的逗號(hào)、分號(hào)、問號(hào)、感嘆號(hào)及破折號(hào)都與英語中的該類符號(hào)類似,但也并不完全一致。尤其是漢語中擁有某些英語中并未有的標(biāo)點(diǎn)符號(hào),例如書名號(hào)(《》)與頓號(hào)(、)。對(duì)比分析原文、機(jī)器譯文與譯后編輯譯文可知,原文中的“-”在機(jī)器譯文中被誤譯為了“-”,原因就在于漢語中的破折號(hào)應(yīng)為“——”,而非“-”。而譯后編輯譯文中則對(duì)其進(jìn)行了刪除,并在括號(hào)內(nèi)對(duì)原文缺失語義進(jìn)行補(bǔ)充說明,從而使得譯文更加符合譯入語的語法規(guī)范,進(jìn)而體現(xiàn)出該報(bào)告的嚴(yán)謹(jǐn)與正式。

不要惹水瓶座,敏感的水瓶座最害怕受傷;水瓶很敏感,幾句話就能感覺出他人對(duì)自己是討厭還是喜歡。水瓶很浪漫,但有時(shí)也不善于表達(dá),很多事悶在心里,自己研究透徹然后做出行動(dòng)。作為別人眼中的“開心果”,水瓶似乎很堅(jiān)強(qiáng),然而內(nèi)心只有自己知道……

5.2 機(jī)器翻譯錯(cuò)誤成因

5.2.1 機(jī)器一詞多義辨析能力尚待提升

無論英語還是漢語,都存在眾多一詞多義的現(xiàn)象。例如,上述例子中operation一詞,既可指“操作”,同樣還有“行動(dòng)”的含義;再如英語中的brother,既有“哥哥”的含義,同樣又可指“弟弟”。又如interest一詞既含有“興趣”之意,又包含“利益、利息”的含義。因此,機(jī)器翻譯研發(fā)人員應(yīng)當(dāng)著重訓(xùn)練與提升機(jī)器翻譯系統(tǒng)根據(jù)特定語境,辨析可能出現(xiàn)的一詞多義現(xiàn)象的能力。

5.2.2 機(jī)器自動(dòng)分詞技術(shù)有待完善

漢語語句是以字為單位,且字與字之間沒有空格。因此,在進(jìn)行漢譯英(或漢語譯為其他語言)時(shí),必須根據(jù)詞匯或意群對(duì)漢語語句進(jìn)行切分。然而,近年來,雖機(jī)器自動(dòng)分詞技術(shù)取得了較為顯著的進(jìn)步,但各類主流機(jī)器翻譯軟件或在線翻譯平臺(tái)仍會(huì)時(shí)常出現(xiàn)相應(yīng)自動(dòng)分詞錯(cuò)誤導(dǎo)致的機(jī)器誤譯。如此前谷歌、必應(yīng)、有道翻譯等機(jī)器翻譯引擎無法進(jìn)行精準(zhǔn)自動(dòng)分詞,錯(cuò)誤地將“請(qǐng)?jiān)谝幻拙€外等候”譯為“Please wait outside rice-flour noodle.”,將“救生衣柜”誤譯為L(zhǎng)ife-saving Wardrobe,以及將“上車票”誤譯為Get on the Ticket。

5.2.3 機(jī)器學(xué)習(xí)算法技術(shù)亟待提高

相較于統(tǒng)計(jì)機(jī)器翻譯,神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯的語言模型較為簡(jiǎn)單,即“端到端”式。其主要包含2個(gè)部分,編碼器和解碼器。同時(shí),神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯主要依賴于機(jī)器學(xué)習(xí)和機(jī)器算法,基于特定的神經(jīng)語言模型,利用龐大的數(shù)據(jù)庫(kù)以獲取較為精確的詞向量,從而進(jìn)行編碼與解碼。因此,神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯對(duì)機(jī)器學(xué)習(xí)與算法技術(shù)的要求較高。如今,機(jī)器學(xué)習(xí),尤其是深度學(xué)習(xí)技術(shù)仍需不斷革新,以滿足機(jī)器翻譯引擎開發(fā)和語言服務(wù)行業(yè)發(fā)展的需要。

5.2.4 語料庫(kù)、數(shù)據(jù)庫(kù)內(nèi)容尚待更新與拓展

作為神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯不可或缺的組成部分之一,神經(jīng)語言模型和詞向量的訓(xùn)練與獲取在某種程度上都依賴于最新的海量數(shù)據(jù)庫(kù)。此外,翻譯語料的新舊與否,同樣可能決定著機(jī)器翻譯與譯后編輯產(chǎn)出結(jié)果的準(zhǔn)確度和流暢度,如近年來出現(xiàn)的“內(nèi)卷”“躺平”“元宇宙”等新詞的翻譯。因此,倘若使用尚未更新的語料庫(kù)和數(shù)據(jù)庫(kù)進(jìn)行機(jī)器翻譯及譯后編輯,很可能造成某些領(lǐng)域的重大且不可逆轉(zhuǎn)的損失。

5.3 機(jī)器翻譯錯(cuò)誤的應(yīng)對(duì)策略與原則

針對(duì)機(jī)器翻譯出現(xiàn)的不同類型錯(cuò)誤,作為機(jī)器翻譯引擎研發(fā)人員與專業(yè)譯后編輯人員,應(yīng)當(dāng)采取相應(yīng)的對(duì)策,加快翻譯技術(shù)的研發(fā),以期降低機(jī)器翻譯譯文錯(cuò)誤率,切實(shí)提升機(jī)器翻譯與譯后編輯譯文水平。

首先,研發(fā)人員應(yīng)基于特定的應(yīng)用場(chǎng)景,從4個(gè)方面加強(qiáng)翻譯技術(shù)的研發(fā)與應(yīng)用:第一,加強(qiáng)產(chǎn)學(xué)研融合發(fā)展;第二,加強(qiáng)多流程與多渠道整合;第三,提高兼容性、拓寬適用性;第四,提高協(xié)作化,提升翻譯效率(余靜良,2022)。同時(shí),應(yīng)著力提升機(jī)器一詞多義甄別能力,優(yōu)化機(jī)器自動(dòng)分詞技術(shù)、機(jī)器學(xué)習(xí)與算法技術(shù),從而真正實(shí)現(xiàn)包括機(jī)器翻譯在內(nèi)的翻譯技術(shù)的跨越式發(fā)展。此外,各大高校、科研院所及語言服務(wù)提供商應(yīng)不斷更新、拓展和完善自身語料庫(kù)、數(shù)據(jù)庫(kù)內(nèi)容,做到與時(shí)俱進(jìn),從而確保機(jī)器翻譯及譯后編輯產(chǎn)出結(jié)果的準(zhǔn)確性和先進(jìn)性。

其次,譯后編輯人員可利用劉重德倡導(dǎo)的“信、達(dá)、切”原則(劉重德,1979),對(duì)機(jī)器翻譯譯文進(jìn)行適當(dāng)修改與調(diào)整,以期滿足不同客戶群體的需求。第一,遵循“信”的原則,對(duì)原文中術(shù)語內(nèi)涵精準(zhǔn)傳遞。例如,在對(duì)“In December 2006, ETA...”例句中的ETA進(jìn)行翻譯時(shí),不能在對(duì)該術(shù)語毫無查證的情況下將該術(shù)語錯(cuò)誤譯為ETC。第二,可利用“達(dá)”的翻譯原則,如對(duì)機(jī)器翻譯譯文中的“其成員在很大程度上被法國(guó)對(duì)馬里的干預(yù)所分散”進(jìn)行處理,將其修改為“法國(guó)對(duì)馬里實(shí)施干預(yù),該組織成員很大程度上因此而‘支離破碎’”,從而讓譯文做到“語序連貫、邏輯嚴(yán)謹(jǐn)”,較好地傳遞出原文語義內(nèi)容。第三,還可在做到“信、達(dá)”的基礎(chǔ)上,利用“切”的原則對(duì)機(jī)器翻譯譯文進(jìn)行恰當(dāng)處理,使得譯文風(fēng)格簡(jiǎn)約、格式無誤。如在對(duì)“...I didn’t get a chance to—when he was describing Chinese investments and so forth...”該例句進(jìn)行翻譯時(shí),譯文無需對(duì)原文英文格式進(jìn)行完全保留,可根據(jù)漢語標(biāo)點(diǎn)符號(hào)使用規(guī)則對(duì)機(jī)器翻譯譯文進(jìn)行處理。因此,該例句可譯為“剛剛,他談及中國(guó)投資等話題時(shí),我并無機(jī)會(huì)……”。

5.4 機(jī)器翻譯及譯后編輯倫理問題

翻譯是一種跨語言、跨文化的交際活動(dòng),是一項(xiàng)在人類意識(shí)支配下為了達(dá)到某種目的或意圖的主觀能動(dòng)性的活動(dòng)。許鈞(1998)曾指出:“任何翻譯標(biāo)準(zhǔn)的確立,任何翻譯方法的采用,無不受到道德層面的約束?!笨梢?翻譯實(shí)際上就是一種倫理活動(dòng),必然會(huì)受到道德層面的限制和約束。

進(jìn)入21世紀(jì)以來,計(jì)算機(jī)與互聯(lián)網(wǎng)技術(shù)飛速發(fā)展,造就了機(jī)器翻譯的興旺繁榮。尤其是近年來,隨著人工智能、深度學(xué)習(xí)、大數(shù)據(jù)及5G技術(shù)不斷取得新的突破,機(jī)器翻譯也出現(xiàn)了神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯新模式。然而,伴隨翻譯技術(shù)的迭代更新,翻譯倫理問題也在人機(jī)交互過程中層出不窮。鑒于此,筆者總結(jié)出以下機(jī)器翻譯及譯后編輯倫理問題:

機(jī)器使用記憶庫(kù)、術(shù)語庫(kù)等版權(quán)不明的語料翻譯出的譯文,經(jīng)由人工譯后編輯,最終產(chǎn)出的譯文版權(quán)到底歸誰?

如若經(jīng)由機(jī)器翻譯及譯后編輯得出的譯文出現(xiàn)錯(cuò)誤,該錯(cuò)誤應(yīng)由機(jī)器承擔(dān)還是譯后編輯人員承擔(dān)?

譯后編輯人員在修改譯文時(shí),是選擇忠實(shí)于原文還是忠實(shí)于機(jī)器翻譯譯文?需不需要參考原文?

某些機(jī)器翻譯公司為提高公司效益,刻意夸大宣傳機(jī)器翻譯效能,甚至將人工譯文當(dāng)作機(jī)器譯文進(jìn)行宣傳,嚴(yán)重?fù)p害譯員權(quán)利,造成信任危機(jī),這種情況該如何應(yīng)對(duì)?

可能還會(huì)出現(xiàn)客戶要求與譯員本身職業(yè)道德相違背,亦或與國(guó)家、民族利益或宗教習(xí)俗相背的問題。在這種情況下,譯員應(yīng)如何選擇?

此外,某些語言服務(wù)企業(yè)可能會(huì)出現(xiàn)泄露客戶或譯員隱私數(shù)據(jù)甚至販賣其隱私數(shù)據(jù)的行為和現(xiàn)象。

上述問題應(yīng)當(dāng)引起所有機(jī)器翻譯及譯后編輯研究人員的反思。

5.5 機(jī)器翻譯及譯后編輯倫理問題成因

5.5.1 意識(shí)不強(qiáng)

近年來,機(jī)器翻譯與譯后編輯倫理問題層出不窮,如某些翻譯公司公開宣稱其公司產(chǎn)出譯文可以與人工譯文相媲美;又如某些譯員錯(cuò)將機(jī)器翻譯譯文當(dāng)作人工譯文交付用戶;再如某些語言服務(wù)提供商存在翻譯數(shù)據(jù)和用戶數(shù)據(jù)泄露的現(xiàn)象與問題等。以上所述案例多數(shù)由翻譯倫理意識(shí)薄弱所致。

5.5.2 責(zé)任不清

大部分語言服務(wù)企業(yè)的譯員均接受過專業(yè)培訓(xùn)。因此,其對(duì)相關(guān)翻譯業(yè)務(wù)、譯員職業(yè)道德及應(yīng)承擔(dān)的責(zé)任較為熟知。然而,某些語言服務(wù)提供商的譯員并未經(jīng)過專業(yè)培訓(xùn)和教育,因而缺乏相應(yīng)的責(zé)任意識(shí),對(duì)相關(guān)翻譯緊急情況的處理能力較弱,無法理清責(zé)任主體和履行專業(yè)譯員應(yīng)盡義務(wù),可能會(huì)出現(xiàn)“責(zé)權(quán)不清”“互相推諉”的問題,最終可能導(dǎo)致某些語言服務(wù)企業(yè)與譯員個(gè)體“聲名狼藉”。

5.5.3 版權(quán)不明

機(jī)器翻譯與譯后編輯倫理問題的另一大成因即為版權(quán)不明。由于記憶庫(kù)、術(shù)語庫(kù)等語料的開放使用和二度傳播,倘若機(jī)器使用版權(quán)來源不明的語料內(nèi)容進(jìn)行翻譯,將很可能產(chǎn)生譯文(或譯著)署名權(quán)糾紛等版權(quán)問題。

5.5.4 規(guī)則不從

首先,國(guó)際標(biāo)準(zhǔn)化組織(ISO)已于2017年4月發(fā)布ISO 18587—2017“Translation services—Post-editing of machine translation output—Requirements”;其次,2019年,中國(guó)翻譯協(xié)會(huì)發(fā)布了《譯員職業(yè)道德準(zhǔn)則與行為規(guī)范》;最后,國(guó)家標(biāo)準(zhǔn)GB/T 40036—2021《翻譯服務(wù) 機(jī)器翻譯結(jié)果的譯后編輯要求》于2021年4月30日由國(guó)家標(biāo)準(zhǔn)化管理委員會(huì)正式批準(zhǔn)發(fā)布(劉智洋 等,2021),已于2021年11月1日實(shí)施。在第一份標(biāo)準(zhǔn)發(fā)布之前,很長(zhǎng)一段時(shí)間內(nèi),國(guó)內(nèi)外機(jī)器翻譯譯后編輯的發(fā)展速度與其缺乏標(biāo)準(zhǔn)規(guī)范的發(fā)展?fàn)顟B(tài)極不相匹配。因此,該段時(shí)間內(nèi),各類問題層出不窮,諸如譯文質(zhì)量層次不齊、版權(quán)糾紛、數(shù)據(jù)泄露、定價(jià)不合理等等。雖然在一系列標(biāo)準(zhǔn)與規(guī)范出臺(tái)后,譯員素質(zhì)和責(zé)權(quán)意識(shí)得以顯著提升,但仍有部分譯員規(guī)則意識(shí)淡薄,不遵守相應(yīng)行業(yè)規(guī)范,導(dǎo)致在譯文交付過程中,各類問題仍有出現(xiàn)。

5.5.5 誠(chéng)信不足

誠(chéng)信是立身之本。然而,某些翻譯公司為了凸顯機(jī)器翻譯引擎的效果,有意夸大宣傳,甚至將專業(yè)譯員的人工譯文當(dāng)作機(jī)器翻譯產(chǎn)出的譯文進(jìn)行宣傳。不僅違反相關(guān)法律法規(guī),更是對(duì)語言服務(wù)提供商、譯員與客戶間信任關(guān)系的嚴(yán)重?fù)p害。此外,某些非專業(yè)譯員還可能出現(xiàn)延期交付譯文、錯(cuò)誤交付譯文亦或交付譯文質(zhì)量無法滿足客戶的期待等問題,從而產(chǎn)生“信任危機(jī)”等翻譯倫理問題。

5.6 機(jī)器翻譯及譯后編輯倫理問題的應(yīng)對(duì)策略

首先,在宏觀層面上,國(guó)家相關(guān)部門和行業(yè)協(xié)會(huì)應(yīng)當(dāng)制定與出臺(tái)相應(yīng)法律法規(guī)和行業(yè)規(guī)范。例如,中國(guó)翻譯協(xié)會(huì)已于2019年正式發(fā)布國(guó)內(nèi)首部《譯員職業(yè)道德準(zhǔn)則與行為規(guī)范》(中國(guó)翻譯協(xié)會(huì),2019)。該規(guī)范理應(yīng)引起每位譯員的高度重視。譯員應(yīng)當(dāng)恪守相關(guān)道德準(zhǔn)則與行為規(guī)范,提升自身職業(yè)道德水平,確保翻譯行業(yè)的積極、健康、有序、和諧發(fā)展。

其次,在理論創(chuàng)新層面上,應(yīng)當(dāng)探索翻譯倫理新模式。約納斯于1979年出版的《責(zé)任原理》一書被認(rèn)為是技術(shù)時(shí)代一種新倫理學(xué)的發(fā)端。因此,有必要將約納斯提出的“責(zé)任倫理”引入翻譯倫理學(xué)領(lǐng)域。切斯特曼提出的再現(xiàn)倫理、服務(wù)倫理、交際倫理、基于規(guī)范的倫理與承諾倫理5種倫理模式屬于微觀層面,關(guān)注的是譯中行為,對(duì)譯前與譯后行為則關(guān)注較少。鑒于此,我們應(yīng)當(dāng)提出新的翻譯倫理模式,做到“將客戶的眼前利益與人類的高遠(yuǎn)目標(biāo)結(jié)合,將職業(yè)操守的近距離責(zé)任與技術(shù)倫理的遠(yuǎn)距離責(zé)任結(jié)合,讓約納斯的責(zé)任倫理成為新時(shí)代語境下一個(gè)新的翻譯倫理模式”(任文,2020)。

再者,相關(guān)語言類高校與應(yīng)用型大學(xué)應(yīng)當(dāng)開設(shè)翻譯倫理相關(guān)課程,將翻譯倫理知識(shí)貫穿于教學(xué)實(shí)踐中。2021年,北京語言大學(xué)國(guó)際語言服務(wù)博士點(diǎn)開始招生。該博士點(diǎn)的設(shè)立與招生可謂高校語言服務(wù)發(fā)展和研究的重大進(jìn)步。其他高校,尤其是語言類和綜合應(yīng)用型大學(xué)應(yīng)趁勢(shì)而上,完善翻譯倫理教育體系,設(shè)立翻譯倫理教育和研究專項(xiàng)基金,組織專業(yè)人員編寫翻譯倫理理論與實(shí)踐相關(guān)教材,開展對(duì)翻譯倫理課程教師的專業(yè)培訓(xùn),逐步開設(shè)翻譯倫理相關(guān)課程。同時(shí),也應(yīng)強(qiáng)化校企合作,建立語言服務(wù)和翻譯倫理實(shí)習(xí)基地,培養(yǎng)熟練掌握和運(yùn)用翻譯倫理知識(shí)的高素質(zhì)、復(fù)合型語言服務(wù)人才。

另外,語言服務(wù)企業(yè)應(yīng)當(dāng)積極開展內(nèi)部人員培訓(xùn)和教育。語言服務(wù)提供商應(yīng)強(qiáng)化責(zé)任意識(shí),樹立翻譯倫理底線思維,定期開展翻譯倫理培訓(xùn)和召開相關(guān)會(huì)議,制定機(jī)器翻譯譯后編輯操作規(guī)范,建立翻譯倫理獎(jiǎng)懲制度,規(guī)范企業(yè)服務(wù)與產(chǎn)品的宣傳手段、內(nèi)容,進(jìn)而促進(jìn)語言服務(wù)行業(yè)的健康和可持續(xù)發(fā)展。

最后,個(gè)體譯員應(yīng)當(dāng)樹立清晰的翻譯倫理責(zé)任意識(shí)。譯者應(yīng)恪守行業(yè)規(guī)范,遵守道德準(zhǔn)則,將翻譯倫理要求貫穿整個(gè)翻譯流程。充分利用最新翻譯技術(shù),在不違背國(guó)家與民族利益等前提下,盡量滿足客戶的合理需求。不斷更新完善翻譯倫理內(nèi)涵,在翻譯倫理約束下,將翻譯技術(shù)應(yīng)用到翻譯研究、翻譯教學(xué)、口筆譯實(shí)踐與語言服務(wù)行業(yè)等更廣闊的領(lǐng)域。

6. 結(jié)語

本文摘選“Country Reports on Terrorism 2014”等文本內(nèi)容,利用阿里翻譯Alynx平臺(tái)對(duì)文本進(jìn)行機(jī)器翻譯,再由人工對(duì)機(jī)器翻譯譯文進(jìn)行譯后編輯。通過對(duì)比分析機(jī)器翻譯與譯后編輯譯文發(fā)現(xiàn),機(jī)器翻譯譯文的確存在各類錯(cuò)誤,這仍然是機(jī)器翻譯平臺(tái)與軟件的“通病”。再對(duì)上述文本中具體案例進(jìn)行歸納發(fā)現(xiàn),機(jī)器翻譯時(shí)常出現(xiàn)類似詞匯層面、句法層面及符號(hào)層面的錯(cuò)誤。因此,上述各類機(jī)器翻譯錯(cuò)誤應(yīng)當(dāng)引起機(jī)器翻譯及譯后編輯研究人員的高度重視。

此外,針對(duì)不同的機(jī)器翻譯錯(cuò)誤類型,筆者總結(jié)出錯(cuò)誤產(chǎn)生的原因,如機(jī)器一詞多義辨析能力尚待提升、機(jī)器自動(dòng)分詞技術(shù)有待完善、機(jī)器學(xué)習(xí)算法技術(shù)亟待提高、語料庫(kù)、數(shù)據(jù)庫(kù)內(nèi)容尚待更新與拓展。同時(shí),基于機(jī)器翻譯及譯后編輯倫理問題,本文還理清了倫理問題的成因,即意識(shí)不強(qiáng)、責(zé)任不清、版權(quán)不明、規(guī)則不從和誠(chéng)信不足。

依據(jù)機(jī)器翻譯錯(cuò)誤成因,筆者提出:首先,研發(fā)人員應(yīng)加大翻譯技術(shù)研發(fā)與應(yīng)用的力度,不斷順應(yīng)人工智能時(shí)代語言服務(wù)行業(yè)的發(fā)展需求;其次,譯后編輯人員可利用劉重德提出的“信、達(dá)、切”翻譯原則,對(duì)機(jī)器翻譯譯文錯(cuò)誤進(jìn)行修改,確保譯文通順流暢、邏輯連貫,以期滿足不同客戶群體的需求。

同時(shí),為解決機(jī)器翻譯及譯后編輯倫理問題,筆者認(rèn)為:第一,相關(guān)部門與行業(yè)協(xié)會(huì)應(yīng)當(dāng)出臺(tái)相應(yīng)法律法規(guī)及行業(yè)規(guī)范,切實(shí)約束譯員主體及規(guī)范譯者行為,努力營(yíng)造和諧共生的行業(yè)環(huán)境;第二,應(yīng)當(dāng)將約納斯的“責(zé)任倫理”引入翻譯倫理學(xué)領(lǐng)域,從而不斷豐富翻譯倫理理論和模式;第三,相關(guān)高校應(yīng)當(dāng)創(chuàng)新性地開設(shè)翻譯倫理相關(guān)課程,培養(yǎng)具備扎實(shí)翻譯倫理知識(shí)的新型翻譯人才;第四,語言服務(wù)提供商應(yīng)適時(shí)開展企業(yè)內(nèi)部翻譯倫理培訓(xùn),強(qiáng)化譯員翻譯倫理意識(shí)和思維,制定譯后編輯操作準(zhǔn)則,規(guī)范宣傳手段;第五,個(gè)體譯員應(yīng)樹立基本翻譯倫理責(zé)任意識(shí),恪守道德準(zhǔn)則,遵守行業(yè)規(guī)范,化解客戶利益關(guān)切與自身道德底線之間的矛盾,妥善處理好個(gè)人、客戶、語言服務(wù)提供商、出版商及贊助人等各方之間的關(guān)系,以實(shí)現(xiàn)語言服務(wù)產(chǎn)業(yè)的健康和可持續(xù)發(fā)展。

希望本文能為機(jī)器翻譯及譯后編輯的研發(fā)與翻譯倫理學(xué)在機(jī)器翻譯領(lǐng)域的應(yīng)用提供學(xué)理參考,為人機(jī)交互的良性、健康發(fā)展貢獻(xiàn)微薄之力。

猜你喜歡
譯員譯文機(jī)器
Stem cell-based 3D brain organoids for mimicking,investigating,and challenging Alzheimer’s diseases
機(jī)器狗
機(jī)器狗
譯文摘要
未來機(jī)器城
電影(2018年8期)2018-09-21 08:00:06
會(huì)議口譯中譯員的譯前準(zhǔn)備研究——一項(xiàng)基于上海譯員的問卷調(diào)查
口譯中的“陷阱”
I Like Thinking
論機(jī)器翻譯時(shí)代人工譯員與機(jī)器譯員的共軛相生
外文研究(2016年3期)2016-03-17 12:41:05
譯員與翻譯企業(yè)的勞資關(guān)系及其和諧發(fā)展
双峰县| 榆社县| 敦煌市| 南宫市| 同心县| 渑池县| 专栏| 会理县| 渭南市| 东台市| 玉溪市| 雅安市| 武定县| 馆陶县| 敖汉旗| 宁波市| 陈巴尔虎旗| 建始县| 岳西县| 乌鲁木齐县| 柯坪县| 昌都县| 新泰市| 霍州市| 罗平县| 涞源县| 兴安县| 深水埗区| 平远县| 吉木乃县| 宁明县| 周至县| 集贤县| 敦煌市| 哈巴河县| 彰武县| 平阴县| 绿春县| 唐河县| 邢台县| 全州县|