王湘玲 賈艷芳
[摘要]機器翻譯已廣泛應用于語言服務行業(yè),國外機器翻譯譯后編輯實證研究近年來取得了較豐富的研究成果?;凇胺g研究文獻目錄”和“機器翻譯檔案館”兩大數據庫,通過全面剖析譯后編輯過程及產品評估、譯后編輯效率影響因素、譯后編輯工具與譯后編輯者及人才培養(yǎng)四大研究熱點,分析其研究進展與研究方法,闡述其未來發(fā)展趨勢以及對我國機器翻譯譯后編輯研究的啟示,為國內相關研究以及翻譯人才培養(yǎng)和翻譯學科建設提供新視角新方法。
[關鍵詞]機器翻譯;譯后編輯;實證研究
一引言
隨著全球化和信息化進程不斷推進,海量的翻譯需求給全球語言服務行業(yè)帶來了前所未有的機遇和挑戰(zhàn)。在此背景下,機器翻譯譯后編輯(machinetranslation post-editing)(簡稱譯后編輯)成為應對這一挑戰(zhàn)的有效途徑。技術的發(fā)展已經徹底改變了職業(yè)譯者的工作方式,不同于傳統(tǒng)人工翻譯,譯后編輯是一種人機交互的翻譯過程,是對機器翻譯結果進行編輯及更正的過程,其中涉及的因素包括機器翻譯系統(tǒng)、譯后編輯工具、譯者、語言對特征等,它們相互作用共同決定譯后編輯的過程和結果,使經過譯后編輯的譯文達到“終端用戶預期的質量需求水平”。翻譯自動化用戶協(xié)會(TAUS)預測,譯后編輯“有可能在未來五年內取代翻譯記憶技術成為翻譯行業(yè)的首要生產環(huán)境”。譯后編輯在國外翻譯行業(yè)的廣泛應用吸引了眾多翻譯學者對這一新技術和新職業(yè)的研究興趣。國際上對該領域的探究主要運用實證手段,近年已有較豐富的研究成果,而國內還鮮有此領域的研究成果出現。本文聚焦于國際上關于譯后編輯的實證研究,重點分析其研究進展與研究方法,進而闡述其未來發(fā)展趨勢以及對我國機器翻譯譯后編輯研究的啟示。
二數據來源
根據Holmes對翻譯學整體研究框架的界定,譯后編輯實證研究同時具備純翻譯研究和應用翻譯研究屬性。此外,譯后編輯實證研究具有明顯的跨學科特質,是翻譯研究以及機器翻譯領域共同的研究話題,所以本文將數據來源定位于兩個領域的權威數據庫,分別為翻譯研究文獻目錄(TranslationStudies Bibliography)和機器翻譯檔案館(Ma-chine Translation Archive),以保證數據全面反映譯后編輯實證研究的現狀。翻譯研究文獻目錄是由歐洲翻譯協(xié)會、魯汶大學翻譯中心和本杰明出版公司聯合開發(fā)的翻譯研究數據庫,其中涵蓋五十多種翻譯領域期刊,以及翻譯學相關的論文集、學位論文等,是翻譯領域庫容最大、專業(yè)性最強的數據庫,能夠充分體現譯后編輯在翻譯領域的研究現狀。機器翻譯檔案館是國際機器翻譯協(xié)會(International As-sociation for Machine Translation)委托歐洲翻譯協(xié)會(European Association for Machine Translation)編撰,收錄了全球最有影響力的機器翻譯期刊和會議論文集,可以代表譯后編輯在機器翻譯領域的最新研究動向。機器翻譯歷經曲折的發(fā)展之后,在20世紀90年代日臻成熟。譯后編輯研究于本世紀初開始,近年來受到了譯學界的廣泛關注。因此,本文將這項研究的時間范圍確定為2000年至2016年。筆者搜索了兩個數據庫內標題、關鍵詞或摘要中包含post-editing的文章,并通過閱讀摘要和全文的方式剔除重復及不相關數據,共獲得譯后編輯實證研究文章87篇,其中35篇來自翻譯研究文獻目錄,52篇來自機器翻譯檔案館。總體上,國際譯后編輯實證研究自2000年以來呈現上升的趨勢,2009年開始每年都有穩(wěn)定的研究成果,其研究內容與方法也愈加豐富。
三研究進展
從研究目的來看,以上研究主要分為四類:1)譯后編輯過程及產品評估;2)譯后編輯效率影響因素;3)譯后編輯工具的研發(fā);4)譯后編輯者及人才培養(yǎng)。以下對其主要研究內容及方法進行剖析。
(一)譯后編輯過程及產品評估
譯后編輯過程及產品評估指對譯后編輯的速度、質量、認知負荷與技術負荷等方面進行評測,通常采用與傳統(tǒng)人工翻譯或翻譯記憶進行實證對比的模式。其生產率評估多集中在速度和質量兩方面。Fiederer&O;'Brien發(fā)現英譯德譯的譯后編輯譯文雖文體風格不如人工翻譯,但準確度和流暢度更具優(yōu)勢。Garcia對英漢雙向譯后編輯進行了探究,發(fā)現譯后編輯在逆向翻譯(漢譯英)且文本難度適中的條件下,速度提升效果更為顯著,雙向翻譯時譯后編輯的質量評分都高于人工翻譯。Guerberof對比了譯后編輯、80%~90%匹配區(qū)問的翻譯記憶以及人工翻譯三種模式在速度和質量上的差異,指出譯后編輯明顯比翻譯記憶及人工翻譯更快,譯后編輯的錯誤數量遠低于翻譯記憶,且在準確性、誤譯以及語言方面有明顯優(yōu)勢。雖然此類研究所采用的機器翻譯系統(tǒng)、受試、質量評估方式及語言對均有差異,但研究結果基本證實,相對于傳統(tǒng)人工翻譯和一定門檻值的翻譯記憶,譯后編輯在不同程度上提升了翻譯速度和質量。
在探究譯者的認知心理過程中,認知負荷評測成為了譯后編輯實證研究的焦點。認知心理研究表明人的工作記憶有限,長時間在高強度認知負荷環(huán)境中工作容易疲勞,這會影響譯者的情緒和對任務的態(tài)度,從而降低工作效率。Sekino以關聯理論為研究視角,發(fā)現譯后編輯需要同時進行概念編碼和過程編碼,所耗認知負荷較人工翻譯反而更高。Koglin基于停頓與眼動指標,證實處理隱喻這一特殊語言現象時,譯后編輯所需認知負荷遠低于人工翻譯。其他眼動研究也表明,譯后編輯與傳統(tǒng)人工翻譯的認知加工模式差異較大。人工翻譯時,原文和譯文所獲注視次數基本相同,而譯后編輯時,譯文所獲注視次數往往遠高于原文,同時前者原文部分的平均注視時長遠高于后者。差異造成的原因顯而易見,譯后編輯過程是對已有機器翻譯譯文的修改過程,所以更多注視譯文區(qū)域,而人工翻譯要以閱讀理解原文為起點,所以關注原文更多。由于認知負荷的大小難以直接度量,其評測方法一直處于不斷發(fā)展中,目前常用的評測指標主要分為三類,即眼動指標、停頓指標和時間指標。盡管三類指標具有各自的解釋力,但目前仍無法基于現有研究得出譯后編輯減輕認知負荷的定論。
(二)譯后編輯效率影響因素
譯后編輯效率的影響因素主要包括原文特征與機譯質量等。探究這些因素與譯者精力投人及產出質量之間的關系,制定受控語言寫作規(guī)范以實施譯前編輯,合理設立譯后編輯的機譯質量容忍門檻,將有利于提高譯后編輯效率和減輕譯者精力投入。源語文本特征和機器翻譯錯誤與譯后編輯效率緊密相關,某些原文特征引發(fā)的機器翻譯錯誤更為復雜,從而造成更多譯后編輯精力投入。OBrien針對英譯德譯后編輯的一系列研究發(fā)現,包含消極翻譯指征的句子會在整體上降低譯后編輯速度,而這些指征對譯后編輯負荷的影響程度不同,如較長的名詞短語及動名詞對譯后編輯負荷影響較大,而縮寫、專有名詞以及標點符號等影響較小。Aikawa et al研究表明受控語言寫作規(guī)范與語言對特征直接相關,譯后編輯效率提升程度對英語譯人荷蘭語、漢語、阿拉伯語及法語各不相同。Tatsumi&Roturier;證實過長或過短的句子都不利于譯后編輯,因為過長的句子分析起來更有難度,過短的句子所提供的語境有限,不完整的句子以及復合句譯后編輯需要更長的時問來處理。由此,制定合理的受控語言寫作規(guī)范,實施譯前編輯,即在機器翻譯之前減少源語文本中的消極翻譯指征,是提高機器翻譯質量從而提高譯后編輯效率的有效途徑。
機器翻譯質量直接影響譯后編輯效率,對低質量機譯結果進行譯后編輯,會造成比人工翻譯更多的精力損耗。根據機譯質量對譯后編輯所耗精力進行預先估測,可以避免過低質量的機譯結果進入譯后編輯流程。機器翻譯質量評估通常通過對比機譯結果和標準參考譯文之問的編輯量差異來完成,其常用方法包括BLEU,NIST,GTM,METEOR以及TER等。O'Brien根據GTM得分,將源語及其對應的機器翻譯句子質量分為低分組、中間組和高分組,三組得分與其譯后編輯所需負荷大小正好相反,低分組需要高負荷而高分組需要低負荷,GTM和TER高分段的句子均比中等及低分段句子明顯耗時短且認知負荷低。Escartin&Arcedillo;研究表明,與人工翻譯和翻譯記憶相比,機器翻譯得分BLEU高于45,TER低于30或FMS高于75則能保證譯后編輯效率更高。機器翻譯錯誤的具體性質和數量也與譯后編輯的程度存在相關性。Daems et al從可接受性和準確性兩方面評估機器翻譯錯誤,依據其嚴重性,錯誤被劃分為不同等級并賦予0到4分不等的權重,發(fā)現機器翻譯錯誤權重均值與譯后編輯時問、平均注視時長、注視次數、停頓率、平均停頓率等都存在不同程度的相關性,其中誤譯、句子結構及詞序錯誤與各認知負荷指征相關性最強。
(三)譯后編輯工具研發(fā)
現階段譯后編輯通常依附機輔翻譯工具完成,然而此類工具專為翻譯記憶開發(fā),許多功能對于譯后編輯工作來說并不理想,因此研發(fā)適用于譯后編輯過程的專業(yè)工具是此類研究的主要目的。Penk-ale&Way;介紹了一個自助式在線機器翻譯平臺SmartMATE,用戶可以根據已有數據個性化設置平臺功能進行譯后編輯,作者通過一個大型游戲公司使用該平臺的案例,分析展示了其應用優(yōu)勢。Roturier描述了一款專為社區(qū)用戶開發(fā)的在線譯后編輯平臺ACCEPT,此軟件不但可以靈活定制滿足譯后編輯的不同需求,還可以實時記錄用戶的譯后編輯過程并生成活動報告,便于隨時查看與分析譯后編輯過程。Moorkens&O;'Biren調查發(fā)現職業(yè)譯后編輯者普遍對當前的譯后編輯環(huán)境不滿意,譯者希望譯后編輯界面簡潔明快且具備可外掛詞典以及網絡搜索引擎等功能,大部分譯者偏愛交互式機器翻譯系統(tǒng)在譯后編輯過程中提供動態(tài)更正建議。這些研究為譯后編輯工具開發(fā)提供了來自終端用戶最直接的反饋及建議,對人性化譯后編輯工具的研發(fā)大有裨益。
此外,自動譯后編輯工具(Automatic Post-ed-itor,APE)和交互式機器翻譯系統(tǒng)也越來越受關注。Mundt et al.使用自動譯后編輯軟件對機器翻譯結果中漏譯詞語進行補譯,發(fā)現阿拉伯語譯英比漢譯英的補譯部分更準確。Parton et al.介紹了一種可修正準確性方面錯誤的自動譯后編輯器,并證實30~56%的句子經自動編輯后其準確性較機器翻譯結果有所提高。Germdn et al.采用CasMaCat工作平臺測試了傳統(tǒng)譯后編輯和交互式譯后編輯的差異,發(fā)現兩種模式下翻譯耗時差別不大,作者認為后者速度沒有顯著提升的原因可能是未經訓練的譯者不能充分利用其優(yōu)勢。機器翻譯領域在不斷探索更加快捷有效且可滿足不同客戶需求的譯后編輯工具,此類工具多具有靈活易用且能提供可定制化服務的特征,用戶不需要太多的技術背景就可方便操作。因此,自動譯后編輯器及交互式機器翻譯等技術的不斷完善將進一步提升譯后編輯效率。
(四)譯后編輯人才培養(yǎng)
人機交互是譯后編輯最主要的表征。作為譯后編輯任務的完成人,譯后編輯者的作用至關重要,此類研究主要關注譯后編輯者的相關情況,包括譯后編輯者的態(tài)度、能力及培養(yǎng)方式等。Aranberri etal.研究發(fā)現職業(yè)譯者對機器翻譯的態(tài)度比較消極,而無翻譯經驗的外行用戶對譯后編輯持更加積極的態(tài)度。相比人工翻譯,譯后編輯時職業(yè)譯者和外行用戶的翻譯效率均有提高,而外行用戶提升幅度更大。Guerberof通過問卷調查了職業(yè)譯者對機器翻譯及譯后編輯的態(tài)度及經驗,發(fā)現他們對機器翻譯結果及譯后編輯的看法極為復雜,許多消極態(tài)度與以往參與機器翻譯譯后編輯項目的不悅經歷有關。Yamada分析了大學語言專業(yè)學生英譯日譯后編輯的時間、質量及態(tài)度,并通過與職業(yè)譯者相比較,發(fā)現同時具備三種特征(對譯后編輯持有正面態(tài)度、在傳統(tǒng)翻譯課堂測評中成績優(yōu)異、采取分析而非整合的方式進行翻譯)的學生有潛力成為合格的譯后編輯者。雖然譯后編輯在翻譯市場得到廣泛應用,但是當前行業(yè)內部嚴重缺少職業(yè)譯后編輯者,原因是譯后編輯能力需要長期的實踐和經驗積累,且譯后編輯人才培養(yǎng)相對滯后,與行業(yè)需求嚴重脫節(jié)。
現階段譯后編輯培訓主要通過公司內部及在職培訓實現,高校作為譯者培養(yǎng)重地還鮮有把譯后編輯納入常規(guī)翻譯課程設置。近年部分學者通過自身譯后編輯課堂實踐,積極探索最佳譯后編輯教學方案。Depraetere基于其譯后編輯課堂教學案例分析發(fā)現,對于學生譯者來說,不可過分弱化譯后編輯文體風格及措辭的重要性,因為學生本身翻譯水平有限且比較依賴機器翻譯結果,過分強調可能導致譯后編輯質量過差。Koponen介紹了其在赫爾辛基大學一學期的譯后編輯教學實踐及評估過程,該課程包括機器翻譯系統(tǒng)對比、譯前編輯、單語譯后編輯、譯后編輯質量水平和機器翻譯質量評估等幾大模塊。實踐表明一學期的課程時間較為有限,很難對每個模塊展開深入講解與剖析。目前,譯后編輯教學及人才培養(yǎng)研究還停留在對譯后編輯能力界定、課程設置規(guī)范等理論探討層面,其實證研究數量相對較少,且多采用案例分析、訪談、問卷調查等方法,側重從不同角度呈現譯后編輯教學中出現的問題以及譯者對于這一新技術新職業(yè)的態(tài)度及期許。
四趨勢與啟示
本文力圖全面涵蓋翻譯學和機器翻譯領域中譯后編輯實證研究的最新成果,雖然其研究內容豐富,角度新穎,研究方法也值得借鑒,但作為一個跨學科新興研究領域,譯后編輯實證研究涉及到翻譯學、語言學、認知心理學、計算機語言學、統(tǒng)計學等多方面知識,研究難度大,許多研究仍處于探索性階段,本文認為未來研究主要存在以下發(fā)展趨勢:
(一)進一步驗證已有研究結果
現有譯后編輯實證研究雖然主題豐富,但許多研究結果仍不具備普遍性,如對于譯后編輯過程和質量評估時,所選機譯系統(tǒng)、原文文本類型及難度、譯后編輯程度(輕度譯后編輯或充分譯后編輯)、譯者數量及經驗、數據收集工具選擇如眼動儀類型,以及實驗過程是否可以查閱詞典等,都會在不同程度上影響實驗結果,因此已有的小范圍研究只能基于實驗本身的變量控制得出有限的結論。此外,已有研究所涉及的語言面較窄,原語以英語居多,目的語多見于法語、德語、西班牙語等同族語言。由于不同語言,尤其是不同語系的語言特征迥異,如英譯法與英譯漢的機器翻譯水平差別很大,相應機譯錯誤類型、受控語言寫作規(guī)范也不同,所以某一語言對的譯后編輯研究結果對于不同語言對并不一定具備可適應性,因此后續(xù)各研究主題需要在更多實驗、更大樣本、更豐富的語言對上進行多方驗證。
(二)理論與實踐層面創(chuàng)新譯后編輯人才培養(yǎng)研究
國外多聚焦于對譯后編輯的評估和工具開發(fā),而關注譯后編輯者培養(yǎng)的研究卻寥寥無幾,少有的幾項研究仍停留在對譯后編輯實踐模式嘗試性的探討,高校也鮮有把譯后編輯能力培養(yǎng)作為一門自成體系的獨立課程,造成譯后編輯人才培養(yǎng)與其市場需求嚴重脫節(jié),國內人才培養(yǎng)現狀與國外大致相似。我國翻譯專業(yè)碩士(MTI)于2007年設立,為順應全球化、信息化背景下市場對翻譯人才的需要,各大高校都在積極創(chuàng)新培養(yǎng)模式以產出熟練掌握行業(yè)技術的翻譯人才,其中包括普遍將機輔翻譯課納入MTI課程設置,而基于譯后編輯人才培養(yǎng)的理論與實踐研究在國內仍屬空白。究其原因,一是由于譯后編輯仍屬新生事物,對其人才的培養(yǎng)尚未引起翻譯研究領域的足夠重視;另一方面,由于學界對于譯后編輯所涉及的專業(yè)能力還處于摸索階段,亟待成熟的學術專著和科研隊伍保證此類研究的開展。相比之下,企業(yè)對譯后編輯技能培養(yǎng)模式則更為成熟,如TAUS、SDL International、Welocalize等國際著名機構或公司都建立了相應的人才培訓機制,積累了豐富的譯后編輯人才培養(yǎng)經驗。因此,未來翻譯研究者將立足高校翻譯人才培養(yǎng)模式創(chuàng)新,充分利用企業(yè)機構在譯后編輯人才培養(yǎng)的優(yōu)勢,共享師資、技術與成果,建立“產學研”相結合的譯后編輯人才培養(yǎng)機制,為未來譯后編輯人才培養(yǎng)開辟一條校企雙贏的可行之路。
(三)實現機器翻譯與翻譯學研究領域的進一步合作
目前,國外機器翻譯領域多關注譯后編輯工具的研發(fā)及評測,對工具的使用者——譯后編輯人才的培養(yǎng)沒有引起足夠重視。而翻譯學研究者對日新月異的譯后編輯工具了解甚少。具體而言,雖然譯后編輯工具的研發(fā)成果頗豐,但其中得到廣泛推廣的新工具卻非常有限,可以應用于譯后編輯教學的則更為稀缺?,F今多數主流機輔翻譯軟件如Tra-dos及MemoQ等兼有譯后編輯功能,國內諸多高校所采用的傳神公司研發(fā)的Tcloud翻譯軟件內嵌于Office中,也兼?zhèn)洳樵儥C器翻譯功能,可用于譯后編輯。此外,在線機譯系統(tǒng)中,Google TranslatorToolkit支持對Google機譯結果進行在線譯后編輯,應用較為成熟。此類工具雖可用于譯后編輯教學,但由于其主要功能服務于機輔翻譯,并非獨立的專業(yè)譯后編輯工具,所以無法靈活定制充分滿足譯后編輯及其教學的不同需求。而機器翻譯領域最新研發(fā)的譯后編輯工具,如交互式機器翻譯系統(tǒng)、自動譯后編輯器等,卻鮮少得到翻譯學及翻譯教育領域的關注。因此,機器翻譯領域未來將在技術上對譯后編輯教學及人才培養(yǎng)等給予更多關注和支持,翻譯研究領域也將更充分地學習和利用機器翻譯領域的新成果,掌握新工具新技術,提高翻譯人才培養(yǎng)效率。
最后,加強譯后編輯基礎理論建設?,F有研究多為描述性研究,長于方法而短于理論。譯后編輯實證研究對于機器翻譯系統(tǒng)優(yōu)化、機器翻譯譯文篩選、科學制定受控語言寫作規(guī)范、合理設置譯后編輯定價模式及研究譯后編輯人才培養(yǎng)模式等方面都有積極意義,強化對該領域基礎理論研究,對于指導其走向成熟必不可少。
五結語
機器翻譯是語言服務行業(yè)的核心技術,機器翻譯譯后編輯模式已廣泛應用于語言服務行業(yè),有望超越翻譯記憶成為翻譯行業(yè)的首要生產環(huán)境。本文基于翻譯研究文獻目錄和機器翻譯檔案館兩大數據庫,較全面地剖析了譯后編輯實證研究在翻譯研究領域和機器翻譯領域的研究熱點,主要包括對譯后編輯過程及產品的評估、對譯后編輯效率影響因素的挖掘、對譯后編輯工具的研發(fā)以及對譯后編輯者及人才培養(yǎng)的探究。相比其他翻譯研究,譯后編輯仍屬于新興跨學科研究領域,許多研究內容仍需進一步深入探究,本文通過對譯后編輯研究現狀的總結和其發(fā)展趨勢的預測,希望給國內譯后編輯實證研究提供新視角新方法,對翻譯人才培養(yǎng)和翻譯學科建設具有一定價值。