周興華 李懿洋
全球化和本地化的蓬勃發(fā)展帶來了海量翻譯需求,單純依靠人工翻譯已遠(yuǎn)不能滿足這些需求。隨著深度學(xué)習(xí)、機(jī)器學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)等人工智能技術(shù)的發(fā)展,機(jī)器翻譯的輸出質(zhì)量得到了明顯提升,但仍然無法達(dá)到職業(yè)譯員翻譯的水平。 為了滿足不斷增長的翻譯需求,同時(shí)實(shí)現(xiàn)翻譯效率與翻譯質(zhì)量之間的平衡,機(jī)器翻譯譯后編輯(machine translation post-editing,MTPE)在語言服務(wù)領(lǐng)域得到了廣泛應(yīng)用(刁洪,2017:79)。崔啟亮(2014:70)認(rèn)為,譯后編輯是人機(jī)交互翻譯的重要體現(xiàn),是語言服務(wù)企業(yè)新的業(yè)務(wù)增長點(diǎn),代表了未來翻譯服務(wù)的發(fā)展方向。
國內(nèi)外學(xué)者均已經(jīng)開展多視角的譯后編輯研究并取得了不少成果,但是現(xiàn)有研究缺少對當(dāng)前主要翻譯工作環(huán)境——計(jì)算機(jī)輔助翻譯(Computer-Aided Translation,CAT)軟件的譯后編輯功能研究。鑒于此,本文在分析國內(nèi)外譯后編輯研究尤其是譯后編輯工具研究的基礎(chǔ)上,集中考察了4 款主流翻譯工具的譯后編輯功能,內(nèi)容涉及機(jī)器翻譯應(yīng)用、譯后編輯操作、譯后編輯內(nèi)容記錄、時(shí)間記錄、譯后編輯工作量統(tǒng)計(jì)、工作效率統(tǒng)計(jì)、譯后編輯工作報(bào)價(jià)、內(nèi)容反饋、機(jī)器翻譯質(zhì)量評估與機(jī)器翻譯擇優(yōu)推薦等方面。本研究旨在從技術(shù)層面展現(xiàn)當(dāng)前CAT 軟件的譯后編輯功能和存在的問題,以期為未來的譯后編輯研究和應(yīng)用提供參考。
在中國知網(wǎng)(CNKI)全文數(shù)據(jù)庫中,以“譯后編輯”為主題或關(guān)鍵詞進(jìn)行檢索(最終檢索時(shí)間為2021 年8 月18 日),共找到中文論文252 篇,包括期刊和輯刊論文98 篇,碩士論文153 篇,博士論文1 篇。對這些論文進(jìn)行計(jì)量可視化分析之后發(fā)現(xiàn),國內(nèi)最早的譯后編輯研究是黃河燕、陳肇雄(1995),但這篇論文是關(guān)于“譯后編輯工具的設(shè)計(jì)與開發(fā)”(崔啟亮,2014:70)方面的研究。因此,馮全功、崔啟亮(2016:73)認(rèn)為,“國內(nèi)譯界的譯后編輯研究始于新千年之后,當(dāng)以魏長宏、張春柏(2007)發(fā)表的論文為標(biāo)志,相對國外起步較晚”。2015 年后,國內(nèi)譯后編輯論文的發(fā)文量呈逐年增多的趨勢(201 5 年為4 篇,2020 年達(dá)到72 篇),其中翻譯專業(yè)碩士學(xué)位(MTI)研究生2016 年撰寫的有關(guān)譯后編輯的翻譯實(shí)踐報(bào)告(即畢業(yè)論文)為4 篇,2020 年達(dá)到49 篇。
“譯后編輯是機(jī)器翻譯與翻譯研究領(lǐng)域共同關(guān)注的話題,前者主要關(guān)注技術(shù)(工具)的研發(fā),后者主要關(guān)注譯后編輯的應(yīng)用?!保T全功、崔啟亮,2016:67)國內(nèi)譯后編輯應(yīng)用研究多為介紹性或概述性研究,內(nèi)容包括:①譯后編輯的概念、發(fā)展動(dòng)力、實(shí)踐準(zhǔn)則(如崔啟亮,2014);②譯后編輯的工作原理、工作特征、譯后編輯錯(cuò)誤類型(如崔啟亮、李聞,2015);③譯后編輯評估、譯后編輯能力構(gòu)建、譯后編輯者培養(yǎng)、譯后編輯課程設(shè)置、譯后編輯教學(xué)等(如馮全功、張慧玉,2015;馮全功、崔啟亮,2016;馮全功、劉明,2018)。研究者還分別對新聞(馮全功、李嘉偉,2016)和外宣(吳萍,2018)等不同專業(yè)領(lǐng)域翻譯文本的譯后編輯進(jìn)行了研究。近年還出現(xiàn)了眼動(dòng)實(shí)驗(yàn)研究(盧植、孫娟,2018)和人工翻譯與機(jī)器翻譯譯后編輯對比實(shí)證研究(王湘玲、王婷婷,2019)。
此外,國內(nèi)還有一些學(xué)者的研究側(cè)重譯后編輯工具或技術(shù)的研發(fā)(如黃河燕、陳肇雄,1995/2004;李梅、朱錫明,2013;阿米妮古麗·奧斯曼等,2013),涉及的譯后編輯工具主要包括谷歌的Google Translator Toolkit(谷歌譯者工具包)、武漢傳神公司(Transn)的TCloud、翻譯自動(dòng)化用戶協(xié)會(huì)(Translation Automation User Society,TAUS)研發(fā)的 DQF Tools(馮全功、張慧玉,2015:70-71),以及由丹麥哥本哈根商學(xué)院A. L. Jakobsen 和L. Schou開發(fā)的Translog-II(盧植、孫娟,2018:763;王湘玲、王婷婷,2019:87)等。其中,谷歌譯者工具包從2019 年12 月4 日起已經(jīng)停用;TCloud 已經(jīng)更名為iCAT,軟件架構(gòu)和功能都已經(jīng)發(fā)生了變化;DQF Tools 自2017 年1 月1 日起一直處于維護(hù)中,目前已經(jīng)停止使用;Translog-II 是一款獲取翻譯過程數(shù)據(jù)的工具,主要用于譯后編輯的實(shí)驗(yàn)或?qū)嵶C研究。另外,也有研究者提到上海一者公司開發(fā)的 YiCAT 云翻譯平臺(tái)(秦美娟,2020:66),機(jī)器翻譯引擎、質(zhì)量保證功能設(shè)置、跟蹤修訂是該平臺(tái)進(jìn)行譯后編輯操作的優(yōu)勢,但該平臺(tái)缺少諸如譯后編輯時(shí)間記錄、譯后編輯工作量統(tǒng)計(jì)、譯后編輯效率統(tǒng)計(jì)等功能。
“國外譯后編輯研究開始于20世紀(jì)80年代中期,至今已有三十余年的歷史,發(fā)表的論文多達(dá)數(shù)百篇?!保◤埢塾瘛ⅠT全功,2016:56)國外譯后編輯研究多集中在譯后編輯概述、譯后編輯評估、機(jī)器翻譯錯(cuò)誤識(shí)別、譯后編輯工具研發(fā)、譯后編輯研究的行業(yè)視角、譯后編輯能力與譯后編輯者的培養(yǎng)等方面。王湘玲、賈艷芳(2018)聚焦2000—2016 年國外發(fā)表的機(jī)器翻譯譯后編輯研究,從譯后編輯過程及產(chǎn)品評估、譯后編輯效率影響因素、譯后編輯工具研發(fā)、譯后編輯者及人才培養(yǎng)4 個(gè)方面出發(fā),分析了國外譯后編輯研究的進(jìn)展、研究方法及未來趨勢,指出許多領(lǐng)域的研究仍處于探索階段。
國外譯后編輯研究提到的譯后編輯工具主要有PET(Aziz et al.,2012)、ACCEPT(Roturier et al.,2013)、iOmegaT(Moran et al.,2014)、CASMACAT(Elming et al.,2014)等。其中,PET 是一款獨(dú)立的譯后編輯工具,可以記錄譯后編輯的時(shí)間、按鍵次數(shù)、編輯距離等;ACCEPT 是一個(gè)在線譯后編輯平臺(tái),可以記錄譯后編輯過程并生成詳細(xì)報(bào)告;iOmegaT 是基于開源翻譯軟件OmegaT的改進(jìn)版系統(tǒng),可以記錄譯員的譯后編輯時(shí)間、按鍵次數(shù)、自我檢查等信息;CASMACAT 是一款在線計(jì)算機(jī)輔助翻譯工具,可以記錄譯員的行為,具體功能包括眼動(dòng)追蹤、按鍵統(tǒng)計(jì)、鼠標(biāo)移動(dòng)等。這些工具都提供了譯后編輯環(huán)境,能夠記錄譯后編輯操作數(shù)據(jù),方便統(tǒng)計(jì)譯后編輯的工作量和效率,甚至可以用來評估機(jī)器翻譯質(zhì)量等,但功能均較為單一,支持的文件格式十分有限,相對而言更適合用于譯后編輯研究。目前功能完善且得到廣泛應(yīng)用的專門的譯后編輯工具仍然很少。
王華樹、李智(2019:68)組織的一項(xiàng)翻譯技術(shù)應(yīng)用調(diào)查結(jié)果顯示,譯員使用的CAT 工具主要包括“SDL Trados(53.71%)、memoQ(25.52%)和Déjà Vu(18.4%)”。這些軟件提供的都是集成翻譯環(huán)境,其集成模式被稱為“TM+MT(translation memory+machine translation)技術(shù)”或“MTM(machine translation+translation memory)技術(shù)”(王華樹,2013)。在這種軟件環(huán)境中進(jìn)行譯后編輯,集成模式就變成了“MTM+PE”(機(jī)器翻譯+翻譯記憶+譯后編輯)(崔啟亮,2014:70)或“MT+CAT+PE”(機(jī)器翻譯+機(jī)輔工具+譯后編輯)(徐彬、郭紅梅,2015:71)。崔啟亮(2014:69)將傳統(tǒng)意義上的針對機(jī)器翻譯的初始譯文進(jìn)行的譯后編輯稱為“狹義的譯后編輯”,即機(jī)器翻譯譯后編輯;將集成翻譯環(huán)境中針對CAT 軟件輸出的初始譯文的譯后編輯稱為“廣義的譯后編輯”或“集成翻譯的譯后編輯”;并認(rèn)為“隨著應(yīng)用實(shí)踐的深入,廣義的譯后編輯研究將成為新方向”。馮全功、張慧玉(2015:69)也同樣認(rèn)為,“機(jī)器翻譯與翻譯記憶的整合是語言服務(wù)行業(yè)的技術(shù)發(fā)展趨勢,……對此應(yīng)進(jìn)行重點(diǎn)介紹和應(yīng)用”。
目前,CAT 軟件已經(jīng)在語言服務(wù)行業(yè)中得到廣泛應(yīng)用,特別是其譯后編輯功能更是得到了從業(yè)者的一致肯定。本文將集中探討和分析4 款主流 CAT 軟件的譯后編輯功能,并在此基礎(chǔ)上對 CAT 軟件環(huán)境中的譯后編輯工作進(jìn)行總體評價(jià),闡明其功能和應(yīng)用優(yōu)勢,同時(shí)也指出目前尚存在的問題。
memoQ①memoQ 網(wǎng)站:https://www.memoq.com/。、MateCat②MateCat 網(wǎng)站:https://www.matecat.com/。、Trados Studio③Trados Studio 網(wǎng)站:https://www.rws.com/cn/translation/software/trados-studio/。、Memsource④Memsource 網(wǎng)站:https://www.memsource.com/。等桌面翻譯軟件或云翻譯軟件提供的都是集成翻譯環(huán)境,即同時(shí)具備機(jī)器翻譯、翻譯記憶和譯后編輯功能。這些翻譯軟件不乏相似之處,而其譯后編輯功能又各具特色。
memoQ 軟件集成了谷歌、微軟、DeepL、KantanMT 等19 個(gè)機(jī)器翻譯插件。通過Intento 或 Tmxmall 機(jī)器翻譯插件,用戶可以“一站式”使用谷歌、微軟、DeepL 等國外機(jī)器翻譯引擎以及百度、搜狗、有道、阿里、騰訊等國內(nèi)機(jī)器翻譯引擎,不需要再逐一注冊賬戶。
memoQ 軟件既支持狹義的譯后編輯,也支持廣義的譯后編輯。狹義的譯后編輯即僅使用機(jī)器翻譯進(jìn)行預(yù)翻譯,然后根據(jù)譯文質(zhì)量要求,采用輕度譯后編輯(light post-editing)或完全譯后編輯(full post-editing)的方法完成譯文的編輯工作。譯后編輯工作界面是譯員和審校人員非常熟悉的編輯器界面,在這個(gè)界面中,譯后編輯人員可以對機(jī)器翻譯的初始譯文進(jìn)行添加、刪除、替換等操作,也可以參照術(shù)語建議修改術(shù)語。質(zhì)量保證功能可以實(shí)時(shí)發(fā)揮作用,預(yù)覽功能方便編輯人員查看上下文語境和譯文格式。所有編輯修改的內(nèi)容都能以跟蹤修訂的方式直觀地顯示出來。
從譯后編輯數(shù)據(jù)統(tǒng)計(jì)的角度來說,memoQ 有一個(gè)“編輯距離統(tǒng)計(jì)”(edit distance statistics)功能。該功能的設(shè)計(jì)初衷是統(tǒng)計(jì)譯員對翻譯記憶庫匹配的編輯工作量或?qū)徯T對譯員翻譯的審校工作量。在譯文從機(jī)器翻譯的初始版本轉(zhuǎn)變?yōu)樽g后編輯完成版本的過程中,該功能同樣可以用于統(tǒng)計(jì)譯后編輯人員的實(shí)際編輯數(shù)量,即對機(jī)器翻譯譯文的譯后編輯工作量進(jìn)行記錄。統(tǒng)計(jì)結(jié) 果可以選擇以字?jǐn)?shù)(編輯距離)或百分比(模糊)的形式呈現(xiàn),如圖1 所示。其中,“絕對編輯距離”指譯后編輯員的實(shí)際編輯字?jǐn)?shù),“已標(biāo)準(zhǔn)化的編輯距離”指編輯后的譯文與機(jī)器翻譯初始譯文之間的差異程度。
圖1 memoQ 編輯距離統(tǒng)計(jì)結(jié)果
memoQ 能夠自動(dòng)記錄編輯時(shí)間(editing time),即每個(gè)角色、每個(gè)句段編輯修改所花費(fèi)的時(shí)間。此外,它還可以在編輯完成后生成一份編輯時(shí)間報(bào)告,內(nèi)容包括總編輯時(shí)間和根據(jù)總編輯時(shí)間估算出的譯后編輯速度,即每小時(shí)的編輯字?jǐn)?shù),并且能夠在編輯器中詳細(xì)顯示每個(gè)句段的編輯時(shí)間。
綜合考慮翻譯記憶庫的匹配質(zhì)量和機(jī)器翻譯的使用成本,語言服務(wù)供應(yīng)商和自由譯者大都會(huì)采用翻譯記憶庫加機(jī)器翻譯(TM+MT)預(yù)翻譯的方式,即廣義的譯后編輯模式。具體來說,就是預(yù)翻譯時(shí)優(yōu)先使用翻譯記憶庫匹配的譯文,對于翻譯記憶庫沒有匹配的句段則添加機(jī)器翻譯的譯文。這里有一個(gè)關(guān)鍵問題,即翻譯記憶庫最低匹配值的設(shè)定,它受文本類型、語言對(language pair)、機(jī)器翻譯引擎等諸多因素的影響。究竟是翻譯記憶庫模糊匹配的譯文質(zhì)量更高,還是機(jī)器翻譯譯文的質(zhì)量更高,這一問題目前尚沒有定論。在TM+MT 這種模式下,譯后編輯人員面對的是翻譯記憶庫匹配和機(jī)器翻譯混合的譯文。具體編輯操作以及編輯距離和編輯時(shí)間統(tǒng)計(jì)與狹義的譯后編輯一樣,故不再贅述。
MateCat 是一款免費(fèi)開源的云翻譯軟件,目前集成了Google、Microsoft、ModernMT、MyMemory 等13 個(gè)機(jī)器翻譯引擎,還有一個(gè)包含120 億句對的公共翻譯記憶庫(Public TM)供用戶免費(fèi)使用。MateCat 也支持狹義和廣義兩種譯后編輯模式:單純的機(jī)器翻譯對應(yīng)狹義的譯后編輯模式;如果同時(shí)選擇機(jī)器翻譯和公共翻譯記憶庫或私人翻譯記憶庫(Private TM),對應(yīng)的就是廣義的譯后編輯模式。
MateCat 的編輯界面和谷歌譯者工具包的編輯界面很相似,打開原文時(shí)每個(gè)句段都會(huì)自動(dòng)添加機(jī)器翻譯譯文或翻譯記憶庫匹配譯文,不需要進(jìn)行任何預(yù)翻譯操作。此外,譯文句段下方列出了譯文匹配的來源,即機(jī)器翻譯匹配、私人翻譯記憶庫匹配或公共翻譯記憶庫匹配。這種譯文呈現(xiàn)方式為廣義的譯后編輯提供了極大的便利,譯后編輯人員可以在機(jī)器翻譯譯文和翻譯記憶庫匹配譯文之間進(jìn)行比較和取舍。每個(gè)句段下方也列出了術(shù)語匹配的內(nèi)容。對文本內(nèi)容的編輯修改、文本格式和標(biāo)記(tag)的處理都非常簡便。
MateCat 的“質(zhì)量報(bào)告”(Quality Report)功能可以在編輯結(jié)束后提供詳細(xì)的譯后編輯統(tǒng)計(jì)信息,包括總的譯后編輯時(shí)間、譯后編輯百分比以及每個(gè)句段的編輯時(shí)間和編輯百分比,譯文則以修訂標(biāo)記的形式呈現(xiàn)編輯修改的內(nèi)容,如圖2 所示。
圖2 MateCat 翻譯質(zhì)量報(bào)告
Trados Studio 軟件默認(rèn)僅集成了SDL Language Cloud 和SDL 機(jī)器翻譯(企業(yè)版)兩個(gè)機(jī)器翻譯引擎,但用戶可以通過RWS①SDL公司已經(jīng)被RWS(如文思)公司收購,目前Trados Studio軟件界面的表述尚未完全統(tǒng)一。AppStore(應(yīng)用商城)添加和使用幾乎所有的機(jī)器翻譯引擎。
Trados Studio 同樣支持狹義和廣義兩種譯后編輯模式。如圖3 所示,在RWS Language Cloud 頁面中可以選擇“翻譯引擎”或“SDL 機(jī)器翻譯”,前者集成了機(jī)器翻譯引擎和用戶個(gè)人的云翻譯記憶庫與云術(shù)語庫資源,后者則是純機(jī)器翻譯引擎。因此,前者對應(yīng)廣義的譯后編輯模式,而后者對應(yīng)狹義的譯后編輯模式。具體編輯操作流程與前文介紹的memoQ 和MateCat 類似,不同的是在Trados Studio 機(jī)器翻譯中,除了可以選擇通用神經(jīng)機(jī)器翻譯(Generic-NMT)模型之外,還可以選擇自適應(yīng)機(jī)器翻譯(AdaptiveMT)模型。
圖3 RWS Language Cloud 窗口
目前機(jī)器翻譯最大的痛點(diǎn)是尚未實(shí)現(xiàn)在翻譯的過程中進(jìn)行學(xué)習(xí),因此同樣的翻譯錯(cuò)誤會(huì)反復(fù)出現(xiàn)。自適應(yīng)機(jī)器翻譯就是針對該問題的一種解決方案,它能夠?qū)崟r(shí)記錄譯后編輯人員所作的每個(gè)編輯修改并將其應(yīng)用到隨后的翻譯中。圖4 是使用自適應(yīng)機(jī)器翻譯 引擎的翻譯結(jié)果,包括初始譯文和逐句編輯修改的情況,在原文和譯文之間會(huì)顯示句段狀態(tài)列,其中的AT 和燈泡圖標(biāo)表示這些譯文來自自適應(yīng)機(jī)器翻譯引擎。
圖4 自適應(yīng)機(jī)器翻譯引擎的翻譯結(jié)果
譯后編輯完成之后,可以在分析報(bào)告中查看自適應(yīng)機(jī)器翻譯引擎的具體使用情況,如圖5 所示。需要說明的是,自適應(yīng)機(jī)器翻譯引擎越使用效果越明顯,編輯的內(nèi)容就會(huì)越少。此外,付費(fèi)用戶還可以選用詞典,進(jìn)一步提高機(jī)器翻譯的輸出質(zhì)量,減少譯后編輯的工作量。
圖5 自適應(yīng)機(jī)器翻譯引擎分析報(bào)告
另外,Trados Studio 還可以添加Post-Edit Compare(譯后編輯比較)插件,用來比較譯后編輯前后兩個(gè)譯文版本的變化并生成比較報(bào)告:首先在機(jī)器翻譯預(yù)翻譯之后創(chuàng)建一個(gè)項(xiàng)目版本(可命名為“機(jī)器翻譯版本”),然后在譯后編輯完成后再創(chuàng)建一個(gè)項(xiàng)目版本(可命名為“譯后編輯版本”),最后在Post-Edit Versions 視圖中選中這兩個(gè)版本,就可以生成整個(gè)項(xiàng)目或其中某個(gè)文檔的譯后編輯比較報(bào)告,整個(gè)流程較為簡單。如圖6 所示,譯后編輯比較報(bào)告的內(nèi)容包含詳細(xì)的譯后編輯統(tǒng)計(jì)數(shù)據(jù)和報(bào)價(jià)等信息,報(bào)告的下方還會(huì)以跟蹤修訂的方式列出每個(gè)句段編輯修改的內(nèi)容和編輯距離數(shù)值,匹配(Match)欄顯示譯文的來源,其中AT 表示譯文來自機(jī)器翻譯。
圖6 譯后編輯比較報(bào)告
Memsource 軟件集成了35 個(gè)機(jī)器翻譯引擎,同樣支持狹義和廣義兩種譯后編輯模式。Memsource 公司很早就組建了人工智能團(tuán)隊(duì),從2018 年開始先后推出了“AI 驅(qū)動(dòng)的非譯元素”功能和“機(jī)器翻譯質(zhì)量評估”(machine translation quality evaluation,MTQE)功能。
AI 驅(qū)動(dòng)的非譯元素功能不僅能夠識(shí)別傳統(tǒng)的非譯元素內(nèi)容,還可以識(shí)別人名和產(chǎn)品名稱等新內(nèi)容,它最大的優(yōu)勢在于可以像翻譯記憶庫一樣提供一個(gè)匹配值,表明某個(gè)句段“確定是”非譯元素句段(匹配值100%)或“可能是”非譯元素句段(匹配值95%-99%)。使用該功能可以在譯前自動(dòng)識(shí)別出原文中只包含非譯元素的句段,并對這些句段進(jìn)行預(yù)翻譯,從而提高譯后編輯效率。
MTQE 功能可以為機(jī)器翻譯的輸出提供句級(jí)質(zhì)量評估,方法類似于翻譯記憶庫匹配。雖然目前機(jī)器翻譯的輸出質(zhì)量在總體上有了較大提升,但因?yàn)閮?nèi)容類型和語言對不同,翻譯質(zhì)量并不穩(wěn)定。因此,譯后編輯人員經(jīng)常要面對很多低質(zhì)量的機(jī)器翻譯譯文,編輯這樣的譯文非常浪費(fèi)時(shí)間。同翻譯記憶庫匹配值相類似,機(jī)器翻譯譯文質(zhì)量的自動(dòng)評分有助于預(yù)估譯后編輯的工作量,并能降低譯后編輯的工作強(qiáng)度。此外,MTQE 功能還可以實(shí)現(xiàn)針對特定內(nèi)容和語言對的機(jī)器翻譯引擎優(yōu)選。2019 年3 月,Memsource 公司發(fā)布了Memsource Translate 功能,這是一種新的機(jī)器翻譯管理解決方案,可以根據(jù)原文內(nèi)容和語言對自動(dòng)選擇性能最佳的機(jī)器翻譯引擎。
前文提到的4 款CAT 軟件提供的都是集成翻譯環(huán)境,并且均支持狹義和廣義兩種譯后編輯模式。根據(jù)前文分析可以看出,在CAT 軟件中進(jìn)行譯后編輯工作優(yōu)勢和問題并存。
(1)靈活的機(jī)器翻譯應(yīng)用
在CAT 軟件這樣的集成翻譯環(huán)境中,機(jī)器翻譯既可以單獨(dú)發(fā)揮作用,又可以和翻譯記憶庫共同發(fā)揮作用;既可以進(jìn)行譯前批量預(yù)翻譯,又可以在翻譯過程中實(shí)時(shí)提供匹配建議,還可以根據(jù)翻譯內(nèi)容和語言對自主選擇機(jī)器翻譯引擎。即使只在編輯器中自動(dòng)提供術(shù)語建議,也已經(jīng)為譯后編輯工作提供了很大便利,而且個(gè)別機(jī)器翻譯引擎已經(jīng)可以支持術(shù)語的自動(dòng)替換。人工智能新技術(shù)的融入進(jìn)一步提高了譯后編輯效率,例如,自適應(yīng)機(jī)器翻譯引擎解決了譯后編輯反饋的問題,改變了提高機(jī)器翻譯質(zhì)量的方法,提升了譯后編輯人員的人機(jī)交互體驗(yàn),顯示了機(jī)器翻譯和翻譯記憶技術(shù)的深度融合。此外,以譯后編輯人員為導(dǎo)向的個(gè)性化機(jī)器翻譯引擎也呼之欲出。機(jī)器翻譯質(zhì)量評估是機(jī)器翻譯應(yīng)用的革新技術(shù),無論是機(jī)器翻譯質(zhì)量自動(dòng)評分,還是機(jī)器翻譯引擎自動(dòng)篩選,都大大提升了機(jī)器翻譯的實(shí)用性。毫不夸張地說,CAT 軟件為各類型機(jī)器翻譯引擎提供了絕佳的應(yīng)用環(huán)境。
(2)便捷的譯后編輯操作
部分國內(nèi)外學(xué)者致力于智能譯后編輯器的研發(fā),這些編輯器的設(shè)計(jì)理念和功能模塊與當(dāng)前主流CAT 軟件大致相同。CAT 軟件的編輯器界面集多種輔譯功能于一身,除了插入、刪除、替換這些常規(guī)操作,還可以很方便地處理文本格式、標(biāo)記等,是便捷的譯后編輯平臺(tái)。在錯(cuò)誤檢查階段,除了譯后編輯人員的人工檢查外,QA 功能可以逐句實(shí)時(shí)發(fā)揮作用,自動(dòng)提示當(dāng)前句段的一些“技術(shù)性”錯(cuò)誤,例如數(shù)字不一致、格式不規(guī)范、缺少標(biāo)記、標(biāo)點(diǎn)符號(hào)錯(cuò)誤、拼寫錯(cuò)誤、詞語重復(fù)、禁用術(shù)語不當(dāng)使用等,這些提示對于譯后編輯的幫助不言而喻。另外,相關(guān)搜索、網(wǎng)絡(luò)搜索使譯后編輯人員可以便捷地查找內(nèi)部和外部資源,預(yù)測輸入和片段匹配等功能能夠加快譯后編輯速度,句段篩選和排序功能可以為譯后編輯的批處理提供方便,實(shí)時(shí)預(yù)覽窗口也便于查看原文上下文語境和譯文格式。除了可以為譯后編輯操作提供以上這些便利條件外,CAT 軟件還能自動(dòng)記錄譯后編輯數(shù)據(jù),生成詳細(xì)的譯后編輯報(bào)告,包括總的譯后編輯工作量和譯后編輯時(shí)間、每個(gè)句段的具體編輯內(nèi)容和編輯時(shí)間等。這些數(shù)據(jù)對于機(jī)器翻譯的錯(cuò)誤類型分析、譯后編輯人員培訓(xùn)、譯后編輯人員安排、工作流程設(shè)計(jì)和譯后編輯服務(wù)報(bào)價(jià)等都具有重要意義。
(3)一體化的工作流程
譯后編輯工作不是孤立存在的,除譯后編輯流程外,整個(gè)翻譯工作還涉及項(xiàng)目管理、資源管理、人員管理、任務(wù)分配、質(zhì)量保證、工作量統(tǒng)計(jì)、格式排版、譯文交付等。以往譯后編輯研究中提到的譯后編輯工具都沒有如此完善的功能,而目前主流的CAT 軟件卻能滿足這些需求。例如,從項(xiàng)目管理的角度來說,CAT 軟件既可以創(chuàng)建本地項(xiàng)目,又可以創(chuàng)建服務(wù)器項(xiàng)目;既可以直接發(fā)送文件,又可以發(fā)送項(xiàng)目文件包。無論哪種形式,項(xiàng)目經(jīng)理都可以通過此類軟件監(jiān)督管控項(xiàng)目進(jìn)度。作為翻譯管理系統(tǒng),目前大多數(shù)CAT 軟件已經(jīng)與內(nèi)容管理系統(tǒng)和企業(yè)資源計(jì)劃系統(tǒng)整合在一起,項(xiàng)目管理者只需對工作流程進(jìn)行定制,系統(tǒng)就會(huì)自動(dòng)引導(dǎo)每個(gè)流程(孔令然、崔啟亮,2018:51)。譯后編輯重在速度和效率,目前語言服務(wù)行業(yè)普遍使用的“客戶端+服務(wù)器軟件”架構(gòu)和云翻譯軟件架構(gòu)都是譯后編輯工作的一體化解決方案。
CAT 軟件用于譯后編輯工作擁有巨大的優(yōu)勢,但同時(shí)也存在一些問題和不足。例如,僅依靠編輯距離來計(jì)算譯后編輯工作量并以此作為報(bào)價(jià)依據(jù)的做法有時(shí)并不合理,對于文本翻譯難度較大或術(shù)語較多的譯后編輯工作,應(yīng)該同時(shí)考慮譯后編輯時(shí)間的長短。目前可用的機(jī)器翻譯引擎大都是通用引擎,通常既沒有說明引擎的類型(具體類型可分為基于規(guī)則的、基于統(tǒng)計(jì)的、基于神經(jīng)網(wǎng)絡(luò)的和可自定義的),也沒有具體說明支持的語言對和適用的專業(yè)領(lǐng)域。這些問題都無形中給機(jī)器翻譯的應(yīng)用制造了障礙。目前,自適應(yīng)機(jī)器翻譯引擎支持的語言對非常有限,機(jī)器翻譯引擎自動(dòng)篩選并擇優(yōu)推薦的功能也還不完善。
“隨著機(jī)器翻譯技術(shù)的發(fā)展和全球翻譯需求的增加,機(jī)器翻譯譯后編輯在語言服務(wù)行業(yè)中的作用得到了廣泛認(rèn)可?!保ㄍ跸媪帷⑼蹑面?,2019:84)國內(nèi)外許多學(xué)者已經(jīng)關(guān)注到了這種發(fā)展趨勢,并從多個(gè)視角對譯后編輯進(jìn)行了大量研究。然而,已有研究大多討論的是支持譯后編輯操作和相關(guān)研究的工具,對目前業(yè)界使用更為普遍的CAT 軟件卻少有提及。簡而言之,前者更適合譯后編輯的測試和學(xué)術(shù)研究,后者才是真正符合行業(yè)需求的譯后編輯量產(chǎn)工具。因此,今后的研究應(yīng)更加關(guān)注后者,并強(qiáng)化對翻譯行業(yè)譯后編輯實(shí)踐和需求的關(guān)注。同時(shí),人工智能新技術(shù)的融入為機(jī)器翻譯應(yīng)用帶來了創(chuàng)新解決方案,在提高譯后編輯速度的同時(shí)降低了成本,進(jìn)一步彰顯了機(jī)器翻譯譯后編輯的優(yōu)勢。當(dāng)然,機(jī)器翻譯仍處在不斷發(fā)展的進(jìn)程中,還存在諸多問題,希望能夠在今后的譯后編輯研究和實(shí)踐中盡快地得到解決。