葉 娜,張桂平,韓亞冬,蔡?hào)|風(fēng)
(沈陽航空航天大學(xué) 知識(shí)工程研究中心,遼寧 沈陽110136)
隨著信息技術(shù)的進(jìn)步和全球一體化步伐的加快,跨語種交流的語言障礙問題日益突出,對(duì)高效翻譯方法的需求愈加緊迫。為了解決這一問題,人們開展了機(jī)器翻譯(Machine Translation,MT)的研究,旨在使計(jì)算機(jī)能夠代替人類進(jìn)行全自動(dòng)翻譯。
然而,目前的機(jī)器翻譯系統(tǒng)所產(chǎn)生的譯文仍然無法達(dá)到直接可用的程度。在這樣的背景下,一些研究人員開始尋求翻譯思想的改變,由全自動(dòng)翻譯技術(shù)轉(zhuǎn)向計(jì)算機(jī)輔助翻譯(Computer-Assisted Translation,CAT)技術(shù)。在計(jì)算機(jī)輔助翻譯系統(tǒng)中,系統(tǒng)為用戶(即人類譯員)提供輔助譯文和各種輔助工具(如術(shù)語管理、文件格式處理、詞典查詢、翻譯記憶檢索等),用戶利用這些輔助工具,對(duì)輔助譯文進(jìn)行譯后編輯(Post-Editing,PE),直至得到最終可用的正確譯文。同時(shí),系統(tǒng)在與用戶交互的過程中,能夠從用戶的反饋中學(xué)習(xí),使自身的翻譯知識(shí)得到增長(zhǎng)和完善,不斷地提高輔助譯文的質(zhì)量。與機(jī)器翻譯相比,計(jì)算機(jī)輔助翻譯以機(jī)器作為助力,為用戶提供所需的知識(shí)輔助,使人類充分發(fā)揮在推理、分析、歸納方面的優(yōu)勢(shì),取得了很好的實(shí)際效果,也出現(xiàn)了一些成熟的實(shí)用化產(chǎn)品,例如,國(guó)外SDL公司的Trados、STAR公司的Transit、ATRIL公司的Déjàvu、LANT公司的 Eurolang、Google的譯者工具包,國(guó)內(nèi)中國(guó)科學(xué)院的華建CAT、東方雅信的雅信CAT等。這些商用產(chǎn)品的出現(xiàn)大大提高了翻譯產(chǎn)業(yè)的生產(chǎn)率。
最近,隨著計(jì)算機(jī)輔助翻譯技術(shù)的快速發(fā)展,輔助翻譯的工作方式已經(jīng)從單用戶、小規(guī)模發(fā)展為多用戶、大規(guī)模。多名在空間上分散的用戶被組織起來共同完成一項(xiàng)翻譯任務(wù)已經(jīng)成為普遍現(xiàn)象。這種翻譯模式可以稱為協(xié)同翻譯(Collaborative Translation,CT)。與計(jì)算機(jī)輔助翻譯相比,協(xié)同翻譯系統(tǒng)不但能提供計(jì)算機(jī)輔助翻譯系統(tǒng)的全部功能,還能夠提供多用戶協(xié)作管理(如協(xié)作進(jìn)程控制、協(xié)作沖突檢測(cè)、個(gè)性化輔助等)、翻譯任務(wù)管理(如翻譯進(jìn)度控制、翻譯任務(wù)分配等)和譯文一致性檢查等功能,以協(xié)調(diào)多名用戶高效率地合作,并保證翻譯結(jié)果的一致性。
本文對(duì)計(jì)算機(jī)輔助翻譯和協(xié)同翻譯的研究進(jìn)行了綜述。全文內(nèi)容組織結(jié)構(gòu)如下,第2部分介紹了計(jì)算機(jī)輔助翻譯技術(shù);第3部分分析了計(jì)算機(jī)輔助翻譯與協(xié)同翻譯技術(shù)的聯(lián)系和區(qū)別,并介紹了協(xié)同翻譯技術(shù)的最新研究進(jìn)展;第4部分總結(jié)全文,對(duì)協(xié)同翻譯的未來發(fā)展方向進(jìn)行了展望。
傳統(tǒng)的計(jì)算機(jī)輔助翻譯系統(tǒng)可以分為兩類[1]:①人助機(jī)譯系統(tǒng) (Human-Assisted MT system,HAMTS),它是由人來輔助計(jì)算機(jī)進(jìn)行翻譯的機(jī)器翻譯系統(tǒng)??梢酝ㄟ^譯前編輯對(duì)于要翻譯的原文進(jìn)行加工,使之適合機(jī)器翻譯系統(tǒng)的要求,或者通過譯后編輯對(duì)于翻譯好的譯文進(jìn)行修改,使之滿足用戶的需要;②機(jī)助人譯系統(tǒng)(Machine-Assisted MT system,MAMTS),它是由計(jì)算機(jī)輔助人來進(jìn)行翻譯的機(jī)器翻譯系統(tǒng)。
現(xiàn)在的計(jì)算機(jī)輔助翻譯系統(tǒng)很難絕對(duì)劃分為人助機(jī)譯或機(jī)助人譯兩種系統(tǒng)之一,而是多種翻譯技術(shù)并存、相輔相成、相互融合的。系統(tǒng)生成輔助譯文時(shí),用戶可以利用自己的語言學(xué)知識(shí)為系統(tǒng)提供指導(dǎo),以獲得更好的譯文;用戶進(jìn)行翻譯時(shí),可以直接對(duì)輔助譯文進(jìn)行譯后編輯,或?qū)⑤o助譯文作為參考;用戶完成翻譯后,系統(tǒng)將用戶的翻譯結(jié)果作為對(duì)輔助譯文的反饋,從中學(xué)習(xí)翻譯知識(shí),來進(jìn)行自我完善。
由此可見,計(jì)算機(jī)輔助翻譯涉及三個(gè)關(guān)鍵技術(shù),即輔助譯文生成、譯后編輯和系統(tǒng)反饋學(xué)習(xí),以下將分別進(jìn)行介紹。
2.1.1 輔助譯文質(zhì)量評(píng)價(jià)標(biāo)準(zhǔn)
輔助譯文是由計(jì)算機(jī)輔助翻譯系統(tǒng)生成,供用戶進(jìn)行譯后編輯,以產(chǎn)生最終可用譯文的一種中間翻譯結(jié)果。作為系統(tǒng)的重要組成部分,輔助譯文的質(zhì)量直接影響著整體的翻譯效率。理想的輔助譯文應(yīng)最大限度地減少用戶的翻譯工作量,提高翻譯速度。不可否認(rèn)的是,過于糟糕的輔助譯文反而會(huì)給用戶增加額外的負(fù)擔(dān),以至于還不如不用輔助譯文,而是直接翻譯源文本。
因此,輔助譯文質(zhì)量評(píng)價(jià)標(biāo)準(zhǔn)的確定是一個(gè)重要的問題。傳統(tǒng)的機(jī)器翻譯譯文評(píng)價(jià)指標(biāo)和方法[2-4]并不完全適合于評(píng)價(jià)輔助譯文,其原因在于,對(duì)機(jī)器翻譯譯文的評(píng)價(jià)角度是譯文的“正確性”,而對(duì)輔助譯文的評(píng)價(jià)則是衡量它為用戶帶來了多少便利。例如,有時(shí)并未對(duì)輔助譯文進(jìn)行譯后編輯修改,卻要占用一定的譯后編輯時(shí)間,因?yàn)橛脩舯仨氉屑?xì)斟酌才能確定譯文是不需修改的。因此,一個(gè)更為公正的輔助譯文質(zhì)量評(píng)價(jià)指標(biāo)是用戶進(jìn)行譯后編輯所需的工作量(Post-Editing Effort),但如何衡量譯后編輯的工作量也是一個(gè)難題。
Krings[5]提出,譯后編輯工作量可以從三個(gè)層次來評(píng)價(jià):時(shí)間(譯后編輯所需時(shí)間)、技術(shù)(用戶采取的鍵盤操作)和認(rèn)知(用戶付出的腦力勞動(dòng))。該評(píng)價(jià)方法比較全面客觀,其缺陷在于認(rèn)知層次的工作量無法直接觀察到。一些研究人員[5-6]采用有聲思維報(bào)告法[7](Think Aloud Protocol,TAP)或選擇網(wǎng)絡(luò)分析法[8](Choice Network Analysis,CNA)來解決這一問題,但仍難以得到量化的結(jié)果。
鑒于此,一些研究人員[9-13]直接用技術(shù)層次工作量,即通過衡量將輔助譯文修改為正確譯文所需的譯后編輯操作次數(shù),來評(píng)價(jià)輔助譯文。根據(jù)操作種類的不同,可以定義多個(gè)評(píng)價(jià)指標(biāo),如表1所示。
表1 基于譯后編輯操作的輔助譯文質(zhì)量評(píng)價(jià)指標(biāo)
上述評(píng)價(jià)指標(biāo)的優(yōu)點(diǎn)是可行性強(qiáng),缺點(diǎn)是計(jì)算代價(jià)較高、缺乏語言學(xué)知識(shí)的支撐,且無法反映用戶在譯后編輯過程中付出的腦力勞動(dòng)代價(jià)。
Tatsumi[14]研究了 BLEU[2]、NIST[3]、GTM[4]、和TER[13]四種評(píng)價(jià)指標(biāo)與譯后編輯速度之間的關(guān)聯(lián),實(shí)驗(yàn)數(shù)據(jù)顯示,GTM與譯后編輯速度之間的關(guān)聯(lián)度最高。
2.1.2 輔助譯文生成策略與方法
不同的系統(tǒng)采取不同的策略來生成輔助譯文。最早的計(jì)算機(jī)輔助翻譯系統(tǒng)[15]直接將機(jī)器翻譯引擎產(chǎn)生的機(jī)器譯文作為輔助譯文。由于機(jī)器譯文質(zhì)量較差,現(xiàn)有系統(tǒng)大多對(duì)其進(jìn)行了優(yōu)化??傮w上,當(dāng)前輔助譯文的生成方法主要是基于兩種策略:①基于翻譯記憶(Translation Memory,TM)的策略;②基于交互式機(jī)器翻譯(Interactive Machine Translation,IMT)的策略。
2.1.2.1 基于翻譯記憶的策略
Bowker[16]將翻譯記憶定義為一種用于儲(chǔ)存原文本及其譯文的語言數(shù)據(jù)庫,其工作原理是將用戶已翻譯完成的譯文及其對(duì)應(yīng)的源語言文本存儲(chǔ)起來,在未來的翻譯過程中,系統(tǒng)自動(dòng)搜索翻譯記憶庫中相同或相似的翻譯資源(如句子、段落等),給出參考,使用戶避免無謂的重復(fù)勞動(dòng),只需專注于新內(nèi)容的翻譯。該策略的優(yōu)化目標(biāo)是使輔助譯文與具有較高匹配相似度的翻譯記憶片段盡量保持一致。
翻譯記憶的思想幾乎在所有的輔助翻譯系統(tǒng)中都有所體現(xiàn)。Craciunescu等人[17]指出,翻譯記憶技術(shù)適用于解決術(shù)語一致性、語詞、短句和簡(jiǎn)單句重復(fù)出現(xiàn)等問題。
基于翻譯記憶的輔助譯文生成方法有兩種,一種是參考式,由用戶選擇待翻譯的文本,系統(tǒng)在翻譯記憶中檢索相關(guān)譯文提供參考。TransSearch[18]、TotalRecall[19]和大部分商用系統(tǒng)均采取了這種方法。另一種方法是自動(dòng)式,即根據(jù)翻譯記憶的結(jié)果自動(dòng)優(yōu)化機(jī)器翻譯譯文,使譯文盡量與翻譯記憶中的相關(guān)片段一致。PECAT系統(tǒng)[20]將句子劃分為組塊,利用多層匹配算法在翻譯記憶里檢索最相似的組塊生成輔助譯文,取得了良好效果。Bi?ici等人[21]從翻譯記憶的模糊匹配結(jié)果(Fuzzy Matches)中提取與源語句共有的雙語短語,加入統(tǒng)計(jì)機(jī)器翻譯系統(tǒng)的短語表中,獲得了更好的譯文。Simard等人[22]將翻譯記憶中最相似的片段納入機(jī)器翻譯候選譯文的評(píng)價(jià)中,提高了機(jī)器譯文的質(zhì)量。He等人[23]訓(xùn)練了一個(gè)統(tǒng)計(jì)分類器,分別判斷對(duì)機(jī)器翻譯譯文和翻譯記憶譯文進(jìn)行譯后編輯的工作量,并將工作量較小的譯文推薦給用戶,取得了很好的效果。
2.1.2.2 基于交互式機(jī)器翻譯的策略
交互式機(jī)器翻譯的基本思想是允許用戶在譯文生成的過程中進(jìn)行人工干預(yù)和指導(dǎo),以獲取較高質(zhì)量的譯文。常寶寶[24]指出,這類研究可以根據(jù)人機(jī)交互發(fā)生的階段分為:①交互式分析,用戶幫助系統(tǒng)得出正確的源語言結(jié)構(gòu),對(duì)多義詞進(jìn)行排歧等;②交互式轉(zhuǎn)換,用戶參與選擇與源語言結(jié)構(gòu)等價(jià)的目標(biāo)語言結(jié)構(gòu),排除不適當(dāng)?shù)霓D(zhuǎn)換;③交互式生成,用戶協(xié)助產(chǎn)生流暢譯文。
早期的交互式機(jī)器翻譯系統(tǒng)[25-31]大都集中于交互式分析和交互式轉(zhuǎn)換技術(shù),主要研究如何使源語言消歧過程更加高效,包括優(yōu)化問題次序來減少用戶需要回答的問題、為用戶提供多個(gè)候選答案、調(diào)整交互方式使用戶更熟悉系統(tǒng)等。這些傳統(tǒng)的方法存在以下問題:第一,人機(jī)間的交互只關(guān)注對(duì)源文本意思的理解,而忽略了最重要的目標(biāo)文本生成。第二,用于交互的語言是基于機(jī)器翻譯模型的,使得問題對(duì)用戶來講難以回答,而將機(jī)器語言自動(dòng)表述為自然語言,并使之包含源文本中的相關(guān)部分,是難以實(shí)現(xiàn)的。
1997年,F(xiàn)oster等人[32]提出了 TransType系統(tǒng)的雛形(TT0),該系統(tǒng)將交互式機(jī)器翻譯所關(guān)注的目標(biāo)從源文本的消歧轉(zhuǎn)移到譯文的生成上,用戶不再需要解釋分析源文本,而是可以直接控制目標(biāo)譯文的生成。TransType的基本思想是,給定源文本s,觀察用戶輸入的譯文,不斷針對(duì)已經(jīng)輸入的文本h(即譯文前綴)計(jì)算可能的譯文后綴x的概率p(x|s,h),其中概率最大的譯文后綴x*就是系統(tǒng)預(yù)測(cè)的譯文,將作為建議提供給用戶。用戶可以接受、修改或忽略這些建議。實(shí)驗(yàn)結(jié)果表明,Trans-Type系統(tǒng)使用戶得到正確譯文所需的鍵盤敲擊次數(shù)大幅減少。
2002年,F(xiàn)oster[33]發(fā)現(xiàn),在 TransType系統(tǒng)中,雖然用戶的鍵盤敲擊次數(shù)減少了,但是翻譯效率反而降低了,原因有兩個(gè):第一,用戶閱讀系統(tǒng)的提示占用了很長(zhǎng)時(shí)間,因此當(dāng)提示不正確或過短時(shí),系統(tǒng)反而降低了用戶的翻譯效率;第二,用戶不總是理性對(duì)待提示,他們有時(shí)候會(huì)接受錯(cuò)誤的提示,拒絕正確的提示。針對(duì)上述問題,F(xiàn)oster對(duì)系統(tǒng)進(jìn)行了改進(jìn),不再在輸入每個(gè)字符后都進(jìn)行提示,而只進(jìn)行可以最大化用戶期望收益B(x,s,h)的預(yù)測(cè)。系統(tǒng)改進(jìn)后,用戶的翻譯效率平均提高了10%。此后又有多名研究人 員[9-12,34-42]對(duì)該系統(tǒng)進(jìn)行了不斷的分析和優(yōu)化,包括利用詞圖[9,34]或動(dòng)態(tài)規(guī)劃算法[35]來提高最優(yōu)預(yù)測(cè)的搜索效率,利用用戶的鼠標(biāo)點(diǎn)擊信息[12]、緩存記錄[36]、譯文可信度[37-38]和語音識(shí)別信息[40]來提高系統(tǒng)預(yù)測(cè)的準(zhǔn)確性等。
由于機(jī)器翻譯的譯文質(zhì)量難以達(dá)到實(shí)用化要求,因此早在20世紀(jì)80年代,人們就已經(jīng)開始對(duì)機(jī)器翻譯結(jié)果進(jìn)行譯后編輯。
關(guān)于譯后編輯的定義,Veale[43]認(rèn)為是“人類語言學(xué)家/編輯人員對(duì)機(jī)器翻譯輸出的修正”。OB-rien[6]則將其定義為“修改機(jī)器翻譯譯文中的錯(cuò)誤,以保證目標(biāo)譯文達(dá)到一定的質(zhì)量要求的行為”。
在計(jì)算機(jī)輔助翻譯系統(tǒng)中,譯后編輯可以使輔助譯文的質(zhì)量達(dá)到可用程度,且保證術(shù)語的標(biāo)準(zhǔn)化。譯后編輯結(jié)果可作為反饋來即時(shí)優(yōu)化機(jī)器翻譯引擎,自動(dòng)修改一些重復(fù)性錯(cuò)誤或可預(yù)知錯(cuò)誤,改善輔助譯文質(zhì)量,用戶也可以通過譯后編輯工作迅速提高自身的翻譯水平[44]。但是,譯后編輯也可能帶來一些負(fù)面作用,例如,用戶可能會(huì)習(xí)慣糟糕的機(jī)器翻譯結(jié)果,對(duì)一些錯(cuò)誤視而不見[45]。另外,為了提高翻譯生產(chǎn)率,需要限制用戶修改的范圍,同時(shí)使用戶的壓力增大,且難以一直保持非常高的生產(chǎn)率水平。
2.2.1 對(duì)譯后編輯的要求
Wagner[46]指出,對(duì)譯后編輯的一般要求是,包含盡可能多的原始譯文、不要在一個(gè)問題上猶豫太久、不要擔(dān)心風(fēng)格是否重復(fù)、不要從事耗費(fèi)時(shí)間的術(shù)語研究,以及只在必要時(shí)進(jìn)行修改。
Senez[47]也列舉了對(duì)譯后編輯的一些要求,指出譯后編輯的一個(gè)重要問題是保證譯文的可靠性,即必須采取措施,排除掉機(jī)器翻譯帶來的任何對(duì)源文本的曲解,保證讀者得到一個(gè)語法正確而且忠實(shí)反映源文本意思的譯文,這比提高譯文的可讀性更加重要。另外,也不必為提高譯文的典雅性而浪費(fèi)太多時(shí)間。
2.2.2 譯后編輯的分類
一般來講,譯后編輯可分為兩類[45]。一類是快速譯后編輯(Fast PE,也可稱為Gist PE、Rapid PE、Light PE),即速度快,且只進(jìn)行必要修改的譯后編輯。其特點(diǎn)是,在保證準(zhǔn)確傳遞信息的前提下,對(duì)譯文的語法、風(fēng)格、術(shù)語、連貫性等質(zhì)量要求較寬松,而對(duì)翻譯生產(chǎn)率的要求較高。另一類是完全譯后編輯(Full PE),即需要為滿足較高的質(zhì)量要求而進(jìn)行更多修改的譯后編輯。
在實(shí)踐中,具體采用哪類方法進(jìn)行譯后編輯需要視具體翻譯任務(wù)而定,一般應(yīng)考慮用戶需求、質(zhì)量期待、時(shí)間要求和譯文功能等因素。但是,Doyon等人[48]的研究結(jié)果表明,從譯文的可用性來看,快速譯后編輯和完全譯后編輯的差別并不明顯。
2.2.3 譯后編輯人員的訓(xùn)練
譯后編輯是一項(xiàng)新的工作,許多翻譯人員對(duì)此還一無所知,在這方面的信息和訓(xùn)練也很少。為了成為一名好的譯后編輯人員,需要學(xué)習(xí)很多新的方法和工具,要求更高的生產(chǎn)率,且翻譯時(shí)自由創(chuàng)造的空間較小。
對(duì)譯后編輯人員的技能要求除了包括與一般翻譯人員相同的要求,如熟練掌握源語言和目標(biāo)語言、具備特定領(lǐng)域的專業(yè)知識(shí)和文本處理技能之外,還應(yīng)該有一些特殊的要求[44,49],如具備較強(qiáng)的容忍度、對(duì)機(jī)器翻譯持有積極態(tài)度、具有一定的機(jī)器翻譯知識(shí)、術(shù)語管理技能(包括詞典編纂、語料質(zhì)量評(píng)價(jià)、術(shù)語工具的使用等)、受限語言(Controlled Language,CL)的使用技能,以及基本的編程技能等。
2009年,在國(guó)際機(jī)器翻譯峰會(huì)上,Batoma等人[50]指出,計(jì)算機(jī)輔助翻譯將成為未來的發(fā)展趨勢(shì),人們應(yīng)關(guān)注如何培養(yǎng)訓(xùn)練翻譯人員以使之勝任技術(shù)驅(qū)動(dòng)的環(huán)境下的翻譯工作。
2.2.4 譯后編輯效率的影響因素
譯后編輯的效率受到多種因素的影響和制約,例如,輔助譯文的質(zhì)量、翻譯人員的經(jīng)驗(yàn)和翻譯人員的母語[48]等。除此之外,Martínez[51]還指出了一些其他因素,包括:①計(jì)算機(jī)輔助翻譯系統(tǒng)所提供的輔助工具是否有效、界面是否友好;②是否遵循了合理的流程來進(jìn)行譯后編輯;③翻譯之前是否對(duì)數(shù)據(jù)進(jìn)行了充分的分析,是否創(chuàng)建了用戶詞典;④所生成的輔助譯文是否可信。
Aikawa等人[52]研究了受限語言、機(jī)器翻譯質(zhì)量和譯后編輯之間的關(guān)系,驗(yàn)證了使用受限語言可以提高機(jī)器翻譯質(zhì)量,且提高譯后編輯效率的假設(shè)。
2.2.5 譯后編輯數(shù)據(jù)采集與分析
翻譯人員在譯后編輯過程中生成大量的行為數(shù)據(jù),這些數(shù)據(jù)是很有價(jià)值的線索,可以反映出人類在翻譯活動(dòng)中的思維過程,以及譯文中哪些部分給用戶帶來了翻譯困難。這些信息有助于優(yōu)化計(jì)算機(jī)輔助翻譯系統(tǒng),給用戶提供更有效的輔助。
譯后編輯行為數(shù)據(jù)的采集分為兩個(gè)方面:操作和認(rèn)知。操作行為主要指翻譯人員的鍵盤和鼠標(biāo)等操作,認(rèn)知行為指的是譯后編輯期間發(fā)生的人類認(rèn)知過程的行為。認(rèn)知行為數(shù)據(jù)雖然無法直接觀察到,但可以部分從操作行為數(shù)據(jù)中分析、推斷得到。
在操作行為方面,Translog[53]是一個(gè)有效的采集工具。Translog是記錄鍵盤輸入過程的程序,它可以在不干擾用戶的前提下,準(zhǔn)確記錄所有按鍵的活動(dòng),包括修改、刪除、增加、剪切、復(fù)制、光標(biāo)移動(dòng)、電子詞典查詢等,并能記錄按鍵活動(dòng)的時(shí)間。同時(shí)還提供線性表示,通過一系列符號(hào)來描述文字輸入過程中的各種活動(dòng)。Carl等人[54]利用Translog所采集的數(shù)據(jù),研究了翻譯過程的屬性。實(shí)驗(yàn)數(shù)據(jù)顯示,人類的翻譯過程明顯分為三個(gè)階段:理解主旨(Gisting)、草擬譯文(Drafting)和譯后編輯,有經(jīng)驗(yàn)的翻譯人員在譯后編輯階段花費(fèi)的時(shí)間較長(zhǎng)。
在認(rèn)知行為的采集和分析方面,Carl[55]認(rèn)為,眼球移動(dòng)可以在一定程度上反映翻譯認(rèn)知過程。例如,閱讀通常是從左至右進(jìn)行的,直至在行末返回下一行,而當(dāng)用戶暫時(shí)面臨理解困難時(shí),將會(huì)長(zhǎng)時(shí)間地盯住一個(gè)詞,或往回移動(dòng)眼球來重新閱讀和思考。Koehn[56]則認(rèn)為,用戶的鍵盤和鼠標(biāo)操作中的“停頓”可以反映其翻譯認(rèn)知心理,并利用Caitra系統(tǒng)所記錄的操作數(shù)據(jù),研究了不同長(zhǎng)度的“停頓”代表的含義,例如,短于2秒的停頓通常是操作間歇,2~6秒的停頓表示猶豫,6~60秒的停頓表示用戶在思索并規(guī)劃下一步操作,更長(zhǎng)的停頓表示用戶遇到了難題。
計(jì)算機(jī)輔助翻譯系統(tǒng)的特點(diǎn)和優(yōu)勢(shì)之一在于系統(tǒng)和用戶之間可以進(jìn)行交互,用戶對(duì)系統(tǒng)提供的輔助譯文進(jìn)行驗(yàn)證和校改,并反饋給系統(tǒng)。系統(tǒng)應(yīng)該對(duì)這種反饋信息加以充分利用,不斷完善自身的翻譯知識(shí)體系,提高翻譯性能,避免重復(fù)生成同樣的錯(cuò)誤。從反饋中學(xué)習(xí)的能力是體現(xiàn)計(jì)算機(jī)輔助翻譯系統(tǒng)性能的重要指標(biāo)之一。
系統(tǒng)進(jìn)行自我完善的途徑有兩種。一種是基于自動(dòng)譯后編輯(Automatic Post-Editing,APE)的方法,即從反饋中學(xué)習(xí)出翻譯知識(shí),建立一個(gè)譯后編輯模型,自動(dòng)發(fā)現(xiàn)系統(tǒng)產(chǎn)生的譯文中存在的錯(cuò)誤,并對(duì)譯文進(jìn)行修改,相當(dāng)于自動(dòng)完成譯后編輯過程。在這種策略下,系統(tǒng)的翻譯引擎并不發(fā)生改變。另一種是基于在線學(xué)習(xí)(Online-Learning)的方法,批量處理用戶的反饋信息,不斷從中學(xué)習(xí),并即時(shí)調(diào)整系統(tǒng)的機(jī)器翻譯引擎的各項(xiàng)參數(shù),使其得到實(shí)時(shí)優(yōu)化。
2.3.1 基于自動(dòng)譯后編輯的方法
自動(dòng)譯后編輯模型是由系統(tǒng)從反饋中學(xué)習(xí)到的翻譯知識(shí)構(gòu)成的。根據(jù)知識(shí)表示形式的不同,可以分為基于模板匹配的方法和基于統(tǒng)計(jì)機(jī)器學(xué)習(xí)的方法。
2.3.1.1 基于模板匹配的方法
此類方法以模板/規(guī)則形式來表示翻譯知識(shí),并用模板匹配的方式來修改譯文。
Nishida等人[57]提出PECOF系統(tǒng),將譯后編輯的修改作為反饋,從中自動(dòng)學(xué)習(xí)模板來提高機(jī)器翻譯引擎的性能。在幾個(gè)實(shí)例句子上的實(shí)驗(yàn)結(jié)果表明,PECOF可以修改一些錯(cuò)誤,但也可能修改失敗。Guzman[58]提出利用正則表達(dá)式進(jìn)行自動(dòng)后編輯,用人工制定的模式匹配修改了一些語言學(xué)錯(cuò)誤,但有時(shí)也會(huì)帶來新的錯(cuò)誤。Elming[59]使用基于轉(zhuǎn)換的學(xué)習(xí)(Transformation-Based Learning,TBL)來自動(dòng)獲取錯(cuò)誤修改規(guī)則,但是該方法只適用于改正選詞錯(cuò)誤,且需要對(duì)原始句子和修改后的句子進(jìn)行詞對(duì)齊。
2009年,Groves等人[60]通過分析微軟 Treelet機(jī)器翻譯引擎的機(jī)器譯文及其譯后編輯結(jié)果,識(shí)別出一系列譯后編輯模板(包括基于字符串和基于成分的模板),其中基于字符串的模板是利用動(dòng)態(tài)規(guī)劃方法,尋找由原始句子出發(fā),到達(dá)最終正確譯文的編輯距離最小的修改路徑,從中自動(dòng)提取模板。實(shí)驗(yàn)證明,這些模板有助于提高機(jī)器翻譯引擎的性能和譯后編輯的工作效率。
2.3.1.2 基于統(tǒng)計(jì)機(jī)器學(xué)習(xí)的方法
在此類方法中,翻譯知識(shí)被表示為統(tǒng)計(jì)模型的形式。2007年Simard等人[61]將機(jī)器翻譯引擎的翻譯結(jié)果作為源語言,將譯后編輯結(jié)果作為目標(biāo)語言,訓(xùn)練一個(gè)統(tǒng)計(jì)機(jī)器翻譯模型作為自動(dòng)譯后編輯系統(tǒng)。在翻譯時(shí),首先用機(jī)器翻譯引擎將源文本翻譯出來,然后用訓(xùn)練出的統(tǒng)計(jì)機(jī)器翻譯模型對(duì)機(jī)器翻譯譯文進(jìn)行再次翻譯,即自動(dòng)譯后編輯。實(shí)驗(yàn)結(jié)果表明,經(jīng)過自動(dòng)譯后編輯后,譯文的TER值大大降低,BLEU值提高。
Dugast等人[62]對(duì)將上述技術(shù)引入SYSTRAN系統(tǒng)的實(shí)驗(yàn)結(jié)果進(jìn)行了深入分析,統(tǒng)計(jì)了該自動(dòng)譯后編輯系統(tǒng)的改詞率和改句率。實(shí)驗(yàn)結(jié)果表明,約98%的句子都被修改了,而改詞率相對(duì)較低(約30%)。從譯文結(jié)構(gòu)來看,修改后的譯文結(jié)構(gòu)與原始SYSTRAN譯文結(jié)構(gòu)基本相同。譯文質(zhì)量提高最明顯的是詞匯方面。在語法方面,改正和改錯(cuò)的情況都很多,導(dǎo)致最終提高不大。另外,未發(fā)現(xiàn)長(zhǎng)距離的結(jié)構(gòu)調(diào)整和語序調(diào)整,且局部調(diào)序的改錯(cuò)率也較高。這表明該方法對(duì)于改正譯文中的選詞錯(cuò)誤較為有效,而對(duì)譯文的調(diào)序錯(cuò)誤作用不太明顯。
2.3.2 基于在線學(xué)習(xí)的方法
此類方法的主要思想是利用在線學(xué)習(xí)技術(shù),從用戶的反饋中實(shí)時(shí)獲取翻譯知識(shí),優(yōu)化機(jī)器翻譯引擎的各項(xiàng)參數(shù)或知識(shí)庫。翻譯知識(shí)可以從用戶的譯后編輯過程中自動(dòng)學(xué)習(xí)得到,也可以通過對(duì)比原始輔助譯文與修改后所生成的正確譯文得到。
黃河燕等人[63]描述了一個(gè)智能譯后編輯系統(tǒng)的設(shè)計(jì)原理和實(shí)現(xiàn)算法。該系統(tǒng)將意段作為編輯處理的基本單位,并且可以形成編輯反饋信息,提供給知識(shí)處理模塊。
Llitjos等人[64]通過實(shí)時(shí)追蹤輔助譯文中錯(cuò)誤的位置,對(duì)原始機(jī)器翻譯引擎的規(guī)則庫和詞典進(jìn)行修改,相當(dāng)于從譯后編輯過程中即時(shí)學(xué)習(xí)。但該方法要求用戶使用TCTool工具進(jìn)行譯后編輯,才能完成錯(cuò)誤追蹤,給用戶帶來了一定制約。
Bianchi等人[65]將一個(gè)在線學(xué)習(xí)模塊整合入Portage統(tǒng)計(jì)機(jī)器翻譯引擎。用戶通過Trados系統(tǒng)提供的界面對(duì)機(jī)器翻譯譯文進(jìn)行譯后編輯。學(xué)習(xí)模塊實(shí)時(shí)調(diào)整短語表內(nèi)的權(quán)重等參數(shù),來優(yōu)化機(jī)器翻譯引擎。
Martinez等人[66]提出,利用在線學(xué)習(xí)技術(shù),在用戶每次完成一批譯文的譯后編輯后,實(shí)時(shí)調(diào)整和更新基于對(duì)數(shù)線性模型的統(tǒng)計(jì)機(jī)器翻譯引擎中各項(xiàng)參數(shù)的估計(jì)值,使產(chǎn)生的輔助譯文質(zhì)量不斷提高,進(jìn)而使用戶的翻譯效率不斷增長(zhǎng)。與Bianchi[65]的方法相比,該方法的可擴(kuò)展性更強(qiáng),對(duì)機(jī)器翻譯引擎的優(yōu)化更為全面。
從研究現(xiàn)狀可以看出,計(jì)算機(jī)輔助翻譯技術(shù)的研究正在逐步深化并取得了一定的成果,然而,翻譯規(guī)模的急速增長(zhǎng)迫使人們開始關(guān)注多名用戶共同完成一項(xiàng)大規(guī)模翻譯任務(wù)的情況,即協(xié)同翻譯。協(xié)同翻譯與計(jì)算機(jī)輔助翻譯技術(shù)之間有一定的關(guān)聯(lián),也存在著顯著的差異。
在協(xié)同翻譯系統(tǒng)中,對(duì)于每個(gè)獨(dú)立用戶而言,其翻譯過程和翻譯環(huán)境與使用計(jì)算機(jī)輔助翻譯系統(tǒng)時(shí)并沒有太大差別,用戶仍然從系統(tǒng)那里得到自動(dòng)產(chǎn)生的輔助譯文,在輔助工具的幫助下進(jìn)行譯后編輯,最后提交給系統(tǒng)。但對(duì)于協(xié)同翻譯系統(tǒng)而言,與計(jì)算機(jī)輔助翻譯系統(tǒng)存在著本質(zhì)的區(qū)別,即用戶的群體性,多名用戶共同完成一項(xiàng)翻譯任務(wù),并且不同用戶的翻譯水平、翻譯經(jīng)驗(yàn)和教育背景等屬性都各有不同。協(xié)同翻譯系統(tǒng)必須充分考慮這種用戶的個(gè)性化差異,在與用戶的交互過程中,逐步對(duì)不同用戶的翻譯狀態(tài)形成深入了解,才能給每名用戶提供最符合他們的個(gè)性化特點(diǎn)和需求的翻譯任務(wù)、輔助譯文、輔助工具乃至質(zhì)檢方案等輔助,發(fā)揮不同用戶的優(yōu)勢(shì),使多用戶協(xié)同工作的效率達(dá)到最高。另外,由于存在多個(gè)用戶,系統(tǒng)從不同用戶的反饋中學(xué)習(xí)的翻譯知識(shí)的有效性和整體翻譯結(jié)果的一致性也需要得到更有效的檢查和保證。
綜上所述,本文第2部分介紹的計(jì)算機(jī)輔助翻譯的關(guān)鍵技術(shù)對(duì)于協(xié)同翻譯系統(tǒng)也極為重要,但協(xié)同翻譯系統(tǒng)對(duì)這些技術(shù)又提出了更高的要求。
在輔助譯文生成方面,面對(duì)相同的源語句,計(jì)算機(jī)輔助翻譯系統(tǒng)給每個(gè)用戶生成同樣的輔助譯文。但翻譯認(rèn)知心理學(xué)的研究成果表明,不同的譯者面對(duì)相同的語篇可能產(chǎn)生不同的心理模型[67]。反映在協(xié)同翻譯中就是不同用戶對(duì)系統(tǒng)所提供的輔助譯文有著不同的需求。例如,輔助譯文的句式和選詞應(yīng)符合用戶的個(gè)性化翻譯習(xí)慣和知識(shí)體系,輔助譯文的表示形式應(yīng)符合用戶的個(gè)性化翻譯心理等。
在譯后編輯方面,計(jì)算機(jī)輔助翻譯系統(tǒng)提供的譯后編輯環(huán)境是固定的,但不同用戶對(duì)譯后編輯的輔助工具、輔助方式和界面風(fēng)格等均有不同需求,且受到翻譯經(jīng)驗(yàn)、翻譯對(duì)象和翻譯過程的影響。協(xié)同翻譯系統(tǒng)應(yīng)能根據(jù)用戶的交互行為和翻譯狀態(tài),預(yù)測(cè)不同用戶在不同翻譯階段對(duì)譯后編輯輔助模式的不同需求,將系統(tǒng)的輔助以合適的方式,在合適的時(shí)機(jī)提供給用戶。
在系統(tǒng)反饋學(xué)習(xí)方面,與計(jì)算機(jī)輔助翻譯系統(tǒng)相同,協(xié)同翻譯系統(tǒng)也能夠從用戶的反饋中學(xué)習(xí)翻譯知識(shí),而且用戶的群體性使協(xié)同翻譯系統(tǒng)能學(xué)到更多的翻譯知識(shí),知識(shí)積累的效率也更高。但是這個(gè)特性也會(huì)造成來自不同用戶的翻譯知識(shí)之間存在沖突的問題。因此,協(xié)同翻譯系統(tǒng)還應(yīng)具備判定翻譯知識(shí)可信度的能力,只接受最可信的翻譯知識(shí),提高翻譯知識(shí)的準(zhǔn)確性。
此外,協(xié)同翻譯還涉及以下關(guān)鍵技術(shù)。
(1)協(xié)作策略確定。研究用戶與用戶、用戶與系統(tǒng)之間怎樣協(xié)同工作,并避免用戶在協(xié)作過程中產(chǎn)生翻譯行為沖突;
(2)協(xié)同任務(wù)分配。研究如何將翻譯任務(wù)進(jìn)行分解,并分配給合適的用戶,使整體翻譯效率最高;
(3)協(xié)同質(zhì)檢。研究如何從用戶的質(zhì)檢歷史中分析用戶的錯(cuò)誤傾向,對(duì)用戶進(jìn)行有針對(duì)性的個(gè)性化質(zhì)檢。
王建德等人[68]介紹了一種基于協(xié)同機(jī)制的多用戶交互翻譯系統(tǒng)的設(shè)計(jì)框架,用戶與系統(tǒng)之間采用客戶—服務(wù)器的方式進(jìn)行協(xié)作,用戶之間通過互相發(fā)送請(qǐng)求或在系統(tǒng)公共數(shù)據(jù)區(qū)發(fā)布信息來進(jìn)行協(xié)作。系統(tǒng)將所學(xué)習(xí)的翻譯知識(shí)分為公共知識(shí)和個(gè)性化知識(shí),在客戶端上存放了一些用戶的個(gè)人信息,并結(jié)合用戶的翻譯經(jīng)驗(yàn)、工作時(shí)間和翻譯工作量等參數(shù),綜合判定用戶的優(yōu)先級(jí),一定程度上實(shí)現(xiàn)了對(duì)用戶狀態(tài)的了解和協(xié)調(diào)控制。
Murata等人[69-70]構(gòu)建了基于 Web的 Yakushite Net協(xié)同翻譯系統(tǒng),其中來自不同領(lǐng)域的用戶可以協(xié)作改進(jìn)在線機(jī)器翻譯引擎的系統(tǒng)詞典,并實(shí)時(shí)共享。
Bey等人[71]借鑒 Wiki技術(shù),實(shí)現(xiàn)了 TRANSBey協(xié)同翻譯環(huán)境,供翻譯志愿者在線協(xié)同完成一些翻譯任務(wù)。該系統(tǒng)很好地發(fā)揮了Wiki技術(shù)的優(yōu)勢(shì)(即允許多名用戶自由創(chuàng)建并編輯網(wǎng)頁內(nèi)容,且有簡(jiǎn)單的句法來創(chuàng)建新網(wǎng)頁和已有網(wǎng)頁間的關(guān)聯(lián)),為協(xié)同翻譯系統(tǒng)中的協(xié)作策略提供了一種新的思路。
張桂平等人[72]提出了基于知識(shí)管理和智能控制的協(xié)同翻譯技術(shù),其中通過創(chuàng)建用戶模型,使系統(tǒng)實(shí)現(xiàn)了以用戶為核心的決策優(yōu)化。用戶模型由用戶行為模型和用戶狀態(tài)模型組成,行為模型描述了用戶在翻譯過程中的動(dòng)作和決策,提高了翻譯知識(shí)積累和應(yīng)用的有效性,狀態(tài)模型描述了用戶的特征和屬性,為協(xié)同任務(wù)分配、協(xié)同質(zhì)檢和翻譯知識(shí)有效性判定提供了依據(jù)。用戶模型的建立和應(yīng)用使協(xié)同翻譯系統(tǒng)中人機(jī)協(xié)同的效率和用戶的翻譯能力得到了同步增長(zhǎng)。該平臺(tái)在大規(guī)??萍假Y料翻譯工程實(shí)踐中取得了顯著的應(yīng)用效果。
還有一些研究人員針對(duì)雙語譯員缺乏的問題,研究如何使單語用戶協(xié)同完成翻譯任務(wù)。
Morita等人[73]描述了一個(gè)協(xié)同翻譯系統(tǒng),可以使源語言和目標(biāo)語言的單語在線用戶協(xié)作進(jìn)行翻譯,其中對(duì)目標(biāo)語言和源語言的用戶進(jìn)行了明確的分工,前者負(fù)責(zé)保證譯文的“流暢性”(對(duì)機(jī)器翻譯譯文進(jìn)行修改,使之可讀,再由機(jī)器翻譯引擎將譯文翻譯回源語言),后者保證譯文的“正確性”(確認(rèn)新產(chǎn)生的源語言句子與原始語句的意思是否相同。若不同,則對(duì)原始語句進(jìn)行改寫,再由機(jī)器翻譯引擎進(jìn)行翻譯,返回給目標(biāo)語言用戶)。該系統(tǒng)充分發(fā)揮了兩種語言的單語用戶在翻譯中的不同作用。
Bederson等人[74-75]也提出了一種單語用戶協(xié)同翻譯的策略,首先,源語言句子被機(jī)器翻譯引擎翻譯為目標(biāo)語言,然后由目標(biāo)語言的母語者盡力猜想其意思,修改(增加信息)后再由機(jī)器翻譯引擎翻譯回源語言,返回源語言母語者,繼續(xù)猜想意思并修改,重復(fù)該過程直至譯文被雙方認(rèn)可為止。
本文對(duì)計(jì)算機(jī)輔助翻譯和協(xié)同翻譯技術(shù)進(jìn)行了綜述。目前協(xié)同翻譯系統(tǒng)雖然已經(jīng)走向大規(guī)模真實(shí)應(yīng)用,但一些核心技術(shù)仍有待進(jìn)一步研究和探索??梢灶A(yù)見,以下技術(shù)將成為未來的研究重點(diǎn)。
(1)翻譯心理學(xué)研究。人類用戶是協(xié)同翻譯系統(tǒng)的核心。無論輔助譯文的生成、輔助工具的選擇,還是界面風(fēng)格的設(shè)計(jì),均需充分考慮用戶的翻譯過程、翻譯習(xí)慣等心理因素,因此對(duì)人類翻譯真實(shí)心理過程的研究將對(duì)協(xié)同翻譯系統(tǒng)的設(shè)計(jì)具有很高的研究?jī)r(jià)值。
(2)用戶角色控制技術(shù)研究。不同狀態(tài)的用戶在協(xié)同翻譯過程中適合不同的角色,現(xiàn)有系統(tǒng)已經(jīng)根據(jù)用戶的母語對(duì)單語用戶進(jìn)行了分工,將來還應(yīng)研究如何利用用戶的更多屬性,進(jìn)行更為深入、細(xì)化的分工。
(3)譯文一致性檢查技術(shù)研究。用戶的群體性使得最終譯文中可能存在沖突,目前一些協(xié)同翻譯系統(tǒng)通過術(shù)語規(guī)范化等方法進(jìn)行了控制,但仍無法完全保證翻譯結(jié)果的一致性,需要進(jìn)一步研究如何自動(dòng)檢測(cè)譯文中相互沖突的語言點(diǎn)。
(4)協(xié)同翻譯流程研究。協(xié)同翻譯是一項(xiàng)大規(guī)模、復(fù)雜的翻譯任務(wù),合理的流程設(shè)計(jì)和嚴(yán)格的過程控制可以充分發(fā)揮計(jì)算機(jī)在運(yùn)算和存儲(chǔ)方面的優(yōu)勢(shì),降低用戶工作量,減少重復(fù)勞動(dòng)的幾率,對(duì)于進(jìn)一步擴(kuò)大翻譯規(guī)模、提高翻譯生產(chǎn)率具有重要作用。
[1]陳群秀.計(jì)算機(jī)輔助翻譯系統(tǒng)漫談[C]//第十一屆全國(guó)民族語言文字信息學(xué)術(shù)研討會(huì)論文集,2007.
[2]Papineni K,Roukos S,Ward T,et al.BLEU:a Method for Automatic Evaluation of Machine Translation[C]//Proceeding of the 40th ACL,2002:311-318.
[3]Doddington G.Automatic evaluation of machine translation quality using n-gram co-occurrence statistics[C]//Proceeding of the ARPA Workshop on Human Language Technology,2002:128-132.
[4]Turian JP,Shen L,Melamed ID.Evaluation of Machine Translation and Its Evaluation[C]//Proceeding of MT Summit IX,2003:386-393.
[5]Krings HP.Repairing Texts:Empirical Investigations of Machine Translation Post-editing Processes[M].Kent State University Press:Koby GS,2001.
[6]O'Brien S.Methodologies for Measuring the Correlations between Post-Editing Effort and Machine Text Translatability[J].Machine Translation,2005,19(1):37-58.
[7]Kussmaul P,Tirkkonen-Condit S.Think-Aloud Protocol Analysis in Translation Studies[J].TTR,1995,8(1):177-199.
[8]Campbell S.Choice Network Analysis in Translation Research[C]//Processes of the Intercultural Faultlines:Research Models in Translation Studies:Textual and Cognitive Aspects,2000:29-42.
[9]Och FJ,Zens R,Ney H.Efficient Search for Interac-tive Statistical Machine Translation[C]//Proceeding of EACL 2003,2003:287-293.
[10]Civera J,Vilar JM,Cubel E,et al.From Machine Translation to Computer Assisted Translation using Finite-state Models [C]//Proceeding of EMNLP 2004,2004:349-356.
[11]Hasan S,Khadivi S,Zens R,et al.A Flexible Architecture for CAT Applications[C]//Proceeding of EAMT 2006,2006:81-88.
[12]Sanchis-Trilles G,Ortiz-Martinez D,Civera J,et al.Improving Interactive Machine Translation via Mouse Actions[C]//Proceeding of EMNLP 2008,485-494.
[13]Snover M,Dorr B,Schwartz R,et al.A Study of Translation Edit Rate with Targeted Human Annotation[C]//Proceeding of AMTA 2006,2006:223-231.
[14]Tatsumi M.Correlation between automatic evaluation metric scores,post-editing speed,and some other factors[C]//Proceeding of MT Summit XII,2009:332-339.
[15]Melby AK.Computer-assisted Translation Systems:The Standard Design and a Multi-level Design[C]//Proceeding of the 1st ANLP,1983:174-177.
[16]Bowker L.Computer-Aided Translation Technology:A Practical Introduction[M].University of Ottawa Press:2002.
[17]Craciunescu O,Gerding-Salas C,Stringer-O'Keeffe S. Machine Translation and Computer-assisted Translation:a New Way of Translating[J].Translation Journal,2004,8(3).
[18]Macklovitch E,Simard M,Langlais P.TransSearch:A Free Translation Memory on the World Wide Web[C]//Proceeding of the LREC 2000,2000:1201-1208.
[19]Wu JC,Chuang TC,Shei WC,et al.Subsentential Translation Memory for Computer Assisted Writing and Translation[C]//Proceeding of the 42nd ACL,2004.
[20]Sun L,Zhang Y,Zhang J,et al.PECAT:A Computer-Aided Translation Tool Based On Bilingual Corpora[C]//Proceeding of the IEEE SMC 2001,2001:927-932.
[21]Bi ici E,Dymetman M.Dynamic Translation Memory:Using Statistical Machine Translation to Improve Translation Memory Fuzzy Matches[C]//Proceedings of CICLing 2008,2008:454-465.
[22]Simard M,Isabelle P.Phrase-based Machine Translation in a Computer-assisted Translation Environment[C]//Proceedings of MT Summit XII,2009.
[23]He Y,Ma Y,Genabith JV.Bridging SMT and TM with Translation Recommendation[C]//Proceeding of the 48th ACL,2010:622-630.
[24]常寶寶,張偉.機(jī)器翻譯研究的現(xiàn)狀和發(fā)展趨勢(shì)[J].術(shù)語標(biāo)準(zhǔn)化與信息技術(shù),1998,(2):32-35.
[25]Kay M.The MIND system[J].Natural Language Processing,1973:155-188.
[26]Tomita M.Feasibility Study of Personal/Interactive Machine Translation Systems[C]//Proceeding of TMI-1,1985:289-297.
[27]Whitelock PJ,Wood MMG,Chandler BJ,et al.Strategies for Interactive Machine Translation:the Experience and Implications of the UMIST Japanese Project[C]//Proceeding of COLING 1986,1986:329-334.
[28]Melby A.On Human-machine Interaction in Translation[J].Machine Translation,1987:145-154.
[29]Zajac R.Interactive Translation:A New Approach[C]//Proceeding of COLING 1988,1988:785-790.
[30]Brown RD,Nirenburg S.Human-computer Interaction for Semantic Disambiguation[C]//Proceeding of COLING 1990,1990:42-47.
[31]Yamron J,Baker J,Bamberg P,et al.LINGSTAT:An Interactive,Machine-Aided Translation System[C]//Proceeding of the Workshop on Human Language Technology,1993:191-195.
[32]Foster G,Isabelle P,Plamondon P.Target-text Mediated Interactive Machine Translation[J].Machine Translation,1997,12(1):175-194.
[33]Foster G.Text Prediction for Translators[D].Canada,Universite de Montreal,2002.
[34]Bender O,Hasan S,Vilar D,et al.Comparison of Generation Strategies for Interactive Machine Translation[C]//Proceeding of the 10th EAMT,2005:33-40.
[35]Langlais P,F(xiàn)oster G,Lapalme G.TransType:a Computer-aided Translation Typing System [C]//Proceeding of the NAACL/ANLP Workshop on Embedded Machine Translation Systems,2000:46-52.
[36]Nepveu L,Philippe L,Lapalme G,et al.Adaptive Language and Translation Models for Interactive Machine Translation[C]//Proceeding of the 9th EMNLP,2004:190-197.
[37]Ueffing N,Ney H.Application of Word-level Confidence Measures in Interactive Statistical Machine Translation[C]//Proceeding of the 10th EAMT,2005:262-270.
[38]Gonzalez-Rubio J,Ortiz-Martinez D,Casacuberta F.Balancing User Effort and Translation Error in Interactive Machine Translation Via Confidence Measures[C]//Proceeding of the 48th ACL,2010:173-177.
[39]Tomas J,Casacuberta F.Statistical Phrase-based Models for Interactive Computer-assisted Translation[C]//Proceeding of the Coling/ACL 2006,2006:835-841.
[40]Khadivi S.Statistical Computer-Assisted Translation[D].Ph.D.thesis,RWTH-Aachen University,2008.
[41]Ortiz-Martinez D,Garcia-Varea I,Casacuberta F.Interactive Machine Translation based on Partial Statistical Phrase-based Alignments[C]//Proceeding of RANLP 2009,2009:330-336.
[42]Barrachina S,Bender O,Casacuberta F,et al.Statistical Approaches to Computer-assisted Translation[J].Computational Linguistics,2009,35(1):3-28.
[43]Veale T,Andy W.Gaijin:A Template-Driven Bootstrapping Approach to Example-Based Machine Translation[C]//Proceeding of the NeMNLP 1997,1997.
[44]Koehn P.Enabling Monolingual Translators:Post-Editing vs.Options[C]//Proceeding of NAACL 2010,2010:537-545.
[45]O'Brien S,Roturier J,Almeida G.Postediting Machine Translation Output[C]//Proceeding of MT Summit XII,2009.
[46]Wagner E.Rapid Post-Editing of Systran[C]//Proceeding of Tools for the Trade:Translating and the Computer,1985:199-213.
[47]Senez D.Post-Editing Service for Machine Translation Users at the European Commission[C]//Proceeding of Translating and the Computer,1998.
[48]Doyon J,Doran C,Means D,et al.Automated Machine Translation Improvement Through Post-Editing Techniques:Analyst and Translator Experiments[C]//Proceeding of the 8th AMTA,2008:346-353.
[49]O'Brien S.Teaching Post-Editing:A Proposal for Course Content[C]//Proceeding of the 6th EAMT Workshop Teaching Machine Translation,2002:99-106.
[50]Batoma PP,Girju R,Lowe E.Educating and Assessing the Human Translator in an Age of Technology[C]//Proceeding of MT Summit XII,2009.
[51]Martínez LG. Human Translation versus Machine Translation and Full Post-Editing of Raw Machine Translation Output[D].Dublin City University,2003.
[52]Aikawa T,Schwartz L,King R,et al.Impact of Controlled Language on Translation Quality and Postediting in a Statistical Machine Translation Environment[C]//Proceeding of MT Summit XI,2007:10-14.
[53]http://www.translog.dk/
[54]Carl M,Kay M,Jensen K.Long-distance Revisions in Drafting and Post-editing [C]//Proceeding of CICling 2010,2010:193-204.
[55]Carl M.Grounding Translation Tools in Translator's Activity Data[C]//Proceeding of MT Summit XIIWorkshop: Beyond Translation Memories: New Tools for Translators,2009.
[56]Koehn P.A Web-based Interactive Computer Aided Translation Tool[C]//Proceeding of the ACL-IJCNLP 2009Software Demonstrations,2009:17-20.
[57]Nishida F,Takamatsu S.Automated Procedures for the Improvement of a Machine Translation System by Feedback from Post-editing[J].Machine Translation,1990,5(3):223-246.
[58]Guzman R.Automating MT Post-editing using Regular Expressions[J].Multilingual Computing,2007,18(6):49-52.
[59]Elming J.2006.Transformation-based Corrections of Rule-based MT[C]//Proceeding of the 11th EAMT,2006.
[60]Groves D,Schmidtke D.Identification and Analysis of Post-Editing Patterns for MT[C]//Proceeding of MT Summit XII,2009.
[61]Simard M,Goutte C,and Isabelle P.Statistical Phrase-Based Post-Editing [C ]//Proceeding of NAACL 2007,2007:508-515.
[62]Dugast L,Senellart J,Koehn P.Statistical Post-editing on SYSTRAN's Rule-based Translation System[C]//Proceeding of WMT 2007,2007:220-223.
[63]黃河燕,陳肇雄.一種智能譯后編輯器的設(shè)計(jì)及其實(shí)現(xiàn)算法[J].軟件學(xué)報(bào),1995,(03):129-134.
[64]Llitjós AF,Carbonell JG.Automating Post-Editing to Improve MT Systems[C]//Proceeding of the AMTA Automated Post-Editing Techniques and Applications Workshop,2006.
[65]Cesa-Bianchi N,Reverberi G,Szedmak S.Online Learning Algorithms for Computer-assisted Translation[R].Deliverable D4.2,SMART Project,2008.
[66]Ortiz-Martinez D,Garcia-Varea I,Casacuberta F.Online Learning for Interactive Statistical Machine Translation[C]//Proceeding of NAACL 2010,2010:546-554.
[67]顏林海.翻譯認(rèn)知心理學(xué)[M].科學(xué)出版社,2008.
[68]王建德,陳肇雄,黃河燕.基于協(xié)同機(jī)制的多用戶交互翻譯系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[C]//第六屆計(jì)算機(jī)科學(xué)與技術(shù)研究生學(xué)術(shù)討論會(huì)論文集,2000.
[69]Shimohata S,Kitamura M,Sukehiro T,et al.Collaborative Translation Environment on the Web[C]//Proceeding of MT Summit VIII,2001:331-334.
[70]Murata T,Kitamura M,F(xiàn)ukui T,et al.Implementation of Collaborative Translation Environment‘Yakushite Net’[C]//Proceeding of MT Summit IX,2003.
[71]Bey Y,Boitet C,Kageura K.The TRANSBey Prototype:An Online Collaborative Wiki-Based CAT Environment for Volunteer Translators[C]//Proceeding of the 3rd International Workshop on Language Resources for Translation Work,Research &Training,2006:49-54.
[72]張桂平,蔡?hào)|風(fēng).基于知識(shí)管理和智能控制的協(xié)同翻譯平臺(tái)——知識(shí)管理和機(jī)器翻譯的融合[J].中文信息學(xué)報(bào),2008,22(5):3-11.
[73]Morita D,Ishida T.Collaborative Translation by Monolinguals with Machine Translators[C]//Proceeding of the 13th International Conference on Intelligent User Interfaces(IUI),2009:361-366.
[74]Hu C.Collaborative Translation by Monolingual Users[C]//Proceedings of the 27th International Conference Extended Abstracts on Human Factors in Computing Systems,2009:3105-3108.
[75]Bederson BB,Hu C,Resnik P.Translation by Iterative Collaboration between Monolingual Users[C]//Proceeding of Graphics Interface (GI)Conference,2010.