皇甫偉
摘 ? ?要: 本研究通過Translog鼠標鍵盤記錄法分析了不同水平譯者的譯后編輯過程,從停頓和編輯操作兩個方面分析了影響譯后編輯效率的主觀因素。結果表明,兩組譯者在停頓總時間和編輯操作總量上不存在顯著性差異,但是高級學生譯者的平均停頓率顯著高于初級學生譯者。本研究發(fā)現在譯后編輯策略的類型特征上,兩組譯者有明顯不同,在翻譯教學中如何從主觀因素角度指導學生提高譯后編輯效率有一定意義。
關鍵詞: 譯后編輯 ? ?主觀因素 ? ?鼠標鍵盤記錄法
譯后編輯的工作對象是機器翻譯的譯文。譯者在譯后編輯(Post-editing,PE)工作模式下的翻譯與以往的翻譯不一樣,他們需要對機器翻譯(Machine Translation, MT)的譯文進行替換、刪除、移動和添加等操作。此時,譯后編輯效率與諸多主客觀因素有關,比如文本難度、翻譯的語言對及譯者的翻譯能力等。本文主要探討影響譯后編輯效率的主觀因素。
一、影響譯后編輯效率的主觀因素
主觀因素主要指的是譯者因素。根據Vieira(2014)[1]譯者在譯后編輯中的認知因素主要體現在三個方面,即時間、認知努力和技術操作。其中,譯后編輯的時間因素屬于客觀,認知努力和技術操作屬于主觀。
譯者認知努力的測量難度較大。目前主要有出聲思維(Think Aloud Protocal, TAP)的方法和鍵盤行為記錄技術,以及眼動試驗三種。一般認為,作為一種心理活動,認知努力付出的越多,翻譯效率越低。比如譯者停頓行為體現了譯者發(fā)現MT譯文中的錯誤和對其進行修正,這是影響翻譯效率的重要因素。停頓動作越多,表明譯文中可譯性負面指標(Negative Translatability Indicator, NTI)越多,所需認知努力越大(OBrien,2007) [2]。因此測量停頓行為就能在一定程度上體現譯者的認知努力。本項研究所用測量影響效率的停頓行為的指標是停頓時間和平均停頓率。
技術操作是譯者對譯文的編輯操作。OBrien(2014)[3]發(fā)現譯后編輯效率的提高往往伴隨譯者利用鍵盤或鼠標編輯操作的減少,即譯者對MT譯文的編輯操作與編輯效率負相關。必須指出的是他們的研究發(fā)現其實是不言自明的道理,但同時他們沒有證明編輯操作的數量與譯后編輯的時間之間存在顯著的因果關系,即前者的增加并不能必然導致更多的譯后編輯時間,換句話說更低的譯后編輯效率。比如,在編輯操作較少的情況下,如果停頓行為增加,譯后編輯時間就會增加,引起譯后編輯效率的降低。此外,高效的譯后編輯操作策略是可以提高編輯效率的。本研究要驗證譯者編輯操作的整體數量和編輯操作的類型和方式對效率有何影響。
二、研究方案
首先對試驗對象、試驗工具、翻譯材料和實施步驟等變量進行有效的控制。本研究選取的譯者根據翻譯經驗劃分為初級學生譯者和高級學生譯者。前者為6名BTI翻譯專業(yè)本科大四的學生,已經通過專業(yè)四級和完成1萬字左右的翻譯量。后者為6名MTI翻譯專業(yè)碩士研三的學生,全部有CATTI三級筆譯證書和完成了10萬字左右的翻譯量。試驗工具采用Translog鍵盤記錄工具。在完成相關的試驗前工具應用和試驗程序和內容培訓后,讓所有試驗對象使用Translog II-user為一段335個漢字的電力建設項目合同的Google機器翻譯英譯文進行譯后編輯。該Google機器翻譯譯文是經過在SDL Trados 2007(試用版)平臺與參考譯文的匹配度測試,與百度、必應機器翻譯譯文比較后,譯文質量最佳,由此盡量控制MT譯文質量這個客觀因素對譯后編輯的影響。
另外,為了再現譯后編輯的真實工作場景,為所有試驗對象提供英漢術語表一份。并根據英語翻譯專業(yè)對學生翻譯能力一般/較高/更高的每小時翻譯字數250/300/350的要求,以及聯合國翻譯標準對譯員每分鐘5個詞的要求,也考慮到學生譯者對機輔編輯的熟練程度,本研究限定譯后編輯的時間為45分鐘完成335個漢語原文的MT譯文的譯后編輯。
然后,在試驗中主要測量不同水平的譯者的譯后編輯時間和停頓時間。此兩項數據通過Translog自動收集得到,并通過線性表示(Linear View)和停頓圖(Pause Plot)展現,整理后就可用于SPSS數據分析。試驗中所采集的譯者譯后編輯操作數據,都保存在一個翻譯過程數據XML文檔中??梢酝ㄟ^觀看Translog的錄屏回放功能,加載這個XML文檔再現譯者的鼠標和鍵盤操作。譯后編輯的譯文質量評價使用SDL Trados 2007(試用版)平臺計算與參考譯文的相似度判定,最大限度地避免采用人工評價可靠性差所帶來的干擾。
三、研究結果
首先觀察來自Translog自動采集的統(tǒng)計數據信息,以及在各測量指標上的組間方差t檢驗結果。
如表1所示,兩組受試對象的譯后編輯時間(PED, Post-editting Time)均值都小于任務規(guī)定完成時間,而譯后編輯速度(Speed)均值都超過聯合國標準(每分鐘5個詞)兩倍多。該研究未設置人工翻譯對照組,并不能推斷出兩組學生譯者的譯后編輯效率比人工翻譯的高。從表1中不考慮有效停頓時間的前7項指標均值和t檢驗結果看,表1反映出高級學生譯者的表現優(yōu)于初級學生譯者,分別是以分鐘為單位的譯后編輯時間,以分鐘為單位的停頓總時間(PD, Pause Duration),以詞/分鐘為單位的譯后編輯速度,以百分比表示的譯后編輯譯文和參考譯文的相似度(SPR, Similarity Between PE Version and Reference),鼠標和鍵盤操作總量(KMS, Key and Mouse Stroke),以秒/詞為單位的平均編輯用時(PED.W, PED per Word),以秒/詞為單位的平均停頓用時(PD.W, PD per Word)。但是,兩組譯者在這7項指標上的獨立樣本t檢驗結果又表明,他們的表現沒有顯著性差異,即自由度為10時|t■|小于雙尾檢驗的t■值2.228,以及概率值均大于0.05。
不考慮有效停頓,只觀察譯后編輯總時間和停頓總時間等指標并不能全部揭示譯者的真實譯后編輯水平,因為只有在譯后編輯時間達到一定長度的停頓才是有效的認知過程。而且為了得出質量最佳的修改方案,認知難度大的要比難度小的目標文本耗費更長的停頓時間。Jakobsen (1998)最早提出要以1秒停頓時作為標準,而Rydning(2002)則以5秒為分界。本研究采用5秒作為判定有效停頓的依據。表1反映出兩組譯者在有效停頓的數量(No.P, Number of Effective Pause),以秒/次為單位的有效停頓次數在停頓總時長中的占比(PD_No.P, Effective Pause per Pause Duration),以及平均停頓率(P.Ratio, Ratio of PD_No.P and PD_W)這三項指標上都存在統(tǒng)計學上的顯著性差異,即自由度為10時|t■|大于雙尾檢驗的t■值2.228,以及概率值均小于0.05。
再對譯者譯后編輯總時間、停頓總時間、編輯速度、鼠標鍵盤編輯操作數量、譯文相似度和平均停頓率5項指標做Spearman等級相關檢驗,結果如表2:
從表2可以看出,編輯速度與編輯操作量這兩項指標與其他各項指標都存在強相關,只是前者與PED、PD和KMS是強負相關,與SPR和P.Ratio強正相關。這表明譯后編輯用時越多,編輯操作的量隨之增多,速度也降低。編輯操作數量與PED和PD呈強正相關,與P.Ratio強負相關,即擊鍵數伴隨用時的增加而增加,平均停頓率高的反而編輯操作數量少。另外一個有意義的發(fā)現是速度與譯文相似度的正相關,盡管不是很高,但也達到0.626。這點再次驗證了表1的數據,即盡管翻譯能力高、低兩組學生譯者之間的編輯速度和編輯操作數量等7項指標之間沒有顯著性差異,但是高級學生譯者組的譯后編輯質量較高,速度較高。表2數據分析結果驗證了一個很顯見但是容易被忽視的一個道理,即譯后編輯速度與編輯操作數量的強相關達到了負0.860,即如要提高速度,可以線盡力把編輯操作總量降下來。下一部分還會詳細討論和解釋表1和表2的發(fā)現。
四、停頓時間與效率相關性討論
高級與初級譯者在停頓時間內所做的編輯操作的層級有差別。高級譯者具有對原文全局理解和能力,會用大量的停頓對機器翻譯譯文及原文做總體分析,決定下一步的修改行為。初級譯者雖然每次的停頓時間比較短,但普遍缺乏整體意識,所以高級譯者的譯后編輯多發(fā)生在宏觀層級,如對從句和句法的修改,初級譯者的譯后編輯行為多發(fā)生在微觀層級,如詞匯和短語的修改。因此,初級譯者會用停頓的時間修改機器譯文中的各種錯誤,高級譯者在改正錯誤的同時還會停頓一下思考如何潤色譯文,以便譯文質量盡力同時達到“準確、簡潔、客觀和通暢”。這種停頓行為會反映到譯后編輯的效率上,即初級譯者需要更多次數的修改和頻繁的停頓思考如何才能生成合格的譯文,而且多數修改缺乏整體意識,很少有兼顧高層級的句子、段落和篇章的調整,多是字詞語法錯誤和拼寫錯誤的修改。
如表1和表2所證實的,兩類譯者的停頓時間總體無顯著性差異,但是有效停頓次數、在停頓總時長中有效停頓次數的占比和平均停頓率三項指標上都呈現顯著性差異。通過查看Translog的線性表示后,發(fā)現高級學生譯者對問題解決方案的甄選過程比較復雜,而初級學生譯者則明顯缺乏統(tǒng)籌兼顧的元策略意識。以下表3所展示的是高級與初級譯者對同一句機器翻譯譯文編輯過程的線性表示,可以直觀揭示這一現象。漢語原文是:“發(fā)包方協(xié)助承包方進行施工現場總平面管理,確?,F場文明施工”。
從表3可以看出,盡管兩者的譯后編輯質量都可算合格水平,但高級學生譯者卻用時較少(44′′258 Vs 1′03″228),刪除操作明顯較少(2次 Vs 12次),增加文本量較少(17個字符 Vs 19個字符),每分鐘的編輯速度也較快(51.516次 Vs 47.2次)。仔細查看Translog回放后發(fā)現,高級學生譯者從一開始就有一個較長的停頓,后來還有一段與其他程序互動的過程。但是,初級學生譯者一開始就急于刪除機器譯文中增譯的“shall”,以至于此后馬上發(fā)現產生了主謂不一致錯誤,只能在“assist”后加“s”后綴修正。而且在發(fā)現第二個“ensure確?!睉汀癮ssist協(xié)助”同是并列謂語后,刪除了“to”,卻又帶來了主謂不一致錯誤,只能再次在“ensure”后加“s”修正。這一切都是初級學生譯者缺乏經驗和沒有整句意識的表現。與此相反,高級學生譯者不但糾正了機器譯文中明顯屬于多義詞誤用的錯誤,把“plane”修改為“l(fā)ayout”,還把最后的“on site”重復成分省譯處理。再反觀初級學生譯者,不但缺乏對“plane”一詞的誤用做深入思考和求證的過程,而且未發(fā)現“on site”這個英語應該省譯的重復成分。
五、譯后編輯操作與效率相關性討論
學者一般認為鼠標和鍵盤操作反映了譯者的編輯策略,但是是否與效率構成一對因果關系看法不一(Arenas, 2014) [4]。本研究的發(fā)現支持譯后編輯操作的總量與譯后編輯時間呈強正相關,與譯后編輯速度呈強負相關,即編輯操作越多,耗費的時間變長,速度變慢,效率降低。另外,本研究同時發(fā)現譯者的平均停頓率與譯文相似度的相關系數大于譯后編輯操作數量與譯文相似度的相關系數(|0.513|>|-0.4501|)。這意味著高級譯者組的編輯操作的絕對數量上不顯著高于初級譯者組的情況下,兩組之間在編輯操作的類型特征上必定存有差異。
根據Translog錄屏回放,可以看出效率差異的決定因素并不局限于編輯操作的數量,主要是由于編輯操作的類型,即編輯的策略。本研究中的譯者編輯策略主要指的是使用鼠標和鍵盤對譯文內容的修改方式,可分為拖拽、復制粘貼內容、增加或刪除內容、替換內容和修正打字錯誤。表3中所示的例子典型地反映了兩種不同的編輯策略。高效的策略會伴隨有較少的打字行為,增刪內容不重復,經常使用鼠標先選中待編輯內容后再進行刪除、移動和替換的操作。初級學生譯者的編輯策略伴隨有較多的重復打字行為,添加和刪除內容等操作多有重復,而且缺乏整體規(guī)劃,經常難以高效利用既有的機器譯文。兩組譯者的打字失誤雖然沒有統(tǒng)計學上的顯著性差異,但初級譯者往往由于語言能力不夠或元策略缺乏而出現打字失誤。意味著同時會出現增刪內容的重復編輯動作,降低效率。
六、結語
該研究對影響譯后編輯效率的主觀因素進行分析,采用Translog的技術路徑,從譯者停頓和編輯操作兩個方面進行定量分析。研究結果表明,在兩組譯者中,高級學生譯者的停頓時間更少,并與初級學生譯者組無顯著性差異,但是平均停頓率前者顯著高于后者。在編輯操作總數量上,高級學生譯者更少,兩組無顯著差異,但錄屏回放揭示出高級學生譯者的編輯策略更高效。
參考文獻:
[1]Vieira L. N.. Indices of cognitive effort in machine translation post-editing[J]. Machine Translation, 2014,28(3-4):187-216.
[2]OBrien S.. An Empirical Investigation of Temporal and Technical Post-Editing Effort[J]. Translation & Interpreting Studies, 2007,2(1):83-136.
[3]OBrien, L. W., Balling, M. Carl, M. Simard, & L. Specia (red.). Post-Editing of Machine Translation: Processes and Applications[M]. Newcastle upon Tyne: Cambridge Scholars Publishing, 2014:147-169.
[4]Arenas A. G.. Correlations between productivity and quality when post-editing in a professional context[J]. Machine Translation, 2014,28(3-4):165-186.
本研究由華北電力大學2018—2019年度教育教學改革項目基金支持。