康寧++尉瑩++曲樂
[摘 要]術語翻譯和術語管理是翻譯流程中重要的環(huán)節(jié)。在計算機輔助翻譯環(huán)境下,通過創(chuàng)建和應用術語庫,有效地進行術語管理,既可以保證術語的一致性,提高翻譯效率,又可以將術語資源轉化為語言資產(chǎn),用于日后的翻譯實踐。本文探討了運用計算機輔助翻譯技術和工具,創(chuàng)建、應用術語庫及進行術語管理等實際問題,可為翻譯從業(yè)者提供有益的借鑒。
[關鍵詞]術語;術語庫;計算機輔助翻譯;術語管理
[中圖分類號]H315.9 [文獻標識碼]A [文章編號]1671-8372(2015)03-0107-04
On the construction and application of terminology database and the terminology management
in computer-aided translation
KANG Ning1, WEI Ying2, QU Le1
(1. School of Foreign Languages, Qingdao University of Science and Technology, Qingdao 266061, China; 2. School of Horticulture and Landscape Architecture, Hainan University, Haikou 570228, China)
Abstract:The translation and management of terminology is important part in translation process. Using computer-aided translation technology and tools to construct and apply terminology database and manage terminology helps to achieve consistency and efficiency, and transform the terminology resources into language assets for future translation practice. This paper discusses issues on the construction and application of terminology data base and issue of terminology management in the computer-aided translation environment, hoping it would be helpful for translation practitioners.
Key words:terminology; terminology database; computer-aided translation (CAT); terminology management
進入21世紀以來,計算機、信息、互聯(lián)網(wǎng)等技術得到了快速發(fā)展,翻譯工作的環(huán)境也隨之發(fā)生了根本性的變化,計算機輔助翻譯(Computer-aided Translation,英文簡稱CAT)觀念應運而生。需要注意的是,計算機輔助翻譯有別于機器翻譯(Machine Translation,英文簡稱MT)。相較于機器翻譯的目標是使翻譯過程實現(xiàn)完全自動化,人的工作只涉及少量的譯前和譯后編輯[1],計算機輔助翻譯則是譯員在翻譯過程中充分運用計算機技術和工具來提高翻譯效率和譯文質量,人工的作用仍然是主要的。廣義上講,計算機輔助翻譯是指對所有有助于譯員完成翻譯工作的技術和工具的運用;而狹義上則專指以翻譯記憶(Translation Memory)和術語管理(Terminology Management)為核心技術的計算機輔助翻譯軟件,如SDL Trados、Word Fast、Déjà Vu、雅信CAT等。
術語問題是翻譯流程中首先要面對和解決的問題,術語翻譯的準確性和一致性直接關系譯文的質量。本文通過探討在計算機輔助翻譯工具中,如何創(chuàng)建與應用術語庫,以及在計算機輔助翻譯環(huán)境下的術語管理,從而提高譯員的翻譯效率,保障譯文質量。
一、術語與術語庫
術語是用來表達某一專業(yè)或學科領域中的概念的詞語,具有明顯的專業(yè)化、標準化特征,被視為“人類科學知識在語言中的結晶”[2]。對于企業(yè)或組織來說,術語包括為了內部溝通、外部溝通、企業(yè)宣傳、品牌一致等目的所約定俗成的一套用語規(guī)范,故而,術語被視為全球化企業(yè)語言資產(chǎn)的重要組成部分[3]。使用術語數(shù)據(jù)資源可以降低產(chǎn)品內容設計及產(chǎn)品本地化和翻譯的成本。在翻譯實踐中,術語的范圍還可以擴大到原文本出現(xiàn)的高頻詞語,并且需要在譯文中保持統(tǒng)一譯名,如說明類或操作類文獻中經(jīng)常使用的“For more information, please…”也可作為術語提取出來。
術語庫是為了有效地利用和管理層出不窮的術語而創(chuàng)建的術語容器,術語條目一般為多語種對應。許多國際組織、政府機構及國際化企業(yè)都建立大型術語庫,例如世界貿易組織創(chuàng)建的WTOTERM、歐盟的EuroTermBank、微軟公司的LanguagePortal、法國標準化協(xié)會術語庫(NORMATERM)等。
對于職業(yè)譯員來說,處理術語是翻譯工作的基石,翻譯項目的開展是從整理和翻譯術語、建立原語和目標語對照的術語表開始的。在計算機輔助翻譯環(huán)境下,可將術語表導入到已創(chuàng)建的術語庫中,以便于在翻譯過程中自動識別原文中出現(xiàn)的術語,并在譯文中插入術語的譯文,這樣一方面可以提高翻譯的速度,另一方面也可以保證同一術語在譯文中的一致性。
二、在計算機輔助環(huán)境中創(chuàng)建和應用術語庫
(一)術語庫條目與術語庫條目結構
術語庫條目是承載術語數(shù)據(jù)的基本單元,每個條目至少應包含一個術語。面向翻譯的術語庫中一個典型的術語庫條目可包含一個術語、與該術語對應的多種語言的譯文,以及有關整個條目和單個術語的說明性信息。在計算機輔助翻譯工具中,每個條目中的術語數(shù)據(jù)信息組織在術語庫字段中,以SDL MultiTerm為例,常見的術語庫字段包括:
1.索引字段—用來記錄條目中不同語種的術語,每個索引對應一種術語語言;
2.說明性字段—用來說明和描述整個條目或單個術語的相關信息;
3.條目類字段—用來指定條目所屬的條目類;
4.系統(tǒng)字段—由系統(tǒng)創(chuàng)建和維護,用于存儲條目整體或單個字段的跟蹤信息,如條目編號、創(chuàng)建日期、創(chuàng)建人、修改日期等。
在計算機輔助翻譯工具中創(chuàng)建術語庫,首先要定義術語條目結構。根據(jù)ISO 30042-2008標準[4],術語庫條目結構包含三個層級:條目層、索引層和術語層,如圖1所示:
圖1 ISO 30042-2008術語庫條目基本結構層示意圖
條目層包含了系統(tǒng)字段以及應用于整個條目的其他說明性字段;索引層也稱語言層,包含了含有多語言術語內容的索引字段;術語層包含用于描述術語的說明性字段,如術語的定義、縮略形式等信息,甚至還可以是有關該術語的圖片、視頻等多媒體信息。
術語條目結構定義好之后,就可以開始創(chuàng)建術語庫的工作了。
(二)根據(jù)術語來源創(chuàng)建術語庫
1.翻譯實際中的術語來源
(1)客戶提供術語表??蛻籼峤淮g的文獻資料的同時,可能會提交與之相關的術語表,以保證譯文中術語翻譯的統(tǒng)一。這樣的客戶往往來自正規(guī)企業(yè)或組織,其機構本身、產(chǎn)品及服務已形成完備的機制,擁有自身的術語資源??蛻籼峤坏男g語表往往比較權威。然而調查顯示[5]國內客戶提供的術語資源大多是利用Access數(shù)據(jù)庫或Excel電子表格形式存儲,有的甚至以Word等文字編輯工具存儲,因此無法直接在計算機輔助翻譯環(huán)境中使用。
(2)譯員通過互聯(lián)網(wǎng)資源等渠道,自建術語表。信息化時代互聯(lián)網(wǎng)資源極大豐富,譯員根據(jù)所譯文獻所屬的學科專業(yè),很容易在互聯(lián)網(wǎng)上獲得多語言對照的術語資源。然而網(wǎng)上資源的質量參差不齊,需要譯員仔細甄別。而且網(wǎng)上獲得的術語資源對所譯文獻的針對性不強,往往不能完全覆蓋原文中的所有術語,需要譯者后續(xù)補充。從互聯(lián)網(wǎng)上得到的術語表也多以Excel電子表格形式存儲。
(3)譯員根據(jù)原文件整理術語。譯員拿到待翻譯的文獻后,先要通讀原文本,將其中的術語一一整理出來,并通過查詢權威性的專業(yè)詞典、與學科專家合作等手段,將術語譯成目標語。這是一般翻譯項目流程中常見的做法。術語表建立之后,在翻譯過程中就可以保證術語使用的一致性,尤其是當一個翻譯團隊處理同一個翻譯項目時,術語表的作用就更為明顯。相對而言,這種方式比較費時費力,但針對性強,術語翻譯的準確性也較高。
2.創(chuàng)建術語庫的步驟
以SDL MultiTerm工具為例,對于上文中前兩種來源獲得的術語,創(chuàng)建術語庫的步驟分為四步:第一步,在Excel表格中對術語進行校對、整理。需要注意的是,要確保所有數(shù)據(jù)位于同一工作表上,且列之間不能有空列。不同語言的術語排在前幾列,術語列的首行需加標題,并作為術語庫的索引字段名稱。因此標題要標明語種,如English,Chinese等。其他列的內容可為關于該術語的說明信息,列標題將作為描述性字段名稱,如“定義”“注釋”等,如表1所示:
表1 存儲于Excel電子表格中的術語及術語信息表
A B C D E F
1 Chinese English German 英文縮略 描述 圖片
2 三維
對象 3D object 3D-Objekt 三維是指在平面二維系中又加入了一個方向向量構成的空間系。
3 活動
腳本 active script Active Script 微軟公司制定的一種腳本語言,能使見面出現(xiàn)各種動態(tài)的交互式的效果
4 適配
器 adapter adapter 接口轉換器,可以是獨立一個硬件接口設備,也可以是一個信息接口
5 端口 port portieren 是計算機與外界通訊交流的出口
6 圖形用戶界面 graphical user interface grafische Benutzeroberflǎche GUI 是指采用圖形方式顯示的計算機操作用戶界面
第二步,用SDL MultiTerm Convert工具將Excel格式的術語表轉換為術語庫定義文件(.XDT)和術語數(shù)據(jù)文件(MultiTerm XML)。以表1為例,轉換時注意將“Chinese”“English”和“German”三個列標題指定為索引字段,“英文縮略”“描述”和“圖片”指定為說明性字段。
第三步,利用上一步中轉換的術語庫定義文件(.XDT)和SDL MultiTerm Desktop工具創(chuàng)建一個空的術語庫。術語庫定義文件將該庫的術語條目結構定義如圖2所示:
圖2 SDL Multi Term 術語條目結構示例圖
第四步,將術語數(shù)據(jù)文件(MultiTerm XML)導入到上步中創(chuàng)建的術語庫,生成術語庫文件(.sdltb)。
對于譯員根據(jù)原文件自己整理的術語,可以先在SDL MultiTerm程序中建立一個術語庫文件,然后逐條手動添加到庫中?;驅⑿g語數(shù)據(jù)整理到Excel表格中,然后按照以上示例,進行轉換和導入。
此外,SDL公司推出的術語提取工具SDL MultiTerm Extract可以自動定位并從現(xiàn)有單語和雙語文檔中提取術語,而不必費力地手動選擇術語,在此不做詳述。
(三)術語庫的應用
與Excel等格式保存的術語表相比,計算機輔助翻譯工具所創(chuàng)建的術語庫最大的優(yōu)勢是可以嵌入到計算機輔助翻譯工具中,并在翻譯過程中自動搜索和識別源語中出現(xiàn)的術語,有助于譯員將該術語的目標語迅速插入到譯文區(qū)中。而且大多數(shù)計算機輔助翻譯工具都支持邊翻譯邊添加和修改術語的功能,從而做到了對術語庫的實時更新和維護。除了上文提到的SDL MultiTerm工具外,Déjà Vu軟件的術語功能也十分強大,而且極具特色,其術語搜索和識別分為兩級進行,即術語庫(terminology)和項目詞表(lexicon)。項目詞表功能可以讓譯員從當前進行的翻譯項目中提取、加工術語,形成與當前項目直接相關的專用術語庫,其針對性更強。翻譯進程中,Déjà Vu首先搜索項目詞表,進而搜索術語庫[6],翻譯效率得到很大提升。
術語庫除了應用于翻譯過程中外,翻譯結束后還可以用于檢驗譯文里術語翻譯的準確性和一致性。許多計算機輔助翻譯工具本身帶有質量保證(Quality Assurance)模塊,對照嵌入的術語庫自動檢查術語翻譯的準確性和一致性,生成質檢報告。此外,術語庫作為獨立的文件,也可以加載到專門的翻譯質量保證工具中,如QA Distiller,Xbench,用于檢驗多種格式的雙語文本中術語使用問題。
三、面向計算機輔助翻譯的術語管理
廣義上講,術語管理是“系統(tǒng)化地收集、描述、處理、記錄、存貯、呈現(xiàn)及查詢特定專業(yè)領域中專業(yè)詞匯的活動”[7]。對公司和組織而言,術語管理的目標是“使企業(yè)或組織機構所使用的有關其產(chǎn)品、服務和商標的專業(yè)名詞,能夠確保在源文檔和所有目標語文檔中保持一致”[8],從而使術語資源成為企業(yè)全球化進程中的語言資產(chǎn)。為了有效管理術語資源,使企業(yè)語言資產(chǎn)最大化,面向企業(yè)的術語管理系統(tǒng)應不斷得到開發(fā)和應用,例如Acrolinx推出的Terminology Manager,SDL的MultiTerm,STAR的TermStar等。而翻譯實踐中的術語管理與企業(yè)術語管理在宗旨、流程和手段上都有所不同,翻譯項目管理者和個人譯者在計算機輔助翻譯環(huán)境下,其術語管理工作貫穿于整個翻譯流程,是保證翻譯質量的重要一環(huán)。
(一)翻譯實踐中術語管理的宗旨與要求
在翻譯實踐中,術語管理的宗旨是適應計算機輔助翻譯環(huán)境,確保術語在譯文中使用準確并且一致,以提升翻譯效率和質量。這就要求在翻譯流程的各個階段都要做好術語管理工作。為此,學界和業(yè)界提出了基于“全質量管理(Total Quality Management”的術語管理理念[9]。
翻譯項目管理的基本流程一般包括啟動、規(guī)劃、執(zhí)行、監(jiān)控和收尾五個階段[10],術語管理工作在翻譯項目的不同階段都有著不同的內容和要求。
在翻譯項目啟動和規(guī)劃階段,翻譯項目管理人對術語管理進行全面規(guī)劃。根據(jù)客戶對術語管理的要求、翻譯稿件的性質和評估術語的難度,制定術語管理策略,明確術語工作的整體進度與分工、術語定義與抽取規(guī)則、術語翻譯規(guī)范、術語驗證流程,以及術語庫標準、術語條目結構、術語庫更新和維護規(guī)范等。在項目執(zhí)行和監(jiān)控流程中,術語工作分四個階段進行:1.譯前準備階段。包括從源語中采集和整理術語、翻譯原語術語、校驗術語準確性(術語質量控制)、建立術語庫。2.翻譯進行階段。包括翻譯團隊中術語庫實時共享、計算機輔助翻譯工具中術語自動識別與插入、添加新術語和術語修正等。3.譯后校對階段。包括新術語和問題術語討論與確定、術語一致性驗證等。4.項目收尾階段。在此階段,術語管理的主要工作是利用專門工具對術語庫進行更新和維護,備份最終的術語資源,將其轉化為語言資產(chǎn),用于后續(xù)的翻譯項目和譯員培訓。
在翻譯實踐中,將有效的術語管理流程融入到翻譯項目管理之中,可以極大地提高整個翻譯項目的運作效率和質量。
(二)面向計算機輔助翻譯的術語管理技術和工具
傳統(tǒng)的術語管理不論是客戶方還是翻譯服務提供方,主要是依靠Excel、Access或文字編輯工具來管理術語,這種方式會帶來很多問題,諸如術語數(shù)據(jù)更新、術語檢索、處理效率、術語發(fā)布與共享等。隨著翻譯技術的迅速發(fā)展,為適應市場與客戶的需求,國內外很多翻譯技術提供商不斷開發(fā)專業(yè)化的術語管理技術和工具。計算機輔助翻譯環(huán)境下的術語管理工具一般分為兩類:獨立式工具和集成式工具。前者獨立于計算機輔助翻譯工具,專門對術語進行管理;后者則作為功能模塊或組件,集成在計算機輔助翻譯工具中。常用的獨立式術語管理工具有SDL MultiTerm,AnyLexic,TermStar,以及國內語智云帆公司研發(fā)的在線術語管理工具“語帆術語寶”等。獨立式術語管理工具功能更為齊全,管理更趨專業(yè)化。集成了術語管理模塊的計算機輔助翻譯工具有Déjà Vu、WordFast、雅信CAT等。這類工具使用更為方便靈活。在翻譯實踐中,需要根據(jù)客戶要求和翻譯項目的特點選擇適當?shù)男g語管理工具。
術語管理工具的主要功能一般包括:1.術語提取功能(包括從單語文件和雙語文件中提取術語),2.術語數(shù)據(jù)庫創(chuàng)建、管理與維護(包括術語條目結構、數(shù)據(jù)模板和屬性字段等),3.術語數(shù)據(jù)編輯功能(術語錄入、修改、合并等),4.術語檢索和篩選功能,5.數(shù)據(jù)交換功能(格式標準支持導入和導出,支持不同術語庫之間數(shù)據(jù)交換),6.用戶使用權限管理(數(shù)據(jù)安全性設置),7.術語共享與發(fā)布(客戶端、局域網(wǎng)及互聯(lián)網(wǎng))。
隨著信息技術和自然語言處理技術的迅速發(fā)展,術語管理系統(tǒng)呈現(xiàn)出標準化、網(wǎng)絡化和融合化的發(fā)展趨勢[11],功能也更為強大,可以滿足不同層次的企業(yè)、組織對術語管理的不同要求。然而在具體的翻譯中,有些術語還需要譯者根據(jù)語境,分析其語義的內涵與外延,而不能簡章地從術語庫中識別和插入譯文。
Bowker L,F(xiàn)isher D. Computer-aided Translation[M]//Gambier Y,Van Doorslaer L. (eds.). Handbook of Translation Studies(Vol. 1),Amsterdam/Philadelphia: John Benjamins Publishing Company, 2010:71.
馮志偉.現(xiàn)代術語學引論(增訂本)[M].北京:商務印書館,2011:1.
崔啟亮.企業(yè)語言資產(chǎn)內容研究與平臺建設[J].中國翻譯,2012(6):65.
ISO 30042:2008. Systems to Manage Terminology, Knowledge and Content-TermBase eXchange(TBX)[M]. BSI Standards Publication, 2009:75.
王華樹.淺議實踐中的術語管理[J].中國科技術語,2013(2):12.
朱玉彬,陳曉倩.國內外四種常見計算機輔助翻譯軟件比較研究[J].外語電化教學, 2013(1):71.
梁愛林.術語管理的意義與作用[J].中國科技術語,2012(5):11.
Muegge U. The Vital Role of Terminology Management in the Life Sciences [R]. CSOFT White Paper, 2009:2.
王華樹,張政.翻譯項目中的術語管理[J].上海翻譯,2014(4):66.
蒲欣玥,高軍.翻譯項目管理流程介紹[J].上海翻譯,2014(2):36.
王華樹,張政.面向翻譯的術語管理系統(tǒng)研究[J].中國科技翻譯,2014(1):22.
[責任編輯 祁麗華]