劉 毅
(廣東白云學院外國語學院,廣州 510450)
作為一種交際方式,書面語應盡可能做到清晰簡潔。然而,由于自然語言(natural language,NL)的隨意性(arbitrariness),交際過程中會出現(xiàn)表達含混不清的情況。于是,語言工程(linguistic engineering)創(chuàng)造了控制性語言(controlled language,CL)。維基百科給控制性語言的定義是:“人為定義的且屬于自然語言(通常為英語)的子集,控制性語言在詞、句及語義方面都受到限制?!?A controlled language is an artificially defined subset of a natural language(usually of English),in which terminology,syntax,and/or semantics are constrained.)B rockmann認為:“依據其定義,受控語言具有句法和術語前后一致的特點?!雹貰rockmann,Daniel.Controlled Language and Translation Memory Technology:a Perfect Match to Save Translation Cost.In TC - Forum.4 -97.1997:10 -11.
國外有代表性的CL研究與應用主要有BASIC English(由Charles Kay Ogden于1932年發(fā)布)、Caterpillar Fundamental English(由 Caterpillar于1970年開發(fā))、ASD Simplified Technical English(AECMA,1995)等。其中ASD Simplified Technical English發(fā)展最為成熟,從當初僅適用于航空工業(yè),覆蓋到許多其他行業(yè)(如醫(yī)療、石油、保險、汽車和計算機行業(yè)等)。隨著科技的飛速發(fā)展與全球化進程的加快,簡化英語越發(fā)引起重視,華為公司就曾在2010年底邀請Frans Wijma(簡化科技英語設計師,STE)對員工提供了簡化英語培訓。
設計控制性語言主要出于兩個目的:一是讓使用控制性語言書寫的文本更易理解,如歐洲航天設備制造商協(xié)會簡化英語(ASD Simplified Technical English)的設計就是要讓飛機維修程序更易理解,尤其是更易被不以英語為母語的技術人員理解;另一個目的是為了讓機器更容易處理以控制性語言書寫的文本,即機器翻譯。
在當今商務活動中,清晰、連貫的表達已經成為一種必然。目前英語是各領域技術文本使用的主要語言,但由于其形式的多樣性及復雜性,如復雜的句式,多義詞、同義詞的使用,很容易造成理解困難[1]。最為緊要的是,由于很多技術文本的最終讀者英語水平很難達到技術文本創(chuàng)作者或工程師的水平,理解以自然語言書寫的技術文本比較困難。因而,業(yè)內一般認為,不使用控制性語言可能會導致安全風險增加、操作或維護過程中造成設備損壞、產品本地化成本上升、翻譯滿意度降低、技術培訓成本增加、客服效率降低、由于溝通不暢導致產品召回而致使成本增加[2]。
第一,更容易理解,一個單詞只對應一條詞義。第二,可以做到寫作風格前后一致,跨文化交際過程中更易接受。第三,可以降低因模糊表達而引起的產品責任風險。第四,CL作為電子商務中提供客戶支持的一門全球性語言,可提高客戶滿意度。第五,使文件的后期處理和再利用更加容易。第六,使機器翻譯更快速,譯文更連貫、更優(yōu)質,同時可降低人工編輯的時間與成本。使用簡潔、清楚的語言書寫可大大提高機器翻譯質量。
為了驗證使用控制性語言編輯后的源語(SL)的機器翻譯結果可讀性更高,從而證明使用控制性語言的調整的必要性,以一段技術規(guī)范文本為翻譯材料,使用谷歌翻譯軟件做實例分析。原文(ST)是關于注塑機模型(Injection Molding Machine Model)的操作提示。
從表1可以看出,對比STa和TTa,主要的問題在于語序不妥,屬于人工調整的范疇,即便譯者不具備專業(yè)知識,稍作調整,可讀性立刻大大提高。STa中的for表示原因,其后譯文可讀性基本上不成問題,其中suggest譯為“顯示”,倒不如人工調整為“意味著”,consumption處理成“消費”也不及“消耗”更貼近。這是措詞的范疇,但也有深層次的原因。如果按照控制性語言“一詞一意”(one word,one meaning)的書寫規(guī)則,將 suggest(v.意味著;建議)替換成 mean(v.意味著),則“each press suggests grease consumption foraboutone month”變?yōu)椤癳ach press means grease consumption for about one month”,經谷歌翻譯軟件處理后得到譯文“每按一下表示油脂消耗約一個月”。經操控或控制(manipulated or controlled)后,“表示”明顯比“顯示”更符合漢語表達習慣。
對比STb和TTb,發(fā)現(xiàn)漢語“的”字出現(xiàn)3次,“報警的”、“不充分的油的容器”,但分析后并未發(fā)現(xiàn)ST相應成分之間有修飾關系或所屬關系,這一影響因子由于不具典型性,故而只需人工調整即可解決。
STc和TTc也存在措詞方面的問題。其中fill同燃油或油脂等搭配時,應為“加注”之意,根據語境,circuit也應為“線路”而不是“電路”。在 ST中,“堵塞”同“潤滑不足”為先果后因的關系,而漢語傾向于先因后果,即因果關系?;谝陨戏治觯{整后的TTc應為:請加注干凈油脂,以防止因潤滑不足而導致線路堵塞。
從以上分析可以看出,僅從可讀性角度來評價譯文質量,由于存在一詞多義、語序不當?shù)纫蛩?,機器翻譯結果并不令人滿意。因而,要想得到理想的譯文,譯前對原文進行編輯是必要的。
表1 技術規(guī)范文本翻譯實例
漢語屬漢藏語系,英語屬印歐語系,二者在詞匯、句法、語義等方面都存在差異,而最大的差異莫過于英語繁復的“曲折變化”,而漢語曲折變化少,主要用詞序和一些虛詞來表示各種語法關系。我國著名語言學家王力先生曾經說過:“就句子的結構而論,西洋語言是法治的,中國語言是人治的?!保?]35關于中英差異的論述比較多,概括起來,主要有以下8個方面:分析vs綜合、主動vs被動、意合vs形合、動態(tài)vs靜態(tài)、流散vs聚集、人稱vs物稱、具體vs抽象,重復vs替代。
事實上,由于漢語重前置修飾,而英文多后置修飾,根據這一差異,表1中STa只要按照漢語的規(guī)則稍作調整,將表示方式的副詞randomly和表示地點的狀語 in operational panel調整至動詞press的前面,則STa改寫為STa1:Do not randomly in operational panel press the lubrication button.再將STa1交由谷歌翻譯軟件處理,得到TTa1:不要隨意按操作面板的潤滑按鈕。
因此,作為具有主觀能動性的譯者,應該了解漢英主要差異,因為這是譯前編輯的參考依據,也會直接影響到譯文質量,進而決定了譯后編輯的工作量。因為從譯前準備的角度來說,準備工作越充分,譯后編輯越省力,翻譯的效率與質量也會大幅提高。
設計控制性語言需考慮漢英兩門語言的差異,為了使翻譯更加流暢,漢英在結構上應力求相近,最好是相同的語序。舉例來說,“我不吃雞了”、“雞我不吃了”和“我把雞吃了”分別對應SVO、OSV和SOV結構,后兩種結構在英語中極其罕見,因而,設計控制性語言(CL)時,理應遵循SVO結構??偟膩碚f,設計控制性語言的終極目的是要讓機器翻譯更加容易,可讀性更高,因而書寫時要避免含混不清。
一是多寫短句,避免長句。見表2。
表2 長短句翻譯結果對比
很明顯,谷歌翻譯軟件處理后的譯文進一步證實了短句和長句的優(yōu)缺點,長句經翻譯軟件處理后可讀性大大降低。
二是避免歧義句,一句一意。如:a)Flying planes can be dangerous.
b)Planes that are flying can be dangerous.
可以看出,a)是歧義句,既可理解為“飛行中的飛機可能是危險的”,也可以理解為“駕駛飛機可能是危險的”。而b)只表達“飛行中的飛機可能是危險的”一個意思。
三是選擇相同的詞、句表達同樣的意思,保持前后的連貫性。見表3。
表3 詞句異同對照實例
表格左邊關于打印機和掃描儀的安裝說明在句型方面前后完全一致,變換的只是printer和scanner這兩個設備名。而表格右邊則采用不同句法手段表達相同意思,從商業(yè)角度來看,不利于安裝人員閱讀,因而不利于產品的推廣使用;單純從機器翻譯的角度來看,也不利于計算機處理。
四是寫完整句(complete sentence)。如:
a)Do you wish to continue the installation of the software?(完整句)
b)Continue installing software?(非完整句)技術文獻作為一種比較正式的語體,類似于b)這樣的非完整句顯得比較口語化,屬于非正式語言。
五是語法結構簡單化。如:
a)Show that you can organize your thoughts by using a simple sentence structure in your texts.(句法結構簡單)
b)You,in your texts,to show that you can organize your thoughts,should use a simple sentence structure.(句法結構復雜)
六是多用主動句。如:
a)The program manager will send a summary of all questions to the responsible coworkers.
b)A summary of questions will be sent to the responsible individuals.
這同自然語言(natural English),尤其是書面語多用被動句并不矛盾。事實上,英語被動句經翻譯軟件處理后,可讀性遠遠不及主動句的翻譯結果。
七是盡量重復,少用代詞。
a)You must check the spelling of your text before you publish your text.
b)You must check the spelling of your text before publishing it.
為避免重復,英語多用代詞替代,甚至省略,但翻譯軟件盡管可以提高效率,多數(shù)情況下卻無法識別代詞所指與被省略的內容。本例中,a)中的從句重復了“your text”,而 b)則使用了代詞“it”,代替“your text”。從機器翻譯的角度來看,a)更符合控制性語言的書寫規(guī)則。
八是避免使用生僻詞匯(大詞,big words)。如:
a)Avoid ambiguity.
b)Eschew obfuscation.
這兩句為同義句,a)中的兩個單詞均為常用詞,易于識別與理解。b)中的兩個單詞均屬于生僻詞,不易識別,難于理解。
九是拼寫務必正確。如:
a)Texts that contain spelling errors complicate the translation process.
b)Texts that contein speling misstakes complicate the translation procces.(單詞 contein,speling,misstakes為拼寫錯誤)
一是名詞前加冠詞或數(shù)詞。二是為了表達不同的時間,必須加“了”、“過”、“在”、“將”、“會”等表達過去、現(xiàn)在和將來的助詞。三是以“許多”、“大量”、“一些”等數(shù)量形容詞表示復數(shù)概念。四是兩個動詞之間使用“以”表示目的。五是盡量使用名詞化結構。六是盡量將時間、地點、方式等狀語后置。七是盡量使用被動式。八是還原SVO結構。九是少用無主句,多用完整句。
前三條原則反映了漢語少曲折變化的特點,這樣的書寫要求充分考慮了譯入語(English)的特點,盡可能照顧英語豐富的形式變化,即按照譯者所期待的譯文要求去控制漢語的生成。
機器翻譯(machine translation,MT)即由電腦自動完成翻譯。我國的機器翻譯研究起步于1957年,是世界上第4個開始搞機器翻譯的國家。現(xiàn)在,中國社會科學院語言研究所、中國科學技術情報研究所、中國科學院計算技術研究所、黑龍江大學、哈爾濱工業(yè)大學等單位都在進行機器翻譯的研究。中國機器翻譯系統(tǒng)的規(guī)模正在不斷地擴大,內容正在不斷地完善。然而,由于機器翻譯運用語言學原理,機器自動識別語法,調用存儲的詞庫,自動進行對應翻譯,但因語法、詞法、句法發(fā)生變化或者不規(guī)則,出現(xiàn)錯誤在所難免,如《大話西游》中“給我一個殺你的理由,先”之類狀語后置的句子以及“最是那一低頭的溫柔,像一朵水蓮花不勝涼風的嬌羞”的文學性較強的句子,機器翻譯是無能為力的。
由于英漢之間的巨大差異,谷歌翻譯的譯文質量遠比印歐語系之間的機器譯文質量差。為了使機器譯文達到可知可解或全知全解的程度,減少后期的編輯工作,我們就必須進行譯前編輯,也即有目的地控制譯出語,將文本中的自然語言(NL)改成控制性語言(CL)。見表4。
從表4可以看出,自然漢語的很多四字結構被濃縮成具體的含義,整個字數(shù)減少到86字,原來的一個長句變成了五個短句,增加了主語“我們”,增加了表示時間的“將”。譯文單詞數(shù)相同,但編輯后的源語譯文可讀性(readability)大大提高。但也存在一些問題:第一,謂語動詞“is”同補語“goals”在數(shù)方面不一致;第二,句式過于單一,這主要受SL寫作風格的影響;第三,長安新工業(yè)的“長安”譯文“Changan”錯誤。因而,為進一步提高譯文質量,譯者還需經歷機器譯文后編輯階段。從多年的實踐經驗來看,機器翻譯的問題主要表現(xiàn)為語序、誤譯、漏譯以及篇章連貫性等方面,這說明機器無法替代人腦[4]。
表4 控制性漢語前后譯文對比
控制性語言固然能夠在詞匯和句法層面減少甚至消除自然語言給機器翻譯帶來的障礙,但是由于控制性語言的書寫對作者的要求較高,是否意味著作者的創(chuàng)造性或自主權因此受到了限制,進而影響到產出的文本數(shù)量,頻繁使用控制性語言是否會導致自然語言能力的退化,這些疑問還需進一步采取實證研究的方法加以驗證。但有一點是肯定的,如果將控制性語言的使用限制在某一特定領域(domain-specific),那么雙語甚至是多語之間的機器翻譯,無論是效率還是準確率都會得到大幅度提高,文中使用谷歌翻譯軟件對受控漢語的翻譯也證實了這一點。但無論機器多智能,也無論譯者花了多長時間做譯前編輯工作,未成功翻譯的文本還是占有一定比例,我們不能完全依賴機器翻譯,還需進行機器翻譯后的編輯。在當今信息化的時代,科技迅猛發(fā)展,需要翻譯的技術文本與日俱增,使用基于控制性語言的機器翻譯是提高技術文獻翻譯質量與效率、降低成本的一條有效途徑。
[1] 王致華.以句法為基礎的機器翻譯的研究現(xiàn)狀及其展望[J].重慶三峽學院學報,2013(5).
[2] 陳友勛.TM還是MT?——談CAT軟件設計中的認知理據[J].重慶工商大學學報:社會科學版,2013(2).
[3] 王力.中國語法理論[M]//王力文集:第一卷.濟南:山東教育出版社,1984.
[4] 楊憲澤.漢英機器翻譯中短語處理與譯文生成研究[J].西南民族大學學報:自然科學版,2013(3).