宋廣波
(山西大同大學(xué)煤炭工程學(xué)院,山西大同037003)
原文預(yù)處理法在漢英機(jī)器翻譯中的應(yīng)用
宋廣波
(山西大同大學(xué)煤炭工程學(xué)院,山西大同037003)
隨著機(jī)器翻譯技術(shù)的發(fā)展,越來越多的人嘗試使用機(jī)器翻譯來完成或輔助完成翻譯任務(wù)。然而,由于當(dāng)前機(jī)器翻譯技術(shù)存在局限性,導(dǎo)致了機(jī)器翻譯質(zhì)量尤其是漢譯英的翻譯質(zhì)量低下,準(zhǔn)確性和可讀性往往較差,從而限制機(jī)器翻譯的應(yīng)用范圍。我們要根據(jù)漢英基本句型對應(yīng)理論以及簡潔性原則,只需對原文進(jìn)行快速、簡單的預(yù)處理,即可大幅度提高譯文的準(zhǔn)確性與可讀性,從而大幅度地提高機(jī)器翻譯的質(zhì)量。
漢譯英;機(jī)器翻譯;基本句型;預(yù)處理;翻譯質(zhì)量
用計(jì)算機(jī)自動(dòng)完成翻譯任務(wù)是人類長期以來的夢想。如今,機(jī)器翻譯已經(jīng)成為職業(yè)和非職業(yè)譯者、翻譯機(jī)構(gòu)不可或缺的得力幫手。[1]機(jī)器翻譯是建立在語言學(xué)、數(shù)學(xué)、信息學(xué)、計(jì)算機(jī)科學(xué)等學(xué)科基礎(chǔ)上的多邊緣學(xué)科。[2]然而,由于中西語言、文化等差異以及當(dāng)前機(jī)器翻譯發(fā)展水平的局限性,漢英機(jī)器翻譯質(zhì)量總的來說不夠理想,準(zhǔn)確率不高,可讀性差,可用率低,后期處理難度高、工作量大。從某種意義上講,機(jī)器翻譯似乎該為晦澀難懂、低質(zhì)量的譯文泛濫“負(fù)全責(zé)”。
那么,機(jī)器翻譯真的是“低質(zhì)量譯文”的代名詞嗎?對此,筆者進(jìn)行了針對性的探索,通過大量的理論研究和對比實(shí)驗(yàn),發(fā)現(xiàn)漢英基本句型對應(yīng)關(guān)系對于機(jī)器翻譯質(zhì)量的研究具有基石作用。鑒于在國內(nèi)漢譯英的應(yīng)用者一般為受過良好中文教育的國人,中文理解、表達(dá)能力相對較強(qiáng)是一大優(yōu)勢,利用這個(gè)優(yōu)勢,在保持原文意義不變的情況下,根據(jù)這兩種語言之間的基本句型的對應(yīng)關(guān)系,只需花少量的時(shí)間和精力先改寫中文的句型結(jié)構(gòu),并盡量簡化詞句的表達(dá)方式,然后再放入翻譯引擎中進(jìn)行翻譯,即可得到準(zhǔn)確性、可讀性均大幅度提高的譯文,為后期的修改、潤色及其他后期處理提供了莫大的便利。[3]可以說這個(gè)方法省時(shí)省力,效果好,具有明顯的推廣價(jià)值。
中文是東方的象形文字,英文卻是西方的拼音文字,似乎兩者之間無任何“默契”可言。而一些淵源相近的語言,例如法語和英語之間的互譯用機(jī)器翻譯來做又快又好。筆者在瀏覽法語、德語網(wǎng)頁的時(shí)候,往往會(huì)利用“百度翻譯”等網(wǎng)絡(luò)翻譯引擎把這些網(wǎng)頁翻譯成英語而不是漢語進(jìn)行閱讀,這是因?yàn)槲鞣秸Z言和漢語在語法等方面差異實(shí)在太大了,機(jī)器翻譯的結(jié)果往往令人費(fèi)解,給人的感覺往往是既不準(zhǔn)確,也不可靠。
幸運(yùn)的是,當(dāng)前語言學(xué)者的研究成果表明,經(jīng)過“格式化”的漢語和英語在語法結(jié)構(gòu)上也有驚人的相似性。這些基本對應(yīng)的句型有主謂結(jié)構(gòu)、主謂賓結(jié)構(gòu)、主系表結(jié)構(gòu)、雙賓語結(jié)構(gòu)以及主謂賓補(bǔ)結(jié)構(gòu)。[4](P57-64)為了更好地說明這個(gè)基本句型對應(yīng)理論,筆者在下面給出各種基本句子結(jié)構(gòu)的例句。為了便于對照,各例句主語用著重號(hào)表示,謂語用斜體表示,賓語用下劃線表示,賓語補(bǔ)足語用波浪線表示,表語用虛下劃線表示。鑒于狀語明確性高,為了簡便起見,例句中的狀語一般予以省略。
1.船沉了?!鶷he ship sank.
2.他們消失了。→They disappeared.
3.價(jià)格已經(jīng)下降了。→The price has dropped.
1.我愛你?!鶬 love you.(賓語為代詞)
2.愛麗絲討厭螞蟻?!鶤lice hates ants.(賓語為名詞)
3.他們喜歡爬山?!鶷hey like climbing mountains.(賓語為動(dòng)名詞)
4.他想喝一杯啤酒?!鶫e wants to have a glass of beer.(賓語為動(dòng)詞不定式)
5.我們不知道他喜歡什么?!鶺e don't know what he likes.(賓語為從句)
6.她在看著那個(gè)玻璃杯?!鶶he is looking at the glass.(不及物動(dòng)詞+介詞結(jié)構(gòu)可以看成等同于及物動(dòng)詞)
7.彼得擅長數(shù)學(xué)?!鶳eter is good at math.(系動(dòng)詞+形容詞+介詞結(jié)構(gòu)可以看成等同于及物動(dòng)詞)
1.她(是)漂亮(的)。→She is pretty.(表語為形容詞)
2.我是一名學(xué)生?!鶬 am a student.(表語為名詞)
3.湯姆(是)在圖書館里?!鶷om is in the library.(表語為介詞)
4.目的是幫助其他人?!鶷he purpose is to help others.(表語為不定式)
5.它不是你所喜歡的?!鶬t is not what you like.(表語為從句)
需要注意的是在漢語中形容詞可以直接做謂語,而在英語中一般不可以。因此一個(gè)翻譯引擎若出現(xiàn)無法有效識(shí)別形容詞做謂語的情況,原文應(yīng)該改寫為標(biāo)準(zhǔn)主系表結(jié)構(gòu),以便機(jī)器識(shí)別。
1.我教他英語?!鶬 teach him English.
2.他遞給我一只鋼筆→He passed me a pen.
3.那個(gè)男人搶走了他的手表?!鶷hat man robbed him of his watch.
第三組例句中“of his watch”構(gòu)成了介賓結(jié)構(gòu),可以看成是雙賓語結(jié)構(gòu)的變形。
主謂賓補(bǔ)結(jié)構(gòu)即主謂賓+賓語補(bǔ)足語結(jié)構(gòu),用法非常靈活,表達(dá)能力極強(qiáng)。在英文中,賓語補(bǔ)足語成分可以由多種詞性充當(dāng)。
1.他讓我生氣了?!鶫e made me angry.(賓補(bǔ)為形容詞)
2.我們選舉他為總統(tǒng)?!鶺e elected him president.(賓補(bǔ)為名詞)
3.他叫我過來。→He asked me to come.(賓補(bǔ)為動(dòng)詞不定式)
4.我看見她在讀一本書?!鶬 saw her reading a book.(賓補(bǔ)為現(xiàn)在分詞短語)
5.讓窗戶關(guān)住?!鶮eep the window closed.(賓補(bǔ)為過去分詞,表示被動(dòng))
6.湯姆發(fā)現(xiàn)她在圖書館里?!鶷om found her in the library.(賓補(bǔ)為介詞短語)
基本句型對應(yīng)關(guān)系是所有機(jī)器翻譯引擎的基礎(chǔ)。由于技術(shù)限制,機(jī)器翻譯中的長句中斷句、斷詞往往不夠準(zhǔn)確,造成誤譯或譯文晦澀難懂,但是翻譯引擎依然擅長處理簡單句。因此,從理論上說,在使用機(jī)器翻譯進(jìn)行漢譯英前,花少量時(shí)間把漢語句子盡量改寫為機(jī)器可識(shí)別的最基本句型并盡量簡化表達(dá)方式,即可大幅度提高譯文質(zhì)量。這個(gè)方法,筆者稱之為“基于漢英基本句型對應(yīng)理論和精簡原則的預(yù)處理法”。具體的做法是:1、如果主句或從句過于復(fù)雜,內(nèi)含多個(gè)從句或者修飾、限制成分,則拆分為最多包含一個(gè)從句的基本句型;2、如果有成分省略,則予以補(bǔ)全。3、生僻、繞口、晦澀或機(jī)器難以識(shí)別的表達(dá)方式,更改為簡單、直接的表達(dá)方式。
中文原文:曾經(jīng)看到那些假日垂釣者,獨(dú)釣一天,空手而歸。
百度翻譯結(jié)果:Ever see those holiday anglers,fishing day,empty handed.
原文預(yù)處理后:以前我經(jīng)常在假日看到那些垂釣者,他們勞動(dòng)了一整天,可是他們空手而歸。
百度翻譯結(jié)果:I used to see those holiday anglers,they work all day,but they left empty handed.
后期處理、潤色結(jié)果:In holidays,I used to see those anglers who worked all day but left emptyhanded.
由于機(jī)器翻譯往往用于輔助翻譯,或用在要求不太高的場合,如網(wǎng)頁即時(shí)翻譯等,因此,機(jī)器翻譯給傳統(tǒng)翻譯的普遍性原則“忠實(shí)、通順”賦予了更多的含義。為了更好地進(jìn)行量化以便打分評估,在此筆者采用“準(zhǔn)確性”和“可讀性”兩大指標(biāo)來量化這個(gè)翻譯標(biāo)準(zhǔn)。[5]所謂準(zhǔn)確性,主要在于信息的完整性,既不添加多余的信息,又不遺漏重要的信息和必要的細(xì)節(jié),不會(huì)造成讀者誤解。所謂可讀性,主要指譯文的閱讀難度。越容易閱讀,可讀性就越高;而句子結(jié)構(gòu)越復(fù)雜,可讀性就越低。有趣的是,中英5種基本句型都是最簡單的句型,天生就具有很高的可讀性,因此看起來簡單,卻值得深入探討、研究。
為了更好地說明本文中所提出的方法的實(shí)效性,筆者以準(zhǔn)確性和可讀性兩大指標(biāo),設(shè)計(jì)了漢英機(jī)器翻譯質(zhì)量對比實(shí)驗(yàn)。準(zhǔn)確性主要由筆者和從事英語教學(xué)的同事把關(guān)、打分(共5人),而可讀性主要由筆者和其他4名以英語為母語的、受過高等教育的英、美、加拿大籍人士通過互聯(lián)網(wǎng)打分(共5人)。分值為去掉最高分、最低分后的平均分。這兩個(gè)指標(biāo)均采取百分制。為了簡化實(shí)驗(yàn),不牽涉其他問題,專業(yè)詞匯由專業(yè)詞典提供,不計(jì)入準(zhǔn)確性考察范圍。本實(shí)驗(yàn)建立在知名度較高、應(yīng)用較為廣泛的“百度翻譯”引擎的基礎(chǔ)上,一共對比了10段不同題材的漢譯英翻譯質(zhì)量,每段原文大約為80至120個(gè)漢字。
應(yīng)用“預(yù)處理法”后,漢英機(jī)器翻譯質(zhì)量明顯提升。
表1 利用預(yù)處理法前后機(jī)器翻譯質(zhì)量對比表
機(jī)器翻譯有著廣泛的應(yīng)用前景,技術(shù)進(jìn)步不但需要人工智能專家的算法改進(jìn),還需要語言學(xué)者對語言規(guī)律的深入挖掘。通過本文實(shí)驗(yàn)表明,在漢英機(jī)器翻譯過程中,只需花很短的時(shí)間,用很少的精力對漢語原文進(jìn)行“預(yù)處理”,就可以大幅度地提高翻譯質(zhì)量,得到較為滿意的翻譯結(jié)果。譯文準(zhǔn)確率更高,可讀性更強(qiáng)。對于輔助翻譯的譯者來說,僅需要進(jìn)一步勘誤和加工潤色,即可最大程度地提高翻譯效率,降低翻譯成本。
[1]范文.機(jī)器翻譯.原理、方法與應(yīng)用[J].廣西師范學(xué)院學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版),2015(05):106.
[2]戴新宇,尹存燕,陳家駿等.機(jī)器翻譯研究現(xiàn)狀與展望[J].計(jì)算機(jī)科學(xué),2004,31(11):176-183.
[3]崔啟亮.論機(jī)器翻譯的譯后編輯[J].中國翻譯,2014(06):68-73.
[4]宋廣波,黃月花,趙偉寧.大學(xué)英語筆譯教程[M].長春:吉林大學(xué)出版社,2015.
[5]周光父,高巖杰.論機(jī)器翻譯質(zhì)量的評估[J].上??萍挤g,1989(04):16.
A Study of a Pre-processing Method in Improving the Output Quality of Chinese-English Machine Translation
SONG Guang-bo
(School of Coal Engineering,Shanxi Datong University,Datong Shanxi,037003)
With the development of Machine Translation Technology,more and more people try to apply it to fulfill or help fulfill translation tasks.However,due to the limitations of current technology,Machine Translation suffers from low output quality,with poor accuracy and readability,which in turn limits the application of Machine Translation.This article is based on the theory of“Equivalence of Basic Sentence Patterns”and simplicity principles,as long as a pre-processing method is employed,which is fast and simple,the accuracy and readability of the output can be dramatically improved,which ultimately improves the translation quality in a large scale.This study also provides a new thinking for the development of Machine Translation technology in the perspective of linguistics.
Chinese-English translation;Machine Translation;basic sentence patterns;pre-processing;translation quality
H315.9
A
1674-0882(2016)05-0074-03
2016-06-30
宋廣波(1972-),男,江蘇沭陽人,碩士,講師,研究方向:翻譯理論與實(shí)踐、英美文學(xué)。
〔責(zé)任編輯 裴興榮〕