南菁高級中學(xué)
王 蓉
過去的幾十年,人們運(yùn)用許多理論和實(shí)證研究探索語言風(fēng)格,特別是語言風(fēng)格的定義以及翻譯中的語言風(fēng)格。理論研究上,Leech & Short (1981)、劉振江 (1990)、劉重德 (1991)、 Baker (2000)、Macro (2004)認(rèn)為語言風(fēng)格體現(xiàn)于文本中的語言特征。此外,不少學(xué)者如Nida & Taber (1982)、許鈞(1993)、鄭海凌(2000)探討了翻譯中語言風(fēng)格的重要性、翻譯中語言風(fēng)格對等以及譯者風(fēng)格。實(shí)證研究上,隨著計(jì)算機(jī)技術(shù)的發(fā)展,涌現(xiàn)出許多基于語料的翻譯語言風(fēng)格研究,如Baker(2000),王克非、秦洪武(2009),胡顯耀(2007),徐欣(2010),劉澤權(quán)、陳冬蕾(2010),黃立波(2014),黃立波、朱志瑜(2016),王克非、秦洪武(2015, 2017)等。然而這些研究主要關(guān)注的是翻譯文本與原創(chuàng)文本的語言風(fēng)格對比,很少有研究關(guān)注譯本和原文之間的語言風(fēng)格對比以及不同譯本之間的語言風(fēng)格對比。因此本研究基于前人的研究,借助自建翻譯語料來探索譯本和原文,以及譯本之間的語言風(fēng)格對比。基于語料的翻譯語言風(fēng)格研究主要借助于以下研究指標(biāo):類形比、高頻詞、詞性分布、詞匯密度、平均句長、平均句段長、標(biāo)點(diǎn)等。
類形比(TTR)指特定語料中類符(type)與形符(token)的比率。類符是語料中不同的詞,形符是所有的詞。比如在I am an English teacher and I teach English這句話中,在9個形符中有7個類符。類形比能衡量文本中詞匯的廣度和多樣性。較高的類形比意味著文本詞匯量廣泛,反之則意味著文本使用較有限的詞匯量(Baker 2000: 250)。但是,Biberetal.(1999: 53)指出類形比隨著文本的長度產(chǎn)生變化:較長的文本有更多重復(fù)的詞,因此類形比較低。這種情況下要將標(biāo)準(zhǔn)類形比(STTR)考慮在內(nèi)。標(biāo)準(zhǔn)類形比指的是基于每千字的平均類形比。
詞表(Wordlist)是指按照類符的頻率高低列出的類符表,也叫詞頻表。該表也列出所有類符的詞頻數(shù)(frequency)和在總詞頻數(shù)中所占的百分比(王克非、胡顯耀 2008)。Laviosa (1998)把高頻詞定義為頻率至少占語料0.1%的詞。肖忠華、戴光榮(2010)認(rèn)同0.1%為高頻詞的標(biāo)準(zhǔn),但同時指出高頻詞也取決于語料的大小。通常詞表中前10位、20位、30位的詞會作為高頻詞羅列在語料研究中。
基本上任何語言都包括實(shí)義詞和功能詞。就英語而言,實(shí)義詞包括名詞、實(shí)義動詞、形容詞和副詞(Biberetal.1999: 62);功能詞包括限定詞、代詞、介詞、連詞、助動詞、數(shù)詞(Biberetal.1999: 69)。就中文而言,實(shí)義詞包括名詞、動詞、形容詞、數(shù)量詞;功能詞包括副詞、代詞、介詞、連詞、助動詞和感嘆詞(胡顯耀 2007)。詞匯分布指不同詞性的數(shù)量和比例(Leech & Short 1981)。詞匯密度指的是實(shí)詞占總詞數(shù)的百分比(Baker 1995: 237)。由于實(shí)詞是信息的載體,詞匯密度的差異可以反映信息量的差異(Biberetal.1999: 62)。
關(guān)于標(biāo)點(diǎn)符號,漢英句子的標(biāo)記是句號、感嘆號和問號。漢英句段的標(biāo)志除了句子的標(biāo)記外還有逗號和分號。
本研究以英語小說《苔絲》和張谷若譯本(簡稱張譯本),孫致禮、唐慧心合譯本(簡稱孫譯本),王忠祥、聶珍釗譯本(簡稱王譯本)為研究素材。由于時間的有限性,本文隨機(jī)選取了研究素材中十二章節(jié)的片段作為自建翻譯語料庫。
1) Wordsmith 4.0
Wordsmith 4.0由英國語言學(xué)家Mike Scott研發(fā),用來處理和分析數(shù)據(jù),功能包括Wordlist、Concord、Viewer & Aligner等。具體說來,Wordlist可以提供文本的類符數(shù)、形符數(shù)、TTR、高頻詞,concord可以提供某個詞所在的語境,Viewer & Aligner可以根據(jù)句法標(biāo)記建立原文和譯本的平行語料。
2) Treetagger
Treetagger由Helmut Schmid研發(fā),用來對英語文本進(jìn)行詞性賦碼,賦碼集包括名詞、動詞、形容詞、副詞、介詞、連詞等。Treetagger在詞性附碼上的準(zhǔn)確率可達(dá)96%~97% (梁茂成等 2010)。
3) ICTCLAS
ICTCLAS是由中國科學(xué)院計(jì)算技術(shù)研究所研發(fā)的對中文文本進(jìn)行詞性賦碼的軟件。經(jīng)過測試和改善,該軟件的分詞準(zhǔn)確率可達(dá)98.13%,詞性賦碼準(zhǔn)確率可達(dá)94.63% (肖忠華、戴光榮 2010)。
首先,筆者將收集的語料進(jìn)行人工檢查,分別用Treetagger和ICTCLAS對英漢語料進(jìn)行詞性賦碼,并進(jìn)行檢查,將準(zhǔn)確率進(jìn)一步提高。最后采用Wordsmith軟件對賦碼前后的數(shù)據(jù)進(jìn)行統(tǒng)計(jì),同時也借助word、excel進(jìn)行輔助統(tǒng)計(jì)。
1) 原文和譯文之間的語言風(fēng)格是否一致?
2) 譯文之間的語言風(fēng)格是否一致?
表1 英語原文和三譯本間的類形比
如表1所示,各譯本的形符數(shù)明顯高于英語原文。這種文本長度的擴(kuò)張是源于翻譯過程中的顯化(黃立波 2007)。具體說來,顯化指譯者常通過增加補(bǔ)充性詞、短語等將原文隱含的信息明晰化或者清除原文模棱兩可的信息。各譯本的類符數(shù)略高于英語原文。此外,就TTR和STTR而言,英語原文高于張譯本和王譯本,而低于孫譯本。我們可以推斷張譯本和王譯本可能沒有英語原文的詞匯豐富。
三譯本間,就形符數(shù)而言,張譯本最高,孫譯本最低。這表明,張譯本的顯化最為明顯。就類符數(shù)、TTR、STTR值而言,都是孫譯本最高,王譯本最低。據(jù)以往實(shí)證研究,這一系列數(shù)據(jù)表明,孫譯本的詞匯量較其他兩個譯本最大。換言之,孫譯本的詞匯比其他兩個譯本豐富。
本文研究英語原文和三譯本前30位高頻詞。限于篇幅,下頁表2中僅羅列了前10位高頻詞。如表2所示,英語原文的高頻詞主要為功能詞,特別是冠詞、代詞、介詞。定冠詞the為英語原文中使用最多的詞。前30位高頻詞中出現(xiàn)了9個代詞her、I、it、she、you、he、his、they、which,其中her是用得最多的代詞;出現(xiàn)了8個介詞,前3位為of、to、in;唯一出現(xiàn)的名詞為Tess。漢譯本中,前30位高頻詞以功能詞為主,其中代詞“她”位列前5高頻詞,對應(yīng)英文原文中her、she的高頻使用。高頻詞中“一”“在”“苔絲”等詞主要取決于英語原文中a、in、Tess的廣泛使用??傊?,漢譯本中高頻詞主要對應(yīng)英語原文高頻詞。
三譯本的高頻詞有相似點(diǎn)。首先,三譯本前10位高頻詞相同,只是順序上有些差異。此外,前30位高頻詞也幾乎是功能詞,特別是代詞。張譯本、孫譯本、王譯本前30位高頻詞的比例分別為35.13%、 32.82%、 37.05%,相較于漢語原創(chuàng)文本LCMC(N)*LCMC(N)即“蘭卡斯特現(xiàn)代漢語語料庫小說語料庫”(Narrative Prose Section of Lancaster Corpus of Mandarin Chinese)。前30位高頻詞比例31.89%高出很多。對于同等個數(shù)的高頻詞來說,比例越高表明這些高頻詞在文本中重復(fù)使用得越多。換句話說,譯者在進(jìn)行英漢翻譯時,有意或無意地重復(fù)使用了較少數(shù)量的常用詞,使文本獨(dú)特性減少,文本難度降低,可接受性提高,被稱為翻譯過程中的簡化現(xiàn)象(王克非、胡顯耀 2008)。三譯本前30位高頻詞也各有自己的特色。張譯本比其他兩個譯本使用更多的副詞,比如“都”“不”的使用。進(jìn)一步研究顯示,張譯本傾向于添加副詞表示強(qiáng)調(diào)和顯化,也喜歡用漢語否定方式去翻譯英語的肯定表達(dá),如翻譯perfect和simple時,張譯本用到“無一不備”“不事鋪張”。此外,張譯本中“把”字使用得最多,常常用“把”字結(jié)構(gòu)來翻譯英語的動詞短語,如翻譯fix eyes on時,張譯本用“把眼睛瞅著”,其他兩個譯本則直接用了“盯著”“望著”。就孫譯本而言,代詞數(shù)量明顯低于其他兩個譯本,特別是“她”“我”“他”這些人稱代詞。進(jìn)一步統(tǒng)計(jì)顯示,孫譯本傾向于用人名去翻譯英語人稱代詞,名詞“苔絲”的頻繁使用正好印證了這一點(diǎn)。王譯本中“的”的出現(xiàn)頻率明顯高于其他兩個譯本,比孫譯本和張譯本分別高出300多次和150多次。進(jìn)一步研究發(fā)現(xiàn),王譯本傾向于使用中文“……的”定語結(jié)構(gòu)來翻譯英語中的限定成分,例如,翻譯一系列形容詞spectral、 half-compounded、 aqueous時,王譯本用了3個“……的”結(jié)構(gòu)(“半明半暗的、明暗混合的、帶著水汽的”);孫譯本用了1個“……的”結(jié)構(gòu)(“一片幽渺凄迷、半明半暗的曉光霧氣”);張譯本未用“……的”結(jié)構(gòu)(“一片幽渺﹑凄迷,曉光霧氣,氤氳不分”)。
表2 英語原文和三譯本前10位高頻詞
上文討論過,漢譯本的形符數(shù)都超過原文,呈現(xiàn)顯化現(xiàn)象。如下頁表3所示,漢譯本動詞、名詞、形容詞、副詞、代詞和數(shù)詞都超過英語原文。這表明顯化主要體現(xiàn)在這些詞性上。進(jìn)一步研究發(fā)現(xiàn),在英漢翻譯過程中,除了詞性對等外,漢譯本中上述詞性的增加主要來源于詞性轉(zhuǎn)換和詞匯添加。如例(1)所示,三譯本中的動詞如“埋”“刻”“躺”“罩”轉(zhuǎn)換自英語原文中的介詞at、in、with、under。孫譯本和王譯本中還添加了動詞“雕成”“用……做成”來闡釋Purbeckmarble。此外,英語原文的介詞和連詞遠(yuǎn)超過漢譯本。研究發(fā)現(xiàn),由于英漢兩種語言的差異,在英譯漢時,英語介詞通常有3種處理方式:轉(zhuǎn)化成漢語動詞、轉(zhuǎn)換成漢語連詞和省略不譯(連淑能 2006: 158)。這就解釋了漢譯本介詞數(shù)明顯少于原文。由于英漢句法上的差異,英語重形合而漢語重意合,英語多借助連詞去連接字詞句,而漢語多使用緊縮句、四字結(jié)構(gòu)、重復(fù)、對偶、排比等修辭手法來表明句子之間的聯(lián)系。因此,英語大部分連詞會在翻譯過程中省略。
(1) At Kingsbere-sub-Greenhill: rows and rows of you in your vaults, with your effigies under Purbeckmarble canopies.
(Hardy 2007: 7)
張譯本:埋在綠山下的王陴。那兒的地下拱頂墓室里,你們家的墳一行一行的,墳上面刻著石像,罩著培白玉華蓋。
(哈代 1984: 17)
孫譯本:埋在青山下的金斯比爾。一排又一排地躺在墓穴里,波倍克大理石雕成的華蓋下面,還有他們的雕像呢。
(哈代 2000: 2)
王譯本:埋在青山下的金斯比爾,一排一排地埋在你們家族的地下墓室里,在用佩比克大理石做成的華蓋下面,還刻有你們祖先的雕像。
(哈代 2006: 5)
張譯本中幾乎各詞性形符數(shù)都最高,孫譯本幾乎各詞性形符數(shù)都最低。進(jìn)一步研究顯示,張譯本傾向于通過添加詞匯來使原文信息明晰化或是表示強(qiáng)調(diào)。如例(2)所示,張譯本增添了6個詞,其中“現(xiàn)在”“已往”來強(qiáng)調(diào)時間;“心里”用來闡釋原文的relief,“教堂”“里”用來使stand up的背景信息更為清楚。孫譯本和王譯本分別添加了1個詞和4個詞。就詞匯密度而言,張譯本為55.77%,孫譯本為58.48%,王譯本為56.08%。筆者再次比較漢語翻譯文本和漢語原創(chuàng)文本,發(fā)現(xiàn)三譯本的詞匯密度均低于漢語原創(chuàng)文本LCMC(N)的詞匯密度59.15%。翻譯小說的詞匯密度較低,或者說,同樣長度的翻譯小說的實(shí)詞數(shù)量少于非翻譯小說,說明從詞語總體特征來看,翻譯小說存在詞語使用的簡化特征,即試圖通過降低實(shí)詞所提供的信息量來降低譯文的難度,從而提高其可接受性(胡顯耀 2007:217)。三譯本中,孫譯本的詞匯密度最高,特別是名詞、動詞、形容詞和數(shù)量詞的比例。從這個角度看,在同樣長度的文本中,孫譯本的信息量比其他兩個譯本多。正如表1所示,孫譯本的確用了最少的形符數(shù)去翻譯同樣內(nèi)容的原文。
(2) But to know that things were in train was an immense relief to Tess notwithstanding, who had well-nigh feared that somebody would stand up and forbid the banns on the ground of her history.
(Hardy 2007: 223)
張譯本:苔絲現(xiàn)在知道了一切都妥當(dāng)齊備,心里就不知輕松了多少;她本來還幾乎害過怕,惟恐有人在教堂里站起來,根據(jù)她已往的歷史,反對她的結(jié)婚通告?,F(xiàn)在不用怕這一層了。
(哈代 1984: 309)
孫譯本:不過,苔絲得知一切都安排妥當(dāng),心里不禁如釋重負(fù)。她本來還有點(diǎn)害怕,擔(dān)心有人聽了結(jié)婚公告,會端出她的底細(xì),反對這門婚事。
(哈代 2000: 141)
王譯本:既然知道一切已準(zhǔn)備就緒,苔絲也就完全放下心來了,本來她就有些害怕有人在教堂里站起來,揭露她過去的歷史,反對結(jié)婚通告。
(哈代 2006: 256)
表3 英語原文和三譯本詞性分布
如表4所示,漢譯本的句數(shù)略高于英語原文。由此推斷,漢譯本基本遵循原文的句法標(biāo)記,只有細(xì)微的變動。漢譯本平均句長略高于英語原文,主要取決于漢譯本的形符數(shù)超過英語原文。三譯本中,張譯本的平均句長最長,主要取決于該譯本的形符數(shù)最大;孫譯本的平均句長最短,取決于該譯本的形符數(shù)最低,句數(shù)最多。此外,漢譯本的句段數(shù)明顯高于英語原文。這表明在英譯漢中,斷句策略很常見。筆者進(jìn)一步統(tǒng)計(jì)了標(biāo)點(diǎn)使用情況,漢譯本的逗號使用明顯超過了英語原文。原文有774個逗號,張、孫、王譯本逗號數(shù)分別為1496、1273、1155個。由于英漢差異,英語是“樓房建筑法”,常借助于介詞、從屬連詞、關(guān)系代詞去構(gòu)建長句或者從屬結(jié)構(gòu);而漢語是“流水記事法”,采用并列結(jié)構(gòu)、松散句、緊縮句、省略句、流水句、并列形式的復(fù)句去構(gòu)建短句(連淑能 2006: 49)。因此,受漢語影響,譯者普遍采用斷句去處理英語長句。三譯本中,張譯本的平均句段長最小,王譯本的平均句段長最高。對標(biāo)點(diǎn)統(tǒng)計(jì)發(fā)現(xiàn),張譯本的逗號和分號數(shù)目均是三譯本中最高的。如例(3)所示,在翻譯原文的長句時,張譯本有4個句段,該譯本擅長斷句,在英語原文in、as、of的地方斷句,因此句段數(shù)最短,易于讀者閱讀。孫譯本也在in的地方斷句,并加上“這”作為連接。王譯本則沒有斷句,使句子比其他兩個譯本難處理。秦洪武(2010)指出翻譯質(zhì)量好壞的一個指標(biāo)是句段長度而不是句子長度;上乘的譯本能更好地控制句段數(shù)。從這個角度看,張譯本略勝一籌。
(3) There was no exaggeration in Marian’s definition of Flintcomb-Ash farm as a starve-acre place.
(Hardy 2007: 308)
張譯本:瑪琳說棱窟槐這個地方,只是一片窮山, 這種形容, 一點(diǎn)也不過分。
(哈代 1984: 420)
孫譯本:瑪麗安把弗林庫姆阿什農(nóng)場說成不毛之地, 這并非言過其實(shí)。
(哈代 2000: 195)
王譯本:瑪麗安把這個地方叫作饑餓的土地并沒有夸張。
(哈代 2006: 353)
表4 英語原文與三譯本平均句長和句段長
由于英漢差異,英語原文和漢譯本語言風(fēng)格存在差異。漢譯本形符數(shù)明顯超過英語原文,主要體現(xiàn)在動詞、名詞、副詞、數(shù)詞上。漢譯本傾向于添加實(shí)詞使原文的信息更加明晰化。英語原文的連詞和介詞超過漢譯本。在英譯漢過程中,這些詞通常會被省略或進(jìn)行詞性轉(zhuǎn)化。英語原文和漢譯本的高頻詞基本對應(yīng)。漢譯本的平均句長高于英語原文,平均句段長低于英語原文,前者是由于漢譯本的形符數(shù)明顯高于英語原文,后者是由于漢譯本的句段數(shù)明顯高于英語原文。漢譯本傾向于在翻譯英語長句時用逗號、頓號、分號斷句,使句子易于為讀者所接受。
三譯本的語言風(fēng)格存在異同。三譯本普遍存在顯化和簡化現(xiàn)象:顯化體現(xiàn)在各譯本形符數(shù)均比原文多;簡化體現(xiàn)在譯本較之原創(chuàng)文本高頻詞比例高、詞匯密度低;較之英語原文平均句段長較低。不同譯本也體現(xiàn)了各自的語言風(fēng)格。張譯本的形符數(shù)最大,平均句長最長,平均句段最短,詞匯密度最低;孫譯本的形符數(shù)最小,平均句長最短,類形比、詞匯密度最高,高頻詞重復(fù)率最低;王譯本的平均句段最長,類形比最低,高頻詞重復(fù)率最高。
基于本研究,本文對翻譯研究與教學(xué)有以下啟示。1)基于語料庫的語言風(fēng)格分析模式中,類形比、高頻詞、詞匯密度、詞性分布、平均句長、平均句段長等是量化分析的重要參數(shù)。這些參數(shù)讓研究者能從多個角度研究翻譯中的語言風(fēng)格。較之傳統(tǒng)的翻譯研究,基于語料庫的譯本分析為研究譯本之間、譯本和原文之間的語言風(fēng)格提供了更加客觀和全面的研究平臺。2)英漢平行語料庫能夠讓研究者發(fā)現(xiàn)英漢之間的差異,比如句式上英語重形合、漢語重意合;用詞上,英語更多使用名詞、形容詞、介詞等;漢語更多使用動詞、副詞等。此外,英漢平行語料庫有助于找出譯文間的差異,比如譯者對原文中詞與句式的不同處理方式。具體而言,對于英語的長句,有些譯者過多依賴修飾成分前置來鋪排句式,降低了句子的可接受度,而另一些譯者擅長采用斷句策略去縮小譯本句段長度,減輕讀者的認(rèn)知負(fù)擔(dān)。因此,英漢平行語料庫便于研究者在多譯本間篩選出較為上乘的譯作。3)教師可以利用該研究指導(dǎo)學(xué)生避免可能出現(xiàn)的“翻譯腔”,比如說在英譯漢中控制譯文功能詞的使用和句段長度;此外,教師也可以通過例子讓學(xué)生熟悉翻譯中的詞性轉(zhuǎn)換。在英譯漢中,譯文和原文不一定完全達(dá)到詞性一致,而是要根據(jù)實(shí)際情況采取多種策略,比如添加、省略、詞性轉(zhuǎn)換等。