◎周 央
(河北工業(yè)大學(xué) 天津 300400)
《孟子》記錄了戰(zhàn)國時(shí)期儒家代表人物孟子的言行,這部儒家經(jīng)典體現(xiàn)了中國的傳統(tǒng)文化。研究《孟子》英譯本有助于全面系統(tǒng)地傳播儒家文化(楊伯峻,1999)。諸多翻譯家如柯大衛(wèi)(David Collie)、理雅各(James Legge)、倫納德·賴發(fā)洛(Leonard A.Lyall)和劉殿爵(D.C.Lau)等皆對《孟子》進(jìn)行了翻譯?;诒姸唷睹献印纷g本,翻譯界的研究成果層出不窮,研究角度也不斷更新。然而,目前翻譯界對《孟子》英譯本的研究以主觀分析為主,缺乏有力的客觀數(shù)據(jù)的支持。本文旨在使用語料庫技術(shù)和自然語言處理(NLP)技術(shù),借助Python提供數(shù)據(jù)分析,基于類符/形符比、詞頻排序、語篇相似性度量、詞云圖等多個(gè)指標(biāo)對《孟子》的三個(gè)代表性譯本進(jìn)行對比分析。
當(dāng)下,《孟子》的翻譯版本眾多,翻譯界也不斷嘗試從各種角度對其進(jìn)行研究。在中國知網(wǎng)(CNKI)文獻(xiàn)檢索可視化平臺中,筆者以“《孟子》英譯本”作為關(guān)鍵詞進(jìn)行檢索,其共現(xiàn)矩陣分析結(jié)果顯示:在所查詢到的48篇相關(guān)論文的主題詞統(tǒng)計(jì)中,“《孟子》”和“比較研究”兩個(gè)詞條的共現(xiàn)數(shù)字最大,為6;其主要主題分布圖顯示,這一主題詞下的研究方向集中在典籍英譯、讀者接受、比較研究、生態(tài)翻譯學(xué)等。對以上文獻(xiàn)進(jìn)行分類整理后發(fā)現(xiàn),目前以《孟子》英譯為主題的研究具有以下幾個(gè)特點(diǎn):①以《孟子》英譯為主題的研究已經(jīng)有一定成果,譯學(xué)界對此類研究有一定關(guān)注度;②近些年譯學(xué)界不斷嘗試從各種角度對《孟子》英譯本進(jìn)行研究。早期譯學(xué)界主要從典籍英譯的視角分析譯本,后來衍生出跨學(xué)科的研究方向,出現(xiàn)了語料庫技術(shù)等諸多研究角度。相應(yīng)的翻譯策略也隨之產(chǎn)生,研究方法也不斷更新——從早先的主觀分析逐漸轉(zhuǎn)向客觀指標(biāo)分析等。③得益于《孟子》的諸多譯本,許多研究者仍關(guān)注多譯本對比研究。在上述57篇對于《孟子》的譯本研究中,多譯本對比研究位列主題分布項(xiàng)前五。
從檢索結(jié)果來看,基于語料庫的《孟子》譯本對比研究相關(guān)文章僅3篇,其中僅1篇是關(guān)于《孟子》譯本的對比分析。
孫婷婷(2013)基于語料庫,以大衛(wèi)·亨頓(David Hinton)所翻譯的《孟子》英譯本為對象,對主語省略句這一語法現(xiàn)象進(jìn)行了研究。作者對六類主語省略句的原文及譯文進(jìn)行統(tǒng)計(jì)分析后指出,盡管主語省略在《孟子》原文及其英譯本中都存在,但是原文中的主語省略句數(shù)量遠(yuǎn)遠(yuǎn)超出于其英譯本。
金紫薇(2014)將語料庫和普通語言學(xué)相結(jié)合,即結(jié)合語言系統(tǒng)內(nèi)和系統(tǒng)外證據(jù),對《孟子》一書中有待商榷的若干詞語釋義做出解釋與論證。
王英強(qiáng)(2020)基于劉殿爵和理雅各《孟子》譯本對比語料庫,從詞匯、句式和語篇層面,以及譯本詞匯豐富度、平均詞長和語篇可讀性角度對兩譯本進(jìn)行翻譯風(fēng)格對比研究。
在語料庫翻譯對比研究領(lǐng)域已有諸多論文,但這些論文往往基于主觀分析,沒有客觀數(shù)據(jù)作為支撐,從而無法全面揭示譯本的復(fù)雜特征。本文借助編程語言Python,增加類符/形符比、詞頻排序、語篇相似性度量、詞云圖等指標(biāo),來對不同譯本的特色進(jìn)行更加客觀具體的描述。
本文以《孟子》三個(gè)英譯本為對比研究對象,數(shù)據(jù)來源于對理雅各、賴發(fā)洛、劉殿爵三個(gè)英文譯本的分析。具體信息如表1所示。
表1 譯本出版信息
本文以文本分析為主線,調(diào)用Python相應(yīng)的庫和模塊,實(shí)現(xiàn)語料庫技術(shù)和自然語言處理(NLP)技術(shù)在譯本對比分析中的應(yīng)用。文本分析是NLP要完成的重要任務(wù),而Python及其第三方庫(常用的幾個(gè)第三方庫包括:NLTK、 Pattern、 gensim、 TextBlob 和 spaCy)可以幫助解決文本分析中的具體問題;文本處理與理解、文本分類、文本相似度計(jì)算等都是常見的文本分析類型。本文采用的指標(biāo)包括:類符/形符比、詞頻排序、語篇相似性度量、詞云圖。
《孟子》三個(gè)譯本中各自詞匯的豐富程度可以通過文本詞匯的類符/形符比表示,用以說明詞匯變化和豐富程度。使用Python調(diào)用相應(yīng)的庫和模塊對數(shù)據(jù)進(jìn)行處理,《孟子》三個(gè)譯本中各自的類符/形符比的結(jié)果如表2所示。
表2 譯本詞匯豐富度
由表2可知,理雅各譯本的類符處于中等位置,形符處于中等位置;賴發(fā)洛譯本類符位置靠后、形符位置也靠后;劉殿爵譯本形符位置靠前。但我們從類符/形符比這一欄中可以看到,理雅各譯本的指標(biāo)明顯高于其他兩個(gè)譯本。我們結(jié)合譯本中的句子分析,理雅各譯本的平均句長指標(biāo)高,譯本詞匯豐富度較高,用詞變化性較大。而在這三個(gè)譯本中,賴發(fā)洛譯本平均句長指標(biāo)低,譯本整體詞匯豐富度較低,用詞變化性較小。
清除停用詞后高頻詞出現(xiàn)的頻次可以反映《孟子》三個(gè)不同譯本間的主題相似度。使用Python調(diào)用相應(yīng)的庫和模塊來對數(shù)據(jù)進(jìn)行處理,繼而分別對《孟子》三個(gè)譯本中排名前七的高頻詞的出現(xiàn)頻次進(jìn)行統(tǒng)計(jì),結(jié)果如下。為直觀呈現(xiàn)數(shù)據(jù),相同高頻詞用黑體標(biāo)注。
由表3所示,相較其他譯本而言,理雅各譯本高頻詞獨(dú)特,主題突出;排名第二的是劉殿爵譯本。由此可以看出,理雅各譯本和劉殿爵譯本的主題突出,用詞獨(dú)特性較高。究其原因,翻譯方法和策略的不同是其中一條。賴發(fā)洛譯本和劉殿爵譯本的高頻詞比較相似,兩個(gè)譯本甚至使用了許多重復(fù)詞語,這表明賴發(fā)洛譯本和劉殿爵兩個(gè)譯本主題相類似。
表3 三個(gè)譯本高頻詞比較
本研究使用Python調(diào)用相應(yīng)的庫和模塊,對于三個(gè)譯本的總體相似度進(jìn)行了統(tǒng)計(jì)分析,數(shù)值差距越小相似度越高。結(jié)果如表4所示。
表4 譯本總體相似度
結(jié)果顯示,理雅各譯本同賴發(fā)洛譯本和劉殿爵譯本的差異性都較大,賴發(fā)洛譯本與劉殿爵譯本相似度較高。這一結(jié)果與表3的結(jié)果也基本吻合。
相較于高頻詞對比,詞云圖可以更加直觀地展示主題詞出現(xiàn)的頻次。使用Python調(diào)用相應(yīng)的庫和模塊,得到《孟子》三個(gè)譯本的詞云圖。字體大小和單詞位置內(nèi)外分別代表主題詞出現(xiàn)的頻次高低。以下三張圖為三個(gè)譯本的詞云展示。
圖1 理譯本圖
圖2 賴譯本圖
圖3 劉譯本圖
通過《孟子》三個(gè)譯本的詞云圖可以看出,在理雅各、賴發(fā)洛和劉殿爵三人各自的譯本中,除停用詞以外的具有實(shí)際意義的詞匯有著不同的體現(xiàn),但在總體上保持了字體大小和單詞位置內(nèi)外的一致。從這一結(jié)果可以看出,理雅各、賴發(fā)洛和劉殿爵都做到了忠實(shí)于原始材料,凸顯出原文的中心思想。詞云圖中字體大小和單詞位置內(nèi)外與上述表格中呈現(xiàn)的數(shù)據(jù)相吻合,是對上述結(jié)論很好的驗(yàn)證。
基于本文對《孟子》英譯本的對比研究,可以得出以下推斷:
整體看來,三個(gè)譯本中,理雅各譯本的詞匯豐富度較高,用詞變化性較大。究其原因,理雅各譯本由十九世紀(jì)的書面語體英文寫成,洋溢著濃厚的學(xué)術(shù)氣息。賴發(fā)洛譯本整體詞匯豐富度較低,用詞變化性較小。究其原因,賴發(fā)洛始終把普通讀者的接受能力放在首要考慮的位置,以激發(fā)他們的閱讀興趣和方便他們理解為己任,因而譯本更顯通俗性。而劉殿爵的《孟子》英譯本詞匯豐富度適中,是學(xué)術(shù)性和通俗性的完美結(jié)合(劉單平,2011)。
三個(gè)譯本中,理雅各譯本的高頻詞最獨(dú)特,可以說明譯者在翻譯《孟子》時(shí),不僅把握住了原文的主旨和思想,而且依據(jù)不同的翻譯原則,選擇了不同的翻譯方法和策略。理雅各在翻譯時(shí),“一直關(guān)注對原文的忠實(shí),而非行文的雅致。他每治一經(jīng),必先廣泛搜集歷代評注,詳加對比、分析,在此基礎(chǔ)上做出自己的判斷?!保ㄍ踺x,2003)
同其他譯本相比,理雅各譯本中高頻詞的相似度較低,說明譯者依據(jù)不同的翻譯原則,選擇了不同的翻譯方法和策略來翻譯特定高頻詞如書名和地名等。
在詞云維度上,理雅各、賴發(fā)洛和劉殿爵三位譯者的《孟子》英譯本的差別不大,都做到了忠實(shí)于原文。
本文基于理雅各、賴發(fā)洛、劉殿爵三位譯者的《孟子》英譯本,使用程序設(shè)計(jì)語言Python,基于語料庫,從詞匯豐富度、主題詞、文本相似度和詞云四個(gè)維度出發(fā),通過類符/形符比、詞頻排序、語篇相似性度量和詞云圖四個(gè)指標(biāo)分析了這些譯本的相似點(diǎn)與不同之處。三個(gè)譯本中理雅各譯本詞匯豐富度高;賴發(fā)洛、劉殿爵譯本詞匯豐富度較低。從譯本的高頻詞對比角度而言,理雅各譯本高頻詞與其他兩個(gè)譯本的重合率較低,獨(dú)特性最高;賴發(fā)洛譯本與其他兩個(gè)譯本的重合率較高,高頻詞獨(dú)特性最低。從主題詞角度而言,賴發(fā)洛、劉殿爵譯本主題詞相似性高,理雅各譯本主題詞差異性大。從詞云角度而言,三個(gè)譯本呈現(xiàn)較為一致的結(jié)果。本文使用Python調(diào)用相應(yīng)的庫和模塊,利用客觀數(shù)據(jù)對《孟子》的三個(gè)譯本進(jìn)行了對比研究。以往的譯本對比分析大都以主觀分析為依據(jù),相比較而言,本文增添了以客觀數(shù)據(jù)為基礎(chǔ)的指標(biāo)分析,角度更為新穎,結(jié)論更加有力,同時(shí)也有利于其他學(xué)者繼續(xù)使用Python進(jìn)行語料庫方面的譯本對比研究。