基于語料庫的《孟子》譯本對比研究

2022-11-21 02:58◎周央

今古文創(chuàng) 2022年44期

◎周央

（河北工業(yè)大學(xué) 天津 300400）

《孟子》記錄了戰(zhàn)國時(shí)期儒家代表人物孟子的言行，這部儒家經(jīng)典體現(xiàn)了中國的傳統(tǒng)文化。研究《孟子》英譯本有助于全面系統(tǒng)地傳播儒家文化（楊伯峻，1999）。諸多翻譯家如柯大衛(wèi)（David Collie）、理雅各（James Legge）、倫納德·賴發(fā)洛（Leonard A.Lyall）和劉殿爵（D.C.Lau）等皆對《孟子》進(jìn)行了翻譯?；诒姸唷睹献印纷g本，翻譯界的研究成果層出不窮，研究角度也不斷更新。然而，目前翻譯界對《孟子》英譯本的研究以主觀分析為主，缺乏有力的客觀數(shù)據(jù)的支持。本文旨在使用語料庫技術(shù)和自然語言處理（NLP）技術(shù)，借助Python提供數(shù)據(jù)分析，基于類符/形符比、詞頻排序、語篇相似性度量、詞云圖等多個(gè)指標(biāo)對《孟子》的三個(gè)代表性譯本進(jìn)行對比分析。

一、文獻(xiàn)綜述

（一）《孟子》英譯本研究

當(dāng)下，《孟子》的翻譯版本眾多，翻譯界也不斷嘗試從各種角度對其進(jìn)行研究。在中國知網(wǎng)（CNKI）文獻(xiàn)檢索可視化平臺中，筆者以“《孟子》英譯本”作為關(guān)鍵詞進(jìn)行檢索，其共現(xiàn)矩陣分析結(jié)果顯示：在所查詢到的48篇相關(guān)論文的主題詞統(tǒng)計(jì)中，“《孟子》”和“比較研究”兩個(gè)詞條的共現(xiàn)數(shù)字最大，為6；其主要主題分布圖顯示，這一主題詞下的研究方向集中在典籍英譯、讀者接受、比較研究、生態(tài)翻譯學(xué)等。對以上文獻(xiàn)進(jìn)行分類整理后發(fā)現(xiàn)，目前以《孟子》英譯為主題的研究具有以下幾個(gè)特點(diǎn)：①以《孟子》英譯為主題的研究已經(jīng)有一定成果，譯學(xué)界對此類研究有一定關(guān)注度；②近些年譯學(xué)界不斷嘗試從各種角度對《孟子》英譯本進(jìn)行研究。早期譯學(xué)界主要從典籍英譯的視角分析譯本，后來衍生出跨學(xué)科的研究方向，出現(xiàn)了語料庫技術(shù)等諸多研究角度。相應(yīng)的翻譯策略也隨之產(chǎn)生，研究方法也不斷更新——從早先的主觀分析逐漸轉(zhuǎn)向客觀指標(biāo)分析等。③得益于《孟子》的諸多譯本，許多研究者仍關(guān)注多譯本對比研究。在上述57篇對于《孟子》的譯本研究中，多譯本對比研究位列主題分布項(xiàng)前五。

（二）語料庫與《孟子》英譯本研究

從檢索結(jié)果來看，基于語料庫的《孟子》譯本對比研究相關(guān)文章僅3篇，其中僅1篇是關(guān)于《孟子》譯本的對比分析。

孫婷婷（2013）基于語料庫，以大衛(wèi)·亨頓（David Hinton）所翻譯的《孟子》英譯本為對象，對主語省略句這一語法現(xiàn)象進(jìn)行了研究。作者對六類主語省略句的原文及譯文進(jìn)行統(tǒng)計(jì)分析后指出，盡管主語省略在《孟子》原文及其英譯本中都存在，但是原文中的主語省略句數(shù)量遠(yuǎn)遠(yuǎn)超出于其英譯本。

金紫薇（2014）將語料庫和普通語言學(xué)相結(jié)合，即結(jié)合語言系統(tǒng)內(nèi)和系統(tǒng)外證據(jù)，對《孟子》一書中有待商榷的若干詞語釋義做出解釋與論證。

王英強(qiáng)（2020）基于劉殿爵和理雅各《孟子》譯本對比語料庫，從詞匯、句式和語篇層面，以及譯本詞匯豐富度、平均詞長和語篇可讀性角度對兩譯本進(jìn)行翻譯風(fēng)格對比研究。

在語料庫翻譯對比研究領(lǐng)域已有諸多論文，但這些論文往往基于主觀分析，沒有客觀數(shù)據(jù)作為支撐，從而無法全面揭示譯本的復(fù)雜特征。本文借助編程語言Python，增加類符/形符比、詞頻排序、語篇相似性度量、詞云圖等指標(biāo)，來對不同譯本的特色進(jìn)行更加客觀具體的描述。

二、Python文本分析

（一）英譯本來源

本文以《孟子》三個(gè)英譯本為對比研究對象，數(shù)據(jù)來源于對理雅各、賴發(fā)洛、劉殿爵三個(gè)英文譯本的分析。具體信息如表1所示。

表1 譯本出版信息

（二）研究工具及方法

本文以文本分析為主線，調(diào)用Python相應(yīng)的庫和模塊，實(shí)現(xiàn)語料庫技術(shù)和自然語言處理（NLP）技術(shù)在譯本對比分析中的應(yīng)用。文本分析是NLP要完成的重要任務(wù)，而Python及其第三方庫（常用的幾個(gè)第三方庫包括：NLTK、 Pattern、 gensim、 TextBlob 和 spaCy）可以幫助解決文本分析中的具體問題；文本處理與理解、文本分類、文本相似度計(jì)算等都是常見的文本分析類型。本文采用的指標(biāo)包括：類符/形符比、詞頻排序、語篇相似性度量、詞云圖。

（三）詞匯豐富度對比

《孟子》三個(gè)譯本中各自詞匯的豐富程度可以通過文本詞匯的類符/形符比表示，用以說明詞匯變化和豐富程度。使用Python調(diào)用相應(yīng)的庫和模塊對數(shù)據(jù)進(jìn)行處理，《孟子》三個(gè)譯本中各自的類符/形符比的結(jié)果如表2所示。

表2 譯本詞匯豐富度

由表2可知，理雅各譯本的類符處于中等位置，形符處于中等位置；賴發(fā)洛譯本類符位置靠后、形符位置也靠后；劉殿爵譯本形符位置靠前。但我們從類符/形符比這一欄中可以看到，理雅各譯本的指標(biāo)明顯高于其他兩個(gè)譯本。我們結(jié)合譯本中的句子分析，理雅各譯本的平均句長指標(biāo)高，譯本詞匯豐富度較高，用詞變化性較大。而在這三個(gè)譯本中，賴發(fā)洛譯本平均句長指標(biāo)低，譯本整體詞匯豐富度較低，用詞變化性較小。

（四）采用高頻詞對比

清除停用詞后高頻詞出現(xiàn)的頻次可以反映《孟子》三個(gè)不同譯本間的主題相似度。使用Python調(diào)用相應(yīng)的庫和模塊來對數(shù)據(jù)進(jìn)行處理，繼而分別對《孟子》三個(gè)譯本中排名前七的高頻詞的出現(xiàn)頻次進(jìn)行統(tǒng)計(jì)，結(jié)果如下。為直觀呈現(xiàn)數(shù)據(jù)，相同高頻詞用黑體標(biāo)注。

由表3所示，相較其他譯本而言，理雅各譯本高頻詞獨(dú)特，主題突出；排名第二的是劉殿爵譯本。由此可以看出，理雅各譯本和劉殿爵譯本的主題突出，用詞獨(dú)特性較高。究其原因，翻譯方法和策略的不同是其中一條。賴發(fā)洛譯本和劉殿爵譯本的高頻詞比較相似，兩個(gè)譯本甚至使用了許多重復(fù)詞語，這表明賴發(fā)洛譯本和劉殿爵兩個(gè)譯本主題相類似。

表3 三個(gè)譯本高頻詞比較

（五）譯本相似度對比

本研究使用Python調(diào)用相應(yīng)的庫和模塊，對于三個(gè)譯本的總體相似度進(jìn)行了統(tǒng)計(jì)分析，數(shù)值差距越小相似度越高。結(jié)果如表4所示。

表4 譯本總體相似度

結(jié)果顯示，理雅各譯本同賴發(fā)洛譯本和劉殿爵譯本的差異性都較大，賴發(fā)洛譯本與劉殿爵譯本相似度較高。這一結(jié)果與表3的結(jié)果也基本吻合。

（六）詞云圖對比

相較于高頻詞對比，詞云圖可以更加直觀地展示主題詞出現(xiàn)的頻次。使用Python調(diào)用相應(yīng)的庫和模塊，得到《孟子》三個(gè)譯本的詞云圖。字體大小和單詞位置內(nèi)外分別代表主題詞出現(xiàn)的頻次高低。以下三張圖為三個(gè)譯本的詞云展示。

圖1 理譯本圖

圖2 賴譯本圖

圖3 劉譯本圖

通過《孟子》三個(gè)譯本的詞云圖可以看出，在理雅各、賴發(fā)洛和劉殿爵三人各自的譯本中，除停用詞以外的具有實(shí)際意義的詞匯有著不同的體現(xiàn)，但在總體上保持了字體大小和單詞位置內(nèi)外的一致。從這一結(jié)果可以看出，理雅各、賴發(fā)洛和劉殿爵都做到了忠實(shí)于原始材料，凸顯出原文的中心思想。詞云圖中字體大小和單詞位置內(nèi)外與上述表格中呈現(xiàn)的數(shù)據(jù)相吻合，是對上述結(jié)論很好的驗(yàn)證。

三、討論

基于本文對《孟子》英譯本的對比研究，可以得出以下推斷：

整體看來，三個(gè)譯本中，理雅各譯本的詞匯豐富度較高，用詞變化性較大。究其原因，理雅各譯本由十九世紀(jì)的書面語體英文寫成，洋溢著濃厚的學(xué)術(shù)氣息。賴發(fā)洛譯本整體詞匯豐富度較低，用詞變化性較小。究其原因，賴發(fā)洛始終把普通讀者的接受能力放在首要考慮的位置，以激發(fā)他們的閱讀興趣和方便他們理解為己任，因而譯本更顯通俗性。而劉殿爵的《孟子》英譯本詞匯豐富度適中，是學(xué)術(shù)性和通俗性的完美結(jié)合（劉單平，2011）。

三個(gè)譯本中，理雅各譯本的高頻詞最獨(dú)特，可以說明譯者在翻譯《孟子》時(shí)，不僅把握住了原文的主旨和思想，而且依據(jù)不同的翻譯原則，選擇了不同的翻譯方法和策略。理雅各在翻譯時(shí)，“一直關(guān)注對原文的忠實(shí)，而非行文的雅致。他每治一經(jīng)，必先廣泛搜集歷代評注，詳加對比、分析，在此基礎(chǔ)上做出自己的判斷?！保ㄍ踺x，2003）

同其他譯本相比，理雅各譯本中高頻詞的相似度較低，說明譯者依據(jù)不同的翻譯原則，選擇了不同的翻譯方法和策略來翻譯特定高頻詞如書名和地名等。

在詞云維度上，理雅各、賴發(fā)洛和劉殿爵三位譯者的《孟子》英譯本的差別不大，都做到了忠實(shí)于原文。

四、結(jié)語

本文基于理雅各、賴發(fā)洛、劉殿爵三位譯者的《孟子》英譯本，使用程序設(shè)計(jì)語言Python，基于語料庫，從詞匯豐富度、主題詞、文本相似度和詞云四個(gè)維度出發(fā)，通過類符/形符比、詞頻排序、語篇相似性度量和詞云圖四個(gè)指標(biāo)分析了這些譯本的相似點(diǎn)與不同之處。三個(gè)譯本中理雅各譯本詞匯豐富度高；賴發(fā)洛、劉殿爵譯本詞匯豐富度較低。從譯本的高頻詞對比角度而言，理雅各譯本高頻詞與其他兩個(gè)譯本的重合率較低，獨(dú)特性最高；賴發(fā)洛譯本與其他兩個(gè)譯本的重合率較高，高頻詞獨(dú)特性最低。從主題詞角度而言，賴發(fā)洛、劉殿爵譯本主題詞相似性高，理雅各譯本主題詞差異性大。從詞云角度而言，三個(gè)譯本呈現(xiàn)較為一致的結(jié)果。本文使用Python調(diào)用相應(yīng)的庫和模塊，利用客觀數(shù)據(jù)對《孟子》的三個(gè)譯本進(jìn)行了對比研究。以往的譯本對比分析大都以主觀分析為依據(jù)，相比較而言，本文增添了以客觀數(shù)據(jù)為基礎(chǔ)的指標(biāo)分析，角度更為新穎，結(jié)論更加有力，同時(shí)也有利于其他學(xué)者繼續(xù)使用Python進(jìn)行語料庫方面的譯本對比研究。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡