詹菊紅 蔣 躍
(西安交通大學(xué),西安 710049)
語(yǔ)言計(jì)量特征在譯者身份判定中的應(yīng)用*
——以《傲慢與偏見(jiàn)》的兩個(gè)譯本為例
詹菊紅 蔣 躍*
(西安交通大學(xué),西安 710049)
本研究提出將語(yǔ)言計(jì)量特征應(yīng)用于語(yǔ)言風(fēng)格對(duì)比及譯者身份判斷的方法。通過(guò)對(duì)各10萬(wàn)字的兩個(gè)訓(xùn)練譯本語(yǔ)料庫(kù)中14個(gè)語(yǔ)言結(jié)構(gòu)特征分布的統(tǒng)計(jì)對(duì)比,發(fā)現(xiàn)兩個(gè)譯本中5個(gè)具有顯著性差異的語(yǔ)言計(jì)量特征。以這5個(gè)特征作為譯本表征,對(duì)各10萬(wàn)字的兩個(gè)未知譯者文本作相關(guān)分析并進(jìn)行譯者身份識(shí)別實(shí)驗(yàn),根據(jù)這5個(gè)計(jì)量特征準(zhǔn)確地判定未知譯本的譯者。研究證明,將基于語(yǔ)料庫(kù)的計(jì)量研究方法與統(tǒng)計(jì)學(xué)方法相結(jié)合,用語(yǔ)言結(jié)構(gòu)的計(jì)量特征標(biāo)識(shí)譯本的方法有助于加強(qiáng)譯者身份、譯本的判定以及譯者風(fēng)格辨別的可解釋性和客觀科學(xué)性,有助于彌補(bǔ)傳統(tǒng)的譯者風(fēng)格定性研究的不足,使翻譯研究趨于客觀、科學(xué)并具有可解釋性。
譯者身份判定;語(yǔ)言計(jì)量特征;相關(guān)性分析
近20年來(lái),作為一門(mén)新興的語(yǔ)言學(xué)分支,計(jì)量語(yǔ)言學(xué)成為研究語(yǔ)言結(jié)構(gòu)和語(yǔ)言演化的一個(gè)利器(劉海濤 2015:40),也成為文學(xué)文本、翻譯語(yǔ)言研究的重要工具。計(jì)量語(yǔ)言學(xué)認(rèn)為,作者不同的語(yǔ)言風(fēng)格是由于語(yǔ)言單位使用頻率差異而形成的(黃偉 劉海濤 2009:25)。近30年來(lái),人們開(kāi)始利用計(jì)量語(yǔ)言學(xué)的統(tǒng)計(jì)方法進(jìn)行語(yǔ)言風(fēng)格特征比較、文本年代的判定、文章作者的判定和作者風(fēng)格的識(shí)別等 (Hanlein 1999,Oakes 1998:139)。黃偉、劉海濤(2009:26)和陳芯瑩(2012:137)等曾通過(guò)對(duì)不同作家作品中語(yǔ)言結(jié)構(gòu)特征的統(tǒng)計(jì)得出語(yǔ)言風(fēng)格的一致性或區(qū)別性特征,利用語(yǔ)言結(jié)構(gòu)的分布數(shù)據(jù)測(cè)量作家語(yǔ)言風(fēng)格的計(jì)量特征,并且用以判斷陌生文本的作者。同理,語(yǔ)言單位在譯作中的分布數(shù)據(jù)成為體現(xiàn)譯者語(yǔ)言風(fēng)格的語(yǔ)言計(jì)量特征。因此,本研究假設(shè),利用計(jì)量的方法對(duì)譯作的語(yǔ)言進(jìn)行統(tǒng)計(jì)分析,提取一些能夠標(biāo)識(shí)譯者語(yǔ)言風(fēng)格的語(yǔ)言計(jì)量特征集(set of quantitative properties),然后基于這些語(yǔ)言特征進(jìn)行未知譯本的譯者識(shí)別或判定,它應(yīng)該像陌生文本作者的判定一樣是可行的?;糗S紅(2010)用語(yǔ)料庫(kù)方法分析典籍英譯譯者的文體并進(jìn)行文本譯者識(shí)別的實(shí)驗(yàn)。王青等(2012:81-93)也用類(lèi)似的方法進(jìn)行作者指紋的建立和識(shí)別。但目前,采用基于語(yǔ)料庫(kù)的計(jì)量研究方法判定未知譯本譯者,尤其是對(duì)翻譯漢語(yǔ)文學(xué)作品的譯者判定和識(shí)別的研究尚未見(jiàn)報(bào)道。
本研究基于語(yǔ)料庫(kù),運(yùn)用計(jì)量語(yǔ)言學(xué)的方法,獲取王科一和張經(jīng)浩《傲慢與偏見(jiàn)》譯本中有區(qū)別性的語(yǔ)言計(jì)量特征集,然后將這些計(jì)量特征與未知文本語(yǔ)言結(jié)構(gòu)方面的數(shù)據(jù)進(jìn)行文本相關(guān)性比對(duì),進(jìn)行未知文本譯者的判定實(shí)驗(yàn)。研究的問(wèn)題包括:(1)王科一和張經(jīng)浩在《傲慢與偏見(jiàn)》譯本中表現(xiàn)出的區(qū)別性的語(yǔ)言計(jì)量特征有哪些;(2)如何獲取這些特征;(3)如何運(yùn)用這些特征判定未知譯本的譯者?通過(guò)回答上述問(wèn)題,以期為譯者譯本風(fēng)格研究及譯本譯者的判定提供比較客觀的和科學(xué)的研究方法和途徑。
本研究語(yǔ)料的收集處理具體包括:語(yǔ)料的選取、語(yǔ)料清洗和分詞賦碼、分詞語(yǔ)料的人工干預(yù)等。使用的語(yǔ)料庫(kù)語(yǔ)言學(xué)軟件主要包括Ant Conc,CLAWS7,ABBYY,Ultra Edit和ICT CLAS 2015等。
2.1 語(yǔ)料選取
秉承權(quán)威性和代表性的原則,本研究選取簡(jiǎn)·奧斯汀的小說(shuō)PrideandPrejudice為源語(yǔ)文本。該小說(shuō)的中譯本有30多部,在中國(guó)讀者中影響廣泛。選取的譯文語(yǔ)料樣本分別為王科一和張經(jīng)浩的譯本。前者是20世紀(jì)后半葉的著名翻譯家,其外國(guó)文學(xué)功底深厚且對(duì)英語(yǔ)語(yǔ)言駕輕就熟,曾翻譯過(guò)多部世界文學(xué)名著,如《遠(yuǎn)大前程》、《十日談》等,而且是第一位《傲慢與偏見(jiàn)》的中文譯者,譯著在1955年2月首次出版,并由上海譯文出版社于1980年再版,已為廣大讀者所熟知,并且廣受好評(píng)。王科一的翻譯語(yǔ)言準(zhǔn)確通順、形神兼?zhèn)洹O其負(fù)責(zé)并忠實(shí)地傳達(dá)原作的精神實(shí)質(zhì)(李雪嬌 2014:48-49),是研究翻譯語(yǔ)言語(yǔ)體和語(yǔ)用特征的理想樣本。20世紀(jì)末,隨著對(duì)外開(kāi)放很多杰出的中國(guó)翻譯家致力于把經(jīng)典文學(xué)名著介紹給中國(guó)讀者,對(duì)很多名著開(kāi)展重譯,《傲慢與偏見(jiàn)》的重譯本如雨后春筍般出現(xiàn)。其中最具代表性的當(dāng)屬1996年張經(jīng)浩的譯本。張經(jīng)浩是這一時(shí)期最杰出的英譯漢翻譯家之一,翻譯經(jīng)驗(yàn)豐富,翻譯風(fēng)格與王科一的迥異。他主張?jiān)诜g過(guò)程中“去翻譯腔”(張經(jīng)浩 1999:38),語(yǔ)言通達(dá)流暢,力求貼近目標(biāo)語(yǔ)言。上述兩譯本首版時(shí)間相差40年,譯者所處的不同時(shí)代背景和不同的翻譯主張?jiān)斐擅黠@的譯本語(yǔ)言結(jié)構(gòu)差異和計(jì)量特征方面的不同,具有較強(qiáng)的可比性,是較理想的語(yǔ)料來(lái)源。
2.2 語(yǔ)料清洗
語(yǔ)料清洗是建立語(yǔ)料庫(kù)的首要工作。通過(guò)掃描獲得兩譯本的PDF格式文件,使用ABBYY軟件進(jìn)行格式轉(zhuǎn)換,生成Word文檔。由于Word文本均存在錯(cuò)別字和亂碼的現(xiàn)象,因此,為了保證研究的準(zhǔn)確性和客觀性,須進(jìn)行語(yǔ)料清洗和人工糾錯(cuò),然后生成兩個(gè)完整的譯本分別保存為wkypap.doc(218,425字)和zjhpap.doc(196,513字)。清洗后的兩個(gè)樣本字?jǐn)?shù)差別小于10%,對(duì)語(yǔ)言特征的計(jì)量結(jié)果不產(chǎn)生實(shí)質(zhì)性影響,可忽略。
2.3語(yǔ)料加工
本研究采用中國(guó)科學(xué)院計(jì)算技術(shù)研究所開(kāi)發(fā)的ICTCLAS 2015漢語(yǔ)詞性標(biāo)注軟件對(duì)清洗后的兩個(gè)譯本進(jìn)行分詞標(biāo)注。由于標(biāo)注軟件自身的局限性,詞性標(biāo)注加工完成后,不可避免地會(huì)出現(xiàn)一些錯(cuò)誤。例如,由于電腦對(duì)句子語(yǔ)義的識(shí)別能力有限,會(huì)導(dǎo)致分詞和標(biāo)注錯(cuò)誤。如“麗迪雅”是人名,軟件將其標(biāo)識(shí)為“麗/ag迪雅/n_newword”,而不能正確地處理成“麗迪雅/nrf”.因此,本研究對(duì)標(biāo)注加工后的譯文再檢查和校對(duì),校對(duì)過(guò)程中,參照《CLAWS 7詞性賦碼集》和《中科院計(jì)算所漢語(yǔ)詞性標(biāo)記集(3.0)》(劉群等 2008)以及《漢語(yǔ)現(xiàn)代詞典》(第五版),對(duì)軟件標(biāo)注錯(cuò)誤的地方進(jìn)行人工糾錯(cuò)。分詞標(biāo)注后的文件分別保存為wkypap.txt和zjhpap.txt.
研究方法涉及語(yǔ)言結(jié)構(gòu)計(jì)量特征的確定與甄選、數(shù)據(jù)統(tǒng)計(jì)以及數(shù)據(jù)處理與分析。使用的軟件主要是AntConc 3.4.3、WordSmith6和SPSSv21。
3.1 語(yǔ)言結(jié)構(gòu)計(jì)量特征的確定
本研究考察語(yǔ)言結(jié)構(gòu)的指標(biāo)均為詞匯層面和句子層面的語(yǔ)言結(jié)構(gòu)特征。按照語(yǔ)料庫(kù)翻譯學(xué)和計(jì)量語(yǔ)言學(xué)文本聚類(lèi)分析的慣例,主要選擇部分代表語(yǔ)言結(jié)構(gòu)長(zhǎng)度、詞匯豐富程度、詞類(lèi)和句式使用等方面的語(yǔ)言結(jié)構(gòu)特征作為考察對(duì)象。參照黃偉和劉海濤(2009:25-26)提出的用于文本聚類(lèi)的漢語(yǔ)計(jì)量特征選擇詞長(zhǎng)、句長(zhǎng)、型例比、副詞比例等12種結(jié)構(gòu)類(lèi)型作為考察對(duì)象,用以有效區(qū)分文本語(yǔ)體特征。須特別指出的是,在翻譯文本中,形容詞比例和四字慣用語(yǔ)比例也是體現(xiàn)譯者風(fēng)格(translator style)差異的一個(gè)重要計(jì)量特征(蔣躍 2014:99-100)。所以,本研究把這兩項(xiàng)也納入考察指標(biāo)中。基于文本聚類(lèi)的漢語(yǔ)計(jì)量特征,本研究最終確定14種語(yǔ)言結(jié)構(gòu)特征作為分析對(duì)象:詞長(zhǎng)、句長(zhǎng)、型例比、形容詞比例、副詞比例、名詞比例、代詞比例、助詞比例、慣用語(yǔ)比例、標(biāo)點(diǎn)符號(hào)比例、陳述句比例、疑問(wèn)句比例、感嘆句比例和單現(xiàn)詞。
3.2 實(shí)驗(yàn)設(shè)計(jì)
為了測(cè)試和探尋到底哪些語(yǔ)言計(jì)量特征可以有效地判定未知譯本的譯者,本研究擬以文本為單位計(jì)算特定語(yǔ)言結(jié)構(gòu)在文本中的頻率和百分比,基于樣本的均值比較這些語(yǔ)言結(jié)構(gòu)在兩組樣本中的分布是否具有差異。即用訓(xùn)練樣本獲取的具有顯著性差異的語(yǔ)言結(jié)構(gòu)數(shù)據(jù)作為依據(jù),對(duì)測(cè)試樣本的相同語(yǔ)言結(jié)構(gòu)特征進(jìn)行檢索和顯著性差異分析,通過(guò)該實(shí)驗(yàn)實(shí)現(xiàn)譯者身份的判定。
3.21 訓(xùn)練文本和測(cè)試文本的確定
首先,將王譯本(wkypap.doc)和張譯本(zjhpap.doc)對(duì)半平分成前后兩部分,平分時(shí)保留截分處句子的完整性。前一部分作為訓(xùn)練文本,后一部分作為測(cè)試文本。也就是說(shuō),兩個(gè)訓(xùn)練文本取自?xún)勺g本的前一半字?jǐn)?shù);待判定譯者的兩個(gè)測(cè)試文本為兩個(gè)譯本的后一半文本,與訓(xùn)練文本數(shù)據(jù)無(wú)交叉。截分的結(jié)果是,王譯本均分為訓(xùn)練文本TTT1.doc(109,211字)和待判定譯者文本ETT1.doc(109,214字);張譯本均分為訓(xùn)練文本TTT2.doc(98,262字)和待判定譯者文本ETT2. doc(98,251字)。之后,在相同截分處將分詞賦碼后的王科一全譯本wkypap.txt和張經(jīng)浩全譯本zjhpap.txt進(jìn)行相應(yīng)的均分,生成兩個(gè)訓(xùn)練文本TTT1.txt和ETT1.txt以及兩個(gè)測(cè)試文本TTT2.txt和ETT2.txt.
3.22 研究樣本的獲取
為求得更加客觀和準(zhǔn)確的統(tǒng)計(jì)數(shù)據(jù),并獲取足夠的樣本量,本研究進(jìn)一步對(duì)兩訓(xùn)練文本和兩測(cè)試文本的4個(gè).doc文件以每5,000字為單位進(jìn)行均分,均分結(jié)果既保證每個(gè)樣本字?jǐn)?shù)基本相同,又保證樣本之間的可比性;同時(shí),使得每組產(chǎn)生20個(gè)左右的樣本,樣本量比較合理。為保證截分處句子的完整性,每個(gè)文檔的字?jǐn)?shù)并非5,000整,但基本確保每個(gè)文檔字?jǐn)?shù)在4,990-5,010之間。而后,在相同截分點(diǎn)處,對(duì)4個(gè).txt文檔進(jìn)行截分,最終生成王科一訓(xùn)練樣本22個(gè),張經(jīng)浩訓(xùn)練樣本20個(gè),未知譯者A測(cè)試樣本22個(gè)以及未知譯者B測(cè)試樣本20個(gè)。所有樣本均為分詞賦碼過(guò)的文檔,擴(kuò)展名均為.txt,用utf(8)格式保存。
3.3數(shù)據(jù)統(tǒng)計(jì)與分析
首先對(duì)wky和zjh的兩組訓(xùn)練樣本中的14個(gè)語(yǔ)言計(jì)量特征進(jìn)行顯著性差異分析,獲取其中具有顯著性差異的語(yǔ)言計(jì)量特征,組成一個(gè)指標(biāo)集(set of index)。然后對(duì)未知譯者文本A和未知譯者文本B中的兩組樣本中的相同指標(biāo)用AntConc 3.4.3進(jìn)行檢索計(jì)算,得出這兩組樣本中相應(yīng)的語(yǔ)言指標(biāo)的數(shù)據(jù)。之后,以這些指標(biāo)為變量,4組樣本兩兩交叉,進(jìn)行獨(dú)立樣本T檢驗(yàn),以驗(yàn)證4組樣本的計(jì)量語(yǔ)言特征之間是否具有顯著性差異。如果兩組數(shù)據(jù)間具有顯著差異,說(shuō)明它們并非來(lái)源于同一總體,即為不同譯者所譯。如果兩組數(shù)據(jù)間的差異不大,且無(wú)統(tǒng)計(jì)學(xué)意義,則可判定它們來(lái)源于同一個(gè)總體,即為同一譯者所譯。
4.1 訓(xùn)練樣本中語(yǔ)言計(jì)量特征顯著性差異分析
對(duì)王科一的22個(gè)訓(xùn)練樣本和張經(jīng)浩的20個(gè)訓(xùn)練樣本中的詞數(shù)、句數(shù)(以句號(hào)、問(wèn)號(hào)和感嘆號(hào)為標(biāo)記)、副詞數(shù)、形容詞數(shù)、名詞數(shù)、代詞數(shù)、助詞數(shù)、慣用語(yǔ)數(shù)、陳述句數(shù)、疑問(wèn)句數(shù)、感嘆句數(shù)、標(biāo)點(diǎn)符號(hào)數(shù)、單現(xiàn)詞以及型例比(TTR/每5,000字)以及慣用語(yǔ)用AntConc 3.4.3進(jìn)行統(tǒng)計(jì)檢索,然后將數(shù)據(jù)導(dǎo)入Excel中進(jìn)行計(jì)算,得出前述14個(gè)語(yǔ)言特征的計(jì)量數(shù)據(jù)。
用SPSS對(duì)兩組訓(xùn)練樣本中的14個(gè)語(yǔ)言計(jì)量特征的數(shù)據(jù)進(jìn)行獨(dú)立樣本T檢驗(yàn),最終從兩組樣本中發(fā)現(xiàn)14個(gè)語(yǔ)言特征中有5個(gè)特征的分布數(shù)據(jù)存在顯著性差異。表1和表2所示是這5個(gè)特征的描述性統(tǒng)計(jì)結(jié)果和T檢驗(yàn)結(jié)果。
表1 兩組訓(xùn)練樣本中5個(gè)語(yǔ)言特征的描述性統(tǒng)計(jì)結(jié)果
注: 表中數(shù)據(jù)均四舍五入到小數(shù)點(diǎn)后4 位。(1)句長(zhǎng)=字?jǐn)?shù)(不含標(biāo)點(diǎn)符號(hào))/句數(shù);(2)名詞比例=名詞數(shù)/詞數(shù);(3)代詞比例=代詞詞數(shù)/詞數(shù);(4)慣用語(yǔ)比例=各類(lèi)慣用語(yǔ)總數(shù)/詞數(shù);(5)標(biāo)點(diǎn)符號(hào)比例=標(biāo)點(diǎn)符號(hào)數(shù)量/字?jǐn)?shù)。
從表1可看出,通過(guò)比較均值可知TTT1(wky譯本)的句長(zhǎng)和代詞比例高于TTT2(zjh譯本),而TTT2(zjh譯本)在標(biāo)點(diǎn)符號(hào)比例、名詞比例和慣用語(yǔ)比例上高于TTT1(wky譯本)。
表2 兩組訓(xùn)練樣本中5個(gè)語(yǔ)言特征的獨(dú)立樣本T檢驗(yàn)結(jié)果
注:獨(dú)立樣本檢驗(yàn)前要假設(shè)具備兩個(gè)條件,一個(gè)是兩個(gè)總體呈現(xiàn)正態(tài)分布,另一個(gè)是兩個(gè)總體具有相同方差。因此,先用SPSS對(duì)兩組數(shù)據(jù)做正態(tài)分布檢驗(yàn),如果不符合正態(tài)分布,則對(duì)數(shù)據(jù)進(jìn)行轉(zhuǎn)化,使之符合正態(tài)分布;另外,獨(dú)立樣本T檢驗(yàn)自帶方差齊性檢驗(yàn)(Levene’s test), T檢驗(yàn)的報(bào)表顯示方差齊性檢驗(yàn)的結(jié)果,只要sig>.05,就代表兩組數(shù)據(jù)方差相同,取T檢驗(yàn)結(jié)果中的第一行sig值;檢驗(yàn)結(jié)果發(fā)現(xiàn),所有樣本符合方差齊性。
由表2可知,經(jīng)過(guò)獨(dú)立樣本T檢驗(yàn)得出的5個(gè)語(yǔ)言特征的sig值均小于臨界值.05。兩譯本的訓(xùn)練樣本在句長(zhǎng)、標(biāo)點(diǎn)符號(hào)比例、名詞比例、代詞比例和慣用語(yǔ)比例這5個(gè)語(yǔ)言計(jì)量特征上均存在顯著性差異。尤其值得注意的是,句長(zhǎng)、名詞、代詞和慣用語(yǔ)比例的sig值均為.000。在統(tǒng)計(jì)學(xué)上,P值小于.001說(shuō)明兩組數(shù)據(jù)之間呈現(xiàn)極其顯著的差異。這一數(shù)據(jù)表明,王科一和張經(jīng)浩譯本中這5個(gè)語(yǔ)言結(jié)構(gòu)特征的分布差異極其顯著,兩譯者在4個(gè)語(yǔ)言結(jié)構(gòu)的使用方面差別非常大。因此,上述5個(gè)語(yǔ)言結(jié)構(gòu)特征形成本研究要重點(diǎn)考察的語(yǔ)言計(jì)量特征集,提示兩位譯者在《傲慢與偏見(jiàn)》訓(xùn)練文本中這5個(gè)語(yǔ)言結(jié)構(gòu)的使用方面具有區(qū)別性差異。那么,這些語(yǔ)言特征在測(cè)試樣本中的表現(xiàn)如何,在訓(xùn)練樣本與測(cè)試樣本間是否具有顯著性差異?本研究將進(jìn)一步分析檢測(cè),并據(jù)此驗(yàn)證未知譯本的譯者。
4.2 測(cè)試樣本中語(yǔ)言計(jì)量特征顯著性差異分析
為了驗(yàn)證兩組訓(xùn)練樣本間的5個(gè)語(yǔ)言計(jì)量特征是否存在顯著性差異,研究對(duì)未知譯者文本ETT1的22個(gè)測(cè)試樣本和未知譯者文本ETT2的20個(gè)測(cè)試樣本中的5個(gè)語(yǔ)言結(jié)構(gòu)特征頻次,用正則表達(dá)式在AntConc 3.4.3中進(jìn)行統(tǒng)計(jì)檢索,之后將數(shù)據(jù)導(dǎo)入Excel進(jìn)行計(jì)算,得出各個(gè)語(yǔ)言結(jié)構(gòu)的計(jì)量數(shù)據(jù)。并用SPSS對(duì)兩組數(shù)據(jù)進(jìn)行獨(dú)立樣本T檢驗(yàn),得出這5個(gè)特征描述性統(tǒng)計(jì)結(jié)果(見(jiàn)表3)和顯著性差異檢驗(yàn)數(shù)據(jù)(見(jiàn)表4)。
表3 兩組測(cè)試樣本中5個(gè)語(yǔ)言特征的描述性統(tǒng)計(jì)結(jié)果
從表3可以看出,通過(guò)比較均值可知未知譯者文本ETT1的句長(zhǎng)和代詞比例均高于未知譯者文本ETT2,而未知譯本ETT2在標(biāo)點(diǎn)符號(hào)的比例、名詞比例、慣用語(yǔ)比例的使用頻率上高于未知譯本ETT1。
表4 兩組測(cè)試樣本中5個(gè)語(yǔ)言特征的獨(dú)立樣本T檢驗(yàn)結(jié)果
表4顯示,經(jīng)過(guò)獨(dú)立樣本T檢驗(yàn)得出5個(gè)語(yǔ)言特征的sig值均小于臨界值.05。由此可知,兩個(gè)未知譯者測(cè)試樣本在句長(zhǎng)、標(biāo)點(diǎn)符號(hào)比例、名詞比例、代詞比例和慣用語(yǔ)比例這5個(gè)語(yǔ)言結(jié)構(gòu)特征方面均存在顯著性差異。其中,句長(zhǎng)、名詞以及代詞比例sig值為.000,小于.001,表明兩未知譯者文本在這5個(gè)方面存在極其顯著的差異,尤其是在標(biāo)點(diǎn)符號(hào)和慣用語(yǔ)的分布上存在更為顯著的差異。據(jù)此可以判定,未知譯者文本A和未知譯者文本B來(lái)自于不同的譯本,為不同譯者所譯。
4.3 4 組樣本間語(yǔ)言計(jì)量特征的顯著性差異分析
將兩組訓(xùn)練樣本和兩組測(cè)試樣本交叉進(jìn)行語(yǔ)言特征的比對(duì)。為了判定未知譯本ETT1是否來(lái)自wky譯本,是否為王科一所譯,需要將未知譯者A樣本中的5個(gè)語(yǔ)言特征數(shù)據(jù)與wky訓(xùn)練樣本TTT1中相應(yīng)的語(yǔ)言特征數(shù)據(jù)進(jìn)行顯著性差異分析,如果存在顯著性差異,則可斷定未知文本ETT1并非王科一所譯;如果5個(gè)指標(biāo)均不存在顯著性差異,則可判定未知文本ETT1來(lái)自于wky譯本,為王科一所譯。同理,為判定未知譯本ETT2是否為王科一所譯,需要將未知譯本ETT2中的5個(gè)語(yǔ)言特征的數(shù)據(jù)與wky樣本TTT1中的語(yǔ)言特征數(shù)據(jù)進(jìn)行顯著性差異分析,如果存在顯著性差異,則可判定未知譯本B并非王科一所譯,反之亦然。同樣,將未知譯本ETT1與未知譯本ETT2和張經(jīng)浩文本TTT2中的5個(gè)語(yǔ)言計(jì)量特征分別進(jìn)行顯著性差異檢驗(yàn),判定未知譯本B是否為張經(jīng)浩所譯。表5顯示4組樣本兩兩交叉的獨(dú)立樣本T檢驗(yàn)結(jié)果中的顯著值,即P值的情況。
表5 4組樣本間5個(gè)語(yǔ)言計(jì)量特征獨(dú)立樣本T檢驗(yàn)的顯著值(P值)
由表5可知,未知譯者文本ETT1與wky訓(xùn)練文本TTT1的5個(gè)語(yǔ)言特征經(jīng)過(guò)獨(dú)立樣本T檢驗(yàn)得出的sig值均遠(yuǎn)遠(yuǎn)大于臨界值.05,所顯示的差異不顯著,無(wú)統(tǒng)計(jì)學(xué)意義。未知譯者文本ETT1與TTT1在上述5個(gè)語(yǔ)言結(jié)構(gòu)特征上均不存在顯著性差異。換言之,ETT1與TTT1來(lái)自于同一譯本。結(jié)合本研究實(shí)際情況可以判定,ETT1來(lái)自于wky譯本,為王科一所譯。ETT2與wky訓(xùn)練文本的5個(gè)語(yǔ)言特征獨(dú)立樣本T檢驗(yàn)得出的sig值均小于臨界值.05。其中,句長(zhǎng)、標(biāo)點(diǎn)符號(hào)比例、代詞比例和慣用語(yǔ)比例sig值均為.000,P值小于.01說(shuō)明兩組數(shù)據(jù)之間的差異具有顯著的統(tǒng)計(jì)學(xué)意義??芍珽TT2與TTT1在5個(gè)語(yǔ)言結(jié)構(gòu)特征方面均差異顯著。據(jù)此可以判定,ETT2不是來(lái)自于wky譯本,非王科一所譯。
未知譯者文本ETT1與zjh訓(xùn)練文本TTT2的5個(gè)語(yǔ)言特征經(jīng)過(guò)獨(dú)立樣本T檢驗(yàn)得出的sig值均小于臨界值.05,而且所有sig值均小于.01。當(dāng)P值小于.01時(shí),說(shuō)明兩組數(shù)據(jù)間存在極其顯著的差異。因此可知,未知譯者文本ETT1與zjh訓(xùn)練文本TTT2在上述5個(gè)語(yǔ)言結(jié)構(gòu)特征的比例方面均差異顯著。據(jù)此可以斷定,ETT1并非來(lái)自于zjh譯本,非張經(jīng)浩所譯。未知譯者文本ETT2與zjh訓(xùn)練文本TTT2的5個(gè)語(yǔ)言特征經(jīng)過(guò)獨(dú)立樣本T檢驗(yàn)得出的sig值均遠(yuǎn)遠(yuǎn)大于臨界值.05,因此可知,ETT2與TTT2在上述5個(gè)語(yǔ)言結(jié)構(gòu)特征比例方面的差異很小,或者均不存在顯著性差異,沒(méi)有統(tǒng)計(jì)學(xué)意義。據(jù)此可以判定,ETT2來(lái)自于zjh譯本,為張經(jīng)浩所譯。
本研究對(duì)王科一訓(xùn)練文本TTT1、張經(jīng)浩訓(xùn)練文本TTT2、未知譯者文本ETT1和未知譯者文本ETT2,分別以句長(zhǎng)、標(biāo)點(diǎn)符號(hào)比值、名詞比值、代詞比值和慣用語(yǔ)比值為考察對(duì)象,進(jìn)行語(yǔ)言計(jì)量特征顯著性差異分析,并進(jìn)行譯者身份識(shí)別實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果驗(yàn)證出我們的研究假設(shè),證明運(yùn)用譯文中獲取的語(yǔ)言計(jì)量特征可以準(zhǔn)確地判定未知文本的譯者,這一點(diǎn)我們通過(guò)回顧未知譯者文本內(nèi)容進(jìn)行驗(yàn)證。
盡管黃立波等(2011)通過(guò)對(duì)照《紅樓夢(mèng)》幾個(gè)英譯本以及英國(guó)“翻譯英語(yǔ)語(yǔ)料庫(kù)”(TEC)翻譯小說(shuō)子庫(kù)文學(xué)類(lèi)翻譯英語(yǔ)在類(lèi)符/形符比、平均句長(zhǎng)、敘述結(jié)構(gòu)(這里指選擇性that的使用)方面的比較,發(fā)現(xiàn)譯者風(fēng)格差異不明顯,這些語(yǔ)言結(jié)構(gòu)和特征“并不足以區(qū)分不同譯者的翻譯風(fēng)格”(黃立波 2011:917)。另外,黃立波等人考察葛浩文英譯中國(guó)小說(shuō)的翻譯風(fēng)格后發(fā)現(xiàn),利用語(yǔ)料庫(kù)統(tǒng)計(jì)數(shù)據(jù)(如標(biāo)準(zhǔn)類(lèi)/形比和平均句長(zhǎng)等)并不能夠有效地將一個(gè)譯者與另一個(gè)譯者的翻譯風(fēng)格區(qū)分開(kāi),這些統(tǒng)計(jì)結(jié)果更像是翻譯文本表現(xiàn)出的一種共性。但是,本研究采用顯著性差異分析方法,能夠準(zhǔn)確區(qū)分王科一和張經(jīng)浩兩譯者的5個(gè)語(yǔ)言結(jié)構(gòu)計(jì)量特征,證明盡管譯者風(fēng)格在宏觀層面可能差異不大,盡管翻譯文體表現(xiàn)出明顯的共性,但是不能否認(rèn)在某些語(yǔ)言形式的使用偏好上,不同譯者、不同譯本確實(shí)存在顯著性差異,并且這些特征可以用來(lái)判定不同譯者及其譯作。
5.1 名詞與代詞
通過(guò)統(tǒng)計(jì)整個(gè)譯本發(fā)現(xiàn),王科一譯本的代詞比例為15.03%,而張經(jīng)浩的則為12.22%,王科一代詞的使用頻率比張經(jīng)浩的高出約3%。此外,通用英漢對(duì)應(yīng)語(yǔ)料庫(kù)(CEPC)中漢語(yǔ)原創(chuàng)文學(xué)的代詞比例為8.83%,漢語(yǔ)翻譯文學(xué)作品的代詞使用頻率為11.81%(王克非 2012:63)。兩譯本的代詞比例均遠(yuǎn)遠(yuǎn)高出漢語(yǔ)原創(chuàng)文學(xué),這是因?yàn)闈h語(yǔ)代詞的類(lèi)型較少,沒(méi)有主賓格之分,使用頻率較低,從而證實(shí)文學(xué)翻譯中指代關(guān)系的“顯化”現(xiàn)象 (王克非 2012:87)。王科一的代詞使用頻率遠(yuǎn)高于漢語(yǔ)翻譯文學(xué)的整體水平,而張經(jīng)浩則略高,比較接近漢語(yǔ)原創(chuàng)作品的代詞使用情況。
王科一在翻譯中本著“極其負(fù)責(zé)任和忠實(shí)原文的思想態(tài)度”(李雪嬌 2014:48-51),在翻譯方法上趨向于靠近源語(yǔ)。王克非認(rèn)為,英語(yǔ)作為一種形式化比較高的語(yǔ)言,代詞使用的頻率要明顯高于漢語(yǔ)原創(chuàng)文學(xué),“譯者的忠實(shí)”會(huì)使代詞從英語(yǔ)向漢語(yǔ)譯本遷移,導(dǎo)致譯本代詞冗余現(xiàn)象。這個(gè)現(xiàn)象也與譯者所處的年代有關(guān),20世紀(jì)50年代新中國(guó)剛剛成立,社會(huì)主義建設(shè)正在起步階段,漢語(yǔ)與英語(yǔ)之間的社會(huì)地位懸殊造成翻譯策略和翻譯產(chǎn)品的“逆差”(王克非 2012:114),代詞的使用便是這種逆差的見(jiàn)證。雖然王科一譯本形神兼?zhèn)?,迄今依然被推崇為《傲慢與偏見(jiàn)》最為經(jīng)典和備受歡迎的譯本之一,但譯者身上深深的時(shí)代烙印藉此可見(jiàn)一斑。我們?cè)?∶2平行語(yǔ)料庫(kù)中對(duì)兩譯本代詞使用情況進(jìn)行檢索觀察,也能看出兩譯本的差異。比如:
① She_PPHS1 felt_VVDanew_RRthe_AT justice_NN1 of_IOMr._NNB Darcy_NP1 ’s_GE objections_NN2;and_CCnever_RRhad_VHD she_PPHS1 before_RTbeen_VBNso_RGmuch_RRdisposed_VVNto_TOpardon_VVIhis_APPGE interference_NN1 in_IIthe_AT views_NN2 of_IOhis_APPGE friend_NN1. //王譯:她/rr 重新/d 又/d 想到/v 達(dá)西/nrf 先生/n 的確/d 沒(méi)有/d 冤枉/v 她們/rr,/wd他/rr指出/v 她們/rr的/ude1 那些/rz缺陷/n 確/d 是/vshi 事實(shí)/n,/wd她/rr深深/d 感覺(jué)/v 到/v,/wd 實(shí)在/d 難怪/d 他/rr 要/v 干涉/v 他/rr朋友/n 和吉英/nr 的/ude1 好事/n./wj
張譯:她/rr 又/d 在/p 想/v,/wd 達(dá)西/nrf 先生/n 看不慣/v 自/p 有/vyou其/rz 看不慣/v 的/ude1 道理/n./wj他/rr 替/p 朋友/n 著想/vi,/wd 插/v 了/ule 一/m 手/n,/wd 現(xiàn)在/t 看來(lái)/v 的確/d 情有可原/vl./wj
例①對(duì)同一英文原句的翻譯,王譯本中代詞出現(xiàn)8次,而張譯本中則只有3次。兩位譯者代詞使用頻率的懸殊顯而易見(jiàn)。
王譯本的名詞比例為16.05%,而張譯本的名詞比例為18.92%,可以看出王科一的名詞使用頻率低于張經(jīng)浩將近3個(gè)百分點(diǎn)。兩譯本中名詞與代詞比例總和分別是31.08%與31.14%,對(duì)比漢語(yǔ)翻譯文學(xué)的研究數(shù)據(jù),翻譯漢語(yǔ)名詞與代詞的比例總和為31.33%(王克非 2012:63)。兩譯本及漢語(yǔ)翻譯文學(xué)作品的名詞與代詞所占的詞頻比例總和基本都在31%左右。數(shù)據(jù)顯示,名詞詞頻比例高的文本,則代詞比例低;而代詞比例偏高時(shí),則名詞比例偏低。其原因可能是因?yàn)椤皾h語(yǔ)常規(guī)的指代方式主要以“名詞復(fù)現(xiàn)”和“零指代為主,顯性人稱(chēng)代詞的使用頻率一般較低;而代詞是替代名詞的一種詞類(lèi),漢語(yǔ)中多數(shù)代詞具有與名詞相同的指別(deixis)功能”(王克非2012:87),因此,代詞與名詞在指稱(chēng)功能上呈現(xiàn)一種“詞頻互補(bǔ)的關(guān)系”。張經(jīng)浩的譯本更加靠近漢語(yǔ),翻譯中刻意弱化源語(yǔ)的影響,盡量消除“翻譯腔”。因此張經(jīng)浩譯本的代詞使用頻率相比于源文和王科一譯本都大大降低。但是,為了避免因指代不明而引起的歧義,譯者勢(shì)必會(huì)使用相對(duì)多的名詞明示原文的指代關(guān)系,這或許是張經(jīng)浩譯本名詞比例增高的原因。
② Mr._NNB Bennet_NP1 saw_VVDthat_CSTher_APPGEwhole_JJ heart_NN1 was_VBDZin_IIthe_ATsubject_NN1 ;_; and_CCaffectionately_RRtaking_VVGher_APPGE hand_NN1,_, said_VVDin_II reply_NN1. //王譯:班納特/nrf先生/n看到/v 她/rr鉆進(jìn)/v 了/ule牛角尖/n,/wd 便/d 慈祥/a 地/ude2 握住/v 她/rr的/ude1 手/n 說(shuō)/v :/wp
張譯:貝內(nèi)特/nrf先生/n看/v 得/ude3 出來(lái)/vf,/wd女兒/n說(shuō)/v 的/ude1 這/rzv 番/qv 話(huà)/n 完全/ad 是/vshi內(nèi)心/n 話(huà)/n,/wd 親切/a 地/ude2 拉/v 起/vf她/rr的/ude1 手/n,/wd 答道/v:/wp
③ Very_RGfrequently_RRwere_VBDR they_PPHS2 reproached_VVNfor_IF this_DD1 insensibility_NN1 by_II Kitty_NP1 and_CC Lydia_NP1,whose_DDQGEown_DA misery_NN1 was_VBDZextreme_JJ,and_CCwho_PNQScould_VMnot_XXcomprehend_VVIsuch_DA hard-heartedness_NN1 in_IIany_DDof_IOthe_AT family_NN1.//王譯:可是/c 吉蒂/nrf和/cc 麗迪雅/nrf已經(jīng)/d 傷心/a 到/v 極點(diǎn)/n,/wd便/d 不由得/d 常常/d 責(zé)備/v 兩/m 位/q 姐姐/n 冷淡/a 無(wú)情/a./wj她們/rr真/d 不/d 明白/v,/wd家里/s 怎么/ryv竟/d 會(huì)/v 有/vyou這樣/rzv沒(méi)有/v 心肝/n的/ude1 人/n !/wt
張譯:基蒂/nrf 與/p 莉迪亞/nrf則/d 難過(guò)/a 至極/vi,/wd 多次/mq 埋怨/v 她們/rr 太/d 冷漠/a 無(wú)情/a./wj 雖然/c 是/vshi 自家/rr 的/ude1 姐姐/n,/wd 這樣/rzv 沒(méi)/v 心肝/n 基蒂/nrf 與/p 莉迪亞/nrf看/v 不/d 過(guò)去/vf./wj
在例②中,王譯本中出現(xiàn)兩例人稱(chēng)代詞“她”,而張譯本中“她”只出現(xiàn)一次,但卻用“女兒”來(lái)明示代詞“她”的所指。另外,從名詞的整體比例來(lái)看,王譯本中名詞的使用頻率為4次,而張譯本中達(dá)到7次??梢钥闯觯瑑勺g者名詞使用頻率的差別,單憑名詞使用頻率的差異也能區(qū)分兩個(gè)譯本;同時(shí)也直觀地呈現(xiàn)出兩譯本中名詞頻率與代詞頻率的“互補(bǔ)關(guān)系”。而例③中,張譯本“基蒂”、“莉迪亞”分別出現(xiàn)兩次,符合漢語(yǔ)以“名詞復(fù)現(xiàn)”的方式明確指代關(guān)系的語(yǔ)言特征。
5.2 句長(zhǎng)與標(biāo)點(diǎn)
從句長(zhǎng)與標(biāo)點(diǎn)兩個(gè)指標(biāo)來(lái)看,王科一譯本的句長(zhǎng)均值為31.63%,張經(jīng)浩的則是24.82%。相比原創(chuàng)漢語(yǔ)平均句長(zhǎng)25.46%和漢語(yǔ)翻譯文學(xué)作品的平均句長(zhǎng)25.81%(王克非 2012:58-59),王科一譯本的平均句長(zhǎng)顯然遠(yuǎn)遠(yuǎn)高于原創(chuàng)漢語(yǔ)文學(xué)作品、翻譯文學(xué)作品和張經(jīng)浩譯本的句長(zhǎng),而張經(jīng)浩的平均句長(zhǎng)則接近翻譯漢語(yǔ)的整體水平。王克非認(rèn)為,“漢語(yǔ)翻譯時(shí)的句子擴(kuò)張與英語(yǔ)源語(yǔ)有關(guān)”(王克非 2012:60),譯者越靠近源語(yǔ),譯本擴(kuò)張?jiān)矫黠@。張經(jīng)浩譯本的標(biāo)點(diǎn)符號(hào)使用比例略高于王科一,這與他的譯文盡量靠近漢語(yǔ)目標(biāo)語(yǔ),語(yǔ)言凝練、句子短小精悍有很大的關(guān)系。例如:
④ I_PPIS1 am_VBMonly_RRashamed_JJof_IOhis_APPGEasking_VVGso_RG little_DA1. //王譯:他/rr 要/v 得/ude3 這么/rz 少/a,/wd 我/rr 倒/d 覺(jué)得/v 不好意思/a 呢/y./wj//張譯:我/rr 還/d 嫌/v 他/rr 開(kāi)價(jià)/v 太/d 低/a./wj
從例④可以看出兩譯文句長(zhǎng)的差異,王譯文句子較長(zhǎng),張譯文的句子比較簡(jiǎn)潔。同時(shí)王譯本在形式上比張譯本更加貼近源語(yǔ),譯文從詞匯與句子層面都與原文形成鮮明的對(duì)應(yīng),卻并非死譯硬譯,譯語(yǔ)溫婉徐緩,這應(yīng)該也是王譯本備受推崇的原因之一;而張譯本更加貼近目標(biāo)語(yǔ),一個(gè)“嫌”字盡顯漢語(yǔ)的凝練之妙,這種翻譯取向使張譯本語(yǔ)言緊湊簡(jiǎn)練,比王譯本總字?jǐn)?shù)少1.5萬(wàn)字之多。
5.3 慣用語(yǔ)
本研究所界定的慣用語(yǔ)包括習(xí)慣用語(yǔ)和四字成語(yǔ),由軟件自動(dòng)分詞標(biāo)注人工校對(duì)的方法進(jìn)行確定。張經(jīng)浩的慣用語(yǔ)比例為1.66%,而王科一的為1.22%。慣用語(yǔ)形式短小、含義豐富,可使語(yǔ)言生動(dòng)形象、含蓄幽默,意在言外?!俺S迷~、習(xí)慣用語(yǔ)比例增高說(shuō)明譯本語(yǔ)言趨向于漢語(yǔ)目標(biāo)語(yǔ)”(胡顯耀 2010:457);“慣用語(yǔ)使用的密集程度或者分布特征,往往能表明譯者對(duì)譯入語(yǔ)慣用語(yǔ)掌握的熟練程度,也能表明其語(yǔ)言和詞匯的豐富度和變化度”(黃立波 2009:84)。張譯本比王譯本更頻繁地使用習(xí)慣用語(yǔ)和四字成語(yǔ),使譯文語(yǔ)言精辟凝練,富有文采,更貼近目標(biāo)語(yǔ)文化。例如:
⑤ They_PPHS2 must_VMhave_VHIseen_VVN them_PPHO2 together_RL for_RR21 ever_RR22. //王譯:照理/v 應(yīng)該/v 常常/d 看到/v 他們/rr 兩/m 人/n 在/p 一起/s 呀/y. /wj//張譯:他們/rr 一定/d 看見(jiàn)/v 了/ule 這/rzv 兩/m 人/n 形影不離/vl./wj
⑥ I_PPIS1 am_VBMso_RGgrieved_JJfor_IF him_PPHO1. //王譯:我/rr 真/d 為/v 他/rr 難受/a./wj//張譯:我/rr 拿/v 他/rr 也/d 無(wú)可奈何/vl./wj
在以上兩例中,張譯文使用“形影不離”和“無(wú)可奈何”兩個(gè)成語(yǔ),譯文讀起來(lái)絲毫沒(méi)有“翻譯腔”,帶有原創(chuàng)漢語(yǔ)文學(xué)作品的韻味。“負(fù)責(zé)任的譯者在穿梭于兩種語(yǔ)言之間進(jìn)行協(xié)調(diào)時(shí),總會(huì)盡量減少信息傳輸過(guò)程中的損耗和丟失,便于讀者的理解和吸收。”(柯飛 2005:307)比照源語(yǔ)不難發(fā)現(xiàn),王譯本的語(yǔ)言表達(dá)更加精準(zhǔn)嚴(yán)謹(jǐn),這也印證其“忠實(shí)地傳達(dá)原文精神實(shí)質(zhì)”的翻譯主張。
本研究以《傲慢與偏見(jiàn)》譯本為例,獲取能夠有效區(qū)分王科一和張經(jīng)浩語(yǔ)言特色的5個(gè)語(yǔ)言結(jié)構(gòu)指標(biāo);并經(jīng)過(guò)實(shí)驗(yàn)和統(tǒng)計(jì)學(xué)分析,證明使用上述5個(gè)語(yǔ)言結(jié)構(gòu)的分布數(shù)據(jù)作為文本的表示特征,可以在未知文本的譯者身份判別方面取得可信任的結(jié)果。本研究證明,即使在譯者風(fēng)格不存在整體差異的情況下,也可以運(yùn)用計(jì)量語(yǔ)言特征進(jìn)行未知譯者的身份判定,并為之提供可以借鑒的方法和基本思路。
陳芯瑩 李雯雯 王 燕.計(jì)量特征在語(yǔ)言風(fēng)格比較及作家判定中的應(yīng)用——以韓寒《三重門(mén)》與郭敬明《夢(mèng)里花落知多少》為例[J]. 計(jì)算機(jī)工程與應(yīng)用, 2012(3).
胡顯耀. 基于語(yǔ)料庫(kù)的漢語(yǔ)翻譯語(yǔ)體特征多維分析[J]. 外語(yǔ)教學(xué)與研究, 2010(6).
黃立波 王克非. 語(yǔ)料庫(kù)翻譯學(xué):課題與進(jìn)展[J].外語(yǔ)教學(xué)與研究, 2011(6).
黃 偉 劉海濤.漢語(yǔ)語(yǔ)體的計(jì)量特征在文本聚類(lèi)中的應(yīng)用[J].計(jì)算機(jī)工程與應(yīng)用,2009(29).
霍躍紅. 譯者研究:典籍英譯譯者文體分析與文本的譯者識(shí)別[M]. 上海:中西書(shū)局, 2014.
蔣 躍.人工譯本與機(jī)器在線譯本的語(yǔ)言計(jì)量特征對(duì)比——以5屆韓素音翻譯競(jìng)賽英譯漢人工譯本和在線譯本為例[J]. 外語(yǔ)教學(xué), 2014(9).
柯 飛. 翻譯中的隱和顯[J]. 外語(yǔ)教學(xué)與研究, 2005(4).
李雪嬌. 從譯者序分析譯本特色——以《傲慢與偏見(jiàn)》的兩個(gè)中譯本為例[J]. 河北北方學(xué)院學(xué)報(bào), 2014(4).
劉海濤 潘夏星. 漢語(yǔ)新詩(shī)的計(jì)量特征[J].山西大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版) 2015(2).
王克非 胡顯耀. 基于語(yǔ)料庫(kù)的翻譯漢語(yǔ)詞匯特征研究[J].中國(guó)翻譯, 2008(6).
王克非. 語(yǔ)料庫(kù)翻譯學(xué)探索[M].上海:上海交通大學(xué)出版社, 2012.
張經(jīng)浩. 重譯《艾瑪》有感[J].中國(guó)翻譯,1999(3).
Adolphs, S.IntroducingElectronicTextAnalysis:APracticalGuideforLanguageandLiteraryStudies[M]. London and New York: Routledge, 2006.
Hanlein, H.StudiesinAuthorshipRecognition—ACorpus-basedApproach[M]. New York: Peter Lang Pub Inc, 1999.
Oakes, M. P.StatisticsforCorpusLinguistics[M]. Edinburgh: Edinburgh University Press, 1998.
Wang, Q., Li, D.-F. Looking for Translator’s Fingerprints: A Corpus-based Study on Chinese Translations of Ulysses[J].Literary&LinguisticComputing, 2012(1).
ApplicationofQuantitativeLinguisticPropertiestoTranslatorshipRecognition
Zhan Ju-hong Jiang Yue
(Xi’an Jiaotong University, Xi’an 710049, China)
This paper proposes a method of using quantitative linguistic properties to contrast different translation styles and to recognize the translators of unknown translation texts. The Chinese translations ofPrideandPrejudiceby two different translators were cleaned, segmented, tagged and used as two corpora for analysis. The two corpora were divided into halves: the first halves to be used as training translation texts(TTT1 and TTT2) and the second as experimental translation texts(ETT1 and ETT2) whose translators were assumed unknown. Fourteen linguistic properties were explored and compared for significant differences between two training translation texts (TTT1 and TTT2). It eventually discovered five contrastive and differentiative linguistic properties typical of two different translators. Data of the five linguistic properties of two experimental translation texts (ETT1 and ETT2) whose translators were assumed unknown were also acquired and cross-compared with those of ETTs for statistical significance of differences by using Significance Test of Difference. It was found out that the five linguistic properties show no statistical significant difference between TTT1 and ETT1, and between TTT2 and ETT2; while the five properties show highly significant diffe-rence between TTT1 and ETT2, TTT2 and ETT1, and ETT2 and TTT2. Thus, it can be concluded that ETT1 and TTT1 belong to the same translator, WKY; and ETT2 and TTT2 belong to the other author, ZJH. The paper has successfully determined the contrastive linguistic properties between two translators, and based on these quantitative linguistic properties, ideally recognized the translators of experimental texts. The paper provides a new method for the research of different translation styles, translators’ styles and translatorship recognition or even identification, which is intended to improve the accuracy, objectivity and explai-nability of the traditional studies of translation and translator styles.
translatorship recognition; quantitative linguistic properties; significance test of difference
*本文系教育部人文社科研究項(xiàng)目“中醫(yī)漢英平行語(yǔ)料庫(kù)的構(gòu)建與應(yīng)用研究”(15YJC740127)和“在線機(jī)譯與人工翻譯的語(yǔ)言計(jì)量特征對(duì)比”(15YJA740016)的階段性成果。
*蔣躍為本文通訊作者。
H059
A
1000-0100(2016)03-0095-7
10.16263/j.cnki.23-1071/h.2016.03.019
定稿日期:2016-03-01
【責(zé)任編輯孫 穎】