国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

翻譯漢語語言特征研究綜述

2017-01-17 05:22朱一凡
當代外語研究 2016年6期
關鍵詞:代詞原創(chuàng)語料

朱一凡

(上海交通大學,上海,200240)

翻譯漢語語言特征研究綜述

朱一凡

(上海交通大學,上海,200240)

近十幾年來基于語料庫的漢譯語言特征研究取得了相當大的進展,在詞匯、句法的研究上都有豐富的成果,這有助于我們更全面、準確地認識翻譯漢語所具有的特點。然而,目前的研究也存在一些缺陷: (1)數(shù)據(jù)多、語言實例少;(2)數(shù)據(jù)的羅列多于解釋;(3)偏重于文學語料;(4)共時的研究多、歷時的研究少; (5)熱點問題的重復研究多,開創(chuàng)性的研究少。

翻譯漢語,語料庫,語言特征

1.引言

對翻譯文本的閱讀,如今已占了現(xiàn)代人日常閱讀相當大的一部分,翻譯漢語盡管以漢文字為載體,但其語言的使用明顯區(qū)別于原創(chuàng)漢語的特征,是現(xiàn)代漢語的翻譯語言變體。盡管以漢語為母語的讀者在閱讀中能夠直覺地感受到這種變體與原創(chuàng)語言的區(qū)別,但要明確描述這些區(qū)別的特征卻并非易事。在計算機和大規(guī)模語料庫出現(xiàn)之前,對翻譯漢語的研究多是印象式、點評式的,憑借的往往是研究者超凡的語言感知能力,例子多靠研究者日積月累加以收集,數(shù)量也只局限于少數(shù)幾個。自Baker(1993)具有奠基性的文章Corpus Linguistics andTranslationStudies:Implications and Applications發(fā)表以來,語料庫方法在翻譯研究中的運用為翻譯研究開辟了新天地,其中一個重要的研究內容就對翻譯語言特征的研究,即翻譯文本有哪些不同于源語文本的典型語言特征?;谡Z料庫的翻譯語言特征的研究在國外開始于20世紀90年代,代表人物有Sara Laviosa(1998)、Mona Baker(2001)和Maeve Olohan(2003)等,研究目標多為西歐語言。自 2001年北京外國語大學創(chuàng)建GCEPC(General Chinese-English Parallel Corpus)以來,國內陸續(xù)涌現(xiàn)出可用于翻譯語言研究的多個大型語料庫,其中具有一定規(guī)模且可用于翻譯漢語研究的有浙江大學的漢語譯文平衡語料庫ZCTC(ZJU Corpus of Translational Chinese)、上海交通大學的莎劇英漢平行語料庫ECPCSP(English-Chinese ParallelCorpus of Shakespeare's Plays)等,研究的方法是與具有可比性的原創(chuàng)語料庫進行比較,以觀察翻譯漢語具有哪些不同于原創(chuàng)漢語的特征。目前已有的漢譯語言特征的研究主要涵蓋三個方面:(1)翻譯漢語的詞匯特征;(2)句法結構特征;(3)搭配及語義韻特征。

2.翻譯漢語詞匯特征研究

對翻譯漢語詞匯特征的研究開始最早,相關的論著也較為豐富。研究的路徑主要有三種:(1)標準化類符/形符比、詞匯密度與詞長;(2)關鍵詞表; (3)具體詞類研究。這三類研究途徑都充分體現(xiàn)了語料庫的統(tǒng)計和搜索優(yōu)勢,用傳統(tǒng)研究手段是不可能實現(xiàn)的。

2.1 標準化類符/形符比、詞匯密度與詞長

對標準化類符/形符比、詞匯密度和詞長的計算是常用的統(tǒng)計手段,標準化類符/形符比(Standardized Type/Token Ratio,簡稱STTR)是類符(type)和形符(token)的標準化比率,是Scott(2004: 27-42)在原來類符/形符比(Type/Token Ratio,簡稱TTR)的基礎上提出來的,可以彌補TTR受庫容大小影響的缺憾。類符指文本中一共出現(xiàn)了多少種詞,形符指文本中詞的總數(shù),標準化類符/形符比能夠反映文本中詞匯的豐富程度。詞匯密度的概念最早是由Ure(1971)提出的,他認為詞匯密度可以用實詞數(shù)除以詞匯總數(shù)進行計算,即詞匯密度=實詞數(shù)÷詞匯總數(shù)×100%。Stubbs(1986)則將其定義為實義詞與總詞數(shù)之比,并認為該比值可以衡量篇章的信息量,英語的實義詞(lexical word或content word)指具有穩(wěn)定詞義的詞語,包括名詞、動詞、形容詞和副詞等詞類,與之相對的是功能詞(functional word),包括介詞、連詞、冠詞、助動詞等,然而需要注意的是這一劃分方法在漢語中會出現(xiàn)問題,因為漢語中詞語兼類的現(xiàn)象相當普遍。楊惠中(2002:168)提出了另一種詞匯密度的計算方法:不同詞語數(shù)÷總詞數(shù)× 100%;此外,用實詞總數(shù)除以虛詞總數(shù)求得百分比也是目前常用的一種詞匯密度的計算方法。詞匯密度在一定程度上能夠反映詞匯的變化以及文本的信息密度。詞長統(tǒng)計的是文本中各種長度詞的頻數(shù),WordSmith有此功能,亦可計算平均詞長,平均詞長在一定程度上可體現(xiàn)文本的正式程度,越正式的文本往往平均詞長越長,越接近口語化的文本平均詞長也會趨于下降。平均詞長對英語文本就更有統(tǒng)計意義,由于現(xiàn)代漢語文本以雙音節(jié)詞為主,詞長這一統(tǒng)計數(shù)據(jù)往往說明不了什么問題。

此類研究最具代表性的當屬王克非和胡顯耀(2008)、Xiao(2010)、肖忠華和戴光榮(2010)的研究。王克非和胡顯耀(2008)的研究運用了北京外國語大學研制的“通用漢英對應語料庫”,主要分文學和非文學兩類文本,研究表明文學類翻譯漢語相比文學類原創(chuàng)漢語類符形符比和詞匯密度都較低,說明文學類翻譯漢語的詞語變化度較低;此外,文學類翻譯漢語的各種虛詞頻率和代詞頻率均高于原創(chuàng)漢語,且常用詞數(shù)量更少而頻率更高。而非文學翻譯漢語與同類原創(chuàng)漢語語料相比,也出現(xiàn)了詞匯密度降低和虛詞代詞增多的趨勢,只是差別不及文學類明顯。

肖忠華和戴光榮的研究運用浙江大學的漢語譯文語料庫ZCTC(ZJU Corpus of Translational Chinese)與蘭卡斯特漢語語料庫LCMC(Lancaster Corpus of Mandarin Chinese)兩個多文體平衡語料庫進行對比,發(fā)現(xiàn)翻譯漢語所有文體的詞匯密度(即實義詞占總詞數(shù)的比例)都遠低于漢語母語文本,尤其是報告和公文、武俠傳奇小說、幽默幾類文體(科幻小說相差不大)。但從標準型次比角度來看,詞匯密度差異并不明顯。他們的研究還發(fā)現(xiàn),漢語譯文中實義詞與功能詞之比相比原創(chuàng)漢語更低,即相對于功能詞來說,實義詞比例偏低,翻譯漢語還呈現(xiàn)高頻詞比例偏高,常用詞重復率偏高等特征。

以上兩個研究盡管運用了不同的語料,但就翻譯漢語的用詞特點方面得出了相似的結論,這有助于我們對翻譯漢語用詞的特點有一個宏觀的了解,并將對后續(xù)的微觀研究有所啟發(fā)。但需要注意的是,標準化類符/形符比、詞匯密度和詞長研究的研究只是從統(tǒng)計學角度讓我們確信翻譯文體是確確實實存在的,卻無法展現(xiàn)翻譯文本在微觀層面的特征,微觀層面的研究還需深入文本內部,考察具體字詞的使用。

2.2 關鍵詞表

關鍵詞(Keyword)分析是語料庫語言學中重要的分析手段,WordSmith和AntConc都提供該關鍵詞分析功能,把翻譯漢語庫的詞頻信息(Wordlist)與可比的原創(chuàng)漢語庫的詞頻信息進行比較,可以得出關鍵詞表,既包括正關鍵詞(表示使用頻率偏高)也包括負關鍵詞(表示使用頻率偏低)。關鍵詞表可以反映翻譯漢語與原創(chuàng)漢語在詞匯使用頻率方面的差異。

秦洪武和王克非(2009)最早開展了此方面的研究,他們運用WordSmith的關鍵詞功能研究了北京外國語大學通用中英對應語料庫中翻譯文本和原創(chuàng)文本在詞匯使用上的差異。研究表明,翻譯漢語高頻使用的單音節(jié)詞較原創(chuàng)文本少,原創(chuàng)漢語中單音節(jié)動詞如湊、擱、甭、傍、嚷、嫌、吵、捧、混、怔,單音節(jié)形容詞如脆、高、貴、好、紅、厚、慌、緊、老、俏、小、飽、苦等的頻率要遠遠高于翻譯漢語;翻譯漢語較原創(chuàng)漢語更高頻地使用第一、第三人稱代詞和指示代詞,其中包括她、他、他們、它、它們、我、我們、那、那兒、那個、那時、那種、這個、這時、這種、這樣、其他、另、別的、任何、每個、一切等;此外,翻譯漢語還更高頻使用方位詞和連詞,如以前、之前、之間、不過、但等。在詞語的組合上,他們發(fā)現(xiàn)翻譯漢語過度使用某些語素,如“-性”、“-度”等;且受源語某些典型譯法的影響,出現(xiàn)了一些固定的表達形式,如“隨著時間的推移”和“是(不)可能(的)”。他們在結論中還特別指出,翻譯語言可能使用原創(chuàng)文本不常用的詞或多詞組合形式,因此不能簡單認為原創(chuàng)文本在詞匯運用上不如目的語文本豐富,這一點也值得進一步思考。

Xiao和Dai(2014)通過與參照語料庫LCMC的對比,找出了ZCTC中前100個最具顯著意義的關鍵詞,其中最多的是名詞共有45個,如公司、美國、美元、英國、全球等,其次是字母詞18個、動詞六個、副詞四個、數(shù)字四個,翻譯語料中顯著超用的詞多是由于內容的需要而在使用上較原創(chuàng)漢語更頻繁。他們還發(fā)現(xiàn)翻譯漢語在功能詞的使用上明顯較原創(chuàng)漢語更頻繁,其中代詞、連詞,助詞“的”和連詞“在”都出現(xiàn)明顯的超用(見表1)。

表1 ZCTC與LCMC對比的關鍵詞表

Xiao和 Dai的研究還發(fā)現(xiàn)一些助詞(“了”、“著”、“之”、“等”)、代詞(“咱們”、“啥”)、動詞(“有”、“搞”、“辦”)以及逗號和頓號在翻譯漢語中使用得更少,反映出翻譯漢語少用體標記詞、口語詞、形式動詞和句內標點的趨勢。

肖忠華(2012)還以LCMC為參考語料庫,對ZCTC的關鍵詞類做了分析,關鍵詞類分析與關鍵詞分析相似,只不過研究的對象是具體的詞類而不是具體的詞。這項研究表明翻譯漢語中的關鍵詞類包括字母詞、音譯專名、標點、代詞、連詞、介詞、助詞、后綴詞、形式動詞等;負關鍵詞類包括漢語專名、漢語專用標點、處所詞、語氣詞等。

對翻譯漢語語料關鍵詞及關鍵詞類的分析可以將翻譯漢語與原創(chuàng)漢語在微觀上的差異展現(xiàn)出來,有助于我們深入了解漢語翻譯變體的區(qū)別特征。在此方面,現(xiàn)有的研究都做出了極有意義的嘗試,但也有進一步提升的空間,如對具體關鍵詞的研究會流于零散,且關鍵詞受語料的內容影響較大,比較難于從中發(fā)現(xiàn)具有代表意義的關鍵詞,因而從關鍵詞入手的從下而上的方式是比較耗時費力,效率很低。而對關鍵詞類的研究比較容易讓研究者迅速捕捉到具有研究意義的切入點,但缺點是容易缺少具體的詞例和分析,讓讀者只見森林不見樹木,因而如能從關鍵詞類入手,再與具體詞的分析相結合,則容易獲得有意義的發(fā)現(xiàn)。

2.3 具體詞類的研究

通過關鍵詞的研究發(fā)現(xiàn)翻譯漢語中某些類別的詞與原創(chuàng)漢語有較大的差異,因而一些研究者進而開始考察翻譯漢語中某個類別的詞的使用特點,目前已有的研究主要集中在連詞和代詞的研究上。

Chen(2004,2006)以自建的英漢科普文本譯文語料庫ECPC(English-Chinese Parallel Corpus)為研究對象,以中國臺灣“中研院平衡漢語語料庫(Sinica Corpus)”中的科技部分為參照庫,對但、因為、所以、如果、因此、但是、由于、因、不過等連詞在ECPC簡體中文譯文庫、繁體中文譯文庫的頻率與Sinica原創(chuàng)漢語科技庫中的頻率進行了對比,發(fā)現(xiàn)翻譯漢語連接詞的使用頻率普遍高于原創(chuàng)漢語,小句以及句子之間更傾向于使用連接詞來標記邏輯關系。從微觀上看,翻譯漢語更集中使用某些高頻連接詞,且有些在翻譯漢語中高頻使用的連接詞在原創(chuàng)漢語中使用頻率并不高,成了翻譯漢語的區(qū)別性特征。此外,翻譯漢語連接詞在連接功能上也發(fā)生了變化,更傾向用于小句之間的連接而不是句與句之間的連接,且更趨向于單獨使用,而不是成對使用。

柯飛(2005)對北外通用漢英對應語料庫中80多萬原創(chuàng)漢語語料和近80萬漢字的漢譯語料進行了考察,發(fā)現(xiàn)時間連接詞、條件連接詞和因果連接詞使用上的一些差異。其中時間連接詞“在……時”、“在……時候”、“當……時”等在翻譯漢語中的使用頻率都遠超過原創(chuàng)漢語;條件連接詞“如果”、“要是”以及因果連接詞“以致”在翻譯漢語中的頻率都遠超過原創(chuàng)漢語。

許文勝和張柏然(2006)以南京大學英漢名著翻譯語料庫(NUCECC)為資源,選用《傲慢與偏見》、《最后的莫希干人》兩本小說的英語文本和漢語譯本,并運用《鄭重的故事》、《圍城》等幾部小說形成參照文本,研究了其中因果關系連詞的運用,英語文本考察了“for,because,why,therefore,as,since,thus,hence”等八個高頻因果關系連詞,漢語考察了“因為、所以、由于、既然、因此、因而”等六個因果連接詞,結果發(fā)現(xiàn)漢語譯文的因果連接詞使用頻率不僅大于英語原文,更是遠高于漢語原創(chuàng)小說。

黃立波(2007)通過考察北外通用漢英對應語料庫,對條件、轉折和因果三類連接詞在翻譯漢語和原創(chuàng)漢語文本中的使用情況進行了對比,發(fā)現(xiàn)這三類連接成分在漢語翻譯文本中的使用頻率均高于漢語原創(chuàng)文本。

夏云(2013)以14部英文原文在民國和最近20年的譯本為研究對象,并以同期的漢語原創(chuàng)文本為參考庫,研究了翻譯漢語連接詞和介詞的歷時變化情況。結果發(fā)現(xiàn),民國時期翻譯漢語更多使用正式和古樸的連接詞,如“如其、縱使、如、誠然、乃、再則、于是乎、縱算、甚而至于、如若、乃至、不拘”等,而最近20年的譯本中連接詞較原創(chuàng)漢語更趨于非正式、口語化和簡單化,如“結果、不是……就是、要不然、就算、要(if)、誰想”等。該研究還進一步對比了介詞的使用,分析發(fā)現(xiàn)最近20年譯本中的介詞數(shù)量偏少,在介詞的選擇上更為保守,更貼近原創(chuàng)漢語的選擇,而民國時期譯本與原創(chuàng)文本差異較大,詞匯變化性強,非常規(guī)用詞較多。

黃立波(2008)以18萬詞(八萬文學語料,十萬非文學語料)的英文語料及其譯文為研究對象,17萬字的原創(chuàng)漢語(九萬文學語料,八萬非文學語料)的參照,考察了代詞主語的翻譯情況,發(fā)現(xiàn)英漢翻譯中人稱代詞主語的轉換,在數(shù)量與頻次上呈遞減趨勢,轉換類型則以對應關系為主,語際顯化不明顯,語際隱化也不明顯。翻譯漢語與原創(chuàng)漢語相比,無論文學還是非文學文本,其人稱代詞主語的使用頻次都要高,這表明翻譯文本受原語文本的影響,表現(xiàn)出人稱代詞主語的遷移現(xiàn)象。

王克非和胡顯耀(2010)運用北外通用漢英對應語料庫探討了翻譯文學中人稱代詞的使用特征,其中特別考察了第三人稱代詞“他”的指代能力,多“他”同句和不同指“他”的交替使用。他們發(fā)現(xiàn)翻譯文學比原創(chuàng)文學更傾向使用“他”,人名的重復率較低,且更多地在同一句中連用多個“他”,還出現(xiàn)了不同指“他”在同一句話中同時存在的現(xiàn)象。

任小華(2015)針對之前的研究在文體上有所局限的問題,運用ZCTC多文體平衡語料庫對人稱代詞進行了研究,研究發(fā)現(xiàn)人稱代詞在翻譯漢語中的顯化特征明顯;第三人稱代詞顯化最明顯,第一人稱代詞次之,第二人稱代詞排在最后。而文體因素對人稱代詞整體的顯化影響不太明顯,但對具體人稱代詞的顯化有一定的影響。

除了對翻譯漢語連詞和代詞的研究外,也有一些對其他詞類的研究。如王克非和胡顯耀(2008)、胡顯耀(2010)運用不同的方法都發(fā)現(xiàn)翻譯漢語中起語法功能的虛詞比例高于原創(chuàng)漢語,其中包括介詞、連詞、助詞等詞類使用頻率均比原創(chuàng)漢語文本高;肖忠華和戴光榮(2010)研究了漢語譯文語料庫中習語與詞簇的使用特征,其分析表明,翻譯漢語總體而言不及原創(chuàng)漢語使用習語頻繁,有顯著性差異,僅在偵探小說文體中出現(xiàn)了逆轉;此外,翻譯漢語中各種長度詞簇出現(xiàn)的頻率都顯著高于原創(chuàng)漢語中相應的詞簇頻率,且高頻詞簇使用更為頻繁,有些在翻譯漢語中的高頻詞簇是譯文特有的,如指代結構“他的”、“你的”、“這樣的”與修飾結構“最重要的”、“公司的”。肖忠華(2012)的研究發(fā)現(xiàn)翻譯漢語比原創(chuàng)漢語較少使用量詞、體標記詞“著、了、過”、助詞“之”和語氣詞,較多使用“的、地、得”。戴光榮(2013)運用ZCTC與LCMC對比了介詞的使用,發(fā)現(xiàn)翻譯漢語介詞使用的頻率顯著高于原創(chuàng)漢語,并結合BABEL英漢平行語料庫考察了“動詞+about”、“在”和“因為”,發(fā)現(xiàn)源語投射是造成翻譯漢語介詞使用頻率升高的原因。許文勝(2015)運用自建的ECCC小說翻譯語料庫,研究了具有銜接意義的副詞在譯文中的運用,研究發(fā)現(xiàn)翻譯小說在銜接性副詞的運用上,比較接近現(xiàn)代漢語小說文本的平均值,并未出現(xiàn)連詞、介詞等在翻譯漢語中的超用現(xiàn)象。

除了對具體某類詞的研究之外,還有研究者對話語標記進行了考察,如肖忠華和戴光榮(2010)對ZCTC中的話語重述標記與LCMC進行了比對,包括“也就是說、換句話說、歸根到底、歸根結底、總之、總的來說、總而言之、更不用說、簡而言”,研究表明翻譯漢語中更常用非正式的、口語體的話語重述標記,如“總的來說”、“換句話說”等,而不常用正式的、書面體的重述標記,如“即”、“總之”、“簡言之”等。趙秋榮(2014)用歷時研究的方法考察了復合語料庫中話語重述標記的使用情況,其中包括類比語料庫(1910~1949)、雙語平行語料庫(1930~1949)和參考語料庫,考察的對象有“總之、總而言之、總的說來、一句話、歸根結底、歸根結蒂、簡言之、簡而言之、由此看來、如上所說、講到底、說到底、綜上、綜上所述”等30余個總結類話語重述標記,研究表明在1910~1949年間,翻譯漢語中話語重述標記的使用頻率普遍高于當時的原創(chuàng)漢語,在翻譯過程中,譯者傾向于使用舊白話中一些不太穩(wěn)定或低頻使用的結構來翻譯漢語中沒有的重述標記,且在翻譯漢語中高頻出現(xiàn)的重述標記有向原創(chuàng)漢語滲透的趨勢。秦洪武和王玉(2014)、秦洪武和李嬋(2014)、秦洪武和司佳冰(2015)利用歷時翻譯和原創(chuàng)語料庫,對詳述類、對比類和言聚類話語標記進行了研究,研究發(fā)現(xiàn)翻譯漢語在過去近百年的時間里各類話語標記形式越來越多樣、使用頻率逐漸增高,且推動了原創(chuàng)漢語話語標記的發(fā)展,豐富了漢語本身的言語資源和表達形式。

對翻譯漢語具體詞類的研究在數(shù)量上相比其他幾個方面有一定的優(yōu)勢,所涵蓋的詞類包括了連詞、代詞、助詞、介詞、習語和話語標記,其中連詞和代詞的研究最為豐富,而對助詞、介詞、其他詞類和話語標記的研究仍有可為的空間。對翻譯漢語具體詞類的研究有一個突出的特點,即研究者多針對平行語料庫和可比語料庫開展研究,對英語原文倍加關注,這也體現(xiàn)了研究者在發(fā)現(xiàn)語言特征的同時,試圖給出合理解釋的嘗試,這樣的研究方法代表了翻譯語言特征研究的一個趨勢,即平行語料庫與可比語料庫相結合,上可追溯源語文本,下可展開與原創(chuàng)漢語的對比,描述與解釋并重。新的研究方法的優(yōu)點是克服了早期翻譯語言特征研究缺少源語文本的缺憾,如TEC和ZCTC都沒有源語信息,提供了進一步解釋翻譯語言現(xiàn)象的可能性,但缺點是抬高了研究的門檻,因為平行語料庫的建庫難度要大大高于單語語料庫,靠研究者一人之力難以完成,現(xiàn)如今較為成熟的平行語料庫多是團隊合作的成果。

3.句法及結構特征研究

王克非(2003)通過對平行語料庫的考察發(fā)現(xiàn)在英譯漢的過程中,英漢語句一一對應比例很高,換而言之,譯文的句子會帶有英語原文的一些特征。又由于英漢句子本身在形態(tài)標記、行文邏輯、句式結構上有很大差異,翻譯漢語在句式結構上也理應呈現(xiàn)出既有別于英語源語又區(qū)別于原創(chuàng)漢語的特征。這方面的研究目前主要集中在兩方面:(1)句長、平均句段長及結構容量;(2)典型句式結構。

3.1 平均句長、句段長及結構容量

平均句長的計算是以總的形符數(shù)除以句點標記(句號、問號、感嘆號)的個數(shù)而得出的,WordSmith可直接統(tǒng)計出該結果。而句段是指語句中由逗號、分號隔開的短句或短語,因此平均句段長的計算是用總形符數(shù)除以句段標記的總個數(shù)(逗號、分號、句號、冒號、問號、感嘆號)得出的。結構容量是與句段長緊密關聯(lián)的概念,指短語結構的長度,如“當……時”這一短語結構中的形符數(shù)的多少。平均句長、句段長和結構容量可以反映語句的復雜程度及可讀性,因而可用來衡量翻譯漢語在句法上的一些特征。

王克非和秦洪武(2009)應用北大通用漢英對應語料庫比較了翻譯漢語與原創(chuàng)漢語的句長,發(fā)現(xiàn)翻譯漢語受源語影響平均句長和句段長都明顯高于原創(chuàng)漢語,且翻譯漢語中某些結構式的容量發(fā)生了擴展:(1)英譯漢時常把原本后置且開放的英語定語(從句)前置于賓語之前形成“的……的NP”結構式,因而擴展了謂賓之間的結構容量;(2)漢語的一些封閉式的介詞短語(如介詞+NP+方位/時間)結構,在翻譯漢語中也發(fā)生了擴展,其間增加了多重修飾成分。

秦洪武(2010)用三部小說的名家譯本(口碑譯本)、普通譯本與原創(chuàng)小說做對比,研究這三種文本在平均句長與句段長上的差異,并考察了“介詞……方位詞”、“指示代詞/數(shù)量詞……名詞”這兩個結構在三種文本中容量的大小。分析表明,句段長度和結構容量比句長更能反映漢語翻譯語言的特征,名家譯本比普通譯本對結構容量的控制更好,句子的可讀性更強。這項研究還說明了一點,即翻譯漢語并非都是同質化的,相反是以變化的連續(xù)統(tǒng)的形式呈現(xiàn)出來的,其中一端是與原創(chuàng)漢語很接近的、歸化程度很高的漢語,而另一端則是歐化程度很高的漢語形態(tài),而歐化程度越高,其翻譯語言特征也越明顯,反之則與原創(chuàng)漢語越接近。

Wang和Qin(2013)進一步運用因子分析的方法對反映漢語翻譯語言特點的因素進行了考察,分析表明句段長度是評估漢語翻譯語言的重要指標,他們又以含有“的”的修飾成分為例,研究了北大通用漢英對應語料庫不同子庫中的結構容量的差異,結果表明,翻譯漢語相比原創(chuàng)漢語句段長度增加、結構容量變大,尤其是結構容量的變大會降低可讀性。

Xiao和Dai(2014)接納了王克非、秦洪武有關漢語句段長度的觀點,對ZCTC中不同文體的翻譯漢語的句段長與原創(chuàng)漢語進行了比對,發(fā)現(xiàn)學術文體的翻譯漢語與原創(chuàng)漢語的平均句段長差異最大,小說的句段長最為接近。由此得出結論,翻譯漢語與原創(chuàng)漢語平均句段長度的差異因文體的不同而有所不同(見圖1)。

圖1 ZCTC與LCMC平均句段長的對比(Xiao&Dai 2014:35)

3.2 典型句式結構

除了關注翻譯漢語的句長和結構容量,研究者還將目光投向了一些典型句式結構,研究最多的是“把”字句和“被”字句。

最早是柯飛(2003)的研究對比了“把”字句在翻譯與原創(chuàng)漢語中的使用,結果發(fā)現(xiàn)無論在文學還是非文學語料中,翻譯文本“把”字句的頻率要遠遠高于原創(chuàng)文本,并提出“把”字句更適合于表達復雜、細微的含義。胡開寶(2009,2011)對莎劇《漢姆雷特》的梁實秋和朱生豪譯本中“把”字句的使用頻率進行了研究,并將其高頻使用的原因歸結為戲劇對白中大量使用的蘊含位移圖式的語句結構的存在,其結構特點及語用功能均與“把”字句相吻合,故引起了“把”字句的頻繁使用。此外,譯者所采取的翻譯策略也會影響“把“字句的使用頻率。胡顯耀和曾佳(2011)利用文學翻譯語料的研究表明,文學翻譯中的“把”字句一改其原來短小精悍的句式特點,長度比原創(chuàng)漢語更長,結構更復雜,層次更豐富,表達的信息量明顯增加,但也帶來了節(jié)奏上的拖沓感,增加了理解難度。肖忠華(2012)利用ZCTC對“把”字句進行的多文體研究,有了新的發(fā)現(xiàn),與原創(chuàng)漢語相比,翻譯漢語的“把”字句確實在小說類語體中的頻率更高,而在非文學類文體如新聞類和學術類中則頻率明顯偏低,而在包括報告和公文在內的一般類語體中,無明顯差異。此研究提示我們對于翻譯漢語的研究要有文體意識,文體的不同往往會帶來研究結果的迥異,目前在分文類漢譯語言特征研究方面還有待進一步研究的需要。

Xiao等(2006)最早運用語料庫對漢語譯文中的“被”字句進行了研究,結果顯示翻譯漢語與原創(chuàng)漢語中“被”字句在不同文體中的分布有差異,在非文學類文體如新聞報道、新聞綜述、操作文體、報告與公文以及學術文體中,譯文“被”字句頻率要比原創(chuàng)漢語高得多,而這種差異在文學類文體中不明顯,偵探小說類還出現(xiàn)了逆轉。他們進一步研究了源語滲透對“被”字句的影響,發(fā)現(xiàn)從英語翻譯成漢語的過程中,非文學類文本中的源語滲透效應比文學類更加明顯,這是因為非文學類的翻譯原文本中本來就存在超用被動句式的特點。胡開寶和鄒頌兵(2009)對七部莎劇中的“被”字句進行了分析,分析表明原文中大量存在的受事前景化的表達引發(fā)了譯文中“被”字句的增加。此外,為語篇銜接的方便,一些主動句也會譯為“被”字句。胡顯耀和曾佳(2010)利用漢譯小說語料庫的研究發(fā)現(xiàn),與原創(chuàng)小說相比,翻譯小說“被”字句頻率更低,更傾向于使用長被動式,且整體呈否定和消極意義。

除了以上兩個典型句式之外,也有其他一些句式研究。如秦洪武和王克非(2004)對翻譯漢語中“so..that”對應句式的研究發(fā)現(xiàn),翻譯可以使?jié)h語原有句式增加新的功能,可以提高先前罕見結構的使用頻率。肖忠華(2012)還考察了“有”字句,發(fā)現(xiàn)其在譯文中頻率比原創(chuàng)漢語低;“是”字句在譯文中使用更頻繁,尤其是“是+(副詞)+形容詞+的+標點”結構的使用頻率顯著高于原創(chuàng)漢語;“所”字句在新聞類、一般類和小說類文體的譯文中受源語影響呈現(xiàn)出超用情形,而在學術類文體中則出現(xiàn)少用現(xiàn)象?!斑B”字句則在譯文中的使用頻率明顯低于原創(chuàng)漢語。戴光榮(2013)對“是”字句做了進一步研究,他認為隨著譯文中“是”字句的增多,出現(xiàn)了語法化的趨勢,“是”已經(jīng)不僅僅是判斷詞的標記,而成了焦點標記、強調標記與對比標記。

現(xiàn)有的翻譯漢語句法特征的研究已經(jīng)相當豐富,要繼續(xù)深入研究需要在以下方面有所突破才能做出新意:(1)注意翻譯漢語非同質化的特點,對不同歐化、歸化程度的漢譯語言做區(qū)別化研究;(2)關注文體差異,對特有文體的句式現(xiàn)象做深入研究; (3)發(fā)掘新的典型句式進行研究。

4.搭配及語義韻特征研究

搭配是語料庫最常見的研究對象,指詞語之間習慣性的共現(xiàn)關系,Sinclair(1991:170)將搭配定義為“同一文本中一定距離內兩個或多個詞的共現(xiàn)”,語料庫研究所說的搭配要比一般語法意義上的搭配其涵蓋范圍更廣,只要在“節(jié)點詞”周圍有一定共現(xiàn)頻率的詞都可稱為搭配詞。Firth(1957:12)進一步指出:“從詞的搭配可以知道該詞的意義。”因而對搭配的研究可以與語義趨向(semantic preference)與語義韻(semantic prosody)的研究相結合,語義趨向與語義韻是Sinclair(1996)基于共選研究(co-selection)提出的擴展意義單位中的兩個要素,節(jié)點詞的語義趨向是由其搭配詞的共同語義特征構成的,而語義韻則是指節(jié)點詞由于與具有某種語義趨向的搭配詞的習慣性共現(xiàn)所呈現(xiàn)的語義氛圍(Stubbs 2002)。

搭配研究是漢譯語言特征研究的一個薄弱環(huán)節(jié),目前僅有的研究是戴光榮(2013)利用ZCTC與LCMC的對比,研究了其中十個高頻名詞的搭配,結果發(fā)現(xiàn)漢語譯文中高頻名詞節(jié)點詞的搭配范圍要比原創(chuàng)漢語的搭配范圍廣,詞匯變化模式更豐富。

考察語義韻的研究由于涉及語義,難度更大,因而也非常有限,Xiao等(2006)基于LCMC考察了“被”字句的語義韻,結果發(fā)現(xiàn)“被”字句在文學作品和演講中更趨于貶義,在新聞、官方文件和學術論文中則中性意義的比重依次加大。胡顯耀和曾佳(2010)針對文學翻譯文本中“被”的語義韻進行了研究,發(fā)現(xiàn)文學翻譯中“被”字句與原創(chuàng)漢語文學作品相比表現(xiàn)出更明顯的消極語義韻。Xiao和Dai (2014)將FLOB的被動結構與LCMC、ZCTC的“被”字句的語義韻做了對比研究,結果表明英語的被動結構是趨于中性的,而原創(chuàng)漢語的“被”字結構趨于貶義,翻譯漢語的“被”字結構介于其間,總體趨于中性(見圖2)。

圖2 FLOB、LCMC和ZCTC中被動式語用意義的對比(Xiao&Dai 2014:37)

夏云(2014)運用歷時語料庫同樣考察了“被”字結構,研究表明在近20年的漢譯文本中,具有消極含義的“被”字句遠遠低于50%,不及中性含義的一半,這一趨勢在非文學語料中尤為明顯。

以上幾個涉及語義韻的研究,為漢譯語言特征研究開辟了新的可能性,突破了語料庫翻譯語言特征研究重語法、輕語義和語用的瓶頸,但已有的幾項語義韻研究都脫離了具體的搭配,因而只能對翻譯語言中某個結構的語義特征作籠統(tǒng)概述,其中細化的語義差別卻被掩蓋其中。朱一凡和胡開寶(2014)基于新聞翻譯和原創(chuàng)語料庫對“被”字句的考察將搭配、語義趨向、語義韻的研究相結合,發(fā)現(xiàn)新聞漢譯語料中“被”字句的主導語義趨向為“弱及物義”,相比原生漢語“被”字句的主導語義趨向(遭受義)發(fā)生了質的變化。此外,新聞漢譯語料中“被”字句的語義韻整體呈中性化趨勢,與呈消極趨勢的原生漢語也有較大的區(qū)別,翻譯語料中“被”中性語義韻比重的加大主要由于“弱及物義”和“承賜義”動詞搭配的增多。

5.小結

不難看出,近十幾年來基于語料庫的漢譯語言特征研究取得了相當大的進展,語料庫方法的借入開拓了新的研究可能性,以前無法研究的詞匯豐富度、結構容量、可讀性、語義韻等領域的研究都成為可能,這有助于我們更全面、更準確地認識翻譯漢語所具有的特點。然而,目前的研究也存在一些缺陷: (1)只見數(shù)據(jù)不見具體的語言實例,盡管語料庫的優(yōu)勢即在數(shù)據(jù)的統(tǒng)計,但傳統(tǒng)語言研究重典型實例分析的方法不應該丟棄,沒有實例的數(shù)據(jù)就像空中樓閣,不接地氣;(2)數(shù)據(jù)的羅列多于解釋,現(xiàn)有的研究多將重心放在研究設計和數(shù)據(jù)呈現(xiàn)上,解釋的部分往往一掠而過;(3)研究多偏重于文學語料,對多文體翻譯漢語的研究則多側重于文體間的差異,概述性的研究居多,而對某一實用文體的全面研究較少; (4)共時的研究多、歷時的研究少,對翻譯語言歷時變化的研究對考察特定歷史文化背景下的翻譯行為、語言接觸的影響會有重大啟示意義,很值得深入考察;(5)熱點問題的重復研究多,開創(chuàng)性的研究少,其中就搭配、語義韻的研究仍存在大有可為的空間。筆者希冀隨著新角度的出現(xiàn)和新語料的介入,此領域的研究可以有新的突破。

Baker,M.1993.Corpus linguistics and translation studies: Implications and applications[A].In M.Baker,G.Francis&E.Tognini-Bonelli(eds.).Text and Technology:In Honour of John Sinclair[C].Amsterdam:John Benjamins.233-250.

Baker,M.2001.Investigating the language of translation:A Corpus-based approach[A].In P.Fernandez&J.M.Bravo (eds.).Pathways of Translation Studies[C].Valladolid: University of Valladolid.47-56.

Chen,W.2004.Investigating explicitation of conjunctions in translated Chinese:A corpus-based study[J].Language Matters35(1):295-312.

Chen,W.2006.Explication Through the Use of Connectives in Translated Chinese:A Corpus-based Study[D].University of Manchester.

Firth,J.R.1957.Papers in Linguistics,1934-1951[M].London:Oxford University Press.

Laviosa,S.1998.Core patterns of lexical use in a comparable corpus of English narrative prose[J].Meta43(4):557-570.

Olohan,M.Spelling out the optionals in translation:A corpus study[J].UCREL Technical Papers13:423-432.

Scott,M.2004.The WordSmith Tools[M].Oxford:OUP.

Sinclair,J.1991.Corpus,Concordance,Collocation[M].Oxford:Oxford University Press.

Sinclair,J.1996.The search for units of meaning[J].TEXTUS9(1):75-106.

Stubbs,M.1986.Lexical density:A computational technique and some findings[A].In M.Coultard(ed.).Talking about Text-Studies Presented to David Brazil on His Retirement[C].Birmingham:English Language Research,University of Birmingham:27-42.

Stubbs,M.2002.Two quantitative methods of studying phraseology in English[J].International Journal of CorpusLinguistics7(2).215-244.

Ure,J.1971.Lexical density and register differentiation[A].In G.Perren&J.L.M.Trim(eds.).Applications of Linguistics[C].London:Cambridge University Press.443-452.

Wang,K.&H.Qin.2013.What is peculiar to translational Mandarin Chinese? A corpus-based study of Chinese constructions’load capacity[J].Corpus Linguistics and Linguistic Theory(2):57-77.

Xiao,R.&G.Dai.2014.Lexical and grammatical properties of Translational Chinese: Translation universal hypotheses reevaluated from the Chinese perspective[J].Corpus Linguistics and Linguistic Theory10(1):11-55.

Xiao,R.2010.How different is translated Chinese from native Chinese—A corpus-based study of translation universals[J].International Journal of Corpus Linguistics15(1):5-35.

Xiao,R.,T.McEnery&Y.Qian.2006.Passive constructions in English and Chinese:A corpus-based contrastive study[J].Languages in Contrast6(1):109-149.

戴光榮.2013.譯文源語透過效應研究[M].上海:上海交通大學出版社.

胡開寶.2009.基于語料庫的莎劇《哈姆雷特》漢譯文本中“把”字句應用及其動因研究[J].外語學刊(1):111-115.

胡開寶.2011.語料庫翻譯學概論[M].上海:上海交通大學出版社.

胡開寶、鄒頌兵.2009.莎士比亞戲劇英漢平行語料庫的創(chuàng)建與應用[J].外語研究(5):64-71.

胡顯耀.2010.譯語體特征多維分析[J].外語教學與研究(6):451-458.

胡顯耀、曾佳.2010.翻譯小說“被”字句的頻率、結構及語義韻研究[J].外國語(3):73-79.

胡顯耀、曾佳.2011.從“把”字句看翻譯漢語的雜合特征[J].外語研究(6):69-75.

黃立波.2007.基于漢英/英漢平行語料庫的翻譯共性[M].上海:復旦大學出版社.

黃立波.2008.英漢翻譯中人稱代詞主語的顯化——基于語料庫的考察[J].外語教學與研究(6):454-459.

柯飛.2003.漢語把字句特點、分布及其英譯研究[J].外語與外語教學(12):1-5.

柯飛.2005.翻譯中的隱和顯[J].外語教學與研究7(4): 303-307.

秦洪武.2010.英譯漢翻譯語言的結構容量:基于多譯本語料庫的研究[J].外國語(4):73-80.

秦洪武、李嬋.2014.翻譯與現(xiàn)代漢語對比類話語標記使用的歷時變化[J].外文研究(4):73-81.

秦洪武、司佳冰.2015.翻譯與目標語發(fā)展的互動研究——翻譯與現(xiàn)代漢語言據(jù)類標記的歷時變化[J].外國語(5): 23-32.

秦洪武、王克非.2004.基于語料庫的翻譯語言分析——以“so..that”的漢語對應結構為例[J].現(xiàn)代外語(1):40-48.

秦洪武、王克非.2009.基于對應語料庫的英譯漢語言特征分析[J].外語教學與研究(2):131-136.

秦洪武、王玉.2014.從詳述類話語標記看翻譯與現(xiàn)代漢語話語組織的發(fā)展[J].外語教學與研究(4):521-530.

任小華.2015.翻譯漢語中人稱代詞的顯化:基于語料庫的研究[J].解放軍外國語學院學報(2):125-133.

王克非.2003.英漢/漢英語句對應的語料庫考察[J].外語教學與研究(6):410-417.

王克非、胡顯耀.2008.基于語料庫的翻譯漢語詞匯特征研究[J].中國翻譯(6):16-21.

王克非、胡顯耀.2010.漢語文學翻譯中人稱代詞的顯化和變異[J].中國外語(4):16-21.

王克非、秦洪武.2009.英譯漢語言特征探討——基于對應語料庫的宏觀分析[J].外語學刊(1):102-105.

夏云.2013.英譯漢文學語言形合特征的歷時研究[J].外語教學與研究(1):105-116.

夏云.2014.現(xiàn)代漢語“被”字句語義特征和結構容量的演化:語言接觸視角[J].外文研究(4):89-94.

肖忠華.2012.英漢翻譯中的漢語譯文語料庫研究[M].上海:上海交通大學出版社.

肖忠華、戴光榮.2010.尋求“第三語碼”—基于漢語譯文語料庫的翻譯共性研究[J].外語教學與研究(1):52-58.

許文勝.2015.基于語料庫的英漢文學作品銜接性副詞對比研究[J].外語教學與研究(2):214-224.

許文勝、張柏然.2006.基于英漢名著語料庫的因果關系連詞對比研究[J].外語教學與研究(4):292-296.

楊惠中.2002.語料庫語言學導論[M].上海:上海外語教育出版社.

趙秋榮.2014.翻譯與現(xiàn)代漢語中數(shù)量詞的使用:基于歷時語料庫的分析[J].外文研究(4):95-101.

朱一凡、胡開寶.2014.“被”字句的語義趨向與語義韻[J].外國語(1):53-64.

(責任編輯 管新潮)

H315.9

A

1674-8921-(2016)06-0040-07

10.3969/j.issn.1674-8921.2016.06.007

朱一凡,博士,上海交通大學外國語學院跨語言處理與語言認知基地翻譯與跨文化研究中心副教授。主要研究方向為漢英對比與翻譯、語料庫譯學。電子郵箱:aliciazhu @sjtu.edu.cn

*本文是國家社會科學基金青年項目“基于語料庫的英漢翻譯對當代漢語影響的研究(1980~2010)”(編號11CYY005)的階段性成果。

猜你喜歡
代詞原創(chuàng)語料
2021年本刊原創(chuàng)題(二)
代詞(一)
代詞(二)
這樣將代詞考分收入囊中
從題海中來,到原創(chuàng)中去
——記我的原創(chuàng)感悟
基于語料調查的“連……都(也)……”出現(xiàn)的語義背景分析
完形填空原創(chuàng)專練
《苗防備覽》中的湘西語料
國內外語用學實證研究比較:語料類型與收集方法
原創(chuàng)地帶