孫麗
摘要:將中國大學(xué)生英漢漢英口筆譯語料庫和英國國家語料庫作為參照語料庫.對自建應(yīng)用型本科院校學(xué)習(xí)者語料庫的詞語豐富度、詞長分布、詞匯難度、詞匯密度、平均句長和形合度等詞匯、句法和語篇的特征進行研究,從學(xué)習(xí)者譯文的角度部分驗證了翻譯共性的簡化、明確化和規(guī)范化假說,也發(fā)現(xiàn)源語滲透效應(yīng)對學(xué)習(xí)者翻譯中實詞使用和句長的影響。
關(guān)鍵詞:應(yīng)用型本科院校;語料庫;語言特征;翻譯普遍性;源語滲透效應(yīng)
中圖分類號:H315.9文獻標志碼:A 文章編號:2095-5383(2019)03-0096-05
自20世紀90年代,基于語料庫的翻譯研究已逐漸成熟,研究成果頗豐。筆者以“語料庫”和“翻譯”為主題詞在中國知網(wǎng)進行搜索,共得到5177條記錄。筆者對這些論文進行梳理發(fā)現(xiàn)國內(nèi)現(xiàn)有的基于語料庫的翻譯研究主要集中在以下方面的內(nèi)容:介紹語料庫翻譯學(xué)理論、研究對象和研究方法、語料庫建設(shè);探討語料庫在翻譯教學(xué)中應(yīng)用的可行性,構(gòu)建基于語料庫的翻譯教學(xué)模式,提升翻譯教學(xué)質(zhì)量;基于語料庫對經(jīng)典著作譯作文本的語言特征、翻譯共性和譯者風格的研究。本研究將以現(xiàn)有研究為基礎(chǔ),對自建學(xué)習(xí)者漢譯英譯文為語料進行研究,將中國大學(xué)生英漢漢英口筆譯語料庫和英國國家語料庫作為參照語料庫,一方面,探索應(yīng)用型本科院校英語專業(yè)學(xué)習(xí)者在詞語、句式和語篇等方面呈現(xiàn)的語言特征,另一方面,研究學(xué)習(xí)者譯文是否符合翻譯共性的簡化、明確化和規(guī)范化假說,并嘗試作出進一步解釋。
1翻譯普遍性
英國曼徹斯特大學(xué)的Mona Baker早在1993年就提出了翻譯普遍性(即翻譯共性),她將翻譯普遍性定義為“譯文而非原文中展現(xiàn)的典型特征”。而后越來越多的學(xué)者關(guān)注并發(fā)展了翻譯普遍性假說,他們認為翻譯共性主要包括簡化、顯化、規(guī)范化等特征。Laviosa利用可比語料庫考察翻譯文本的簡化特征,她指出翻譯文本在詞匯范圍、實詞和功能詞使用比例、平均句長方面呈現(xiàn)簡略化趨勢。顯化,也稱明確化,最早由Blum-Kulka提出,她認為,譯者傾向于添加銜接性標記和額外信息幫助讀者理解。Vanderawera指出了明確化的方法,如使用插入語,擴展?jié)饪s篇章,增添修飾詞、限定詞和連接詞,增加額外信息和明確信息等。規(guī)范化,也稱作保守化,指的是翻譯語言具有“遵從甚至夸大譯入語中典型特征和表達法的趨勢”;譯者有意識或無意識地將原文獨特的文本特征翻譯為與譯語典型的文本特征一致,即消除原文的獨特性使譯文更加規(guī)范化?!霸凑Z滲透效應(yīng)”(source language shiningthrough)作為翻譯共性假說的一種,指翻譯文本較為貼近源語的特征。
2研究方法
本研究所使用的語料庫分別是自建的學(xué)習(xí)者漢譯英譯本語料庫(簡稱LCCE)、中國大學(xué)生英漢漢英口筆譯語料庫(PACCEL)和英國國家語料庫(BNC)。本研究中的自建語料庫總形符數(shù)為30745字,為某應(yīng)用型本科院校英語專業(yè)大三學(xué)生在筆譯學(xué)習(xí)中的漢譯英譯本語料,文章共26篇,其中包括文學(xué)體裁(小說)9篇,法律題材說明文1篇,描寫記敘文5篇,地理狀況說明文1篇,科普說明文10篇?!吨袊髮W(xué)生英漢漢英口筆譯語料庫》收錄了全國18所高等院校英語專業(yè)三、四年級學(xué)生的英漢、漢英口譯和筆譯翻譯測試語料,本研究使用其中的漢譯英筆譯平行語料庫的譯文部分,總詞容量為493534字。英國國家語料庫詞容量近1億,本研究使用其筆語部分的語料進行研究。
本研究使用Worthsmith Tool 6.0統(tǒng)計語料庫的類符、形符、類符/形符比、詞長和平均句長;利用Tree Tagger詞性賦碼器對LCCE和PACCEL兩種學(xué)習(xí)者語料進行詞性賦碼,利用Range軟件統(tǒng)計語料庫詞表,利用AntConc對賦碼后的語料庫進行詞匯密度和功能詞的統(tǒng)計;利用BNCweb(CQP-Edition)在線(網(wǎng)址:http://bncweb.1ancs.ac.uk/)統(tǒng)計BNC的詞匯密度和功能詞數(shù)量。
3學(xué)習(xí)者語料語言特征分析
3.1詞語層面
3.1.1詞語豐富度:類符形符比
類符型符比(TTR)指的是語料庫中類符和型符的比例,是衡量文本中詞匯密度的常用方法,但是用它來計算長度不等的文本詞匯密度并不合理,常用的補救方法是標準化類符型符比,即標準類符/型符比(STTR)。STTR值越大,詞語使用的重復(fù)率越低,詞語使用越豐富。由于LCCE和PACCEL中部分單個文本形符數(shù)較少,單一文本在wordsmith中分析時,STTR無法計算,筆者將所有txt文檔先壓縮,將壓縮文件名rar改為戧t就得到了兩種學(xué)習(xí)者語料各自所有文檔的一個合并文檔,并據(jù)此再做進一步分析。表1是wordsmith6.0對3種語料的形符、類符、類形符比和標準類/形符比的統(tǒng)計數(shù)據(jù)。
表1顯示,LCCE的STTR值(38.22)介于PACCEL(30.57)和BNC(43.10)之間,卡方檢驗的結(jié)果顯示,LCCE與PACCEL的平均差(+7.56)具有顯著性差異(X2=307.79,P<0.05),LCCE與BNC的平均差(-4.88)也具有顯著性差異(X2=54629.73,P<0.05)。這表明,自建學(xué)習(xí)者語料庫的詞語使用豐富度高于PACCEL,但兩者均低于英語母語使用者,該結(jié)果驗證了Laviosa的翻譯“簡化共性假設(shè)”。而對于兩種學(xué)習(xí)者語料庫的差異,筆者認為,PACCEL收錄的是全國18所高校英語專業(yè)學(xué)生的筆譯測試語料,學(xué)生是在沒有借助任何翻譯工具的情況下完成的,而LCCE的學(xué)習(xí)者是在課下完成,教師鼓勵使用各種翻譯工具,這可能是促成LCCE詞語豐富度高于PACCEL的原因之一。
3.1.2詞長分布
詞長指單詞長度,即單詞構(gòu)成的字母數(shù)量,詞長越長,單詞的復(fù)雜度越大,在一定程度上可以反映語料庫文本的復(fù)雜度。筆者使用wordsmith 6.0對詞長分布進行了統(tǒng)計,從平均詞長來看,BNC平均詞長是4.66,LCCE是4.43,PACCEL是4.72;鑒于3種語料庫容量不同,筆者將詞長數(shù)量進行了標準化處理,圖1為3種語料庫每千字的詞長分布情況。
如圖1所示,在2和8個字母詞匯的使用上,BNC遠少于其他兩個語料庫,在1~17詞的使用上(除2和8個字母詞之外),三種語料庫差異不大。在18以上字母詞的使用方面,兩種學(xué)習(xí)者語料庫都為0,而BNC語料庫則從0.14/千詞呈逐漸遞減趨勢。從18以上字母超長詞來看,兩種學(xué)習(xí)者語料庫采用了相對簡單的詞匯,譯文可讀性高,這樣的結(jié)果也驗證了翻譯共性的“簡化趨勢”。
3.1.3詞表:詞匯難度分析
Range BNC是基于整個BNC語料統(tǒng)計詞匯的跨文本分布情況。Paul Nation主張利用詞簇信息判斷詞匯難度和豐富度,而梁茂成等認為三級詞表中,第三級和詞表外詞匯,特別是第三級詞表的類符對文本整體的詞匯難度有較好的判斷能力。筆者利用Range BNC對LCCE和PACCEL對詞匯分布進行了統(tǒng)計,結(jié)果如表2、表3所示。
表2、3顯示,從詞簇來看,LCCE有271個詞簇屬于第三級詞表,在PACCEL中只有114個;從類符列來看,LCCE有366個類符屬于第三級詞表,占總類符的9.02%,而PACCEL有147個類符屬于第三級詞表,占總類符的5.02%。無論是從詞簇還是類符來看,LCCE的詞匯難度和豐富度都高于PACCEL,這與兩語料庫的標準類符/形符比的結(jié)果一致。
3.1.4詞匯密度
詞匯密度是指實詞占總形符數(shù)的百分比。詞匯密度可以衡量不同文本在信息上的差異和難度大小,詞匯密度偏高,則說明文本信息含量大,難度相應(yīng)偏大。筆者利用TreeTagger對LCCE和PACCEL兩種語料庫進行詞性賦碼.利用AntoConc的wordlist的搜索功能對實詞(形容詞、副詞、動詞和名詞)所對應(yīng)的不同編碼進行搜索;利用BNCweb(CQP-Edition)在線統(tǒng)計BNC語料庫的實詞數(shù)量。圖2為3種語料庫每千詞的實詞統(tǒng)計。
統(tǒng)計顯示,LCCE、PACCEL和BNC的實詞使用比例分別是59.01%、55.75%和51.87%,LCCE和PACCEL實詞使用高于英語本土使用者,這表明兩種學(xué)習(xí)者語料庫的信息承載量高于英語本土使用者,這與Laviosa”譯文實詞使用比例呈簡化趨勢”的說法相違背。從具體實詞的使用來看,LCCE的形容詞使用高于BNC,但這種差異不具備顯著性(P>0.05),動詞和名詞使用均高于BNC,且差異具有顯著性(P<0.05),副詞使用低于BNC,差異也具有顯著性;PACCEL形容詞和動詞使用高于BNC,副詞和名詞使用則低于BNC,4種實詞的使用均呈現(xiàn)顯著性差異(P<0.05)。與英語本土使用者相比,兩種學(xué)習(xí)者語料庫的形容詞和動詞使用均呈現(xiàn)較高態(tài)勢,副詞使用呈低態(tài)勢;在名詞使用上,與BNC相比,LCCE較高,而PACCEL則較低。
筆者認為,學(xué)習(xí)者在翻譯時使用了更多的實詞加大信息含量以明確譯文信息,這符合Blum-Kulka提出的明確化原則,通過增添和擴展的方法增加和明確信息。LCCE學(xué)習(xí)者增加了名詞的使用,用于解釋概念和范疇,使譯文信息更清晰易懂。LCCE和PACCEL語料的動詞使用也呈顯化特征,這可能是因為學(xué)習(xí)者在翻譯中采用了轉(zhuǎn)譯成動詞的翻譯方法,以準確表達源語信息,增加譯文的連貫性。與英語本土使用者相比,兩種學(xué)習(xí)者語料庫在形容詞使用上也呈顯化特征,這可能與英漢語言形容詞的功能差異有關(guān),張益芳等指出,“漢語形容詞在句中所起的語法作用要比英語形容詞多,英語形容詞通常用作定語修飾名詞或表語來說明主語的特征或狀態(tài),而漢語形容詞除了作定語外,還可以充當謂語、狀語甚至主語和賓語”。受源語滲透效應(yīng)影響,學(xué)習(xí)者過度使用形容詞,從而導(dǎo)致形容詞使用高于英語母語使用者,呈現(xiàn)了顯化特征。在副詞使用上,兩種學(xué)習(xí)者語料庫均低于英語本土使用者,這與英漢副詞在各自語言中的功能和地位差異相關(guān),姚吉剛等指出,“英語副詞的語法功能較多,接近實詞,漢語副詞語法功能相對較少,介于實詞和虛詞之間。英語副詞的詞類地位高于漢語副詞”。同樣,受到源語效應(yīng)影響,學(xué)習(xí)者的副詞使用低于英語母語使用者。
3.2句法和語篇層面
3.2.1平均句長
平均句長是指以單詞為單位,計算每個句子平均的單詞量。Buffer根據(jù)句長將句子分為三類:短句(1-9詞)、中句(10-25詞)、長句(>25詞)。就整個語料庫而言,句子的長短在一定程度上反映句子的復(fù)雜度,句子越長,目標讀者的閱讀復(fù)雜度越高。統(tǒng)計結(jié)果顯示,LCCE、PACCEL和BNC的平均句長分別為15.95、18.77和26.75詞,LCCE和PACCEL平均句長均屬于中句,而BNC屬于長句,這符合Laviosa提出的譯文簡略化傾向,即翻譯文本的句子平均長度比翻譯文本的句子平均長度短。這表明,中國翻譯學(xué)習(xí)者受地源語影響,短句較多,句子結(jié)構(gòu)相對簡單,傾向使用短句再現(xiàn)源文本內(nèi)容。
3.2.2形合度
功能詞數(shù)量在總詞頻中所占的比例稱為形合度。功能詞在語料中的比例越大,句法顯化程度越高,形合度則就越高,反之則越低。功能詞包括并列連詞、介詞或從屬連詞、人稱代詞、所有格代詞、不定式to和疑問代詞。筆者利用前文提到的詞匯密度的統(tǒng)計方法,對3種語料中的6種功能詞數(shù)量進行統(tǒng)計,圖3為3種語料庫每千詞功能詞的數(shù)量。
統(tǒng)計顯示,LCCE、PACCEL和BNC的功能詞使用比依次為為23.49%、18.95%和21.23%,LCCE功能詞使用比例最高,BNC處于LCCE和PACCEL之間。從功能詞總體使用比例來看,PACCEL符合而LCCE則違背了翻譯普遍性的簡化特征。LCCE學(xué)習(xí)者通過增加功能詞的使用實現(xiàn)譯文的語篇銜接,使其更符合英語語言形合的特征,這符合翻譯普遍性的規(guī)范化特征。
與BNC相比,LCCE和PACCEL在并列連詞、不定式to和疑問代詞使用高于BNC,且卡方檢驗結(jié)果顯示差異均具有顯著性(P<0.05);在介詞或從屬連詞方面,兩種學(xué)習(xí)者語料庫均呈現(xiàn)低于BNC的趨勢,且差異具有顯著性(P<0.05);在人稱代詞方面,LCCE使用高于BNC,而PACCEL則低于BNC,且兩種差異均具有顯著性(P<0.05)。從具體功能詞的使用來看,兩種學(xué)習(xí)者語料在并列連詞、不定式to和疑問代詞的使用方面均高于英語母語使用者,介詞或從屬連詞的使用低于英語母語使用者,對于人稱代詞的使用兩種學(xué)習(xí)者語料庫則呈現(xiàn)了不同的態(tài)勢。對于本研究中的LCCE學(xué)習(xí)者來說,盡管使用了大量的功能詞,但平均句長仍低于PACCEL和BNC,這足以表明LCCE學(xué)習(xí)者句式復(fù)雜度較低,從這角度來說,LCCE語料符合翻譯普遍性的簡化原則,學(xué)習(xí)者通過結(jié)構(gòu)簡單的句式再現(xiàn)原文本內(nèi)容。
4結(jié)論
本研究將自建學(xué)習(xí)者語料庫與中國大學(xué)生英漢漢英口筆譯語料庫和英國國家語料庫進行對比分析,從詞語豐富度、詞長分布、詞匯難度、詞匯密度、平均句長和形合度等方面對學(xué)習(xí)者譯文的詞匯、句法和語篇等方面的特征進行了研究。研究發(fā)現(xiàn),兩種學(xué)習(xí)者語料庫的詞語豐富度和18及以上字母詞的使用上低于英語本族語者,這進一步驗證了翻譯普遍性的簡化趨勢;與PACCEL相比,自建學(xué)習(xí)者語料庫的詞匯難度和豐富度較高:兩種學(xué)習(xí)者語料庫的詞匯密度均高于BNC,自建學(xué)習(xí)者語料庫和PACCEL通過增加不同實詞使用加大文本信息含量以明確譯文信息,符合翻譯普遍性的明確化特征;受地源語的影響,與英語本族語相比,兩種學(xué)習(xí)者語料庫的形容詞使用偏高,副詞使用則偏低。從句法和語篇層面看,自建語料庫學(xué)習(xí)者利用功能詞實現(xiàn)英語語篇銜接,這符合翻譯普遍性的規(guī)化特征。但是,盡管使用了大量的功能詞,其平均句長仍低于英語本土使用者,這表明學(xué)習(xí)者句式復(fù)雜度較低,符合簡化特征。
本研究存在不足之處,語料來源于僅限于1所應(yīng)用型本科院校的學(xué)習(xí)者翻譯語料,且?guī)烊萘枯^小,今后的研究可以關(guān)注更多同類院校學(xué)習(xí)者的語料。以提升研究結(jié)論的可靠性。