鄧倩
摘要:本文通過(guò)分析中國(guó)日?qǐng)?bào)網(wǎng)發(fā)布的習(xí)近平建黨百年的講話,運(yùn)用語(yǔ)料庫(kù)和計(jì)量的方法分析其詞匯的詞頻、詞長(zhǎng)、詞匯密度以及型例比使用特征。研究表明,源語(yǔ)料型例比(8.92)、詞匯密度(30.95%)均低于譯語(yǔ)料的型例比(11.63)、詞匯密度(52.96%),源語(yǔ)料的詞匯豐富程度較低;詞頻和詞長(zhǎng)分布分析發(fā)現(xiàn)兩個(gè)語(yǔ)料中排名前10的高頻詞有部分英漢對(duì)應(yīng)的詞語(yǔ)出現(xiàn),表明其主題比較集中;源語(yǔ)料的平均詞長(zhǎng)1.45,譯語(yǔ)料的平均詞長(zhǎng)3.58,表明源語(yǔ)料的文本難度相對(duì)較低而譯語(yǔ)料的長(zhǎng)詞較多,文本較復(fù)雜。筆者認(rèn)為翻譯策略的差異以及受眾不同可能會(huì)產(chǎn)生這些詞匯特征。
關(guān)鍵詞:語(yǔ)料庫(kù);計(jì)量;詞匯特征;建黨百年
1.引言
2021年是我們黨成立百年的日子,對(duì)我國(guó)有著重大的歷史意義。詞匯不僅要傳達(dá)其表層含義更要讓受眾領(lǐng)會(huì)到其更深層次的含義。有著不同文化背景的讀者對(duì)文本有著大不相同的理解,如果只是簡(jiǎn)單的詞與詞相互對(duì)應(yīng),則會(huì)出現(xiàn)不同程度的誤解,這種現(xiàn)象在政治話語(yǔ)中尤為突出。
在已有的詞匯研究中,國(guó)內(nèi)學(xué)者進(jìn)行了相應(yīng)的詞匯研究主要從以下兩方面進(jìn)行:一是教學(xué)詞匯方面的研究(夏靜 2021);二是文學(xué)作品中的詞匯研究(曾江江 2020)。還有少部分從新聞?wù)Z篇以及法律語(yǔ)篇等著手。從已有的研究來(lái)看部分學(xué)者基于語(yǔ)料庫(kù)分析政治話語(yǔ);部分學(xué)者通過(guò)分析譯本的用詞風(fēng)格來(lái)探討其差異;只有少部分學(xué)者基于語(yǔ)料庫(kù)并使用計(jì)量語(yǔ)言學(xué)的相關(guān)計(jì)量指標(biāo)如型例比、詞長(zhǎng)等,還有相關(guān)計(jì)量軟件等對(duì)政治話語(yǔ)的詞匯系統(tǒng)進(jìn)行分析。因此,本文選取習(xí)近平總書(shū)記在今年七月一號(hào)《在慶祝中國(guó)共產(chǎn)黨成立100周年大會(huì)上的講話》為研究語(yǔ)料,英漢兩個(gè)版本的語(yǔ)料均從中國(guó)日?qǐng)?bào)網(wǎng)下載并自建平行語(yǔ)料庫(kù);為便于區(qū)分,漢語(yǔ)版本的語(yǔ)料料庫(kù)稱為源語(yǔ)料,英語(yǔ)版本的語(yǔ)料稱為譯語(yǔ)料;源語(yǔ)料共有7321個(gè)詞語(yǔ),譯語(yǔ)料共有5574個(gè)詞。2021年正值建黨一百周年的偉大時(shí)間點(diǎn),分析構(gòu)架最高領(lǐng)導(dǎo)人的重要講話具有一定的現(xiàn)實(shí)意義,能夠讓讀者充分了解國(guó)家領(lǐng)導(dǎo)人對(duì)人民、對(duì)青年、對(duì)國(guó)家、對(duì)社會(huì)的殷切希望和美好愿景;在應(yīng)用方面,本文通過(guò)自建平行語(yǔ)料庫(kù),運(yùn)用計(jì)量語(yǔ)言學(xué)的相關(guān)計(jì)量指標(biāo)如平均詞長(zhǎng)、詞頻來(lái)分析語(yǔ)料中詞長(zhǎng)特征;通過(guò)型例比、詞匯密度來(lái)分析文本的豐富程度以及可讀性等;通過(guò)高頻詞分析文本在使用詞性方面的差異對(duì)文本中的詞匯進(jìn)行計(jì)量研究,為政治話語(yǔ)的詞匯系統(tǒng)分析提供了可行路徑。本文通過(guò)自建平行語(yǔ)料庫(kù),運(yùn)用計(jì)量的方法和軟件對(duì)習(xí)近平同志在建黨百年大會(huì)中的講話對(duì)其中英詞匯進(jìn)行定性和定量的分析,旨在回答以下問(wèn)題:一是源語(yǔ)料和譯語(yǔ)料各自的詞匯特征是什么?二是通過(guò)對(duì)比,分析產(chǎn)生該結(jié)果的原因是什么?
2.研究方法和計(jì)量指標(biāo)
計(jì)量語(yǔ)言學(xué)是以語(yǔ)言文本為研究對(duì)象,以定量方法為主,但注重定性和定量的方法結(jié)合,在研究中使用多種計(jì)量指標(biāo)對(duì)文本屬性進(jìn)行量化統(tǒng)計(jì)是計(jì)量語(yǔ)言學(xué)和傳統(tǒng)語(yǔ)言學(xué)研究的顯著區(qū)別之一(韋愛(ài)云 2019)。下文將詳細(xì)介紹分析語(yǔ)料的相關(guān)研究方法以及計(jì)量指標(biāo)。
2.1計(jì)量指標(biāo)
2.1.1型例比
型例比(Type-token ratio)是語(yǔ)料庫(kù)語(yǔ)言學(xué)最常用的術(shù)語(yǔ),也是計(jì)量語(yǔ)言學(xué)最常用語(yǔ)言文本計(jì)量指標(biāo)之一。這個(gè)比率與文本作者使用語(yǔ)言詞語(yǔ)熟練程度有關(guān)。其中型即詞型,指的是一個(gè)文本中不重復(fù)的詞的數(shù)量;例即詞例,指的是一個(gè)文本中詞的總數(shù),反映文本的長(zhǎng)度規(guī)模(韋愛(ài)云 2019)。其計(jì)算公式為型例比=型符/例符。
2.1.2詞長(zhǎng)和詞頻
在研究詞匯的基本屬性中最常見(jiàn)的則是詞頻和詞長(zhǎng)。詞長(zhǎng)是指某個(gè)詞匯的長(zhǎng)度,比如某個(gè)單詞是單音節(jié)詞匯它的詞長(zhǎng)就相對(duì)較短;而如果一個(gè)單詞是三音節(jié)詞匯它的詞長(zhǎng)則較長(zhǎng),因此這一特征在一定程度上表明了文本的難易程度、文本的文體風(fēng)格以及可讀性。詞頻則是指某個(gè)單詞在該語(yǔ)料中出現(xiàn)的次數(shù),它也在一定程度上體現(xiàn)利潤(rùn)該文本的文本風(fēng)格。
2.1.3詞匯密度
詞匯密度是某個(gè)特定文本中出現(xiàn)的實(shí)義詞數(shù)量與全文總詞匯的比例。當(dāng)文本中出現(xiàn)的實(shí)義詞較多則表明該文本的詞匯密度較大。在英語(yǔ)中,一個(gè)單詞可以蘊(yùn)含多種語(yǔ)義即即可當(dāng)名詞也可作動(dòng)詞等,因此當(dāng)文本中出現(xiàn)多種實(shí)義詞類,文本的復(fù)雜度和難度則相對(duì)較高,因此該文本則包含了更多的內(nèi)容,帶給讀者相對(duì)大的難度,并且對(duì)讀者閱讀理解能力有一定的要求。
2.2研究方法
文章采用定性和定量的方法,以2021年七月一號(hào)習(xí)近平總書(shū)記在中國(guó)共產(chǎn)黨建立一百周年大會(huì)上的講話的英漢版本自建平行語(yǔ)料庫(kù),使用相關(guān)軟件如詞性標(biāo)注軟件Tree tagger,檢索軟件Antconc以及文本計(jì)量指標(biāo)的分析工具QUITA。首先,在中國(guó)日?qǐng)?bào)網(wǎng)下載習(xí)近平總書(shū)記建黨百年講話的中英文版本,轉(zhuǎn)存為文本文件。其次,使用軟件Tree tagger等軟件對(duì)中英文版本進(jìn)行詞性標(biāo)注。然后利用語(yǔ)言分析軟件對(duì)語(yǔ)料進(jìn)行分析如詞匯密度、詞頻、平均詞長(zhǎng)等并探討講話中英漢版本的詞匯特征。
3.英漢語(yǔ)料詞匯特征
以下內(nèi)容將從型例比,詞長(zhǎng)等方面對(duì)創(chuàng)建的語(yǔ)料庫(kù)從探討講話中英漢語(yǔ)料的詞匯特征,進(jìn)而對(duì)比分析他們之前存在的差異以及原因。
3.1詞匯密度
測(cè)量詞匯密度常見(jiàn)的方式有兩種,一是語(yǔ)料庫(kù)語(yǔ)言學(xué)中常用的型例比,但這種方法也有一定的缺陷,因?yàn)樗慕y(tǒng)計(jì)結(jié)果不能很好地反映該文本最根本的特征。表3-1是通過(guò)文本計(jì)量軟件QUITA統(tǒng)計(jì)的兩個(gè)語(yǔ)料庫(kù)中型符數(shù)、例符數(shù)以及型例比。
從表3-1可以看出,源語(yǔ)料的型符數(shù)為775,譯語(yǔ)料的型符數(shù)為1262;源語(yǔ)料的例符數(shù)為8685,譯語(yǔ)料的例符數(shù)為10854;源語(yǔ)料的型例比為8.92,低于譯語(yǔ)料的型例比11.63,通過(guò)以上數(shù)據(jù)基本可以清晰譯語(yǔ)料中的詞匯比源語(yǔ)料中的詞匯更加豐富且重復(fù)詞匯較少,源語(yǔ)料詞匯變化相對(duì)少一些并且譯語(yǔ)料的文本明顯擴(kuò)大,由此反映出譯語(yǔ)料的閱讀難度比源語(yǔ)料的閱讀難度高。第二種方式是二是根據(jù)詞匯密度詞來(lái)衡量語(yǔ)篇的信息量大小和文本難度。本文統(tǒng)計(jì)了動(dòng)詞、形容詞等實(shí)義詞的詞頻從而更加全面的分析兩個(gè)語(yǔ)料庫(kù)的詞匯特征。
由圖表可知源語(yǔ)料中四類實(shí)詞的詞頻均低于譯語(yǔ)料中的相應(yīng)詞頻;但源語(yǔ)料的總字詞數(shù)明顯高于譯語(yǔ)料的總字詞數(shù);譯語(yǔ)料的詞匯密度明顯高于源語(yǔ)料的詞匯密度。前文提到文本密度與文本的語(yǔ)言風(fēng)格、閱讀難度有關(guān),因此該結(jié)果表明譯語(yǔ)料的文本難度相對(duì)較大,文中的用詞也相對(duì)比較復(fù)雜。以上兩個(gè)表格呈現(xiàn)的結(jié)果,筆者認(rèn)為有以下兩個(gè)原因,一是漢英語(yǔ)言的差異以及不同的譯者使用了不同的翻譯方法。如例(1)中包含了名詞(中國(guó)等)、動(dòng)詞(需要等)、形容詞(新的);而在例(2)中不僅出現(xiàn)了名詞、動(dòng)詞、形容詞,還出現(xiàn)了介詞(in)和限定詞(a)。
(1)中國(guó)迫切需要新的思想運(yùn)動(dòng)、革命力量。(源文)
(2)China was in urgent need of new ideas and a new revolutionary forces.(譯文)
二是源語(yǔ)料的受眾是全國(guó)人民,其內(nèi)容應(yīng)該通俗易懂,并且整篇文章從“兩個(gè)一百年”奮斗目標(biāo)交匯的歷史方位出發(fā),深刻表達(dá)了慶祝建黨100周年的主題主線;而且“七一”重要講話的語(yǔ)言凸顯真理真事真情,通過(guò)排比句凸顯力量,對(duì)仗結(jié)構(gòu)貫穿全篇,感嘆句多達(dá)五十個(gè),每一處排比、對(duì)仗、感嘆都讓人內(nèi)心深處形成強(qiáng)烈思想共振、情感共鳴。而譯語(yǔ)料的受眾則多數(shù)為外國(guó)友人,其用語(yǔ)也應(yīng)符合英語(yǔ)遣詞造句的規(guī)則。在源語(yǔ)料中出現(xiàn)了很多中國(guó)特色的詞匯如“小康社會(huì)”等,這些特色詞匯是專屬于中國(guó)的,在國(guó)外是找不到相應(yīng)的詞匯來(lái)表達(dá),因此譯者就要針對(duì)這類詞根據(jù)中國(guó)相關(guān)政策法規(guī)做出最通俗易懂的解釋,所以就需要用更多的詞匯,因此出現(xiàn)譯語(yǔ)料實(shí)詞數(shù)量多于源語(yǔ)料實(shí)詞也是情有可原的。前文提到由于該講話的行文結(jié)構(gòu)重復(fù)使用了排比句等句式,從而達(dá)到振奮人心的效果,而在翻譯過(guò)程中,英語(yǔ)多省略和抽象,而漢語(yǔ)傾向于重復(fù)和具體。在并列結(jié)構(gòu)中英語(yǔ)常常省略重復(fù)的詞語(yǔ)如例(3)中三次重復(fù)使用“這是”和“偉大光榮”,而例(4)中將重復(fù)部分省略,而在其后面用三個(gè)介詞短語(yǔ)表示其對(duì)象,顯得更加精煉。
(3)這是中華民族的偉大光榮!這是中國(guó)人民的偉大光榮!這是中國(guó)共產(chǎn)黨的偉大光榮?。ㄔ次模?/p>
(4)This is a great and glorious accomplishment for...(譯文)
3.2詞頻
一般來(lái)說(shuō),功能詞的數(shù)量在很大程度上反映文本的規(guī)范程度與可讀程度。詞頻在語(yǔ)料庫(kù)中可以有效地反映文章的主題,通過(guò)軟件檢索高頻詞,選取排名前十的高頻詞進(jìn)行分析解讀。
結(jié)果顯示,源語(yǔ)料的高頻詞為“的(221)、中國(guó)(116)、人民(69)、偉大(53)、和(53)、共產(chǎn)黨(48)、中華民族(44)、了(41)、是(38)、新(37)”;譯語(yǔ)料的高頻詞為“the(456)、and(311)、of(209)、to(149)、Party(98)、in(96)、a(91)、Chinese(86)、people(81)、China(53)”,(注:括號(hào)的熟悉為詞匯出現(xiàn)的頻次)。兩個(gè)語(yǔ)料中的高頻詞都包含“中國(guó)China”“人民people”“我們we”“黨Party”“偉大great”“和and”“為for”“在in”,表明兩個(gè)語(yǔ)料的主題十分集中都是以“人民、黨、中國(guó)”為主旋律。由表可知連接詞在譯語(yǔ)料中出現(xiàn)的次數(shù)極高,這也驗(yàn)證了英語(yǔ)語(yǔ)言的結(jié)果是重形合,如果沒(méi)有相應(yīng)的連接詞連接,該文本則就像一盤散沙沒(méi)有條理性;中文中一句可出現(xiàn)多個(gè)動(dòng)詞并不需要多個(gè)連接進(jìn)行連接,而英語(yǔ)不行,一個(gè)句子中只能出現(xiàn)一個(gè)動(dòng)詞。從詞性來(lái)看,源語(yǔ)料中的高頻詞主要為名詞,如中國(guó)、偉大、人民等詞和動(dòng)詞如堅(jiān)持、發(fā)展、實(shí)現(xiàn);而譯語(yǔ)料中的高頻詞主要為功能詞以及名詞等,而且相同意義的內(nèi)容用不同語(yǔ)種表達(dá)出來(lái)時(shí),所使用的高頻詞匯也不相同。并且在譯語(yǔ)料中詞頻排名前五中有四個(gè)屬于功能詞;在英語(yǔ)文本中,馮慶華(2008)認(rèn)為the和of的使用頻率可以反映文本的語(yǔ)體正式程度,當(dāng)這兩個(gè)詞在文本中出現(xiàn)的頻率不高,則說(shuō)明文本的語(yǔ)言體裁不那么正式,反之亦然。party一詞出現(xiàn)頻率排名第五,也再次說(shuō)明此次主題與中國(guó)共產(chǎn)黨建立一百周年的偉大事件相契合。高頻詞中人稱詞如“we、我們”都屬于第一人稱,說(shuō)明習(xí)近平總書(shū)記是站在全國(guó)人民、代表我們偉大的中國(guó)共產(chǎn)黨講話,因此更加具有感召力。除此之外,譯語(yǔ)料中的高頻動(dòng)詞is出現(xiàn)了37詞,用一般現(xiàn)在時(shí)來(lái)客觀地陳述中國(guó)乃至中國(guó)共產(chǎn)黨的光輝歷史,也從側(cè)面表明在此次重要講話中的事件都是真實(shí)存在的,表明在建黨前后以及現(xiàn)在中國(guó)的繁榮富強(qiáng)的狀態(tài)都是一直存在的,盡管一路走來(lái)出現(xiàn)過(guò)大大小小的問(wèn)題,但中國(guó)共產(chǎn)黨都是客觀對(duì)待并對(duì)自己的問(wèn)題進(jìn)行批評(píng)與自我批評(píng)。
3.3詞長(zhǎng)
文本中使用的詞匯長(zhǎng)度對(duì)文本的理解難度有一定的影響。而平均詞長(zhǎng)則是文本中不重復(fù)詞的數(shù)量的平均長(zhǎng)度,如果文本中平均詞長(zhǎng)越長(zhǎng)就說(shuō)明文本中長(zhǎng)詞比較多,就如中文中兩個(gè)相同意思的詞語(yǔ),但一個(gè)是兩個(gè)字一個(gè)是四個(gè)字則四個(gè)字的詞語(yǔ)可讀性更難。源語(yǔ)料和譯語(yǔ)料的平均詞長(zhǎng)數(shù)據(jù)如表3-4所示。
從表3-4看出,譯語(yǔ)料的平均詞長(zhǎng)明顯高于源語(yǔ)料的平均詞長(zhǎng),與型例比的結(jié)果相一致。數(shù)據(jù)表明源語(yǔ)料的可讀性高于譯語(yǔ)料的可讀性。該現(xiàn)象的產(chǎn)生也有一部分歸因于英語(yǔ)可以通過(guò)詞性的不同來(lái)變換使用單詞,因此譯語(yǔ)料的型符數(shù)遠(yuǎn)遠(yuǎn)高于源語(yǔ)料的型符數(shù)。
4.總結(jié)
本文基于真實(shí)的語(yǔ)料,采用語(yǔ)料庫(kù)驅(qū)動(dòng)的計(jì)量語(yǔ)言學(xué)研究方法,選取習(xí)近平總書(shū)記在2021年7月1號(hào)建立中國(guó)共產(chǎn)一百周年大會(huì)上的講話的中英文版本為研究語(yǔ)料,對(duì)其進(jìn)行定量和定性分析,從詞匯層面研究建黨百年大會(huì)上的講話中的英漢詞匯特征,并分析其原因。研究表明,在詞匯豐富程度方面,本文通過(guò)對(duì)比源語(yǔ)料和譯語(yǔ)料的型例比和詞匯密度來(lái)進(jìn)行分析:源語(yǔ)料的型例比為8.92,譯語(yǔ)料的型例比為11.63,源語(yǔ)料的型例比明顯低于譯語(yǔ)料的型例比;繼而統(tǒng)計(jì)了語(yǔ)料庫(kù)中的實(shí)義詞的出現(xiàn)次數(shù)討論其詞匯密度。筆者認(rèn)為有以下原因:一是漢英語(yǔ)言的差異和譯者在漢譯英過(guò)程中使用的翻譯策不同;觀察得出,源語(yǔ)料中出現(xiàn)大量排比句、感嘆句等,其目的是為了引起共鳴,讓人內(nèi)心深處形成強(qiáng)烈的思想共振,因此會(huì)出現(xiàn)相當(dāng)多的重復(fù),而在英語(yǔ)翻譯策略中,相同的句式或詞匯都會(huì)選擇省略;二是此次講話的受眾不同,源語(yǔ)料的受眾是全國(guó)人民各個(gè)階層、不同年齡段的人們,其內(nèi)容應(yīng)該通俗易懂,而閱讀譯語(yǔ)料的大部分是外國(guó)人,大量具有中國(guó)特色的詞匯在英文中無(wú)明確的對(duì)應(yīng)詞,譯者需要用受眾能懂的語(yǔ)言進(jìn)行分析解讀,因此源語(yǔ)料的型例比和詞匯密度均低于譯語(yǔ)料的詞匯密度。在詞長(zhǎng)詞頻方面,譯語(yǔ)料的平均詞長(zhǎng)明顯高于源語(yǔ)料的平均詞長(zhǎng),存在的原因可能為漢語(yǔ)的詞語(yǔ)可以翻譯為英語(yǔ)中同義但不同詞性的詞;通過(guò)分析,兩個(gè)語(yǔ)料庫(kù)的高頻詞中都出現(xiàn)了部分相互對(duì)應(yīng)的中英詞,表明其主題集中度高。對(duì)國(guó)家領(lǐng)導(dǎo)人在重大時(shí)間點(diǎn)的講話進(jìn)行分析有利于幫助讀者解讀,為政治話語(yǔ)的詞匯研究提供新思路。
參考文獻(xiàn)
[1] 馮慶華. 母語(yǔ)文化下的譯者風(fēng)格[M]. 上海: 上海外語(yǔ)教育出版社, 2008.
[2] 韋愛(ài)云. 壯語(yǔ)詞匯系統(tǒng)的計(jì)量研究[D]. 浙江大學(xué), 2019.
[3] 夏靜. 基于語(yǔ)料庫(kù)的英語(yǔ)教材詞匯研究[D]. 天津師范大學(xué), 2021.
[4] 曾江江. 基于語(yǔ)料庫(kù)的《浮生六記》英譯本詞匯特征研究[D]. 華僑大學(xué), 2020.