張 航
(信息工程大學(xué) 洛陽校區(qū),河南 洛陽 471003)
隨著國家“一帶一路”戰(zhàn)略的實施以及經(jīng)濟全球化的縱深發(fā)展,英語作為各國文化交流以及信息傳播的主要語言媒介,其重要性日益凸顯,而各國間密切的經(jīng)濟合作與貿(mào)易往來則使得商務(wù)英語逐漸成為語言學(xué)界研究的熱點領(lǐng)域。當前,財經(jīng)新聞不僅是獲取經(jīng)濟與貿(mào)易領(lǐng)域信息、大數(shù)據(jù)的主要來源,更成為翻譯教學(xué)、文本寫作等方面的重要教學(xué)內(nèi)容。因此,本文對英漢財經(jīng)新聞的文本特征進行分析研究,以期為商務(wù)英語、翻譯教學(xué)以及商務(wù)文本寫作提供思考與借鑒。
一直以來,翻譯研究盡管長期存在,其研究重心卻放在以《圣經(jīng)》翻譯為主體的宗教翻譯領(lǐng)域,直至20世紀后半葉才逐漸形成一門獨立的學(xué)科(Munday,2014)。James S. Holmes(1988)在《翻譯研究的名稱與性質(zhì)》一文中將“獨立學(xué)科”的概念引入翻譯研究領(lǐng)域,并對翻譯學(xué)所涵蓋的研究內(nèi)容提出了較為完整的框架。
20世紀60年代,奈達與卡特福德開始了描述性翻譯研究的探索后,翻譯研究的重點逐漸從規(guī)定性研究轉(zhuǎn)向描述性研究。Gideion Toury在《描述翻譯研究及其他》(1995)認同Holmes提出的有關(guān)描述翻譯學(xué)的設(shè)想,并將其提出的翻譯研究領(lǐng)域框架以圖表的形式加以展現(xiàn),如圖1所示?!凹兝碚摲g學(xué)”包括兩個方面,即對實際發(fā)生的翻譯現(xiàn)象進行描述的描述翻譯研究以及對翻譯現(xiàn)象進行解釋和預(yù)測的翻譯理論研究(Holmes,1972)。其中,描述翻譯研究避免了以往規(guī)定性研究基于譯文所進行的翻譯批評,而是將翻譯視為一種文化和歷史現(xiàn)象,在目的語社會文化的環(huán)境中考察翻譯與譯入語文化的互動關(guān)系(韓子滿,劉芳,2005)。20世紀80年代,翻譯理論研究又經(jīng)歷了從“微觀”到“宏觀”層面的轉(zhuǎn)變,將翻譯作為跨文化交際活動的一部分,從對文本中“字”、“詞”、“短語”及“句法”層面的研究,轉(zhuǎn)向了對社會文化層面的研究,拓展了翻譯研究的領(lǐng)域。
圖1 霍爾姆斯翻譯學(xué)結(jié)構(gòu)圖
語料庫翻譯學(xué)的發(fā)展立足于翻譯學(xué)從“規(guī)定性”研究向“描述性”研究以及“微觀”研究向“宏觀”研究兩個轉(zhuǎn)變。自Mona Baker于1993年發(fā)表《語料庫語言學(xué)與翻譯研究:啟示和應(yīng)用》一文并開創(chuàng)性地指出“語料庫可以用于描寫和分析大量客觀存在的翻譯語料并揭示翻譯的本質(zhì)”(Baker,1993),國內(nèi)語料庫翻譯學(xué)研究不斷發(fā)展。自1993年以來,語料庫研究方法被廣泛地應(yīng)用于翻譯研究領(lǐng)域,研究內(nèi)容包括語言特征、譯者風格、應(yīng)用翻譯、翻譯語料庫建設(shè)及應(yīng)用、語料庫翻譯學(xué)介評以及口譯研究等(宋慶偉,2013)。
商務(wù)英語作為專門用途英語的分支之一,隨著全球經(jīng)濟貿(mào)易的發(fā)展成為了翻譯研究的熱門領(lǐng)域。目前,商務(wù)英語翻譯研究不僅涉及微觀層面的詞匯、句法及語言特征,也涵蓋了宏觀層面的翻譯原則、技巧與策略方面的論證。然而,縱觀商務(wù)英語翻譯近十年的研究成果,大部分研究雖采用描述性翻譯研究模式,但主要是研究者通過經(jīng)驗和觀察,針對某種商務(wù)翻譯產(chǎn)品進行描述研究或?qū)ΜF(xiàn)有翻譯理論在商務(wù)翻譯中的適用性進行論述(徐珺,夏蓉,2013)。由此看來,商務(wù)英語現(xiàn)有研究中,大部分研究者的論證依據(jù)主要來源于其主觀經(jīng)驗,數(shù)據(jù)支撐較為欠缺。
與以往基于主觀經(jīng)驗對商務(wù)文本進行研究的傳統(tǒng)方式不同,本文通過搜集大量財經(jīng)新聞英漢文本自建語料庫,通過語料庫分析工具、以數(shù)據(jù)為支撐對英漢財經(jīng)新聞的文本特征進行分析,主要研究問題包括:(1)英語財經(jīng)新聞和漢語對應(yīng)文本在平均詞長、詞類頻數(shù)、標準類符/形符比以及詞匯密度方面有何特征及其差異;(2)英語財經(jīng)新聞和漢語對應(yīng)文本的平均句長與連詞的使用及其差異;(3)這些差異產(chǎn)生的原因以及為英漢財經(jīng)新聞互譯帶來的啟示。
本文自建英語財經(jīng)新聞?wù)Z料庫(English Business News Corpus, 簡稱EBNC)以及漢語財經(jīng)新聞?wù)Z料庫(Chinese Business News Corpus, 簡稱CBNC)作為英漢財經(jīng)新聞文本特征的研究對象,并選取英國國家語料庫(British National Corpus,簡稱BNC)作為英語參照語料庫,用于比較財經(jīng)新聞這種專門用途英語與通用英語之間的差異,用于揭示財經(jīng)新聞特有的文本特征。
BNC語料庫是有英國牛津出版社、朗文出版公司、錢伯斯-哈洛普出版公司、牛津大學(xué)計算機服務(wù)中心、蘭卡斯特大學(xué)英語計算機中心以及大英圖書館等聯(lián)合開發(fā)建立的大型語料庫,由4282篇現(xiàn)代英語文本組成,規(guī)模為1億多詞,內(nèi)容包括國家及區(qū)域性報紙、各行業(yè)專業(yè)期刊與雜志、學(xué)術(shù)書籍以及通俗小說、學(xué)位論文、信件及備忘錄等內(nèi)容,其中書面語占90%,口語占10%。此外,筆者通過搜集《福布斯》、《華爾街日報》、《財富》以及《金融時報》中英文網(wǎng)站上2012年6月至2013年10月期間的935篇英漢財經(jīng)新聞自建語料庫,EBNC及CBNC語料庫共計1870個中英平行文本,其中,EBNC語料庫中共計680146詞,CBNC語料庫中共計708181詞,如表1所示。
表1 三個語料庫文本數(shù)量與文本容量
TreeTagger是德國斯圖加特大學(xué)Helmut Schmid開發(fā)的一款自動詞性標注軟件,采用賓州樹庫符碼集對語料文本進行語義標注。WordSmith 5.0軟件是牛津大學(xué)主持研發(fā)的語料庫分析工具,主要包含檢索(Concordance)、關(guān)鍵詞(Keywords)以及單詞列表(Wordlist)三大功能。本研究搜集到BNC完整語料庫標注文本以及相應(yīng)的C5系列詞性賦碼集,并且分別利用TreeTagger與中科院研發(fā)的漢語詞法分析系統(tǒng)(ICTCLAS)語料庫工具對EBNC與CBNC語料庫文本進行分詞與賦碼。在完成對語料庫文本的處理之后,利用WordSmith 5.0對包括詞匯長度、類符/形符比、詞類分布、詞匯密度、平均句長等因素進行統(tǒng)計,并基于以上參數(shù)對中英文財經(jīng)新聞文本特征進行研究與分析。
通常,詞匯長度可以反映出文本中所使用的詞匯的難易程度,長度越長,則詞匯越難,同時會使得文本較為晦澀,增加文本的閱讀難度。本文利用WordSmith 5.0 分別計算出了EBNC語料庫與BNC參照語料庫由1-14個字母組成的詞語的使用情況以及其占總詞匯數(shù)的百分比,如表2所示。
表2 EBNC與BNC語料庫文本中不同長度詞語數(shù)量及所占比重
根據(jù)表1,EBNC與BNC語料庫中,所占比重最大的四類詞語按照降序排列均為3個字母單詞、4個字母單詞、2個字母單詞以及5個字母單詞。不難發(fā)現(xiàn),EBNC與BNC語料庫在5個以內(nèi)字母組成的單詞的使用頻率方面,差異并不顯著。根據(jù)WordSmith 5.0得出的觀測語料庫EBNC與參照語料庫BNC的單詞列表,筆者制作了主題詞表,并著重針對主題詞表中的3個字母單詞與4個字母單詞進行對比分析,如表3所示。通過分析,筆者發(fā)現(xiàn),在EBNC語料庫中常用的由3個字母或4個字母組成的專有詞匯縮寫或商務(wù)英語詞匯在BNC語料庫中并不常用,這些詞匯在兩個語料庫中使用頻率相差懸殊。此外,這些詞匯的P值均小于0.05,說明EBNC和BNC語料庫在專有詞匯縮寫及商務(wù)英語詞匯使用方面有顯著差異。因此,即使兩個語料庫中使用頻率最高的詞為3個字母單詞,但是根據(jù)主題詞表及差異分析,可以判斷與參照語料庫BNC相比,EBNC語料庫中的小詞包含較多商務(wù)領(lǐng)域?qū)S忻~,具有鮮明的商務(wù)英語與財經(jīng)新聞特征。
表3 3個字母單詞與4個字母單詞主題詞表抽樣分析
根據(jù)表2可以得出,在由5個至10個字母組成的單詞的使用頻數(shù)方面,EBNC語料庫均高于BNC語料庫,而在11個以上字母組成的單詞使用頻數(shù)方面,其大小結(jié)果相反。這說明與BNC語料庫中來源甚廣且從屬于不同領(lǐng)域的文本相比,EBNC語料庫中的文本來源及屬性皆為財經(jīng)新聞文本,其文本目的在于財經(jīng)信息的有效傳達,因而在詞匯使用方面較為專業(yè)與集中,所以較少出現(xiàn)長度超出普通單詞的生僻詞。
此外,根據(jù)WordSmith 5.0計算結(jié)果,EBNC與BNC語料庫中的平均詞長分別為4.83個字母與4.66個字母,EBNC語料庫中的平均詞長較長于BNC語料庫中的平均詞長。從文本整體內(nèi)容來看,除了長度超出普通水平的生僻詞以外,BNC語料庫中的文本更偏向一般化、綜合類文本,其用詞也更加大眾化、日?;?;而EBNC語料庫由于其特定屬性的財經(jīng)新聞內(nèi)容,其用詞更趨向于商務(wù)英語詞匯,因而平均詞長也會略高于日常英語詞匯。
詞匯密度的計算方法有兩種,一種是計算文本的類符/形符比,另外一種是計算文本中實義詞總數(shù)與總詞數(shù)的比率(Stubbs,1986)。形符(Token)是指文本中總的詞匯總數(shù),而類符(Type)是指文本中不同詞形的數(shù)量。類符/形符比(Type/Token Ratio, TTR)代表文本中不同詞形數(shù)量與總詞形數(shù)量的比率,這一數(shù)值可以在一定程度上反映文本中用詞的變化,即詞匯豐富度,比率大小與詞匯豐富度成正比。一般情況下,如果文本的形符總數(shù)超過1000,則需要使用標準化類符/形符比(Standardized Type/Token Ratio, STTR),以減少長文本中功能詞詞頻過高而造成的誤差。英語詞匯從宏觀層面上可以分為實義詞和功能詞兩大類,實義詞(content word)是指具有獨立、穩(wěn)定的實際含義的詞語,而功能詞(functional word)是指無實際含義,僅發(fā)揮語法連接作用的詞語。根據(jù)胡壯麟(2002)對于英語詞類的劃分,實義詞指的是名詞、形容詞、動詞、副詞,功能詞指的是連詞、冠詞、介詞、代詞、感嘆詞。在文本中,與功能詞的語法連接作用不同,實義詞能夠起到傳達實際信息的作用,因而實義詞的數(shù)量與文本詞語總數(shù)的比率可以反映出文本內(nèi)容傳達的信息量與信息密度以及文本理解的難易程度。
筆者分別利用TreeTagger以及ICTCLAS工具對EBNC與CBNC語料庫文本進行賦碼,并根據(jù)賦碼文本,利用WordSmith 5.0檢索、計算EBNC,BNC以及CBNC語料庫的實詞數(shù)量及各自的標準類符/形符比,如表4所示。根據(jù)表格可以看出,三個語料庫的標準類符/形符比按照由大到小的順序排列分別為CBNC、EBNC、BNC。對比發(fā)現(xiàn),由英語財經(jīng)新聞構(gòu)成的EBNC語料庫在詞形變化及詞匯豐富度上高于由來源廣泛的諸多文本組成的參照語料庫BNC,這說明財經(jīng)新聞作為專業(yè)性書面文本,其行文更加注重不同詞性的詞語的交叉使用。CBNC語料庫中的文本作為EBNC語料庫的對應(yīng)中文譯本,詞形變化與詞匯豐富度較EBNC語料庫更高,這是由于在英漢翻譯過程中會根據(jù)文本內(nèi)容對詞性以及句式結(jié)構(gòu)進行相應(yīng)的轉(zhuǎn)換,使之更符合中文的行文習慣。
表4 三個語料庫實詞數(shù)量與標準類符/形符比
根據(jù)實詞數(shù)量,筆者分別計算出不同類別的實詞在三個語料庫中的占比情況以及詞匯密度,如圖2所示。三個語料庫詞匯密度按照由大到小的順序排列分別為CBNC、EBNC、BNC。這說明由財經(jīng)文本組成的EBNC與CBNC語料庫其信息量與信息密度大于BNC語料庫的構(gòu)成文本,凸顯了財經(jīng)新聞文本重視信息傳遞的文本目的;而CBNC語料庫詞匯密度略高于EBNC語料庫,這說明相同的文本內(nèi)容,漢語文本所用實詞更多,更加注重文本的信息內(nèi)容,因而信息密度更高。EBNC語料庫中名詞占比為31.86%,而BNC語料庫中名詞占比為22.47%,而前者動詞占比為15.51%,低于后者的16.85%,這說明英語財經(jīng)新聞在撰寫時使用的名詞較多,動詞相對較少,這不僅體現(xiàn)了財經(jīng)新聞重視信息傳遞的文本目的,還更加注重文本內(nèi)容的客觀性以及語言風格的正式程度。然而,EBNC與CBNC語料庫相比,前者的名詞與形容詞占比高于后者,而動詞與副詞占比卻低于后者。這說明在進行英漢翻譯時,漢語文本中出現(xiàn)了詞性轉(zhuǎn)換,尤其是將名詞與形容詞轉(zhuǎn)換為動詞。
圖2 三個語料庫實詞占比情況與詞匯密度
句子是語法層面上最大的構(gòu)成單位,是文本的基本組成部分,而從語義功能方面來講,一個句子是對一個概念相對完整的表達。一般而言,短句多為簡單句,句式結(jié)構(gòu)簡單,所包含的單詞較少,理解起來也相對容易;而長句則包含較多的分句及復(fù)合句,并由邏輯關(guān)聯(lián)詞對這些分句進行連接與組合,因而句式結(jié)構(gòu)較為復(fù)雜,所包含的單詞數(shù)量也更多,理解起來較為困難。平均句長指的是文本中每個句子平均所包含的單詞數(shù)量,是反映文本中句子長度的指標,也可以作為反映文本可讀性與理解難易程度的重要指標。合眾國際社將句子長度作為衡量文本可讀性的一項重要指標,并通過句子長度對文本可讀性進行量化說明,如表5所示(McIntyre,1996)。根據(jù)合眾國際社的標準,句子的長度與其可讀性成反比,句子越長越難以理解,亦即句子的可讀性越低。其中,由8個單詞或少于8個單詞組成的句子最容易理解,可讀性最高,由17個單詞組成的句子理解難易程度中等,可讀性中等,而由29個單詞或多于29個單詞組成的句子 則最難理解,可讀性最低。
表5 句長與文本可讀性對應(yīng)關(guān)系
筆者利用WordSmith工具分別統(tǒng)計出EBNC、BNC及CBNC語料庫文本的平均句長與句長標準差。根據(jù)圖3,EBNC語料庫文本平均句長為18.90,即平均每個句子包含18.9個單詞,基于合眾國際社關(guān)于句長與文本可讀性對應(yīng)關(guān)系的量化統(tǒng)計,英語財經(jīng)新聞的可讀性從句長因素考慮處于中等水平。相對比,參照語料庫BNC的平均句長為22.16,略高于EBNC語料庫,且其文本可讀性趨于較難理解,在句長標準差方面,BNC語料庫文本的句長標準差為404.19遠遠高于EBNC語料庫(11.39)。基于以上兩組數(shù)據(jù),可以看出,英語財經(jīng)新聞中的句子長度略低于參照語料庫文本,但是句長標準差較小,說明英語財經(jīng)新聞文本的句子長度變化差異小,句長較為穩(wěn)定,體現(xiàn)了財經(jīng)新聞?wù)Z言簡潔精煉、行文流暢規(guī)范的文體特點。此外,雖然從句長與文本可讀性對應(yīng)關(guān)系層面上統(tǒng)計,財經(jīng)新聞文本較參照語料庫文本較易理解,但是由于前者包含大量的商務(wù)英語詞匯與專有名詞,且詞類豐富,所包含的信息量較大,因而加大了財經(jīng)新聞的理解難度,降低了其可讀性。 CBNC語料庫中文本平均句長為22.04個字,其可讀性與BNC
圖3 三個語料庫平均句長與句長標準差統(tǒng)計圖
語料庫的文本相似,處于較難理解的層次,且其句長標準差為11.06,為三個語料庫中的最低水平,這說明CBNC語料庫中的文本其句長最為穩(wěn)定,單句長度變化差異最小。
筆者還使用WordSmith 5.0對標注文本進行檢索,分別檢索三個文本中的并列連詞、從屬連詞以及作為連詞使用的that的數(shù)量,這三個數(shù)據(jù)及其在各個語料庫文本中的百分比情況如表6和圖4所示。根據(jù)數(shù)據(jù)可以看出,相比較BNC語料庫,除了that用作連詞的占比相同外,EBNC語料庫中并列連詞數(shù)量的百分比較前者略少,而從屬連詞數(shù)量的百分卻較高于后者,EBNC語料庫的合計連詞占比也遠高于BNC語料庫,這說明英語財經(jīng)新聞中較多使用復(fù)合句式來進行表述,句子之間存在較為復(fù)雜的邏輯關(guān)系,盡管句長較參照語料庫文本略短,但是句式結(jié)構(gòu)卻較為復(fù)雜,加強了英語財經(jīng)新聞的專業(yè)性并加大了其文本的理解難度。由于不同語言之間的差異,CBNC語料庫中的中文文本并無區(qū)分并列連詞與從屬連詞,因而在檢索時將文本中的所有連詞進行合并統(tǒng)計,在CBNC語料庫中連詞數(shù)量為22802,在整個語料庫文本中占3.22%。根據(jù)WordSmith 5.0制作出的單詞列表中的統(tǒng)計數(shù)據(jù),EBNC語料庫中共有34860個句子,而CBNC語料庫中共有31804個句子,因而,可以推斷,在進行英漢翻譯時,漢語文本對英語文本中的句子進行了較多的合并。然而,盡管漢語財經(jīng)新聞文本中的句子數(shù)量減少,但是連詞占比情況卻遠低于英語財經(jīng)新聞文本的百分比(7.03%)。這一差異說明,英文是重形合的語言,英語文本中的句子更多的是通過不同的連詞而對各個分句進行邏輯關(guān)系的架構(gòu)與銜接;與之相反,漢語是重意合的語言,句子與句子之間的銜接與邏輯關(guān)系依賴的是語義而非連詞。
表6 三個語料庫中不同類別的連詞數(shù)量
圖4 三個語料庫中不同類別的連詞占比情況
語料庫翻譯學(xué)隨著語料庫語言學(xué)與描述翻譯理論的不斷發(fā)展而興起,基于語料庫研究工具對真實的語料進行數(shù)據(jù)統(tǒng)計,利用語言學(xué)及翻譯學(xué)等其他分支理論對文本進行分析,其分析結(jié)果也更具客觀性。
本文利用WordSmith 5.0等語料庫工具對語義標注的英漢財經(jīng)新聞文本進行詞匯與句法層面的文本特征分析,其中詞匯層面的分析包括平均詞長、詞類分布、標準類符/形符比以及詞匯密度,句法層面則包括平均句長與可讀性以及連詞的使用情況。通過分析,筆者發(fā)現(xiàn),英漢財經(jīng)新聞與通用文本相比其用詞更為專業(yè),包含較多的商務(wù)英語詞匯以及商務(wù)專有名詞。此外,由于特殊的文本性質(zhì),財經(jīng)新聞更加注重文本信息的傳遞,因而文本中詞形變化較為豐富,實詞數(shù)量占比較多,信息密度較普通文本更大。然而,英語財經(jīng)新聞較多地使用名詞以提高文本的客觀性與正式程度,但是在中文文本中卻相應(yīng)地轉(zhuǎn)換為形容詞與動詞。在句法層面,英語財經(jīng)新聞較中文文本更加注重連詞的使用,強調(diào)各個分句之間的邏輯關(guān)系與銜接。基于上述不同的文本特征,在進行英漢財經(jīng)新聞翻譯時應(yīng)更多地注重商務(wù)詞匯的準確翻譯、詞性轉(zhuǎn)換以及句子之間的拆分與合并,使得翻譯文本更符合目的語的語言特征,增強翻譯文本的可讀性,以更好地實現(xiàn)財經(jīng)新聞的信息傳遞功能。