□孫 娟
基于語料庫的“Life”語義韻對比研究——以小說《德伯家的苔絲》為例
□孫 娟
本文分別采用數(shù)據(jù)驅動方法和基于數(shù)據(jù)的方法,對托馬斯·哈代《德伯家的苔絲》中的“l(fā)ife”一詞進行分析與研究,并與LOB語料庫進行對比。首先通過AntConc 3.2.1w軟件進行檢索,利用Collocates功能分別從自建的Tess語料庫與LOB語料庫中篩選出MI值大于等于3.0的“l(fā)ife”顯著性搭配詞,在此基礎上進行語義韻對比分析;同時采用基于數(shù)據(jù)的方法,建立類鏈接,對“l(fā)ife”在這兩個語料庫中的語義韻進行對比研究。在這兩種研究方法下,文章得出了一致性的研究結果,即在LOB語料庫中“l(fā)ife”一詞多為中性含義,而在Tess語料庫中,“l(fā)ife”多呈現(xiàn)消極意義。這種顯著性差異說明,在小說中,作者托馬斯·哈代借助了詞匯手段著墨苔絲的悲慘命運以及她落魄無助的生活,增添了整個故事的悲劇色彩,為故事情節(jié)的展開埋下了伏筆。
語料庫 life 語義韻 德伯家的苔絲
語料庫研究表明,詞項的搭配行為顯示出一定的語義趨向:一定的詞項會習慣性地吸引某一類具有相同語義特點的詞項,構成搭配。由于這些具有相同語義特點的詞項與關鍵詞項在文本中高頻共現(xiàn),后者就被“傳染”上了有關的語義特點,使語境內彌漫著某種語義氛圍。這就是語義韻(semantic prosody)[1][2]。語義韻是語料庫語言學迄今為止發(fā)現(xiàn)的重要語言運作機制之一[3],它可以大體分為積極語義韻(positive prosody)、消極語義韻(negative prosody)和中性語義韻(neutral prosody)三種。如果節(jié)點詞吸引的詞項幾乎都有積極涵義,那么該詞具有積極語義韻。相反,如果節(jié)點詞吸引的詞項幾乎都有消極涵義,那么該詞具有消極語義韻。如果節(jié)點詞吸引的詞項中,一些有積極涵義,一些有消極涵義,那么該詞具有中性語義韻[4]。
將語料庫應用于文學作品也是語料庫研究的一個熱點。根據(jù)文學文本情節(jié)復雜的特點,語料庫檢索工具可以對其主題、人物和情節(jié)發(fā)展等進行趨于理性的加工、分析和統(tǒng)計,從巨量的文字庫中提取出骨架,再結合文義,進而從一個全新的角度對文學文本進行研究。托馬斯·哈代的《德伯家的苔絲》是一部非常經典的悲劇作品,講述了出生于沒落貴族家庭的女主人公苔絲最終沒能逃脫悲慘的命運而死于絞刑的故事。她的一生充滿了悲劇色彩,因此本文從文本中提取“l(fā)ife”一詞,結合語料庫對其進行語義韻分析,并與LOB語料庫進行對比,通過對比差異深入分析哈代為渲染主題而采用的技巧。下面首先簡要介紹語義韻研究的一般方法。
衛(wèi)乃興(2001)對語義韻的一般研究方法進行了歸納與總結。他認為,語義韻的研究主要有三種方法:1.建立并參照類聯(lián)接,用基于數(shù)據(jù)的方法(data-based approach)研究;2.計算節(jié)點詞的搭配詞,用數(shù)據(jù)驅動的方法(data-driven approach)研究;3.用基于數(shù)據(jù)與數(shù)據(jù)驅動相結合的方法研究。
(一)建立類聯(lián)接,基于數(shù)據(jù)來概括和描述的語義韻
類聯(lián)接是詞語搭配研究中的一個重要概念,指語法范疇間的結合。類聯(lián)接不是與詞語搭配平行的抽象表述,而是高一級的抽象[5]。Mitchell[6]認為,類聯(lián)接是關于詞語組合類別的抽象表述,搭配則是類聯(lián)接的具體實現(xiàn)。換言之,類聯(lián)接是一種句法結構,是從文本中概括或抽象出來的用句法范疇表述的搭配類,用來描述詞語的典型語法功能。一個類聯(lián)接代表了一個搭配類(collocational class),類聯(lián)接建立后,便可以觀察、概括和描述關鍵詞的語義韻。
(二)計算搭配詞,用數(shù)據(jù)驅動方法研究語義韻
這種方法主要是利用軟件,對語料進行自動檢索,并對搭配進行計算和統(tǒng)計測量。目前使用的統(tǒng)計手段主要有Z值、T值或MI值,以檢驗搭配詞與節(jié)點詞共現(xiàn)的顯著程度。當Z和T值達到2.0,或MI值達到3.0時,搭配詞可以視為顯著搭配詞。所謂節(jié)點詞(node word),即研究人員要在語料中檢查其搭配行為的關鍵詞??缇啵⊿pan)是由節(jié)點詞左右詞項構成的語境,以詞形為單位計算,不包括標點符號。一般來說,將跨距界定為-4/+4或-5/+5是最適宜的[7]。所有落入跨距的詞項都視作節(jié)點詞的搭配詞(collocates)。這種研究方法的特點是:研究者頭腦中沒有太多先入為主的觀念,而是由數(shù)據(jù)引導進行研究和描述,人為因素較少,主要靠自動化程序進行檢索、提取和統(tǒng)計測量。
(三)基于數(shù)據(jù)與數(shù)據(jù)驅動相結合,建立語義韻結構
這是一種比較折中的方法,是將上述兩種方法結合起來使用。一般做法是:先從語料庫隨機抽取一定數(shù)量的索引,然后界定跨距、提取搭配詞、建立和參照類聯(lián)接、檢查和概括搭配詞的語義特點,最后建立節(jié)點詞的語義韻結構。
本研究以自建的托馬斯·哈代《德伯家的苔絲》語料庫和LOB語料庫為基礎。自建Tess語料庫庫容量約為30萬詞。LOB語料庫建于上世紀70年代初,由英國Lancaster大學和挪威Oslo大學以及Bergen大學建成,庫容量約為100萬詞次。
本研究首先采用數(shù)據(jù)驅動的方法,主要通過AntConc 3.2.1w軟件進行檢索,利用Collocates計算“l(fā)ife”的搭配詞的MI值。當MI≥3.0時,表明該詞與節(jié)點詞之間有較強的搭配力(Church & Hanks,1990;Hunston,2002;Stubbs,1995)。因此,本文用跨距為±4,相互信息值MI≥3.0的標準分別提取自建Tess語料庫和LOB語料庫中“l(fā)ife”的搭配詞。在此基礎上,對“l(fā)ife”在兩個語料庫中搭配詞的語義內涵進行對比分析,以此來考察哈代的寫作手法。為了研究結果的準確性以及權威性,本文同時采用了基于數(shù)據(jù)的方法,即利用AntConc軟件中的Concordance功能,分別提取“l(fā)ife”的索引行,然后建立類聯(lián)接,進行語義韻分析。
(一)基于數(shù)據(jù)驅動的方法
本文利用Collocates統(tǒng)計出在自建語料庫(Tess)中,“l(fā)ife”搭配詞的MI值≥3.0的共計417例,節(jié)點詞“l(fā)ife”所吸引的顯著性搭配詞主要有“Modern,impractical,crisis,brokenly,unreasonable,destroy,burden,wasted,universe,rough”等,在此只列舉具有典型代表性的幾例。本文以同樣的方法提取了從LOB語料庫中所檢索到的符合要求的“l(fā)ife”顯著搭配詞。如表1所示:
表1:“l(fā)ife”的顯著搭配詞統(tǒng)計數(shù)據(jù)
通過觀察表格不難發(fā)現(xiàn),“l(fā)ife”的顯著性搭配詞無論是在自建語料庫(Tess)中,還是在LOB語料庫中,都呈現(xiàn)較高的MI值,說明節(jié)點詞“l(fā)ife”具有較強的語義選擇趨向,吸引它們相互聚集。在Tess語料庫中,這些搭配詞有如下特點:“impractical,crisis,brokenly,unreasonable,destroy,burden,wasted,rough”這8例均呈現(xiàn)出明顯的消極性語義,“modern”和“universe”呈現(xiàn)出中性語義內涵。這說明在Tess中,和“l(fā)ife”搭配的詞多是表現(xiàn)悲觀的生活態(tài)度和消極情緒的詞語。而在LOB語料庫中:“single,uneventful,antecedent,everyday,the,tranquil,inner”這7例呈現(xiàn)中性語義,“comfortable”呈現(xiàn)出明顯的積極語義,“dully”呈現(xiàn)出明顯的消極語義。對比表明,LOB語料庫與Tess語料庫在“l(fā)ife”的搭配詞方面表現(xiàn)出了明顯的差異性,在LOB語料庫中,“l(fā)ife”的搭配詞多呈現(xiàn)中性意義,而在Tess語料庫中卻多呈現(xiàn)出消極語義。通過搭配詞的語義差別對比可以推測出,在《德伯家的苔絲》這部小說當中,作者托馬斯·哈代為了渲染整個故事的悲劇色彩,特別是為了著墨苔絲的悲慘命運以及她落魄無助的生活,運用了悲劇化搭配詞的寫作手法來實現(xiàn)理想的情感目的。
(二)基于數(shù)據(jù)的方法
通過AntConc的Concordance檢索發(fā)現(xiàn),“Life”一詞在自建語料庫(Tess)中共有131條索引,其中有1條索引重復,剔除重復的1條后,剩下有效索引130條。在LOB語料庫中,檢索到711條索引,本文采用系統(tǒng)隨機抽樣法,即每隔四行取一次的方法抽取了共計142條有效索引。限于篇幅,現(xiàn)僅將兩個語料庫中的前10條索引顯示如表2和表3。
表2:自建語料庫(Tess)中的前10條索引
表3:LOB語料庫中抽樣后的前10個索引
本文對在這兩個語料庫中所提取的索引分別進行了歸納和總結,并建立了類聯(lián)接,在此基礎上分析“l(fā)ife”的語義韻。表4為Tess語料庫中“l(fā)ife”的相關類聯(lián)接及語義韻,表5為LOB語料庫中“l(fā)ife”的相關類聯(lián)接及語義韻。
表4:Tess語料庫中“l(fā)ife”的相關類聯(lián)接及語義韻
表5:LOB語料庫中“l(fā)ife”的相關類聯(lián)接及語義韻
PRON+N 39(27.46%) 11(36.67%) 21(25.00%) 7(25.00%)V+N+PREP 15(10.56%) 2(6.67%) 11(13.10%) 2(7.14%)總數(shù) 142(100%) 30(21.12%) 84(59.15%) 28(19.72%)
對比表4和表5可以發(fā)現(xiàn),“l(fā)ife”的類聯(lián)接與語義韻在Tess語料庫與LOB語料庫中既有相似之處,也存在差異性。通過觀察得知:“l(fā)ife”的類聯(lián)接形式在這兩個語料庫中存在很大的共性,都包含六種類聯(lián)接,即N+N,PREP+N,DT+N+PREP,ADJ+N,PRON+N,V+N+PREP。每個類聯(lián)接在這六個類聯(lián)接中所占的比重相似,其中,ADJ+N和PRON+N占的比重較大,兩者大約占總數(shù)的一半,其余四項類聯(lián)接比重較小且比例相當。這充分說明了托馬斯·哈代《德伯家的苔絲》中“l(fā)ife”一詞的用法遵循了英語的一般用法,符合英國人的表達習慣。
值得一提的是,“l(fā)ife”一詞的語義韻在這兩個語料庫中呈現(xiàn)出了較大的差異,主要表現(xiàn)在:在自建語料庫(Tess)中,“l(fā)ife”的語義韻積極涵義和中性涵義所占比重相當,分別為25.38%和27.69%,而消極涵義接近半數(shù),占到了總數(shù)的46.92%。這說明在Tess中,“l(fā)ife”多呈現(xiàn)消極意義,具有濃厚的悲觀主義色彩,這一點與哈代的宿命觀是一致的。在LOB語料庫中,“l(fā)ife”的積極語義韻和消極語義韻比重相當,分別為21.12%和19.72%,中性語義韻超過半數(shù),為59.15%。通過這兩個語料庫的前后對比,可以很清晰地看到哈代的寫作手法,悲觀色彩貫穿作品全篇。通過運用這種詞匯手段來渲染苔絲的悲慘命運,為小說的悲劇結局埋下了伏筆。通過基于數(shù)據(jù)的分析,本文得出了與基于數(shù)據(jù)驅動的分析相一致的結論,進一步證明了本文數(shù)據(jù)的有效性。
語義韻研究可以豐富人們對語言規(guī)則的認識,加深對語言運作機制的理解,促使人們重視詞語行為模式(衛(wèi)乃興,2002)。為了增強研究結果的可靠性和權威性,本文分別采用了數(shù)據(jù)驅動的方法和基于數(shù)據(jù)的方法,對《德伯家的苔絲》中的“l(fā)ife”一詞進行了語義韻研究,并與LOB語料庫進行了對比。研究表明:在自建語料庫(Tess)與LOB語料庫中,“l(fā)ife”一詞的類聯(lián)接形式具有很大的共性,都有六種類聯(lián)接:N+N,PREP+N,DT+N+PREP,ADJ+N,PRON+N,V+N+PREP,并且各自所占的比重相當。但是“l(fā)ife”在這兩個語料庫中呈現(xiàn)出的語義韻卻存在較大的差異性,主要表現(xiàn)在:在LOB語料庫中,“l(fā)ife”多呈現(xiàn)中性語義韻,而在自建語料庫(Tess)中,“l(fā)ife”多呈現(xiàn)消極語義韻。這種顯著性差異充分說明了:在小說《德佰家的苔絲》中,作者托馬斯·哈代多用消極悲觀色彩詞來描述命運與生活,通過運用這種詞匯手段來渲染苔絲的悲慘命運,充分體現(xiàn)了作者的宿命觀,悲觀主義色彩貫穿全篇,為小說的悲劇結局埋下了伏筆。
(本文為廣東外語外貿大學高層次人才引進聯(lián)合項目“認知翻譯學的理論及模型建構”[GWTP-YJ-2015-07]和廣東省人文社會科學重點研究基地廣東外語外貿大學翻譯學研究中心2015年招標項目“認知翻譯學的學科理論基礎及體系建構研究”[CTS201503]的階段性研究成果。)
[1]Sinclair,J.Corpus,Concordance,Collocation[M].Oxford:Oxford University Press,1991.
[2]Louw,B.Irony in the Text or Insincerity in the Writer?The Diagnostic Potential of Semantic Prosodies[A].In M.Baker,G.Francis &E.Tognini-Bonelli(eds.).Text and Technology:In Honour of John Sinclair[C].Amsterdam:John Benjamins,1993.
[3]衛(wèi)乃興.基于語料庫學生英語中的語義韻對比研究[J].外語學刊,2006,(5):50-54.
[4]Stubbs,M.Text and Corpus Analysis[M].Oxford:Blackwell Publishers,1996.
[5]Firth,J.R.Papers in Linguistics 1934-1951[C].London:Oxford University Press,1957.
[6]Mitchell,T.F.Principles of Firthian Linguistics[M].London:Longman,1975.
[7]Jones,S & J.Sinclair.English Lexical Collocations:A Study in Computational Linguistics[C].Cahiers de Lexicoligie,1974,(2):15-61.
(孫娟 廣東廣州 廣東外語外貿大學高級翻譯學院 510420)