董曉燁,柴靜
?
語料庫輔助的文學(xué)作品主題分析
董曉燁,柴靜
(東北林業(yè)大學(xué) 外國語學(xué)院,黑龍江 哈爾濱 150040)
語料庫對英語學(xué)習(xí)具有極大的輔助作用。文學(xué)研究者在運用語料庫進(jìn)行作家文體分析方面已經(jīng)取得了一定成果。本論文將數(shù)據(jù)和主題研究相結(jié)合,對文學(xué)主題進(jìn)行語料庫研究,考察通過檢索詞、句、篇章的頻率、搭配和分布等信息研究如何借用生文本和標(biāo)注文本來探討文學(xué)作品主題的方法,試圖將定量和定性分析相結(jié)合,提供了一種科學(xué)、系統(tǒng)、深入的文本解讀方式。
語料庫;主題研究;生文本;標(biāo)注文本
文學(xué)作品的主題就是其“中心和重要思想。它也是與小說的其它構(gòu)成元素相關(guān)的統(tǒng)一觀點和推動力量”[1]。因此,它涉及作品的主要內(nèi)容、主要題材、中心思想和核心精神,確切地掌握文學(xué)作品的主題對理解文學(xué)作品非常重要。但是,以往讀者對文學(xué)作品主題的學(xué)習(xí)和闡釋都是主觀的和印象式的。不同的人在讀同一部作品時,可能會歸納出不同的,甚至是大相徑庭的主題;缺乏文學(xué)感悟力或沒有經(jīng)過系統(tǒng)文學(xué)訓(xùn)練的人可能根本無法獲知文學(xué)作品的主題;同一個讀者對同一部作品的每一次重讀可能都會生成不同的印象,產(chǎn)生不同的感悟。
語料庫研究者認(rèn)為上述現(xiàn)象的產(chǎn)生源自傳統(tǒng)文論重直覺經(jīng)驗性的感悟式思維和缺乏可操作性科學(xué)分析的特征。他們批評傳統(tǒng)文學(xué)評論的主觀操作性過強(qiáng)?!把芯恐黝}的過程就是用自己的詞匯來闡釋文學(xué)作品中所呈現(xiàn)的人類經(jīng)驗”[2]。他們認(rèn)為在進(jìn)行傳統(tǒng)方式的文學(xué)批評時,即使是在那些意思十分突出的論文中,評論家也只是在從文本中尋找細(xì)節(jié)支持論點并對論據(jù)進(jìn)行一步步的細(xì)化,同時有意無意地忽視與論點相違背的數(shù)據(jù)。因為可操作性科學(xué)分析的缺乏,在反主觀論者的眼中,任何一個論點的提出都是可疑的,學(xué)者的洞見因為缺少實際數(shù)據(jù)的支撐而導(dǎo)致了說服力弱化和學(xué)術(shù)交流的紛亂狀況,學(xué)者們對文學(xué)的理解幾乎無法達(dá)成共識。與之相比,語料庫輔助分析為解讀文學(xué)作品的主題提供了客觀的、有力的論據(jù),有助于促使讀者對文學(xué)作品形成初步的和直觀的理解。
語料庫的支持者的觀點略有夸大定量研究的功用之嫌,但我們也不可否認(rèn)語料庫方法對文學(xué)研究的輔助作用。運用語料庫輔助分析文學(xué)作品的主題,有利于突顯文學(xué)研究的客觀依據(jù)。近年來,隨著計算機(jī)科學(xué)的發(fā)展和人們對定量分析的重視,運用語料庫語言學(xué)方法研究文學(xué)文本成為當(dāng)前文學(xué)研究的主要范式之一[3]。運用語料庫語言學(xué)的方法便于研究作家的語言特色和技巧。除此之外,語料庫語言學(xué)的應(yīng)用對于研究文學(xué)作品的主題意義也具有非常強(qiáng)的指導(dǎo)意義。語料庫語言學(xué)為“挖掘文本的隱含意義”“提供了更便捷的服務(wù)”[4]。我們在研究文學(xué)文本時可以運用多種計算機(jī)輔助方法。最為初步的一種方法是對語料進(jìn)行搜集,研究高頻表達(dá)的隱喻意義,通過考察詞匯在文本中或文本的某一部分的分布和頻率,發(fā)現(xiàn)文本的特殊主題。這方面的研究我們可以直接借助生文本來進(jìn)行。
生文本是沒有經(jīng)過標(biāo)注的原始語料。我們可以利用初步的檢索手段,得出詞匯在文學(xué)文本中的顯現(xiàn)頻率,考察在文本中出現(xiàn)的高頻詞匯,從而分析文學(xué)作品的創(chuàng)作主題。
例如在分析20世紀(jì)初的英國作家詹姆斯·喬伊斯的著名的短篇小說《阿拉比》時,我們可以利用常用的語料庫檢索軟件AntConc來進(jìn)行詞匯檢索研究,得出一個主題詞頻率列表。去除語法虛詞之后,我們將出現(xiàn)頻率的排名在前五位的詞列表如下:
RankFrequencyWord 198I 220she 311street 49dark 49bazaar
從上述列表中,我們可以對小說的情節(jié)和主題形成一個初步的認(rèn)知。小說以第一人稱敘事視角講述了發(fā)生在“我”和“她”之間的故事。故事主要發(fā)生在“街道”和“集市”上,小說的氣氛“悲郁”。結(jié)合其它高頻度的主題詞和小說閱讀,我們可以初步得出小說的主題是借由講述一個男孩在初戀幻滅之后的成長,表現(xiàn)了成長的幻滅和20世紀(jì)初愛爾蘭社會頹廢和空虛的癱瘓狀態(tài)。
以“bazaar”一詞為例。“bazaar”表示集市,卻與“fair”和“market”等詞不同。它指中東的集市,因此具有異域風(fēng)情。它與“Araby”相關(guān)聯(lián),讓人想到阿拉伯和《一千零一夜》,因此引發(fā)了有關(guān)遙遠(yuǎn)、夢想、神秘和浪漫的意象。阿拉比的集市是“我”愛戀的對象向往的地方,因此也代表了少年的理想和主人公的探索與追求的目標(biāo)?!拔摇卑殉鯌佼?dāng)作圣潔的瑪利亞去祈禱和崇拜,因此集市也成為了和信仰相關(guān)的朝圣地?!癰azaar”也是少年發(fā)生頓悟的場所。阿拉比本來蘊(yùn)含了少年美麗的想象和純潔的夢想,但是當(dāng)他經(jīng)歷了一番波折終于到了他心目中的圣地之后,他所看到的阿拉比昏暗、破敗、蕭條,“像做完禮拜后空無一人的教堂一般死寂”。最后在他目睹了一個女服務(wù)員和兩個男人的調(diào)情之后,他對純潔愛情的想象和向往徹底轟塌了。
我們還可以借用AntConc的一些基本功能來檢索語料的主題特征。例如,我們可以對小說中的另一個高頻詞匯“street”這個詞做cluster 功能檢索,看看它的前面有哪些修飾語。我們檢索到的直接用形容詞來修飾“street”的例子有“quiet street”、“silent street”和“flaring streets”,除此之外在后置定語中用來修飾“street”的詞還有“being blind”、“somber”、“feeble”、“jostled by drunken men and bargaining women”等。這些語句向讀者展示了一個愛爾蘭的典型場景。“我們”生活的環(huán)境“死寂而缺乏活力”,而外面的花花世界充滿了吸引力,“燈光炫目”?!拔摇彼幼〉慕值朗且粭l“死胡同”,象征著生活在這里的人們難以與外界交流,進(jìn)而影射都柏林乃至整個愛爾蘭社會都沒有出路。這樣的環(huán)境“昏沉”、“無力”,“到處都是醉醺醺的男人和吵吵嚷嚷的女人”。上述意象與文中反復(fù)出現(xiàn)的“dark”一起構(gòu)成了小說的背景氛圍和愛爾蘭社會的縮影:死寂與陰暗、庸俗與丑陋、黑暗與冷漠、癱瘓與沒落、無奈與凄涼并存。小說的一個場景街道就是愛爾蘭千千萬萬的街道中的一條,代表了20世紀(jì)初愛爾蘭典型的生活場景。
我們還可以利用語料庫檢索分析來研究某一特定主題的呈現(xiàn)狀況。例如在分析19世紀(jì)美國女作家凱特·肖邦的代表作《覺醒》所體現(xiàn)的家庭倫理方面的主題時,我們可以借助專業(yè)的語料庫檢索工具AntConc,或word文檔中常用的查找功能,檢索作品中的表示家庭成員關(guān)系的詞匯。檢索發(fā)現(xiàn),《覺醒》中表現(xiàn)人物關(guān)系的詞匯共有17種566個。我們可以就檢索結(jié)果做出相應(yīng)的分布圖(檢索詞包括單復(fù)數(shù)兩種形式),作為可供分析的實驗數(shù)據(jù)。
以條形表格顯示高頻詞匯的分布和頻率,為讀者提供了對文學(xué)作品進(jìn)行直觀解讀的方式,也為學(xué)者的評論提供了支持性或是反對性的客觀證據(jù)和數(shù)據(jù)。上面的條形表格清晰地顯示《覺醒》一書中出現(xiàn)的最多的表示家庭倫理關(guān)系的詞匯是“女人”一詞,這說明作品的主要創(chuàng)作主旨是關(guān)注女性命運,作品中呈現(xiàn)出作者鮮明的女性主義傾向和女性意識。書中出現(xiàn)最少的表示家庭倫理關(guān)系的詞匯是祖父母。這說明了主人公家庭觀念的淡漠和家庭倫理關(guān)系的薄弱,與之相對應(yīng)的是對個體權(quán)力和價值的凸顯。另外,隔代親情關(guān)系的斷裂也表現(xiàn)了文化傳承的缺失。
由此可見,通過詞頻來分析小說的主題是一種有效而直觀的手段,也是語料庫輔助主題分析的初步應(yīng)用。
標(biāo)注文本是指經(jīng)過人工或自動標(biāo)注的語料。在找到了高頻詞匯的基礎(chǔ)之上,我們可以進(jìn)一步對高頻詞匯進(jìn)行更為專業(yè)的標(biāo)注和加工,用計算機(jī)語言來記錄文學(xué)文本。與生文本相比,標(biāo)注文本獲得了增值,承載了更多有價值的信息,可以更清晰的顯現(xiàn)語料的結(jié)構(gòu)和內(nèi)容特征。
對自然語言進(jìn)行標(biāo)注的主要程序包括:進(jìn)行文本采集,創(chuàng)建符合研究目的的語料庫;進(jìn)行文本整理,創(chuàng)建清潔文本;進(jìn)行信息標(biāo)注,創(chuàng)建能夠提供更多信息的研究文本。
我們進(jìn)行語言標(biāo)注的第一步是要根據(jù)研究的目的采集相應(yīng)的文本。例如要分析《覺醒》的主題時,我們首先要獲取小說完整的電子文本。在此基礎(chǔ)之上,為了更深入地挖掘作家的創(chuàng)作特色和歷史地位,我們也可以進(jìn)一步采集相關(guān)文本,如肖邦全部的小說文本或是她在19世紀(jì)90年代,也就是與《覺醒》在同一時代出版的文本,如她的第一部長篇小說《過錯》(,1890);肖邦其它文類的創(chuàng)作,如散文、日記、信件等,或是與《覺醒》在同一時期產(chǎn)生的其它文類的文本,如肖邦的三部短篇小說集《牛軛湖的鄉(xiāng)親》(1894)、《阿卡迪亞之夜》(1897)、《一個職業(yè)和一個聲音》(1898);產(chǎn)生于同一時代的美國文學(xué)作品,如薩拉·奧恩·朱厄特(Sarah Orne Jewett)的《尖尖的榕樹之鄉(xiāng)》(1896)和瑪麗·弗里曼(Mary Freeman)的《一個英格蘭修女及其它故事》(1891);產(chǎn)生于同一時代的其它國家的作品,如英國19世紀(jì)重要的女性作家喬治·艾略特和蓋斯凱爾夫人的作品;產(chǎn)生于不同時代和不同地域但具有類似主題的作品等等。
通過不同文本的比較研究,我們還原了文本的生產(chǎn)語境,挖掘出更多的相關(guān)主題。《過錯》同《覺醒》一樣,探討了婚姻觀念、道德理想和現(xiàn)代女性的困惑等主題。肖邦的短篇小說從多重視角探討了個人,尤其是女性在社會中的位置和困境,深化了女性主義話題。與朱厄特和弗里曼等同時代的美國女性小說家的創(chuàng)作相比,肖邦在展現(xiàn)地方特色的同時,體現(xiàn)出更為強(qiáng)烈的女性意識和與傳統(tǒng)決裂的決心。同樣,與19世紀(jì)英國女作家的創(chuàng)作相比,肖邦的創(chuàng)作更關(guān)注女性個體意識的覺醒,而喬治·艾略特和蓋斯凱爾夫人等英國女性小說家的創(chuàng)作呈現(xiàn)出了更為強(qiáng)烈的批判現(xiàn)實主義傾向。此外,世界文壇上不乏出軌的家庭主婦的形象,雖然艾德娜、安娜·卡列尼娜和包法利夫人最后都自殺身亡,但與安娜和艾瑪別無出路的絕望自盡相比,艾德娜更多體現(xiàn)出對女性傳統(tǒng)社會角色的反叛、對自由靈魂和獨立個性的追求,因此,她裸身奔向大海的行為既是心靈獨立的體現(xiàn),也具有積極的社會意義。
隨后,我們要對采集的文本進(jìn)行整理,其目的是校正語言,保證文本的內(nèi)容正確,清潔受污染的文本,提高搜索結(jié)果的正確率,避免由于文本排版的清晰度或是詞匯的多種形式和同形異義詞等原因所引起的對搜索目標(biāo)的干擾。進(jìn)行文本整理的主要任務(wù)是校正格式,如統(tǒng)一混雜的標(biāo)點和字符,網(wǎng)頁拷貝文本中的換行符和空行,校正段落格式和文本換行等,進(jìn)行語言校正,如刪除亂碼、非英語字符和不屬于文本正文的嘈雜信息等。
進(jìn)行語料處理,為語料加上人工標(biāo)注,是進(jìn)一步獲取文本信息的有效手段?!罢Z料庫分析對象實際上囊括了語言的各個層面——詞匯層面、句法層面、語篇結(jié)構(gòu)和語篇類型”[5]。我們可以進(jìn)行不同層次的標(biāo)注,如文本信息和附加信息等。文本信息主要指語言信息,包括文本的語言單位(詞和句子)和內(nèi)部結(jié)構(gòu)(語篇)。針對文本的語言信息,我們可以進(jìn)行相應(yīng)的詞法、句法、語義和語用標(biāo)注。例如,我們可以標(biāo)注詞的語音、構(gòu)詞、詞性、同義詞、反義詞等;標(biāo)注句子的語法信息和語法屬性,如句法和語義等;標(biāo)注語篇信息如語段結(jié)構(gòu)、銜接手段、開頭策略和結(jié)尾策略等。除了上述通用的文本結(jié)構(gòu)信息之外,我們還可以對與文類相關(guān)的特殊文本內(nèi)部結(jié)構(gòu)進(jìn)行標(biāo)注,如與詩歌和戲劇的文類相關(guān)的標(biāo)題、章節(jié)、段落、句子、文體和錯誤標(biāo)注等。為了開展不同目的的研究,我們還可以對文本的特殊屬性進(jìn)行標(biāo)注,如文本的語料來源、出版信息、作者信息、語境信息等文本外部元信息和標(biāo)題、段落、文獻(xiàn)等文本內(nèi)部元信息等非語言信息。
我們對文本進(jìn)行標(biāo)注的目的是為了便于對語料進(jìn)行歸類和關(guān)鍵詞索引,從而更為快速和準(zhǔn)確地獲取文本信息?!霸谡Z料庫語言學(xué)中,這種機(jī)器可讀的索引被稱為縱向單”[6]。縱向單包含許多字母順序排序的關(guān)鍵詞記錄。每一條記錄除包含關(guān)鍵詞之外,還包括它的頻率和識別位置等。這樣,通過語料整理、清潔和標(biāo)注,我們建立了可以利用的語料庫文本。接下來,我們可以利用語料庫檢索軟件進(jìn)行檢索,還可以利用語料庫分析軟件從自動標(biāo)注的語料中找到文本所包含的多種信息,以此深入了解文本的外部信息和內(nèi)部結(jié)構(gòu),避免忽視文本的諸多細(xì)節(jié)。一般說來,我們可以借助Go Tagger軟件對已搜集的語料進(jìn)行詞性賦碼和統(tǒng)計。
將語料庫應(yīng)用于文學(xué)研究有兩個重要的方法。“‘由上而下’和‘由下而上’的方法。即基于語料庫的方法和語料庫驅(qū)動的方法?;谡Z料庫的方法,指的是先確定理論假設(shè),然后再用語料庫的數(shù)據(jù)來驗證這種假設(shè);而語料庫驅(qū)動的方法,指的是在采集大量數(shù)據(jù)的基礎(chǔ)上,通過分析數(shù)據(jù)現(xiàn)象,得出結(jié)論或總結(jié)出某種規(guī)律”[7]。接下來,我們可以根據(jù)研究目的來分析已標(biāo)注的語料信息。例如通過對“Araby”進(jìn)行標(biāo)注,我們找到了它的同根詞“Arab”,從而得出了“Araby”一詞的象征意義,神秘、美麗、愛情、夢幻、夢想等。而“Araby”一詞的發(fā)音由同一元音字母的開口音和非重讀音組成,加重了這種夢幻式的情景。除此之外,整個單詞的發(fā)音由開口音到閉口音的變化有力地表現(xiàn)了童年的純真夢想的消失這一主題。
另外,我們通過同義詞和相關(guān)詞標(biāo)注發(fā)現(xiàn)在《阿拉比》中還有許多表示宗教意義的詞匯。在小說的開頭,作者插入了一個已經(jīng)死去的牧師的故事。在短短的幾句話中牧師死去這一事件不斷被重復(fù)。die、will、leave、late等詞不停地出現(xiàn),凸顯了死亡事件。通過初步分析,我們發(fā)現(xiàn)牧師影射了宗教。愛爾蘭是一個宗教氛圍濃厚的國家。大多數(shù)愛爾蘭人信仰天主教,這與英國國教發(fā)生沖突,因而導(dǎo)致愛爾蘭的宗教氛圍令人窒息。牧師的死亡意味著宗教在現(xiàn)代社會的敗落,影射了整個愛爾蘭社會的癱瘓狀態(tài)和生活于其間的人們的頹廢、空虛和無奈。
通過同義詞標(biāo)注,我們在文中還發(fā)現(xiàn)了除“牧師”之外的許多與宗教相關(guān)的表述,例如圣杯、修道院和虔誠等等。這樣的表述同樣暗示了文章的主題。如在小說開頭出現(xiàn)了一句話:“The wild garden behind the house contained a central apple-tree and a few straggling bushes, under one of which I found the late tenant’s rusty bicycle-pump.”這句話的意思是:“在房子后面有一個廢棄的花園?;▓@的中間長著一顆蘋果樹,園中還有一些雜亂的灌木,我在灌木叢下發(fā)現(xiàn)了已故的房客的上銹的自行車氣筒”。這句話中的“garden”和“apple”無疑都影射了伊甸園的典故,因此這句看似平常的話實際上含義豐富,表達(dá)了純真的失去、理想的陷落、宗教的丟棄和信仰的失落等等。小說中還有一個重要的宗教意象“圣杯”。當(dāng)主人公經(jīng)過了一番波折終于到了他心中向往的圣地“阿拉比”之后,嘈雜、骯臟的環(huán)境令其不知所措,他只有默念著純潔的初戀的名字,“想象舉著我的圣杯在一群敵人中安然穿過?!笔ケ腔浇痰氖テ鳎虼松袷ザ终滟F。男孩將這個嘈雜混亂的環(huán)境想象成純潔的愛的圣地,因此,圣杯在此象征了純潔的愛,而那群敵人無疑象征了充滿了敵意的愛爾蘭社會。
除此之外,我們也可以就標(biāo)注文本的元信息進(jìn)行分析。例如,《阿拉比》中的另外一個主要人物是曼根的姐姐(Mangan’s sister)。曼根是一名愛爾蘭詩人的名字,他寫過一首非常流行的詩《褐色的羅薩琳》,此后人們常用《褐色的羅薩琳》來寓指愛爾蘭,因此我們可以推斷,這個小說中沒有名字的女主人公實際上就是愛爾蘭的抽象的化身。男孩愛情的幻滅實際上體現(xiàn)了主人公對愛爾蘭的希望與失望、盼望與絕望的復(fù)雜感情。
再以我們提到的另一部小說《覺醒》為例。我們可以對小說中的詞法進(jìn)行標(biāo)注。例如標(biāo)注小說標(biāo)題“The Awakening”的語音特征,發(fā)現(xiàn)這個詞的元音發(fā)音由中元音變成前元音,再變成中元音。這一系列的口型的變化,配合了“喚醒、覺醒”的詞義,表明了在覺醒前的半夢半醒的狀態(tài)。另外,對“Awakening”的構(gòu)詞法和詞性進(jìn)行標(biāo)注。動詞結(jié)尾加“ing”的用法具有現(xiàn)在分詞和動名詞的雙重功用,既強(qiáng)調(diào)了覺醒的結(jié)果,也強(qiáng)調(diào)了覺醒的過程。我們還可以標(biāo)注小說中其它詞匯信息。如法語姓名反應(yīng)了小說的文化背景,主人公的名字與當(dāng)時流行的地方色彩小說《圣艾爾墨》和《女人王國》中的女主人公同名,但肖邦在表現(xiàn)地方色彩的基礎(chǔ)之上,開辟了具有反叛性的新女性的形象。
對小說的語篇和創(chuàng)作手法進(jìn)行標(biāo)注,發(fā)現(xiàn)小說呈現(xiàn)了三位典型的女性形象:艾德娜、艾德娜的朋友阿黛爾·勒布朗和蕾茨小姐。分別以三個人的名字Edna、Adele Ratignolle和Mademoiselle Reisz作為檢索詞,借助語料庫軟件 AntConc對小說進(jìn)行檢索,再做concordance (語境共現(xiàn)) 和collocates (詞匯搭配)功能分析,“通過提取和分析語篇中具有超常頻率的詞以及具有共現(xiàn)關(guān)系的詞語或詞群, 可以確定語篇的主題和表達(dá)該主題的詞集, 進(jìn)而研究作者對某一主題的表述”[8]。檢索三位人物出現(xiàn)的文本語境和搭配表達(dá),標(biāo)注她們在外貌、語言、行為、心理、生活環(huán)境等方面的特征,可以發(fā)現(xiàn)人物形象,比較得出肖邦對女性的社會角色的多重和深入思考。
以三位主人公的家庭關(guān)系為例,我們可以標(biāo)注出她們對家庭的不同態(tài)度。勒布朗夫人是典型的賢妻良母。她全身心服務(wù)于家庭?!敖Y(jié)婚7年,兩年生一個孩子,并把這作為自己義不容辭的責(zé)任”[9]10。她寵愛孩子,常常責(zé)備艾德娜對孩子的關(guān)心不夠。她崇拜丈夫。在丈夫侃侃而談時,“專心地聽著,不愿錯過一個字,時而隨聲附和,時而代他把話說完”[9]69。配合對她的外貌和言行等方面的描寫,勒布朗夫人被塑造成傳統(tǒng)的家庭型女性。她迷人大方、舉止得體,極富女性氣質(zhì)。她獻(xiàn)身家庭,是完美的主婦。從勒布朗夫人在格蘭德島上的社會地位和周圍人對她的評價上,我們可以看出她是克里奧爾人心中完美女性。
蕾茨小姐與勒布朗夫人截然相反。她沒有家庭、丈夫和孩子,以教人彈琴謀生。與勒布朗夫人精致的生活狀態(tài)不同,蕾茨小姐長相蒼老、衣著寒磣、生活窘迫。她在人們的眼中性情孤傲、“令人討厭、名聲最壞”[9]72,因此受人排斥,處在社會的邊緣地位。
艾德娜兼具二者的特征,試圖在兩者之間找到平衡。她擁有前者的美貌端莊和社會地位,但她卻喜愛藝術(shù)和思考,追求后者不受家庭束縛的自由。在對二者的思考中艾德娜開啟了追求自我的覺醒之旅。她無法為了家庭而放棄自由,因此成為家人眼中的反叛的女兒、妻子和不盡責(zé)的家庭主婦和母親。在自我和家庭責(zé)任發(fā)生沖突時,艾德娜拋棄了賢妻良母的社會角色,正如她所說,“我愛我的孩子,但我不能為他們而奉獻(xiàn)自己”[9]67。三種女性形象的并置說明了女性氣質(zhì)的多變,環(huán)境對個人訴求的壓抑以及尋求個人精神獨立的代價。
標(biāo)注小說的社會背景和作者信息也有助于挖掘主題。19世紀(jì)末男權(quán)主義的盛行、當(dāng)時女性的生存狀態(tài)、理想的女性角色、南方淑女的傳統(tǒng)等都說明肖邦發(fā)出了女性主義小說的先聲,但經(jīng)濟(jì)獨立和脫離家庭是一種超前的生活方式,這樣的女性在當(dāng)時受到人們的鄙視和排斥。這反映了女性追求自由獨立所面臨的困難和男權(quán)社會文化對女性意識的遏制。而肖邦本人家境富有,從小受到良好教育,愛好藝術(shù),但不斷痛失親人使她成為懷疑主義者。祖母、母親、女老師等聰明而獨立的單身女性提升了肖邦對女性個體價值的認(rèn)識。青年守寡,獨立支撐家庭重?fù)?dān)的經(jīng)歷使肖邦肯定女性的獨立和堅強(qiáng)。
通過為語料加上人工標(biāo)注,我們能夠方便地獲取文本信息。有關(guān)文本內(nèi)的語言信息標(biāo)注可以直觀呈現(xiàn)文本的文體和語體特色,從而在詞法、句法和章法的研究中找到形式所反映的內(nèi)容和主題特征。有關(guān)文本外的元文本信息標(biāo)注有助于展現(xiàn)與主題相關(guān)的作者的創(chuàng)作語境、創(chuàng)作倫理、創(chuàng)作目的和文本接受效果等問題。
綜上所述,“語料庫的優(yōu)勢在于它的信息儲存量巨大以及電腦檢索的快捷和準(zhǔn)確”[10]。數(shù)據(jù)的直觀呈現(xiàn)一方面可以使得隱藏于大量文本中的語言信息得以浮現(xiàn),另一方面可以大量地節(jié)省讀者的學(xué)習(xí)時間,提高學(xué)習(xí)的有效性。將數(shù)據(jù)和主題研究相結(jié)合,對文學(xué)主題進(jìn)行語料庫研究,考察詞、句、篇章的頻率、搭配和分布等信息同樣具有文學(xué)批評的優(yōu)勢。因此,語料庫的手段是對傳統(tǒng)文論批評的有力支持和補(bǔ)充。定量和定性分析相結(jié)合,提供了一種科學(xué)、系統(tǒng)、深入的文本解讀方式,既有助于呈現(xiàn)文本的細(xì)節(jié)特征,又有助于檢驗我們的論斷,同時輔助提高那些沒有經(jīng)過專門訓(xùn)練的讀者的文學(xué)敏感性、闡釋能力和藝術(shù)鑒賞能力。
[1] 金莉,張劍.文學(xué)原理教程[M].北京:外語教學(xué)與研究出版社,2004:42.
[2] 林六辰.英美小說要素解析[M].上海:上海外語教育出版社,2005:113.
[3] 盧衛(wèi)中,夏云.語料庫文體學(xué):文學(xué)文體學(xué)研究的新途徑[J].外國語,2010 (1):47-53.
[4] 李晉,郎建國.語料庫語言學(xué)視野中的外國文學(xué)研究[J].外國語,2010(2):82-89.
[5] 李濤.語料庫文體學(xué):計算機(jī)輔助文學(xué)語篇的文體分析[J].外語電化教學(xué),2009(1):19-24.
[6] AITKEN A J.The Computer and Literary Studies[C].Edinburgh:Edinburgh UP,1973:172.
[7] 尚必武.敘事研究的新領(lǐng)域和新方法:語料庫敘事學(xué)評析[J].解放軍外國語學(xué)院學(xué)報,2011(3):104-109.
[8] 張仁霞.語料庫檢索分析在文學(xué)評論領(lǐng)域中的應(yīng)用[J].廣東外語外貿(mào)大學(xué)學(xué)報,2010(9):34-39.
[9] CHOPIN KATE.The Awakening[M].Londong:Everyman’s Library,1992.
[10] 何安平.語料庫與外語教學(xué)[J].國外外語教學(xué),2001(3):15-19.
Corpus-Assisted Thematic Analysis of Literary Works
DONG XIAOYE, CHAI JING
Corpus is an aid for English study and contributes to the analysis of literary style in which literary critics have won certain achievements. This paper tries to employ statistics into thematic study and develop corpus-assisted thematic analysis of literary works so as to retrieve the frequency of words, sentences, passages, collocation and distribution of textual data and then discusses the themes of original texts and tagged text. The cooperation of quantitative analysis and qualitative analysis bring about a scientific, systematic and profound method of textual interpretation.
corpus; thematic study; raw text; tagged text
本文推薦專家:
胡江波,中國科學(xué)院大學(xué)外語系,副教授,研究方向:英美文學(xué)與教學(xué)。
黃芙蓉,哈爾濱工業(yè)大學(xué)外國語學(xué)院,教授,研究方向:英美文學(xué)與教學(xué)。
2017-12-14
本文系黑龍江省高等教育學(xué)會高等教育科學(xué)研究“十三五”規(guī)劃課題“美國文學(xué)數(shù)據(jù)驅(qū)動教學(xué)模式研究”(編號:16Q022);中央高校基本科研業(yè)務(wù)費專項資金項目“文學(xué)倫理學(xué)視域下的華裔美國文學(xué)研究”(編號:2572016CC02)階段成果。
董曉燁(1978-),女,黑龍江哈爾濱人,東北林業(yè)大學(xué)外國語學(xué)院,副教授,博士研究生,研究方向:英美文學(xué)與教學(xué);
柴 靜(1981-),女,黑龍江哈爾濱人,東北林業(yè)大學(xué)外國語學(xué)院,講師,研究方向:語料庫語言學(xué)。
H08
A
1008-472X(2018)02-0106-06