金 迪
(南京師范大學(xué)文學(xué)院,江蘇 南京 210097)
語料庫語言學(xué)是一種以語料庫為基礎(chǔ)的語言研究方法,包括對自然語料進(jìn)行加工標(biāo)注,以及用已經(jīng)標(biāo)注好的語料進(jìn)行語言研究。它自上世紀(jì)50 年代產(chǎn)生,在80年代嶄露頭角并開始引入我國,是一門集語言學(xué)、計算機(jī)科學(xué)、應(yīng)用語言學(xué)和認(rèn)知語言學(xué)等的交叉學(xué)科。[1]作為對傳統(tǒng)定性式文本分析的一種有益補(bǔ)充和深化的手段,語料庫語言學(xué)以真實(shí)的語言數(shù)據(jù)為研究對象,通過對文學(xué)文本進(jìn)行量化分析,為基于個人閱讀體驗(yàn)、以闡釋性為主的傳統(tǒng)文體學(xué)提供實(shí)證支持,并使分析結(jié)果變得更為客觀、可靠。[2]
目前,國內(nèi)對張恨水《啼笑因緣》這部小說的研究都是傳統(tǒng)的文學(xué)賞析,筆者在中國知網(wǎng)上以“張恨水《啼笑因緣》”為檢索關(guān)鍵詞進(jìn)行檢索,共搜索到49篇。其中對小說中相關(guān)女性人物形象的賞析最多,此外還有對小說中的佛學(xué)思想、對傳統(tǒng)章回小說體式的繼承與創(chuàng)新、藝術(shù)成就等方面進(jìn)行了描述性的分析。但是卻缺少基于語料庫的、以客觀理性的角度對《啼笑因緣》進(jìn)行的研究。因此本文采用語料庫語言學(xué)的方法,基于AntConc軟件對張恨水的作品《啼笑因緣》從小說的敘事視角、文章主題、主要人物形象分析、發(fā)展脈絡(luò)、語言特色等角度進(jìn)行相關(guān)檢索統(tǒng)計,以期從新的研究角度對傳統(tǒng)文本進(jìn)行相應(yīng)的補(bǔ)充分析。
在進(jìn)行語料庫檢索前需要對語料進(jìn)行中文分詞,使用Python編寫分詞程序,運(yùn)用jieba中文分詞包進(jìn)行自動分詞,接著對分詞結(jié)果(主要是一些人名、稱謂等的錯誤分詞)進(jìn)行人工校對。該語料庫包含了 153,619個形符,16,586個類符。再使用AntConc3.2.4w軟件中Word List、Concordance、Concordance Plot、Keyword List等功能對小說《啼笑因緣》進(jìn)行相關(guān)統(tǒng)計分析。
通過Word List對詞頻進(jìn)行排序,得出詞頻表,從而可以對文本的敘述視角、語言特色、主要人物等有一個基本了解。而Concordance功能可以幫助找到被檢索詞所在的所有句子,列出所有相關(guān)的句子片段,方便對被檢索詞所在的上下文語境進(jìn)行分析。
運(yùn)用AntConc3.2.4w軟件中Word List功能對小說《啼笑因緣》進(jìn)行詞頻檢索排序,選取前45個高頻詞繪制成如下表格,詳見表1。
表1 《啼笑因緣》中出現(xiàn)頻率在前45位的高頻詞語
從表1中可以發(fā)現(xiàn),首先,“我、你、他、她”四個人稱代詞均出現(xiàn)在高頻詞表中,其中“我”和“你”頻率最高,分別是3085次和2523次。又通過Concordance功能檢索發(fā)現(xiàn),代詞“我”和“你”一般都是出現(xiàn)在人物對話里,可見小說并不是以第一、二人稱進(jìn)行敘述的。接著代詞“她”和“他”進(jìn)行相關(guān)檢索,發(fā)現(xiàn)這兩個代詞很少出現(xiàn)在對話內(nèi)容當(dāng)中,而是大量出現(xiàn)在旁白中,可見該小說是以第三人稱這一上帝視角進(jìn)行敘述的。用第三人稱敘述的優(yōu)勢在于小說不受時空限制,能更客觀地反映內(nèi)容,并全方位地表現(xiàn)主題。從排名和頻率上看,女性人稱代詞“她”比男性人稱代詞“他”排名更靠前,出現(xiàn)頻率也更高,說明小說中的女性角色人數(shù)可能比男性角色多。
第二,在這些高頻詞中,“道”“說”是頻率最高的兩個動詞,分別位列第四位和第十三位,說明小說中有大量的人物對話。另外,還存在一些高頻語氣詞,例如“嗎”“呢”“吧”,也驗(yàn)證了上述結(jié)論——作者比較注重對話描寫。而通過大量的人物對話,從人物口中講出親身經(jīng)歷的事情或者心理活動,又在很大程度上彌補(bǔ)了第三人稱敘述視角的不足,使讀者更感親切和真實(shí)。
使用Concordance Plot功能可以視覺化呈現(xiàn)被檢索詞在文本中出現(xiàn)的位置以及疏密程度分布,而Collates功能可以檢索到被檢索詞的前后搭配詞,從而進(jìn)一步幫助了解相關(guān)文本內(nèi)容。
從表1中可以發(fā)現(xiàn),前63位高頻詞中,共出現(xiàn)了四個人物“家樹”“鳳喜”“秀姑”“何麗娜”。通過Concordance觀察包含這四個人物的句子,發(fā)現(xiàn)這四個人物分別是一男(家樹)三女(鳳喜、秀姑、何麗娜),可見小說故事情節(jié)的發(fā)展與這四個主人公密切相關(guān)。
使用索引定位Concordance Plot,得到“家樹”在小說《啼笑因緣》中的情節(jié)分布圖,見圖1:
圖1 “家樹”在小說《啼笑因緣》中的情節(jié)分布圖
從圖1可以看出,“家樹”是小說至關(guān)重要的人物,貫穿文章始末,分布得十分密集。從Collate檢索發(fā)現(xiàn)與其搭配的詞有“鳳喜”“何麗娜”“秀姑”“壽峰”“笑嘻嘻”“微笑”“酒杯”“贊成”等。結(jié)合Concordance分析可知,“家樹”是一個有錢有地位的少爺,也是有些傳統(tǒng)思想的知識分子,待人溫和、善良且樂于助人,不嫌貧愛富,和“鳳喜”“何麗娜”“秀姑”這三個女子都有過情感糾葛,與仗義的“壽峰”大叔也是忘年交的好友,一拍即合。
圖2 “鳳喜”在小說《啼笑因緣》中的情節(jié)分布圖
從圖2可以看出,“鳳喜”也是小說的主要人物,在分布圖上占了很大的篇幅,幾乎貫穿了整個小說。
通過Collate檢索可以發(fā)現(xiàn)與其搭配的關(guān)鍵詞有“家樹”“沈大娘”“沈三玄”“劉將軍”“臉”“胡同”“笑”“眼睛”“相片”“病”“唱”“大鼓”等。結(jié)合Concordance可以推斷鳳喜是沈大娘的女兒,沈三玄的侄女,家境貧寒,靠唱大鼓為生,是一個平民女子,從“笑”這個詞可以看出她是一個天真爛漫活潑的人,是家樹的心上人,曾經(jīng)送了家樹一張自己的半身像照片,并受其恩惠,搬到大喜胡同居住,后來卻受金錢迷惑虛榮心作祟做了劉將軍的夫人,一次和家樹私會被劉將軍鞭打致瘋,最后凄慘死去。
圖3 “秀姑”在小說《啼笑因緣》中的情節(jié)分布圖
從圖3可知,“秀姑”出現(xiàn)的頻率也較高,是小說另一個比較重要的人物。和鳳喜相比,她出現(xiàn)的時間更早,但是出現(xiàn)的頻率相對較少,只集中在部分章節(jié)。從Collate檢索和其搭配的關(guān)鍵詞有“家樹”“壽峰”“鳳喜”“姑娘”“何麗娜”“救命”“醫(yī)院”“英雄”等,結(jié)合Concordance可知江湖俠女秀姑是“壽峰”的女兒,因家樹幫助父親入院治病一事而對家樹暗生情愫,曾經(jīng)救“鳳喜”于水深火熱之中,俠肝義膽,盡力撮合家樹和何麗娜,最后在戰(zhàn)爭中為國捐軀。
圖4 “何麗娜”在小說《啼笑因緣》中的情節(jié)分布圖
從圖4可知,“何麗娜”相對集中在小說后半段出現(xiàn),前半部分出現(xiàn)的次數(shù)比較少,可見她在小說的后半部分起到了關(guān)鍵作用,是一個從次要到關(guān)鍵的循序發(fā)展的人物。從Collate檢索與其搭配的關(guān)鍵詞有“家樹”“車子”“茶”“汽車”“密斯何”“鳳喜”“音樂”等。結(jié)合Concordance可知,部長千金何麗娜剛開始生活奢侈,經(jīng)常出入于跳舞場,和鳳喜長相酷似,深深愛戀著家樹,為了愛毅然改變自己奢靡的作風(fēng),后來與家樹喜結(jié)良緣。
綜上可知,《啼笑因緣》主要講述的是一男三女之間的愛情故事,男主人公家樹多金但不紈绔、樂于助人、平等待人、進(jìn)步向上,另外三個女主人公——鳳喜美麗純真但拜金虛榮,秀姑淳樸豪爽且狹義、富家女何麗娜時髦活潑且愛情至上,一女三男之間上演了種種“啼笑姻緣”的愛情故事。
上文通過使用Word List、Concordance Plot、Concordance以及Collates功能簡要地分析了小說的敘述視角、語言特色、人物形象與關(guān)系,對小說的內(nèi)容有了大致的了解,但對于文本脈絡(luò)的掌握并不完整細(xì)致,要想深入而詳細(xì)地了解小說的精髓與核心思想,還必須結(jié)合使用Keyword List功能。Keyword List功能可以通過建立一個比目標(biāo)語料庫更大的參照語料庫,并提取目標(biāo)語料庫中在詞頻方面具有顯著性差異的詞語,生成關(guān)鍵詞詞表。該功能有助于更加細(xì)致深入地分析文本主題和內(nèi)容特色,從而準(zhǔn)確把握文本的情節(jié)發(fā)展。
表2 《啼笑因緣》關(guān)鍵詞分類表
本研究的目標(biāo)語料庫《啼笑因緣》,其語料庫總字?jǐn)?shù)為241,061字;參照語料庫選取的是張恨水的另一部通俗小說《紙醉金迷》,共593,077字。
使用Keyword List功能生成小說《啼笑因緣》的關(guān)鍵詞,選取了顯著性排名在前72位、并具有研究價值的51個關(guān)鍵詞進(jìn)行多角度歸類,具體見表2(表格中的數(shù)字表示關(guān)鍵詞的顯著性排名)。
從表2可知,前14個關(guān)鍵詞中,除了第9位“姑娘”不是指具體的人物,指的是一種稱謂以外,其余十三個都是指人物。通過concordance發(fā)現(xiàn)“何小姐”與“密斯何”,“樊先生”與“樊大爺”分別指的是小說的主要人物“何麗娜”“樊家樹”。此外還有“何廉”“尚師長”“劉?!薄把徘佟薄袄钣绖佟薄跋脑粕健币约啊吧蚪y(tǒng)制”,共計20個人名。
再從這些名字特點(diǎn)上看,“鳳喜”“秀姑”“壽峰”這樣的名字比較傳統(tǒng),屬于年代比較久遠(yuǎn)的名字,而“何麗娜”這個名字又比較歐化,更具現(xiàn)代性,而且文中還有“密斯何”即Miss He這種受西方文化影響的外來品,也有“少爺”這種傳統(tǒng)文化的稱謂,因此可以推斷小說故事應(yīng)該發(fā)生在一個新舊交替、傳統(tǒng)文化與西洋文化碰撞激烈的年代——民國時期。又從“劉將軍”“尚師長”“沈統(tǒng)制”這些名稱中可以推斷,故事發(fā)生背景可能還與軍閥政治相關(guān)。
此外,還有各種稱謂,比如“姑娘”“大叔”“女子”“叔叔”“父親”“表嫂”“夫婦”“大夫”“少爺”??梢娫撔≌f涉及的人物眾多,且關(guān)系復(fù)雜,各個年齡段、男女性皆有涉及。
從地名一欄可見,小說發(fā)生的地點(diǎn)主要有“北京”和“天津”兩座城市,而具體到范圍更小的地方有“院子”“胡同”“西山”“天橋”——這些都是老北京的特色,說明“北京”是小說情節(jié)設(shè)置最主要發(fā)生的地點(diǎn)。通過Concordance發(fā)現(xiàn),小說一些重要故事情節(jié)都發(fā)生在“醫(yī)院”,比如家樹幫助壽峰大叔住院,鳳喜被鞭打致瘋后住院治療,這兩個場景都極大地推動了小說故事情節(jié)的發(fā)展。
從政治一欄可知,故事背景還涉及政治軍事。結(jié)合前文所說從人名和稱謂上推測故事發(fā)生的年代是在民國時期,又通過Concordance進(jìn)一步分析可以推斷小說發(fā)生的具體時期是軍閥混戰(zhàn)烽煙未息、列強(qiáng)侵華野心日顯的年代。
最后,在其它這一欄中,結(jié)合Concordance功能,從“唱”和“大鼓”這兩個詞可以發(fā)現(xiàn)小說女主人公之一的鳳喜是唱大鼓出身的平民女子,與家樹相識時正是在天橋唱大鼓的時候?!捌嚒币辉~說明小說也涉及上層人物,“書”也符合了家樹作為知識分子的特質(zhì),來京是為了考取學(xué)位。另外“相片”是小說的一條重要發(fā)展線索,起因是鳳喜贈送了家樹自己的一張照片,而鳳喜又和何麗娜長得很相像,后來被陶太太看到誤以為家樹喜歡何麗娜,就盡力撮合他倆,由此引發(fā)了一場“啼笑皆非”的愛情故事。
綜上所述,通過對小說中人物、時間、地點(diǎn)、背景和情節(jié)的深入了解,可以歸納出小說中的三條愛情主線——①男主人公家樹愛上了唱大鼓書的平民女子鳳喜,盡自己的能力幫助鳳喜走出貧困,但兩人有緣無份,鳳喜受到金錢的誘惑嫁給了劉將軍,卻被劉將軍鞭打致瘋,最后在思念與懺悔中病死;②家樹在一次去天橋閑逛時結(jié)識了豪爽仗義的關(guān)壽峰,后與其女兒秀姑相識,因家樹盡心幫助關(guān)壽峰入院醫(yī)治,使得秀姑對其暗生情愫。雖然家樹心有他屬,俠肝義膽的江湖俠女秀姑依舊全心全意為家樹付出,比如深入劉將軍府解救鳳喜。后來秀姑與其父參加了義勇軍,并為國犧牲;③家樹初見富家女何麗娜時并不心動,甚至覺得其生活放蕩奢靡,后來因遭鳳喜背叛,且何麗娜為愛情甘愿改變自己的生活作風(fēng),使得家樹對其刮目相看,兩人終成眷屬??梢姁矍槭窃撔≌f最重要的主題,另外其中也穿插了關(guān)壽峰和秀姑父女倆除強(qiáng)扶弱的武俠傳奇主題,以及最后眾人為國奉獻(xiàn)的愛國主題。
本研究借助語料庫檢索軟件AntConc3.2.4w,綜合運(yùn)用Word List、Concordance等功能,對張恨水小說《啼笑因緣》從敘述視角、語言特色、人物形象、人物關(guān)系、文本主題與情節(jié)發(fā)展六個角度進(jìn)行了細(xì)致深入的分析。
采用Word List功能,從敘述視角和語言特色對小說進(jìn)行分析,發(fā)現(xiàn)小說主要采用第三人稱敘事視角,可以更加客觀地反映小說內(nèi)容,而且小說中存在大量的人物對話,又在一定程度上拉近與讀者的距離。
采 用 Word List、Concordance Plot、Concordance、Collates功能,初步分析了小說四個主要人物的形象和關(guān)系。家樹出身富家,但講究平等,不嫌貧愛富,樂于助人;鳳喜出身貧苦,美麗活潑但拜金虛榮,缺乏獨(dú)立意識;秀姑俠肝義膽、古道熱腸,具有犧牲奉獻(xiàn)精神;何麗娜家境優(yōu)越,美麗勇敢,勇于追求愛情。小說就是圍繞著這一男三女之間的多角戀愛展開的。
采用Keyword List、Concordance功能,深入分析文本主題與情節(jié)發(fā)展。該小說發(fā)生在軍閥混戰(zhàn)烽煙未息、列強(qiáng)侵華野心日顯的民國時期,地點(diǎn)主要在北京,涉及人物眾多,且關(guān)系復(fù)雜,共有三個主題:愛情、武俠和愛國。其中愛情是最主要的主題,共涉及三條愛情線索——家樹與鳳喜、家樹與秀姑、家樹與何麗娜。小說沿著這三條主線發(fā)展了一系列故事情節(jié)。
基于相關(guān)語料庫AntConc軟件對小說《啼笑因緣》進(jìn)行定量分析,雖然缺乏一定的感染力,但是具有層次清晰、數(shù)據(jù)量化等特點(diǎn),有助于提高文本分析的準(zhǔn)確度,對于傳統(tǒng)文學(xué)鑒賞《啼笑因緣》起到了有益的補(bǔ)充作用。