劉瑜 于小娟
摘要:借助語(yǔ)料庫(kù)檢索工具 WordSmith5.0,通過對(duì)比分析自建《哈利.波特》系列小說語(yǔ)料庫(kù)和BROWN(K-R)文學(xué)類語(yǔ)料庫(kù)在詞匯分布、詞匯密度方面的特征,試圖發(fā)現(xiàn)《哈利.波特》系列小說的詞匯特征。
關(guān)鍵詞:《哈利.波特》;BROWN(K-R)文學(xué)語(yǔ)料庫(kù);詞匯特征
一、研究背景
隨著語(yǔ)料庫(kù)語(yǔ)言學(xué)的發(fā)展,語(yǔ)料庫(kù)文體學(xué)以現(xiàn)代計(jì)算機(jī)和統(tǒng)計(jì)學(xué)的手段對(duì)文本進(jìn)行分析,它強(qiáng)調(diào)用定量分析的方法分析文本,利用語(yǔ)料庫(kù)及語(yǔ)料庫(kù)工具對(duì)文本進(jìn)行客觀地、量化地分析文本。較之基于直覺和印象主義的文體學(xué),語(yǔ)料庫(kù)文體學(xué)能提供更客觀的數(shù)據(jù),更有說服力。
《哈利.波特》是英國(guó)作家J.K.羅琳的魔幻文學(xué)系列小說,共7部。該系列小說被翻譯成67種語(yǔ)言,所有版本的總銷量逾5億本,名列世界上最暢銷小說之列。國(guó)內(nèi)外學(xué)者從不同視角對(duì)它進(jìn)行了多元化的剖析。從研究現(xiàn)狀來看,以使用文學(xué)理論進(jìn)行的描述性研究為主導(dǎo),尚缺乏將定量分析技巧與定性分析方法相融合的研究方法?;诖耍疚膶⒗谜Z(yǔ)料庫(kù)定量研究方法對(duì)《哈利.波特》系列小說的文體詞匯特征進(jìn)行分析。
二、研究方法
本文的研究語(yǔ)料為自建的由7部《哈利.波特》系列小說構(gòu)成的微型語(yǔ)料庫(kù)共100多萬字,同時(shí)選取BROWN 語(yǔ)料庫(kù)中文學(xué)類文本,即 BROWN(K-R)(共計(jì)約 25 萬多詞)作為參照語(yǔ)料庫(kù)。本文利用語(yǔ)料庫(kù)文本分析軟件 Wordsmith Tools5.0對(duì)比兩庫(kù)中詞長(zhǎng)和詞匯密度等層面的特征,分析《哈利.波特》系列小說的詞匯特征。
三、研究結(jié)果與討論
1.詞長(zhǎng)分析
本研究發(fā)現(xiàn),只有1-13字母單詞在兩個(gè)語(yǔ)料庫(kù)中的比率均在0.1%以上,因此,通過對(duì)比《哈利.波特》系列小說語(yǔ)料庫(kù)和BROWN(K-R)文學(xué)類語(yǔ)料庫(kù)中1-13字母單詞的比率(如圖1所示),可以發(fā)現(xiàn),1-13字母單詞在《哈利.波特》系列小說語(yǔ)料庫(kù)中所占比率均小于在BROWN(K-R)文學(xué)類語(yǔ)料庫(kù)中的比率。由于“詞長(zhǎng)是決定文本難易程度的一個(gè)重要指標(biāo)。單詞越短小,文本越易理解,難度越低,文本的正式程度就越低;反之,單詞越長(zhǎng),文本越不易理解,難度越大,文本越正式”[2]。圖1進(jìn)一步表明《哈利.波特》系列小說的閱讀難度較大小。
2.詞頻和詞匯密度分析
形符(Tokens)指在詞頻統(tǒng)計(jì)時(shí),一個(gè)單詞計(jì)算為一個(gè)形符,即文本中有多少單詞就有多少形符??傂畏麛?shù)是語(yǔ)料庫(kù)容量的最常用的測(cè)量單位。表1顯示,《哈利.波特》系列小說語(yǔ)料庫(kù)總形符數(shù)為1,096,170,BROWN(K-R)文學(xué)類語(yǔ)料庫(kù)總形符數(shù)為256,087,因此這兩個(gè)語(yǔ)料庫(kù)在容量上相差近4.28倍。
類符(Types)是一個(gè)統(tǒng)計(jì)單位,一個(gè)文本的類符數(shù)就是該文本不同詞形的數(shù)量,如表1所示,《哈利.波特》系列小說語(yǔ)料庫(kù)和BROWN(K-R)文學(xué)類語(yǔ)料庫(kù)中的類符數(shù)分別為23,146和19,198。
在語(yǔ)料庫(kù)語(yǔ)言學(xué)中,類符/形符比(TTR)通常被用來衡量文本中的詞匯密度[3],詞匯密度反映的是句中實(shí)詞所占的比例,因此在一定程度上反映了文本的某種本質(zhì)特征,即用詞的多樣性。表1 的統(tǒng)計(jì)結(jié)果顯示,《哈利.波特》系列小說語(yǔ)料庫(kù)中類符/形符比為 2.11,而 BROWN(K-R)文學(xué)類語(yǔ)料庫(kù)的類符/形符比為 7.56,但由于不同容量的語(yǔ)料庫(kù)類符/形符比不具可比性,故一般用標(biāo)準(zhǔn)化類符/形符比(STTR)來衡量語(yǔ)料庫(kù)的詞匯密度。
標(biāo)準(zhǔn)化類符/形符比(STTR)是將所得到的若干個(gè)類符/形符比進(jìn)行均值處理后最終得到的數(shù)值。《哈利.波特》系列小說語(yǔ)料庫(kù)和BROWN(K-R)文學(xué)類語(yǔ)料庫(kù)的標(biāo)準(zhǔn)化類符/形符比分別為44.33和44.89。Halliday發(fā)現(xiàn)非正式書面語(yǔ)體的詞匯密度低,書面語(yǔ)詞匯密度高,信息量大;而口語(yǔ)詞匯密度低,包含信息量小,但是句子結(jié)構(gòu)靈活多變、復(fù)雜?;谝陨蠑?shù)據(jù)分析可以了解到《哈利.波特》系列小說的詞匯普遍短小,詞匯密度較低,口語(yǔ)化特征明顯,用詞更加簡(jiǎn)易,通俗。
四、結(jié)語(yǔ)
通過對(duì)比分析自建《哈利.波特》系列小說語(yǔ)料庫(kù)和BROWN(K-R)文學(xué)類語(yǔ)料庫(kù)在詞匯分布、詞匯密度方面的詞匯特征,發(fā)現(xiàn)《哈利.波特》系列小說所用詞匯普遍短小,詞匯密度較高,口語(yǔ)化特征明顯,敘事簡(jiǎn)潔、平實(shí),可讀性強(qiáng)。因此,語(yǔ)言研究者通過語(yǔ)料庫(kù)手段對(duì)文學(xué)作品詞匯進(jìn)行量化分析,可以觀察到用傳統(tǒng)方法無法發(fā)現(xiàn)的很多語(yǔ)言事實(shí),從而對(duì)語(yǔ)言本身進(jìn)行更加客觀地描寫和解釋,為研究提供更加科學(xué)的數(shù)據(jù)支撐,從而使結(jié)果更具客觀性和準(zhǔn)確性,繼而增加了 解釋的說服力。
【參考文獻(xiàn)】
[1]陳建生,高博.基于語(yǔ)料庫(kù)的《詩(shī)經(jīng)》兩個(gè)英譯本的譯者風(fēng)格考察—以“國(guó)風(fēng)”為例[J].天津外國(guó)語(yǔ)大學(xué)學(xué)報(bào),20111(04):36-41
[2]楊秀珍,續(xù)娜,劉美瑜.基于語(yǔ)料庫(kù)的 《暮光之城 》系列小說詞匯特點(diǎn)初探[J].長(zhǎng)春理工大學(xué)學(xué)報(bào),2010(02):71-73
[3]王華,甄鳳超.透過主題詞和關(guān)鍵主題詞管窺中國(guó)學(xué)習(xí)者英語(yǔ)口語(yǔ)交際能力中的詞語(yǔ)知識(shí)[J].外語(yǔ)界,2007(01)