国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

從語料庫文體學(xué)的視角看培根Essays的文體特征

2011-12-28 02:02張榮梅
關(guān)鍵詞:文體學(xué)培根詞頻

周 琨,張榮梅

(江蘇科技大學(xué) 外國語學(xué)院,江蘇 鎮(zhèn)江 212003)

從語料庫文體學(xué)的視角看培根Essays的文體特征

周 琨,張榮梅

(江蘇科技大學(xué) 外國語學(xué)院,江蘇 鎮(zhèn)江 212003)

采用實(shí)證的研究方法,從語料庫文體學(xué)的視角出發(fā),建立一個(gè)包含培根隨筆集Essays的小型語料庫,并借助于WordSmith軟件,詳細(xì)比較Essays和參照語料庫Flob的部分文體特征,發(fā)現(xiàn)Essays具有詞匯豐富,句式靈活多變等鮮明的特點(diǎn),驗(yàn)證了語料庫的方法在文體學(xué)研究中的有效性。

語料庫文體學(xué);培根隨筆集;文體特征

20世紀(jì)60年代以來,隨著語料庫語言學(xué)的迅速發(fā)展,基于語料庫的研究方法逐漸為人們所認(rèn)識(shí)并采用,成為一種重要的研究范式。語料庫語言學(xué)與文體學(xué)相結(jié)合而催生的語料庫文體學(xué)(Corpus Stylistics)是一個(gè)新興的研究領(lǐng)域,旨在借助語料庫的工具提供一種新的途徑來描述語篇中的言語、寫作和思想表達(dá)形式,以實(shí)證的方法對(duì)文本的文體特征進(jìn)行定量和定性的研究。[1]

弗朗西斯·培根(1561-1626)是英國文藝復(fù)興時(shí)期著名的哲學(xué)家和文學(xué)家,Essays是其主要文學(xué)著作,在世界文壇享有不朽的文學(xué)聲譽(yù)。該書包括58篇散文,內(nèi)容非常豐富,涉及哲學(xué)思想、倫理探討、處世方法以及藝術(shù)欣賞等。培根的論述見解獨(dú)到,且文筆優(yōu)美,簡潔老練,警句迭出,被奉為散文史上的杰作,因而備受推崇,重印不衰,并被譯成各國文字廣為流傳。

一、Essays語料庫的建立及相關(guān)分析軟件

Leech和Short(1981)提出了一個(gè)文本分析模式,用來分析文本的文體特征。他們將考察的對(duì)象按層次整理,并列出了一個(gè)詳盡的清單,包括詞匯特征、語法特征、修辭手段、語境和銜接四大類,每一大類下面又具體分了各小類。[2]75-80本文將用語料庫的方法來研究Essays的詞匯特征和語法特征。

1.語料庫的建立

國內(nèi)外有多家出版社都出版了Essays這部作品,但基本都是忠實(shí)于原著,沒有進(jìn)行什么刪改。作者以目前較為流行的外語教學(xué)與研究出版社1998年4月的版本為依據(jù),將全書58篇文章電子化,并對(duì)書中的標(biāo)題、段落以及句子等基本信息進(jìn)行初步的標(biāo)注(annotation)。在此基礎(chǔ)上,利用CLAWS標(biāo)注系統(tǒng)對(duì)其進(jìn)行詞類賦碼(tagging)并進(jìn)行后期的手工校對(duì),改正自動(dòng)賦碼過程中的少量錯(cuò)誤。這樣,一個(gè)簡單Essays語料庫就建成了。

2.參照語料庫

Flob (Freiburg-Lob Corpus of British English)語料庫是Lob語料庫的更新版本,收錄了20世紀(jì)90年代英國英語語料。該語料庫的庫容為100萬詞左右,包含500個(gè)各類文體的文本,每個(gè)文本大約2000詞,是一個(gè)很好的參照語料庫。

3.WordSmith 5.0

WordSmith是一款功能非常強(qiáng)大的語料庫軟件,目前的最新版本是5.0,由利物浦大學(xué)的Mike Scott博士開發(fā)。它具有很強(qiáng)的詞語索引和統(tǒng)計(jì)功能,能提供多項(xiàng)統(tǒng)計(jì)數(shù)據(jù),如形符、類符、類符/形符比、標(biāo)準(zhǔn)化類符/形符比、詞頻、平均詞長、平均句長等。

二、Essays的詞匯特征和語法特征

本文所采用的WordSmith 5.0軟件在分析過程中將所考察的部分詞匯和語法范疇交叉在一起,例如表1同時(shí)包含詞匯和句子的分析數(shù)據(jù),而其中句長等概念在Leech和Short的清單中則屬于語法范疇;表4中包含的各個(gè)詞類則依實(shí)詞和虛詞的區(qū)分被分別歸入了詞匯和語法范疇。因此,為了方便討論,在下面的研究中筆者也把這兩大類特征放在一起考察。

1.形符、類符、類符/形符比和標(biāo)準(zhǔn)化類符/形符比

運(yùn)行WordSmith 5.0,分別打開Essays和Flob語料庫,利用軟件中的“Wordlist”功能,經(jīng)簡單計(jì)算后可以得到如下的統(tǒng)計(jì)數(shù)據(jù):

表1 Essays和Flob基于Wordlist功能的主要統(tǒng)計(jì)數(shù)據(jù)

形符(tokens)是一個(gè)語言單位,類似于我們?nèi)粘Uf的“詞”。[3]9形符數(shù)是語料庫容量的最常用的測量單位,一個(gè)文本的形符數(shù)就是該文本的長度。比如,一個(gè)1億詞的語料庫就是指這個(gè)語料庫有1億個(gè)形符。從表1可以看出,Essays的總形符數(shù)為51,952,去除文本中的阿拉伯?dāng)?shù)字以后的形符數(shù)為51,949;Flob 的總形符數(shù)為 1,235,041,去除阿拉伯?dāng)?shù)字后的形符數(shù)為1,004,738,因此這兩個(gè)語料庫從容量上來說相差近20倍。

類符(types)指不重復(fù)計(jì)算的形符數(shù),重復(fù)出現(xiàn)的形符只能記作一個(gè)類符。[3]9一個(gè)文本的類符數(shù)就是該文本不同形符的數(shù)量。例如,一個(gè)100詞的文本中,如果有80個(gè)不同的單詞,那么這個(gè)文本的形符數(shù)為100,類符數(shù)為80。如表1所示,Essays和Flob的類符數(shù)分別為為6,727和45,539。

類符/形符比(TTR,type/token ratio)是衡量文本中詞匯密度(lexical density)的常用方法。[3]9從表1的數(shù)據(jù)來看,兩個(gè)語料庫的TTR存在巨大差異:Essays為 12.95,而 Flob僅為 4.53,但這并不表示Essays的詞匯密度達(dá)到Flob的三倍之多,而主要是由于兩庫的庫容相差巨大,TTR不能準(zhǔn)確反映其詞匯密度水平。這種情況下我們可以借助標(biāo)準(zhǔn)化類符/形符比的概念來進(jìn)一步考察兩庫的詞匯密度情況。

標(biāo)準(zhǔn)化類符/形符比 (STTR,standardised type/token ratio)是按一定長度分批計(jì)算文本的TTR,然后計(jì)算所有TTR的平均值所得的結(jié)果。比如,Wordsmith默認(rèn)設(shè)置長度設(shè)為1000(可根據(jù)文本的長度進(jìn)行適當(dāng)?shù)恼{(diào)整),則在運(yùn)行過程中會(huì)計(jì)算文本中每1000個(gè)形符的TTR,然后計(jì)算出所得的所有TTR的平均值,得到的數(shù)值就是該文本的STTR。這種方法可以彌補(bǔ)用TTR來計(jì)算不同長度文本詞匯密度的不足。因此我們來看一下這兩個(gè)語料庫的STTR 值:Essays為 41.35,F(xiàn)lob 為 39.03,Essays高于Flob 5.94%。這組數(shù)據(jù)應(yīng)該是比較理性和可靠的,它們說明相對(duì)于參照語料庫來說,Essays的詞匯密度較大,也就是說Essays的詞匯使用更加靈活,詞匯量更為豐富。

2.詞長分布及平均詞長

詞長 (word length)即一個(gè)單詞所包含的字母數(shù)。通過Wordsmith的Wordlist功能,我們還可以得到語料庫中有關(guān)詞長的數(shù)據(jù)。

表2 Essays和Flob的詞長分布情況

觀察表2的數(shù)據(jù)我們可以發(fā)現(xiàn),Essays和Flob中四個(gè)字母以下的單詞均占較大的比重,所不同的是,Essays的雙字母單詞和四字母單詞的比例大于Flob,而單字母單詞和三字母單詞的比例則小于Flob。另外,Essays中包含5-7個(gè)字母的單詞所占比重均高于Flob,而8個(gè)及以上字母構(gòu)成的單詞則比重較小。

平均詞長(average word length)指文本中單詞的平均長度。一般來說,一個(gè)文本的平均詞長反映該文本中詞匯的復(fù)雜程度和難易程度。從表1的數(shù)據(jù)來看,Essays的平均詞長為4.375,略高于Flob的4.367,這說明整體而言,Essays中用詞的復(fù)雜程度和難度略高。

3.平均句長及其標(biāo)準(zhǔn)差

平均句長(average sentence length)指文本中句子的平均長度。一般來說,一個(gè)文本的平均句長越長,則說明該文本的句子越復(fù)雜,反之則越簡單。根據(jù)表1的數(shù)據(jù),Essays的平均句長達(dá)到每句29.28個(gè)單詞,大大高于Flob的平均每句18.83個(gè)單詞,這充分說明培根在Essays中使用了大量較長的語句。

標(biāo)準(zhǔn)差(std.dev.,Standard Deviation)是一個(gè)統(tǒng)計(jì)學(xué)概念,指一個(gè)數(shù)據(jù)集中各數(shù)據(jù)偏離該數(shù)據(jù)集平均數(shù)的距離的平均數(shù),能反映該數(shù)據(jù)集的離散程度。就句長標(biāo)準(zhǔn)差而言,如果一個(gè)文本的句長標(biāo)準(zhǔn)差較大,則表示該文本的句長偏離平均句長較大,也就是說該文本中各個(gè)句子間的長度差異較大;反之則說明該文本中各個(gè)句子的長度比較一致,相差較小。觀察表1中的數(shù)據(jù)發(fā)現(xiàn),在Essays中,句長標(biāo)準(zhǔn)差為17.45,高出Flob近30%,可以看出培根在Essays中的語言使用富于變化,句式靈活,既有大量的長難句,也運(yùn)用了一些簡潔的短句,增加了語言的表現(xiàn)力。

4.詞頻

詞頻(word frequency)指一個(gè)單詞在文本中出現(xiàn)的次數(shù)。詞頻可用于觀察、比較不同單詞的使用頻率,并從文本中出現(xiàn)的一些高頻詞中發(fā)現(xiàn)作者的用詞習(xí)慣。

用Wordsmith分別運(yùn)行Essays和Flob,觀察各自的frequency列表,我們可以發(fā)現(xiàn),Essays中詞頻超過1%的高頻詞有13個(gè) (如表3所示),F(xiàn)lob有8個(gè);而Essays中詞頻超過0.1%的有120個(gè),F(xiàn)lob有97個(gè)。從表3中還可以看出,在這13個(gè)高頻詞中,只有a和the這兩個(gè)冠詞在Essays中出現(xiàn)得比Flob少,特別是the,少了近1%,這說明培根在Essays中冠詞使用偏少。另外,Essays中部分連詞的使用則明顯多于 Flob,如 and,that,but等,這也符合 Essays中句式比較復(fù)雜,長難句較多的特點(diǎn)。

表3 Essays和Flob中的部分高頻詞

5.詞類分布

運(yùn)用Wordsmith的Concord功能對(duì)Essays和Flob分別進(jìn)行檢索,并對(duì)檢索結(jié)果進(jìn)行簡單的計(jì)算,可以獲得這兩個(gè)語料庫中主要詞類的使用情況,如表4所示:

表4 Essays和Flob的詞類分布情況

表4的數(shù)據(jù)顯示,兩個(gè)語料庫在詞類的構(gòu)成上總體相當(dāng),差別不是太大。主要區(qū)別有以下幾點(diǎn):(1)Essays的名詞使用量較少,相應(yīng)地,主要用來修飾名詞的形容詞和冠詞的使用量也偏少;(2)Essays中的連詞使用較多,所占比例幾乎接近Flob的2倍,使得語句更加流暢、豐滿,同時(shí)也增加了句子的長度和難度;(3)Essays中很少使用感嘆詞,感嘆詞在文本中所占的比例大約相當(dāng)于Flob的1/5,這說明口語化的表達(dá)在Essays中很少出現(xiàn),而基本上是以書面語為主;(4)Essays中大量使用了外來語,如拉丁語、希臘語及法語等,外來詞匯的使用比例幾乎達(dá)到了Flob的20倍之多,這是該作品的一個(gè)顯著特色。

三、結(jié)語

從以上的分析中可以看出,Essays在詞匯和語法方面都具有較為鮮明的特色,如詞匯豐富,句式靈活多變等。這一結(jié)果和讀者在閱讀這部作品時(shí)的主觀感受相一致,同時(shí)也驗(yàn)證了語料庫在文體分析中的有效性。然而,由于語料庫文體學(xué)畢竟還是一個(gè)比較年輕的學(xué)科,其本身還存在一定的不足,尤其是文本分析與計(jì)算機(jī)技術(shù)的結(jié)合,還有待進(jìn)一步的研究和完善,如語料的深層次自動(dòng)標(biāo)注和相關(guān)分析軟件的研制等。筆者堅(jiān)信,隨著計(jì)算機(jī)技術(shù)的不斷發(fā)展,語料庫文體學(xué)將會(huì)在語言學(xué)和文學(xué)的研究中發(fā)揮更大的作用。

[1]劉 靖,黃立波.《語料庫文體學(xué)》述介[J].外語教學(xué)與研究,2010,(3):236.

[2]Leech,G.N.,Short,M.H.Style in Fiction:A Linguistic Introduction to English Fictional Prose[M].London:Longman,1981.

[3]梁茂成,李文中,許家金.語料庫應(yīng)用教程[M].北京:外語教學(xué)與研究出版社,2010.

Stylistic Features of Bacon's Essays:A Corpus Stylistic Perspective

ZHOU Kun,ZHANG Rong-mei
(School of Foreign Languages,Jiangsu University of Science and Technology,Zhenjiang,Jiangsu China,212003)

From the perspective of Corpus Stylistics,the author constructs a small corpus composed of Bacon's Essays,compares some stylistic features of Essays and Flob,a reference corpus,and finds that Essays has very striking lexical and grammatical features.The results of the research also confirm the validity of the corpus-based approach in stylistics studies.

Corpus Stylistics;Bacon's Essays;stylistic feature

H315

A

1008—7974(2011)11—0059—04

江蘇科技大學(xué)人文社科項(xiàng)目“曹明倫譯《培根隨筆集》的文學(xué)文體學(xué)研究”階段性成果。項(xiàng)目編號(hào):2009WY124J

2011—08—20

周 琨(1976-),安徽合肥人,江蘇科技大學(xué)外國語學(xué)院講師,碩士;張榮梅(1978-),女,江蘇南通人,江蘇科技大學(xué)外國語學(xué)院講師,碩士。

林凡)

猜你喜歡
文體學(xué)培根詞頻
文體學(xué)的學(xué)科特點(diǎn)和發(fā)展趨勢研究
蔬果們的七七八八
《語料庫翻譯文體學(xué)》評(píng)介
25年來中國修辭研究的關(guān)鍵詞詞頻統(tǒng)計(jì)*——基于國家社科與教育部社科課題立項(xiàng)數(shù)據(jù)
從文體學(xué)視角研究英詩《為國捐軀》的反戰(zhàn)主題
火腿培根,吃還是不吃?
開封后的培根該如何保存?
詞頻,一部隱秘的歷史
以關(guān)鍵詞詞頻法透視《大學(xué)圖書館學(xué)報(bào)》學(xué)術(shù)研究特色
百貨們的囧事