国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

菲茨杰拉德作品一致性的潛在語義分析

2013-09-05 02:18:20劉海燕尹曉虎
統(tǒng)計(jì)與信息論壇 2013年1期
關(guān)鍵詞:菲茨杰拉德相似性章節(jié)

劉海燕,尹曉虎

(1.南京信息工程大學(xué) 語言文化學(xué)院,江蘇 南京 210044;2.72465部隊(duì),山東 濟(jì)南 250022)

一、引 言

美學(xué)價(jià)值和審美觀因時(shí)因人而異,有關(guān)菲茨杰拉德評(píng)論的研究便印證了這一點(diǎn)。盡管現(xiàn)在菲茨杰拉德被譽(yù)為“爵士時(shí)代的桂冠詩人”,然而他在生前并未獲得如此崇高的文學(xué)地位,并且評(píng)論家們對(duì)于他的作品,尤其是他的長(zhǎng)篇小說,一直充滿了爭(zhēng)議。例如,Miller便認(rèn)為《了不起的蓋茨比(The Great Gatsby)》是菲茨杰拉德創(chuàng)作生涯的頂點(diǎn),而《夜色溫柔(Tender is The Night)》和《最后的大亨(The Last Tycoon)》則是華麗的失敗,因?yàn)楹髢刹孔髌吩僖膊荒軐?shí)現(xiàn)《了不起的蓋茨比》所達(dá)到的藝術(shù)水準(zhǔn)[1]293-296;Edward Weeks也曾經(jīng)認(rèn)為在《人間天堂(This Side of Paradise)》和《夜色溫柔》之間找不出任何不同[2]1-10。同時(shí),也有評(píng)論家對(duì)此存在不同看法,評(píng)論家Seldes認(rèn)為《夜色溫柔》是菲茨杰拉德作家生涯中最偉大的小說;Malcolm Cowley甚至曾經(jīng)將這部作品中的事件按照時(shí)間順序重新排序,試圖推翻以往評(píng)論家們都認(rèn)為的《夜色溫柔》在結(jié)構(gòu)上是斷裂的和松散的這一論斷[2]1-10。

文學(xué)批評(píng)應(yīng)該回歸到文本文學(xué)成就的研究,但迄今為止關(guān)于菲茨杰拉德作品的評(píng)論幾乎都與其生平和傳記有關(guān),這些定性的評(píng)論并不能提供有力的證據(jù)以支撐對(duì)菲茨杰拉德作品優(yōu)劣的比較和評(píng)判。從結(jié)構(gòu)上看,文本表現(xiàn)為語段和按照句法定義的單元(從句、句子)序列,同時(shí)也是一個(gè)統(tǒng)一的整體,完整、一致、情感、信息、人本、分段、時(shí)空統(tǒng)一等是文學(xué)文本最重要的概念[3]。有意義的優(yōu)秀的英語文本必然是一致的、有條理的和連貫的,“在一致的文本中,意義是清晰的,文本的各個(gè)段落形成了統(tǒng)一的整體”[4]。文本具有較高的一致性被認(rèn)為是寫作上取得成功的一個(gè)重要指標(biāo),一致性高的作品更容易被閱讀和理解[5]。

Halliday和Hasan是最早研究一致性的學(xué)者,他們認(rèn)為文本不是形式的整體,而是語義和邏輯的整體[6]。Harker認(rèn)為一致性是文本的一種表象性質(zhì),它描述文本中的結(jié)構(gòu)和相互關(guān)系,通過這種結(jié)構(gòu)和 關(guān) 系 建 立 表 面 上 的 統(tǒng) 一 性[7];Hwang 和Merrifield則認(rèn)為一致性是文學(xué)文本的一個(gè)固有屬性,它描述了文本不同要素之間的關(guān)系,取決于作者表達(dá)其意圖的方式[8]189-210;Leech和 Short將文本一致性分為交叉所指(如使用代詞)和聯(lián)系,聯(lián)系包括句子之間的邏輯或其他聯(lián)系,包括意義的隱含聯(lián)系[9]250-251;Tyrkkō提出一致性是對(duì)文學(xué)文本質(zhì)量的一種評(píng)價(jià),包括語法一致性和詞匯一致性[10]。語法一致性是指文本而不是單詞的堆砌、句子的羅列,文本意義的標(biāo)準(zhǔn)是不僅句子及其序列有意義,而且它們要有明確的所指;詞匯一致性就是文本中詞匯項(xiàng)的意義之間的關(guān)系。

由此可見,學(xué)者們對(duì)于一致性概念和內(nèi)涵的認(rèn)識(shí)還不盡統(tǒng)一,亟需建立能夠自動(dòng)處理文本和計(jì)算文本一致性的方法及工具。近年來,心理語言學(xué)、語料庫語言學(xué)和計(jì)算語言學(xué)的最新發(fā)展,已經(jīng)建立了能夠在不同維度上分析文本的復(fù)雜計(jì)算機(jī)工具,特別是已經(jīng)有能夠自動(dòng)處理大型詞匯索引、語法解析、語義分析、論文評(píng)分、摘要評(píng)論等的算法和程序[11]?;谶@些最新成果,有研究提出:文本的一致性可以通過考察文本不同單元所描述語義信息的相關(guān)程度進(jìn)行測(cè)度,而文本內(nèi)部相關(guān)程度的評(píng)估則可以采用潛在語義分析方法[12]107-122。

因此,可以利用潛在語義分析方法來計(jì)算文本的一致性測(cè)度,這為定量比較和判別菲茨杰拉德不同作品在寫作上的優(yōu)劣和差異提供了一種可行的思路。以下通過計(jì)算菲茨杰拉德的四部小說《人間天堂》、《漂亮冤家(The Beautiful and Damned)》、《了不起的蓋茨比》和《夜色溫柔》的一致性測(cè)度,首次對(duì)這些作品從語義角度進(jìn)行一致性的定量比較,以檢驗(yàn)上述作品現(xiàn)有的定性評(píng)論。

二、小說文本的向量空間模型與潛在語義分析

潛在語義分析是一種用于提取和推斷語篇中單詞使用語境之間關(guān)系的完全自動(dòng)的數(shù)學(xué)/統(tǒng)計(jì)技術(shù),其基本思想是假設(shè)在單詞及其語境之間存在著潛在的依賴關(guān)系,并且這種關(guān)系可以用其中若干變量構(gòu)成的語義空間來表示,它的主要功能是通過比較文本的向量表示從而計(jì)算文本之間的相似性,這一相對(duì)簡(jiǎn)單的相似性標(biāo)準(zhǔn)源于文本意義的心理學(xué)理論,并且已經(jīng)在許多文本分析任務(wù)中取得了與人類分析結(jié)論相一致的結(jié)果[13]。因此,作品的意義可通過探討單詞與其上下文之間的關(guān)系來理解[14]。

潛在語義分析的基礎(chǔ)是文本的向量空間模型,文本的意義是文本中所出現(xiàn)的所有單詞意義的平均,并可采用矩陣的形式表示。矩陣中的行代表不同的單詞,每一列表示一個(gè)文本章節(jié)或其他語境,行和列對(duì)應(yīng)的元素表示行所代表的單詞在列所代表的語境中出現(xiàn)的次數(shù)[15]。

具體而言,如果以小說的章節(jié)來劃分文本語境,假設(shè)在包含D個(gè)章節(jié)的小說中共有T個(gè)類符,類符i∈(1,2,…,T)在章節(jié)j∈(1,2,…,D)中出現(xiàn)的次數(shù)用頻率fij表示,這些頻率構(gòu)成了類符章節(jié)矩陣F,該矩陣即為小說文本的向量空間表示;F的每一列表示小說中的一個(gè)章節(jié);類符i在章節(jié)j中的相對(duì)重要性用ωij表示,ωij的值是fij和單詞統(tǒng)計(jì)測(cè)度重要性的函數(shù)。基于對(duì)類符章節(jié)矩陣F或類符權(quán)重矩陣W=(ωij)的奇異值分解,即可進(jìn)行文本潛在語義分析。

三、基于潛在語義分析的作品一致性測(cè)度及其計(jì)算

本文分析的并非是矩陣F,而是類符權(quán)重矩陣W=(ωij)。ωij通常被定義為ωij=lijgi,其中g(shù)i是反映類符i的整體價(jià)值的全局權(quán)重,例如可以是類符出現(xiàn)的章節(jié)個(gè)數(shù)的倒數(shù);lij是反映類符i在章節(jié)j中重要性的局部權(quán)重,例如類符頻率的對(duì)數(shù)。在本文的分析中,全局權(quán)重采用了逆章節(jié)頻率,而局部權(quán)重則采用了類符的對(duì)數(shù)頻率,其中類符i的全局逆章節(jié)頻率權(quán)重定義為gi=ln(D/dfi),dfi是類符i的章節(jié)頻率,定義為dfi=dij,dij為1表示類符i在文本j中出現(xiàn),否則為0;類符i的局部對(duì)數(shù)頻率權(quán)重定義為lij=ln (fij+1)。

為了測(cè)度小說文本的一致性,筆者考察了小說章節(jié)之間的相似性,并定義了小說的章節(jié)相似性矩陣S。對(duì)于由D個(gè)章節(jié)構(gòu)成的小說,其章節(jié)相似性矩陣S為D×D的對(duì)稱矩陣。矩陣S中的元素sjk表示章節(jié)j與章節(jié)k之間所表達(dá)意義的相似程度,這一相似程度可以利用類符在這兩個(gè)章節(jié)中的權(quán)重向量的余弦函數(shù)來計(jì)算,即:

根據(jù)上述定義,利用筆者的計(jì)算結(jié)果[16],即可計(jì)算菲茨杰拉德小說的章節(jié)相似性矩陣。下面以包含了9個(gè)章節(jié)的《了不起的蓋茨比》為例,其章節(jié)相似性矩陣S的計(jì)算結(jié)果為:

利用章節(jié)相似性矩陣S的一些性質(zhì),可對(duì)小說文本的一致性進(jìn)行分析和比較,其理論基礎(chǔ)如下:

定義1[17]446-450矩陣被稱為正矩陣,是指該矩陣的元素都是非負(fù)的且該矩陣不是零矩陣。若該矩陣的所有元素都為正,則稱該矩陣為嚴(yán)格正矩陣。

定義2[17]446-450n(n≥2)階的矩陣A= (aik)被稱為不可約的,是指對(duì)于集合 {1,2,…,n} 的任意非空子集P,總存在k∈P和jP,使得ajk≠0。

定理1[17]446-450非負(fù)矩陣A是不可約的,當(dāng)且僅當(dāng)A的矩陣指數(shù)exp(A)嚴(yán)格正。

定理2(Perron-Frobenius定理)[18]若非負(fù)不可約矩陣A的譜半徑為ρ(A),則有:

1.ρ(A)>0,且ρ(A)是A的重?cái)?shù)為1的本征值。

2.A的對(duì)應(yīng)于ρ(A)的左和右本征向量都是正的。

3.若λ為A的其他本征值,則有|λ|≤ρ(A)。

根據(jù)定義1、2和定理1,小說文本的章節(jié)相似性矩陣S是不可約的嚴(yán)格正矩陣。由定理2知:任何嚴(yán)格正的相似性矩陣S都至少存在一個(gè)實(shí)數(shù)非負(fù)本征值,且該本征值的模是所有本征值中最大的,從而可以用該本征值作為小說文本的一致性測(cè)度,記作λCoherence。同時(shí),因?yàn)橄嗨菩跃仃嘢是對(duì)稱的且其元素sij都介于0和1之間,包含D個(gè)章節(jié)的小說章節(jié)相似性矩陣SD×D的最大本征值則不會(huì)超過D。為比較包括不同章節(jié)數(shù)的小說之間一致性的差異,定義小說文本的一致性系數(shù)(Coefficient of Coherence):CC=λCoherence/D,有 CC∈[1/D,1]。

基于上述定義和定理,菲茨杰拉德小說一致性的潛在語義分析計(jì)算步驟可以歸納如下:

(1)首先獲得小說文本的電子版,對(duì)其中的拼寫和語法錯(cuò)誤進(jìn)行必要的修正。

(2)根據(jù)上下文的時(shí)態(tài)和語態(tài)將文本中的縮寫、縮略語等補(bǔ)充完整,如將“I’m”改成“I am”。

(3)去除文本中的符號(hào)和數(shù)字,包括引號(hào)、連字符等。

(4)編制計(jì)算機(jī)程序讀入小說文本,利用KSTEM算法將單詞詞干化,構(gòu)建小說文本的類符列表。

(5)編寫算法,統(tǒng)計(jì)小說各個(gè)章節(jié)中的類符數(shù)及其在各章節(jié)中的出現(xiàn)次數(shù),以獲得文本的向量空間表示矩陣F。

(6)計(jì)算類符的全局逆章節(jié)頻率權(quán)重和局部對(duì)數(shù)頻率權(quán)重,以建立類符權(quán)重矩陣W。

(7)對(duì)菲茨杰拉德的每部小說,根據(jù)類符權(quán)重矩陣計(jì)算其章節(jié)相似性矩陣S。

(8)對(duì)每部小說的章節(jié)相似性矩陣S進(jìn)行奇異值分解,以得到對(duì)應(yīng)的最大本征值。

(9)根據(jù)每部小說章節(jié)相似性矩陣S的最大本征值和章節(jié)數(shù),計(jì)算小說的一致性測(cè)度和一致性系數(shù)。

采用上述方法和步驟,計(jì)算菲茨杰拉德的四部小說的一致性測(cè)度和一致性系數(shù),結(jié)果見圖1。

圖1 菲茨杰拉德小說一致性的計(jì)算和比較圖

如圖1所示,從文本一致性的角度看,《人間天堂》到《了不起的蓋茨比》,菲茨杰拉德在對(duì)文本一致性的把握上是穩(wěn)步提升的。然而對(duì)于《夜色溫柔》,其一致性測(cè)度與一致性系數(shù)卻展現(xiàn)出兩個(gè)相反的結(jié)論:一致性測(cè)度顯示《夜色溫柔》要優(yōu)于菲茨杰拉德的前三部作品;一致性系數(shù)卻表明《夜色溫柔》稍遜于前三部作品。

對(duì)于這一結(jié)果可以這樣理解:小說文本的一致性與小說章節(jié)的結(jié)構(gòu)安排有關(guān),菲茨杰拉德的前三部作品都是分為9個(gè)章節(jié),而《夜色溫柔》則細(xì)分為61個(gè)章節(jié)。一致性測(cè)度是從整體連續(xù)性的角度來考察小說主題的全局連貫性和統(tǒng)一性,而一致性系數(shù)則是從章節(jié)與章節(jié)之間相關(guān)性的角度考察小說主題的局部連貫性和統(tǒng)一性。從這個(gè)意義來說,盡管《夜色溫柔》較菲茨杰拉德的前三部作品在主題意義上更為集中和內(nèi)斂,然而該作品的章節(jié)安排卻使章節(jié)與章節(jié)之間的意義表達(dá)更為松散,這就可以解釋為何不同的評(píng)論家對(duì)菲茨杰拉德的小說會(huì)有不同的認(rèn)識(shí)和評(píng)判。

四、結(jié) 論

小說文本的一致性是該小說在創(chuàng)作上是否良好的一個(gè)重要指標(biāo),評(píng)論家們對(duì)文本一致性的認(rèn)知分歧將會(huì)導(dǎo)致對(duì)該作品評(píng)判的差異。潛在語義分析為定量計(jì)算和比較不同作品的一致性提供了可行的思路和方法。本文以菲茨杰拉德的四部長(zhǎng)篇小說為例,基于潛在語義分析方法首次定義了小說文本的章節(jié)相似性矩陣、一致性測(cè)度和一致性系數(shù),并根據(jù)一致性測(cè)度和一致性系數(shù)對(duì)菲茨杰拉德的四部作品進(jìn)行了比較和分析,檢驗(yàn)并解釋了現(xiàn)有不同評(píng)論家們對(duì)這幾部作品的定性評(píng)論。

本文的計(jì)算和分析表明:小說文本的一致性與小說章節(jié)的結(jié)構(gòu)安排有關(guān)。一致性測(cè)度是從整體連續(xù)性的角度來考察小說主題的全局連貫性和統(tǒng)一性,而一致性系數(shù)則是從章節(jié)與章節(jié)之間相關(guān)性的角度考察小說主題的局部連貫性和統(tǒng)一性。評(píng)論家們對(duì)小說文本全局一致性和局部一致性的不同側(cè)重,導(dǎo)致其對(duì)同一部作品有著截然不同的評(píng)論。

[1] Bryant Mangum F.Scott Fitzgerald:American Novelist and Short Story Writer,Reader's Guide to Literature in English[M].London:Fitzroy-Dearborn,1995.

[2] Kirk Curnutt.The Cambridge Introduction to F.Scott Fitzgerald[M].Cambridge,UK:Cambridge University Press,2007.

[3] Alois Heuboeck.Some Aspects of Coherence,Genre and Rhetorical Structure and Their Integration in a Generic Model of Text[J].Language Studies Working Papers,2009,35(1).

[4] Ambreen Shahriar,Habibullah Pathan.Coherence and the Role of Cohesion in Coherent Texts[J].Language in India,2012(5).

[5] Mirella Lapata,Regina Barzilay.Automatic Evaluation of Text Coherence:Models and Representations[C].in Proceedings of the 19th International Joint Conference on Artificial Intelligence,San Francisco:Morgan Kaufmann Publishers Inc,2005.

[6] Eyyup Coskun.Text coherence in the narrative texts of Turkish students and Bilingual Uzbek students in Turkey[J].Scientific Research and Essay,2009(7).

[7] John Harker W.The Role of Cohesion and Coherence in Processing Literary Texts[J].Working Papers of the Linguistics Circle of the University of Victoria,1986(1).

[8] HWang Shin Ja J,Merrifield William R.Language in Context:Essays for Robert E.Longacre[M].Dallas:Summer Institute of Linguistics and the University of Texas at Arlington,1992.

[9] Leech Geoffrey N,Short Michael H .Style in Fiction:A Linguistic Introduction to English Fictional Prose[M].New York:Longman,1981.

[10] Jukka Tyrkk.Fuzzy Coherence:Making Sense of Continuity in Hypertext Narratives[D].Helsinki:University of Helsinki,2011.

[11] McNamara Danielle S,Max M.Louwerse and Arthur C.Graesser.Coh-Metrix:Automated cohesion and coherence scores to predict text readability and facilitate comprehension[R].Memphis:University of Memphis,2003.

[12] McCarthy Philip M,Briner Stephen W ,Vasile Rus,et al.Textual Signatures:Identifying Text-Types Using Latent Semantic Analysis to Measure the Cohesion of Text Structures,in Natural Language Processing and Text Mining[M].London:Springer-Verlag,2007.

[13] Preslav Nakov.Latent Semantic Analysis for German literature investigation[C].in 7th Fuzzy Days on Computational Intelligence,Theory and Applications,London,UK:Springer-Verlag,2001.

[14] Roberto Basili,Paolo Marocco.A geometrical approach to literary text analysis[C].in Toward Computational Models of Literary Analysis,Genoa,Italy:University of Roma Tor Vergata,2006.

[15] Landauer Thomas K,F(xiàn)oltz Peter W,Darrell Laham.An Introduction to Latent Semantic Analysis[J].Discourse Processes,1998,25(2-3).

[16] 劉海燕,黎漫暉.菲茨杰拉德創(chuàng)作能力的變遷--基于詞匯測(cè)度的統(tǒng)計(jì)分析[J].統(tǒng)計(jì)與信息論壇,2010(10).

[17] Thieme Horst R .Perron-Frobenius Theory of Positive Matrices and Associated Linear Dynamical Systems,in Mathematics in Population Biology[M].Princeton:Princeton University Press,2003.

[18] Unnikrishna Pillai S,Toresten Suel,Cha Seunghun.The Perron-Frobenius theorem:Some of its applications[J].IEEE Signal Processing Magazine,2005(2).

猜你喜歡
菲茨杰拉德相似性章節(jié)
一類上三角算子矩陣的相似性與酉相似性
淺析當(dāng)代中西方繪畫的相似性
認(rèn)真
完美無缺的作品
高中數(shù)學(xué)章節(jié)易錯(cuò)點(diǎn)提前干預(yù)的策略研究
干船塢中的美國“伯克”級(jí)導(dǎo)彈驅(qū)逐艦“菲茨杰拉德”號(hào)(DDG 62)
素養(yǎng)之下,美在引言——《“推理與證明”章節(jié)引言》一節(jié)比賽課的實(shí)錄
《了不起的蓋茨比》與菲茨杰拉德
低滲透黏土中氯離子彌散作用離心模擬相似性
黃廖本《現(xiàn)代漢語》詞匯章節(jié)中的幾個(gè)問題
腾冲县| 宁强县| 容城县| 金寨县| 汪清县| 新源县| 江永县| 凉城县| 获嘉县| 拉孜县| 麻阳| 泰来县| 东乡县| 荔浦县| 贵定县| 麟游县| 嘉峪关市| 太仆寺旗| 视频| 永登县| 会泽县| 东乌| 永胜县| 通山县| 东至县| 静宁县| 黄陵县| 武义县| 昌都县| 湖州市| 腾冲县| 浑源县| 厦门市| 元谋县| 沙河市| 望奎县| 齐齐哈尔市| 南木林县| 麻栗坡县| 英德市| 合山市|