夏立新++庾小美
摘要在過去的半個世紀(jì)中,語言學(xué)研究因沒有充分重視語言使用的實際情況而走了一些彎路。因此,現(xiàn)在有必要根據(jù)語詞使用的實證對這些已被普遍接受的語言學(xué)理論的核心部分重新進行評判。句法結(jié)構(gòu)對意義表征起著重要的作用,但它過于籠統(tǒng),難以表述日常語言使用中普遍存在的語義差別。許多語詞的語義十分含混;語詞的各個意義之間似乎沒有很明顯的界限。單靠句法或語詞都無法解構(gòu)說話人或作者想要表達的意思。但如果我們把二者結(jié)合起來,通過甄別語詞的組合模式和優(yōu)先搭配結(jié)構(gòu),其歧義就會大大減小。近年來,語料庫模式分析表明,每個語詞通常只參與為數(shù)不多的幾個模式,而這些模式在意義表征上大多數(shù)都沒有歧義。語詞的模式通常含有兩大要素:相對穩(wěn)定的句法配價和靈活多變的詞匯搭配。語料庫模式分析是建立在之前一些理論上的一個嶄新的語言學(xué)理論,語言使用受兩套規(guī)則的支配:一是語詞的常態(tài)用法規(guī)則,二是創(chuàng)造性地拓展常態(tài)用法的規(guī)則。
文章將詳細介紹該理論的核心部分——常態(tài)與拓展理論,并概述這兩套系統(tǒng)或規(guī)則相互作用的方式。
關(guān)鍵詞模式語詞語義類型句法配價常態(tài)拓展
一、引言
毫無疑義,一個語詞的意義(或多或少)依賴于它所使用的語境。但什么是“語境”?如何識別語境?如何把語境與被Firth (1950)稱為“紛繁的語言使用現(xiàn)象”區(qū)別開來?為了理解話語或書面語,我們需要通過某種方式把它映射到一個可以表達意義的基本模式上。下面將詳細介紹何謂模式,以及如何構(gòu)建模式。
第一步是根據(jù)語詞的詞類確定其句法配價。修飾性形容詞通常只有一價:它們由一個名詞中心詞管轄,僅此而已。表語形容詞和謂語動詞通常有一到三價:分別是主語、直接賓語、間接賓語或狀語的組配。名詞的配價從一價到三價不等,取決于該名詞的次語類。
為了便于說明,我們杜撰了一個從很多方面看都不能構(gòu)成模式的句子。
(1)Matilda saw an ant sitting on a peacock.[1]
例(1)中,動詞saw為二價(主語和直接賓語),分詞sitting也是二價(主語和狀語,后者被視作介詞短語)。這個杜撰的句子違反邏輯,不能構(gòu)成模式。它沒有展示模式,與模式?jīng)]有任何關(guān)系。它甚至不是模式的拓展,這在下文將予以論述。然而,它在句法上完全正確,因為動詞see(除了管轄其他成分外)通常管轄ing形式,而“an ant sitting on a peacock”就有ing形式。同樣,動詞sit通常管轄由on引導(dǎo)的介詞短語。其次,例(1)中(假定的)選擇限制是期望限制:動詞see通常選擇事件或事件狀態(tài)作為其直接賓語,而“an ant sitting on a peacock”則表征(或者更確切地說,意欲表征)事件的狀態(tài);短語動詞sit on通常選擇一個指稱具體物體的名詞做介詞賓語,而peacock毫無疑問指稱具體物體。但是,我們不能違反sit on必須接無生命物體作為賓語的選擇限制。盡管人們坐在馬和駱駝這些有生命的動物上十分平常,但是其他有生命物體出現(xiàn)在這個介詞賓語的位置上就不那么正常了(因此,這里已經(jīng)可以看到“選擇限制”這個概念的問題所在。下文還將闡明這一點)。
上文不厭其煩地分析說明一個杜撰的句子(理論語言學(xué)家深愛的一種方式)是因為它內(nèi)含兩個語言學(xué)流派相左的觀點,它們是理論語言學(xué)和計算語言學(xué)流派以及語料庫語言學(xué)流派。前者盡管尚不盡如人意,但已被學(xué)界廣泛接受;而后者盡管更好,但尚未被充分闡釋。前一理論的核心在于“選擇限制”這個概念,它之所以對理論語言學(xué)家和計算語言學(xué)家具有吸引力,無疑是因為“限制”具有預(yù)測能力。然而,實際情況往往事與愿違。語料庫語言學(xué)家在經(jīng)過二十多年的研究后發(fā)現(xiàn),句法配價對詞項的選擇是由優(yōu)選條件決定的,而不是限制條件。把優(yōu)選條件等同于限制條件的說法只會把問題攪亂。若要真正改進模式的預(yù)測能力,就必須開發(fā)一套基于優(yōu)選條件的概率預(yù)測系統(tǒng)。統(tǒng)計語言處理和概率語言學(xué)正在進行這方面的研究。(Bod et al. 2003)
語料庫語言學(xué)理論的核心觀點是:所有語言范疇都建立在固定模式或原型的基礎(chǔ)上,因此,意義分析必須基于統(tǒng)計數(shù)據(jù)。固定模式與原型都可以通過類推和概率計算來得出——某物坐在有生命實體上的可能性有多大?當(dāng)然,答案一下子就跳入到腦海中:假如這個生物是一匹馬或一頭駱駝,可能性很大;如果不是,則可能性較小。如果這個生物是一只鳥,這種可能性毫無疑問是存在的,但當(dāng)然是不正常的。上述假設(shè)可以通過對語料庫中語詞模式的考察來證實,并進一步擴展。再回到前文杜撰的那個句法正確但不合乎邏輯的句子,正常來說,螞蟻不會坐——不管是坐在孔雀上,還是其他東西上。但從詞語使用的角度看,這也是一種或然率,而不是必然。也許螞蟻在生理上不可能坐,但這并不妨礙一位富有創(chuàng)造力的語言學(xué)家(或者其他人)編造出一個句法正確的句子,說螞蟻正坐在某個物體上。
在闡述了例(1)的荒謬性后,現(xiàn)在再回過頭來看看語詞實際上能做什么。一個有生命力的語言學(xué)理論必須以人們實際是怎樣使用語詞為根據(jù),而不是以他們可能怎樣使用語詞為根據(jù)。但我們?nèi)匀槐仨毧紤]到偶然的非常規(guī)用法,這是一種有目的性的、創(chuàng)造性的語言使用。
語言教學(xué)必須建立在對語詞的實際使用具有清楚的認識之上,而不是憑推測和想象,這一點似乎十分明顯,毋庸多言。當(dāng)二語學(xué)習(xí)者創(chuàng)造性地使用二語中的一個語詞時,他/她本人及讀者或聽話人雙方都應(yīng)該明白這正是他/她想做的事,而不是又犯了一個語言錯誤,這一點十分重要。
為了說明人們實際上如何正常地使用語詞來表達意義,我們詳細調(diào)查了shower一詞作為動詞在語料庫中的實際用法。像許多英語動詞一樣,當(dāng)shower用來指稱一個動作或事件時,它可能被視作語法隱喻用法。從原型上來看,shower是一個名詞。從次語類的層面上看,該詞的基本感知或經(jīng)驗是,小水滴快速地從高處——從天上的云朵,或者從浴室里或泳池邊特意安裝的噴頭中流下來。這個基本的認知原型是模糊的,不精確的,它甚至沒有詞類。但如果我們現(xiàn)在回過頭來考慮用法模式,詞類就變得很重要,就像句法配價和搭配一樣。下面我們將詳細論述shower作為動詞的模式。
二、句法配價與語義辨析
有時候只靠配價就足以區(qū)分語義。因此,動詞shower的兩個含義(廣義指“淋浴”和“饋贈”)可以通過論元的數(shù)目來區(qū)別。例(2)是不及物用法(即一價動詞),既不帶直接賓語,也不帶介詞賓語。與之相比,例(3)和例(4)中的shower是三價動詞:兩個例子都是及物的,并帶有一個狀語(介詞短語)。
(2)e showered and dressed quickly.
(3)e showered her with kisses.
(4)e showered kisses on her.
例(3)和例(4)的語義沒有什么差別,至多是強調(diào)點不同。例(2)到例(4)的基本配價模式如下:
A.[NP] shower.
B.[NP1] shower [NP2] {with [NP3]}.
C.[NP1] shower [NP3] {on [NP2]}.
我們從British National Corpus(以下簡稱BNC)中隨機抽取了100個shower作為動詞使用的句子,并按照上述模式將它們進行分類,其結(jié)果是:只有16個句子是“洗浴”的意義(配價模式A),而“饋贈”的用法更常見,盡管這一用法不是該詞的字面意義。
(至少)在理論上,我們還可以推測該詞有二價的用法:
D.[NP1] shower [NP2].
但是,在BNC(1億詞的語料庫)中卻沒有找到一個符合D模式的句子,然而,我們可以虛構(gòu)像例(5)這樣的句子。
(5)She showers the dog every Sunday.
例(5)中的詞組every Sunday是一個附加語選項,不是動詞的論元。它不影響動詞的意義。因此,這個虛構(gòu)的句子——有可能存在,但可能性不大——演示了shower用作二價動詞的情況。那么,對于這個動詞來說,決定其語義的主要因素是有無狀語論元(通常以介詞短語的形式實現(xiàn),如with [NP]或on [NP])。
僅僅根據(jù)配價的不同,不一定能確定語義。例如,accept通常是二價動詞:它可接一個主語和一個直接賓語。然而,在一些語境中,可以省略直接賓語而不影響語義,例如,e invited her to dinner and she accepted. 這種用法只有一價,但所表達的意義卻與常見的二價用法一樣。
三、搭配和語義類型
到目前為止我們通過配價可以區(qū)分一些語義差別,但是,配價只是眾多區(qū)分意義的手段之一,在大多數(shù)語義出現(xiàn)歧義的情況下,僅靠配價分析還不足以區(qū)分語義,就算加入諸如“施事”“受事”“受益者”和“工具”之類的題元角色來提高配價的精確度,也幫不了我們多少。因此,我們需要用與之不同的其他手段來區(qū)分語義,這就是搭配。所有的實詞都優(yōu)先選擇與一組或多組其他詞項共現(xiàn)。由于語料庫語言學(xué)的發(fā)展,我們現(xiàn)在可以對這些優(yōu)先選擇加以分析。
下面是摘自BNC的一些句子:
(6)Boris showered the woman with presents.
(7)Rather than the hopedfor cash, they were showered with snuff boxes and other trinkets, to Leopolds disgust.
(8)Lauren Bacall, Bianca agger ... and Lionel Blair were among the stars who showered him with praise.
(9)If they ignore the remark or reply negatively they may be accused of rudeness and/or showered with abuse.
(10)You long to shower gifts on everyone.
(11)European heads of government ... showered telegrams of congratulation on Clinton.
(12)Despite all the criticisms showered on this model during the past forty years, it still occupies the center of the stage.
(13)Chinese parents do, of course, shower love and attention on their children.
(14)Whistling and swearing offends them and they will shower the guilty person with pebbles and gravel until he stops.
(15)The eruption showered debris on Pompeii.
(16)The DC10 exploded, showering them with debris.
上述句子中有多少單詞是動詞shower具有統(tǒng)計學(xué)意義的搭配詞?要回答這個問題,我們需要調(diào)取更大的樣本,并統(tǒng)計這些單詞有多少是重復(fù)出現(xiàn)的,其復(fù)現(xiàn)率是多少。此外,我們還要考慮每個搭配在整個語料庫中的相對頻率或凸顯度。像plaudits這類不常用的單詞,如果它與動詞shower共現(xiàn)了幾次,那么它的凸顯度要比常用詞(如love)與shower的搭配要高得多,因為plaudits是罕用詞。Church & anks (1990)論述了如何使用大型語料庫來統(tǒng)計搭配的凸顯度。此后,又有很多學(xué)者開發(fā)了其他統(tǒng)計搭配凸顯度的方法,如Kilgarriff (2004)的Sketch Engine軟件。不同的統(tǒng)計方法會產(chǎn)生不同的結(jié)果,而不同的結(jié)果適合于不同的應(yīng)用。例如,t值有利于統(tǒng)計高頻功能詞的搭配,因此它適用于確定一定語境中的介詞選擇。Church & anks(1990)研發(fā)的點態(tài)交互信息統(tǒng)計方式則更適合于統(tǒng)計不常用的實詞,因此它更適用于通過搭配進行語義分析。
一組具有統(tǒng)計學(xué)意義的搭配一旦確定下來,就可以將它們劃分成不同的詞集。詞集是一組擁有一個或多個共同語義特征的語詞。此語義特征往往是該詞的“正式”義,用Pustejovsky(2005)的話來說,就是上位概念。
在動詞詞組“shower [someone] with [something]”中,介詞賓語位置的搭配詞在大型語料庫中為以下(反復(fù)出現(xiàn)的)詞匯單位:
abuse,accolades,affection,applause,arrows,attention,awards,cash,compliments,debris,dollars,favo(u)rs,flowers,gifts,glass,hono(u)rs,jewel(le)ry,kisses,largesse,love,money,obscenities,plaudits,praise,presents,rocks,shrapnel
乍一看,這些詞似乎凌亂地堆在一起,讓人感到很困惑。但是,當(dāng)我們從頭看到尾之后,我們便本能地想把這些詞整理并分類。這時,我們開始看到模糊的模式輪廓。此外,一旦確認了一個或多個詞集的“種子成員”后,就可以根據(jù)共享的語義特征尋找其他頻率低一些的搭配詞,這樣詞集的成員數(shù)量可以進一步增加。由此得出的模式在語義上都是不同的,也就是說,(通過配價和搭配確定的)每個模式都有其獨特的意義。
shower一個很明顯的模式是shower someone with復(fù)數(shù)[[Speech Act]]。這些言語行為要么像例(17)和(18)一樣非常積極(accolades, compliments, plaudits, praise),要么非常消極(abuse, obscenities)。跟這些言語行為緊密聯(lián)系的是那些指稱態(tài)度的語詞,它們大多數(shù)都是積極的,但不一定在言語中表現(xiàn)出來(attention, applause, favours, honours, affection, kisses, love)。接下來,我們注意到,在shower someone with physical object的模式中,所贈送的東西是人們樂意接受的有形物品(gifts, presents, awards, jewellery, flowers, cash, dollars, money)。到目前為止,所給出的這些例子中,介詞with的賓語通常有一個人稱施事做語法主語。
(17)Lauren Bacall, Bianca agger ... and Lionel Blair were among the stars who showered him with praise.
(18)European heads of government ... showered telegrams of congratulation on Clinton.
(19)If they ignore the remark or reply negatively they may be accused of rudeness and/or showered with abuse.
(20)Despite all the criticisms showered on this model during the past forty years, it still occupies the center of the stage.
(21)Chinese parents do, of course, shower love and attention on their children.
(22)Boris showered the woman with presents.
(23)You long to shower gifts on everyone.
(24)Rather than the hopedfor cash, they were showered with snuff boxes and other trinkets, to Leopolds disgust.
在例(17)、(18)、(21)和(23)中,謂語動詞用主動語態(tài),因此主語(Lauren Bacall, Bianca agger, and Lionel Blair; European heads of government;Chinese parents;you)直接出現(xiàn)在句子中。這些主語都屬于[[uman]]語義類型,其語義特征是這些名詞以及其他成千上萬的名詞都擁有的,因此,它們都可以在這個位置與動詞shower共現(xiàn)。在該模式中,shower是一個及物動詞,而動作類及物動詞通??梢赞D(zhuǎn)換成被動結(jié)構(gòu),如例(19)、(20)和(24)。當(dāng)然,這些句子中的主語或“施事”沒有明示,但隱含的“施事”仍然是[[uman]]。
與此相反,在該介詞賓語位置還可以使用另一組數(shù)量相對較少、用來指稱無生命物體的語詞,例如rocks, pebbles, gravel, debris, arrows, glass和shrapnel等,但對受贈一方來說,這些物體顯然是他們不愿接受的。此處的主語并不局限于[[uman]];其他常見(不是必然)的語法主語是指稱爆炸和火山爆發(fā)之類事件的語詞。如:
(25)Whistling and swearing offends them and they will shower the guilty person with pebbles and gravel until he stops.
(26)The eruption showered debris on Pompeii.
(27)The DC10 exploded, showering them with debris.
四、句法轉(zhuǎn)換
到目前為止,我們已經(jīng)找出了在介詞賓語位置出現(xiàn)的語詞范圍,它們可以激活動詞shower的一組密切相關(guān)的意義。同時我們還發(fā)現(xiàn),不管動詞是用主動語態(tài)還是被動語態(tài),都能激活這些意義。對于及物動詞而言,這是很自然的事:使用被動句的目的不是要表達一個與主動句不同的意義,使用被動句的主要目的是免除明確地陳述施事的麻煩,而不是激活一個不同的意義。
除了主動和被動轉(zhuǎn)換外,動詞模式還有很多其他的轉(zhuǎn)換。不同的動詞參與不同的轉(zhuǎn)換??偟膩碚f,句法轉(zhuǎn)換的目的在于使句子的強調(diào)點不同,而不是語義不同。在shower這個例子中,既可把介詞賓語移到直接賓語位置,也可把直接賓語移到由on管轄的介詞賓語位置。這可能屬于句法轉(zhuǎn)換,而不屬于不同的模式,因為沒有激活不同的意義。
(28)You long to shower gifts on everyone.
(29)Despite all the criticisms showered on this model during the past forty years, it still occupies the center of the stage.
(30)Chinese parents do, of course, shower love and attention on their children.
(31)The eruption showered debris on Pompeii.
很明顯,這些例子中動詞shower的所有三價意義都可以參與這樣的轉(zhuǎn)換。shower的意義并沒有因使用不同的介詞with或on而不同。
在語料庫模式分析的目前階段,所有這些轉(zhuǎn)換都被看作一個獨立的模式。其影響是,參與這些轉(zhuǎn)換的每個動詞的模式數(shù)量增加了兩倍,某些情況下甚至是四倍。因此,把這種常規(guī)轉(zhuǎn)換看作模式的子集,而不是獨立的模式可能會更合理一些。為了能夠更有效地進行這項工作,我們必須給出每個轉(zhuǎn)換的語言使用實例。在過去的半個世紀(jì)中,語言學(xué)理論就是因為依靠內(nèi)省式的規(guī)則推測而嚴重曲解了語言的本質(zhì)。
五、詞項與詞集
動詞每個模式的所有論元都是由名詞詞集(這些名詞可能包括像snuff boxes這樣的詞組)來充當(dāng)?shù)?。一個詞集可能由單個語詞組成,也可能由多個詞項組成。根據(jù)上文的分析,我們可以清楚地看出,語言處理的一個關(guān)鍵問題是:在動詞各個論元(或者“配價空位”)中出現(xiàn)的詞項能否根據(jù)其共同語義特征來歸類?
詞集1(語義類型[Physical Object]):典型成員:gifts, presents, jewellery等。
非典型成員:trinkets, snuff boxes。
詞集2(語義類型[Speech Act]):典型成員:praise, abuse, insults。
如果這兩個詞集足以證明它們是不同的,可以歸納成E和F兩個模式,那就理想了。
E.[[uman1]] shower [uman2]] {with [[Physical Object]]}.
F.[[uman1]] shower [uman2]] {with [[Speech Act]]}.
然而,正如我們所看到的那樣,這種歸納尚不足以反映這兩個模式的本質(zhì)。我們還需要進一步發(fā)現(xiàn)其他特征。首先,這兩個模式中的介詞賓語都必須是一個物質(zhì)名詞或者一個復(fù)數(shù)名詞。這看起來像是一個必要條件。shower someone with an expensive watch或者shower someone with a word of advice是不可能出現(xiàn)的。其次,語義類型[[Physical Object]]不能夠區(qū)別下面的語義差異:并非所有的有形物品都是禮物。此外,showering someone with pebbles和showering someone with snuff boxes之間的差異是動作執(zhí)行者的意圖不同:前者是攻擊他人,后者是饋贈禮品。
通常來說(但不一定),搭配詞可以根據(jù)它們共有的語義類型進行分類,但這樣做給確定語義類型的概括程度帶來困難。鑒于這一原因,我們必須把一個概念固有的語義特征與由使用語境賦予語詞的外在特征區(qū)分開來。
如果動詞shower有一個無生命的主語(具體名詞或抽象名詞),那么,與此共現(xiàn)的通常是一個作為第二論元的[[Physical Object]]和一個作為第三論元的[[uman]]或[[Location]]:explosions shower debris on people and place(或者explosions shower people and places with debris)。語義論元的這種共現(xiàn)能夠預(yù)測動詞的意義,通過Church & anks (1990:28—29)的“三角定位法”就可以確定詞義:
盡管語詞索引只用一個詞來索引,但詞典學(xué)家經(jīng)常使用另外一個語詞(如介詞from)或者一個同樣常見的語義概念(例如時間狀語)來決定如何對索引行進行分類。也就是說,他們用兩個單詞的三角定位方式來確定詞義。這種三角定位法主要根據(jù)語詞的實際用法(分布證據(jù)),而不是通過對語義的直覺判斷把索引行按詞義進行分組。因此,詞義問題可以用句法方式(符號標(biāo)注的方式)解決,而不需要用語義方式(語義說明的方式),盡管句法標(biāo)簽本身似乎具有語義價值。
運用三角定位法需要“藝術(shù)”。詞典學(xué)家如何決定哪些可能的切點是“有趣的”,而哪些只是緣于幾率?三角定位法所提出的關(guān)系比率得分是一個客觀、實用的判斷標(biāo)準(zhǔn),它幾近“藝術(shù)”。由于該方法十分客觀,所以可以系統(tǒng)地應(yīng)用于大量語料的處理,從而提高語言處理的精確度和效率。
六、語義類型與語境角色
語義類型的理論基礎(chǔ)是Pustejovsky (1995)提出的“生成詞庫理論”(GL)。根據(jù)生成詞庫理論,實詞的意義有四種不同的來源:
i.事件結(jié)構(gòu):說明子句或表達式的事件類型,例如行為、過程和狀態(tài)。
ii.論元結(jié)構(gòu):具體標(biāo)示謂詞的論元數(shù)量。
iii.詞匯類型結(jié)構(gòu):說明語詞在概念層級體系中的語義類型,例如[[uman]]、[[Artifact]]和[[Vehicle]]。
iv.特性結(jié)構(gòu):說明一個詞項與其他具有相同特性的詞項在語義預(yù)測能力上的結(jié)構(gòu)區(qū)別。
如果我們問,動詞shower只帶一個論元時屬于哪種事件類型,答案是[[uman]],只有人才淋浴。該事件類型是一種活動。盡管任何生物或有形物體都有可能被雨淋(或者被置于浴室的噴頭之下),但showering用作動詞就具有有意淋浴的含義。
順便說一下,我們發(fā)現(xiàn),鑒于英語氣象詞匯的組合特性,從邏輯上來推測英語中可能存在It was showering這種帶有形式主語的表達式,藉以表達與It was raining同樣的意義,但是沒有任何證據(jù)表明英語中存在這一表達式。這個例子再一次說明語言學(xué)中推測的風(fēng)險。
另一方面,如果我們現(xiàn)在問,帶有三個論元的動詞shower屬于哪種事件類型?答案將是,“呃,這取決于……” ,尤其是取決于論元的語義類型。
然而,要完成語義分析,還需要考慮更多因素。這是因為語義的很多方面都是由語詞所處的語塊或語境來激活的,而不僅僅是語詞本身。
語境角色是由語詞使用的語境所指派的語義特征。下面是一個典型的例子:
(32)Mr Woods sentenced Bailey to seven years.
在例(32)中,Mr Woods 和Bailey的語義類型都是[[uman]]。值得注意的是,如果不考慮語境,孤立地看Mr Woods和Bailey這兩個表達式,它們肯定指人,這種可能性非常大,但不是絕對的,也可能是某人養(yǎng)的狗叫Mr Woods或Bailey。
關(guān)鍵問題是,語境角色[[=udge]]和[[= (Criminal) Offender]]是由語境指派的,而不是由所用名詞的固有語義特征指派的。同樣,“seven years”這個表達式的語境角色[[= Punishment, = Imprisonment]]也是由語境指派的。
把這一點運用到動詞shower上,我們會發(fā)現(xiàn),shower用許多指稱有形物體的名詞充當(dāng)論元,但這些有形物體究竟是missiles還是gifts,是由語境角色決定的,而不是所用名詞的固有語義決定的。
七、名詞的搭配分析
下面將討論語料庫驅(qū)動的名詞語義分析,它也可以通過調(diào)查和研究搭配詞來進行。但是,其分析過程和結(jié)果與動詞的搭配分析有本質(zhì)區(qū)別。[2]
以名詞spider為例,其句法配價不像動詞那樣重要。對幾個大型語料庫的分析表明,spider最顯著的搭配詞是scorpion(蝎子)和cockroach(蟑螂)。然而,作為搭配詞,它們與spider沒有任何句法關(guān)系,它們只是出現(xiàn)在spider的附近,在節(jié)點詞spider左右五個單詞的范圍之內(nèi)。
從語料庫中選出來的搭配詞可以作為構(gòu)建名詞的“認知模型”的基礎(chǔ),該模型用準(zhǔn)確地道的語言闡述名詞的語義特征(參見表1)。首先,該認知模型將概括描述名詞的總體特征,這一描述并非基于語料庫,但剩下的描述是基于搭配分析的。表1中搭配詞用斜體凸顯。
表1
語料庫驅(qū)動的名詞spider的認知模型
蜘蛛: 蜘蛛是一種生物,與人類相比,即使大型蜘蛛也較小。
蜘蛛的種類:已知的蜘蛛種類有上萬種(包括
漏斗網(wǎng) 蛛、 織網(wǎng) 蛛、 圓網(wǎng) 蜘蛛、 食鳥 蜘蛛、 地面 蜘蛛、 巨型 蜘蛛、 特大型 蜘蛛、 大型 蜘蛛、 小型 蜘蛛、 有毒 蜘蛛、 黑寡婦 蜘蛛、 駱駝 蛛, 紅背蛛, 隱身蛛, 狼 蛛, 白尾 蛛, 蟹 蛛,以及塔蘭圖拉毒蛛)。
有些蜘蛛 捕食 。
有些蜘蛛 叮咬 。
有些蜘蛛 有毒 。
許多蜘蛛用 結(jié)實的絲線織網(wǎng) 。
蜘蛛 藏匿 在 網(wǎng) 的中央。
蜘蛛 掌控蛛網(wǎng) 中發(fā)生的一切。
蜘蛛有8 條 腿。
蜘蛛腿與其軀干相比 細 長,且腿上有毛。
蜘蛛長著 八只眼睛 。
蜘蛛大部分時間都保持 不動 。
蜘蛛會 突然行動 。
蜘蛛會 爬行 。
蜘蛛會 疾行 。
蜘蛛 敏捷、靈活 。
蜘蛛會 爬墻 。
許多人對蜘蛛有 一絲厭惡 ,或者 害怕 蜘蛛。
人類 捕殺 蜘蛛。
在民間分類中, 蝎子 和 蟑螂 常常與蜘蛛一起被分類為令人恐懼和厭惡的生物。
構(gòu)建這類名詞認知模型的目的是,用準(zhǔn)確地道的語言把目標(biāo)詞凸顯的搭配詞盡可能詳盡地描述出來。名詞分析沒有(像動詞那樣的)配價組合框架,因此,詞典會給說明這些搭配詞留有更多的空間。優(yōu)秀的認知模型將囊括目標(biāo)詞的所有凸顯搭配,它們?yōu)檎_、地道地使用該詞提供了很好的指南。敏銳的讀者會發(fā)現(xiàn),我們在為“有生命的實體”分類時運用了語義類型的理論。在表2中,我們能更加清楚地看到,語義類型在語詞分類(即WordNet中的概念上位詞或上義詞)中的運用。
如果我們把這種搭配的語料數(shù)據(jù)分析應(yīng)用到名詞shower上,就會發(fā)現(xiàn)它至少擁有四個認知模型,如表2所示:
表2
語料庫驅(qū)動的名詞shower的認知模型
Shower 1: shower是一個短時間的天氣事件。
一般來說,shower是 雨水在短時間內(nèi)落下。
其他類型的showers: 在寒冷天氣下,有陣 雪 (snow shower)、 凍 雨(wintry shower)以及短時 冰雹 和 雨夾雪 (shower of hail and sleet)。
陣雨可能是 強 (heavy)陣雨,也可能是 小 (light)陣雨。
天氣預(yù)報會用到 零星 陣雨(scattered shower)、偶爾有陣雨(occasional shower)或偶然有陣雨(the odd shower)。
陣雨 掠過 (sweep over or across)某地。
一會后,陣雨 逐漸減弱 (die away)或 消失 (die out)。陣雨 停了 (clear)。
人們被陣雨 淋 (caught in)。
四月的陣雨 (April shower)通常被認為短暫、清新,雨過即晴。
shower有一些比喻用法,物理學(xué)家常說簇射 粒子 (shower of particles);天文學(xué)家常說 隕石 或 隕星 群(shower of meteorites or meteors)。
Shower 2: shower是一個用來使水像下雨一樣成滴落下的人工制品。
一般來說,shower由建筑師或房屋設(shè)計師 設(shè)計 ,由建筑工 安裝 在房屋 浴室 的 洗浴間 中,或者 浴缸 上方,或者獨立的 淋浴房 中。
獨立淋浴器(ensuite shower)是安裝在 臥室 旁邊房間的淋浴裝置。
如果安裝沒有問題,淋浴器能正常 使用 。
淋浴器的類型:有眾多廠商生產(chǎn)不同類型的淋浴器。有 電動 或 電力淋浴器。(還有 引力淋浴器。)
人們 使用 淋浴器來洗頭和身體。
人們 打開 淋浴器以便使用,用完后 關(guān)閉 淋浴器。
Shower 3:
shower也可以為一個人類活動,即用淋浴器(Shower 2)來洗頭和身體。
人 洗 淋浴。
淋浴可以用 熱水 ,也可以用 涼水 或 冷水 。
洗淋浴 讓人 清爽。
Shower 4:
在英語口語中,一群無用的、不受歡迎的人會被稱作shower。
在適當(dāng)?shù)沫h(huán)境下,中級語言學(xué)習(xí)者使用語料數(shù)據(jù)和諸如Sketch Engine這樣的詞匯統(tǒng)計工具嘗試自己編纂名詞的認知模型是一個非常有用的練習(xí)。他們對這些名詞的意義至少部分理解或大致理解,但并不完全掌握它們的地道用法。
八、結(jié)論
本文用詳細的語料分析說明,搭配是語言表達地道與否的重要因素,而(動詞或“事件語詞”的)配價與搭配結(jié)合在一起可以決定詞義。
shower是一個較簡單的動詞,但其用法仍然十分復(fù)雜,因此,本文通過分析該詞所得出的結(jié)論適用于所有動詞的語義分析:
配價對動詞詞組意義的形成做出了重大貢獻,而且,因為動詞是子句的核心,這就意味著它對句子意義的形成也做出了重大貢獻。
搭配對意義的形成同樣也做出了重大的貢獻。
名詞搭配詞可以根據(jù)其固有的語義類型分成不同的詞集。這些詞集對具體語境下動詞意義的確定起著重要的補充作用。
某些情況下,語境賦予詞集特殊的解釋(語境角色)。語境角色是詞集的外在語義特征,不能與語義類型相混淆。
其他影響語義形成的限制因素包括名詞的數(shù)(單數(shù)、物質(zhì)名詞和復(fù)數(shù))、形容詞的價值(褒貶)評價(Sinclair稱之為“語義韻”)和句法轉(zhuǎn)換。
對名詞的語料庫分析(以+y結(jié)尾的名詞)比較簡單,因此,其結(jié)果不那么令人滿意。一般情況下,動詞與其他詞匯互相影響的情況多于名詞;而名詞更多地與(假定的)外部世界的客觀實在相互影響,因此(部分由于這一原因),名詞使用的模式往往不像動詞那樣受限。
總之,必須說明的是,語料庫模式分析與述謂邏輯沒有任何關(guān)系。述謂邏輯是推導(dǎo)出來的,并非自然語言的本質(zhì)特征。自然的、有意義的人類語言行為瞬息萬變,遠不像傳統(tǒng)述謂邏輯所認為的那樣一成不變。因此,我們必須用統(tǒng)計數(shù)據(jù)和概率來闡釋語言使用,追求絕對真理只是空幻的夢想。如果不是語義和語義學(xué)理論自1975年以來一直在強調(diào)語言具有“根本”邏輯這個事實,我們也許不必要說這些。
附注
[1]按照慣例,本文中的真實引例(包括源自大型語料庫的例句)使用正體,而杜撰的例句(通常為了對比而編造的)使用斜體。
[2]更確切地說,指稱實體的名詞的搭配分析與指稱事件和事件狀態(tài)的名詞不同。有些名詞(用某些語言學(xué)學(xué)派的術(shù)語來說是“由動詞派生的名詞”)指稱事件,對這些詞的分析必須像分析動詞那樣。
參考文獻
1.Baker C F, Fillmore C , Cronin B. The Structure of the FrameNet Database.International ournal of Lexicography, 2003 (16).
2.Bod R, ennifer , Stefanie . (eds.) Probabilistic Linguistics. Cambridge:MIT Press, 2003.
3.Church K W, anks P. Word Association Norms, Mutual Information, and Lexicography.Computational Linguistics, 1990(1).
4.Cinkova S, olub M. Can Corpus Pattern Analysis be Used in NLP?∥Text, Speech and Dialogue:13th International Conference, TSD. Brno, 2010.
5.Fontenelle T. (ed.) Practical Lexicography: A Reader. Oxford: Oxford University Press, 2007.
6.Grice P. Logic and Conversation. ∥Cole P, Morgan L. (eds.) Syntax and Semantics, vol.3: Speech Acts. Salt Lake City: Academic Press, 1975.
7.alliday M. Categories of the Theory of Grammar.Word, 1961,17(3).
8.anks P. Linguistic Norms and Pragmatic Explanations, or Why Lexicographers Need Prototype Theory and Vice Versa. ∥ Kiefer F, Kiss G, Pajzs . (eds.) Computational Lexicography: Complex ‘94, 1994.
9.anks P, Pustejovsky . A Pattern Dictionary for Natural Language Processing. Revue Franaise de Linguistique Appliquée, 2005.
10.anks P. Metaphoricity is Gradable. ∥Anatol S, Gries
S Th. (eds.) CorpusBased Approaches to Metaphor and Metonymy. Berlin/New York, 2006:17—35.
11.anks P. (ed.) Lexicology: Critical Concepts in Linguistics. London: Routledge, 2008(6).
12.anks P, ezek E. Shimmering Lexical Sets. ∥Bernal E, De Cesaris . (eds.) Proceedings of the XIII EURALEX International Congress. Barcelona: Universitet Pompeu Fabra, 2008.
13.anks P. Nine Issues in Metaphor Theory and Analysis. International ournal of Corpus Linguistics, 2010 (15):133—150.
14.erbst T et al. A Valency Dictionary of English. Berlin: De Gruyter, 2005.
15.oey M. Lexical Priming: A New Theory of Words and Language. London: Routledge, 2005.
16.unston S, Francis G. Pattern Grammar. Amsterdam and Philadelphia: ohn Benjamins, 2000.
17.ezek E, anks P. What Lexical Sets Tell Us about Conceptual Categories. Lexis,2010 (4).
18.Kilgarriff A et al.The Sketch Engine. ∥Williams G, Vessier S. (eds.) Euralex 2004 Proceedings. Lorient: Université de BretagneSud, 2004.
19.Louw B. Irony in the Text or Insincerity in the Writer? — The Diagnostic Potential of Semantic Prosodies. ∥Baker M, Francis G, TogniniBonelli E. (eds.) Text and Technology. Amsterdam and Philadelphia: ohn Benjamins, 1993.
20.Pustejovsky . The Generative Lexicon. Cambridge:MIT Press, 1995.
21.Pustejovsky , Rumshisky A, anks P. Automated Induction of Sense in Context. ∥Proceedings of the 20th International Conference on Computational Linguistics. Geneva, 2004.
22.Putnam . Is Semantics Possible?Metaphilosophy, 1970 (3).
23.Putnam . The Meaning of “Meaning”.
Minnesota Studies in the Philosophy of Science,1975a.
24.Putnam .Mind, Language, and Reality: Philosophical Papers. Cambridge: Cambridge University Press, 1975b.
25.Rosch E. Natural Categories.Cognitive Psychology, 1973a (7).
26.Rosch E. On the Internal Structure of Perceptual and Semantic Categories. ∥Moore T E. (ed.) Cognitive Development and the Acquisition of Language.Salt Lake City: Academic Press, 1973b.
27.Sinclair . Beginning the Study of Lexis. ∥Bazell C E ,Catford C, alliday M A K. (eds.) In Memory of . R. Firth. London:Longman, 1966.
28.Sinclair . (ed.) Looking Up: An Account of the COBUILD Project in Lexical Computing. New York: Collins, 1987.
29.Sinclair , anks P et al. Collins Cobuild English Language Dictionary. New York: Collins, 1987.
30.Sinclair . Corpus, Concordance, Collocation. Oxford: Oxford University Press, 1991.
31.Sinclair . The Lexical Item. ∥Weigand E. (ed.) Contrastive Lexical Semantics. Amsterdam and Philadelphia: ohn Benjamins, 1998.
32.Stubbs M. Words and Phrases: Corpus Studies of Lexical Semantics. Oxford: Blackwell, 2001.
33.Tesnière L. léments de syntaxe structurale. Paris: Klincksieck, 1959.
(廣東外語外貿(mào)大學(xué)詞典學(xué)研究中心廣州510420)
(責(zé)任編輯李瀟瀟)