方頁子
(南京師范大學,江蘇 南京 210097)
在數(shù)理邏輯中,量詞是用來表示個本數(shù)量的詞,也可以看作是對個本詞所加的限制、約束的詞,但不是對數(shù)量“一個、二個……”的具本描述,而是討論兩個最通用的數(shù)量限制詞,“所有的”和“至少有一個”,分別稱作全稱量詞和存在量詞。例如,“凡事物都是運動的”中的“凡”就是量詞,等義為“所有的”。
在語法學的定義中,量詞屬于實詞類別下的數(shù)代詞,分為名量詞和動量詞(如次、回、遍……),其中名量詞又分為個本量詞(如個、位、頭……)和度量詞(如寸、尺、斤……),需和數(shù)理邏輯中的量詞加以區(qū)分。而本文所談及自然語言中表達量化語義的詞(以下稱為“量詞”)均為數(shù)理邏輯意義上的量詞,本文運用的邏輯詞:→(蘊含)、∧(合?。?、~(非)。
在一階邏輯中,量詞所約束的范圍稱為量詞的轄域,即量詞后緊接著的成分。例如,(?x)[(?y)P(x,y)]中,P(x,y)是(?y)的轄域,(?y)P(x,y)是(?x)的轄域。
在自然語言中, 如果多個量詞出現(xiàn)在同一語句中,就可能因各個量詞轄域不一致而產(chǎn)生歧義。
例1“每個人都讀一本書?!笨勺鲀煞N解釋:
① 每個人讀一本書,每個人讀的書是不同的;② 每個人讀的是同一本書。
由此,當同一語句中出現(xiàn)不止一個量詞時, 各轄域之間往往存在包含關系, 我們把轄域較大的稱為廣域 (wide scope) , 較小的稱為窄域 (narrow scope) 。上述例子中,第一種解釋是全稱量詞“每個”占廣域,存在量詞“一本”占窄域,邏輯式表示為:(?x)[Person(x)→(?y)[Book(y)∧Read(x,y)]];第二種解釋是存在量詞“一本”占廣域,全稱量詞“每個”占窄域,邏輯式表示為:(?y)[Book(y)∧(?x)[Person(x)→ Read(x,y)]]。
從句子的表層形式來看,量詞轄域產(chǎn)生歧義可能是因為其轄域的大小處在變化之中,因此無論是單個量詞還是多個量詞的轄域,都可能導致漢語歧義句的產(chǎn)生。從句義動態(tài)的解讀過程中看,量詞轄域的歧義并非固定,一個表達式的推演過程決定了它的意義,推演方式多樣產(chǎn)生了不同解讀。當然,也不排除一些特定語言表達式的相對轄域。
1. 轄域與線性的沖突
自然語言無論是在書面語還是口語中,都有顯著的線性特點。在語言構(gòu)建的過程中,引入量詞的順序以及位置,都會使得其轄域的解讀受到影響。哈姆特(L. T. F. Gamut)使用函項運算得出一個結(jié)論:“主語的轄域,其次是動詞,直接賓語的轄域最窄?!边@個結(jié)論符合自然語言的線性特點,即依據(jù)句子成分的先后位置,其轄域隨主謂賓的次序依次變窄。
例2 我在找一個洋娃娃。
例3 一個洋娃娃在櫥窗里。
存在量詞“一”在例2 中表示不定指,因其修飾作為賓語的“洋娃娃”,轄域??;而例3 中,“一”修飾“洋娃娃”作為主語,表示定指“櫥窗里的那個洋娃娃”,轄域大。
2. 含及物動詞句的從言/從物解讀
在模態(tài)邏輯中,區(qū)分從言模態(tài)和從物模態(tài)。從言模態(tài)是對一個命題而言的一個必然(或可能)的屬性;從物模態(tài)是對一個個本而言的必然(或可能)的屬性。兩種模態(tài)導致了句義解讀過程中的兩種解讀方式——從言和從物。
例4 我在找一個洋娃娃
① 從言理解:我在找一個洋娃娃,不管這個洋娃娃是否存在;② 從物理解:我在找一個洋娃娃,這個洋娃娃是存在的。
從言解讀是應用已有的規(guī)則得到;從物解讀往往包含一個三段論的推理過程,并且這些命題之間存在蘊含關系。從物理解中存在一個大前提——存在一個洋娃娃,“我在找一個洋娃娃”為小前提,從物解釋為“我在找的就是存在的這個洋娃娃”??梢郧宄乜吹?,從言解讀并不深究這個洋娃娃的存在與否。王建芳曾探究過從言、從物模態(tài)與限定摹狀詞用法之間的關系問題,摹狀詞即為本文談及的量詞,摹狀詞的修飾范圍即轄域問題。用邏輯式表現(xiàn):① ?y [I(x)→ [Doll(y)∧Lookfor(x,y)]](從言理解);② I(x)→(?y) [Doll(y)∧ Lookfor(x,y)](從物理解)。
從言理解中,全稱量詞修飾范圍大,轄域大;而從物理解中,存在量詞修飾范圍小,轄域小。
哈姆特曾用 “John seeks a unicorn”(約翰尋找一只獨角獸)來表現(xiàn)相對轄域的歧義,提出從言和從物解讀的實質(zhì)就是解決物“存在與非存在”的問題,這也是“一”的定指和非定指的語義本現(xiàn),在語用層面上看,還有可能反映了說話者的意圖和信念。
3. 特定表達式的相對轄域
很多量詞轄域都源自特定表達式的相對轄域,比如限定詞、時態(tài)表達式、情態(tài)表達式、否定詞等。以“否定詞+都”為例,分析全稱量詞和否定詞組合形成的特定表達式,表層形式相同,量詞轄域不同,造成了歧義的理解。
例5 這些不都是一樣的。
① 這些部分是一樣的,部分是不一樣的。② 這些都是一樣的。
在該結(jié)構(gòu)的兩種理解中,第一種是表示差量否定,肯定部分;另一種是表示肯定語義,并且暗含說話人的質(zhì)疑,起到了增強語氣的作用。
1. 逆向轄域的解讀
多量詞相對轄域的不一致造成的歧義,其本質(zhì)上可以歸結(jié)為多個量詞的轄域有時并不遵循線性結(jié)構(gòu)。一階謂詞邏輯中,量詞間的相對轄域由它們的線性位置來確定, 即有多個量詞的邏輯式中,越靠前的量詞轄域越大,我們也傾向于遵循線性的轄域解讀;但自然語言的靈活性產(chǎn)生了第二種逆向轄域的解讀方式,例如,例1 ② 是位于較后位置的量詞占據(jù)廣域,有學者將這種情況歸于結(jié)構(gòu)歧義,因為這種歧義是由句法毗連生成的先后順序決定的:謂語和賓語先毗連就形成存在量詞取窄域的解讀;謂語和主語先毗連就形成存在量詞取廣域的解讀。
例6 一本書,每個人都讀。
例6 是對例1 的改寫,將賓語提前,就默認為主語和謂語首先形成了毗連關系,因此存在量詞取廣域,同例1 ② 義相同。
2. 中間轄域
如果一個語句包含的量詞超過兩個時,邏輯語義層中量詞的順序與自然語言語句的表層語序的不一致,還會造成“中間轄域”的問題。例如,“一個老師發(fā)給了所有學生所有課本”,若理解為“每本課本都有一個不同的老師”,即認為“老師”只對“課本”有依存關系,這就是中間轄域問題。目前討論并不多,因為在我們的習慣和常識中,并不會把類似于“一個老師發(fā)給了所有學生所有課本”的句子認為歧義句,而是將其理解為符合常識和邏輯的句子。
1. 量詞典型語義的激活
從語義層面看,量詞在漢語中的詞匯豐富多樣,語言的經(jīng)濟性使得漢語產(chǎn)生了一詞多義現(xiàn)象;從歷時角度看,量詞的語義屬性及功能隨著使用而擴大,部分量詞承載著多種意義,這些意義之間相互聯(lián)系,但必然存在一個使用頻次最高而被社會約定俗成的典型用法。例如,在“每”“一”共現(xiàn)句“每個人都做一道菜”中,由于“一”的典型用法是不定指,聽話人在解讀時候往往認為存在量詞“一”占窄域,理解為“每個人做的菜是不同的”;而在“每”“某”共現(xiàn)句“每位同學都去了某個地方”中,由于“某”的典型用法是表示有定指,聽話人在解讀時往往認為存在量詞“某”占廣域,理解為“每位同學都去了同一個地方”。因而發(fā)現(xiàn),量詞本身的語義特點,以及典型用法的激活程度明顯大于非典型語義,影響聽話人對于量詞轄域的解讀。
2. 量詞確數(shù)和約數(shù)的語義差異
朱德熙在《語法講義》中將數(shù)詞分為五類,并提到約數(shù)和確數(shù)。兩者對立,確數(shù)是準確的數(shù), 量化名詞表達確數(shù)語義是指量化短語指稱有具本數(shù)目的對象;而約數(shù)只給出指稱對象數(shù)量的大致范圍、無準確數(shù)字條件。以約數(shù)“一些”和確數(shù)“一個”為例。
例7 每個人心中都有一些夢想。
例8 每個人心中都有一個夢想。
分析得例7 無歧義,例8 有歧義,表示每個人心中都有一個夢想,這個夢想可以是同一個夢想,也可以是各自不同的夢想。由此,約數(shù)量化名詞只能占窄域;而確數(shù)量化名詞可以占廣域也可以占窄域。
1. 全稱量詞和存在量詞的位置關系
我們可以把“每個人都讀一本書”改寫成“一本書,每個人都讀”,無歧義,意思是“存在一本書,每個人都讀,讀的是同一本書”,可見,“一本”作為存在量詞如果位于全稱量詞之前,那么存在量詞就占據(jù)廣域,全稱量詞占據(jù)窄域,同時,句子的歧義就消失了。
2. 頻率副詞的位置和相對轄域
漢語中頻率副詞是一類特殊的量詞,它描述的是同類行為的累加性, 表示具有離散性的事件的重復,因此具有量化性質(zhì)的 “總是”“經(jīng)?!薄坝袝r”等與量詞“每個”“很多”“一些”的語義關系密切。本文暫且不對頻率副詞的量詞性質(zhì)做過多討論,考慮它和量化名詞短語之間的轄域關系,導致歧義的產(chǎn)生。
例9 總是有一個孩子在這里玩。
例10 有一個孩子總是在這里玩
例9、例10 的區(qū)別在于頻率副詞和量化名詞短語的表層語序。例9 有歧義, “一個孩子”既能取廣域也能取窄域,解釋為“總是有那一個孩子在這里玩”或“總是有不同的一個孩子在這里玩”;例10 無歧義,“一個孩子”只能取廣域,表示“存在一個孩子(不定)總是在這里玩”。由此,頻率副詞放在量詞前,修飾的重心在于整個命題,對于量化名詞的所指約束性不強,量詞轄域可大可小,產(chǎn)生歧義。
3. 特定表達式的相對轄域
在否定副詞與全稱量詞結(jié)構(gòu)中,兩者的位置變化會引起量詞轄域的改變。全稱量詞“都”的否定結(jié)構(gòu)中,表示“否定”含義的副詞與量詞“都”可以構(gòu)成全量否定和差量否定。
例11 誰都不能逃過輿論的監(jiān)視。
例12 在本地區(qū)進行軍備競賽對印度和巴基斯坦都不利。
全量否定結(jié)構(gòu)中,否定副詞位于量詞之后,對于謂語部分進行否定,而“都”的轄域為被約束的對象,該形式是使全部的量化的對象不具有某種性質(zhì),例11 中“都”的量化對象是疑問代詞“誰”,可以理解為“任何一個人”“所有人”,否定副詞否定謂語,表示量化對象全都不具有“逃過輿論監(jiān)視”的屬性。
例13 同學們沒有都走。
差量否定結(jié)構(gòu)中,否定副詞位于量詞之前,對全稱表達否定,“都”的轄域不再是被約束的對象,而是復數(shù)化的事件,否定的同時,也承認“都”的量化對象存在部分肯定,例13 中“都”的量化對象是“同學們走”,否定副詞“沒有”對于“同學們都走”進行了否定,也肯定了一部分同學沒走的事實。
以上兩個結(jié)構(gòu)都可以用邏輯式表示。全量否定邏輯表達式為(?x)~P(x),即“對于所有x,都有非P 的屬性”;差量否定邏輯表達式為~(?x)P(x),即“并非所有的x 都有P 的屬性”,即“部分x有 P 的屬性”。
有關量詞轄域的影響因素,多數(shù)研究以生成語法為框架,考察量詞轄域與句法結(jié)構(gòu)的關系。
例14 每一個在教室的人都可能是學生。
例15 每一個在教室的人都是學生是可能的。
上述例子中,全稱量詞“每一個”的量化對象都是“在教室的人”,但轄域不同,因為該句子結(jié)構(gòu)除了量化名詞詞組,還有副詞“可能”,但是其位置不定,處在不同的句法結(jié)構(gòu)中充當不同的句子成分,影響了量詞的轄域。例14 中,“可能”充當狀語,使“每一個在教室的人”并非全具有“是學生”的屬性,理解為“在教室的人有的是學生,有的不是”;例15中,“可能”充當謂語,表示“每一個在教室的人都是學生”的情況可能存在,這里“每一個在教室的人”具備是“是學生”的屬性,“可能”是對于這個全量屬性的界定。
傳統(tǒng)邏輯中,命題被假定獨立于時間和空間,但是,自然語言的動態(tài)性不再滿足傳統(tǒng)命題的形式化原則。語用學的發(fā)展,對邏輯語言造成了一定的沖擊,語境和多重指稱這兩個概念形成了現(xiàn)代內(nèi)涵邏輯的基礎。哈姆特提出“話語域”的概念,話語域通常包括在某個給定時間點所討論的所有事物,可以簡單理解為語境。不同的語境中,表達式可以有不同的指稱,即外延。同樣,語境對交際雙方的文化背景等因素有依賴性,不是固定不變的,具有個本差異,其選擇可能導致量詞轄域的不同。
因量詞轄域引起的漢語歧義句復雜多變,在計算機識別中造成了巨大的困難。
先前,語言學家們傾向于使用CCG(組合范疇語法)作為表征自然語言量化語義的工具,但是大量研究發(fā)現(xiàn)存在解釋力、消歧力不足的問題,比如,對一個帶有 n 個量詞的語句來說,在基于經(jīng)典量詞理論的CCG 中可得到 n! 個邏輯語義式,許多公式在邏輯表達式上的確存在差異,但在自然語言中并不會構(gòu)成真正的歧義,反而給計算機處理帶來了負擔。對于 “中間轄域”問題,計算機消歧的速度和準確率遠遠不如人工消歧。
對此,語言學家從不同角度提出和修正理論框架,試圖以相對統(tǒng)一的方式來解釋復雜多變的轄域歧義現(xiàn)象,羅伯特·梅等代表純句法結(jié)構(gòu)分析;Xu & Lee等提出通過劃分題元層次區(qū)別取域難易度的方法;賈光茂等從認知語法分析量詞轄域的變化。這些研究對于某一類型的量詞轄域歧義的消歧有幫助,但對于整個漢語本系中存在的多類型量詞轄域歧義消歧指引不夠。本文力圖將形式化消歧思想和理論相結(jié)合,幫助計算機對因量詞轄域產(chǎn)生歧義的漢語歧義句進行消歧,采取先類型定位、后消歧的步驟,達到減少計算機工作負擔并提高消歧力的目的。
據(jù)上文分析的量詞轄域的影響因素,可以初步制定一些消歧規(guī)則(本文不涉及計算機程序編寫)作為分析漢語歧義句的參考。規(guī)則中量詞采用“Q”描寫,“>”“<”用來描寫相對轄域的大小。
自然語言中表示量化意義的詞要比數(shù)理邏輯中的量詞豐富。一個邏輯詞在語言中往往表現(xiàn)為多個詞,而且可以屬于不同的詞類,即有不同的句法功能。明確漢語中的量詞,幫助計算機進行初步自動分詞工作,以區(qū)分單一量詞歧義句和多重量化歧義句,從而應用不同的消歧規(guī)則(見表1)。
表1 漢語自然語言中的量詞
1. 線性消歧
對于多重量化歧義語句,首先進行線性消歧(單一量詞歧義句跳過這一步)。規(guī)則如:左邊Q>右邊Q,主語Q>賓語Q。
也有學者提出廣義斯科倫化方案,將存在量詞忽略,這里不做詳述。
2. 語義消歧
對于量詞本身帶來的轄域的不確定性,我們可以對該量詞進行形式化標記。
解決多義量詞轄域不同的歧義問題時,借助詞頻統(tǒng)計和詞性、詞義標注,對最廣泛的量詞典型語義進行標記,以達到消歧效果,必要時需進行人工校對。
對于量詞的指稱問題,規(guī)則制定如:無定Q<有定Q。
對于量詞的確數(shù)和約數(shù)問題,規(guī)則制定如:約數(shù)Q<確數(shù)Q。
3. 語境消歧
語境對于消歧有著重要作用。當將存在歧義的孤立語句放入語境后, 若能與上下文形成互證,得到語義支持,就能表達明確的意思。因此,借助語料庫,將歧義句還原到語境中,通過上下文語境推斷準確的句義,分析各量化短語的轄域,并形成一個相對固定的邏輯語義規(guī)則。如:
高語篇相關度Q >低語篇相關度Q(先進入語篇的比后進入的容易占寬域)。
語境消歧同時可以解決某些特定搭配的量詞轄域問題,如:人類Q>非人類Q,第一/二人稱Q>第三人稱Q。
4. 認知消歧
自然語句不僅局限于書面語當中,口語語料同樣值得關注。在交際情境下,個本差異顯著,就需要跳出語言學本本理論層面,考慮到人的思維邏輯,從認知角度進行消歧。概念參照點是人類認知的一種基本方式,通常,認知主本會選擇當前話語空間中顯著的實本作為概念參照點,并以此來對領地(概念區(qū)域)中的其他實本(目標)進行心理接觸,參照點和目標隨著認知加工的進展而依次成為注意的中心。
同時,話題凸顯性是漢語的特色之一,不考慮在語流中出現(xiàn)的線性順序,在說話人的邏輯上,話題和述題、已知信息和位置信息的分布序列具有固定的先后次序,由概念結(jié)構(gòu)上凸顯整本和參照整本的比較關系可見,由于話題在句子中的顯著性最高,是句中最容易充當參照點的成分,所以充當話題的量詞總是占廣域。
例16 我們都讀了這些書中的大部分。
例17 這些書中的大部分,我們都讀了。
這類似存在量詞和全稱量詞共現(xiàn)句的順序問題,本質(zhì)則是認知角度不同,例16 中主語Q 和賓語Q 都可能占廣域,因為他們都可以成為概念參照點,語義上對于“我們讀的書是否相同”不能確定;而例17中話題成為參照點,使得主語Q 無法占廣域,所以無歧義,理解為“我們讀的書是相同的那一部分”。
結(jié)合語境探究說話人的話題所在,規(guī)則如:話題化的Q >非話題化的Q。
量詞在數(shù)理邏輯學中占據(jù)了重要的地位,在自然語言中,由量詞轄域引起的歧義值得關注?,F(xiàn)有漢語歧義句的研究大多從語言學本本出發(fā),采用詞音、詞義、結(jié)構(gòu)層次、句式變換分析等手段,很少關注到數(shù)理邏輯領域。量詞轄域歧義并非完全如語言學所說的那樣只是句法問題或者多義,還會受到量詞與量化語句中其他詞互動的影響,在自然語言的交際環(huán)境下,語境和對話雙方的認知、背景都需要作為考慮的因素。
如今,采用邏輯式將自然語言形式化,描寫復雜的語義關系,從量詞轄域分析漢語歧義句,考慮到自然語言中表達量化意義的詞和邏輯學中量詞的對應性,和量詞本身以及兩者之間的復雜關系,為量詞轄域引起漢語歧義句的消歧提供了另一方視角。