国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

現(xiàn)代漢語(yǔ)語(yǔ)義角色研究述評(píng)

2012-08-15 00:42段瀟雪
文教資料 2012年27期
關(guān)鍵詞:句法范疇語(yǔ)料庫(kù)

段瀟雪

(南京師范大學(xué) 文學(xué)院,江蘇 南京 210097)

隨著語(yǔ)言學(xué)研究的進(jìn)一步深入,人們?cè)絹?lái)越認(rèn)識(shí)到語(yǔ)言的本質(zhì)共性是語(yǔ)義性。借助于句法分析的手段,自然語(yǔ)言理解的研究也必須建立在語(yǔ)義理解的基礎(chǔ)上。語(yǔ)言工程對(duì)語(yǔ)義分析的迫切要求充分說(shuō)明要使計(jì)算機(jī)具有人類(lèi)的智能和高速的分析能力,就必須進(jìn)行深度的語(yǔ)義分析。目前現(xiàn)代漢語(yǔ)的語(yǔ)義角色研究取得了一定的成績(jī),但對(duì)語(yǔ)義角色的分類(lèi)和鑒別仍然存在較大的分歧。

一、語(yǔ)義角色的劃分與鑒別

(一)理論上的研究

“語(yǔ)義格”的提出將語(yǔ)義分析引向深入,然而語(yǔ)義格數(shù)目的不確定也是學(xué)者們對(duì)這一理論詬病的主要原因。Fillmore(1968)首先提出了6種語(yǔ)義格,之后又增補(bǔ)了10個(gè),但語(yǔ)義格的數(shù)量難以確定,有些NP如何劃類(lèi)仍存在爭(zhēng)議。顯然這16種格是不夠的,“不能做到相同的格表示相同的關(guān)系,不同的格表示不同的關(guān)系。有些不同的關(guān)系不得不用同一種格描述”(徐烈炯,1995)。Dowty(1991)把題元?jiǎng)澐譃閮蓚€(gè)大類(lèi),即“原型施事”、“原型受事”。然而,語(yǔ)義角色劃分得過(guò)于簡(jiǎn)單就不能很好地區(qū)分句子的語(yǔ)義特點(diǎn)。同樣這種以原型理論為背景的語(yǔ)義角色劃分是否完全適合于漢語(yǔ)的特點(diǎn)也值得商榷。

事實(shí)上用“語(yǔ)義角色”的概念來(lái)研究語(yǔ)義也并不只是西方學(xué)者的創(chuàng)見(jiàn)。呂叔湘在《中國(guó)文法要略》中所提的“起詞”、“止詞”以及14種補(bǔ)詞的區(qū)分,都已經(jīng)蘊(yùn)含了漢語(yǔ)語(yǔ)法研究的格語(yǔ)法思想。任善銘(1956)認(rèn)為“施受關(guān)系和結(jié)構(gòu)在句子里本來(lái)都存在,兩者的存在本身并沒(méi)有抵觸。在認(rèn)識(shí)和分析句子的時(shí)候,兩者都應(yīng)該適當(dāng)?shù)膽?yīng)用”。丁聲樹(shù)和等(1961)也指出“有各種不同的動(dòng)詞,因此動(dòng)詞跟賓語(yǔ)也有各種不同的關(guān)系。就是同一個(gè)動(dòng)詞也常帶各種關(guān)系不同的賓語(yǔ)”,主語(yǔ)與謂語(yǔ)是施事還是受事等等關(guān)系也都考慮在列。然而遺憾的是20世紀(jì)80年代之前,學(xué)者們并沒(méi)有在語(yǔ)義的這條路上走下去。隨著語(yǔ)法研究的深入和語(yǔ)義重要性的提升,80年代以后學(xué)者們又重回到了語(yǔ)義研究上來(lái),展開(kāi)了語(yǔ)義角色的深入討論。80年代胡明揚(yáng)翻譯了《“格”辨》,譯介了Fillmore的早期格語(yǔ)法理論;之后還有楊成凱對(duì)格語(yǔ)法早期和70年代的發(fā)展進(jìn)行了詳盡的描述;朱德熙區(qū)分了句子中各種成分間的顯性語(yǔ)法關(guān)系和隱性語(yǔ)法關(guān)系。其中隱性語(yǔ)法關(guān)系就包含了施事、受事、工具等。三個(gè)平面語(yǔ)法理論提出后,語(yǔ)義成分?jǐn)[脫了句法成分附庸的地位。徐烈炯、沈陽(yáng)在譯介西方的格語(yǔ)法理論后,對(duì)漢語(yǔ)語(yǔ)義角色問(wèn)題進(jìn)行了較為深入的剖析,如《題元理論和漢語(yǔ)配價(jià)問(wèn)題》(1998),詳細(xì)討論了題元能否分類(lèi),有多少個(gè)題元,能否列出題元總表,如何定義題元等問(wèn)題。孟琮等人在《動(dòng)詞用法詞典》(1987)中將與動(dòng)詞相關(guān)的名詞賓語(yǔ)劃分為14個(gè)類(lèi)別,這14個(gè)類(lèi)別僅限于動(dòng)詞的賓語(yǔ)位置,但與動(dòng)詞發(fā)生格關(guān)系的體詞性成分的狀語(yǔ)位置并未涉及。魯川、林杏光的《現(xiàn)代漢語(yǔ)語(yǔ)法的格關(guān)系》(1989)中指出“格關(guān)系是諸多的語(yǔ)義關(guān)系的一種,指的是句子的表述中心的謂詞跟周?chē)捏w詞之間的及物性關(guān)系”,“格系統(tǒng)是一棵樹(shù)”,共分兩個(gè)層次,上層6種,下層18種。邵敬敏在《論漢語(yǔ)語(yǔ)法的語(yǔ)義雙向選擇性原則》(2007)中基于魯川、林杏光的格體系,劃分了7大類(lèi)24小類(lèi)的語(yǔ)義角色系統(tǒng)。范曉在《說(shuō)語(yǔ)義成分》(2003)一文中再次修改動(dòng)核結(jié)構(gòu)的動(dòng)元、狀元分類(lèi)和名核結(jié)構(gòu)的名元、定元。重建后的語(yǔ)義角色體系分為31個(gè)小類(lèi)。陳昌來(lái)在《現(xiàn)代漢語(yǔ)語(yǔ)義平面問(wèn)題研究》(2003)中把漢語(yǔ)的語(yǔ)義格分為26個(gè)。

有關(guān)語(yǔ)義角色理論研究的分歧還表現(xiàn)在界定問(wèn)題上,包括鑒別的標(biāo)準(zhǔn)問(wèn)題。Fillmore給語(yǔ)義格界定的標(biāo)準(zhǔn)是人類(lèi)對(duì)其周?chē)l(fā)生的事件所能做出的某些類(lèi)型的判斷。Jackendoff提出了一個(gè)認(rèn)定代理格的方法,即通過(guò)某些短語(yǔ)是否能添加到句子中來(lái)判斷。Dowty則認(rèn)為應(yīng)該劃分為幾個(gè)題元在本質(zhì)上是沒(méi)有意義的,他認(rèn)為應(yīng)該以事件而不是透視域來(lái)鑒別題元角色,而以事件為依據(jù)得出的語(yǔ)義角色能夠獨(dú)立于句法功能,保持穩(wěn)定的語(yǔ)義作用。

同樣,中國(guó)的語(yǔ)言學(xué)者在語(yǔ)義角色的鑒別上方法和原則也不盡相同。林杏光、魯川(1999)通過(guò)對(duì)漢語(yǔ)格關(guān)系的研究發(fā)現(xiàn),語(yǔ)義角色可以按層級(jí)進(jìn)一步細(xì)分。他們認(rèn)為語(yǔ)義角色系統(tǒng)像一顆樹(shù)一樣按層級(jí)排列,語(yǔ)義角色之間存在著層次。在這種認(rèn)知的基礎(chǔ)上,他們采取了層層控制和層層推進(jìn)的方法界定語(yǔ)義角色類(lèi)別。畢玉德(2003)在建構(gòu)朝鮮語(yǔ)語(yǔ)義角色體系時(shí)歸納了四條語(yǔ)義角色鑒別的原則:基于事件原則;面向語(yǔ)料;句法為本;意念驅(qū)動(dòng)。

對(duì)語(yǔ)義角色研究較多的袁毓林先生在《論元角色的層級(jí)關(guān)系和語(yǔ)義特征》(2003)一文中提出了怎樣確定語(yǔ)義角色,如何處理語(yǔ)義角色的模糊性問(wèn)題以及語(yǔ)義角色的層級(jí)設(shè)立和動(dòng)詞在特定句式中增加的論元如何處理等問(wèn)題。語(yǔ)義角色難免有一定的模糊性,用一種形式化的辦法難以嚴(yán)格的定義,那么是否可以采用原型理論,在給出語(yǔ)義角色的典型句法和語(yǔ)義特征的前提下,通過(guò)類(lèi)比歸類(lèi)的辦法鑒別特征不明顯的語(yǔ)義角色。

語(yǔ)義角色的鑒定是語(yǔ)義角色范疇體系制定的前提,也是檢驗(yàn)語(yǔ)義角色分類(lèi)是否合理的指標(biāo)。有了清晰的鑒定方法,語(yǔ)義角色的研究才能從混沌走向清晰。

(二)現(xiàn)有漢語(yǔ)語(yǔ)義標(biāo)注語(yǔ)料庫(kù)建設(shè)

在語(yǔ)義研究的過(guò)程中,人們?cè)絹?lái)越意識(shí)到單一層面的劃分是不可能把語(yǔ)義角色的范疇描述清楚的,但是句式的多樣性和漢語(yǔ)動(dòng)詞語(yǔ)義的復(fù)雜情況使得語(yǔ)義角色范疇的研究難有一個(gè)統(tǒng)一的定論。學(xué)者們因認(rèn)識(shí)與需求的不同形成了不同的語(yǔ)義角色層級(jí)劃分體系。至今語(yǔ)義角色的數(shù)目和語(yǔ)義范疇體系的明晰之間的矛盾依然存在,建立更加合理的語(yǔ)義角色范疇是語(yǔ)義角色標(biāo)注的前提,對(duì)中文信息處理同樣有重要的意義。

對(duì)應(yīng)于理論層面的研究,近年來(lái)面向語(yǔ)義標(biāo)注語(yǔ)料庫(kù)的語(yǔ)義角色劃分也取得了一定的成績(jī),具有代表性的有:

由清華大學(xué)、北京大學(xué)和魯東大學(xué)共同構(gòu)建的事件塊句法語(yǔ)義標(biāo)注語(yǔ)料庫(kù),標(biāo)注的關(guān)鍵集中在對(duì)物質(zhì)世界、人類(lèi)社會(huì)中的幾大類(lèi)客觀關(guān)系的實(shí)踐內(nèi)容,主要包括:廣義擁有關(guān)系、時(shí)空存現(xiàn)關(guān)系和時(shí)空變化關(guān)系等方面。

魯東大學(xué)承建的現(xiàn)代漢語(yǔ)句法語(yǔ)義信息語(yǔ)料庫(kù),以中小學(xué)課文和對(duì)外漢語(yǔ)閱讀材料為基礎(chǔ)共加工了包含713430字、28669個(gè)句子的語(yǔ)料。以句子為單位標(biāo)注了每個(gè)句子的句法結(jié)構(gòu)和語(yǔ)義信息結(jié)構(gòu)。在語(yǔ)料庫(kù)的基礎(chǔ)上,分別提取并建立了句型系統(tǒng)、句模系統(tǒng)和句干系統(tǒng)。該語(yǔ)料庫(kù)共設(shè)置了24個(gè)語(yǔ)義成分標(biāo)記,7個(gè)句法成分標(biāo)記,以句子為單位進(jìn)行句法結(jié)構(gòu)和語(yǔ)義結(jié)構(gòu)的標(biāo)注。

北京語(yǔ)言大學(xué)的現(xiàn)代漢語(yǔ)語(yǔ)料的句子級(jí)語(yǔ)義標(biāo)注。該標(biāo)注語(yǔ)料庫(kù)是以HNC理論為指導(dǎo)建立的自上而下的句子語(yǔ)義標(biāo)注,主要標(biāo)注句類(lèi)、語(yǔ)義塊、句蛻。

北大中文網(wǎng)庫(kù)是2007年開(kāi)始建設(shè)的一個(gè)基于大規(guī)模真實(shí)文本的多層次語(yǔ)義關(guān)系標(biāo)注語(yǔ)料庫(kù),共定義了22個(gè)論元角色,分為必有論元和非必有論元。在標(biāo)注論元信息的同時(shí)對(duì)句子的主觀信息也進(jìn)行了標(biāo)注。北大中文網(wǎng)庫(kù)是在詹衛(wèi)東等人開(kāi)發(fā)的北大漢語(yǔ)句法分析樹(shù)庫(kù)的基礎(chǔ)上進(jìn)行的語(yǔ)義信息標(biāo)注。

哈工大語(yǔ)言技術(shù)平臺(tái)(Language Technology Platform,LTP)是哈爾濱工業(yè)大學(xué)社會(huì)計(jì)算與信息檢索研究中心開(kāi)發(fā)的一套系統(tǒng),提供了一系列的漢語(yǔ)語(yǔ)言處理模塊,其中包括分詞、詞性標(biāo)注、命名實(shí)體識(shí)別、依存句法分析、語(yǔ)義消歧和語(yǔ)義角色標(biāo)注等。該平臺(tái)使用的訓(xùn)練數(shù)據(jù)是Chinese Prop-Bank2.0中的22277個(gè)句子?!皵?shù)據(jù)稀疏仍然是困擾語(yǔ)義角色標(biāo)注的主要問(wèn)題之一”(劉挺,2011),由此可見(jiàn),語(yǔ)義角色的精細(xì)等級(jí)和標(biāo)注的效率的矛盾是一直存在的。與此同時(shí),哈工大近兩年正在研究“語(yǔ)義依存分析”(Semantic Dependency Parsing,SDP),同時(shí)聯(lián)合北京城市大學(xué)標(biāo)注了1萬(wàn)句中文語(yǔ)義依存分析樹(shù)。中文語(yǔ)義依存樹(shù)庫(kù)是以依存句法理論為基礎(chǔ),融合依存結(jié)構(gòu)和語(yǔ)義信息,提取句子中所有的修飾詞與核心詞之間的語(yǔ)義關(guān)系。除了分析句子中主要謂詞與其論元的語(yǔ)義關(guān)系外,還涉及了諸如數(shù)量、屬性、頻率等非主要謂詞包含的語(yǔ)義信息。

現(xiàn)代漢語(yǔ)的語(yǔ)義標(biāo)注研究,除了以上所提到的還有較早建立的SinicaTreeBank(臺(tái)灣中央研究院詞庫(kù)小組,1986)、句子級(jí)語(yǔ)義標(biāo)注的現(xiàn)代漢語(yǔ)語(yǔ)料庫(kù)系統(tǒng)(社科院聲學(xué)所、北京師范大學(xué)和北京大正語(yǔ)言有限公司研制,1989)。上海師范大學(xué)和山西大學(xué)聯(lián)合構(gòu)建的Chinese Frame Net,可以看做是Frame Net的漢語(yǔ)對(duì)應(yīng)庫(kù)。偏向于工程的語(yǔ)義角色體系還有董振東的知網(wǎng)(HowNet),共有90個(gè)語(yǔ)義角色,用義元和角色關(guān)系來(lái)描述概念,采用了812類(lèi)事件義元,并規(guī)定了相應(yīng)的必備語(yǔ)義角色框架。

現(xiàn)有工程上的語(yǔ)義角色標(biāo)注系統(tǒng)多數(shù)以句法成分為基本的標(biāo)注單元,必然依靠句法標(biāo)注信息,這里不再贅述。

二、當(dāng)前語(yǔ)義角色范疇研究的困難及趨勢(shì)

漢語(yǔ)語(yǔ)義角色的研究雖然已經(jīng)在中文信息處理、對(duì)外漢語(yǔ)教學(xué)等方面取得了一定的成績(jī),但是也存在一定的問(wèn)題。語(yǔ)義角色的稱(chēng)謂混亂、語(yǔ)義角色的數(shù)目不定、歸屬上混沌模糊、各角色間的界限不明確等。從學(xué)者們對(duì)語(yǔ)義角色范疇研究的歷程中可以看出,語(yǔ)義角色的不斷增加說(shuō)明不同的句式對(duì)語(yǔ)義角色有著不同的要求。語(yǔ)義角色范疇研究的困難大致有兩個(gè)方面的原因:一是句式的復(fù)雜多樣;二是動(dòng)詞語(yǔ)義的復(fù)雜。

首先,語(yǔ)義角色概念稱(chēng)謂的混亂是亟待解決的問(wèn)題。不應(yīng)因?yàn)楦拍畹幕靵y造成研究上的障礙,使得人們對(duì)語(yǔ)義分析理論有一種不規(guī)范、不明確的認(rèn)識(shí)。第二,沒(méi)有一套準(zhǔn)確的語(yǔ)義角色測(cè)定標(biāo)準(zhǔn)。在分離和制定語(yǔ)義角色標(biāo)準(zhǔn)的時(shí)候,各個(gè)學(xué)者的標(biāo)準(zhǔn)不同。使得原本就混亂的語(yǔ)義角色劃分更不清晰,有些相同句式中的語(yǔ)義成分被歸為了不同的語(yǔ)義角色。第三,可供計(jì)算機(jī)處理的可用資源很有限。

針對(duì)語(yǔ)義角色范疇研究的困難,增大可供學(xué)習(xí)的語(yǔ)料庫(kù)是解決句式多樣造成范疇研究困難的一條途徑。語(yǔ)料庫(kù)的規(guī)模越大,所能涵蓋的句式就更加全面,再給機(jī)器學(xué)習(xí)之后才能更好的完成語(yǔ)義角色的標(biāo)注。在此基礎(chǔ)上,本文認(rèn)為面向深層次語(yǔ)義研究的語(yǔ)義角色范疇建立體現(xiàn)出以下的研究趨勢(shì):

1.語(yǔ)義句法理論的建構(gòu)更加注重面向自然語(yǔ)言的處理中語(yǔ)義理解的需要。語(yǔ)義句法的理論研究和語(yǔ)義角色范疇的劃分都是為了對(duì)語(yǔ)言進(jìn)行深層次的語(yǔ)義剖析,解釋語(yǔ)義的生成機(jī)制,以期提供更多可供機(jī)器學(xué)習(xí)的語(yǔ)義信息。

2.語(yǔ)義角色范疇的劃分需要基于真實(shí)文本的標(biāo)注驗(yàn)證。不論是理論上的語(yǔ)義角色體系建構(gòu),還是面向自然語(yǔ)言處理的語(yǔ)義角色劃分,近年來(lái)有關(guān)語(yǔ)義角色范疇劃分的一個(gè)明顯趨勢(shì)就是更多地將范疇劃分和真實(shí)文本的標(biāo)注驗(yàn)證相結(jié)合。語(yǔ)義角色的劃分要遵循一定的語(yǔ)義分析原則,但并不是這樣就一定適合于自然語(yǔ)言復(fù)雜多樣的情況。因此,以真實(shí)文本的標(biāo)注中遇到的問(wèn)題來(lái)驗(yàn)證并提高語(yǔ)義句法范疇體系的信度和效度是今后研究的一個(gè)方向。

3.語(yǔ)義角色的研究趨向典型格的深化,同時(shí)關(guān)照非典型格的分析。孫道功(2009)提出目前漢語(yǔ)格語(yǔ)法取得了一定進(jìn)展,在格的層級(jí)性以及施事、受事等典型格的界定上都已經(jīng)達(dá)成共識(shí);但對(duì)于格的個(gè)案研究還不充分,格的名稱(chēng)也缺乏統(tǒng)一性;對(duì)名核結(jié)構(gòu)內(nèi)部關(guān)系缺乏關(guān)注和探討。以往的研究者們對(duì)典型的語(yǔ)義角色的研究已經(jīng)有一定的成果,認(rèn)識(shí)上也達(dá)成了一定程度上的一致,正一步步接近典型語(yǔ)義角色的語(yǔ)義本質(zhì)。典型語(yǔ)義角色與研究較少的非典型語(yǔ)義角色之間組織關(guān)系等還不很清楚;在個(gè)別一些語(yǔ)義角色的界定上存在很大的分歧。進(jìn)一步深入研究非典型的語(yǔ)義角色,才能平衡語(yǔ)義角色體系內(nèi)部的研究。

4.語(yǔ)義句法范疇體系的建構(gòu)更加需要借鑒認(rèn)知語(yǔ)言學(xué)的相關(guān)理論。認(rèn)知語(yǔ)言學(xué)的興起使人們看到它在對(duì)語(yǔ)言現(xiàn)象的解釋特別是對(duì)語(yǔ)義的挖掘上十分有效。語(yǔ)義句法范疇的建構(gòu)和研究也要善于借鑒認(rèn)知語(yǔ)言學(xué)的理論。

如上所述,當(dāng)今人們對(duì)自然語(yǔ)言理解的最終目標(biāo)就是深層次的語(yǔ)義分析,以期進(jìn)行自動(dòng)的知識(shí)獲取、推理等等。因此在語(yǔ)義角色標(biāo)注的基礎(chǔ)上進(jìn)行深層次的語(yǔ)義分析必然是未來(lái)語(yǔ)義研究的重點(diǎn)。語(yǔ)義角色范疇體系的建立是進(jìn)一步語(yǔ)義研究的基石,是語(yǔ)義角色標(biāo)注完備的前提。

[1]畢玉德.關(guān)于語(yǔ)義信息處理的語(yǔ)義角色系統(tǒng)的建構(gòu).2003(3).

[2]陳昌來(lái).現(xiàn)代漢語(yǔ)語(yǔ)義平面問(wèn)題研究.學(xué)林出版社,2003.

[3]丁聲樹(shù)等.現(xiàn)代漢語(yǔ)語(yǔ)法講話.商務(wù)印書(shū)館,1961.

[4]范曉.說(shuō)語(yǔ)義成分.漢語(yǔ)學(xué)習(xí),2003(1).

[5]劉挺,車(chē)萬(wàn)翔,李正華.語(yǔ)言技術(shù)平臺(tái).中文信息學(xué)報(bào),2011(11).

[6]魯川,林杏光.現(xiàn)代漢語(yǔ)語(yǔ)法的格關(guān)系.漢語(yǔ)學(xué)習(xí),1989.

[7]林杏光.詞匯語(yǔ)義和計(jì)算語(yǔ)言學(xué).語(yǔ)文出版社,1999.

[8]呂叔湘.中國(guó)文法要略.商務(wù)印書(shū)館,1941.

[9]孟琮等.動(dòng)詞用法詞典.上海辭書(shū)出版社,1987.

[10]任善銘.主賓語(yǔ)問(wèn)題是怎樣的問(wèn)題.中華書(shū)局,1956.

[11]邵敬敏.漢語(yǔ)語(yǔ)法的立體研究.商務(wù)印書(shū)館,2007.

[12]孫道功.詞匯-句法語(yǔ)義貫通研究的新探索.語(yǔ)言文字應(yīng)用,2009(2).

[13]徐烈炯.語(yǔ)義學(xué)(修訂本).語(yǔ)文出版社,1995.

[14]徐烈炯,沈陽(yáng).題元理論和漢語(yǔ)配價(jià)問(wèn)題.當(dāng)代語(yǔ)言學(xué),1998(3).

[15]袁毓林.一套動(dòng)詞論元角色的語(yǔ)法指標(biāo).世界漢語(yǔ)教學(xué),2003(3).

[16]袁毓林.論元角色的層級(jí)關(guān)系和語(yǔ)義特征.世界漢語(yǔ)教學(xué),2002(3).

[17]http://ir.hit.edu.cn/demo/ltp/.

猜你喜歡
句法范疇語(yǔ)料庫(kù)
批評(píng)話語(yǔ)分析的論辯范疇研究
述謂結(jié)構(gòu)與英語(yǔ)句法配置
正合范疇中的復(fù)形、余撓對(duì)及粘合
《語(yǔ)料庫(kù)翻譯文體學(xué)》評(píng)介
Clean-正合和Clean-導(dǎo)出范疇
基于JAVAEE的維吾爾中介語(yǔ)語(yǔ)料庫(kù)開(kāi)發(fā)與實(shí)現(xiàn)
語(yǔ)料庫(kù)語(yǔ)言學(xué)未來(lái)發(fā)展趨勢(shì)
不能把范疇不同的兩個(gè)問(wèn)題混為一談