国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

面向中文信息處理的“N+V”結構的句法語義研究

2015-04-29 03:36劉安然
現(xiàn)代語文 2015年1期
關鍵詞:結構

摘 ?要:立足于面向計算機的語言本體研究,從切分語料中選擇數(shù)條N+V結構,從句法、語義和語用特征的角度探索該結構形成歧義的原因,找尋搭配兩個成分的搭配規(guī)則,并將之形式化,進而制定相應的機用識別策略,從而提升計算機對該結構進行分析的能力。

關鍵詞:中文信息處理 ?“N+V”結構 ?自動消歧

“N+V”格式是一種比較常見的同形異構結構,雖然表層形式簡潔,從層次劃分上不存在困難,但是內部可能存在不同的語法關系、語義關系。

一、“N+V”結構本體分析

(一)“N+V”結構的語法關系

本文所指“N+V”結構是指可以自足的、無其他成分或標記的合法語言單位,不包括“把N+V了”“N的V”等結構形式。根據(jù)馮志偉先生的潛在歧義理論,我們將這種結構底層存在的語法關系區(qū)分如下:

主謂關系,其中“N”作主語,“V”作謂語,二者之間是陳述與被陳述的關系,如:糧食豐收、媽媽做飯、小二黑結婚;

偏正關系,其中“N”為修飾語,“V”是中心語,如:口頭創(chuàng)作、直線上升、文藝演出、汽車制造、語言研究、核試驗;

既可以分析成主謂關系也可以分析成偏正關系,這種結構在沒有給定語境時會產(chǎn)生理解上的歧義,如:機器生產(chǎn)、專業(yè)人員培訓。

其中,前兩種屬于“格式真歧義短語”,它們具有相同的表層類型形式,但是對應著兩種句法功能結構,計算機在處理時不能判斷采取哪種句法結構,就會產(chǎn)生兩種結果,而這種歧義對人來說是不存在的;最后一種屬于“實例真歧義短語”,即實例化后產(chǎn)生的短語對應至少兩種句法結構,這種歧義對人和計算機都是存在的。

除此之外,由于已經(jīng)給定短語格式,其中成分的詞類已經(jīng)確定,不會作為結構歧義的產(chǎn)生原因;另一方面,只涉及兩個成分的“N+V”結構,詞與詞搭配時不會產(chǎn)生不同的結構層次,也就不會成為結構歧義的產(chǎn)生原因。

(二)“N+V”結構的語義、語用關系

“N”和“V”之間的語義關系不止一種,“N”既可以作為施事支配“V”,又可以作為“V”的受事受到“V”的支配,還可以作為狀語修飾“V”,當同一個結構能夠分析出不同關系時就會產(chǎn)生歧義。如“機器”既可以作為“生產(chǎn)”動作的對象,又可以作為“生產(chǎn)”動作的施行者,就會產(chǎn)生歧義。因此,我們可以認為,不及物動詞只能構成主謂結構和部分狀中結構,而不會產(chǎn)生歧義,只有“V”可以帶賓語并且能帶體詞性賓語時,才會反過來支配前面的“N”,才會產(chǎn)生理解上的區(qū)別。如“專業(yè)人員培訓”中的“培訓”是及物動詞,“專業(yè)人員”既可以作為狀語,表示“培訓”動作的執(zhí)行者,又可以作為賓語,表示“培訓”動作的對象。

當進入結構的“N”和“V”之間構成動作與受事、對象關系時,有可能構成定中結構。當進入結構的“N”和“V”之間構成施事主體與動作關系時可能構成主謂結構。當這兩種關系同時存在時,就會構成歧義結構,這也是歧義格式中最常見的雙重歧義關系,還有一些歧義結構的語義關系比較特殊,如:西部開發(fā)(“N”既是客體又是地點)、每個人都給一本書(“N”既是主體又是與事)。而當這兩種關系都不存在時,“N”通常表示“V”的某種方式、手段,或是動作的時間、原因、范圍等,此時構成偏正結構中的另一種——狀中結構。

名詞性的“N+V”結構還具有一種特殊的語篇特征,即“N”失去話題性,不能被回指,而“V”失去謂詞性,得到指稱意義,有時可以被數(shù)量詞修飾,如:一項季度考核、一份會議記錄。據(jù)此,整個結構就產(chǎn)生指稱的語義效果,具有類別義和概念性的傾向,伴隨著“N”的改變,類別也會發(fā)生變化。

根據(jù)現(xiàn)有“N+V”結構的研究成果來看,學者們對定中式的研究比較多,其討論主要集中在此結構的性質、產(chǎn)生機制和限制條件方面。

對于進入定中結構的“N”的限制條件,李晉霞提出高生命度、高個體度的名詞不易進入;缺省賓語不能進入;區(qū)別性的下位名詞更易進入;概念信息非常具體的“N”不易進入。耿國鋒則提出語義抽象、泛化,分布上失去名詞形態(tài)特征的名詞比較容易進入,還有抽象名詞、集合名詞較容易進入。對于“V”的限制條件,馬真、陸儉明《“名詞+動詞”詞語串淺析》中提出四類排斥進入主謂結構的動詞:企圖類、成為類、“使”類和“著想”類;并提出進入偏正結構的動詞必須是名動詞。李晉霞則提出:強動作動詞、特征動詞、口語動詞、黏著動詞、不及物動詞不易進入,但可以舉出很多反例。耿國鋒提出,動作具有無界性的動詞、非完成性和非瞬時性的動詞、及物性降低的動詞比較容易進入,且進入后失去動詞的典型句法功能。但是,名詞性“N+V”結構處在不穩(wěn)定的發(fā)展變化中,許多曾經(jīng)排斥的情況已經(jīng)有為數(shù)不少的用例,需要重新考慮相應的規(guī)則。

這些限制條件具有啟發(fā)價值,但其中某些概念比較模糊,有些對音節(jié)的限制幾乎只是現(xiàn)象描寫,還有一些從詞類角度總結的限制條件更是瑣碎而充滿例外,不適合直接作為計算機消歧的策略。

二、歧義成因與識別方法

計算機處理自然語言時,是以詞類標記序列為對象的,除了需要切分和了解各個詞的詞類、意義之外,還需要知道搭配規(guī)則與結果。根據(jù)馮志偉先生的潛在歧義理論,抽象的歧義格式所包含的歧義在代入具體成分時可能消除或保留。這里我們將“N+V”歧義格式分化為單義結構分別進行歧義成因和消解的討論。

(一)主謂結構

在主謂結構中,“N”擔任施事或感事,是動作行為的發(fā)出者或主體。參照知網(wǎng)的信息結構庫,我們將典型的主謂結構的模式總結為以下幾類:

N→V=[施事](個人名詞/團體名詞)→(事件,行動)

N→V=[施事](動物)→(事件,行動/狀態(tài))

N→V=[感事](表人名詞/表物名詞)→(事件,關系/狀態(tài))

通常來說,人或動物更容易發(fā)出動作,作為施事構成主謂結構,比較常見;而沒有生命的物體也可以進入這種結構,如:長江奔騰、工程竣工,它們可以作為動作的感事進入結構,所以我們可以制定這樣的規(guī)則,其中zwp表示主謂結構:

R1 ? ?IF N∈ V的主體語義類(即N的語義類為V的主體語義類或其子集)

AND V[+單獨作謂語]

THEN N+V≌zwp

END IF

此條件的實現(xiàn)方法在于建立以動詞為中心的詞匯網(wǎng)絡,針對動詞的每個論元關系建立詞庫,再作為外部調用。高生命度的名詞容易將N+V語符串通過心理加工構成主謂結構,當聽到這類名詞時聽眾容易產(chǎn)生“怎么樣?”的語義期待,這也是這類名詞不易構成偏正結構的原因。而“N”為人所共知的著名人物時,容易產(chǎn)生歧義,例如:魯迅研究。

“N+V”形式的獨立的主謂結構單獨成句時往往受到語義上的很大限制,通常只能用于祈使句、表示對比或在口語中提問與回答,比較容易識別。如:

你說。

——誰去? ? ——小明去。

我忘了,他記得。

(二)偏正結構

在偏正狀中結構中,“N”描述“V”具有的某種特性,往往表示非常態(tài)的情況。其中有一種是由“N”作狀語與某種不及物動詞共同構成的,如:直線上升、五點出發(fā)、火線入黨等,區(qū)分度比較明顯,可以制定這樣的規(guī)則,其中zzp表示狀中結構:

R2 ? ?IF V[+自身動作] or V [+趨向動詞]

AND N∈ V的主體語義類①

THEN N+V≌zzp

END IF

對于其他偏正狀中結構來說,語義具有如下幾種模式:

“N”表示范圍。這種模式中的“V”在語義上一定存在一個域外的施事論元,如:局部調整、全線出擊、側面打聽。

“N”表示時間、處所、方式、工具。這幾種模式都是狀語的常見用法,如:電話報名、網(wǎng)上繳費、鄉(xiāng)村支教。

這種名詞作為狀語直接修飾動詞的現(xiàn)象,簡潔便當且鮮明直觀,在古代漢語中就已經(jīng)存在,如:風馳電掣、天翻地覆、灰飛煙滅等,在成語中仍有許多保留。另外,許多“N單+V單”的偏正結構已經(jīng)被看作雙音節(jié)動詞收入了詞典,如“龜縮、云集、瓜分”等。這些詞數(shù)量有限且穩(wěn)定封閉,用建立詞庫的方法進行標記就可以實現(xiàn)計算機對它們的自動識別。

在偏正定中結構中,“V”是中心語,具有動名兼類的性質,動詞性減弱,名詞性增強;“N”從自己的語義出發(fā)對“V”的類別進行限定,與“V”間是屬性關系。有些結構中的“V”本身就與相關意義的“N”同形,如:合唱指揮、語文測驗、學歷證明。有些結構中的“V”則是在語境中獲得名詞性,如:政策調整、干部提拔等,其中的“V”指的是“V”所代表的動作事件。定中結構作賓語時,前面的謂語往往是既可以帶體詞性賓語又可以帶謂詞性賓語的,如表示判斷、變化、心理態(tài)度等意義的動詞。

定中結構主要有如下幾種模式:

N→V = [受事](具體名詞)→(事件,行動)

其中“N”是“V”的賓語,可以進入“把”字結構,這種情況在所有偏正式結構中所占比例最大,如“身體檢查、日程安排、罪犯抓捕”。值得注意的是,“V”的缺省賓語一般不能構成這種結構,如“*學生教育”,因為“教育”的客體必然是學生,通常不這樣說,而“學生”的下位概念則比較容易進入。如:小學生教育。

N→V = [結果](具體名詞)→(事件,行動)

“N”的實體在“V”的影響下產(chǎn)生、改變或消失,可以用“出來”“成”檢驗。如:產(chǎn)品開發(fā)、服裝剪裁、文件起草。

這兩種結構中,“V”一般都是及物動詞,“N”是“V”的賓語,有相應的“N+V”格式。對于這兩種格式,我們制定這樣的規(guī)則,其中dzp表示定中結構:

R3 ? ?IF N∈ V的客體語義類②

AND V[+過程性]

THEN N+V≌dzp

END IF

其它結構還包括“N”表示對象、目的,有時還包括表示處所、方式、工具等,這些情況下一般沒有對應的“N+V”格式或變換后語義上發(fā)生改變。如:

對象:質量保證、會場布置、難民補助、社區(qū)服務

目的:會議籌備、主席選舉、毒品搜查

工具:糧食救濟、津貼補助、金錢獎勵

方式:網(wǎng)絡服務、行政干預、電話采訪

處所:西部開發(fā)、地下工作、異地就業(yè)

對于這些格式,我們制定這樣的規(guī)則:

R4 ? ?IF N∈ V的狀況語義類∪V的時空語義類∪V的目的語義類③

AND V[+過程性]

THEN N+V≌dzp

END IF

其中有些“N”的意義與狀中結構難以區(qū)分,有時狀中結構也能充當名詞性成分。為了對其進行區(qū)分,我們考慮這樣的情況:偏正結構都是向心結構,整體性質由中心詞的性質決定,狀語修飾謂詞而定語修飾體詞,定中結構中的“V”呈現(xiàn)出明顯的名詞化。齊滬揚在《偏正式“N+V”短語研究》一文中將偏正式“N+V”結構的名詞性和動詞性連續(xù)情況繪制如下圖④:

因此我們制定這樣的補充規(guī)則:

R5 ? 在句中作為謂語的一定是狀中結構,作為主語、賓語、定中結構中心語和定語的一定是定中結構。如:

記者電話采訪了張先生。(作謂語)

電話采訪是一種調查手段。(作主語)

張先生接受了電話采訪。(作賓語)

電話采訪的內容無可奉告。(作定語)

(三)歧義結構

上文所述皆是基于約束法的消歧策略,但是不管語料的規(guī)模多大也無法概括語言的全貌,這些規(guī)則是根據(jù)現(xiàn)有語料制定的,難免掛一漏萬。且有一種無法處理的情況,即:當“N”既屬于“V”的主體語義類又屬于“V”的客體語義類時構成歧義結構,無法以形式化的規(guī)則判斷。好在語言自有其整體性,各個部分間能夠相互影響,可以將其放到具體語境中,根據(jù)上下文信息,基于優(yōu)選法,從若干備選語義中選擇最優(yōu)方案。沒有上下文的、獨立成句的情況,上文已經(jīng)討論過,一般都出現(xiàn)在對話中,也可以根據(jù)語境區(qū)分。例如,“理事會審查”原本是個歧義結構,但在下列語境中可以輕易區(qū)分:

XX公司的理事會審查工作已近尾聲。

理事會審查通過了這項提案。

對此,基于現(xiàn)有語料,我們提出幾個假設性質的規(guī)則:

R6 當句中出現(xiàn)了“V”的其他客體時,就可以認為這個“N+V”是主謂關系。例如:

在與中方新聞界交流、座談的過程中,非洲朋友介紹了各自國家的新聞體制及運作情況。

蒙古教官培訓阿富汗軍隊的費用大部分是由美國提供的。

雞吃了混合食物比牛更能轉化蛋白質。

R7 將“N+V”結構的左端記為Wi,若Wi-1為“由”“用”等介詞,則可以認為這個“N+V”是主謂關系。

這種情況已經(jīng)不是前述的自足結構,“N”由介詞引入,語義上支配動詞。例如:

我是公司的法人代表,是由任局長任命的。

這些工具大部分仍然由手工業(yè)或工場手工業(yè)方式生產(chǎn),然后才裝到由機器生產(chǎn)的工作機的機體上。

即將派往伊拉克的軍人是根據(jù)美格“訓練與裝備”計劃由美國教官培訓的。

通過對這兩個假設規(guī)則的分析,我們發(fā)現(xiàn)不能獨立成句、必須作為句子成分才能出現(xiàn)的“N+V”結構已經(jīng)上升到句子層面的語言形式了,本文不再討論。

(本文得到國家“973”重大基礎理論研究項目子課題“語言計算模型與理論:面向網(wǎng)絡語言的句法和語義分析的理論模型[項目編號:2014CB340500]”的支持。)

本文寫作過程中得到南京大學文學院沈陽教授、鐘叡逸老師的具體指導;本文在解放軍外國語學院作報告時,李宗江教授提供了寶貴意見。特此致謝!

注釋:

①主體語義類包括:施事(agent)、當事(relevant)、感事

(experiencer)、領事(possessor)

②客體語義類包括:受事(patient)、內容(content)、結果

(resultevent)、致事(beneficiary)

③狀況語義類包括:方式(manner)、工具(instrument)、材料

(material)時空語義類包括:時間(time)、空間(location)

④轉引自:章婧.現(xiàn)代漢語定中N+V結構研究[D].北京,中國人民大

學,2008.

參考文獻:

[1]俞士汶.計算語言學概論[M].北京:商務印書館,2007.

[2]章婧.現(xiàn)代漢語定中N+V結構研究[D].北京:中國人民大學,

2008.

[3]馮志偉.論歧義結構的潛在性[J].中文信息學報,1995,(4):

14~24.

[4]李晉霞.定中“N賓+V”結構構成因素的考察[D].北京:教育部

語言文字應用研究所,2003.

[5]馬真,陸儉明.“名詞+動詞”詞語串淺析[J].中國語文,1996,

(3):183~188.

[6]耿國鋒.名詞性“N+V”短語分析[D].開封:河南大學,2008.

[7]詹衛(wèi)東.面向中文信息處理的現(xiàn)代漢語短語結構規(guī)則研究[D].北

京:北京大學,1999.

[8]楊泉,馮志偉.面向中文信息處理的現(xiàn)代漢語“V+V”結構歧義

問題研究[J].語言文字應用,2005,(1):123~129.

[9]王錦,陳群秀.現(xiàn)代漢語語義資源用于短語歧義模式消歧研究

[J].中文信息學報,2007,(5):80~86.

[10]袁毓林.語義角色的精細等級及其在信息處理中的應用[J].中

文信息學報,2007,(4):10~20.

(劉安然 ?江蘇南京 南京大學文學院 ?210023)

猜你喜歡
結構
DNA結構的發(fā)現(xiàn)
《形而上學》△卷的結構和位置
耳朵的結構
論結構
新型平衡塊結構的應用
循環(huán)結構謹防“死循環(huán)”
論《日出》的結構
縱向結構
縱向結構
創(chuàng)新治理結構促進中小企業(yè)持續(xù)成長
精河县| 大城县| 肥乡县| 安国市| 汉寿县| 库尔勒市| 凤凰县| 东光县| 海林市| 孝昌县| 喀什市| 棋牌| 顺义区| 海兴县| 华池县| 巫溪县| 兴宁市| 奉化市| 昌平区| 岚皋县| 四川省| 洪泽县| 贺兰县| 汉川市| 古田县| 康保县| 沐川县| 吴忠市| 海城市| 汉川市| 巍山| 宜宾市| 盐池县| 北安市| 高青县| 西充县| 隆昌县| 吐鲁番市| 湘西| 赫章县| 铜鼓县|