国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

漢語話頭話身關(guān)系分析影響因素研究*

2024-01-11 08:41:58盧達(dá)威
學(xué)術(shù)研究 2023年12期
關(guān)鍵詞:標(biāo)點常識句法

盧達(dá)威

一、話頭話身結(jié)構(gòu)和話頭話身關(guān)系分析

話頭話身關(guān)系是話題說明關(guān)系的擴展。漢語是話題顯著型語言。在單句層面表現(xiàn)為“主語即話題”;①趙元任:《漢語口語語法》,北京:商務(wù)印書館,1979 年,第45 頁;朱德熙:《語法答問》,北京:商務(wù)印書館,1985 年,第38 頁;沈家煊:《“零句”和“流水句”》,《中國語文》2012 年第5 期。在篇章層面,話題可以通過平行推進(jìn)或?qū)蛹壨七M(jìn)等零形回指方式②陳平:《漢語零形回指的話語分析》,《中國語文》1987 年第5 期。以及其他方式被后續(xù)的小句談?wù)?,從而?gòu)成超越單句的“主題鏈”③曹逢甫:《漢語的句子與子句結(jié)構(gòu)》,北京:北京語言大學(xué)出版社,2005 年,第53-54 頁?;颉皾h語句”④[美]屈承熹:《漢語篇章語法》,潘文國等譯,北京:北京語言大學(xué)出版社,2006 年,第282 頁。。宋柔⑤宋柔:《漢語敘述文中的小句前部省略現(xiàn)象初析》,《中文信息學(xué)報》1992 年第3 期;宋柔:《現(xiàn)代漢語跨標(biāo)點句句法關(guān)系的性質(zhì)研究》,《世界漢語教學(xué)》2008 年第2 期;宋柔:《漢語篇章廣義話題結(jié)構(gòu)的流水模型》,《中國語文》2013 年第6 期;宋柔:《小句復(fù)合體的語法結(jié)構(gòu)》,北京:商務(wù)印書館,2022 年,第18 頁。對單句層面和篇章層面中的“話題/主題”概念進(jìn)行了統(tǒng)一和擴展,認(rèn)為被談?wù)摰某煞旨瓤梢允菃尉鋵用娴模部梢允瞧聦用娴?,而且不僅可以是體詞性成分,還可以是謂詞性成分、環(huán)境成分、狀語性成分,甚至介詞、連詞等,⑥宋柔:《小句復(fù)合體的語法結(jié)構(gòu)》,第26 頁。故使用了“話頭(naming)”的說法,以免與傳統(tǒng)話題混淆。話頭所對應(yīng)的說明成分則稱為“話身(telling)”。一個話頭可對應(yīng)多個話身,話頭及其所有話身組成的結(jié)構(gòu)叫“話頭話身結(jié)構(gòu)(Naming-telling Structure)”。

在實際語料中,話頭話身結(jié)構(gòu)的概念更有利于語篇結(jié)構(gòu)描寫。語篇是由一個個標(biāo)點句⑦標(biāo)點句指以逗號、分號、句號、嘆號、問號、直接引語的冒號、部分波折號和刪節(jié)號(關(guān)于波折號和刪節(jié)號的細(xì)節(jié)將另文說明)分隔的語段(宋柔:《小句復(fù)合體的語法結(jié)構(gòu)》,第15 頁)。構(gòu)成的,但超過50%的標(biāo)點句句法或語義不完整。①盧達(dá)威、宋柔、尚英:《從廣義話題結(jié)構(gòu)考察漢語篇章話題的認(rèn)知復(fù)雜度》,《中文信息學(xué)報》2014 年第5 期。這些句法語義不完整的標(biāo)點句大多能夠在上文(少數(shù)情況是下文)找到所缺失(或稱共享)的“話頭”,這些標(biāo)點句本身就是“話身”,從而形成話頭話身結(jié)構(gòu)。與話題說明不同的是,話頭話身結(jié)構(gòu)允許層層嵌套,一個話頭話身結(jié)構(gòu)允許話身是一個話頭話身結(jié)構(gòu)。在話頭話身結(jié)構(gòu)理論中,標(biāo)點句通過話頭話身關(guān)系組成話頭話身結(jié)構(gòu),進(jìn)而組成篇章,形成了“標(biāo)點句—話頭話身結(jié)構(gòu)—篇章”的語篇組織方式。本文研究話頭與話身的關(guān)系,是要探究標(biāo)點句如何通過話頭共享組織成話頭話身結(jié)構(gòu);以及通過研究話頭補全過程,探究語言認(rèn)知和理解的過程。為清晰展現(xiàn)話頭話身結(jié)構(gòu),我們將整個篇章按照每個標(biāo)點句占一行的方式來排列,并將話身標(biāo)點句縮進(jìn)到話頭的右邊,這樣就可以把話頭和話身的關(guān)系直觀展現(xiàn)(如表1),這種篇章表示方法稱為“換行縮進(jìn)圖式”。②宋柔:《現(xiàn)代漢語跨標(biāo)點句句法關(guān)系的性質(zhì)研究》,《世界漢語教學(xué)》2008 年第2 期;宋柔:《漢語篇章廣義話題結(jié)構(gòu)的流水模型》,《中國語文》2013 年第6 期;宋柔:《小句復(fù)合體的語法結(jié)構(gòu)》,第19-20 頁。

表1 以換行縮進(jìn)圖式展示話頭話身結(jié)構(gòu)

表1 是賓州中文樹庫(Chinese Tree Bank,CTB)的一段新聞?wù)Z料,我們用換行縮進(jìn)圖式對這段新聞進(jìn)行排列后,得到了如表1 所示的呈現(xiàn)形式。從話頭話身結(jié)構(gòu)的角度看,整體段落7 個標(biāo)點句(c1~c7)構(gòu)成以“西藏銀行部門”為最外層話頭的話頭話身結(jié)構(gòu)(例中話頭用“ □ ”表示)。“西藏銀行部門”的話身有三個,分別是“積極調(diào)整信貸結(jié)構(gòu)”(c1)、目的連詞“以”為話頭的話頭話身結(jié)構(gòu)(c2~c3)和以“去年”為話頭的話頭話身結(jié)構(gòu)(c4~c7)。其中“去年”的話身也有3 個,分別是以“新增貸款”為話頭的話頭話身結(jié)構(gòu)(c4~c5),“農(nóng)牧業(yè)……億元”(c6)和“鄉(xiāng)鎮(zhèn)……點八三”(c7)。從標(biāo)點句的角度看,除c1 不缺話頭外,c2~c7 都缺少部分話頭,有的缺少一層話頭(如c2 和c4),有的缺少兩層話頭(如c3、c6、c7),有的缺少三層話頭(如c5)。以c5 為例,“比上年增加八億多元”不完整,缺少話頭。檢索上下文發(fā)現(xiàn)c5 說的是“新增貸款”(在c4),屬于實體話頭;③話頭話身結(jié)構(gòu)理論中包含四種類型話頭:實體話頭、環(huán)境話頭(包括時間和處所)、謂詞話頭和狀性話頭(宋柔:《漢語篇章廣義話題結(jié)構(gòu)的流水模型》,《中國語文》2013 年第6 期)。補全后看似完整,再往前還發(fā)現(xiàn)環(huán)境話頭“去年”(在c4),這是“新增貸款比上年增加八億多元”發(fā)生的時間;再往前發(fā)現(xiàn)c5還有另一實體話頭“西藏銀行部門”(在c1),這是“新增貸款”的領(lǐng)有者。再往前已沒有其他能夠進(jìn)一步補充說明c5 的部分了,至此,c5 補全話頭后完整的信息應(yīng)該是“西藏銀行部門去年新增貸款比上年增加八億多元”,補全后的句子叫作“話頭話身自足句”(Naming-telling Clause)。其中,“新增貸款”是直接話頭,“西藏銀行部門”和“去年”都是間接話頭。

以上對表1 的分析發(fā)現(xiàn),識別各標(biāo)點句的話頭需要對標(biāo)點句進(jìn)行話頭話身關(guān)系分析。話頭識別的研究可以幫助我們了解人在閱讀理解時對標(biāo)點句的認(rèn)知過程,進(jìn)而幫助計算機進(jìn)行話頭話身結(jié)構(gòu)自動識別。但這是一項復(fù)雜的任務(wù)。對人來說,憑語感進(jìn)行話頭識別很容易,這個過程甚至是無意識的。但我們更想知道,所謂的“語感”究竟包含了哪些內(nèi)容?也就是說,人在話頭話身關(guān)系的識別過程中,究竟調(diào)用了哪些語言特征和語言知識?以及這些特征和知識如何協(xié)調(diào)和互動?哪些因素起了關(guān)鍵作用?調(diào)用順序如何?對這些問題的研究,一方面從語言認(rèn)知的角度,能夠?qū)θ祟愓Z言理解有更深刻的認(rèn)識;另一方面,從語言計算的角度,話頭話身結(jié)構(gòu)識別可以檢驗語言學(xué)知識和規(guī)律的正確性,也有助于計算機信息抽取、信息摘要、機器翻譯等工程應(yīng)用。

本文正是在已有話頭話身結(jié)構(gòu)理論的基礎(chǔ)上,從語言認(rèn)知和語言計算的角度出發(fā),分析話頭話身關(guān)系,挖掘話頭識別過程中所涉及的影響因素和因素間的互動關(guān)系。為此,我們構(gòu)造了一個“話頭話身結(jié)構(gòu)語料庫”,對30963 個標(biāo)點句、約37.8 萬字的語料進(jìn)行了人工的話頭話身結(jié)構(gòu)標(biāo)注,內(nèi)容涉及百科釋文、小說和政府工作報告等語體類型。其中,百科釋文包括生物、地理、歷史事件和人物4 種題材;小說包括當(dāng)代小說、現(xiàn)代章回小說和古代白話小說。考察語料發(fā)現(xiàn),話頭話身關(guān)系涉及語義、句法、語境、常識、百科知識等影響因素。以下我們將對這些影響因素逐一考察。

二、影響話頭話身關(guān)系分析的語義因素

考察語料發(fā)現(xiàn),話頭話身分析中最主要的影響因素是語義知識,這是標(biāo)點句話頭識別分析的基礎(chǔ)。語義知識對人來說顯而易見,但從語言理解過程看,我們不知道自己調(diào)用了哪些知識以及這些知識的調(diào)用過程。從語言計算角度,理解語義則是比較困難的。雖然人工智能大語言模型(如ChatGPT 等)已具有一定的語義知識,但這些模型是一個黑箱,無法知道其識別過程,且對語義的理解不穩(wěn)定。因此,我們?nèi)孕枰獙τ绊懺掝^話身關(guān)系的語義因素進(jìn)行挖掘。目前發(fā)現(xiàn)的語義特征有以下類型。

(一)話頭和話身主要謂詞的語義關(guān)系

這主要是指話頭和話身謂詞的語義搭配關(guān)系(如表2)。表2 展現(xiàn)了語料中最普通的話頭話身結(jié)構(gòu),其中c1 不缺話頭,c2 缺少話頭。從語言認(rèn)知過程看,c2 的話頭補全過程如下。首先,判斷c2 缺話頭的原因。本句缺少話頭的原因是核心謂語“倒酒”的論元數(shù)量不足,“倒酒”缺少語義上的主體論元。第二,判斷缺失話頭的類型。根據(jù)語義常識,“倒酒”的主體應(yīng)該是人。第三,查找c1 的所有成分(“小姐”“啟開”“酒瓶”),并逐一識別其語義類型(“小姐”是人,“啟開”是動作,“酒瓶”是物品)。第四,匹配c2 對話頭的語義要求和c1 的候選話頭語義類型,得到c2 的話頭是“小姐”。從語言計算的角度,以上認(rèn)知過程可以形式化為話頭識別的基礎(chǔ)算法,其中語義搭配知識和語義類型知識可以從語義詞典①如由北京大學(xué)袁毓林教授開發(fā)的《漢語實詞信息詞典》。該詞典包含名詞的物性結(jié)構(gòu)知識,形容詞、動詞的論元結(jié)構(gòu)知識等,特別是物性結(jié)構(gòu)知識包含了豐富的與名詞所指事物有關(guān)的常識(詳見袁毓林、曹宏:《“漢語形容詞句法語義功能信息詞典暨檢索系統(tǒng)”知識內(nèi)容說明書》,《辭書研究》2019 年第2 期;袁毓林、曹宏:《〈動詞句法語義信息詞典〉知識體系及其檢索界面》,《中文信息學(xué)報》2022 年第8 期?;蛘哒Z料統(tǒng)計中獲得。

表2 話頭和話身主要謂詞之間的語義關(guān)系示例

話頭和話身謂詞的語義搭配關(guān)系是其他語義特征的基礎(chǔ),話頭和話身謂詞的語義關(guān)系是最基本的語義關(guān)系。語料調(diào)查中發(fā)現(xiàn),大部分標(biāo)點句的話頭靠話頭和話身的謂詞的語義搭配就可以識別。

(二)大話頭與小話頭的語義關(guān)系

有的標(biāo)點句缺少話頭的原因不是核心謂詞的論元不足,而是當(dāng)句首為一階名詞或者一些意義不自足詞語時,缺少其依附成分。這類詞語相當(dāng)于一個小話頭,需要在上文找到所依附的成分作為大話頭。小話頭與其依附的大話頭的語義關(guān)系主要有:局部和整體、部分與全體、屬性與主體、事物與領(lǐng)有者,以及空間(或時間)參照關(guān)系、人際參照關(guān)系等(如表3)。②張瑞朋:《現(xiàn)代漢語書面語中跨標(biāo)點句句法關(guān)系約束條件的研究》,北京:中國社會科學(xué)出版社,2013 年,第37-40 頁。

表3 大話頭與小話頭之間的語義關(guān)系示例

表3(a)句首“年均溫度”是一種屬性,其屬性主體是“澳門”。表3(b)c1 的“安徽省”和c2 句首“銅陵”構(gòu)成大小處所的關(guān)系,“安徽省”成為c2的話頭。表 3(c)c1 的“1912 年10 月”與“9日”以及c2 句首“17、18 日”構(gòu)成大小時間的關(guān)系。大小話頭的語義關(guān)系也可以歸納為詞匯知識,在話頭識別時,這類知識可以作為語義搭配知識的補充。

(三)前句主語和賓語的語義關(guān)系

單靠上文話頭和話身謂詞的搭配以及大小話頭語義關(guān)系有時還不足以確定話頭。例如,在判斷句中,前句主語和賓語在語義搭配上能與話身搭配,但主賓語的語義關(guān)系不同,會影響是否作為話頭。若前句的主語和賓語分別是類和子類或類和元素的語義關(guān)系時,傾向于以子類或元素作為本句話頭(如表4)。表4(a)c2 和c3 句首“眼”“背鰭”都是身體部件名稱,c1 的“條紋蝦魚”和“中國玻甲魚科”語義上都能成為部件的主體。在沒有其他標(biāo)記的情況下,傾向于以子類為話頭,即“條紋蝦魚”。而且這與句法無關(guān),即使我們把上例稍作變動,以“條紋蝦魚”作主語,語感上仍然認(rèn)為c2~c3 在描述“條紋蝦魚”(如表4(a1))。在語料庫中真實的例子如表4(b)。表4(b)c2 句首是器官名詞“體”,需要依附于生物全體構(gòu)成整體與器官關(guān)系。僅看詞匯語義,c1 中“電鰻目”“硬骨魚綱”都能與之搭配?!半婗犇俊笔亲宇?,“硬骨魚綱”是父類,“電鰻目”更傾向于成為話頭。

表4 前句主語和賓語之間的語義關(guān)系示例

可見主賓語的語義關(guān)系也能影響話頭識別。判斷句中傾向以概念更具體、外延更小的成分為話頭。

(四)話身謂語語義類型

標(biāo)點句本身謂語動詞的語義類型對話頭話身關(guān)系也有較大影響。若缺話頭的標(biāo)點句的謂語是表達(dá)屬性、狀態(tài)等靜態(tài)描寫的語義時,傾向于以前句動詞賓語為話頭;若標(biāo)點句的謂語動詞是表達(dá)動作、事件等動態(tài)描寫的語義時,傾向于以前句主語為話頭(如表5)。表5(a)和(b)的c1 相似,c2 不同。表5(a)的c2 的句首是“臉上”,核心謂語是“有些紅點”,無論從搭配角度還是大小話頭關(guān)系看,c1 的“兩人”或“孫小姐”在句法和語義上都能成為c2 的話頭。但從語感可知,c2 是對“孫小姐”的進(jìn)一步說明,其話頭應(yīng)該是c1 的賓語“孫小姐”。表5(b)不同在于,雖然c1 的“鴻漸”和“孫小姐”在句法語義等方面也都能作為c2 的話頭,但從語感可知c2 的話頭是主語“鴻漸”而不是“孫小姐”。造成以上差別的原因是:表5(a)的c2 是靜態(tài)描寫,這種情況往往是對前句賓語(通常在句子的信息結(jié)構(gòu)中是新事物)的進(jìn)一步解釋說明。而表5(b)c2 的核心謂詞“說”是動作性較強的語義類型,往往是前句主語的時間上連續(xù)的動作??梢?,標(biāo)點句本身的語義類型也有重要影響。

表5 話身謂語語義類型差異示例

(五)非直接句子成分充當(dāng)話頭

在上文的討論中,我們默認(rèn)話頭成分是一個能夠直接充當(dāng)句子成分的短語結(jié)構(gòu)。實際上,在一定的語義因素影響下,句子成分的局部也可能成為話頭,如定中結(jié)構(gòu)的定語或主謂結(jié)構(gòu)的主語等(如表6)。表6(a)(b)(c)中,c2 都以c1 中定中結(jié)構(gòu)的定語為話頭,而這個定中結(jié)構(gòu)在c1 中分別是主語、賓語、介詞賓語。雖然句法各異,但語義上這幾個定語都是中心語是領(lǐng)有者,故成為c2 的話頭。這不是特例,定中結(jié)構(gòu)中表環(huán)境、領(lǐng)屬、類型等的定語,都有可能成為后句話頭(如表7)。表7(a)是語料庫原文,c2 的話頭“1995 年末居民儲蓄存款余額”呈現(xiàn)為定中結(jié)構(gòu),只要有需要,定語的各個部分幾乎都能成為話頭。比如我們可以自擬出表7(b)(c)(d)的例子。表7(b)(c)(d)中c2 的話頭分別是“存款”“居民”“1995 年末”,在語義上分別與中心語“余額”構(gòu)成環(huán)境、領(lǐng)屬、類型等關(guān)系。c2 句與其構(gòu)成話頭話身關(guān)系的原因既包括句式的對齊,也包括大小話頭的語義關(guān)系。可見,雖然從傳統(tǒng)的句法分析角度看,定語與中心語是修飾關(guān)系,定語是名詞短語的一個成分,不是句子的直接成分,不影響句子格局,但從話頭話身結(jié)構(gòu)看,定語和中心語在語用上可能是一系列潛在的嵌套的話頭話身關(guān)系。

表6 定中結(jié)構(gòu)的領(lǐng)屬定語充當(dāng)話頭的示例

表7 定中結(jié)構(gòu)的各類型定語充當(dāng)話頭的示例

除了定中結(jié)構(gòu)外,當(dāng)句子主語是主謂結(jié)構(gòu)時,其主語也可能充當(dāng)話頭(如表8)。表8(a)c2 的話頭是主謂賓結(jié)構(gòu)“建設(shè)規(guī)模超過國家財力、物力的可能”,其主語部分“建設(shè)規(guī)?!边€可以獨立做話頭。例如,我們可以根據(jù)句法平行結(jié)構(gòu)的原則追補出以c1“建設(shè)規(guī)?!睘樵掝^(如表8(b)的c3)。

表8 主謂結(jié)構(gòu)的主語充當(dāng)話頭的示例

當(dāng)然,以上的例子只說明存在這樣的現(xiàn)象,并非所有定中結(jié)構(gòu)的定語都能成為話頭。例如描寫性的定語(如“漂亮的女孩”中的“漂亮”)就不能與中心語形成話頭話身關(guān)系,不能被后續(xù)話身說明。

(六)小結(jié)

從上述語義特征可知,在認(rèn)知話頭話身關(guān)系時,首先確認(rèn)造成話頭缺失的原因,如果是核心謂語的主體論元缺失,則要考慮話身與候選話頭的語義搭配;如果標(biāo)點句句首有小話頭,則要考慮候選話頭與句首小話頭的語義關(guān)系;判斷句中,傾向于概念更具體、外延更小的成分為話頭;如果話身標(biāo)點句表達(dá)靜態(tài)描寫,一般是一種解釋說明,傾向于以非句首的成分為話頭;另外,表環(huán)境、領(lǐng)屬、類型的定語和主謂結(jié)構(gòu)的主語也可能成為話頭。

三、影響話頭話身關(guān)系分析的句法因素

這里說的句法因素,主要是指在進(jìn)行標(biāo)點句的話頭話身關(guān)系分析時,能夠從字面識別的,或者經(jīng)過簡單句法分析能夠識別的特征。已發(fā)現(xiàn)的句法特征有關(guān)聯(lián)詞語、平行結(jié)構(gòu)和語篇停頓。這些句法特征一般與語義因素不沖突,主要起到標(biāo)記提示的作用。

(一)關(guān)聯(lián)詞語

關(guān)聯(lián)詞語對話頭話身關(guān)系分析有明顯的提示作用,特別是標(biāo)點句句首有“就”“便”“所以”“但是”等后連詞時,該句傾向于共享前句的主語作話頭(如表9)。表9(a)的c1 主語“王腳”和賓語“兒子王肝和女兒王膽”,在語義上都能與c2“大聲喝斥”搭配,但在于c2 句首存在后連詞“便”,表示c2和c1 是動作的順承,即c2 是動態(tài)描寫。因此,c2 語義指向“王腳”。如果前句有與之搭配的前關(guān)聯(lián)詞,那么這一對關(guān)聯(lián)詞語傾向于對應(yīng)起來。例如表 9(b)的c3 缺話頭,c3 與“你”和“他”在語義上都能夠搭配,不過“雖然”和“但是”組成關(guān)聯(lián)詞對,所以c3 共享“雖然”的話頭“他”。

表9 關(guān)聯(lián)詞語影響話頭話身關(guān)系分析的示例

(二)平行結(jié)構(gòu)

平行結(jié)構(gòu)最早由Frazier①Frazier, Lyn; Taft, Lori; Roeper, Tom; Clifton, Charles, “Parallel Structure: A Source of Facilitation in Sentence Comprehension”, Mem Cognit, 12(5), 1984, pp.421-430.提出,指由兩個或兩個以上相關(guān)聯(lián)的語言單位組成,這些語言單位由連接詞或其他手段連接,具有相同的組成成分,在句子中擔(dān)當(dāng)相同的句法角色。平行結(jié)構(gòu)一般被用于修辭方面的研究,如篇章銜接等。Chambers 等①C. Chambers; R. Smyth, “Structural Parallelism and Discourse Coherence: A Test of Centering Theory”, Journal of Memory Language, vol.39(4) , 1998, pp.593-608(16).把平行結(jié)構(gòu)引入描述篇章回指現(xiàn)象,研究了代詞回指問題,認(rèn)為代詞傾向于回指與其結(jié)構(gòu)平行的先行詞,李榕②李榕:《影響代詞回指的因素分析》,《當(dāng)代語言學(xué)》2012 年第2 期。認(rèn)為平行結(jié)構(gòu)指相接的兩句話宏觀結(jié)構(gòu)一致,而且包含有語義聯(lián)系的謂語。她關(guān)注的也是代詞回指的問題,認(rèn)為如果含代詞的句子和前一句的格式平行,平行結(jié)構(gòu)可以打破主語的優(yōu)先權(quán),影響代詞回指??傮w來說,學(xué)者們對平行結(jié)構(gòu)的定義主要關(guān)注篇章銜接等方面。話頭話身結(jié)構(gòu)的標(biāo)注過程中發(fā)現(xiàn),平行結(jié)構(gòu)對共享話頭的確認(rèn)非常有效(如表10)。表10 都是平行結(jié)構(gòu)組成的話頭話身結(jié)構(gòu)。表10(a)的c1 尾部和c2、c3 對應(yīng)成分都是“互相+行為”;表10(b)的c1~c3 的結(jié)構(gòu)都是“時間副詞+擔(dān)任+隸屬者+職務(wù)”;表10(c)的c2~c4 與c1 尾部都是“向+方向+到達(dá)+處所”結(jié)構(gòu)。當(dāng)然,平行結(jié)構(gòu)也能夠造出反例(如表11(a))。表11(a)c1~c3 雖然句式上構(gòu)成了平行結(jié)構(gòu),但常識上,“小趙”的可能方位只有左右前后上下,如果后面被占據(jù)了,再有“后面”只能是“小錢”的后面。若換成“前、后、左、右”則不一樣,如表11(b)的c2、c3,由于“前、后、左、右”語義不沖突,于是都傾向于共享主語“小趙”。可見話頭識別的影響因素是眾多的。

表10 平行結(jié)構(gòu)影響話頭話身關(guān)系分析的示例

表11 平行結(jié)構(gòu)影響話頭話身關(guān)系分析的正反例對比

(三)語篇停頓(標(biāo)點符號)

語言中停頓的長短代表了人對話頭轉(zhuǎn)換的預(yù)期,停頓長更傾向轉(zhuǎn)換話頭,停頓短更傾向接著原有話頭繼續(xù)說。不同停頓時長落實到文本中,就是不同的標(biāo)點符號。因此,標(biāo)點符號作為話頭話身關(guān)系的標(biāo)記是有一定認(rèn)知理據(jù)的,語料中對話頭話身關(guān)系分析也有一定影響(如表12)。表12 的c3 缺少話頭。從上文看,c1 的“鄉(xiāng)鎮(zhèn)企業(yè)”無論句法上還是語義上都適合充當(dāng)c3 的話頭,但是語感上c3 與c1~c2 并不屬于同一個話頭話身結(jié)構(gòu),c2 的句號起到了一定的提示作用。實際上,c3 是一個主語省略句,在政府工作報告中比較常見。當(dāng)然,標(biāo)點符號僅為一種傾向性提示,句號切分話頭話身結(jié)構(gòu)的平均正確率只有80.77%,③何曉文、羅智勇、胡紫娟、王瑞琦:《基于小句復(fù)合體的句子邊界自動識別研究》,《中文信息學(xué)報》2021 年第5 期。例如,表1 的c5 句就是反例。c5 是句號,但是后句沒有轉(zhuǎn)換話頭,仍以“西藏銀行部門”為話頭。

表12 語篇停頓(標(biāo)點符號)影響話頭話身關(guān)系分析的示例

(四)句法特征判別與語義核查

本節(jié)提到的句法特征,雖然對話頭話身關(guān)系的判別有較高的準(zhǔn)確率,但目前只是局部的特征,尚未形成體系。由于漢語句法形式特征比較缺乏,能夠明確影響話頭話身關(guān)系的句法因素并不多見,所以句法特征對語料覆蓋度不高,多數(shù)情況下需要其他知識輔助判斷。

值得注意的是,基于句法特征進(jìn)行話頭識別后,還需要進(jìn)行語義、語境、常識等多方面知識的核查,才能真正確認(rèn)話頭。人在理解語言時也如此,當(dāng)一句話符合句法、語義、常識等各方面的認(rèn)知,我們才認(rèn)為自己“理解”了這句話。若某個具有特定句法特征的話頭語義不合格,應(yīng)該根據(jù)語義特征重新識別話頭。這是話頭識別過程中的一種“語義核查”機制。

四、影響話頭話身關(guān)系分析的語境因素

大部分標(biāo)點句單看前句可以確定話頭,但仍有極少數(shù)標(biāo)點句,需要看更遠(yuǎn)的上下文才能確認(rèn)(如表13)。表13(a)的c2 句首“下面”是方位詞,意義不自足,需要含有方位特征的名詞作話頭構(gòu)成空間參照關(guān)系。例中可與“下面”形成參照的候選成分有“那張片子”和“‘杜甫’兩字”。這兩個成分無論誰作為c2 的話頭句法語義都是通順的。由于“天頭上”又和“下面”對應(yīng)形成方位的平行結(jié)構(gòu),似乎傾向于以“天頭上”前的“那張片子”作為話頭,即理解為表13(b)。但我們看更遠(yuǎn)的上下文就會發(fā)現(xiàn)(見表13(c)),表 13(a)理解不正確。仔細(xì)揣摩表13(c)的后文發(fā)現(xiàn),“片子”從上到下應(yīng)該是“‘杜甫’兩字”,接著是“標(biāo)題”,接著是正文。所以“下面”并不是指“那張片子”的下面,而是“‘杜甫’兩字”的下面。因此,c2“下面紫墨水寫的標(biāo)題”,其話頭應(yīng)該是“‘杜甫’兩字”。

表13 語境因素影響話頭話身關(guān)系分析的示例

這個例子反映出,句法特征有時候會起反作用,甚至引起誤導(dǎo),下文語境對其進(jìn)行了糾正。語境因素通常以一種“語境核查”的形式起作用。就是說,如果一個話頭符合句法語義,但與語境相沖突,則應(yīng)該重新選擇符合句法語義的其他候選話頭,再進(jìn)行語境核查。

五、影響話頭話身關(guān)系分析的常識因素

有時僅靠句法語義知識仍然難以確認(rèn)標(biāo)點句的話頭是其上下文的哪一成分,還需要用到常識(如表14)。表14(a)“香蕉”比“桃子”容易剝皮是常識,若c2 改成“剝皮真麻煩!”將會理解為對“桃子”的描述,以“桃子”為話頭。表14(b)單從句法語義上看,c2“搶去錢袋”的話頭可以是“他們”也可以是“潰兵”。但“潰兵”更容易讓人與“搶”的施動者聯(lián)系起來,因此以“潰兵”為話頭更合理。即使表14(c)將主語和賓語位置調(diào)換,把“潰兵”作為主語,“搶去方老先生的錢袋”的人仍理解為潰兵??梢姡?dāng)若干候選話頭句法語義都合格而難以選擇時,往往需要常識輔助。同時,常識也會對符合句法語義的話頭進(jìn)行核查,核查不通過可能需要重新選擇其他候選話頭(如表11(a))。但將常識形式化難度很大,人們甚至不清楚自己有多少常識,對語言處理而言是一大挑戰(zhàn)。

表14 常識因素影響話頭話身關(guān)系分析的示例

六、影響話頭話身關(guān)系分析的百科知識

有的情況不僅需要句法語義語用知識和常識,還要調(diào)用百科知識幫助話頭的判斷(如表15)。表15 的c4 的句首是“下葉”,是魚的部件名,意義不自足,需要主體。此時,如果沒有足夠的百科知識,很難判斷“下葉”是“鰺”的部件,還是“尾鰭”的部件。只有我們形成了一個魚類的本體知識集,才知道,“下葉”實際上是魚尾的一部分,所以話頭不是“鰺”,而是先共享c3 的“尾鰭”作直接話頭,再共享“鰺”作間接話頭。在語言計算中,百科知識可以利用知識圖譜等資源進(jìn)行識別。

表15 百科知識影響話頭話身關(guān)系分析的示例

七、話頭話身關(guān)系分析中的知識調(diào)用與互動

上文分析可知,話頭話身關(guān)系分析涉及句法、語義、語境、常識以及百科等知識,是一個復(fù)雜的過程。基于上文分析和語料庫研究,我們對這些影響因素的調(diào)用順序、協(xié)調(diào)和互動過程,進(jìn)行了歸納??偟膩碚f,話頭話身關(guān)系的分析過程中各類知識調(diào)用順序是:句法知識→語義知識→常識/百科知識→語境知識。這些知識的用途主要包括話頭判定和話頭合格性核查。話頭判定指從眾多可能詞語中選擇最合適的話頭,這個操作要反復(fù)比較和篩選,要調(diào)用較多的認(rèn)知資源;話頭合格性核查只要檢查當(dāng)前選中的話頭是否合格,沒有比較和篩選等操作,需要的認(rèn)知資源較少。話頭話身分析所涉及的知識中,句法知識主要用于話頭判定,語境知識主要用于話頭核查,語義、常識/百科知識既用于話頭判定,也用于話頭核查。他們的互動過程如圖1 所示。

圖1 話頭話身分析中各因素的調(diào)用與協(xié)調(diào)

對各知識的調(diào)用與互動過程說明如下:(1)句法知識。話頭識別過程中,首先嘗試根據(jù)句法特征確定話頭。句法特征是語言理解的表層特征,最容易被識別,調(diào)用的認(rèn)知資源最少。如果能夠判定話頭,則再進(jìn)行語義、常識、百科知識、語境的核查。若均核查通過,則表示句法判定的話頭正確;若任何一個環(huán)節(jié)的核查不通過,都將利用語義知識進(jìn)行話頭的重新判定。(2)語義知識。在沒有明顯可用于判定話頭的句法特征下,則根據(jù)語義特征進(jìn)行話頭判定。若語義特征可以判定話頭,則進(jìn)行常識、百科知識和語境的核查;若語義特征無法最終判定話頭,則通過常識、百科知識進(jìn)一步判定。(3)常識、百科知識。若經(jīng)句法特征和語義特征分析后,仍有若干個候選話頭不能唯一確定,則根據(jù)常識和百科知識對若干個符合句法語義的候選話頭進(jìn)行選擇。判定后,再進(jìn)行語境核查。若仍無法判定話頭,則表示上文找不到同時符合句法、語義、常識和百科知識的話頭,此時,該句可能是無主句、省略句或其他等不存在話頭的情況,甚至可能是有誤的句子,這些暫不在本文討論范圍內(nèi)。(4)語境知識。語境知識主要用于對已選話頭進(jìn)行核查,在句法語義常識等特征對話頭判斷失誤的情況下進(jìn)行糾正。

八、結(jié)語

話頭話身結(jié)構(gòu)是組成漢語篇章的基本組織結(jié)構(gòu)。話頭話身結(jié)構(gòu)是由多個標(biāo)點句通過話頭共享而組成的。本文研究話頭話身關(guān)系,補全標(biāo)點句缺失的話頭,正是為了發(fā)現(xiàn)標(biāo)點句間的話頭共享關(guān)系。從語篇研究的角度,這項工作使我們對語篇組織結(jié)構(gòu)有更深刻的認(rèn)識。從語言認(rèn)知的角度,話頭補全的過程涉及的句法、語義、常識、百科知識等影響因素以及它們的互動關(guān)系,是人們理解語言的過程之一,話頭話身關(guān)系研究有利于我們更好探索語言理解過程的奧秘。從語言計算角度,話頭話身關(guān)系研究和話頭補全是語篇自動分析的基礎(chǔ)任務(wù)。只有將話頭補全涉及的影響因素和交互過程形式化,才能構(gòu)建自動計算;也只有清楚每個標(biāo)點句的話頭話身關(guān)系,才能在此基礎(chǔ)上進(jìn)行句間邏輯關(guān)系分析、篇章主旨分析等工作,這是各種基于篇章的語言處理任務(wù)不可逾越的基本步驟。

猜你喜歡
標(biāo)點常識句法
標(biāo)點可有可無嗎
句法與句意(外一篇)
中華詩詞(2021年3期)2021-12-31 08:07:22
《遼史》標(biāo)點辨誤四則
述謂結(jié)構(gòu)與英語句法配置
靠不住的常識
文苑(2020年11期)2020-11-19 11:45:11
小小標(biāo)點真厲害
句法二題
中華詩詞(2018年3期)2018-08-01 06:40:40
詩詞聯(lián)句句法梳理
中華詩詞(2018年11期)2018-03-26 06:41:32
近視600度以上,這5條常識務(wù)必知道
有趣的標(biāo)點
兴和县| 长沙县| 当阳市| 通江县| 卓尼县| 烟台市| 崇仁县| 平陆县| 商洛市| 浦北县| 玉屏| 东兴市| 林甸县| 高雄县| 黄冈市| 东辽县| 淮阳县| 弥渡县| 威宁| 山阳县| 鲜城| 龙胜| 甘谷县| 南皮县| 贡山| 邯郸市| 吴忠市| 潼南县| 阜宁县| 锦州市| 淳化县| 巨野县| 昔阳县| 策勒县| 定远县| 乌拉特前旗| 扎赉特旗| 蒙山县| 米林县| 苗栗县| 塘沽区|