国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于中心理論和話語結(jié)構(gòu)的交互式問答文本指代消解

2016-05-03 13:01映,孔
中文信息學(xué)報 2016年4期
關(guān)鍵詞:語段指代代詞

李 映,孔 芳

(蘇州大學(xué) 計算機科學(xué)與技術(shù)學(xué)院,江蘇 蘇州 215006)

基于中心理論和話語結(jié)構(gòu)的交互式問答文本指代消解

李 映,孔 芳

(蘇州大學(xué) 計算機科學(xué)與技術(shù)學(xué)院,江蘇 蘇州 215006)

與傳統(tǒng)新聞文本相比,交互式問答中蘊含著更為豐富的語言現(xiàn)象。在傳統(tǒng)的針對新聞文本的指代消解方案的基礎(chǔ)上,融入了交互式問答特有的特征集,給出了一個適于交互式問答文本的指代消解方案。具體而言,基于淺層語義角色分析的結(jié)果進行話語結(jié)構(gòu)的識別,根據(jù)識別出的話語結(jié)構(gòu)進行話語中心及中心跳轉(zhuǎn)的識別。將獲取到的話語中心及跳轉(zhuǎn)信息組織成交互式文本特有的特征集,使用交互式問答領(lǐng)域廣泛使用的TREC2004和TREC2007的評測語料進行指代消解的實驗,結(jié)果表明給出的方案能大大提高交互式問答文本中指代消解的性能,系統(tǒng)F值提高了3.2%。

指代消解;交互式問答;中心理論;話語結(jié)構(gòu)

自動問答(Question Answering)是指在對用戶以自然語言形式提出的問題進行分析、理解的基礎(chǔ)上,借助各類信息檢索技術(shù)給出回答。自動問答給出的答案并非只是相關(guān)文檔,而是以自然語言形式重新組織的文本片段。傳統(tǒng)的問答技術(shù)局限于對單一問題進行回答,因此對問題的理解相對片面,提供的答案的信息量有限,不能滿足用戶了解同一實體或事件多方面復(fù)雜信息的需求。近年來新提出的交互式問答(Interactive Question Answering,IQA)很好地解決了這一問題。用戶提出一系列主題相關(guān)的問題,在綜合分析這些問題的基礎(chǔ)上,交互式問答系統(tǒng)能以對話的形式逐個回答用戶關(guān)于同一實體或事件不同方面的問題[1]。交互式問答作為自動問答的一項重要技術(shù)受到了越來越多的關(guān)注。文本信息檢索會議(TREC)在2004年的QA任務(wù)中開始以系列問題的方式給出問題評測集[2],每個系列針對一個Target(對象),系列問題中的每個問題都與此Target相關(guān),如圖1所示的例子。

交互式問答相關(guān)的應(yīng)用也逐漸進入我們的生活,例如,蘋果公司的siri語音助手、許多領(lǐng)域相關(guān)的自動咨詢機器人等。但至今還沒有能夠通過“圖靈測試”[3]的智能機器人出現(xiàn),其中一個重要的原因是自然語言中存在眾多機器難以理解的語言現(xiàn)象,這些語言現(xiàn)象使得用戶提出的問題很難被機器充分理解,從而給出正確的反饋。在這些語言現(xiàn)象中,指代是最為常見的語言現(xiàn)象之一。對于前文中提及過的語言單位,或是當(dāng)前闡述的中心對象,為了表達的簡潔高效,都會選擇指代詞表示。例如,圖1中,Q2中的“his”和Q3中的“he”都指代Q1中的“Jar Jar Binks”。指代詞可以是代詞,也可以是指示性名詞短語,或是別名形式的其他表述方法。指代現(xiàn)象的存在成為機器流暢理解問題的阻礙,因此需要為篇章中的指代詞找回指代的語言單位,以便機器能更準(zhǔn)確、全面地理解用戶的提問,而為指代詞找回指代的語言單位的過程稱為指代消解。

圖1 系列問題示例

近年來,國內(nèi)外許多學(xué)者對指代消解進行了大量細致的研究,但大部分研究都集中在對新聞文本中指代消解的研究上,對交互式問答中指代消解的研究相對較少。本文考慮交互式問答文本的特點,結(jié)合傳統(tǒng)的針對新聞文本的指代消解解決方案,給出了一個融合中心理論和話語結(jié)構(gòu)的針對交互式問答文本的指代消解解決方案。在交互式問答文本語料(TREC2004和TREC2007的評測語料)上的實驗表明,該方案能大大提高交互式問答文本中指代消解的性能,系統(tǒng)F值提高了3.2%。

本文結(jié)構(gòu)安排如下: 第一部分介紹與本文相關(guān)的工作;第二部分基于傳統(tǒng)的針對新聞文本的指代消解方案給出了一個基準(zhǔn)系統(tǒng);第三部分介紹融入了中心理論和話語結(jié)構(gòu)的指代消解方案;第四部分給出了交互式問答語料上指代消解實驗的結(jié)果及分析;最后總結(jié)全文。

1 相關(guān)工作

本節(jié)分別介紹交互式問答和指代消解領(lǐng)域的相關(guān)研究。

1.1 交互式問答

Chai 等人[4]以及Tsuneaki 等人[5]發(fā)現(xiàn)僅僅一個問題往往滿足不了用戶的需求,通常用戶的問題總是圍繞一個特定的主題,或者是希望解決一個特定的任務(wù),因此他們指出以對話形式獲取的信息比一問一答的形式更加全面和準(zhǔn)確。近年來交互式問答的重要性日益凸顯,相關(guān)的研究也日益豐富。

交互式問答主要是以對話形式解答用戶的一系列問題,而Carbonell 等人[6]和Nils 等人[7]很早就提出,對話領(lǐng)域中頻繁出現(xiàn)的指代和省略是人機對話處理的一大障礙。交互式問答的相關(guān)研究目前主要集中在問題理解方面,主要思想是提取與交互式問答相關(guān)聯(lián)的上下文信息來輔助對問題自身的理解。代表性工作包括: Chai 等人[4]就問題的上下文信息能否對其他相關(guān)問題的理解以及答案的抽取有幫助這一問題展開了研究,提出了適于交互式問答的富語義話語模型,探討了問題中的話語角色和問題間的話語轉(zhuǎn)換等相關(guān)話題。Kirschner 等人[8]則針對問題分類展開,他們給出了一個利用淺層語義進行相似度計算,從而有效確定下一問題所屬類型的方法。Bernardi 等人[9]在Kirschner 等人研究的基礎(chǔ)上進一步探討了深層次的對話和話語結(jié)構(gòu)特征對確定下一問題所屬類型的作用。Wang 等人[10]提出了使用本體與模板方法提取交互式問答中的上下文信息的方案,并在傳統(tǒng)問答系統(tǒng)OTQAs[11]中應(yīng)用這一方案動態(tài)提取上下文信息,構(gòu)造了一個完整的中文交互式問答系統(tǒng)OTCQAs。

本文主要解決影響機器理解問題的指代現(xiàn)象,將在Chai 等人[4]提出的富語義話語模型的基礎(chǔ)上,融合中心理論與話語結(jié)構(gòu),給出一個適于交互式文本中的指代消解的方案。

1.2 指代消解

作為信息抽取的核心組成部分之一,指代消解一直都是自然語言處理領(lǐng)域的研究熱點。早期指代消解方法均采用啟發(fā)式規(guī)則方法,從二十世紀(jì)九十年代開始,隨著各類指代消解標(biāo)注語料的不斷發(fā)布,以及一些有影響力的自然語言處理會議和公開評測的召開,例如,MUC(Message Understanding Conference)、ACE(Automatic Content Extraction)、CoNLL shared task等,指代消解的研究重點也轉(zhuǎn)向了數(shù)據(jù)驅(qū)動的基于機器學(xué)習(xí)的指代消解方法研究。

目前,基于機器學(xué)習(xí)的指代消解研究可以分成四類: 一是基于表述對(mention-mention)的消解方案,基本思想是從文本中提取各種表述,根據(jù)前后關(guān)系兩兩配對,針對配對的兩個表述分別提取各類詞法、語法和語義特征借助機器學(xué)習(xí)方法生成訓(xùn)練模型,測試時仍然針對配對好的兩個表述進行判斷,確認(rèn)它們間是否存在指代關(guān)系,最后根據(jù)指代關(guān)系的傳遞性構(gòu)建生成指代鏈。這種方法的最大優(yōu)勢在于簡單,但僅考慮配對的兩個表述的相關(guān)特征(局部特征)有時是不夠的。代表性工作包括: Soon等人[12],Ng等人[13],Yang等人[14],Kong等人[15]等;二是實體與表述對(entity-mention)的消解方案,基本思想是將已經(jīng)形成的部分指代鏈(實體)與當(dāng)前表述配對,再判別當(dāng)前表述是否屬于這一指代鏈,代表性工作包括: Yang等人[16],Rahman和Ng[17]等;三是實體與實體對(entity-entity)的消解方案,基本思想是借助聚類形成局部的指代鏈片段,再將指代鏈借助合并的方式擴充成完整的指代鏈,代表性工作包括: Stamborg等人[18];四是采用聯(lián)合模型,將指代消解、Entity linking和NER等任務(wù)進行聯(lián)合學(xué)習(xí),代表性工作包括Hajishirzi等人[19]。

目前大部分指代消解研究都集中在新聞?wù)Z料上,針對交互式問答文本的指代消解研究極少,代表性工作包括張超等人[20]。本文主要針對交互式文本中的指代現(xiàn)象,以中心理論為基礎(chǔ),結(jié)合話語結(jié)構(gòu),利用話語結(jié)構(gòu)獲取問題句中的優(yōu)選中心,再結(jié)合話語結(jié)構(gòu)中話語轉(zhuǎn)換信息確定句子間的跳轉(zhuǎn)關(guān)系,最終提出并實現(xiàn)了一個針對交互式問答文本的指代消解方法。

2 基準(zhǔn)系統(tǒng)

與目前大多數(shù)指代消解研究類似,我們使用Soon等人[21]提出的基于機器學(xué)習(xí)的指代消解平臺作為實驗的基準(zhǔn)系統(tǒng),它的基本構(gòu)成如圖2所示。我們選取Soon等人提出的12個基本特征來構(gòu)建指代消解基準(zhǔn)平臺,而待消解項識別模塊則采用了孔芳等人[21]給出的平面特征集構(gòu)建。限于篇幅,特征集請參見相關(guān)論文。

圖2 基于機器學(xué)習(xí)的指代消解平臺

3 應(yīng)用中心理論和話語結(jié)構(gòu)的交互式問答文本指代消解

相關(guān)研究工作表明合理應(yīng)用中心理論可以進一步提升指代消解的性能。另一方面,話語結(jié)構(gòu)與交互式問答間關(guān)系密切,交互過程中話語的焦點(即中心)及其跳轉(zhuǎn)、延續(xù)都將影響交互式問答中指代消解的性能。本節(jié)將針對交互式問答文本給出一個基于中心理論和話語結(jié)構(gòu)的指代消解方案。

3.1 背景知識

3.1.1 中心理論

中心理論是計算語言學(xué)中的一個理論模型,它主要分析了代詞在語篇中的分布規(guī)律,以及影響代詞實現(xiàn)的各種條件。中心理論詳細、全面地論述了代詞是如何促進語篇連貫的[22],它指出語段中出現(xiàn)的所有話語實體都是語篇的中心,這些中心在前后語段中的突顯程度以及它們的語言實現(xiàn)形式都會影響到語篇的連貫性。語篇是以中心為基礎(chǔ)連接前后語段的,每一語段都有三種中心。

1) 潛在中心(forward-looking center, Cf): 是指一個語段可能存在的會話焦點,它提供了與后繼語段聯(lián)系的紐帶,包括一系列的對象,這些對象按照在注意狀態(tài)中突顯度的不同形成一定的等級排列。

2) 現(xiàn)實中心(back-looking center, Cb): 是指一個語段的當(dāng)前會話焦點,它只包含一個對象,負(fù)責(zé)與先前語段建立聯(lián)系,即前一語段的若干Cf中,突顯度最高的一個對象就是本句的Cb。

3) 優(yōu)選中心(preferred center,Cp): 是指潛在中心中突顯度最高的那個對象。

在語段中區(qū)分出潛在中心、現(xiàn)實中心和優(yōu)選中心的目的是為了說明各語段之間的連貫性。中心理論根據(jù)前后兩個語段(分別設(shè)為Un-1和Un)的三種中心的變化情況定義了四種前后語段的跳轉(zhuǎn)類型,具體如表1所示。

表 1 中心理論的跳轉(zhuǎn)類型

這四種跳轉(zhuǎn)類型代表了前后兩個語段間的連貫程度,顯然語段連貫性由高到低的順序為: Continue>Retain>Smooth Shift>Rough Shift。

在上述語段中心和跳轉(zhuǎn)類型的基礎(chǔ)上,中心理論進一步給出了一些規(guī)則和約束來描述篇章中代詞的分布規(guī)律,表2給出了這些規(guī)則和約束??偨Y(jié)上述中心理論的規(guī)則和約束,孔芳等人[15]提出了如下結(jié)論。

表2 中心理論的約束和規(guī)則

1) 中心理論是與上下文相關(guān)的,中心是上下文的構(gòu)成要素,是一個語義層的概念。

2) 前一語段的Cf中突顯度最高的一個對象就是本語段的Cb。Grosz等人[23]進一步研究發(fā)現(xiàn),語段中Cb是不受出現(xiàn)的先后次序、語法角色以及實施/受施等語義角色影響的。但位置以及語法角色等要素會影響Cf中各對象的突顯度,其中語法角色是確定Cf中各對象突顯度的關(guān)鍵要素之一。英語中Cf中各對象的突顯度按照語法角色排列順序為: 主語>賓語>其他。

3) 當(dāng)本語段包含其它代詞時,Cb必須以代詞的形式來表示,否則會造成這一語段閱讀時間的增加。

4) 各語段間頻繁發(fā)生硬轉(zhuǎn)(Rough Shift)將會影響文章內(nèi)容的連貫性。為了保持文章內(nèi)容的連貫性,文章的作者必然會制定寫作計劃,減少焦點的切換次數(shù)。

中心理論是一個通用的語言學(xué)模型,并沒有針對對話的特點展開討論,因此各種中心的識別是非常困難的。本文在交互式對話這一背景下展開討論,與對話中的話語結(jié)構(gòu)相結(jié)合,在中心的識別上更容易實現(xiàn)。

3.1.2 話語結(jié)構(gòu)

現(xiàn)實生活中,人們通常會借助一系列連續(xù)、相關(guān)的提問來獲取某一感興趣事物的多方面的詳細信息。Chai等人[4]指出要將所有相關(guān)問題聯(lián)系起來,每一個問題和答案在整個問題集中的話語狀態(tài)是一個重要信息。他指出話語狀態(tài)包括兩部分: 話語角色和話語轉(zhuǎn)換。

在交互式問答中,每一個問題都有一個上下文情境。句子中的實體除了帶有一定的語義信息,還常常帶有句子的話語角色信息。實體能夠表示兩種不同的話語角色: 主題(Topic)和中心(Focus)。主題代表著一個問題所談?wù)摰氖挛?,而中心則是所談?wù)撝黝}的一個方面。

話語轉(zhuǎn)換預(yù)示著話語角色如何從一個問題到另一個問題間進行轉(zhuǎn)變以及這種轉(zhuǎn)變是如何反映了用戶信息的需求。在交互式問答里,一個問題向另一個問題的轉(zhuǎn)換過程中包含了許多上下文信息,這些信息可以用來處理問題和獲取答案。問題的內(nèi)容主要是圍繞著問題的主題進行,主題如何演化與問題間如何關(guān)聯(lián)關(guān)系密切。因此圍繞問題的主題,可以把話語的轉(zhuǎn)換分為以下三類。

(1) 主題的延伸: 下一問題的主題與前一問題相同,但參與者或某些方面略有不同;

(2) 主題的擴展: 前后問題的主題相同,但兩個問題的中心不同;

(3) 主題的轉(zhuǎn)移: 前后問題討論了不同的主題。

3.2 中心理論與話語結(jié)構(gòu)的結(jié)合

本節(jié)首先給出話語結(jié)構(gòu)的識別方法,在此基礎(chǔ)上介紹了基于話語結(jié)構(gòu)的語段中心及其跳轉(zhuǎn)類型的識別方法,并基于此進一步提出與中心和話語結(jié)構(gòu)相關(guān)的新特征集,并將其應(yīng)用于交互式問答文本的指代消解。

3.2.1 話語結(jié)構(gòu)的識別

獲取話語結(jié)構(gòu)信息是一項比較困難的任務(wù),由于話語結(jié)構(gòu)語料的匱乏,無法采用直接的有監(jiān)督的機器學(xué)習(xí)方法。近年來淺層語義分析取得了長足的發(fā)展,語義角色標(biāo)注(SRL,Semantic Role Labeling)性能不斷提升,特別是英文的SRL系統(tǒng)已進入了可應(yīng)用階段。本文采用Gildea和Surdeanu[24]等人提出的問句中語義角色識別方法進行交互式問答文本中問題句的語義角色標(biāo)注,并基于話語角色和語義角色間的映射關(guān)系獲取話語角色信息,再根據(jù)前后問題中話語角色信息自動標(biāo)注話語轉(zhuǎn)換的具體類別。

3.2.2 基于話語結(jié)構(gòu)的中心識別

就英文而言,中心理論中指出語段中各對象突顯性按照語法角色排序為: 主語>賓語>其他。但語法與語義間仍然存在一定的分歧,不同的時態(tài),不同的表述方法使得當(dāng)前的話語中心并不一定充當(dāng)主語?;谠捳Z結(jié)構(gòu)的中心識別方法的基本思想是,從語義視角獲取中心,無法確定再由傳統(tǒng)的語法角色排序決定。

在話語結(jié)構(gòu)中主題是指當(dāng)前問題的討論范圍,而中心是主題中特定的一部分,是指主題中當(dāng)前問題最關(guān)心的一方面。主題和中心與句子的語義信息密切相關(guān)。其中,主題可以是實體(Entity)或活動(Activity)。當(dāng)主題為實體時,該實體即為當(dāng)前問題討論的中心,就可以認(rèn)為該實體就是當(dāng)前語段的Cp;而當(dāng)主題為活動時,活動參與者的突顯性應(yīng)該高于語段中的其他實體,因此接著考察話語中心,如果中心是某一個主題(活動)的參與者時,則認(rèn)為此參與者實體是當(dāng)前語段中突顯度最高的,即為本語段的Cp;當(dāng)主題是一個活動,并且話語中心也不是主題參與者實體時,即無法從語義視角確定Cp,則按照傳統(tǒng)的語法角色排序決定。Cp確定后,根據(jù)中心理論的定義可以很方便的得到下一語段的Cb。結(jié)合話語結(jié)構(gòu),我們得到了圖4所示的語段中心的識別方法。

圖4 基于話語結(jié)構(gòu)的中心識別方法

3.2.3 基于話語結(jié)構(gòu)的中心跳轉(zhuǎn)識別

在識別出問題句中Cp和Cb后便可進一步識別出語段跳轉(zhuǎn)關(guān)系。另一方面,話語結(jié)構(gòu)中的話語轉(zhuǎn)換從語義的視角描述了話語角色中主題和中心的轉(zhuǎn)換關(guān)系。前一小節(jié)我們討論了基于話語結(jié)構(gòu)的中心識別方法,本節(jié)我們將進一步考慮在話語結(jié)構(gòu)的基礎(chǔ)上如何更有效地進行語段中心跳轉(zhuǎn)類型的識別。

針對3.1.2節(jié)介紹的三種話語轉(zhuǎn)換,我們分別給出了相應(yīng)的語段跳轉(zhuǎn)類型識別方法。

1) 話題的延伸: 表示下一個問題的主題與上一問題的主題相同,但參與者或某些約束不同,可將其細分為約束變化和參與者轉(zhuǎn)移。如果主題為實體,由3.2.1節(jié)給出的中心識別方法可知它是當(dāng)前語段的 Cp,且與上一語段的 Cp相同,即 Cb(Un) =Cp(Un),由此可以確定語段的跳轉(zhuǎn)關(guān)系為延續(xù)或順轉(zhuǎn);如果主題是活動,則進一步區(qū)分: (1)約束變化: 指對主題的約束條件有變化,并不帶來主題的參與者的變化,因此Cb(Un) = Cp(Un);(2)參與者轉(zhuǎn)移: 若當(dāng)前話語中心是參與者,那么Cb(Un) ≠Cp(Un)。此外的其他情況我們均認(rèn)為在話語轉(zhuǎn)換過程中,語段各實體的突顯度變化很小,語段的中心未發(fā)生變化,即Cb(Un)=Cp(Un)。

2) 話題的擴展: 表示兩個相連的問題有著相同的主題,但兩者的中心不同。與話題延伸關(guān)系類似,因為前后問題有相同的主題,如果主題是一個實體,便可得到 Cb(Un)=Cp(Un),由此可以確定跳轉(zhuǎn)關(guān)系為延續(xù)或順轉(zhuǎn)。如果兩個語段的Cp都是話語中心,或者兩個語段的Cp只有一個是話語中心,因為中心發(fā)生了變化,可以得到 Cb(Un)≠Cp(Un)。此外我們都認(rèn)為語段中心沒有發(fā)生變化。

3) 話題的轉(zhuǎn)移: 表示兩個相連問題的主題不同,問句關(guān)注的內(nèi)容有了較大的變化??梢詫⒃掝}轉(zhuǎn)移細分成三類: (1)一個活動主題轉(zhuǎn)移為另一個活動主題: 話語中心都是這兩個活動的參與者,那么,如果話語中心沒有變化,為同一個參與者,則可認(rèn)為 Cb(Un) = Cp(Un);如果話語中心變化,則認(rèn)為 Cb(Un)≠Cp(Un);(2)活動主題與實體主題之間的轉(zhuǎn)移: 此時考慮活動主題中的參與者中心是否為另一實體主題,如果是則認(rèn)為Cb(Un) = Cp(Un),否則Cb(Un)≠Cp(Un) 。

根據(jù)Cb(Un)和Cp(Un)的關(guān)系,以及Cb(Un)和Cb(Un-1)的關(guān)系,我們就能進一步識別中語段中心的跳轉(zhuǎn)情況。

3.2.4 與中心和話語結(jié)構(gòu)相關(guān)的新特征集

結(jié)合中心理論和話語結(jié)構(gòu)確定語段的中心及其跳轉(zhuǎn),話語的主題和中心,以及話語的跳轉(zhuǎn)后,我們提取了如表3所示的與中心和話語結(jié)構(gòu)相關(guān)的新特征集,并將它們應(yīng)用于基準(zhǔn)平臺。從表3給出的新特征集我們可以看到,新特征主要描述了四個方面的信息。

1) 照應(yīng)語和先行語候選所在問題在整個系列問題集中所處的物理位置(特征1),不同位置的問題所含的已知/未知的信息量是不一樣的;

2) 照應(yīng)語和先行語候選的話語角色信息(特征2~4)和語段中心信息(特征5);

3) 照應(yīng)語和先行語候選所在語段間的跳轉(zhuǎn)關(guān)系(特征6)和話語轉(zhuǎn)換關(guān)系(特征7);

4) 照應(yīng)語和先行語候選間包含的其他語段間的語段跳轉(zhuǎn)和話語轉(zhuǎn)換關(guān)系(特征8~9)。

表3 中心及話語結(jié)構(gòu)相關(guān)的特征集

4 實驗及分析

4.1 實驗設(shè)置

本文采用TREC2004至TREC2007的QA評測任務(wù)的問題集作為實驗語料,共計286個問題集1 962個問題,其中每個系列問題都標(biāo)注了問題的主題(target)。參考傳統(tǒng)的新聞類指代消解語料的標(biāo)注方案,我們在此語料上增加了指代信息的標(biāo)注,最終的標(biāo)注結(jié)果如表4所示,從中可以看到,代詞所占比重最大,約為53.48%,有定名詞也占據(jù)相當(dāng)比重,約為31.97%,專有名詞約占13.43%。由于語料規(guī)模較小,后續(xù)實驗均采用五倍交叉驗證,機器學(xué)習(xí) 算法使用SVM-Light工具中的徑向基(RBF)核

表 4 語料中指代關(guān)系的各類別分布

函數(shù)進行,所有參數(shù)均使用默認(rèn)值。實驗結(jié)果采用Precision、Recall和F1-score進行評測。

表5給出了基準(zhǔn)系統(tǒng)在新聞類語料(ACE2003 NWIR)和交互式問答語料上的性能,我們可以看到,就系統(tǒng)總體性能的F1值而言,基準(zhǔn)系統(tǒng)在新聞?wù)Z料和交互式語料上的結(jié)果相差不大。但在交互式文本上占比重最大的代詞的消解性能偏低,特別是召回率,僅為23.8%,說明交互式文本中的代詞與新聞文本中的代詞使用上有較大差異。

需要特別說明的是,中心理論和話語結(jié)構(gòu)并不僅僅針對交互式文本,新聞類文本中也存在中心、話語角色以及話語轉(zhuǎn)換等概念,但與交互式文本不同,新聞類文本中不存在話語的分割(即utterance的概念),而新聞類文本中話語自動分割的規(guī)范不統(tǒng)一,其性能也未達到服務(wù)于其他應(yīng)用的程度。因此本文后續(xù)的實驗僅針對交互式文本展開。

表6給出了應(yīng)用中心理論和話語結(jié)構(gòu)改進的指代消解系統(tǒng)在交互式問答語料上的性能,從中我們可以看到,提出的中心理論及話語結(jié)構(gòu)相關(guān)的新特征能改進指代消解在交互式語料上的性能。

表 6 基于中心理論和話語結(jié)構(gòu)的指代消解系統(tǒng)在交互式問答語料上的性能

類別P/%R/%F1+話語角色相關(guān)特征代詞79.640.653.7有定名詞55.354.354.8專有名詞53.160.656.6總體性能51.267.958.4+話語轉(zhuǎn)換相關(guān)特征代詞79.640.653.7有定名詞57.553.755.6專有名詞54.263.358.4總體性能53.569.360.4

1) 相比基準(zhǔn)系統(tǒng),話語角色相關(guān)特征的引入提高了對所有類別的消解項的消解性能,其中對代詞的貢獻度最為明顯。

2) 引入話語角色相關(guān)特征的基礎(chǔ)上,再加入話語轉(zhuǎn)換相關(guān)特征,從表6可以看到,代詞消解的性能維持不變,有定名詞、專有名詞消解的性能有了一定的提升,最終系統(tǒng)的總體F1值提升了約2%。

3) 相比基準(zhǔn)系統(tǒng),加入所有與中心理論和話語結(jié)構(gòu)相關(guān)的新特征后,系統(tǒng)對各類別的消解性能均有不同程度的提高,總體性能的各項指標(biāo)都有所上升,準(zhǔn)確率上升了3.4%,召回率上升了2.8%,F(xiàn)1值提高了3.2%。

4) 相比基準(zhǔn)系統(tǒng),新加入的特征對交互式文本中比重最大的代詞的消解,貢獻度最大。召回率提高了近17%,準(zhǔn)確率下降了約10.6%,F(xiàn)1值提高了16%。但40.6%的召回率仍然不太理想,還有待進一步的提高。

5 結(jié)論

本文給出了一個結(jié)合中心理論和話語結(jié)構(gòu)的針對交互式問答文本的指代消解方法。首先介紹了基于語義角色和話語角色映射關(guān)系的話語結(jié)構(gòu)識別方法,接著給出了基于話語結(jié)構(gòu)的語段中心及語段跳轉(zhuǎn)關(guān)系識別方法,并基于此提出了與中心理論和話語結(jié)構(gòu)相關(guān)的新特征集。交互式問答文本上指代消解的實驗結(jié)果表明,新提出的特征集能夠提升指代消解的性能,特別是代詞消解的性能。

不過中心理論和話語結(jié)構(gòu)都更關(guān)注文本的局部信息,如何更好的結(jié)合交互式文本的全局信息將是進一步的工作。此外,交互式問答文本中的答案對后續(xù)問題的主題、中心的轉(zhuǎn)換也起著很重要的作用,如何在指代消解系統(tǒng)中考慮問題的回答也是未來的工作方向。

[1] Nick Webb. Introduction of Interactive Question Answering Workshop[C]//Proceedings of the Interactive Question Answering Workshop at HLT-NAACL, 2006.

[2] Ellen M Voorhees. Overview of the TREC 2007 Question Answering Track[C]//Proceedings of the TREC, 2007.

[3] Alan M Turing. Computing Machinery and Intelligence[J]. Mind, 1950: 433-460.

[4] Joyce Y Chai, Rong Jin. Discourse structure for context question answering[C]//Proceedings of the Workshop on Pragmatics of Question Answering, HLT-NAACL, 2004: 23-30.

[5] Tsuneaki Kato, Fumito Masui Jun’ichi Fukumoto, Noriko Kando. Handling information access dialogue through QA technologies—A novel challenge for opendomain question answering[C]//Proceedings of the HLT-NAACL 2004 Workshop on Pragmatics of Question Answering, 2004: 70-77.

[6] Jaime G Carbonell. Discourse pragmatics and ellipsis resolution in task-oriented natural language interfaces[C]//Proceedings of the 21st Annual Meeting on Association for Computational Linguistics, 1983: 164-168.

[7] Nils Dahlback, Arne Jonsson. Empirical studies of discourse representations for natural language interfaces[C]//Proceedings of the fourth conference on European chapter of the Association for Computational Linguistics, 1989: 291-298.

[8] Manuel Kirschner, Raffaella Bernardi, Marco Baroni, et al. Analyzing interactive qa dialogues using logistic regression models[C]//Proceedings of the AI* IA :Emergent Perspectives in Artificial Intelligence, 2009:334-344.

[9] Raffaella Bernardi, Manuel Kirschner, Zorana Ratkovic. Context Fusion: The Role of Discourse Structure and Centering Theory[C]//Proceedings of the LREC, 2010.

[10] D S Wang. Answering contextual questions based on ontologies and question templates[J]. Frontiers of Computer Science in China, 2011, 5(4): 405-418.

[11] D S Wang. A domain-specific question answering system based on ontology and question templates[C]//Proceedings of the Software Engineering Artificial Intelligence Networking and Parallel/Distributed Computing (SNPD), 2010 11th ACIS International Conference on, 2010: 151-156.

[12] Soon W M, Ng H T, Lim D C Y. A machine learning approach tocoreference resolution of noun phrases[J]. Computational Linguistics, 2001,27(4):521-544.

[13] Ng V,Cardie C. Improving machine learning approaches to coreference resolution[C]//Proceedings of the ACL 2002. 104-111.

[14] Yang X F, Zhou G D, Su J, et al.Coreference resolution using competition learning approach[C]//Proceedings of the ACL 2003. 177-184.

[15] Kong F, Zhou G D, Zhu Q M. Employing the centering theory in pronoun resolution from the semantic perspective[C]//Proceedings of the EMNLP 2009. 2009. 987-996.

[16] Yang X F, Su J, Tan C L. A twin-candidate model for learning-based anaphora resolution[J]. Computational Linguistics, 2008,34(3): 327-356.

[17] Altaf Rahman, Vincent Ng. Coreference Resolution with World Knowledge[C]//Proceedings of the ACL 2011: 814-824.

[18] Stamborg M, Medved D, Exner P, et al. Using syntactic dependencies to solve coreferences[C]//Proceedings of the Joint Conference on EMNLP and CoNLL-Shared Task, 2012.

[19] Hannaneh Hajishirzi, Leila Zilles, Daniel S. Weld,et al. Joint Coreference Resolution and Named-Entity Linking with Multi-Pass Sieves[C]//Proceedings of the EMNLP 2013: 289-299.

[20] 張超,孔芳,周國棟. 交互式問答系統(tǒng)中待消解項的識別方法研究[J]. 中文信息學(xué)報. 2014:4(28):111-116.

[21] 孔芳, 朱巧明, 周國棟. 中英文指代消解中待消解項識別的研究[J]. 計算機研究與發(fā)展. 2012.49(5):1072-1085.

[22] Peter C Gordon, Barbara J Grosz, Laura AGilliom. Pronouns, names, and the centering of attention in discourse[J]. Cognitive science, 1993, 17(3): 311-347.

[23] Barbara J Grosz, Scott Weinstein, Aravind K Joshi. Centering: A framework for modeling the local coherence of discourse[J]. Computational linguistics, 1995,21(2): 203-225.

[24] Daniel Gildea, Daniel Jurafsky. Automatic labeling of semantic roles[J]. Computational linguistics,2002,28(3): 245-288.

[25] Hobbs J R. Resolving pronoun references[J]. Lingua. 1978,44(4): 311-38.

[26] Brennan S E, Friedman M W, Pollard C J. A centering approach to pronouns[C]//Proceedings of the 25th annual meeting on Association for Computational Linguistics; 1987: Association for Computational Linguistics; 1987: 155-62.

[27] Strube M. Never look back: An alternative to centering[C]//Proceedings of the 17th international conference on Computational linguistics-Volume 2; 1998.

[28] Tetreault J R. Analysis of syntax-based pronoun resolution methods[C]//Proceedings of the 37th annual meeting of the Association for Computational Linguistics on Computational Linguistics; 1999.

[29] Ng V. Semantic class induction andcoreference resolution[C]//Proceedings of the ACL 2007: 536-543.

[30] 孔芳, 周國棟. 基于樹核函數(shù)的中英文代詞消解研究. 軟件學(xué)報[J], 2012.23(5):1085-1099.

Centering Theory and Discourse Structure Based Approach toCoreference Resolution for Interactive Question Answering Text

LI Ying, KONG Fang

(School of Computer Science and Technology, Soochow University, Suzhou, Jiangsu 215006,China)

The interactive question answering texts is rich in linguistic phenomena. Taking this a advantage, a novel coreference resolution approach for interactive question answering text is proposed. On basis of shallow sematic role analysis, the discourse structure is identified, upon which the preferred center and types center shift are further identified. These form a new feature set related to centering theory and discourse structure. Experiments on TREC2004 to TREC2007 corpora show that the proposed approach can significantly improve the performance of coreference resolution about 3.2% in F-measure for interactive question answering texts.

coreference resolution; interactive question answering; centering theory; discourse structure

李映(1976—),碩士,實驗師,主要研究領(lǐng)域為中文信息處理。E-mail:liy@suda.edu.cn孔芳(1977—),博士,副教授,主要研究領(lǐng)域為機器學(xué)習(xí),自然語言處理,篇章分析。E-mail:kongfang@suda.edu.cn

1003-0077(2016)04-0090-08

2014-06-25 定稿日期: 2015-03-09

國家自然科學(xué)基金(61333018,61331011);國家自然科學(xué)基金(61273320,61472264)

TP391

A

猜你喜歡
語段指代代詞
奧卡姆和布列丹對指代劃分的比較
代詞(一)
代詞(二)
基于語段加標(biāo)推導(dǎo)和特征核查的TCG分析及接口區(qū)分條件
The Ways of Leading a Healthy Life
【重點】語言文字運用:語段壓縮
這樣將代詞考分收入囊中
基于深度學(xué)習(xí)的維吾爾語名詞短語指代消解
不同語段理論之比較
如何壓縮新聞?wù)Z段
英德市| 宁南县| 长治市| 扬州市| 佛学| 获嘉县| 镇雄县| 新巴尔虎右旗| 察雅县| 临城县| 江源县| 平潭县| 六枝特区| 阜康市| 博野县| 城市| 礼泉县| 石阡县| 萍乡市| 五原县| 同心县| 临城县| 平果县| 昆山市| 敦煌市| 黄浦区| 都安| 洪泽县| 永福县| 邳州市| 蕲春县| 神木县| 南陵县| 泰安市| 双柏县| 鄂托克前旗| 东城区| 天长市| 长治县| 石屏县| 郓城县|