?
基于Tri-Training的事件關(guān)系分類方法研究*
通信地址:215000 江蘇省蘇州市蘇州大學(xué)計算機科學(xué)與技術(shù)學(xué)院Address:School of Computer Science and Technology,Soochow University,Suzhou 215000,Jiangsu,P.R.China
丁思遠,洪宇,朱珊珊,姚建民,朱巧明
(蘇州大學(xué)江蘇省計算機信息處理重點實驗室,江蘇 蘇州 215006)
摘要:事件關(guān)系分類是一項研究事件之間存在何種邏輯關(guān)系的自然語言處理技術(shù)。針對事件關(guān)系分類任務(wù)中訓(xùn)練語料不足的問題,提出了基于Tri-Training的事件關(guān)系分類方法。該方法首先根據(jù)已標注的語料訓(xùn)練三個不同的分類器,以多數(shù)投票的方式從未標注集中抽取置信度較高的樣本對訓(xùn)練集進行擴充,然后利用新的訓(xùn)練集重新訓(xùn)練分類器,反復(fù)迭代,不斷完善分類模型,最終達到提升事件關(guān)系分類性能的目的。實驗結(jié)果表明,以F1值為評價標準,基于Tri-Training的事件關(guān)系分類方法在四大類事件關(guān)系上的分類性能為64.36%。
關(guān)鍵詞:事件關(guān)系;框架語義;半監(jiān)督學(xué)習(xí);Tri-Training
doi:10.3969/j.issn.1007-130X.2015.12.023
中圖分類號:TP391
文獻標志碼:A
基金項目:國家自然科學(xué)基金資助項目(61003152,61272259,61272260)
收稿日期:修回日期:2015-11-03
文章編號:1007-130X(2015)12-2345-07