伍大勇 劉挺
摘要: 提出了一種弱指導(dǎo)的方法從搜索引擎查詢?nèi)罩局型诰蛎麑?shí)體。該方法中采用人工選擇的少量命名實(shí)體名稱作為種子,使用隨機(jī)游走模型從查詢?nèi)罩局蝎@得大量的命名實(shí)體。其中采用了查詢?nèi)罩局械膶?shí)體上下文模板,用戶點(diǎn)擊URL和候選命名實(shí)體構(gòu)建三分圖,根據(jù)在該圖上的隨機(jī)游走計(jì)算候選命名實(shí)體屬于指定目標(biāo)實(shí)體類別的概率,從而在查詢?nèi)罩局蝎@取該類別的命名實(shí)體。在真實(shí)的查詢?nèi)罩旧蠈?duì)7個(gè)實(shí)體類別進(jìn)行的實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果顯示本文方法在各個(gè)類別上均獲得較好的命名實(shí)體挖掘效果。
關(guān)鍵詞:
中圖分類號(hào):TP391.3文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):2095-2163(2012)04-0022-06