楊攀 桂小林 田豐 王剛
摘要:針對(duì)基于關(guān)鍵詞元的話題內(nèi)事件檢測(cè)算法運(yùn)行效率不高、不適合進(jìn)行大規(guī)模文本話題檢測(cè)的問(wèn)題,提出了一種高效的關(guān)鍵詞元聚類算法,該算法在進(jìn)行詞元簇選擇時(shí),為簇問(wèn)相似度分配權(quán)值,并借鑒正態(tài)分布函數(shù)評(píng)估詞元簇的個(gè)數(shù),提高詞元簇的選擇精度,從而減少所需的詞元聚類次數(shù),實(shí)驗(yàn)結(jié)果表明,將改進(jìn)的方法應(yīng)用到輿情監(jiān)控的話題檢測(cè)中,能在不影響檢測(cè)精度的前提下有效地提高算法的運(yùn)行效率。