殷復(fù)蓮 張曉宇 馮晴 王思佳
摘要:針對互聯(lián)網(wǎng),尤其是微博平臺中大學(xué)生用戶的海量文本,應(yīng)用貝葉斯網(wǎng)絡(luò)分類器對微博評論進行分類?;谪惾~斯,通過先驗概率和似然度求出后驗概率的原理,針對具體事件選擇不同的訓(xùn)練集和調(diào)整特征詞庫,得到大學(xué)生對熱點事件關(guān)注相較于整體網(wǎng)民更加理性、冷靜的結(jié)論,可為研究大學(xué)生心理健康及大學(xué)生輿情提供參考。
關(guān)鍵詞:貝葉斯分類;文本分類;文本分詞;概率估測;大學(xué)生;熱點事件
DOIDOI:10.11907/rjdk.161251
中圖分類號:TP319文獻標(biāo)識碼:A文章編號:1672-7800(2016)006-0112-03
參考文獻:
[1]中國互聯(lián)網(wǎng)絡(luò)信息中心.第36次中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計報告[R].北京:中國互聯(lián)網(wǎng)絡(luò)信息中心.2015.
[2]吳保來.基于互聯(lián)網(wǎng)的社交網(wǎng)絡(luò)研究[D].北京:中共中央黨校,2013.
[3]田野.基于微博平臺的事件趨勢分析及預(yù)測研究[D]武漢:武漢大學(xué),2012.
[4]李榮陸.文本分類及其相關(guān)技術(shù)研究[D]上海:復(fù)旦大學(xué),2005.
[5]許林杰.中文文本分詞研究[D]濟南:山東師范大學(xué),2003.
[6]李原.中文文本分類中分詞和特征選擇方法研究[D]長春:吉林大學(xué),2011.
[7]蔣良孝.樸素貝葉斯分類器及其改進算法研究[D]北京:中國地質(zhì)大學(xué),2009.
[8]馮永,李華,鐘將等.基于自適應(yīng)中文分詞和近似SVM的文本分類算法[J].計算機科學(xué),2010,37(1):251-252.