国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于知識圖譜的抗疫意見領(lǐng)袖熱點(diǎn)話題檢測與分析

2020-12-01 03:15任東亮林紹福黃鴻發(fā)付鈺
軟件導(dǎo)刊 2020年10期
關(guān)鍵詞:意見領(lǐng)袖新冠疫情知識圖譜

任東亮 林紹福 黃鴻發(fā) 付鈺

摘 要:新型冠狀病毒(COVID-19)疫情爆發(fā)期間,涌現(xiàn)出了眾多的抗疫意見領(lǐng)袖。通過對意見領(lǐng)袖話題傳播和演化進(jìn)行分析研究,可以為網(wǎng)絡(luò)輿情治理和疫情防控提供理論和知識支撐。采用N-Gram語言模型和Shingling相似度算法相結(jié)合的方式進(jìn)行話題檢測,再通過Neo4j圖數(shù)據(jù)庫存儲與檢索意見領(lǐng)袖、話題、事件等多維實(shí)體特征,構(gòu)建以意見領(lǐng)袖為核心的話題圖譜。實(shí)驗(yàn)結(jié)果表明,話題準(zhǔn)確率達(dá)82.3%,召回率達(dá)81.6%,與傳統(tǒng)Single-Pass聚類相似度算法相比均有所提高。通過對圖譜分析,能夠簡單直觀地展示出不同實(shí)體間多維輿情關(guān)系。同時,可以提高檢索速度和分析效率,符合輿情傳播客觀規(guī)律。

關(guān)鍵詞:新冠疫情;意見領(lǐng)袖;網(wǎng)絡(luò)輿情;知識圖譜;話題分析

DOI:10. 11907/rjdk. 201625

中圖分類號:TP301 文獻(xiàn)標(biāo)識碼:A 文章編號:1672-7800(2020)010-0020-05

Abstract:Many anti-epidemic opinion leaders emerged during the outbreak of COVID-19 period. Through the analysis and research on the topic dissemination and evolution of opinion leaders,it can provide theoretical and knowledge support for network public opinion governance and epidemic prevention and control. This paper first uses the combination of N-Gram language model and shingling similarity algorithm for topic detection. Then by storing and retrieving the multi-dimensional entity characteristics such as opinion leaders, topics, events and so on, Neo4j graph database is used to build topic graph with opinion leaders as the core. The results show that topic accuracy reaches 82.3% and recall rate 81.6%, which are improved compared with the traditional Single-Pass clustering similarity algorithm.Through the analysis of the Graph, the multidimensional public opinion relationship between different entities can be displayed simply and intuitively.At the same time, it can improve the retrieval speed and analysis efficiency, and conform to the objective law of public opinion dissemination.

Key Words: COVID-19 epidemic; opinion leader; network public opinion; knowledge graph; topic analysis

0 引言

抗疫意見領(lǐng)袖是指在疫情中作出貢獻(xiàn),并且在社交媒體平臺上能夠因傳播信息和表達(dá)意見而影響多數(shù)人態(tài)度傾向的公眾人物。他們通過積極制造或參與話題,引起網(wǎng)友的關(guān)注和討論,從而產(chǎn)生較大影響力[1]。新型冠狀病毒 (Corona Virus Disease 2019,COVID-19)疫情爆發(fā)并迅速蔓延,在這一突發(fā)公共衛(wèi)生事件背景下,涌現(xiàn)出了眾多的抗疫意見領(lǐng)袖,如鐘南山、馬云、韓紅等。他們發(fā)表的觀點(diǎn)具有強(qiáng)大的輿論號召力,他們本人也成為此次疫情事件中的意見領(lǐng)袖。在微博平臺上,網(wǎng)民們對意見領(lǐng)袖的話題及相關(guān)熱點(diǎn)事件發(fā)表自己的意見和看法,從而產(chǎn)生海量的文本信息。從這些文本信息中進(jìn)行話題挖掘抽取,可以了解網(wǎng)民對突發(fā)公共衛(wèi)生事件的觀點(diǎn),探索事件發(fā)展全過程的輿情演變規(guī)律。充分利用文本信息、發(fā)揮網(wǎng)絡(luò)平臺民意采集作用,可以預(yù)測突發(fā)公共衛(wèi)生事件宏觀發(fā)展走向,對協(xié)助網(wǎng)絡(luò)輿情引導(dǎo)具有重要意義[2]。

在大數(shù)據(jù)環(huán)境下,傳統(tǒng)話題分析技術(shù)的應(yīng)用遠(yuǎn)遠(yuǎn)不能滿足網(wǎng)絡(luò)輿情管理實(shí)際需要,因此必須開拓創(chuàng)新,研究更為科學(xué)的知識組織技術(shù)和智能知識處理技術(shù)[3]。知識圖譜具有結(jié)構(gòu)規(guī)范、語義豐富以及支持高效查詢和復(fù)雜知識計算等特點(diǎn),能夠?yàn)檩浨橹黝}發(fā)現(xiàn)、熱點(diǎn)跟蹤、影響分析、傳播分析等提供有力支持[4-5]。從我國疫情防控階段和輿情發(fā)展特點(diǎn)分析,2020年1月中旬至3月底是疫情防控的關(guān)鍵階段,輿情爆發(fā),互聯(lián)網(wǎng)上充斥著各種各樣的觀點(diǎn),對該時期輿情數(shù)據(jù)分析有重要意義。本文采用網(wǎng)絡(luò)爬蟲技術(shù),從中國最大的社交媒體——新浪微博采集1月20日—3月25日共66天不同領(lǐng)域影響力較大且有一定代表性的10位抗疫意見領(lǐng)袖的文本信息。通過對這些信息中的短文本非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行話題檢測,再與結(jié)構(gòu)化數(shù)據(jù)結(jié)合,進(jìn)行語義關(guān)系設(shè)計,構(gòu)建出針對抗疫意見領(lǐng)袖的熱點(diǎn)話題輿情知識圖譜。完成圖譜構(gòu)建后,從意見領(lǐng)袖、話題影響力和基于時間的話題走勢3方面進(jìn)行話題分析。本文研究能為有關(guān)機(jī)構(gòu)應(yīng)對突發(fā)公共衛(wèi)生事件和網(wǎng)絡(luò)輿情有效治理提供參考。

1 相關(guān)研究綜述

1.1 話題檢測與分析

1996年,美國國防高級研究計劃局(DARPA)迫切需要一種能夠?qū)崿F(xiàn)新聞數(shù)據(jù)流話題判斷的全自動技術(shù),于是話題檢測與跟蹤技術(shù)的概念應(yīng)運(yùn)而生[6]。一種方法是基于LDA主題模型或者改進(jìn)的LDA主題模型,通常是將文檔理解為多個隱式主題的組合,這些主題由文檔中的特定詞匯表示;另一種是基于改進(jìn)聚類算法的話題檢測。其中,增量聚類是有效的文本數(shù)據(jù)流聚類算法,而Single-pass單向聚類算法是最簡單和應(yīng)用最廣泛的算法?;诜謱泳垲惖腒-means算法是簡單實(shí)用的分區(qū)聚類算法,但是K值和初始聚集中心點(diǎn)的選擇是K-means算法的關(guān)鍵和難點(diǎn)。根據(jù)主題的周期性特點(diǎn),饒浩[7]介紹了基于時間窗的原始指標(biāo),并基于主成分分析和兩層隱層BP神經(jīng)網(wǎng)絡(luò)對微博主題輿情進(jìn)行分析;黃賢英等[8]利用微博短文的發(fā)布、轉(zhuǎn)發(fā)和評論時間等信息實(shí)現(xiàn)其語義相似度修改,形成一種新的多維微博短文本相似度算法?;趯ο嚓P(guān)話題提取算法的分析研究,本文采用N-Gram語言模型和Shingling相似度算法相結(jié)合的方式,實(shí)現(xiàn)了微博話題檢測。

1.2 輿情領(lǐng)域的知識圖譜研究

知識圖譜(Knowledge Graph)最初由Google[9]提出,這項(xiàng)技術(shù)使得其搜索服務(wù)更加智能化。此后,學(xué)術(shù)界和企業(yè)界紛紛跟進(jìn),使得該技術(shù)在智能搜索、情報分析、自動問答等領(lǐng)域的應(yīng)用顯示出強(qiáng)大優(yōu)勢。在輿情領(lǐng)域,Kim等[10]提出一種基于知識圖譜可視化工具的社交網(wǎng)絡(luò)輿情挖掘方法,他們以韓國方便面事件為例,驗(yàn)證了該方法可用于社交網(wǎng)絡(luò)輿情分析,成為采用知識圖譜分析熱點(diǎn)事件的開端;Chen等[11]利用BICOMB和SPSS軟件,收集了1986-2016年中國知網(wǎng)290篇教學(xué)論文,構(gòu)建出熱點(diǎn)問題和發(fā)展趨勢主題圖譜,并參與輿情調(diào)查研究,為查閱教學(xué)文獻(xiàn)提供了方便的可視化圖譜。在分析網(wǎng)絡(luò)輿情信息組織技術(shù)的基礎(chǔ)上,國內(nèi)學(xué)者如婁國哲等[12]給出網(wǎng)絡(luò)輿情知識圖譜結(jié)構(gòu)的定義,分析網(wǎng)絡(luò)輿情管理知識需求,闡述網(wǎng)絡(luò)輿情知識地圖構(gòu)建方法,提出基于知識圖譜的網(wǎng)絡(luò)輿情知識組織結(jié)構(gòu);馬哲坤等[13]通過突發(fā)詞項(xiàng)篩選、突發(fā)事件話題圖譜構(gòu)建、語義補(bǔ)充和改進(jìn),提出基于知識圖譜進(jìn)行網(wǎng)絡(luò)輿情突發(fā)事件主題內(nèi)容監(jiān)控,有效地提高了網(wǎng)絡(luò)輿情監(jiān)測的準(zhǔn)確性和全面性,使知識圖譜技術(shù)運(yùn)用得到進(jìn)一步發(fā)展。通過以上文獻(xiàn)可以得出,大部分輿情知識圖譜是基于文本構(gòu)建研究,關(guān)于以人物為研究對象的網(wǎng)絡(luò)輿情知識圖譜較少。本文通過構(gòu)建以意見領(lǐng)袖為核心的知識圖譜,結(jié)合疫情期間的熱點(diǎn)話題進(jìn)行分析,為網(wǎng)絡(luò)輿情治理和疫情防控提供理論和知識支撐。

2 熱點(diǎn)話題檢測與圖譜構(gòu)建

2.1 博文話題檢測

本文主要采用N-Gram語言模型和Shingling相似度算法相結(jié)合的方式,實(shí)現(xiàn)微博話題檢測。微博數(shù)據(jù)本質(zhì)上是一系列獨(dú)立的短文本,每個文本中的單詞數(shù)通常不超過140字,并且文本可能包含一些特殊的格式,表示公共主題和用戶之間的交互關(guān)系。例如“@user”、“rt”表示轉(zhuǎn)發(fā)、“# subject #”表示參與某個特定主題的討論。同時,文本還具有一些其它屬性,例如發(fā)布者的發(fā)送時間、來源、地理信息和用戶信息等。本文使用NLPIR-ICTCLASE中文分詞系統(tǒng)對每個微博文本進(jìn)行分詞,以刪除文本中的停用詞。單詞分割效果如圖1所示。

處理停用詞后,進(jìn)行N-Gram處理,該處理涉及由N個單詞組成的集合。各單詞不僅具有先后順序,而且允許單詞相同[14]。N-Gram模型根據(jù)條件概率式(1)和乘法式(2)得到推導(dǎo)式(3)。

其中,P表示由n個詞組成的句子,每一個單詞wi都要依賴于從第一個單詞w1到它之前一個單詞wi-1的影響。將每條微博轉(zhuǎn)換成若干詞語集合,每個集合中包括從該集合的起始詞語開始,連續(xù)出現(xiàn)的n個詞語。每個集合的起始詞語不同,第i個集合的起始詞語是原文本中第i個詞語。

每條微博經(jīng)過處理后,任意兩個微博文本之間的相似度R(A,B)都是用Shingling算法計算而來,并將相似度大于閾值E(0.6)的微博文本都放入同一個文本簇中,如式(4)所示。

其中,S(A)表示微博A的若干詞語集合,[|S(A)?S(B)|]表示S(A)和S(B)的交集中包含的詞語集合數(shù)量,[|S(A)?S(B)|]表示S(A)和S(B)的并集中包含的詞語集合數(shù)量。通過以上方法,統(tǒng)計每個文本簇所有微博文本的詞語出現(xiàn)在話題詞典中的數(shù)量,將每個文本簇劃分到出現(xiàn)的詞語數(shù)量最多的一類話題中?;趯ξ⒉┲性掝}影響力最大的前7個熱點(diǎn)話題共500條微博分析,本文采用DT會議制定的比較規(guī)范的話題檢測評價標(biāo)準(zhǔn)[15],經(jīng)過實(shí)驗(yàn),準(zhǔn)確率達(dá)82.3%,召回率達(dá)81.6%,與傳統(tǒng)Single-Pass聚類相似度算法[16]相比,準(zhǔn)確率和召回率均有所提高,如表1所示。

2.2 抗疫意見領(lǐng)袖話題知識圖譜構(gòu)建

分析已有文獻(xiàn)可知,大部分知識圖譜是基于文本構(gòu)建研究,關(guān)于結(jié)合突發(fā)公共衛(wèi)生事件并且以人物為研究對象的網(wǎng)絡(luò)輿情知識圖譜較少,因此以該突破點(diǎn)出發(fā)展開研究。知識圖譜從邏輯上分為模式層和數(shù)據(jù)層兩部分[17]。其中,模式層是知識圖譜的核心,主要存儲經(jīng)過提煉了的疫情語義知識結(jié)構(gòu),通過本體庫管理這一層;數(shù)據(jù)層存儲的是具體實(shí)體和關(guān)系數(shù)據(jù)信息,本文存儲在Neo4j圖數(shù)據(jù)庫中。

2.2.1 模式層構(gòu)建

模式層建立在數(shù)據(jù)層之上,是知識圖譜的核心,模式層通常使用本體進(jìn)行管理。本體是結(jié)構(gòu)化知識庫的概念模板,所形成的知識庫不僅具有層次性,而且冗余度較小。抗疫意見領(lǐng)袖熱點(diǎn)話題圖譜是指在新型冠狀病毒疫情突發(fā)公共衛(wèi)生事件下以意見領(lǐng)袖為研究對象的語義知識結(jié)構(gòu)庫和輿情事件庫,其基本組成單元是<實(shí)體,關(guān)系,實(shí)體>、<關(guān)系,屬性,屬性值>和<實(shí)體,屬性,屬性值>三元組。其中定義了4種實(shí)體類別:話題、用戶、事件、意見領(lǐng)袖。模式層中定義的每種實(shí)體屬性如表2所示。

通過對定義好的實(shí)體進(jìn)行研究,得到<事件,屬于,話題>、<用戶,發(fā)布,事件>、<意見領(lǐng)袖,參與,事件>、<意見領(lǐng)袖,包含,話題>4種實(shí)體關(guān)系,如圖2所示。其中,圓形表示實(shí)體類別,連線表示實(shí)體類別關(guān)系。

2.2.2 數(shù)據(jù)層構(gòu)建

本文通過新浪微博的公共數(shù)據(jù)接口爬取2020年1月20日-3月25日來自醫(yī)療專家、社會名人、政府官員3個不同領(lǐng)域博文影響力較大的10位抗疫意見領(lǐng)袖相關(guān)的? ? 4 795件熱點(diǎn)事件和2 080位微博用戶信息。圖數(shù)據(jù)庫相較于傳統(tǒng)的RDF存儲具有查詢效率高、搜索快和直觀簡單等優(yōu)點(diǎn),故在存儲上選擇開源的Neo4j數(shù)據(jù)庫,在平臺構(gòu)建上選擇SDN(Spring Data Neo4j),它是開源Spring數(shù)據(jù)項(xiàng)目的一個子項(xiàng)目。其提供了將帶注解的實(shí)體類映射到Neo4j數(shù)據(jù)庫的高級功能,為與關(guān)系圖的交互提供了基礎(chǔ),還可用于高級倉庫支持。

設(shè)計好實(shí)體類別和實(shí)體關(guān)系后,通過Springboot開發(fā)框架和Neo4j圖數(shù)據(jù)庫相結(jié)合的方式進(jìn)行數(shù)據(jù)存儲,設(shè)計意見領(lǐng)袖熱點(diǎn)話題輿情知識圖譜并構(gòu)建平臺?;谖⒉┡廊〉娜繑?shù)據(jù),共構(gòu)建8 387個實(shí)例,16 497條關(guān)系邊。如圖3所示,考慮到圖譜展示效果,本文截取以韓紅、鐘南山、馬云等5位意見領(lǐng)袖為核心的輿情話題圖譜部分結(jié)構(gòu)。其中,不同灰度色和大小的圓形節(jié)點(diǎn)代表了不同的實(shí)體類別,連線代表了節(jié)點(diǎn)之間的關(guān)系,整體直觀地描述出以抗疫意見領(lǐng)袖為核心的熱點(diǎn)話題事件傳播過程。

3 抗疫意見領(lǐng)袖熱點(diǎn)話題演化分析

關(guān)于輿情話題演變,從現(xiàn)有文獻(xiàn)看,陳婷等[18]提出基于時間序列話題的網(wǎng)絡(luò)輿情熱點(diǎn)話題演化分析方法,通過添加時間序列標(biāo)簽,直觀分析輿情熱點(diǎn)話題內(nèi)容和強(qiáng)度的演化過程。從情感分析角度出發(fā),何天祥等[19]提出一種采用情感分析的網(wǎng)絡(luò)輿情演變分析方法。因此,本文在前人研究基礎(chǔ)上,在Neo4j圖數(shù)據(jù)庫中通過Cypher查詢語言與相關(guān)算法相結(jié)合的方式對知識圖譜進(jìn)行分析,以把握疫情突發(fā)公共衛(wèi)生事件下網(wǎng)絡(luò)話題輿情發(fā)展趨勢,進(jìn)而了解事件發(fā)展過程[20-22]。

3.1 意見領(lǐng)袖人物分析

此次新冠疫情突發(fā)事件中產(chǎn)生了眾多的抗疫意見領(lǐng)袖,如鐘南山、馬云、韓紅等。他們發(fā)表了具有強(qiáng)大輿論號召力的觀點(diǎn),成為此次疫情事件中的熱點(diǎn)人物。通過對意見領(lǐng)袖、事件、話題三者關(guān)系進(jìn)行Cypher查詢統(tǒng)計分析,得到各領(lǐng)域意見領(lǐng)袖的事件報道數(shù)量和話題數(shù)量,如圖4所示。其中,抗疫科學(xué)家鐘南山參與的事件有647件,引起266條話題討論。歌唱家、慈善家韓紅參與的事件數(shù)有743之多,引起139條話題討論。

人物影響力計算如式(5)所示。

與通過Cypher查詢統(tǒng)計分析意見領(lǐng)袖、事件、事件屬性三者關(guān)系相結(jié)合的方式,可以計算出每位意見領(lǐng)袖的抗疫影響力。其中,i表示與意見領(lǐng)袖k相關(guān)的事件,retweet(i)表示第i件事轉(zhuǎn)發(fā)數(shù)之和,comment(i)表示第i件事評論數(shù)之和,likes(i)表示第i件事點(diǎn)贊數(shù)之和。將所有事件的影響力求和,可以得到如圖5所示的抗疫意見領(lǐng)袖排行榜,可以看到鐘南山的抗疫影響力達(dá)836萬之多,位居榜首。

3.2 熱點(diǎn)話題影響力分析

經(jīng)過初期的話題檢測后,共提取到1 323個話題。通過對檢測到的話題進(jìn)行排名,可以快速從大量的話題中檢測到抗疫熱門話題,有利于網(wǎng)絡(luò)輿情治理。提取不同話題包含的所有事件實(shí)體,話題熱度計算如式(6)所示。

與通過Cypher查詢統(tǒng)計分析話題、事件、事件屬性三者關(guān)系相結(jié)合的方式,可以計算出話題中每一條原始微博的影響力。其中,w(label(z))表示z文本簇中話題類別對應(yīng)的權(quán)重,retweet(z)表示z文本簇中所有微博文本的轉(zhuǎn)發(fā)數(shù)之和,comment(z)表示z文本簇中所有微博文本的評論數(shù)之和,likes(z)表示第z個文本簇里所有微博文本的點(diǎn)贊數(shù)之和。構(gòu)建的意見領(lǐng)袖熱點(diǎn)話題影響力排行榜如圖6所示,本文選取前15個熱點(diǎn)話題,其中“終南山全程英語分享中國經(jīng)驗(yàn)”這個話題以164萬多影響力位居榜首。

3.3 基于時間的熱點(diǎn)話題走勢分析

本文選取“韓紅愛心馳援武漢”這個熱點(diǎn)話題進(jìn)行分析。通過在圖譜中對話題、事件、事件屬性三者關(guān)系進(jìn)行Cypher查詢統(tǒng)計分析。提取該話題不同時間段包含的所有事件實(shí)體的評論、轉(zhuǎn)發(fā)、點(diǎn)贊、時間、內(nèi)容和其它屬性,在此基礎(chǔ)上,根據(jù)上述話題熱度計算式(6)計算話題影響力,得出一段時間輿情事件發(fā)展過程中話題出現(xiàn)階段和話題討論熱度等多維特征。如圖7所示,本文將輿情事件按潛伏期1月21號—2月11日、爆發(fā)期——2月11號—2月25日、衰退期2月25日—3月22日這3個階段進(jìn)行話題討論分析。從話題影響看,在潛伏期內(nèi),話題討論熱度不高,影響力較小;隨著事件的傳播,進(jìn)入輿論的爆發(fā)期,話題影響力呈現(xiàn)顯著增加,該時期的輿論事件也受到了很多關(guān)注和轉(zhuǎn)發(fā);當(dāng)處于衰退階段時,話題影響力逐漸減弱,且這一時期持續(xù)最長。

4 結(jié)語

隨著大數(shù)據(jù)時代的到來,構(gòu)建一個準(zhǔn)確、完善、實(shí)時更新的知識圖譜仍然面臨諸多挑戰(zhàn)。本文通過微博數(shù)據(jù)采集、話題檢測構(gòu)建抗疫意見領(lǐng)袖熱點(diǎn)話題知識圖譜,能夠簡單直觀地展示出疫情期間意見領(lǐng)袖、話題、事件等多維輿情關(guān)系,同時可以提高檢測速度和分析效率,符合輿情傳播客觀規(guī)律,實(shí)現(xiàn)較為滿意的分析效果,有助于輿情監(jiān)控相關(guān)部門在疫情防控期間的輿情分析與網(wǎng)絡(luò)治理。

本文基本完成了預(yù)期的圖譜分析效果,但依然存在以下不足:本文只是從微博上采集抗疫意見領(lǐng)袖熱點(diǎn)事件,后期可以從多數(shù)據(jù)源獲取,使圖譜分析實(shí)驗(yàn)結(jié)果更加準(zhǔn)確;在話題檢測上,本文選擇了目前效果相對較好的算法,但是微博文本內(nèi)容長度短、表達(dá)隨意、非規(guī)范化等特點(diǎn)致使文本向量高維且有效特征稀疏,后續(xù)研究中可對相關(guān)算法作出改進(jìn)。本文構(gòu)建的輿情知識圖譜可用于新冠疫情輿情監(jiān)測和引導(dǎo)等相關(guān)研究。

參考文獻(xiàn):

[1] 羅莉,周婷. 意見領(lǐng)袖對網(wǎng)絡(luò)輿情的作用[J]. 新聞戰(zhàn)線,2016,61(8):26-27.

[2] 劉雅姝,張海濤,徐海玲,等. 多維特征融合的網(wǎng)絡(luò)輿情突發(fā)事件演化話題圖譜研究[J]. 情報學(xué)報,2019,38(8):798-806.

[3] 王蘭成,婁國哲. 基于知識圖譜的網(wǎng)絡(luò)輿情管理方法與實(shí)踐研究[J]. 情報理論與實(shí)踐, 2020,43(6):97-101.

[4] 王晰巍,韋雅楠,邢云菲,等. 社交網(wǎng)絡(luò)輿情知識圖譜發(fā)展動態(tài)及趨勢研究[J]. 情報學(xué)報,2019,38(12):1329-1338.

[5] 袁立庠. 微博的傳播模式與傳播效果[J]. 安徽師范大學(xué)學(xué)報,2011,55(6):678-683.

[6] 張仰森,段宇翔,黃改娟,等. 社交媒體話題檢測與追蹤技術(shù)研究綜述[J]. 中文信息學(xué)報,2019,33(7):1-10,30.

[7] 饒浩,陳海媚. 主成分分析與BP神經(jīng)網(wǎng)絡(luò)在微博輿情預(yù)判中的應(yīng)用[J]. 現(xiàn)代情報,2016,36(7):58-62,70.

[8] 黃賢英,陳紅陽,劉英濤. 短文本相似度研究及其在微博話題檢測中的應(yīng)用[J]. 計算機(jī)工程與設(shè)計,2015,36(11):3128-3133.

[9] SINGHAL A. Introducing the knowledge graph: things, not strings[Z]. Official Google Blog,2012.

[10] KIM Y,JEONG S R.Opinion-Mining methodology for social media analytics[J]. KSII Transactions on Internet and Information Systems,2015,9(1):391-406.

[11] CHEN X D,SUN Y,HE T Z. Historical retrospect and future prospect of research on effective teaching in China——knowledge map‐ ping analysis based on the research over the past three decades (1986-2016)[J]. Advances in Higher Education,2018,2(2):1-10.

[12] 婁國哲,王蘭成. 基于知識圖譜的網(wǎng)絡(luò)輿情知識組織方法研究[J]. 情報理論與實(shí)踐,2019,42(1):58-64.

[13] 馬哲坤,涂艷. 基于知識圖譜的網(wǎng)絡(luò)輿情突發(fā)話題內(nèi)容監(jiān)測研究[J]. 情報科學(xué),2019,37(2):33-39.

[14] 周水庚,俞紅奇,胡運(yùn)發(fā),等. 基于N—gram信息的中文文檔分類研究[J]. 中文信息學(xué)報,2001,16(1):34-39.

[15] 洪宇,張宇,劉挺,等. 話題檢測與跟蹤的評測及研究綜述[J]. 中文信息學(xué)報,2007,22(6):71-87.

[16] 李倩.? Single-Pass聚類算法的改進(jìn)及其在微博話題檢測中的應(yīng)用研究[D]. 濟(jì)南:山東師范大學(xué),2016.

[17] 林萍,黃衛(wèi)東. 基于LDA模型的網(wǎng)絡(luò)輿情事件話題演化分析[J]. 情報雜志,2013,32(12):26-30.

[18] 陳婷,王雪怡,曲霏,等. 基于時序主題的網(wǎng)絡(luò)輿情熱點(diǎn)話題演化分析方法[J]. 華中師范大學(xué)學(xué)報(自然科學(xué)版),2016,50(5):672-676.

[19] 何天翔,張暉,李波,等. 一種基于情感分析的網(wǎng)絡(luò)輿情演化分析方法[J]. 軟件導(dǎo)刊,2015,14(5):131-134.

[20] SOHN D,GEIDNER N. Collective dynamics of the spiral of silence:the role of ego-network size[J]. International Journal of Public Opinion Research,2016,28(1):25-45.

[21] BLEI D M,NG AY,JORDAN M I. Latent Dirichlet allocation[J]. Journal of Machine Learning Research,2003(3):993-1022.

[22] 王義真,鄭嘯,后盾,等. 基于SVM的高維混合特征短文本情感分類[J]. 計算機(jī)技術(shù)與發(fā)展,2018,28(2):88-93.

(責(zé)任編輯:孫 娟)

猜你喜歡
意見領(lǐng)袖新冠疫情知識圖譜
新冠疫情視閾下感悟“四個自信”國家共識
“心理成長任務(wù)包”助力學(xué)生安度疫情
微博動員、維權(quán)倡議與記者的利益表達(dá)機(jī)制
新形勢下高校網(wǎng)絡(luò)文化建設(shè)管理機(jī)制研究
微信營銷意見領(lǐng)袖培養(yǎng)現(xiàn)狀研究
從《ET&S》與《電化教育研究》對比分析中管窺教育技術(shù)發(fā)展