于衛(wèi)紅
〔摘要〕[目的意義]為校園輿情信息管理員、校園輿情監(jiān)管辦公室、相關(guān)領(lǐng)導(dǎo)等提供輿情信息服務(wù)及決策參考。[方法過程]在Jade平臺下分析、設(shè)計了基于多Agent的高校網(wǎng)絡(luò)輿情監(jiān)測與分析系統(tǒng)。詳細(xì)闡述了信息采集Agent、信息預(yù)處理Agent、輿情分析Agent、輿情簡報生成Agent的工作機制。構(gòu)建了由物理層、語法層和語義層組成的多Agent間的通信模型。為了提高Agent的輿情分析能力與分析結(jié)果的可視化展示能力,通過Rserve接口對Jade平臺與R語言進行集成,使得Jade Agent可以靈活調(diào)用R語言豐富的算法包。[結(jié)果結(jié)論]文中給出了“高校百度貼吧熱點分析”的系統(tǒng)運行實例。運行結(jié)果表明基于多Agent的高校網(wǎng)絡(luò)輿情監(jiān)測與分析系統(tǒng)充分利用了Agent的自主性、智能性和交互性,使得系統(tǒng)更加具有靈活性和實時性;同時系統(tǒng)以大數(shù)據(jù)思維為指導(dǎo),并集成了大數(shù)據(jù)分析利器R語言,使得輿情分析更加全面、客觀。
〔關(guān)鍵詞〕高校網(wǎng)絡(luò)輿情;輿情監(jiān)測與分析;多Agent;Jade平臺;R語言
DOI:10.3969j.issn.1008-0821.2017.10.009
〔中圖分類號〕G2062〔文獻標(biāo)識碼〕A〔文章編號〕1008-0821(2017)10-0053-05
〔Abstract〕[PurposeSignificance]To provide public opinion information service and decision-making reference for campus public opinion information administrators,campus public opinion supervision office and related leaders.[MethodProcess]Under Jade platform,a network public opinion monitoring and analysis system based on multi Agent was analyzed and designed.The work mechanism of information collection Agent,information pre-processing Agent,public opinion analysis Agent and public opinion report Agent were elaborated in detail.A multi Agent communication model consisting of physical layer,syntax layer and semantic layer was constructed.In order to improve Agents public opinion analysis ability and the ability of analysis result visualization display,Jade platform was integrated with R language through Rserve interface,so that Jade Agent could flexibly call rich algorithms of R language.[ResultConclusion]As a system running instance,“hot spot analysis of university Baidu Post Bar”was given.The running results showed that University Network Public Opinion Monitoring and Analysis System Based on Multi-Agent takes full advantage of Agent good properties such as autonomy,intelligence and interactivity,so that the system became more flexible and real-time.Meanwhile,taking big data thinking as a guide and integrating R language made public opinion analysis more comprehensive and objective.
〔Key words〕university network public opinion;public opinion monitoring and analysis;Multi-Agent;Jade platform;R language
新媒體時代,網(wǎng)絡(luò)輿情傳播更加具有多元性、復(fù)雜性、集中性、持續(xù)性等特點。大學(xué)生群體知識層次高、思維活躍、參與意識強但尚未完全成熟,特別是部分大學(xué)生主流意識模糊、思想認(rèn)識偏差、價值觀念異化,更容易在校園安全管理、決策部署、師生權(quán)益等敏感話題上引發(fā)校園網(wǎng)絡(luò)輿情,并造成輿情傳播的“蝴蝶效應(yīng)”,使學(xué)校卷入安全或聲譽的危機之中。因此,各高校應(yīng)充分重視校園網(wǎng)絡(luò)輿情的監(jiān)測、分析與引導(dǎo),完善組織機構(gòu),健全校園輿情管理制度。
傳統(tǒng)的網(wǎng)絡(luò)輿情監(jiān)測主要依靠搜索引擎人工監(jiān)測,即安排固定人手,定期瀏覽目標(biāo)站點并搜索目標(biāo)關(guān)鍵詞。很顯然,人工監(jiān)測在實時性、全面性和準(zhǔn)確性等方面存在很大的局限性。傳統(tǒng)的輿情分析也主要采用專家研判的人工方式,盡管專家在輿情研判方面具有豐富的經(jīng)驗,但人工研判依賴的數(shù)據(jù)往往是樣本數(shù)據(jù),數(shù)據(jù)所反映的層次相對簡單和淺薄,而且人工研判容易帶有人為設(shè)計的主觀隨意性,使得輿情研判在深度、信度、效度、客觀性等方面大打折扣。endprint
因此,大數(shù)據(jù)時代,輿情監(jiān)管工作應(yīng)該充分引入大數(shù)據(jù)思維以及大數(shù)據(jù)的分析與處理技術(shù),使得輿情研判與引導(dǎo)更加科學(xué)。比如,在輿情采集環(huán)節(jié),可以考慮分布式采集系統(tǒng),高效、準(zhǔn)確、實時地對覆蓋主流的社交平臺進行全方位信息采集;在輿情分析方面,應(yīng)分析全數(shù)據(jù)而非隨機采樣,應(yīng)重視數(shù)據(jù)的復(fù)雜性、弱化精確性,應(yīng)更加關(guān)注數(shù)據(jù)的關(guān)聯(lián)性而非因果關(guān)系,同時要綜合運用分類、聚類、時序分析等多種數(shù)據(jù)分析技術(shù)。
鑒于此,本文提出了基于多Agent的高校網(wǎng)絡(luò)輿情監(jiān)測與分析系統(tǒng),力求在輿情采集、輿情分析等方面減少人工干預(yù),使輿情采集更加自動化、全方位,輿情分析更加客觀、科學(xué)。Agent是指駐留在某一環(huán)境下,能持續(xù)自主地發(fā)揮作用,具備反應(yīng)性、社會性、主動性等特征的計算實體[1]。多Agent系統(tǒng)是由多個自主Agent所組成的一種分布式系統(tǒng),其主要任務(wù)是要創(chuàng)建一群自主的Agent,并協(xié)調(diào)它們的智能行為[2]。
目前已有很多學(xué)者將多Agent思想應(yīng)用到輿情研究中,研究的側(cè)重點主要集中在輿情傳播機制的仿真建模,如孫雷霆等使用Multi-Agent建模技術(shù),建立虛假輿情傳播的巴斯擴散仿真模型[3];吳鵬等基于“信念–愿望–意圖”模型建立起網(wǎng)絡(luò)輿情演變過程中各類主體的多Agent交互模型,對網(wǎng)民的心智狀態(tài)的轉(zhuǎn)換過程建模仿真,從而揭示網(wǎng)絡(luò)輿情演變的內(nèi)在動因,支持應(yīng)急響應(yīng)策略的科學(xué)制定[4];余樂安等基于多Agent技術(shù)構(gòu)建了危險化學(xué)品泄漏所造成的水污染事件中網(wǎng)絡(luò)輿情擴散機制的仿真模型[5]。上述成果大都使用Anylogic、NetLogo等仿真平臺揭示輿情信息的傳播機理,為我們提供了很好的借鑒。但是,文獻研究發(fā)現(xiàn),利用多Agent技術(shù)構(gòu)建網(wǎng)絡(luò)輿情監(jiān)測與分析系統(tǒng)的成果很少,目前流行的網(wǎng)絡(luò)輿情系統(tǒng)大都采用較傳統(tǒng)的面向?qū)ο蟮拈_發(fā)方法,沒有很好地利用Agent的智能性、通信能力、協(xié)商性等優(yōu)勢;在輿情分析方面也忽視了多種分析工具和技術(shù)的整合應(yīng)用。
本文以大數(shù)據(jù)思維為指導(dǎo),在Jade平臺下分析、設(shè)計了基于多Agent的高校網(wǎng)絡(luò)輿情監(jiān)測與分析系統(tǒng)。Jade是基于Java語言的多Agent系統(tǒng)開發(fā)框架[6],Jade Agent具有自主性、智能性、適應(yīng)性以及很強的通信協(xié)作能力。為了提升系統(tǒng)中相關(guān)Agent的數(shù)據(jù)分析與可視化展示能力,本文提出了將Jade平臺與R語言無縫集成,以便各Agent能夠靈活調(diào)用R語言豐富的算法包。
1系統(tǒng)結(jié)構(gòu)及功能分析
為了進一步加強網(wǎng)絡(luò)輿情監(jiān)測及預(yù)警防范,營造良好的輿論環(huán)境,確保校園網(wǎng)絡(luò)信息服務(wù)健康有序,各高校應(yīng)根據(jù)實際情況設(shè)定校園輿情信息管理員,成立校園輿情監(jiān)管辦公室?;诙郃gent的高校網(wǎng)絡(luò)輿情監(jiān)測與分析系統(tǒng)主要為校園輿情信息管理員、校園輿情監(jiān)管辦公室、相關(guān)領(lǐng)導(dǎo)等提供輿情信息服務(wù)及決策參考。
網(wǎng)絡(luò)輿情監(jiān)測與分析是一項復(fù)雜的系統(tǒng)工程,基于任務(wù)分解的思想,將這項工作分解為輿情信息采集、輿情信息預(yù)處理、輿情分析、輿情簡報生成四部分,每一部分都由相應(yīng)的Agent類來完成,系統(tǒng)中各Agent在邏輯上或物理上呈分布狀態(tài),每個Agent擁有解決指定問題的不完全的信息或能力,Agent間通過協(xié)作或協(xié)商共同完成校園網(wǎng)絡(luò)輿情監(jiān)測與分析工作。此外,在需要的時候輿情分析Agent、輿情簡報生成Agent等還可以通過Rserve接口實現(xiàn)與R語言的跨平臺通信,遠(yuǎn)程調(diào)用R語言強大的數(shù)據(jù)分析功能。
本系統(tǒng)的功能結(jié)構(gòu)如圖1所示。
2基于多Agent的高校網(wǎng)絡(luò)輿情監(jiān)測與分析系統(tǒng)的工作機制
系統(tǒng)中的Agent可以看作是慎思Agent,其內(nèi)部狀態(tài)及主要行為使用六元組形式化表示如下:Agent=〈D,K,I,B,C,T〉,其中,D表示Agent的數(shù)據(jù)庫,K表示Agent的知識庫,I表示Agent的意圖集,B表示Agent的行為能力,C表示Agent的協(xié)調(diào)控制、解決沖突能力,T表示Agent的通信能力。Agent工作時感知外部環(huán)境,根據(jù)意圖集決定其行為,行為執(zhí)行過程中通常需要調(diào)用數(shù)據(jù)庫和知識庫。
21信息采集Agent
信息采集Agent相當(dāng)于校園輿情主題爬蟲。主題爬蟲是指選擇性地爬取那些與預(yù)先定義好的主題相關(guān)頁面的網(wǎng)絡(luò)爬蟲,和通用網(wǎng)絡(luò)爬蟲相比,主題爬蟲針對性強,信息采集速度快,極大地節(jié)省了網(wǎng)絡(luò)資源,并能夠很好地滿足特定人群對特定信息的需求。
對于高校網(wǎng)絡(luò)輿情來說,關(guān)注度比較高的主題主要包括:教學(xué)、科研、考研、招生、師德師風(fēng)、師生關(guān)系、職稱評定、學(xué)科評估、專業(yè)評估、實習(xí)就業(yè)等,信息采集Agent將這些主題詞設(shè)為特征關(guān)鍵詞,從百度貼吧、校園BBS、微博、QQ空間、QQ群、微信平臺等信息源爬取輿情信息。信息采集Agent的工作機制如圖2所示。從圖2可以看出,信息采集Agent完成主題建模(設(shè)定主題詞及其權(quán)重)、網(wǎng)頁相關(guān)度計算、網(wǎng)頁優(yōu)先權(quán)設(shè)置及信息爬取等工作。輿情信息采集時,可運行多個信息采集Agent類的實例,進行分布式采集。
22信息預(yù)處理Agent
信息預(yù)處理Agent主要負(fù)責(zé)數(shù)據(jù)清洗和數(shù)據(jù)轉(zhuǎn)換工作,數(shù)據(jù)清洗指的是清除無用數(shù)據(jù)、處理缺失值、刪除重復(fù)記錄等工作;數(shù)據(jù)轉(zhuǎn)換一般包括特征選擇、格式轉(zhuǎn)換等操作。文本分詞、去停用詞、文檔特征提取工作也由信息預(yù)處理Agent完成。
23輿情分析Agent
輿情分析Agent主要完成信息的相關(guān)性分析、傳播影響力指數(shù)計算、輿情基本屬性分析、情感分析、輿情態(tài)勢預(yù)測等。輿情分析Agent要用到大量的數(shù)據(jù)分析算法,目前,R語言是統(tǒng)計分析領(lǐng)域非常強大的工具,Jade Agent以Java為開發(fā)語言,為了提升Agent的輿情分析能力及可視化展示能力,本文采用基于Rserve的跨平臺通信方式將Java與R語言有機集成,實現(xiàn)了Jade Agent對R語言的遠(yuǎn)程功能調(diào)用。Rserve可以看作是基于TCPIP協(xié)議和CS結(jié)構(gòu)的R語言后臺服務(wù)器,它提供了遠(yuǎn)程連接、認(rèn)證、文件傳輸?shù)裙δ?,處理來自C、C++、Java、PHP等客戶端語言提出的統(tǒng)計建模、數(shù)據(jù)分析、可視化等任務(wù)請求。輿情分析Agent調(diào)用R語言服務(wù)的主要步驟包括:①在R環(huán)境或命令提示符下啟動Rserve服務(wù);②在Agent程序中建立與R語言的遠(yuǎn)程連接RConnection;③在Agent程序中使用eval()函數(shù)調(diào)用R語句;④Rserve執(zhí)行R語句并將執(zhí)行結(jié)果返回給Agent。endprint
24輿情簡報生成Agent
輿情簡報生成Agent提供若干種簡報模板,根據(jù)用戶自定義的輿情關(guān)鍵詞、時間、布局方式等參數(shù),自動生成輿情簡報。所生成的簡報主要包括:①分類信息簡報;②最新信息報道與跟蹤;③熱點信息跟蹤;④專題信息專報。輿情簡報生成Agent要用到大量的可視化圖表,為了簡化操作,輿情簡報生成Agent也可以按需調(diào)用R語言的繪圖功能。
25Agent間的交互與通信
在多Agent系統(tǒng)中,為了實現(xiàn)自身的目標(biāo),Agent應(yīng)該在遵循某種會話規(guī)則的基礎(chǔ)上彼此協(xié)作并通過交換信息來對外界產(chǎn)生感知。為此,本研究構(gòu)建了如圖3所示的多Agent通信模型。
在圖3所示的通信模型中,Agent通信模塊由物理層、語法層和語義層構(gòu)成,其中,物理層基于TCPIP、RMI、SOAP等通信協(xié)議負(fù)責(zé)Agent間信息的發(fā)送和接收;語法層根據(jù)Agent通信語言(KQML或ACL)的語法規(guī)則對消息內(nèi)容、發(fā)送者、接收者等進行解析;任何消息只有將其置于一定的語義環(huán)境下才有意義,語義可以理解為數(shù)據(jù)在某個領(lǐng)域上的解釋和邏輯表示,目前,主要使用本體對特定領(lǐng)域中的概念及其相互關(guān)系進行形式化表達,而本體常以XML作為知識表達語言。因此,在語義層主要使用本體及XML技術(shù)保證Agent對信息的正確理解。
3系統(tǒng)運行實例——高校百度貼吧熱點分析
本實例以大連海事大學(xué)百度貼吧為信息源,首先運行信息采集Agent(運行時命名為CollectAgent),爬取2017年6月間大連海事大學(xué)百度貼吧的主題帖,作為待處理數(shù)據(jù)保存到本地文件中。信息采集Agent將待處理的數(shù)據(jù)集的地址以及預(yù)處理請求作為消息內(nèi)容發(fā)送給信息預(yù)處理Agent(運行時命名為PreProcessAgent)。信息預(yù)處理Agent收到消息后對數(shù)據(jù)集進行清洗,保留了1 500條有效數(shù)據(jù),部分?jǐn)?shù)據(jù)內(nèi)容如圖4所示。
然后,信息預(yù)處理Agent選取數(shù)據(jù)集的title和content字段進行分詞和去停用詞處理,處理完畢,向信息分析Agent(運行時命名為AnalysisAgent)提出“輿情熱點分析”的建議,并將預(yù)處理后的結(jié)果發(fā)送給信息分析Agent。信息分析Agent通過Rserve調(diào)用R語言的數(shù)據(jù)處理功能,以詞頻分析為例,其核心語句如下:
RConnection c=new?RConnection(); 建立與R的遠(yuǎn)程連接
c.eval("library(wordcloud)"); 在R語言中加載用于繪制詞云的wordcloud包
c.eval("txt.aslist<-unlist(txt)"); 將分詞后的詞語列表轉(zhuǎn)換為向量
c.eval("txt.freq<-table(txt.aslist)"); 詞頻統(tǒng)計
c.eval("txt.result<-txt.freq[order(txt.freq)]"); 頻數(shù)排序
c.eval("wordcloud(names(txt.result),txt.result,random.order=FALSE)");畫詞云圖
信息分析Agent提取出2017年6月間大連海事大學(xué)百度貼吧的熱點詞如圖5所示。從圖5可以看出,2017年6月期間,大連海事大學(xué)百度貼吧中備受關(guān)注的問題主要包括:高考提前錄取;選專業(yè);考研;畢業(yè)。被討論較多的專業(yè)包括:輪機、航海、電氣工程、船舶工程。很多人通過百度貼吧咨詢高考錄取等問題,咨詢者主要來自:遼寧、河南、河北、山東等省份。信息分析Agent將分析結(jié)果發(fā)送給輿情簡報生成Agent(運行時命名為ReportAgent),輿情簡報生成Agent對原始數(shù)據(jù)、分析結(jié)果進行整理后按照用戶指定的模板生成輿情報告,由于篇幅有限,輿情報告的具體內(nèi)容略。
系統(tǒng)運行過程中,Agent間相互協(xié)作、共同完成對校園網(wǎng)絡(luò)輿情監(jiān)測與分析問題的求解。在Jade環(huán)境下,系統(tǒng)運行某一時刻各Agent間的交互如圖6所示。
4結(jié)語
大數(shù)據(jù)時代的高校網(wǎng)絡(luò)輿情監(jiān)管面臨前所未有的機遇和挑戰(zhàn),挑戰(zhàn)來自于輿情數(shù)據(jù)量激增、輿情信息源復(fù)雜、輿情態(tài)勢瞬息萬變等方面,而機遇則體現(xiàn)在大數(shù)據(jù)的思維理念日益成熟,輿情信息的采集方式、分析技術(shù)日臻完善,以大數(shù)據(jù)思維為指導(dǎo)、整合多種先進技術(shù)必將使校園輿情監(jiān)管工作更加科學(xué)化、智能化,為推進和諧校園建設(shè),維
圖6系統(tǒng)運行時Agent間的交互圖
護正常的教學(xué)、科研秩序做出貢獻。本文所提出的基于多Agent的高校網(wǎng)絡(luò)輿情監(jiān)測與分析系統(tǒng)充分利用了多Agent系統(tǒng)分布式問題求解的優(yōu)勢,同時整合了R語言強大的數(shù)據(jù)分析與結(jié)果可視化能力,為輿情監(jiān)測與分析系統(tǒng)的分析、設(shè)計、實現(xiàn)提供了新的思路。
參考文獻
[1]唐明圣.基于Agent的人工社會應(yīng)急管理政策分析方法[D].長沙:國防科學(xué)技術(shù)大學(xué),2015.
[2]程世清.基于多Agent的動態(tài)協(xié)同作戰(zhàn)軟件設(shè)計與實現(xiàn)[D].西安:西安電子科技大學(xué),2015.
[3]孫雷霆,李春發(fā),陶建強.基于Multi-Agent的虛假輿情傳播仿真[J].情報雜志,2017,(4):162-169.
[4]吳鵬,金貝貝,強韶華.基于BDI-Agent模型的突發(fā)事件網(wǎng)絡(luò)輿情應(yīng)急響應(yīng)建模研究[J].現(xiàn)代圖書情報技術(shù),2016,(Z1):32-41.
[5]余樂安,李玲,戴偉,等.?;匪廴臼录姓C信息公布策略與網(wǎng)絡(luò)輿情擴散研究:基于多主體模型[J].管理評論,2016,(8):175-185.
[6]胡曉玉.基于JADE的集裝箱港口堆場作業(yè)多Agent仿真系統(tǒng)開發(fā)[D].大連:大連理工大學(xué),2015.
[7]邢文雪.自媒體時代高校網(wǎng)絡(luò)輿情應(yīng)對研究[D].長沙:湖南大學(xué),2014.
[8]趙揚.高校網(wǎng)絡(luò)輿情引導(dǎo)研究[D].長春:東北師范大學(xué),2016.
[9]徐萍.大數(shù)據(jù)在高校網(wǎng)絡(luò)輿情應(yīng)急處置中的應(yīng)用探討[J].圖書館工作與研究,2016,(5):55-58.
[10]孫莉玲.大數(shù)據(jù)時代高校網(wǎng)絡(luò)輿情研判與治理[J].江海學(xué)刊,2016,(3):204-209,239.
(本文責(zé)任編輯:孫國雷)endprint