劉云花+黎泉
摘 要: 針對網(wǎng)絡(luò)輿情的隱蔽性與廣泛性對相關(guān)技術(shù)具有限制性的缺點,提出了一種基于MVC模式的網(wǎng)絡(luò)輿情管理系統(tǒng)。該系統(tǒng)基于Windows平臺,應(yīng)用Apache服務(wù)器,采用Java開發(fā)語言,并結(jié)合AJAX技術(shù),以實現(xiàn)對網(wǎng)絡(luò)輿情的高效采集、準(zhǔn)確監(jiān)控與預(yù)警。最后對該系統(tǒng)進(jìn)行驗證,結(jié)果表明,該系統(tǒng)具有較強的實用性,滿足了用戶需求。
關(guān)鍵詞: 網(wǎng)絡(luò)輿情管理; MVC模式; 結(jié)構(gòu)設(shè)計; 聚類; Java
中圖分類號: TN711?34; TP393 文獻(xiàn)標(biāo)識碼: A 文章編號: 1004?373X(2017)24?0031?03
Abstract: In allusion to the covertness and extensiveness of network public opinions, and their constraints to the relevant technologies, a network public opinion management system based on MVC model is proposed. Apache server, Java development language and AJAX technology are used in the system based on the Windows platform to realize efficient collection, accurate monitoring and early warning of network public opinions. The system was verified. The results show that the system has strong practicality and can meet users′ needs.
Keywords: network public opinion management; MVC model; structure design; clustering; Java
0 引 言
互聯(lián)網(wǎng)隨著信息技術(shù)的發(fā)展已成為越來越重要的媒體,互聯(lián)網(wǎng)輿情監(jiān)測能力也已備受政府關(guān)注[1?3]。針對網(wǎng)絡(luò)輿情的隱蔽性與廣泛性對相關(guān)技術(shù)存在限制性的缺點,本文提出一種基于MVC模式的網(wǎng)絡(luò)輿情管理系統(tǒng),旨在提高互聯(lián)網(wǎng)輿情檢測能力。該系統(tǒng)基于Windows平臺,應(yīng)用Apache服務(wù)器,采用Java開發(fā)語言,并結(jié)合AJAX技術(shù),且實現(xiàn)基于模型?試圖?控制(Model?View?Control,MVC)的系統(tǒng)技術(shù)架構(gòu)以解決系統(tǒng)結(jié)構(gòu)設(shè)計問題。從而達(dá)到對網(wǎng)絡(luò)輿情的高效采集、準(zhǔn)確監(jiān)控與預(yù)警。
1 系統(tǒng)架構(gòu)技術(shù)
本文通過分析網(wǎng)絡(luò)輿情管理需求,采用MVC三層架構(gòu)設(shè)計該系統(tǒng),以有效解決系統(tǒng)結(jié)構(gòu)設(shè)計問題。其中MVC是應(yīng)用于交互式的Web,尤其適用于存在大量客戶訪問的情況[4?5]。該系統(tǒng)架構(gòu)所用技術(shù)包括網(wǎng)絡(luò)蜘蛛技術(shù)、垂直搜索采集、文本預(yù)處理與聚類和信息分析跟蹤技術(shù)。網(wǎng)絡(luò)蜘蛛技術(shù)輔助獲取輿情語料的核心是不斷通過網(wǎng)頁中的超鏈接獲取其他各個網(wǎng)頁內(nèi)容,其工作流程如圖1所示。
垂直搜索采集技術(shù)是搜索引擎的一個細(xì)分。相比于普通搜索引擎是抽取所有網(wǎng)頁內(nèi)容,垂直搜索引擎則僅是對相關(guān)行業(yè)信息進(jìn)行整合[6]。網(wǎng)頁文本預(yù)處理技術(shù)是對網(wǎng)頁進(jìn)行去重與特征提取,文本聚類則是為了方便人們在海量文獻(xiàn)中定位有用文獻(xiàn)而對文獻(xiàn)進(jìn)行的有效分類方法,目前常用的有六類聚類方法:劃分、層次、密度分類、網(wǎng)絡(luò)分類和基于模型的方法。通過文本聚類得到關(guān)注的網(wǎng)站,對其進(jìn)行輿情分析與跟蹤,并分析文章語境進(jìn)行情感傾向性判斷。
2 網(wǎng)絡(luò)輿情管理系統(tǒng)需求分析
網(wǎng)絡(luò)輿情管理系統(tǒng)是實時分析管理與監(jiān)督網(wǎng)絡(luò)輿情信息,并將處理結(jié)果向用戶展示的系統(tǒng)。在設(shè)計系統(tǒng)時,需考慮其功能可擴(kuò)展性與后期的可維護(hù)性。同時,系統(tǒng)分析信息需全面廣泛覆蓋網(wǎng)絡(luò)媒介。網(wǎng)絡(luò)輿情監(jiān)督管理系統(tǒng)結(jié)構(gòu)圖如圖2所示。
網(wǎng)絡(luò)輿情監(jiān)管系統(tǒng)功能主要包括輿情規(guī)劃、檢索收集、統(tǒng)計分析、預(yù)警和分類評估功能。網(wǎng)絡(luò)輿情規(guī)劃是設(shè)定監(jiān)督主題,并確定搜索范圍;網(wǎng)絡(luò)輿情檢索由全文數(shù)據(jù)庫提供檢索功能;系統(tǒng)的關(guān)鍵是輿情分析,使用數(shù)據(jù)庫和數(shù)據(jù)挖掘等技術(shù)對海量數(shù)據(jù)進(jìn)行分析以實現(xiàn)輿情信息的精確管理;通過設(shè)置閾值系統(tǒng)實現(xiàn)自動報警;輿情分類評估是分析總結(jié)與備案輿情事件,分析統(tǒng)計輿情熱點,為優(yōu)化輿情監(jiān)督系統(tǒng)提供依據(jù)。除以上所述功能外,該系統(tǒng)還包括個性化、用戶權(quán)限管理與數(shù)據(jù)維護(hù)等功能。系統(tǒng)簡要流程如圖3所示。系統(tǒng)功能結(jié)構(gòu)關(guān)系圖如圖4所示。
該系統(tǒng)的性能需求是滿足準(zhǔn)確數(shù)據(jù)輸入、輸出與遠(yuǎn)程傳輸。系統(tǒng)對本地局域網(wǎng)的響應(yīng)速度不超過5 s,遠(yuǎn)程用戶的響應(yīng)速度不超過10 s,且要保證數(shù)據(jù)訪問與傳輸?shù)陌踩裕约皯?yīng)用級數(shù)據(jù)庫的安全。
3 系統(tǒng)設(shè)計
3.1 系統(tǒng)架構(gòu)
本文設(shè)計的系統(tǒng)采用MVC先進(jìn)架構(gòu)與B/S結(jié)構(gòu),根據(jù)監(jiān)督站點數(shù)量決定信息采集服務(wù)器個數(shù),服務(wù)器為主流服務(wù)器、Linux 操作系統(tǒng)??筛鶕?jù)實際情況調(diào)整其他應(yīng)用模塊服務(wù)器的數(shù)量,最終實現(xiàn)基于瀏覽器的瘦客戶端模式[7?8]。該系統(tǒng)網(wǎng)絡(luò)拓?fù)鋱D如圖5所示。系統(tǒng)開發(fā)采用Java語言,使用標(biāo)準(zhǔn)通信協(xié)議,數(shù)據(jù)庫為SQL Server,以提高系統(tǒng)性能,網(wǎng)頁顯示界面采用HTML與AJAX集成技術(shù)。該系統(tǒng)技術(shù)架構(gòu)如圖6所示。
3.2 數(shù)據(jù)庫設(shè)計
數(shù)據(jù)庫設(shè)計需要按照數(shù)據(jù)規(guī)模進(jìn)行設(shè)計,并充分考慮數(shù)據(jù)容量。該設(shè)計主要有逐步分解數(shù)據(jù)流對數(shù)據(jù)進(jìn)行分析與面向?qū)ο笠罁?jù)功能對數(shù)據(jù)分類這兩種策略[9?10]。數(shù)據(jù)庫根據(jù)系統(tǒng)功能而產(chǎn)生,一般設(shè)計過程包括目標(biāo)確定與數(shù)據(jù)收集、概念設(shè)計、數(shù)據(jù)模型建立、數(shù)據(jù)庫的維護(hù)。
3.3 系統(tǒng)功能與安全設(shè)計endprint
該系統(tǒng)主要由信息采集、信息檢索、信息分析與服務(wù)三個模塊構(gòu)成,如圖7所示。系統(tǒng)從大量Web頁面采集信息并進(jìn)行結(jié)構(gòu)化存儲供系統(tǒng)數(shù)據(jù)分析,系統(tǒng)中最為關(guān)鍵的處理模塊是輿情分析模塊,采用聚類方法分析挖掘預(yù)處理后的素材信息。
系統(tǒng)安全問題始終是系統(tǒng)構(gòu)建者需要著重考慮的,本系統(tǒng)采用IP控制、驗證碼、三方認(rèn)證和加密鎖等措施應(yīng)對惡意攻擊與入侵情況。
4 系統(tǒng)實現(xiàn)與驗證
該系統(tǒng)基于Windows系統(tǒng)開發(fā),運行采集爬蟲與并行搜索以提高效率。所實現(xiàn)系統(tǒng)的登錄界面如圖8所示。用戶管理界面如圖9所示。其包括用戶創(chuàng)建、刪改、訪問權(quán)限的管理與用戶信息查詢、登錄記錄等功能。輿情采集事件管理實現(xiàn)界面如圖10所示。本文最后對系統(tǒng)進(jìn)行功能測試,并給出了測試報告。通過測試報告可看出,本文所設(shè)計的系統(tǒng)準(zhǔn)確性高,具有較強的實用性,能滿足用戶需求。
5 結(jié) 語
針對網(wǎng)絡(luò)輿情的隱蔽性與廣泛性對相關(guān)技術(shù)存在限制性的缺點,本文提出一種基于MVC模式的網(wǎng)絡(luò)輿情管理系統(tǒng)。該系統(tǒng)基于Windows平臺,應(yīng)用Apache服務(wù)器,采用Java開發(fā)語言,并結(jié)合AJAX技術(shù),以實現(xiàn)對網(wǎng)絡(luò)輿情的高效采集、準(zhǔn)確監(jiān)控與預(yù)警。本文最后對該系統(tǒng)進(jìn)行驗證,結(jié)果表明該系統(tǒng)具有較強的實用性,滿足了用戶需求。
參考文獻(xiàn)
[1] 丁學(xué)君.基于SIR的SNS網(wǎng)絡(luò)輿情話題傳播模型研究[J].計算機(jī)仿真,2015,32(1):241?247.
[2] 史玉珍,單冬紅.基于Hadoop的網(wǎng)絡(luò)輿情監(jiān)控平臺的研究[J].電子測試,2015(9):71?73.
[3] 李宇博.基于文本聚類技術(shù)的網(wǎng)絡(luò)輿情分析系統(tǒng)的研究與應(yīng)用[D].天津:天津工業(yè)大學(xué),2016.
[4] 丁蒙蒙.突發(fā)事件網(wǎng)絡(luò)輿情監(jiān)測指標(biāo)體系構(gòu)建研究[D].成都:電子科技大學(xué),2015.
[5] EDWARDS J, MCCURLEY K, TOMLIN J. An adaptive model for optimizing performance of an incremental Web crawler [J]. Association for computing machinery, 2001: 106?113.
[6] 孟強,李海晨.Web數(shù)據(jù)挖掘技術(shù)及應(yīng)用研究[J].電腦與信息技術(shù),2017,25(1):59?62.
[7] 肖紅,許少華.改進(jìn)的話題檢測和跟蹤算法研究[J].計算機(jī)技術(shù)與發(fā)展,2014(9):84?88.
[8] CHANG F, DEAN J, GHEMAWAT S, et al. A distributed storage system for structured data [C]// Proceedings of the 7th Symposium on Operating System Design and Implementation, 2006: 205?218.
[9] 房春波.“微時代”高校網(wǎng)絡(luò)輿情生成與干預(yù)機(jī)制研究[J].通訊世界,2016(5):252?253.
[10] MEHRA A. The development of social network analysis: a study in the sociology of science by Linton C. Freeman [J]. Empirical press, 2005, 50(1): 148?151.endprint