国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

微博的高校輿情監(jiān)控系統(tǒng)設(shè)計(jì)

2018-06-07 06:48文展龐建劉捷張力
無線互聯(lián)科技 2018年1期
關(guān)鍵詞:爬蟲網(wǎng)絡(luò)輿情微博

文展 龐建 劉捷 張力

摘要:隨著自媒體快速發(fā)展,網(wǎng)絡(luò)輿論的負(fù)面影響日益凸顯。文章以網(wǎng)絡(luò)輿論敏感詞為切入點(diǎn),以高校學(xué)生為目標(biāo)研究人群,針對(duì)其微博數(shù)據(jù),提出高校輿情監(jiān)控系統(tǒng)設(shè)計(jì)方案,通過自動(dòng)爬取目標(biāo)人群的原創(chuàng)微博內(nèi)容,存儲(chǔ)到本地?cái)?shù)據(jù)庫,并采用敏感詞匹配的方式對(duì)微博內(nèi)容進(jìn)行判斷。若出現(xiàn)敏感詞則觸發(fā)告警,通知高校網(wǎng)警等工作人員,從而實(shí)現(xiàn)高校網(wǎng)絡(luò)輿情監(jiān)控。

關(guān)鍵詞:網(wǎng)絡(luò)輿情;微博;爬蟲;監(jiān)控

校園網(wǎng)絡(luò)輿論是當(dāng)前影響大學(xué)生思想和行為的新興力量,相比其他輿情監(jiān)控,校園輿情監(jiān)控有其特殊性,它的主體是參與意識(shí)強(qiáng)、好奇心理重的在校學(xué)生,導(dǎo)致網(wǎng)絡(luò)輿論的聚焦和傳播迅速。個(gè)別學(xué)生因?yàn)閷W(xué)業(yè)壓力和心理原因,對(duì)社會(huì)事件的看法趨于偏激,產(chǎn)生不當(dāng)行為。因此,學(xué)校有責(zé)任對(duì)傾向性、突發(fā)性、群發(fā)性的網(wǎng)絡(luò)輿論及時(shí)進(jìn)行疏導(dǎo),有效化解偏激輿論,引導(dǎo)正確輿論。微博相比微信更加開放,成為網(wǎng)絡(luò)輿論的主要集散地,也成為校園情緒宣泄的重要平臺(tái)。雖然微博對(duì)于敏感言論可以實(shí)行舉報(bào),但長期以來發(fā)現(xiàn),由于微博用戶數(shù)量巨大,舉報(bào)審核需人工進(jìn)行,此項(xiàng)功能常常不管用。這就需要自動(dòng)化網(wǎng)絡(luò)輿情監(jiān)控,對(duì)于敏感言論進(jìn)行管理,達(dá)到凈化網(wǎng)絡(luò)空間的目的。

1 系統(tǒng)設(shè)計(jì)思路

針對(duì)校園輿情監(jiān)控,首先獲取1 000名成都某大學(xué)學(xué)生志愿者的微博賬號(hào),使用Python編寫微博爬蟲程序,并通過關(guān)鍵詞(ID,用戶名)模擬搜索,爬取相應(yīng)的用戶信息和微博內(nèi)容,存入MySQL數(shù)據(jù)庫,然后對(duì)數(shù)據(jù)進(jìn)行處理,將含敏感詞的微博內(nèi)容過濾出來,列出其對(duì)應(yīng)的微博賬號(hào),觸發(fā)告警程序,以郵件形式通知高校網(wǎng)警等工作人員,從而實(shí)現(xiàn)對(duì)校園網(wǎng)絡(luò)的輿情監(jiān)控。11敏感詞庫創(chuàng)建

系統(tǒng)敏感詞庫是專門針對(duì)高校輿情本身的特征所建立的,大學(xué)生作為高校的主體,校園內(nèi)與學(xué)習(xí)生活息息相關(guān)的一切事務(wù)都是其關(guān)注的焦點(diǎn)。另一方面,大學(xué)生作為思想覺悟較高和愛國熱情強(qiáng)烈的社會(huì)群體,對(duì)社會(huì)各種焦點(diǎn)熱點(diǎn)問題和國內(nèi)外的重大事件也有極大的興趣和關(guān)注度,對(duì)信息的關(guān)注自然會(huì)引發(fā)情緒、意愿、態(tài)度和意見的產(chǎn)生,進(jìn)而會(huì)產(chǎn)生相關(guān)輿情的主題。通過查閱相關(guān)的文獻(xiàn)資料和對(duì)近年來各大高校產(chǎn)生的重大事件進(jìn)行梳理,并結(jié)合其相關(guān)的網(wǎng)絡(luò)輿情信息,來建立敏感詞庫。文獻(xiàn)把高校輿論產(chǎn)生的主題類歸結(jié)為時(shí)事政治類、高校內(nèi)部管理類、高校安全類、大學(xué)生權(quán)益類、高校聲譽(yù)類和大學(xué)生心理健康類。系統(tǒng)的敏感詞也是圍繞著這些主題類篩選的,具體明細(xì)如表l所示,并且系統(tǒng)提供對(duì)敏感詞的管理模塊,可以根據(jù)當(dāng)前形勢實(shí)時(shí)地更新敏感詞庫。

1.2網(wǎng)絡(luò)輿情監(jiān)控流程

網(wǎng)絡(luò)輿情監(jiān)控是指整合互聯(lián)網(wǎng)信息采集技術(shù)及信息智能處理技術(shù),通過對(duì)互聯(lián)網(wǎng)海量信息自動(dòng)抓取、自動(dòng)分類聚類、主題檢測、專題聚焦,實(shí)現(xiàn)用戶的網(wǎng)絡(luò)輿情監(jiān)控和新聞專題追蹤等信息需求,形成簡報(bào)、報(bào)告、圖表等分析結(jié)果,為客戶全面掌握群眾思想動(dòng)態(tài),做出正確輿論引導(dǎo),提供分析依據(jù)。

本文提出了一個(gè)簡單易行的網(wǎng)絡(luò)輿情監(jiān)控方案,首先獲取監(jiān)控對(duì)象的數(shù)據(jù),存入數(shù)據(jù)庫,然后通過敏感詞判斷,找出包含敏感詞的內(nèi)容和相應(yīng)帳號(hào),進(jìn)行報(bào)警,其流程如圖1所示。

其中,獲取目標(biāo)網(wǎng)站數(shù)據(jù),指確定所要監(jiān)控的目標(biāo)網(wǎng)站,本文以微博作為監(jiān)控對(duì)象,使用爬蟲程序不間斷獲取前面所選取的1 000名大學(xué)生志愿者的微博內(nèi)容;數(shù)據(jù)存儲(chǔ),指將爬蟲獲取的微博數(shù)據(jù)存入MySQL數(shù)據(jù)庫,供分析使用;敏感詞判斷,指根據(jù)前面所選擇的敏感詞,對(duì)獲取的微博數(shù)據(jù)進(jìn)行分析對(duì)比,一旦發(fā)現(xiàn)敏感詞,觸發(fā)告警程序,將相應(yīng)的微博賬號(hào)和敏感微博內(nèi)容通過郵件通知高校網(wǎng)警,網(wǎng)警將重點(diǎn)關(guān)注該報(bào)警名單上的微博賬號(hào),實(shí)現(xiàn)對(duì)高校網(wǎng)絡(luò)輿情的監(jiān)控。

2測試結(jié)果

輿情監(jiān)控測試表明,基于該方案編程的程序能實(shí)現(xiàn)目標(biāo)帳號(hào)的微博內(nèi)容獲取,并存入數(shù)據(jù)庫,通過對(duì)網(wǎng)絡(luò)輿情敏感詞匯表的判斷,實(shí)現(xiàn)敏感內(nèi)容和帳號(hào)的報(bào)警,并形成輿情監(jiān)控報(bào)告,發(fā)送至高校網(wǎng)警郵箱,網(wǎng)警對(duì)其進(jìn)行密切關(guān)注。其中輿情監(jiān)控報(bào)告包含ID、用戶名、微博內(nèi)容等多個(gè)微博賬號(hào)數(shù)據(jù),如表2所示(為保護(hù)隱私,省略了部分ID和用戶名信息)。

因?yàn)槠?,只取了測試結(jié)果的前3條。從微博內(nèi)容可以看出,均含有敏感詞匯。通過對(duì)微博帳號(hào)的關(guān)注,可以及時(shí)發(fā)現(xiàn)高校學(xué)生存在的問題,從而避免一些極端事件的發(fā)生。

3結(jié)語

據(jù)中國互聯(lián)網(wǎng)絡(luò)信息中心(CNNIC)統(tǒng)計(jì)顯示,截至2016年12月,中國網(wǎng)民規(guī)模達(dá)7.31億,其中大學(xué)生群體占到很大的比例。這部分人群通過互聯(lián)網(wǎng)的社交網(wǎng)絡(luò)、微博、即時(shí)通信,對(duì)各個(gè)熱點(diǎn)問題表達(dá)自己的思想和態(tài)度,形成高校網(wǎng)絡(luò)輿情信息。但由于校園網(wǎng)絡(luò)沒有時(shí)間、空間的限制,是一個(gè)比較自由開放的公共平臺(tái),校園發(fā)生的一些熱點(diǎn)問題、突發(fā)事件都會(huì)以最快的速度在校園網(wǎng)傳播。而大學(xué)生由于自身年齡、知識(shí)、價(jià)值觀的限制,言論上會(huì)有一定的從眾、傾向性,若是形成負(fù)面的網(wǎng)絡(luò)輿論信息,會(huì)給高校的校園安全造成損害。

本文提出的高校網(wǎng)絡(luò)輿情監(jiān)控方案,可適用于微博、微信、博客、論壇等各種社交網(wǎng)絡(luò),通過輿情監(jiān)控報(bào)告,為掌握高校大學(xué)生的思想動(dòng)態(tài)提供依據(jù),并進(jìn)行積極引導(dǎo)和干預(yù)。

猜你喜歡
爬蟲網(wǎng)絡(luò)輿情微博
何以解憂?基于社交媒體大數(shù)據(jù)的睡眠健康公眾敘事研究
利用網(wǎng)絡(luò)爬蟲技術(shù)驗(yàn)證房地產(chǎn)灰犀牛之說
基于Python的網(wǎng)絡(luò)爬蟲和反爬蟲技術(shù)研究
利用爬蟲技術(shù)的Geo-Gnutel la VANET流量采集
大數(shù)據(jù)環(huán)境下基于python的網(wǎng)絡(luò)爬蟲技術(shù)
事實(shí)與流言的博弈
淺析網(wǎng)絡(luò)輿情治理
基于社會(huì)穩(wěn)定視角的網(wǎng)絡(luò)輿情預(yù)警機(jī)制構(gòu)建的思考
重大突發(fā)事件中微博之力不微
武宁县| 永寿县| 忻州市| 宜兴市| 当雄县| 罗山县| 墨玉县| 扎囊县| 通辽市| 宝丰县| 江孜县| 潞城市| 高邮市| 宁德市| 汉川市| 株洲市| 辰溪县| 庄浪县| 于都县| 汝阳县| 肇庆市| 南丰县| 定兴县| 丰原市| 志丹县| 利川市| 铁力市| 柏乡县| 易门县| 大安市| 山阳县| 东至县| 云阳县| 邵武市| 黎平县| 尚义县| 绍兴县| 尚志市| 建瓯市| 天长市| 远安县|