胡治宇 利莉
摘 ?要:大數(shù)據(jù)技術(shù)的合理應(yīng)用不僅可以有效地發(fā)現(xiàn)影響高校輿情走向的各種因素,而且可以促使高校運(yùn)用科學(xué)的方式方法來(lái)開(kāi)展輿情處理應(yīng)急方案。本文主要對(duì)大數(shù)據(jù)技術(shù)的特點(diǎn)在高校輿情監(jiān)測(cè)中的應(yīng)用進(jìn)行分析,又具體說(shuō)明輿情應(yīng)急機(jī)制的疏導(dǎo)辦法,不斷分析其原理,得出大數(shù)據(jù)下高校輿情應(yīng)急機(jī)制的研究結(jié)果。
關(guān)鍵詞:大數(shù)據(jù);高校輿情;應(yīng)急機(jī)制
中圖分類號(hào):TP391.1;TP393.2 ? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2096-4706(2019)18-0051-03
Abstract:The rational application of big data technology can not only effectively discover various factors affecting the trend of public opinion in universities,but also can urge universities to use scientific methods to carry out public opinion emergency plans. This paper mainly analyzes the characteristics of big data technology based on the application of public opinion monitoring in universities,and specifically explains the approach of public opinion emergency mechanism,and continuously analyzes its principle to obtain the research results of public opinion emergency mechanism under the big data.
Keywords:big data;public opinion in universities;emergency mechanism
0 ?引 ?言
當(dāng)代大學(xué)生在大數(shù)據(jù)時(shí)代的浪潮里缺乏社會(huì)閱歷和成熟的思想,在認(rèn)識(shí)問(wèn)題上不夠深刻清晰,易發(fā)生偏差或是做出錯(cuò)誤的決定。在論壇中的觀點(diǎn)易受集體化思維引導(dǎo),導(dǎo)致輿情發(fā)酵,引發(fā)錯(cuò)誤思想的大面積擴(kuò)張,或是受到負(fù)面情緒影響而被其主導(dǎo)自己的思想[1]。高校網(wǎng)絡(luò)輿情在大學(xué)生生活中占據(jù)很重要的地位,高校輿情反映了在校大學(xué)生的思想狀況和校園的穩(wěn)定和諧,大數(shù)據(jù)時(shí)代下的網(wǎng)絡(luò)環(huán)境影響著校園安全的一部分。
1 ?大數(shù)據(jù)環(huán)境下高校輿情監(jiān)測(cè)技術(shù)分析
1.1 ?網(wǎng)絡(luò)輿情信息采集及其預(yù)處理技術(shù)分析
該網(wǎng)絡(luò)輿情監(jiān)測(cè)系統(tǒng)主要采取了專門的抓取器在網(wǎng)頁(yè)上進(jìn)行輿情信息的采集,比如import.io、Gooseeker等編程語(yǔ)言。抓取器能夠?qū)⒉杉臄?shù)據(jù)進(jìn)行結(jié)構(gòu)化處理,并將這些數(shù)據(jù)存儲(chǔ)起來(lái)。在進(jìn)行數(shù)據(jù)采集時(shí)需要對(duì)數(shù)據(jù)進(jìn)行篩選和過(guò)濾,而這就需要依靠網(wǎng)頁(yè)清洗技術(shù)來(lái)完成,這項(xiàng)技術(shù)能夠?qū)⒕W(wǎng)頁(yè)當(dāng)中的“噪聲”數(shù)據(jù)過(guò)濾掉,目前運(yùn)用最為廣泛的網(wǎng)頁(yè)數(shù)據(jù)清洗技術(shù)主要為開(kāi)源軟件HTMLParser和DataWrangler。另外,在網(wǎng)絡(luò)輿情監(jiān)測(cè)系統(tǒng)當(dāng)中還利用了Shark-Search搜索策略算法來(lái)進(jìn)行改進(jìn),其主要依靠面向主題爬蟲(chóng)Heritrixs實(shí)現(xiàn)。為了更加快速便捷地對(duì)網(wǎng)頁(yè)數(shù)據(jù)信息進(jìn)行預(yù)處理,在該網(wǎng)絡(luò)輿情監(jiān)測(cè)系統(tǒng)當(dāng)中還利用了基于統(tǒng)計(jì)信息和語(yǔ)意理解相結(jié)合的算法來(lái)進(jìn)行網(wǎng)頁(yè)內(nèi)容的自動(dòng)摘要處理。高校輿情監(jiān)測(cè)系統(tǒng)輿情采集功能總體架構(gòu)設(shè)計(jì)圖如圖1所示。
1.2 ?開(kāi)源軟件HTML Parser
現(xiàn)如今,互聯(lián)網(wǎng)上的信息量呈現(xiàn)出幾何式增長(zhǎng)的趨勢(shì),人們要想從這些海量的信息當(dāng)中快速、準(zhǔn)確地獲取自己真正需要的信息,比如:圖片、標(biāo)題、鏈接等,那么就必須要借助一些自動(dòng)化工具[2]。但是目前Web網(wǎng)頁(yè)中所采取的HTML語(yǔ)言需要經(jīng)過(guò)瀏覽器解析后才能夠正常瀏覽,而HTML語(yǔ)言并不適合作為數(shù)據(jù)交換的方式交由機(jī)器處理。但是現(xiàn)在在網(wǎng)絡(luò)上所獲取的資料大多為HTML文檔,在這些文檔當(dāng)中包含著大量的信息和數(shù)據(jù),其中有很多信息和數(shù)據(jù)都是無(wú)用的,甚至還隱藏著錯(cuò)誤。如果在獲取網(wǎng)頁(yè)信息時(shí),將這些資料全部看作字符流,會(huì)加大數(shù)據(jù)處理的難度。因此,為了更好地解析和提取Web網(wǎng)頁(yè)上的信息,我們通常會(huì)采用HTML Parser開(kāi)源軟件來(lái)完成。該軟件會(huì)將整個(gè)信息處理的過(guò)程分為頁(yè)面裝載、頁(yè)面判斷以及信息提取這三個(gè)環(huán)節(jié)。首先,將頁(yè)面裝載到程序當(dāng)中,裝載成功之后才會(huì)進(jìn)行下一步,如果失敗那么本次信息提取就會(huì)結(jié)束。接下來(lái)就是進(jìn)行頁(yè)面判斷,這一步驟會(huì)由程序自動(dòng)完成,程序會(huì)將符合模板規(guī)定的信息部分提取出來(lái)。
整個(gè)頁(yè)面信息提取的過(guò)程都是由HTML Parser的過(guò)濾器來(lái)完成的,這主要是因?yàn)槊總€(gè)網(wǎng)站頁(yè)面格式以及風(fēng)格都存在較大的差異,在提取網(wǎng)頁(yè)信息時(shí),需要先分析網(wǎng)頁(yè)的結(jié)構(gòu),然后再根據(jù)不同網(wǎng)站,編寫(xiě)不同的模塊程序。但是用半結(jié)構(gòu)化HTML語(yǔ)言編寫(xiě)的網(wǎng)頁(yè),瀏覽器解析起來(lái)是比較麻煩的,這時(shí)采用HTML Parser開(kāi)源軟件中的過(guò)濾器和Parser解析器來(lái)對(duì)HTML標(biāo)簽進(jìn)行解析無(wú)疑是最好的一種方法。
1.3 ?基于大數(shù)據(jù)技術(shù)的高校輿情分析系統(tǒng)在微博中的具體應(yīng)用
微博具有影響范圍廣、傳播速度快等特點(diǎn),受到了當(dāng)代大學(xué)生的廣泛青睞,并成為他們應(yīng)用最為廣泛的一種社交平臺(tái)。這也使得微博逐漸成為了高校輿情的一種重要的表現(xiàn)形式。學(xué)生可以在微博平臺(tái)上,通過(guò)關(guān)注他人的方式來(lái)獲取他人所發(fā)表的信息,并形成自己的朋友圈。而高校就可以通過(guò)網(wǎng)絡(luò)輿情監(jiān)測(cè)系統(tǒng)對(duì)師生在微博上所發(fā)表的信息進(jìn)行有效的監(jiān)管,全面掌握高校輿情的發(fā)展態(tài)勢(shì),并針對(duì)突發(fā)輿情事件及時(shí)做出應(yīng)對(duì)措施,進(jìn)而有效地提升高校輿情治理的水平。
2 ?大數(shù)據(jù)技術(shù)的高校輿情分析系統(tǒng)的作用
2.1 ?利用大數(shù)據(jù)分析功能,主導(dǎo)輿論導(dǎo)向
作為高校中的學(xué)生,有自己的意見(jiàn)和思想是一件必備的技能,做到今日事今日解決,不要拖泥帶水,對(duì)生活中的任何情況都要有自己的主見(jiàn),不要因?yàn)榧w思想或者從眾心理打敗了獨(dú)特的見(jiàn)解,更不要?jiǎng)e人做什么自己就要跟著做,不一樣不代表著另類,只有有頭腦有想法的人才能主導(dǎo)自己的人生[3]。比如是提前預(yù)習(xí)的效率高還是課后復(fù)習(xí)的效率高,記單詞是早晨記憶力好還是深夜牢固,走出大門是從A路線快速還是B路線方便,這都是我們將會(huì)遇到的問(wèn)題。在大數(shù)據(jù)時(shí)代,我們不能隨時(shí)掌握別的思想,但是我們要把住的根基和底線,不會(huì)輕易動(dòng)搖。同時(shí),學(xué)生中的一些代表性人物,比如學(xué)生會(huì)主席、班長(zhǎng)、學(xué)習(xí)委員、生活委員等等一些活潑開(kāi)朗、待人接物有準(zhǔn)則又靈活的同學(xué)或是和同學(xué)們打成一片的同學(xué),這些人的一舉一動(dòng)經(jīng)常會(huì)帶動(dòng)一部分同學(xué)的行為。組織高校人才在高校論壇上進(jìn)行言論發(fā)表,多和同學(xué)進(jìn)行積極的互動(dòng),傳播真實(shí)有效的信息,在論壇上發(fā)表積極正能量的帖子并適時(shí)終止錯(cuò)誤導(dǎo)向,樹(shù)立鮮明的旗幟、堅(jiān)定立場(chǎng),有利于在輿情中抓緊主動(dòng)權(quán)、發(fā)展健康的大數(shù)據(jù)時(shí)代輿論。
2.2 ?利用輿情監(jiān)控機(jī)制,降低高校輿論危機(jī)的發(fā)生率
大數(shù)據(jù)環(huán)境下高校輿情形成與傳播的過(guò)程如圖2所示。
從圖2中可以看出,某個(gè)事件形成一定的聲勢(shì)輿論往往都是需要某個(gè)導(dǎo)火索所引發(fā)的,一旦導(dǎo)火索被點(diǎn)燃,那么就會(huì)超出輿情觸發(fā)的閾值,進(jìn)而導(dǎo)致均衡被打破,進(jìn)而爆發(fā)輿情危機(jī)。因此,高校應(yīng)當(dāng)要建立輿情預(yù)見(jiàn)機(jī)制,隨時(shí)監(jiān)控輿情的發(fā)生和演變,及時(shí)把控輿情走向,防止發(fā)生不良校園現(xiàn)象。降低突發(fā)事件的發(fā)生概率,維護(hù)學(xué)校的聲譽(yù)和威望。在零碎的碎片信息中找到有用信息,合理分類,有效使用大數(shù)據(jù)找出潛在的危險(xiǎn),從源頭杜絕輿情,控制走向,從而保證將輿情控制在合理范圍內(nèi)。
2.3 ?基于大數(shù)據(jù)技術(shù)的高校輿情監(jiān)測(cè)效果
通過(guò)大數(shù)據(jù)技術(shù)能夠?qū)Ω咝]浨橹械姆N種不確定因素進(jìn)行有效的捕捉,進(jìn)而推動(dòng)高校輿情治理的科學(xué)開(kāi)展[4]。并且大數(shù)據(jù)技術(shù)還能夠?yàn)楦咝5妮浨楣芾硖峁└啾O(jiān)測(cè)和判別工具,這樣一來(lái)就可以使得高校的輿情危機(jī)預(yù)判能力以及處理能力大大提升,同時(shí)大數(shù)據(jù)技術(shù)還能夠?qū)Ω咝]浨楣芾淼哪J胶退季S方式產(chǎn)生較大的影響,這對(duì)于高校的輿情管理具有非常重要的意義。
3 ?結(jié) ?論
綜上所述,大數(shù)據(jù)技術(shù)對(duì)于高校輿情的監(jiān)測(cè)和引導(dǎo)都具有非常重要的作用。高校的輿情能夠反映出全體師生的心態(tài),并通過(guò)社交媒體形成輿情大數(shù)據(jù)。這就要求高校應(yīng)當(dāng)合理地運(yùn)用大數(shù)據(jù)技術(shù),來(lái)為高校輿情的管理提供更加先進(jìn)的理念和工具,以此來(lái)幫助高校更好地對(duì)輿情數(shù)據(jù)進(jìn)行查找、監(jiān)督,并在此基礎(chǔ)上制定出科學(xué)的應(yīng)對(duì)策略,從而幫助高校掌握輿情的主導(dǎo)權(quán),提升高校輿情管理的水平。
參考文獻(xiàn):
[1] 侯菲菲,張帆,梁玉琪.大數(shù)據(jù)環(huán)境下突發(fā)事件網(wǎng)絡(luò)輿情分析及應(yīng)對(duì)策略 [J].新聞研究導(dǎo)刊,2016,7(18):74-75.
[2] 王曰芬.大數(shù)據(jù)環(huán)境下社會(huì)輿情及其演化分析研究 [J].情報(bào)資料工作,2016(3):5.
[3] 徐萍.大數(shù)據(jù)在高校網(wǎng)絡(luò)輿情應(yīng)急處置中的應(yīng)用探討 [J].圖書(shū)館工作與研究,2016(5):55-58.
[4] 岑詠華,王曰芬.大數(shù)據(jù)環(huán)境下社會(huì)輿情分析與決策支持的研究視角和關(guān)鍵問(wèn)題 [J].現(xiàn)代圖書(shū)情報(bào)技術(shù),2016(Z1):3-11.
作者簡(jiǎn)介:胡治宇(1983.03-),男,漢族,安徽黃山人,講師,碩士,研究方向:網(wǎng)絡(luò)工程、圖形圖像、多媒體技術(shù);利莉(1983.12-),女,漢族,江西景德鎮(zhèn)人,講師,碩士,研究方向:網(wǎng)絡(luò)工程、計(jì)算機(jī)科學(xué)與應(yīng)用。