国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

易班環(huán)境下高校網(wǎng)絡(luò)輿情知識庫平臺建設(shè)研究

2016-04-12 07:21:03虞晨潔
關(guān)鍵詞:易班熱詞知識庫

虞晨潔

(東華大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院, 上海 201620)

易班環(huán)境下高校網(wǎng)絡(luò)輿情知識庫平臺建設(shè)研究

虞晨潔

(東華大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院, 上海 201620)

易班作為Web 2.0時(shí)代的產(chǎn)物,因其具有政府部門主導(dǎo)、用戶實(shí)名注冊、對象主體集中、專注教育服務(wù)等獨(dú)特優(yōu)勢,已成為當(dāng)前高校網(wǎng)絡(luò)輿情的重要組成部分。然而,隨著易班的快速發(fā)展,基于易班的各類高校網(wǎng)絡(luò)輿情信息呈海量增長,相關(guān)輿情監(jiān)測和引導(dǎo)過程中逐步凸顯各類問題,傳統(tǒng)的人工監(jiān)控方法已經(jīng)難以應(yīng)對,監(jiān)測和研判高校網(wǎng)絡(luò)輿情需要強(qiáng)有力的信息搜索技術(shù)?;诖?,本文提出易班環(huán)境下的高校網(wǎng)絡(luò)輿情知識庫平臺建設(shè)研究,在考慮信息采集的深度和廣度的同時(shí), 進(jìn)一步提高精度與準(zhǔn)度,并結(jié)合“東華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院易班網(wǎng)絡(luò)輿情知識庫系統(tǒng)”的開發(fā)工作,將理論研究和實(shí)踐應(yīng)用有機(jī)結(jié)合,取得初步成效。

易班;高校網(wǎng)絡(luò)輿情;監(jiān)測;知識庫

一、 易班環(huán)境下高校網(wǎng)絡(luò)輿情的內(nèi)涵和特征

(一) 易班環(huán)境下高校網(wǎng)絡(luò)輿情的內(nèi)涵

高校網(wǎng)絡(luò)輿情主要是指師生對相關(guān)國際重大問題、社會焦點(diǎn)問題、時(shí)政問題以及有關(guān)校園事務(wù)、學(xué)校管理等與自己利益相關(guān)的問題的情緒、看法、意見和態(tài)度[1]。易班作為Web2.0時(shí)代的產(chǎn)物,已成為滬上各高校師生活躍度最高的社交平臺之一,為我們深入研究師生需求、把握并研判高校網(wǎng)絡(luò)輿情提供了一個(gè)友好的網(wǎng)絡(luò)平臺,已成為當(dāng)前高校網(wǎng)絡(luò)輿情的重要組成部分。易班環(huán)境下的高校網(wǎng)絡(luò)輿情主要研究基于易班平臺的硬空間中高校師生對于各類事件的情緒、看法、意見和態(tài)度。

(二) 易班環(huán)境下高校網(wǎng)絡(luò)輿情的特征

易班環(huán)境下的高校網(wǎng)絡(luò)輿情除了具有一般網(wǎng)絡(luò)輿情的特征外,還因其用戶的特殊和高校環(huán)境的開放包容,從而具有自身的一些特征。

主體一元,實(shí)名認(rèn)證,網(wǎng)絡(luò)真實(shí)性得到保證。易班環(huán)境下高校網(wǎng)絡(luò)輿情的主體為高校師生,以在校的青年學(xué)生為主。由于他們在知識儲備、成長歷程、心理訴求等方面具有不少交集,因而易班用戶在彼此關(guān)注的輿情事件上易形成高校師生的代表性觀點(diǎn)。同時(shí),易班目前采取的注冊方式為實(shí)名認(rèn)證,使輿情處置針對性更強(qiáng),反應(yīng)速度更快。

政府主導(dǎo),專注教育服務(wù),信息源純凈。易班是市教委在全市高校中重點(diǎn)推進(jìn)的網(wǎng)絡(luò)文化建設(shè)項(xiàng)目,具有其官方性。上海市易班發(fā)展中心對于易班平臺監(jiān)控有力,為師生營造了一個(gè)相對純凈的網(wǎng)絡(luò)環(huán)境。易班從設(shè)立開始就以服務(wù)教育為目的,有較為明確的服務(wù)對象和目標(biāo),不摻雜企業(yè)利益等社會影響因素,不易受到外界干擾。

內(nèi)容豐富,多向交織互動(dòng),輿情形成迅速。易班環(huán)境下的高校網(wǎng)絡(luò)輿情涉及社會問題、校園問題等囊括社會各個(gè)方面的信息,表達(dá)和傳播方式多種多樣。以東華大學(xué)易班社區(qū)為例,下屬33個(gè)學(xué)院或部門,已有成員41502人,學(xué)校與學(xué)生、老師與學(xué)生、學(xué)生與學(xué)生之間的溝通形態(tài)呈現(xiàn)扁平化,減少了以往信息傳遞過程中的內(nèi)容失真和時(shí)間耗散。因而,輿情易在極短的時(shí)間內(nèi)傳播、交織、膨脹。

突出班級概念,分解輿論壓力。易班突出班級,在班級中問題的探討更容易以緩和的方式展開,現(xiàn)實(shí)生活中的親密關(guān)系有助于對同一問題達(dá)成共識,因此在班級的小輿論圈中就可以化解一些問題,為整個(gè)易班的大輿論場減輕了壓力[2]。

二、 基于易班的高校網(wǎng)絡(luò)輿情監(jiān)測和引導(dǎo)的現(xiàn)狀

隨著易班建設(shè)不斷推進(jìn),網(wǎng)站在思想教育、教務(wù)教學(xué)、生活服務(wù)、文化娛樂等方面吸引和積累的資源也愈加豐富和多樣化,由此產(chǎn)生的線上行為、信息文本、線下行動(dòng)等方面的海量數(shù)據(jù)是高校網(wǎng)絡(luò)輿情監(jiān)測和引導(dǎo)的重要來源,如何收集、管理和分析數(shù)據(jù)是網(wǎng)絡(luò)輿情研究工作中首當(dāng)其沖的問題。當(dāng)前,基于易班的高校網(wǎng)絡(luò)輿情監(jiān)測和引導(dǎo)工作已經(jīng)開始推進(jìn),但在其操作過程中也存在著一些問題。主要問題如下:

(一) 數(shù)據(jù)源的“質(zhì)量”價(jià)值尚未得到充分重視

在易班環(huán)境下,高校網(wǎng)絡(luò)輿情工作的重要內(nèi)容之一就是掌握有“量”、有“質(zhì)”的數(shù)據(jù)源,并在此基礎(chǔ)上為易班監(jiān)管者提供定量、定性分析結(jié)果。目前,這項(xiàng)工作并未得到足夠重視。

從2007年至今,易班網(wǎng)的建設(shè)已歷經(jīng)八年,目前該網(wǎng)站已經(jīng)覆蓋上海地區(qū)所有高校。截至2015年6月,已有注冊用戶180萬人,日均訪問量1000萬次,總計(jì)學(xué)習(xí)資料2000萬個(gè),總發(fā)帖量2570萬個(gè)。無論是從時(shí)間維度,還是從地理維度上來看,易班將占據(jù)全國高校師生網(wǎng)絡(luò)行為數(shù)據(jù)的制高點(diǎn),成為教育領(lǐng)域網(wǎng)絡(luò)輿情的重要數(shù)據(jù)來源和分析平臺。易班數(shù)據(jù)體量龐大,它的不斷激增,也意味著網(wǎng)站管理者對高校師生網(wǎng)絡(luò)行為的記錄范圍、測量范圍和分析范圍在不斷擴(kuò)大,但從現(xiàn)狀而言,這部分?jǐn)?shù)據(jù)并未得到充分利用。

需要指出的是,做好網(wǎng)絡(luò)輿情工作,除了重視數(shù)據(jù)的“量”之外,還要重視數(shù)據(jù)的“質(zhì)”。所謂數(shù)據(jù)的“質(zhì)”就是樣本的全面性[3]。所謂全面性,不僅僅指數(shù)量層面的多寡,更是要求指數(shù)據(jù)的采集面能夠覆蓋網(wǎng)站上所有信息。易班的數(shù)據(jù)源分為顯性數(shù)據(jù)和隱性數(shù)據(jù)兩個(gè)部分。顯性部分即是易班網(wǎng)上公開發(fā)布的各類信息,隱性部分是易班網(wǎng)上被屏蔽或者刪除的各類信息。由于易班本身的特殊定位,決定了其顯性部分?jǐn)?shù)據(jù)往往具有正面性,在一定程度上反映高校校園積極向上的一面。相對而言,隱性部分?jǐn)?shù)據(jù)中就有可能存在危害校園安全、社會安全的相關(guān)信息。將顯性數(shù)據(jù)和隱性數(shù)據(jù)綜合起來,才能立體多維地呈現(xiàn)易班環(huán)境中高校網(wǎng)絡(luò)輿情的真實(shí)面貌。

(二) 現(xiàn)有高校網(wǎng)絡(luò)輿情工作體系難以適應(yīng)快速多變網(wǎng)絡(luò)輿情監(jiān)測的需要

隨著新媒體技術(shù)的不斷演進(jìn),易班除了擁有網(wǎng)站平臺之外,還擁有移動(dòng)客戶端、微信公眾號等多個(gè)平臺。這些平臺既結(jié)合了時(shí)下各種主流網(wǎng)絡(luò)應(yīng)用,又較好地?cái)U(kuò)大了易班的社會知名度和影響力。其必然結(jié)果是:易班信息資源傳播速度不斷加快、易班的社會關(guān)注度得到不斷提高。因此,易班與其他社會網(wǎng)站一樣,也具有隨時(shí)爆發(fā)網(wǎng)絡(luò)輿情的可能性。在管理模式方面,絕大多數(shù)高?,F(xiàn)有網(wǎng)絡(luò)輿情工作體系采用傳統(tǒng)的自上而下的垂直管理模式。該模式在處理非緊急事件時(shí)能收到一定效果,但是在突發(fā)性網(wǎng)絡(luò)輿情事件中難以實(shí)現(xiàn)快速有效地響應(yīng)。在軟硬件建設(shè)方面,高校在網(wǎng)絡(luò)輿情監(jiān)測工作中對軟硬件的建設(shè)投入較少,這也直接影響到監(jiān)測實(shí)效[4]。網(wǎng)絡(luò)輿情監(jiān)控分析系統(tǒng)因購置成本較高、技術(shù)難度較大,故而國內(nèi)僅有小部分高校采取了有害信息過濾系統(tǒng)、網(wǎng)絡(luò)監(jiān)控系統(tǒng)等輿情安全技術(shù)措施。大多數(shù)高校的輿情信息仍然來源于人工檢測、抓取數(shù)據(jù)的傳統(tǒng)方式,該方式難以適應(yīng)快速多變網(wǎng)絡(luò)輿情監(jiān)測的需要。

(三) 易班“虛”“實(shí)”交互成效顯著,但在網(wǎng)絡(luò)輿情引導(dǎo)介入方面有待加強(qiáng)

易班與其他網(wǎng)絡(luò)應(yīng)用一樣,具有虛實(shí)二重性。易班的“虛”主要表現(xiàn)為信息內(nèi)容的虛擬化。作為一個(gè)全方位育人平臺,易班通過主動(dòng)對接學(xué)校教育教學(xué)資源,為學(xué)生提供一站式服務(wù),實(shí)現(xiàn)網(wǎng)絡(luò)平臺、教育資源、學(xué)習(xí)空間的共享。例如:東華大學(xué)推出“教學(xué)資源建設(shè)工程”,將教材、課件、視頻、科研成果等內(nèi)容供師生分享,提升教學(xué)資源的利用率和附加值;開設(shè)“課程答疑互助分享”專欄,增強(qiáng)師生的互動(dòng)性。

易班的“實(shí)”主要表現(xiàn)為建設(shè)隊(duì)伍的實(shí)體化和線下活動(dòng)的實(shí)際化。在建設(shè)隊(duì)伍實(shí)體化方面,易班在市級層面啟動(dòng)易班體制機(jī)制改革,摸索新的建設(shè)模式,進(jìn)一步加強(qiáng)易班核心團(tuán)隊(duì)建設(shè),培養(yǎng)了一支年輕且富有戰(zhàn)斗力的核心隊(duì)伍。同時(shí),在學(xué)校層面,分別成立了校易班發(fā)展中心和易班學(xué)生工作站,通過培訓(xùn)、交流,不斷提升隊(duì)伍的工作能力和水平,為易班的全面推進(jìn)奠定了扎實(shí)基礎(chǔ)。

易班在“虛”和“實(shí)”兩方面均取得了一定成效,且交互成效顯著,但在這個(gè)過程中,有關(guān)網(wǎng)絡(luò)輿情引導(dǎo)相關(guān)工作卻未充分介入,仍大多停留在表面的項(xiàng)目推進(jìn)、活動(dòng)開展等方面,基于背后的數(shù)據(jù)呈現(xiàn)、網(wǎng)絡(luò)輿情動(dòng)態(tài)等關(guān)注不夠。易班作為一個(gè)重要的社交平臺,數(shù)據(jù)的激增隱藏著重要的各類網(wǎng)絡(luò)輿情信息,網(wǎng)絡(luò)輿情的引導(dǎo)工作至關(guān)重要,需要在人員隊(duì)伍、引導(dǎo)策略等方面對于網(wǎng)絡(luò)空間進(jìn)行治理。就現(xiàn)狀而言,易班工作中網(wǎng)絡(luò)輿情引導(dǎo)介入需要增強(qiáng)。

三、 易班環(huán)境下建立高校網(wǎng)絡(luò)輿情知識庫平臺的必要性

易班發(fā)展迅速,已逐漸由上海向全國推廣,其所涉及到的學(xué)生用戶群體數(shù)呈指數(shù)級增加,基于易班的高校網(wǎng)絡(luò)輿情信息量海量增長,傳統(tǒng)的人工監(jiān)控方法已經(jīng)難以應(yīng)對,監(jiān)測和研判高校網(wǎng)絡(luò)輿情需要強(qiáng)有力的信息搜索技術(shù)。當(dāng)前,網(wǎng)絡(luò)輿情監(jiān)控研究的主要方法是通過獲取輿情話題的主題內(nèi)容,利用統(tǒng)計(jì)方法來實(shí)現(xiàn)熱點(diǎn)問題發(fā)現(xiàn)和話題態(tài)勢分析,缺少基于知識的推理,也沒有專門針對輿情知識庫的相關(guān)研究。國內(nèi)具有代表性的輿情監(jiān)控系統(tǒng),如方正智思輿情預(yù)警輔助決策系統(tǒng)、TRS網(wǎng)絡(luò)輿情監(jiān)測系統(tǒng)等,雖提供了較強(qiáng)的數(shù)據(jù)采集和統(tǒng)計(jì)分析功能,但在輿情分析與預(yù)警的精準(zhǔn)度方面仍存在不足,缺少對不同輿情事件間相互關(guān)系的挖掘等。導(dǎo)致這些問題的原因在于系統(tǒng)缺乏完善的底層知識庫平臺的支持,缺少知識對輿情監(jiān)控過程的有效引導(dǎo),導(dǎo)致系統(tǒng)難以準(zhǔn)確獲取輿情關(guān)鍵信息,從而無法有效實(shí)現(xiàn)突發(fā)事件網(wǎng)絡(luò)輿情預(yù)警。

易班融合了微博、論壇、博客等多種網(wǎng)絡(luò)應(yīng)用,在成為滬上各高校師生活躍度最高的社交平臺之一的同時(shí),因其具有政府部門主導(dǎo)、用戶實(shí)名注冊、對象主體集中、專注教育服務(wù)等獨(dú)特優(yōu)勢,為我們深入研究高校學(xué)生需求、把握并研判高校網(wǎng)絡(luò)輿情提供了一個(gè)友好的網(wǎng)絡(luò)平臺。因此,易班環(huán)境下的高校網(wǎng)絡(luò)輿情監(jiān)測應(yīng)更加關(guān)注技術(shù)革新,大力加強(qiáng)基于易班的高校網(wǎng)絡(luò)輿情知識庫系統(tǒng)平臺的建立,在考慮信息采集的深度和廣度的同時(shí), 進(jìn)一步提高系統(tǒng)的精度與準(zhǔn)度,從而及時(shí)應(yīng)對各類網(wǎng)絡(luò)輿情狀況的出現(xiàn)。易班環(huán)境下高校網(wǎng)絡(luò)輿情知識庫平臺建設(shè)是順應(yīng)數(shù)字時(shí)代的客觀要求,其勢在必行。

四、 基于易班的高校網(wǎng)絡(luò)輿情知識庫平臺建設(shè)與實(shí)踐

(一) 網(wǎng)絡(luò)輿情知識庫的定義

網(wǎng)絡(luò)輿情知識庫包含在輿情數(shù)據(jù)采集、輿情數(shù)據(jù)抽取、輿情監(jiān)測追蹤、輿情態(tài)勢分析等過程中的基礎(chǔ)知識和數(shù)據(jù)。它是關(guān)于輿情源、發(fā)布輿情的主體、輿情針對的客體、輿情話題主體、輿情分析指標(biāo)等的描述。通過建立易班環(huán)境下的高校網(wǎng)絡(luò)輿情知識庫可以形成易班熱點(diǎn)人物指數(shù)、熱詞指數(shù)和熱點(diǎn)貼文指數(shù)等,以便主管部門準(zhǔn)確獲取網(wǎng)絡(luò)輿情關(guān)鍵信息,對輿情監(jiān)控過程進(jìn)行有效引導(dǎo)。

(二) 基于易班的高校網(wǎng)絡(luò)輿情的組成

基于易班的高校網(wǎng)絡(luò)輿情的形成有兩個(gè)主要的要素:輿情具體指向的事件和輿情參與主體。因此,易班輿情監(jiān)測和研判的重點(diǎn)應(yīng)包括易班網(wǎng)絡(luò)特殊事件、易班網(wǎng)絡(luò)特殊主體[5]。易班網(wǎng)絡(luò)特殊事件是指在現(xiàn)實(shí)校園或易班網(wǎng)絡(luò)社區(qū)中容易形成巨大影響的重要事件,其關(guān)注度高、傳播迅速、社會影響范圍廣,如評獎(jiǎng)評優(yōu)、報(bào)送研究生、發(fā)展黨員等,社會熱點(diǎn)事件也是大學(xué)生們最為關(guān)注的焦點(diǎn)。在易班網(wǎng)絡(luò)社區(qū)中,那些活躍的成員將逐漸成為易班網(wǎng)絡(luò)空間里的強(qiáng)勢聲音,而其他易班用戶由于從眾心理而跟從這些聲音,從而使得易班網(wǎng)絡(luò)輿情易被這些少數(shù)主體所主導(dǎo)。同時(shí),由于高校各項(xiàng)事務(wù)的運(yùn)行有一定的時(shí)間規(guī)律,易班網(wǎng)絡(luò)輿情監(jiān)測和研判需要重點(diǎn)關(guān)注特殊時(shí)段,如網(wǎng)上選課期間、推優(yōu)入黨期間、畢業(yè)離校期間等。因此,基于易班的高校網(wǎng)絡(luò)輿情知識庫的基本體系架構(gòu)是由易班網(wǎng)絡(luò)特殊事件、易班網(wǎng)絡(luò)特殊主體、易班網(wǎng)絡(luò)特殊時(shí)段三個(gè)子庫組成。知識庫系統(tǒng)自動(dòng)實(shí)時(shí)抓取相關(guān)信息,并定期提供相關(guān)易班網(wǎng)絡(luò)輿情分析報(bào)告,為高校網(wǎng)絡(luò)輿情工作提供保障。

(三) 基于易班的高校網(wǎng)絡(luò)輿情知識庫系統(tǒng)平臺建設(shè)實(shí)踐——以東華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院為例

東華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院作為上海市首批推進(jìn)易班的試點(diǎn)單位,經(jīng)過8年多的發(fā)展,易班工作成效顯著,并積攢了相應(yīng)的高校網(wǎng)絡(luò)輿情工作經(jīng)驗(yàn)。2014年9月,學(xué)院結(jié)合學(xué)科優(yōu)勢,成立易班技術(shù)開發(fā)工作室,致力于以項(xiàng)目化的運(yùn)作模式開發(fā)和實(shí)現(xiàn)各類有東華特色的應(yīng)用系統(tǒng),并進(jìn)行基于平臺建設(shè)的各類大數(shù)據(jù)分析統(tǒng)計(jì)。該工作室成立后承接的第一項(xiàng)系統(tǒng)開發(fā)任務(wù)便是配合2014年度上海學(xué)校德育實(shí)踐研究課題“基于易班的高校網(wǎng)絡(luò)輿情知識庫建設(shè)”同步推進(jìn)的實(shí)體系統(tǒng)開發(fā),經(jīng)過一年的開發(fā)與測試,第一期系統(tǒng)基本完成。

1. 系統(tǒng)平臺架構(gòu)

在第一期開發(fā)實(shí)踐中,著重完成易班熱點(diǎn)人物知識庫、易班熱詞知識庫和易班熱點(diǎn)貼文知識庫三個(gè)子庫的建立。

(1) 易班熱點(diǎn)人物知識庫:易班用戶是易班環(huán)境下網(wǎng)絡(luò)輿情產(chǎn)生的主體,其特征是影響易班網(wǎng)絡(luò)輿情形成的直接因素。本庫是關(guān)于易班熱點(diǎn)人物的知識庫。易班熱點(diǎn)人物是指活躍度高、影響力大的易班用戶。易班熱點(diǎn)人物的選取標(biāo)準(zhǔn)是易班用戶的影響力和活躍度,選取指標(biāo)是用戶發(fā)帖量和貼文評論數(shù)。易班用戶發(fā)帖的次數(shù)越多、貼文的評論數(shù)越多,其在信息傳播過程中產(chǎn)生的影響越大,輿情研究價(jià)值就越高。對于易班用戶,我們主要對用戶名、所屬群體和貼文數(shù)等屬性進(jìn)行編碼,在此基礎(chǔ)上以貼文數(shù)量為參考指標(biāo)對易班用戶進(jìn)行排序,形成易班熱點(diǎn)人物指數(shù)。易班熱點(diǎn)人物知識庫的結(jié)構(gòu)設(shè)計(jì)為:人物編號、發(fā)帖人、開始時(shí)間、結(jié)束時(shí)間、所屬群體、發(fā)帖數(shù)、貼文主題。

(2) 易班熱詞知識庫:熱詞作為一種詞匯現(xiàn)象,反映了一個(gè)國家、一個(gè)地區(qū)的人們在某一個(gè)時(shí)期普遍關(guān)注的問題和事物,具有時(shí)代特征,反映一個(gè)時(shí)期的熱點(diǎn)話題及民生問題。本庫是關(guān)于易班熱詞的知識庫。易班熱詞包括兩類,一是在某一時(shí)間段內(nèi)易班用戶提及次數(shù)達(dá)到一定量的人名;二是在某一時(shí)間段內(nèi)易班用戶互動(dòng)數(shù)達(dá)到一定量的事件名。易班熱詞的選取標(biāo)準(zhǔn)是易班環(huán)境中出現(xiàn)頻率較高的詞,選取指標(biāo)是詞出現(xiàn)的頻率。建立熱詞知識庫的意義在于希望通過對易班熱詞的采集、跟蹤、整理、分析,探索易班熱詞與易班用戶關(guān)注熱點(diǎn)及易班用戶用網(wǎng)習(xí)慣之間的聯(lián)系,剖析詞匯關(guān)注群體的情感脈絡(luò)以及對事件和生活的態(tài)度。對于易班熱詞,我們主要對詞、詞所在貼文、發(fā)帖者等屬性進(jìn)行編碼。在此基礎(chǔ)上以熱詞出現(xiàn)頻率為唯一參考指標(biāo),進(jìn)行排序,形成易班熱詞指數(shù)。易班熱詞知識庫的結(jié)構(gòu)設(shè)計(jì)為:熱詞編號、熱詞、熱詞頻率、開始時(shí)間、結(jié)束時(shí)間、所屬貼文主題、發(fā)帖人。

(3) 易班熱點(diǎn)貼文知識庫:本知識庫用于歸納和掌握易班輿情熱點(diǎn)動(dòng)向,對可能演化為網(wǎng)絡(luò)風(fēng)險(xiǎn)事件的熱點(diǎn)事件實(shí)時(shí)監(jiān)控,對網(wǎng)絡(luò)熱點(diǎn)特征和發(fā)展規(guī)律進(jìn)行深入研究。易班熱點(diǎn)貼文是指在某一時(shí)間段內(nèi)易班用戶互動(dòng)數(shù)達(dá)到一定量的貼文。易班熱點(diǎn)貼文的選取標(biāo)準(zhǔn)是易班網(wǎng)上貼文的互動(dòng)情況,具體指標(biāo)是貼文的評論數(shù)、轉(zhuǎn)載數(shù)和點(diǎn)擊數(shù)。對于易班熱點(diǎn)貼文,我們主要對貼文主題、發(fā)帖人、所屬群體、瀏覽數(shù)、回復(fù)數(shù)等屬性進(jìn)行編碼。易班熱點(diǎn)貼文知識庫的結(jié)構(gòu)設(shè)計(jì)為:貼文編號、貼文主題、發(fā)帖人、學(xué)校、學(xué)院、班級、開始時(shí)間、結(jié)束時(shí)間、瀏覽量、回復(fù)數(shù)。

圖1 易班輿情知識庫系統(tǒng)平臺架構(gòu)

2. 系統(tǒng)流程分析

易班的主要數(shù)據(jù)來自于易班的帖文,建設(shè)基于易班的高校網(wǎng)絡(luò)輿情知識庫系統(tǒng)主要圍繞易班的帖文進(jìn)行系統(tǒng)建設(shè)和分析。由于易班尚未開放數(shù)據(jù)查詢的公共接口,因此目前對易班的帖文數(shù)據(jù)主要依靠網(wǎng)絡(luò)爬蟲獲取。本系統(tǒng)能夠自動(dòng)獲取限定時(shí)間段內(nèi)易班平臺的發(fā)帖信息,將網(wǎng)絡(luò)爬蟲所得的易班帖文數(shù)據(jù)經(jīng)過篩選和清洗之后放入數(shù)據(jù)庫系統(tǒng)中,依靠數(shù)據(jù)庫系統(tǒng)的信息整合能力對易班數(shù)據(jù)進(jìn)行分析、數(shù)據(jù)挖掘,最后根據(jù)需要將獲得的結(jié)果集以圖標(biāo)或表格的形式展示給用戶,使用戶能夠直觀地獲取易班的數(shù)據(jù)信息。

圖2 易班輿情知識庫系統(tǒng)流程分析

3. 系統(tǒng)主要模塊設(shè)計(jì)

網(wǎng)絡(luò)爬蟲模塊:本模塊是數(shù)據(jù)獲取模塊,管理員啟動(dòng)該模塊,該模塊根據(jù)設(shè)定的時(shí)間,起始網(wǎng)頁地址自動(dòng)從易班網(wǎng)站上獲取相關(guān)貼文的原網(wǎng)頁,并下載原網(wǎng)頁存儲于數(shù)據(jù)庫中。爬蟲采用廣度優(yōu)先搜索,搜索與初始URL一定距離內(nèi)的網(wǎng)頁,保證對淺層網(wǎng)頁的優(yōu)先處理。

圖3 易班輿情知識庫系統(tǒng)主要模塊設(shè)計(jì)

數(shù)據(jù)清洗模塊:由網(wǎng)絡(luò)爬蟲模塊獲取并存儲于數(shù)據(jù)庫中的原網(wǎng)頁包含網(wǎng)頁中的所有信息,而這些信息并不都是我們所需要的,我們需要從原網(wǎng)頁中獲取我們所需要的貼文信息以及發(fā)帖人信息。我們利用JAVA程序從數(shù)據(jù)庫中獲取原網(wǎng)頁,利用HTML解析工具獲取需要的信息塊,并結(jié)合正則表達(dá)式工具提取貼文、發(fā)帖人、瀏覽量、回復(fù)量等信息,并將這些信息分別存入數(shù)據(jù)庫中的貼文表、用戶表等不同表中。

數(shù)據(jù)分析模塊:對存儲于數(shù)據(jù)庫中的各種數(shù)據(jù)表我們還需要作進(jìn)一步的中文分詞分析,獲取更多的信息。利用JAVA程序通過設(shè)計(jì)好的SQL語句生成各類數(shù)據(jù)報(bào)表的視圖,并對貼文進(jìn)行進(jìn)一步的分詞分析。利用分詞工具IKAnalyzer將貼文主題進(jìn)行劃分,通過添加用戶詞庫和刪除無關(guān)詞語和虛詞等手段確保分詞產(chǎn)生的結(jié)果的準(zhǔn)確性,并通過數(shù)據(jù)分析將“熱詞”進(jìn)行提煉并再次存入數(shù)據(jù)庫。

數(shù)據(jù)展示模塊:最后數(shù)據(jù)以圖表的形式展現(xiàn)給用戶,利用PHP連接數(shù)據(jù)庫,從數(shù)據(jù)庫中獲取分析后的數(shù)據(jù),前臺通過ichartjs和HTML5將數(shù)據(jù)繪制成圖像和表格。

本系統(tǒng)基本按照原定計(jì)劃,根據(jù)當(dāng)前高校網(wǎng)絡(luò)輿情搜集、研判的基本規(guī)律,初步完成“基于易班的高校網(wǎng)絡(luò)輿情知識庫系統(tǒng)建設(shè)”第一期相關(guān)任務(wù),研究成果兼具理論性和應(yīng)用性,有較好的參考價(jià)值。第二期開發(fā)階段,我們將從以下幾個(gè)方面進(jìn)行推進(jìn):一是子知識庫建立不斷完善,在前期易班熱點(diǎn)人物知識庫、易班熱詞知識庫、易班熱點(diǎn)貼文知識庫的基礎(chǔ)上,拓展功能,完成易班網(wǎng)絡(luò)特殊時(shí)段等子庫的開發(fā)工作。二是知識庫的數(shù)據(jù)需要增大容量,囿于硬件基礎(chǔ),目前知識庫系統(tǒng)的數(shù)據(jù)僅能以東華大學(xué)易班平臺所有貼文為樣本,并不能建立起易班全網(wǎng)的輿情知識庫系統(tǒng)。在后續(xù)研究中,應(yīng)不斷擴(kuò)充樣本容量,從而實(shí)現(xiàn)更全面的輿情監(jiān)控。三是知識庫的成果需進(jìn)一步推廣。從研究成果來看,熱點(diǎn)事件、熱點(diǎn)人物和熱詞的查詢已經(jīng)實(shí)現(xiàn)。這對于當(dāng)前易班教師用戶來說,是提升易班用戶友好感的一項(xiàng)重要服務(wù)。因此,希望能夠?qū)⒈狙芯砍晒盎谝装嗟母咝>W(wǎng)絡(luò)輿情知識庫系統(tǒng)”軟件推廣至易班教師用戶,為教師提供更多樣化的服務(wù)。

易班作為滬上各高校師生活躍度最高的社交平臺之一,為我們深入研究高校學(xué)生需求、把握并研判高校網(wǎng)絡(luò)輿情提供了一個(gè)友好的網(wǎng)絡(luò)平臺。然而,隨著易班的快速發(fā)展,基于易班的各類高校網(wǎng)絡(luò)輿情信息呈海量增長,監(jiān)測和研判高校網(wǎng)絡(luò)輿情需要強(qiáng)有力的信息搜索技術(shù)。基于此,本文提出易班環(huán)境下的高校網(wǎng)絡(luò)輿情知識庫平臺建設(shè)研究,在考慮信息采集的深度和廣度的同時(shí), 進(jìn)一步提高精度與準(zhǔn)度,并結(jié)合“東華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院易班網(wǎng)絡(luò)輿情知識庫系統(tǒng)”的開發(fā)工作,將理論研究和實(shí)踐應(yīng)用有機(jī)結(jié)合。高校網(wǎng)絡(luò)輿情知識庫平臺建設(shè)順應(yīng)數(shù)字時(shí)代的客觀要求,其勢在必行。期望易班環(huán)境下的高校網(wǎng)絡(luò)輿情知識庫平臺建設(shè)為大數(shù)據(jù)時(shí)代下的網(wǎng)絡(luò)輿情管理體系建設(shè)提供有效借鑒和參考。

[1] 陶宇煒,熊長江,王娟琳.高校網(wǎng)絡(luò)輿情信息監(jiān)測管理體系的構(gòu)建研究[J].現(xiàn)代教育技術(shù),2013,(12):111-113.

[2] 陳然,吳桂山.新媒體事件對大學(xué)生價(jià)值觀教育影響的初步研究——易班網(wǎng)絡(luò)輿情研究系列[J].中國科教創(chuàng)新導(dǎo)刊,2013,(10):88-89.

[3] 曾潤喜.網(wǎng)絡(luò)輿情管控工作機(jī)制研究,圖書情報(bào)工作,2009,(18):79-82.

[4] 張建利,李羽佳.基于易班平臺的高校網(wǎng)絡(luò)輿情事件化解與引導(dǎo)機(jī)制研究[J].思想理論教育,2014,(9):81-84.

[5] 曾陽素,劉水強(qiáng),伍雁鵬,等.對高校網(wǎng)絡(luò)輿情系統(tǒng)建設(shè)的幾點(diǎn)思考[J].邵陽學(xué)院學(xué)報(bào):自然科學(xué)版,2012,(4):25-28.

2015-12-21

2014年度上海學(xué)校德育實(shí)踐研究課題“基于易班的高校網(wǎng)絡(luò)輿情知識庫建設(shè)”(項(xiàng)目編號:2014-D-116)的研究成果。

虞晨潔(1981—),女,上海人,講師,碩士,研究方向?yàn)樗枷胝谓逃-mail:yuchenjie@dhu.edu.cn

G641

A

1009-9034(2016)02-0069-06

猜你喜歡
易班熱詞知識庫
熱詞
“三全育人”視域下高校完善“易班”建設(shè)探析
熱詞
熱詞
淺議易班在高校共青團(tuán)改革中的作用
活力(2019年15期)2019-09-25 07:23:08
基于TRIZ與知識庫的創(chuàng)新模型構(gòu)建及在注塑機(jī)設(shè)計(jì)中的應(yīng)用
十九大熱詞 我踐行
高等學(xué)校易班平臺推廣建設(shè)探析
輔導(dǎo)員應(yīng)用“易班”開展工作的思考與建議
高速公路信息系統(tǒng)維護(hù)知識庫的建立和應(yīng)用
清原| 昆山市| 上蔡县| 垦利县| 丰县| 宜都市| 德昌县| 彭阳县| 余姚市| 修武县| 安康市| 四子王旗| 嵊州市| 磐安县| 博爱县| 万载县| 封开县| 建水县| 绿春县| 黄陵县| 黄大仙区| 固原市| 成都市| 浦东新区| 克拉玛依市| 娱乐| 陆河县| 东港市| 阿图什市| 门头沟区| 南靖县| 保亭| 灌云县| 都匀市| 唐山市| 阳朔县| 荣昌县| 广汉市| 上杭县| 镇赉县| 家居|