陳顯龍
(東莞理工學院城市學院,廣東 東莞 523419)
?
基于大數(shù)據(jù)輿情分析的圖書館信息增值服務(wù)
陳顯龍
(東莞理工學院城市學院,廣東 東莞 523419)
[摘 要]目前大數(shù)據(jù)技術(shù)在各行各業(yè)得到了廣泛的應(yīng)用,而圖書館信息服務(wù)仍處于傳統(tǒng)的模式中,本文把大數(shù)據(jù)輿情分析與圖書館信息服務(wù)結(jié)合起來進行了淺析,首先介紹了大數(shù)據(jù)與輿情分析的概念,其次簡述了圖書館信息增值服務(wù)的內(nèi)涵,最后就如何實現(xiàn)大數(shù)據(jù)輿情分析下的圖書館信息增值服務(wù)進行了探討。本文對圖書館從業(yè)人員提升業(yè)務(wù)水平有一定的積極意義。
[關(guān)鍵詞]大數(shù)據(jù);輿情分析;圖書館;增值
近兩年來,大數(shù)據(jù)已經(jīng)成為全民關(guān)注的一個名詞,各行各業(yè)紛紛投身大數(shù)據(jù)的熱潮,政府部門也相繼啟動各種大數(shù)據(jù)項目。而當前現(xiàn)有數(shù)據(jù)中心技術(shù)不能完全滿足大數(shù)據(jù)的需求,這就有可能會引發(fā)IT界的技術(shù)革新、架構(gòu)重構(gòu)等問題。目前輿情服務(wù)正在進行行業(yè)規(guī)范和整合,基于大數(shù)據(jù)的輿情分析,利用大數(shù)據(jù)技術(shù)可以精準地掌握各項事態(tài)的發(fā)展,從而有利于得出正確結(jié)論,作出精準預(yù)測。 這樣的形勢為圖書館信息服務(wù)的發(fā)展帶來了機遇和挑戰(zhàn),將基于大數(shù)據(jù)的輿情分析與傳統(tǒng)的圖書館信息服務(wù)相結(jié)合,可以挖掘用戶潛在的知識需求,拓展圖書館信息服務(wù)的渠道,衍生出新的信息增值服務(wù),達到圖書館資源、服務(wù)、用戶三者之間的有機結(jié)合,推動行業(yè)的發(fā)展。
1.1大數(shù)據(jù)的概念
大數(shù)據(jù)這一概念是在2011年5月首次提出的,但是到目前為止人們對于大數(shù)據(jù)的概念、內(nèi)涵等有著多種的定義與理解,并未形成一個統(tǒng)一的規(guī)范。通過比較不同的概念會發(fā)現(xiàn),盡管各種定義在對大數(shù)據(jù)的內(nèi)涵的具體表達中會有所不同,但普遍存在這樣一個共識:大數(shù)據(jù)是指無法在可承受的時間范圍內(nèi)用常規(guī)軟件工具進行捕捉、管理和處理的數(shù)據(jù)集合,是需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力來適應(yīng)海量、高增長率和多樣化的信息資產(chǎn)。下面筆者從大數(shù)據(jù)的內(nèi)容和應(yīng)用上談一下自己的認識。
首先,大數(shù)據(jù)從內(nèi)容上包含了三種類型的數(shù)據(jù),即結(jié)構(gòu)化、半結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù)。結(jié)構(gòu)化數(shù)據(jù)是指能夠用統(tǒng)一的邏輯結(jié)構(gòu)表示的數(shù)據(jù),如數(shù)字、符號等,反之則為非結(jié)構(gòu)化數(shù)據(jù),如郵件、視頻、論壇帖子等。而半結(jié)構(gòu)化的數(shù)據(jù)與上面兩種不同,它雖然是結(jié)構(gòu)化的數(shù)據(jù),但結(jié)構(gòu)變化很大,無法在數(shù)據(jù)庫中簡單地建一個表與之對應(yīng),如智能設(shè)備、社交網(wǎng)站等會產(chǎn)生大量的半結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù)。在當前這樣一個網(wǎng)絡(luò)社會中,人們所面對的信息更多的半結(jié)構(gòu)化與非結(jié)構(gòu)化的數(shù)據(jù),對這些數(shù)據(jù)的分析是傳統(tǒng)數(shù)據(jù)挖掘工具的短板,也正是基于大數(shù)據(jù)技術(shù)的新型企業(yè)的優(yōu)勢。
其次,從大數(shù)據(jù)的應(yīng)用上來說,大數(shù)據(jù)技術(shù)并不是靜態(tài)地存儲與展示數(shù)據(jù),而是動態(tài)地對數(shù)據(jù)進行高速、實時分析。如在對圖書館用戶需求分析的過程中,可以結(jié)合用戶往日的閱讀行為、查詢記錄等,運用大數(shù)據(jù)技術(shù)實時預(yù)測出用戶的需求。在實際應(yīng)用中,大數(shù)據(jù)的應(yīng)用往往與云計算相結(jié)合,云計算所特有的高速、分布式處理技術(shù)、云存儲技術(shù)等是大數(shù)據(jù)技術(shù)對海量數(shù)據(jù)進行挖掘的基礎(chǔ)和依托。
1.2輿情分析
輿情分析就是對某個問題相關(guān)的輿情進行深層次的分析研究,最終得到相關(guān)結(jié)論的過程。舉例來說就是,當一件事情發(fā)生后,人們通過網(wǎng)絡(luò)、電視、報刊等途徑了解事情發(fā)生的詳情,隨之對其進行抨擊,或同情、或感性、或理性的評論,對這些評論進行分析、匯總,識別其中的關(guān)鍵信息,作出有利于事態(tài)發(fā)展的正確決定。輿情的收集渠道有多種,如報刊、門戶網(wǎng)站、論壇、微博等。
傳統(tǒng)輿情分析,依賴隨機采樣,采用模式識別、自然語言處理等技術(shù),來得出相關(guān)結(jié)論,作出態(tài)勢預(yù)測,具有單一化、靜態(tài)化的缺點。而基于大數(shù)據(jù)的輿情分析,在傳統(tǒng)的基礎(chǔ)上,采集更多的相關(guān)數(shù)據(jù),對所有的輿情信息進行量化,可以得出超出人類經(jīng)驗的精準化結(jié)果。如中國足球隊在時隔15年后再次進入12強的機率,傳統(tǒng)分析為32.7%,而結(jié)合了專業(yè)數(shù)據(jù)、隊員信息、天氣情況等各項指標的大數(shù)據(jù)分析,結(jié)果則為86.2%。
圖書館信息服務(wù)實質(zhì)上就是實現(xiàn)信息的傳播、交流、增值的過程。圖書館為用戶提供了紙制的、網(wǎng)絡(luò)的文字、圖像、視頻等信息,用戶對這些信息篩選、整理,使這些信息成為自己需要的有用信息,同時對這些信息分析、研究、判斷,使其效用與價值得到更大的發(fā)揮,從而實現(xiàn)信息的增值。
具體來說,信息的增值主要包括三個方面:一是量的增值;二是質(zhì)的增值;三是信息的使用價值。在實際工作中,對大量同類微觀信息的分析、加工,就可以獲得潛在的宏觀信息,通過量的積累,來產(chǎn)生質(zhì)的變化,微觀信息就會得到增值。同時在信息的增值過程中,隨著信息反映出來的新問題,人們需要及時作出新決策,在新的經(jīng)營決策中實現(xiàn)信息價值的再利用,也就是信息的二次增值。
對于圖書館的信息增值服務(wù),圖書館工作人員要在傳統(tǒng)圖書館對信息產(chǎn)品簡單的供給和接受模式基礎(chǔ)上,開展更多個性化、差異化的服務(wù)。圖書館擁有海量的紙質(zhì)資源與數(shù)字資源,如何將這些資源共享,利用基于大數(shù)據(jù)的輿情分析來增強信息的價值和創(chuàng)造力,實現(xiàn)圖書館資源信息的增值?下面筆者從3個方面來進行簡要探討。
3.1樹立“大數(shù)據(jù)思維”,拓展用戶主體
大數(shù)據(jù)時代帶給人們的不僅是先進的技術(shù)與工具,更重要的是一種新的思維模式——大數(shù)據(jù)思維。大數(shù)據(jù)關(guān)注的從來都不是局部、單線的的信息來源,而是盡可能多地拓展收集信息源,這樣最后得到的結(jié)論才能更精準。同樣,基于大數(shù)據(jù)的理念,圖書館應(yīng)將服務(wù)用戶延伸到社會的各個領(lǐng)域,如政府、企業(yè)等,將服務(wù)內(nèi)容延伸到輿情分析、預(yù)警,決策制定等事件處理的各個環(huán)節(jié)。
3.2打造信息資源輿情監(jiān)測分析平臺,實現(xiàn)數(shù)據(jù)價值最大化
圖書館工作人員應(yīng)將大數(shù)庫技術(shù)與云計算技術(shù)結(jié)合,為政府和企業(yè)打造共享數(shù)據(jù)平臺,從而實現(xiàn)數(shù)據(jù)的互聯(lián)互通以及對輿情的實時監(jiān)測分析。這樣就能夠解決各系統(tǒng)之間的“孤島”狀態(tài),從數(shù)據(jù)收集、挖掘到數(shù)據(jù)提取、報表等,將各個系統(tǒng)數(shù)據(jù)、技術(shù)共享,實現(xiàn)信息數(shù)據(jù)價值的最大化。
下面筆者簡單描述一下數(shù)據(jù)平臺的具體實現(xiàn)方式。數(shù)據(jù)平臺利用物理服務(wù)器,搭建若干虛擬機,并基于NAS、IP SAN、FCS SAN等技術(shù),架構(gòu)虛擬化存儲體系。同時在此云平臺的基礎(chǔ)上,架構(gòu)輿情監(jiān)測分析系統(tǒng)。如圖1所示,平臺底層為基礎(chǔ)資源服務(wù)(IaaS),主要包括虛擬存儲、虛擬服務(wù)器等;中間層為平臺即服務(wù)(PaaS),主要為平臺提供大數(shù)據(jù)服務(wù)及相應(yīng)的技術(shù)組件完成輿情監(jiān)測分析的功能,如網(wǎng)頁爬蟲組件、輿情分析組件、日志服務(wù)等;最上層為軟件即服務(wù)(SaaS),為用戶提供輿情應(yīng)用服務(wù)。
圖1 信息輿情監(jiān)測分析平臺
3.3以用戶為導向,提升深層服務(wù)能力
圖書館應(yīng)當利用用戶閱讀的行為偏好,對用戶進行行為分析。在大數(shù)據(jù)時代,用戶行為數(shù)據(jù)主要由5個活動步驟產(chǎn)生:閱讀服務(wù)需求、閱讀活動信息采集、閱讀模式選擇、閱讀活動開展以及用戶閱讀反饋。圖書館應(yīng)根據(jù)用戶閱讀活動的生命周期,對行為數(shù)據(jù)進行采集、分析、決策等。同時在采集數(shù)據(jù)時應(yīng)盡量減少采集的盲點,提高采集數(shù)據(jù)的精桷性、及時性。通過對用戶行為數(shù)據(jù)的輿情分析,就可以勾勒出每一個用戶的“數(shù)字剪影”,洞悉用戶的需求,從而為用戶提供個性化、深層化的服務(wù)。
當前智能手機已經(jīng)成為大量用戶的必備工具,所以圖書館還應(yīng)在手機APP端作好文章,拓展采集數(shù)據(jù)的廣度和深度,增強數(shù)據(jù)的可用性。
筆者預(yù)見,隨著大數(shù)據(jù)應(yīng)用的深入,圖書館必將迎來新的發(fā)展。當然,圖書館信息服務(wù)的發(fā)展離不開專業(yè)人才的參與,而目前圖書館行業(yè)的人才結(jié)構(gòu)仍有些傳統(tǒng)和單一。因此圖書館還應(yīng)重點加強對數(shù)據(jù)人才的培養(yǎng)和引進,積極參與技術(shù)研發(fā),為行業(yè)的發(fā)展打好堅實的基礎(chǔ)??傊?,圖書館作為提供公共服務(wù)資源的部門,必須承擔起信息傳播的責任,通過對數(shù)據(jù)的生產(chǎn)、分析、解讀,探索出一條為用戶提供多元化信息服務(wù)的發(fā)展之路。
主要參考文獻
[1]張毅,趙雅潔.論大數(shù)據(jù)在圖書館管理與服務(wù)中的應(yīng)用[J].圖書館工作與研究,2015(9).
[2]唐濤.基于大數(shù)據(jù)的網(wǎng)絡(luò)輿情分析方法研究[J].現(xiàn)代情報,2014(3).
[3]李祝啟,陸和建,申林.政府網(wǎng)絡(luò)輿情日志大數(shù)據(jù)挖掘?qū)嵶C研究[J].情報科學,2014(11).
[4]宋毓.大數(shù)據(jù)環(huán)境下圖書館移動微服務(wù)研究[J].內(nèi)蒙古科技與經(jīng)濟,2015(13).
doi:10.3969/j.issn.1673 - 0194.2016.12.127
[中圖分類號]G252.65
[文獻標識碼]A
[文章編號]1673-0194(2016)12-0188-02
[收稿日期]2016-05-20
[基金項目]東莞理工學院城市學院青年教師項目(2014QJZ005Z)。