魯秀紅
(濰坊學院,山東 濰坊 261061)
大數(shù)據(jù)環(huán)境下的圖書館服務創(chuàng)新思考
魯秀紅
(濰坊學院,山東 濰坊 261061)
當前已經(jīng)進入了大數(shù)據(jù)時代,大數(shù)據(jù)正在改變?nèi)藗兊男畔⑹褂闷门c習慣,給圖書館的數(shù)據(jù)存儲、信息服務、網(wǎng)絡架構等帶來了巨大的挑戰(zhàn)。本文在分析大數(shù)據(jù)對圖書館的影響的基礎上,就圖書館如何創(chuàng)新服務以適應大數(shù)據(jù)環(huán)境圖書館發(fā)展進行了深入思考。
大數(shù)據(jù);圖書館服務;信息服務
當今世界計算機網(wǎng)絡及信息技術迅猛發(fā)展,數(shù)以億計的網(wǎng)絡用戶正持續(xù)不斷地創(chuàng)造出海量驚人的復雜信息數(shù)據(jù),世界已經(jīng)進入到了以數(shù)據(jù)為中心的大數(shù)據(jù)時代。大數(shù)據(jù)正在改變當前信息傳播與利用的方式和手段,給圖書館等傳統(tǒng)信息收藏與提供利用的核心機構提出了巨大挑戰(zhàn),如何利用好大數(shù)據(jù)做好圖書館服務將是未來圖書館建設與發(fā)展的重要內(nèi)容。
2007年,在美國國家研究理事會計算機科學和遠程通訊委員會(NRC-CSTB)的演講報告中計算機圖靈獎得主吉姆·格雷(JimGrey)提出了以數(shù)據(jù)密集型計算為基礎的科學研究“第四范式”。[1]2008年,《科學》雜志刊出“Big-Data:Science in the Petabyte Era”一文,正式提出了“大數(shù)據(jù)”(Big Data)一詞。[2]2011年,在易安信(EMC)舉辦的主題為“云計算相遇大數(shù)據(jù)”的會議上,“大數(shù)據(jù)”概念正式誕生。同年,全球知名咨詢公司麥肯錫(Mckinseyand Company) 發(fā)布了“Bigdata:The next frontier for innovation,competition,andproductivity”《大數(shù)據(jù):創(chuàng)新、競爭和生產(chǎn)力的下一個前沿領域》報告,并在報告中指出“數(shù)據(jù)已經(jīng)滲透到每一個行業(yè)和業(yè)務職能領域,逐漸成為重要的生產(chǎn)因素;而人們對于海量數(shù)據(jù)的運用將預示著新一波生產(chǎn)率增長和消費者盈余浪潮的到來”。[3]從此大數(shù)據(jù)概念開始廣泛傳播。
大數(shù)據(jù)是一個抽象的概念,不同的領域從不同的角度對大數(shù)據(jù)有著不同理解與定義。美國英領出版公司(O'Reilly Media)馬格拉斯(Magoulas)把大數(shù)據(jù)概括性描述為:當數(shù)據(jù)的規(guī)模和性能要求成為數(shù)據(jù)管理分析系統(tǒng)的重要設計和決定因素時,這樣的數(shù)據(jù)就被稱為“大數(shù)據(jù)”。[3]根據(jù)馬格拉斯的理解,界定大數(shù)據(jù)除數(shù)據(jù)規(guī)模外,數(shù)據(jù)查詢與分析的復雜程度也是界定大數(shù)據(jù)的重要因素。麥肯錫公司則認為,“大數(shù)據(jù)”是指大小超出了典型數(shù)據(jù)庫軟件的采集、存儲、管理與分析能力的數(shù)據(jù)集。該定義指出,符合大數(shù)據(jù)標準的數(shù)據(jù)集大小是變化的,會隨著時間推移、技術進步而增長,不同部門符合大數(shù)據(jù)標準的數(shù)據(jù)集大小會存在差別。[4]概括各觀點,大數(shù)據(jù)至少應該具備以下幾個特征:Velocity(生成快速)、Variety(模態(tài)繁多)、Volume(體量浩大)和Value(價值巨大但密度很低)。[5]
大數(shù)據(jù)環(huán)境下,信息數(shù)據(jù)量迅猛增長,數(shù)據(jù)產(chǎn)生的方式多種多樣、范圍無處不在,人們的一舉一動都將產(chǎn)生出大量的信息數(shù)據(jù),信息數(shù)據(jù)的結構、類型、格式、形態(tài)愈加復雜。這對圖書館應用和存儲這些復雜的數(shù)據(jù)帶來了極大的挑戰(zhàn)性,其中不僅包括技術問題,也還包括社會問題。迎接這些挑戰(zhàn)至少需要解決以下幾大難題:首先,云計算的出現(xiàn)解決了海量數(shù)據(jù)的存儲與運算,但信息安全等問題依然不能讓用戶缺乏足夠的信任,而圖書館自身又無法充分保證大數(shù)據(jù)的安全;其次,海量數(shù)據(jù)的存儲及運算能力與大數(shù)據(jù)對存儲能力的高要求之間的矛盾,這將直接決定著圖書館在大數(shù)據(jù)時代能擁有什么質(zhì)量、多少數(shù)量的大數(shù)據(jù);第三,大數(shù)據(jù)對于圖書館的數(shù)據(jù)存儲范圍有著極高的要求。
信息服務已經(jīng)成為了當前圖書館服務的主要內(nèi)容,隨著互聯(lián)網(wǎng)技術的飛速發(fā)展和知識社會的到來,以互聯(lián)網(wǎng)信息搜索、查詢?yōu)榛A的知識信息服務也成為了現(xiàn)代圖書館服務體系中重要內(nèi)容。但不管是簡單的信息服務還是高層次的知識服務,最終都只是可歸納為是就數(shù)據(jù)而進行的服務。數(shù)據(jù)服務對圖書館服務層次提高出了更高的要求,盡管有了Web2.0等互動技術的推動后圖書館服務的個性化、人性化服務有了顯著提高,但交互性程度并不高,個性化、人性化服務也只是簡單的以用戶的結構化數(shù)據(jù)。 但大數(shù)據(jù)則要求圖書館不僅需要通過結構化數(shù)據(jù)了解用戶需要什么服務,也更需要利用大量的非結構化數(shù)據(jù)、 半結構化數(shù)據(jù)發(fā)現(xiàn)當前正在發(fā)生什么,預測和分析將來會發(fā)生什么,以便圖書館找到更好的服務策略與模式來應對未知的危機及挑戰(zhàn)。[6]
傳統(tǒng)的圖書館網(wǎng)絡架構是以用戶端向服務器發(fā)出請求,然后由服務器應答系統(tǒng)返回結果給客戶的垂直網(wǎng)絡結構。大數(shù)據(jù)時代,這種垂直網(wǎng)絡結構的服務請求將變得越來越少,也很難適應用戶的需要,取而代之的是橫向的水平結構請求服務。在大數(shù)據(jù)環(huán)境里,大量的異構數(shù)據(jù)存儲在分布廣泛、不同地域、各種類型的服務器中。當用戶發(fā)出一個搜索或查詢請求時,主要的運算是服務器之間的信息運算與交換,經(jīng)過服務器的運算后最終將結果返回給用戶。傳統(tǒng)的網(wǎng)絡架構已經(jīng)不能滿足大數(shù)據(jù)環(huán)境下的這種信息交換應用需求。[7]而且,大數(shù)據(jù)環(huán)境下的圖書館數(shù)據(jù)庫里的內(nèi)容是非結構化的,其移動和修改將耗費大量的人力物力,數(shù)據(jù)移動代價太高,更多的網(wǎng)絡設備將同時訪問數(shù)據(jù)中心,傳統(tǒng)圖書館網(wǎng)絡架構難以適應快速變化的需要。
在大數(shù)據(jù)時代里,傳統(tǒng)的信息檢索手段已經(jīng)無法滿足用戶獲取信息的需求,用戶首選渠道已經(jīng)不再去圖書館借閱工具書,而是借助搜索引擎實現(xiàn)快速檢索,圖書館逐步喪失了信息檢索優(yōu)勢。[8]為適應用戶的需要,圖書館必須提供更快捷準確又有針對性的個性化服務。因此,在大數(shù)據(jù)時代,圖書館應充分利用好大數(shù)據(jù)從海量、復雜的數(shù)據(jù)中挖掘出用戶的閱讀行為習慣、偏好和需求,根據(jù)分析得到的不同時期不同類型用戶的喜好和習慣,以便及時調(diào)整圖書館自身的發(fā)展策略。例如,圖書館系統(tǒng)中保存的圖書借還流通日志數(shù)據(jù)、書目查詢?nèi)罩緮?shù)據(jù)都應被有效利用,作為圖書館開展個性化服務的依據(jù)。所以,圖書館應依托圖書館大數(shù)據(jù)分析用戶,以用戶偏好為著眼點,進行圖書館資源個性化推薦,為用戶提供更高效、更準確的個性化圖書館服務。
大數(shù)據(jù)信息環(huán)境下,閱讀碎片化和功利化趨勢日漸明顯,用戶不再滿足于圖書館內(nèi)相關的知識信息,用戶更歡迎遍布網(wǎng)絡的非結構化數(shù)據(jù)、短小精悍的熱點評論、被加工過的知識信息產(chǎn)品。大數(shù)據(jù)中包含了規(guī)模龐大的重要的數(shù)據(jù)知識與信息,用戶期待對其進行更深度的分析,以便更好地從中發(fā)掘獲得自己需要的知識。信息可視化技術可以實現(xiàn)大規(guī)模非數(shù)值型信息資源的視覺呈現(xiàn),幫助人們更好地理解和分析數(shù)據(jù),能夠為圖書館的用戶提供一個簡易方便的知識信息環(huán)境,可以實現(xiàn)檢索過程及結果之間關系的主題可視化,并對數(shù)據(jù)庫內(nèi)容和時間分布進行可視化。利用信息可視化可以制作各類學科地圖,映射各領域的最新研究成果和學科發(fā)展趨勢,歸納不同知識領域的結構和特征,幫助用戶從更高層面挖掘信息資源中潛在的價值資源,提高用戶信息獲取效率和準確度,大致提升圖書館的服務水平。[9]
復雜海量的大數(shù)據(jù)對信息存儲、傳輸、挖掘、服務提出更高標準的要求與挑戰(zhàn),圖書館面對爆炸增長的大數(shù)據(jù),必須引入智能化信息服務技術,否則將無法滿足用戶對檢索技術的要求。首先,就圖書館自身來看,圖書館文獻保有量越來越大,信息類型越來越復雜,更需要運用智能化技術對海量數(shù)據(jù)進行深度加工挖掘,以解決依靠人力無法達到的目標。其次,就圖書館用戶來看,圖書館服務手段的智能化將大大提高用戶的檢索效率,同時智能化技術、工具、平臺應用,以及社交網(wǎng)絡、圖書館系統(tǒng)記錄中產(chǎn)生的大量非結構化、半結構化數(shù)據(jù),都能為圖書館的智能化決策分析與服務提供幫助。第三,從信息知識流通來看,服務智能化能夠促進資源有效整合,從而促進知識信息的智慧傳播,使知識的流通與傳播模式從單主體被動接收向多主體主動參與轉(zhuǎn)變。[10]
[1]周曉英.數(shù)據(jù)密集型科學研究范式的興起與情報學的應對[J].情報資料工作,2012( 2):5.
[2]Nature.Bigdata:Science in the Petabyte Era[ EB/OL].[2016-12-20].http://www.nature.com/nature/journal/v455/n7209/edsumm/e080904-01.html.
[3]Bigdata: Thenextfrontier forinnova tion,competition,andproductivity[EB/OL].[ 2016-12-20].http://www.mckins ey.com/insights/busines stechnology/bigdatathe nextfrontie rfor innovation.
[4]ManyikaJ,etal.Bigdata:Thenextfrontierforinnovation,competition,and productivity[ R].McKin-seyGlobalinstitute,2011:1-3.
[5]GantzJ,Reins elD.Extractingvaluefromchaos [R].IDC iView,2011:1-12.
[6]韓翠峰.大數(shù)據(jù)帶給圖書館的影響與挑戰(zhàn).圖書與情報,2012,( 5):37-40
[7]張計龍.數(shù)據(jù)驅(qū)動圖書館業(yè)務應用與服務創(chuàng)新.上海高校圖書情報工作與研究,2013( 3):1-6.
[8]吳鳴謙.大數(shù)據(jù)時代的圖書館用戶服務創(chuàng)新[J].技術與創(chuàng)新管理,2014(9):426-429.
[9]朱靜薇.大數(shù)據(jù)時代下圖書館的挑戰(zhàn)及其應對策略[J].現(xiàn)代情報,2013(5):9-13.
[10]張國杰.大數(shù)據(jù)視角下圖書館服務發(fā)展走向及策略研究[J].圖書館工作與研究,2014(6):8-12.
G252.61
A
1671-4288(2017)01-0115-02
2017-01-25
魯秀紅(1967-),女,山東青州人,濰坊學院圖書館副研究館員。
孫延波