大數(shù)據(jù)時代背景下高校圖書館的服務變革探析
鑒于圖書館界對“大數(shù)據(jù)”基本未作出應有反應的現(xiàn)狀,本研究就“大數(shù)據(jù)”概念與歷史發(fā)展及其由來、“大數(shù)據(jù)”戰(zhàn)略價值、“大數(shù)據(jù)”時代高校圖書館面臨的機遇與挑戰(zhàn)以及對策等作一探討,以冀引起業(yè)界對“大數(shù)據(jù)”的關注。
大數(shù)據(jù);高校圖書館;服務變革
10.3969/j.issn.2095-5707.2014.03.003
近十年來,信息技術熱點的形成日益呈現(xiàn)出“加速”趨勢。目前,繼數(shù)字圖書館、移動圖書館、物聯(lián)網(wǎng)、云計算等熱點之后,“大數(shù)據(jù)”(Big Data)無疑已登居IT熱詞之榜首。盡管諸多學者已經(jīng)或正在努力地描繪著“大數(shù)據(jù)”時代的嶄新圖景——“大數(shù)據(jù)”對世界的廣泛而深刻的變革,盡管以信息服務為核心職能的圖書館在這場變革中難以置身其外,但毋庸諱言,迄今為止還沒有引起圖書館界足夠的重視——圖書館界基本上還沒有作出反應。有鑒于此,本文試就“大數(shù)據(jù)”概念與歷史發(fā)展及其由來、“大數(shù)據(jù)”戰(zhàn)略價值、“大數(shù)據(jù)”時代高校圖書館面臨的機遇與挑戰(zhàn)以及對策等作一探討,以冀引起業(yè)界對“大數(shù)據(jù)”的關注。
一般認為,“大數(shù)據(jù)”作為一個相對成熟、相對定型、在核心內涵認識上達成共識的概念,見于美國信息存儲資訊科技公司(EMC)在2011年5月召開的“EMC World 2011”大會上,美國麥肯錫咨詢公司(Mckinsey & Company)在其所發(fā)布的研究報告《大數(shù)據(jù):創(chuàng)新、競爭和生產力的下一個前沿》中用“大數(shù)據(jù)”這一概念表述“創(chuàng)新、競爭和生產力”的下一個前沿[1]。倘若著眼于一般用詞,其歷史則又可以回溯到上個世紀末,1998年,美國《科學》(Science)雜志在介紹某計算機軟件時就曾提及“大數(shù)據(jù)”一詞。與麥肯錫咨詢公司報告以及近年來所討論的“大數(shù)據(jù)”概念最為接近的文獻則出現(xiàn)在2008年英國《自然》(Nature)雜志推出的“大數(shù)據(jù)???。
國內外知名媒體對“大數(shù)據(jù)”的專題報道,盡管對概念的理解不盡相同,但在定義上又有著基本共識——數(shù)據(jù)數(shù)量的大小、通信及其便利并非“大數(shù)據(jù)”的本質,“大數(shù)據(jù)”的特質在于在海量數(shù)據(jù)中快速獲取所需信息、學到知識[2]。維克托?邁爾?舍恩伯格(Viktor Mayer-Sch?nberger)教授在其著作《大數(shù)據(jù)時代:生活、工作與思維的大變革》中認為,“大數(shù)據(jù)”并非一個明確的概念,“大數(shù)據(jù)是人們在大規(guī)模數(shù)據(jù)的基礎上可以做到的事情,而這些事情在小規(guī)模數(shù)據(jù)的基礎上是無法完成的;大數(shù)據(jù)是人們獲得新的認知、創(chuàng)造新的價值的源泉;大數(shù)據(jù)還是改變市場、組織機構,以及政府與公民關系的方法。”[3]
“大數(shù)據(jù)”衍生于信息數(shù)據(jù)數(shù)量上的持續(xù)“加速”增長。美國著名市場研究公司IDC研究顯示,全球信息數(shù)據(jù)量以年均50%的速率迅猛增長,2011年全球新增數(shù)據(jù)量高達1.8 ZB(1 ZB=10億TB)[4]。美國南加州大學的學者在《自然》雜志中撰文指出,人類信息儲存量每 18個月翻一番[5]。數(shù)字資源構成的變化乃信息數(shù)據(jù)數(shù)量劇增的最為根本的原因。隨著智能手機、穿戴式終端等移動終端的普及,以及社交網(wǎng)絡、移動互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、信息化應用、傳感器、攝像頭等方面的快速發(fā)展,原生的(Born-digital resources)“非結構化數(shù)據(jù)”劇增,并成為“數(shù)據(jù)資源的主體”,目前,已占數(shù)據(jù)總量的80%以上[4]。海量的、雜亂無章的數(shù)據(jù)中蘊藏的巨大價值引發(fā)了對于數(shù)據(jù)處理、分析、挖掘的巨大需求,這樣便催生了“大數(shù)據(jù)”概念與相關技術。
“大數(shù)據(jù)的真實價值就像漂浮在海洋中的冰山,第一眼只能看到冰山的一角,絕大部分都隱藏在表面之下?!盵3]“大數(shù)據(jù)”的價值有如浪里淘沙,卻又彌足珍貴,目前已經(jīng)得到了西方發(fā)達國家國家戰(zhàn)略高度的重視,2012年3月29日,美國政府宣布推出“大數(shù)據(jù)研究和發(fā)展計劃”(Big Data Research Development Initiative),斥資兩億美元研發(fā)采集、組織和分析大數(shù)據(jù)的工具及技術[6]。
就高校圖書館而言,如何利用大數(shù)據(jù)技術服務于高校圖書館發(fā)展策略的制定、業(yè)務的轉型拓展與提升等,已經(jīng)成為高校圖書館行業(yè)層面的戰(zhàn)略課題。
“大數(shù)據(jù)”最具顛覆性的影響在于其對思維范式的變革,即拋棄對樣本、精確性、因果關系的執(zhí)迷,轉而接受整體、混沌、相關關系,更好地知覺當下以及正在發(fā)生的未來。對高校圖書館而言,提高對數(shù)據(jù)資源的重視程度,以大數(shù)據(jù)的思維看待數(shù)據(jù),也許能更敏銳地覺察讀者的信息需求的變化,從而為其提供更優(yōu)質的服務。
2.2.1 變樣本為總體 人類曾經(jīng)長期習慣于抽樣、局部、片面數(shù)據(jù),甚至僅憑經(jīng)驗等主觀感受去探尋未知領域的規(guī)律,由于樣本量有限,獲得的認識難免不同程度存在著表面、膚淺、扭曲等問題。大數(shù)據(jù)時代,全數(shù)據(jù)分析模式將逐步取代樣本分析模式,進而深入探尋其內在規(guī)律,獲取新知。
2.2.2 變精確為混沌 “大數(shù)據(jù)”海量、多樣、實時變化的特性,使人類獲取數(shù)據(jù)信息的準確性降低,混沌因此而無法避免,這就意味著“小數(shù)據(jù)”時代的精確性思維向“大數(shù)據(jù)”時代的混沌性思維轉變。
2.2.3 變因果為相關 “社會需要在一定程度上拋掉對因果關系的執(zhí)迷,代之以簡單的對應:不知道為什么,而知道是什么;這將推翻數(shù)百年的既定作法,挑戰(zhàn)我們對于如何決策、如何理解現(xiàn)實的最根本的認識”[3]。即人們只需通過相關性預測未來結果,從而做出相關決策,而無需去探究其因果關系。例如,超市只需知道暴風雨之前,手電筒和糕點銷量呈正相關,而做出將兩者放置在一起銷售的決定,無需去考慮其中的因果關系。
首先,大數(shù)據(jù)時代為高校圖書館數(shù)據(jù)采集提供了不竭的來源,成為新知識的主要來源。多樣性特征明顯的海量數(shù)據(jù)中所蘊藏的大量有價值的信息,為包括圖書館在內的各行各業(yè)拓展市場、深化服務提供了可能。以著名的“美國塔吉特(Target)超市嬰兒尿布事件”為例,塔吉特公司通過數(shù)據(jù)挖掘發(fā)現(xiàn)某高中女生在孕嬰用品頁面停留較長時間,準確地預測到該女生懷孕的事實,并向其發(fā)放母嬰用品優(yōu)惠券。高校圖書館服務自然理無二致,高校圖書館亦可通過對讀者借閱信息的數(shù)據(jù)挖掘,精確推送其感興趣的圖書信息。
其次,大數(shù)據(jù)時代為高校圖書館提供了數(shù)據(jù)采集、分析及處理技術,如二維碼技術、無線射頻識別(RFID)技術等,高校圖書館應用這些技術采集、處理數(shù)據(jù)信息,深化拓展自身服務。
第三,尤為重要的是“大數(shù)據(jù)”為高校圖書館提供了分析問題的思想方法。如前文所述,思維模式的變革在于——變局部為整體,變精確為混沌,變因果聯(lián)系為相關性。這對高校圖書館如何敏銳發(fā)現(xiàn)讀者信息需求的變化尤為重要。
首先,大數(shù)據(jù)時代,媒體資源愈發(fā)讓人眼花繚亂,高校圖書館對讀者(尤其是自控能力較弱的年輕大學生)的吸引力在下降,讀者爭奪將更加激烈,高校圖書館讀者流失問題可能日益突出。
其次,數(shù)據(jù)分析處理服務日趨成為高校圖書館服務的主業(yè),柜臺服務將日益減少,甚至退出歷史舞臺,這對高校圖書館的數(shù)據(jù)處理能力、服務品質提出了更高的要求。
第三,數(shù)據(jù)安全保護難度增大,大數(shù)據(jù)技術將“數(shù)字化生存”逐漸轉變?yōu)椤巴该骰妗?,知識產權、商業(yè)利益、公共安全受損的可能性增大,高校圖書館的讀者隱私安全及數(shù)據(jù)知識產權等權益將更難保障,讀者隱私、知識產權被泄漏或濫用的風險在增大。
第四,大數(shù)據(jù)對高校圖書館工作人員的素質、能力提出了更高的要求,高校圖書館相關技術人才的缺乏問題將更突出。
大數(shù)據(jù)時代,數(shù)字資源日益豐富,但也存在著館藏資源趨于同質化的問題,因而高校圖書館從非結構化數(shù)據(jù)這一嶄新的角度出發(fā),圍繞自身特色、優(yōu)勢學科進行專題數(shù)據(jù)采集,打造特色館藏資源、核心館藏資源并實時更新變得十分重要。
大數(shù)據(jù)技術包括海量數(shù)據(jù)的采集、存儲、計算等。數(shù)據(jù)采集用ETL工具(Extraction Transformation Loading,數(shù)據(jù)提取、轉換和加載),包括OWB(Oracle Warehouse Builder,適用于Oracle數(shù)據(jù)庫的綜合工具)、ODI(Oracle Data Integrator,適用于Oracle數(shù)據(jù)庫的數(shù)據(jù)集成類工具)等;數(shù)據(jù)存儲包括云存儲、分布式文件系統(tǒng)等;數(shù)據(jù)計算包括Hadoop大數(shù)據(jù)分布式處理軟件框架(基于Java語言構建的分布式處理大數(shù)據(jù)平臺)、Map Reduce(適用于大規(guī)模數(shù)據(jù)集并行運算的編程模型)等。大數(shù)據(jù)技術的應用勢在必行,藉以提高工作效率、深化拓展服務、增強競爭力。
大數(shù)據(jù)時代,數(shù)據(jù)的重新組織、數(shù)據(jù)的再利用變得更有價值。高校圖書館積累了大量書目數(shù)據(jù)、讀者數(shù)據(jù)、流通數(shù)據(jù)、數(shù)字資源利用數(shù)據(jù)、文獻查詢數(shù)據(jù)、參考咨詢數(shù)據(jù)等等,對這些數(shù)據(jù)進行挖掘分析,對讀者行為進行有效分析,尤其應重視讀者交互數(shù)據(jù)研究,深入理解讀者行為特征,用科學數(shù)據(jù)說話,這對于高校圖書館改進資源建設、深化拓展服務(為用戶提供精確、高質、高效、持續(xù)的信息資源服務,尤其是個性化服務和精準推薦)、提高工作效率有著重要作用。
館藏資源日趨同質化的今天,讀者資源對高校圖書館的重要性日益明顯,因而擴大高校圖書館的讀者群、通過多渠道及時了解讀者需求,進而提升高校圖書館在高校教工、學生的科研工作及文化生活中的影響力日趨重要。而關注和融入微信、微博、博客、人人網(wǎng)、BBS(Bulletin Board System,電子公告板)等社交網(wǎng)站則是及時了解讀者需求的重要途徑。
在“透明化生存”環(huán)境下,高校圖書館切實保障讀者隱私、尊重和保護知識產權的任務更為艱巨,完善有關制度并嚴格執(zhí)行顯得尤為重要。
“大數(shù)據(jù)”是高校圖書館未來發(fā)展無法逃避的發(fā)展趨勢[7],但目前國內高校圖書館對數(shù)據(jù)的重視程度不足,收集數(shù)據(jù)、挖掘數(shù)據(jù)意識不強,制約了高校圖書館信息服務的進一步發(fā)展。技術上的難題往往不難解決,思想上的輕視才是問題的關鍵。以信息服務工作為己任的高校圖書館,如何以“大數(shù)據(jù)”的思維重新認識高校圖書館的信息服務工作,如何利用大數(shù)據(jù)技術將已有的數(shù)據(jù)資源進行有序組織、深入挖掘與開發(fā),如何敏銳覺察讀者信息需求與信息獲取習慣的變化,如何進一步推動數(shù)字圖書館、移動圖書館的發(fā)展,成為高校圖書館未來發(fā)展的關鍵。
[1]楊繹.基于文獻計量的“大數(shù)據(jù)”研究[J].圖書館雜志, 2012,31(9):29-32,37.
[2]韓翠峰.大數(shù)據(jù)帶給圖書館的影響與挑戰(zhàn)[J].圖書與情報,2012(5):37-40.
[3]維克托?邁爾-舍恩伯格,肯尼思?庫克耶.大數(shù)據(jù)時代:生活、工作與思維的大變革[M].盛楊燕,周濤,譯.杭州:浙江人民出版社,2012.
[4]余建斌,趙展慧.大數(shù)據(jù)崛起[N].人民日報,2013-02-22(020).
[5]Martin Hilbert1, Priscila López. The World’s Technological Capacity to Store, Communicate, and Compute Information[J]. Science,2001,332(6025):60-65.
[6]孟小峰,慈祥.大數(shù)據(jù)管理:概念、技術與挑戰(zhàn)[J].計算機研究與發(fā)展,2013,50(1):146-169.
[7]樊偉紅,李晨暉,張興旺,等.圖書館需要怎樣的“大數(shù)據(jù)”[J].圖書館雜志,2012,31(11):63-68,77.
鄭紅月,蔣麗平,李如輝
浙江中醫(yī)藥大學圖書館,浙江 杭州 310053
Analysis of University Library Service Reform in the Era of Big Data
Zheng Hongyue, Jiang Liping, Li Ruhui
(Library of Zhejiang Chinese Medical University, Hangzhou Zhejiang 310053, China)
Since library community basically has not yet made proper response to Big Data, this article elaborated the concept,the historical development, the origin, the strategic value of Big Data, and the opportunities and challenges university libraries encountered in the era of Big Data, in order to draw public attention.
Big Data; university library; service reform
浙江中醫(yī)藥大學校級課題(2012ZZ09)
鄭紅月,副研究館員,研究方向:期刊評價與研究。E-mail: 1074194096@qq.com
2014-03-03,編輯:魏民)