大數(shù)據(jù)影響下的圖書館應變策略
趙雪峰
(東北財經(jīng)大學圖書館,遼寧 大連 116400)
摘要:大數(shù)據(jù)作為一項新興信息技術,給大眾信息庫——圖書館帶來了各方面的影響,具體表現(xiàn)在服務重點與用戶需求、數(shù)據(jù)規(guī)模與類型、信息的采集模式與方法、存儲能力、組織模式、信息服務方式和內(nèi)容及其他信息服務等維度上。在合理界定大數(shù)據(jù)的基礎上,系統(tǒng)分析大數(shù)據(jù)給圖書館發(fā)展帶來的具體影響,并嘗試探討圖書館應變的相關對策,是圖書館在大數(shù)據(jù)潮流中與時俱進、科學發(fā)展的客觀需要。
關鍵詞:大數(shù)據(jù);圖書館;信息服務;技術
中圖分類號:F250.7
文獻標識碼:A
文章編號:1008-4681(2015)01-0047-03
收稿日期:2014-12-2
作者簡介:趙雪峰(1976— ),男,遼寧大連人,東北財經(jīng)大學圖書館館員,碩士。研究方向:圖書館管理。
Abstract:As a newly developed information technology, big data exerts great influence on public information database, library, in all aspects, including the emphasis of service and the need of users, the scale and style of data, data collection mode and method, the capacity of storage, the pattern of organization, the mode and content of information service and so on. The paper systematically analyzes the specific impact which big data brings to libraries and explores relative countermeasures, which are objective requirements for the library to advance with the time and develop scientifically in the big data trend.
目前,關于大數(shù)據(jù)的實踐已從局限于少數(shù)象牙塔之中的學術精英圈擴大到了普通的機構、企業(yè)和政府部門,已經(jīng)在社會的不同領域產(chǎn)生了深刻的影響。鑒于此,唯有迎接挑戰(zhàn)、破舊學新、總結(jié)變化的影響,并在此基礎上不斷完善創(chuàng)新圖書館的服務、管理機制才能適應數(shù)字信息環(huán)境的轉(zhuǎn)變給社會大眾帶來的急劇變化和挑戰(zhàn),進而克服和破除價值質(zhì)疑、貢獻邊緣化、技術落后和人員隊伍不適應等一系列相關問題。
一大數(shù)據(jù)的學理釋義
一提到大數(shù)據(jù),不知其意的人一定認為它表示數(shù)據(jù)規(guī)模龐大,有海量的數(shù)據(jù)。其實,大數(shù)據(jù)的真實意義不能僅用數(shù)量上的龐大來表示,它經(jīng)過了超大規(guī)模數(shù)據(jù)、海量數(shù)據(jù),再到大數(shù)據(jù)的發(fā)展歷程。
一些研究者對大數(shù)據(jù)提出了不同的看法,比如Gartner公司提出,大數(shù)據(jù)作為高速度、大容量、多樣化的信息集合,必須采用新型的管理方式來提高數(shù)據(jù)的整合與利用,實現(xiàn)企業(yè)流程的優(yōu)化,并不斷提高決策者的洞察力和決策能力。再比如Information中國區(qū)首席顧問但彬認為,大數(shù)據(jù)雖然內(nèi)容上包含了海量數(shù)據(jù)的含義,但是僅僅把大數(shù)據(jù)簡單理解成海量數(shù)據(jù)就忽略了數(shù)據(jù)復雜性的重要性。另有資料這樣描述大數(shù)據(jù):大數(shù)據(jù)又可以稱為企業(yè)無法在短時間內(nèi)透過現(xiàn)有的文字軟件、讀寫工具獲取、整合和應用,使海量數(shù)據(jù)成為其提高企業(yè)決策支持的巨量資料[1]。目前業(yè)界對大數(shù)據(jù)的界定模式依舊比較簡單,如利用常用軟件工具捕獲、管理和處理數(shù)據(jù)所耗時間超過可容忍時間的數(shù)據(jù)集[2]。而IBM公司認為大數(shù)據(jù)具有4V特征,分別指規(guī)模性(volume)、高速性(velocity)、多樣性(variety)及價值性(value);此外,IBM公司認為,大數(shù)據(jù)為用戶提供了應對新的或潛在問題的洞察機會和解決方案,并使得其流程更加靈活[3]。而IBM公司認為大數(shù)據(jù)所具有的4V特征的觀念也將貫穿于下文。
綜合上述觀點,考慮本文內(nèi)容宜采用如下定義: 大數(shù)據(jù)的描述是伴隨數(shù)據(jù)海量和數(shù)據(jù)類型激增應運而生的大規(guī)模、多樣化的數(shù)據(jù)集合,以及提取知識、價值對數(shù)據(jù)集高速采集、分析、處理的技術結(jié)構域過程[4]。
二大數(shù)據(jù)給圖書館發(fā)展帶來的影響
雖然大數(shù)據(jù)的應用多集中于企業(yè),但圖書館所擁有的文獻信息具有數(shù)據(jù)規(guī)模巨大、更新周期短、文獻類型多樣、載體數(shù)字化、語種多樣性和內(nèi)容交叉等特征,這些特征都具備大數(shù)據(jù)的特征。圖書館相關人員應該深刻了解大數(shù)據(jù)時代特征,在采集、分析、處理數(shù)據(jù)中,提取知識價值、構建技術框架,發(fā)現(xiàn)大數(shù)據(jù)對圖書館產(chǎn)生的影響,才能更好適應大數(shù)據(jù)時代的發(fā)展要求。
不論是美國大選,還是地震海嘯的預測,亦或淘寶購物,許多領域都充分利用大數(shù)據(jù)分析的手段,大數(shù)據(jù)已經(jīng)成為一個眾人矚目的焦點。隨著網(wǎng)絡時代的發(fā)展,傳統(tǒng)圖書館很難單以資源來吸收讀者,圖書館應該既重視資源又重視個性化服務,利用大數(shù)據(jù)分析這一重要手段獲取讀者偏好,為讀者提供個性化服務。
用戶需求方面的變化比較明顯。傳統(tǒng)的服務都只為用戶提供數(shù)據(jù)或信息,它包括整篇的相關文獻、資料或其他知識產(chǎn)品;大數(shù)據(jù)時代下用戶更加重視圖書館是否能為自己解決具體某一個問題,而不是單單的搜尋資料。這一區(qū)別顯示了圖書館在服務的專業(yè)化和知識化水平視角下的用戶需求發(fā)生的變化。除此之外,用戶之間關系數(shù)據(jù)、用戶與群組、科研小組之間相互關系的數(shù)據(jù)和信息更是在大數(shù)據(jù)時代用戶需要的信息服務[5]。
從規(guī)模來看,當前的數(shù)據(jù)規(guī)模已從以前的TB級別躍升到PB級別( I為1000個T,E為100萬個T,Z為10億個T)。數(shù)據(jù)規(guī)模的擴大無疑會給圖書館帶來變化,圖書館也將會有一個新的適用過程。
從類型來看,數(shù)據(jù)類型也會更加繁多。網(wǎng)絡日志、視頻、圖片等類型的出現(xiàn),非結(jié)構化數(shù)據(jù)的增多也將會給傳統(tǒng)信息處理能力帶來極大的挑戰(zhàn)。統(tǒng)計數(shù)據(jù)顯示,世界結(jié)構化數(shù)據(jù)增長率大約是32%,而非結(jié)構化數(shù)據(jù)增長率則是63%,到2012年為止,非結(jié)構化數(shù)據(jù)已占互聯(lián)網(wǎng)整個數(shù)據(jù)量比例的75%以上。就圖書館而言,非結(jié)構化數(shù)據(jù)雖與之相伴,但并沒有得到圖書館的重視和研究。圖書館應該把結(jié)構化數(shù)據(jù)與非結(jié)構化數(shù)據(jù)相結(jié)合,充分發(fā)揮數(shù)據(jù)的功能。
綜合兩個方面,從大數(shù)據(jù)的四個特征中的兩個“v”,即類型多和規(guī)模大,我們可以了解到大數(shù)據(jù)在這兩點上的“魅力”和給圖書館帶來的變化和挑戰(zhàn)。
信息采集是信息處理的第一步,是大數(shù)據(jù)價值挖掘最重要的一環(huán),其后的集成、分析、管理都基于信息采集[6]。傳統(tǒng)的信息采集方式主要是網(wǎng)絡蜘蛛、地毯式收索,采集內(nèi)容一般結(jié)構化的出版物,例如期刊、專著、學位論文、電子書、會議報告等。但大數(shù)據(jù)時代下的數(shù)據(jù)類型較多,只能用非結(jié)構化數(shù)據(jù)庫來解決。圖書館必須采用新的采集模式:依據(jù)圖書館自身的特征、管理模式,采用適合的、符合圖書館管理的采集模式。這一提議應當?shù)玫綀D書館界人士的重視和思考。
信息存儲(information accumulation)是將獲得的或加工后的信息保存起來,以備將來應用。信息存儲并不是一個獨立的環(huán)節(jié),它貫穿于信息處理的全過程。
谷歌公司每天都要處理24拍字節(jié)的數(shù)據(jù)、Facebook每天更新的照片量超過1000萬張、YouTube每月接待多達8億訪客,這些正說明了數(shù)據(jù)的高速性。數(shù)據(jù)的增長幅度已經(jīng)遠遠超出數(shù)據(jù)的存儲和處理能力。圖書館的數(shù)據(jù)存儲已經(jīng)不能停留在結(jié)構化數(shù)據(jù),非結(jié)構化數(shù)據(jù)的不斷增多,原有的存儲方式應該是進行升級的時候了。
針對信息的組織模式而言,傳統(tǒng)的模式和大數(shù)據(jù)時代下的信息組織模式有明顯區(qū)別。傳統(tǒng)的信息組織模式僅為用戶提供簡單的信息服務,而大數(shù)據(jù)時代下的信息組織模式是為用戶提供個性化、精確化的知識服務。主要體現(xiàn)在兩個方面:第一,通過深入分析,可以對采集、存儲的數(shù)據(jù)挖掘出有利用價值的信息;第二,大數(shù)據(jù)時代下的圖書館信息組織和分析更加注重用戶信息的挖掘,旨在為用戶提供獨特性、精準化的服務。
大數(shù)據(jù)時代的到來使得信息的服務方式和內(nèi)容發(fā)生改變。大數(shù)據(jù)背景下,圖書館的競爭力已不再是體現(xiàn)在信息資源的數(shù)量、范圍上,而是在于所提供的產(chǎn)品的信息化和知識化水平及其基于知識的創(chuàng)新力競爭。在收索需要的資源時,人們更傾向于利用圖書館中的數(shù)據(jù)庫資源。這種既方便又快捷的方式,受到大數(shù)據(jù)背景下人們的熱捧。
除了信息服務方式和內(nèi)容的改變,大數(shù)據(jù)還加快了圖書館服務技術變革,推動圖書館服務模式創(chuàng)新,促進圖書館服務能力提升,并且還推動了圖書館服務的跨界合作。圖書館信息服務方面離不開大數(shù)據(jù)的應用。所以,圖書館相關機構要充分重視大數(shù)據(jù)對圖書館信息服務產(chǎn)生的影響,做好大數(shù)據(jù)時代的信息服務工作。未來,大數(shù)據(jù)壞境下的圖書館服務可能更加注重強化信息的集成服務、數(shù)據(jù)分析與挖掘、新型資源的收集、服務內(nèi)容時效性,并且圖書館要想在大數(shù)據(jù)時代激烈的市場競爭中處于相對有利的地位,還必須廣泛深入地開展用戶數(shù)據(jù)分析。隨著互聯(lián)網(wǎng)的重心正逐步向移動互聯(lián)網(wǎng)方向發(fā)展,圖書館的服務方式也將轉(zhuǎn)向移動互聯(lián)網(wǎng)。
三圖書館應變的策略分析
針對大數(shù)據(jù)給圖書館帶來的變化,圖書館應該轉(zhuǎn)變觀念,正確理解大數(shù)據(jù)內(nèi)在涵義,認識大數(shù)據(jù)技術的重要性,積極學習大數(shù)據(jù)相關技術,加強大數(shù)據(jù)人才隊伍建設和管理機制的建設,這其中,大數(shù)據(jù)人才培養(yǎng)是策略之重,大數(shù)據(jù)相關技術的應用與發(fā)展離不開良好的教育和培養(yǎng)。不論大數(shù)據(jù)所帶來的是機遇還是挑戰(zhàn),圖書館都應加以適應,從容應對,總結(jié)經(jīng)驗,做好大數(shù)據(jù)在圖書館應用的前景預測和分析,經(jīng)受實踐的考驗。
大數(shù)據(jù)已經(jīng)在許多商業(yè)領域中被應用,但效果究竟如何尚無定論。一些科學的新事物在出現(xiàn)之前總是會受到質(zhì)疑,但圖書館是傳播知識的窗口,應該引領時代潮流,敢于接受,敢于嘗試,轉(zhuǎn)變觀念,正確理解大數(shù)據(jù)內(nèi)在涵義。其次,要深刻體會大數(shù)據(jù)規(guī)模大、類型多、速度快、價值性的特點,應用好大數(shù)據(jù)帶給圖書館的機遇,應對好大數(shù)據(jù)帶給圖書館的挑戰(zhàn)。針對大數(shù)據(jù)四個特點圖書館應該明確四個基本問題:如何解決數(shù)據(jù)規(guī)模大的前提下數(shù)據(jù)的處理問題;如何解決數(shù)據(jù)在呈指數(shù)級別速度增長的背景下對數(shù)據(jù)的分析處理,避免數(shù)據(jù)結(jié)果過時的問題;面對數(shù)據(jù)類型和結(jié)構的復雜多樣,如何處理非結(jié)構化數(shù)據(jù)等問題;面對數(shù)據(jù)巨大的價值量,圖書館如何才能發(fā)現(xiàn)新知識、創(chuàng)造新價值、提升競爭力。
作為一項新信息技術,大數(shù)據(jù)能夠幫助圖書館建立和完善新的知識服務方式,為圖書館拓展公共服務提供強有力的技術支撐。目前最為流行的大數(shù)據(jù)處理平臺是 Hadoop,另外還有較多大數(shù)據(jù)處理工具,如 MapReduce等[7]。大數(shù)據(jù)技術可以幫助圖書館獲得準確、及時的用戶數(shù)據(jù),并且還有助于管理者及時了解圖書館最新知識服務的趨勢并及時而準確地作出決策、調(diào)整服務方向。這些作用有助于圖書館開展公共服務,同時,可以為用戶提供更多的便利,進而提升公眾的滿足感,增強公共圖書館的核心競爭力。毋庸置疑,大數(shù)據(jù)技術的應用可以體現(xiàn)在圖書館管理中,圖書館管理人員應正確認識大數(shù)據(jù)時代所帶來的優(yōu)勢與便捷,積極學習、應用大數(shù)據(jù)技術,才能適應大數(shù)據(jù)的影響并且充分發(fā)揮該技術的價值。
研究大數(shù)據(jù)方向的人才大多是精通數(shù)學、統(tǒng)計學,并能夠熟練進行數(shù)據(jù)分析、商業(yè)分析和自然語言處理;數(shù)據(jù)科學家應該是集數(shù)學、統(tǒng)計學、機器學習等于一身,并能綜合掌控、熟練應用的復合型人才。
從人才培養(yǎng)角度來講,對于圖書館相關專業(yè)的學習應該加強大數(shù)據(jù)技能的教育和培養(yǎng),為圖書館數(shù)據(jù)科學家隊伍的形成提供保障。目前,我國有許多企事業(yè)單位和機構已經(jīng)重視大數(shù)據(jù)人才培養(yǎng),并且做出了里程碑式的工作。2014年8月15日在“大數(shù)據(jù)時代企業(yè)創(chuàng)新發(fā)展”主題高峰論壇上,中國科學院大學管理學院EDP中心與工信部軟件與集成電路促進中心聯(lián)合啟動了“國家信息技術緊缺人才培養(yǎng)工程(NITE)——中國科學院大學大數(shù)據(jù)分析高端培養(yǎng)與認證”項目。這一項目啟動了大數(shù)據(jù)分析高端培訓與資格認證高級研修班,并且首次面向全國招生。該課程緊緊圍繞大數(shù)據(jù)的核心技術和技術的實際應用。圖書館領域也應該借此東風培養(yǎng)圖書館行業(yè)的大數(shù)據(jù)“科學家”。
從圖書館隊伍角度講,當前圖書館的管理人員大多是以圖書館學以及計算機為主修專業(yè),這些人才在求學階段對大數(shù)據(jù)技術的接觸甚少,并不能將其掌握、應用到圖書館管理中來,無法更好地應對大數(shù)據(jù)時代的挑戰(zhàn)。對此,相關部門應做好兩方面工作:第一,調(diào)整招聘方向,引進一些涉及統(tǒng)計學、圖書館管理、計算機應用的復合型人才;第二,對原有的圖書管理員進行大數(shù)據(jù)相關技術的培訓,提升隊伍素質(zhì)。
對于圖書館大數(shù)據(jù)管理機制的建立大體上可從國家的大環(huán)境和圖書館范圍內(nèi)兩個方面來考慮:首先,國家應該把圖書館規(guī)劃在國家大數(shù)據(jù)戰(zhàn)略范圍內(nèi),與大數(shù)據(jù)背景相適應,用大數(shù)據(jù)戰(zhàn)略引導圖書館的大數(shù)據(jù),推動建立信息資源共建共享機制。其次,在圖書館內(nèi)部對于大數(shù)據(jù)的管理應當形成鏈接式的完整的數(shù)據(jù)處理和管理過程,這其中包括數(shù)據(jù)的采集、數(shù)據(jù)存取、數(shù)據(jù)分析挖掘和數(shù)據(jù)服務,只有將這些環(huán)節(jié)完整地連接起來,形成圖書館內(nèi)部的大數(shù)據(jù)處理流程,才能有效管理大數(shù)據(jù)條件下的圖書館事務。
參考文獻:
[1]大數(shù)據(jù)[EB/OL]. http://baike.baidu.com/view/6954399.htm,2013-03-02.
[2]Big Data[EB/OL]. http://www.en.wikipedia.org/wiki/BigData,2013-03-02.
[3]What is big data? [EB/OL].http://www-01.ibm.com/software/data/bigdata/,2013-05-06.
[4]劉高勇,汪會玲,吳金紅.大數(shù)據(jù)時代的競爭情報發(fā)展動向探析[J].圖書情報知識,2013,(2).
[5][6]安宗玉.淺析大數(shù)據(jù)對圖書館的影響及對策[J].河南圖書館學刊,2014,(1).
[7]孟小峰,慈祥.大數(shù)據(jù)管理:概念、技術與挑戰(zhàn)[J].計算機研究與發(fā)展,2013,(1).
Countermeasures for Libraries Adapting the Changes
under the Influence of Big Data
ZHAO Xuefeng
(Library of Northeast University of Finance and Economics, Dalian Liaoning 116400,China)
Key Words:big data; library; information service; technology
(責任編校:陳婷)