文庭孝
(中南大學(xué)生命科學(xué)學(xué)院醫(yī)藥信息系 長(zhǎng)沙 410083)
2012年是世界“大數(shù)據(jù)元年”,美國(guó)政府推出了“大數(shù)據(jù)研究和發(fā)展計(jì)劃”,將大數(shù)據(jù)研究和開(kāi)發(fā)提升到國(guó)家戰(zhàn)略高度[1]。據(jù)麥肯錫全球研究院IDC最新預(yù)計(jì),到2020年,全世界數(shù)據(jù)存儲(chǔ)總量將達(dá)到35ZB(相當(dāng)于35萬(wàn)億GB)。高德納(Gartner)公司指出,新產(chǎn)生的數(shù)據(jù)量每年正以至少50%的速度遞增,每年新增的數(shù)據(jù)量不到兩年就翻一番[2]。大數(shù)據(jù)時(shí)代已經(jīng)來(lái)臨!
世界數(shù)據(jù)化是大數(shù)據(jù)時(shí)代社會(huì)發(fā)展的一種趨勢(shì)。當(dāng)今社會(huì)已從信息時(shí)代進(jìn)入數(shù)據(jù)驅(qū)動(dòng)的“智能時(shí)代”[3]“算法時(shí)代”[4]“智慧時(shí)代”[5],“數(shù)據(jù)化”浪潮開(kāi)啟了一個(gè)時(shí)代的重要轉(zhuǎn)變[6]。
數(shù)據(jù)是對(duì)信息爆炸現(xiàn)象的一種新描述,代表著一種新環(huán)境和新思維[7]。Mcafee和Brynjolfsson 認(rèn)為“大數(shù)據(jù)”是“分析”的另一種表述(數(shù)據(jù)即分析),是尋求從數(shù)據(jù)中萃取知識(shí),并將其轉(zhuǎn)化為商業(yè)優(yōu)勢(shì)的智能化活動(dòng)[8]。阿里巴巴創(chuàng)始人馬云認(rèn)為“大數(shù)據(jù)是一種服務(wù)(數(shù)據(jù)即服務(wù))”?!洞髷?shù)據(jù),大影響(Big Data, Big Impact)》報(bào)告中指出:數(shù)據(jù)即資產(chǎn)[9]。大數(shù)據(jù)廣泛分布、多源異構(gòu)、動(dòng)態(tài)變化、來(lái)源復(fù)雜、非結(jié)構(gòu)化、海量存在等特征給圖書(shū)館帶來(lái)了巨大挑戰(zhàn)[10]。
圖書(shū)館大數(shù)據(jù)具有多種結(jié)構(gòu)、多種形式、多種用途、多種分類。資源大數(shù)據(jù)、用戶大數(shù)據(jù)、館員大數(shù)據(jù)、管理大數(shù)據(jù)、服務(wù)大數(shù)據(jù)、業(yè)務(wù)大數(shù)據(jù)及其關(guān)聯(lián)是圖書(shū)館大數(shù)據(jù)的核心。圖書(shū)館的管理、服務(wù)和業(yè)務(wù)工作以資源數(shù)據(jù)為基礎(chǔ),圍繞用戶和館員兩大主體進(jìn)行,通過(guò)對(duì)資源的管理與利用將管理、服務(wù)、業(yè)務(wù)、用戶和館員幾大要素關(guān)聯(lián)在一起。
在大數(shù)據(jù)環(huán)境下,如何進(jìn)行數(shù)據(jù)管理,實(shí)現(xiàn)個(gè)性化服務(wù)、知識(shí)服務(wù)、數(shù)據(jù)服務(wù)、智慧服務(wù)、增值服務(wù),提升自身管理與服務(wù)水平以及信息資源開(kāi)發(fā)利用效率,是圖書(shū)館面臨的重大挑戰(zhàn)與機(jī)遇。
在大數(shù)據(jù)環(huán)境下,圖書(shū)館在資源、服務(wù)、用戶、館員、設(shè)施、管理、業(yè)務(wù)等方面都發(fā)生了巨大變化。大數(shù)據(jù)既是圖書(shū)館創(chuàng)新發(fā)展的良好機(jī)遇,也使圖書(shū)館面臨前所未有的巨大挑戰(zhàn)[11-13]。
大數(shù)據(jù)使圖書(shū)館資源的數(shù)量和結(jié)構(gòu)發(fā)生了重大變化。在大數(shù)據(jù)環(huán)境下,圖書(shū)館的資源可以得到無(wú)限拓展,除了自身所擁有的大量數(shù)字資源外,高速增長(zhǎng)的數(shù)字資源,日益普及的互聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)以及云計(jì)算、RFID、語(yǔ)義網(wǎng)、社交網(wǎng)絡(luò)等新技術(shù)的應(yīng)用提供了更廣泛的數(shù)據(jù)來(lái)源[11]。圖書(shū)館資源大數(shù)據(jù)由兩部分構(gòu)成,一是館藏資源大數(shù)據(jù)(現(xiàn)實(shí)資源),二是網(wǎng)絡(luò)資源大數(shù)據(jù)(虛擬資源)[14]。圖書(shū)館所擁有的任何資源都可以被視為某種“數(shù)據(jù)”,都可以被表征、解析、鏈接、交互、融會(huì)。數(shù)據(jù)化、語(yǔ)義化、碎片化和關(guān)聯(lián)化成為大數(shù)據(jù)時(shí)代圖書(shū)館資源的最大特征。各類圖書(shū)館資源通過(guò)著錄、標(biāo)引、解析、鏈接等一系列加工和組織,可以實(shí)現(xiàn)數(shù)據(jù)化和知識(shí)元化解構(gòu)、重組與關(guān)聯(lián),形成新的資源空間[6]。這些資源中,非結(jié)構(gòu)化、半結(jié)構(gòu)化數(shù)據(jù)占據(jù)圖書(shū)館大數(shù)據(jù)總量的85%以上,全文本、圖像、聲音、影視、超媒體等非結(jié)構(gòu)化復(fù)雜數(shù)據(jù)將成為圖書(shū)館大數(shù)據(jù)的核心[15]。
大數(shù)據(jù)對(duì)圖書(shū)館用戶的影響主要體現(xiàn)在用戶數(shù)量、用戶結(jié)構(gòu)和用戶需求變化三個(gè)方面。在基于互聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)的大數(shù)據(jù)環(huán)境下,所有網(wǎng)民理論上都可能成為某個(gè)圖書(shū)館的用戶。這不僅僅是用戶數(shù)量上的簡(jiǎn)單擴(kuò)張,其價(jià)值更多地體現(xiàn)在用戶網(wǎng)絡(luò)及其關(guān)聯(lián)上。隨著圖書(shū)館用戶數(shù)量的拓展,用戶在文化層次、需求層次、年齡層次、素養(yǎng)層次、職業(yè)差異、興趣愛(ài)好等結(jié)構(gòu)上也會(huì)發(fā)生巨大變化。圖書(shū)館用戶大數(shù)據(jù)的關(guān)鍵問(wèn)題不在于數(shù)量和結(jié)構(gòu)本身,而在于因數(shù)量和結(jié)構(gòu)引發(fā)的關(guān)聯(lián)改變。大數(shù)據(jù)對(duì)圖書(shū)館用戶最大的影響是需求內(nèi)容的變化,用戶對(duì)圖書(shū)館資源和服務(wù)的需求已遠(yuǎn)遠(yuǎn)超出了簡(jiǎn)單的數(shù)字化資源獲取和網(wǎng)絡(luò)化資源存取[6]。
一項(xiàng)關(guān)于大學(xué)生對(duì)高校圖書(shū)館使用情況的調(diào)查表明,72%的學(xué)生通過(guò)網(wǎng)絡(luò)獲得信息,而通過(guò)圖書(shū)館獲得信息的學(xué)生只占 18%[16]。另一項(xiàng)調(diào)查同樣顯示,大學(xué)生訪問(wèn)圖書(shū)館網(wǎng)站(數(shù)字圖書(shū)館)的只占 28%,遠(yuǎn)低于使用搜索引擎的比例,甚至有 25.3%的大學(xué)生表示從來(lái)沒(méi)有訪問(wèn)過(guò)圖書(shū)館網(wǎng)站(數(shù)字圖書(shū)館)[17]。Anderson Rick 則憂慮地指出,在大數(shù)據(jù)環(huán)境下,圖書(shū)館到了必須給其資助機(jī)構(gòu)更多說(shuō)服力來(lái)證明自身存在價(jià)值的時(shí)候[18]。圖書(shū)館用戶流失及價(jià)值分析已成為大數(shù)據(jù)時(shí)代圖書(shū)館界關(guān)注的重要問(wèn)題[19]。這說(shuō)明在大數(shù)據(jù)環(huán)境下,圖書(shū)館的結(jié)構(gòu)化數(shù)據(jù)資源及其基本服務(wù)已無(wú)法滿足用戶的新需求。
《哈佛商業(yè)評(píng)論》在專題文章中指出:數(shù)據(jù)科學(xué)家的主要工作就是從大數(shù)據(jù)中找出有用的信息,數(shù)據(jù)科學(xué)家將成為21世紀(jì)最性感的職業(yè)。美國(guó)學(xué)者對(duì)圖書(shū)館員在大數(shù)據(jù)環(huán)境下的角色和專業(yè)技能做了調(diào)查與設(shè)想,認(rèn)為圖書(shū)館可以在大數(shù)據(jù)時(shí)代承擔(dān)起“數(shù)據(jù)管理”這一職責(zé),但目前絕大多數(shù)圖書(shū)館員還不具備數(shù)據(jù)科學(xué)家必備的素質(zhì)[20-21]。
隨著大數(shù)據(jù)時(shí)代的到來(lái),個(gè)性化服務(wù)、知識(shí)服務(wù)、嵌入式服務(wù)、精準(zhǔn)知識(shí)服務(wù)、智能服務(wù)、增值服務(wù)、智慧服務(wù)和大數(shù)據(jù)服務(wù)等成為圖書(shū)館服務(wù)創(chuàng)新發(fā)展的趨勢(shì),圖書(shū)館服務(wù)開(kāi)始向數(shù)據(jù)分析、數(shù)據(jù)挖掘等數(shù)據(jù)服務(wù)轉(zhuǎn)變[10]。圖書(shū)館大數(shù)據(jù)資源的擴(kuò)展、用戶需求的變化和圖書(shū)館服務(wù)要求的提升,對(duì)館員素質(zhì)提出了巨大挑戰(zhàn)。大數(shù)據(jù)對(duì)圖書(shū)館員的最大挑戰(zhàn)在于指導(dǎo)用戶處理海量數(shù)據(jù),從中挖掘和提取關(guān)鍵信息并獲得知識(shí)[22],而用戶與圖書(shū)館員的信息素養(yǎng)和數(shù)據(jù)素養(yǎng)差距正在縮小。圖書(shū)館員只有掌握了數(shù)據(jù)處理和數(shù)據(jù)分析能力,才能揭示大數(shù)據(jù)中蘊(yùn)含的價(jià)值,通過(guò)大數(shù)據(jù)技術(shù)挖掘出更多、更深、更全的信息,滿足用戶的個(gè)性化知識(shí)需求[23]。因此,面對(duì)大數(shù)據(jù),圖書(shū)館員需要重新定位角色。
為了應(yīng)對(duì)這一挑戰(zhàn),美國(guó)密歇根州立大學(xué)、伊利諾伊州立大學(xué)、北卡羅來(lái)納州立大學(xué)和亞利桑那州立大學(xué)等已經(jīng)開(kāi)設(shè)了大數(shù)據(jù)相關(guān)課程和研究方向來(lái)適應(yīng)大數(shù)據(jù)發(fā)展的需要。不少大學(xué)圖書(shū)館和研究機(jī)構(gòu)開(kāi)始設(shè)立專門崗位進(jìn)行大數(shù)據(jù)管理,如數(shù)據(jù)圖書(shū)館員、數(shù)據(jù)服務(wù)圖書(shū)館員、數(shù)據(jù)監(jiān)護(hù)圖書(shū)館員、數(shù)據(jù)分析員、科研數(shù)據(jù)圖書(shū)館員等[24]。美國(guó)學(xué)者Landon甚至直接指出“情報(bào)學(xué)是培養(yǎng)數(shù)據(jù)科學(xué)家的學(xué)科”[25],為圖書(shū)館學(xué)和情報(bào)學(xué)教育的未來(lái)發(fā)展指明了方向。
大數(shù)據(jù)對(duì)圖書(shū)館服務(wù)的影響主要體現(xiàn)在三個(gè)方面:一是服務(wù)內(nèi)容;二是服務(wù)方式;三是服務(wù)平臺(tái)。從服務(wù)內(nèi)容來(lái)看,大數(shù)據(jù)環(huán)境下,圖書(shū)館能夠提供個(gè)性化服務(wù)、知識(shí)服務(wù)、嵌入式服務(wù)、精準(zhǔn)知識(shí)、智能服務(wù)、增值服務(wù)、智慧服務(wù)和大數(shù)據(jù)服務(wù)等服務(wù)內(nèi)容和服務(wù)方式,而這些都需要圖書(shū)館大數(shù)據(jù)平臺(tái)支撐。
(1)個(gè)性化服務(wù)。個(gè)性化服務(wù)也稱為精準(zhǔn)服務(wù)、定制服務(wù)、推送服務(wù)、推薦服務(wù)和特色服務(wù)等。個(gè)性化服務(wù)是大數(shù)據(jù)時(shí)代圖書(shū)館最重要的服務(wù)模式[26-27]。個(gè)性化服務(wù)是圖書(shū)館根據(jù)用戶的特定需求而特別定制的服務(wù),也是圖書(shū)館服務(wù)長(zhǎng)期以來(lái)追求的目標(biāo)。個(gè)性化服務(wù)包括服務(wù)時(shí)空的個(gè)性化(在用戶指定的時(shí)間和地點(diǎn)提供服務(wù))、服務(wù)方式的個(gè)性化(根據(jù)用戶個(gè)人愛(ài)好或特點(diǎn)提供服務(wù))和服務(wù)內(nèi)容的個(gè)性化(根據(jù)用戶需求提供定制的服務(wù)內(nèi)容)[28]。早在2000年,美國(guó) Ex Libris 公司就推出了SFX,可以實(shí)現(xiàn)不同類型數(shù)據(jù)與 OPAC資源的整合與挖掘,針對(duì)用戶需求提供個(gè)性化服務(wù)[29]。2007 年,Library Thing 提供了一項(xiàng) LTFL(Library Thing for Libraries)服務(wù),以存儲(chǔ)在 Library Thing中的數(shù)據(jù)為基礎(chǔ),通過(guò)標(biāo)簽實(shí)現(xiàn)讀者閱讀關(guān)聯(lián),提供資源導(dǎo)讀和資源推送等個(gè)性化服務(wù)[30]。圖書(shū)館有大量的用戶行為數(shù)據(jù),如OPAC查詢?nèi)罩?、借還書(shū)日志、電子資源檢索瀏覽下載及數(shù)據(jù)庫(kù)訪問(wèn)日志、圖書(shū)館網(wǎng)站訪問(wèn)流量及社交網(wǎng)絡(luò)等數(shù)據(jù),通過(guò)用戶大數(shù)據(jù)挖掘和分析,可以發(fā)現(xiàn)某個(gè)用戶或群體的興趣和行為規(guī)律,從而定位用戶需求,為用戶提供個(gè)性化精準(zhǔn)服務(wù)[31]。圖書(shū)館大數(shù)據(jù)平臺(tái)能對(duì)用戶的個(gè)人信息、借閱歷史、瀏覽記錄等數(shù)據(jù)進(jìn)行挖掘和分析,為用戶提供信息推送、參考咨詢、學(xué)科服務(wù)、好書(shū)推薦等個(gè)性化服務(wù)[32]。
(2)知識(shí)服務(wù)。知識(shí)服務(wù)是圖書(shū)館面向用戶的特定需求,運(yùn)用大數(shù)據(jù)技術(shù)(如關(guān)聯(lián)分析技術(shù)、推理技術(shù)、語(yǔ)義檢索技術(shù)等)對(duì)圖書(shū)館的數(shù)據(jù)進(jìn)行處理,為用戶精準(zhǔn)提供解決問(wèn)題所需知識(shí)的服務(wù)過(guò)程[11]。從本質(zhì)上來(lái)看,圖書(shū)館是一個(gè)知識(shí)發(fā)現(xiàn)和服務(wù)系統(tǒng),并且在不斷地更新知識(shí)服務(wù)內(nèi)容和形式。隨著大數(shù)據(jù)時(shí)代的到來(lái),圖書(shū)館以數(shù)據(jù)挖掘和分析為基礎(chǔ),在知識(shí)服務(wù)的內(nèi)容和形式上不斷創(chuàng)新,發(fā)生了巨大的變化。以用戶大數(shù)據(jù)為基礎(chǔ),圖書(shū)館可以開(kāi)展用戶知識(shí)需求預(yù)測(cè)和用戶行為智能分析,并輔助圖書(shū)館資源采購(gòu)和資源配置,開(kāi)展個(gè)性化服務(wù);以資源大數(shù)據(jù)為基礎(chǔ),圖書(shū)館可以構(gòu)建新型知識(shí)搜索引擎,關(guān)聯(lián)圖書(shū)館資源與用戶需求,提供一站式知識(shí)搜索、資源與服務(wù)推薦、多維度資源獲取等知識(shí)服務(wù);以圖書(shū)館綜合大數(shù)據(jù)為基礎(chǔ),圖書(shū)館可以開(kāi)展數(shù)據(jù)處理、數(shù)據(jù)挖掘和數(shù)據(jù)分析等知識(shí)服務(wù)內(nèi)容,為圖書(shū)館管理和決策服務(wù),提升圖書(shū)館的服務(wù)水平和層次[33-35]。
(3)嵌入式服務(wù)。嵌入式服務(wù)是圖書(shū)館以用戶的多樣化需求為導(dǎo)向,將服務(wù)融入用戶的工作、教學(xué)、科研、學(xué)習(xí)和生活等過(guò)程的服務(wù)模式[36]。嵌入式服務(wù)包括嵌入用戶空間(即實(shí)體物理空間和虛擬空間)和嵌入服務(wù)過(guò)程(包括科研、教學(xué)、工作、學(xué)習(xí)和生活等過(guò)程)。大數(shù)據(jù)環(huán)境下,圖書(shū)館的嵌入式服務(wù)內(nèi)容主要有用戶需求分析、研究項(xiàng)目查新、研究力量調(diào)查、前沿?zé)狳c(diǎn)分析、規(guī)律趨勢(shì)預(yù)測(cè)等[37]。如高校圖書(shū)館提供的嵌入式學(xué)科服務(wù),利用圖書(shū)館掌握的龐大數(shù)據(jù)資源和專業(yè)信息分析技術(shù)為用戶提供高效、專業(yè)的學(xué)科服務(wù),將用戶、學(xué)科館員、動(dòng)態(tài)數(shù)據(jù)和數(shù)據(jù)分析工具四個(gè)方面的因素關(guān)聯(lián)起來(lái),提高學(xué)科服務(wù)效率[24,38]。
(4)智能服務(wù)。智能服務(wù)也稱智慧服務(wù)。圖書(shū)館智能服務(wù)包括運(yùn)用智能技術(shù)對(duì)海量數(shù)據(jù)進(jìn)行深度挖掘、創(chuàng)造[39],運(yùn)用智能技術(shù)、工具、平臺(tái)處理大量非結(jié)構(gòu)化、半結(jié)構(gòu)化數(shù)據(jù),為圖書(shū)館智能決策服務(wù)[40],促進(jìn)圖書(shū)館的資源整合、知識(shí)整合和服務(wù)整合[22]。在大數(shù)據(jù)環(huán)境下,圖書(shū)館可以通過(guò)多維度對(duì)用戶大數(shù)據(jù)、資源大數(shù)據(jù)進(jìn)行融合、組合、挖掘和知識(shí)分析,建立智能服務(wù)環(huán)境,為圖書(shū)館數(shù)據(jù)管理、數(shù)據(jù)決策、數(shù)據(jù)服務(wù)和數(shù)據(jù)創(chuàng)新提供智慧服務(wù)[41]。如中國(guó)知網(wǎng)(CNKI)正在積極探索“智慧服務(wù)”新形態(tài),推出“智能檢索”(全球?qū)W術(shù)資源發(fā)現(xiàn))新產(chǎn)品;超星公司推出了“知識(shí)發(fā)現(xiàn)”等智能工具,為用戶提供智能知識(shí)服務(wù)。
(5)增值服務(wù)。大數(shù)據(jù)技術(shù)、大數(shù)據(jù)分析和智能服務(wù)是圖書(shū)館實(shí)現(xiàn)增值服務(wù)的最佳方式。大數(shù)據(jù)環(huán)境下,圖書(shū)館通過(guò)收集、處理大數(shù)據(jù)及引入大數(shù)據(jù)處理技術(shù),對(duì)融合后的海量數(shù)據(jù)進(jìn)行深入挖掘和智能分析,發(fā)現(xiàn)圖書(shū)館大數(shù)據(jù)背后潛藏的知識(shí)及其關(guān)聯(lián),幫助用戶快捷獲取所需知識(shí)與服務(wù),實(shí)現(xiàn)大數(shù)據(jù)利用、增值和再創(chuàng)造[42]。圖書(shū)館的增值服務(wù)可以通過(guò)提供知識(shí)化、智能化、個(gè)性化、精準(zhǔn)化、嵌入式服務(wù)和數(shù)據(jù)服務(wù)等方式來(lái)實(shí)現(xiàn)。
(6)數(shù)據(jù)服務(wù)。哈佛大學(xué)最早將“大數(shù)據(jù)服務(wù)”引入圖書(shū)館中并著手實(shí)施[43]。圖書(shū)館的數(shù)據(jù)服務(wù)主要是對(duì)圖書(shū)館資源、用戶、管理、服務(wù)、業(yè)務(wù)等數(shù)據(jù)的深度挖掘和智能分析[44],從大量的、不完整的、有噪聲的、模糊的和隨機(jī)的數(shù)據(jù)中,提取潛在的有價(jià)值的信息和知識(shí)的過(guò)程,為圖書(shū)館管理、決策和服務(wù)以及用戶獲取資源提供幫助。數(shù)據(jù)挖掘技術(shù)對(duì)經(jīng)過(guò)預(yù)處理的海量數(shù)據(jù)進(jìn)行深度挖掘,可以更好地服務(wù)于圖書(shū)館的管理決策和讀者服務(wù)。如利用決策樹(shù)挖掘方法對(duì)讀者信息、借閱數(shù)據(jù)和圖書(shū)信息進(jìn)行挖掘,可以發(fā)現(xiàn)不同類型讀者的借閱需求;利用關(guān)聯(lián)規(guī)則分析方法對(duì)讀者信息、讀者瀏覽記錄、讀者下載記錄、數(shù)字資源信息等進(jìn)行挖掘,可以揭示讀者與數(shù)字資源瀏覽下載行為之間的關(guān)聯(lián)規(guī)律[6,45]。
大數(shù)據(jù)環(huán)境下,圖書(shū)館可以通過(guò)提供個(gè)性化服務(wù)、知識(shí)服務(wù)、嵌入服務(wù)、智能服務(wù)、增值服務(wù)和數(shù)據(jù)服務(wù)等服務(wù)內(nèi)容和形式重構(gòu)圖書(shū)館服務(wù)體系,提升圖書(shū)館服務(wù)質(zhì)量和水平,提高圖書(shū)館資源利用效率和用戶滿意度。
圖書(shū)館管理包括資源管理(財(cái)、物、設(shè)備、信息等)和人員管理(館員管理和用戶管理)?!豆鹕虡I(yè)評(píng)論》指出:大數(shù)據(jù)本質(zhì)上是“一場(chǎng)管理革命”[46]。
在大數(shù)據(jù)環(huán)境下,“一切皆數(shù)據(jù)”“一切皆服務(wù)”“一切皆讀者”已成為圖書(shū)館發(fā)展的一種新思維和新思路[47]。圖書(shū)館管理不再是單一資源和要素的管理,而是綜合管理,將資源、館員、用戶、服務(wù)、技術(shù)、設(shè)備和制度等要素建立聯(lián)系,構(gòu)建圖書(shū)館綜合智能管理、決策和服務(wù)體系[12]。經(jīng)過(guò)數(shù)據(jù)優(yōu)化管理,大數(shù)據(jù)必將促進(jìn)圖書(shū)館數(shù)據(jù)管理、數(shù)據(jù)分析、數(shù)據(jù)使用及數(shù)據(jù)服務(wù)的深層次變革。隨著圖書(shū)館資源(將本館資源與互聯(lián)網(wǎng)虛擬資源融合為一體,建立面向解決復(fù)雜問(wèn)題的資源整合、加工大數(shù)據(jù)資源觀)、技術(shù)(構(gòu)建和完善數(shù)據(jù)采集、信息處理、組織架構(gòu)、知識(shí)挖掘、分析預(yù)測(cè)、結(jié)果呈現(xiàn)、智能服務(wù)等技術(shù)體系)、服務(wù)(面向全社會(huì)、提供全資源、開(kāi)展多元化服務(wù),如精準(zhǔn)服務(wù)、推送服務(wù)、個(gè)性化服務(wù)、移動(dòng)服務(wù)、知識(shí)服務(wù)、數(shù)據(jù)服務(wù)、智能服務(wù)、增值服務(wù)、嵌入式服務(wù)等)、館員(成為數(shù)據(jù)分析專家和數(shù)據(jù)科學(xué)家,了解大數(shù)據(jù)關(guān)鍵技術(shù)、熟悉各種數(shù)據(jù)分析工具和軟件、掌握?qǐng)D書(shū)館大數(shù)據(jù))、用戶(需求內(nèi)容和需求方式不斷變化)、設(shè)備(分布式存儲(chǔ)和分布式計(jì)算)等要素的變化,圖書(shū)館管理也會(huì)不斷變化,同時(shí)也對(duì)圖書(shū)館管理人員提出了更高的要求[48]。
管理數(shù)據(jù)化是大數(shù)據(jù)時(shí)代圖書(shū)館管理發(fā)展的必然[29],精準(zhǔn)管理是大數(shù)據(jù)時(shí)代圖書(shū)館管理的新常態(tài)[49]。圖書(shū)館管理建立在對(duì)大數(shù)據(jù)進(jìn)行挖掘和分析的基礎(chǔ)之上,以數(shù)據(jù)和用戶為中心,不斷創(chuàng)新管理體制、管理方法、管理方式,進(jìn)行動(dòng)態(tài)管理,創(chuàng)造性地開(kāi)展大數(shù)據(jù)服務(wù)[50]。與此同時(shí),利用大數(shù)據(jù)可以加強(qiáng)各館之間的信息溝通與交互,實(shí)現(xiàn)館員和資源最優(yōu)配置,實(shí)現(xiàn)精準(zhǔn)管理,降低服務(wù)成本,發(fā)揮資源效用,實(shí)現(xiàn)效益最大化[51]。
大數(shù)據(jù)技術(shù)是一項(xiàng)顛覆性技術(shù),為圖書(shū)館提供一種技術(shù)解決方案,助力海量數(shù)據(jù)的網(wǎng)絡(luò)應(yīng)用,并釋放復(fù)雜數(shù)據(jù)中的智能。在大數(shù)據(jù)環(huán)境下,基礎(chǔ)設(shè)施決定了圖書(shū)館的數(shù)據(jù)存儲(chǔ)能力、計(jì)算能力和處理能力。圖書(shū)館大數(shù)據(jù)平臺(tái)包括體系架構(gòu)、計(jì)算模型、數(shù)據(jù)模型、智能輔助決策模型、性能優(yōu)化模型及知識(shí)服務(wù)模型[34]。復(fù)雜異構(gòu)數(shù)據(jù)處理、存儲(chǔ)、關(guān)聯(lián)挖掘、檢索查詢、分析理解、智能服務(wù)等都需要先進(jìn)的大數(shù)據(jù)存儲(chǔ)和處理基礎(chǔ)設(shè)施[33]。
從技術(shù)上來(lái)看,大數(shù)據(jù)技術(shù)是從海量數(shù)據(jù)中快速高效地挖掘出有效信息的綜合性技術(shù),包括兩項(xiàng)關(guān)鍵技術(shù):Hadoop 大數(shù)據(jù)分析平臺(tái)(分布式文件系統(tǒng)和大數(shù)據(jù)存儲(chǔ)服務(wù))和 MapReduce 計(jì)算框架(高性能并行計(jì)算和大數(shù)據(jù)處理服務(wù)),能夠?qū)崿F(xiàn)對(duì)結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)數(shù)據(jù)和復(fù)雜數(shù)據(jù)的快速處理和分析,這些都必須基于大數(shù)據(jù)基礎(chǔ)設(shè)施才能實(shí)現(xiàn)。如圖書(shū)館常用監(jiān)控服務(wù)器、網(wǎng)絡(luò)監(jiān)控器、視頻監(jiān)控系統(tǒng)、用戶閱讀終端、可穿戴閱讀設(shè)備和讀者管理系統(tǒng)等設(shè)備采集數(shù)據(jù)[52]。
圖書(shū)館資源、用戶、技術(shù)、設(shè)施、服務(wù)等的變化引發(fā)了圖書(shū)館業(yè)務(wù)流程的變化。隨著大數(shù)據(jù)時(shí)代的到來(lái),圖書(shū)館將重點(diǎn)圍繞資源大數(shù)據(jù)和用戶大數(shù)據(jù)等的產(chǎn)生、存儲(chǔ)、分析、利用、決策等展開(kāi)業(yè)務(wù)流程。數(shù)據(jù)管理是大數(shù)據(jù)環(huán)境下圖書(shū)館業(yè)務(wù)的核心,圖書(shū)館的業(yè)務(wù)將圍繞大數(shù)據(jù)管理進(jìn)行調(diào)整和重組,建立大數(shù)據(jù)技術(shù)與圖書(shū)館資源、館員、用戶、服務(wù)和管理之間的關(guān)聯(lián)[53]。如中國(guó)藥科大學(xué)圖書(shū)館圖書(shū)與信息中心2016年基于大數(shù)據(jù)流向構(gòu)建了“大數(shù)據(jù)業(yè)務(wù)456模式”[54]。越來(lái)越多的圖書(shū)館將基于數(shù)據(jù)重組業(yè)務(wù)流程以適應(yīng)大數(shù)據(jù)發(fā)展的需要。
大數(shù)據(jù)是一種新思維[55],大數(shù)據(jù)思維可以幫助圖書(shū)館實(shí)現(xiàn)資源、館員、設(shè)施、讀者和服務(wù)之間的關(guān)聯(lián),挖掘出大數(shù)據(jù)之間存在的復(fù)雜、非線性關(guān)系[52]。大數(shù)據(jù)給圖書(shū)館發(fā)展帶來(lái)挑戰(zhàn)的同時(shí),也帶來(lái)了新的發(fā)展契機(jī),拓展了圖書(shū)館的創(chuàng)新發(fā)展空間。大數(shù)據(jù)環(huán)境下,圖書(shū)館將重點(diǎn)圍繞數(shù)據(jù)采集、數(shù)據(jù)整理、分析挖掘、數(shù)據(jù)展現(xiàn)、數(shù)據(jù)應(yīng)用等數(shù)據(jù)處理流程,研發(fā)或采購(gòu)大數(shù)據(jù)管理軟件、大數(shù)據(jù)挖掘分析軟件、數(shù)據(jù)可視化軟件、硬件支撐平臺(tái)等,打造適應(yīng)圖書(shū)館發(fā)展的大數(shù)據(jù)技術(shù)平臺(tái),形成與傳統(tǒng)業(yè)務(wù)流程深度融合的大數(shù)據(jù)解決方案[56]。隨著資源、服務(wù)、用戶、館員、設(shè)施、管理與業(yè)務(wù)等不斷變化,圖書(shū)館需要重新定位其發(fā)展方向。
在“一切皆數(shù)據(jù)”“一切皆資源”理念的指引下,圖書(shū)館資源將會(huì)大大得到拓展。大數(shù)據(jù)時(shí)代圖書(shū)館的資源創(chuàng)新主要體現(xiàn)在:
(1)圖書(shū)館大數(shù)據(jù)資源的積累。在大數(shù)據(jù)環(huán)境下,圖書(shū)館圍繞資源和用戶以及業(yè)務(wù)、服務(wù)和管理活動(dòng)會(huì)形成資源大數(shù)據(jù)、用戶大數(shù)據(jù)、業(yè)務(wù)大數(shù)據(jù)、服務(wù)大數(shù)據(jù)和管理大數(shù)據(jù),經(jīng)過(guò)不斷積累和更新,形成龐大的數(shù)據(jù)集,是圖書(shū)館寶貴的數(shù)據(jù)資產(chǎn)。
(2)圖書(shū)館網(wǎng)絡(luò)大數(shù)據(jù)的延伸。隨著計(jì)算機(jī)互聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)的不斷升級(jí)和普及,圖書(shū)館在互聯(lián)網(wǎng)上的大數(shù)據(jù)資源可以無(wú)限拓展和延伸。一部分高度關(guān)聯(lián)的互聯(lián)網(wǎng)資源可以變成圖書(shū)館自身的大數(shù)據(jù)資源,另一部分則是圖書(shū)館的虛擬大數(shù)據(jù)資源。
(3)圖書(shū)館大數(shù)據(jù)資源的拓展。政府是大數(shù)據(jù)資源的最大擁有者,政府?dāng)?shù)據(jù)開(kāi)放已成為一種世界潮流。與此同時(shí),隨著數(shù)據(jù)量的積累,數(shù)據(jù)存儲(chǔ)、管理、安全等將成為大數(shù)據(jù)時(shí)代政府、企業(yè)、機(jī)構(gòu)甚至個(gè)人的一種巨大負(fù)擔(dān),需要專業(yè)可靠的數(shù)據(jù)托管機(jī)構(gòu)承擔(dān)數(shù)據(jù)保管工作。圖書(shū)館作為重要的專業(yè)數(shù)據(jù)管理機(jī)構(gòu),可以開(kāi)展數(shù)據(jù)托管業(yè)務(wù),一方面可以拓展圖書(shū)館的大數(shù)據(jù)資源,另一方面可以開(kāi)發(fā)圖書(shū)館的數(shù)據(jù)管理功能,為圖書(shū)館發(fā)展找到新的生存空間。
(4)圖書(shū)館大數(shù)據(jù)資源的開(kāi)放。在大數(shù)據(jù)時(shí)代,數(shù)據(jù)開(kāi)放與共享已成為一種趨勢(shì)。圖書(shū)館也應(yīng)加入數(shù)據(jù)開(kāi)放與共享行列,一方面享受大數(shù)據(jù)開(kāi)放與共享的福利,另一方面可開(kāi)放自身的大數(shù)據(jù)資源以造福更多用戶。2012 年 4月 26 日,哈佛大學(xué)圖書(shū)館宣稱將圖書(shū)大數(shù)據(jù)公之于眾,這些數(shù)據(jù)由 73 家圖書(shū)館分館提供,涵蓋1 200 多萬(wàn)種資料,包括書(shū)目數(shù)據(jù)、手稿、地圖、視頻和音頻等,在美國(guó)數(shù)字公共圖書(shū)館(Digital Public Library of America)中提供下載[57]。OverDrive 圖書(shū)公司將長(zhǎng)期以來(lái)與各類圖書(shū)館合作中所獲得的電子書(shū)和數(shù)字有聲讀物的流通狀況、讀者的圖書(shū)需求狀況、圖書(shū)館網(wǎng)站訪問(wèn)的擁堵?tīng)顩r和人口統(tǒng)計(jì)學(xué)等信息提供給合作者開(kāi)放存取[58]。
在大數(shù)據(jù)時(shí)代,“一切皆用戶”“一切皆服務(wù)”將是圖書(shū)館服務(wù)的新思維和新理念。互聯(lián)、開(kāi)放、高效與便利是大數(shù)據(jù)時(shí)代的特點(diǎn),大數(shù)據(jù)挖掘與分析將成為未來(lái)圖書(shū)館服務(wù)的新模式,是圖書(shū)館服務(wù)創(chuàng)新、轉(zhuǎn)型和可持續(xù)發(fā)展的新理念和新實(shí)踐[45]?;趫D書(shū)館大數(shù)據(jù),利用大數(shù)據(jù)關(guān)聯(lián),通過(guò)大數(shù)據(jù)智能分析,快速定位用戶所需資源,圖書(shū)館能夠提供個(gè)性化服務(wù)、知識(shí)服務(wù)、精準(zhǔn)服務(wù)、推薦服務(wù)、定制服務(wù)、數(shù)據(jù)服務(wù)、智慧服務(wù)、增值服務(wù)等創(chuàng)新服務(wù)內(nèi)容,提高圖書(shū)館的服務(wù)質(zhì)量和水平。
提供數(shù)據(jù)綜合服務(wù)是圖書(shū)館服務(wù)發(fā)展的重要方向,未來(lái)圖書(shū)館的一個(gè)重要角色就是提供數(shù)據(jù)服務(wù)[29]。數(shù)據(jù)服務(wù)是大數(shù)據(jù)環(huán)境下圖書(shū)館服務(wù)在內(nèi)容和形式上的一種創(chuàng)新,其核心價(jià)值在于為館員和用戶提供精準(zhǔn)的數(shù)據(jù),以輔助圖書(shū)館管理和用戶利用決策?;跀?shù)據(jù)驅(qū)動(dòng)的智慧服務(wù)也是大數(shù)據(jù)環(huán)境下圖書(shū)館服務(wù)的新內(nèi)容和新形式[41]。
在大數(shù)據(jù)環(huán)境下,圖書(shū)館的服務(wù)都是基于大數(shù)據(jù)挖掘與分析而進(jìn)行的,數(shù)據(jù)即服務(wù)、分析即服務(wù)將成為大數(shù)據(jù)時(shí)代圖書(shū)館的主要服務(wù)模式,這是一種綜合性的集成服務(wù)創(chuàng)新,圖書(shū)館的服務(wù)內(nèi)容、服務(wù)方式、服務(wù)系統(tǒng)、用戶素養(yǎng)等都將發(fā)生巨大變化。服務(wù)內(nèi)容不僅有傳統(tǒng)的結(jié)構(gòu)化館藏?cái)?shù)字資源、網(wǎng)絡(luò)資源、數(shù)據(jù)庫(kù)資源,還有大量用戶行為、交互產(chǎn)生的分布式、異構(gòu)化、多樣化的數(shù)字資源,且這種非結(jié)構(gòu)化的資源在大數(shù)據(jù)環(huán)境下的服務(wù)價(jià)值將更加凸顯。圖書(shū)館的服務(wù)方式將由被動(dòng)注意、被動(dòng)交流轉(zhuǎn)向主動(dòng)發(fā)現(xiàn)、雙向互動(dòng)交流;服務(wù)系統(tǒng)更加開(kāi)放、社會(huì)化、人性化。用戶的信息素養(yǎng)和要求發(fā)生變化,多數(shù)用戶已經(jīng)掌握了在網(wǎng)絡(luò)環(huán)境下利用計(jì)算機(jī)終端、智能手機(jī)、掌上電腦、電視等訪問(wèn)數(shù)字資源的技術(shù)和技巧,其信息要求已由簡(jiǎn)單的檢索、咨詢向?qū)W科知識(shí)導(dǎo)航、個(gè)性化定制方向發(fā)展。圖書(shū)館要對(duì)在線文本、圖像、音視頻、日志、讀者行為等數(shù)據(jù)進(jìn)行實(shí)時(shí)更新、采集、抽取、分析、挖掘、去重,提煉出有價(jià)值的信息整合存儲(chǔ)到虛擬空間,通過(guò)大數(shù)據(jù)智能化檢索技術(shù)給用戶提供一站式服務(wù)。同時(shí),為了更好地滿足用戶的個(gè)性化需求,圖書(shū)館還要提供基于聯(lián)機(jī)公共檢索目錄日志、借還書(shū)流通日志、瀏覽下載館藏資源和網(wǎng)絡(luò)資源日志的學(xué)科知識(shí)導(dǎo)航服務(wù)、可視化服務(wù)、智慧服務(wù)等個(gè)性化定制或個(gè)性化推送服務(wù)[59]。如清華大學(xué)、上海交通大學(xué)、上海師范大學(xué)等高校圖書(shū)館的學(xué)科博客服務(wù),就是通過(guò)統(tǒng)計(jì)、分析,有針對(duì)性地為用戶推介圖書(shū)館的資源與服務(wù),多角度、深層次挖掘?qū)W科信息,為用戶量身定制服務(wù)[60]。圖書(shū)館管理者應(yīng)從頂層設(shè)計(jì)開(kāi)始,把“信息的快速獲取、信息資源的高效存儲(chǔ)、數(shù)據(jù)的精準(zhǔn)分析、數(shù)據(jù)的智慧化處理”作為大數(shù)據(jù)環(huán)境下數(shù)字圖書(shū)館發(fā)展的戰(zhàn)略目標(biāo),構(gòu)建基于大數(shù)據(jù)資源、技術(shù)、服務(wù)、管理的新的運(yùn)行機(jī)制,全面提升圖書(shū)館的服務(wù)能力[50]。
如何及時(shí)、有效、精準(zhǔn)、智慧地為讀者服務(wù),提高讀者滿意度,是大數(shù)據(jù)時(shí)代圖書(shū)館發(fā)展的核心價(jià)值,其前提是充分了解讀者及其需求,而基于大數(shù)據(jù)的讀者畫(huà)像能為圖書(shū)館全面、真實(shí)地了解讀者提供有效的手段和工具。
用戶畫(huà)像也稱為用戶臉譜繪制、用戶角色定位,圖書(shū)館也稱為讀者畫(huà)像。用戶畫(huà)像是以海量數(shù)據(jù)為基礎(chǔ),抽取與用戶相關(guān)的數(shù)據(jù),從足夠多的用戶數(shù)據(jù)中逐漸抽象出用戶真實(shí)面貌的過(guò)程[61]。用戶畫(huà)像可以還原用戶真實(shí)面目,幫助圖書(shū)館精準(zhǔn)地定位讀者并提供個(gè)性化服務(wù),是圖書(shū)館精準(zhǔn)服務(wù)的內(nèi)容之一。
用戶畫(huà)像的過(guò)程就是繪制用戶臉譜的過(guò)程,即根據(jù)用戶社會(huì)屬性、生活習(xí)慣和消費(fèi)行為等數(shù)據(jù)抽象出一個(gè)標(biāo)簽化的用戶模型[62]。Alan Cooper最早提出了Persona(畫(huà)像、臉譜、角色) 的概念:畫(huà)像是目標(biāo)用戶的具體體現(xiàn)(Personas are a concrete representation of target users)。畫(huà)像是真實(shí)用戶的虛擬代表,是基于一系列真實(shí)數(shù)據(jù)之上的目標(biāo)用戶模型構(gòu)建[63]。Amato將用戶畫(huà)像界定為“一個(gè)從海量數(shù)據(jù)中獲取由用戶信息構(gòu)成的形象集合”[61]。
圖書(shū)館的用戶基本數(shù)據(jù)和用戶行為數(shù)據(jù)既包含線上行為數(shù)據(jù),也包含線下行為數(shù)據(jù),可以通過(guò)統(tǒng)一用戶系統(tǒng)(讀者基本信息數(shù)據(jù))、借閱系統(tǒng)(讀者借閱數(shù)據(jù))、搜索系統(tǒng)(登錄數(shù)據(jù)、搜索歷史、操作日志)、門禁系統(tǒng)(入館刷卡數(shù)據(jù))、讀者門戶系統(tǒng)(讀者賬號(hào)、閱讀筆記、閱讀歷史、收藏信息)等數(shù)據(jù)完整地勾勒出讀者的信息全貌,即用戶畫(huà)像[64]。構(gòu)建讀者畫(huà)像的核心工作是給讀者貼“標(biāo)簽”,通過(guò)數(shù)據(jù)加分析,用若干標(biāo)簽來(lái)逐步精準(zhǔn)描述一個(gè)目標(biāo)讀者的過(guò)程,而標(biāo)簽是通過(guò)對(duì)讀者數(shù)據(jù)進(jìn)行挖掘和分析得來(lái)的高度精煉的讀者特征標(biāo)識(shí)[62]?;谟脩舳嗑S標(biāo)簽(如基本信息標(biāo)簽、內(nèi)容偏好標(biāo)簽、互動(dòng)標(biāo)簽、會(huì)話標(biāo)簽、情境標(biāo)簽等),圖書(shū)館能夠全面細(xì)致地刻畫(huà)出讀者全貌,深入挖掘圖書(shū)館大數(shù)據(jù)資源的價(jià)值,為讀者提供精準(zhǔn)的個(gè)性化知識(shí)推薦服務(wù),提升基于大數(shù)據(jù)的圖書(shū)館知識(shí)服務(wù)水平[61]。
美國(guó)思域技術(shù)公司(Civic Technologies)在美國(guó)博物館和圖書(shū)館服務(wù)協(xié)會(huì)的資助下,在美國(guó)10 所圖書(shū)館展開(kāi)了關(guān)于用戶的大數(shù)據(jù)項(xiàng)目,通過(guò)分析核心用戶數(shù)據(jù),深入了解用戶的生活、學(xué)習(xí)習(xí)慣,細(xì)分用戶,形成用戶畫(huà)像并用于圖書(shū)館個(gè)性化服務(wù)和精準(zhǔn)服務(wù)[65]。
圖書(shū)館究竟需要什么樣的大數(shù)據(jù)?圖書(shū)館有哪些大數(shù)據(jù)?大數(shù)據(jù)能給圖書(shū)館帶來(lái)什么影響?如何利用大數(shù)據(jù)為圖書(shū)館服務(wù)?這些問(wèn)題的回答關(guān)系到大數(shù)據(jù)環(huán)境下圖書(shū)館的定位問(wèn)題[66]。
21 世紀(jì)是知識(shí)世紀(jì)、數(shù)據(jù)世紀(jì),強(qiáng)調(diào)數(shù)據(jù)力。大數(shù)據(jù)給圖書(shū)館發(fā)展帶來(lái)的影響是不言而喻的,也使圖書(shū)館出現(xiàn)了一些新的發(fā)展趨勢(shì)。圖書(shū)館在資源、用戶、服務(wù)、管理、業(yè)務(wù)、技術(shù)、設(shè)施等方面發(fā)生了一系列變化,是到了應(yīng)該給圖書(shū)館發(fā)展重新定位的時(shí)候。數(shù)據(jù)圖書(shū)館、智慧圖書(shū)館和數(shù)據(jù)中心將會(huì)是未來(lái)圖書(shū)館發(fā)展的新形態(tài)。
(1)數(shù)據(jù)圖書(shū)館。數(shù)據(jù)圖書(shū)館和大數(shù)據(jù)圖書(shū)館將是大數(shù)據(jù)環(huán)境下圖書(shū)館發(fā)展的新形態(tài)。圖書(shū)館以數(shù)據(jù)為核心進(jìn)行數(shù)據(jù)保存、處理和應(yīng)用,進(jìn)而形成具有數(shù)據(jù)服務(wù)、數(shù)據(jù)出版和數(shù)據(jù)增值服務(wù)的圖書(shū)館新形態(tài),即數(shù)據(jù)圖書(shū)館。
數(shù)據(jù)圖書(shū)館具備數(shù)據(jù)資源的采集、篩選、加工、組織與序化、集成與整合、推送、導(dǎo)航與獲取、用戶服務(wù)與管理、知識(shí)服務(wù)等優(yōu)勢(shì),并能實(shí)現(xiàn)圖書(shū)館服務(wù)的大數(shù)據(jù)化[29]。數(shù)據(jù)圖書(shū)館的核心任務(wù)是構(gòu)建數(shù)據(jù)密集型知識(shí)服務(wù)系統(tǒng),提供基于大數(shù)據(jù)的知識(shí)服務(wù)[67]。
數(shù)據(jù)圖書(shū)館將承擔(dān)開(kāi)放數(shù)據(jù)管理與保存中心、開(kāi)放數(shù)據(jù)服務(wù)、數(shù)據(jù)監(jiān)管服務(wù)、數(shù)據(jù)分析服務(wù)和知識(shí)發(fā)現(xiàn)服務(wù)等功能[68]。大數(shù)據(jù)環(huán)境下,圖書(shū)館有責(zé)任與義務(wù)扮演開(kāi)放數(shù)據(jù)管理與中心的角色,為科學(xué)家等用戶群體提供開(kāi)放數(shù)據(jù)的檢索、分析、保存等服務(wù)。如開(kāi)源站點(diǎn) biblios.net向圖書(shū)館界提供開(kāi)放 MARC 數(shù)據(jù)的開(kāi)發(fā)、 創(chuàng)建、 共享、 轉(zhuǎn)換服務(wù),目前以3 000余萬(wàn)條數(shù)據(jù)成為全球最大的免費(fèi)圖書(shū)館編目數(shù)據(jù)平臺(tái)[69]。德國(guó)國(guó)家圖書(shū)館[70]、大英圖書(shū)館[71]也宣布對(duì)外提供開(kāi)放數(shù)據(jù)服務(wù)。數(shù)據(jù)圖書(shū)館可發(fā)揮自身在信息組織與檢索方面的優(yōu)勢(shì),提供數(shù)據(jù)監(jiān)管服務(wù),對(duì)數(shù)據(jù)進(jìn)行修改、合并、標(biāo)引、分析與索引,建立數(shù)據(jù)關(guān)聯(lián),便于數(shù)據(jù)檢索、挖掘與分析,提高數(shù)據(jù)質(zhì)量和價(jià)值;還可以利用圖書(shū)館的大數(shù)據(jù)平臺(tái)和工具,提供數(shù)據(jù)分析和知識(shí)發(fā)現(xiàn)服務(wù),提高數(shù)據(jù)資源的利用效率,更好地發(fā)揮數(shù)據(jù)資源的潛在價(jià)值,如EDS、PRIMO、SUMMON等一站式知識(shí)發(fā)現(xiàn)平臺(tái)可以為用戶提供知識(shí)發(fā)現(xiàn)和知識(shí)咨詢等服務(wù)[68]。
(2)智慧圖書(shū)館。智慧圖書(shū)館是第三代新興的圖書(shū)館發(fā)展形態(tài),是基于大數(shù)據(jù)服務(wù)的圖書(shū)館發(fā)展模式[72]。智慧圖書(shū)館主要從數(shù)據(jù)、平臺(tái)、服務(wù)三個(gè)層面構(gòu)建智慧服務(wù)體系[73],并借助大數(shù)據(jù)分析技術(shù)對(duì)用戶行為、業(yè)務(wù)及服務(wù)數(shù)據(jù)進(jìn)行智慧分析[74],提供智能服務(wù)、知識(shí)服務(wù)、個(gè)性化服務(wù)等智慧服務(wù)[75]。
(3)數(shù)據(jù)中心。大數(shù)據(jù)時(shí)代,圖書(shū)館將從文獻(xiàn)中心、信息中心、知識(shí)中心向數(shù)據(jù)中心轉(zhuǎn)變,承擔(dān)數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)保管、數(shù)據(jù)監(jiān)護(hù)、數(shù)據(jù)分析、數(shù)據(jù)開(kāi)發(fā)、數(shù)據(jù)服務(wù)等職能,成為公共數(shù)據(jù)中心、數(shù)據(jù)存儲(chǔ)中心、數(shù)據(jù)托管中心、數(shù)據(jù)開(kāi)發(fā)中心、數(shù)據(jù)服務(wù)中心、數(shù)據(jù)管理中心、數(shù)據(jù)分析中心等。隨著數(shù)據(jù)資源的拓展和開(kāi)發(fā),圖書(shū)館甚至有可能成為數(shù)據(jù)超級(jí)市場(chǎng)和數(shù)據(jù)交易中心。
國(guó)外圖書(shū)館界較早意識(shí)到圖書(shū)館數(shù)據(jù)功能和職責(zé)的變化。2009 年,Huwe提出用政治手段推進(jìn)圖書(shū)館與數(shù)據(jù)中心合并,拓展圖書(shū)館的職責(zé)[76]。2012 年,美國(guó)研究圖書(shū)館協(xié)會(huì) (Association of College & Research Libraries,ACRL)在其發(fā)布的《高校圖書(shū)館十大發(fā)展趨勢(shì)》報(bào)告中指出:開(kāi)展數(shù)據(jù)收集、保存、開(kāi)發(fā)與應(yīng)用將是未來(lái)圖書(shū)館的發(fā)展趨勢(shì)[77]。2014 年 6 月,ACRL在《高校圖書(shū)館發(fā)展大趨勢(shì)》報(bào)告中把“數(shù)據(jù)”列為四大關(guān)鍵詞之一[78]。2016年,ACRL在《高校圖書(shū)館十大發(fā)展趨勢(shì)》報(bào)告中提出:“研究數(shù)據(jù)服務(wù)”“數(shù)據(jù)發(fā)展政策與管理計(jì)劃”“基于館員專業(yè)化發(fā)展而提供研究數(shù)據(jù)服務(wù)”“數(shù)字化學(xué)術(shù)中心”將是學(xué)術(shù)圖書(shū)館發(fā)展的趨勢(shì)[79]。美國(guó) Ithaka S+R咨詢機(jī)構(gòu)也認(rèn)為,數(shù)據(jù)管理可能是未來(lái)圖書(shū)館管理的核心問(wèn)題,這將使圖書(shū)館面臨挑戰(zhàn)[80]。
我國(guó)圖書(shū)館界也對(duì)圖書(shū)館作為數(shù)據(jù)中心的定位進(jìn)行了探討。陳傳夫提出把數(shù)字圖書(shū)館作為公共文化的組成部分,納入國(guó)家大數(shù)據(jù)發(fā)展戰(zhàn)略之中,作為其發(fā)展的子項(xiàng)目,并建議成立國(guó)家層面的數(shù)字圖書(shū)館大數(shù)據(jù)管理中心,下設(shè)大數(shù)據(jù)專家組中心、大數(shù)據(jù)控制中心和大數(shù)據(jù)分析中心[81]。劉春麗、徐躍權(quán)認(rèn)為在開(kāi)放數(shù)據(jù)環(huán)境中,圖書(shū)館可能扮演知識(shí)服務(wù)中心和開(kāi)放數(shù)據(jù)管理與保存中心兩大角色[82]。樊偉紅等認(rèn)為,在大數(shù)據(jù)環(huán)境下,圖書(shū)館通常有三種角色:大數(shù)據(jù)的使用者或受益者、大數(shù)據(jù)的提供者或開(kāi)發(fā)者及大數(shù)據(jù)的運(yùn)營(yíng)者或維護(hù)者[34]。張崢嶸、劉亞麗認(rèn)為,圖書(shū)館是法定的政府信息公開(kāi)承辦單位,在推動(dòng)政府?dāng)?shù)據(jù)公開(kāi)方面大有可為。在大數(shù)據(jù)時(shí)代,政府是公共數(shù)據(jù)的“托管人”,而圖書(shū)館是公共數(shù)據(jù)的委托人和保管人[68]。許碧文認(rèn)為圖書(shū)館在數(shù)據(jù)監(jiān)護(hù)工作中可以承擔(dān)數(shù)據(jù)集合存儲(chǔ)、數(shù)據(jù)管理規(guī)劃、最佳實(shí)踐經(jīng)驗(yàn)傳播、收集與傳播數(shù)據(jù)集合以及數(shù)據(jù)保存標(biāo)準(zhǔn)制定等職責(zé)[83]。