數(shù)字圖書館的“大數(shù)據(jù)”
2012年3月奧巴馬政府宣布投資2億美元啟動(dòng)“大數(shù)據(jù)研究與發(fā)展計(jì)劃”,并將之定義為“未來的新石油”,標(biāo)志著大數(shù)據(jù)時(shí)代的到來。
大數(shù)據(jù)實(shí)際上是指針對(duì)海量數(shù)據(jù)的處理方法。當(dāng)數(shù)據(jù)量和規(guī)模巨大到無法利用目前主流軟件工具處理時(shí),如何在合理時(shí)間內(nèi)擷取、管理、處理并整理分析成為有用的資訊,是大數(shù)據(jù)要解決的問題。大數(shù)據(jù)對(duì)人類的數(shù)據(jù)駕馭能力提出了新的挑戰(zhàn),也為人們獲得更為深刻、全面的洞察力提供了前所未有的空間與潛力。
數(shù)字圖書館作為人類知識(shí)的儲(chǔ)存空間、社會(huì)文化的傳承渠道,積累著大量數(shù)據(jù),如各類型書目數(shù)據(jù)、文摘數(shù)據(jù)、全文數(shù)據(jù)、事實(shí)型數(shù)據(jù),等等。這些數(shù)據(jù)中蘊(yùn)含著大量的知識(shí)及其關(guān)聯(lián),對(duì)各種知識(shí)主題、實(shí)體對(duì)象和載體形式,以及科研要素、科學(xué)文獻(xiàn)、科技項(xiàng)目、事件活動(dòng)、專家學(xué)者、產(chǎn)品技術(shù)、組織機(jī)構(gòu)和呈現(xiàn)之間的關(guān)系進(jìn)行揭示和挖掘,形成知識(shí)網(wǎng)絡(luò)平臺(tái),進(jìn)行相關(guān)計(jì)量分析和監(jiān)測(cè)評(píng)估,以形成新的科學(xué)知識(shí)和實(shí)事對(duì)策,可以豐富數(shù)字圖書館的服務(wù)內(nèi)涵。
隨著互聯(lián)網(wǎng)與人們生活的不斷融合,人們的每一行為都會(huì)成為數(shù)據(jù),不知不覺中人們的信息行為和消費(fèi)習(xí)慣都會(huì)被記錄。數(shù)字圖書館擁有豐富的用戶數(shù)據(jù)資源,如用戶注冊(cè)信息、用戶利用信息(如瀏覽、檢索、下載等)、用戶交互信息等各類日志等,通過分析這些用戶數(shù)據(jù),能夠?qū)τ脩舻拈営[習(xí)慣、資源利用行為、網(wǎng)絡(luò)使用痕跡進(jìn)行細(xì)粒度的分析,進(jìn)而拓展數(shù)字圖書館的服務(wù)形式。
大數(shù)據(jù)的發(fā)展,提供了一種看待世界的全新方法,更多地基于事實(shí)與數(shù)據(jù)作出判斷,使社會(huì)也經(jīng)歷思維變革、商業(yè)變革和管理變革;大數(shù)據(jù)也必將促進(jìn)數(shù)字圖書館數(shù)據(jù)管理、數(shù)據(jù)分析、數(shù)據(jù)使用及數(shù)據(jù)服務(wù)的深層次變革,既提出針對(duì)數(shù)據(jù)本身的處理和服務(wù)要求,也提出針對(duì)圖書館員的職責(zé)和意識(shí)要求。這更多地需要圖書館員適應(yīng)大數(shù)據(jù)時(shí)代,改進(jìn)自身的數(shù)據(jù)處理觀念并提高數(shù)據(jù)挖掘能力。
曾建勛