關(guān)鍵詞:大數(shù)據(jù);圖書館;知識服務
摘要:文章分析了大數(shù)據(jù)的內(nèi)涵特征、對圖書館的價值,并從增加、嵌入、應用等幾個方面論述大數(shù)據(jù)對圖書館的積極意義。
中圖分類號:G252文獻標識碼:A文章編號:1003-1588(2015)04-0117-03
收稿日期:2015-03-12
作者簡介:李英(1971—), 江蘇第二師范學院圖書館館員。1大數(shù)據(jù)概述及內(nèi)涵
1.1大數(shù)據(jù)概述
大數(shù)據(jù)的理念,要追溯到1980年,著名未來學家阿爾文·托夫勒在其《第三次浪潮》一書中提到的“大數(shù)據(jù)”一詞。但直到2011年,全球知名咨詢公司麥肯錫提出“大數(shù)據(jù)時代已經(jīng)到來了”,大數(shù)據(jù)才迅速成為政府及信息科技等行業(yè)關(guān)注的熱點。圖書館歷來是信息新技術(shù)、新理念應用的前沿,“大數(shù)據(jù)”亦不例外。美國等發(fā)達國家圖書館已經(jīng)率先將“大數(shù)據(jù)”的服務引入到了圖書館中,并進行了實踐。然而,關(guān)于“大數(shù)據(jù)”的概念,目前學術(shù)界還沒有達成一個統(tǒng)一的認識。綜合已有的學術(shù)研究,可以從三個方面理解這一概念的含義:①大數(shù)據(jù)是信息資產(chǎn),他需要新的處理模式才具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。②大數(shù)據(jù)還是一個技術(shù)概念,是指從各種各樣類型的數(shù)據(jù)中,快速獲得有價值信息的能力。目前,大數(shù)據(jù)技術(shù)主要涵蓋的領域有:數(shù)據(jù)采集、數(shù)據(jù)存取、數(shù)據(jù)處理、統(tǒng)計分析、數(shù)據(jù)挖掘、模型預測、結(jié)果呈現(xiàn)等。③大數(shù)據(jù)是指一種思維,認為公開的數(shù)據(jù)一旦處理得當就能為人們急需解決的問題提供答案。
1.2大數(shù)據(jù)的內(nèi)涵特征
1.2.1 “大”。 “大” 不僅是指數(shù)據(jù)規(guī)模的海量,更在于他是全面數(shù)據(jù)、完整數(shù)據(jù)和綜合數(shù)據(jù)。 “大數(shù)據(jù)”屬于多維數(shù)據(jù),對調(diào)查對象的全方位全部信息進行了記錄,有空間維度上的多角度、多層次信息的交叉復現(xiàn);還有時間維度上的與人或社會有機體的活動相關(guān)聯(lián)的信息的持續(xù)呈現(xiàn)。因而,大數(shù)據(jù)能夠更真實地還原客觀世界。
1.2.2“數(shù)”。 “數(shù)”是指數(shù)字化內(nèi)容。數(shù)據(jù)是客觀存在的,但是只有經(jīng)過“數(shù)字化”處理的數(shù)據(jù)才有可能被計算機系統(tǒng)計算、分析、追蹤、量化處理。大數(shù)據(jù)的數(shù)據(jù)來自多種數(shù)據(jù)源,是一種綜合數(shù)據(jù),數(shù)據(jù)類型繁多,囊括了傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù)(如數(shù)值型、數(shù)字型)和新型的海量的半結(jié)構(gòu)、非結(jié)構(gòu)化數(shù)據(jù)(如文本、音頻、視頻、傳感數(shù)據(jù)、訪問日志、網(wǎng)絡檢索歷史記錄、Email、社交媒體、圖片)。
1.2.3“據(jù)”。 “據(jù)”是指證據(jù)。大數(shù)據(jù)蘊藏大量前瞻性的預見信息,能為預測提供重要依據(jù),價值巨大。尋找大數(shù)據(jù)價值需要人們擁有全新的大數(shù)據(jù)思維,具有大數(shù)據(jù)意識,相信數(shù)據(jù)會說話。在大數(shù)據(jù)技術(shù)輔助下,開展以數(shù)據(jù)為基礎的理性的實證分析,挖掘數(shù)據(jù)背后所隱藏的有價值信息,由此去做一些判斷、策劃、預測,使得人類社會朝著 “智能化”“智慧化” 方向發(fā)展。
2大數(shù)據(jù)給圖書館服務帶來的發(fā)展機遇
2.1大數(shù)據(jù)給圖書館帶來豐富的信息源
大數(shù)據(jù)時代,萬物皆可測量,全世界數(shù)據(jù)每分每秒都有產(chǎn)生,數(shù)據(jù)量達到海量,數(shù)據(jù)來源分布十分廣泛,如有關(guān)業(yè)務流程的社會大數(shù)據(jù)、個人大數(shù)據(jù)、科學大數(shù)據(jù)等。這些數(shù)據(jù)與科學政治社會經(jīng)濟軍事等人類社會生活息息相關(guān)。開發(fā)和利用這些數(shù)據(jù)會給人類的生活帶來更多便利,對人類社會進步有著重要的意義。這些數(shù)據(jù)獲取大多是免費的。對圖書館而言,收集和存儲這些數(shù)據(jù),不僅可以豐富圖書館館藏信息資源,為社會提供大數(shù)據(jù)源和創(chuàng)造信息價值;還可以利用數(shù)據(jù)中富含的用戶信息行為數(shù)據(jù)了解用戶需求,指導圖書館信息資源建設和創(chuàng)新信息服務、擴大信息服務范圍和提高信息服務質(zhì)量。
2.2大數(shù)據(jù)技術(shù)提升了圖書館服務能力
在大數(shù)據(jù)時代,圖書館傳統(tǒng)的數(shù)據(jù)庫服務平臺和傳統(tǒng)的IT架構(gòu)技術(shù)無法滿足大數(shù)據(jù)的數(shù)據(jù)管理、數(shù)據(jù)應用及數(shù)據(jù)服務的需求。同時,隨著用戶素質(zhì)的提高,圖書館傳統(tǒng)的信息服務已不能滿足用戶需求了,用戶要求圖書館提供更多的知識服務。
大數(shù)據(jù)技術(shù)給圖書館知識服務帶來服務平臺的升級,不僅提供了數(shù)據(jù)獲取、存儲、傳遞的新模式,而且還提供了信息分析挖掘的新手段,對數(shù)字資源進行深層次開發(fā),建立新型知識服務引擎。新型知識服務引擎包括資源及學術(shù)搜索引擎、資源及服務推薦引擎、知識服務社區(qū)實體(包括用戶及資源)行為智能分析引擎、用戶知識需求預測引擎及多維度信息資源獲取、組織、分析及決策引擎等。
2.3大數(shù)據(jù)思維帶來了圖書館可持續(xù)發(fā)展
圖書館作為信息中心,在數(shù)據(jù)占有方面,具有得天獨厚的優(yōu)勢。擁有豐富的數(shù)據(jù)庫資源、期刊報紙及讀者個人信息 、讀者瀏覽歷史,日常工作中也積累了大量與社會經(jīng)濟生活息息相關(guān)的數(shù)據(jù)。然而一些數(shù)據(jù)一旦完成了最基本的用途后,數(shù)據(jù)也會被認為已沒有用處而丟掉。從大數(shù)據(jù)的角度看來,那些沉睡的數(shù)據(jù)、丟掉的數(shù)據(jù)有著無比巨大的價值,能產(chǎn)生驚人的效用。比如,來自于讀者數(shù)據(jù)庫的瀏覽檢索歷史,一個檢索命令完成之后,檢索詞就沒用了。然而讀者瀏覽歷史能夠反映讀者的興趣和關(guān)注點,具有十分重要的商業(yè)價值。如“京東出版”的首部圖書《大衛(wèi)·貝克漢姆》,就是京東出版通過對讀者瀏覽史大數(shù)據(jù)進行挖掘,反向操作,為特定消費群體“私人定制”相關(guān)圖書。隨著大數(shù)據(jù)的理念深入人心,圖書館人認識到了數(shù)據(jù)是圖書館戰(zhàn)略資源,得數(shù)據(jù)者得天下,并學著從數(shù)據(jù)中學習洞察事物發(fā)展規(guī)律,預測未來?,F(xiàn)在,圖書館人一方面加強了對各類數(shù)據(jù)的收集;另一方面積極深入開展大數(shù)據(jù)的開發(fā)和利用,為數(shù)據(jù)供應商、出版社和企業(yè)等不同群體提供信息資源增值服務,尋求產(chǎn)業(yè)聯(lián)盟,開展與數(shù)據(jù)供應商、出版社和企業(yè)等跨界合作,充實與拓展圖書館自身業(yè)務基礎,提高個性化服務實力,實現(xiàn)圖書館的可持續(xù)發(fā)展。
李英:基于大數(shù)據(jù)的圖書館服務新發(fā)展研究李英:基于大數(shù)據(jù)的圖書館服務新發(fā)展研究3基于大數(shù)據(jù)的圖書館服務新發(fā)展
3.1增加半結(jié)構(gòu)和非結(jié)構(gòu)數(shù)據(jù)資源的收藏,擴大圖書館可調(diào)用的數(shù)字資源
圖書館是人類文明記憶的裝置,擔負著保護人類文明職責,大數(shù)據(jù)是人類文明的重要體現(xiàn),是科學研究的基本信息資源。收集大數(shù)據(jù)是圖書館的重要職責,大數(shù)據(jù)也是開展知識服務的基礎。目前,圖書館數(shù)據(jù)庫以收藏結(jié)構(gòu)化數(shù)據(jù)為主,半結(jié)構(gòu)化或者非結(jié)構(gòu)化數(shù)據(jù)所占比重非常低,而半結(jié)構(gòu)和非結(jié)構(gòu)化數(shù)據(jù)恰恰是圖書館為用戶開展細節(jié)服務不可或缺的。一些圖書館開始了探索半結(jié)構(gòu)化或者非結(jié)構(gòu)化數(shù)據(jù)的收藏道路,如美國國會圖書館的“美國記憶”項目,收集整理了照片、手稿、海報、樂譜、地圖、錄音、動態(tài)圖像等記載美國歷史文化的特藏。在中國CALIS已啟動科學數(shù)據(jù)項目,中國科技信息研究所啟動了科技報告項目,國家圖書館則啟動了國家記憶項目。這些項目為圖書館迎接大數(shù)據(jù)挑戰(zhàn)積累經(jīng)驗,提供借鑒。 大數(shù)據(jù)環(huán)境下,隨著大數(shù)據(jù)產(chǎn)業(yè)化發(fā)展,對一般圖書館而言,不可能也沒有必要收集所有的數(shù)據(jù)。圖書館只許采集兩類本地數(shù)據(jù),一類是資源性數(shù)據(jù)。比如科研研究數(shù)據(jù),這是本單位科研人員在長期的科研活動中積累的科學數(shù)據(jù),是本單位寶貴的數(shù)據(jù)財富,圖書館有義務采集這方面的數(shù)據(jù)。另一類是在圖書館產(chǎn)生新的大數(shù)據(jù):RFID射頻數(shù)據(jù)、傳感器數(shù)據(jù)、社交網(wǎng)絡交互數(shù)據(jù)、移動互聯(lián)數(shù)據(jù),收集這些包含用戶行為的數(shù)據(jù)為圖書館的精準個性化服務提供參考。
3.2嵌入科研過程,提供知識數(shù)據(jù)信息服務
大數(shù)據(jù)推動下,科學研究進入了一個嶄新的階段。計算機圖靈獎得主Jim G ray提出科學研究的第四范式——以協(xié)同化、網(wǎng)絡化與數(shù)據(jù)驅(qū)動為其主要特征數(shù)據(jù)密集型科學研究,科學研究的本質(zhì)是數(shù)據(jù)的整理和分析。這對科學研究人員的信息能力提出了更高的要求,要求科研人員擁有更強的數(shù)字化交互式的信息管理能力、海量數(shù)據(jù)實時的分析挖掘能力、科學數(shù)據(jù)融匯和多學科協(xié)同的信息資源共享能力。然而科研人員研究由于其對信息的發(fā)現(xiàn)和分析能力的欠缺,直接導致在數(shù)據(jù)的挖掘和信息的管理方面面臨著挑戰(zhàn)。信息的整理和分析是圖書館專業(yè)的信息工作者基本職能和強項。圖書館作為為科研服務的重要力量,為迎合科學研究不斷變化的新需求,圖書館專業(yè)信息工作者應根據(jù)科研人員的需要,將信息服務嵌入科學研究工作的數(shù)據(jù)生命周期中,從其課題選定到結(jié)束的整個過程,為科學研究人員提供評價與預測性信息推送、方案規(guī)劃信息參考咨詢、過程管理與信息重構(gòu)、專題信息關(guān)聯(lián)性管理等服務,促使科研人員的知識發(fā)現(xiàn)和知識創(chuàng)造。
3.3應用大數(shù)據(jù)技術(shù),實現(xiàn)精準化的個性化服務
個性化信息服務一直是圖書館服務追求的目標和發(fā)展方向,也是圖書館可持續(xù)發(fā)展的重要保證。在泛在知識環(huán)境下,圖書館不再是讀者獲取信息的唯一中介,如果讀者無法從圖書館獲得滿意的服務就會轉(zhuǎn)向其他信息組織或機構(gòu),讀者大量的流失將導致圖書館被邊緣化的危險,圖書館只有開展精準化的個性化信息服務,為用戶提供滿意的、可增值的信息服務,才能夠提高用戶對圖書館的忠誠度和滿意度,留住用戶。
通過對大量的用戶信息行為產(chǎn)生的數(shù)據(jù)挖掘,清晰把握用戶的信息需求、意愿及知識應用能力,對用戶的信息需求以及信息行為偏好進行預測,為讀者提供跟蹤服務、知識關(guān)聯(lián)服務、先覺性服務,提高用戶體驗,實現(xiàn)架構(gòu)以讀者個性化服務為核心的信息服務體系。未來,圖書館將進入超個人化時代,為每一位讀者提供一個幫助讀者更好地了解自己、更好地做出選擇的最完備的學習科研生活信息環(huán)境, 支持讀者追求夢想和分享知識等方面的個體信息需求。同時用戶也可以根據(jù)自身的需求定制信息、場地、設備和服務;圖書館專業(yè)館員針對用戶的個性和特點、需求變化,主動為用戶推送他們可能需要的重要資源和服務。
4結(jié)語
圖書館服務是其價值體現(xiàn)的核心,大數(shù)據(jù)時代的到來給圖書館的發(fā)展注入了新的理念、新的技術(shù)和豐富的數(shù)據(jù)資源,圖書館人只有提高大數(shù)據(jù)理念的認知與認同,提高應用大數(shù)據(jù)技術(shù)技能,才能把大數(shù)據(jù)的思想和理念付之行動,才能更好地為用戶服務。
參考文獻:
[1]韋曉凱.大數(shù)據(jù)時代高校圖書館工作思考[J].河北科技圖苑,2014(1):54-56.
[2]維克爾·邁爾-舍恩伯格,肯尼思·庫克耶.大數(shù)據(jù)時代[M].浙江:浙江人民出版社,2013:107.
[3]喻國明.大數(shù)據(jù)的價值及分析技術(shù)的關(guān)鍵[J].新聞與寫作,2014(4): 1.
[4][7]樊偉紅等.圖書館需要怎樣的“大數(shù)據(jù)”[J].圖書館雜志,2012(11) :63-68.
[5][6]陳傳夫、錢 鷗、代鈺珠.大數(shù)據(jù)時代的數(shù)字圖書館建設研究[J].圖書情報工作,2014(4):40-44.
[8]楊海亞.提供公共智慧服務:大數(shù)據(jù)時代圖書館服務模式創(chuàng)新[J].新世紀圖書館,2014(3):10-14.
[9]鄧仲華、李立睿、陸穎雋.大數(shù)據(jù)環(huán)境下嵌入科研過程的信息服務模式研究[J].圖書與情報,2014(1):30-34.
(編校:馬懷云)