王潔
摘 要:本文對(duì)大數(shù)據(jù)帶給圖書館的影響與挑戰(zhàn)進(jìn)行了探討,文章從闡述大數(shù)據(jù)的概念入手,進(jìn)一步分析了大數(shù)據(jù)對(duì)圖書館的有利影響、大數(shù)據(jù)對(duì)圖書館造成的挑戰(zhàn),最后提出了大數(shù)據(jù)時(shí)代圖書館建設(shè)對(duì)策。
關(guān)鍵詞:大數(shù)據(jù);圖書館;概念;有利影響;建設(shè)對(duì)策
大數(shù)據(jù)的出現(xiàn),對(duì)圖書館事業(yè)發(fā)展起到重要作用,它提高了效率、降低了圖書館管理成本,優(yōu)化了讀者閱讀體驗(yàn),推動(dòng)了數(shù)字圖書館的建立;但同時(shí),大數(shù)據(jù)的復(fù)雜性、不確定性、先進(jìn)性也對(duì)圖書館的運(yùn)營(yíng)和管理造成了巨大挑戰(zhàn),對(duì)此,相關(guān)單位要抓住機(jī)遇,迎接挑戰(zhàn)。
1 大數(shù)據(jù)的具體定義
2011年5月,麥肯錫咨詢公司(Mckinsey and Company)發(fā)布報(bào)告,首次提出了“大數(shù)據(jù)”的概念——“大數(shù)據(jù)”是指其大小超出了典型數(shù)據(jù)庫(kù)軟件的采集、儲(chǔ)存、管理和分析等能力的數(shù)據(jù)集。該定義的重點(diǎn)在于——其一,符合大數(shù)據(jù)標(biāo)準(zhǔn)的數(shù)據(jù)集大小是變化的;其二,不同部門符合大數(shù)據(jù)標(biāo)準(zhǔn)的數(shù)據(jù)集大小存在差別。
2 大數(shù)據(jù)的特征
在信息技術(shù)快速更新?lián)Q代的今天,數(shù)據(jù)信息的采集、存儲(chǔ)和利用都表現(xiàn)出火山式噴發(fā)的特征。大數(shù)據(jù)的特點(diǎn)最初被歸結(jié)為“3V”——即Variety、Velocity、Volume;后來(lái)在此基礎(chǔ)上增加“Value”概念,至今則進(jìn)一步提出“1C”(Complexity)使其完善至“4V+1C”。這是指大數(shù)據(jù)具有五個(gè)方面的特征,其一是類型多樣,涵蓋結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化等多種類型,且其各自對(duì)應(yīng)的運(yùn)行和分析方法是互不相同的;其二,容量大,隨著互聯(lián)網(wǎng)在群眾生活的覆蓋面越來(lái)越廣,所衍生的數(shù)據(jù)也越來(lái)越多,導(dǎo)致各種復(fù)雜信息成倍增長(zhǎng),形成海量信息數(shù)據(jù)庫(kù);其三,速度快,由于社會(huì)的運(yùn)轉(zhuǎn)速度不斷加快,對(duì)數(shù)據(jù)分析和處理的速度和效率也提出了更為嚴(yán)格的要求;其四,價(jià)值高,總體來(lái)說(shuō),某一條數(shù)據(jù)或許不會(huì)有太大的價(jià)值,但信息庫(kù)的價(jià)值卻是不可估量的,而對(duì)其中的各種數(shù)據(jù)進(jìn)行有效整合與利用,還能生成更多實(shí)用信息;其五,復(fù)雜性,為了從大量數(shù)據(jù)中獲取有價(jià)值的部分,就需要經(jīng)過(guò)一個(gè)相對(duì)復(fù)雜的分析和提取過(guò)程,具有一定的難度。
3 大數(shù)據(jù)對(duì)圖書館的有利影響
1)提高效率,降低圖書館管理成本。在大數(shù)據(jù)時(shí)代,在處理海量數(shù)據(jù)資料時(shí),可以借助計(jì)算機(jī)對(duì)數(shù)據(jù)的高效處理功能完成工作,在處理圖書資料時(shí)同樣如此,目前各個(gè)工作領(lǐng)域都離不開各種數(shù)據(jù)信息等內(nèi)容,若是單純利用紙質(zhì)檔案的形式進(jìn)行管理和分析,不僅無(wú)法完整可靠地保存好檔案。還會(huì)因?yàn)樾枰罅考垙堄涗浂鴮?dǎo)致成本增加。以計(jì)算機(jī)這種先進(jìn)的設(shè)備實(shí)現(xiàn)檔案存儲(chǔ)和整合,避免了大量的紙張消耗和大面積的存放空間,也減少了人力投入,具有實(shí)惠的特征。
2)優(yōu)化讀者閱讀體驗(yàn)。因?yàn)榇髷?shù)據(jù)的支持,圖書館得以以一種全新的面貌呈現(xiàn)在讀者面前,讀者進(jìn)入圖書館后,不再需要借助引導(dǎo)標(biāo)識(shí)、建筑內(nèi)部構(gòu)造地圖和咨詢員答疑等導(dǎo)航方式,而是依靠百度地圖等所建成的圖書館導(dǎo)航體系,在該體系內(nèi)文本以二維、三維的模式歸整為導(dǎo)航信息;讀者還可以利用計(jì)算機(jī)快速找到目標(biāo)圖書,享受高度精確的定位服務(wù),或者借助手機(jī)、掌上電腦等掃描書架,得到多種書籍的影像資料。
3)推動(dòng)數(shù)字圖書館的建立。在大數(shù)據(jù)時(shí)代,我國(guó)的很多地區(qū)都陸陸續(xù)續(xù)地建成了數(shù)字圖書館,在該過(guò)程中,高校圖書館的文獻(xiàn)資料得以用一種全新的形式進(jìn)行承載和傳遞,比如傳統(tǒng)的紙質(zhì)材料得以用諸如光盤、硬盤、U盤的一系列電子媒介做載體,這在很大程度上擴(kuò)展了存儲(chǔ)的容量和存取效率。而且,目前的很多圖書館都開展了館藏文獻(xiàn)資料數(shù)字化處理,這也大大提升了資料數(shù)據(jù)的處理速度和便捷度。
4 大數(shù)據(jù)對(duì)圖書館造成的挑戰(zhàn)
1)大數(shù)據(jù)復(fù)雜性所造成的挑戰(zhàn)。在大數(shù)據(jù)的背景下,因?yàn)閿?shù)據(jù)具有海量和復(fù)雜性特征,將大數(shù)據(jù)技術(shù)運(yùn)用到圖書館領(lǐng)域,圖書館的運(yùn)營(yíng)管理難度將隨之增大。首先,就數(shù)據(jù)形式看,現(xiàn)代社會(huì)微博、微信等社交媒體的廣泛運(yùn)用,使得信息數(shù)據(jù)以短文本形式呈現(xiàn),而這種文本形式的控制是極為困難的。而且,在數(shù)據(jù)結(jié)構(gòu)方面,因?yàn)樯缃幻襟w、移動(dòng)終端和傳感器等技術(shù)和設(shè)備的利用,導(dǎo)致非結(jié)構(gòu)化的數(shù)據(jù)在日常生活中占據(jù)越來(lái)越重要的地位,而這種數(shù)據(jù)結(jié)構(gòu)的組織相對(duì)散亂,且含有許多無(wú)價(jià)值信息內(nèi)容,這會(huì)對(duì)數(shù)據(jù)的查詢、儲(chǔ)存、提取造成干擾。此外,因?yàn)閿?shù)據(jù)模式具有一定的復(fù)雜性,就要求圖書館的管理人員在日常工作中注意數(shù)據(jù)的彼此作用,把握數(shù)據(jù)的內(nèi)在聯(lián)系,使信息處于有序狀態(tài)。
2)大數(shù)據(jù)的不確定性所造成的挑戰(zhàn)。由于數(shù)據(jù)具有明顯的不確定特征,就使得網(wǎng)路數(shù)據(jù)無(wú)法迅速建成固定掛的模型,無(wú)法準(zhǔn)確分析出其蘊(yùn)含的規(guī)律,最終無(wú)法對(duì)數(shù)據(jù)價(jià)值進(jìn)行準(zhǔn)確判斷和有效利用。數(shù)據(jù)的不確定性首先表現(xiàn)在原數(shù)據(jù)方面,因?yàn)閿?shù)據(jù)的分析處理不到位,造成后期網(wǎng)絡(luò)數(shù)據(jù)在維度、尺度等層面都表現(xiàn)出不準(zhǔn)確性;其次,數(shù)據(jù)在被處理分析的環(huán)節(jié)必須運(yùn)用非常規(guī)方法,因此工作人員必須構(gòu)想出科學(xué)的建模方式,并且在模型的表達(dá)和復(fù)雜程度間達(dá)到一種平衡狀態(tài);而在數(shù)據(jù)建模的整個(gè)階段,工作人員必須對(duì)模型的相關(guān)參數(shù)加以研究,而在后期的學(xué)習(xí)階段,通常會(huì)采用最接近最優(yōu)解的近似值,用不確定的方法確定一個(gè)較為精準(zhǔn)的解。而結(jié)合實(shí)際看,這種傳統(tǒng)的、近似的、不確定性的方法已經(jīng)難以適應(yīng)新時(shí)代的要求。
3)大數(shù)據(jù)的先進(jìn)性對(duì)管理人員造成挑戰(zhàn)。因?yàn)閭鹘y(tǒng)的管理觀念及方式遺留的問(wèn)題,現(xiàn)在許多圖書館內(nèi)部管理人員在處理數(shù)據(jù)時(shí),不能充分利用大數(shù)據(jù)技術(shù);加上大數(shù)據(jù)本身是一種新興技術(shù),具有一定的專業(yè)性和操作難度,部分不能跟上信息時(shí)代的步伐的管理者,會(huì)面臨挑戰(zhàn),導(dǎo)致管理工作長(zhǎng)期舉步不前。而在大數(shù)據(jù)的形勢(shì)下,需要記錄的數(shù)據(jù)、保存的檔案數(shù)目增加,管理工作在客觀上會(huì)存在任務(wù)繁重、工作量大的問(wèn)題,單純采取舊的人力操作模式,無(wú)疑會(huì)面臨巨大的工作壓力。
5 大數(shù)據(jù)時(shí)代圖書館建設(shè)對(duì)策分析
1)建立超大型倉(cāng)儲(chǔ)數(shù)據(jù)庫(kù)。在傳統(tǒng)的倉(cāng)儲(chǔ)模式中,采取的是將數(shù)據(jù)抽取到數(shù)字倉(cāng)庫(kù)后對(duì)信息進(jìn)行存儲(chǔ)和管理、隨后對(duì)信息進(jìn)行搜索、提取、分析和利用的方法。而在新的時(shí)代背景下,圖書館的數(shù)據(jù)路倉(cāng)儲(chǔ)更多的包含有大量非結(jié)構(gòu)化數(shù)據(jù),還按照傳統(tǒng)的思路和倉(cāng)儲(chǔ)方式,無(wú)疑會(huì)拉低數(shù)據(jù)利用質(zhì)量。所以,在圖書館運(yùn)營(yíng)管理中,需要考慮到用戶的實(shí)際需求,打造符合時(shí)代發(fā)展潮流的大數(shù)據(jù)倉(cāng)儲(chǔ),對(duì)數(shù)據(jù)資源進(jìn)行有效利用。
2)構(gòu)建復(fù)合型人才隊(duì)伍。在圖書館管理工作中,人才是最核心的要素,是確保管理效果和效率的關(guān)鍵,所以單位需要聘請(qǐng)專業(yè)人才專門負(fù)責(zé)信息技術(shù)操作、綜合管理等業(yè)務(wù)內(nèi)容。在日常中,要對(duì)目前的工作團(tuán)隊(duì)進(jìn)行適當(dāng)?shù)哪芰ε嘤?xùn),設(shè)置考核培訓(xùn)制度,通過(guò)合理的獎(jiǎng)懲措施來(lái)鼓勵(lì)員工積極學(xué)習(xí)、對(duì)工作負(fù)責(zé)。同時(shí),有組織地開展圖書館運(yùn)營(yíng)管理、信息技術(shù)操作的專業(yè)培訓(xùn)活動(dòng),活動(dòng)應(yīng)結(jié)合圖書館工作從原有的圖書文獻(xiàn)建設(shè)功能向數(shù)字資源建設(shè)發(fā)展的現(xiàn)實(shí)情況,幫助工作人員樹立新的意識(shí),迅速轉(zhuǎn)變角色,掌握新的工作技能。
6 結(jié)語(yǔ)
綜上所述,加強(qiáng)對(duì)大數(shù)據(jù)帶給圖書館的影響與挑戰(zhàn)的探討,意義重大。相關(guān)工作人員需要明確大數(shù)據(jù)的具體定義及特征;同時(shí)把握大數(shù)據(jù)對(duì)圖書館的有利影響及其對(duì)圖書館造成的挑戰(zhàn);在此基礎(chǔ)上,對(duì)大數(shù)據(jù)時(shí)代圖書館建設(shè)對(duì)策展開分析,建立超大型倉(cāng)儲(chǔ)數(shù)據(jù)庫(kù),構(gòu)建復(fù)合型人才隊(duì)伍。
參考文獻(xiàn)
[1]馬建玲,祝忠明,王楠,楊敏.美國(guó)高校圖書館參與研究數(shù)據(jù)管理服務(wù)研究[J].圖書情報(bào)工作,2012(21).
[2]張曉林,李麟,劉細(xì)文,曾燕.開放獲取學(xué)術(shù)信息資源:逼近“主流化”轉(zhuǎn)折點(diǎn)[J].圖書情報(bào)工作,2012(09).
[3]王學(xué)勤,Amy Stout,Howard Silver.建立數(shù)據(jù)驅(qū)動(dòng)的e-Science圖書館服務(wù):機(jī)遇和挑戰(zhàn)[J].圖書情報(bào)工作,2011(13).