鄭 艷
(武漢職業(yè)技術(shù)學院,湖北 武漢 430074)
在互聯(lián)網(wǎng)信息時代,現(xiàn)代網(wǎng)絡(luò)科技的迅猛發(fā)展助力圖書館行業(yè)發(fā)生了巨大的變革,轉(zhuǎn)變了傳統(tǒng)圖書館的構(gòu)成模式、閱讀渠道,也隨之改變了圖書館的管理與服務(wù)方式。盡管從大數(shù)據(jù)技術(shù)應用層面來看,現(xiàn)代圖書館在資源獲取、圖書內(nèi)容、閱讀服務(wù)等方面顛覆了人們對原有圖書館的認知,然而從社會地位性、認可度方面來看卻不及傳統(tǒng)圖書館時期。究其原因,主要還是信息化的便利性使得讀者改變了傳統(tǒng)的閱讀方式,很多讀者不再往返于圖書館耗時耗力獲取資料,這也成為現(xiàn)代圖書館在轉(zhuǎn)型期發(fā)展的陣痛,我國圖書館行業(yè)正面臨著重大的機遇和挑戰(zhàn)[1]。因此,如何在大數(shù)據(jù)時代,利用網(wǎng)絡(luò)科技的力量獲得成功轉(zhuǎn)型、重新得到讀者青睞,現(xiàn)已成為圖書館行業(yè)的重要使命。
在大數(shù)據(jù)時代各行各業(yè)都與數(shù)據(jù)掛鉤,“大數(shù)據(jù)”這個名詞已經(jīng)膾炙人口,如今社會企業(yè)、醫(yī)療機構(gòu)、高等院校、金融領(lǐng)域等都在分析使用大數(shù)據(jù)。大數(shù)據(jù)技術(shù)讓人們從數(shù)據(jù)系統(tǒng)中獲取到更多有深度價值的信息資源,幫助人們及時做出重大決策,這也對大數(shù)據(jù)研究提供了重要依據(jù)。鑒于存儲、分析大數(shù)據(jù)所需的軟硬件成本較低而實用性很強,這也就使得越來越多的行業(yè)對大數(shù)據(jù)產(chǎn)生了興趣,傳統(tǒng)圖書館行業(yè)更要在逆境中求生存、化阻力為動力,利用大數(shù)據(jù)技術(shù)轉(zhuǎn)變管理及服務(wù)模式。在現(xiàn)代圖書館管理中,大數(shù)據(jù)技術(shù)能夠?qū)D書館數(shù)據(jù)轉(zhuǎn)化為信息資源,為讀者提供個性化服務(wù)。因此,當前大量的大數(shù)據(jù)研究都在分析圖書館大數(shù)據(jù)的應用問題,力求通過大數(shù)據(jù)技術(shù)優(yōu)化圖書館工作效率及服務(wù)品質(zhì)。在大數(shù)據(jù)背景下,現(xiàn)代圖書館數(shù)據(jù)庫具備以下特點:
從圖書館表面管理來看,圖書館中的各類圖書、雜志、刊物等數(shù)據(jù)組織井井有條,讀者可以通過類別查詢所需內(nèi)容;然而針對存儲的圖書研究數(shù)據(jù)卻不盡人意。通常大部分圖書館的數(shù)據(jù)較為混亂,數(shù)據(jù)研究者慣于使用自我認知來分類組織數(shù)據(jù),這些數(shù)據(jù)通常經(jīng)項目管理,而項目完成了數(shù)據(jù)也就受到封存。
數(shù)據(jù)研究者在組織數(shù)據(jù)時沒有規(guī)范格式標準,盡管有些圖書學科或領(lǐng)域已創(chuàng)建數(shù)據(jù)標準,然而大部分學科往往都缺少規(guī)范化,尤其是政治、社會研究這類集中的數(shù)據(jù)庫。此外,數(shù)據(jù)格式也缺乏統(tǒng)一性,數(shù)據(jù)研究者慣于用自己的格式對數(shù)據(jù)進行收集,即便是同一個數(shù)據(jù)研究者,不同數(shù)據(jù)格式也會用于不同項目,這就給收集數(shù)據(jù)帶來很大阻力[2]。
圖書館數(shù)據(jù)庫中所存儲的數(shù)據(jù)龐大,鑒于圖書多源異構(gòu)的特征,這個大數(shù)據(jù)也不同于其他數(shù)據(jù)領(lǐng)域,因此在圖書館數(shù)據(jù)收集、處理、分析及轉(zhuǎn)換等方面均存在一定問題。圖書館大數(shù)據(jù)要獲得科學合理應用,其應用技術(shù)區(qū)別于其他領(lǐng)域,這也正是當前圖書館大數(shù)據(jù)存在的不足之處。
作為圖書館數(shù)據(jù)分析師,不但要掌握基本的計算機和統(tǒng)計學技術(shù),同時必要具備圖書館管理領(lǐng)域知識和技能。當前,大部分圖書館之所以在大數(shù)據(jù)技術(shù)方面應用不足,主要是專業(yè)人員技術(shù)力量的不足,圖書館管理人員更需要加強大數(shù)據(jù)信息的管理培訓,這是一個循序漸進的過程,絕非靠短期突擊學習所能達成。
在互聯(lián)網(wǎng)信息時代,大數(shù)據(jù)的挖掘來源于行業(yè)各個領(lǐng)域,現(xiàn)在很多行業(yè)并未實質(zhì)做好大數(shù)據(jù)的研究準備工作。據(jù)了解,社會半數(shù)以上的行業(yè)機構(gòu)因缺少專業(yè)人才、應用平臺而無法實現(xiàn)大數(shù)據(jù)的處理及應用。然而,圖書館行業(yè)的大數(shù)據(jù)研究起步甚至更晚,究其原因主要還是基于圖書館更像是一個獨立的組織單位,自成一體與其他行業(yè)的關(guān)聯(lián)性不強。
盡管現(xiàn)在很多人都明白應用大數(shù)據(jù)分析的優(yōu)勢,但大數(shù)據(jù)研究還需要一些較大的成本投資,比如高性能的計算機服務(wù)系統(tǒng)、分析服務(wù)系統(tǒng)等。基于有些圖書館規(guī)模較小、成本預算不足,無法將大數(shù)據(jù)技術(shù)普及到圖書館實際管理中;同時專業(yè)人才成本較高,其所研究數(shù)據(jù)極少能受到充分重視也是問題之一。據(jù)了解,當前很多圖書館研究數(shù)據(jù)仍為多年前所產(chǎn)生的,顯然資源數(shù)字化本非一項簡單工作,還需要耗費大量的時間和精力。
大數(shù)據(jù)要實現(xiàn)使用功能,必須要經(jīng)過數(shù)據(jù)收集、存儲、處理、轉(zhuǎn)換等環(huán)節(jié),通過這些技術(shù)應用才能呈現(xiàn)真實的數(shù)據(jù)信息。圖書館數(shù)據(jù)庫中的數(shù)據(jù)類型多且雜,其數(shù)據(jù)表象不同,一些數(shù)據(jù)沒有數(shù)字化;同時大量數(shù)據(jù)中還包含了許多錯誤、無意義的數(shù)據(jù),要排除這些無用數(shù)據(jù)則需要花費更多的數(shù)據(jù)處理時間。鑒于圖書館數(shù)據(jù)類型、格式的特異性,大數(shù)據(jù)研究者要將其實現(xiàn)集成必定是一項龐大且困難的工作,很多類型的數(shù)據(jù)看似具備可用性,實則在通過處理之后其可用性會明顯降低;同時基于數(shù)據(jù)的可訪問性,圖書館數(shù)據(jù)庫發(fā)生系統(tǒng)入侵的風險問題也必須慎重考慮。
眾所周知,傳統(tǒng)圖書館運營模式下,讀者首先要確定自己需要哪本或哪個方面的書籍,隨之通過圖書館查詢系統(tǒng)搜索該書籍所在館內(nèi)具體位置實現(xiàn)借閱,或是自行瀏覽圖書館挑選感興趣的書籍。但隨著知識學科的進步發(fā)展,現(xiàn)在的圖書資源越來越豐富,此種傳統(tǒng)借閱方式將消耗讀者大量的查找時間;同時由于書籍的多樣性,讀者的選擇困難度更高,亟待通過技術(shù)行為幫助其解決找書問題,那么大數(shù)據(jù)技術(shù)的優(yōu)勢就顯現(xiàn)出來了。圖書館通過借閱系統(tǒng)中的個人借閱信息,應用大數(shù)據(jù)技術(shù)分析其近期借閱書籍的喜好和關(guān)注點,繼而以此為依據(jù)給讀者推薦合適的書籍。如依據(jù)借閱信息判斷讀者喜歡的圖書類別,通過借閱時長分析讀者的喜好程度。圖書館管理人員將所有讀者的借閱信息進行分類、量化、評估,再與其他館內(nèi)圖書進行相似計算,就可以實現(xiàn)類似書籍的自動推薦,幫助讀者獲取到一些他們可能感興趣但未能觸及的書籍。
實現(xiàn)閱讀推廣是發(fā)揮圖書館服務(wù)的一項重要工作。圖書館除了優(yōu)選推薦讀物給受眾者,還應通過書評為讀者精確推廣閱讀內(nèi)容。圖書館以引薦指導讀者為目的創(chuàng)建書評資源庫,可以邀請一些專業(yè)領(lǐng)域?qū)W者綜合對館內(nèi)所有藏書進行多方位評價,將一些精品書、好書通過書評方式引薦給讀者。圖書館還能通過大數(shù)據(jù)技術(shù)搜集網(wǎng)絡(luò)書評,獲取一些熱門網(wǎng)上書店如當當網(wǎng)、天貓書城、文軒網(wǎng)等在線書評,包括圖書購買問答區(qū)的評價信息,利用大數(shù)據(jù)處理技術(shù)對這些數(shù)據(jù)進行分類、整合再向讀者進行推薦,從而為讀者提供閱讀決策意見,提高圖書推薦的精準性。
行為數(shù)據(jù)分析包括很多內(nèi)容,有讀者的圖書查詢檢索記錄、借還流通日志、下載資源地址等,這些行為數(shù)據(jù)經(jīng)過分析可以反饋出讀者群體的閱讀需求、閱讀時間、閱讀趨向等。圖書館可以充分利用這些大數(shù)據(jù)為其管理決策做出有效支撐。例如,在采購圖書時,可以通過大數(shù)據(jù)技術(shù)對圖書借閱量進行數(shù)據(jù)分析,及時了解哪些圖書資源匱乏,進行有針對性的補充;針對搜索次數(shù)多、預定借閱多、瀏覽簡介多、續(xù)借次數(shù)多的書籍,我們都應該增加復本數(shù)量,以保證讀者的借閱需求。據(jù)實踐了解,借助大數(shù)據(jù)技術(shù)以讀者意愿驅(qū)動采購,能夠促進圖書借閱率獲得顯著提高。尤其是在高校圖書館方面,鑒于教學的時間規(guī)律性特點,高校的圖書館往往會有圖書借閱高峰期,那么借助讀者借閱行為數(shù)據(jù)的分析,就能知悉不同時間段的圖書借閱頻率,更有利圖書館合理安排工作人數(shù),并實現(xiàn)圖書館的高效管理和服務(wù)。
鑒于圖書館數(shù)據(jù)庫信息的龐大復雜性,加之互聯(lián)網(wǎng)病毒侵襲、網(wǎng)絡(luò)故障等問題均有可能導致圖書館數(shù)據(jù)庫系統(tǒng)產(chǎn)生故障、系統(tǒng)崩潰。為提高圖書館數(shù)據(jù)庫系統(tǒng)的安全性,盡量減少故障發(fā)生率、減小損失率,對數(shù)據(jù)庫進行定期維護是圖書館管理工作中的一項必要任務(wù)。鑒于當前圖書館信息數(shù)據(jù)海量陡增,需要在傳統(tǒng)圖書館管理工作思維的基礎(chǔ)上,強化數(shù)據(jù)備份處理功能,在原有冷備份方式上采用網(wǎng)絡(luò)備份新技術(shù),進一步提高數(shù)據(jù)備份的效率,降低圖書館數(shù)據(jù)庫的故障產(chǎn)生率。
在大數(shù)據(jù)背景下,圖書館行業(yè)要順應時代發(fā)展需求,充分利用大數(shù)據(jù)及時實現(xiàn)數(shù)字化圖書館的管理與服務(wù),才能在新時代的大弄潮中占有一席之地。通過大數(shù)據(jù)技術(shù)的應用,改變傳統(tǒng)圖書館模式、提高圖書館管理效率、提升知識服務(wù)層次、提供個性化服務(wù)需求,以此發(fā)揮出圖書館的最大最優(yōu)功效。