文/遼寧財(cái)貿(mào)學(xué)院 孫冰洋
大數(shù)據(jù)的發(fā)展對(duì)人們的閱讀方式產(chǎn)生了較大的影響,傳統(tǒng)的紙質(zhì)書籍閱讀逐漸轉(zhuǎn)變?yōu)榧堎|(zhì)書籍閱讀與電子書閱讀并重的閱讀模式。圖書館需要認(rèn)識(shí)到人們閱讀方式的轉(zhuǎn)變,對(duì)傳統(tǒng)業(yè)務(wù)和服務(wù)進(jìn)行創(chuàng)新,使其符合大數(shù)據(jù)時(shí)代讀者的閱讀需求,保障圖書館功能和作用的充分發(fā)揮。
大數(shù)據(jù)技術(shù)的發(fā)展?fàn)I造了泛在知識(shí)環(huán)境,人們能夠通過(guò)互聯(lián)網(wǎng)進(jìn)行數(shù)據(jù)信息的傳播,傳統(tǒng)紙質(zhì)書籍閱讀方式逐漸被取代;再加上商業(yè)搜索引擎的推廣,對(duì)圖書館的OPAC服務(wù)造成不利影響。由此可以看出,大數(shù)據(jù)的發(fā)展對(duì)圖書館的業(yè)務(wù)應(yīng)用與服務(wù)創(chuàng)新提供了更高的要求。雖然大數(shù)據(jù)對(duì)圖書館的生存發(fā)展帶來(lái)了挑戰(zhàn),也為圖書館提供了發(fā)展機(jī)遇,圖書館管理人員需要充分利用大數(shù)據(jù)技術(shù)的各項(xiàng)功能,對(duì)圖書館業(yè)務(wù)開展和提供讀者服務(wù)過(guò)程中產(chǎn)生的數(shù)據(jù)信息進(jìn)行采集與整合分析,明確圖書館發(fā)展中的薄弱環(huán)節(jié),為圖書館業(yè)務(wù)的完善和服務(wù)水平的提升提供參考資料。
(一)大數(shù)據(jù)驅(qū)動(dòng)平臺(tái)的構(gòu)建。在應(yīng)用大數(shù)據(jù)技術(shù)進(jìn)行圖書館業(yè)務(wù)應(yīng)用與服務(wù)創(chuàng)新時(shí),圖書館首先要做好大數(shù)據(jù)驅(qū)動(dòng)平臺(tái)的構(gòu)建,整合圖書館的相關(guān)大數(shù)據(jù),為大數(shù)據(jù)挖掘和應(yīng)用提供支持。一般來(lái)說(shuō),大數(shù)據(jù)驅(qū)動(dòng)平臺(tái)主要包括大數(shù)據(jù)采集、大數(shù)據(jù)建模及大數(shù)據(jù)分析三個(gè)維度。在大數(shù)據(jù)采集方面,主要通過(guò)圖書館流通日志、OPAC日志、系統(tǒng)層面或者圖書館網(wǎng)絡(luò)底層進(jìn)行用戶訪問數(shù)據(jù)的采集,包括用戶信息行為數(shù)據(jù)和用戶訪問行為數(shù)據(jù)兩類大數(shù)據(jù),為后續(xù)大數(shù)據(jù)建模與分析提供數(shù)據(jù)支持;在大數(shù)據(jù)建模方面,技術(shù)人員可以通過(guò)多事務(wù)隊(duì)列解析原始HTML數(shù)據(jù)的方式,對(duì)大數(shù)據(jù)進(jìn)行初步處理,并將初步處理的數(shù)據(jù)存儲(chǔ)于目標(biāo)數(shù)據(jù)表,完成數(shù)據(jù)建模,并將其存儲(chǔ)于用戶數(shù)據(jù)庫(kù);在大數(shù)據(jù)分析方面,技術(shù)人員通過(guò)大數(shù)據(jù)挖掘技術(shù)整合有價(jià)值的用戶數(shù)據(jù),對(duì)其進(jìn)行深入統(tǒng)計(jì)分析,為大數(shù)據(jù)業(yè)務(wù)應(yīng)用及服務(wù)創(chuàng)新提供參考。需要注意的是,在圖書館網(wǎng)絡(luò)與應(yīng)用系統(tǒng)中,圖書館工作人員的管理權(quán)限有所差異。針對(duì)具有管理權(quán)限的數(shù)據(jù),技術(shù)人員可以通過(guò)管理程序代理的方式,實(shí)現(xiàn)進(jìn)程級(jí)別數(shù)據(jù)的管理;針對(duì)沒有管理權(quán)限的數(shù)據(jù),技術(shù)人員可以通過(guò)模擬訪問進(jìn)行應(yīng)用系統(tǒng)運(yùn)行數(shù)據(jù)的獲取,并分析系統(tǒng)服務(wù)狀態(tài)是否有效。在獲取圖書館網(wǎng)絡(luò)與應(yīng)用系統(tǒng)的相關(guān)數(shù)據(jù)后,技術(shù)人員可以通過(guò)隱馬爾可夫模型明確數(shù)據(jù)中的異常數(shù)據(jù)信息,實(shí)現(xiàn)圖書館網(wǎng)絡(luò)與應(yīng)用系統(tǒng)的有效監(jiān)控,在圖書館網(wǎng)絡(luò)系統(tǒng)的CPU使用率或者內(nèi)存使用率等數(shù)據(jù)信息出現(xiàn)異常時(shí),及時(shí)發(fā)現(xiàn)與報(bào)警,保障圖書館網(wǎng)絡(luò)系統(tǒng)的穩(wěn)定運(yùn)行。
(二)基于業(yè)務(wù)應(yīng)用的平臺(tái)功能創(chuàng)新。在圖書館業(yè)務(wù)管理與應(yīng)用中,圖書館管理人員可以通過(guò)大數(shù)據(jù)技術(shù)進(jìn)行決策支持系統(tǒng)和統(tǒng)一統(tǒng)計(jì)分析系統(tǒng)的開發(fā),實(shí)現(xiàn)圖書館業(yè)務(wù)應(yīng)用的創(chuàng)新。在不同子系統(tǒng)中,大數(shù)據(jù)技術(shù)的應(yīng)用方法和實(shí)現(xiàn)功能有所差異。
1.決策支持系統(tǒng)。在圖書館業(yè)務(wù)應(yīng)用創(chuàng)新中,圖書館管理人員可以通過(guò)大數(shù)據(jù)技術(shù)的引進(jìn),對(duì)圖書館業(yè)務(wù)系統(tǒng)的大數(shù)據(jù)進(jìn)行整合分析,結(jié)合大數(shù)據(jù)挖掘內(nèi)容,為圖書館業(yè)務(wù)決策提供參考資料。技術(shù)人員需要構(gòu)建大數(shù)據(jù)平臺(tái),對(duì)圖書館現(xiàn)有館藏?cái)?shù)據(jù)、OPAC檢索日志數(shù)據(jù)以及流通數(shù)據(jù)等數(shù)據(jù)信息進(jìn)行整合,通過(guò)數(shù)據(jù)的深入挖掘,為業(yè)務(wù)應(yīng)用創(chuàng)新提供幫助。在館藏?cái)?shù)據(jù)挖掘方面,技術(shù)人員可以通過(guò)大數(shù)據(jù)技術(shù)進(jìn)行圖書館藏相關(guān)數(shù)據(jù)的分析,對(duì)不同學(xué)科大類和二級(jí)學(xué)科的圖書數(shù)量及占比進(jìn)行分析,并通過(guò)餅形圖、柱狀圖和表格等方式,對(duì)圖書館館藏?cái)?shù)據(jù)進(jìn)行挖掘。在此基礎(chǔ)上,大數(shù)據(jù)平臺(tái)可以根據(jù)圖書的年份、分館、學(xué)科和語(yǔ)種等因素實(shí)現(xiàn)圖書館館藏的整合分析,圖書館管理人員能夠以此明確館藏的薄弱環(huán)節(jié),有針對(duì)性地進(jìn)行圖書資源的引進(jìn),豐富圖書館館藏,有助于圖書館業(yè)務(wù)的完善。在OPAC檢索日志數(shù)據(jù)挖掘方面,大數(shù)據(jù)技術(shù)可以保障日志數(shù)據(jù)挖掘的有效性,明確讀者資源利用和圖書館館藏資源間的匹配度,該內(nèi)容與圖書館業(yè)務(wù)水平聯(lián)系密切。大數(shù)據(jù)平臺(tái)需要具備結(jié)構(gòu)查詢及關(guān)鍵字頻次查詢功能,使圖書館人員明確檢索效率高,但是檢索結(jié)果為0的內(nèi)容,該內(nèi)容為圖書館館藏的空白區(qū)域,需要管理人員進(jìn)行補(bǔ)充。由此可以看出,OPAC檢索日志數(shù)據(jù)的挖掘,能夠?yàn)閳D書館業(yè)務(wù)開展提供指導(dǎo)。在流通數(shù)據(jù)挖掘方面,圖書館可以通過(guò)大數(shù)據(jù)平臺(tái)對(duì)讀者的借閱數(shù)據(jù)信息、預(yù)約信息數(shù)據(jù)進(jìn)行挖掘。通過(guò)學(xué)科、出版社等參數(shù)分析讀者借閱狀況;通過(guò)年月、分館和院系等參數(shù)分析讀者續(xù)借狀況及讀者預(yù)約狀況;通過(guò)學(xué)科、借閱日期和入庫(kù)時(shí)間等參數(shù)分析零借閱狀況分析?;谏鲜龃髷?shù)據(jù)挖掘結(jié)果,圖書館管理人員可以明確圖書館館藏的使用狀況,為圖書館業(yè)務(wù)的改進(jìn)提供參考。
2.統(tǒng)一統(tǒng)計(jì)分析系統(tǒng)。在圖書館資源統(tǒng)計(jì)分析方面存在數(shù)據(jù)異構(gòu)和應(yīng)用異構(gòu)問題,對(duì)圖書館數(shù)據(jù)信息的保護(hù)產(chǎn)生影響。在此基礎(chǔ)上,技術(shù)人員可以通過(guò)大數(shù)據(jù)平臺(tái)構(gòu)建統(tǒng)一統(tǒng)計(jì)分析系統(tǒng),開展有效資源管理及使用統(tǒng)計(jì)分析工作,明確圖書館資源的應(yīng)用狀況,為圖書館業(yè)務(wù)應(yīng)用管理提供幫助。在圖書館資源管理方面,大數(shù)據(jù)平臺(tái)的應(yīng)用可以實(shí)現(xiàn)圖書館資源的有效劃分,將其劃分為平臺(tái)、網(wǎng)站、數(shù)據(jù)庫(kù)以及電子期刊等內(nèi)容,并通過(guò)學(xué)科種類進(jìn)行數(shù)據(jù)庫(kù)和電子期刊的進(jìn)一步細(xì)化,實(shí)現(xiàn)資源管理工作的精細(xì)化。具體而言,大數(shù)據(jù)平臺(tái)可以將資源管理工作細(xì)化為電子期刊管理、學(xué)科分類管理以及讀者分組管理等內(nèi)容,實(shí)現(xiàn)圖書館業(yè)務(wù)管理的有效開展。在圖書館使用統(tǒng)計(jì)分析工作中,大數(shù)據(jù)平臺(tái)主要對(duì)讀者使用與資源使用兩個(gè)維度進(jìn)行分析。在讀者使用統(tǒng)計(jì)分析方法中,大數(shù)據(jù)平臺(tái)通過(guò)讀者相關(guān)大數(shù)據(jù)的整合與分析,明確讀者使用行為、讀者訪問文獻(xiàn)以及讀者分組管理等內(nèi)容,并對(duì)讀者分組下的讀者使用資源、行為統(tǒng)計(jì)和應(yīng)用數(shù)據(jù)庫(kù)統(tǒng)計(jì)等數(shù)據(jù)進(jìn)行整合分析,明確圖書館讀者的閱讀需求,為圖書館服務(wù)的創(chuàng)新提供參考;在資源使用統(tǒng)計(jì)分析方法中,大數(shù)據(jù)平臺(tái)通過(guò)圖書館資源應(yīng)用狀況,明確數(shù)據(jù)庫(kù)、電子期刊的使用狀況,并根據(jù)相關(guān)使用數(shù)據(jù)構(gòu)建報(bào)表,為圖書館業(yè)務(wù)完善提供參考。
(三)基于圖書館服務(wù)的平臺(tái)功能創(chuàng)新。在圖書館服務(wù)創(chuàng)新方面,大數(shù)據(jù)的驅(qū)動(dòng)主要是通過(guò)讀者大數(shù)據(jù)的挖掘,為其提供個(gè)性化圖書館服務(wù)。具體而言,圖書館在獲取讀者網(wǎng)絡(luò)底層數(shù)據(jù)信息的同時(shí),利用大數(shù)據(jù)挖掘技術(shù)對(duì)大數(shù)據(jù)中的檢索、瀏覽、下載等相關(guān)日志數(shù)據(jù)進(jìn)行整合分析,以此歸納讀者在圖書資源檢索、瀏覽和下載方面的特征,結(jié)合其時(shí)間維度,分析某一時(shí)期讀者較為關(guān)注的學(xué)科,并通過(guò)關(guān)聯(lián)分析方法、社會(huì)網(wǎng)絡(luò)分析方法與聚類分析方法,預(yù)測(cè)學(xué)科熱點(diǎn)及關(guān)聯(lián)交叉學(xué)科,事先做好圖書資源整合,在其他讀者檢索或者瀏覽時(shí),為其推薦相關(guān)圖書資源,有助于圖書館服務(wù)水平的提升。以高校圖書館為例,高校圖書館需要充分發(fā)揮自身的學(xué)科情報(bào)服務(wù)作用,定期采集各個(gè)學(xué)科師生在某個(gè)時(shí)間段的中國(guó)期刊網(wǎng)檢索、瀏覽及下載日志數(shù)據(jù),并通過(guò)關(guān)聯(lián)分析法,明確學(xué)科熱點(diǎn)和關(guān)聯(lián)交叉學(xué)科。比如,某高校圖書館管理人員指導(dǎo)圖書館館員應(yīng)用情報(bào)分析專業(yè)知識(shí),通過(guò)大數(shù)據(jù)挖掘技術(shù)及高校圖書館的文獻(xiàn)信息資源優(yōu)勢(shì),編制了多份學(xué)科分析報(bào)告,指出圖書館在學(xué)科情報(bào)服務(wù)方面的不足,對(duì)圖書館業(yè)務(wù)創(chuàng)新提供指導(dǎo)。
綜上所述,大數(shù)據(jù)對(duì)圖書館發(fā)展提出了較大的挑戰(zhàn),也為圖書館提供了發(fā)展機(jī)遇。通過(guò)本文的分析可知,圖書館管理人員需要構(gòu)建完善的大數(shù)據(jù)驅(qū)動(dòng)平臺(tái),基于該平臺(tái)進(jìn)行業(yè)務(wù)應(yīng)用及服務(wù)創(chuàng)新,提升圖書館的業(yè)務(wù)水平,為讀者提供信息化與個(gè)性化的圖書館服務(wù),提升圖書館的市場(chǎng)競(jìng)爭(zhēng)力,促進(jìn)其健康發(fā)展。