摘? 要:隨著大數(shù)據(jù)的應(yīng)用與發(fā)展,圖書館如何利用大數(shù)據(jù)來提高公共文化服務(wù)水平,是所有公共圖書館面臨的問題,讀者大數(shù)據(jù)可視化平臺是基于各圖書館核心業(yè)務(wù)數(shù)據(jù)庫系統(tǒng)之上,經(jīng)過接口協(xié)議進(jìn)行大數(shù)據(jù)采集,經(jīng)省級圖書館匯總后把各維度數(shù)據(jù)匯總分析,并以圖形化的方式實(shí)時(shí)展示在不同終端上,便于圖書館員利用數(shù)據(jù)分析指導(dǎo)業(yè)務(wù)調(diào)整。通過實(shí)時(shí)圖書借還數(shù)據(jù)、圖書借還排行榜等服務(wù),引導(dǎo)讀者利用數(shù)據(jù)來提升圖書閱讀服務(wù)體驗(yàn)。
關(guān)鍵詞:大數(shù)據(jù)? ?圖書館? ?公共數(shù)字文化服務(wù)? ?讀者服務(wù)
中圖分類號:G252? ? ?文獻(xiàn)標(biāo)識碼:A
Abstract: With the application and development of big data, how libraries use big data to improve the level of public cultural services is a problem faced by all public libraries. The reader data visualization platform is based on the core business database system of each library, carries out big data collection through interface protocol, after being collected by provincial libraries, summarizes and analyzes all dimensions of data and displays it on different terminals in a graphic way in real time, which makes it easier for librarian to use data analysis to guide business adjustment, and guides readers to use data to improve their book reading service experience through real-time book borrowing and returning data, book borrowing and returning ranking lists and other services.
Key Words: Big Data; Library; Public digital culture service; Reader service
1? 項(xiàng)目背景
河北省圖書館是河北省唯一省級綜合性研究型公共圖書館,國家一級圖書館,是全省公共文化服務(wù)的核心骨干力量,全省圖書館事業(yè)高質(zhì)量發(fā)展和智慧化轉(zhuǎn)型的引領(lǐng)者、推動(dòng)者。其致力于圖書館事業(yè)發(fā)展研究,承擔(dān)全省基層圖書館的業(yè)務(wù)指導(dǎo)與培訓(xùn);開展文獻(xiàn)信息資源的收藏、保護(hù)、研究和利用,推動(dòng)全民閱讀,面向黨政機(jī)關(guān)、企事業(yè)單位、社會(huì)各界及公眾提供文獻(xiàn)借閱、數(shù)字資源、決策參考、講座展覽等服務(wù),著力建設(shè)成為服務(wù)人的全面發(fā)展和面向未來的終身教育機(jī)構(gòu)。改擴(kuò)建后,新館總建筑面積5萬m2 ,設(shè)計(jì)藏書量330萬冊,閱覽坐席3 070個(gè),信息節(jié)點(diǎn)4 000余個(gè),年接待讀者200余萬人次[1]。目前文獻(xiàn)總藏量為360萬冊(件)數(shù)字資源總量150 TB,隨著大數(shù)據(jù)信息技術(shù)的廣泛應(yīng)用,國家互聯(lián)網(wǎng)+計(jì)劃重大項(xiàng)目的部署推進(jìn),大數(shù)據(jù)成為我國文化事業(yè)產(chǎn)業(yè)發(fā)展的重要支撐,在推動(dòng)河北省公共文化服務(wù)發(fā)展方面起著日益重要的作用。但是,由于大數(shù)據(jù)在河北省圖書館行業(yè)運(yùn)用相對較少,全省各級圖書館的讀者數(shù)據(jù)缺乏統(tǒng)籌管理,并且多頭建設(shè)易造成財(cái)政的浪費(fèi);讀者數(shù)據(jù)缺乏有效的收集、匯總、分析手段,造成數(shù)據(jù)的浪費(fèi)。
該館研發(fā)的“河北省圖書館讀者大數(shù)據(jù)可視化平臺系統(tǒng)”可為上述問題提供理想的解決方案,對匯總的讀者數(shù)據(jù)不再以結(jié)構(gòu)型和非結(jié)構(gòu)型數(shù)據(jù)存在于數(shù)據(jù)庫中,而是使這些數(shù)據(jù)可視化,即以柱狀圖、餅狀圖、線型圖等圖形的方式展現(xiàn)數(shù)據(jù),讓圖書館工作人員可以更高效地了解讀者進(jìn)出館信息、讀者借閱信息、數(shù)字資源獲取、各級圖書館讀者分布情況等重要信息和細(xì)節(jié)層次。對實(shí)現(xiàn)全省圖書館行業(yè)各項(xiàng)文化服務(wù)的跨越式提升具有重要意義。
2? 需求分析
目前,公共數(shù)字文化建設(shè)工作框架基本建立,覆蓋全國的服務(wù)網(wǎng)絡(luò)基本成型,資源庫群初具規(guī)模,服務(wù)模式不斷創(chuàng)新,政策標(biāo)準(zhǔn)逐步完善,保障水平明顯提高,對構(gòu)建現(xiàn)代公共文化服務(wù)體系發(fā)揮了重要的支撐作用[2]。與此同時(shí),各市產(chǎn)生了很多讀者信息,其中包括讀者借閱信息,資源檢索習(xí)慣、讀者身份信息、讀者進(jìn)出館信息等數(shù)據(jù)。但這些數(shù)據(jù)采集系統(tǒng)比較獨(dú)立,依據(jù)地理因素及服務(wù)器因素形成了數(shù)據(jù)孤島,無法發(fā)揮其價(jià)值,更無法為圖書館的管理提供高效的支撐。要提高圖書館的運(yùn)行管理效率,發(fā)揮數(shù)據(jù)價(jià)值,更好地為圖書館的領(lǐng)導(dǎo)決策提供輔助支持,需要解決以下幾個(gè)問題。
(1)全省各級圖書館信息系統(tǒng)互相獨(dú)立,數(shù)據(jù)格式不兼容,每個(gè)系統(tǒng)都產(chǎn)生大量的數(shù)據(jù),但是無法互聯(lián)互通,更無法實(shí)現(xiàn)整合,無法實(shí)現(xiàn)統(tǒng)一的數(shù)據(jù)分析和處理,從而大大限制了這些數(shù)據(jù)的應(yīng)用范圍,造成了數(shù)據(jù)浪費(fèi)。
(2)傳統(tǒng)的讀者借閱系統(tǒng)、進(jìn)出館系統(tǒng)的管理系統(tǒng)僅提供了數(shù)據(jù)的原始界面,非系統(tǒng)開發(fā)人員不易快速理解數(shù)據(jù)的規(guī)律和含義。需要將數(shù)據(jù)進(jìn)行可視化方式進(jìn)行表達(dá),以人類最自然、最喜聞樂見的方式把數(shù)據(jù)的深層含義和變化規(guī)律展現(xiàn)在公眾面前。
(3)全省各級圖書館相互獨(dú)立的平臺構(gòu)建模式忽視了用戶多樣化的信息需求和使用方式,對具體使用而言,其更需要的是一站式服務(wù)中心,而不是在不同系統(tǒng)平臺間的反復(fù)跳轉(zhuǎn)與學(xué)習(xí)。
綜上所述,河北省圖書館行業(yè)管理人員需要一種平臺,能夠有效整合全省各級圖書館讀者進(jìn)出館、圖書借閱、資源瀏覽等各項(xiàng)數(shù)據(jù),并及時(shí)進(jìn)行分析和匯總,以提供更準(zhǔn)確高效的數(shù)據(jù)支持。有助于優(yōu)化公共數(shù)字文化資源結(jié)構(gòu)、推動(dòng)公共數(shù)字文化資源共享、創(chuàng)新公共數(shù)字文化發(fā)展模式,推動(dòng)公共數(shù)字文化服務(wù)的持續(xù)、創(chuàng)新發(fā)展。
3 建設(shè)目標(biāo)
河北省圖書館讀者大數(shù)據(jù)可視化平臺系統(tǒng),是建立在云計(jì)算應(yīng)用的基礎(chǔ)上,對全省各級圖書館海量結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)整體利用,深度對業(yè)務(wù)數(shù)據(jù)做各維度的分析,聯(lián)合其他平臺數(shù)據(jù)對讀者行為做挖掘分析,進(jìn)行讀者聚類、自動(dòng)定義標(biāo)簽、閱讀傾向研判等,為讀者更加個(gè)性化的閱讀服務(wù),將圖書館的服務(wù)向精準(zhǔn)化轉(zhuǎn)型,為未來全省圖書館運(yùn)營提供科學(xué)化的參考。同時(shí)實(shí)時(shí)了解全省公共文化服務(wù)需求、類型、分布、預(yù)期和現(xiàn)狀,動(dòng)態(tài)體現(xiàn)全省公眾公共文化服務(wù)需求的變化趨勢,通過項(xiàng)目開展建立全省圖書館行業(yè)統(tǒng)一數(shù)據(jù)標(biāo)準(zhǔn)及數(shù)據(jù)接口,數(shù)據(jù)提供方按照統(tǒng)一標(biāo)準(zhǔn)上傳數(shù)據(jù)信息,有效實(shí)現(xiàn)全省讀者數(shù)據(jù)資源根據(jù)數(shù)據(jù)提供機(jī)構(gòu)級別、數(shù)據(jù)類型等內(nèi)容進(jìn)行匯總、分析,并可以完成系統(tǒng)對數(shù)據(jù)有針對性地進(jìn)行整合及使用。通過對全省讀者所有數(shù)據(jù)匯總進(jìn)行數(shù)據(jù)整理、分析與預(yù)測,在挖掘大數(shù)據(jù)、數(shù)據(jù)融合后,可以實(shí)現(xiàn)對全省圖書館行業(yè)中的服務(wù)、資源、效能等多維度的關(guān)聯(lián)展示[3],為河北省圖書館對全省各項(xiàng)圖書館類公共文化服務(wù)工作的規(guī)劃和指導(dǎo)提供有力幫助。
4 系統(tǒng)設(shè)計(jì)及技術(shù)指標(biāo)
數(shù)據(jù)分析系統(tǒng)采用BS架構(gòu),不需要安裝客戶端,即可通過Web網(wǎng)頁進(jìn)行操作,分辨率為2048×832。系統(tǒng)底層采用MySQL+Redis數(shù)據(jù)庫,滿足大量的數(shù)據(jù)處理需求,保證在多用戶同時(shí)使用時(shí)運(yùn)行穩(wěn)定。數(shù)據(jù)分析系統(tǒng)的功能架構(gòu)圖1所示。
“河北省圖書館讀者大數(shù)據(jù)平臺可視化平臺” 整體設(shè)計(jì)建設(shè)主要實(shí)現(xiàn)以下內(nèi)容。
4.1? 人數(shù)流量數(shù)據(jù)
進(jìn)出館讀者數(shù)據(jù)實(shí)時(shí)展示,可按年/月/日不同維度統(tǒng)計(jì)分析。讀者數(shù)量統(tǒng)計(jì)(進(jìn)出館)、當(dāng)天入館人數(shù)、當(dāng)前在館人數(shù)。
4.2? 借閱情況分析
今日借還情況、借閱冊數(shù)、還書冊數(shù)、借閱量分布情況、借閱時(shí)段分析、人均借閱量、分類借閱情況、圖書分類借閱排行榜、讀者證分類等。圖書館借閱數(shù)據(jù):(1)以統(tǒng)計(jì)圖展示本數(shù)據(jù),主要有總圖書數(shù)、總借出數(shù)、總歸還數(shù)這3種狀態(tài);(2)展示當(dāng)日借出數(shù)、當(dāng)日歸還數(shù)。借出歸還統(tǒng)計(jì):以折線圖的形式,交叉展示,并且定時(shí)切換當(dāng)日、最近每日、每月維度展示。
4.3? 讀者分析
包括讀者新證情況、活躍讀者分析、讀者總量、讀者性別比率、讀者性別借閱量情況、讀者年齡群體比率、各專業(yè)借閱情況等.閱讀方式統(tǒng)計(jì):閱讀方式統(tǒng)計(jì)(留館、借閱),當(dāng)日留館閱讀人數(shù)、當(dāng)日借閱閱讀人數(shù)。
4.4? 圖書分析
包括被借閱過的圖書排行、新書入庫情況、新書分類入庫情況。(1)熱門圖書借閱統(tǒng)計(jì):按借閱熱度統(tǒng)計(jì)近1年以來最熱門的借閱書籍,以及被借閱的次數(shù);(2)借閱實(shí)時(shí)動(dòng)態(tài):展示借出狀態(tài),借書人名稱、書籍名稱、借閱時(shí)間。
4.5? 數(shù)字資源使用量分析
數(shù)字資源總量、數(shù)字資源類型數(shù)量及分布、每類數(shù)字資源的使用情況,實(shí)時(shí)使用情況,每周、每月、每年等。圖書推薦展示:熱門書目類別展示,并且展示該類型下的熱門書籍進(jìn)行推薦,書目類別滾動(dòng)展示。
以上所有功能展示設(shè)計(jì)內(nèi)容如圖2所示。
河北省圖書館讀者大數(shù)據(jù)可視化平臺的主要功能是從其各市讀者認(rèn)證服務(wù)器提取共享數(shù)據(jù),把各地市縣不同應(yīng)用的圖書館業(yè)務(wù)系統(tǒng)、相互不一致的數(shù)據(jù)進(jìn)行數(shù)據(jù)融合處理;基于統(tǒng)一接口、數(shù)據(jù)字典對實(shí)時(shí)數(shù)據(jù)和歷史數(shù)據(jù)進(jìn)行重組,以保證數(shù)據(jù)間關(guān)系的統(tǒng)一性、正確性、可理解性并避免數(shù)據(jù)冗余;維護(hù)讀者基礎(chǔ)信息、圖書借還動(dòng)態(tài)業(yè)務(wù)數(shù)據(jù)以及系統(tǒng)管理配置參數(shù);支撐系統(tǒng)的網(wǎng)絡(luò)構(gòu)架、信息安全、網(wǎng)絡(luò)管理、業(yè)務(wù)流程管理、數(shù)據(jù)庫維護(hù)和備份等運(yùn)維能力。整合協(xié)同平臺根據(jù)功能可分為兩個(gè)部分:第一部分,業(yè)務(wù)基礎(chǔ)數(shù)據(jù)和共享數(shù)據(jù)的匯聚交換服務(wù)和路由流程管理,該部分是交換平臺的基礎(chǔ),包括:靜態(tài)交換數(shù)據(jù)、動(dòng)態(tài)交換數(shù)據(jù)、圖形數(shù)據(jù)及表格、統(tǒng)計(jì)資料等屬性數(shù)據(jù);第二部分,各系統(tǒng)之間的接口實(shí)現(xiàn),根據(jù)事先制定好的規(guī)范、標(biāo)準(zhǔn),實(shí)現(xiàn)各子系統(tǒng)之間的數(shù)據(jù)共享和傳輸操作。在接入中心平臺時(shí),應(yīng)按系統(tǒng)集成要求設(shè)計(jì)系統(tǒng)結(jié)構(gòu),各類數(shù)據(jù)接口遵循系統(tǒng)集成規(guī)范[4]?!昂颖笔D書館讀者大數(shù)據(jù)可視化平臺”可實(shí)現(xiàn)與相關(guān)信息資源進(jìn)行跨平臺數(shù)據(jù)資源對接與共享。
5? 建設(shè)內(nèi)容及實(shí)現(xiàn)結(jié)果
河北省圖書館讀者大數(shù)據(jù)可視化平臺系統(tǒng)采用云服務(wù)模式進(jìn)行構(gòu)架與建設(shè),并遵循“統(tǒng)籌規(guī)劃、分步實(shí)施;層級管理、數(shù)據(jù)融合;安全可信、先進(jìn)可靠、靈活方便;統(tǒng)一標(biāo)準(zhǔn)、統(tǒng)一規(guī)范”的指導(dǎo)思想。平臺面向該館及各市圖書館提供服務(wù),同時(shí)通過系統(tǒng)及時(shí)分析與統(tǒng)計(jì)匯總為河北省圖書館對全省圖書館各項(xiàng)閱讀服務(wù)工作進(jìn)行全面實(shí)時(shí)管理,有效提升河北省圖書館公共文化服務(wù)體系建設(shè)步伐,全面提高全省各級圖書館公共文化服務(wù)供需的匹配程度,為公共文化服務(wù)措施的制定提供依據(jù),切實(shí)增強(qiáng)全省圖書館行業(yè)公共文化服務(wù)的群眾滿意度,更好地滿足人民群眾精神文化生活新需求。平臺可以通過大屏幕實(shí)時(shí)展示各種相關(guān)數(shù)據(jù)。同時(shí),通過數(shù)據(jù)統(tǒng)計(jì)分析匯總,轉(zhuǎn)化為圖形化直觀展示,以挖掘讀者與數(shù)據(jù)間關(guān)系,提高數(shù)據(jù)利用方面相關(guān)性,根據(jù)大數(shù)據(jù)分析展示結(jié)果,提高數(shù)據(jù)利用程度,達(dá)到利用大數(shù)據(jù)服務(wù)提高讀者服務(wù)效能問題。平臺數(shù)據(jù)實(shí)際共功能展示界面如圖3所示。
河北省圖書館讀者大數(shù)據(jù)可視化平臺系統(tǒng)是建立在全省各級圖書館數(shù)據(jù)基礎(chǔ)上的一種新型生態(tài)系統(tǒng),它全面采集和分析各種資源,通過大數(shù)據(jù)的手段,為讀者提供更好的個(gè)性化服務(wù),幫助讀者完善個(gè)人知識體系;為圖書館提供各種統(tǒng)計(jì)分析報(bào)告,深度挖掘分析數(shù)據(jù)價(jià)值,幫助圖書館充分利用各種資源,加強(qiáng)資源流動(dòng),優(yōu)化資源配置,提高圖書館服務(wù)質(zhì)量,為管理、服務(wù)改善提供有力依據(jù)[5-6]。平臺系統(tǒng)支持圖書館行業(yè)標(biāo)準(zhǔn)協(xié)議,采用了先進(jìn)的大數(shù)據(jù)存儲(chǔ)技術(shù)、快速準(zhǔn)確的數(shù)據(jù)挖掘分析算法,具有表格、圖形等直觀的可視化人機(jī)交互界面,操作簡便,能滿足各層次的人員使用。平臺通過分析讀者各類行為獲取數(shù)據(jù),借助數(shù)據(jù)庫技術(shù)、數(shù)學(xué)建模及知識服務(wù)等基礎(chǔ)理論,抽取出每個(gè)讀者的普遍性需求和個(gè)性化需求。同時(shí)平臺還可根據(jù)區(qū)域范圍、用戶類型等篩選條件查閱全省各級圖書館的閱讀服務(wù)概況,統(tǒng)計(jì)所篩選的圖書館整體數(shù)據(jù),生成對于該圖書館的分析報(bào)表。河北省圖書館讀者大數(shù)據(jù)展示揭示系統(tǒng)可以通過數(shù)據(jù)統(tǒng)計(jì),對讀者進(jìn)行有效的閱讀行為分析,挖掘讀者與閱讀時(shí)間、閱讀地點(diǎn)、閱讀內(nèi)容等方面的相關(guān)性,為全省讀者閱讀趨勢研判提供數(shù)據(jù)支撐,同時(shí)也將為公共文化資源智慧化利用,公共文化服務(wù)提升提供有效的數(shù)據(jù)保障。
6 經(jīng)驗(yàn)總結(jié)
“河北省圖書館讀者大數(shù)據(jù)可視化平臺系統(tǒng)”項(xiàng)目實(shí)現(xiàn)了對已有管理系統(tǒng)的數(shù)據(jù)接口的對接,及對圖書館各類管理系統(tǒng)的歷史數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘整理、分析預(yù)測、數(shù)據(jù)融合等操作。同時(shí)還實(shí)現(xiàn)了全省各級圖書館主要數(shù)據(jù)管理與展示,并可根據(jù)區(qū)域與權(quán)限設(shè)定分級控制。文獻(xiàn)借閱數(shù)據(jù)統(tǒng)計(jì)分析、讀者數(shù)據(jù)統(tǒng)計(jì)與分析與全省各級圖書館各項(xiàng)熱點(diǎn)動(dòng)態(tài)、讀者數(shù)據(jù)、借閱數(shù)據(jù)的綜合分類展示,并可根據(jù)管理層級進(jìn)行數(shù)據(jù)查看與管理。此系統(tǒng)利用大數(shù)據(jù)、云計(jì)算等先進(jìn)技術(shù),整合零散數(shù)據(jù)流,實(shí)現(xiàn)全省圖書館的入館讀者數(shù)據(jù)集合,以科技手段提升讀者服務(wù)滿意度,為今后智慧圖書館發(fā)展,功能的擴(kuò)展完善積累經(jīng)驗(yàn)奠定基礎(chǔ)。
參考文獻(xiàn)
[1]賈東琴,牛佳寧,柯平.中國圖書館事業(yè)法制史編年[J].圖書情報(bào)研究,2019,12(1):33-40,14.
[2]文化部.文化部關(guān)于印發(fā)《文化部“十三五”時(shí)期公共數(shù)字文化建設(shè)規(guī)劃》的通知[EB/OL].(2017-07-07).https://zwgk.mct.gov.cn/zfxxgkml/ghjh/202012/t20201204_906376.html.
[3]汪澤. 數(shù)字人文視域下歷史檔案資源知識庫構(gòu)建研究[D].長春:吉林大學(xué),2022.
[4] 譚靖,彭松,王海月,等.一種基于林業(yè)數(shù)據(jù)共享服務(wù)平臺的數(shù)據(jù)共享方法及裝置:CN201911370226.X[P].2020-05-08.
[5] 黃亞平.大數(shù)據(jù)與人工智能環(huán)境下的高校圖書館智慧服務(wù)探索[J].辦公室業(yè)務(wù),2022(9):184-186.
[6]陳心怡. 基于大數(shù)據(jù)的高校圖書館智慧搜索服務(wù)模式研究[D].天津:天津理工大學(xué),2022.
作者簡介:王小培(1980|—),男,本科,館員,研究方向?yàn)楣参幕?wù)、信息化建設(shè)。