王喜平
云計(jì)算環(huán)境下數(shù)字圖書館信息服務(wù)平臺(tái)的研究
王喜平
隨著網(wǎng)絡(luò)技術(shù)和信息技術(shù)的發(fā)展,針對(duì)數(shù)字圖書館信息資源的利用環(huán)境逐漸由物理空間向虛擬空間轉(zhuǎn)變,信息資源的存在方式也逐漸由模擬狀態(tài)向數(shù)字狀態(tài)轉(zhuǎn)變。通過將云計(jì)算中的虛擬化、分布式數(shù)據(jù)存儲(chǔ)、海量數(shù)據(jù)處理和云平臺(tái)等關(guān)鍵技術(shù)應(yīng)用于構(gòu)建數(shù)字圖書館信息服務(wù)云平臺(tái),構(gòu)建了云環(huán)境下數(shù)字圖書館信息服務(wù)體系結(jié)構(gòu),并提出了云環(huán)境下數(shù)字圖書館個(gè)性化信息服務(wù)的框架模型。為高校圖書館在云計(jì)算環(huán)境下開展個(gè)性化知識(shí)服務(wù)提供了參考。
云計(jì)算;web服務(wù);數(shù)字圖書館;虛擬化;信息服務(wù)
在網(wǎng)絡(luò)環(huán)境下,如何實(shí)現(xiàn)圖書館之間,海量數(shù)據(jù)資源的無縫連接,實(shí)現(xiàn)資源共享和利用,為用戶提供個(gè)性化的服務(wù)。云計(jì)算是一種服務(wù)使用模式,是并行計(jì)算、分布式計(jì)算和網(wǎng)格計(jì)算的發(fā)展,是虛擬化、效用計(jì)算、基礎(chǔ)設(shè)施即服務(wù)、軟件即服務(wù)和平臺(tái)即服務(wù)等內(nèi)容與概念的綜合[1]。在該計(jì)算模式中,網(wǎng)絡(luò)、服務(wù)器、存儲(chǔ)設(shè)備、應(yīng)用軟件和各種服務(wù)組成資源池,這些資源通過網(wǎng)絡(luò)以服務(wù)的方式供用戶使用[2]。云計(jì)算模式下,任務(wù)處理過程分布在分布式計(jì)算機(jī)上,數(shù)據(jù)中心以互聯(lián)網(wǎng)提供服務(wù)的模式運(yùn)行[3]。云計(jì)算通過把散落在不同設(shè)備或者介質(zhì)上的數(shù)字資源進(jìn)行重新組合、協(xié)調(diào)、排序,為數(shù)字圖書館信息服務(wù)提供了一個(gè)集成的應(yīng)用平臺(tái);該平臺(tái)可以加工、存儲(chǔ)數(shù)字信息資源,能夠不受時(shí)間、地點(diǎn)限制,可以隨時(shí)獲取信息資源。用戶所需的信息資源存儲(chǔ)在云服務(wù)平臺(tái)中,可以最大程度的滿足用戶對(duì)數(shù)字圖書館的信息需求。
數(shù)字圖書館是一個(gè)基于網(wǎng)絡(luò)環(huán)境的信息管理系統(tǒng),可發(fā)在任何時(shí)間、任何地點(diǎn)為用戶提供所需要的服務(wù)的操作系統(tǒng),數(shù)字圖書館信息管理系統(tǒng)在Web中的結(jié)點(diǎn)上運(yùn)行。數(shù)字圖書館具有跨學(xué)科性、跨領(lǐng)域性以及研究角度的差異性等特點(diǎn)[4]。其主要功能:提供數(shù)字化資源服務(wù)技術(shù)、信息化資源的存儲(chǔ)、提供信息的檢索機(jī)制和檢索信息的發(fā)送。數(shù)字圖書館信息管理系統(tǒng)是一種分布式的信息系統(tǒng),擁有多種媒體內(nèi)容的資源,它以網(wǎng)絡(luò)方式把各種信息資源提供用戶、為用戶提供方便、快捷有效的信息存取服務(wù)。高效的利用其豐富的信息資源來滿足用戶需求。數(shù)字圖書館具有占用空間小且易保存、查閱檢索方便、獲取信息迅速和資源共享的優(yōu)點(diǎn)。數(shù)字圖書館作為信息資源數(shù)據(jù)中心,需要長期保存大量的數(shù)據(jù)信息資源以方便用戶使用。云服務(wù)平臺(tái)由用戶需求主導(dǎo),用戶通過互聯(lián)網(wǎng)進(jìn)入云服務(wù)平臺(tái),利用云服務(wù)平臺(tái)所提供的服務(wù),用戶可在任意時(shí)間、地點(diǎn)的訪問所需要的信息資源,同時(shí)平臺(tái)內(nèi)帶寬和計(jì)算資源可以被用戶共享。云計(jì)算環(huán)境下的數(shù)字圖書館改變了傳統(tǒng)的圖書館信息服務(wù)模式,使數(shù)字圖書館的功能和角色發(fā)生重大變革。
云計(jì)算是一種在分布式計(jì)算、網(wǎng)格計(jì)算、并行計(jì)算、效用計(jì)算等傳統(tǒng)計(jì)算技術(shù)的基礎(chǔ)上相互融合發(fā)展起來的信息資源提供方式,通過互聯(lián)網(wǎng)將動(dòng)態(tài)、異構(gòu)的硬件資源、軟件資源、平臺(tái)管理資源等進(jìn)行系統(tǒng)的優(yōu)化和有效整合,通過互聯(lián)網(wǎng)以按需付費(fèi)的服務(wù)方式提供給用戶的新型信息服務(wù)方式[5]。云計(jì)算應(yīng)具有大規(guī)模、高可擴(kuò)展性、按需服務(wù)、資源共享、虛擬化和成本低廉的特點(diǎn)[6]。云計(jì)算系統(tǒng)由用戶交互界面提供云計(jì)算服務(wù)交換的接口、用戶通過服務(wù)目錄可以查找所需、通過系統(tǒng)管理計(jì)算機(jī)資源、應(yīng)用提供工具為用戶提供需求服務(wù)、監(jiān)測跟蹤監(jiān)測云計(jì)算的使用,以保證資源可以合理有效的分配,服務(wù)器集群提供云計(jì)算服務(wù)所需的計(jì)算資源,由系統(tǒng)管理工具所控制。服務(wù)器集群服務(wù)器集群可以是物理的也可以是虛擬化的。如圖1所示:
圖1 云計(jì)算的系統(tǒng)架構(gòu)
數(shù)字圖書館提供信息服務(wù)需具備3個(gè)要素:信息資源、傳輸渠道以及用戶。信息資源是數(shù)字圖書館的基礎(chǔ),讀者是數(shù)字圖書館的服務(wù)對(duì)象,數(shù)字圖書館通過網(wǎng)絡(luò)把信息資源傳遞給讀者來形成訪問服務(wù)行為。數(shù)字圖書館能否提供個(gè)性化定制的信息服務(wù)是其吸引現(xiàn)有用戶、開發(fā)潛在用戶并留住用戶的關(guān)鍵所在。
數(shù)字圖書館云平臺(tái)的架構(gòu)采用跨平臺(tái)技術(shù),對(duì)異構(gòu)的圖書館數(shù)據(jù)庫資源進(jìn)行元數(shù)據(jù)收割與管理整合到統(tǒng)一的云平臺(tái)上,為用戶提供個(gè)性化的信息服務(wù)。數(shù)字圖書館云平臺(tái)的構(gòu)建涉及三個(gè)方面:提供服務(wù)的底層物理設(shè)備和基礎(chǔ)設(shè)施,提供服務(wù)調(diào)度的管理平臺(tái)和數(shù)據(jù)資源,提供服務(wù)的應(yīng)用程序和服務(wù)接口等。云平臺(tái)的構(gòu)建有兩種方案:①自建私有云平臺(tái);②付費(fèi)使用Google App Engine和Microsoft Azure 云平臺(tái)。
(1)私有云平臺(tái)搭建
數(shù)字圖書館在提供個(gè)性化的信息服務(wù)時(shí)對(duì)用戶的個(gè)性化信息有很強(qiáng)的依賴性,即數(shù)字圖書館需要根據(jù)用戶的訪問行為來提供個(gè)性化的數(shù)據(jù),這其中涉及到用戶信息的安全性。數(shù)字圖書館向用戶提供信息服務(wù),除了依賴其付費(fèi)購買的公共資源和網(wǎng)絡(luò)資源外,還有一部分其自建的信息資源。出于這兩個(gè)方面的考慮,我們可以針對(duì)這部分信息自建一個(gè)私有的云平臺(tái)。私有云建成之后,可以降低成本,使用起來也更加方便,需求也可以更好更快地得到響應(yīng)。數(shù)字圖書館內(nèi)部核心數(shù)據(jù)的傳輸可以通過內(nèi)部網(wǎng)絡(luò)在私有云上進(jìn)行處理和存儲(chǔ),這樣就解決了數(shù)據(jù)的安全問題。
搭建數(shù)字圖書館信息服務(wù)的私有云平臺(tái),需應(yīng)用虛擬化技術(shù)來實(shí)現(xiàn)服務(wù)器資源的統(tǒng)一管理,具體可以采用微軟的Hyper-v或VMware的ESXh 的遷移技術(shù)來整合多臺(tái)服務(wù)器資源,這樣能夠降低服務(wù)器的成本以及提高服務(wù)器的利用效率。
(2)部署“公有云”平臺(tái)方案
云服務(wù)提供商通過互聯(lián)網(wǎng)可以同時(shí)向多個(gè)數(shù)字圖書館提供公有云服務(wù)。輕松地實(shí)現(xiàn)了圖書館之間的信息資源共享。利用公有云提供的服務(wù),既能操作便利又具有很強(qiáng)的安全保障。 數(shù)字圖書館在提供個(gè)性化信息服務(wù)時(shí),可以將公共基礎(chǔ)資源、后臺(tái)數(shù)據(jù)以及 云門戶網(wǎng)站都部署在公有云上,這能有效的降低數(shù)字圖書館的信息服務(wù)成本和維護(hù)成本。鑒于目前云計(jì)算行業(yè)的現(xiàn)狀,用戶可以根據(jù)數(shù)字圖書館需要選擇購買使用亞馬遜的彈性計(jì)算公有云平臺(tái)。 本文結(jié)合數(shù)字圖書館服務(wù)使用和云計(jì)算的實(shí)現(xiàn)情況,搭建一個(gè)數(shù)字圖書館的混合云平臺(tái),即針對(duì)數(shù)字圖書館自建的資源部署在私有云平臺(tái)上,將網(wǎng)絡(luò)資源和其他資源部署在公有云平臺(tái)上,具體部署方案如圖2所示:
圖2 基于云計(jì)算的數(shù)字圖書館信息服務(wù)網(wǎng)絡(luò)平臺(tái)
4.1 數(shù)字圖書館信息服務(wù)框架設(shè)計(jì)
根據(jù)云計(jì)算技術(shù)的特點(diǎn)以及數(shù)字圖書館采用個(gè)性化信息服務(wù)的現(xiàn)狀,把數(shù)字圖書館的基礎(chǔ)設(shè)施資源整合到統(tǒng)一的云服務(wù)平臺(tái)上,構(gòu)建數(shù)字圖書館信息服務(wù)云平臺(tái),可以為用戶提供應(yīng)用服務(wù)程序和接口。利用集群技術(shù)、虛擬化技術(shù)、分布式技術(shù)來進(jìn)行數(shù)據(jù)和資源的調(diào)度與分配構(gòu)建了一個(gè) 3層框架模型,該體系結(jié)構(gòu)自上而下劃分為應(yīng)用服務(wù)層、中間管理層和基礎(chǔ)設(shè)施層,這種部署提高了系統(tǒng)架構(gòu)的靈活性和可擴(kuò)展性,如圖3所示:
圖3 云計(jì)算環(huán)境下數(shù)字圖書館個(gè)性化信息服務(wù)總體框架設(shè)計(jì)
(1)應(yīng)用服務(wù)層
該層通過將應(yīng)用程序或軟件進(jìn)行封裝,最終以服務(wù)的方式提供給用戶訪問和使用。在模型中,應(yīng)用服務(wù)層為用戶提供了各種類型的可以直接訪問的服務(wù),如公共信息服務(wù)、檢索服務(wù)和個(gè)性化信息服務(wù)等;該層還提供了服務(wù)訪問接口,該接口特征明確、定位清晰,具有易用性和可移植性,用戶使用各種終端設(shè)備,如 PC、移動(dòng)設(shè)備或者其他任何可以聯(lián)網(wǎng)的設(shè)備都可以快速的訪問和部署服務(wù)及資源,具有很強(qiáng)的用戶友好性。該層主要提供數(shù)字圖書館云服務(wù)平臺(tái)門戶網(wǎng)站,用戶通過登錄網(wǎng)站首頁接入云服務(wù)平臺(tái)就可獲得所需的服務(wù)。在其之上的電腦客戶端與移動(dòng)客戶端是用戶與數(shù)字圖書館進(jìn)行交互和通信的工具,是用戶使用云服務(wù)的平臺(tái),可以不受時(shí)間地點(diǎn)設(shè)備的限制,訪問云服務(wù)網(wǎng)絡(luò)的所需資源,如PC機(jī)、瀏覽器和移動(dòng)終端設(shè)備等。
(2)中間管理層
中間管理層具有承上啟下的作用,它為上層的應(yīng)用服務(wù)層提供支撐,又對(duì)底層的基礎(chǔ)設(shè)施層進(jìn)行抽象封裝。本層是基于云計(jì)算的PaaS來實(shí)現(xiàn)和部署的,它為應(yīng)用程序提供了一個(gè)開源的環(huán)境,為高層服務(wù)提供了軟件環(huán)境、中間件及數(shù)據(jù)庫等的訪問接口,通過身份識(shí)別和認(rèn)證為部署高層次的服務(wù)提供了一個(gè)統(tǒng)一的平臺(tái)和接口。
中間層是數(shù)字圖書館提供個(gè)性化信息的核心層,為應(yīng)用程序提供資源,并對(duì)資源進(jìn)行合理的調(diào)度和優(yōu)化處理,最終提供給用戶使用。該層通過各種虛擬化技術(shù)對(duì)底層基礎(chǔ)設(shè)施進(jìn)行虛擬化操作,同時(shí)實(shí)時(shí)采集用戶信息并及時(shí)更新。云平臺(tái)通過對(duì)各節(jié)點(diǎn)圖書館的數(shù)據(jù)快速訪問和部署來提高數(shù)字圖書館的運(yùn)行效率和服務(wù)質(zhì)量。用戶向數(shù)字圖書館提出服務(wù)請(qǐng)求,數(shù)據(jù)處理模塊對(duì)用戶需求進(jìn)行分析和細(xì)化,資源調(diào)度模塊根據(jù)細(xì)化后的需求動(dòng)態(tài)的調(diào)度合適的資源給用戶。
(3)基礎(chǔ)設(shè)施服務(wù)層
基礎(chǔ)設(shè)施層是整個(gè)體系結(jié)構(gòu)的支撐,通過集群技術(shù)將各種物理設(shè)施設(shè)備和資源封裝起來形成服務(wù)資源池供上層調(diào)度和使用。該層主要實(shí)現(xiàn)虛擬化集群和數(shù)據(jù)存儲(chǔ)的功能。通過虛擬化技術(shù)將分布在不同節(jié)點(diǎn)的主機(jī)、服務(wù)器、存儲(chǔ)設(shè)備、網(wǎng)絡(luò)帶寬等物理設(shè)施集成形成一個(gè)整體,構(gòu)成整個(gè)云計(jì)算系統(tǒng)的基礎(chǔ)設(shè)施,擴(kuò)展了物理設(shè)備的性能,優(yōu)化了對(duì)數(shù)字資源的訪問。用戶可以透明的對(duì)數(shù)字圖書館進(jìn)行訪問,無需關(guān)注數(shù)字圖書館基礎(chǔ)設(shè)施內(nèi)部的部署方案和運(yùn)行情況;分布式存儲(chǔ)數(shù)據(jù)資源,形成一個(gè)動(dòng)態(tài)可擴(kuò)展的存儲(chǔ)資源池,該資源池具有強(qiáng)大的計(jì)算能力和按需擴(kuò)展能力,能夠滿足海量數(shù)據(jù)環(huán)境下大規(guī)模并發(fā)用戶的個(gè)性化信息請(qǐng)求。數(shù)字圖書館信息服務(wù)云平臺(tái)的每一層都可以利用相應(yīng)的云計(jì)算服務(wù)來構(gòu)建,并且實(shí)現(xiàn)數(shù)字圖書館云平臺(tái)功能的最大化?;A(chǔ)設(shè)施層可以利用基礎(chǔ)實(shí)施即服務(wù)(IaaS)來構(gòu)建計(jì)算機(jī)集群,形成強(qiáng)大的彈性計(jì)算能力,實(shí)現(xiàn)資源利用的最大化,為中間管理層提供物理和數(shù)據(jù)支持;中間管理層利用平臺(tái)即服務(wù)(PaaS)可以來構(gòu)建圖書館的系統(tǒng)平臺(tái)服務(wù)環(huán)境,應(yīng)用服務(wù)層利用云計(jì)算技術(shù)的軟件即服務(wù)(SaaS)可以來構(gòu)建云圖書館的數(shù)字化管理系統(tǒng)、信息檢索平臺(tái)以及其他應(yīng)用服務(wù)軟件,通過對(duì)云計(jì)算的應(yīng)用,最終形成基于云計(jì)算的數(shù)字圖書館信息服務(wù)云平臺(tái)。
4.2 數(shù)字圖書館個(gè)性化信息服務(wù)技術(shù)模型
數(shù)字圖書館個(gè)性化信息服務(wù)體系采用J2EE框架的體系結(jié)構(gòu)。如圖4所示:
圖4 數(shù)字圖書館個(gè)性化信息服務(wù)技術(shù)模型
需要跨平臺(tái)的互操作性和異構(gòu)數(shù)據(jù)的整合,因此數(shù)字圖書館的個(gè)性化信息服務(wù)技術(shù)模型設(shè)計(jì)分為:(1)客戶端層,此層主要為用戶提供功能一致的服務(wù)界面,是各種客戶端程序的開發(fā),提高了用戶的感知體驗(yàn),具有兼容性和可移植性;(2)應(yīng)用服務(wù)層,利用云計(jì)算提供的開源框架快速開發(fā)和部署數(shù)字圖書館個(gè)性化信息服務(wù),通過訪問低層提供的服務(wù)接口和各種基礎(chǔ)設(shè)施設(shè)備,實(shí)現(xiàn)客戶端與應(yīng)用程序的無縫集成,并最終封裝成服務(wù)提供給用戶使用;(3)管理平臺(tái)層,通過各種開源的云計(jì)算技術(shù),對(duì)底層設(shè)備管理和封裝,并通過統(tǒng)一的云資源管理平臺(tái)對(duì)資源進(jìn)行調(diào)度和監(jiān)控;(4)基礎(chǔ)設(shè)施層,此層提供各種軟硬件資源的虛擬化處理和封裝,實(shí)現(xiàn)整個(gè)系統(tǒng)的透明使用和統(tǒng)一訪問。
將云計(jì)算應(yīng)用到數(shù)字圖書館領(lǐng)域,構(gòu)建一個(gè)成功的基于云計(jì)算的數(shù)字圖書館服務(wù)系統(tǒng)是一項(xiàng)長期而艱巨的任務(wù),不僅需要致力于數(shù)字圖書館的研究人員不斷地鉆研探索,而且需要努力適應(yīng)新的形勢對(duì)數(shù)字圖書館發(fā)展的需要。
4.3 個(gè)性化信息服務(wù)的實(shí)現(xiàn)
數(shù)字圖書館要在海量數(shù)據(jù)環(huán)境下實(shí)現(xiàn)個(gè)性化信息服務(wù),為用戶提供高質(zhì)量的信息內(nèi)容,其關(guān)鍵是精確匹配用戶的個(gè)性化需求。用戶個(gè)性化信息的獲取可以通過顯示獲取和隱式獲取,獲取的用戶個(gè)性化信息要注意弱化用戶真實(shí)信息的透露,通過數(shù)據(jù)挖掘和聯(lián)機(jī)分析處理,得到量化的用戶興趣信息并構(gòu)建用戶興趣模型。個(gè)性化的信息服務(wù)功能設(shè)計(jì)主要有個(gè)性化信息獲取模塊、個(gè)性化信息組織模塊、個(gè)性化信息服務(wù)提供模塊。如圖5所示:
圖5 個(gè)性化信息服務(wù)功能結(jié)構(gòu)圖
個(gè)性化信息獲取模塊主要通過用戶的注冊(cè)、檢索、瀏覽等獲取用戶興趣信息,個(gè)性化信息組織模塊通過對(duì)用戶行為的ap-Reduce 處理構(gòu)建用戶興趣特征庫、構(gòu)建用戶興趣模型,根據(jù)用戶興趣模型,對(duì)資源池的信息進(jìn)行化簡和處理,得到用戶興趣信息的推薦列表;通過個(gè)性化信息服務(wù)提供模塊,為最終用戶和管理者提供個(gè)性化信息推送服務(wù)、參考咨詢服務(wù)、智能代理服務(wù)等多種不同的服務(wù)。云計(jì)算環(huán)境下的數(shù)字圖書館個(gè)性化信息服務(wù)平臺(tái),為用戶接入方式實(shí)現(xiàn)個(gè)性化。通過網(wǎng)絡(luò),移動(dòng)設(shè)備等訪問數(shù)字圖書館。實(shí)現(xiàn)個(gè)性化的信息提供與發(fā)布。滿足用戶對(duì)個(gè)性化知識(shí)交流和共享的需求。使得用戶可以享受一站式的個(gè)性化信息服務(wù)。
隨著云計(jì)算的出現(xiàn),利用虛擬化技術(shù)和云存儲(chǔ)相關(guān)技術(shù)解決目前數(shù)字圖書館信息服務(wù)的限制和瓶頸,給數(shù)字圖書館個(gè)性化信息服務(wù)帶來無限的應(yīng)用。本文重點(diǎn)研究了數(shù)字圖書館個(gè)性化信息服務(wù)的設(shè)計(jì)問題,構(gòu)建基于云計(jì)算的數(shù)字圖書館個(gè)性化信息服務(wù)平臺(tái),改變了用戶與數(shù)字圖書館之間的主被動(dòng)關(guān)系,實(shí)現(xiàn)讀者用戶可以根據(jù)自已需要構(gòu)建其相應(yīng)的私有云,拓展了數(shù)字圖書館個(gè)性化信息服務(wù),為用戶提供更加多樣化的個(gè)性化信息服務(wù),用戶可以根據(jù)自己的需要來定制服務(wù),提升了個(gè)性化信息服務(wù)的能力和質(zhì)量,服務(wù)平臺(tái)系統(tǒng)具有較強(qiáng)的可擴(kuò)展性,為數(shù)字圖書館的未來發(fā)展提供了廣闊的空間。解決了數(shù)字圖書館個(gè)性化信息服務(wù)的設(shè)計(jì)問題,為下一步研究奠定基礎(chǔ)。
[1] 劉鵬.云計(jì)算[M].北京:電子工業(yè)出版社,2010:1-2.
[2] 周彤.欠發(fā)達(dá)地區(qū)農(nóng)村用戶個(gè)性化信息需求與服務(wù)[J].高校圖書館工作,2011,31(5):72-74.
[3] 陳雙慶,高志平.用戶個(gè)性化模式的信息搜索服務(wù)探索[J].農(nóng)業(yè)圖書情報(bào)學(xué)刊,2013,25(07):14-17
[4] 顧倩.數(shù)據(jù)挖掘應(yīng)用于高校圖書館個(gè)性化服務(wù)的探討[J].圖書館雜志,2013(8):63-65.
[5] 王園.網(wǎng)絡(luò)環(huán)境下高校圖書館個(gè)性化信息服務(wù)研究[J].情報(bào)科學(xué),2011,29(8):1192-1196.
[6] Fox R.Library in the clouds[J].OCLC Systems&Services, 2009(3):156-161.
TN919 文獻(xiàn)標(biāo)志碼:A
2015.06.02)
1007-757X(2015)08-0073-03
王喜平(1963-),女,駐馬店人,黃淮學(xué)院圖書館,館員,本科,研究方向:圖書信息資源管理,駐馬店,463000