●馮京桉(國(guó)家圖書(shū)館,北京 100081)
數(shù)字圖書(shū)館的目標(biāo)是基于網(wǎng)絡(luò)環(huán)境實(shí)現(xiàn)分布式數(shù)字化信息資源的集成與共享,為用戶(hù)方便、快捷地提供高水平的信息服務(wù)。[1]數(shù)字圖書(shū)館作為在網(wǎng)絡(luò)環(huán)境下數(shù)字化信息資源的一種新的服務(wù)與技術(shù)體系結(jié)構(gòu),是基于廣域網(wǎng)環(huán)境的計(jì)算機(jī)信息資源系統(tǒng)的聯(lián)合體。[2]網(wǎng)絡(luò)技術(shù)的發(fā)展推動(dòng)了數(shù)字圖書(shū)館的產(chǎn)生和發(fā)展,但是鑒于當(dāng)前整個(gè)互聯(lián)網(wǎng)中從硬件到軟件系統(tǒng)的異構(gòu)性,以及在資源共享與服務(wù)提供上的局限性,客觀上制約了數(shù)字圖書(shū)館的進(jìn)一步發(fā)展。如何有效地實(shí)現(xiàn)數(shù)字化信息資源共享,為用戶(hù)提供可靈活控制的、智能的、個(gè)性化的信息服務(wù)成為數(shù)字圖書(shū)館建設(shè)迫切需要解決的問(wèn)題。
網(wǎng)格技術(shù)的出現(xiàn),為最終解決數(shù)字圖書(shū)館建設(shè)中的信息資源共享與信息服務(wù)的靈活實(shí)施提供了有效的技術(shù)手段。網(wǎng)格把用通信手段連接起來(lái)的資源無(wú)縫集成為一個(gè)有機(jī)的整體,為用戶(hù)提供一種基于國(guó)際互聯(lián)網(wǎng)的新型工作平臺(tái),在這個(gè)平臺(tái)上對(duì)來(lái)自客戶(hù)的請(qǐng)求和提供資源的能力進(jìn)行合理匹配,為用戶(hù)請(qǐng)求選擇合適的資源服務(wù),實(shí)現(xiàn)廣域范圍的資源共享。[3,4]探討網(wǎng)格技術(shù)在數(shù)字圖書(shū)館的應(yīng)用與發(fā)展成為國(guó)內(nèi)外情報(bào)學(xué)界的研究熱點(diǎn)。[5]美國(guó)和歐盟先后資助了多項(xiàng)基于網(wǎng)格的數(shù)字圖書(shū)館研究項(xiàng)目,例如歐盟資助的DILIGENT項(xiàng)目、美國(guó)的DigitalLibraryGRID項(xiàng)目、葡萄牙國(guó)家圖書(shū)館的ARCO項(xiàng)目、國(guó)際合作研究項(xiàng)目GRACE等等。[6]而在我國(guó),網(wǎng)格技術(shù)在數(shù)字圖書(shū)館建設(shè)中的應(yīng)用研究也成為圖書(shū)情報(bào)領(lǐng)域的研究熱點(diǎn),研究?jī)?nèi)容涉及網(wǎng)格技術(shù)的影響分析、資源處理能力、體系結(jié)構(gòu)、服務(wù)提供、互操作技術(shù)等多個(gè)方面,正在從意義作用的分析、理論層面的研究向結(jié)合系統(tǒng)的實(shí)證式研究轉(zhuǎn)變。本文在分析數(shù)字圖書(shū)館提供的信息服務(wù)的基礎(chǔ)上,提出了基于網(wǎng)格技術(shù)的信息服務(wù)架構(gòu)設(shè)計(jì)方案,對(duì)信息服務(wù)流程進(jìn)行了分析。
基于網(wǎng)格的數(shù)字圖書(shū)館是以現(xiàn)有的國(guó)際互聯(lián)網(wǎng)為基礎(chǔ),在其上建立的一個(gè)滿(mǎn)足用戶(hù)對(duì)信息資源更高需求的信息服務(wù)平臺(tái),實(shí)現(xiàn)廣域范圍內(nèi)分布式信息資源的有效集成,管理跨組織、跨區(qū)域的信息資源,為各種應(yīng)用提供全面的資源共享接口,在任何時(shí)間、任何地點(diǎn)為用戶(hù)提供共享各種信息資源的個(gè)性化服務(wù)。由此決定了網(wǎng)格支持下的全球數(shù)字圖書(shū)館的服務(wù)模式是主動(dòng)服務(wù),信息服務(wù)類(lèi)型主要包括資源數(shù)據(jù)服務(wù)、知識(shí)導(dǎo)航服務(wù)、信息集成服務(wù)、知識(shí)服務(wù)和個(gè)性化服務(wù)等,具有如下特征:
(1)提供對(duì)全球分布式信息資源的透明訪問(wèn)。用戶(hù)登錄基于網(wǎng)格的數(shù)字圖書(shū)館信息應(yīng)用服務(wù)系統(tǒng)后,可以透明訪問(wèn)全球分布式信息資源,無(wú)須知道信息資源的具體位置。信息資源所在的地理位置、所存儲(chǔ)的數(shù)據(jù)服務(wù)器、所在的數(shù)據(jù)庫(kù)管理系統(tǒng)對(duì)讀者來(lái)說(shuō)是透明的。
(2)實(shí)現(xiàn)對(duì)海量分布式信息資源的共享與統(tǒng)籌優(yōu)化。網(wǎng)格技術(shù)具有超大規(guī)模的信息吞吐量,能夠?qū)崿F(xiàn)互聯(lián)網(wǎng)上包括硬軟件資源、計(jì)算資源、存儲(chǔ)資源、通信資源、信息資源、知識(shí)資源、專(zhuān)家資源等海量資源的全面聯(lián)通,最終實(shí)現(xiàn)網(wǎng)絡(luò)虛擬環(huán)境下的資源共享和協(xié)同工作,支持?jǐn)?shù)字圖書(shū)館的知識(shí)服務(wù)體系的構(gòu)建,并能夠進(jìn)行資源的優(yōu)化調(diào)度,將用戶(hù)的資源請(qǐng)求與可用資源進(jìn)行匹配,作出統(tǒng)籌優(yōu)化。
(3)按需提供高質(zhì)量的無(wú)縫信息服務(wù)?;诰W(wǎng)格技術(shù)的數(shù)字圖書(shū)館使用戶(hù)在共享全世界范圍內(nèi)信息資源的同時(shí),還可享受到智能推理服務(wù),使相互理解沒(méi)有任何障礙。通過(guò)自然語(yǔ)言的語(yǔ)義檢索,并基于知識(shí)挖掘、過(guò)濾、推薦、探索等手段,對(duì)全球分布的相關(guān)知識(shí)進(jìn)行智能聚合,提供滿(mǎn)足用戶(hù)需要的、合適的、完備的最小知識(shí)集。
(4)實(shí)現(xiàn)知識(shí)的動(dòng)態(tài)發(fā)現(xiàn)、存儲(chǔ)與持續(xù)更新?;诰W(wǎng)格技術(shù)的數(shù)字圖書(shū)館通過(guò)資源共享與協(xié)同工作,從事實(shí)、數(shù)據(jù)和信息中提取對(duì)決策有直接作用的知識(shí),完成知識(shí)的動(dòng)態(tài)發(fā)現(xiàn)。在網(wǎng)格環(huán)境中,知識(shí)不是靜態(tài)存貯的,所服務(wù)的知識(shí)能動(dòng)態(tài)演化、遷移與整合,并保持常新。
在對(duì)基于網(wǎng)格技術(shù)的數(shù)字圖書(shū)館信息服務(wù)特征進(jìn)行深入分析的基礎(chǔ)上,設(shè)計(jì)網(wǎng)格環(huán)境下數(shù)字圖書(shū)館的信息服務(wù)架構(gòu)對(duì)于數(shù)字圖書(shū)館工程的建設(shè)與發(fā)展具有重要的意義。IanFoster提出了基于“沙漏模型”的層次式網(wǎng)絡(luò)結(jié)構(gòu)模型;[7]Globus小組和IBM將計(jì)算網(wǎng)格和互聯(lián)網(wǎng)服務(wù)結(jié)合起來(lái),提出了開(kāi)放的網(wǎng)格服務(wù)結(jié)構(gòu),即 OGSA (Open Grid Service Architecture) 架構(gòu)。[8]筆者在對(duì)相關(guān)網(wǎng)格系統(tǒng)體系結(jié)構(gòu)進(jìn)行深入分析的基礎(chǔ)上,設(shè)計(jì)了面向數(shù)字圖書(shū)館信息服務(wù)的層次化數(shù)字圖書(shū)館網(wǎng)格架構(gòu),如圖1所示。
圖1 基于網(wǎng)格的數(shù)字圖書(shū)館信息服務(wù)架構(gòu)圖
整個(gè)基于網(wǎng)格的數(shù)字圖書(shū)館信息服務(wù)架構(gòu)采用層次化的面向服務(wù)的架構(gòu),便于對(duì)軟件的復(fù)用、系統(tǒng)的可擴(kuò)充性與健壯性有良好支持。整個(gè)層次架構(gòu)共分為網(wǎng)格服務(wù)協(xié)議和標(biāo)準(zhǔn)層、基本服務(wù)層、通用服務(wù)層、應(yīng)用服務(wù)層等四個(gè)層次。
網(wǎng)格服務(wù)協(xié)議和標(biāo)準(zhǔn)層:以現(xiàn)有的國(guó)際互聯(lián)網(wǎng)為基礎(chǔ),制定一系列的網(wǎng)格服務(wù)協(xié)議和標(biāo)準(zhǔn),完成資源描述、資源發(fā)現(xiàn)、資源訪問(wèn)和共享,是以服務(wù)形式共享資源,把資源有機(jī)組織聯(lián)系起來(lái)的基礎(chǔ)。
基本服務(wù)層:為基于網(wǎng)格技術(shù)的數(shù)字圖書(shū)館提供基本的功能,類(lèi)似于操作系統(tǒng)的內(nèi)核,提供數(shù)字圖書(shū)館網(wǎng)格環(huán)境中的數(shù)據(jù)傳輸服務(wù)、通信服務(wù)、信息管理服務(wù)、安全服務(wù)、監(jiān)控服務(wù)等?;痉?wù)要求具有運(yùn)行的可靠性和實(shí)現(xiàn)的高效性。
通用服務(wù)層:通用服務(wù)與具體資源沒(méi)有太緊密的關(guān)聯(lián),提供數(shù)字圖書(shū)館的統(tǒng)一資源訪問(wèn)服務(wù)、遠(yuǎn)程資源控制服務(wù)、中介服務(wù)、審計(jì)服務(wù)、隊(duì)列調(diào)度、統(tǒng)一數(shù)據(jù)訪問(wèn)服務(wù)、出錯(cuò)管理服務(wù)、事件管理服務(wù)、網(wǎng)絡(luò)緩存服務(wù)等。
應(yīng)用服務(wù)層:應(yīng)用服務(wù)層通過(guò)應(yīng)用支持環(huán)境與下層服務(wù)打交道,為用戶(hù)提供各種數(shù)字圖書(shū)館服務(wù),用戶(hù)不需要了解各種服務(wù)的實(shí)現(xiàn)細(xì)節(jié)。具體服務(wù)類(lèi)型包括:基于語(yǔ)義的檢索服務(wù)、虛擬參考咨詢(xún)服務(wù)、定題信息服務(wù)、個(gè)性化信息服務(wù)、培訓(xùn)服務(wù)等。
基于層次化的數(shù)字圖書(shū)館信息服務(wù)網(wǎng)格架構(gòu),參考基于Web服務(wù)的網(wǎng)格體系結(jié)構(gòu)的工作過(guò)程,[9]設(shè)計(jì)數(shù)字圖書(shū)館一般性信息服務(wù)的邏輯流程,如圖2所示。
圖2 基于網(wǎng)格技術(shù)的數(shù)字圖書(shū)館信息服務(wù)流程
(1)數(shù)字圖書(shū)館服務(wù)門(mén)戶(hù)系統(tǒng)提供基于Web的統(tǒng)一用戶(hù)界面,用戶(hù)通過(guò)門(mén)戶(hù)界面選擇數(shù)字圖書(shū)館各種應(yīng)用服務(wù)類(lèi)型,提交服務(wù)申請(qǐng),門(mén)戶(hù)系統(tǒng)后臺(tái)基于任務(wù)描述語(yǔ)言,完成用戶(hù)服務(wù)申請(qǐng)描述,提交給服務(wù)代理,服務(wù)代理在任務(wù)執(zhí)行完畢后,將結(jié)果返回給用戶(hù)界面顯示。
(2)服務(wù)代理通過(guò)服務(wù)工作流引擎,分析由數(shù)字圖書(shū)館服務(wù)門(mén)戶(hù)提交的任務(wù)描述,確定服務(wù)類(lèi)型,如是執(zhí)行檢索服務(wù)還是執(zhí)行館際互借服務(wù)等,繼而查詢(xún)網(wǎng)格信息服務(wù)并收集必要的信息,按照一定策略為用戶(hù)申請(qǐng)任務(wù)的執(zhí)行選取相應(yīng)的服務(wù)執(zhí)行過(guò)程,包括服務(wù)選擇、創(chuàng)建服務(wù)實(shí)例、任務(wù)執(zhí)行以及執(zhí)行過(guò)程中的任務(wù)監(jiān)控等。在任務(wù)執(zhí)行完畢后,服務(wù)代理將處理結(jié)果返回給數(shù)字圖書(shū)館服務(wù)門(mén)戶(hù)系統(tǒng)。
(3)數(shù)字圖書(shū)館網(wǎng)格服務(wù)運(yùn)行環(huán)境支持網(wǎng)格服務(wù)的實(shí)例、狀態(tài)和整個(gè)服務(wù)執(zhí)行的生命周期中的協(xié)商機(jī)制,運(yùn)行環(huán)境通過(guò)面向服務(wù)的結(jié)構(gòu)實(shí)現(xiàn)對(duì)數(shù)字圖書(shū)館應(yīng)用服務(wù)、通用服務(wù)、基本服務(wù)等層次化服務(wù)的部署,完成服務(wù)功能的共享。
(4)網(wǎng)格安全支持機(jī)制主要為了實(shí)現(xiàn)對(duì)數(shù)字圖書(shū)館網(wǎng)格中分布式資源的有效、一致的管理和共享,保證資源不被非法破壞和獲取。安全支持機(jī)制是基于面向異構(gòu)環(huán)境的跨自治域的安全系統(tǒng),基于策略實(shí)現(xiàn)分布式資源安全控制與自治域間的安全互操作,主要包括全局統(tǒng)一強(qiáng)制身份認(rèn)證授權(quán)機(jī)制、訪問(wèn)控制策略及安全信任域管理等。
網(wǎng)格技術(shù)是解決數(shù)字圖書(shū)館信息資源共享與信息服務(wù)提供的有效技術(shù)手段,網(wǎng)格技術(shù)正處在飛速發(fā)展之中,應(yīng)該充分利用網(wǎng)格技術(shù)最新研究成果,促進(jìn)數(shù)字圖書(shū)館在資源處理、技術(shù)應(yīng)用與服務(wù)能力的全面提升。
[1] ShenR,etal.WhatIsa Successful Digital Library? [J].Researchand Advanced Techno logyfor Digital Libraries,2006 (Springer):208-219.
[2]曲建峰,等.基于網(wǎng)格的數(shù)字圖書(shū)館服務(wù)模式探討[J].現(xiàn)代圖書(shū)情報(bào)技術(shù),2006(2):10-14.
[3]于茁,劉雁.構(gòu)建基于網(wǎng)格的數(shù)字圖書(shū)館服務(wù)模式探討[J].科技情報(bào)開(kāi)發(fā)與經(jīng)濟(jì),2007,17(27):36-37.
[4]于映紅.基于網(wǎng)格的圖書(shū)館信息服務(wù)[J].情報(bào)探索,2006(9):73-75.
[5] Sebest yé n-P á lG,etal.Towards a GRID-Based Digital Library Management System[C]//Kacsuk P.Distributed and Parallel Systems.Springer,2008:77-90.
[6] 畢強(qiáng),等.國(guó)外基于網(wǎng)格技術(shù)的數(shù)字圖書(shū)館結(jié)構(gòu)體系比較研究[J].情報(bào)學(xué)報(bào),2006,25(3):330-336.
[7]FosterI,Kesse lmanC.網(wǎng)格計(jì)算[M].金海,等譯.北京:電子工業(yè)出版社,2004.
[8] 徐志偉,等.網(wǎng)格計(jì)算技術(shù)[M].北京:電子工業(yè)出版社,2004.
[9]胡春明,等.基于Web服務(wù)的網(wǎng)格體系結(jié)構(gòu)及其支撐環(huán)境研究[J].軟件學(xué)報(bào),2004(7) :1064-1073.