程羅德 郭顯久 盧笑明 張仕春
摘要:本文首先對(duì)高校數(shù)字化圖書(shū)網(wǎng)絡(luò)資源平臺(tái)環(huán)境的建設(shè)、應(yīng)用、發(fā)展及特點(diǎn)進(jìn)行具體闡釋?zhuān)瑸榱私鉀Q讀者對(duì)數(shù)字資源索取和互動(dòng)的服務(wù)需求,對(duì)資源數(shù)據(jù)的集成、加工和交互訪(fǎng)問(wèn)進(jìn)行了設(shè)計(jì)。采用LAMPWEB技術(shù)框架搭建通用、跨平臺(tái)、高性能Web Server平臺(tái),構(gòu)建集成數(shù)據(jù)、多元服務(wù)、快速響應(yīng)的應(yīng)用環(huán)境。在平臺(tái)環(huán)境設(shè)計(jì)建設(shè)過(guò)程中注重功能性、便捷性、繼承性等因素,對(duì)數(shù)字化校園建設(shè)環(huán)境下的數(shù)字圖書(shū)網(wǎng)絡(luò)資源平臺(tái)進(jìn)行了設(shè)計(jì)、文獻(xiàn)資源庫(kù)建設(shè)、服務(wù)與管理等方面深入探討。詳實(shí)介紹了數(shù)字網(wǎng)絡(luò)資源平臺(tái)和環(huán)境建設(shè)設(shè)計(jì)原則、模式、策略、關(guān)鍵技術(shù)、功能模塊設(shè)計(jì)等,并給出具體配置和應(yīng)用。
關(guān)鍵詞:數(shù)字;虛擬化;集成;協(xié)議
中圖分類(lèi)號(hào):G250 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1671-1580(2017)08-0165-04
一、引言
本文以大連海洋大學(xué)讀者為服務(wù)對(duì)象,根據(jù)我校數(shù)字化校園URP建設(shè)及管理需求,基于校園網(wǎng)龐大而豐富的資源優(yōu)勢(shì),進(jìn)行整合與利用,提供一個(gè)數(shù)字資源個(gè)性化互動(dòng)、共享型服務(wù)平臺(tái)。計(jì)算機(jī)信息技術(shù)在圖書(shū)館領(lǐng)域的快速應(yīng)用和發(fā)展,促使高校圖書(shū)館資源存在及服務(wù)模式發(fā)生很大的改變,出現(xiàn)了讀者對(duì)數(shù)字圖書(shū)資源需求的維度化、時(shí)空化、個(gè)性化等趨勢(shì)和特點(diǎn)。高校圖書(shū)資源需求應(yīng)用中讀者不同數(shù)字資源需求、個(gè)性化定制索取、高效管理服務(wù)及其在應(yīng)用過(guò)程中訪(fǎng)問(wèn)角色優(yōu)化設(shè)計(jì),已成為URP建設(shè)項(xiàng)目應(yīng)用過(guò)程中的重要研究?jī)?nèi)容。本文在傳統(tǒng)圖書(shū)資源建設(shè)及服務(wù)讀者模式的基礎(chǔ)上,構(gòu)建新型圖書(shū)數(shù)字資源建設(shè)及服務(wù)管理平臺(tái),并提出了數(shù)字資源供應(yīng)鏈管理模式,采用數(shù)據(jù)共享中心集成技術(shù),設(shè)計(jì)讀者與虛擬平臺(tái)點(diǎn)對(duì)面、點(diǎn)對(duì)點(diǎn)互動(dòng)資源利用的友好型環(huán)境,真正做到圖書(shū)資源平臺(tái)應(yīng)用的虛擬化、數(shù)字化和個(gè)性化服務(wù)。
二、高校圖書(shū)資源建設(shè)發(fā)展現(xiàn)狀及特點(diǎn)
圖書(shū)資源建設(shè)在不斷發(fā)展和變化,其大致經(jīng)歷了現(xiàn)場(chǎng)采訪(fǎng)最基本的信息源采集——藏書(shū)補(bǔ)充一定程度上的規(guī)?;貢?shū)建設(shè)出入互逆的動(dòng)態(tài)性——文獻(xiàn)資源建設(shè)協(xié)調(diào)與共享——今天數(shù)字化資源建設(shè)的過(guò)程。信息技術(shù)的發(fā)展與應(yīng)用,促使圖書(shū)館文獻(xiàn)資源載體多樣化的種類(lèi)出現(xiàn),傳統(tǒng)的單一紙質(zhì)文獻(xiàn)資源向多元化趨勢(shì)發(fā)展,形成了傳統(tǒng)實(shí)體與當(dāng)前網(wǎng)絡(luò)虛擬館藏資源共存的應(yīng)用局面。共享、便捷、多元、個(gè)性等特點(diǎn)已成為圖書(shū)資源建設(shè)的重要組成要素,建設(shè)一個(gè)可靠性高、持續(xù)性強(qiáng)、內(nèi)涵豐富的圖書(shū)資源環(huán)境,打破信息化所產(chǎn)生的“數(shù)字鴻溝和信息孤島”,使讀者在技術(shù)成熟的信息環(huán)境下對(duì)資源所需即所得,已成為數(shù)字化校園建設(shè)的重要組成部分。
三、圖書(shū)館數(shù)字資源建設(shè)原則模式及關(guān)鍵技術(shù)
(一)數(shù)字資源建設(shè)原則
高校數(shù)字圖書(shū)資源環(huán)境平臺(tái)的設(shè)計(jì)和建設(shè)主要以校內(nèi)、校際之間師生讀者為使用和服務(wù)對(duì)象,面對(duì)在量和型的龐大規(guī)模的對(duì)象群體、豐富和龐雜的網(wǎng)絡(luò)信息資源進(jìn)行數(shù)字化的建設(shè),在設(shè)計(jì)時(shí)必須考慮到針對(duì)性和目的性原則,對(duì)各類(lèi)型信息資源進(jìn)行有的放矢的規(guī)劃和建設(shè)。在虛擬數(shù)字化館藏資源平臺(tái)建設(shè)中,緊扣學(xué)校特色,充分利用和發(fā)揮信息技術(shù)優(yōu)勢(shì),形成自己的館藏資源特色,凸顯特色化原則,建成具有特殊意義的現(xiàn)代圖書(shū)館。遵循資源共享原則,在資源數(shù)量龐大、類(lèi)型多樣的網(wǎng)絡(luò)信息環(huán)境下,如果分工不協(xié)調(diào),獨(dú)立開(kāi)發(fā),必將增大建設(shè)成本投入的重復(fù)性。結(jié)合自身學(xué)校圖書(shū)資源建設(shè)實(shí)際情況,尤其是面對(duì)多個(gè)校區(qū)單館或多館的文獻(xiàn)資源體系,必須全局考慮、統(tǒng)籌規(guī)劃,形成一個(gè)合作、依存、共享的數(shù)字文獻(xiàn)體系,使資源平臺(tái)環(huán)境在應(yīng)用和服務(wù)過(guò)程中充分體現(xiàn)出知識(shí)與對(duì)象的結(jié)合度和共享性。
在圖書(shū)館數(shù)字資源建設(shè)過(guò)程中,遵循標(biāo)準(zhǔn)化和規(guī)范化原則也很重要,從整個(gè)信息源來(lái)看,圖書(shū)館及提供內(nèi)容都不再是一個(gè)獨(dú)立的信息節(jié)點(diǎn),而是源中的一個(gè)節(jié)點(diǎn),那么節(jié)點(diǎn)之間信息數(shù)據(jù)的交互與訪(fǎng)問(wèn)、共享等,必須在統(tǒng)一的標(biāo)準(zhǔn)和規(guī)范下才具有時(shí)效性、通用性和安全性。以資源最大化利用為目的的建設(shè),不能忽視使用對(duì)象、讀者層次、不同需求、需求的變化等方面的因素,以便及時(shí)調(diào)整資源結(jié)構(gòu),以提高數(shù)字圖書(shū)網(wǎng)絡(luò)資源的使用效率。
(二)數(shù)字資源建設(shè)模式與策略
供應(yīng)鏈模式的宗旨在于創(chuàng)造并保持整個(gè)鏈條中的競(jìng)爭(zhēng)優(yōu)勢(shì)和價(jià)值,使整個(gè)體系達(dá)到最優(yōu)狀態(tài)。它通過(guò)信息流、物流、資金流將鏈中的各個(gè)節(jié)點(diǎn)連成一個(gè)整體的功能網(wǎng)鏈結(jié)構(gòu)模式。在數(shù)字圖書(shū)資源設(shè)計(jì)與建設(shè)中,我們提出并應(yīng)用了“即時(shí)即控、并聯(lián)結(jié)合”模式,突破圖書(shū)館內(nèi)部各信息資源節(jié)點(diǎn),將節(jié)點(diǎn)擴(kuò)展到館外單位和部門(mén)信息節(jié)點(diǎn),將節(jié)點(diǎn)匯成資源池,融合成一條價(jià)值鏈,采用“線(xiàn)下溝通、線(xiàn)上控制”的數(shù)據(jù)信息審核控制及訪(fǎng)問(wèn)策略,實(shí)現(xiàn)數(shù)字圖書(shū)資源的有效管理。運(yùn)用SWOT態(tài)勢(shì)分析法從節(jié)點(diǎn)環(huán)境和集群因素同時(shí)進(jìn)行分析,制定數(shù)字文獻(xiàn)資源計(jì)劃,集成校內(nèi)外的數(shù)字資源,形成數(shù)據(jù)集成與共享中心,使各個(gè)節(jié)點(diǎn)協(xié)調(diào)相互之間的關(guān)系,發(fā)揮大數(shù)據(jù)資源池的最大化作用。
改變紙質(zhì)文獻(xiàn)資源規(guī)模體現(xiàn)的觀念,面對(duì)挑戰(zhàn),將館藏建設(shè)轉(zhuǎn)向信息資源建設(shè),以讀者信息需求為導(dǎo)向,在供應(yīng)鏈模式內(nèi)部的節(jié)點(diǎn)采集、加工、組織、存儲(chǔ)、網(wǎng)絡(luò)訪(fǎng)問(wèn)、開(kāi)發(fā)利用等方面,下大功夫做好文章。
在大數(shù)據(jù)背景下,對(duì)數(shù)字資源的設(shè)計(jì)和建設(shè)必須整體規(guī)劃,建立多級(jí)保障體系,實(shí)現(xiàn)數(shù)據(jù)的集成共享,這是圖書(shū)館發(fā)展的趨勢(shì)和方向。如果做不到整體規(guī)劃和標(biāo)準(zhǔn)規(guī)范,就無(wú)法實(shí)現(xiàn)數(shù)字文獻(xiàn)資源的共建、共享和共知,更無(wú)法建立多層次、相對(duì)集中、多級(jí)互連的數(shù)字化文獻(xiàn)資源保障體系。無(wú)論是信息節(jié)點(diǎn)還是信息群,都要從整體進(jìn)行協(xié)調(diào),建設(shè)一個(gè)合作、共享、互利的文獻(xiàn)資源保障鏈條,對(duì)減少重復(fù)建設(shè)、提高資源利用率具有重要作用。
(三)資源數(shù)據(jù)整合與共享技術(shù)
目前,較為流行的數(shù)字資源整合協(xié)議有Z39.50、SOAP、OAI、OpenURL等,Z39.50協(xié)議主要應(yīng)用于圖書(shū)館聯(lián)機(jī)書(shū)目檢索服務(wù),能夠?qū)崿F(xiàn)跨多庫(kù)數(shù)據(jù)檢索,格式規(guī)范,過(guò)程簡(jiǎn)化,同時(shí)能實(shí)現(xiàn)異構(gòu)數(shù)據(jù)或系統(tǒng)之間的通信。開(kāi)放文檔先導(dǎo)OAI協(xié)議從元數(shù)據(jù)收獲的層次上,定義了開(kāi)放文檔元數(shù)據(jù)集OAMS,實(shí)現(xiàn)了圖書(shū)館館際之間的文獻(xiàn)資源互操作,促進(jìn)了網(wǎng)絡(luò)信息資源的開(kāi)發(fā)和共享。開(kāi)放式鏈接框架OpenURL協(xié)議是在信息資源和服務(wù)組件之間實(shí)現(xiàn)互操作,它能夠把信息源、服務(wù)和終端用戶(hù)有機(jī)地整合,提供上下文關(guān)聯(lián)的繼承傳遞式服務(wù)。SOAP簡(jiǎn)單對(duì)象訪(fǎng)問(wèn)協(xié)議在分布式交換信息環(huán)境中應(yīng)用較為廣泛。endprint
根據(jù)學(xué)校圖書(shū)館資源建設(shè)聯(lián)機(jī)檢索、跨庫(kù)查詢(xún)、異構(gòu)通信等實(shí)際需求,在資源建設(shè)整合設(shè)計(jì)及應(yīng)用過(guò)程中,我們采用了Z39.50協(xié)議。由于圖書(shū)數(shù)字網(wǎng)絡(luò)資源存在的格式不同,當(dāng)應(yīng)用服務(wù)請(qǐng)求接口讀取這些互異數(shù)據(jù)時(shí),首先必須對(duì)這些異構(gòu)資源數(shù)據(jù)進(jìn)行整合,使之成為資源大數(shù)據(jù)共享中心,把不同來(lái)源、格式、特點(diǎn)、性質(zhì)的數(shù)據(jù)在邏輯上或是物理上有機(jī)地集中,消除資源數(shù)據(jù)孤島?;赯39.50協(xié)議的圖書(shū)數(shù)字資源整合框架圖如圖1所示:
Z39.50搜索引擎作為Z39.50連接器的人口與中間組件,由WebService來(lái)進(jìn)行實(shí)現(xiàn),接收上層檢索引擎請(qǐng)求模塊,將請(qǐng)求數(shù)據(jù)提交給平臺(tái)控制層,全局?jǐn)?shù)據(jù)庫(kù)將提交數(shù)據(jù),通過(guò)數(shù)據(jù)轉(zhuǎn)換模塊中數(shù)據(jù)轉(zhuǎn)換組件完成異構(gòu)數(shù)據(jù)之間的格式轉(zhuǎn)換,使之成為Z39.50協(xié)議支持的查詢(xún)數(shù)據(jù)格式,再通過(guò)數(shù)據(jù)連接和操作模塊,與局部數(shù)據(jù)進(jìn)行連接、讀取及查詢(xún)操作,最后由元數(shù)據(jù)格式轉(zhuǎn)換器將MARC格式轉(zhuǎn)換為DC格式的元數(shù)據(jù),返回上層協(xié)議連接器引擎,對(duì)結(jié)果進(jìn)行處理并以統(tǒng)一形式響應(yīng)返回給用戶(hù)。
四、數(shù)字圖書(shū)網(wǎng)絡(luò)資源整合平臺(tái)設(shè)計(jì)及構(gòu)建
(一)數(shù)字網(wǎng)絡(luò)資源整合模型設(shè)計(jì)
在進(jìn)行資源整合模型設(shè)計(jì)中,我們充分考慮到多樣化類(lèi)型的資源數(shù)據(jù)(如紙質(zhì)資源、電子資源、網(wǎng)絡(luò)資源、媒體資源、期刊論文等),在進(jìn)行數(shù)據(jù)資源整合時(shí),把握好設(shè)計(jì)管理界面、信息過(guò)濾機(jī)制、角色權(quán)限管理等問(wèn)題,因?yàn)槲覀兊哪繕?biāo)是為讀者提供最優(yōu)質(zhì)化的服務(wù)。數(shù)字資源整合模型圖如圖2所示:
基礎(chǔ)層提供各種網(wǎng)絡(luò)和硬件等方面的基礎(chǔ)設(shè)施環(huán)境;數(shù)據(jù)層是整合的主要對(duì)象和內(nèi)容,包括結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化等方面的數(shù)據(jù);服務(wù)層為整個(gè)資源整合的中間層,它將收到的用戶(hù)請(qǐng)求通過(guò)轉(zhuǎn)換器組件把異構(gòu)數(shù)據(jù)轉(zhuǎn)換為Z39.50協(xié)議支持的數(shù)據(jù)格式,將結(jié)果返回給請(qǐng)求用戶(hù);最上層應(yīng)用層是數(shù)字資源整合的目標(biāo)層,通過(guò)信息門(mén)戶(hù)為終端用戶(hù)提供相應(yīng)展示服務(wù)。
(二)數(shù)字網(wǎng)絡(luò)資源整合平臺(tái)架構(gòu)設(shè)計(jì)
資源整合平臺(tái)設(shè)計(jì)提出了異構(gòu)數(shù)據(jù)集成與共享方案,采用模塊、分層設(shè)計(jì),用戶(hù)從統(tǒng)一集成管理界面提交請(qǐng)求,請(qǐng)求通過(guò)中間引擎來(lái)進(jìn)行調(diào)度作業(yè),然后作業(yè)任務(wù)通過(guò)適配器引擎被分發(fā)給數(shù)據(jù)庫(kù)連接器,并對(duì)連接器返回的結(jié)果進(jìn)行處理,最后返回給請(qǐng)求用戶(hù),從而實(shí)現(xiàn)資源的整合與統(tǒng)一檢索。數(shù)字資源整合平臺(tái)架構(gòu)如圖3所示:
平臺(tái)架構(gòu)大致可以分為四個(gè)層次:用戶(hù)層、信息集成處理層、適配器層和數(shù)據(jù)源層。用戶(hù)層主要用來(lái)實(shí)現(xiàn)終端數(shù)據(jù)信息的交互輸入,并獲得請(qǐng)求響應(yīng)結(jié)果;信息集成處理層接收、處理請(qǐng)求內(nèi)容,并將作業(yè)任務(wù)傳遞給適配器層,同時(shí)調(diào)適配器層的Web服務(wù),整合數(shù)據(jù)信息,返回上層結(jié)果;適配器層處理不同類(lèi)型數(shù)據(jù)源任務(wù);數(shù)據(jù)源層提供基礎(chǔ)數(shù)據(jù)服務(wù)。信息集成平臺(tái)在與數(shù)據(jù)源接口間進(jìn)行數(shù)據(jù)傳輸時(shí),信息格式采用XML格式。
(三)數(shù)字化圖書(shū)網(wǎng)絡(luò)資源平臺(tái)環(huán)境應(yīng)用
針對(duì)數(shù)字資源異構(gòu)特點(diǎn),在設(shè)計(jì)中,我們結(jié)合高效安全數(shù)據(jù)存儲(chǔ),充分利用校內(nèi)高速局域網(wǎng)絡(luò)優(yōu)勢(shì),采用雙機(jī)集群并行機(jī)制,通過(guò)負(fù)載均衡動(dòng)態(tài)分配策略,實(shí)現(xiàn)數(shù)字圖書(shū)網(wǎng)絡(luò)資源的快速交互和安全存放。在項(xiàng)目部署應(yīng)用中,利用axis2 1.0實(shí)現(xiàn)WebService,兩個(gè)Tomcat+Apache服務(wù)器進(jìn)行集成,由其來(lái)共同運(yùn)行servlevJsp組件的任務(wù),共同為讀者提供優(yōu)質(zhì)的數(shù)字資源服務(wù)。數(shù)字圖書(shū)網(wǎng)絡(luò)資源平臺(tái)集成環(huán)境部署架構(gòu)圖如圖4所示:
通過(guò)public String getHtmlContentAsString(StringUrl)方法利用HttpClient類(lèi)實(shí)現(xiàn)Web content獲取,把獲取內(nèi)容信息存儲(chǔ)到數(shù)據(jù)庫(kù)中。關(guān)于服務(wù)的部署,我們采用基于Linux操作系統(tǒng)上的Tomcat+Apache作為WEB容器,Axis2作為SOAP容器,并對(duì)基礎(chǔ)服務(wù)services、standard和conf等文件做相應(yīng)的配置及應(yīng)用。
五、結(jié)語(yǔ)
隨著知識(shí)經(jīng)濟(jì)的快速發(fā)展,數(shù)字圖書(shū)館成為新型網(wǎng)絡(luò)虛擬資源組織模式,為滿(mǎn)足信息資源數(shù)字化、傳遞網(wǎng)絡(luò)化、利用集成共享化、提供知識(shí)化、實(shí)體虛擬化,在資源平臺(tái)設(shè)計(jì)及構(gòu)建中采用了信息虛擬供應(yīng)鏈管理創(chuàng)新模式與數(shù)據(jù)整合技術(shù),在管理應(yīng)用中,增強(qiáng)了角色權(quán)限細(xì)粒度化的程度,大大提高了數(shù)據(jù)有效利用率。雙機(jī)集群應(yīng)用模式實(shí)現(xiàn)了負(fù)載均衡動(dòng)態(tài)資源調(diào)配,針對(duì)資源內(nèi)容差異性,利用Z39.50協(xié)議進(jìn)行格式轉(zhuǎn)化和整合,實(shí)現(xiàn)了資源共享的最終目的。
[責(zé)任編輯:劉愛(ài)華]endprint