蔡 煒
(青島大學(xué)圖書館 山東 青島 266061)
區(qū)域高校圖書館聯(lián)盟信息服務(wù)云平臺體系研究★
蔡 煒
(青島大學(xué)圖書館 山東 青島 266061)
為了實現(xiàn)高校圖書館聯(lián)盟內(nèi)文獻的共享和共用,利用云計算技術(shù),構(gòu)建了包括角色層、服務(wù)層、工具層和基礎(chǔ)層的面向區(qū)域高校圖書館聯(lián)盟的區(qū)域云服務(wù)平臺體系架構(gòu),并對資源發(fā)現(xiàn)進行了探討,提出了一種層次遞進的檢索模型,在資源語義建?;A(chǔ)上,給出了基于用戶需求的語義匹配策略。
語義建模;云計算;資源發(fā)現(xiàn);圖書館聯(lián)盟
圖書館聯(lián)盟是以實現(xiàn)資源共享、互惠互利為目的而組織起來的圖書館聯(lián)合體,是數(shù)字圖書館的一種發(fā)展趨勢[1]。區(qū)域性圖書館聯(lián)盟是圖書館聯(lián)盟中比較普遍的一種,這種聯(lián)盟利用地域上的便利,充分發(fā)揮聯(lián)盟的優(yōu)勢,在聯(lián)合編目、館際互借、公共檢索、集團采購、電子信息資源的建設(shè)等活動中相互協(xié)作[2],建立起區(qū)域性的文獻信息服務(wù)體系。國內(nèi)比較典型的如江蘇省高等教育文獻保障系統(tǒng)、天津高等教育文獻信息中心、河南省高等教育文獻保障系統(tǒng)、山東省網(wǎng)上圖書館共享服務(wù)平臺等都是區(qū)域性信息資源共建共享機構(gòu)。
云計算是一種新興的計算模型, 具有可靠性高、數(shù)據(jù)處理量大、擴展靈活以及設(shè)備利用率高等優(yōu)勢, 正成為信息領(lǐng)域研究的熱點, 包括Google、IBM、Amazon、Microsoft在內(nèi)的幾乎所有的IT巨頭都將云計算作為未來發(fā)展的主要戰(zhàn)略之一[3,4]。云計算旨在由專業(yè)計算機和網(wǎng)絡(luò)公司建立計算機存儲和計算服務(wù)中心,把資源虛擬化成“云”后集中存儲起來,為用戶需求提供服務(wù)。對于圖書館應(yīng)用,云計算作為一種信息共享技術(shù)的架構(gòu)模式,可以將海量的數(shù)字信息資源集中在一起,實現(xiàn)數(shù)字圖書館的云平臺和云聯(lián)盟,為數(shù)字資源的真正共享提供了新的途徑。
本文針對區(qū)域內(nèi)高校圖書館聯(lián)盟模式,探討云計算模式下信息資源共享服務(wù)平臺架構(gòu),對云模式下的資源檢索提出了本體建模方法和檢索策略。
隨著圖書館事業(yè)的不斷發(fā)展,圖書館的各類資源已經(jīng)覆蓋社會生活每個領(lǐng)域,并不斷地細(xì)分、深化和專業(yè)化,各高校圖書館根據(jù)自身的條件分別擁有其中的部分或全部資源。但由于高校類型不同,圖書館提供的館藏電子資源服務(wù)的綜合性和專業(yè)性不同,因而形成了電子資源的千種百態(tài)。用戶如果要從圖書館中獲取最有價值、最全面的資料,就要面對不同的圖書館、不同的資源檢索系統(tǒng),無疑增加了用戶的困難。圖書館聯(lián)盟的形成實際就是電子資源整合的一種服務(wù)方式。云計算在圖書館的應(yīng)用很適合共享與合作的范式。這種區(qū)域圖書館聯(lián)盟構(gòu)成云計算模式,或稱為區(qū)域云,具有如下優(yōu)勢:
(1)區(qū)域內(nèi)各高校通過聯(lián)合建立一個共享“云端”,以資源高度共享為基礎(chǔ),改進現(xiàn)有的用戶服務(wù)模式,逐步形成“統(tǒng)一檢索——集成咨詢——實時獲取——知識服務(wù)”的服務(wù)模式,有效提高高校圖書館的資源利用率及用戶滿意度。
(2)眾多的服務(wù)器、存儲器等設(shè)備集成在“云端”,其存儲能力和計算能力理論上可以無限增大。在區(qū)域云中,各高校圖書館實現(xiàn)了共享資源,避免了電子數(shù)據(jù)庫資源的重復(fù)購買,也不必再考慮硬件費用問題。同時,更方便的終端設(shè)備(如4G手機、IPDA等)接入方式提供用戶去訪問區(qū)域云內(nèi)的資源信息。
(3)以區(qū)域云平臺為基礎(chǔ),高校聯(lián)盟圖書館可以利用云平臺實現(xiàn)數(shù)字資源的整合、組織、導(dǎo)航以及可視化服務(wù),不同類型和規(guī)模的高校圖書館可以按需索取相應(yīng)的服務(wù),滿足用戶的需求。
3.1 云服務(wù)平臺架構(gòu)
云計算的出現(xiàn)對于建立一個統(tǒng)一、開放、靈活的數(shù)字圖書館信息服務(wù)平臺有著重要作用。本文構(gòu)建了包括角色層、服務(wù)層、工具層和基礎(chǔ)層的四層結(jié)構(gòu)的面向區(qū)域高校圖書館聯(lián)盟的區(qū)域云服務(wù)平臺體系架構(gòu),可以為用戶提供基于網(wǎng)絡(luò)的快捷、安全、價廉的信息服務(wù),并實現(xiàn)地區(qū)性圖書館集群的多方協(xié)同與共贏,構(gòu)建一個科學(xué)、穩(wěn)定的平臺體系(如圖1)所示。
圖1 圖書館聯(lián)盟區(qū)域云信息服務(wù)平臺架構(gòu)
(1) 角色層是資源需求方、資源提供方和方案服務(wù)方等各用戶與圖書館聯(lián)盟信息服務(wù)平臺進行交互的接口。
(2) 服務(wù)層是服務(wù)平臺的核心功能層。通過人機交互界面用戶對各類信息資源需求、信息資源進行注冊發(fā)布,形成云需求和云資源。在工具層各類型工具的驅(qū)動下,服務(wù)化的信息資源將按用戶需求動態(tài)組合為粒度不同的服務(wù)模塊,形成相應(yīng)的區(qū)域云服務(wù)。
(3) 工具層是服務(wù)支持層,主要由資源管理工具集、運行服務(wù)工具集和平臺綜合管理工具集等組成。資源管理工具集用于用戶及圖書館需求和資源的注釋、注冊、發(fā)布以及分類,主要包括注解工具、注冊工具、分類管理工具和發(fā)布工具;運行服務(wù)工具集可支持信息區(qū)域云服務(wù)的網(wǎng)絡(luò)化運行,包括智能匹配工具、本體構(gòu)建工具、運行優(yōu)化工具、服務(wù)評價工具、租賃管理工具、實時監(jiān)控工具等;綜合管理工具集則為用戶提供安全、可靠和穩(wěn)定的服務(wù)環(huán)境支持,主要包括了信息平臺運行管理工具、用戶信息管理工具、安全運行管理工具等。
(4) 基礎(chǔ)層將區(qū)域內(nèi)分布在各高校圖書館的數(shù)據(jù)庫、存儲類設(shè)備、服務(wù)器和網(wǎng)絡(luò)安全類設(shè)備接入?yún)^(qū)域云服務(wù)平臺中,形成云數(shù)據(jù)庫、云服務(wù)器、云存儲和云安全等信息服務(wù)平臺運行支撐環(huán)境。
3.2 平臺運行模式
云服務(wù)平臺既要支持區(qū)域內(nèi)各信息服務(wù)角色所擁有的廣域、異構(gòu)信息資源虛擬集成,又要實現(xiàn)信息資源共享和優(yōu)化利用、圖書系統(tǒng)網(wǎng)絡(luò)化集成運行、信息獲取過程優(yōu)化,以及遠(yuǎn)程維護等基于網(wǎng)絡(luò)的信息服務(wù)。本文初步建立了圖書信息云服務(wù)平臺的運行模式,如圖2所示。
圖2 云平臺服務(wù)模式
資源需求方、資源提供方和整體解決方案服務(wù)方通過云服務(wù)平臺的注冊發(fā)布工具,對各自的服務(wù)需求信息、信息資源進行虛擬化描述與服務(wù)化封裝,并注冊發(fā)布到云服務(wù)平臺上,形成相應(yīng)的云需求和云資源;資源需求方調(diào)用服務(wù)平臺工具集中的智能搜索匹配工具,對其相應(yīng)的云需求與云資源庫中的信息資源進行智能搜索匹配,形成供需匹配文檔,并反饋至信息供需雙方;待服務(wù)確認(rèn)后,供需雙方則可利用平臺提供的組合調(diào)配工具、優(yōu)化運行工具、交易協(xié)同工具、綜合評價工具等服務(wù)運行工具對服務(wù)進行組合、調(diào)配、優(yōu)化、交易和評價,并將其反饋給服務(wù)供需雙方,以便對所提供服務(wù)進行實時跟蹤和完善;同時,平臺服務(wù)在線監(jiān)控工具、服務(wù)容錯管理工具等對其服務(wù)進行運維管控,以不斷優(yōu)化平臺服務(wù)能力。
云服務(wù)平臺的構(gòu)建及運行實現(xiàn),涉及信息資源的云端接入、信息本體建模、云資源搜索與智能匹配、云服務(wù)運行及監(jiān)控等關(guān)鍵技術(shù),就云資源檢索本文提出了一種層次遞進的檢索模型。
云計算模式下的圖書館聯(lián)盟涉及到多方面的技術(shù)和內(nèi)容,包括:
(1)圖書館信息資源存儲:通過聯(lián)盟應(yīng)用、網(wǎng)格技術(shù)以及分布式文件系統(tǒng)等功能,將網(wǎng)絡(luò)中大量各類存儲設(shè)備通過應(yīng)用軟件虛擬地集合起來協(xié)同工作,共同對外提供數(shù)據(jù)存儲和業(yè)務(wù)訪問功能,即“云存儲”。在云計算模式下,圖書館藏書目數(shù)據(jù)庫和特色文獻數(shù)據(jù)庫等資源都可以選擇存儲在區(qū)域云中。
(2)圖書館信息資源檢索:云計算具有強大的計算能力,這為圖書館完成大規(guī)模用戶同時在線檢索服務(wù)提供了可能。用戶通過Google、百度等檢索界面將檢索請求提交給云計算服務(wù)器,服務(wù)器進行本體演算、機器智能推理匹配等復(fù)雜計算,將存儲在云存儲服務(wù)器的資源提供給用戶。
(3)圖書館信息資源獲?。夯谠朴嬎惚旧淼姆植际郊軜?gòu)和強大計算能力,用戶從云中獲取數(shù)字資源的速度將如同在本地一樣快捷。用戶可以隨時的向云服務(wù)器提交獲取資源請求,云計算服務(wù)器將通過統(tǒng)一平臺,自動挖掘分布在區(qū)域云中各處的數(shù)據(jù)提供給用戶。為了完成信息資源檢索,系統(tǒng)需具有強大的資源發(fā)現(xiàn)功能。本文在信息資源語義建模基礎(chǔ)上,提出了基于用戶需求的資源發(fā)現(xiàn)服務(wù)和語義匹配策略。
4.1 區(qū)域圖書館用戶模型的建立及其語義描述
用戶建模的目的是幫助信息服務(wù)系統(tǒng)推測用戶提出的需求,智能、主動地發(fā)現(xiàn)用戶所需的資源內(nèi)容。因此,資源發(fā)現(xiàn)服務(wù)需要自動地或人工獲取用戶需求信息,用戶需求表達(dá)的準(zhǔn)確性和合理性直接影響到發(fā)現(xiàn)服務(wù)的質(zhì)量。用戶模型所涉及到的用戶知識包括采用檢索關(guān)鍵詞表示的用戶需求、隱含的問題空間、用戶的興趣模型及領(lǐng)域知識。用戶模型的主要元素包括用戶的研究方向及領(lǐng)域、愛好、工作部門、職務(wù)等基本背景信息。模型采用類來定義層次不同類型的用戶,類屬性用來描述相應(yīng)類用戶的特征知識,每一個具體用戶對應(yīng)類的一個實例,可以通過類的繼承和關(guān)聯(lián)關(guān)系來表達(dá)模型的層次。
圖3是一用戶模型實例,其中用戶類描述了所有用戶的抽象特征,用戶類又分為圖書館類、部門類以及個人用戶類。
4.2 基于語義的圖書館聯(lián)盟文獻資源建模
云模式下的資源模型描述需要從語義層次上來加以研究。語義是建立在一定語法上,反映一定認(rèn)知結(jié)果的數(shù)據(jù)對象的含義以及關(guān)聯(lián)關(guān)系,是對數(shù)據(jù)的一種抽象或者更高層次的邏輯描述[5]。文獻信息資源的語義模型可以用于資源的主題搜索、元數(shù)據(jù)提取和資源語義注釋等資源發(fā)現(xiàn)過程。同時,也可用于資源的分類聚類,語義導(dǎo)航、檢索匹配及智能推理等信息資源語義的應(yīng)用服務(wù)。本體是一種可以在語義和知識層次上描述資源的概念建模工具。對于云模式下資源發(fā)現(xiàn)服務(wù),可以通過對信息資源的概念抽象,把信息資源組織為一個公共的資源模型,使其成為基于本體的資源語義模型。
圖3 基于類表示的用戶模型圖
圖4 圖書類資源本體實例
構(gòu)建資源領(lǐng)域本體常采用自頂向下(Top—down)的方法,構(gòu)建的主要步驟包括:(1)確定領(lǐng)域資源的本體范圍;(2)定義資源概念的語義層次體系框架;(3)建立資源的領(lǐng)域本體;(4)細(xì)化、擴展應(yīng)用本體。圖4是采用有向圖定義的圖書類資源的局部本體。
4.3 基于概念本體的資源語義檢索
高校數(shù)字文獻資源分布廣泛,內(nèi)容和形式復(fù)雜,有效的資源發(fā)現(xiàn)和服務(wù)機制是資源共享服務(wù)的基礎(chǔ)。資源檢索是信息服務(wù)的一項主要內(nèi)容,本文采用一種層次遞進的檢索模型(如圖5所示),可以實現(xiàn)精確檢索、基于語義檢索、模糊檢索以及智能推理等功能。首先對用戶需求進行模糊擴展來完成對模糊查詢量的精確化,其次根據(jù)資源本體的語義模型實現(xiàn)語義擴展(如:同義擴展、語義蘊涵、語義聯(lián)想等),末層采用精確匹配和智能推理技術(shù)完成資源的檢索服務(wù)。
圖5 層次遞進檢索模型
基于本體的資源語義檢索是一種基于語義匹配過程的資源服務(wù),其檢索步驟為:
Step1:將用戶需求信息和文獻資源信息所包含的概念分別映射到各自對應(yīng)的本體概念語義模型上,形成用戶需求本體O1和文獻資源本體O2;
Step2:采用后序遍歷分別生成O1和O2各自所包含的概念序列;
Step3:對序列中的每一對概念節(jié)點(ci,cj)進行概念本體的語義相似度計算;
Step4:以語義相似度作為量度,從區(qū)域云存儲數(shù)據(jù)庫中找出符合條件的信息資源集合。
語義相似度采用如下計算公式:
Sim=(ci,cj)=
其中,Sim(ci,cj)代表兩個概念ci和cj之間的語義相似程度,li、lj分別是概念ci和cj在概念本體樹中所在的層次,α是調(diào)節(jié)系數(shù)(0<α<1),Dis(ci,cj)是概念ci和cj在概念本體樹中路徑距離長度。
以用戶需求為基本是數(shù)字圖書館發(fā)展的根本和宗旨。隨著云計算技術(shù)的逐漸完善,將云計算技術(shù)與方法運用到區(qū)域圖書館聯(lián)盟信息服務(wù)平臺建設(shè)中,本文在平臺的結(jié)構(gòu)及相關(guān)技術(shù)方面做了有益的探討,可以有效提高區(qū)域聯(lián)盟內(nèi)軟硬件資源的利用率,構(gòu)建數(shù)字圖書館資源共享體系,提升圖書館的服務(wù)質(zhì)量。
[1]葉素萍.云計算環(huán)境下的區(qū)域圖書館聯(lián)盟建設(shè)模式研究[J].河北科技圖苑,2012,25(4):84-86.
[2]張甫.國內(nèi)區(qū)域圖書館聯(lián)盟建設(shè)與發(fā)展研究[J].情報雜志,2011,30(8):138-143.
[3]王德文.基于云計算的智能電網(wǎng)信息平臺[J].電力系統(tǒng)自動化,2010,34(22):7-11.
[4]VAQUERO L M,RODERO-MERINO L,CACERES J,etal.A break in the clouds:towards a cloud definition.ACM SIGCOMM Computer Communication Review,2009,39(1):50-55.
[5]張維明.語義信息模型及應(yīng)用[M].北京:電子工業(yè)出版社,2002.
[6]陳康,鄭緯.云計算:系統(tǒng)實例與研究現(xiàn)狀[J].軟件學(xué)報, 2009,20(5):1337-1348.
Research of Cloud Information Service Platformfor Regional University Library Alliance
Cai Wei
To achieve the sharing and reuse of Library alliance literature resources, the paper uses cloud computing technology, and structures regional cloud service platform for regional university library alliance that includes multilevel, such as user layer, service layer, tool layer and support layer. The resource discovery is discussed. A retrieval model of hiberarchy is presented. The semantic matching strategy is given based on resource semantic modeling.
Semantic Modeling; Cloud Computing; Resource Discovery; Library Alliance
本文系山東省藝術(shù)科學(xué)重點課題“基于SOA架構(gòu)和多Agent技術(shù)的區(qū)域高校圖書館聯(lián)盟信息服務(wù)體系研究”(2013438)的研究成果。
G250.7
A
10.13897/j.cnki.hbkjty.2017.0014
蔡煒(1970-),女,碩士,青島大學(xué)圖書館副研究館員,研究方向:圖書館學(xué)、文獻學(xué)。
2016-12-03 責(zé)任編輯:張曉霞)