国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于網(wǎng)格的數(shù)字圖書館知識服務(wù)平臺的設(shè)計

2010-09-12 01:01:22甘文麗諶章義伍臨莉
重慶高教研究 2010年2期
關(guān)鍵詞:知識庫服務(wù)平臺網(wǎng)格

甘文麗,諶章義,伍臨莉

(洛陽師范學(xué)院 信息技術(shù)學(xué)院,河南 洛陽 471022)

目前,在數(shù)字圖書館發(fā)展戰(zhàn)略中,人們都是基于 Internet/Web來構(gòu)建數(shù)字圖書館體系.但是由于 Internet/Web具有資源較為分散、缺乏統(tǒng)一管理等先天不足,使得信息資源體系和信息服務(wù)體系的建立變得十分困難并且效率不高.而從用戶的需求來看,人們總是希望數(shù)字圖書館系統(tǒng)能靈活地處理信息和提煉知識.因此,構(gòu)建知識服務(wù)平臺,為用戶提供全面的、專業(yè)化和個性化的知識服務(wù)成為現(xiàn)代數(shù)字圖書館的必然選擇.要實現(xiàn)這些功能,現(xiàn)有的 Web技術(shù)就顯得無能為力,而網(wǎng)格為我們實現(xiàn)這一目標(biāo)提供了物質(zhì)基礎(chǔ).

網(wǎng)格(Grid)是近年來興起的新的研究領(lǐng)域,被譽為繼 Internet和 Web之后的第三次信息技術(shù)浪潮.它利用互聯(lián)網(wǎng)把地理上廣泛分布的各種資源(包括計算資源、存儲資源、帶寬資源、軟件資源、信息資源等)連成一個邏輯整體,不僅實現(xiàn)了對各種資源的訪問,而且實現(xiàn)了對所有數(shù)據(jù)資源的統(tǒng)一訪問[1].網(wǎng)格技術(shù)的初期主要集中在高性能科學(xué)計算領(lǐng)域,重提升計算能力,并不關(guān)心資源的語義,故不能有效地管理知識.隨著計算網(wǎng)格發(fā)展為面向服務(wù)的網(wǎng)格,如何有效地獲取和發(fā)現(xiàn)知識資源成為網(wǎng)格技術(shù)應(yīng)用的關(guān)鍵問題[2].知識網(wǎng)格具有高性能、一體化、知識生產(chǎn)、資源共享、異地協(xié)同工作、支持開放標(biāo)準(zhǔn)、功能動態(tài)變化等優(yōu)點,為數(shù)字圖書館開展知識服務(wù)提供了有利的條件.

1 基于網(wǎng)格的數(shù)字圖書館知識服務(wù)平臺構(gòu)建

1.1 框架設(shè)計

為了實現(xiàn)網(wǎng)格環(huán)境下數(shù)字圖書館的知識服務(wù),在分析數(shù)字圖書館知識服務(wù)模式的基礎(chǔ)上,設(shè)計了一種如圖1所示的集成的數(shù)字圖書館知識服務(wù)平臺框架.這個平臺總體結(jié)構(gòu)由操作層、知識庫和服務(wù)層組成.

操作層主要是對圖書館收藏的各種載體的文獻(xiàn)資源、互聯(lián)網(wǎng)資源和引進(jìn)的商業(yè)數(shù)據(jù)庫資源等通過業(yè)務(wù)自動化系統(tǒng)和知識發(fā)現(xiàn)、智能代理、知識庫等技術(shù)進(jìn)行搜集、組織、綜合和開發(fā).知識庫由書目數(shù)據(jù)庫、自建數(shù)字資源庫、免費網(wǎng)絡(luò)資源庫、專業(yè)導(dǎo)航庫等構(gòu)成,是對用戶開展服務(wù)的基礎(chǔ).服務(wù)層是知識服務(wù)平臺的核心,包括異構(gòu)數(shù)據(jù)統(tǒng)一檢索系統(tǒng)、數(shù)字參考咨詢系統(tǒng)、個性化服務(wù)系統(tǒng).

用戶可以通過異構(gòu)數(shù)據(jù)統(tǒng)一檢索系統(tǒng),實現(xiàn)對傳統(tǒng)圖書館館藏目錄、聯(lián)合目錄、自建數(shù)據(jù)庫、外購數(shù)據(jù)庫、網(wǎng)絡(luò)資源等一站式的檢索.從知識轉(zhuǎn)化的角度,檢索服務(wù)實現(xiàn)了知識的內(nèi)化和融合,即用戶將所獲取的文獻(xiàn)資源(也就是顯性知識)進(jìn)行分析、研究轉(zhuǎn)化為自身的隱性知識.專業(yè)化服務(wù)可以為用戶提供質(zhì)量更高、速度更快的專業(yè)咨詢服務(wù),體現(xiàn)了知識的外化.個性化服務(wù)主要是針對用戶個人特定的需求進(jìn)行知識的定制和推送服務(wù).通過這些功能模塊,以資源層數(shù)據(jù)庫為依托,便可實現(xiàn)信息和知識的有效共享與服務(wù)的智能化.

圖1 數(shù)字圖書館知識服務(wù)平臺框架

1.2 關(guān)鍵技術(shù)

基于網(wǎng)格的數(shù)字圖書館知識服務(wù)平臺是以知識網(wǎng)格提供的基礎(chǔ)設(shè)施框架來實現(xiàn)數(shù)字圖書館的信息服務(wù)與知識服務(wù)功能的,其核心的關(guān)鍵技術(shù)是對信息與知識的描述、存儲及推理和表達(dá),即元數(shù)據(jù)目錄設(shè)計,資源存儲與代理,知識獲取.

1.2.1 元數(shù)據(jù)目錄的設(shè)計

設(shè)計合理、高效、能互操作的元數(shù)據(jù)目錄是利用網(wǎng)格實現(xiàn)信息集成和知識集成的基礎(chǔ).元數(shù)據(jù)專門用來描述數(shù)據(jù)的特征和屬性,支持電子資源的定位、發(fā)現(xiàn)、評估、選擇等,具有互操作性、可擴展性、獨立句法結(jié)構(gòu)、可重復(fù)性、可修改性和查尋功能[3].因此,將各種資源與服務(wù)以元數(shù)據(jù)目錄進(jìn)行展示.元數(shù)據(jù)目錄包括元數(shù)據(jù)的命名、發(fā)布與訪問,并為用戶提供統(tǒng)一的訪問接口.可擴展標(biāo)記語言 XML能夠表達(dá)網(wǎng)絡(luò)上各種信息,它不僅可以表達(dá)元數(shù)據(jù),而且可以提示數(shù)據(jù)的內(nèi)容,為信息的整理、存儲、交換、檢索提供了有效途徑.采用 XML來表示應(yīng)用元數(shù)據(jù),不僅能適應(yīng)網(wǎng)格的可擴展性,同時能支持大規(guī)模組織中的各種信息源.各應(yīng)用領(lǐng)域的專家對各自領(lǐng)域的元數(shù)據(jù)進(jìn)行了詳細(xì)的規(guī)定,并采用 XML語言對應(yīng)用元數(shù)據(jù)進(jìn)行描述,這樣不僅可以按照學(xué)科和主題對信息內(nèi)容進(jìn)行準(zhǔn)確描述,保留早期網(wǎng)絡(luò)發(fā)展的個性化特色,而且實現(xiàn)了信息內(nèi)容描述的互理解和互操作.

1.2.2 資源的存儲與代理

數(shù)字圖書館的資源是在廣域范圍內(nèi)分布于異構(gòu)存儲設(shè)備上的各種信息與服務(wù).為提高資源的訪問效率必須在整個網(wǎng)格范圍內(nèi)存儲多個副本,從而實現(xiàn)資源的就近訪問.網(wǎng)格上各個節(jié)點的資源存儲可采用適合自己體系結(jié)構(gòu)的方式,同時也應(yīng)為其它節(jié)點的資源進(jìn)行代理管理.代理管理利用元數(shù)據(jù)目錄為用戶提供統(tǒng)一的訪問接口和數(shù)據(jù)視圖.用戶利用應(yīng)用程序接口(API)進(jìn)行數(shù)據(jù)訪問,而代理主體利用元數(shù)據(jù)目錄中的信息進(jìn)行協(xié)議轉(zhuǎn)換,并將轉(zhuǎn)換后的協(xié)議請求分發(fā)到不同的存儲體系,從而實現(xiàn)對分布異構(gòu)數(shù)據(jù)資源的統(tǒng)一訪問.利用智能 Agent技術(shù),設(shè)計相應(yīng)的Agent以實現(xiàn)資源存儲與代理的智能化處理.根據(jù)需要可設(shè)計如下 Agent:數(shù)據(jù)副本 Agent、數(shù)據(jù)移動 Agent、數(shù)據(jù)訪問 Agent和數(shù)據(jù)定位 Agent.數(shù)據(jù)副本 Agent主要負(fù)責(zé)數(shù)據(jù)副本的管理,維護(hù)數(shù)據(jù)資源與副本映像間的一致性;數(shù)據(jù)移動 A-gent主要管理不同存儲器上的資源的移動;數(shù)據(jù)訪問 Agent實現(xiàn)具體的存儲調(diào)用以及和其它存儲資源的代理聯(lián)系,實現(xiàn)數(shù)據(jù)訪問;數(shù)據(jù)定位 A-gent通過元數(shù)據(jù)目錄獲取有關(guān)信息,進(jìn)而實現(xiàn)數(shù)據(jù)定位.利用存儲和代理可以減少網(wǎng)格信息流量,使信息的查詢就地進(jìn)行,體現(xiàn)了整個系統(tǒng)在運行過程中的統(tǒng)一邏輯視圖.采用基于 SOAP(Simple Object Access Protocol)的通信機制來實現(xiàn) Agent之間的互操作,SOAP是一種跨平臺的協(xié)議標(biāo)準(zhǔn),它通過與 XML相結(jié)合,能夠?qū)崿F(xiàn)異構(gòu)平臺間的對象調(diào)用和通信[4].

1.2.3 知識獲取

要實現(xiàn)數(shù)字圖書館的知識服務(wù)必須把分布異構(gòu)的信息資源轉(zhuǎn)換為相應(yīng)的知識.要實現(xiàn)知識服務(wù)過程,數(shù)字圖書館首先要能發(fā)現(xiàn)知識,其次要有對發(fā)現(xiàn)知識進(jìn)一步求精的能力,再把這些知識存入到知識庫中供用戶檢索與查詢.在知識發(fā)現(xiàn)過程中,目前一般的處理方式是以領(lǐng)域本體知識為基礎(chǔ)來進(jìn)行的[5-7].對于規(guī)范文檔,系統(tǒng)直接從給定本體中提取 XML文檔類型定義.對半結(jié)構(gòu)文檔,采用數(shù)據(jù)挖掘和知識發(fā)現(xiàn)的方法,將文檔的規(guī)律與相應(yīng)的本體含義進(jìn)行匹配,并直接封裝到系統(tǒng)的知識庫中,發(fā)現(xiàn)的知識在經(jīng)過評價過濾后添加到知識庫中,然后再對知識庫中的知識進(jìn)一步求精,發(fā)現(xiàn)知識庫的知識缺陷,如知識的短缺、冗余和不一致,并試圖進(jìn)行修改和完善.經(jīng)過上述的知識發(fā)現(xiàn)與知識求精處理后,相應(yīng)的信息資源體系就以知識化的形式進(jìn)行儲存,對用戶需求的滿足就不再僅是信息,而是提供對決策有價值的知識.

2 系統(tǒng)實現(xiàn)

數(shù)字圖書館知識服務(wù)平臺要為用戶提供Web訪問方式的界面,使用戶能夠通過 SSL安全地訪問網(wǎng)格資源、使用網(wǎng)格服務(wù)、運行應(yīng)用程序,通過中間件技術(shù)提供到底層網(wǎng)格中各種資源和服務(wù)的連接,實現(xiàn)對網(wǎng)格服務(wù)和網(wǎng)格資源的使用[8].網(wǎng)格門戶是連接網(wǎng)格和用戶的橋梁,它的工作流程是:1)用戶使用瀏覽器程序訪問網(wǎng)格門戶,成功登錄后使用 Web GUI提供的功能訪問網(wǎng)格服務(wù);2)網(wǎng)格門戶接收用戶的 Web請求后,對請求進(jìn)行內(nèi)部處理,轉(zhuǎn)換成網(wǎng)格的 I/O操作.網(wǎng)格門戶集成的網(wǎng)格服務(wù)訪問接口向相應(yīng)的網(wǎng)格資源提交網(wǎng)格 I/O操作,并接收網(wǎng)格資源的執(zhí)行結(jié)果;3)返回的原始數(shù)據(jù)在網(wǎng)格門戶中進(jìn)行處理,以用戶易于理解的 HTML格式返回給用戶瀏覽器.目前,常用的基于 Globus網(wǎng)格的 Portal開發(fā)工具有 SDSC(San Diedo Supercomputing Center)開發(fā)的 Grid Portal Toolkit和 Lawrence Berkeley National Lab開發(fā)的 GPDK(Grid Portal Development Toolkit).我們的設(shè)計采用 GPDK作為網(wǎng)格門戶開發(fā)工具.GPDK使用 JSP和 Java Servlet技術(shù),以 JavaBean的形式提供了一系列核心組件來訪問網(wǎng)格服務(wù).在構(gòu)建數(shù)字圖書館知識服務(wù)平臺時,使用 GPDK能大大加速網(wǎng)格門戶的設(shè)計.網(wǎng)格環(huán)境下數(shù)字圖書館的知識服務(wù)平臺系統(tǒng)在邏輯上采用典型的 3層模型(如圖2所示).

其中,客戶端瀏覽器通過 HTTP協(xié)議訪問Web服務(wù)器.為了傳輸?shù)陌踩?瀏覽器需要支持SSL.Web服務(wù)器主要處理來自客戶端的 HTTP請求,并能訪問 Globus Toolkit提供的網(wǎng)格服務(wù).網(wǎng)格服務(wù)平臺提供數(shù)據(jù)存儲資源、計算資源和信息服務(wù).LDAP服務(wù)器存儲用于訪問、管理或配置資源的特殊數(shù)據(jù)庫,用對象技術(shù)和層次方式表現(xiàn)系統(tǒng)的各種資源,支持資源信息的分布存儲和備份,為訪問動態(tài)分布和多樣性的各種信息資源提供了統(tǒng)一的訪問機制.Myproxy服務(wù)器的功能在于維護(hù)用戶的證書和代理,可以將用戶從Myproxy服務(wù)器得到的代理證書存儲在門戶數(shù)據(jù)庫,在代理證書未過期的期限內(nèi),用戶可以直接從數(shù)據(jù)庫中讀取代理訪問網(wǎng)格資源,避免了用戶對 Myproxy服務(wù)器的頻繁訪問.

圖2 系統(tǒng)實現(xiàn)架構(gòu)

3 結(jié)語

數(shù)字圖書館的發(fā)展以智能化和知識化作為主要的發(fā)展動力和方向,本文構(gòu)建了網(wǎng)格環(huán)境下數(shù)字圖書館的知識服務(wù)平臺,通過用戶、管理員和系統(tǒng)軟件的協(xié)調(diào)作用可將零散的原始資源組織成一體化的信息和知識體系,有利于促進(jìn)數(shù)字圖書館信息服務(wù)向知識服務(wù)的轉(zhuǎn)變,實現(xiàn)知識產(chǎn)生、傳播和利用的總體最優(yōu)化.

[1]林偉偉,齊德昱,李擁軍.基于網(wǎng)格的分布式異構(gòu)數(shù)據(jù)集成模型[J].計算機工程,2006,32(24):48-50.

[2]魏定國,彭宏.基于知識網(wǎng)格的數(shù)據(jù)挖掘[J].計算機科學(xué),2006,33(6):210-213.

[3]趙宏偉,宋寶燕,邵一川.網(wǎng)格環(huán)境下一種高效的元數(shù)據(jù)管理策略[J].廣西師范大學(xué)學(xué)報:自然科學(xué)版,2007,25(4):156-159.

[4]張奇勇,王東.基于 XML及 SOAP的信息交換平臺研究[J].計算機應(yīng)用與軟件,2007,24(10):39-41.

[5]黃屹,顧進(jìn)廣,陳莘萌,等.網(wǎng)格環(huán)境下基于本體的知識庫模型研究[J].武漢大學(xué)學(xué)報:理學(xué)版 ,2005,51(5):603-608.

[6]胡艷麗,白亮,張維明,等.知識網(wǎng)格中基于領(lǐng)域本體的智能檢索[J].計算機科學(xué),2007,34(8):202-207.

[7]李玉華,盧正鼎,廖振松.基于本體的通用知識網(wǎng)格架構(gòu)研究[J].華中科技大學(xué)學(xué)報:自然科學(xué)版,2006,34(3):21-24.

[8]唐蕾,楊志義,周興社,等.基于網(wǎng)格的多機群資源中間件的設(shè)計與實現(xiàn)[J].計算機工程,2008,34(9):89-92.

猜你喜歡
知識庫服務(wù)平臺網(wǎng)格
密碼服務(wù)平臺
用全等三角形破解網(wǎng)格題
打造一體化汽車服務(wù)平臺
論基于云的電子政務(wù)服務(wù)平臺構(gòu)建
反射的橢圓隨機偏微分方程的網(wǎng)格逼近
基于TRIZ與知識庫的創(chuàng)新模型構(gòu)建及在注塑機設(shè)計中的應(yīng)用
基于云計算的民航公共信息服務(wù)平臺
重疊網(wǎng)格裝配中的一種改進(jìn)ADT搜索方法
高速公路信息系統(tǒng)維護(hù)知識庫的建立和應(yīng)用
基于曲面展開的自由曲面網(wǎng)格劃分
贺州市| 宣城市| 于田县| 亚东县| 黑龙江省| 修水县| 新疆| 建水县| 乐亭县| 丰城市| 正定县| 修武县| 桓仁| 吴忠市| 佳木斯市| 和平县| 兴仁县| 临高县| 白银市| 仲巴县| 剑河县| 白玉县| 古蔺县| 临高县| 南丹县| 集安市| 泊头市| 治多县| 西安市| 孝感市| 唐山市| 岑溪市| 于田县| 黎城县| 揭东县| 屏东市| 突泉县| 准格尔旗| 安平县| 三门县| 马鞍山市|