国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于OAI?PMH協(xié)議數(shù)字圖書館中數(shù)據(jù)提供者的研究

2016-05-14 09:17:15周莉
現(xiàn)代電子技術(shù) 2016年9期
關(guān)鍵詞:服務提供者

周莉

摘 要: 針對目前基于OAI?PMH協(xié)議的數(shù)據(jù)提供者只支持DC這一種格式的元數(shù)據(jù)及OAI?PMH協(xié)議中多個數(shù)據(jù)提供者與多個服務提供者之間無法進行元數(shù)據(jù)交互的問題,設計了MARC格式元數(shù)據(jù)到DC格式元數(shù)據(jù)的格式轉(zhuǎn)換器并重新設計了基于OAI?PMH協(xié)議互操作平臺的命令動詞。研究了MARC格式與DC格式的對照關(guān)系、命令動詞的使用方式及請求應答格式,最后給出了格式轉(zhuǎn)換器和命令動詞的實現(xiàn)方法,解決了上述問題。

關(guān)鍵詞: 數(shù)據(jù)提供者; 服務提供者; OAI?PMH; 格式轉(zhuǎn)換器

中圖分類號: TN915.04?34; TM417 文獻標識碼: A 文章編號: 1004?373X(2016)09?0027?04

Abstract: Since the current data provider based on OAI?PMH protocol only supports metadata in DC format, and the metadata interaction between multiple data providers and multiple service providers in OAI?PMH protocol can′t be performed, the format converter from MARC metadata to DC metadata was designed, and the command verbs of interactive operation platform based on OAI?PMH protocol was redesigned. The comparison relation between MARC format and DC format, and usage mode and request response format of the command verbs are studied. The implementation method of format converter and command verbs is given. The above problems were solved.

Keywords: data provider; service provider; OAI?PMH; format converter

隨著網(wǎng)絡、計算機和通信技術(shù)的快速發(fā)展,數(shù)字圖書館已經(jīng)成為人們?nèi)〉眯畔⒌闹匾獊碓?,然而對于網(wǎng)絡上眾多的分布式數(shù)字資源[1?2],人們希望通過檢索獲得所需的信息。但由于早期在建立數(shù)字圖書館時沒有統(tǒng)一的標準,其資源的元數(shù)據(jù)格式并不相同,因而要制定出一套能夠描述不同數(shù)字圖書館資源的統(tǒng)一元數(shù)據(jù)格式相當困難;同時,早期建立的數(shù)字圖書館數(shù)據(jù)提供者與服務提供者間多是點對點的協(xié)議服務,協(xié)議外的數(shù)據(jù)提供者與服務提供者間無法進行元數(shù)據(jù)交互[3?4]。

針對上述問題,設計了數(shù)字圖書館中廣泛使用的元數(shù)據(jù)格式MARC和DC的格式轉(zhuǎn)換器,并重新設計了基于OAI?PMH協(xié)議互操作平臺的命令動詞,對數(shù)字圖書館間資源的共享具有重要意義。

1 OAI?PMH協(xié)議概述

數(shù)據(jù)提供者、服務提供者、注冊服務器構(gòu)成了數(shù)字圖書館領域[5?7]中OAI?PMH協(xié)議的框架。數(shù)據(jù)提供者是框架中存儲大量元數(shù)據(jù)的信息庫,服務提供者可從多個數(shù)據(jù)提供者中提取元數(shù)據(jù)并提供檢索、瀏覽等增值服務,服務提供者對數(shù)據(jù)提供者發(fā)出的是到UDP的請求,也就是基于OAI?PMH的命令動詞,數(shù)據(jù)提供者對服務提供者的請求是通過HTTP協(xié)議以XML的形式響應的,注冊服務器中可以進行數(shù)據(jù)提供者和服務提供者的注冊。其具體框架如圖1所示。

2 MARC到DC格式轉(zhuǎn)換器的設計與實現(xiàn)

目前數(shù)字圖書管中使用的元數(shù)據(jù)格式主要為MARC,而基于OAI?PMH協(xié)議的數(shù)據(jù)提供者只能支持DC格式的元數(shù)據(jù)[8]。所以要實現(xiàn)基于OAI?PMH協(xié)議的元數(shù)據(jù)互操作平臺,就需要把MARC格式的元數(shù)據(jù)轉(zhuǎn)換為DC格式的元數(shù)據(jù)。

2.1 MARC與DC格式的域?qū)φ贞P(guān)系

DC格式包含的元素描述共有15個,按照其描述內(nèi)容的范圍和類別可分為三組,具體如表1所示。

本系統(tǒng)提供了一個項批輸入接口,所以設計的MarcDc模塊應在項批輸入者之前進行處理。如果輸入的是MARC格式,則先經(jīng)過MarcDc格式轉(zhuǎn)換器進行數(shù)據(jù)轉(zhuǎn)換,然后通過項批處理模塊進行處理;如果輸入的就是DC格式,則直接應用項批處理模塊進行處理。

3 OAI?PMH互操作平臺的實現(xiàn)

3.1 基于OAI?PMH協(xié)議的命令動詞分析

基于OAI?PMH協(xié)議的數(shù)字圖書館中,為實現(xiàn)多個數(shù)據(jù)提供者與服務提供者間之間的元數(shù)據(jù)交互,重新設計了基于OAI?PMH協(xié)議互操作平臺的命令動詞,命令動詞的主要功能如下:

(1) GetRecord:此動詞可從倉儲中搜索元數(shù)據(jù)記錄。如果從倉儲中和指定的項中無法得到由metadataPrefix指定的元數(shù)據(jù)格式,其可以返回狀態(tài)屬性的頭部信息值為“刪除”,此功能的實現(xiàn)依賴于倉儲所跟蹤的刪除級別;

(2) Identify:此動詞用于檢索倉儲的有關(guān)信息。利用此動詞,倉儲也可以返回余下的描述性信息,在返回的信息中,一部分對于基于OAI?PMH協(xié)議的互操作平臺是需要的;

(3) ListIdentifiers:此動詞不返回記錄本身,而僅返回頭部的記錄,通過基于集合成員和時間戳的頭部可獲取選擇的參數(shù)?;趥}儲對刪除的支持特性,如過請求中刪除了與指定參數(shù)匹配的記錄,則返回的記錄中將含有值為“刪除”的狀態(tài)屬性;

(4) ListMetadataFormats:此動詞可從倉儲中檢索獲得所需的元數(shù)據(jù)格式,同時可以通過參數(shù)限制該請求對指定項元數(shù)據(jù)格式的獲??;

(5) ListRecords:此動詞用于從倉儲中獲取記錄?;趥}儲對刪除的支持特性,如果刪除了請求中與參數(shù)匹配的記錄,則返回的記錄中將含有值為“刪除”的狀態(tài)屬性,但返回有“刪除”狀態(tài)的記錄是不能被表達為元數(shù)據(jù)格式的;

(6) ListSets:此動詞用于返回倉儲的集合結(jié)構(gòu),對于選擇性獲取有益。

3.2 數(shù)據(jù)提供者與服務提供者間命令動詞使用方式分析

數(shù)據(jù)提供者與數(shù)據(jù)服務者之間的請求和應答是通過上述六個核心動詞來實現(xiàn)的。使用標準的Web服務器是一個典型請求的實現(xiàn)方式,通過配置該Web服務器,使其可以向能夠處理OAI?PMH請求的軟件分發(fā)OAI?PMH請求,具體交互過程如圖5所示。

數(shù)據(jù)提供者與數(shù)據(jù)服務者之間的交互步驟具體如下:

(1) 服務提供者首先找到其所需元數(shù)據(jù)的數(shù)據(jù)提供者,然后獲取其惟一標識;

(2) 服務提供者向數(shù)據(jù)提供者發(fā)出ListSets請求和ListMetaFormats請求。數(shù)據(jù)提供者根據(jù)服務提供者的請求返回其所能提供的滿足一定條件(如某種格式,某種主題,某個時間段)的元數(shù)據(jù);服務提供者取得元數(shù)據(jù)后向用戶提供服務。

3.3 OAI?PMH命令動詞的請求和應答格式分析

(1) 請求格式

3.4 OAI六個動詞的設計

(1) 概要設計

當數(shù)據(jù)提供者接收到OAI請求后,需對該請求進行解析。首先判斷該請求類型是否合法,若不合法,則向服務提供者發(fā)送一個錯誤的信息;若合法,則判斷該請求屬于六個有效請求的哪個類型。由于參數(shù)metadataPrifix對于請求類型 ListIdentifiers是強制的,所以如果數(shù)據(jù)提供者接收到的請求類型是ListIdentifiers,那么解析器可以直接檢查這個請求的第二個參數(shù)。但如果請求中沒有相關(guān)參數(shù),那么要確認這個請求有效,則需確認請求中必須包含resumptionToken (恢復標志參數(shù)),并且數(shù)據(jù)提供者知道這個參數(shù)。

假設數(shù)據(jù)提供者在unqualified DC模式下只能發(fā)送元數(shù)據(jù)集合,那么metadataPrifix參數(shù)惟一有效的值只能是oai_dc。在正常情況下,請求中可選取的參數(shù)是必須被解析的,但可以簡單化,以一種非正式的形式進行描述。然后,根據(jù)接收到的請求參數(shù),數(shù)據(jù)提供者運用SQL語句在倉儲中進行查詢,如果產(chǎn)生了記錄大于傳遞標識符一次所能傳遞的最大值,那么數(shù)據(jù)提供者則會新生成一個resumptionToken標志,并將查詢參數(shù)與指針信息存儲在一起,具體實現(xiàn)流程如圖6所示。

(2) 詳細設計

① 利用Protocol數(shù)據(jù)庫包進行六個動詞的請求、響應及信息顯示,其中Date類使用java.util.Date,Calendar或String方法實現(xiàn)年、月、日等各種格式間的相互轉(zhuǎn)換和輸出;Set類可通過一個已命名的集合創(chuàng)建一個新的集合,并用XML形式描述。

② 處理客戶端源代碼Client,可以利用一個URL或一個集合的性質(zhì)創(chuàng)建HarvesterItinerary類用于描述harvester類的狀態(tài),HarvesterItinerary類中可以對Harvester類的狀態(tài)進行保存。OAIConnection類可以描述一個到OAI的連接,用于接收單一的請求,該連接是基于用doReques或基于倉儲的URL所返回的Response。

③ 互操作平臺中的Server包可以提供服務器端的OAI源代碼,并把源代碼轉(zhuǎn)換為文檔服務。OAI服務的目標編程接口通過Target類實現(xiàn),互操作平臺通過TargetAdapter類定義了一個不做任何事的執(zhí)行,GenericTarget類可以實現(xiàn)由一個非常簡單的機制以創(chuàng)建小型的OAI收集器,并在存儲器中尋找與服務,利用集合規(guī)程和給定的元數(shù)據(jù)前綴得到所有的記錄; JDBCServer類是OAI servlet提供的一般服務器,OAIServerIfc類為OAI提供了一個框架,元數(shù)據(jù)前綴用在DC元數(shù)據(jù)核心記錄,處理GetRecord 請求、Identify 請求、ListRecords請求、 ListSets請求、ListMetadataFormats請求和ListIdentifiers請求。ResumableResultSet類描述了一個結(jié)果,該結(jié)果通過與重用標記相結(jié)合,可以被客戶作為一系列局部結(jié)果而重用。

3.5 數(shù)據(jù)提供者的功能實現(xiàn)

(1) 項的訂購及提交

用戶可以使用e?mail訂購自己所需的項,這樣可以共享數(shù)字圖書館的資源。用戶首先提交項的要素描述元數(shù)據(jù),然后上傳源文件,在通過系統(tǒng)的驗證后可把文件提交到互操作平臺上供大家瀏覽及下載。

(2) 工作流的實現(xiàn)

三個小組負責人負責實現(xiàn)社團的工作流,每個小組負責人完成不同的工作流步驟。工作流的次序如下:當社團收到一個遞呈時,如果社團中有小組負責人,那么他將會選擇接受或拒絕,如果社團中沒有小組負責人,這一步工作流將會被直接省略。第二步和第三步的遞呈也是按照此步驟處理。

當調(diào)用工作流的第一步時,完成工作流步驟的任務把相關(guān)的遞呈放到“任務箱”中,如果組中的一個成員接受任務箱中的任務,則任務被從任務箱中移出。如果一個遞呈被拒絕,則系統(tǒng)會通過e?mail把原因發(fā)送給遞呈提交者,提交者可以修改后重新提交;如果一個遞呈被“接受”,將轉(zhuǎn)到工作流的下一步。

(3) 搜索和瀏覽功能實現(xiàn)

終端用戶可以使用多種方法發(fā)現(xiàn)內(nèi)容,具體如下:使用關(guān)鍵字進行搜索;使用外部的ID號進行搜索;使用標題、數(shù)據(jù)進行瀏覽。

在數(shù)字圖書館系統(tǒng)中,發(fā)現(xiàn)內(nèi)容最基本的方法是搜索。基于OAI?PMH協(xié)議的互操作平臺的搜索和索引模塊是一個簡單的API接口,它能夠在全部的社區(qū)、社團中完成新內(nèi)容的索引、再生索引,系統(tǒng)的具體搜索界面如圖7所示。

4 結(jié) 論

本文設計了MARC格式到DC格式的格式轉(zhuǎn)換器及基于OAI?PMH協(xié)議互操作平臺的命令動詞,解決了數(shù)字圖書館中數(shù)據(jù)提供者與服務提供者間的元數(shù)據(jù)交互問題。給出了不同格式間的對照關(guān)系及格式轉(zhuǎn)換器的實現(xiàn)方法,同時完成了命令動詞的實現(xiàn)代碼,對推動OAI?PMH協(xié)議在數(shù)字圖書館領域的應用具有重要意義。

參考文獻

[1] NELSON M L, SOMPEL H V D, WARNER S. Advanced overview of version 2.0 of the open archives initiative protocol for metadata harvesting [C]// Proceedings of 2002 ACM/IEEE Joint Conference on Digtal Labraries. [S.l.]: ACM, 2002: 418.

[2] WARNER S, NELSON M, LAGOZE C. The open archives initiative protocol for metadata harvesting [EB/OL]. [2002?09?11]. http://www.openarchives.org/oai.

[3] 謝莉莉,林春梅,陳家訓.基于XML的數(shù)據(jù)交換中心模型研究[J].東華大學學報(自然科學版),2001(6):33?36.

[4] 王海波,耿暉,姜吉發(fā),等.基于XML的數(shù)據(jù)交換的實現(xiàn)[J].計算機應用,2001(4):67?68.

[5] 王愛華,張銘,楊冬青,等.基于OAI的數(shù)字圖書館中元數(shù)據(jù)互操作框架[J].計算機工程與應用,2002(1):5?7.

[6] 張詠.XML及其在圖書館和情報檢索中的應用[J].現(xiàn)代圖書情報技術(shù),2001(2):30?34.

[7] 施芝元,劉杰群,粟欣,等.基于XML技術(shù)資源組件庫的管理及調(diào)度研究[J].現(xiàn)代電子技術(shù),2013,36(3):115?118.

[8] WATERS D J. The metadata harvesting initiative of the Mellon Foundation ARL bimonthly report [R]. US: Mellon Foundation, 2001.

猜你喜歡
服務提供者
“紅旗規(guī)則”視域下網(wǎng)絡服務提供者版權(quán)保護法定注意義務認定研究*
網(wǎng)絡服務提供者的侵權(quán)責任研究
法制博覽(2020年11期)2020-11-30 03:36:52
網(wǎng)絡服務提供者的侵權(quán)責任研究
法制博覽(2020年4期)2020-07-05 03:17:32
網(wǎng)絡服務提供者侵權(quán)在合同法視角下的責任分析
關(guān)于網(wǎng)絡服務提供者侵權(quán)連帶責任的反思與重構(gòu)
法制博覽(2019年36期)2019-12-14 06:00:45
網(wǎng)絡服務提供者“應知規(guī)則”的再厘定及適用探討
網(wǎng)絡服務提供者不作為的刑事可罰性根據(jù)檢視
論網(wǎng)絡服務提供者刑事責任的歸責模式一一以拒不履行網(wǎng)絡安全管理義務罪為切入點
論網(wǎng)絡服務提供者的侵權(quán)責任
法制博覽(2017年16期)2017-01-28 00:01:59
網(wǎng)絡服務提供者第三方責任的立法審視
湖湘論壇(2015年4期)2015-12-01 09:30:16
霍林郭勒市| 巴东县| 阳曲县| 原平市| 千阳县| 石城县| 永靖县| 南阳市| 江达县| 阿拉善左旗| 保德县| 安化县| 盈江县| 木里| 高青县| 东安县| 宜城市| 上饶市| 南充市| 古浪县| 锡林浩特市| 岳阳市| 花垣县| 明光市| 巴彦淖尔市| 搜索| 荣昌县| 安乡县| 通辽市| 陆河县| 津南区| 武宁县| 海淀区| 宁德市| 新田县| 镇巴县| 宁蒗| 法库县| 丰县| 丽水市| 长垣县|