国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

語義聯(lián)合目錄:基于BIBFRAME 2.0的聯(lián)合目錄建構

2017-05-27 19:37:18林澤斐
知識管理論壇 2016年6期

摘要:[目的/意義]隨著以BIBFRAME為代表的語義書目模型不斷完善,書目數(shù)據(jù)面臨著從MARC向語義化書目的轉型。本文探索了基于語義化書目數(shù)據(jù)的聯(lián)合目錄構建模式。[方法/過程]首先分析傳統(tǒng)聯(lián)合目錄的建設模式,認為傳統(tǒng)聯(lián)合目錄建構方法在語義網(wǎng)環(huán)境下有一定借鑒意義;其次在分析BIBFRAME 2.0書目信息表示形式的基礎上,提出3種語義聯(lián)合目錄構建模式:集中式語義聯(lián)合目錄、分布式語義聯(lián)合目錄和集中與分布相結合的語義聯(lián)合目錄;最后利用Jena Fuseki+Apache HTTP服務器搭建實驗平臺,對語義聯(lián)合目錄的互操作模式進行測試。[結果/結論]實驗結果顯示,本研究提出的3種語義聯(lián)合目錄建設方法在實踐上具有可行性,可為圖書情報部門的語義化書目數(shù)據(jù)互操作和跨庫檢索系統(tǒng)的實現(xiàn)提供有益參考。

關鍵詞:聯(lián)合目錄 BIBFRAME 語義網(wǎng) 關聯(lián)數(shù)據(jù)

分類號:G257.22

引用格式:林澤斐. 語義聯(lián)合目錄:基于BIBFRAME 2.0的聯(lián)合目錄建構[J/OL]. 知識管理論壇, 2016, 1(6): 440-448[引用日期]. http://www.kmf.ac.cn/p/1/77/.

自1966年美國國會圖書館制定機讀目錄規(guī)范以來,MARC已成為書目數(shù)據(jù)的主流交換格式,同時也是當前聯(lián)合目錄構建的基石。盡管MARC在圖書情報領域得到了廣泛應用,但學術界長期存在著對MARC的批評,如L. Andresen認為MARC缺乏靈活性,導致對資源的附加描述成為本地系統(tǒng)和聯(lián)機系統(tǒng)交流的障礙[1];G. Alemu等認為MARC在設計之初是面向文獻的,這使得MARC難以描述非文獻實體之間的關系[2];R. Tennant在著名的MARC Must Die一文中則指出MARC的使用囿于圖書館領域,且MARC數(shù)據(jù)過于平面化,難以表達實體間的等級關系[3]。

在近20年時間里,美國國會圖書館、OCLC等組織對MARC進行了諸多改進,發(fā)展出MARC21、MARCXML等格式;在RDA發(fā)布后,圖書館界也迅速對MARC21中的相關字段進行了增補和修改,以便與RDA保持一致。然而從整體上看,MARC以文檔為中心的設計思想已成為自身發(fā)展的禁錮,簡單地將MARC字段映射為XML也并無法充分揭示文獻所涉及的實體與關系。針對MARC存在的缺陷,圖書館界開始探索利用關聯(lián)數(shù)據(jù)進行書目元數(shù)據(jù)的描述,試圖建立更加開放、有足夠伸縮性,且能夠溶入語義網(wǎng)環(huán)境的文獻數(shù)據(jù)交換標準。以BIBFRAME(Bibliographic Framework)為代表的語義書目模型,正是圖書館界在替代MARC道路上邁出的重要一步。雖然BIBFRAME仍在完善過程中,但鑒于國會圖書館在書目數(shù)據(jù)領域的影響力,BIBFRAME將不可避免地對未來的聯(lián)合目錄構建形式產(chǎn)生重要影響。

1 BIBFRAME及其研究概況

BIBFRAME即書目框架,是美國國會圖書館聯(lián)合以語義網(wǎng)技術見長的數(shù)據(jù)服務公司Zepheira共同研發(fā)的書目數(shù)據(jù)模型,旨在使用關聯(lián)數(shù)據(jù)對書目數(shù)據(jù)進行描述,從而實現(xiàn)對MARC的替代。國會圖書館于2012年底發(fā)布了BIBFRAME草案,并于2014年公布了BIBFRAME正式版本。BIBFRAME正式發(fā)布后,國會圖書館根據(jù)BIBFRAME應用過程中的反饋,于2016年4月發(fā)布了經(jīng)修改后的BIBFRAME 2.0模型和詞匯表。

在BIBFRAME 1.0模型中,包括子類和子屬性在內(nèi),共包含53個類及289個屬性[4],其中Work、Instance、Authority和Annotation四個類為BIBFRAME的核心類:作品(Work)用于反映作品的概念實質;實例(Instance)反映了作品的物理載體表現(xiàn)形式,一個作品可以有多個對應的實例,但一個實例只有一個對應的作品;規(guī)范(Authority)實現(xiàn)了與作品和實例相關的人物、組織、事件、主題的規(guī)范控制;注釋(Annotation)則提供有關作品和實例相關的描述信息(如封面、描述、評論、館藏等)。

BIBFRAME 2.0對BIBFRAME 1.0的體系結構進行了優(yōu)化。包括子類和子屬性在內(nèi),BIBFRAME 2.0共設置了140個類及165個屬性[5]。BIBFRAME 2.0中屬性減少而類增加的主要原因在于:BIBFRAME 1.0中,對于一種資源的多種類型,使用多個屬性來表示,如表示不同類型Identifiers(標識符)的屬性包括bf:isbn、bf:issn、bf:lccn等;而在BIBFRAME 2.0中,相關標識符均使用bf:identifiedBy屬性表示,標識符的類型則反映為bf:Isbn、bf:Issn、bf:Lccn等多個類。

BIBFRAME 2.0的另一重要變化是將4個核心類簡化為3個:Work、Instance和Item。其中Work、Instance類的含義與1.0版相同;Item(館藏項)類代表一個實例的館藏復本(可以為實體館藏或電子館藏),并反映了諸如館藏位置、條碼號、索書號等與館藏復本相關的信息,其內(nèi)涵與BIBFRAME 1.0中Annotation類的Helditem子類相似。圖1是采用RDF/Turtle格式進行形式化表述的BIBFRAME 2.0館藏書目數(shù)據(jù)片段。該數(shù)據(jù)包含一個作品(bf:Work)、一個作品的實例(bf:Instance)和該實例的館藏項(bf:Item),并分別定義了題名(bf:title)、作者(bf:contributor)、ISBN號(bf:Isbn)、所在圖書館(bf:heldBy)和條碼號(bf:Barcode)等數(shù)據(jù)項。

BIBFRAME出現(xiàn)后,部分國外機構和學者開展了相關試驗與研究。截至2016年4月,共有7個機構(美國國會圖書館、不列顛圖書館、德國國家圖書館、普林斯頓大學圖書館、喬治·華盛頓大學圖書館、美國國家醫(yī)學圖書館、OCLC)在BIBFRAME項目平臺中發(fā)布了書目測試數(shù)據(jù)集[6]。歐洲數(shù)字圖書館(Europeana)項目的研究人員探索了歐洲數(shù)據(jù)模型(Europeana Data Model,EDM)與BIBFRAME的映射關系[7]??的螤柎髮W圖書館、哈佛大學圖書館和斯坦福大學圖書館的合作項目Linked Data for Libraries(LD4L)則試圖通過整合包括BIBFRAME、VIVO、VIAF和ISNI在內(nèi)的關聯(lián)數(shù)據(jù)集,創(chuàng)建一個面向學術資源的語義信息存儲模型[8]。

我國圖書館學界對BIBFRAME的研究始于2014年。劉煒、夏翠娟率先撰文對BIBFRAME的體系結構、特性和應用領域進行了探討[9]。筆者通過對中文數(shù)據(jù)庫進行檢索發(fā)現(xiàn),截至2016年4月,我國針對BIBFRAME的學術論文共有11篇,研究主要著眼于3個方面:一是BIBFRAME的體系架構和應用領域;二是MARC(CNMARC、MARC21)向BIBFRAME轉換路徑;三是BIBFRAME與FRBR、RDA、Shema.org等相關模型和規(guī)則的比較研究。目前國內(nèi)有關BIBFRAME的應用研究還較為缺乏,夏翠娟等的《基于書目框架(BIBFRAME)的家譜本體設計》一文是唯一對BIBFRAME在具體應用領域進行研究的論述[10],有關基于BIBFRAME模型的聯(lián)合目錄構建模式未見有研究涉足。

2 傳統(tǒng)聯(lián)合目錄建設模式分析

聯(lián)合目錄(union catalogs)在聯(lián)合檢索、聯(lián)機編目、館際互借等館際資源共建共享業(yè)務中具有重要作用。聯(lián)合目錄最早始于1898年普魯士10所大學圖書館編制的《柏林印刷本目錄》,隨后在美國國會圖書館等機構的推動下,逐步發(fā)展出卡片式聯(lián)合目錄、縮微膠片式聯(lián)合目錄、光盤版聯(lián)合目錄和聯(lián)機目錄等多種形式[11],其中聯(lián)機目錄是當前聯(lián)合目錄建設的主流形式。從體系結構上看,傳統(tǒng)聯(lián)機目錄總體可分為兩種類型:集中式聯(lián)機聯(lián)合目錄和分散式聯(lián)機聯(lián)合目錄。

2.1 集中式聯(lián)機聯(lián)合目錄

集中式聯(lián)機聯(lián)合目錄的典型特征為存在一個中央書目數(shù)據(jù)庫,該數(shù)據(jù)庫通過一定機制與成員館書目數(shù)據(jù)實現(xiàn)同步更新。集中式聯(lián)合目錄實現(xiàn)的關鍵在于中央數(shù)據(jù)庫與成員館的數(shù)據(jù)同步機制。當前聯(lián)機目錄的建設實踐主要基于人工批量同步和元數(shù)據(jù)收割兩種形式。如我國臺灣地區(qū)的“全國圖書書目資訊網(wǎng)”(NBINet)即是前者的代表。根據(jù)NBINet的《書目網(wǎng)絡合作辦法》,NBINet成員館須定期或不定期向臺灣“國家圖書館”寄送CMARK、USMARK或MARK21格式的檔案,“國家圖書館”則負責將成員館的MARC數(shù)據(jù)導入NBINet數(shù)據(jù)庫[12]。CALIS聯(lián)合目錄數(shù)據(jù)庫也采用了集中式數(shù)據(jù)庫結構,在管理中心和地區(qū)中心建立8個聯(lián)合目錄數(shù)據(jù)庫,通過“增量復制”技術(互為“鏡像”)使8個聯(lián)合目錄數(shù)據(jù)庫中的書目記錄保持準同步[11]?;谠獢?shù)據(jù)收割的聯(lián)機目錄多采用OAI-PMH 協(xié)議。

OAI-PMH定義了兩類角色:數(shù)據(jù)提供者(data prodiver)和服務提供者(service provider)。數(shù)據(jù)提供者將一個或多個書目數(shù)據(jù)倉儲以OAI協(xié)議進行發(fā)布,服務提供者則使用支持OAI協(xié)議的客戶端對OAI倉儲進行定期收割。當前在openarchives.org中公布的數(shù)據(jù)提供者已達3 014個[13]。國內(nèi)的CALIS高校學位論文數(shù)據(jù)庫和中國科學院聯(lián)合機構知識庫也采用了成員館分散建庫、中心館利用OAI-PMH集中收割的建設模式[14]。

2.2 分布式聯(lián)機聯(lián)合目錄

分布式聯(lián)機聯(lián)合目錄由不同文獻機構維護各自的書目數(shù)據(jù)庫,書目檢索方通過聯(lián)邦檢索的形式向多個文獻機構廣播檢索請求,并將返回的檢索結果進行匯總。當前主流的分布式聯(lián)機目錄大多基于Z39.50協(xié)議,即檢索客戶端將檢索請求轉換為Z39.50協(xié)議的應用協(xié)議數(shù)據(jù)單元(APDU)后廣播至多個支持Z39.50協(xié)議的服務器。服務器對APDU解碼后,轉換成自身系統(tǒng)的檢索請求進行查詢。查詢完成后,使用相同的方法將檢索結果返回給檢索客戶端。如香港科技大學的《香港大學圖書館聯(lián)合目錄》就利用Z39.50實現(xiàn)了包括8所香港大學和16個國外機構在內(nèi)的文獻資源分布式檢索[15]。

3 聯(lián)合目錄的語義化構建

語義網(wǎng)是T. Berners-Lee于1998年所提出的概念,其目標是為萬維網(wǎng)中的文檔添加可理解的語義;2006年,T. Berners-Lee在語義網(wǎng)的基礎上提出了關聯(lián)數(shù)據(jù)(linked data)一詞,試圖利用Web實現(xiàn)對RDF數(shù)據(jù)的相互關聯(lián),最終形成數(shù)據(jù)之網(wǎng)(Web of Data)。語義網(wǎng)和關聯(lián)數(shù)據(jù)的概念提出后,圖書館界也在不斷探索書目數(shù)據(jù)語義化的策略。目前圖書館界的數(shù)據(jù)語義化嘗試主要集中在兩個方面:一是詞表和分類表數(shù)據(jù)的語義化,如美國國會圖書館已將《美國國會圖書館標題詞表》(Library of Congress Subject Headings)進行語義化描述(基于SKOS)后以關聯(lián)數(shù)據(jù)形式發(fā)布在Web上,臺灣“國家圖書館”也已完成了主題詞表的SKOS化和中文圖書分類法的語義化轉換,并將其應用于其編目系統(tǒng)[16];二是書目數(shù)據(jù)集的語義化,如大英圖書館將英國國家書目(BNB)從MARC21格式轉換為關聯(lián)數(shù)據(jù)的RDF/XML格式,并通過Web提供數(shù)據(jù)集的下載;德國柏林自由大學和漢諾威大學的研究者則利用D2R服務器將著名的計算機科技文獻書目數(shù)據(jù)庫DBLP發(fā)布為關聯(lián)數(shù)據(jù)[17]。

近年來,隨著關聯(lián)數(shù)據(jù)在圖書情報領域應用的深化,部分機構已開始嘗試實現(xiàn)聯(lián)合目錄的語義化構建。最早將聯(lián)合目錄以語義化形式發(fā)布的機構為瑞典國家圖書館,該館于2008年嘗試將瑞典聯(lián)合目錄(Swedish Union Catalogue)發(fā)布為關聯(lián)數(shù)據(jù)[18]。作為全球最大聯(lián)機目錄,OCLC的WorldCat數(shù)據(jù)庫自2012年開始將一批被廣泛收藏的作品通過Schema.org詞匯表加以描述,并以關聯(lián)數(shù)據(jù)的形式進行發(fā)布,目前已發(fā)布書目數(shù)據(jù)1.97億條[19]。

從當前語義化聯(lián)合目錄的建設實踐上看,主流構建方式為將機構原先擁有的MARC數(shù)據(jù)內(nèi)容進行語義網(wǎng)轉換,通過機構自身所編制的書目本體對書目進行語義化描述,最終以Turtle、RDF/XML、RDFa等RDF形式化表示進行發(fā)布。這種語義化聯(lián)合目錄構建方式的不足之處是無法實現(xiàn)原生的語義聯(lián)合目錄構建;聯(lián)合目錄與成員館之間缺乏語義化的數(shù)據(jù)互操作,導致語義書目數(shù)據(jù)同步的滯后性;同時也缺乏基于以BIBFRAME為代表的標準化語義書目數(shù)據(jù)格式的聯(lián)合目錄構建實踐。因此,如何構建BIBFRAME作為標準的書目數(shù)據(jù)載體并能夠實現(xiàn)原生語義化互操作的聯(lián)合目錄,是書目數(shù)據(jù)語義化過程中亟待解決的問題。

4 基于BIBFRAME 2.0的語義聯(lián)合目錄體系結構

如前所述,傳統(tǒng)聯(lián)機目錄可采用集中式和分散式兩種建構策略。筆者認為,傳統(tǒng)聯(lián)機目錄的建構方法在語義網(wǎng)環(huán)境下有一定借鑒意義,但不可簡單套用。構建基于BIBFRAME 2.0的語義聯(lián)合目錄,可利用BIBFRAME的開放性及跨域關聯(lián)特性,并借鑒傳統(tǒng)聯(lián)機目錄中OAI收割機制及基于Z39.50的廣播式查詢機制,采用集中式、分布式和集中與分布相結合3種構建模式。

4.1 集中式語義聯(lián)機目錄

集中式語義聯(lián)合目錄的特征為存在一個中心語義數(shù)據(jù)倉儲。如圖2所示,中心語義數(shù)據(jù)倉儲中存放有多個數(shù)據(jù)集,分別用于存儲使用BIBFRAME 2.0表示的作品、實例和館藏項三元組以及各成員館、書庫、作者的URI命名等規(guī)范數(shù)據(jù)。所有數(shù)據(jù)集使用帶有訪問權限控制的SPARQL端點(Endpoint)將數(shù)據(jù)開放給成員館。各成員館亦分別維護一份本地BIBFRAME數(shù)據(jù)倉儲,同樣使用SPARQL端點將數(shù)據(jù)開放給中心倉儲。

集中式語義聯(lián)合目錄實現(xiàn)的關鍵在于中心倉儲數(shù)據(jù)集與成員館本地數(shù)據(jù)集的同步機制。數(shù)據(jù)集同步可采用兩種形式:

(1)批量同步。即中心系統(tǒng)輪詢成員館的SPARQL端點,定期將本地書目倉儲的數(shù)據(jù)收割至中心倉儲。批量同步方式是OAI-PMH收割在語義網(wǎng)環(huán)境下的替代。

(2)增量同步。增量同步將語義聯(lián)合目錄構建與聯(lián)機編目相結合,其運作流程為:成員館獲得新館藏資源時,首先查詢本地倉儲是否有相應作品、實例和館藏信息,若無則通過HTTPPOST方法將SPARQL請求發(fā)送至中心倉儲的SPARQL端點進行檢索。若中心倉儲已存在該資源的相應數(shù)據(jù),則成員館將其套錄至本地倉儲中;否則,成員館完成相關數(shù)據(jù)的原始編目并同步存儲至本地和中心倉儲。為防止數(shù)據(jù)更新后導致的不一致,可在中心系統(tǒng)和本地系統(tǒng)間建立Pingback機制,若中心倉儲中的數(shù)據(jù)發(fā)生了修改,則各成員館本地系統(tǒng)將收到相應書目的更新通知。增量同步的優(yōu)勢在于可有效防止元數(shù)據(jù)的重復建設,因此特別適合作品(Work)和實例(Instance)等共性較強的數(shù)據(jù)的同步。

4.2 分布式語義聯(lián)合目錄

分布式語義聯(lián)合目錄不設置中心語義數(shù)據(jù)倉儲,而是將BIBFRAME數(shù)據(jù)分散存儲于不同機構中。各機構分別承擔自身收藏的所有書目的作品、實例及館藏項數(shù)據(jù)的建設,并將BIBFRAME數(shù)據(jù)以SPARQL端點的形式向外部開放。

當聯(lián)合目錄收到用戶檢索請求時,可分別向各成員館發(fā)送SPARQL查詢請求,再將響應的結果集進行合并,也可利用SPARQL的聯(lián)邦查詢(federated query)機制,一次性對指定機構的書目進行聯(lián)邦查詢,并將檢索結果進行去重后提供給用戶。圖3為一段SPARQL查詢實例,該實例通過聯(lián)邦檢索方式查詢了指定ISBN號的圖書實例在兩館中各自的館藏復本量。

分布式語義聯(lián)合目錄無需成員館對系統(tǒng)架構作較大調整,也無需部署專用的同步終端軟件,因此較適合松散型圖書館聯(lián)盟成員間的資源整合。其缺點是不同成員間缺乏協(xié)調機制,可能存在對同一作品和實例數(shù)據(jù)的重復建設,并由此產(chǎn)生數(shù)據(jù)去重過程中的取舍問題。

4.3 集中與分布相結合的語義聯(lián)合目錄

集中與分布相結合的語義聯(lián)合目錄綜合了前兩者的特性。在這一模式下,作品、實例和命名規(guī)范等共性較強的數(shù)據(jù)采用集中式管理;館藏項等個性較強的數(shù)據(jù)采用分布式管理(見圖4)。其優(yōu)點在于通過作品和實例數(shù)據(jù)的集中管理可以減少資源的重復建設,同時通過分布式的采集館藏項數(shù)據(jù)可以盡可能擴大檢索的成員館范圍。

5 實驗測評

為驗證上述語義聯(lián)合目錄構建方法的有效性,筆者使用Jena Fuseki+Apache HTTP Server搭建實驗平臺,進行了相關測試。Fuseki是Apache基金會開發(fā)的開源語義網(wǎng)框架Jena中的一個SPARQL服務器,其內(nèi)置了TDB三元組存儲器,同時提供支持HTTP REST架構的SPARQL端點(Endpoint)服務。

Fuseki服務器自帶有基于Apache Shiro框架的權限控制機制[20],但經(jīng)筆者測試,其權限控制主要針對三元組數(shù)據(jù)集管理系統(tǒng),并未覆蓋SPARQL端點服務,這使得SPARQL端點暴露在外,存在一定的數(shù)據(jù)安全隱患。為解決這一問題,筆者利用Apache HTTP Server的反向代理機制構建了反向代理服務器指向Fuseki服務器的URL,并針對該反向代理設置了AuthType Basic權限限制,從而將SPARQL端點覆蓋在鑒權范圍內(nèi)。

針對集中式語義聯(lián)合目錄的館際互操作問題,筆者按上述權限控制方案在局域網(wǎng)中搭建了兩臺部署有Fuseki+Apache HTTP Server的服務器,用于模擬中心倉儲和本地倉儲,并在中心倉儲服務器中建立了名為center的數(shù)據(jù)集(Dataset),在本地倉儲服務器中建立了名為local的數(shù)據(jù)集,兩數(shù)據(jù)集中均建立了名為work、instance、item的3個具名圖(Named Graph),用于分類保存用于測試的BIBFRAME 2.0 RDF數(shù)據(jù)。

Jena ARQ是Jena所包含的SPARQL查詢引擎,提供了包括基本SPARQL查詢、聯(lián)邦查詢及SPARQL更新在內(nèi)的一系列API。筆者利用Jena ARQ API實現(xiàn)了對遠端語義書目倉儲的查詢和修改,進而可完成數(shù)據(jù)批量下載、套錄等一系列操作。圖5為書目數(shù)據(jù)讀寫操作的關鍵代碼(其中admin和pw為鑒權信息,http://192.168.1.2/center/sparql和http://192.168.1.2/center/update分別為經(jīng)反向代理包裝后的中心倉儲的查詢和修改SPARQL端點):

為驗證分布式語義聯(lián)合目錄互操作的可靠性,筆者使用Java程序自動生成了1 000條BIBFRAME作品測試數(shù)據(jù),每部作品數(shù)據(jù)各生成10條相關實例,每部實例各生成10個相關館藏項,共計10萬條館藏數(shù)據(jù),并將上述數(shù)據(jù)分散存放于廣域網(wǎng)中的3臺計算機中(其中2臺位于Chinanet,1臺位于Cernet)。此后,筆者以Chinanet中的另一主機充當聯(lián)合目錄服務器對上述3臺計算機進行SPARQL查詢,以聯(lián)邦檢索方式查詢特定作品的所有館藏信息。實驗結果顯示,10次針對不同作品的查詢均得到正確的查詢結果,取得返回結果所用的平均耗時為1.2秒,但實驗也發(fā)現(xiàn)基于SPARQL聯(lián)邦查詢獲取數(shù)據(jù)存在一定的“木桶效應”,即一旦某一節(jié)點連接時延過長或斷開連接,將導致聯(lián)合目錄查詢超時。因此,筆者認為基于聯(lián)邦檢索方式實現(xiàn)的分布式語義聯(lián)合目錄主要適用于網(wǎng)絡時延較短、成員館節(jié)點數(shù)量較少的應用場景。在網(wǎng)絡時延不確定或需要大規(guī)模分布式查詢的應用場景中,通過前述Jena ARQ API分別查詢成員館SPARQL端點,再進行數(shù)據(jù)合并的方式應更為理想。

6 總結與展望

基于BIBFRAME 2.0的語義聯(lián)合目錄相比傳統(tǒng)聯(lián)合目錄相比,主要優(yōu)勢在于:

(1)實現(xiàn)了書目信息內(nèi)容揭示和館藏數(shù)據(jù)的分離。在BIBFRAME模型中,作品數(shù)據(jù)屬于抽象內(nèi)容,實例和館藏數(shù)據(jù)屬于載體表現(xiàn),在描述時分開描述。在語義聯(lián)機目錄中,作品、作品實例和館藏項三元組可以分別存儲于不同數(shù)據(jù)集中,由不同機構或部門負責維護,用戶在聯(lián)機檢索時再整合多個數(shù)據(jù)集的內(nèi)容進行查詢。

(2)提高了書目數(shù)據(jù)的開放性和關聯(lián)程度。在語義網(wǎng)中,使用HTTP URI作為實體的標識符。在BIBFRAME書目數(shù)據(jù)中,任何與圖書有關的實體(如作者、出版商、圖書館、地區(qū))均可使用URI進行標識。這有助于打破傳統(tǒng)圖書館的封閉系統(tǒng)與萬維網(wǎng)之間的藩籬,便于實現(xiàn)書目數(shù)據(jù)和其他開放數(shù)據(jù)集之間的混搭。

針對BIBFRAME 2.0出現(xiàn)后書目數(shù)據(jù)語義化的發(fā)展,本研究在分析傳統(tǒng)聯(lián)合目錄構建機制的基礎上提出了3種語義聯(lián)合目錄的構建模式,即集中式語義聯(lián)合目錄、分布式語義聯(lián)合目錄以及集中與分布相結合的建設模式,通過語義聯(lián)合目錄的構建,可實現(xiàn)館際間語義書目數(shù)據(jù)的聯(lián)合查詢,進而可為基于BIBFRAME的語義聯(lián)機編目和館際互借等館際協(xié)作提供基礎。

為驗證語義聯(lián)合目錄構建方法的有效性,本研究開展了基于BIBFRAME和語義倉儲的館際互操作實驗。由實驗結果可知,本研究提出的語義聯(lián)合目錄建設方法在實踐中具有可行性。在本研究中,主要以自動生成的書目數(shù)據(jù)作為測試資源,未將大批量MARC數(shù)據(jù)轉換后進行測試,同時也缺乏對大量成員館節(jié)點在跨區(qū)域網(wǎng)絡環(huán)境下構建聯(lián)合目錄的測試。在后續(xù)研究中,筆者將對CNMARC向BIBFRAME 2.0的轉換機制進行探索,同時對跨區(qū)域多節(jié)點環(huán)境下的語義聯(lián)合目錄應用予以關注和測試。

參考文獻:

[1] ANDRESEN L. After MARC-what then[J]. Library hi tech, 2004, 22(1): 40-51.

[2] ALEMU G, Stevens B, Ross P, et al. Linked data for libraries: benefits of a conceptual shift from library specific record structures to RDF-based data models[J]. New library world, 2012, 113(11/12): 549-570.

[3] TENNANT R. MARC must die[J]. Library journal, 2002, 127(17): 26-28.

[4] Library of Congress. BIBFRAME vocabulary[EB/OL]. [2016-04-10]. http: //bibframe.org/vocab-list.

[5] Library of Congress. BIBFRAME 2. 0 vocabulary[EB/OL]. [2016-04-15]. http: //id.loc.gov/ontologies/bibframe.html.

[6] Library of Congress. BIBFRAME Implementation & testing[EB/OL]. [2016-04-10]. http://www.loc.gov/bibframe/implementation.

[7] Zapounidou S, Sfakakis M, Papatheodorou C. Library data integration: towards BIBFRAME mapping to EDM[C]//Closs S, Studer R, Garoufallou E, et al. Metadata and Semantics Research. Berlin: Springer International Publishing, 2014: 262-273.

[8] LD4L Project team. Project description [EB/OL]. [2016-04-30]. https://www.ld4l.org/description.

[9] 劉煒, 夏翠娟. 書目數(shù)據(jù)新格式BIBFRAME及其應用[J]. 大學圖書館學報, 2014(1): 5-13.

[10] 夏翠娟, 劉煒, 張磊,等. 基于書目框架(BIBFRAME)的家譜本體設計[J]. 圖書館論壇, 2014(11): 5-19.

[11] 盧共平, 汪善建. 歐美國家聯(lián)合目錄的進展與我國虛擬聯(lián)合目錄的發(fā)展思路[J]. 圖書情報工作, 2002, 46(10): 84-87.

[12] NBINet. 全國圖書書目資訊網(wǎng)合作編目要點[EB/OL]. [2016-04-30]. http: //nbinet.ncl.edu.tw/content.aspx?t=m&id=95.

[13] Open Archives Initiative. Registered data providers[EB/OL]. [2016-04-30]. http://www.openarchives.org/Register/BrowseSites.

[14] 姚曉娜, 祝忠明, 盧利農(nóng),等. 機構知識庫OAI互操作數(shù)據(jù)同步策略研究[J]. 現(xiàn)代圖書情報技術, 2014(3): 14-18.

[15] Hong Kong University of Science and Technology Library. Z39. 50 union catalogs [EB/OL]. [2016-05-03]. http://ustlib.ust.hk:211/z39m.

[16] 臺灣“國家圖書館”. “國家圖書館”鏈接資源系統(tǒng)開放使用[EB/OL]. [2016-10-23]. http://catweb.ncl.edu.tw/portal_d2_page.php?button_num=d2&cnt_id=301.

[17] 歐石燕.語義網(wǎng)的主要功能及其在數(shù)字圖書館中的應用[J]. 數(shù)字圖書館論壇, 2014(3): 2-10.

[18] Martin M. Making a library catalogue part of the semantic Web[EB/OL]. [2016-05-15]. http://dcpapers.dublincore.org/pubs/article/view/927/923.

[19] OCLC. Data strategy and linked data[EB/OL]. [2016-05-03]. http://www.oclc.org/data.en.html.

[20] Apache Software Foundation. Security in Fuseki2[EB/OL]. [2016-05-15]. https://jena.apache.org/documentation/fuseki2/fuseki-security.html.

Semantic Union Catalogs: The Construction of Union Catalogs Based on BIBFRAME 2.0

Lin Zefei

College of Social Development, Fujian Normal University, Fuzhou 350013

Abstract: [Purpose/significance] With the continuous improvement of bibliographic description models such as BIBFRAME, bibliographic data are facing the transition from MARC to the semantic bibliography. This paper explores the construction model of semantic union catalogs. [Method/process] The author analyzed the construction model of tranditional union catalogs firstly, and considered that its pattern had reference significance for semantic union catalogs but should not be simply copied. Then, the authors analyzed the bibliographic description method of BIBFRAME 2.0, and proposed three construction models of semantic union catalogs: the centralized semantic union catalogs, the distributed semantic union catalogs and the combination of these two methods. Finally, the authors built an experimental platform based on Jena Fuseki and Apache HTTP server, and tested the interoperated method of semantic union catalogs. [Result/conclusion] The experimental results show that the three methods proposed in this paper are feasible in practice, and can provide useful references for the semantic bibliographic data interoperability and the cross-database retrieval system of the library and information department.

Keywords: union catalogs BIBFRAME Semantic Web linked data

靖安县| 义马市| 临洮县| 西乌| 湘潭县| 五台县| 吴堡县| 定襄县| 五指山市| 南康市| 铜梁县| 芜湖市| 大邑县| 永宁县| 响水县| 安溪县| 通河县| 晋城| 赞皇县| 忻州市| 高台县| 苍山县| 安庆市| 镇安县| 鹰潭市| 桃园县| 巩义市| 六枝特区| 郯城县| 临西县| 南昌县| 大姚县| 清流县| 兴文县| 阿合奇县| 开封市| 东源县| 德格县| 永登县| 韶关市| 化州市|