后MARC時代書目數(shù)據(jù)關聯(lián)應用探討
●梁 亮,陳 琦(杭州圖書館,杭州310016)
MARC;書目數(shù)據(jù);關聯(lián)數(shù)據(jù)
數(shù)字時代,MARC格式的書目數(shù)據(jù)已無法滿足用戶服務的需求,本文在對國內外書目數(shù)據(jù)關聯(lián)應用案例分析的基礎上,探討如何在這個新舊交替的過程中,運用關聯(lián)數(shù)據(jù)理念改造、優(yōu)化現(xiàn)存的MARC書目數(shù)據(jù),使之滿足用戶服務,并做好向RDA、關聯(lián)數(shù)據(jù)等新的數(shù)據(jù)形式轉換的準備。
圖書館采用計算機進行書目編制以來,MARC格式便是圖書館最重要的數(shù)據(jù)標準,但MARC是一種在封閉環(huán)境下使用的元數(shù)據(jù),隨著時代的變遷,傳統(tǒng)的MARC數(shù)據(jù)已經(jīng)越來越不適應用戶的需求,無法為用戶提供更滿意的服務,隨之而來的對MARC數(shù)據(jù)改造的理論研究和實踐層出不窮。本文從編目員和OPAC用戶的視角出發(fā),結合對國內外書目數(shù)據(jù)關聯(lián)應用的案例分析,思考和探討如何運用關聯(lián)數(shù)據(jù)的理念去優(yōu)化、改造、革新現(xiàn)有的MARC格式書目數(shù)據(jù),使圖書館的數(shù)據(jù)尤其是書目數(shù)據(jù)走出圖書館,融入互聯(lián)網(wǎng)。
1.1 概念闡釋
關聯(lián)數(shù)據(jù)是萬維網(wǎng)的發(fā)明人Tim Berners Lee于2006年提出在萬維網(wǎng)上發(fā)布數(shù)據(jù)的一種方式,是一種旨在提高網(wǎng)絡數(shù)據(jù)機器可讀性的技術框架,它通過建立數(shù)據(jù)之間的關聯(lián)來實現(xiàn)數(shù)據(jù)在網(wǎng)絡中的分享與重用。關聯(lián)數(shù)據(jù)的核心是將數(shù)據(jù)和網(wǎng)絡融合起來,關聯(lián)數(shù)據(jù)給圖書館帶來了機會,讓圖書館有可能遵循一種泛在的技術規(guī)范提供服務,將自身數(shù)據(jù)與網(wǎng)絡世界相關聯(lián)、相融合,從而真正地將自己融入到整個信息世界中去。[1]作為圖書館原生的書目數(shù)據(jù)和規(guī)范數(shù)據(jù)無疑是其中最獨特、最重要的一部分。
1.2 國外書目數(shù)據(jù)關聯(lián)應用案例分析
自2008年以來,國外將書目數(shù)據(jù)發(fā)布為關聯(lián)數(shù)據(jù)的圖書館及組織眾多。本文選取頗具代表性的瑞典國家圖書館瑞典聯(lián)合目錄(LⅠBRⅠS)及挪威奧斯陸公共圖書館的PODE項目為例,探討采用關聯(lián)數(shù)據(jù)技術后,現(xiàn)有的MARC數(shù)據(jù)能在圖書館服務上發(fā)揮怎樣的功能。
(1)瑞典國家圖書館瑞典聯(lián)合目錄(LⅠBRⅠS)。[2]2008年瑞典國家圖書館率先把瑞典聯(lián)合目錄(LⅠBRⅠS)發(fā)布為關聯(lián)數(shù)據(jù),瑞典聯(lián)合目錄是瑞典大學圖書館、研究圖書館及公共圖書館的國家聯(lián)合目錄,至今共開放了其200多個成員館超過650萬條書目記錄以及20萬條規(guī)范檔。當用戶登錄LⅠBRⅠS(http://libris. kb.se/)檢索某一特定的圖書,檢索結果頁面會顯示詳細書目信息、電子書信息、相關版本及各圖書館收藏情況,用戶可以直接點擊到自己喜愛的圖書館網(wǎng)站進一步檢索。而同樣在各圖書館網(wǎng)站的相應頁面,用戶還可以鏈接回LⅠBRⅠS。在主題標目和分類號欄會顯示相同主題或類號的文獻,在“search further”欄下,點擊作者名字就可獲得該作者所有相關作品。在“Search outside LⅠBRⅠS”欄下,提供了Google、Google Book Search、Google Scholar、Scirus及LibrsaryThing的鏈接,將用戶引領到了圖書館以外的地方進行資源再發(fā)現(xiàn)。
LⅠBRⅠS實現(xiàn)了書目數(shù)據(jù)之間的關聯(lián)、圖書館之間的關聯(lián)、LⅠBRⅠS與外部的關聯(lián),使用戶通過一站式檢索獲得不同圖書館、不同資源類型的書目信息并在此基礎上獲得更多的信息資源,而這些功能都是以關聯(lián)數(shù)據(jù)為基礎來實現(xiàn)的。
(2)挪威奧斯陸公共圖書館的Pode項目。[3]Pode項目是挪威奧斯陸公共圖書館采用FRBR和關聯(lián)數(shù)據(jù)提升圖書館編目系統(tǒng)的實踐。它采用挪威科技大學開發(fā)的工具,將(NOR)MARC自動FRBR化。通過清理、修正和完善MARC記錄,這些FRBR化的數(shù)據(jù)最終通過XSLT以及DC元數(shù)據(jù)術語、書目本體、FRBR核心詞、FOAF、SKOS等詞匯表和本體,被轉換成RDF格式成為關聯(lián)數(shù)據(jù)。[4]通過這個項目平臺,用戶可以查找特定作者的完整館藏,也可以通過元數(shù)據(jù)的使用發(fā)現(xiàn)其他關聯(lián)的元數(shù)據(jù)以獲取藝術、天氣預報、地圖、百科全書等相關內容,如用戶可以鏈接到DB-pedia獲取與作者相關的更多資源,鏈接到古登堡計劃以獲取全文電子書。
PODE項目向我們展示了結合FRBR模型和關聯(lián)數(shù)據(jù)技術,確實可以很好的提高我們原有的MARC數(shù)據(jù)質量,提供給用戶更好的服務,這些對處于生命周期末期的MARC來說無疑是一種重生的方式。
1.3 國內應用案例分析
國內的書目數(shù)據(jù)關聯(lián)應用尚屬起步、探索階段,以上海圖書館、中國科學技術信息研究所、中國科學院國家科學圖書館為代表的圖書館、研究所是其中的先行者,并逐漸形成了關聯(lián)數(shù)據(jù)的核心研究圈。
在書目數(shù)據(jù)關聯(lián)數(shù)據(jù)應用實踐方面,上海圖書館試驗性地采用關聯(lián)數(shù)據(jù)技術,將300條MARC數(shù)據(jù)與人名規(guī)范、館藏信息合三為一,從而將互不相連的三個數(shù)據(jù)庫:來自Horizon的書目數(shù)據(jù)、名人手稿館的名人規(guī)范檔數(shù)據(jù)和上海市中心圖書館名錄,合成了一個統(tǒng)一的關聯(lián)數(shù)據(jù)庫。[5]
杭州圖書館嘗試書目數(shù)據(jù)關聯(lián)數(shù)據(jù)的應用,雖目前技術和人力無法做到書目數(shù)據(jù)RDF化,但充分借鑒了關聯(lián)數(shù)據(jù)的理念來改造書目數(shù)據(jù)。編目員采用了各大讀書網(wǎng)站的熱門標簽,將這些標簽整理、歸類后,重新對MARC數(shù)據(jù)進行組織,結合新型OPAC技術,使用戶能使用自己所熟悉的標簽進行文獻的檢索、瀏覽,并將每一冊圖書鏈接到了豆瓣網(wǎng)站、百度圖書等外部網(wǎng)站,擴展了用戶信息源。[6]雖然此項工作才剛開始,效果還有待檢驗,也不是真正意義上的書目數(shù)據(jù)關聯(lián)應用,但運用了關聯(lián)數(shù)據(jù)的理念,通過“鏈接”的方式為用戶提供了更多的信息資源。
2.1 關注MARC以外的關聯(lián)數(shù)據(jù)環(huán)境
關聯(lián)數(shù)據(jù)的核心之一就是和其他數(shù)據(jù)集實現(xiàn)數(shù)據(jù)共享和相互關聯(lián),可以將書目數(shù)據(jù)和其他數(shù)據(jù)融合起來,使書目信息更加豐富和完整。從國外發(fā)布的關聯(lián)書目數(shù)據(jù)看,很多國家的書目數(shù)據(jù)關聯(lián)到了外部數(shù)據(jù)集,如Dbpedia、Wikipedia、LCSH、ⅤⅠAF等,大大增加了書目數(shù)據(jù)的豐富程度。要關注外部關聯(lián)數(shù)據(jù)的應用情況,如百度百科將外部的關聯(lián)數(shù)據(jù)源與MARC記錄中的各項字段內容結合起來,以期與更多的外部關聯(lián)數(shù)據(jù)集實現(xiàn)關聯(lián)。未來的書目控制應當是國際化、協(xié)作化和網(wǎng)絡化的,書目數(shù)據(jù)的關聯(lián)數(shù)據(jù)應用也應走國際化、協(xié)作化和網(wǎng)絡化的道路。
2.2 加強圖書館之間的協(xié)作
虛擬規(guī)范文檔(ⅤⅠAF)最初由美國國會圖書館、法國國家圖書館、德國國家圖書館和OCLC共同建設,現(xiàn)移交OCLC統(tǒng)一管理。目前已發(fā)布的很多書目數(shù)據(jù)關聯(lián)數(shù)據(jù)都關聯(lián)到了LCSH、ⅤⅠAF等規(guī)范數(shù)據(jù)關聯(lián)數(shù)據(jù),這些圖書館及圖書館組織間的合作極大促進了書目數(shù)據(jù)關聯(lián)應用的發(fā)展。在長期的全球性書目控制工作中,圖書館的編目界已形成了一個成熟的、運行良好的全球合作分享數(shù)據(jù)的機制與模式,這種機制同樣可以運用到書目數(shù)據(jù)關聯(lián)應用的實踐中去。就國內而言,書目數(shù)據(jù)可以與中圖法、中文主題規(guī)范數(shù)據(jù)、中文人名規(guī)范數(shù)據(jù)結合起來開發(fā)。
2.3 謀求與不同組織的合作
關聯(lián)數(shù)據(jù)的豐富性、社會性要求圖書館的書目數(shù)據(jù)關聯(lián)應用不能局限于圖書館,而是出版方、圖書館、用戶等多方參與,共同完善。劉煒老師曾提出過一種共建書目數(shù)據(jù)關聯(lián)數(shù)據(jù)的模式,設想由出版商提供圖書的原始數(shù)據(jù),由國家圖書館或相關權威機構添加書目信息和權威控制,由本地圖書館添加館藏信息,由用戶(包括編目員)添加附加信息如維基百科的鏈接,而圖書館ⅠT人員為所有這些與本書相關的信息生成頁面和鏈接,如同一個作者的其他著作、同一主題的其他書籍、維基百科、百度百科中的作者生平、讀書網(wǎng)站上的讀者評論等等。
圖書館的外延在不斷擴展,可與之合作的行業(yè)、組織也越來越多,從用戶服務的角度出發(fā),圖書館的書目數(shù)據(jù)可以與更多的組織、網(wǎng)站、項目合作,以書目數(shù)據(jù)為基礎拓展到整個人類知識的海洋。
2.4 規(guī)范、一致的MARC數(shù)據(jù)是書目數(shù)據(jù)關聯(lián)應用的基礎
挪威PODE項目的核心思想之一是圖書館僅僅基于現(xiàn)有的元數(shù)據(jù)而不是基于提供的元數(shù)據(jù)的質量,無法創(chuàng)造更好的服務。PODE項目的一個重要步驟是將MARC數(shù)據(jù)FRBR化,但在具體數(shù)據(jù)轉換、測試中發(fā)現(xiàn)細微到MARC數(shù)據(jù)個別字段指示符的缺失都會直接影響到后續(xù)數(shù)據(jù)轉換的正確性。[8]由此可見,書目數(shù)據(jù)的標準、規(guī)范、可靠是關聯(lián)數(shù)據(jù)應用的基礎。因此,要確保我們能跟上這波關聯(lián)數(shù)據(jù)的浪潮,繼續(xù)產(chǎn)生規(guī)范的MARC數(shù)據(jù)乃至RDA數(shù)據(jù),仍是書目數(shù)據(jù)關聯(lián)應用的基礎。
2.5 通過“鏈接”拓展服務功能
圖書館采用關聯(lián)數(shù)據(jù)技術的最終目的是為了服務,關聯(lián)數(shù)據(jù)通過“鏈接”實現(xiàn)了不同數(shù)據(jù)集的關聯(lián)。近年來,通過優(yōu)化圖書館檢索界面,書目目錄已經(jīng)增加了很多書目以外的信息,如國外普遍應用的LibraryThing、Google Book、國內的豆瓣讀書、百度圖書等為圖書館提供目次、圖書封面、內容簡介和讀者評論的鏈接。而更多的圖書館和豆瓣讀書合作,通過豆瓣的圖書館合作項目,將豆瓣用戶鏈接回圖書館的OPAC頁面,吸引用戶使用圖書館資源。通過這些“鏈接”的使用,圖書館極大地拓展了書目服務的功能。
關聯(lián)數(shù)據(jù)在圖書館書目數(shù)據(jù)方面的應用方興未艾,國內的各級各類圖書館應當有計劃有策略的合作開展此項研究和實踐。關聯(lián)數(shù)據(jù)需要一個社會性的開放的數(shù)據(jù)環(huán)境良好的數(shù)據(jù)保障機制,圖書館界應努力為書目數(shù)據(jù)的關聯(lián)應用打造良好的數(shù)據(jù)環(huán)境和保障機制。未來是數(shù)據(jù)的時代,關聯(lián)數(shù)據(jù)和大數(shù)據(jù)(Big Data)已初顯規(guī)模。MARC可能很快會消亡,但它會以另一種數(shù)據(jù)(如關聯(lián)數(shù)據(jù))方式新生,在未來數(shù)據(jù)的海洋中占有重要的一席。
[1]林海青,等.圖書館關聯(lián)數(shù)據(jù):機會與挑戰(zhàn)[J].中國圖書館學報,2012(1):58-67,112.
[2]LⅠBRⅠS[EB/OL].[2013-05-01].http://libris. kb.se/?language=en.
[3]About the project[EB/OL].[2013-05-01].http: //bibpode.no/?q=node/9.
[4]Westrum,A,et al.Ⅰmproving the presentation of library data using FRBR and linked data[J].Code4Lib Journal,Dec2011,Ⅰssue16:1-7.
[5]夏翠娟.關聯(lián)數(shù)據(jù)的技術實現(xiàn)與案例[EB/OL].[2013-05-02].http://wenku.it168.com/d_0008558 63.shtml.
[6]杭州圖書館OPAC[EB/OL].[2013-05-01]. http://my1.hzlib.net/opac3/hotLabel/hotLabelCategory.
[7]白海燕.基于關聯(lián)數(shù)據(jù)的書目組織深度序化初探[EB/OL].[2013-05-02].http://www.doc88. com/p-70583489330.html.
[責任編輯]菊秋芳
G254.364
A
1005-8214(2014)06-0019-02
梁亮(1963-),女,杭州圖書館副研究館員;陳琦(1972-),女,杭州圖書館副研究館員。
2013-06-17