国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

圖書館系統(tǒng)演變及其元數(shù)據(jù)管理*

2021-10-19 10:25:26許磊
圖書館論壇 2021年10期
關(guān)鍵詞:數(shù)據(jù)管理服務(wù)平臺實體

許磊

0 引言

自1950年代開始,圖書館開始自研專注于特定業(yè)務(wù)的獨立系統(tǒng),用于采購、編目、流通或期刊管理等業(yè)務(wù)。進入1970年代,圖書館自動化系統(tǒng)(Library Automation System,LAS)更加成熟,并有商業(yè)產(chǎn)品推出市場。隨著1960年代出現(xiàn)的MARC(Machine-ReadableCataloging)以及計算機技術(shù)的發(fā)展,1980年代開始,以MARC為底層元數(shù)據(jù)標(biāo)準(zhǔn),集成了各獨立功能模塊的圖書館集成系統(tǒng)(Integrated Library Systems,ILS)逐漸取代LAS成為圖書館自動化轉(zhuǎn)型的推手[1]。ILS以及隨后的OPAC(Online Public Access Catalog),真正地將圖書館帶入計算機時代。但隨著互聯(lián)網(wǎng)出現(xiàn),圖書館上下游生態(tài)環(huán)境發(fā)生改變,數(shù)字資源成為讀者的首選信息源。而ILS基于MARC構(gòu)建的一套圍繞紙質(zhì)文獻的采編典流集成系統(tǒng),不再能夠適應(yīng)數(shù)字化、云計算的互聯(lián)網(wǎng)環(huán)境。為滿足對電子資源的管理需要,出現(xiàn)了各種獨立的產(chǎn)品和服務(wù),如電子資源管理系統(tǒng)(Electronic Resources Management,ERM),數(shù)字資產(chǎn)管理系統(tǒng)(Digital Asset Management,DAM);也出現(xiàn)了與之配套的元數(shù)據(jù)管理方案,如DC(Dublin Core)、MARCXML、MODS(Metadata Object Description Schema)。但是,各自獨立的系統(tǒng)以及異構(gòu)的元數(shù)據(jù)方案阻礙了圖書館的業(yè)務(wù)流程優(yōu)化以及資源整合。與此同時,圖書館元數(shù)據(jù)領(lǐng)域FRBR(Functional Requirements for Bibliographic Records)、RDA(Resource Description and Access)、BIBFRAME(Bibliographic Framework)等基于關(guān)聯(lián)數(shù)據(jù)設(shè)計的書目本體方案逐漸成為圖書館知識組織與融合的優(yōu)選方案。因此,圖書館急需一個能夠整合ILS、ERM、OpenURL解析器、DAM等眾多獨立系統(tǒng)功能,也能夠支持各種開放元數(shù)據(jù)格式和數(shù)據(jù)交換協(xié)議以實現(xiàn)跨媒體的資源描述與組織的下一代圖書館管理系統(tǒng)。2010年OCLC推出的WorldShare Management Services(WMS)標(biāo)志著圖書館服務(wù)平臺(Library Services Platform,LSP)進入圖書館系統(tǒng)市場。LSP是構(gòu)建在SaaS(Software as a Service)平臺之上,利用云計算、Web技術(shù)和發(fā)現(xiàn)系統(tǒng),實現(xiàn)全媒體的資源管理,全流程的業(yè)務(wù)管理和全網(wǎng)域的資源發(fā)現(xiàn)的新一代圖書館系統(tǒng)[2]。

平臺化的前提是信息化,只有開放、多元的信息生態(tài)才能促進圖書館的平臺化轉(zhuǎn)型。信息化不僅僅是解決業(yè)務(wù)流程的問題,更改變了信息資源的開發(fā)、建設(shè)與利用的生態(tài)鏈。信息化的基礎(chǔ)是自動化,圖書館自動化的發(fā)展推動了圖書館的資源與服務(wù)的網(wǎng)絡(luò)化和數(shù)字化[3]。從圖書館自動化到信息化再到平臺化,基礎(chǔ)都是信息資源的開發(fā),也就是利用元數(shù)據(jù)對資源進行描述、組織與開發(fā)利用。無論是LSP的統(tǒng)一資源管理與發(fā)現(xiàn),還是數(shù)據(jù)的開放與關(guān)聯(lián),都對新一代圖書館系統(tǒng)的元數(shù)據(jù)管理提出了更多的要求。因此,本文從元數(shù)據(jù)管理角度對圖書館系統(tǒng)的演變進行梳理。并著重分析2類典型的圖書館服務(wù)平臺及其元數(shù)據(jù)管理方案,即商業(yè)產(chǎn)品Alma和開源項目FOLIO。

1 圖書館自動化系統(tǒng)及其元數(shù)據(jù)管理

1.1 圖書館集成系統(tǒng)及其元數(shù)據(jù)管理

計算機發(fā)明之初,圖書館就敏銳地發(fā)現(xiàn)計算機的應(yīng)用對提升圖書館內(nèi)部效率具有巨大潛力。1950年代美國和英國的圖書館開始嘗試將計算機應(yīng)用于圖書館的內(nèi)部業(yè)務(wù)[4]。到20世紀(jì)六七十年代,國內(nèi)外圖書館開始研發(fā)專注于某一個核心業(yè)務(wù)的獨立系統(tǒng)[5-8]。但直到MARC出現(xiàn),才真正奠定了圖書館自動化的基礎(chǔ),推動了圖書館系統(tǒng)從單一功能的自動化系統(tǒng)轉(zhuǎn)向集成管理系統(tǒng)。MARC作為一種書目元數(shù)據(jù)格式,不僅提供了創(chuàng)建一致記錄所需的規(guī)則,成為支持圖書館龐大基礎(chǔ)結(jié)構(gòu)互通的關(guān)鍵標(biāo)準(zhǔn);而且創(chuàng)造性地在數(shù)據(jù)內(nèi)容字段中嵌入目錄,即由頭標(biāo)區(qū)、地址目次區(qū)和數(shù)據(jù)字段區(qū)構(gòu)成的格式結(jié)構(gòu),解決了早期計算機技術(shù)應(yīng)用于書目數(shù)據(jù)的諸多限制[9]。MARC的創(chuàng)新性不僅使其成為圖書館自動化系統(tǒng)的基礎(chǔ),也使得書目數(shù)據(jù)共享達(dá)到了新的水平,推動了聯(lián)合目錄的發(fā)展與壯大。

圖書館系統(tǒng)在MARC誕生之后,經(jīng)過初始階段的探索與自主研發(fā)后,1980年代逐漸發(fā)展為由商業(yè)公司主導(dǎo)開發(fā)的圖書館集成管理系統(tǒng),并占據(jù)主流直至今日。ILS建立在圖書館標(biāo)準(zhǔn)化的業(yè)務(wù)流程之上,從采訪、編目、流通到連續(xù)出版物管理、聯(lián)合目錄等業(yè)務(wù)都圍繞著標(biāo)準(zhǔn)書目數(shù)據(jù)格式展開。因此,無論是國內(nèi)的ILAS、匯文[10],還是國外的Millennium、Aleph500、Horizon[11],都以MARC作為其元數(shù)據(jù)管理標(biāo)準(zhǔn)格式。自ILS投入使用后,其采編典流等功能模塊基本是穩(wěn)定的。雖然每個模塊隨著技術(shù)升級不斷完善,但仍主要管理紙質(zhì)資源。進入1990年代,日益增多的電子和數(shù)字資源改變了整個圖書館資源和技術(shù)生態(tài),幾乎所有圖書館都面臨著同時支持物理和電子資源,并提供適合各種媒介服務(wù)的復(fù)合任務(wù)。由于傳統(tǒng)的ILS側(cè)重于紙質(zhì)資源管理,圖書館不得不開發(fā)獨立于ILS的系統(tǒng)以支持電子和數(shù)字資源管理,如鏈接解析器、聯(lián)邦搜索、電子資源管理系統(tǒng)、數(shù)字資產(chǎn)管理系統(tǒng)、機構(gòu)知識庫。在這種背景下,圖書館需要一個不同于MARC的新的元數(shù)據(jù)標(biāo)準(zhǔn)。

1.2 數(shù)字圖書館系統(tǒng)及其元數(shù)據(jù)管理

當(dāng)MARC成為圖書館行業(yè)主流的元數(shù)據(jù)標(biāo)準(zhǔn)時,互聯(lián)網(wǎng)和搜索引擎卻在顛覆信息傳播與獲取方式。鑒于MARC已不再適用新型資源的管理,圖書館專家著手利用最新技術(shù)對MARC進行改造,MARCXML因此誕生。雖然MARCXML部分解決了MARC格式的缺陷,使其在網(wǎng)絡(luò)時代獲得暫時性的新生[12],但它只是一種臨時的補救措施,并不能完全解決MARC對網(wǎng)絡(luò)資源的不適性。針對多變的網(wǎng)絡(luò)資源,1995年來自圖情檔和計算機領(lǐng)域的專家們在都柏林發(fā)布網(wǎng)絡(luò)世界的元數(shù)據(jù)標(biāo)準(zhǔn)DC。DC通過將元數(shù)據(jù)元素精簡到最低限度,確定最為核心的15個元素,以滿足對各種物理或電子資源的描述。經(jīng)過DCMI的維護與推廣,DC逐漸成為互聯(lián)網(wǎng)描述性元數(shù)據(jù)的通用標(biāo)準(zhǔn),也成為文化遺產(chǎn)領(lǐng)域新開發(fā)的數(shù)字圖書館系統(tǒng)的基礎(chǔ)元數(shù)據(jù)之一[13-14]。

數(shù)字圖書館系統(tǒng)的元數(shù)據(jù)管理方案復(fù)雜。它不僅需要對數(shù)字對象進行描述性記錄,還需要對數(shù)字對象本身的管理性與結(jié)構(gòu)性信息進行記錄,最后這三種類型的記錄還需要一個整體框架進行封裝,以實現(xiàn)對數(shù)字對象完整的元數(shù)據(jù)管理[15]。因此,即使部分圖書館集成系統(tǒng)支持對DC數(shù)據(jù)的管理,但依舊無法滿足圖書館的數(shù)字資源管理需求。在圖書館自動化系統(tǒng)時代,面向紙質(zhì)資源的圖書館集成系統(tǒng)元數(shù)據(jù)管理以MARC格式為主。1990年代后,面對格式多樣的資源,又出現(xiàn)了各種數(shù)字圖書館系統(tǒng)。資源管理系統(tǒng)的分裂導(dǎo)致圖書館資源分散,不僅降低了用戶信息檢索的效率,也影響了圖書館內(nèi)部業(yè)務(wù)的整合。雖然在信息服務(wù)方面,通過聯(lián)邦檢索[16],OAIPMH(Open Archives Initiative Protocol for Metadata Harvesting)、SRU(Search/Retrieve via URL)等元數(shù)據(jù)收割協(xié)議[17],或建設(shè)統(tǒng)一元數(shù)據(jù)倉儲[18]等技術(shù)手段實現(xiàn)資源的統(tǒng)一檢索,但在圖書館內(nèi)部業(yè)務(wù)整合潮流之下,圖書館自動化系統(tǒng)的升級慢了很多。圖書館不得不在原有的ILS基礎(chǔ)上開發(fā)各種補丁式工具,或者另起爐灶開發(fā)獨立的管理系統(tǒng),以滿足日益多樣的資源類型、用戶需求和業(yè)務(wù)流程[19]。這種打補丁堆疊的系統(tǒng)開發(fā)方式使ILS喪失了“集成性”,并導(dǎo)致數(shù)據(jù)的孤島化,進而降低了圖書館的服務(wù)效能[20]。圖書館需要更新系統(tǒng)以滿足不斷變化的需求。從2008年開始,系統(tǒng)生產(chǎn)商著手研發(fā)取代ILS的下一代圖書館系統(tǒng)。直到2010年,OCLC發(fā)布下一代圖書館系統(tǒng)WorldShare Management Services,才昭示紙電合一的圖書館服務(wù)平臺正式進入圖書館自動化市場。

2 圖書館服務(wù)平臺及其元數(shù)據(jù)管理

2.1 現(xiàn)狀與需求

在數(shù)據(jù)驅(qū)動業(yè)務(wù)轉(zhuǎn)型以及研究范式變化[21]的當(dāng)下,開放共享數(shù)據(jù)日漸成為重要的生產(chǎn)資料,圖書館的主要矛盾已變?yōu)橛脩魧D書館新型服務(wù)的需求與圖書館服務(wù)能力不足的矛盾,特別是深度的數(shù)據(jù)服務(wù)、知識服務(wù)、智慧服務(wù)等[22]。可以說第三代圖書館正在經(jīng)歷從信息環(huán)境到數(shù)據(jù)環(huán)境、知識環(huán)境的轉(zhuǎn)變,經(jīng)歷資源與信息服務(wù)向知識服務(wù)平臺的轉(zhuǎn)變[23]。

如阿克夫DIKW金字塔(Ackoff's pyramid)所描述的,知識是在信息之間建立有意義的聯(lián)系,而信息則是有組織的數(shù)據(jù)。從底層的數(shù)據(jù)到信息到知識乃至到理解與智慧,每個層次的上升關(guān)鍵在于在低層次的各部分之間建立聯(lián)系,產(chǎn)生新的模式,從而組成新的聚合體,并成為下一個層次的組成部分,而元數(shù)據(jù)正是其粘合劑[24]。一方面,傳統(tǒng)圖書館元數(shù)據(jù)無論是MARC還是DC都是以記錄為最小單位,無法應(yīng)對資源數(shù)據(jù)化和服務(wù)知識化的挑戰(zhàn);另一方面,圖書館服務(wù)平臺的統(tǒng)一資源管理與發(fā)現(xiàn)的基本特征決定了中央知識庫在整個平臺中的核心地位[25]。中央知識庫集成了其他各個模塊的異構(gòu)資源,提高了平臺效率、互操作性和自動化水平。針對多源異構(gòu)元數(shù)據(jù)的互操作,服務(wù)平臺需要在元數(shù)據(jù)之上建立某種機制,作為“元”元數(shù)據(jù)的知識本體就是一種解決方案[26]。長遠(yuǎn)看,無論是圖書館數(shù)據(jù)規(guī)范[27],還是資源發(fā)現(xiàn)服務(wù)[28],以一體化本體模型為基礎(chǔ)的元數(shù)據(jù)模式是相對高效的解決方案[29]。業(yè)務(wù)與系統(tǒng)功能整合、資源關(guān)聯(lián)與融合、服務(wù)智慧化與知識化這一圖書館新常態(tài)對新一代圖書館服務(wù)平臺的元數(shù)據(jù)管理提出了新的需求,即完整的生命周期管理、資源類型兼容、標(biāo)準(zhǔn)規(guī)范兼容、互聯(lián)網(wǎng)環(huán)境下的書目與規(guī)范控制、知識組織與知識融合[30]。

2.2 特點

(1)全媒體資源管理已經(jīng)成為智慧圖書館的基本功能。圖書館服務(wù)平臺需要兼容各種標(biāo)準(zhǔn),實現(xiàn)元數(shù)據(jù)間的互操作。位于架構(gòu)核心的中央知識庫的數(shù)據(jù)模型將作為現(xiàn)有元數(shù)據(jù)的共同子集,實現(xiàn)對各種標(biāo)準(zhǔn)的兼容。一方面支持圖書館靈活描述紙質(zhì)資源、電子資源、數(shù)字資源,不受限于文獻類型與格式;另一方面也支持用戶對跨媒體資源的內(nèi)容發(fā)現(xiàn)、識別、選擇、獲取與導(dǎo)航。

(2)新一代圖書館服務(wù)平臺不僅需要支持各類型圖書館本地特色性功能,也要滿足未來新型服務(wù)形式的開發(fā)需求。因此,針對各種個性化和未知性的需求,服務(wù)平臺的元數(shù)據(jù)是可擴展的。一方面新部署的應(yīng)用程序或模塊的元數(shù)據(jù)可以在原標(biāo)準(zhǔn)上進行應(yīng)用內(nèi)擴展,也可以啟用新標(biāo)準(zhǔn);另一方面中央知識庫的元數(shù)據(jù)可以通過映射轉(zhuǎn)換實現(xiàn)對新標(biāo)準(zhǔn)的兼容,或可以對現(xiàn)有模型進行擴展實現(xiàn)兼容。

(3)隨著語義網(wǎng)和關(guān)聯(lián)數(shù)據(jù)技術(shù)的日漸成熟,元數(shù)據(jù)的語義化改造已成為趨勢。伴隨著這股浪潮,知識服務(wù)、智慧服務(wù)正在成為圖書館新的發(fā)展方向。傳統(tǒng)元數(shù)據(jù)通過標(biāo)簽或字段名定義元素的語義信息,不同元數(shù)據(jù)標(biāo)準(zhǔn)即使字段名相同其含義也會不同。在開放數(shù)據(jù)情境下,無法精確定義的元素不能有效支持對知識的推斷。與傳統(tǒng)元數(shù)據(jù)相比,知識本體利用RDF進行形式化編碼,通過URI提供所標(biāo)識元素的上下文語境。它不僅利用URI的全網(wǎng)唯一性,實現(xiàn)圖書館在互聯(lián)網(wǎng)時代規(guī)范控制的宏愿,也使得資源描述的粒度由記錄級細(xì)化到陳述級,描述對象深入到知識和實體,激活圖書館的知識服務(wù)。新一代圖書館服務(wù)平臺元數(shù)據(jù)方案中本體與RDF的應(yīng)用,將打破圖書館行業(yè)的“孤芳自賞”,信息組織、規(guī)范控制的思想可以貢獻到整個網(wǎng)絡(luò)之中。同時,圖書館也可以整合機構(gòu)內(nèi)外的各種資源,在語義層面實現(xiàn)元數(shù)據(jù)互操作,賦予其機器可理解的能力,促進圖書館數(shù)據(jù)的開放與融合,助推圖書館服務(wù)轉(zhuǎn)型。

3 Alma平臺元數(shù)據(jù)管理

Alma是商業(yè)上最成功的圖書館服務(wù)平臺,無論是在用戶滿意度還是留存率上都處于第一梯度[31]。作為支持多類型資源管理和元數(shù)據(jù)協(xié)作的云服務(wù)平臺,Alma設(shè)計了不同于傳統(tǒng)圖書館集成系統(tǒng)的集中式元數(shù)據(jù)管理服務(wù)(Metadata Management Service,MMS)。一方面,Alma元數(shù)據(jù)根據(jù)需要存儲在三個不同的數(shù)據(jù)區(qū):機構(gòu)區(qū)(Institution Zone)、共享區(qū)(Community Zone)和網(wǎng)絡(luò)區(qū)(Network Zone)[32]。機構(gòu)區(qū)保存有圖書館本地的Alma配置和元數(shù)據(jù)。共享區(qū)是Alma對所有租戶開放的共享記錄部分,包含中央知識庫、規(guī)范數(shù)據(jù)庫和聯(lián)合書目庫。網(wǎng)絡(luò)區(qū)則保存機構(gòu)聯(lián)盟的共享記錄。這種混合模式允許機構(gòu)管理其獨特的本地館藏,同時支持一個共享的聯(lián)盟目錄,以及一個全球社區(qū)目錄。另一方面,每個數(shù)據(jù)區(qū)又分層為MMS記錄和館藏記錄(Inventory records)。MMS記錄包括各種配置信息,如導(dǎo)入、查重、數(shù)據(jù)合并,以及MARC、DC等多種格式的描述性記錄。館藏記錄包括紙質(zhì)資源的館藏復(fù)本記錄、電子資源檔案和數(shù)字資源表達(dá)與文檔,并進一步分為3層:知識實體層(intellectual entity,IE)、中間層(Middle level)和單件層(Item)[33],如圖1所示。知識實體層是一個不可見的透明實體,僅作為指向MMS記錄的指針。通過IE,館藏記錄與書目描述記錄實現(xiàn)關(guān)聯(lián)。中間層對不同資源類型有不同的層次分組,這個層級記錄包括紙質(zhì)資源的館藏信息、電子資源的服務(wù)信息、數(shù)字資源的表達(dá)信息。最底層的單件記錄是關(guān)于紙質(zhì)復(fù)本、電子文件、數(shù)字文檔的有關(guān)信息。

圖1 Alma元數(shù)據(jù)記錄分層結(jié)構(gòu)

Alma通過上述的分區(qū)、分層的元數(shù)據(jù)管理模式實現(xiàn)對包括本地、聯(lián)盟和全球社區(qū)的多源資源的共享與協(xié)作。也實現(xiàn)對多種元數(shù)據(jù)格式、內(nèi)容標(biāo)準(zhǔn)和通信協(xié)議的兼容,雖然這一定程度上增加了資源管理與業(yè)務(wù)操作的復(fù)雜性,但可以滿足圖書館對紙質(zhì)、電子和數(shù)字資源的統(tǒng)一管理與聚合揭示的需求[34]。另外,Alma利用嵌入式URI實現(xiàn)對關(guān)聯(lián)數(shù)據(jù)的支持,并通過RESTful API對外提供數(shù)據(jù)服務(wù)[35]。

新一代圖書館系統(tǒng)是圖書館平臺化轉(zhuǎn)型的基礎(chǔ)。平臺化的一個重要特征是開放的標(biāo)準(zhǔn)的信息生態(tài),任何人都可以在生態(tài)平臺上開發(fā)新的應(yīng)用與服務(wù)[36]。平臺化強調(diào)的是協(xié)作,是與利益相關(guān)方建立的社區(qū),合作創(chuàng)新促進更多價值的產(chǎn)生。按此理解,以Alma、WMS、Sierra為代表的商業(yè)LSP,更側(cè)重于圖書館在云環(huán)境中對各類型資源管理的能力。雖然它們在朝著平臺化方向發(fā)展,即使開放了API供數(shù)據(jù)交互,但本身仍然是一個缺乏其他行業(yè)參與者的“封閉”系統(tǒng)。

吳建中[37]、劉煒[38]在關(guān)于第三代圖書館及其圖書館系統(tǒng)的論述中都強調(diào)不同于傳統(tǒng)圖書館的空間服務(wù)、知識服務(wù)。以商業(yè)公司主導(dǎo)無論是集成性、開放性還是技術(shù)先進性的問題[39],并不能完全適應(yīng)第三代圖書館多樣性和差異化的發(fā)展趨勢。正如朱強所言,當(dāng)前圖書館對其管理系統(tǒng)的發(fā)展無話語權(quán),系統(tǒng)與數(shù)據(jù)開發(fā)商對數(shù)據(jù)庫和系統(tǒng)的壟斷極大地限制了我國圖書館的發(fā)展。因此,第三代圖書館需要更大的自主權(quán),利用松散耦合的應(yīng)用組合方式滿足本地的特色發(fā)展;需要一個模式自選、業(yè)務(wù)自組、數(shù)據(jù)自管的開放服務(wù)平臺應(yīng)對從資源到空間、從業(yè)務(wù)到服務(wù)的各種挑戰(zhàn)[40]。更強大的新一代圖書館服務(wù)平臺不僅要滿足統(tǒng)一的資源與業(yè)務(wù)管理,也要具有足夠的靈活性、擴展性和個性化,以支持圖書館大量已知或未知的業(yè)務(wù),滿足個性化發(fā)展需求。而這種社區(qū)驅(qū)動的平臺化在開源的FOLIO項目中可窺見一二。FOLIO不僅致力于開發(fā)一個創(chuàng)新的開源圖書館服務(wù)平臺,更是一個由圖書館、開發(fā)商、供應(yīng)商及其他利益機構(gòu)共同組成的協(xié)作社區(qū)。

4 FOLIO平臺及其元數(shù)據(jù)管理

4.1 FOLIO平臺的元數(shù)據(jù)方案

一方面,作為一個面向圖書館的微服務(wù)平臺,F(xiàn)OLIO的元數(shù)據(jù)方案遵循微服務(wù)架構(gòu)數(shù)據(jù)管理的域敏感,即每一個服務(wù)可以有自己的數(shù)據(jù)模型與數(shù)據(jù)存儲。根據(jù)業(yè)務(wù)需求,F(xiàn)OLIO將整個服務(wù)平臺劃分成不同的“域”,如典藏域、流通域、采訪域、數(shù)字資源管理域以及核心的Codex域等。每一個FOLIO域是由多個應(yīng)用程序(Apps)組成,完成特定任務(wù)的功能模塊。域的數(shù)據(jù)模型與元素秉承最小化原則,只保留滿足本模塊功能的核心元素。另一方面,F(xiàn)OLIO根據(jù)資源管理域所需的描述詳略程度和它們所服務(wù)的目的,將元數(shù)據(jù)記錄從下到上分成3層:正式記錄層(Formal Records)、業(yè)務(wù)記錄層(Working Records)、統(tǒng) 一 記 錄 層(Unifying Records)[41]。FOLIO針對具體的管理功能,根據(jù)文獻類型,在不同域的App中執(zhí)行。在預(yù)先了解了資源屬性與相應(yīng)的管理程序時,可以直接訪問這些應(yīng)用程序獲取和管理資源,即業(yè)務(wù)記錄層。但在一般情況下,是以Codex域中的應(yīng)用程序作為入口,即頂層的統(tǒng)一記錄層。根據(jù)需要,從Codex可以導(dǎo)航到系統(tǒng)的任何地方,以便在適當(dāng)?shù)膽?yīng)用環(huán)境中管理資源。如圖2所示,F(xiàn)OLIO通過Codex記錄與各種資源管理應(yīng)用程序中的業(yè)務(wù)記錄相鏈接,再與底層的正式記錄相連,形成一條從Codex到最細(xì)粒度元數(shù)據(jù)的鏈接路徑。

圖2 FOLIO系統(tǒng)的數(shù)據(jù)分層[41]

圖3 Codex數(shù)據(jù)模型[42]

4.1.1 Codex的元數(shù)據(jù)方案

Codex是一個規(guī)范的虛擬層,使用一個通用模型域與元素來整合不同類型資源,而不考慮格式、編碼或存儲位置。

(1)Codex定位于FOLIO平臺的數(shù)據(jù)注冊與鏈接中心,避免各業(yè)務(wù)域之間的糾纏。在FOLIO分層結(jié)構(gòu)中,位于頂層的Codex可以充當(dāng)不同模塊之間的協(xié)調(diào)者。每個模塊只需與中介模塊集成,即可實現(xiàn)對其他模塊的數(shù)據(jù)需求,而不用與其發(fā)生依賴關(guān)系。同時,Codex中介域的角色決定了它在整個FOLIO系統(tǒng)中的資源中心地位,其他資源管理模塊都會將其數(shù)據(jù)記錄通過映射轉(zhuǎn)換后在Codex域中生成對應(yīng)的記錄,自然也成為所有資源查詢的起點。從Codex開始,用戶可以深入到更低的、更豐富的業(yè)務(wù)、正式記錄層。

(2)作為一個域,Codex就有自己的概念模型來描述資源。在BIBFRAME 2分層模型和DC元素定義基礎(chǔ)上,Codex定義了一個輕量級的作品—實例—單件/館藏的3層數(shù)據(jù)模型。它是單個資源管理域所使用的更復(fù)雜、更專業(yè)的數(shù)據(jù)模型的共同交集。該模型足夠完整,可以滿足Codex域的資源描述任務(wù)。但又足夠的小,避免與其他域元數(shù)據(jù)過多的重復(fù)。另外,為滿足對電子資源的管理,Codex核心模型中還定義了資源包(Container)、覆蓋范圍(Coverage)和館藏地信息(Location),如圖3所示。

4.1.2 FOLIO的實體對象管理

以2008年瑞典國家圖書館的關(guān)聯(lián)書目數(shù)據(jù)發(fā)布為標(biāo)志,圖書館書目、規(guī)范數(shù)據(jù)的實體化轉(zhuǎn)向成為行業(yè)共識[43]。FOLIO的元數(shù)據(jù)方案融合BIBFRAME模型特征和DC的最小化原則,為滿足未來面向?qū)嶓w對象的下一代元數(shù)據(jù)管理構(gòu)建了良好的基礎(chǔ)。Codex愿景也表明對整個FOLIO服務(wù)平臺的實體標(biāo)識與關(guān)聯(lián)的設(shè)想。而在具體的實施層面,F(xiàn)OLIO則設(shè)計了專用的實體管理App(Entities Management App)[44]。

實體管理App是FOLIO平臺跨域進行實體規(guī)范控制的核心,它不僅可以對本地規(guī)范數(shù)據(jù)和取值詞表進行統(tǒng)一的創(chuàng)建、發(fā)布和永久URI維護,也可以對外部開放數(shù)據(jù)源進行實時調(diào)用檢索甚至于本地化緩存。FOLIO暫將實體分成代理(Agents)、體 裁(Genres)、地 理(Geographic)、主題(Subjects)、作品(Works)和其他6類實體。代理、地理、主題實體以及其他取值詞表,是傳統(tǒng)圖書館規(guī)范控制工作的延續(xù),外部來源可以包括VIAF、LC名稱規(guī)范庫(LCNAF),蓋蒂藝術(shù)家聯(lián)合名錄(Getty Union List of Artist Names)、地理名稱(GeoNames)、LC主題詞表(LCSH)、分面應(yīng)用主題詞表(FAST)、MARC和RDA中取值詞表等。體裁在用戶信息檢索中的重要性已經(jīng)得到證實[45],因此FOLIO將其作為一個獨立實體進行標(biāo)識管理,外部數(shù)據(jù)來源可以有善本手稿專業(yè)委員會詞表(RBMS Genre Terms),蓋蒂藝術(shù)與建筑詞表(Getty Art & Architecture Thesaurus)等。而作品實體作為書目領(lǐng)域最為核心的基礎(chǔ)實體,F(xiàn)OLIO更是在已有的書目本體方案基礎(chǔ)上,兼容了最新的研究進展,即作品—超級作品模型,其作品實體包含LC BIBFRAME Works、LC hub、OCLC Works、Share-VDE Works、Share-VDE Opus。其中的LC hub,Share-VDE Opus即是在實踐中對作品—實例—單件/館藏模型的擴展,在作品層之上定義超級作品,聚合相關(guān)作品,形成作品家族。

實體管理App的元數(shù)據(jù)方案遵循FOLIO平臺的域敏感以及分層結(jié)構(gòu)。實體管理App中的元數(shù)據(jù)屬于業(yè)務(wù)記錄層,主要是提供對受控字符串的訪問,而不是對實體的完整描述性。更詳細(xì)的正式記錄存儲在實體源記錄庫(Entities Source Record Storage)中,或直接鏈接到外部數(shù)據(jù)源。因此,其數(shù)據(jù)模型也是一個抽象層,不關(guān)心原始實體描述數(shù)據(jù)的格式或存儲位置。FOLIO Apps通過實體管理App提供的檢索查找服務(wù)或API獲取本地或外部的首選標(biāo)簽應(yīng)用于描述數(shù)據(jù)中。

4.2 與Alma元數(shù)據(jù)方案的比較

憑借后發(fā)優(yōu)勢,F(xiàn)OLIO在微服務(wù)域以及元數(shù)據(jù)模型設(shè)計上,原生支持基于語義的規(guī)范控制與知識融通。一方面,基于微服務(wù)架構(gòu)的FOLIO平臺是一個基于標(biāo)準(zhǔn)協(xié)議的框架,框架內(nèi)是一個個按照單一職能原則獨立開發(fā)和部署的應(yīng)用程序。不同的應(yīng)用程序根據(jù)不同的業(yè)務(wù)需求會設(shè)計不同的數(shù)據(jù)模型與元數(shù)據(jù)元素。而頂層的Codex域則解決了異構(gòu)資源的統(tǒng)一管理問題,同時中介各服務(wù)間的元數(shù)據(jù)鏈接,維持整個平臺的低耦合。另一方面,基于BIBFRAME設(shè)計的最小化元數(shù)據(jù)模型,以及實體管理App,都將保障FOLIO平臺實現(xiàn)圍繞實體進行身份的管理與服務(wù)。

Alma平臺雖然在異構(gòu)資源整合和基于MARC的業(yè)務(wù)流程上提供了強大的功能,但也因此在基于身份的實體管理方面依舊處于BIBFLOW所言的第一階段[46],即通過在MARC中 嵌 入URI,導(dǎo) 出BIBFRAME、RDA/RDF、JSON-LD記錄[47]在界面中顯示,或提供SPARQL、API端 點。Alma通 過FRBR化 在Primo發(fā)現(xiàn)層[48]對讀者提供有限的信息增值服務(wù),但其內(nèi)部元數(shù)據(jù)管理依舊圍繞記錄展開。雖然Alma在最新的開發(fā)路線圖中描述了圍繞關(guān)聯(lián)數(shù)據(jù)構(gòu)建的一套元數(shù)據(jù)管理流程[49],但受限于現(xiàn)有技術(shù)架構(gòu)與元數(shù)據(jù)方案,全面的實體轉(zhuǎn)向效果仍待觀察。二者元數(shù)據(jù)方案對比見表1。

表1 Alma與FOLIO元數(shù)據(jù)方案比較

5 結(jié)語

成也MARC,敗也MARC。進入互聯(lián)網(wǎng)時代,誕生于1960年代的MARC已經(jīng)成為圖書館融入網(wǎng)絡(luò)環(huán)境的一大掣肘。雖然在元數(shù)據(jù)方案方面,圖書館一直在積極變革,如1995年DC、1998年FRBR、2000年MARCXML、2002年MODS、2010年RDA、2011年BIBFRAME 1.0、2012年SchemaBibEx。圖書館元數(shù)據(jù)管理方案一直在努力實現(xiàn)更細(xì)粒度的深層描述與資源展示,但受限于圖書館管理系統(tǒng)與MARC的深度綁定,面向?qū)ο蟮膶嶓w編目以及跨領(lǐng)域的知識融合收效甚微。

新一代的圖書館服務(wù)平臺以全新的技術(shù)架構(gòu)整合各自獨立的圖書館系統(tǒng),通過一組標(biāo)準(zhǔn)化的內(nèi)部數(shù)據(jù)結(jié)構(gòu),或通過一種本地存儲不同類型記錄的機制,打破MARC格式的封閉性,同時支持各種元數(shù)據(jù)標(biāo)準(zhǔn),為圖書館提供一個開放的元數(shù)據(jù)管理環(huán)境[50],實現(xiàn)紙電合一的業(yè)務(wù)流程管理以及資源描述和發(fā)現(xiàn)服務(wù)。但在數(shù)據(jù)為王的時代,第三代圖書館需要對系統(tǒng)設(shè)計和數(shù)字資產(chǎn)擁有更大的自主權(quán)。以FOLIO為代表的新一代圖書館服務(wù)平臺可以滿足圖書館對管理系統(tǒng)的深度參與按需定制。FOLIO基于BIBFRAME和DC為基礎(chǔ)設(shè)計的Codex抽象數(shù)據(jù)層作為其元數(shù)據(jù)管理核心。同時,根據(jù)微服務(wù)的數(shù)據(jù)管理原則,對元數(shù)據(jù)記錄劃分為“統(tǒng)一記錄—業(yè)務(wù)記錄—正式記錄”的三層結(jié)構(gòu)。這樣一來,不僅可以跳出MARC“圍城”,不再考慮元數(shù)據(jù)格式以及存儲位置,為深度知識組合與融合提供基礎(chǔ);更進一步,F(xiàn)OLIO設(shè)計了單獨的實體管理App,順應(yīng)了互聯(lián)網(wǎng)環(huán)境下圖書館書目與規(guī)范控制的語義化趨勢,為圖書館資源與服務(wù)的“出圈”提供了可能。

猜你喜歡
數(shù)據(jù)管理服務(wù)平臺實體
密碼服務(wù)平臺
打造一體化汽車服務(wù)平臺
企業(yè)級BOM數(shù)據(jù)管理概要
定制化汽車制造的數(shù)據(jù)管理分析
海洋環(huán)境數(shù)據(jù)管理優(yōu)化與實踐
CTCS-2級報文數(shù)據(jù)管理需求分析和實現(xiàn)
論基于云的電子政務(wù)服務(wù)平臺構(gòu)建
前海自貿(mào)區(qū):金融服務(wù)實體
中國外匯(2019年18期)2019-11-25 01:41:54
基于云計算的民航公共信息服務(wù)平臺
實體的可感部分與實體——兼論亞里士多德分析實體的兩種模式
老河口市| 维西| 永嘉县| 梁山县| 长丰县| 张家港市| 奇台县| 色达县| 清徐县| 汨罗市| 尚志市| 龙门县| 都匀市| 固原市| 青铜峡市| 东至县| 汉寿县| 电白县| 兰考县| 霍邱县| 黄山市| 睢宁县| 库伦旗| 报价| 汕头市| 阜南县| 甘德县| 乡城县| 南通市| 保山市| 鄂伦春自治旗| 孟村| 丹棱县| 五寨县| 绵竹市| 鞍山市| 中方县| 台山市| 京山县| 虎林市| 五常市|