楊 靜 楊 崢 蔣蓓蓓
(金陵圖書(shū)館 江蘇南京 210019)
BIBFRAME是由美國(guó)國(guó)會(huì)圖書(shū)館(Library of Congress,LC)聯(lián)合Zepheira公司于2011年發(fā)起的“書(shū)目框架先導(dǎo)計(jì)劃”,旨在開(kāi)發(fā)一種替代MARC的書(shū)目數(shù)據(jù)格式[1]。BIBFRAME繼承了FRBR的思想,通過(guò)描述實(shí)體、屬性、實(shí)體間的層級(jí)關(guān)系來(lái)構(gòu)建模型,用來(lái)增強(qiáng)書(shū)目信息在Web環(huán)境中的發(fā)現(xiàn)。
2013年1月BIBFRAME1.0模型發(fā)布,提供了具體的元數(shù)據(jù)方案,并聯(lián)合德國(guó)國(guó)家圖書(shū)館、大英圖書(shū)館及聯(lián)機(jī)計(jì)算機(jī)圖書(shū)館中心(Online Computer Library Center,OCLC)等機(jī)構(gòu)進(jìn)行了大量的測(cè)試和開(kāi)發(fā),后于2016年1月發(fā)布了BIBRRAME2.0,版本發(fā)布后吸引了更多國(guó)家申請(qǐng)加入測(cè)試。目前其官網(wǎng)發(fā)布了BIBFRAME2.0與MARC21之間相互轉(zhuǎn)換工具、轉(zhuǎn)換規(guī)范、BIBFRAME編輯器、BIBFRAME2.0詞表等。
BIBFRAME2.0書(shū)目框架模型(見(jiàn)圖1)與之前的1.0版本最大的區(qū)別就是取消Authority(規(guī)范)和Annotation(注釋?zhuān)﹥蓚€(gè)核心級(jí)別,新增Item(單件),即將所要描述的信息簡(jiǎn)化為三個(gè)核心級(jí)別:Work(作品)、Instance(實(shí)例)和Item(單件),三者共同構(gòu)成了BIBFRAME2.0的三個(gè)層次,分別是Work(作品)代表的內(nèi)容層次,Instance(實(shí)例)代表的載體層次,和Item(單件)代表的單件層次,再通過(guò)定義相關(guān)的類(lèi)、屬性、關(guān)系來(lái)對(duì)文獻(xiàn)資源進(jìn)行富含語(yǔ)義的關(guān)系揭示[2]。
圖1 BIBFRAME2.0 書(shū)目框架模型
其中Work(作品)描述的是不同名稱(chēng)以及不同表達(dá)方式的同一作品,是一個(gè)抽象的集合,具有subject(主題)、agent(代理)、event(事件)等屬性;Instance(實(shí)例)描述的是載體層次,是Work(作品)的具體化表現(xiàn),因?yàn)橐粋€(gè)作品很可能包括很多實(shí)例,可能是電子版,也可能是印刷本,所以具有format(格式)和publisher(出版者)等屬性;Item(單件)通常理解為圖書(shū)館館藏信息的描述,如借閱狀態(tài)、副本信息等,該信息可以幫助用戶(hù)直接獲得所需資源,具有held by(持有者)和barcode(條形碼)等屬性。
BIBFRAME模型基于關(guān)聯(lián)數(shù)據(jù)技術(shù),注重描述實(shí)體之間、實(shí)體屬性之間的關(guān)系。如模型中Work(作品)、Instance(實(shí)例)和Item(單件)三個(gè)核心級(jí)別之間存在“has(有)”的關(guān)系,Work(作品)“有”Instance(實(shí)例),Instance(實(shí)例)“有”Item(單件)。還利用統(tǒng)一資源標(biāo)識(shí)符(Uniform Resource Identifier,URI)來(lái)標(biāo)識(shí)“作品”“實(shí)例”“單件”及其屬性,使書(shū)目數(shù)據(jù)實(shí)現(xiàn)在互聯(lián)網(wǎng)上的發(fā)布和共享。
雖然BIBFRAME誕生的目標(biāo)就是為了取代MARC,但在目前還未開(kāi)發(fā)完全的情況下,仍保持著與MARC的相互兼容,它繼承了MARC的語(yǔ)義性和一致性。美國(guó)國(guó)會(huì)圖書(shū)館在BIBFRAME官網(wǎng)上發(fā)布了BIBFRAME到MARC21的雙向轉(zhuǎn)換工具,并規(guī)定了轉(zhuǎn)換規(guī)范和轉(zhuǎn)換程序[3]。
在BIBFRAME2.0模型中,Work(作品)層次集合的是抽象的內(nèi)容,包含不同題名、不同語(yǔ)種或者不同表現(xiàn)形態(tài)的同一作品,具有subject(主題)、agent(代理)、event(事件)等屬性。Instance(實(shí)例)層次則描述的Work(作品)的具象內(nèi)容,具有fomart(格式)和publisher(出版者)等屬性。Work(作品)和Instance(實(shí)例)之間是1對(duì)n的關(guān)系[4],因?yàn)橥患髌房赡馨鄠€(gè)實(shí)例,舉例來(lái)說(shuō),《不能說(shuō)的秘密》這部作品在BIBFRAME2.0層級(jí)中屬于一個(gè)抽象內(nèi)容,因?yàn)樗梢詫?duì)應(yīng)電影《不能說(shuō)的秘密》、話(huà)劇《不能說(shuō)的秘密》、電子書(shū)《不能說(shuō)的秘密》、印刷本小說(shuō)《不能說(shuō)的秘密》等多個(gè)實(shí)例,于是每個(gè)實(shí)例又對(duì)應(yīng)著不同的格式和出版者等屬性。將抽象層次和具象層次分開(kāi)描述,同時(shí)給抽象和具象的內(nèi)容及其屬性都賦予URI,可以更準(zhǔn)確地展示它們之間的關(guān)系,從而提高檢索的準(zhǔn)確性和全面性。
雖然BIBFRAME的名稱(chēng)叫書(shū)目框架模型,但其目標(biāo)遠(yuǎn)不止對(duì)于書(shū)目數(shù)據(jù)的描述,還包括地圖、數(shù)據(jù)集、靜態(tài)圖像、動(dòng)態(tài)圖像、音頻、樂(lè)譜、舞譜、物體、多媒體、混合資料等多種形式的資源[5]。在各國(guó)的應(yīng)用測(cè)試過(guò)程中,BIBFRAME官方也提供多種元數(shù)據(jù)映射方案,如MODS(元數(shù)據(jù)對(duì)象描述模型)、EAD(編碼檔案描述模型)、Pica+(荷蘭圖書(shū)館自動(dòng)化中心,一種元數(shù)據(jù)格式)、DCMI(都柏林核心集)等,因此,BIBFRAME的適用范圍并不僅限于圖書(shū)館,還包括檔案館、博物館等機(jī)構(gòu)。
關(guān)聯(lián)數(shù)據(jù)四原則是萬(wàn)維網(wǎng)的發(fā)明者蒂姆·伯納斯·李(Tim Berners Lee)于2006年提出的關(guān)于建立數(shù)據(jù)之間鏈接的四個(gè)原則,即給所有事物賦予一個(gè)URI;用HTTP URI來(lái)標(biāo)識(shí)資源,使數(shù)據(jù)資源能夠在網(wǎng)絡(luò)環(huán)境下通過(guò)HTTP協(xié)議訪(fǎng)問(wèn)獲??;訪(fǎng)問(wèn)HTTP URI標(biāo)識(shí)的資源時(shí),可以根據(jù)標(biāo)識(shí)的URI發(fā)現(xiàn)更有意義的相關(guān)資源;提供相關(guān)的URI鏈接,以便用戶(hù)可以發(fā)現(xiàn)更多的關(guān)聯(lián)對(duì)象[6]。在BIBFRAME2.0模型的設(shè)計(jì)中,也遵循了關(guān)聯(lián)數(shù)據(jù)四原則的內(nèi)涵,即不論在哪一個(gè)層級(jí),不論是抽象還是具體的內(nèi)容,或是其各種屬性,都有一個(gè)HTTP URI來(lái)標(biāo)識(shí);BIBFRAME采用RDF(Resource Description Framework,資源描述框架)的編碼方式,當(dāng)有人查詢(xún)一個(gè)URI時(shí),使用標(biāo)準(zhǔn)的RDF提供與當(dāng)前資源相關(guān)的其他有用信息;當(dāng)發(fā)布書(shū)目數(shù)據(jù)時(shí),與更多相關(guān)資源的HTTP URI建立語(yǔ)義鏈接,提高用戶(hù)發(fā)現(xiàn)、獲取和使用網(wǎng)絡(luò)中潛在的相關(guān)信息資源的能力。
2013年8月BIBFRAME官方發(fā)布了一份《BIBFRAME使用案例與需求》討論稿,里面提出了BIBFRAME的15個(gè)應(yīng)用場(chǎng)景[7],這些應(yīng)用場(chǎng)景不僅面向圖書(shū)館工作人員,也面向讀者,甚至是面向圖書(shū)館以外的機(jī)構(gòu)使用。以下將整合選取其中8個(gè)方面的內(nèi)容試做分析,展示基于關(guān)聯(lián)技術(shù)的BIBFRAME是如何揭示書(shū)目信息,簡(jiǎn)化編目工作,并且使書(shū)目信息隨著網(wǎng)絡(luò)發(fā)揮前所未有的價(jià)值,使未來(lái)社會(huì)知識(shí)活動(dòng)中的不同角色都能夠從書(shū)目信息中獲得支持和服務(wù)成為可能。
需要指出的是,BIBFRAME采用SPARQL語(yǔ)言作為查詢(xún)語(yǔ)言,即SPARQL Protocol and RDF Query Language的縮寫(xiě),專(zhuān)門(mén)用于訪(fǎng)問(wèn)和操作RDF數(shù)據(jù)。W3C的RDF數(shù)據(jù)存取小組(RDF Data Access Working Group, RDAWG)對(duì)其進(jìn)行了標(biāo)準(zhǔn)化。在2008年,SPARQL1.0成為W3C官方所推薦的標(biāo)準(zhǔn),2013年發(fā)布了SPARQL1.1[8]。
BIBFRAME可以根據(jù)客戶(hù)端的地理信息方便地為用戶(hù)提供SoLoMo(社交本地移動(dòng))服務(wù)。例如,當(dāng)讀者需要查找附近30英里以?xún)?nèi)的一本書(shū),就可以用SPARQL語(yǔ)句實(shí)現(xiàn):
SELECT ?work ?inst ?lib
WHERE {
?work bf:title "PhantomTollbooth"
?inst bf:instanceOf ?work
?holdings bf:holds ?inst
?holdings bf:heldBy ?lib
?lib gs:nearby(40.1583 83.0742 30) .
}
用戶(hù)輸入作品題名(bf:title "PhantomTollbooth"),查找條件為該作品的某些實(shí)例(bf:inst a nceO f?work),通過(guò)用戶(hù)查詢(xún)的設(shè)備定位坐標(biāo)(40.1583 83.0742 30),查找出符合距離條件的圖書(shū)館館藏(?holdings bf:heldBy ?lib)。其實(shí)這種SoLoMo服務(wù)早已根植于各類(lèi)互聯(lián)網(wǎng)應(yīng)用中了,是一種基于本地的移動(dòng)社交概念,如大眾點(diǎn)評(píng)APP中,用戶(hù)可以根據(jù)某一位置查找附近某一距離內(nèi)的餐飲、景點(diǎn)、住宿、休閑等服務(wù),并可以按照距離、評(píng)價(jià)等順序排列。同樣,BIBFRAME書(shū)目框架模型也可以根據(jù)客戶(hù)端的地理信息方便地為用戶(hù)提供SoLoMo服務(wù),甚至設(shè)想可以加入距離內(nèi)實(shí)體書(shū)店、檔案館、博物館的關(guān)聯(lián)數(shù)據(jù)搜索結(jié)果,只要他們同樣采用BIBFRAME對(duì)書(shū)目、檔案、藏品進(jìn)行編目,由此可以增加用戶(hù)發(fā)現(xiàn)資源、獲取資源的途徑。
用戶(hù)在查找圖書(shū)館館藏的某件作品時(shí),BIBFRAME會(huì)優(yōu)先顯示適應(yīng)當(dāng)前設(shè)備的實(shí)例類(lèi)型,如手機(jī)端、平板端就會(huì)推薦電子資源。用SPARQL語(yǔ)句實(shí)現(xiàn)如下:
SELECT ?work ?inst ?lib
WHERE {
?work bf:title "Fahrenheit451"
?work bf:hasInstanceOf ?inst
?inst rdf:type bf:Ebook
?inst bf:fomat
}
當(dāng)讀者需要找一本Fahrenheit451的書(shū)時(shí),BIBFRAME根據(jù)當(dāng)前設(shè)備的情況優(yōu)先顯示Ebook資源種類(lèi),于是顯示了一本來(lái)源于idpf網(wǎng)站上epub格式的電子資源實(shí)例。
目前,國(guó)內(nèi)外的圖書(shū)館幾乎采用的都是MARC格式的編目格式,其檢索方式一般為:用戶(hù)查詢(xún)某作品,須先進(jìn)入圖書(shū)館OPAC檢索平臺(tái),根據(jù)所選擇的題名、責(zé)任者、主題詞等檢索點(diǎn),才能檢索出與MARC字段相對(duì)應(yīng)的結(jié)果,在檢索結(jié)果頁(yè)面可以獲得該作者在本OPAC系統(tǒng)上的其他作品鏈接,國(guó)內(nèi)用戶(hù)可獲得豆瓣、當(dāng)當(dāng)、谷歌讀書(shū)等網(wǎng)絡(luò)社區(qū)關(guān)于本作品討論、書(shū)評(píng)、購(gòu)買(mǎi)的鏈接。而B(niǎo)IBFRAME以數(shù)據(jù)關(guān)聯(lián)技術(shù)為基礎(chǔ),以URI來(lái)標(biāo)識(shí)“作品”或者其“主題”“代理”“事件”等屬性,采用RDF數(shù)據(jù)建模,能夠使書(shū)目數(shù)據(jù)易于被萬(wàn)維網(wǎng)識(shí)別和處理,擴(kuò)大檢索范圍,提高檢索結(jié)果的質(zhì)量。
BIBFRAME的設(shè)計(jì)比一般的書(shū)目格式更具開(kāi)放性,不僅在圖書(shū)館領(lǐng)域,在檔案館、博物館等機(jī)構(gòu)同樣適用,因?yàn)樗梢悦枋鑫谋?、地圖、數(shù)據(jù)集、靜態(tài)圖像、動(dòng)態(tài)圖像、音頻、樂(lè)譜、舞譜、物體、多媒體、混合資料共11種資源類(lèi)型,其對(duì)某一資源的檢索結(jié)果可以是全方位、多元化的立體屬性。同時(shí)為MARC、MODS、RDA、FRBR等多種元數(shù)據(jù)提供映射方案,為BIBFRAME連接世界打開(kāi)了一扇窗戶(hù)[9]。
可以設(shè)想當(dāng)用戶(hù)檢索某一歷史人物時(shí),不僅可以檢索到有關(guān)該歷史人物在圖書(shū)館里的單一文本形式的文獻(xiàn)資源,還可以獲得圖書(shū)館外的資源,例如博物館里與該人物關(guān)聯(lián)的歷史事件、考古挖掘、出土文物,檔案館里與該人物關(guān)聯(lián)的手稿、作品、檔案,甚至是視頻網(wǎng)站上與該人物關(guān)聯(lián)的影視作品等全方位的檢索結(jié)果。這類(lèi)似于維基百科的詞條,可以通過(guò)鏈接自由跳轉(zhuǎn)到我們感興趣的對(duì)象或者內(nèi)容上去。
BIBFRAME另一方面也簡(jiǎn)化了編目人員的工作流程。如果編目人員獲得一件作品,是The Shadow Club的電子資源,作者是Neal Shusterman,需要將其添加至本地圖書(shū)館,那么編目人員只要在圖書(shū)館聯(lián)合編目系統(tǒng)中搜索到關(guān)于該作者的所有電子資源,將符合條件的實(shí)例拷貝到本地,賦予一個(gè)本地URI并添加它與本地作品的關(guān)系,同時(shí)為該實(shí)例添加item(單件),即館藏信息URI。
當(dāng)一件作品原作用A語(yǔ)種出版后,可能會(huì)被翻譯成B語(yǔ)種、C語(yǔ)種、D語(yǔ)種……全球發(fā)行,那么在書(shū)目信息中就需要經(jīng)常更新信息,在BIBFRAME中,作品Work是以HTTP URI來(lái)標(biāo)識(shí)的,具有唯一性和共享性,全球各地的圖書(shū)館員都可以通過(guò)互聯(lián)網(wǎng),引用該作品的書(shū)目信息。當(dāng)有新的語(yǔ)種信息產(chǎn)生時(shí),只需要通過(guò)觸發(fā)器(Trigger),向原作品擁有者發(fā)出通知[10],例如作者Kurt Vonnegut的作品Bluebread被翻譯成了印地語(yǔ),那么印度的圖書(shū)館員便會(huì)操作如下:
(1)在網(wǎng)絡(luò)上的BIBFRAME規(guī)范控制服務(wù)中查詢(xún)?cè)撟髌返脑髡摺?/p>
…
bf:title”Bluebread”
(2)拷貝該作品書(shū)目信息到本地,賦予一個(gè)本地的URI,編輯添加本地語(yǔ)種信息。
a bf:Monograph;
bf:title”Barbablu”;
bf:author< http://bibframe.org/auth/people/kurt_vonnegut>;
bf:translator
BIBFRAME中圖書(shū)館采訪(fǎng)人員在文獻(xiàn)采購(gòu)階段就可以率先開(kāi)始部分編目工作了。由于采購(gòu)人員在流程一開(kāi)始就已經(jīng)知道了采訪(fǎng)對(duì)象的基本信息,所以可以先行在采購(gòu)目錄中添加“Work”(作品)、“Instance”(實(shí)例)、“Item”(單件)等部分信息,讀者在查詢(xún)時(shí)也可以看到某作品或?qū)嵗幱凇皁n order”(已訂購(gòu))的狀態(tài)。當(dāng)編目人員正式開(kāi)始編目時(shí),會(huì)發(fā)現(xiàn)聯(lián)合編目系統(tǒng)中已經(jīng)有新采購(gòu)資源的部分書(shū)目信息,這就是前期采訪(fǎng)人員所添加的,此時(shí),編目人員只需接受更新,便會(huì)大大減少后期編目工作量。
(1)采訪(fǎng)人員在聯(lián)機(jī)編目系統(tǒng)中查找采購(gòu)訂單上的作品和實(shí)例。
在編目人員拿到具體實(shí)例之后就可以繼續(xù)添加館藏地(bf:physicalLocation)、分類(lèi)號(hào)(bf:shelfMarkCLC)等單件信息。
在MARC編目中,編目信息之間缺乏關(guān)聯(lián),無(wú)法識(shí)別用戶(hù)語(yǔ)義檢索的需求。如在某圖書(shū)館的OPAC檢索系統(tǒng)中,責(zé)任者輸入“冰心”,可以檢索到368條記錄,而輸入“謝婉瑩”則僅搜到2條記錄,且不是同一個(gè)人。而在BIBFRAME中,可以利用關(guān)聯(lián)數(shù)據(jù)中owl:sameAs在不同規(guī)范實(shí)體間建立等同關(guān)系。
這樣,當(dāng)讀者檢索謝婉瑩時(shí),也能檢索到冰心的作品。
BIBFRAME的問(wèn)世,表明了圖書(shū)館界也在積極順應(yīng)技術(shù)進(jìn)步和社會(huì)需求,利用關(guān)聯(lián)技術(shù)深度揭示書(shū)目信息所蘊(yùn)含的知識(shí),挖掘書(shū)目信息的價(jià)值,使其不再“藏于深閨”。這不僅是對(duì)圖書(shū)館內(nèi)部的采訪(fǎng)、編目、參考咨詢(xún)等業(yè)務(wù)在工作流程上的全方位的革新,更是對(duì)圖書(shū)館人工作、服務(wù)理念的轉(zhuǎn)變,圖書(shū)館人要著眼于服務(wù)知識(shí)生產(chǎn)、傳播、消費(fèi)等全生態(tài)鏈條,使知識(shí)生產(chǎn)、文化交流中的不同角色都能夠在圖書(shū)館得到供需適配的支持和服務(wù)。
BIBFRAME在美國(guó)國(guó)會(huì)圖書(shū)館、Zepheira公司、聯(lián)機(jī)計(jì)算機(jī)圖書(shū)館中心以及高校圖書(shū)館的共同合作下持續(xù)完善。在2021年冬季召開(kāi)的年會(huì)上,美國(guó)國(guó)會(huì)圖書(shū)館宣布BIBFRAME 100計(jì)劃的目標(biāo)調(diào)整為“成功達(dá)成80%—90%的編目員使用BIBFRAME編目”。從新生事物的演化規(guī)律來(lái)看,一項(xiàng)事物一旦突破了關(guān)鍵技術(shù)的制約,就會(huì)迅速和蓬勃的發(fā)展,BIBFRAME具有遠(yuǎn)超MACR的諸多優(yōu)勢(shì)和廣闊前景。目前我國(guó)僅有上海圖書(shū)館的家譜知識(shí)平臺(tái),以關(guān)聯(lián)數(shù)據(jù)技術(shù)為基礎(chǔ),設(shè)計(jì)了BIBFRAME家譜本體,以及華東師范大學(xué)的數(shù)字方志集成平臺(tái)基于BIBFRAME2.0等詞表構(gòu)建數(shù)字方志知識(shí)庫(kù)本體模型,并正式上線(xiàn)服務(wù)。所以,我國(guó)圖書(shū)情報(bào)界必須盡快達(dá)成共識(shí),搶抓機(jī)遇、乘勢(shì)而上,積極開(kāi)展相關(guān)研究和國(guó)際交流,為我國(guó)“智慧圖書(shū)館”乃至“智慧社會(huì)”建設(shè)作出更大貢獻(xiàn)。