安曉麗 (江蘇科技大學(xué)圖書館 江蘇 鎮(zhèn)江 212003)
BIBFRAME與圖書館工作的變革*
安曉麗(江蘇科技大學(xué)圖書館 江蘇 鎮(zhèn)江 212003)
作為新的書目數(shù)據(jù)格式,BIBFRAME具有三大創(chuàng)新之處:面向語義網(wǎng),以關(guān)聯(lián)數(shù)據(jù)為基礎(chǔ);采用FRBR的“實體-關(guān)系”模型和RDF模型;適用范圍廣。BIBFRAME給圖書館帶來了觀念上和具體業(yè)務(wù)流程上(采購、編目和檢索)的巨大變革。編目員需轉(zhuǎn)變觀念,參加培訓(xùn),積極應(yīng)對BIBFRAME。
BIBFRAME(書目框架)圖書館書目數(shù)據(jù)格式
作為圖書館重要的“大數(shù)據(jù)”, 書目數(shù)據(jù)貫穿于圖書館的所有業(yè)務(wù)流程中,從采訪到編目,從館藏揭示到讀者服務(wù)。這些“大數(shù)據(jù)”如果能融入互聯(lián)網(wǎng),被全球用戶利用,那將是一件很有價值的事情。目前,我們采用的書目數(shù)據(jù)格式是MARC格式,隨著館藏資源向著數(shù)字資源的拓展和互聯(lián)網(wǎng)的全方位滲透,MARC不適用于網(wǎng)絡(luò)的弊端已呈現(xiàn)出來,于是BIBFRAME(書目框架)應(yīng)運而生。
BIBFRAME源于美國國會圖書館的一項全稱為Bibliographic Framework Initiative的計劃,該計劃能使未來的書目描述出現(xiàn)在因特網(wǎng)上,不僅為圖書館具體需求服務(wù),而且服務(wù)于更寬泛的信息社區(qū)。該計劃將帶來全新的資源描述方式和資源發(fā)布方式:明確區(qū)分資源的概念屬性和外部表現(xiàn)、明確識別資源的實體(如規(guī)范數(shù)據(jù))、揭示實體間的關(guān)系。在網(wǎng)絡(luò)世界里,能將作品的概念屬性(作者或標(biāo)題等)和作品的外部形態(tài)(頁碼、是否有附錄等)區(qū)別開來是一件很重要的事。盡管該計劃給我們展示了一種新的有望取代MARC的書目數(shù)據(jù)格式,但它的目標(biāo)遠不止于此,還包括研究書目描述、數(shù)據(jù)創(chuàng)造及數(shù)據(jù)轉(zhuǎn)換的所有影響因素,兼容不同的目錄模型和分類規(guī)則,探索新的數(shù)據(jù)輸入方法,評估信息交換協(xié)議等[1]。該計劃的最終目的是形成一套適應(yīng)互聯(lián)網(wǎng)的書目信息應(yīng)用規(guī)范(包括模型與實體、術(shù)語詞表、編碼及打包規(guī)則),以實現(xiàn)與圖書館以外的網(wǎng)絡(luò)空間的信息交換[2]。
模型和詞匯是BIBFRAME的重要組成部分。BIBFRAME模型作為一種概念模型,將在需詳細記錄的書目描述、其他文化材料的描述、不需詳細描述的記錄之間作出平衡。BIBFRAME模型里有4種類或?qū)嶓w:創(chuàng)造性作品(creative work)、實例(instance)、規(guī)范(authority)、注釋(annotation)。創(chuàng)造性作品能反映待編資源的概念屬性;實例是能反映作品的個體和材料組成的資源;規(guī)范是能揭示作品和實例之間關(guān)系的關(guān)鍵概念的資源,包括人物(people)、地點(places)、主題(topics)、組織(organizations)等,規(guī)范數(shù)據(jù)的一個重要概念是域,負責(zé)資源的識別和組織;注釋是有助于我們擴充待編資源以外知識的資源,包括書評、摘要和封面設(shè)計等。這些被解構(gòu)的信息資源將被再建構(gòu)成有關(guān)聯(lián)的數(shù)據(jù),當(dāng)我們利用網(wǎng)絡(luò)搜索數(shù)據(jù)時,本地資源集合、特殊資源集合及第三方數(shù)據(jù)都會呈現(xiàn)給我們,最初的那些書目資源將以一種顆?;男问奖桓佑行У睦肹3]。
BIBFRAME詞匯是資源描述的關(guān)鍵,如同MARC有一套定義過的元素和屬性,BIBFRAME詞匯也有一套被定義過的類和屬性,一個類代表一種BIBFRAME資源,屬性則是對該資源更深層次的描述,可理解為子類。類和屬性有嚴格的設(shè)計規(guī)則和命名約定,不可隨意使用。例如,“an RDF classs”是指一類型事物;“BIBFRAME core classes”是指作品、實例、規(guī)范和注釋;“domain and range”分別是指一個RDF三元組的主題和一個RDF三元組的目標(biāo)或被渴望實現(xiàn)的價值;“structured entity”是指被結(jié)構(gòu)化的且被定義了屬性的類、子類或核心類等。BIBFRAME詞匯使用關(guān)聯(lián)數(shù)據(jù)模型,并利用RDF建模,使得所有實體、屬性及其關(guān)系都成為網(wǎng)絡(luò)資源[4]。
2.1BIBFRAME與MARC
作為目前圖書館界的主流書目數(shù)據(jù)格式,MARC是由若干條記錄組成的數(shù)據(jù)庫,結(jié)構(gòu)化特征明顯。其外在表現(xiàn)是一條條具體的記錄,每條記錄由揭示資源特征的字段和子字段組成。MARC重點關(guān)注能單獨理解的分類記錄,一條記錄聚合了概念作品及其物理載體信息,同時借助字符串標(biāo)識記錄之外有價值的個人名稱、企業(yè)名稱、主題等信息[1]。MARC將資源的每種信息都捆綁在一起成為一條完整記錄,導(dǎo)致多條記錄之間存在重復(fù)信息,且不能直接用于圖書館系統(tǒng)之外的環(huán)境交流,不能增加評論、視頻和聲音等。
與MARC相比,BIBFRAME的創(chuàng)新之處表現(xiàn)在以下幾點:首先,BIBFRAME面向語義網(wǎng),以關(guān)聯(lián)數(shù)據(jù)為基礎(chǔ),決定了其是適用于網(wǎng)絡(luò)的。語義網(wǎng)是在萬維網(wǎng)基礎(chǔ)上增加了資源描述框架(RDF)編碼,使部分網(wǎng)絡(luò)資源具有語義表達能力,而關(guān)聯(lián)數(shù)據(jù)是語義網(wǎng)的簡化實現(xiàn)形式,關(guān)聯(lián)數(shù)據(jù)的重要原則是使用HTTP URI作為任何事物的標(biāo)識,任何人都能訪問這些標(biāo)識,當(dāng)有人訪問時能提供有用的信息和相關(guān)的URI[5]。BIBFRAME的最小單位不是記錄,是記錄被拆分后的一個個相互關(guān)聯(lián)的更小粒度的語義單元。這些語義單元將被賦予唯一的HTTP URI標(biāo)識,實現(xiàn)不同命名間的跨網(wǎng)域鏈接,從而實現(xiàn)整個網(wǎng)絡(luò)空間的覆蓋。其次,BIBFRAME借鑒了FRBR(書目記錄功能需求)的“實體-關(guān)系”模型,重點關(guān)注資源之間的關(guān)系(作品之間、作品與實例之間、作品與規(guī)范數(shù)據(jù)之間),并通過可控的人名、地點和語種等標(biāo)識符達到揭示這種關(guān)系的目的。在網(wǎng)絡(luò)世界中,事物間的關(guān)聯(lián)很重要。RDF模型也是BIBFRAME的精髓,BIBFRAME模型是使圖書館書目數(shù)據(jù)成為浩瀚網(wǎng)絡(luò)數(shù)據(jù)中的一部分的關(guān)鍵所在。BIBFRAME為網(wǎng)絡(luò)而生,能使書目數(shù)據(jù)在網(wǎng)絡(luò)上發(fā)布、共享,這是它最顯著的特點。最后,BIBFRAME適用性廣,不僅可描述圖書館書目,而且可應(yīng)用于對計算機程序、博客文章、靜態(tài)動態(tài)圖象等的描述。
2.2BIBFRAME與RDA
BIBFRAME與RDA(資源描述與檢索)關(guān)系密切,如同機讀目錄格式是參照AACR確立的,BIBFRAME同樣是參照RDA制定的。作為新的國際編目標(biāo)準(zhǔn),RDA是以AACR2為基礎(chǔ),以FRBR和FRAD(規(guī)范數(shù)據(jù)功能需求)為模型,解決數(shù)字環(huán)境下不同類型資源在著錄項目、著錄格式、著錄用標(biāo)識符等方面的標(biāo)準(zhǔn)問題,進而實現(xiàn)對各類型資源的書目控制。RDA將圖書館編目對象抽象為三類實體:作品、責(zé)任者實體(個人、家族和機構(gòu)團體)、主題類實體(概念、地點、事件和實物),再從屬性和關(guān)系兩方面進行規(guī)范控制,改變了AACR2以具體的資源類型分述編目規(guī)則的體例。RDA的三大特點是編目標(biāo)準(zhǔn)FRBR化、編目標(biāo)準(zhǔn)適于網(wǎng)絡(luò)、編目標(biāo)準(zhǔn)適用范圍廣及兼容性強[6]。
RDA以FRBR為模型,BIBFRAME以RDA為基礎(chǔ),所以BIBFRAME也是在間接吸收FRBR關(guān)于實體、屬性、實體間關(guān)系、實體與屬性間關(guān)系的概念模型基礎(chǔ)上對書目信息進行編碼,但BIBFRAME并未完全照搬而是簡化了FRBR模型,而RDA是FRBR模型的忠實實踐者,所以BIBFRAME與RDA的編目數(shù)據(jù)并不完全一致。
技術(shù)在進步,社會在發(fā)展,圖書館無疑也需要變革。在館藏資源利用率日趨下降、入館讀者日趨減少的當(dāng)下,圖書館該如何轉(zhuǎn)型才能在新環(huán)境中繼續(xù)發(fā)揮其收藏知識、傳播文化的職能?與網(wǎng)絡(luò)息息相關(guān)的BIBFRAME無疑給我們指出了一條新出路。BIBFRAME作為一種新生事物,其實際價值有哪些?對圖書館將產(chǎn)生怎樣的變革?
3.1 觀念上的變革
BIBFRAME開啟了一種“大圖書館”的思維方式,顛覆了傳統(tǒng)的狹隘理念。所謂“大圖書館”,是指圖書館的書目資源以更加開放、更加共享的形式融入互聯(lián)網(wǎng),書目資源的價值變“大”了,圖書館的利用率變“大”了,與外界的藩籬被打破,圖書館空前的變“大”改變了傳統(tǒng)環(huán)境下書目資源只能在自身系統(tǒng)內(nèi)被利用的封閉的“小”格局。我們狹隘的、僅圍繞資源和服務(wù)的“小”觀念將受到?jīng)_擊。
3.2具體業(yè)務(wù)工作上的變革
BIBFRAME書目框架與網(wǎng)絡(luò)有著天然的淵源,從模型到詞表再到技術(shù)架構(gòu)等都是為融入網(wǎng)絡(luò)而設(shè)計的,這也決定了圖書館各項業(yè)務(wù)將在新的以BIBFRAME為格式的系統(tǒng)中完成。而MARC格式下的各項業(yè)務(wù)是在圖書館自動化管理系統(tǒng)(ILAS、匯文等)中完成,自成一體,與外界不發(fā)生信息交流。
3.2.1采購的變革
傳統(tǒng)的采購數(shù)據(jù)是由出版商提供的比較簡單的MARC數(shù)據(jù),格式固定,維護起來比較麻煩,而BIBFRAME下采購人員在采購階段就能添加更詳細的“作品”“實例”等信息,這些信息反饋給讀者,便于讀者及早地了解到某資源已在訂購中。當(dāng)訂購資源到位后,編目人員看到的也是更新后的全面信息,實現(xiàn)了采購、編目和檢索的協(xié)作。
3.2.2編目的變革
BIBFRAME對編目這一業(yè)務(wù)流程影響最大,將實現(xiàn)真正意義上的網(wǎng)絡(luò)編目。在手工編目時代,每個圖書館都在編目,館際之間缺少合作,造成書目資源的封閉、浪費、重復(fù);聯(lián)合編目時代是計算機編目,大多數(shù)圖書館可以共享少數(shù)幾個圖書館的書目資源,人財物得到了節(jié)??;時代發(fā)展到現(xiàn)在的網(wǎng)絡(luò)編目,關(guān)聯(lián)的書目數(shù)據(jù)融入萬維網(wǎng),同時各圖書館既可以使用數(shù)據(jù),也可以更新數(shù)據(jù),館際合作空前繁榮,實現(xiàn)了真正意義上的與全球網(wǎng)絡(luò)的對接及資源的共享共建,對編目員來說,開闊了視野,提高了效率。例如,要對某館藏作品進行維護,先到BIBFRAME的新系統(tǒng)中找到該作品(相當(dāng)于一個具有HTTP URI的多種屬性的關(guān)聯(lián)數(shù)據(jù)),再復(fù)制到本地系統(tǒng),賦予其一個本地URI,最后添加相關(guān)信息即可[7]。新系統(tǒng)還有個更大的特點,當(dāng)某作品的關(guān)聯(lián)屬性需要更新時,任何圖書館發(fā)現(xiàn)后都可以被授權(quán)操作,進而更新到系統(tǒng)中,被全網(wǎng)絡(luò)共享。
3.2.3檢索的變革
BIBFRAME和MARC是兩種不同的檢索方式,其實施過程和檢索效率也大不相同。MARC格式下,當(dāng)我們搜索某種資源時,需要進入圖書館OPAC系統(tǒng),我們可獲得與MARC字段屬性保持一致的檢索結(jié)果,同時也獲得了相關(guān)資源(包括鏈接到豆瓣網(wǎng)、Google和Baidu可查看到的相關(guān)書評和作者簡介等信息),還可以獲取該責(zé)任者在該OPAC系統(tǒng)中的其他作品。
采用BIBFRAME后將拓寬檢索范圍,改善服務(wù)質(zhì)量。BIBFRAME以關(guān)聯(lián)數(shù)據(jù)為實現(xiàn)方式,而關(guān)聯(lián)數(shù)據(jù)是基于HTTP URI等成熟的網(wǎng)絡(luò)技術(shù),以HTTP URI標(biāo)識的數(shù)據(jù)可方便地鏈接到網(wǎng)絡(luò)的數(shù)據(jù)集中;同時關(guān)聯(lián)數(shù)據(jù)采用RDF數(shù)據(jù)模型對數(shù)據(jù)建模,使數(shù)據(jù)易被機器識別和處理[7]。所以,基于BIBFRAME的檢索結(jié)果是可獲取到關(guān)于某事物的立體化的多種屬性,遠超越了MARC以文本出現(xiàn)的單一屬性,并且萬維網(wǎng)的搜索引擎能覆蓋到這些書目數(shù)據(jù)。例如,當(dāng)我們以題名項屬性搜索某種資源時,檢索結(jié)果是多方位的,不僅包括該題名的資源,還包含與該題名資源的其他屬性(ProviderEventRelationLanguage)相關(guān)的資源,還包含與注釋模型中的一些信息相關(guān)的資源(關(guān)于作品的評論、關(guān)于作者的傳記信息、關(guān)于出版者介紹等)。對于用戶來講,如此豐富的有關(guān)聯(lián)的檢索結(jié)果算是一次高質(zhì)量的檢索體驗。
BIBFRAME順應(yīng)了技術(shù)發(fā)展和社會發(fā)展潮流,前景良好。但也存在幾個疑慮:一是管理層的擔(dān)憂,BIBFRAME的調(diào)試使用需要大量的經(jīng)濟投入,這樣的經(jīng)濟投入是否有必要?BIBFRAME到底能帶來多大的價值?畢竟新技術(shù)的應(yīng)用說到底是一個經(jīng)濟問題,而不只是與時俱進的觀念問題[8]。二是人員的抵觸,BIBFRAME使用后將改善編目,改變圖書館所有業(yè)務(wù),但前期的新系統(tǒng)的接受適應(yīng)、觀念的扭轉(zhuǎn)、新技能的拓展并不容易,保守的工作人員會有抵觸情緒。三是BIBFRAME的規(guī)范控制如何實現(xiàn)?既然各個機構(gòu)都有更新書目數(shù)據(jù)的權(quán)利,其結(jié)果可能導(dǎo)致書目質(zhì)量下降。為保證高質(zhì)量的書目數(shù)據(jù),需進行規(guī)范控制,建立配套的書目質(zhì)量標(biāo)準(zhǔn)和監(jiān)控體系,還可引入社會化眾包模式進行規(guī)范檔的糾錯維護,利用大數(shù)據(jù)分析進行自動的規(guī)范術(shù)語的獲取[9]。
盡管MARC格式在圖書館界曾做出了巨大貢獻,盡管BIBFRAME的被認可、被應(yīng)用還需要一段時間,但未來發(fā)展趨勢必將是MARC與BIBFRAME并存或被取代。BIBFRAME對圖書館的影響不僅是編目,而是整個業(yè)務(wù)流程;不僅是實踐上的,更是思維方式上的。我們該如何應(yīng)對BIBFRAME?作為圖書館,需整合有限的資源以加快促成格式轉(zhuǎn)換這一戰(zhàn)略目標(biāo)的實施,具體做法:一是進行基礎(chǔ)設(shè)施方面的投入,包括軟硬件、網(wǎng)絡(luò)配置、基于BIBFRAME書目框架的新系統(tǒng)的引進和維護、原自動化管理系統(tǒng)的處置;二是實施培訓(xùn)計劃,BIBFRAME徹底顛覆了我們目前的工作和思維,所以進行新系統(tǒng)和新技能的培訓(xùn)很有必要。作為編目員,為適應(yīng)未來的關(guān)聯(lián)數(shù)據(jù)目錄和工作流程,首先要轉(zhuǎn)變觀念,認識到書目信息不再局限于某個系統(tǒng)或某家機構(gòu),而是在整個互聯(lián)網(wǎng)空間傳輸和交流;其次,需要學(xué)習(xí)新知識和發(fā)展新技能,如關(guān)聯(lián)數(shù)據(jù)、RDF、HTTP URI技術(shù)、規(guī)范控制、新系統(tǒng)的理解掌握等。
BIBFRAME計劃從提出到現(xiàn)在已有4年之久,其間經(jīng)歷了關(guān)聯(lián)數(shù)據(jù)模型草案的推出、功能需求和用例的發(fā)布、BIBFRAME詞表的發(fā)布、規(guī)范控制的更新等工作。而我們所能做的是多關(guān)注、多引介、多參與研究,以推進BIBFRAME早日付諸實踐。
[1]Library of Congress.BIBFRAME Frequently Asked Questions [EB/OL].[2015-04-20].http://www.loc.gov/bibframe/faqs/#q02.
[2]劉煒, 夏翠娟.書目數(shù)據(jù)新格式BIBFRAME及其應(yīng)用[J].大學(xué)圖書館學(xué)報, 2014(1):7.
[3]Library of Congress.Overview of the BIBFRAME Model[EB/OL].[2015-04-21].http://www.loc.gov/bibframe/docs/model.html.
[4]Library of Congress.BIBFRAME Vocabulary: Terminology and Conventions[EB/OL].[2015-04-21].http://www.loc.gov/bibframe/docs/vocab-conventions.html.
[5]吳貝貝, 宋文.從MARC走向Bibframe:后MARC時代的書目記錄[J].圖書情報工作, 2014(5):87.
[6]吳麗坤, 殷潔.文獻編目理論研究[M].北京:中央編譯出版社, 2013:240.
[7]夏翠娟.面向語義網(wǎng)的書目框架(BIBFRAME):功能需求及實現(xiàn)[J].大學(xué)圖書館學(xué)報, 2014(6):61.
[8]胡小菁, 李愷.MARC四十年的發(fā)展及其未來[J].中國圖書館學(xué)報, 2010(3):85.
[9]劉煒, 張春景, 夏翠娟.萬維網(wǎng)時代的規(guī)范控制[J].中國圖書館學(xué)報, 2015(3):9.
安曉麗 女,1979年生,現(xiàn)工作于江蘇科技大學(xué)圖書館采編部,館員。
Discussion on BIBFRAME and Transformation of Library Work
As a new kind of bibliographic data format, BIBFRAME has three innovations: Semantic Web oriented, and based on related data, using entity-relation model of FRBR and RDA model, and broad applicability.BIBFRAME brings an enormous transformation on both conceptions and concret work of libraries, including purchasing, cataloging and retrieving.The cataloguer should change their ideas, attend training to face BIBFRAME actively.
Bibliographic Framework; Library; Bibliographic data format
G250.1
A
*本文系江蘇科技大學(xué)圖書館科研項目“基于關(guān)聯(lián)數(shù)據(jù)的BIBFRAME(書目框架)與圖書館的變革研究”的成果之一。