曾建勛
資源建設(shè)需要推進(jìn)元數(shù)據(jù)戰(zhàn)略
曾建勛
元數(shù)據(jù)是描述數(shù)據(jù)的數(shù)據(jù),盡管元數(shù)據(jù)概念始于20世紀(jì)末,但概念所表達(dá)的內(nèi)涵及所表現(xiàn)的作用卻早已存在。從圖書(shū)館來(lái)看,傳統(tǒng)目錄、檢索文摘,以及MARC數(shù)據(jù)都具備元數(shù)據(jù)特質(zhì),且對(duì)物理資源和數(shù)字資源的管理和利用發(fā)揮了舉足輕重的作用。
隨著數(shù)字資源的快速發(fā)展,圖書(shū)館占有的印本資源越來(lái)越少,遠(yuǎn)程訪問(wèn)的出版社數(shù)字資源、發(fā)現(xiàn)系統(tǒng)搜索資源,以及集成商的數(shù)據(jù)資源等越來(lái)越多;由于MARC基于印本資源進(jìn)行描述,沒(méi)有涵蓋和整合數(shù)字資源,因此除MARC數(shù)據(jù)外,圖書(shū)館占有的元數(shù)據(jù)資源也越來(lái)越少。圖書(shū)館如何才能擁有數(shù)字資源的元數(shù)據(jù),實(shí)現(xiàn)與圖書(shū)館原有以MARC為核心的館藏元數(shù)據(jù)融合,形成統(tǒng)一的館藏元數(shù)據(jù)體系,需要規(guī)劃圖書(shū)館元數(shù)據(jù)戰(zhàn)略。
依據(jù)管理對(duì)象和管理目標(biāo)的不同,元數(shù)據(jù)有不同的類(lèi)別和形態(tài)。既有業(yè)務(wù)元數(shù)據(jù)、技術(shù)元數(shù)據(jù)和管理元數(shù)據(jù),又有描述元數(shù)據(jù)、語(yǔ)義元數(shù)據(jù)和用戶元數(shù)據(jù),還有版權(quán)元數(shù)據(jù)、保存元數(shù)據(jù)和使用元數(shù)據(jù)等;元數(shù)據(jù)的管理功能不僅在于識(shí)別、描述、定位物理資源,而且在于搜尋、評(píng)估和選擇數(shù)字資源,更多地在于關(guān)聯(lián)、計(jì)算和挖掘其中的知識(shí)資源。數(shù)字環(huán)境所帶來(lái)的元數(shù)據(jù)種類(lèi)、層級(jí)、來(lái)源、渠道、形態(tài)和格式不一,因而需要圖書(shū)館構(gòu)建統(tǒng)一的元數(shù)據(jù)體系。
首先,需要將基于MARC的可交換機(jī)讀目錄及館際間聯(lián)合目錄轉(zhuǎn)換成XML的元數(shù)據(jù)格式,打破MARC格式的煩瑣性和封閉性,增強(qiáng)關(guān)聯(lián)性,以實(shí)現(xiàn)與數(shù)字出版、信息搜索等相融合的跨界互操作;其次,需要在維護(hù)實(shí)體資源的基礎(chǔ)上,強(qiáng)化數(shù)字資源的描述元數(shù)據(jù)、版權(quán)元數(shù)據(jù)、保存元數(shù)據(jù)、使用元數(shù)據(jù)等采集和著錄,按照統(tǒng)一標(biāo)準(zhǔn)格式和層次體系實(shí)現(xiàn)物理資源與數(shù)字資源的元數(shù)據(jù)統(tǒng)一管理,以推進(jìn)資源一站式利用與服務(wù);再次,需要構(gòu)建統(tǒng)一的元數(shù)據(jù)集成整合系統(tǒng),對(duì)不同渠道來(lái)源的元數(shù)據(jù)進(jìn)行映射集成、整合規(guī)范,實(shí)現(xiàn)元數(shù)據(jù)從采集、識(shí)別、整理、組織,到規(guī)范、審計(jì)、評(píng)估、保存和服務(wù)的全生命周期管理,對(duì)書(shū)目元數(shù)據(jù)、文摘元數(shù)據(jù)、語(yǔ)義元數(shù)據(jù)、渠道來(lái)源及其權(quán)益元數(shù)據(jù)等進(jìn)行分層次地整合處理,提升元數(shù)據(jù)的整體質(zhì)量;最后,需要建立跨越圖書(shū)館,橫聯(lián)出版社、數(shù)據(jù)庫(kù)商的元數(shù)據(jù)登記注冊(cè)與對(duì)象資源提供獲取的跨界聯(lián)盟,革新聯(lián)合編目方法,構(gòu)建集多渠道資源提供途徑的資源調(diào)度知識(shí)庫(kù),支持用戶情景敏感的資源多途徑獲取。
構(gòu)建圖書(shū)館新型元數(shù)據(jù)體系,需要轉(zhuǎn)變資源建設(shè)理念,既重視對(duì)象資源的訂購(gòu)和管理,也重視元數(shù)據(jù)資源的采集和組織;既重視物理資源的編目揭示,也重視數(shù)字資源的元數(shù)據(jù)渠道管理;既重視資源本身權(quán)威性價(jià)值評(píng)估,也重視資源使用價(jià)值分析。需要改變資源建設(shè)流程,在元數(shù)據(jù)多渠道采集、整合、審計(jì)和服務(wù)利用過(guò)程中,增強(qiáng)物理資源和數(shù)字資源的訂前需求評(píng)估和訂后使用分析,優(yōu)化資源訂購(gòu)和提供策略,提升資源投入效益。
程煥文先生提出數(shù)據(jù)庫(kù)商憑什么如此狼?其根源之一在于圖書(shū)館沒(méi)有構(gòu)建自身的適應(yīng)數(shù)字環(huán)境的元數(shù)據(jù)體系。2015年10月,大英圖書(shū)館發(fā)布2015—2018年館藏元數(shù)據(jù)戰(zhàn)略,我國(guó)圖書(shū)館界也需要融入大數(shù)據(jù)環(huán)境,大力提倡元數(shù)據(jù)先行戰(zhàn)略,主張?jiān)獢?shù)據(jù)權(quán)益,整合元數(shù)據(jù)資產(chǎn),實(shí)現(xiàn)館藏元數(shù)據(jù)資源與社會(huì)資源關(guān)聯(lián),吸納社會(huì)元數(shù)據(jù)資源,推進(jìn)館藏元數(shù)據(jù)的開(kāi)放服務(wù),以全面釋放圖書(shū)館館藏資源價(jià)值。