国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

多來源元數(shù)據(jù)集成中的組織管理框架研究*

2018-01-04 00:59:00丁遒勁馬袁燕李勃慧
數(shù)字圖書館論壇 2017年12期
關(guān)鍵詞:來源圖書館資源

丁遒勁,馬袁燕,李勃慧

(中國科學(xué)技術(shù)信息研究所,北京 100038)

多來源元數(shù)據(jù)集成中的組織管理框架研究*

丁遒勁,馬袁燕,李勃慧

(中國科學(xué)技術(shù)信息研究所,北京 100038)

國家圖書館、CALIS及NSTL均在開展資源發(fā)現(xiàn)系統(tǒng)構(gòu)建,特別是多來源元數(shù)據(jù)集成的相關(guān)實(shí)踐,然而元數(shù)據(jù)資源的獲取渠道相對單一,尚未形成標(biāo)準(zhǔn)化、模塊化的工作流程。通過對比澳大利亞、日本等國家圖書館的元數(shù)據(jù)集成實(shí)踐,提出一個面向多來源元數(shù)據(jù)集成的組織管理框架,旨在形成統(tǒng)一的元數(shù)據(jù)標(biāo)準(zhǔn)、固化元數(shù)據(jù)獲取流程、明晰相關(guān)利益主體間的權(quán)益關(guān)系。

元數(shù)據(jù)集成;發(fā)現(xiàn)服務(wù);組織管理

元數(shù)據(jù)是關(guān)于數(shù)據(jù)的數(shù)據(jù)。按照館藏文獻(xiàn)的加工揭示粒度,除描述母體的書目級元數(shù)據(jù)外,還涵蓋描述單篇論文題名、作者等信息的篇章級元數(shù)據(jù)。由于書目數(shù)據(jù)是圖書館OPAC系統(tǒng)建設(shè)的數(shù)據(jù)基礎(chǔ),所以早期以印本進(jìn)行母體信息揭示的編目工作尤為重要,成為對機(jī)構(gòu)內(nèi)部及機(jī)構(gòu)間文獻(xiàn)資源共享的重要前提條件。但伴隨著數(shù)字出版和數(shù)據(jù)庫的發(fā)展,文獻(xiàn)資源揭示粒度已從書目層級逐步深化到篇章級乃至文章內(nèi)部的圖表、實(shí)體、公式等層級,語義出版在出版界方興未艾,如Primo、Summon、EDS這類文獻(xiàn)資源發(fā)現(xiàn)系統(tǒng)以億計的篇章級元數(shù)據(jù)集成顯現(xiàn)出強(qiáng)大的規(guī)模效應(yīng),使圖書館原本以書目元數(shù)據(jù)資源集成為優(yōu)勢的地位受到挑戰(zhàn)。特別是在當(dāng)前許多高校圖書館以電子資源為主體的文獻(xiàn)資源建設(shè)時期,圖書館單純以編目方式進(jìn)行的書目數(shù)據(jù)集成工作受到挑戰(zhàn),亟須向多來源元數(shù)據(jù)集成方向轉(zhuǎn)變,在自主加工元數(shù)據(jù)的同時,不斷拓展網(wǎng)絡(luò)采集、第三方提供等其他來源渠道。面對龐雜的元數(shù)據(jù)資源來源渠道,固化元數(shù)據(jù)資源獲取流程、明晰元數(shù)據(jù)集成方與提供方的權(quán)益關(guān)系等有效的組織管理工作,將在較大程度上提升元數(shù)據(jù)集成的工作效率,為圖書館更大規(guī)模地集成、更精準(zhǔn)地發(fā)現(xiàn)資源奠定堅實(shí)的數(shù)據(jù)基礎(chǔ)。

1 國內(nèi)多來源元數(shù)據(jù)集成研究進(jìn)展

多來源元數(shù)據(jù)集成的目的在于改進(jìn)異構(gòu)資源的整合與發(fā)現(xiàn)效率。伴隨文獻(xiàn)資源的數(shù)字出版程度不斷加深,圖書館在向數(shù)字資源建設(shè)模式轉(zhuǎn)變的同時也在不斷通過各種努力對數(shù)字資源進(jìn)行整合。如建立期刊導(dǎo)航和數(shù)據(jù)庫導(dǎo)航、提供全文鏈接服務(wù)、建設(shè)聯(lián)邦檢索系統(tǒng)等,但都存在一定局限性[1]。2009年1月,全球第一個網(wǎng)絡(luò)級資源發(fā)現(xiàn)系統(tǒng)——Summon發(fā)布,該系統(tǒng)通過整合海量的異構(gòu)資源元數(shù)據(jù),形成統(tǒng)一的元數(shù)據(jù)索引,為用戶提供快速有效的資源發(fā)現(xiàn)與傳遞服務(wù)[2],由此基于資源發(fā)現(xiàn)系統(tǒng)的文獻(xiàn)資源整合模式得到迅速發(fā)展。2011年以來,國內(nèi)對資源發(fā)現(xiàn)系統(tǒng)的研究逐漸增多,國內(nèi)圖書館對資源發(fā)現(xiàn)系統(tǒng)的實(shí)踐程度主要集中于商業(yè)性資源發(fā)現(xiàn)系統(tǒng)的引進(jìn)和應(yīng)用,因此相關(guān)研究多為資源發(fā)現(xiàn)服務(wù)系統(tǒng)構(gòu)建原理分析[3]、商業(yè)性資源發(fā)現(xiàn)系統(tǒng)的選型與評估[4]、資源發(fā)現(xiàn)系統(tǒng)在圖書館服務(wù)中的應(yīng)用[5]等。同時,當(dāng)前商業(yè)資源發(fā)現(xiàn)系統(tǒng)中的元數(shù)據(jù)資源處于集成狀態(tài)而非經(jīng)過有效地知識組織與關(guān)聯(lián),所能提供的發(fā)現(xiàn)服務(wù)層次處于“資源”而非“知識”層次。彭佳等以上海交通大學(xué)圖書館“思源探索”系統(tǒng)為例,指出需要在元數(shù)據(jù)倉儲的基礎(chǔ)上,進(jìn)一步構(gòu)建資源組織和深度聚合的整體框架體系,從語義層面上實(shí)現(xiàn)信息資源的組織和聚合[6];曾建勛等在國家科技信息發(fā)現(xiàn)服務(wù)體系構(gòu)建中,重點(diǎn)強(qiáng)調(diào)本體、敘詞表等知識組織工具在文獻(xiàn)資源語義知識組織中的應(yīng)用,促進(jìn)資源發(fā)現(xiàn)系統(tǒng)功能從單一資源級發(fā)現(xiàn)服務(wù)向引文分析、科研實(shí)體識別等知識服務(wù)方向拓展[7]。

多來源元數(shù)據(jù)集成是資源發(fā)現(xiàn)服務(wù)系統(tǒng)的數(shù)據(jù)基礎(chǔ),因此資源發(fā)現(xiàn)服務(wù)系統(tǒng)構(gòu)建和實(shí)踐情況,可在一定程度上反映多來源元數(shù)據(jù)集成的進(jìn)展。在我國,除超星、萬方數(shù)據(jù)庫等中文商業(yè)性資源發(fā)現(xiàn)系統(tǒng)外,國家圖書館等國家級文獻(xiàn)資源服務(wù)機(jī)構(gòu)也正在強(qiáng)化資源發(fā)現(xiàn)服務(wù)系統(tǒng)建設(shè),構(gòu)建多來源元數(shù)據(jù)資源建設(shè)渠道體系。其中,國家圖書館“文津搜索”系統(tǒng)通過收割、轉(zhuǎn)換、清洗、裝載不同來源的元數(shù)據(jù),并對館藏資源整合,構(gòu)建了超大型海量元數(shù)據(jù)倉儲;其元數(shù)據(jù)來源于不同系統(tǒng)、不同機(jī)構(gòu),涵蓋中西文MARC、DC、XML以及MDF等多種數(shù)據(jù)格式文件[8]。CALIS在三期項(xiàng)目建設(shè)中,建立面向圖書館聯(lián)盟“云上的”信息服務(wù)協(xié)作網(wǎng)絡(luò)。其中,資源匯集與交換平臺負(fù)責(zé)收集各成員館提交的網(wǎng)上免費(fèi)資源、外部購買資源以及由合作方提供的資源,成員館數(shù)據(jù)直接匯集到CALIS全國交換中心,或是成員館數(shù)據(jù)先匯集到CALIS省級分中心,再匯集到CALIS全國交換中心[9]。NSTL是在原有依托“印本采集+自主加工”的元數(shù)據(jù)資源建設(shè)模式下,不斷向多來源元數(shù)據(jù)集成方向轉(zhuǎn)變,并于2015年起陸續(xù)與數(shù)據(jù)集成商(如Clarivate Analytics)、出版社(如Taylor Francis等)、圖書代理公司(如中國圖書進(jìn)出口[集團(tuán)]總公司等)達(dá)成元數(shù)據(jù)合作協(xié)議。

總體而言,我國在多來源元數(shù)據(jù)集成方面已有一定研究和實(shí)踐,但由于當(dāng)前元數(shù)據(jù)資源獲取渠道相對單一,獲取方式相對簡單,具有一定局限性,造成元數(shù)據(jù)集成中的組織管理工作相對粗放,尚未形成標(biāo)準(zhǔn)化、模塊化的工作流程,不利于資源發(fā)現(xiàn)系統(tǒng)建設(shè)。因此,亟待強(qiáng)化前期組織管理工作,提升元數(shù)據(jù)資源獲取質(zhì)量和效率。

2 多來源元數(shù)據(jù)集成中的組織管理需求分析

多來源元數(shù)據(jù)集成中的組織管理目的在于使各類型、各來源渠道均能按照一定標(biāo)準(zhǔn)規(guī)范,高效有序地提交元數(shù)據(jù)資源,并確保資源集成方、提供方、使用方等各利益主體間的權(quán)益均衡,形成良性循環(huán)。具體而言,組織管理工作需包含以下三方面內(nèi)容。

(1)制定統(tǒng)一的元數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范。異構(gòu)元數(shù)據(jù)資源整合有賴于統(tǒng)一的元數(shù)據(jù)標(biāo)準(zhǔn),需要在不同標(biāo)準(zhǔn)間建立映射關(guān)系,因此在數(shù)據(jù)準(zhǔn)備階段應(yīng)向元數(shù)據(jù)提供方明確可接收/兼容的數(shù)據(jù)標(biāo)準(zhǔn)、字段必備程度等,甚至提供統(tǒng)一的元數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范文本,從而提高元數(shù)據(jù)提供方資源供給的準(zhǔn)確性。

(2)固化元數(shù)據(jù)獲取流程??傮w而言,元數(shù)據(jù)獲取流程涉及數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)提交、數(shù)據(jù)校驗(yàn)三個環(huán)節(jié)。數(shù)據(jù)準(zhǔn)備階段包含向元數(shù)據(jù)提供方明確數(shù)據(jù)提交要求,由元數(shù)據(jù)提供方自行判斷是否符合提交要求;數(shù)據(jù)提交則須說明支持的數(shù)據(jù)打包、傳輸方式等;數(shù)據(jù)校驗(yàn)包含格式校驗(yàn)和內(nèi)容抽查,利用數(shù)據(jù)校驗(yàn)工具和人工審核方法分時段抽驗(yàn)數(shù)據(jù)的提交情況。

(3)明確相關(guān)利益主體間的權(quán)益關(guān)系。集成海量元數(shù)據(jù)資源的目的在于高效使用數(shù)據(jù),明確各利益主體間的權(quán)益關(guān)系,以利于資源發(fā)現(xiàn)系統(tǒng)的平穩(wěn)構(gòu)建與使用。因此,在數(shù)據(jù)準(zhǔn)備階段,就應(yīng)通過相應(yīng)協(xié)議文本明確元數(shù)據(jù)提供方式(免費(fèi)或有償)、元數(shù)據(jù)版權(quán)歸屬、元數(shù)據(jù)使用方式與范圍等,以免產(chǎn)生后續(xù)糾紛。

3 國外多來源元數(shù)據(jù)集成實(shí)踐的組織管理框架

在國外,無論是商業(yè)性資源發(fā)現(xiàn)系統(tǒng)還是公益機(jī)構(gòu)建設(shè)的資源發(fā)現(xiàn)服務(wù)系統(tǒng)均在多來源元數(shù)據(jù)集成管理方面取得成功實(shí)踐。商業(yè)性資源發(fā)現(xiàn)系統(tǒng)如Summon、EDS、Primo以及Scopus等同時具備發(fā)現(xiàn)和計量評價功能的外文數(shù)據(jù)庫產(chǎn)品;由非盈利性組織構(gòu)建的資源集成平臺如澳大利亞國家圖書館Trove系統(tǒng)、日本國立國會圖書館NDL Search、歐洲虛擬博物館Europeana等,以及專門整合開放期刊、開放圖書、開放學(xué)位論文等開放資源的集成平臺DOAJ、PubMed Central等。綜合上述平臺的元數(shù)據(jù)采集規(guī)范、流程與方法實(shí)踐,其多來源元數(shù)據(jù)集成工作基本遵循圖1的組織管理框架,主要目的是固化和細(xì)化工作流程,提升多來源元數(shù)據(jù)集成工作的效率。

總體而言,該組織管理框架分為基礎(chǔ)層、操作層和應(yīng)用層三個層次。在元數(shù)據(jù)集成方制定統(tǒng)一數(shù)據(jù)標(biāo)準(zhǔn)的基礎(chǔ)上,元數(shù)據(jù)提供方按照數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)提交、數(shù)據(jù)校驗(yàn)等流程實(shí)現(xiàn)多來源元數(shù)據(jù)資源的轉(zhuǎn)換和映射,最終由數(shù)據(jù)集成方實(shí)現(xiàn)元數(shù)據(jù)匯集和整合,形成有效的元數(shù)據(jù)資源集合,以滿足各類用戶需求。

圖1 面向多來源元數(shù)據(jù)集成的組織管理框架

3.1 基礎(chǔ)層

在多來源元數(shù)據(jù)集成工作前期,須先構(gòu)建一個元數(shù)據(jù)采集工作組,專門負(fù)責(zé)多來源元數(shù)據(jù)資源采集工作。如Trove的宏觀調(diào)控和運(yùn)行由Trove小組負(fù)責(zé),小組成員是來自澳大利亞國家圖書館的高級管理人員及來自地方圖書館的工作人員。Trove小組主要由四部分組成,分別負(fù)責(zé)其戰(zhàn)略方向、資源供給、資源構(gòu)建、數(shù)據(jù)提供及維護(hù),各部門間相互協(xié)作,職責(zé)分明[10]。此外,制訂統(tǒng)一的元數(shù)據(jù)標(biāo)準(zhǔn)是多來源元數(shù)據(jù)集成工作需要解決的重要問題,也是后期不同來源、遵循不同標(biāo)準(zhǔn)的元數(shù)據(jù)進(jìn)行映射轉(zhuǎn)換的依據(jù),如日本國立國會圖書館NDL Search、歐洲虛擬博物館Europeana的發(fā)現(xiàn)系統(tǒng)均已制定統(tǒng)一的元數(shù)據(jù)標(biāo)準(zhǔn)。特別是Europeana參照METS和RDF等相關(guān)標(biāo)準(zhǔn)和規(guī)范,設(shè)計開放、跨領(lǐng)域的Europeana Data Modal數(shù)據(jù)模型,在此基礎(chǔ)上確立揭示數(shù)字文化資源不同概念間關(guān)聯(lián)關(guān)系的語義知識本體模型,通過執(zhí)行本體與關(guān)聯(lián)數(shù)據(jù)融合驅(qū)動的元數(shù)據(jù)語義化操作,對跨機(jī)構(gòu)、跨領(lǐng)域的數(shù)字文化資源進(jìn)行關(guān)聯(lián)與整合,形成一個語義關(guān)聯(lián)數(shù)據(jù)網(wǎng)絡(luò)[11],為其后期開展深層次知識服務(wù)提供數(shù)據(jù)基礎(chǔ)。

3.2 操作層

3.2.1 數(shù)據(jù)準(zhǔn)備階段

該階段是元數(shù)據(jù)集成方與提供方交互的初始階段,需要相互了解數(shù)據(jù)基本情況及數(shù)據(jù)提交要求,包括數(shù)據(jù)評估、協(xié)議簽署及數(shù)據(jù)測試。(1)數(shù)據(jù)評估內(nèi)容包括是否為正規(guī)出版物、涵蓋資源品種、元數(shù)據(jù)遵循標(biāo)準(zhǔn)及提供的數(shù)據(jù)格式是否在資源集成方可兼容范圍內(nèi)。如在資源品種層面,PubMed Central對期刊遴選的基本要求包括擁有注冊的ISSN號,出版商在生命科學(xué)領(lǐng)域最少擁有2年出版經(jīng)歷,每種期刊至少包含2.5篇同行評議論文;在元數(shù)據(jù)層面,PubMed Central推薦出版商提供的數(shù)據(jù)應(yīng)遵循NISO的JATS標(biāo)準(zhǔn),并同時提交XML格式的期刊論文全文且不接受HTML格式。(2)協(xié)議簽署的目的主要是明確資源集成方與資源提供方的權(quán)責(zé)關(guān)系。如資源提供方在Trove系統(tǒng)提交元數(shù)據(jù)前須簽署《國家發(fā)現(xiàn)服務(wù)數(shù)據(jù)貢獻(xiàn)理解備忘錄》,該協(xié)議文本對知識產(chǎn)權(quán)、費(fèi)用、雙方義務(wù)均進(jìn)行明確約定。(3)數(shù)據(jù)測試是在正式數(shù)據(jù)提交前進(jìn)行雙方磨合。相比而言,日本國立國會圖書館的元數(shù)據(jù)操作流程較嚴(yán)謹(jǐn),測試工作被細(xì)分為樣本數(shù)據(jù)提取、系統(tǒng)連接和協(xié)調(diào)測試兩部分內(nèi)容,以確保后期工作的順利開展。

3.2.2 數(shù)據(jù)提交階段

在雙方確認(rèn)合作、完成初步數(shù)據(jù)測試后,將進(jìn)入數(shù)據(jù)正式提交階段。對元數(shù)據(jù)集成中的組織管理工作而言,明確元數(shù)據(jù)提交方式和提交途徑是此階段的主要內(nèi)容。一般而言,元數(shù)據(jù)提交方式包括OAI-PMH數(shù)據(jù)收割、API、網(wǎng)絡(luò)爬蟲、FTP傳輸或HTTP等方式。元數(shù)據(jù)提交途徑指數(shù)據(jù)提交的組織結(jié)構(gòu),既包括資源提供方(資源建設(shè)方的單一結(jié)構(gòu)),也包括多層級的網(wǎng)絡(luò)結(jié)構(gòu)。如在Europeana的數(shù)據(jù)提交網(wǎng)絡(luò)中,資源提供方提供數(shù)據(jù)到聚合器(項(xiàng)目組或組織),隨后處理該數(shù)據(jù)并將其提供給Europeana。CALIS也采用類似的數(shù)據(jù)匯集方式,構(gòu)成“成員館—CALIS省級分中心—CALIS全國交換中心”三級數(shù)據(jù)匯交體系。

3.2.3 數(shù)據(jù)校驗(yàn)階段

資源集成方在獲取各渠道數(shù)據(jù)后,需要進(jìn)行相應(yīng)的格式校驗(yàn)和質(zhì)量抽檢工作以確保提交的質(zhì)量。一般而言,格式校驗(yàn)可通過程序自動完成。如PubMed Central的在線格式校驗(yàn)工具[12]可基于自身格式規(guī)范對數(shù)據(jù)進(jìn)行驗(yàn)證,對不符合規(guī)范的數(shù)據(jù)項(xiàng)進(jìn)行警告或報錯。質(zhì)量抽檢更注重元數(shù)據(jù)的內(nèi)容層面(如作者與機(jī)構(gòu)的對應(yīng)關(guān)系、關(guān)鍵詞拆分準(zhǔn)確性等),以人工抽查的方式確保數(shù)據(jù)質(zhì)量的進(jìn)一步提升。

3.2.4 數(shù)據(jù)入倉階段

數(shù)據(jù)入倉涵蓋前期數(shù)據(jù)查重、數(shù)據(jù)整合和數(shù)據(jù)入倉三個環(huán)節(jié)。不同來源、不同渠道獲取的數(shù)據(jù)必然在種類、卷期乃至篇級數(shù)據(jù)方面存在交叉重復(fù)現(xiàn)象,通過在母體、卷期、篇級、渠道四個層面對數(shù)據(jù)進(jìn)行查重和集成整合,增加元數(shù)據(jù)厚度,形成有機(jī)的元數(shù)據(jù)資源。如某商業(yè)發(fā)現(xiàn)系統(tǒng)對印本資源與電子資源數(shù)據(jù)主要通過以下三個方面進(jìn)行匹配和融合:(1)每個ID至少有一個唯一標(biāo)識符匹配,“ISBN to ISBN”“EISBN to EISBN”“ISSN to ISSN”“EISSN to EISSN”“LCCN to LCCN”;(2)記錄必須有且僅有一個出版年,允許印本資源出版年份與電子資源出版年份差距在一年內(nèi);(3)使用模糊邏輯匹配題名,至少匹配一個題名。

3.3 應(yīng)用層

基于統(tǒng)一的元數(shù)據(jù)資源,目前主要應(yīng)用方式仍處于資源層級的檢索服務(wù),由此衍生出當(dāng)前市場上眾多資源發(fā)現(xiàn)系統(tǒng)產(chǎn)品,卻遠(yuǎn)不能滿足用戶需求,相比于全文數(shù)據(jù)庫的語義化出版粒度明顯滯后。因此,隨著海量元數(shù)據(jù)資源的知識組織深度不斷加深,及關(guān)聯(lián)數(shù)據(jù)等在元數(shù)據(jù)集成中的應(yīng)用,提供基于作者、機(jī)構(gòu)等海量科研實(shí)體的分析服務(wù)將成為可能。同時,基于中央元數(shù)據(jù)倉儲的個性化數(shù)據(jù)定制以及應(yīng)用系統(tǒng)的嵌入,也是元數(shù)據(jù)集成的一種服務(wù)形式。如日本國立國會圖書館NDL Search提供API接口服務(wù),支持其他公共圖書館、博物館、美術(shù)館等的系統(tǒng)建設(shè)與服務(wù)。

4 對我國多來源元數(shù)據(jù)集成工作的建議

(1)拓寬元數(shù)據(jù)獲取渠道,重視版權(quán)歸屬處理。目前,我國公益機(jī)構(gòu)的元數(shù)據(jù)集成實(shí)踐主體主要包括國家圖書館、CALIS以及NSTL,或局限于系統(tǒng)內(nèi)部合作,或基于自身數(shù)據(jù)基礎(chǔ)重點(diǎn)開拓圖書代理公司、出版社等渠道,尚未在系統(tǒng)內(nèi)外達(dá)成廣泛合作,這與國外部分國家圖書館的建設(shè)機(jī)制恰好相反。如澳大利亞國家圖書館Trove系統(tǒng)集成澳大利亞的圖書館、博物館、檔案館和其他科學(xué)文化機(jī)構(gòu)的5.3億條有關(guān)澳大利亞文化遺產(chǎn)的元數(shù)據(jù)、全文和鏈接資源[13],包含超過2 000家澳大利亞的圖書館、博物館、檔案館和其他文化機(jī)構(gòu)的資源[14]。同時,在與其他機(jī)構(gòu)合作時,發(fā)現(xiàn)系統(tǒng)構(gòu)建主體已對合作對象的合作內(nèi)容及合作要求進(jìn)行明確表述,并形成相應(yīng)的協(xié)議文本,這對我國文獻(xiàn)信息服務(wù)機(jī)構(gòu)推進(jìn)跨界合作,具有重要借鑒意義。因此,我國在開展相關(guān)數(shù)據(jù)合作時應(yīng)重視相應(yīng)合作協(xié)議文本的撰寫,對合作內(nèi)容、版權(quán)歸屬等問題進(jìn)行清晰界定。

(2)加快統(tǒng)一元數(shù)據(jù)標(biāo)準(zhǔn)與其他主流標(biāo)準(zhǔn)映射工作,固化元數(shù)據(jù)提交要求與流程。統(tǒng)一元數(shù)據(jù)標(biāo)準(zhǔn)是在更大范圍內(nèi)進(jìn)行元數(shù)據(jù)集成、提高集成效率的有效途徑之一。目前,我國主要文獻(xiàn)保障系統(tǒng)內(nèi)部已形成一定規(guī)模的元數(shù)據(jù)標(biāo)準(zhǔn),但仍存在系統(tǒng)性的條塊分割。因此,一方面要加強(qiáng)系統(tǒng)間元數(shù)據(jù)標(biāo)準(zhǔn)的交流、探討和宣傳,在統(tǒng)一元數(shù)據(jù)標(biāo)準(zhǔn)建設(shè)方面盡可能達(dá)成共識;另一方面,要加強(qiáng)元數(shù)據(jù)標(biāo)準(zhǔn)注冊系統(tǒng)建設(shè),實(shí)現(xiàn)單一文獻(xiàn)機(jī)構(gòu)、出版社、圖書代理公司等元數(shù)據(jù)標(biāo)準(zhǔn)的相互轉(zhuǎn)換和映射。同時,我國的大范圍元數(shù)據(jù)集成工作應(yīng)明確和固化元數(shù)據(jù)的合作層級(書目級或篇章級)、可提交元數(shù)據(jù)格式、元數(shù)據(jù)上傳方式(FTP、網(wǎng)盤、HTTP等)、格式轉(zhuǎn)換及校驗(yàn)流程等,在網(wǎng)站顯著位置明確說明,便于元數(shù)據(jù)合作方對前期的評估以及后續(xù)工作的開展。

(3)拓展合作內(nèi)容,構(gòu)建多元化元數(shù)據(jù)資源服務(wù)體系。從元數(shù)據(jù)獲取渠道看,與出版社、集成商的合作可快速獲取大規(guī)模元數(shù)據(jù)資源,與館藏機(jī)構(gòu)合作的價值在于館藏信息及后續(xù)服務(wù)保障。如澳大利亞國家圖書館、日本國立國會圖書館與其他文獻(xiàn)信息服務(wù)機(jī)構(gòu)的合作主要在元數(shù)據(jù)資源層面,為用戶提供相應(yīng)的全文獲取渠道(印本資源館藏位置、電子資源全文鏈接等)。從現(xiàn)有服務(wù)實(shí)踐看,國外發(fā)現(xiàn)系統(tǒng)尚未完全實(shí)現(xiàn)后端服務(wù)與本地系統(tǒng)的整合。建議我國大型文獻(xiàn)保障機(jī)構(gòu)在與其他文獻(xiàn)信息服務(wù)機(jī)構(gòu)開展元數(shù)據(jù)合作中,除數(shù)據(jù)本身外,增加原文傳遞服務(wù)整合機(jī)制,以及通過API方式將資源嵌入合作方本地文獻(xiàn)信息系統(tǒng),從而增加合作雙方黏性,保證資源發(fā)現(xiàn)系統(tǒng)功能的穩(wěn)定性和運(yùn)行的持續(xù)性。

[1] 包凌,蔣穎.圖書館統(tǒng)一資源發(fā)現(xiàn)系統(tǒng)的比較研究[J].情報資料工作,2012(5):67-72.

[2] 竇天芳,姜愛蓉.資源發(fā)現(xiàn)系統(tǒng)功能分析及應(yīng)用前景[J].圖書情報工作,2012,56(7):38-43.

[3] 聶華,朱玲.網(wǎng)絡(luò)級發(fā)現(xiàn)服務(wù)——通向深度整合與便捷獲取的路徑[J].大學(xué)圖書館學(xué)報,2011,29(6):5-10.

[4] 秦鴻.關(guān)于發(fā)現(xiàn)系統(tǒng)的問題與思考[J].數(shù)字圖書館論壇,2012(7):17-20.

[5] 陳雪,鄒小筑,邱彥濤.資源發(fā)現(xiàn)系統(tǒng)在科研課題跟蹤服務(wù)中的應(yīng)用[J].圖書館論壇,2015(5):68-74.

[6] 彭佳,鄭巧英.信息資源聚合與組織研究——以發(fā)現(xiàn)系統(tǒng)為例[J].圖書館雜志,2016(3):80-85.

[7] 曾建勛,丁遒勁.基于語義的國家科技信息發(fā)現(xiàn)服務(wù)體系研究[J].中國圖書館學(xué)報,2017,43(4):51-62.

[8] 楊東波,邢軍.國家圖書館“文津搜索”的設(shè)計與實(shí)現(xiàn)[J].國家圖書館學(xué)刊,2014(3):93-98.

[9] 王文清,張月祥,關(guān)濤,等.CALIS資源整合與云服務(wù)[J].國家圖書館學(xué)刊,2015,24(2):36-42.

[10] 肖希明,李琪.公共數(shù)字文化服務(wù)合作機(jī)制研究[J].圖書與情報,2016(4):31-37.

[11] 王萍,黃新平.基于關(guān)聯(lián)開放數(shù)據(jù)的數(shù)字文化資源語義融合方法研究——?dú)W洲數(shù)字圖書館案例分析[J].圖書情報工作,2016,60(12):29-37.

[12] File Validation Tools[EB/OL].[2017-11-25].https://www.ncbi.nlm.nih.gov/pmc/pub/validation/.

[13] Trove Content Inclusion Statement[EB/OL].[2017-11-25].http://help.nla.gov.au/trove/our-policies/trove-content-inclusion-policy#anchor-0.[14] Trove.Current Work Counts by Contributor[EB/OL].[2017-11-25].http://trove.nla.gov.au/system/counts.

Research on the Organization and Management Models for Multi-Source Metadata Integration

DING QiuJing, MA YuanYan, LI BoHui
(Institute of Scientific and Technical Information of China, Beijing 100038, China)

In China, the National Library, CALIS and the National Science and Technology Library have developed their own resource discovery system, including integrating the multi-source metadata, but the systems still need to be upgraded in terms of diversity of metadata acquisition channel and standardization of workflow.Based on the metadata integration practice of the national libraries in Australia and Japan, this paper constructs an organization management framework for multisource metadata integration, which aims to form a unified metadata standard, solidify metadata acquisition workflow, and clarify the interest relationship among relevant stakeholders.

Metadata Integration; Discovery Service; Organization and Management

2017-11-15)

G250

10.3772/j.issn.1673-2286.2017.12.009

* 本研究得到國家社會科學(xué)基金重點(diǎn)項(xiàng)目“基于知識組織的圖書館資源發(fā)現(xiàn)服務(wù)體系研究”(編號:17ATQ002)資助。

丁遒勁,女,1988年生,館員,研究方向:數(shù)字資源建設(shè),E-mail:dingqj2011@istic.ac.cn。

馬袁燕,女,1993年生,碩士研究生,研究方向:數(shù)字資源建設(shè)。

李勃慧,女,1994年生,碩士研究生,研究方向:數(shù)字資源建設(shè)。

猜你喜歡
來源圖書館資源
將來吃魚不用調(diào)刺啦
基礎(chǔ)教育資源展示
一樣的資源,不一樣的收獲
試論《說文》“丵”字的來源
資源回收
圖書館
小太陽畫報(2018年1期)2018-05-14 17:19:25
“赤”的來源與“紅”在服裝中的應(yīng)用
流行色(2018年11期)2018-03-23 02:21:22
資源再生 歡迎訂閱
資源再生(2017年3期)2017-06-01 12:20:59
飛躍圖書館
去圖書館
陆良县| 泗阳县| 寿宁县| 仁化县| 蓝田县| 资兴市| 白山市| 黔西| 石棉县| 紫金县| 唐海县| 南丰县| 陇西县| 义乌市| 金昌市| 台安县| 莱阳市| 鄂温| 西乌| 正镶白旗| 余干县| 清新县| 儋州市| 开远市| 望谟县| 郁南县| 郓城县| 吉林市| 庆城县| 上思县| 四平市| 米泉市| 昭通市| 珲春市| 静宁县| 武夷山市| 敦煌市| 崇仁县| 郸城县| 黄冈市| 瑞昌市|