中國人民解放軍空軍第四飛行學(xué)院圖書館〔河北省石家莊市 050071〕 劉曉林 趙建玲
當前,在信息技術(shù)與網(wǎng)絡(luò)技術(shù)日新月異的形勢下,人們面對浩如煙海、內(nèi)容復(fù)雜、類型繁多、更新迅速的數(shù)字信息資源往往感到無所適從,準確選擇與獲取所需數(shù)字信息資源的難度日益加大。對數(shù)字信息資源的準確識別與定位已成為數(shù)字信息資源管理領(lǐng)域研究者關(guān)注的一個重要問題。DOI技術(shù)正是在這種情況下應(yīng)運而生的。它產(chǎn)生之初只是為了保護與管理電子出版物的版權(quán),現(xiàn)在已在電子出版、電子商務(wù)等多個領(lǐng)域得到廣泛應(yīng)用。目前,DOI技術(shù)在國外的發(fā)展已經(jīng)比較成熟,而在中國,DOI技術(shù)的應(yīng)用尚處于初級階段,還未得到廣泛普及。本文正是基于對DOI技術(shù)在數(shù)字信息資源共建共享進程中應(yīng)用意義的認識,將DOI技術(shù)與我國數(shù)字信息資源共建共享的實際結(jié)合起來,并提出幾點策略,希望能夠為推進我國數(shù)字信息資源共建共享進程提供有益的借鑒。
我國學(xué)者大多將DOI(DigitalObjectIdentifier)翻譯為“數(shù)字對象標識符”,它是一種對互聯(lián)網(wǎng)上的數(shù)字信息資源進行標識的工具,正如每件商品的條形碼是商品識別的唯一依據(jù)一樣,DOI號碼在全球的唯一性使其能夠?qū)?shù)字信息資源進行準確識別與定位。因此,有的學(xué)者將其形象地稱為數(shù)字信息資源的“條形碼”或“身份證”。
我國學(xué)者大多將 DOI系統(tǒng)分為四個部分:編碼規(guī)則、解析系統(tǒng)、元數(shù)據(jù)方案以及分配和管理機制。
1.DOI號碼的編碼規(guī)則。在 DOI系統(tǒng)中,一條DOI號碼實際上就是一條 Handle。DOI號碼的編碼規(guī)則完全遵從于 Handle,同 Handle一樣,DOI號碼也由前綴和后綴兩部分構(gòu)成。 DOI號碼的結(jié)構(gòu)式為:〈DIR〉.〈REG〉 /〈DSS〉。 其中〈DIR〉為 Handle System(句柄系統(tǒng))分配給DOI系統(tǒng)的命名授權(quán),其值為 10;〈 REG〉(RegistrantCode)是 DOI系統(tǒng)注冊代理機構(gòu)的代碼,由 DOI基金會—— IDF(InternationalDOIFoundation)負責分配,由 4位阿拉伯數(shù)字組成;〈DSS〉是數(shù)字信息資源本身的號碼,由 DOI系統(tǒng)注冊代理機構(gòu)自行給出,無統(tǒng)一規(guī)則、無規(guī)定格式,可以是任何字母或數(shù)字。既可以采用已有的國際標準號碼,如 ISBN、ISSN等,如某篇中文論文的 DOI號碼:10.3772/j.issn.1674-1544.2008.04.011,也可重新編制號碼,只要該號碼具有唯一性即可,這就使 DOI號碼具有了靈活性與可擴展性。
2.DOI號碼的解析系統(tǒng)。DOI號碼的解析系統(tǒng)是 DOI系統(tǒng)運行的核心機制,它在 HandleSystem解析機制的基礎(chǔ)上進行了擴展。 HandleSystem提供的解析機制在數(shù)字信息資源名稱與數(shù)字信息資源地址之間建立鏈接,由服務(wù)器將數(shù)字信息資源名稱解析為數(shù)字信息資源地址(URL)返回給用戶。 DOI系統(tǒng)在此基礎(chǔ)上實現(xiàn)了從單一解析機制到多重解析機制的技術(shù)突破,即一個 DOI號碼可以對應(yīng)多個URL,可鏈接多種數(shù)字信息資源目標。當用戶點擊某一數(shù)字信息資源的 DOI號碼時,用戶請求會被傳送到 HandleSystem服務(wù)器上,服務(wù)器可將該 DOI號碼解析為多個URL返回給用戶,使用戶不僅可以實現(xiàn)對所檢索數(shù)字信息資源的獲取,還可以訪問該數(shù)字信息資源的引文、參考文獻等信息,無形中擴大了信息獲取范圍,有利于用戶對所查找內(nèi)容的深入理解,有利于圖書館等信息管理機構(gòu)對數(shù)字信息資源進行高效整合,提升信息服務(wù)水平。
3.DOI號碼的元數(shù)據(jù)方案。DOI號碼的元數(shù)據(jù)是 DOI系統(tǒng)中必不可少的重要因素,是 DOI技術(shù)發(fā)揮數(shù)字信息資源鏈接及數(shù)字信息資源整合功能的根本。盡管從表面上看,DOI號碼僅是一串標識數(shù)字信息資源的字符,但其之所以能實現(xiàn)對數(shù)字信息資源的準確定位及原文、摘要、引文之間的相關(guān)鏈接,與其存儲的元數(shù)據(jù)是分不開的,出版機構(gòu)向 IDF及DOI號碼注冊代理機構(gòu)提出申請時需要同時將所標識數(shù)字信息資源的元數(shù)據(jù)(包括數(shù)字信息資源的存儲地址、版權(quán)信息、內(nèi)容信息等)一并提交與上傳。由于可賦予 DOI號碼標識的數(shù)字信息資源種類繁多,對其進行揭示所需要的元數(shù)據(jù)各不相同,還要考慮不同元數(shù)據(jù)的互操作問題,因此DOI號碼的元數(shù)據(jù)開發(fā)并非易事。目前,DOI系統(tǒng)采用的元數(shù)據(jù)方案可分為兩類,分別是核心元數(shù)據(jù)與擴展元數(shù)據(jù)。核心元數(shù)據(jù)由 8個揭示數(shù)字信息資源的最小限度要素構(gòu)成,是最簡單的元數(shù)據(jù);擴展元數(shù)據(jù)是針對不同類型的數(shù)字信息資源,通過對核心元數(shù)據(jù)的要素進行添加或限定,從而將圖書、論文、會議文獻等不同數(shù)字信息資源加以區(qū)分。
4.DOI號碼的分配和管理機制。DOI號碼的分配和管理機制是 DOI系統(tǒng)運行的保障。 1997年,DOI系統(tǒng)在德國法蘭克福世界圖書博覽會上首次亮相,并成為數(shù)字信息資源命名的一項世界標準。1998年,DOI基金會—— IDF在法蘭克福成立,負責有關(guān) DOI技術(shù)的政策制定、技術(shù)支持、申請注冊等業(yè)務(wù)。各國可在IDF授權(quán)下成立分支機構(gòu),即DOI注冊代理機構(gòu)(RA)。目前,全球已有8個RA。RA作為IDF的下屬機構(gòu),在IDF的領(lǐng)導(dǎo)下開展工作,主要負責本國數(shù)字信息資源的 DOI號碼申請注冊、號碼分配、元數(shù)據(jù)管理等具體業(yè)務(wù)。每個 RA的代碼由IDF分配,每一數(shù)字信息資源的具體號碼則由 RA自行分配。除此以外,DOI號碼還要求注冊的出版商將數(shù)字信息資源的元數(shù)據(jù)一并上傳到服務(wù)器,并負責對其進行管理。當某一數(shù)字信息資源的存儲地址發(fā)生改變時,要及時更新該數(shù)字信息資源的 URL并重新提交給 DOI技術(shù)服務(wù)器,這就保證了 DOI技術(shù)對數(shù)字信息資源的鏈接不會隨數(shù)字信息資源存儲地址的改變而失效。
通過上文對 DOI技術(shù)原理的介紹,不難看出,DOI技術(shù)與其他標識系統(tǒng)不同。歸納起來,DOI技術(shù)主要具有以下幾個特點及功能,即:第一,DOI號碼具有唯一性。 DOI號碼的編碼規(guī)則決定其號碼在全球具有唯一性,因此可實現(xiàn)對數(shù)字信息資源的準確識別。第二,DOI號碼具有永久性。 DOI號碼與URL不同,它對數(shù)字信息資源的鏈接不會隨數(shù)字信息資源存儲地址的改變而失效,有學(xué)者稱其為“下一代 URL”,因而它能夠?qū)崿F(xiàn)數(shù)字信息資源的長期保存。第三,DOI號碼具有兼容性。DOI號碼靈活的編碼規(guī)則使其可以兼容 ISBN、ISSN等已有的國際標準號碼,因此它可以實現(xiàn)不同標識系統(tǒng)之間的互操作。第四,DOI號碼具有關(guān)聯(lián)性。DOI號碼的多重解析機制使其可實現(xiàn)原文、文摘、引文之間的相互鏈接。這樣,一方面提高了信息檢索的檢全率,另一方面有利于實現(xiàn)數(shù)字信息資源的深度整合。
通過上文對 DOI技術(shù)原理及其特點與功能的闡述,可以看出 DOI技術(shù)在數(shù)字信息資源管理方面具有一定優(yōu)勢。因此,將 DOI技術(shù)引入圖書館的數(shù)字信息資源建設(shè)之中,使其在數(shù)字信息資源建設(shè)與共享中發(fā)揮應(yīng)有作用,對推進我國數(shù)字信息資源共建共享進程具有重要意義。
近年來,圖書、期刊、數(shù)據(jù)庫等文獻信息資源價格的飛速上漲與圖書館經(jīng)費的短缺形成了一對突出矛盾。如何提高經(jīng)費使用效益,增加文獻信息資源采購量成為大多數(shù)圖書館不得不考慮的問題。DOI技術(shù)的數(shù)字信息資源鏈接功能正好為解決圖書館經(jīng)費緊張問題提供了一種途徑。以NSTL為例,NSTL作為我國最大的科技文獻信息中心,承擔著為我國科研工作提供信息保障的重任,每年都需要采購大量的外文數(shù)據(jù)庫。外文數(shù)據(jù)庫高昂的價格也曾經(jīng)使NSTL的經(jīng)費比較緊張,但現(xiàn)在該問題隨著它加入DOI系統(tǒng)已經(jīng)得到有效解決。 2007年,NSTL成為CrossRef聯(lián)盟的會員后,對于聯(lián)盟其他成員單位訂購的外文文獻,可以通過CrossRef聯(lián)盟查找DOI標識和元數(shù)據(jù),并將 DOI標識和元數(shù)據(jù)儲存到本地服務(wù)系統(tǒng)。目前,可以用購買外文文摘數(shù)據(jù)庫的形式,通過DOI編碼的匹配與查詢,實現(xiàn)文摘信息與全文信息的鏈接,從而實現(xiàn)引文到全文的鏈接。文摘數(shù)據(jù)庫的價格相對于全文數(shù)據(jù)庫的價格自然要低很多,這就使NSTL在很大程度上減少了用于購買外文數(shù)據(jù)庫的支出,提高了圖書館經(jīng)費的使用效益,也意味著數(shù)字信息資源共建共享效益的提高。NSTL的成功經(jīng)驗同樣值得其他圖書館借鑒。
數(shù)字信息資源在網(wǎng)絡(luò)環(huán)境下的分散存儲給數(shù)字信息資源的存取與利用帶來了很大不便,如何將數(shù)量豐富、內(nèi)容各異、形式多樣的數(shù)字信息資源進行系統(tǒng)整合,將相關(guān)數(shù)字信息資源集中起來,統(tǒng)一提供給用戶,成為數(shù)字圖書館發(fā)展需要解決的問題之一。如前所述,在數(shù)字信息資源之間建立參考鏈接是 DOI技術(shù)的特點之一。正是由于其對數(shù)字信息資源賦予的唯一標識和采取的多重解析機制使 DOI系統(tǒng)能夠?qū)崿F(xiàn)相關(guān)數(shù)字信息資源之間的動態(tài)鏈接,能夠?qū)崿F(xiàn)從原文到引文之間的一站式檢索,能夠?qū)崿F(xiàn)同類主題數(shù)字信息資源的集中獲取,這就為數(shù)字信息資源的高效整合創(chuàng)造了有利條件。仍以NSTL為例,NSTL為其外文期刊數(shù)據(jù)庫中收錄的論文、會議文獻、科技報告等數(shù)字信息資源申請注冊了 DOI號碼,用戶在利用NSTL的外文期刊數(shù)據(jù)庫檢索信息時,通過點擊數(shù)字信息資源的 DOI號碼鏈接,便可訪問文章全文及參考文獻,包括尚未購買的數(shù)據(jù)庫中的文獻(前提是這些文獻都申請注冊了 DOI號碼)。這樣,就使用戶一次性盡可能全面地獲取了與其檢索指令相符的數(shù)字信息資源。數(shù)字信息資源管理者,通過對用戶檢索、訪問數(shù)字信息資源的記錄進行統(tǒng)計,便可將這些同類主題的相關(guān)數(shù)字信息資源整合在一起,為今后滿足用戶相似的信息需求做好準備。可見,DOI技術(shù)的參考鏈接功能,既方便了用戶檢索信息,又方便了工作人員對數(shù)字信息資源的管理,可為我國數(shù)字信息資源的共建共享提供借鑒。
標準化是制約數(shù)字信息資源共建共享實現(xiàn)的又一個關(guān)鍵因素。目前,我國數(shù)字信息資源共建共享發(fā)展中存在的突出問題就是標準不統(tǒng)一,分布式異構(gòu)數(shù)據(jù)庫之間的互操作實現(xiàn)困難,導(dǎo)致數(shù)字信息資源共建共享進展緩慢。如何實現(xiàn)數(shù)字信息資源開發(fā)與利用的標準化成為數(shù)字信息資源管理領(lǐng)域急需解決的重要問題。DOI技術(shù)作為數(shù)字信息資源應(yīng)用的規(guī)則體系,其編碼規(guī)則與號碼分配及其管理機制與解析機制都為數(shù)字信息資源的開發(fā)與應(yīng)用提供了統(tǒng)一的規(guī)范。首先,DOI號碼的編碼規(guī)則統(tǒng)一了數(shù)字信息資源標識符的格式,實現(xiàn)了數(shù)字信息資源標識的一致;其次,DOI號碼的分配及其管理機制,保證了在 DOI系統(tǒng)申請注冊的數(shù)字信息資源更新、維護、管理的統(tǒng)一;再次,DOI號碼的解析機制使用戶能夠?qū)崿F(xiàn)對數(shù)字信息資源的統(tǒng)一檢索,以某一數(shù)字信息資源的 DOI號碼為檢索詞即可實現(xiàn)一次輸入、多次輸出,從而有利于解決異構(gòu)數(shù)據(jù)庫之間的互操作問題。由此可見,DOI技術(shù)在實現(xiàn)數(shù)字信息資源開發(fā)與利用標準化問題上也具有重要意義。
從DOI技術(shù)在國內(nèi)外的發(fā)展現(xiàn)狀看,中文 DOI系統(tǒng)的發(fā)展落后于國外,而且國內(nèi)外參與 DOI系統(tǒng)的大多都是出版商與數(shù)據(jù)庫商,作為保存和傳播數(shù)字信息資源重要機構(gòu)的圖書館卻很少參與。畢竟數(shù)字信息資源是全人類的共同財富,不是出版商的專利。數(shù)字信息的編碼和互通對數(shù)字信息資源的共享和利用關(guān)系巨大,需要有關(guān)各方的共同參與,體現(xiàn)各方的利益要求。 DOI技術(shù)的價值絕不應(yīng)僅僅體現(xiàn)在出版領(lǐng)域,始終以實現(xiàn)數(shù)字信息資源共享為奮斗目標的圖書館應(yīng)當積極參與 DOI技術(shù)的研究與應(yīng)用?,F(xiàn)提出幾點關(guān)于我國圖書館應(yīng)用 DOI技術(shù)開展數(shù)字信息資源建設(shè)與服務(wù)的策略。
為了充分利用 DOI技術(shù),圖書館應(yīng)當加入 DOI系統(tǒng),成為DOI系統(tǒng)的會員。目前,中文 DOI號碼注冊中心制定的相關(guān)政策規(guī)定:圖書館、出版商、數(shù)據(jù)集成商均可以成為該中心的注冊會員。圖書館成為該中心會員以后,可以把中文 DOI系統(tǒng)作為本地鏈接方案的一部分,為館藏數(shù)字信息資源提供 DOI鏈接,進一步豐富館藏數(shù)字信息資源,擴大館藏數(shù)字信息資源檢索與獲取范圍,實現(xiàn)從原文到引文之間的一站式檢索。
目前,西文 DOI系統(tǒng)的發(fā)展已經(jīng)比較成熟,很多出版機構(gòu)、行業(yè)協(xié)會、政府部門與圖書館等都已加入了 IDF(英特爾開發(fā)者論壇),多數(shù)西文出版社和全文數(shù)據(jù)庫均采用 DOI號碼作為文獻的唯一標識。其中,以 CrossRef為代表。據(jù) 2008年~2009年CrossRef的年度報告統(tǒng)計數(shù)據(jù)顯示,目前每天新增注冊記錄 15000條,截至 2009年底,DOI號碼的注冊數(shù)量已達37101562條。而據(jù)中文DOI網(wǎng)站統(tǒng)計數(shù)據(jù)顯示,截至 2010年 7月 30日,接受的中文 DOI號碼注冊總量為1350217條,中文注冊總量顯然與國外相差很多,由此可見 DOI技術(shù)在我國還未得到普遍推廣。因此,圖書館加入中文DOI系統(tǒng)的同時,還應(yīng)當加強同國外 DOI系統(tǒng)的交流與合作,積極參與 IDF有關(guān) DOI技術(shù)政策的制定與元數(shù)據(jù)的開發(fā),為數(shù)字圖書館建設(shè)與實現(xiàn)數(shù)字信息資源共享提供技術(shù)支持。
數(shù)字信息資源建設(shè)是數(shù)字圖書館發(fā)展的關(guān)鍵問題。圖書館進行數(shù)字信息資源建設(shè)的方式一般有兩種:一種是從出版商、數(shù)據(jù)集成商那里購買與引進數(shù)字信息資源,另一種是通過對館藏紙質(zhì)文獻信息資源進行數(shù)字化或自建特色數(shù)據(jù)庫的方式充實數(shù)字信息資源。而自建數(shù)據(jù)庫的結(jié)構(gòu)往往與引進的數(shù)據(jù)庫不同,標準不統(tǒng)一,從而導(dǎo)致數(shù)據(jù)庫之間的互操作困難,不利于數(shù)字信息資源的共享。 DOI系統(tǒng)能夠?qū)崿F(xiàn)圖書館、出版商、數(shù)據(jù)集成商所提供數(shù)字信息資源之間的鏈接,達到各方的共贏??梢?利用DOI系統(tǒng)的技術(shù)優(yōu)勢有利于實現(xiàn)圖書館數(shù)字信息資源的建設(shè)與共享。因此,圖書館應(yīng)當加強同出版商、數(shù)據(jù)集成商之間的溝通與交流,在購買數(shù)據(jù)庫時盡量選擇那些在 DOI系統(tǒng)注冊了的數(shù)據(jù)集成商開發(fā)的產(chǎn)品,既可以節(jié)約經(jīng)費,又能最大限度地實現(xiàn)數(shù)字信息資源的使用價值。
DOI技術(shù)作為一項新技術(shù),目前還未引入我國圖書館。但是,隨著我國數(shù)字圖書館建設(shè)的進展,DOI技術(shù)憑借其在數(shù)字信息資源管理方面的優(yōu)勢,必將在我國圖書館的數(shù)字信息資源建設(shè)與服務(wù)領(lǐng)域得到廣泛應(yīng)用,從而推動我國數(shù)字信息資源共建共享的發(fā)展進程。
[2]田杰,吳琳.DOI在數(shù)字圖書館科技外文文獻共享服務(wù)中的應(yīng)用探討[J].數(shù)字圖書館論壇,2007,(10):23~27.
[3]柯藐茜.論網(wǎng)絡(luò)環(huán)境下圖書館文獻信息資源的共建共享[J].河北科技圖苑,2008,21(6):63~65.
[4]蔡焰輝.我國數(shù)字資源唯一標識符的發(fā)展與應(yīng)用研究[J].情報探索,2009,(4):62~64.
[5]江澤琴,楊曦,周厚永.中文期刊論文 DOI的概念、構(gòu)成及其意義[J].西南軍醫(yī),2009,11(4):806.