孫銳 楊新涯 魏群義 李燕 廖維
摘要 文獻(xiàn)資產(chǎn)元數(shù)據(jù)倉儲(chǔ)建設(shè)是圖書館文獻(xiàn)資產(chǎn)管理的基礎(chǔ),在文獻(xiàn)資產(chǎn)元數(shù)據(jù)倉儲(chǔ)建設(shè)中,文獻(xiàn)資產(chǎn)權(quán)益的法律保障問題、圖書館合理獲得及使用文獻(xiàn)元數(shù)據(jù)的權(quán)益保障問題及資產(chǎn)元數(shù)據(jù)組織規(guī)范問題的解決是關(guān)鍵。文章通過對(duì)高校圖書館數(shù)字資源采購聯(lián)盟(DigitalResource Acquisition Alliance of Chinese Academic Libraries,縮寫為DRAA)采購方案樣本中存檔權(quán)、永久使用權(quán)、永久訪問權(quán)、元數(shù)據(jù)獲得權(quán)等與資產(chǎn)管理密切相關(guān)的條款的研究,探討數(shù)字資產(chǎn)權(quán)益的保障程度;并以重慶大學(xué)圖書館為例,提出了基于教育部學(xué)科門類進(jìn)行資源組織的思路,提出了文獻(xiàn)判重標(biāo)準(zhǔn)和數(shù)字資產(chǎn)館藏號(hào)方案。
關(guān)鍵詞 元數(shù)據(jù)元數(shù)據(jù)倉儲(chǔ) 文獻(xiàn)資產(chǎn)管理 資產(chǎn)權(quán)益 采購協(xié)議 數(shù)字資產(chǎn) 重慶大學(xué)圖書館
分類號(hào) G250
DOI 10.16603/j.issn1002 - 1027.2018.02.003
1 引言
文獻(xiàn)資產(chǎn)管理是圖書館服務(wù)的基礎(chǔ),根據(jù)《事業(yè)單位國有資產(chǎn)管理暫行辦法》的規(guī)定,資產(chǎn)管理以維護(hù)國有資產(chǎn)的安全完整、合理配置和有效利用為目標(biāo)。安全完整指文獻(xiàn)資產(chǎn)有詳細(xì)清楚的資產(chǎn)賬目,賬實(shí)相符;合理配置指文獻(xiàn)資產(chǎn)滿足讀者和學(xué)科發(fā)展需要;有效利用指利用效果好,讀者滿意度高。其中安全完整是基礎(chǔ)。圖書館的文獻(xiàn)資產(chǎn)包括紙質(zhì)資產(chǎn)、虛擬的數(shù)字資產(chǎn)和其他載體資產(chǎn),紙質(zhì)資產(chǎn)和其他載體資產(chǎn)通過常規(guī)的文獻(xiàn)編目形成目錄和財(cái)產(chǎn)賬,實(shí)現(xiàn)資產(chǎn)的借閱、增加、減少、變動(dòng)、盤存等管理。數(shù)字資產(chǎn)管理則還停留在以“庫”為粒度的粗放式管理上,圖書館網(wǎng)站顯示的是同質(zhì)化的數(shù)據(jù)庫陳列服務(wù),數(shù)據(jù)庫成為一個(gè)個(gè)信息孤島,無法實(shí)現(xiàn)聚類和重組;無法展示具有本校特色的文獻(xiàn)信息資源體系;無法掌握文獻(xiàn)資源完整詳細(xì)的館藏情況、利用情況等大數(shù)據(jù);無法為用戶提供精細(xì)化的信息服務(wù)。數(shù)字資產(chǎn)的采購經(jīng)費(fèi)占國家下?lián)芙?jīng)費(fèi)的比例越來越高,成為文獻(xiàn)資產(chǎn)的重要組成部分,數(shù)字資產(chǎn)管理水平亟待提高。
重慶大學(xué)圖書館正在進(jìn)行的文獻(xiàn)資產(chǎn)元數(shù)據(jù)倉儲(chǔ)建設(shè),將圖書以“冊(cè)”為基本單元,其余文獻(xiàn)以“篇”為基本單元進(jìn)行整合,利用資產(chǎn)管理平臺(tái)盤點(diǎn)了圖書、期刊論文、學(xué)位論文、標(biāo)準(zhǔn)等4類全文數(shù)據(jù)庫的資產(chǎn),目前已收集、整理了1.3億條元數(shù)據(jù),實(shí)現(xiàn)了圖書館元數(shù)據(jù)百萬級(jí)向億級(jí)的飛躍。在文獻(xiàn)資產(chǎn)元數(shù)據(jù)倉儲(chǔ)建設(shè)的過程中,有3個(gè)關(guān)鍵問題值得研究:文獻(xiàn)資產(chǎn)相關(guān)權(quán)益的法律保障、圖書館合理獲得及使用文獻(xiàn)元數(shù)據(jù)的權(quán)益保障及元數(shù)據(jù)組織的相關(guān)標(biāo)準(zhǔn)。
2 文獻(xiàn)資產(chǎn)權(quán)益的法律保障研究
圖書館的紙質(zhì)資產(chǎn)和其他載體資產(chǎn)具有物理載體,圖書館擁有所有權(quán),可在法律范圍之內(nèi)為讀者提供外借、復(fù)制、館際互借、匯編等服務(wù),通過常規(guī)的文獻(xiàn)編目形成目錄和財(cái)產(chǎn)賬,實(shí)現(xiàn)資產(chǎn)的增減、調(diào)配、盤存等管理,符合固定資產(chǎn)要求的資產(chǎn)還要建固定資產(chǎn)賬目,資產(chǎn)權(quán)益得到保障。數(shù)字資源由于實(shí)行許可證制度,資源獲取與擁有相分離,即很多情況下圖書館實(shí)際只從出版商那里購買了使用權(quán),沒有實(shí)際的所有權(quán)。為加強(qiáng)對(duì)數(shù)字資產(chǎn)的控制,DRAA在《高校圖書館數(shù)字資源采購聯(lián)盟工作規(guī)范(草案)》中第十五條明確規(guī)定:一般情況下,所購買數(shù)據(jù)庫應(yīng)有存檔權(quán),存檔可采取聯(lián)盟公共存檔或成員館白行存檔的方式。此外,成員館可以通過訪問聯(lián)盟公共存檔或者成員館自己存檔的數(shù)據(jù)和數(shù)據(jù)庫商提供永久訪問的權(quán)限兩種方式或其中的一種方式永久使用所購數(shù)據(jù)庫。存檔權(quán)、永久訪問權(quán)、永久使用權(quán)是與文獻(xiàn)資產(chǎn)屬性密切相關(guān)的資產(chǎn)權(quán)益。本文對(duì)高校圖書館數(shù)字資源采購聯(lián)盟(Digital Resource Acqui-sition Alliance of Chinese Academic Libraries,以下簡稱DRAA)聯(lián)合采購的20個(gè)合同期內(nèi)數(shù)據(jù)庫的采購方案進(jìn)行調(diào)研,涉及期刊、圖書、學(xué)位論文、會(huì)議錄、事實(shí)數(shù)值、參考工具等文獻(xiàn)類型,重點(diǎn)調(diào)研許可協(xié)議中有關(guān)存檔權(quán)、永久使用權(quán)、永久訪問權(quán)等方面的內(nèi)容。
存檔權(quán)(Archive Right):有關(guān)主體出于為國家和公眾長遠(yuǎn)保護(hù)網(wǎng)絡(luò)信息和有效開展服務(wù)的動(dòng)機(jī),而擁有的對(duì)網(wǎng)絡(luò)信息定期或不定期進(jìn)行捕獲、歸檔、保存等權(quán)利,它是有關(guān)主體為了履行其所承擔(dān)的社會(huì)職責(zé)所必須具備的職業(yè)權(quán)利。存檔權(quán)是采購方案重要的關(guān)注點(diǎn)之一,關(guān)乎圖書館所購買的數(shù)字資產(chǎn)能否在圖書館長期保存。
使用權(quán)(Use Right):從公眾的利益考慮,圖書館對(duì)數(shù)字資源的使用應(yīng)該有這樣一些權(quán)利,即訪問權(quán)、下載權(quán)、打印權(quán)、有限的館際互借權(quán)和有限的上載權(quán),非惡意的或技術(shù)過程所必須的無商業(yè)利益的解密權(quán)等。有學(xué)者指出數(shù)字圖書館應(yīng)當(dāng)在特定的價(jià)格范圍內(nèi)要求最大化的使用形式。美國加州大學(xué)為不受制于出版商,獨(dú)立創(chuàng)建了CDL電子資源許可協(xié)議模型,該模型明確規(guī)定:許可協(xié)議必須指明當(dāng)數(shù)據(jù)庫移除時(shí),加州大學(xué)對(duì)于已經(jīng)付費(fèi)的電子資源擁有永久使用權(quán),資源提供商必須明確描述圖書館及其使用者的權(quán)利,也必須相信圖書館擁有監(jiān)控合法使用信息的能力。
訪問權(quán)(Access Rights):國家標(biāo)準(zhǔn)《GB/T4894-2009信息文獻(xiàn)與術(shù)語》對(duì)“訪問權(quán)”的解釋是:獲取或利用圖書館館藏的權(quán)利。即訪問權(quán)不僅僅是普通意義上的瀏覽,從這個(gè)解釋來看,圖書館對(duì)數(shù)字資源的訪問、下載、打印、館際互借乃至技術(shù)過程所必須的無商業(yè)利益的解密都是獲取和利用圖書館館藏的方式,屬于訪問權(quán)的范疇。因此,使用權(quán)(UseRight)與訪問權(quán)(Access Right)并無實(shí)際意義的差別。
20個(gè)數(shù)據(jù)庫采購方案中出現(xiàn)“永久使用權(quán)”、“永久訪問權(quán)”等字樣,但均未進(jìn)一步說明該權(quán)利包含的具體內(nèi)容,大部分方案給予圖書館的是永久訪問權(quán)而非永久使用權(quán)。
根據(jù)表1可以看出:
2.1 僅70%的數(shù)據(jù)庫給予圖書館永久訪問權(quán)/使用權(quán)
20個(gè)數(shù)據(jù)庫給予圖書館永久使用權(quán)的有2個(gè):PQDT為免費(fèi)提供,“提供訂購相應(yīng)篇數(shù)的PDF論文全文的永久使用權(quán)”,當(dāng)然,對(duì)某一家具體圖書館來講,訂購相應(yīng)篇數(shù)的數(shù)量并不多;ScienceDirectOnline為付費(fèi)提供,協(xié)議第13條規(guī)定:訂閱者在全部年度訂閱終止時(shí),可選擇2種方式訪問和使用,一種是付費(fèi)獲得、裝載及技術(shù)性格式化其已付費(fèi)出版年份內(nèi)全部或部分訂閱題目的電子副本,另一種是支付年度訪問費(fèi)。給予圖書館永久訪問權(quán)的有11個(gè),占55%,其中8個(gè)為免費(fèi)提供,3個(gè)為付費(fèi)提供;6個(gè)數(shù)據(jù)庫在方案里未提及永久使用權(quán)和永久訪問權(quán),占30%。
2.2 文獻(xiàn)類型與提供永久訪問權(quán)不絕對(duì)相關(guān)
一直以來,圖書館界普遍認(rèn)為電子圖書供應(yīng)商應(yīng)提供永久使用權(quán)或永久訪問權(quán),期刊數(shù)據(jù)庫供應(yīng)商應(yīng)提供購買年限的永久使用權(quán)或永久訪問權(quán),事實(shí)型/數(shù)值型/參考工具型數(shù)據(jù)庫供應(yīng)商一般不會(huì)提供,基于這種認(rèn)識(shí),在與數(shù)據(jù)庫商協(xié)議時(shí),圖書館方對(duì)擁有電子圖書和電子期刊的永久使用權(quán)或永久訪問權(quán)的堅(jiān)持會(huì)表現(xiàn)比較強(qiáng)硬,通過對(duì)20個(gè)方案的分析,發(fā)現(xiàn)這個(gè)認(rèn)識(shí)有偏頗。
20個(gè)方案中涉及的5類文獻(xiàn)均有可提供永久使用/訪問權(quán)的方案,也均有未提及永久使用/訪問權(quán)的方案。有4個(gè)期刊數(shù)據(jù)庫的方案沒有提及永久訪問權(quán)和永久使用權(quán),占樣本中期刊數(shù)據(jù)庫的比例為30%。明確表明不提供的1個(gè)數(shù)據(jù)庫是律商聯(lián)訊(LexisNexis Academic及Lexis.com),其在方案中的表述為:“基于數(shù)據(jù)庫性質(zhì),律商聯(lián)訊無法提供存檔服務(wù)以及合同以外的服務(wù)?!?/p>
“Wiley Current Protocols實(shí)驗(yàn)室指南”收錄18000篇同行評(píng)審、定期更新的分步式實(shí)驗(yàn)室流程,為參考工具型數(shù)據(jù)庫,在2017.1.1 - 2019.12. 31的方案里明確表述:連續(xù)訂購三年8個(gè)實(shí)驗(yàn)室指南以上(含8個(gè))可獲得訂購專輯的訂購當(dāng)年永久訪問權(quán),其他訂購方式均為訂購當(dāng)年訪問權(quán)。
2.3 大部分?jǐn)?shù)據(jù)庫聯(lián)合采購方案未提及存檔權(quán)
20個(gè)方案中有9個(gè)方案未提及存檔權(quán),涉及各種文獻(xiàn)類型,占45%;4個(gè)方案為付費(fèi)提供;6個(gè)方案為免費(fèi)提供;1個(gè)方案不提供,明確不提供存檔權(quán)的數(shù)據(jù)庫為“LexisNexis Academic及Lexis.com”。
2.4 購買存檔權(quán)的費(fèi)用不菲
4個(gè)付費(fèi)提供的方案均為期刊數(shù)據(jù)庫,其存檔費(fèi)用占訂購金額的比例在4-22%之間。美國物理學(xué)會(huì)數(shù)據(jù)庫(APS)的存檔費(fèi)用最高,占Tl級(jí)用戶訂購價(jià)格的21.59%。如此高的價(jià)格將會(huì)使圖書館在經(jīng)費(fèi)有限的情況下完全不去采購,失去了提供存檔的意義。另外,如何使用存檔權(quán)并不清楚,方案中沒有提及,圖書館館員也大都沒有相關(guān)知識(shí)和經(jīng)驗(yàn)。4個(gè)付費(fèi)存檔的數(shù)據(jù)庫見表2。
2.5 圖書館的資產(chǎn)權(quán)益保障現(xiàn)狀不容樂觀
據(jù)對(duì)20個(gè)采購方案的資產(chǎn)屬性條款進(jìn)行分析,發(fā)現(xiàn)從法律角度保障圖書館資產(chǎn)權(quán)益的狀況不容樂觀,圖書館界須進(jìn)一步與數(shù)據(jù)庫商博弈,爭取更多權(quán)益。同時(shí)在與數(shù)據(jù)庫商簽訂采購方案時(shí).應(yīng)注意條款的完整規(guī)范,建議向加州大學(xué)學(xué)習(xí),建立適合國情并保障圖書館權(quán)益的電子資源許可協(xié)議模型,進(jìn)一步規(guī)范協(xié)議的簽訂。
3 圖書館合理獲得及使用文獻(xiàn)元數(shù)據(jù)的權(quán)益保障研究
元數(shù)據(jù)是數(shù)據(jù)的數(shù)據(jù),是用來描述和規(guī)定數(shù)據(jù)特征、相互關(guān)系以及相應(yīng)操作的數(shù)據(jù)的集合,構(gòu)建完整的圖書館文獻(xiàn)資源元數(shù)據(jù)倉儲(chǔ)是圖書館對(duì)文獻(xiàn)資產(chǎn)進(jìn)行管理的基礎(chǔ)。數(shù)字資產(chǎn)的元數(shù)據(jù)既有資源集合的元數(shù)據(jù),又有資源對(duì)象的元數(shù)據(jù)。資源集合元數(shù)據(jù)用來描述和管理電子資源的集合,如圖書、期刊、論文集、會(huì)議錄等;資源對(duì)象元數(shù)據(jù)用來描述某一具體不可再細(xì)分的電子資源,例如一篇論文、一份標(biāo)準(zhǔn)、一篇學(xué)位論文。元數(shù)據(jù)是數(shù)據(jù)庫的詳細(xì)目錄,是建設(shè)資產(chǎn)元數(shù)據(jù)倉儲(chǔ)的基礎(chǔ),紙質(zhì)資產(chǎn)的元數(shù)據(jù)在采購合同中有規(guī)定,元數(shù)據(jù)提供已經(jīng)成為紙質(zhì)資產(chǎn)采購合同必備條款之一。數(shù)字資產(chǎn)的元數(shù)據(jù)作為數(shù)據(jù)庫產(chǎn)品的目錄應(yīng)由各數(shù)據(jù)庫商無償提供給購買方,數(shù)據(jù)庫商可要求購買方承諾在合理范圍內(nèi)使用。通過對(duì)DRAA聯(lián)合采購的20個(gè)合同期內(nèi)數(shù)據(jù)庫的采購方案相關(guān)條款的調(diào)研,發(fā)現(xiàn)情況不容樂觀。
3.1 大部分方案未提及是否可提供元數(shù)據(jù)
20個(gè)聯(lián)合采購方案有14個(gè)沒有提到是否提供元數(shù)據(jù),有6個(gè)方案提到可以提供元數(shù)據(jù),均為MARC格式數(shù)據(jù),僅占30%。提供MARC數(shù)據(jù)的方案中,有2個(gè)為期刊數(shù)據(jù)庫,3個(gè)為圖書數(shù)據(jù)庫,1個(gè)為學(xué)位論文數(shù)據(jù)庫。
3.2提供元數(shù)據(jù)的方式不明確
提供元數(shù)據(jù)的方式很重要,是圖書館利用好元數(shù)據(jù)的基礎(chǔ)和保障,大部分方案沒有提及。例如:《牛津期刊現(xiàn)刊庫聯(lián)合采購方案(2017)》:提供免費(fèi)的MARC記錄。通過這個(gè)條款,我們無法知道是以什么方式提供,是自動(dòng)收割,還是客戶下載,亦或電子郵件發(fā)送?
3.3 圖書館獲取元數(shù)據(jù)的相關(guān)對(duì)策
通過以上研究,可見圖書館獲取元數(shù)據(jù)的權(quán)益未得到采購方案的充分保障,作為數(shù)據(jù)庫產(chǎn)品的目錄,應(yīng)成為數(shù)據(jù)庫商銷售產(chǎn)品的一部分,理應(yīng)提供給圖書館,按圖書館所希望的方式提供。元數(shù)據(jù)是資產(chǎn)管理的基礎(chǔ),因此在簽訂采購協(xié)議時(shí)應(yīng)通過相關(guān)條款明確下來。當(dāng)前情況下,要獲得元數(shù)據(jù),需要在續(xù)訂時(shí)與數(shù)據(jù)庫商進(jìn)一步博弈,重慶大學(xué)圖書館在建設(shè)文獻(xiàn)資產(chǎn)數(shù)據(jù)倉儲(chǔ)時(shí)向所有數(shù)據(jù)庫商發(fā)出征集元數(shù)據(jù)的通知,數(shù)據(jù)庫商均能很快響應(yīng):有的數(shù)據(jù)庫商直接提供、有的采用簽補(bǔ)充協(xié)議的方式提供、也有的明確表態(tài)不提供。經(jīng)過半年多的努力,獲得了39個(gè)數(shù)據(jù)庫的元數(shù)據(jù),合計(jì)1.3億條,提供者包括Elsevier、Wiley、Springer等大出版商。
4 文獻(xiàn)資產(chǎn)元數(shù)據(jù)組織的相關(guān)標(biāo)準(zhǔn)研究
文獻(xiàn)資產(chǎn)元數(shù)據(jù)倉儲(chǔ)建設(shè)涉及的標(biāo)準(zhǔn)有元數(shù)據(jù)標(biāo)準(zhǔn)、分類標(biāo)準(zhǔn)、判重標(biāo)準(zhǔn)等。重慶大學(xué)圖書館的文獻(xiàn)資產(chǎn)元數(shù)據(jù)以都柏林核心元素集(Dublin CoreElement Set,以下簡稱DC)為基礎(chǔ),結(jié)合需要整合的文獻(xiàn)類型特征,形成元數(shù)據(jù)方案。DC是一個(gè)致力于規(guī)范Web資源體系結(jié)構(gòu)的國際性元數(shù)據(jù)解決方案,是成熟而廣為接受的元數(shù)據(jù)格式,這里不再贅述。本文重點(diǎn)闡述分類標(biāo)準(zhǔn)及文獻(xiàn)判重標(biāo)準(zhǔn)。
4.1 基于教育部學(xué)科分類的文獻(xiàn)分類標(biāo)準(zhǔn)
根據(jù)文獻(xiàn)的學(xué)科屬性進(jìn)行分類是圖書館組織和揭示文獻(xiàn)的重要方式,國內(nèi)圖書館多采用《中國圖書館分類法》(簡稱《中圖法》)進(jìn)行分類,《中圖法》將知識(shí)分為5大部類22個(gè)大類?!镀胀ǜ叩葘W(xué)校本科專業(yè)目錄(2012年)》是高等教育工作的基本指導(dǎo)性文件之一。它規(guī)定的專業(yè)劃分、名稱及所屬門類,是設(shè)置和調(diào)整專業(yè)、實(shí)施人才培養(yǎng)、安排招生、授予學(xué)位、指導(dǎo)就業(yè)、進(jìn)行教育統(tǒng)計(jì)和人才需求預(yù)測等工作的重要依據(jù),該目錄一共12個(gè)門類92個(gè)專業(yè)。增加按教育部《普通高等學(xué)校本科專業(yè)目錄( 2012年)》的學(xué)科門類的分類代碼標(biāo)引,可為后續(xù)的虛擬專業(yè)圖書館的資源組織及學(xué)科服務(wù)提供便利。具體方式是將《中圖法》第五版和教育部學(xué)科分類進(jìn)行映射,將《中圖法》的270個(gè)類目映射到92個(gè)專業(yè)類目,實(shí)現(xiàn)教育部學(xué)科專業(yè)類代碼的自動(dòng)標(biāo)引。大量的外文文獻(xiàn)沒有《中圖法》分類號(hào),則根據(jù)主題詞、關(guān)鍵詞、標(biāo)題等,依照自建的《主題詞表》進(jìn)行自動(dòng)分類標(biāo)引,該主題詞表以《中國分類主題詞表》為主,補(bǔ)充了部分主題詞,擁有150萬個(gè)主題詞,覆蓋范圍比較廣,標(biāo)引效果比較好。
要做到教育部學(xué)科門類與《中圖法》分類號(hào)的精確映射很難,學(xué)科發(fā)展具有交叉、滲透的特點(diǎn),但是通過教育部學(xué)科分類代碼的標(biāo)引,增加組織文獻(xiàn)的一種方式,可按教育部學(xué)科門類集中文獻(xiàn),具體來說,有以下作用。
(1)快速盤點(diǎn)文獻(xiàn)資產(chǎn)情況,對(duì)學(xué)校相關(guān)專業(yè)評(píng)估數(shù)據(jù)的統(tǒng)計(jì)、報(bào)送及館藏分析極有幫助。圖2是機(jī)械類期刊論文的館藏情況。
期刊論文是最重要的學(xué)科資源,分散于若干數(shù)據(jù)庫中,通過資產(chǎn)盤點(diǎn),以圖表方式展示了機(jī)械類期刊論文的館藏總量、主要分布數(shù)據(jù)庫、語種分布和發(fā)表年分布,同時(shí)可通過輸入限制條件,如導(dǎo)入資產(chǎn)的批次、作者、標(biāo)題,進(jìn)一步篩選并輸出館藏清單。
(2)自動(dòng)生成若干虛擬專業(yè)圖書館,提升學(xué)科服務(wù)能力。
在“雙一流大學(xué)”建設(shè)中,文獻(xiàn)資源是學(xué)科建設(shè)的重要支撐,國家投入了巨額經(jīng)費(fèi)購買文獻(xiàn),但是文獻(xiàn)分散于各數(shù)據(jù)庫中,在文獻(xiàn)資產(chǎn)元數(shù)據(jù)倉儲(chǔ)中,除圖書外均以“篇”為基本單元進(jìn)行元數(shù)據(jù)的整合,打破了數(shù)據(jù)庫壁壘;基于教育部分類的標(biāo)引使文獻(xiàn)能按專業(yè)門類集中并展示出來,數(shù)字圖書館可以呈現(xiàn)若干虛擬的專業(yè)圖書館,極大地提升了資源的顯示度,學(xué)科服務(wù)更有針對(duì)性。
4.2 文獻(xiàn)判重方案
在圖書館文獻(xiàn)管理中,“種”和“冊(cè)”的概念非常清晰,衡量一個(gè)圖書館的館藏是否豐富,除了看冊(cè)數(shù),更重要的是看有多少品種。在數(shù)字資產(chǎn)的數(shù)據(jù)整理中,提供判重的標(biāo)準(zhǔn)非常重要,通過判斷重復(fù),合并相同文獻(xiàn)的元數(shù)據(jù),不同來源的同一種文獻(xiàn)認(rèn)定為復(fù)本,在館藏號(hào)字段添加館藏號(hào),通過相同數(shù)據(jù)的合并和館藏號(hào)管理,理清數(shù)字資產(chǎn)的品種與復(fù)本,得到館藏的真實(shí)狀況。不同文獻(xiàn)類型重復(fù)甄別的規(guī)則不同,重慶大學(xué)圖書館在資產(chǎn)元數(shù)據(jù)倉儲(chǔ)建設(shè)過程中,先整合了圖書、期刊、學(xué)位論文和標(biāo)準(zhǔn)這四類文獻(xiàn),依據(jù)表4的判重規(guī)則甄別重復(fù)文獻(xiàn)。
(1)文獻(xiàn)判重方案使采購前查重、采購后驗(yàn)收成為可能,完善了文獻(xiàn)資產(chǎn)管理流程。
依據(jù)文獻(xiàn)判重的標(biāo)準(zhǔn),可利用資產(chǎn)管理系統(tǒng)的數(shù)據(jù)工具功能為文獻(xiàn)采購進(jìn)行查重,生成訂購數(shù)據(jù),為數(shù)字文獻(xiàn)采購及到貨驗(yàn)收提供依據(jù)。查重和驗(yàn)收是圖書館的常規(guī)工作,是文獻(xiàn)采購的重要環(huán)節(jié)。資產(chǎn)管理系統(tǒng)使用前,由于元數(shù)據(jù)不完備,業(yè)務(wù)系統(tǒng)功能不完善,無法對(duì)電子資源進(jìn)行批量查重和驗(yàn)收,采購書單的驗(yàn)收采用抽查方式,效率低下,效果欠佳,資產(chǎn)系統(tǒng)的使用使工作流程更加規(guī)范,效率顯著提高。
(2)文獻(xiàn)判重方案為文獻(xiàn)的統(tǒng)計(jì)分析提供依據(jù)。
查重功能可分析數(shù)據(jù)庫指定導(dǎo)入批次文獻(xiàn)資源的獨(dú)有及重復(fù)情況,以圖書為例,包括指定批次獨(dú)有圖書的情況:獨(dú)有數(shù)量、學(xué)科分布、出版年分布;重復(fù)圖書情況:重復(fù)數(shù)量、學(xué)科分布、出版年分布等。對(duì)重慶大學(xué)圖書館采購的3個(gè)中文電子圖書數(shù)據(jù)庫進(jìn)行查重后顯示,總量234萬冊(cè)電子書中,獨(dú)有圖書占76%,掌握重復(fù)情況,可分析、對(duì)比數(shù)據(jù)庫的重復(fù)數(shù)量,見表5。
4.3 館藏號(hào)方案
館藏號(hào)是文獻(xiàn)收藏單位所保管和收藏文獻(xiàn)的唯一編號(hào),具有唯一識(shí)別文獻(xiàn)的功能,是文獻(xiàn)收藏單位資產(chǎn)入賬及銷賬的依據(jù)。館藏號(hào)的概念源于圖書館對(duì)紙本文獻(xiàn)的管理,圖書館將每冊(cè)紙本圖書和期刊裝訂本都賦予一個(gè)館藏號(hào)。圖書館采用機(jī)讀目錄以前,館藏號(hào)一般是用號(hào)碼機(jī)打印的流水號(hào);采用機(jī)讀目錄以后,館藏號(hào)一般是可掃描的條形碼。數(shù)字資產(chǎn)的管理也需要館藏號(hào),以實(shí)現(xiàn)對(duì)數(shù)字資產(chǎn)的增加、減量、變動(dòng)和盤點(diǎn)的精細(xì)化管理,以不同的館藏號(hào)區(qū)分不同館藏來源,使館藏統(tǒng)計(jì)更為精確。重慶大學(xué)圖書館的數(shù)字文獻(xiàn)資產(chǎn)館藏號(hào)由三部分組成:機(jī)構(gòu)代碼、文獻(xiàn)類型代碼和流水號(hào)。機(jī)構(gòu)代碼采用教育部為高校編制的學(xué)校標(biāo)識(shí)碼后5位數(shù),重慶大學(xué)為10611;文獻(xiàn)類型代碼由1位阿拉伯?dāng)?shù)字構(gòu)成,用于區(qū)分文獻(xiàn)類型;流水號(hào)由10位阿拉伯?dāng)?shù)字組成,每類文獻(xiàn)容納數(shù)量為十億級(jí)。
5 結(jié)語
維克托·邁爾·舍恩伯格在《大數(shù)據(jù)時(shí)代》一書指出:大數(shù)據(jù)目前為我們生活、思維、工作所帶來改變,大數(shù)據(jù)時(shí)代的開啟是一個(gè)時(shí)代重要的轉(zhuǎn)型。對(duì)于圖書館來說,做數(shù)據(jù)的擁有者才能更好地管理資源,為讀者提供文獻(xiàn)服務(wù),充分發(fā)揮文獻(xiàn)資產(chǎn)的管理者和使用者的作用。文獻(xiàn)資產(chǎn)元數(shù)據(jù)倉儲(chǔ)建設(shè)中關(guān)鍵問題的研究,為重慶大學(xué)圖書館建設(shè)文獻(xiàn)資產(chǎn)元數(shù)據(jù)倉儲(chǔ)掃清了障礙,初步實(shí)現(xiàn)了圖書、期刊、學(xué)位論文和標(biāo)準(zhǔn)資產(chǎn)元數(shù)據(jù)的整合,為服務(wù)教學(xué)科研打下了堅(jiān)實(shí)的基礎(chǔ)。