陳和
(廈門大學(xué)圖書館,廈門 361005)
芻議國內(nèi)高??茖W(xué)數(shù)據(jù)知識庫的構(gòu)建
陳和
(廈門大學(xué)圖書館,廈門 361005)
本文在概述國內(nèi)科學(xué)數(shù)據(jù)知識庫建設(shè)現(xiàn)狀的基礎(chǔ)上,對構(gòu)建科學(xué)數(shù)據(jù)知識庫所屬范疇、科學(xué)數(shù)據(jù)管理政策、元數(shù)據(jù)方案、科學(xué)數(shù)據(jù)獲取、系統(tǒng)平臺選擇、館員素養(yǎng)與能力等關(guān)鍵問題進行分析探討,為國內(nèi)高校圖書館構(gòu)建科學(xué)數(shù)據(jù)知識庫提供借鑒與參考。
數(shù)據(jù)管理;數(shù)據(jù)知識庫;機構(gòu)知識庫;高校圖書館
隨著新技術(shù)的應(yīng)用和交叉學(xué)科的不斷發(fā)展,以及科學(xué)研究范式的轉(zhuǎn)變,科學(xué)數(shù)據(jù)成為當下科研生產(chǎn)活動的熱門研究對象。一方面,隨著科研調(diào)查的不斷深入、傳感設(shè)備不斷輸出新監(jiān)測數(shù)據(jù)、科學(xué)實驗活動不斷獲得新觀測數(shù)據(jù)等,面對日益增長的科學(xué)數(shù)據(jù),科研人員提出科學(xué)數(shù)據(jù)管理的需求;另一方面,隨著開放科學(xué)的發(fā)展,科學(xué)數(shù)據(jù)開放獲取逐漸成為趨勢,科學(xué)數(shù)據(jù)管理日益受到重視。在大數(shù)據(jù)背景下,科學(xué)數(shù)據(jù)成為一種重要的科研資源,如英國聯(lián)合信息系統(tǒng)委員會的報告Managing and Sharing Data指出[1],研究數(shù)據(jù)是非常有價值的資源,通常需要更多的時間和金錢來生產(chǎn)和創(chuàng)造,其中很多數(shù)據(jù)的價值可能會超過原始的研究。
基于科學(xué)數(shù)據(jù)在科研活動中的重要性,國外相關(guān)科研主管機構(gòu)或科研基金資助組織提出,受資助的科研人員需要進行科學(xué)數(shù)據(jù)管理。由于圖書館在知識組織、保存和管理等方面的天然優(yōu)勢,能夠為科研人員提供科學(xué)數(shù)據(jù)管理服務(wù),并為其建立科學(xué)數(shù)據(jù)知識庫,使得科學(xué)數(shù)據(jù)能夠合理地進行組織與保存,以及在合理范圍內(nèi)實現(xiàn)開放共享,既滿足科研人員對科學(xué)數(shù)據(jù)管理的需求,也為挖掘科學(xué)數(shù)據(jù)的潛在價值提供平臺。
因此,構(gòu)建科學(xué)數(shù)據(jù)知識庫不僅是圖書館開展科學(xué)數(shù)據(jù)管理服務(wù)的一項重要工作,也是圖書館深入進行學(xué)科服務(wù)的一個重要平臺。通過網(wǎng)絡(luò)調(diào)查和文獻調(diào)研,國外高校圖書館科學(xué)數(shù)據(jù)知識庫建設(shè)已經(jīng)進入快速增長時期并逐漸趨向成熟;而國內(nèi)高校圖書館有關(guān)構(gòu)建科學(xué)數(shù)據(jù)知識庫的理論探索雖多,但實踐很少,科學(xué)數(shù)據(jù)知識庫在構(gòu)建數(shù)量和數(shù)據(jù)規(guī)模上與國外差距較大。本文就國內(nèi)高校構(gòu)建科學(xué)數(shù)據(jù)知識庫過程中的關(guān)鍵問題進行探討,提倡國內(nèi)高校圖書館應(yīng)抓住契機、克服困難,積極構(gòu)建科學(xué)數(shù)據(jù)知識庫,全面開展科學(xué)數(shù)據(jù)管理相關(guān)學(xué)科服務(wù)。
本文在中國知網(wǎng)中以“科學(xué)數(shù)據(jù)知識庫”“研究數(shù)據(jù)知識庫”“科研數(shù)據(jù)知識庫”為檢索詞,選定核心期刊和CSSCI為來源類別,檢索得到文獻41篇,其中與研究較為相關(guān)的文獻5篇。通過擴大檢索范圍,以“科學(xué)數(shù)據(jù)”“研究數(shù)據(jù)”“科研數(shù)據(jù)”為檢索詞,其他要求不變,最終獲得4 293篇文獻,經(jīng)過關(guān)鍵詞篩選、時間設(shè)定(2013年1月—2017年10月)和人工識別過濾等,獲得與本研究密切相關(guān)的文獻97篇。對檢索得到的文獻內(nèi)容進行分析,可以將目前科研人員討論科學(xué)數(shù)據(jù)知識庫的內(nèi)容概括為5個方面。
孫繼周[2]、申蓉[3]對E-Science概念、科學(xué)數(shù)據(jù)管理概念、科學(xué)數(shù)據(jù)管理內(nèi)容等進行探討,通過對科研人員科學(xué)數(shù)據(jù)管理需求調(diào)查,發(fā)現(xiàn)目前科研人員普遍沒有制訂數(shù)據(jù)管理計劃,數(shù)據(jù)管理意識有待提高;胡芳對國外典型科學(xué)數(shù)據(jù)倉儲的元數(shù)據(jù)方案進行介紹,認為在設(shè)計元數(shù)據(jù)方案時應(yīng)以用戶為中心[4];黃鑫等從介紹服務(wù)、創(chuàng)建服務(wù)、咨詢服務(wù)和培訓(xùn)服務(wù)四個角度探討國外高校圖書館科學(xué)數(shù)據(jù)的元數(shù)據(jù)服務(wù)內(nèi)容[5];周波[6]、黃如花等[7]進行了科學(xué)數(shù)據(jù)管理元數(shù)據(jù)實踐應(yīng)用,在Dublin Core(DC)元數(shù)據(jù)基礎(chǔ)上設(shè)計了一套科學(xué)數(shù)據(jù)元數(shù)據(jù)方案;另外,陳大慶[8]、彭鑫等[9]對科學(xué)數(shù)據(jù)管理實施框架進行了探討。
張萍對英國高校科學(xué)數(shù)據(jù)管理研究和實踐進行介紹和分析,從國家層面的指導(dǎo)和引領(lǐng)、高校內(nèi)外的合作、相應(yīng)的數(shù)據(jù)管理政策三方面提出對我國高??茖W(xué)數(shù)據(jù)管理的啟示[10];柳影[11]、徐菲等[12]分別以美國伊利諾伊大學(xué)香檳分校和康奈爾大學(xué)為例,介紹美國高??茖W(xué)數(shù)據(jù)服務(wù)的經(jīng)驗,為國內(nèi)高校開展相關(guān)服務(wù)提供參考;陳媛媛等對《歐洲學(xué)術(shù)研究圖書館科研數(shù)據(jù)服務(wù)》調(diào)查報告進行解讀,從科學(xué)數(shù)據(jù)管理內(nèi)部要素發(fā)展、科學(xué)數(shù)據(jù)管理合作關(guān)系及科學(xué)數(shù)據(jù)管理服務(wù)類型選擇等方面,對我國高校圖書館的科學(xué)數(shù)據(jù)服務(wù)發(fā)展提出建議[13];劉玉敏等對美國“常春藤”大學(xué)和我國“211工程”重點建設(shè)高校圖書館科學(xué)數(shù)據(jù)服務(wù)現(xiàn)狀進行調(diào)研和對比,提出我國高校圖書館開展科學(xué)數(shù)據(jù)服務(wù)的思路與舉措[14]。
賴劍菲等通過調(diào)研國內(nèi)外有代表性的數(shù)據(jù)管理平臺,分別從科學(xué)數(shù)據(jù)管理的建設(shè)目標、組織實施、系統(tǒng)架構(gòu)、技術(shù)路線和平臺功能方面提出建議[15];殷沈琴和朱玲等分別對復(fù)旦大學(xué)、北京大學(xué)的科學(xué)數(shù)據(jù)管理需求進行調(diào)研分析,然后對商用和開源的科學(xué)數(shù)據(jù)平臺進行比較,最后選用Dataverse作為本單位的科學(xué)數(shù)據(jù)管理平臺[16-17];張閃閃等對海外基于開源軟件的典型科學(xué)數(shù)據(jù)共享服務(wù)平臺案例進行調(diào)研,建議我國在建設(shè)科學(xué)數(shù)據(jù)管理平臺時應(yīng)綜合考慮政策內(nèi)容、用戶與資源、合作關(guān)系及教育培訓(xùn)等方面的內(nèi)容[18];孫仙閣介紹了云環(huán)境下構(gòu)建高校科學(xué)數(shù)據(jù)集成與共享平臺的方法[19];馬建玲等對科學(xué)數(shù)據(jù)管理中的數(shù)據(jù)處理類工具、數(shù)據(jù)分發(fā)與出版類工具、數(shù)據(jù)分析類工具和集成管理工具等進行比較[20]。
魏悅等對英國蘭開斯特大學(xué)、利茲大學(xué)以及巴斯大學(xué)的數(shù)據(jù)管理政策進行調(diào)查,建議我國在數(shù)據(jù)管理政策方面應(yīng)完善政策法規(guī)體系、設(shè)立專門的管理監(jiān)督部門、建立明確的職責追究機制等[21];王瓊等對28所英國高校的科學(xué)數(shù)據(jù)保存政策進行調(diào)研,發(fā)現(xiàn)英國高??茖W(xué)數(shù)據(jù)保存政策在不同保存階段的內(nèi)容完備程度不同,并對我國高校制定科學(xué)數(shù)據(jù)保存政策提出建議[22];丁培對國外高校制定科學(xué)數(shù)據(jù)管理政策的實踐及策略進行分析,并從制定政策的必要性、多方參與共同合作、前期準備及圖書館成為政策制定催化劑四個方面提出建議[23];張閃閃等對國外10所大學(xué)的圖書館數(shù)據(jù)管理政策進行調(diào)研與分析,建議我國信息服務(wù)機構(gòu)在制定科學(xué)數(shù)據(jù)管理政策時,需要注重科學(xué)數(shù)據(jù)存儲規(guī)范、管理規(guī)范、共享規(guī)范等內(nèi)容[24];劉峰等對數(shù)據(jù)管理計劃構(gòu)成規(guī)范及其可操作數(shù)據(jù)監(jiān)護模型進行研究[25]。
相對理論探索與經(jīng)驗介紹,國內(nèi)在實踐探索方面的文獻較少,目前只有復(fù)旦大學(xué)、北京大學(xué)、武漢大學(xué)等少數(shù)高校發(fā)表過關(guān)于構(gòu)建科學(xué)數(shù)據(jù)知識庫實踐的文獻[16-17,26-27]。為促進科學(xué)數(shù)據(jù)管理的發(fā)展,我國已經(jīng)成立“中國高校圖書館研究數(shù)據(jù)管理推進工作組”[28]。
綜上所述,國內(nèi)相關(guān)學(xué)者對構(gòu)建科學(xué)數(shù)據(jù)知識庫的相關(guān)理論進行了充分探討,并對國外成功案例進行深度剖析。這些已有成果對指導(dǎo)國內(nèi)高校科學(xué)數(shù)據(jù)知識庫的建設(shè)具有非常重要的意義。因此,與此相關(guān)的科研組織,特別是高校圖書館應(yīng)更進一步,積極地從理論探索階段向?qū)嵺`應(yīng)用階段轉(zhuǎn)移,促進科學(xué)數(shù)據(jù)知識庫的實踐。
科學(xué)數(shù)據(jù)知識庫是對科學(xué)數(shù)據(jù)進行管理的有效平臺,是對科學(xué)數(shù)據(jù)的有效梳理和整合,因此,在構(gòu)建科學(xué)數(shù)據(jù)知識庫時要綜合考慮多方面的問題,不僅要明確科學(xué)數(shù)據(jù)知識庫的范疇,建立科學(xué)數(shù)據(jù)管理政策和元數(shù)據(jù)方案,還需要形成良好的科學(xué)數(shù)據(jù)獲取渠道,選擇合適的系統(tǒng)平臺,同時必須做好館員素養(yǎng)與能力的培養(yǎng)。
科學(xué)數(shù)據(jù)知識庫的研究管理對象為科學(xué)數(shù)據(jù),一般指科研人員在科學(xué)研究過程中通過科學(xué)實驗、實際調(diào)查等方式產(chǎn)生和獲得的數(shù)據(jù)資料,包括數(shù)字、圖表、圖片、文本、聲音、影像等資源[14]。而機構(gòu)知識庫的研究管理對象是機構(gòu)成員所生產(chǎn)、創(chuàng)造的一切智力產(chǎn)品,包含機構(gòu)的成員/團隊在科研過程中對一切活動和過程的記錄,通常分為靜態(tài)的科研成果(各種數(shù)據(jù)、論文、報告)和動態(tài)的科研過程[29]。
在研究管理對象的概念內(nèi)涵上,機構(gòu)知識庫包括科學(xué)數(shù)據(jù)知識庫,兩者從邏輯上看是全集與子集的關(guān)系。目前,國內(nèi)機構(gòu)知識庫構(gòu)建實踐中,收集、整理的學(xué)術(shù)成果基本是科研人員的最終學(xué)術(shù)產(chǎn)物,即研究后期產(chǎn)出的以公開出版為目的的各類科研文檔(如期刊論文、會議論文、專利等),不包括在科研過程中產(chǎn)出的科學(xué)數(shù)據(jù)。因此,在進行科學(xué)數(shù)據(jù)管理討論時,常誤認為科學(xué)數(shù)據(jù)知識庫與機構(gòu)知識庫是獨立并行且不相關(guān)的兩個知識庫,忽視了科學(xué)數(shù)據(jù)知識庫與機構(gòu)知識庫的內(nèi)在邏輯關(guān)系。
本文認為,科學(xué)數(shù)據(jù)知識庫與機構(gòu)知識庫同屬科研成果的管理系統(tǒng),建設(shè)科學(xué)數(shù)據(jù)知識庫是對當前機構(gòu)知識庫建設(shè)實踐的延續(xù)和深化。因此,科學(xué)數(shù)據(jù)知識庫的建設(shè)可部分參照機構(gòu)知識庫的建設(shè)方式。
劉玉敏等在分析中美高校科學(xué)數(shù)據(jù)管理差距時,指出首要因素是“政策制度缺失”[14]。在國外,基金資助組織或科研主管機構(gòu)已有明確的數(shù)據(jù)管理政策/法規(guī),即要求受資助人在提交資助申請時須提交相關(guān)的科學(xué)數(shù)據(jù)管理計劃。如美國國家自然科學(xué)基金[30]、英國研究理事會[31]、英國愛丁堡大學(xué)[32]、澳大利亞墨爾本大學(xué)[33]等都有相應(yīng)的研究數(shù)據(jù)管理政策,要求受資助人或機構(gòu)成員在進行科研活動時,制訂貫穿科學(xué)數(shù)據(jù)生命周期的科學(xué)數(shù)據(jù)管理計劃。
國內(nèi)的科學(xué)數(shù)據(jù)管理政策通常局限于國家層面。如《國家中長期科學(xué)和技術(shù)發(fā)展規(guī)劃綱要(2006—2020年)》(國發(fā)〔2005〕44號)明確提出“促進科學(xué)數(shù)據(jù)與文獻資源的共享,構(gòu)建網(wǎng)絡(luò)科研環(huán)境,面向全社會提供服務(wù),推動科學(xué)研究手段、方式的變革”[34];國務(wù)院《促進大數(shù)據(jù)發(fā)展行動綱要》(國發(fā)〔2015〕50 號)指出“要發(fā)展科學(xué)大數(shù)據(jù),積極推動由國家公共財政支持的公益性科研活動獲取和產(chǎn)生的科學(xué)數(shù)據(jù)逐步開放共享,構(gòu)建科學(xué)大數(shù)據(jù)國家重大基礎(chǔ)設(shè)施,實現(xiàn)對國家重要科技數(shù)據(jù)的權(quán)威匯集、長期保存、集成管理和全面共享”[35];國家自然科學(xué)基金委員會關(guān)于受資助項目科研論文實行開放獲取的政策聲明中要求“將同行評議后錄用的最終審定稿,存儲到國家自然科學(xué)基金委員會的知識庫”[36],但遺憾的是目前僅對發(fā)表成果提出繳交要求,而對科學(xué)數(shù)據(jù)沒有提及。
相比國外的科學(xué)數(shù)據(jù)管理政策,國內(nèi)的科研主管機構(gòu)或基金資助組織沒有對受資助人提出科學(xué)數(shù)據(jù)管理方面的強制要求(多采用“倡議”形式)。受資助人限于科研時間和精力,很少關(guān)注科學(xué)數(shù)據(jù)管理,通常忽略或不進行科學(xué)數(shù)據(jù)管理。雖然我國機構(gòu)知識庫在建設(shè)初期同樣缺乏相應(yīng)的政策/法規(guī),但目前高校機構(gòu)知識庫的建設(shè)已相對成熟。由此可見,相關(guān)政策/法規(guī)并非構(gòu)建科學(xué)數(shù)據(jù)知識庫的決定因素,即雖然目前科學(xué)數(shù)據(jù)管理的相關(guān)政策有待完善和加強,但并不影響規(guī)模性地構(gòu)建科學(xué)數(shù)據(jù)知識庫。
因此,構(gòu)建科學(xué)數(shù)據(jù)知識庫可以參照機構(gòu)知識庫“由下而上”的構(gòu)建模式。國內(nèi)高校圖書館可以借鑒國外成功案例或參考機構(gòu)知識庫建設(shè)經(jīng)驗,制訂高校科學(xué)數(shù)據(jù)管理計劃,構(gòu)建科學(xué)數(shù)據(jù)知識庫,為科研人員提供科學(xué)數(shù)據(jù)管理服務(wù)。在高??茖W(xué)數(shù)據(jù)知識庫達到一定規(guī)模后,CALIS或高校聯(lián)盟組織可向高校提議制定和推薦相關(guān)科學(xué)數(shù)據(jù)管理的政策,并在全國范圍內(nèi)推廣實施。
科學(xué)數(shù)據(jù)的采集、處理、分析、長期保存、數(shù)據(jù)發(fā)現(xiàn)、數(shù)據(jù)重用等環(huán)節(jié)都需要元數(shù)據(jù)規(guī)范。科學(xué)數(shù)據(jù)管理采用的元數(shù)據(jù)方案決定了科學(xué)數(shù)據(jù)的使用范圍和深度,以及科學(xué)數(shù)據(jù)之間互操作的便利性。隨著學(xué)科的交叉融合,交叉學(xué)科的科學(xué)數(shù)據(jù)也不斷涌現(xiàn),學(xué)科差異性決定了科學(xué)數(shù)據(jù)間的差異,科學(xué)數(shù)據(jù)采用元數(shù)據(jù)方案也將存在差異。
綜合國內(nèi)外已有的科學(xué)數(shù)據(jù)知識庫,科學(xué)數(shù)據(jù)管理元數(shù)據(jù)方案主要包括三種。(1)針對不同學(xué)科的科學(xué)數(shù)據(jù)采用該學(xué)科主流的元數(shù)據(jù)方案。如地球科學(xué)使用FDGC元數(shù)據(jù)標準、檔案類數(shù)據(jù)使用EAD元數(shù)據(jù)標準、文獻類數(shù)據(jù)使用MODS元數(shù)據(jù)標準。(2)在通用元數(shù)據(jù)標準(DC)基礎(chǔ)上吸收其他學(xué)科元數(shù)據(jù)標準中的元素,成為具有一定通用性的自定義元數(shù)據(jù)方案。對自定義元數(shù)據(jù)方案中的元素可以進一步分為基本元素、必要元素和可選元素。(3)出于機構(gòu)自身學(xué)術(shù)管理需要,制定機構(gòu)或?qū)W科的科學(xué)數(shù)據(jù)管理元數(shù)據(jù)方案。第一種方案對科學(xué)數(shù)據(jù)來說,采用的元數(shù)據(jù)方案越詳細,科學(xué)數(shù)據(jù)描述就越詳細,對科學(xué)數(shù)據(jù)資源粒度揭示就越深,相應(yīng)地,對數(shù)據(jù)采集、描述處理等工作要求就會越高,該方案主要適用于某一個學(xué)科或領(lǐng)域的科學(xué)數(shù)據(jù)知識庫建設(shè)。第二種方案對不同科學(xué)數(shù)據(jù)采用一種折中平衡機制,能夠盡量保留各學(xué)科數(shù)據(jù)間的最大共同屬性,確??茖W(xué)數(shù)據(jù)能夠采用相同的處理步驟和操作流程,數(shù)據(jù)間也保留最大的互操作性,對數(shù)據(jù)的采集、描述處理等工作要求相對低,但無法滿足學(xué)科個性化的需求。第三種方案與第一種方案類似,對系統(tǒng)管理平臺要求相對較高,在與外部科學(xué)數(shù)據(jù)互操作與利用上可能會存在一些障礙。
作為高??茖W(xué)數(shù)據(jù)知識庫,必然要面對不同學(xué)科的科學(xué)數(shù)據(jù)管理需求,考慮到系統(tǒng)開發(fā)與維護方面的因素,本文認為高??茖W(xué)數(shù)據(jù)知識庫的元數(shù)據(jù)方案可以優(yōu)先選擇第二種,在既有DC元數(shù)據(jù)的基礎(chǔ)上,根據(jù)用戶的實際需求,吸收不同學(xué)科元數(shù)據(jù)標準中的元素,制定適合機構(gòu)的通用元數(shù)據(jù)方案。
采用的元數(shù)據(jù)方案應(yīng)盡量遵循以用戶為中心,并盡量節(jié)約用戶建立記錄的時間為原則。元數(shù)據(jù)方案對系統(tǒng)平臺選型和構(gòu)建產(chǎn)生直接的影響,過于復(fù)雜的元數(shù)據(jù)方案,對管理平臺系統(tǒng)提出較高要求,過高的要求需要平臺在設(shè)計、運維等方面付出更多的時間和精力,最終可能導(dǎo)致平臺無法落地,科學(xué)數(shù)據(jù)知識庫也將變成空中樓閣。
機構(gòu)知識庫建設(shè)的難題之一是如何與科研人員合作并獲得相關(guān)學(xué)術(shù)成果資料,由于大多數(shù)文獻資料已經(jīng)公開出版,因此部分文獻資料可以通過出版商渠道獲得。而科學(xué)數(shù)據(jù)與公開出版的文獻資料相比,大部分存儲于科研人員的個人設(shè)備中,需要與科研人員充分合作才能獲取。
在歐美發(fā)達國家,科研人員的科學(xué)數(shù)據(jù)管理意識相對較強,并且相關(guān)科研主管單位或基金資助組織團體強制要求受資助人員提交科學(xué)數(shù)據(jù)管理計劃,因此國外高校圖書館在開展科學(xué)數(shù)據(jù)管理服務(wù)時比國內(nèi)更容易。國內(nèi)高??蓞⒖嘉錆h大學(xué)、復(fù)旦大學(xué)和北京大學(xué)的科學(xué)數(shù)據(jù)知識庫建設(shè)經(jīng)驗,即分為四個階段與用戶互動合作,并實現(xiàn)科學(xué)數(shù)據(jù)知識庫的構(gòu)建。
首先,通過用戶調(diào)查了解科學(xué)數(shù)據(jù)管理需求。對本校用戶進行比較廣泛的需求調(diào)查,了解本校科學(xué)數(shù)據(jù)類型特點、用戶對科學(xué)數(shù)據(jù)管理的需求及合作意愿、對科學(xué)數(shù)據(jù)管理共享開放的顧慮,以及對科學(xué)數(shù)據(jù)管理平臺的功能期望等。
其次,制定科學(xué)數(shù)據(jù)管理方案。主要針對前期用戶調(diào)查進行合理分析和歸納,提出科學(xué)數(shù)據(jù)管理方案。對用戶特別關(guān)注的問題,給出完善的解決方案,真正解決用戶痛點。
再次,篩選最有合作意愿的機構(gòu)或團隊,陸續(xù)實施已制定的科學(xué)數(shù)據(jù)管理方案,初步構(gòu)建科學(xué)數(shù)據(jù)知識庫。
最后,把初步形成的科學(xué)數(shù)據(jù)知識庫推廣到其他有合作意愿的機構(gòu)或團隊中,經(jīng)過不斷地反饋與改進,使本校的科學(xué)數(shù)據(jù)知識庫走上持續(xù)健康發(fā)展之路。
此外,社交網(wǎng)絡(luò)已經(jīng)成為科研人員日常工作和學(xué)習(xí)交流的重要平臺,作為非正式出版的科學(xué)數(shù)據(jù)逐漸出現(xiàn)在此平臺上。高校圖書館在進行科學(xué)數(shù)據(jù)知識庫建設(shè)時,可以考慮嵌入到社交網(wǎng)絡(luò)中,與科研人員在另一個場景中進行合作。
科學(xué)數(shù)據(jù)知識庫是實現(xiàn)科學(xué)數(shù)據(jù)管理的一種重要方式,能夠為科學(xué)數(shù)據(jù)的生產(chǎn)者、加工者、管理者、利用者、發(fā)布者等提供一個支持協(xié)同、協(xié)作的平臺,是科學(xué)數(shù)據(jù)管理的具體落地形態(tài)[18]。科學(xué)數(shù)據(jù)知識庫的系統(tǒng)平臺通??煞譃樯虡I(yè)平臺、免費開源平臺和自建平臺。其中免費開源平臺因經(jīng)濟性、使用自由、可以靈活二次開發(fā)等優(yōu)勢而受到高校青睞。
在構(gòu)建科學(xué)數(shù)據(jù)知識庫的眾多免費開源軟件中,DSpace、Fedora和Dataverse較為常見。DSpace是由美國麻省理工學(xué)院和惠普實驗室于2002年推出的用于構(gòu)建機構(gòu)知識庫的開源軟件,F(xiàn)edora是由康乃爾大學(xué)于1997年推出的數(shù)字倉儲軟件,如今兩者均歸非營利組織DuraSpace所有,并由后者對其持續(xù)開發(fā)與維護。Dataverse是哈佛大學(xué)社會科學(xué)量化研究所與麻省理工學(xué)院聯(lián)合開發(fā)的開源軟件,用于分享、展示、引用、發(fā)現(xiàn)和分析科學(xué)數(shù)據(jù)。結(jié)合已有研究成果[16-17],對3個軟件的功能進行比較(見表1)。
表1 3個軟件功能比較
綜上所述,科學(xué)數(shù)據(jù)知識庫屬于機構(gòu)知識庫范疇,若高校已經(jīng)構(gòu)建機構(gòu)知識庫,建議在現(xiàn)有機構(gòu)知識庫平臺基礎(chǔ)上擴展,不需重新安裝或配置新的科學(xué)數(shù)據(jù)知識庫平臺。若尚未構(gòu)建機構(gòu)知識庫,在選擇平臺時,要考慮科學(xué)數(shù)據(jù)之外的科研成果管理。如果將機構(gòu)知識庫與科學(xué)數(shù)據(jù)知識庫分開建設(shè),則會導(dǎo)致兩方面問題。
(1)出現(xiàn)新的“信息孤島”。數(shù)字圖書館多年來一直致力整合不同資源,消除“信息孤島”,為用戶提供一站式的發(fā)現(xiàn)服務(wù),在系統(tǒng)平臺已經(jīng)存在的前提下,構(gòu)建新的信息系統(tǒng),則與主流服務(wù)方向相悖。(2)割裂科研過程中產(chǎn)生的學(xué)術(shù)資源的完整性。目前國內(nèi)高校機構(gòu)知識庫系統(tǒng)中的大部分數(shù)據(jù)是以出版交流為目的的公開學(xué)術(shù)成果,而科學(xué)數(shù)據(jù)是這些學(xué)術(shù)成果結(jié)論的依據(jù)或佐證資料,只有將學(xué)術(shù)成果和科學(xué)數(shù)據(jù)融為一體,才能完整地展現(xiàn)整個科研活動成果,如果把兩者分別置于不同平臺進行管理,是人為地割裂學(xué)術(shù)資源,不利于科研活動過程的整體呈現(xiàn),以及資源的發(fā)現(xiàn)和再利用。
鑒于目前國內(nèi)機構(gòu)知識庫的建設(shè)現(xiàn)狀,本文認為高校在構(gòu)建機構(gòu)內(nèi)的科學(xué)數(shù)據(jù)知識庫時應(yīng)直接在DSpace平臺基礎(chǔ)上擴展,無須另建信息管理系統(tǒng)。通過對DSpace平臺進行擴展或二次開發(fā)以適合科學(xué)數(shù)據(jù)管理,可以參考蝎物種與毒素數(shù)據(jù)庫的建設(shè)實踐[37]。香港科技大學(xué)、香港大學(xué)、明尼蘇達大學(xué)等均在基于DSpace構(gòu)建的機構(gòu)知識庫平臺上進行擴展,最終實現(xiàn)科學(xué)數(shù)據(jù)和科研成果的共同管理。此外,此外,也可以參考CALIS三期項目——中國高校機構(gòu)知識庫聯(lián)盟的實施方案,由“中國高校圖書館研究數(shù)據(jù)管理推進工作組”統(tǒng)一組織開發(fā)軟件平臺,然后分發(fā)給高校使用,這種方案既節(jié)省資源,又能提高國內(nèi)高校開展科學(xué)數(shù)據(jù)管理效率。
對于尚未構(gòu)建機構(gòu)知識庫的高校,在選擇科學(xué)數(shù)據(jù)管理系統(tǒng)平臺時,建議選擇由中國科學(xué)院國家科學(xué)圖書館蘭州分館主導(dǎo)開發(fā)的源于DSpace二次開發(fā)的CSpace[38],該平臺雖然針對中國科學(xué)院用戶而研發(fā),但也面向除中國科學(xué)院以外的國內(nèi)外用戶,比較切合中國國內(nèi)實際需求。
構(gòu)建科學(xué)數(shù)據(jù)知識庫,推廣科學(xué)數(shù)據(jù)管理服務(wù),首先需要館員擁有科學(xué)數(shù)據(jù)管理服務(wù)的意識,具備相關(guān)科學(xué)數(shù)據(jù)管理的技術(shù)和能力。姚水洪等認為要開展科學(xué)數(shù)據(jù)管理服務(wù),館員需要具備綜合處理科學(xué)數(shù)據(jù)、與科研人員交流溝通、科學(xué)數(shù)據(jù)組織、信息通信技術(shù)數(shù)據(jù)評價等方面的能力[39]。然而,目前國內(nèi)高校圖書館尚未設(shè)置數(shù)據(jù)館員崗位,并且缺乏推動科學(xué)數(shù)據(jù)管理服務(wù)的人才,為此圖書館應(yīng)盡快聘請或培訓(xùn)相關(guān)科學(xué)數(shù)據(jù)處理方面的人才,以便更好地向高校用戶宣傳科學(xué)數(shù)據(jù)管理服務(wù)。
除聘請科學(xué)數(shù)據(jù)管理人才外,圖書館還應(yīng)注重對有相關(guān)經(jīng)驗的館員培訓(xùn)。通過前期機構(gòu)知識庫建設(shè)的宣傳和推廣,圖書館已經(jīng)儲備有機構(gòu)知識庫建設(shè)相關(guān)理論或?qū)嵺`經(jīng)驗的館員,只要對其稍加培訓(xùn),便可開展科學(xué)數(shù)據(jù)管理服務(wù)。根據(jù)已有資料顯示,中國科學(xué)院文獻情報中心[40]、中國圖書館學(xué)會高等學(xué)校圖書館分會[41]已經(jīng)開展了科學(xué)數(shù)據(jù)管理方面的培訓(xùn),中國高校研究數(shù)據(jù)管理推進工作組每年都會對國內(nèi)外科學(xué)數(shù)據(jù)相關(guān)熱點問題進行探討[42],各高校圖書館可以根據(jù)實際建設(shè)需求要求館員參加培訓(xùn)學(xué)習(xí)。
科學(xué)數(shù)據(jù)知識庫屬于機構(gòu)知識庫范疇,構(gòu)建科學(xué)數(shù)據(jù)知識庫應(yīng)該在構(gòu)建機構(gòu)知識庫的背景下統(tǒng)籌規(guī)劃和建設(shè),構(gòu)建科學(xué)數(shù)據(jù)知識庫是一個循序漸進的過程,首先可以選擇合作意愿強、科學(xué)數(shù)據(jù)相對簡單的機構(gòu)或團隊進行合作,為科學(xué)數(shù)據(jù)管理服務(wù)的后續(xù)推廣積累經(jīng)驗。在數(shù)據(jù)積累后,圖書館可以適時為科研人員開展更高層次的數(shù)據(jù)分析服務(wù)。
在科學(xué)研究范式發(fā)展到數(shù)據(jù)密集型研究范式的背景下,科學(xué)數(shù)據(jù)日益成為一種新的戰(zhàn)略資源。由于科研管理政策不到位、科研人員科學(xué)數(shù)據(jù)管理與重用意識淡薄等多種因素,科學(xué)數(shù)據(jù)未能有效保存和再利用。高校圖書館作為科研活動的重要場所,科學(xué)數(shù)據(jù)種類繁多且豐富,為開展科學(xué)數(shù)據(jù)管理服務(wù)提供了機遇和挑戰(zhàn)。高校圖書館應(yīng)該抓住機遇,盡快構(gòu)建科學(xué)數(shù)據(jù)知識庫,收集和保存可能或?qū)⒁皝G失”的科學(xué)數(shù)據(jù)。
[1] VANDEN E,LOUISE C,MATTHEW W,et al.Managing and Sharing Data[EB/OL].[2017-10-20].http://www.data-archive.ac.uk/media/2894/managingsharing.pdf.
[2] 孫繼周.E-Science環(huán)境下高校圖書館開展科學(xué)數(shù)據(jù)管理與共享的路徑研究[J].圖書館,2016(5):66-71.
[3] 申蓉.基于科研需求的高校圖書館科學(xué)數(shù)據(jù)管理研究[J].農(nóng)業(yè)圖書情報學(xué)刊,2016,28(8):179-181.
[4] 胡芳.國外典型科學(xué)數(shù)據(jù)倉儲實施的元數(shù)據(jù)方案及啟示[J].圖書與情報,2015(1):117-121.
[5] 黃鑫,鄧仲華.國外高校圖書館科學(xué)數(shù)據(jù)的元數(shù)據(jù)服務(wù)研究[J].圖書與情報,2017(2):84-90.
[6] 周波.高??茖W(xué)數(shù)據(jù)元數(shù)據(jù)方案初探[J].圖書館學(xué)研究,2012(1):45-49.
[7] 黃如花,邱春艷.圖書館參與科學(xué)數(shù)據(jù)管理中的元數(shù)據(jù)應(yīng)用實踐研究[J].圖書與情報,2014(5):65-66.
[8] 陳大慶.國外高校數(shù)據(jù)管理服務(wù)實施框架體系研究[J].大學(xué)圖書館學(xué)報,2013,31(6):10-17.
[9] 彭鑫,鄧仲華.數(shù)據(jù)密集型科研環(huán)境下的科研數(shù)據(jù)管理框架研究[J].數(shù)字圖書館論壇,2017(7):61-67.
[10] 張萍.英國高??蒲袛?shù)據(jù)管理及啟示[J].情報雜志,2015,34(4):155-159.
[11] 柳影,吳鳴,胡卉,等.國外高校圖書館科研數(shù)據(jù)服務(wù)研究——以美國伊利諾伊大學(xué)香檳分校為例[J].新世紀圖書館,2017(6):69-74.
[12] 徐菲,王軍,曹均,等.康奈爾大學(xué)嵌入式科研數(shù)據(jù)管理服務(wù)探析[J].圖書館建設(shè),2015(12):54-59.
[13] 陳媛媛,柯平.《歐洲學(xué)術(shù)研究圖書館科研數(shù)據(jù)服務(wù)》調(diào)查對我國高校圖書館科研數(shù)據(jù)服務(wù)的啟示[J].圖書情報工作,2017,61(6):73-78.
[14] 劉玉敏,張群.中美高校圖書館科學(xué)數(shù)據(jù)服務(wù)調(diào)查與分析[J].圖書館論壇,2017(11):132-138.
[15] 賴劍菲,洪正國.對高??茖W(xué)數(shù)據(jù)管理平臺建設(shè)的建議[J].圖書情報工作,2013,57(6):23-27.
[16] 殷沈琴,張計龍,張瑩,等.社會科學(xué)數(shù)據(jù)管理服務(wù)平臺系統(tǒng)選型研究——以復(fù)旦大學(xué)社會科學(xué)數(shù)據(jù)平臺為例[J].圖書情報工作,2013,57(19):92-96.
[17] 朱玲,聶華,崔海媛,等.北京大學(xué)開放研究數(shù)據(jù)平臺建設(shè):探索與實踐[J].圖書情報工作,2016,60(4):44-51.
[18] 張閃閃,王錚.海外基于開源軟件的典型科研數(shù)據(jù)共享服務(wù)平臺案例研究[J].圖書情報工作,2017,61(6):79-86.
[19] 孫仙閣.云環(huán)境下高校圖書館科學(xué)數(shù)據(jù)集成與共享服務(wù)平臺構(gòu)建研究[J].圖書館學(xué)刊,2016,38(5):133-136.
[20] 馬建玲,曹月珍.研究數(shù)據(jù)管理工具發(fā)展研究[J].圖書館學(xué)研究,2014,(15):40-47.
[21] 魏悅,劉桂鋒.英國高??蒲袛?shù)據(jù)管理政策內(nèi)容調(diào)查及啟示[J].圖書情報研究,2016,9(4):35-44.
[22] 王瓊,曹冉.英國高??蒲袛?shù)據(jù)保存政策調(diào)查與分析[J].中國圖書館學(xué)報,2016,42(5):102-115.
[23] 丁培.國外大學(xué)科研數(shù)據(jù)管理政策研究[J].圖書館論壇,2014,34(5):99-106.
[24] 張閃閃,顧立平,蓋曉良.國外信息服務(wù)機構(gòu)的數(shù)據(jù)管理政策調(diào)研與分析[J].圖書情報知識,2015(5):99-109.
[25] 劉峰,張曉林.數(shù)據(jù)管理計劃構(gòu)成規(guī)范及其可操作數(shù)據(jù)監(jiān)護模型研究[J].現(xiàn)代圖書情報技術(shù),2016(1):11-16.
[26] 劉霞,饒艷.高校圖書館科學(xué)數(shù)據(jù)管理與服務(wù)初探——武漢大學(xué)圖書館案例分析[J].圖書情報工作,2013,57(6):33-38.
[27] 項英,賴劍菲,丁寧.高校圖書館科學(xué)數(shù)據(jù)管理服務(wù)實踐探索——以武漢大學(xué)社會科學(xué)數(shù)據(jù)管理為例[J].情報理論與實踐,2013,36(12):89-93.
[28] 殷沈琴,王燁.“中國高校圖書館研究數(shù)據(jù)管理推進工作組”正式成立“上海地區(qū)高校科學(xué)數(shù)據(jù)平臺暨機構(gòu)庫研討會”舉行[J].上海高校圖書情報工作研究,2014,24(4):50.
[29] 常唯.機構(gòu)知識庫:數(shù)字科研時代一種新的學(xué)術(shù)交流與知識共享方式[J].圖書館雜志,2005(3):16-19.
[30] NSF data management plan requirements[EB/OL].[2017-10-20].https://www.nsf.gov/bfa/dias/policy/dmp.jsp.
[31] Supporting research data management costs through grant funding[EB/OL].[2017-10-20].http://blogs.rcuk.ac.uk/2013/07/09/supportingresearch-data-management-costs-through-grant-funding/.
[32] Research data management policy[EB/OL].[2017-10-20].http://www.ed.ac.uk/information-services/about/policies-and-regulations/research-data-policy.
[33] Records Management Policy[EB/OL].[2017-10-20].https://policy.unimelb.edu.au/MPF1106.
[34] 中華人民共和國國務(wù)院.國家中長期科學(xué)和技術(shù)發(fā)展規(guī)劃綱要(2006—2020年)[EB/OL].[2017-10-20].http://www.gov.cn/jrzg/2006-02/09/content_183787.htm.
[35] 中華人民共和國國務(wù)院.促進大數(shù)據(jù)發(fā)展行動綱要[EB/OL].[2017-10-20].http://www.gov.cn/zhengce/content/2015-09/05/content_10137.htm.
[36] 國家自然科學(xué)基金委員會關(guān)于受資助項目科研論文實行開放獲取的政策聲明[EB/OL].[2017-10-20].http://www.nsfc.gov.cn/publish/portal0/tab38/info44471.htm.
[37] 洪正國,項英.基于Dspace構(gòu)建高??茖W(xué)數(shù)據(jù)管理平臺——以蝎物種與毒素數(shù)據(jù)庫為例[J].圖書情報工作,2013,57(6):39-42+84.
[38] CSpace官方社區(qū)[EB/OL].[2017-10-20].http://www.cspace.org.cn/.
[39] 姚水洪,周曉婭.英國科研數(shù)據(jù)管理政策及實踐對我國的啟示[J].北京化工大學(xué)學(xué)報(社會科學(xué)版),2017(2):20-23.
[40] 第四屆中國數(shù)據(jù)館員培訓(xùn)班順利舉辦[EB/OL].[2017-10-20].http://www.las.cas.cn/xwzx/fwcx/201704/t20170426_4780626.html.
[41] 高校圖書館分會關(guān)于舉辦“研究數(shù)據(jù)管理與智能分析工具使用培訓(xùn)”的通知[EB/OL].[2017-10-20].http://www.sal.edu.cn/view/new.aspx?id=8504.
[42] 中國高校研究數(shù)據(jù)管理推進工作組簡介[EB/OL].[2017-10-20].http://society.library.sh.cn/node/2611.
Discussion on the Building of University Library Research Data Repository
CHEN He
(Xiamen University Libraries, Xiamen 361005, China)
Base on the current status overview of domestic research data repositories, this paper analyzes the key issues such as the category, research data management policy, metadata scheme, research data acquisition, system platform selection, librarian literacy and ability, and provides reference to domestic university libraries for building research data repositories.
Data Management; Data Repository; Institutional Repository; University Library
2017-11-06)
G250
10.3772/j.issn.1673-2286.2017.12.007
陳和,男,1976年生,碩士,副研究館員,研究方向:機構(gòu)知識庫、科學(xué)數(shù)據(jù)管理,E-mail:xmu_chen@163.com。