王丹丹 董金金 楊嘉敏
(河南科技大學(xué)管理學(xué)院,洛陽 471023)
共享和重用有質(zhì)量保證的科研數(shù)據(jù)是良好的科學(xué)實(shí)踐倡導(dǎo)的行為[1]??蒲袛?shù)據(jù)管理(Research Data Management,RDM)是指在科研活動進(jìn)行過程中和科研活動完成之后處理科研數(shù)據(jù)(收集、組織、存儲和記錄數(shù)據(jù))的活動[2]。數(shù)據(jù)管理計(jì)劃(Data Management Plan,DMP)實(shí)際上是一份書面文檔,描述項(xiàng)目期望在研究過程中獲取的現(xiàn)有數(shù)據(jù)或生成的新數(shù)據(jù),描述如何管理、分析和存儲這些數(shù)據(jù)以及在項(xiàng)目結(jié)束時將如何共享和保存這些數(shù)據(jù)[3]。數(shù)據(jù)管理計(jì)劃有助于科研人員就如何、何時以及在何處共享哪些數(shù)據(jù)做好規(guī)劃。許多科研資助機(jī)構(gòu)和科研機(jī)構(gòu)都制定了數(shù)據(jù)管理政策,提出了關(guān)于數(shù)據(jù)管理計(jì)劃的要求。然而,不同的機(jī)構(gòu)數(shù)據(jù)管理政策存在較大差異,導(dǎo)致科研人員在遵從政策和滿足要求時感到困惑,無所適從。科學(xué)歐洲(SCIENCE EUROPE)是于2011年在柏林宣布成立的一個科學(xué)聯(lián)盟,它代表歐洲主要科研資助機(jī)構(gòu)和科研機(jī)構(gòu)的利益[4]??茖W(xué)歐洲和荷蘭科學(xué)研究組織(Netherlands Organisation for Scientific Research)于2018年發(fā)起了一項(xiàng)倡議,通過明確數(shù)據(jù)管理計(jì)劃的核心要素和選擇知識庫的最低標(biāo)準(zhǔn)來支持歐洲科研資助機(jī)構(gòu)、科研機(jī)構(gòu)校正科研數(shù)據(jù)管理政策,減少政策的不一致性,為其他機(jī)構(gòu)制定科研數(shù)據(jù)管理政策提供統(tǒng)一的基礎(chǔ)[5]。2019年《科研數(shù)據(jù)管理國際聯(lián)盟實(shí)用指南》(Practical Guide to the International Alignment of Research Data Management)正式發(fā)布,之后歐洲一些國家和機(jī)構(gòu)采用了其建議[6-8]。2021年科學(xué)歐洲又發(fā)布了《科研數(shù)據(jù)管理國際聯(lián)盟實(shí)用指南(擴(kuò)展版)》[9],將第1版中的第三部分“指南”進(jìn)一步細(xì)分為“科研人員使用指南”和“評審專家使用指南”兩部分(見表1)。本文結(jié)合應(yīng)用情況,對兩個版本的《科研數(shù)據(jù)管理國際聯(lián)盟實(shí)用指南》進(jìn)行深入分析,以為我國相關(guān)機(jī)構(gòu)制定政策、出臺辦法提供啟發(fā)和參考。
表1 《科研數(shù)據(jù)管理國際聯(lián)盟實(shí)用指南》兩個版本的內(nèi)容對比
要求科研人員撰寫數(shù)據(jù)管理計(jì)劃的目的是鼓勵科研人員考慮數(shù)據(jù)的最佳處理、組織、記錄和存儲的方式方法。但是,由于不同機(jī)構(gòu)數(shù)據(jù)管理計(jì)劃的要求不一致,以及科研人員對數(shù)據(jù)管理計(jì)劃的認(rèn)識不到位等原因,很多科研人員認(rèn)為數(shù)據(jù)管理計(jì)劃是強(qiáng)加給他們的負(fù)擔(dān),而不是他們在規(guī)劃和實(shí)施科研項(xiàng)目時的一種有用手段。
為解決數(shù)據(jù)管理計(jì)劃要求的不一致性,2013年英國數(shù)字監(jiān)管中心(Digital Curation Centre,DCC)提出“數(shù)據(jù)管理計(jì)劃主題”(DMP Themes)的概念,用于統(tǒng)一數(shù)據(jù)管理計(jì)劃中最常出現(xiàn)的主要問題。數(shù)據(jù)管理計(jì)劃主題已從最初的29個[10]精簡為目前的14個,分別是數(shù)據(jù)描述、數(shù)據(jù)格式、數(shù)據(jù)量、數(shù)據(jù)收集、元數(shù)據(jù)&文檔、道德&隱私、知識產(chǎn)權(quán)、存儲&安全、數(shù)據(jù)共享、數(shù)據(jù)知識庫、長期保存、角色&責(zé)任、預(yù)算、相關(guān)政策[11]。同樣為了解決這一問題,《科研數(shù)據(jù)管理國際聯(lián)盟實(shí)用指南》則將數(shù)據(jù)管理計(jì)劃必須包含的關(guān)鍵核心內(nèi)容總結(jié)為6個方面,并將其命名為“數(shù)據(jù)管理計(jì)劃的核心要求”,具體包括:①數(shù)據(jù)描述和收集,或重復(fù)使用現(xiàn)有數(shù)據(jù);②文檔和數(shù)據(jù)質(zhì)量;③研究過程中的存儲和備份;④法律和道德要求,行為準(zhǔn)則;⑤數(shù)據(jù)共享和長期保存;⑥數(shù)據(jù)管理職責(zé)和資源。這6個方面并無先后之分,無重要次要之說,可以根據(jù)特定需求和機(jī)構(gòu)側(cè)重點(diǎn)更改其出現(xiàn)的順序。所謂核心要求實(shí)際上是對數(shù)據(jù)管理計(jì)劃提出的最低要求或最基本要求,要求在科研人員撰寫的數(shù)據(jù)管理計(jì)劃中均應(yīng)充分體現(xiàn)。因?yàn)橹С挚蒲腥藛T撰寫數(shù)據(jù)管理計(jì)劃的模板多以問題方式呈現(xiàn),科研人員通過回答問題自動生成數(shù)據(jù)管理計(jì)劃文檔,所以《科研數(shù)據(jù)管理國際聯(lián)盟實(shí)用指南》將數(shù)據(jù)管理計(jì)劃的核心要求與具體問題一一對應(yīng)(見表2)。
提供對科研數(shù)據(jù)的獲取是實(shí)現(xiàn)可靠的、可重復(fù)科學(xué)研究的支柱之一。越來越多的科研資助機(jī)構(gòu)、科研機(jī)構(gòu)和學(xué)術(shù)期刊要求科研人員將數(shù)據(jù)存儲在知識庫中。可信是數(shù)據(jù)共享的關(guān)鍵問題??蒲腥藛T需要能夠識別可信賴的知識庫,以便在其中存儲數(shù)據(jù)以實(shí)現(xiàn)共享。當(dāng)前還沒有此類知識庫的公認(rèn)列表,綜合性的全球科研數(shù)據(jù)知識庫注冊目錄系統(tǒng)(re3data.org)中已羅列出的知識庫有3 590多個。但是,這些知識庫的成熟度和可信度很難評價(jià)[12]。
評估認(rèn)證是證明可信的有效途徑。一些權(quán)威的認(rèn)證機(jī)構(gòu),如由國際科學(xué)理事會世界數(shù)據(jù)系統(tǒng)(World Data System of the International Science Council,WDS)和批準(zhǔn)數(shù)據(jù)印章(Data Seal of Approval,DSA)共同成立的認(rèn)證組織CoreTrustSeal,可以提供認(rèn)證[13-15]。中國天文數(shù)據(jù)中心、中國國家空間科學(xué)數(shù)據(jù)中心等一些知識庫通過了該認(rèn)證,但是大多知識庫尚未開展此類認(rèn)證。因此,對于科研人員及其隸屬的科研機(jī)構(gòu)和科研資助機(jī)構(gòu)而言,確定合適的、可信賴的知識庫依然困難重重。萊頓大學(xué)為此專門開發(fā)了“數(shù)據(jù)管理服務(wù)目錄”,以目錄形式提供各種數(shù)據(jù)知識庫信息,幫助科研人員選擇合適的知識庫,這也成為其科研數(shù)據(jù)管理服務(wù)的一大特色[16]。
某些學(xué)科的科研人員會使用特定學(xué)科的數(shù)據(jù)知識庫,這些知識庫的政策和標(biāo)準(zhǔn)主要是滿足特定要求的。其他數(shù)據(jù)知識庫則服務(wù)于更廣泛的研究群體,但它們的政策和標(biāo)準(zhǔn)也必須更加通用。為了便于科研人員識別可信賴的數(shù)據(jù)知識庫,《科研數(shù)據(jù)管理國際聯(lián)盟實(shí)用指南》強(qiáng)烈建議尚未進(jìn)行認(rèn)證的數(shù)據(jù)知識庫積極考慮尋求權(quán)威機(jī)構(gòu)的認(rèn)證,并建議科研人員優(yōu)先選擇得到廣泛認(rèn)可的特定學(xué)科知識庫或經(jīng)過認(rèn)證的知識庫。對于沒有經(jīng)過認(rèn)證的知識庫,《科研數(shù)據(jù)管理國際聯(lián)盟實(shí)用指南》列出了數(shù)據(jù)知識庫的選擇標(biāo)準(zhǔn)(見表3)。需要說明的是,這些標(biāo)準(zhǔn)是數(shù)據(jù)知識庫都應(yīng)滿足的最低標(biāo)準(zhǔn),且標(biāo)準(zhǔn)之間不存在先后之分,無重要次要之說。
表3 數(shù)據(jù)知識庫的選擇標(biāo)準(zhǔn)
1.3.1 科研人員使用指南
(1)撰寫數(shù)據(jù)管理計(jì)劃文檔??蒲腥藛T在撰寫數(shù)據(jù)管理計(jì)劃時,要回答15個具體問題,還應(yīng)該提供項(xiàng)目申請人姓名、項(xiàng)目名稱、項(xiàng)目編號和數(shù)據(jù)管理計(jì)劃版本這些基本信息。
關(guān)于收集或產(chǎn)生新數(shù)據(jù)和/或?qū)⑷绾沃貜?fù)使用現(xiàn)有數(shù)據(jù),要求科研人員說明使用哪種方法或軟件收集或產(chǎn)生了新數(shù)據(jù),陳述重用現(xiàn)有數(shù)據(jù)的限制(如果有),解釋記錄數(shù)據(jù)來源的方式,說明是否考慮過重用現(xiàn)有數(shù)據(jù)源但最終放棄的原因;提供有關(guān)數(shù)據(jù)類型的詳細(xì)信息,如數(shù)字(數(shù)據(jù)庫,電子表格)、文本(文檔)、圖像、音頻、視頻和/或混合媒體等,以及提供有關(guān)數(shù)據(jù)格式(用于存儲的數(shù)據(jù)編碼的方式)的詳細(xì)信息,通常通過文件擴(kuò)展名(如pdf,xls,doc,txt或rdf)反映出來,建議科研人員合理使用數(shù)據(jù)格式,如基于所屬機(jī)構(gòu)內(nèi)的員工專業(yè)知識,優(yōu)選開放格式和數(shù)據(jù)知識庫接受的標(biāo)準(zhǔn)格式,同時建議研究廣泛使用的或即將使用的軟件或設(shè)備生成的數(shù)據(jù)格式;提供有關(guān)數(shù)據(jù)存儲空間大小的信息。
關(guān)于文檔和數(shù)據(jù)質(zhì)量,要求科研人員說明提供哪些元數(shù)據(jù)來幫助其他人識別和發(fā)現(xiàn)數(shù)據(jù),以及使用哪些元數(shù)據(jù)標(biāo)準(zhǔn)(如DDI、TEI、EML、MARC、CMDI)或研究社區(qū)特有的元數(shù)據(jù)標(biāo)準(zhǔn),指明在項(xiàng)目期間如何組織數(shù)據(jù),如命名約定、版本控制和文件夾結(jié)構(gòu);會提供哪些數(shù)據(jù)文檔(提供有關(guān)用于收集數(shù)據(jù)的方法,分析和程序信息,變量的定義,度量單位等信息)支持?jǐn)?shù)據(jù)的重用;如何捕獲這些信息以及將其記錄在何處(如項(xiàng)目鏈接、“自述”文本文件、文件頭、代碼書或?qū)嶒?yàn)筆記本的數(shù)據(jù)庫中);將使用哪些數(shù)據(jù)質(zhì)量控制措施(包括校準(zhǔn)、重復(fù)采樣或測量、標(biāo)準(zhǔn)化數(shù)據(jù)捕獲、數(shù)據(jù)輸入驗(yàn)證、數(shù)據(jù)的同行評審等)控制和記錄數(shù)據(jù)收集的一致性和質(zhì)量。
關(guān)于研究過程中的存儲和備份,要求科研人員描述科研活動期間將在哪里存儲和備份數(shù)據(jù),以及執(zhí)行備份的頻率;說明發(fā)生事故時如何恢復(fù)數(shù)據(jù);說明在研究過程中誰有權(quán)獲取數(shù)據(jù),以及如何控制合作伙伴對數(shù)據(jù)的獲?。唤榻B如果存在敏感數(shù)據(jù)(包含個人數(shù)據(jù)、政治敏感信息或商業(yè)秘密)如何實(shí)施保護(hù)。
關(guān)于法律和道德要求以及行為準(zhǔn)則,要求科研人員確保在處理個人數(shù)據(jù)時,獲得有關(guān)保存和/或共享個人數(shù)據(jù)的知情同意,對個人數(shù)據(jù)進(jìn)行匿名化或假名替換處理,或者進(jìn)行加密,說明是否有針對授權(quán)個人數(shù)據(jù)的獲取程序;要求科研人員解釋獲取數(shù)據(jù)的條件,明確數(shù)據(jù)的使用許可;鼓勵科研人員考慮道德問題是否會影響數(shù)據(jù)的存儲和傳輸方式,要求遵守國家和國際行為守則和機(jī)構(gòu)道德準(zhǔn)則,并檢查在研究項(xiàng)目中收集數(shù)據(jù)是否需要進(jìn)行道德審查(如由道德委員會審核)。
關(guān)于數(shù)據(jù)共享,要求科研人員說明如何發(fā)現(xiàn)和共享數(shù)據(jù)(通過將數(shù)據(jù)存放在可信賴的數(shù)據(jù)知識庫中,在目錄中建立索引,使用安全數(shù)據(jù)服務(wù),直接處理數(shù)據(jù)請求或使用其他機(jī)制等);關(guān)于長期保存,要求科研人員概要介紹數(shù)據(jù)保存計(jì)劃,提供有關(guān)數(shù)據(jù)保存時間的信息,說明提供數(shù)據(jù)的時間以及數(shù)據(jù)出版時間,指出哪些人能夠使用數(shù)據(jù),并解釋原因,說明將采取什么措施來克服對數(shù)據(jù)的限制或?qū)?shù)據(jù)的限制降到最小,還要指出出于合同、法律或法規(guī)目的必須保留或銷毀哪些數(shù)據(jù),說明保留或銷毀的依據(jù),描述要長期保存的數(shù)據(jù),并說明其可預(yù)見的研究用途(和/或用戶)。說明數(shù)據(jù)存放在何處,如果沒有建議的數(shù)據(jù)知識庫,需要在數(shù)據(jù)管理計(jì)劃中證明可以有效地管理數(shù)據(jù)。要指出潛在用戶需要哪些特定工具和程序來訪問和(重新)使用數(shù)據(jù),在數(shù)據(jù)管理計(jì)劃中說明如何在其他情況下重復(fù)使用數(shù)據(jù),表明是否將使用數(shù)據(jù)的唯一性標(biāo)識符。
關(guān)于數(shù)據(jù)管理職責(zé),要求科研人員概述數(shù)據(jù)管理/管理活動的角色和職責(zé),如捕獲數(shù)據(jù)、生成元數(shù)據(jù)生產(chǎn)、把控?cái)?shù)據(jù)質(zhì)量、存儲和備份數(shù)據(jù)、數(shù)據(jù)歸檔和數(shù)據(jù)共享,要求盡可能落實(shí)到人。對于協(xié)作項(xiàng)目,需要說明合作伙伴之間數(shù)據(jù)管理職責(zé)如何進(jìn)行協(xié)調(diào),指出誰負(fù)責(zé)實(shí)施數(shù)據(jù)管理計(jì)劃,確保對其進(jìn)行審查,并在必要時進(jìn)行修訂,定期更新數(shù)據(jù)管理計(jì)劃。關(guān)于資源,要求科研人員說明共享/保存數(shù)據(jù)所需資源,如存儲成本、硬件、員工時間、準(zhǔn)備數(shù)據(jù)以存儲數(shù)據(jù)的成本和數(shù)據(jù)知識庫費(fèi)用等,指出是否需要其他資源。如果是,說明需要多少以及如何支付這些費(fèi)用。
(2)選擇數(shù)據(jù)知識庫。選擇可信賴數(shù)據(jù)知識庫的第一個標(biāo)準(zhǔn)是提供永久且唯一的標(biāo)識符(PID)。并非所有知識庫都使用公認(rèn)的通用PID系統(tǒng),有些是使用知識庫本身維護(hù)的本地標(biāo)識符或管理號。如果將數(shù)據(jù)移到另一位置,或者知識庫不復(fù)存在,重新組織或更改其監(jiān)管方式,則存在找不到數(shù)據(jù)的風(fēng)險(xiǎn)。數(shù)據(jù)知識庫提供的PID能夠發(fā)現(xiàn)和識別數(shù)據(jù),可以搜索、引用和檢索數(shù)據(jù),同時支持?jǐn)?shù)據(jù)的版本控制。為此,知識庫須確保為其所保存的數(shù)據(jù)分配PID(如DOI、URN、ARK),并將PID包含在相應(yīng)的元數(shù)據(jù)中,即使存儲數(shù)據(jù)的位置發(fā)生了變化,也可以找到、引用和檢索相應(yīng)的數(shù)據(jù)和元數(shù)據(jù)。確保明確指定存儲在知識庫中的數(shù)據(jù)版本,并持續(xù)進(jìn)行審核跟蹤。
選擇可信賴數(shù)據(jù)知識庫的第二個標(biāo)準(zhǔn)是元數(shù)據(jù)。數(shù)據(jù)需要使用豐富的元數(shù)據(jù)進(jìn)行描述,元數(shù)據(jù)應(yīng)記錄數(shù)據(jù)的生成方式、許可證的使用方式以及如何重復(fù)使用,并提供適當(dāng)?shù)谋尘靶畔?。?shù)據(jù)知識庫的元數(shù)據(jù)支持?jǐn)?shù)據(jù)發(fā)現(xiàn)和對相關(guān)信息(如其他數(shù)據(jù)和出版物)的引用,提供公開可用和維護(hù)的信息,甚至包括未發(fā)布、受保護(hù)、撤回或刪除的數(shù)據(jù)。元數(shù)據(jù)采用的是被科學(xué)界廣泛接受的元數(shù)據(jù)標(biāo)準(zhǔn),且機(jī)器可檢索。這就要求知識庫:基于公認(rèn)的、易于訪問的語言提供數(shù)據(jù)和元數(shù)據(jù),能確保其他人可互操作和重用數(shù)據(jù);使用標(biāo)準(zhǔn)詞匯表和格式描述數(shù)據(jù)和元數(shù)據(jù),使計(jì)算機(jī)系統(tǒng)可以搜索,自動組合它們以及將元數(shù)據(jù)與科研數(shù)據(jù)文件區(qū)分開;確保通過提供PID和對科學(xué)關(guān)系的描述,在元數(shù)據(jù)信息中聲明與其他相關(guān)或關(guān)聯(lián)信息的鏈接;科研人員存在永久的研究ID(如ORCID、ISNI、DAI);確保長期保存元數(shù)據(jù),確保通過元數(shù)據(jù)仍然可以找到由于不良的研究實(shí)踐或不當(dāng)行為而撤回的數(shù)據(jù),并將其保存起來,以便檢查研究記錄;確保由知識庫維護(hù)的元數(shù)據(jù)是機(jī)器可檢索的,并使用被(科學(xué)界)廣泛接受的標(biāo)準(zhǔn);確保遵循社區(qū)標(biāo)準(zhǔn)或數(shù)據(jù)處理最佳做法(如果存在);鼓勵以允許機(jī)器檢索元數(shù)據(jù)的方式來構(gòu)造元數(shù)據(jù)中包含的信息。
選擇可信賴數(shù)據(jù)知識庫的第三個標(biāo)準(zhǔn)是數(shù)據(jù)獲取和使用許可。具體而言,就是需要知識庫支持特定條件下的數(shù)據(jù)獲取,確保數(shù)據(jù)的真實(shí)性和完整性,支持?jǐn)?shù)據(jù)檢索,提供有關(guān)授權(quán)和許可的信息(最好是機(jī)器可讀的形式),并具有保密功能。這就要求知識庫:清晰闡釋可以重用數(shù)據(jù)的條款,并將許可信息包含在元數(shù)據(jù)中;確保元數(shù)據(jù)包含有關(guān)數(shù)據(jù)來源的詳細(xì)信息,包括其生成方式、處理方法、復(fù)用條件及可靠性;允許使用開放的標(biāo)準(zhǔn)化協(xié)議(非專有通信協(xié)議)檢索數(shù)據(jù)或至少檢索元數(shù)據(jù);允許以結(jié)構(gòu)化的方式引用許可證信息,在可能的情況下,應(yīng)使用可以通過URL引用的通用或被廣泛接受的許可系統(tǒng)(如Creative Commons);提供一種對人和機(jī)器用戶進(jìn)行身份驗(yàn)證和授權(quán)的方法,允許設(shè)置用戶(組)特定的訪問權(quán)限,以解決數(shù)據(jù)存在的機(jī)密性和其他限制問題。
選擇可信賴數(shù)據(jù)知識庫的第四個標(biāo)準(zhǔn)是保存。知識庫須確保元數(shù)據(jù)和數(shù)據(jù)的持久性,確保使命、范圍、保存政策和規(guī)劃的透明性。具體而言,就是確保用戶委托的數(shù)據(jù)和元數(shù)據(jù)的長期保存,持續(xù)可用以及可獲取。這就要求知識庫:以書面文件形式說明數(shù)據(jù)和元數(shù)據(jù)的管理保存策略,詳細(xì)說明知識庫的任務(wù)和范圍、監(jiān)管、資金可持續(xù)性、外包合作伙伴和保存的時間范圍;制定可公開獲取的應(yīng)急計(jì)劃,確保在知識庫的整個生命周期之外保留數(shù)據(jù)和元數(shù)據(jù)。
1.3.2 評審專家使用指南
這部分為評審專家提供了一個研究工具——數(shù)據(jù)管理計(jì)劃評價(jià)量表(DMP Rubric),使其可以對本機(jī)構(gòu)的數(shù)據(jù)管理計(jì)劃進(jìn)行大規(guī)模、標(biāo)準(zhǔn)化的分析。這一評價(jià)量表是針對數(shù)據(jù)管理計(jì)劃的6個核心要求所涉及的15個具體問題設(shè)置的,以實(shí)現(xiàn)數(shù)據(jù)管理計(jì)劃評價(jià)與數(shù)據(jù)管理計(jì)劃撰寫和支持服務(wù)的統(tǒng)一。不同于其他的一些評價(jià)量表(如DRAT Rubric設(shè)置的是三級評分體系[17]),數(shù)據(jù)管理計(jì)劃評價(jià)量表設(shè)置了“充分處理”和“處理不足”兩個評價(jià)等級(見表4)。需要說明的是,該部分只是為評審專家提供了一個參考大綱,而不是可以直接使用的現(xiàn)成工具。因此,希望為評估數(shù)據(jù)管理計(jì)劃制定檢查清單的組織可以基于此框架進(jìn)行相應(yīng)調(diào)整。同時也請?jiān)u審專家記住數(shù)據(jù)管理計(jì)劃是一份實(shí)時文檔,其詳細(xì)程度可能會有所不同,具體取決于所評估的版本。
表4 數(shù)據(jù)管理計(jì)劃評價(jià)量表展示(部分)
通過對《科研數(shù)據(jù)管理國際聯(lián)盟實(shí)用指南》的解讀以及歐洲國家應(yīng)用該指南的情況分析,可以得到的重要啟示是,要推進(jìn)科研數(shù)據(jù)管理需按緊迫程度從以下3個方面著手。
科研資助機(jī)構(gòu)和科研機(jī)構(gòu)組織制定科研數(shù)據(jù)管理政策并提出數(shù)據(jù)管理計(jì)劃要求,是其適應(yīng)不斷發(fā)展的開放科學(xué)運(yùn)動,促進(jìn)數(shù)據(jù)共享,允許重復(fù)使用、驗(yàn)證或復(fù)制研究結(jié)果而邁出的重要一步。在制定科研數(shù)據(jù)管理政策并推動落實(shí)的過程中要關(guān)注以下問題。首先,在制定科研數(shù)據(jù)管理政策時,科研資助機(jī)構(gòu)和科研機(jī)構(gòu)要重視在本組織內(nèi)部和外部進(jìn)行協(xié)作,因?yàn)樗欣嫦嚓P(guān)者的參與都會增加對新政策的接受度。不同參與者之間的協(xié)作和收集反饋對于成功制定被廣泛接受和支持的科研數(shù)據(jù)政策至關(guān)重要。盡管《科研數(shù)據(jù)管理國際聯(lián)盟實(shí)用指南》提供了制定數(shù)據(jù)政策的統(tǒng)一基礎(chǔ),但采納指南的機(jī)構(gòu)和國家在具體化政策過程中,均無一例外地采用與其他利益相關(guān)者協(xié)作的方式。一些機(jī)構(gòu)僅專注于在內(nèi)部制定科研數(shù)據(jù)政策,一些機(jī)構(gòu)則在國家層面上與其他組織開展合作,這種合作模式將國家層面最相關(guān)的參與者匯聚在一起,包括與數(shù)據(jù)存儲和可訪問性相關(guān)的科研資助機(jī)構(gòu)、科研機(jī)構(gòu)、基礎(chǔ)架構(gòu)和服務(wù)提供商等[18]。其次,在就新要求進(jìn)行溝通時,科研資助機(jī)構(gòu)和科研機(jī)構(gòu)應(yīng)直接與所有相關(guān)方(包括科研人員、法律部門、財(cái)務(wù)部門、宣傳部門等)進(jìn)行接觸,并向其解釋其基本概念和益處。需要確保所有核心要求被滿足,并在需要更多信息時提供特定學(xué)科的靈活性,如添加與任何特定學(xué)科相關(guān)的更多問題。最后,在實(shí)施科研數(shù)據(jù)管理政策時,科研資助機(jī)構(gòu)和科研機(jī)構(gòu)需要充分認(rèn)識到實(shí)施新政策期間和實(shí)施之后,科研人員、其所屬機(jī)構(gòu)和資助組織所面臨的挑戰(zhàn),協(xié)同工作,考慮為科研人員科研數(shù)據(jù)管理提供有效支持的方案,如設(shè)置數(shù)據(jù)管理計(jì)劃模板和提供數(shù)據(jù)管理計(jì)劃培訓(xùn)等。
《科研數(shù)據(jù)管理國際聯(lián)盟實(shí)用指南》是為科研資助機(jī)構(gòu)、科研機(jī)構(gòu),以及科研人員個人組織科研數(shù)據(jù)并適當(dāng)保存提供的針對性指導(dǎo)。這些機(jī)構(gòu)與個人均可以數(shù)據(jù)管理計(jì)劃的核心要求為基礎(chǔ)來設(shè)置自己的數(shù)據(jù)管理計(jì)劃模板。在后續(xù)階段,可以將《科研數(shù)據(jù)管理國際聯(lián)盟實(shí)用指南》提供的數(shù)據(jù)管理計(jì)劃評價(jià)量表作為評估數(shù)據(jù)管理計(jì)劃質(zhì)量的參考工具??蒲袡C(jī)構(gòu)和科研人員在撰寫數(shù)據(jù)管理計(jì)劃時可以參考以獲取支持。對于研究領(lǐng)域的其他參與者,《科研數(shù)據(jù)管理國際聯(lián)盟實(shí)用指南》可作為有關(guān)數(shù)據(jù)管理計(jì)劃結(jié)構(gòu)和使用方式的參考文檔。選擇可信賴知識庫的標(biāo)準(zhǔn)將有助于科研資助機(jī)構(gòu)、科研機(jī)構(gòu)和科研人員確定用于存儲和共享數(shù)據(jù)的知識庫。數(shù)據(jù)管理計(jì)劃的核心要求和選擇可信賴知識庫的標(biāo)準(zhǔn)可以視為獨(dú)立文件,可以獨(dú)立使用。但是,在制定或修改機(jī)構(gòu)或特定學(xué)科的政策時則需要同時考慮這兩者,以便在機(jī)構(gòu)之間實(shí)現(xiàn)最佳的一致性。指南之所以能發(fā)揮上述作用,與科學(xué)歐洲充分發(fā)揮其科學(xué)聯(lián)盟的合作優(yōu)勢是分不開的??茖W(xué)歐洲組織其成員單位的專家一起發(fā)布了數(shù)本有關(guān)數(shù)據(jù)管理的出版物,為在跨學(xué)科和跨組織的政策調(diào)整方面提供了實(shí)用指南[19]。指南發(fā)布以后,之所以迅速在歐洲被廣泛采納和使用,離不開科學(xué)歐洲的宣傳推廣。作為科學(xué)聯(lián)盟的科學(xué)歐洲提供了一個合作交流的平臺,在宣傳推廣方面具有得天獨(dú)厚的優(yōu)勢,它形成了一個天然的實(shí)踐社區(qū),提供已成功實(shí)施數(shù)據(jù)管理政策的組織的最佳實(shí)踐示例,幫助和指導(dǎo)仍在探索制定政策的組織和機(jī)構(gòu)。指南采納現(xiàn)狀和實(shí)施效果全景圖的繪制也是得益于成員單位的配合和支持,實(shí)施效果全景圖為指南版本的更新提供了有價(jià)值的參考。
FAIR原則、科研數(shù)據(jù)管理以及數(shù)據(jù)管理計(jì)劃均是創(chuàng)建可重用數(shù)據(jù)和優(yōu)化數(shù)據(jù)共享必不可少的要素。FAIR原則從微觀上定義了確保數(shù)據(jù)可發(fā)現(xiàn)、可訪問、可互操作、可重用的指導(dǎo)原則,其核心目標(biāo)是實(shí)現(xiàn)數(shù)據(jù)的機(jī)器可操作性[20-21]??茖W(xué)歐洲積極倡導(dǎo)科研數(shù)據(jù)遵循FAIR原則。它與其成員組織和其他利益相關(guān)者合作,協(xié)調(diào)政策和程序,并提供明確的指導(dǎo)方針,支持科研人員進(jìn)行數(shù)據(jù)管理??茖W(xué)歐洲的目標(biāo)是在整個歐洲統(tǒng)一科研數(shù)據(jù)管理政策和數(shù)據(jù)管理計(jì)劃要求,從而使來自不同組織或?qū)W科的科研人員以及更換資助機(jī)構(gòu)或所屬單位的科研人員之間更容易開展合作,也使科研資助機(jī)構(gòu)和科研機(jī)構(gòu)更容易評價(jià)數(shù)據(jù)管理計(jì)劃并實(shí)施自己的政策。歐洲開放科學(xué)云(EOSC)在促進(jìn)數(shù)據(jù)的共享和重用方面,發(fā)揮著至關(guān)重要的作用。2018年6月,歐盟委員會的FAIR數(shù)據(jù)專家組在第二次歐洲開放科學(xué)云峰會上發(fā)布了《把FAIR變成現(xiàn)實(shí)》的報(bào)告,較為全面地闡述了FAIR原則的推進(jìn)計(jì)劃以及34條詳細(xì)的實(shí)施建議[22]。科學(xué)歐洲積極參與了歐洲開放科學(xué)云的開發(fā)和推廣,支持在科研數(shù)據(jù)的所有活動中采用EOSC。與此同時,還積極促進(jìn)FAIR原則的應(yīng)用,開展并協(xié)調(diào)各項(xiàng)活動,以增強(qiáng)科學(xué)歐洲的集體影響力和知名度?!犊蒲袛?shù)據(jù)管理國際聯(lián)盟實(shí)用指南》的最終目的也是幫助科研人員在適當(dāng)情況下確保數(shù)據(jù)遵循FAIR原則,甚至在數(shù)據(jù)存儲、項(xiàng)目期間的備份以及長期保存等其他方面已經(jīng)超越了FAIR原則。
實(shí)施科研數(shù)據(jù)管理已經(jīng)成為一種全球性趨勢。在實(shí)踐推進(jìn)過程中,越來越多的利益相關(guān)者認(rèn)識到,推動科研數(shù)據(jù)管理政策趨向標(biāo)準(zhǔn)化和統(tǒng)一化的重要性和必要性,并且積極參與到科研數(shù)據(jù)管理政策標(biāo)準(zhǔn)化和統(tǒng)一化理論研究與工作實(shí)踐。從英國數(shù)據(jù)監(jiān)管中心提出DCC Themes,期刊出版商Springer Nature推出科研數(shù)據(jù)政策標(biāo)準(zhǔn)框架,到科學(xué)歐洲發(fā)布《科研數(shù)據(jù)管理國際聯(lián)盟實(shí)用指南》都有力證明了這一趨勢。與國際社會相比,我國科研數(shù)據(jù)管理起步較晚,但是發(fā)展迅速。我國的科學(xué)聯(lián)盟、科研資助機(jī)構(gòu)、科研機(jī)構(gòu)有必要學(xué)習(xí)國外在科研數(shù)據(jù)管理政策標(biāo)準(zhǔn)化和統(tǒng)一化實(shí)踐方面的有益經(jīng)驗(yàn),出臺相關(guān)政策和辦法,有效推動我國科學(xué)數(shù)據(jù)管理工作的有效開展?!犊蒲袛?shù)據(jù)管理國際聯(lián)盟實(shí)用指南》提出的數(shù)據(jù)管理計(jì)劃核心要求和知識庫選擇標(biāo)準(zhǔn),對我國相關(guān)機(jī)構(gòu)和科研人員也同樣具有重要參考價(jià)值。我國的科研資助機(jī)構(gòu)應(yīng)該了解政策標(biāo)準(zhǔn)化發(fā)展的國際進(jìn)展,在遵從標(biāo)準(zhǔn)化的前提下,制定適合我國國情的具體政策,其中對數(shù)據(jù)管理計(jì)劃的要求建議遵從國際標(biāo)準(zhǔn),但是在數(shù)據(jù)管理計(jì)劃模板設(shè)計(jì)和案例參考方面可以設(shè)計(jì)自己的方案。其知識庫選擇的標(biāo)準(zhǔn)可以作為我國國家層面知識庫的設(shè)計(jì)依據(jù)。作為科學(xué)聯(lián)盟,科學(xué)歐洲成功推進(jìn)《科研數(shù)據(jù)管理國際聯(lián)盟實(shí)用指南》采納的工作機(jī)制也值得我們學(xué)習(xí)。未來,應(yīng)該把FAIR原則、科研數(shù)據(jù)管理和開放科學(xué)的關(guān)系理順,使科研數(shù)據(jù)共享的價(jià)值最大程度得以發(fā)揮。