姜恩波 李娜
(1.中國科學(xué)院成都文獻(xiàn)情報(bào)中心,成都610041;2.中國科學(xué)院大學(xué)經(jīng)濟(jì)與管理學(xué)院圖書情報(bào)與檔案管理系,北京100190)
歐洲一體化進(jìn)程已經(jīng)延續(xù)了幾十年的歷史。一體化的內(nèi)容早已從經(jīng)濟(jì)一體化發(fā)展到政治、經(jīng)濟(jì)、文化和科技全方位的一體化。而在一體化的建設(shè)過程中,成員國之間的發(fā)展不平衡也是一個(gè)突出的特征。因此,在歐盟建設(shè)過程中,“強(qiáng)化整體發(fā)展”和“通過開放推動(dòng)均衡發(fā)展”一直是其各項(xiàng)政策的著眼點(diǎn)和目標(biāo)。2009年,歐債危機(jī)爆發(fā),歐盟各國紛紛出臺政策促進(jìn)政府及社會(huì)的開放、均衡和透明化,緩解獨(dú)立個(gè)體應(yīng)對危機(jī)的壓力。2016年,英國啟動(dòng)脫歐進(jìn)程,一體化進(jìn)程面臨艱巨考驗(yàn)。2019年,德法兩國簽署《亞琛條約》,“雙引擎”繼續(xù)為歐洲一體化提供新動(dòng)力。而歐盟也從政治、經(jīng)濟(jì)、科技、人文和社會(huì)發(fā)展多個(gè)角度強(qiáng)化內(nèi)部聯(lián)合,力求減少英國脫歐帶來的負(fù)面影響。其中,推動(dòng)開放科學(xué),建立歐洲研究區(qū)(European Research Area,ERA),倡導(dǎo)研究數(shù)據(jù)開放共享就是其中的一項(xiàng)措施。
21世紀(jì),隨著開放運(yùn)動(dòng)的發(fā)展,開放科學(xué)的理念越發(fā)受到來自歐洲科研生態(tài)圈中的各利益方的關(guān)注。開放科學(xué)是一場旨在讓科學(xué)研究、科學(xué)交流和研究成果更為開放的社會(huì)運(yùn)動(dòng)。聯(lián)合國教科文組織認(rèn)為,開放科學(xué)通常包括充分開放的科研活動(dòng)與學(xué)術(shù)交流機(jī)制、研究成果的開放獲取和流通機(jī)制、面向科研人員和公眾的豐富的服務(wù)機(jī)制。歐盟對開放科學(xué)的理解是通過數(shù)字工具、網(wǎng)絡(luò)和媒體,傳播科研并轉(zhuǎn)變科學(xué)研究的方式,通過為科學(xué)合作、實(shí)驗(yàn)、分析提供新的工具使科學(xué)知識更易獲取,促進(jìn)科學(xué)研究過程更加高效、透明和有效[1]。在當(dāng)前基于大科學(xué)裝置、大數(shù)據(jù)驅(qū)動(dòng)的科研模式下,愈加需要來自各個(gè)國家、各個(gè)領(lǐng)域的科學(xué)家在整個(gè)探索過程中貢獻(xiàn)智慧、協(xié)同合作、開放共享。從歐洲核子研究中心(European Organization for Nuclear Research,CERN)粒子加速器的建設(shè)、歐洲空間基礎(chǔ)設(shè)施項(xiàng)目的實(shí)施,再到引力波的發(fā)現(xiàn)、宇宙黑洞的觀測與模擬都有力地印證了這一特征。
歐盟非常重視科研成果的開放獲取,也一直走在開放運(yùn)動(dòng)的前沿。它認(rèn)為科研基礎(chǔ)設(shè)施不僅是指科學(xué)裝置、大型儀器和電子設(shè)備,還包括研究數(shù)據(jù)、學(xué)術(shù)論文以及專利這些知識資源[2]。而知識資源的開放流通,又將是未來科研基礎(chǔ)設(shè)施建設(shè)的最為活躍和最能刺激創(chuàng)新發(fā)展的內(nèi)容。因此,歐盟一方面希望通過開放獲取推動(dòng)歐洲研究區(qū)的人才、科研成果和技術(shù)的自由流通。另一方面則希望“最大化整合利用歐盟及成員國科研基礎(chǔ)設(shè)施資源,拓展研發(fā)創(chuàng)新活動(dòng)視野范圍”[3],讓科研工作者通過統(tǒng)一的門戶訪問。
研究數(shù)據(jù)是為驗(yàn)證原始研究結(jié)果而收集、觀察、生成或創(chuàng)建的任何信息。雖然通常是數(shù)字化的,但研究數(shù)據(jù)也包括非數(shù)字格式,如實(shí)驗(yàn)室筆記本和日記[4]。歐洲是世界上最大的研究數(shù)據(jù)產(chǎn)出地[5],但是由于各國在科研能力和科研基礎(chǔ)設(shè)施的建設(shè)上水平不一,既存在單個(gè)國家基礎(chǔ)設(shè)施不足的情況,也存在研究力量碎片化,大量研究數(shù)據(jù)未被充分利用的現(xiàn)象。再者,由于研究數(shù)據(jù)的類型眾多、來源渠道多樣、內(nèi)容也更為個(gè)性化。在相關(guān)政策的制定、提交管理、流通重用以及知識產(chǎn)權(quán)保護(hù)上要比學(xué)術(shù)論文的開放獲取更為復(fù)雜。因此,為了進(jìn)一步推動(dòng)研究數(shù)據(jù)在歐洲研究區(qū)的流通與開放共享,加強(qiáng)歐盟及各成員國的科技基礎(chǔ),共同應(yīng)對各種重大挑戰(zhàn)的能力,歐盟采取了多種方式予以推進(jìn)。本文擬從以下四個(gè)方面來介紹歐盟推動(dòng)研究數(shù)據(jù)開放共享的行動(dòng):協(xié)同制定數(shù)據(jù)開放國際規(guī)范、共同建立研究數(shù)據(jù)開放國際組織、制定頒布研究數(shù)據(jù)開放政策以及通過項(xiàng)目推動(dòng)研究數(shù)據(jù)的管理。另外,由于研究數(shù)據(jù)管理涉及多個(gè)方面,如研究數(shù)據(jù)的開放共享、安全隱私、元數(shù)據(jù)規(guī)范、實(shí)際應(yīng)用以及數(shù)據(jù)與文獻(xiàn)的關(guān)聯(lián)等等。而本文則更偏重于從研究數(shù)據(jù)的開放共享這個(gè)角度來介紹歐盟關(guān)于研究數(shù)據(jù)管理方面的政策。畢竟在開放科學(xué)的發(fā)展背景之下,研究數(shù)據(jù)的“開放”是其第一要義,也是充分發(fā)揮研究數(shù)據(jù)作用的第一步。
2013年6月,G8國家在北愛爾蘭峰會(huì)上簽署了《開放數(shù)據(jù)憲章》(Open Data Charter)(以下簡稱“G8憲章”),共同開啟了開放政府?dāng)?shù)據(jù)(Open Government Data,OGD)的序幕。G8憲章的理念也成為后續(xù)加入開放政府?dāng)?shù)據(jù)運(yùn)動(dòng)的國家所共同遵守的原則與規(guī)范。
G8憲章闡明了政府?dāng)?shù)據(jù)在開放透明國家建設(shè)過程中的5項(xiàng)原則、14個(gè)重點(diǎn)開放領(lǐng)域和3項(xiàng)共同行動(dòng)計(jì)劃。5項(xiàng)原則是:使開放數(shù)據(jù)成為默認(rèn)規(guī)則;注重?cái)?shù)據(jù)質(zhì)量和數(shù)量;讓所有人都可以使用;為了改善治理發(fā)布數(shù)據(jù);為激勵(lì)創(chuàng)新發(fā)布數(shù)據(jù)。其中第一項(xiàng)原則現(xiàn)在已經(jīng)為很多國家所采用的,即“開放是默認(rèn)”。經(jīng)過多年的發(fā)展,G8憲章的基本原則也從5項(xiàng)變成了6項(xiàng),增加了數(shù)據(jù)的可比和可互操作原則(Comparable and Interoperable)[6]。3項(xiàng)行動(dòng)計(jì)劃是指政府?dāng)?shù)據(jù)開放行動(dòng)方案;立法保證政府開放數(shù)據(jù)的合法性;對數(shù)據(jù)開放過程中的各方權(quán)益給予分類保護(hù)[7]。
G8國家中,歐盟成員占據(jù)一半席位。峰會(huì)之后,各國分別制定了自己的數(shù)據(jù)開放方案:英國制定了《開放政府合作伙伴2013—2015英國國家行動(dòng)方案》,還把政府開放數(shù)據(jù)網(wǎng)站的代碼共享到Github,讓用戶下載使用。法國推出了《G8開放數(shù)據(jù)法國行動(dòng)規(guī)》[8],德國對其政務(wù)信息門戶網(wǎng)站(GovData)進(jìn)行了升級,使之成為國家的開放數(shù)據(jù)門戶。而意大利則在《意大利第二行動(dòng)規(guī)劃2014—2016》中提出了強(qiáng)化政府開放數(shù)據(jù)門戶(dati.gov.it)的功能,使其向公眾及商業(yè)企業(yè)提供最重要的數(shù)據(jù)[9]。英、法、德、意四國的行為也推動(dòng)著歐洲其他國家以及學(xué)術(shù)交流體系中的各方在研究數(shù)據(jù)管理政策的制定和實(shí)施。
嚴(yán)格說來,G8憲章不能算作研究數(shù)據(jù)領(lǐng)域的框架。它是針對整個(gè)政府所掌握的數(shù)據(jù)資源的管理和利用。研究數(shù)據(jù)和開放政府?dāng)?shù)據(jù)都是每個(gè)國家大數(shù)據(jù)建設(shè)的重要組成部分。G8憲章的簽署和實(shí)施,首先在成員國中逐漸形成了數(shù)據(jù)開放共享的風(fēng)氣,同時(shí)帶動(dòng)了全球范圍數(shù)據(jù)開放共享政策的制定以及眾多數(shù)據(jù)發(fā)現(xiàn)和再利用的基礎(chǔ)服務(wù)設(shè)施的建設(shè)。
研究數(shù)據(jù)聯(lián)盟(Research Data Alliance,RDA)是由歐盟委員會(huì)、美國國家科學(xué)基金會(huì)、美國國家標(biāo)準(zhǔn)與技術(shù)研究院以及澳大利亞政府創(chuàng)新部于2013年建立的一個(gè)國際組織。其目標(biāo)是建立溝通的平臺與橋梁,降低數(shù)據(jù)開放共享和重用的壁壘,幫助科研人員跨越技術(shù)、學(xué)科和國家的界限共享數(shù)據(jù),應(yīng)對各自社會(huì)所面臨的巨大挑戰(zhàn)。RDA主要面向農(nóng)業(yè)、化學(xué)以及數(shù)字人文等八個(gè)領(lǐng)域。截至2019年5月,RDA已經(jīng)擁有來自137個(gè)國家的8200個(gè)機(jī)構(gòu)及個(gè)人成員。開放科研學(xué)術(shù)組織和政府公共服務(wù)部門占到了成員數(shù)的8成左右[10]。2016年,RDA和世界數(shù)據(jù)系統(tǒng)(World Data System,WDS)共同推出了致力于文獻(xiàn)與數(shù)據(jù)關(guān)聯(lián)的信息交換模型(SCHOlarly LInk eXchange,SCHOLIX)[11]。近年來,RDA、WDS、國際數(shù)據(jù)委員會(huì)(The Committee on Data,CODATA)和GO FAIR(Findable,Accessible,Interopertale,Resuable)又極力推動(dòng)FAIR規(guī)范的落地和實(shí)施。
RDA強(qiáng)調(diào)自己的橋梁紐帶作用。它通過創(chuàng)建論壇平臺,吸引數(shù)據(jù)生產(chǎn)者、使用者和管理員探討數(shù)據(jù)交換、處理和存儲(chǔ)問題。同時(shí),RDA通過舉辦會(huì)議,匯聚世界范圍內(nèi)的研究數(shù)據(jù)專家交流意見就數(shù)據(jù)共享、數(shù)據(jù)管理計(jì)劃、跨學(xué)科互操作性等主題進(jìn)行討論。
RDA Europe由歐洲十二個(gè)主要的代表性組織組成,是歐洲數(shù)據(jù)開放與應(yīng)用對外擴(kuò)展的重要橋梁。它的任務(wù)是在歐洲建立RDA社區(qū),確保歐洲各國了解、推進(jìn)以及積極參與的RDA的各項(xiàng)行動(dòng)。2018年,RDA Europe推出其RDA Europe 4.0目標(biāo),即通過建立一個(gè)統(tǒng)一的歐洲國家節(jié)點(diǎn)網(wǎng)絡(luò)成為歐盟開放科學(xué)戰(zhàn)略核心[12]。
歐盟既是一個(gè)地區(qū)性的國際組織,同時(shí)也是成員國對外的代表。因此,雖然它不能夠直接參與各國政策的制定與實(shí)施,但是卻能夠通過制定更高級別的政策來統(tǒng)籌規(guī)劃、指導(dǎo)和推動(dòng)成員國以及眾多科研資助機(jī)構(gòu)的行為。2012年7月,歐盟發(fā)布《面向科學(xué)信息更好地獲取》,明確了研究數(shù)據(jù)的開放存取原則。除此之外,歐盟政府機(jī)構(gòu)、研究機(jī)構(gòu)、智庫機(jī)構(gòu)相繼形成了一系列的政策、綱領(lǐng)、規(guī)劃和倡議來推動(dòng)形成研究數(shù)據(jù)開放共享的政策環(huán)境。筆者也收集到了其中的部分內(nèi)容,見表1。
從這些政策的內(nèi)容來看,歐盟對研究數(shù)據(jù)的開放共享政策也是經(jīng)歷了較長的準(zhǔn)備和醞釀。從框架計(jì)劃到“地平線2020”中的開放研究數(shù)據(jù)試點(diǎn)計(jì)劃(Open Research Data Pilot),再到《“地平線2020”框架中科學(xué)出版物和研究數(shù)據(jù)的開放獲取指南》《“地平線2020”中的FAIR數(shù)據(jù)管理指南》,歐盟對研究數(shù)據(jù)的開放管理也從倡導(dǎo)到部分(所有)領(lǐng)域開放,再到具體開放規(guī)范FAIR的明確。政策逐步從宏觀規(guī)劃向具體實(shí)施。另外,隨著各類政策的推廣,研究數(shù)據(jù)開放保存和服務(wù)相關(guān)的基礎(chǔ)設(shè)施也逐次出現(xiàn),包括專業(yè)和通用型的研究數(shù)據(jù)倉儲(chǔ)、FAIR規(guī)范的細(xì)化評價(jià)指標(biāo)、研究數(shù)據(jù)的元數(shù)據(jù)標(biāo)準(zhǔn)等等。其次,從參與制定這些政策的機(jī)構(gòu)來看,研究數(shù)據(jù)的管理已經(jīng)滲入到科技、經(jīng)濟(jì)以及社會(huì)發(fā)展的方方面面。不完全統(tǒng)計(jì),歐洲研究與創(chuàng)新理事會(huì)、歐洲科學(xué)基金會(huì)、歐洲研究理事會(huì)、歐盟以及歐盟高級專家組都根據(jù)自身的需求和責(zé)任形成了一系列的政策、制度和建議。
表1 歐盟及相關(guān)機(jī)構(gòu)的部分研究數(shù)據(jù)管理政策Tab.1 Part of European's Open Research Data Policies
1.3.1 《“地平線2020”框架中科學(xué)出版物和研究數(shù)據(jù)的開放獲取指南》
2013年12月,歐盟發(fā)布了“地平線2020”框架的示范資助協(xié)議(AGA-Annotated Model Grant Agreement)。示范資助協(xié)議分別對學(xué)術(shù)出版物和開放研究數(shù)據(jù)先導(dǎo)計(jì)劃(Open Research Data Pilot)中成果的開放獲取進(jìn)行了規(guī)定。2016年2月,歐盟發(fā)布了《“地平線2020”框架中科學(xué)出版物和研究數(shù)據(jù)的開放獲取指南》,簡稱《OA指南》,實(shí)際上就是對示范資助協(xié)議中的規(guī)定進(jìn)行響應(yīng),同時(shí)對開放獲取的意義、研究數(shù)據(jù)開放的范圍和步驟進(jìn)行更為詳細(xì)地闡述。
《OA指南》定義了研究數(shù)據(jù)的概念,是指為進(jìn)行驗(yàn)證、決策、推理、討論以及計(jì)算所使用的信息,特別是事實(shí)數(shù)據(jù)和數(shù)字??茖W(xué)研究過程中的研究數(shù)據(jù)則包括統(tǒng)計(jì)數(shù)據(jù)、實(shí)驗(yàn)結(jié)果、測量數(shù)據(jù)、實(shí)地觀測數(shù)據(jù)、調(diào)研結(jié)果、訪談?dòng)涗浐蛨D像,并且重點(diǎn)在于這些研究數(shù)據(jù)能夠以數(shù)字形式提供[26]。
在地平線2020框架所資助的項(xiàng)目中,研究數(shù)據(jù)的開放獲取上則通過開放研究數(shù)據(jù)先導(dǎo)計(jì)劃來試點(diǎn)。先導(dǎo)計(jì)劃2014—2015年規(guī)劃要求“地平線2020框架”支持的核心領(lǐng)域項(xiàng)目需要提交其研究數(shù)據(jù)成果。而從2017年起則要求所有支持項(xiàng)目都必須將其研究數(shù)據(jù)成果提交。開放的內(nèi)容則包括數(shù)據(jù)、元數(shù)據(jù)以及DMP里要求的數(shù)據(jù)、文檔、軟件工具等[17],具體涉及:1)未來與新興技術(shù);2)研究基礎(chǔ)設(shè)施;3)支持與工業(yè)技術(shù)的領(lǐng)導(dǎo)——信息與通信技術(shù);4)納米技術(shù)、先進(jìn)材料、先進(jìn)制造和加工,以及生物技術(shù);5)社會(huì)挑戰(zhàn)——糧食安全、可持續(xù)農(nóng)業(yè)和林業(yè)、海洋和海洋及內(nèi)陸水域研究和生物經(jīng)濟(jì);6)社會(huì)挑戰(zhàn)——?dú)夂蜃兓?、環(huán)境、資源效率和原材料;7)社會(huì)挑戰(zhàn)——包容、創(chuàng)新和反思的社會(huì);8)科學(xué)與社會(huì);9)跨領(lǐng)域活動(dòng)——智能和可持續(xù)發(fā)展城市。
研究數(shù)據(jù)的開放獲取步驟上,《OA指南》提出了四個(gè)開放步驟:1)建立項(xiàng)目的數(shù)據(jù)管理規(guī)劃(Data Management Plan);2)把研究數(shù)據(jù)集和其元數(shù)據(jù)放置在研究數(shù)據(jù)倉儲(chǔ)中;3)讓第三方用戶能夠免費(fèi)發(fā)現(xiàn)、訪問、挖掘、分析、重用及分發(fā);4)提供數(shù)據(jù)使用和驗(yàn)證的必要工具(信息)。
1.3.2 《“地平線2020”中的FAIR數(shù)據(jù)管理指南》
歐盟雖然一直都在推進(jìn)研究數(shù)據(jù)的開放獲取,但是對于什么叫做“良好的數(shù)據(jù)管理”則尚不是特別清晰,缺少一個(gè)整體的框架。2014年1月,在荷蘭萊頓大學(xué)舉辦的FAIRPORT會(huì)議上,各利益相關(guān)方為解決現(xiàn)有數(shù)字生態(tài)系統(tǒng)的障礙設(shè)計(jì)出一套數(shù)據(jù)管理規(guī)范——“共同設(shè)計(jì)數(shù)據(jù)FAIR接口”(Jointly Designing a Data FAIRPORT)。2016年2月,刊載在Nature雜志“研究數(shù)據(jù)”專題上的文章介紹了FAIR原則產(chǎn)生的背景、意義以及一些應(yīng)用實(shí)例,同時(shí)也對FAIR所包含的內(nèi)容進(jìn)行了詳細(xì)的說明。
FAIR規(guī)范是關(guān)于的數(shù)據(jù)管理的框架原則,不是數(shù)據(jù)管理的技術(shù)標(biāo)準(zhǔn)和實(shí)施方案。FAIR原則簡潔明了、領(lǐng)域無關(guān)、適用性廣泛。數(shù)據(jù)管理方和發(fā)布方可以基于此來評價(jià)自身數(shù)據(jù)管理的質(zhì)量。FAIR原則更加強(qiáng)調(diào)機(jī)器用戶自動(dòng)查找和使用數(shù)據(jù)的能力。另外,F(xiàn)AIR的四個(gè)原則分別描述了數(shù)據(jù)管理的某一個(gè)側(cè)面。因此,F(xiàn)AIR既可以以整體方式出現(xiàn),也是可以單獨(dú)、可分離的,可以形成不同級別的管理模式。
基于FAIR原則,2016年7月,歐盟發(fā)布《“地平線2020”項(xiàng)目中數(shù)據(jù)管理的FAIR指南》,簡稱《FAIR指南》?!禙AIR指南》指出,F(xiàn)AIR原則的制定是為了讓研究數(shù)據(jù)能夠更方便地被發(fā)現(xiàn)、可訪問、可交互和可重用。但良好的數(shù)據(jù)管理不是目標(biāo),利用數(shù)據(jù)的開放推動(dòng)知識發(fā)現(xiàn)、技術(shù)創(chuàng)新以及數(shù)據(jù)與知識的融合才是最終的目標(biāo)?!禙AIR指南》要求所有參加開放研究數(shù)據(jù)先導(dǎo)計(jì)劃的所有項(xiàng)目都必須提交符合FAIR原則的數(shù)據(jù)管理計(jì)劃(Data Management Plan,DMP),并且提供了一個(gè)DMP模板。
2016年9月,G20杭州峰會(huì)上,20國集團(tuán)領(lǐng)導(dǎo)人發(fā)表聲明,贊同基于FAIR規(guī)范提高獲取科研成果的便利性[27]。目前已經(jīng)有不少政策和規(guī)劃推動(dòng)FAIR從云端落到實(shí)地,包括歐盟委員會(huì)2018年發(fā)布的《讓FAIR變?yōu)楝F(xiàn)實(shí)》(TURNING FAIR INTO REALITY)。2018年,WDS簽署使用FAIR數(shù)據(jù)承諾聲明。
科技政策為項(xiàng)目的設(shè)計(jì)與建設(shè)提供指導(dǎo),而項(xiàng)目的實(shí)施與延續(xù)又將政策的內(nèi)容進(jìn)行落實(shí)。二者是相輔相成、相互印證的關(guān)系。歐盟從歐盟科研框架計(jì)劃(Framework Programme,F(xiàn)P)到地平線2020計(jì)劃,一直沿用這一模式。為了落實(shí)“開放科學(xué)、開放創(chuàng)新”的政策理念,歐盟也推出了一系列面向研究數(shù)據(jù)開放共享的項(xiàng)目。這些項(xiàng)目既包括戰(zhàn)略性的建設(shè)項(xiàng)目,也包括面向特定學(xué)科、特定領(lǐng)域的項(xiàng)目。本文重點(diǎn)介紹歐洲開放科學(xué)云項(xiàng)目。
歐洲是世界上最大的研究數(shù)據(jù)產(chǎn)出地。歐洲開放科學(xué)云(the European Open Science Cloud,EOSC)是歐盟為了推動(dòng)研究數(shù)據(jù)的進(jìn)一步開放和共享推出的一個(gè)項(xiàng)目。EOSC的宗旨就是“消除研究數(shù)據(jù)共享方面的技術(shù)、政策和人為障礙,讓歐洲在研究數(shù)據(jù)基礎(chǔ)設(shè)施方面處于全球領(lǐng)先地位,并確保歐洲科學(xué)家從數(shù)據(jù)中獲得最大利益”[28]。EOSC的設(shè)想于2016年提出。2018年3月,歐盟委員會(huì)發(fā)布了EOSC的實(shí)施路線圖。EOSC的建設(shè)將在各方自愿的基礎(chǔ)上把現(xiàn)有的科研云基礎(chǔ)設(shè)施整合為一個(gè)可以向全歐洲提供服務(wù)的云架構(gòu)基礎(chǔ)設(shè)施聯(lián)盟,以便讓歐洲1700萬科研工作者能夠獲取并分享彼此之間的研究數(shù)據(jù)。
在實(shí)施路線圖中,歐盟委員會(huì)為EOSC制定了六個(gè)方面的實(shí)施路線[29]:1)架構(gòu)(Architecture):將現(xiàn)有碎片化的研究數(shù)據(jù)基礎(chǔ)設(shè)施進(jìn)行整合,提高彼此的互操作性;2)數(shù)據(jù)(Data):采取基于FAIR的通用數(shù)據(jù)管理規(guī)范,確保能夠跨學(xué)科和國別進(jìn)行數(shù)據(jù)管理;3)服務(wù)(Services):提供基于用戶需求驅(qū)動(dòng)的多樣化服務(wù);4)訪問與接口(Access&Interface):提供簡潔方式來訪問開放的和跨學(xué)科的研究數(shù)據(jù);5)規(guī)則(Rules):在遵循現(xiàn)有法律和技術(shù)框架的基礎(chǔ)上,制定EOSC參建者的條例、規(guī)范;6)治理(Governance):建立新的治理框架,確保歐盟在數(shù)據(jù)驅(qū)動(dòng)型科學(xué)領(lǐng)域處于領(lǐng)先地位。
EOSC的實(shí)施,也是通過地平線2020支持的項(xiàng)目來完成,而不是新起爐灶。其建設(shè)成果也將直接回饋地平線2020項(xiàng)目。EOSC pilot項(xiàng)目是EOSC的第一階段。這個(gè)項(xiàng)目的主要內(nèi)容是綜合利益相關(guān)方的意見和建議,提出EOSC的治理框架(Governance Framework)。EOSC-Hub項(xiàng)目是要為EOSC建立一個(gè)面向研究人員和服務(wù)供應(yīng)商的流轉(zhuǎn)集成中心[30]。對于服務(wù)提供商,EOSC-Hub建立相關(guān)的準(zhǔn)入政策和管理流程,并維護(hù)服務(wù)商提供的服務(wù)、軟件與資源目錄。對于研究人員,EOSC-Hub則提供各類資源和服務(wù)的發(fā)現(xiàn)、比較、訪問、存儲(chǔ)、計(jì)算以及基于多學(xué)科的主題分析工具?;谶@些工作,EOSC-Hub將成為第一個(gè)整合歐洲主要電子基礎(chǔ)設(shè)施和研究基礎(chǔ)設(shè)施服務(wù)的歐洲在線平臺。
隨著數(shù)據(jù)密集型研究模式的發(fā)展,人們越來越清晰地感受到“現(xiàn)實(shí)世界和數(shù)字世界一起在向我們走來”[31]。社會(huì)的發(fā)展需要?jiǎng)?chuàng)新推動(dòng)。而國家創(chuàng)新能力的大小則取決于整個(gè)社會(huì)獲取知識和利用知識的能力[32]。研究數(shù)據(jù)在科研活動(dòng)中的重要作用已經(jīng)毋庸置疑,對于整個(gè)國家來說都是一種戰(zhàn)略性知識資源。
歐盟研究數(shù)據(jù)開放共享管理政策順應(yīng)開放科學(xué)的發(fā)展,推動(dòng)歐盟成員國之間打破地域的界限,盡其可能地將各種數(shù)據(jù)資源發(fā)布到網(wǎng)絡(luò)之上。從文獻(xiàn)到數(shù)據(jù),從人員到大型科研基礎(chǔ)設(shè)施,從軟件到信息服務(wù),凡是資源,皆可共享。其目標(biāo)是通過開放,縮小成員國之間差距,共同發(fā)展。
歐盟的研究數(shù)據(jù)管理政策的制定與實(shí)施結(jié)合得非常緊密。長期以來,歐盟通過框架計(jì)劃和地平線計(jì)劃資助和推動(dòng)相關(guān)領(lǐng)域的發(fā)展。通過相關(guān)項(xiàng)目的開展和取得的研究成果,了解社會(huì)、經(jīng)濟(jì)和學(xué)術(shù)發(fā)展的變化,然后形成制度、規(guī)范并上升為政策。政策形成之后又成為后續(xù)項(xiàng)目申請或者實(shí)施的準(zhǔn)則。同時(shí),政策也會(huì)根據(jù)實(shí)際情況不斷地作出調(diào)整,讓自身具有更好的適應(yīng)性。這一點(diǎn)在《OA指南》中體現(xiàn)得非常明顯。政策所要求開放共享的數(shù)據(jù)的領(lǐng)域不斷擴(kuò)大,從若干核心領(lǐng)域研究數(shù)據(jù)的開放直到受支持項(xiàng)目全部研究數(shù)據(jù)無差別的開放。另外,在FAIR數(shù)據(jù)管理規(guī)范出臺后,不斷地有新的項(xiàng)目來對這個(gè)規(guī)范進(jìn)行深化和落地。而落地的研究成果又會(huì)對后面的研究數(shù)據(jù)管理進(jìn)行更為具體和有效的指導(dǎo)。
歐盟作為一個(gè)地域性的國際組織,和其他國際組織不一樣的地方是成員國有自己的統(tǒng)一的歐盟憲法條約。從G8開放數(shù)據(jù)憲章開始,在近20年的時(shí)間里,歐盟作為其成員國的代表,自上而下,統(tǒng)籌規(guī)劃科研基礎(chǔ)設(shè)施的整合與開放,推動(dòng)歐洲研究區(qū)知識資源的流動(dòng)與重用,竭盡全力提升歐盟在世界科研領(lǐng)域的地位。通過對外參與國際組織建設(shè)、國際條例的制定,對內(nèi)制定政策條例、開展實(shí)施各類項(xiàng)目等行為,切實(shí)探索和印證著其提出的“開放科學(xué)、開放創(chuàng)新和向世界開放”的理念,又一次站到了開放獲取運(yùn)動(dòng)的前沿。同時(shí),歐盟認(rèn)識到研究數(shù)據(jù)的開放將會(huì)給整個(gè)學(xué)術(shù)交流社區(qū)帶來一次深刻的變革。因此,它關(guān)注研究數(shù)據(jù)相關(guān)利益各方的意見。各項(xiàng)政策條例的研究、醞釀到最終出臺,都是各利益方在開放理念前提下的溝通與協(xié)調(diào),在開放科學(xué)的環(huán)境下重新塑造研究數(shù)據(jù)生態(tài)系統(tǒng)。“良好的數(shù)據(jù)管理不是目標(biāo),它只是知識流通和社會(huì)創(chuàng)新的基礎(chǔ)”,《FAIR指南》如是說。歐盟為推動(dòng)開放獲取和研究數(shù)據(jù)而制定的一系列政策及其成果,將會(huì)對歐洲乃至世界范圍內(nèi)開放科學(xué)以及開放獲取運(yùn)動(dòng)帶來極大的影響,同時(shí)也對我們國家研究數(shù)據(jù)共享以及研究數(shù)據(jù)中心的建設(shè)提供鮮活的借鑒。
我國于2001年啟動(dòng)了科學(xué)數(shù)據(jù)共享工程,科學(xué)數(shù)據(jù)共享工程建設(shè)的總體目標(biāo)是:利用10年的時(shí)間,完成共享政策、法規(guī)體系和管理體制的建設(shè),建立健全共享機(jī)制;構(gòu)建50個(gè)左右的國家科學(xué)數(shù)據(jù)中心或科學(xué)數(shù)據(jù)共享服務(wù)網(wǎng),基本形成覆蓋全面,結(jié)構(gòu)合理,功能先進(jìn)的科學(xué)數(shù)據(jù)共享服務(wù)體系,基本滿足科技創(chuàng)新和國家發(fā)展對科學(xué)數(shù)據(jù)的需求[33]。
2004年,在科學(xué)數(shù)據(jù)共享工程的基礎(chǔ)上,我國啟動(dòng)了國家科技基礎(chǔ)條件平臺建設(shè),制定了《2004—2010年國家科技基礎(chǔ)條件平臺建設(shè)綱要》,初步形成了一批資源優(yōu)勢明顯的科學(xué)數(shù)據(jù)中心,實(shí)現(xiàn)了一批數(shù)據(jù)的匯交整合與開放共享。
2015年,國務(wù)院印發(fā)《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》(以下簡稱《綱要》),希望推動(dòng)解決政府?dāng)?shù)據(jù)和政務(wù)信息共享程度受限,信息資源開發(fā)利用水平不高等難題。《綱要》提出了2018年底前建成國家政府?dāng)?shù)據(jù)統(tǒng)一開放平臺的目標(biāo)。截止2019年,已經(jīng)有50多個(gè)省市建立了開放政府?dāng)?shù)據(jù)平臺。
2018年3月17日,國務(wù)院辦公廳發(fā)布了《科學(xué)數(shù)據(jù)管理辦法》(以下簡稱《辦法》)。這是我國第一部國家層次的,關(guān)于科學(xué)數(shù)據(jù)管理與應(yīng)用的規(guī)范?!掇k法》明確了由政府資金資助的項(xiàng)目所產(chǎn)生的科學(xué)數(shù)據(jù)應(yīng)當(dāng)按照“開放為常態(tài)、不開放為例外”的原則進(jìn)行管理。次年6月,科技部、財(cái)政部發(fā)布《國家科技資源共享服務(wù)平臺優(yōu)化調(diào)整名單》[34],名單包括了20個(gè)國家科學(xué)數(shù)據(jù)中心和30個(gè)國家生物種質(zhì)與實(shí)驗(yàn)材料資源庫的建設(shè)內(nèi)容和依托單位。50個(gè)國家平臺今后將代表我國研究數(shù)據(jù)管理與共享的國家水平,為我國創(chuàng)新型國家建設(shè)提供有力支撐。
除此之外,2018年和2019年的政府報(bào)告都提到推動(dòng)大數(shù)據(jù)應(yīng)用及產(chǎn)業(yè)發(fā)展。2020年4月《中共中央國務(wù)院關(guān)于構(gòu)建更加完善的要素市場化配置體制機(jī)制的意見》,已經(jīng)把數(shù)據(jù)明確為一種新型生產(chǎn)要素,提出“加快數(shù)據(jù)要素市場培育,充分發(fā)揮數(shù)據(jù)要素對其他要素效率的倍增作用,使大數(shù)據(jù)成為推動(dòng)經(jīng)濟(jì)高質(zhì)量發(fā)展的新動(dòng)能”[35]。2020年,政府工作報(bào)告中首次提到培育數(shù)據(jù)市場。
由此可見,我國推動(dòng)大數(shù)據(jù)應(yīng)用、管理以及產(chǎn)業(yè)發(fā)展的力度越來越大。研究數(shù)據(jù)作為大數(shù)據(jù)的一個(gè)重要組成部分,也將會(huì)在宇宙空間探索、生命起源研究、自然災(zāi)害防御以及社會(huì)應(yīng)急管理方面起到越來越重要的作用。
3.2.1 科學(xué)數(shù)據(jù)管理的政策體系不完備
“工欲善其事,必先利其器”。政策制度的建立與完善為事務(wù)的推進(jìn)實(shí)施提供了理論基礎(chǔ)和實(shí)施依據(jù)。目前,我國在研究數(shù)據(jù)開放共享方面的宏觀政策和規(guī)劃初具規(guī)模。從2015年的《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》到2017年《科學(xué)數(shù)據(jù)管理辦法》再到2020年的《關(guān)于構(gòu)建更加完善的要素市場化配置體制機(jī)制的意見》,數(shù)據(jù)的重要性在我國社會(huì)經(jīng)濟(jì)建設(shè)中的重要性日益凸顯,并且相關(guān)的政策都強(qiáng)調(diào)各類數(shù)據(jù)的開放共享,“開放為缺省,不開放為例外”。但是只有極少數(shù)省份出臺了本省研究數(shù)據(jù)開放管理的政策。另外,研究數(shù)據(jù)的開放共享是一個(gè)需要多方力量參與的復(fù)雜系統(tǒng)工程,會(huì)涉及數(shù)據(jù)的清理、描述、發(fā)布、使用許可設(shè)定、數(shù)據(jù)安全管理等很多具體而微的工作環(huán)節(jié)。因此,除了宏觀、中觀政策之外,還需要制定大量的技術(shù)標(biāo)準(zhǔn)、工作規(guī)范、管理制度來層層落實(shí)。而目前這些微觀層次的內(nèi)容還基本屬于空白。
3.2.2 已經(jīng)發(fā)布的科學(xué)數(shù)據(jù)數(shù)量和可用程度都需要進(jìn)一步提高
科研人員雖然積極支持?jǐn)?shù)據(jù)共享。但是從目前來看,還缺少必要的環(huán)境。比如數(shù)據(jù)共享和重用的激勵(lì)機(jī)制、合適的數(shù)據(jù)登記倉儲(chǔ)、方便的數(shù)據(jù)管理工具。最為重要的是在科研過程中缺少數(shù)據(jù)管理人員的幫助與提醒。因此,從總體來說,大量的研究數(shù)據(jù)也都還放在科研人員的電腦里,發(fā)布出來的數(shù)據(jù)只是必須要發(fā)布出來的內(nèi)容。另外,開放政府?dāng)?shù)據(jù)占據(jù)了整個(gè)社會(huì)數(shù)據(jù)的80%。2018年,國務(wù)院發(fā)布《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》(以下簡稱《綱要》)?!毒V要》提出“大力推動(dòng)政府部門數(shù)據(jù)共享”,優(yōu)先推動(dòng)農(nóng)業(yè)等20個(gè)領(lǐng)域的政府?dāng)?shù)據(jù)集向社會(huì)開放。而從目前的多項(xiàng)調(diào)研情況來看,各省市雖然建立了自己的開放政府?dāng)?shù)據(jù)平臺。但是從發(fā)布數(shù)據(jù)的數(shù)量、系統(tǒng)性、完備性、一致性以及易用性等方面都還無法承擔(dān)起實(shí)際應(yīng)用的功能。
3.2.3 開放數(shù)據(jù)、開放科學(xué)的環(huán)境建設(shè)需要強(qiáng)化
我國開放科學(xué)研究處于起步階段,相關(guān)應(yīng)用少。但開放科學(xué)是科學(xué)發(fā)展的新范式,需要給予重視。開放環(huán)境的建設(shè)需要政府機(jī)構(gòu)、出版機(jī)構(gòu)、科研學(xué)術(shù)機(jī)構(gòu)、科研資助機(jī)構(gòu)、圖書情報(bào)機(jī)構(gòu)以及科研人員從自身的利益出發(fā)共同推動(dòng)。但是,從總體來說,開放科學(xué)運(yùn)動(dòng)在我國還處于開放獲取的宣傳和推廣階段。各類機(jī)構(gòu)更多的是從理論研究角度介紹國外發(fā)展情況和實(shí)踐,而具體的實(shí)踐行為則不多。科研人員對開放獲取、開放數(shù)據(jù)以及開放科學(xué)對自身的責(zé)任要求、風(fēng)險(xiǎn)以及自身能夠從中如何受益等情況并不很了解。知識開放共享意識不足,缺乏參與知識共享的積極性。
針對上述存在的問題,提出一些意見和建議。首先,針對中微觀層次政策制度較為薄弱的現(xiàn)狀,不管是開放政府?dāng)?shù)據(jù)還是各類研究數(shù)據(jù),都能夠?qū)σ粋€(gè)省的社會(huì)經(jīng)濟(jì)和科技的發(fā)展起到巨大的支撐和推動(dòng)作用。目前這些研究數(shù)據(jù)仍然極為分散,形成不了規(guī)模價(jià)值和效應(yīng)。根據(jù)《科學(xué)數(shù)據(jù)管理辦法》,受到各級政府資金資助的研究項(xiàng)目的研究數(shù)據(jù)應(yīng)該匯聚到各級政府所設(shè)立的數(shù)據(jù)中心。因此,各級政府可以以此為契機(jī),建立本省的數(shù)據(jù)中心管理辦法,形成本省的研究數(shù)據(jù)呈交和匯聚制度,讓研究數(shù)據(jù)和開放政府?dāng)?shù)據(jù)進(jìn)行融合。另外,在微觀層面,建議建立縱橫向聯(lián)合的數(shù)據(jù)管理規(guī)范和各類標(biāo)準(zhǔn)(數(shù)據(jù)資源目錄標(biāo)準(zhǔn)、數(shù)據(jù)分類體系、數(shù)據(jù)描述標(biāo)準(zhǔn)以及數(shù)據(jù)交換標(biāo)準(zhǔn))等等。
針對研究數(shù)據(jù)數(shù)量和質(zhì)量都有待進(jìn)一步提高的情況,建議各相關(guān)機(jī)構(gòu)及時(shí)出臺數(shù)據(jù)共享和管理的制度與政策,鼓勵(lì)和激勵(lì)各領(lǐng)域研究人員依照政策開放數(shù)據(jù)。另外,應(yīng)該加大對各機(jī)構(gòu)中數(shù)據(jù)管理人員的專業(yè)化培訓(xùn),提高數(shù)據(jù)管理人員對本單位數(shù)據(jù)資產(chǎn)的管理能力,包括但不限于制度落實(shí)、數(shù)據(jù)質(zhì)量清查與提升、數(shù)據(jù)安全管理、知識產(chǎn)權(quán)管理以及數(shù)據(jù)重用評估等。同時(shí),數(shù)據(jù)管理人員應(yīng)該對科研人員以及項(xiàng)目組、課題組進(jìn)行貼身服務(wù),幫助科研人員更為清晰地了解數(shù)據(jù)開放的政策以及如何低成本、順利地完成數(shù)據(jù)的提交和匯聚。
針對開放科學(xué)、開放數(shù)據(jù)基礎(chǔ)環(huán)境建設(shè)的問題,應(yīng)切實(shí)加強(qiáng)對開放科學(xué)、開放共享等政策的宣傳,營造良好的科學(xué)數(shù)據(jù)共享的學(xué)術(shù)環(huán)境、管理環(huán)境和社會(huì)環(huán)境。開放科學(xué)給科學(xué)研究以及學(xué)術(shù)交流中所涉及的每個(gè)角色都帶來了沖擊和機(jī)遇。開放科學(xué)也為每一個(gè)人增加了參與科學(xué)發(fā)展的機(jī)會(huì)并使得他們能更便捷地共享研究成果,讓更多的科研人員自愿并積極參與到數(shù)據(jù)管理中來。