袁雅琴 胡曉彥 佟繼周 鄒自明
(1.中國(guó)科學(xué)院國(guó)家空間科學(xué)中心,北京 100190;2.國(guó)家空間科學(xué)數(shù)據(jù)中心,北京 100190)
繼實(shí)驗(yàn)驗(yàn)證、歸納推演和計(jì)算模擬科學(xué)范式之后,數(shù)據(jù)密集型科學(xué)研究成為科學(xué)研究范式第四范式[1]??茖W(xué)研究越來(lái)越取決于對(duì)科學(xué)數(shù)據(jù)的積累,以及對(duì)數(shù)據(jù)進(jìn)行分析,提取出有價(jià)值的內(nèi)容轉(zhuǎn)換為信息和知識(shí)的能力[2],前沿科學(xué)領(lǐng)域的突破也是更多地依賴(lài)于對(duì)科學(xué)數(shù)據(jù)的收集、整理、挖掘、分析和利用。在全球大數(shù)據(jù)開(kāi)放背景下,科學(xué)數(shù)據(jù)的開(kāi)放共享既能避免重復(fù)實(shí)驗(yàn)和研究造成的浪費(fèi),縮短研究周期,打破科學(xué)壟斷,解決“學(xué)術(shù)孤島”等問(wèn)題[3],也能促進(jìn)海量數(shù)據(jù)的持續(xù)、有序積累,提升數(shù)據(jù)的質(zhì)量,實(shí)現(xiàn)科學(xué)數(shù)據(jù)價(jià)值最大化。在科學(xué)數(shù)據(jù)開(kāi)放共享過(guò)程中,為了保護(hù)科研人員的勞動(dòng)成果和共享的積極性,提出了科學(xué)數(shù)據(jù)出版的概念,主要目的是在科學(xué)數(shù)據(jù)開(kāi)放共享過(guò)程中保護(hù)科學(xué)數(shù)據(jù)生產(chǎn)者的有關(guān)利益(如著作權(quán)和所有權(quán))[4-5]。
隨著全球數(shù)據(jù)開(kāi)放共享的不斷推進(jìn),數(shù)據(jù)出版受到學(xué)術(shù)界、出版界、圖情界和國(guó)際數(shù)據(jù)組織等的廣泛關(guān)注,開(kāi)展了很多有益的研討、實(shí)踐,但目前尚未形成一個(gè)各界所認(rèn)可的準(zhǔn)確而統(tǒng)一的定義[5-6]。在眾多的數(shù)據(jù)出版定義中,筆者比較認(rèn)同孔麗華等[7]給出的定義,即“數(shù)據(jù)出版(Data Publishing)是指按照一定的規(guī)則通過(guò)相關(guān)受認(rèn)可的平臺(tái)發(fā)布科研數(shù)據(jù)集,使得用戶(hù)可以發(fā)現(xiàn)、獲取、應(yīng)用、引用這些數(shù)據(jù)集”。
本文將在闡述國(guó)內(nèi)外數(shù)據(jù)開(kāi)放共享與出版背景以及科學(xué)數(shù)據(jù)出版的基礎(chǔ)上,探討我國(guó)空間科學(xué)數(shù)據(jù)出版實(shí)踐,分析存在的問(wèn)題,提出相應(yīng)的對(duì)策建議,為我國(guó)科學(xué)數(shù)據(jù)共享和出版發(fā)展提供參考。
在共享政策方面,美國(guó)和歐洲發(fā)達(dá)國(guó)家已逐步形成了體系較為健全的數(shù)據(jù)政策和法規(guī),不僅有指導(dǎo)長(zhǎng)遠(yuǎn)發(fā)展的宏觀(guān)政策,還有解決在實(shí)踐中遇到的具體問(wèn)題的微觀(guān)政策[8]。如2018年12月,美國(guó)國(guó)會(huì)正式通過(guò)《開(kāi)放政府?dāng)?shù)據(jù)法案》(Foundations for Evidence-Based Policymaking Act of 2017),要求美國(guó)所有的政府機(jī)構(gòu)主動(dòng)公開(kāi)其擁有的除涉及國(guó)家安全的公共數(shù)據(jù),并設(shè)立專(zhuān)門(mén)的網(wǎng)站用于開(kāi)放此類(lèi)數(shù)據(jù),對(duì)于公開(kāi)的數(shù)據(jù)需滿(mǎn)足機(jī)器可讀、可檢索等格式要求[8-9];2016年4月,歐洲議會(huì)通過(guò)了《通用數(shù)據(jù)保護(hù)法案》(General Data Protection Regulation),為維護(hù)數(shù)據(jù)安全、保護(hù)用戶(hù)隱私提供法律保障[10];2016年10月,法國(guó)《數(shù)字共和國(guó)法案》(the French Digital Republic Act)正式生效,該法案的第一部分為法國(guó)的開(kāi)放式數(shù)據(jù)政策設(shè)立了基本的框架,所有的公共數(shù)據(jù)將會(huì)被默認(rèn)為公開(kāi)、免費(fèi)的[8]。
在國(guó)際組織方面,國(guó)際科學(xué)理事會(huì)(ICSU)、世界數(shù)據(jù)系統(tǒng)(WDS)、國(guó)際科技數(shù)據(jù)委員會(huì)(CODATA)等研究制定了特定的數(shù)據(jù)政策并在各界進(jìn)行了推廣和使用,在推動(dòng)全球的數(shù)據(jù)管理和數(shù)據(jù)開(kāi)放共享方面取得了矚目的成績(jī)。如WDS聯(lián)合90 多個(gè)國(guó)際組織于2018年11月共同簽署了《賦能FAIR數(shù)據(jù)承諾聲明》(Enabling FAIR Data Commitment Statement),確定了不同國(guó)家不同利益相關(guān)者共同支持?jǐn)?shù)據(jù)的FAIR原則,即可發(fā)現(xiàn)(Findable)、可獲?。ˋccessible)、可互操作(Interoperable)、可重用(Reusable)[11]。
在國(guó)際學(xué)術(shù)出版界方面,許多出版商制定了分類(lèi)分級(jí)、逐步加強(qiáng)的數(shù)據(jù)共享政策,鼓勵(lì)或要求作者提供數(shù)據(jù)可獲取性聲明,并在論文中引用數(shù)據(jù)集[7]。以Springer Nature、Elsevier、Wiley為例,這些國(guó)際出版集團(tuán)均面向不同期刊有步驟地逐步推行了數(shù)據(jù)共享政策,并與Figshare、Dryad等國(guó)際數(shù)據(jù)倉(cāng)儲(chǔ)進(jìn)行合作,或自行開(kāi)發(fā)了Mendeley等數(shù)據(jù)倉(cāng)儲(chǔ)平臺(tái)。AGU則對(duì)旗下所有期刊均要求論文關(guān)聯(lián)數(shù)據(jù)需存放在可信任的且遵循FAIR原則的數(shù)據(jù)倉(cāng)儲(chǔ)。同時(shí),出版集團(tuán)也推出了專(zhuān)注于數(shù)據(jù)論文出版的期刊,如《Scientific Data》《Data in brief》《Geoscience Data Journal》等。
在我國(guó),近年來(lái)陸續(xù)發(fā)布了科學(xué)數(shù)據(jù)管理、科學(xué)數(shù)據(jù)開(kāi)放共享的相關(guān)政策,良性的開(kāi)放共享生態(tài)環(huán)境正在逐步建立。2015年8月,國(guó)務(wù)院印發(fā)的《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》[12]明確提出“積極推動(dòng)由國(guó)家公共財(cái)政支持的公益性科研活動(dòng)獲取和產(chǎn)生的科學(xué)數(shù)據(jù)逐步開(kāi)放共享”。2018年2月,國(guó)家出臺(tái)的《國(guó)家科技資源共享服務(wù)平臺(tái)管理辦法》[13]進(jìn)一步明確了各類(lèi)科技資源共享服務(wù)平臺(tái)的數(shù)據(jù)共享職責(zé)與任務(wù)。2018年3月,國(guó)務(wù)院辦公廳印發(fā)的《科學(xué)數(shù)據(jù)管理辦法》[14]提出“主管部門(mén)和法人單位應(yīng)積極推動(dòng)科學(xué)數(shù)據(jù)出版和傳播工作,支持科研人員整理發(fā)表產(chǎn)權(quán)清晰、準(zhǔn)確完整、共享價(jià)值高的科學(xué)數(shù)據(jù)”,并要求“科學(xué)數(shù)據(jù)使用者應(yīng)遵守知識(shí)產(chǎn)權(quán)相關(guān)規(guī)定,在論文發(fā)表、專(zhuān)利申請(qǐng)、專(zhuān)著出版等工作中注明所使用和參考引用的科學(xué)數(shù)據(jù)”。該辦法的出臺(tái)成為了我國(guó)科學(xué)數(shù)據(jù)開(kāi)放共享史上新的里程碑。2019年 2月,中國(guó)科學(xué)院發(fā)布的《中國(guó)科學(xué)院科學(xué)數(shù)據(jù)管理與開(kāi)放共享辦法(試行)》[15]對(duì)中國(guó)科學(xué)院科學(xué)數(shù)據(jù)管理與開(kāi)放共享的總體原則、職責(zé)分工、管理要求、保障機(jī)制及安全保密等作了制度規(guī)范,要求內(nèi)容包括數(shù)據(jù)匯交及審核管理、數(shù)據(jù)共享的規(guī)范,以及共享服務(wù)等方面,為進(jìn)一步加強(qiáng)科學(xué)數(shù)據(jù)管理、提高科學(xué)數(shù)據(jù)開(kāi)放共享水平提供了制度規(guī)范。
為了進(jìn)一步落實(shí)《科學(xué)數(shù)據(jù)管理辦法》和《國(guó)家科技資源共享服務(wù)平臺(tái)管理辦法》的要求,2019年 6月,科技部、財(cái)政部對(duì)原有國(guó)家數(shù)據(jù)資源平臺(tái)開(kāi)展了優(yōu)化調(diào)整工作,形成了 20 個(gè)國(guó)家科學(xué)數(shù)據(jù)中心[2,16],涵蓋了生命科學(xué)、天文學(xué)、空間科學(xué)、地球科學(xué)、物理學(xué)等學(xué)科領(lǐng)域。國(guó)家科學(xué)數(shù)據(jù)中心是我國(guó)科學(xué)數(shù)據(jù)管理和開(kāi)放共享服務(wù)的重要平臺(tái)[2],重點(diǎn)開(kāi)展科學(xué)數(shù)據(jù)的匯交、整合和管理等工作,面向全社會(huì)提供共享服務(wù)。近年來(lái),國(guó)內(nèi)學(xué)術(shù)出版界也推出了專(zhuān)門(mén)發(fā)表數(shù)據(jù)論文的數(shù)據(jù)期刊。如中國(guó)科學(xué)院計(jì)算機(jī)網(wǎng)絡(luò)信息中心和ISC CODATA中國(guó)全國(guó)委員會(huì)于2016年聯(lián)合創(chuàng)辦了目前國(guó)內(nèi)唯一的專(zhuān)門(mén)面向多學(xué)科領(lǐng)域科學(xué)數(shù)據(jù)出版的學(xué)術(shù)期刊《中國(guó)科學(xué)數(shù)據(jù)》(China Scientific Data)[17],中國(guó)科學(xué)院地理科學(xué)與資源研究所和中國(guó)地理學(xué)會(huì)等于2017年聯(lián)合創(chuàng)辦了元數(shù)據(jù)、實(shí)體數(shù)據(jù)和數(shù)據(jù)論文關(guān)聯(lián)一體出版的《全球變化數(shù)據(jù)學(xué)報(bào)》等,為我國(guó)數(shù)據(jù)共享提供了新的模式。
科學(xué)數(shù)據(jù)出版的形式日益多樣化,但大體上可歸納為學(xué)術(shù)論文關(guān)聯(lián)出版、數(shù)據(jù)倉(cāng)儲(chǔ)平臺(tái)出版、數(shù)據(jù)論文出版等3 種[7]。其中,學(xué)術(shù)論文關(guān)聯(lián)出版是指學(xué)術(shù)期刊與數(shù)據(jù)倉(cāng)儲(chǔ)合作,期刊負(fù)責(zé)學(xué)術(shù)論文的出版,數(shù)據(jù)倉(cāng)儲(chǔ)平臺(tái)負(fù)責(zé)數(shù)據(jù)的存儲(chǔ)、獲取和共享服務(wù)[18],論文與數(shù)據(jù)之間通過(guò)唯一標(biāo)識(shí)符如DOI進(jìn)行互關(guān)聯(lián);獨(dú)立數(shù)據(jù)出版是指將數(shù)據(jù)存儲(chǔ)在數(shù)據(jù)倉(cāng)儲(chǔ)平臺(tái),該平臺(tái)以機(jī)器可讀、可檢索和可使用的形式對(duì)數(shù)據(jù)進(jìn)行發(fā)布;數(shù)據(jù)論文出版指數(shù)據(jù)生產(chǎn)者按照一定的論文結(jié)構(gòu)對(duì)數(shù)據(jù)進(jìn)行描述,遵循傳統(tǒng)的學(xué)術(shù)出版流程,將數(shù)據(jù)論文進(jìn)行發(fā)表,以幫助讀者更好地獲取、理解和使用該數(shù)據(jù)。
在傳統(tǒng)的學(xué)術(shù)出版過(guò)程中,出版商往往關(guān)注于學(xué)術(shù)論文本身,而忽視支撐論文研究的原始數(shù)據(jù)。論文出版后,原始數(shù)據(jù)往往只存在于作者個(gè)人手中,雖然部分期刊將數(shù)據(jù)作為論文附件一同出版,但受篇幅等限制,很難全部出版。隨著大數(shù)據(jù)開(kāi)放時(shí)代和科研第四范式的到來(lái),學(xué)術(shù)論文的原始數(shù)據(jù)越來(lái)越受到重視。論文關(guān)聯(lián)數(shù)據(jù)的公開(kāi)出版不僅能最大程度地避免學(xué)術(shù)不端、提升研究成果的信任度,而且能讓其他科研工作者“站在巨人肩膀上”開(kāi)展新的研究和創(chuàng)新。因此,學(xué)術(shù)論文和數(shù)據(jù)關(guān)聯(lián)出版的模式應(yīng)運(yùn)而生。
該模式的出版涉及期刊和數(shù)據(jù)倉(cāng)儲(chǔ)兩個(gè)主體,通過(guò)論文和數(shù)據(jù)的永久標(biāo)識(shí)符(如DOI)實(shí)現(xiàn)兩者的互關(guān)聯(lián)。其流程通常為:期刊對(duì)論文關(guān)聯(lián)數(shù)據(jù)的公開(kāi)獲取做出明確要求,并給出可信任的數(shù)據(jù)倉(cāng)儲(chǔ)列表或?qū)?shù)據(jù)倉(cāng)儲(chǔ)的基本要求;作者在該期刊提交論文的同時(shí),選擇符合期刊要求的數(shù)據(jù)倉(cāng)儲(chǔ)提交數(shù)據(jù),數(shù)據(jù)倉(cāng)儲(chǔ)為該數(shù)據(jù)提供唯一標(biāo)識(shí)符,通常情況下為DOI;作者在論文中通過(guò)數(shù)據(jù)DOI引用該數(shù)據(jù),在數(shù)據(jù)倉(cāng)儲(chǔ)平臺(tái)發(fā)布頁(yè)面插入該論文的DOI,這樣就實(shí)現(xiàn)了論文和數(shù)據(jù)的互關(guān)聯(lián)。
該模式在國(guó)外已普遍實(shí)施,如愛(ài)思唯爾(ELESVIER)已對(duì)其期刊實(shí)施了《數(shù)據(jù)引用原則聯(lián)合聲明》[19],這意味著作者需要將數(shù)據(jù)引用到論文的參考文獻(xiàn)列表中且在論文中提供數(shù)據(jù)的可用性說(shuō)明。同時(shí),為了幫助作者更加方便快捷地共享論文數(shù)據(jù),愛(ài)思唯爾也建立了一個(gè)通用性的數(shù)據(jù)倉(cāng)儲(chǔ)Mendeley Data,為用戶(hù)提供了數(shù)據(jù)DOI分配、永久保存和開(kāi)放獲取服務(wù)。斯普林格(Springer Nature)則對(duì)其期刊實(shí)施了4 個(gè)等級(jí)的數(shù)據(jù)共享政策,從鼓勵(lì)作者共享其數(shù)據(jù)到強(qiáng)制共享和引用數(shù)據(jù)[20]。斯普林格也在其網(wǎng)站上給出了其所信任的數(shù)據(jù)倉(cāng)儲(chǔ)列表,作者在發(fā)表論文時(shí),需從該列表中選擇相關(guān)倉(cāng)儲(chǔ)進(jìn)行數(shù)據(jù)的關(guān)聯(lián)出版。
在我國(guó),論文數(shù)據(jù)的關(guān)聯(lián)出版仍然處于發(fā)展的早期,大多數(shù)期刊仍屬于傳統(tǒng)出版模式,但少數(shù)先行者已開(kāi)始進(jìn)行論文數(shù)據(jù)關(guān)聯(lián)出版的有益嘗試,如《數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn)》于2016年開(kāi)始,要求所有作者在發(fā)表論文時(shí)一并提交論文研究中所使用的自主數(shù)據(jù),并以適當(dāng)方式共享該數(shù)據(jù)[21]?!吨腥A外科雜志》于2016年發(fā)布《關(guān)于在投稿時(shí)提供原始研究資料的通知》,明確提出作者提交稿件的同時(shí)必須提供相應(yīng)的原始資料,并在2017年發(fā)布了《已發(fā)表文章結(jié)論支撐原始數(shù)據(jù)的補(bǔ)償性/獎(jiǎng)勵(lì)性數(shù)據(jù)共享通知》,明確表明“為了響應(yīng)國(guó)家大數(shù)據(jù)戰(zhàn)略,促進(jìn)科學(xué)數(shù)據(jù)共享,減少重復(fù)研究,最大限度地發(fā)揮發(fā)表文章的數(shù)據(jù)作用,《中華外科雜志》和《中華腫瘤雜志》與國(guó)家人口與健康科學(xué)數(shù)據(jù)共享平臺(tái)腫瘤專(zhuān)題服務(wù)網(wǎng)絡(luò)共享平臺(tái)合作,進(jìn)行文章原始數(shù)據(jù)的收集與發(fā)布”[22]。
數(shù)據(jù)倉(cāng)儲(chǔ)平臺(tái)出版一般是指獨(dú)立的數(shù)據(jù)出版。數(shù)據(jù)所有者或項(xiàng)目團(tuán)隊(duì)按要求將數(shù)據(jù)存放到指定的或自主選擇的倉(cāng)儲(chǔ)平臺(tái)。我國(guó)《科學(xué)數(shù)據(jù)管理辦法》中要求“政府預(yù)算資金資助的各級(jí)科技計(jì)劃(專(zhuān)項(xiàng)、基金等)項(xiàng)目所形成的科學(xué)數(shù)據(jù),應(yīng)由項(xiàng)目牽頭單位匯交到相關(guān)科學(xué)數(shù)據(jù)中心”,該辦法為我國(guó)的項(xiàng)目數(shù)據(jù)獨(dú)立出版奠定了基礎(chǔ)。一般而言,數(shù)據(jù)所有者在提交數(shù)據(jù)時(shí),除數(shù)據(jù)實(shí)體外,還需按照數(shù)據(jù)倉(cāng)儲(chǔ)平臺(tái)要求提供元數(shù)據(jù)和數(shù)據(jù)說(shuō)明文檔等。倉(cāng)儲(chǔ)平臺(tái)對(duì)數(shù)據(jù)進(jìn)行審查、整理和發(fā)布,并分配唯一標(biāo)識(shí)符。但需要指出的是,數(shù)據(jù)倉(cāng)儲(chǔ)可允許數(shù)據(jù)所有者設(shè)置一定的數(shù)據(jù)保護(hù)期,在其保護(hù)期內(nèi)不對(duì)外公開(kāi)此數(shù)據(jù)。
數(shù)據(jù)倉(cāng)儲(chǔ)通常分為通用型和領(lǐng)域?qū)I(yè)型,如HARVARD DATAVERSE、DRYAD、FIGSHARE、ZENODO[23]以及國(guó)內(nèi)的ScienceDB等都為通用型數(shù)據(jù)倉(cāng)儲(chǔ),接受各學(xué)科領(lǐng)域的數(shù)據(jù);美國(guó)國(guó)家航空航天局(NASA)、美國(guó)國(guó)家海洋和達(dá)氣管理局(NOAA)等相關(guān)學(xué)科數(shù)據(jù)中心以及我國(guó)國(guó)家科學(xué)數(shù)據(jù)中心等均為各領(lǐng)域?qū)I(yè)的數(shù)據(jù)倉(cāng)儲(chǔ)平臺(tái)。
在數(shù)據(jù)倉(cāng)儲(chǔ)擁有數(shù)量方面,以綜合性的全球研究數(shù)據(jù)存儲(chǔ)庫(kù)注冊(cè)庫(kù)re3data.org(REgistry of REsearch data REpositories)為檢索庫(kù),其收錄排名前三的分別為美國(guó)(1 134 個(gè))、德國(guó)(459 個(gè))和英國(guó)(302 個(gè)),而中國(guó)(62 個(gè),含香港和臺(tái)灣地區(qū)的統(tǒng)計(jì)數(shù)據(jù))排名第11 位[24]。在按學(xué)科分類(lèi)進(jìn)行檢索時(shí),生命科學(xué)領(lǐng)域的倉(cāng)儲(chǔ)庫(kù)排名第一[25]。
數(shù)據(jù)論文是大數(shù)據(jù)開(kāi)放背景下新的產(chǎn)物,是指對(duì)具有進(jìn)一步研究或分析價(jià)值的某個(gè)或某類(lèi)數(shù)據(jù)集進(jìn)行全面描述,經(jīng)過(guò)同行評(píng)議的并遵從學(xué)術(shù)發(fā)表規(guī)范的正式出版物[26]。在數(shù)據(jù)論文中,描述應(yīng)足夠詳細(xì),包括數(shù)據(jù)的采集處理方法、數(shù)據(jù)格式說(shuō)明、數(shù)據(jù)質(zhì)量評(píng)估方法等,能夠使讀者更深入地理解數(shù)據(jù),并可以重復(fù)使用該數(shù)據(jù)。由于數(shù)據(jù)論文是需要經(jīng)過(guò)同行評(píng)審的,這也提高了公開(kāi)發(fā)表的數(shù)據(jù)質(zhì)量。相較于學(xué)術(shù)論文,數(shù)據(jù)論文不包含新的研究結(jié)論、科研發(fā)現(xiàn)或創(chuàng)新性成果[27]。與論文關(guān)聯(lián)出版模式相似的是,數(shù)據(jù)論文中所描述的數(shù)據(jù)集也需要在合適的數(shù)據(jù)倉(cāng)儲(chǔ)進(jìn)行公開(kāi)共享,論文和數(shù)據(jù)通過(guò)唯一標(biāo)識(shí)符如DOI實(shí)現(xiàn)互關(guān)聯(lián)。
目前,發(fā)表數(shù)據(jù)論文的期刊主要分為兩類(lèi):一是只出版數(shù)據(jù)論文[7],如前文所提及的《Scientific Data》《Data in brief》以及國(guó)內(nèi)的《中國(guó)科學(xué)數(shù)據(jù)》《全球變化數(shù)據(jù)學(xué)報(bào)》等;二是混合型期刊,一般由傳統(tǒng)期刊發(fā)展而來(lái),在出版學(xué)術(shù)論文的同時(shí)又接受數(shù)據(jù)論文的發(fā)表[7],如《CODATA Data Science Journal》《The Astrophysics Journal:Supplement Series》《Research Data Journal for the Humanities and Social Sciences(RDJ)》[26]。所有的數(shù)據(jù)論文都是開(kāi)放式訪(fǎng)問(wèn),不對(duì)其他讀者有任何限制。
國(guó)家空間科學(xué)數(shù)據(jù)中心是科技部、財(cái)政部正式認(rèn)定的中國(guó)空間科學(xué)領(lǐng)域唯一的國(guó)家科學(xué)數(shù)據(jù)中心,屬于基礎(chǔ)支撐與條件保障類(lèi)國(guó)家科技創(chuàng)新基地。近年來(lái),在國(guó)際開(kāi)放背景趨勢(shì)下和我國(guó)新的數(shù)據(jù)管理和開(kāi)放政策環(huán)境下,國(guó)家空間科學(xué)數(shù)據(jù)中心開(kāi)展了數(shù)據(jù)出版的新探索,取得了一定的成效。
為滿(mǎn)足學(xué)術(shù)論文作者的需求,響應(yīng)國(guó)內(nèi)外期刊對(duì)數(shù)據(jù)的引用和可公開(kāi)獲取的基本要求,國(guó)家空間科學(xué)數(shù)據(jù)中心于2020年2月推出了中英文雙語(yǔ)的空間科學(xué)論文數(shù)據(jù)倉(cāng)儲(chǔ)(Space Science Article Data Repository,SADR)。SADR是一個(gè)面向國(guó)內(nèi)外空間科學(xué)領(lǐng)域?qū)W術(shù)期刊論文關(guān)聯(lián)數(shù)據(jù)的安全存儲(chǔ)與共享發(fā)布平臺(tái),主要面向科研人員、科研期刊等利益相關(guān)者,提供論文關(guān)聯(lián)數(shù)據(jù)的提交、審核、保存、出版、共享和獲取等服務(wù)。
SADR目前支持兩種論文關(guān)聯(lián)數(shù)據(jù)出版方式。一是在提交數(shù)據(jù)后即公開(kāi)出版:①作者在線(xiàn)填寫(xiě)數(shù)據(jù)元數(shù)據(jù)信息,包括數(shù)據(jù)集標(biāo)題、數(shù)據(jù)集簡(jiǎn)介、關(guān)鍵詞、學(xué)科分類(lèi)、數(shù)據(jù)文件類(lèi)型等,提交數(shù)據(jù)實(shí)體和數(shù)據(jù)輔助說(shuō)明文檔等;②在數(shù)據(jù)提交后,SADR向數(shù)據(jù)集分配唯一標(biāo)識(shí)符,對(duì)數(shù)據(jù)進(jìn)行完整性審查,給出返修意見(jiàn)或?qū)徍送ㄟ^(guò),在審查通過(guò)后隨即發(fā)布數(shù)據(jù)集,在發(fā)布的同時(shí),唯一標(biāo)識(shí)符將自動(dòng)注冊(cè)成功。③作者在待發(fā)表的論文中通過(guò)唯一標(biāo)識(shí)符引用該數(shù)據(jù)集或提供數(shù)據(jù)集的公開(kāi)訪(fǎng)問(wèn)鏈接,待數(shù)據(jù)正式發(fā)表后,SADR在該數(shù)據(jù)集出版頁(yè)面插入論文信息,通常是論文的唯一標(biāo)識(shí)符或URL鏈接。二是在提交數(shù)據(jù)后暫不公開(kāi)出版:①作者在線(xiàn)填寫(xiě)元數(shù)據(jù)信息并提交數(shù)據(jù)實(shí)體和輔助說(shuō)明文檔等;②數(shù)據(jù)提交后,SADR向數(shù)據(jù)集分配唯一標(biāo)識(shí)符,對(duì)數(shù)據(jù)進(jìn)行完整性審查;③作者在待發(fā)表的論文中通過(guò)預(yù)分配的唯一標(biāo)識(shí)符引用該數(shù)據(jù)集并向期刊提供數(shù)據(jù)集的私有訪(fǎng)問(wèn)鏈接供同行評(píng)議;④待論文發(fā)表時(shí)或根據(jù)期刊具體要求,SADR在約定時(shí)間發(fā)布該數(shù)據(jù)集,此時(shí)唯一標(biāo)識(shí)符將自動(dòng)完成注冊(cè)。
SADR采用Creative Commons系列知識(shí)共享許可協(xié)議,包括CC0 和CC BY 4.0,在保障作者知識(shí)產(chǎn)權(quán)的基礎(chǔ)上促進(jìn)了數(shù)據(jù)的完全公開(kāi)共享。同時(shí),在數(shù)據(jù)集出版頁(yè)面上,SADR推薦了基于唯一標(biāo)識(shí)符的標(biāo)準(zhǔn)數(shù)據(jù)引用格式,促進(jìn)科學(xué)數(shù)據(jù)的合規(guī)使用,也提供了數(shù)據(jù)集的訪(fǎng)問(wèn)、下載和引用次數(shù)等統(tǒng)計(jì)信息。經(jīng)過(guò)不斷的實(shí)踐探索,SADR已形成了完整的“數(shù)據(jù)提交-數(shù)據(jù)審核-規(guī)范引用-統(tǒng)計(jì)分析”的數(shù)據(jù)出版流程。迄今為止,SADR已公開(kāi)出版論文關(guān)聯(lián)數(shù)據(jù)集35 個(gè),關(guān)聯(lián)論文發(fā)表在《Space Weather》《AIP Advance》《JGR》《GRL》《空間科學(xué)學(xué)報(bào)》等國(guó)內(nèi)外期刊上,數(shù)據(jù)作者來(lái)自中國(guó)、英國(guó)、美國(guó)、日本等國(guó)家和地區(qū)。
國(guó)家空間科學(xué)數(shù)據(jù)中心數(shù)據(jù)倉(cāng)儲(chǔ)平臺(tái)出版的數(shù)據(jù)主要是由政府預(yù)算資金資助的與空間科學(xué)領(lǐng)域相關(guān)項(xiàng)目所產(chǎn)生的數(shù)據(jù),在出版過(guò)程中主要涉及項(xiàng)目數(shù)據(jù)的匯交和項(xiàng)目數(shù)據(jù)的出版。針對(duì)數(shù)據(jù)的匯交,目前國(guó)家空間科學(xué)中心采取線(xiàn)下模式進(jìn)行數(shù)據(jù)的匯交,“科技計(jì)劃項(xiàng)目科學(xué)數(shù)據(jù)匯交”線(xiàn)上匯交平臺(tái)正處于內(nèi)測(cè)階段,待正式上線(xiàn)后,數(shù)據(jù)的匯交將由數(shù)據(jù)提交者自主選擇線(xiàn)上或線(xiàn)下匯交方式。針對(duì)數(shù)據(jù)的出版,國(guó)家空間科學(xué)中心推出了空間科學(xué)虛擬觀(guān)測(cè)臺(tái)(Virtual Space Science Observatory,VSSO),進(jìn)行數(shù)據(jù)的出版、數(shù)據(jù)目錄的發(fā)布,提供跨學(xué)科、分布式數(shù)據(jù)資源交叉檢索與發(fā)現(xiàn)服務(wù)。
具體出版流程為:①項(xiàng)目團(tuán)隊(duì)提交數(shù)據(jù)實(shí)體文件和數(shù)據(jù)描述信息。其中,描述信息主要指用于描述科學(xué)數(shù)據(jù)來(lái)源、處理過(guò)程、對(duì)象內(nèi)容、分級(jí)定義、格式說(shuō)明和質(zhì)量控制情況等方面的配套信息,以元數(shù)據(jù)、輔助說(shuō)明文檔進(jìn)行記錄。必要時(shí)提供用于數(shù)據(jù)處理、加工和分析的專(zhuān)門(mén)輔助工具軟件及其屬性信息。②國(guó)家空間科學(xué)數(shù)據(jù)中心基于相關(guān)的標(biāo)準(zhǔn)規(guī)范對(duì)數(shù)據(jù)進(jìn)行形式審查,并適時(shí)組織數(shù)據(jù)專(zhuān)家和學(xué)科專(zhuān)家開(kāi)展數(shù)據(jù)質(zhì)量評(píng)估活動(dòng)。若提交的數(shù)據(jù)存在問(wèn)題,則將反饋至數(shù)據(jù)提交者進(jìn)行修改。③對(duì)最終審核通過(guò)后的數(shù)據(jù),國(guó)家空間科學(xué)數(shù)據(jù)中心對(duì)數(shù)據(jù)進(jìn)行分類(lèi)、編目、保存與備份。④對(duì)于滿(mǎn)足開(kāi)放共享?xiàng)l件的科學(xué)數(shù)據(jù),分配和注冊(cè)了唯一標(biāo)識(shí)符,使數(shù)據(jù)集實(shí)現(xiàn)永久追溯。⑤由數(shù)據(jù)提交方選擇Creative Commons系列中的一種知識(shí)共享許可協(xié)議后,國(guó)家空間科學(xué)數(shù)據(jù)中心采取多渠道方式進(jìn)行發(fā)布,便于用戶(hù)搜索和發(fā)現(xiàn)數(shù)據(jù),包括通過(guò)VSSO進(jìn)行元數(shù)據(jù)信息和數(shù)據(jù)實(shí)體的發(fā)布,將數(shù)據(jù)目錄和元數(shù)據(jù)信息提供給中國(guó)科技資源共享網(wǎng)和中國(guó)科學(xué)院數(shù)據(jù)云進(jìn)行發(fā)布等。
截至目前,國(guó)家空間科學(xué)數(shù)據(jù)中心已完成了近50 個(gè)科技計(jì)劃項(xiàng)目的匯交,包括國(guó)家重大科技專(zhuān)項(xiàng)、國(guó)家重點(diǎn)研發(fā)計(jì)劃、國(guó)家自然科學(xué)基金、中國(guó)科學(xué)院先導(dǎo)專(zhuān)項(xiàng)等,在線(xiàn)出版數(shù)據(jù)集300 余個(gè),在線(xiàn)訪(fǎng)問(wèn)量超億人次,有效地促進(jìn)了我國(guó)空間科學(xué)數(shù)據(jù)的開(kāi)放共享。
國(guó)家空間科學(xué)數(shù)據(jù)中心聯(lián)合國(guó)家空間天氣科學(xué)中心子午工程辦公室,推出了《中國(guó)科學(xué)數(shù)據(jù)》子午工程數(shù)據(jù)專(zhuān)刊,旨在使用戶(hù)更加深入地了解子午工程數(shù)據(jù)資源。這也是我國(guó)空間科學(xué)領(lǐng)域內(nèi)首次在專(zhuān)業(yè)的數(shù)據(jù)期刊發(fā)表數(shù)據(jù)論文專(zhuān)刊,是國(guó)家空間科學(xué)數(shù)據(jù)中心聯(lián)合工程項(xiàng)目拓展開(kāi)放共享方式、提高數(shù)據(jù)影響力的重要手段。此次專(zhuān)刊出版歷經(jīng)了專(zhuān)刊策劃、征稿研討、數(shù)據(jù)論文寫(xiě)作專(zhuān)題培訓(xùn)、作者投稿、編輯初審、同行評(píng)議、確認(rèn)發(fā)表等過(guò)程。
具體的出版流程為:①將擬介紹的數(shù)據(jù)集存儲(chǔ)至VSSO,并由VSSO進(jìn)行公開(kāi)發(fā)布,注冊(cè)生成數(shù)據(jù)的DOI號(hào);②按照《中國(guó)科學(xué)數(shù)據(jù)》期刊的論文結(jié)構(gòu)要求,撰寫(xiě)數(shù)據(jù)論文并在規(guī)定的時(shí)間內(nèi)在線(xiàn)提交;③數(shù)據(jù)論文和數(shù)據(jù)集共同接受期刊組織的同行評(píng)議;④在線(xiàn)發(fā)表中英文雙版的數(shù)據(jù)論文,并在論文的數(shù)據(jù)集基本信息介紹表中附上基于DOI標(biāo)識(shí)符生成的數(shù)據(jù)集訪(fǎng)問(wèn)鏈接。當(dāng)用戶(hù)檢索到該數(shù)據(jù)論文時(shí),則可通過(guò)論文了解數(shù)據(jù)的相關(guān)信息,并可訪(fǎng)問(wèn)到數(shù)據(jù)集的發(fā)表頁(yè)面。
專(zhuān)刊共發(fā)表了14 篇論文,包括1 篇綜述性論文和13 篇數(shù)據(jù)論文,詳細(xì)介紹了子午工程13類(lèi)監(jiān)測(cè)設(shè)備產(chǎn)出的13 種數(shù)據(jù)集,其介紹內(nèi)容包括數(shù)據(jù)的采集處理方法、數(shù)據(jù)樣本描述、數(shù)據(jù)質(zhì)量控制和評(píng)估以及數(shù)據(jù)的使用方法或建議等[28]。截至目前,中文版專(zhuān)刊論文共被預(yù)覽2 萬(wàn)余次,論文下載量達(dá)300 余次。后續(xù),國(guó)家空間科學(xué)數(shù)據(jù)中心將聯(lián)合更多的項(xiàng)目團(tuán)隊(duì),開(kāi)展數(shù)據(jù)論文專(zhuān)刊的撰寫(xiě)和出版,幫助空間科學(xué)數(shù)據(jù)用戶(hù)更好地了解和使用數(shù)據(jù)。
針對(duì)3 種出版模式,筆者進(jìn)行初步的優(yōu)勢(shì)和不足比較分析,見(jiàn)表1。
表1 3 種數(shù)據(jù)出版模式比較分析
結(jié)合近年來(lái)我國(guó)空間科學(xué)數(shù)據(jù)的出版實(shí)踐經(jīng)驗(yàn)和實(shí)施效果,筆者認(rèn)為,目前國(guó)內(nèi)數(shù)據(jù)出版存在著以下問(wèn)題和挑戰(zhàn):一是國(guó)內(nèi)大多數(shù)學(xué)術(shù)期刊尚未形成論文關(guān)聯(lián)數(shù)據(jù)公開(kāi)共享的要求,作者很難自覺(jué)地將論文關(guān)聯(lián)數(shù)據(jù)進(jìn)行公開(kāi)出版;二是國(guó)內(nèi)開(kāi)放共享的觀(guān)念尚未成熟,開(kāi)放共享的生態(tài)環(huán)境還有待改善,數(shù)據(jù)所有者和用戶(hù)對(duì)數(shù)據(jù)出版的積極性不高,而作為兩者“橋梁”的數(shù)據(jù)倉(cāng)儲(chǔ)則相對(duì)積極;三是開(kāi)放共享過(guò)程中對(duì)知識(shí)產(chǎn)權(quán)缺乏有效的保護(hù),數(shù)據(jù)引用機(jī)制尚未建立,這也進(jìn)一步影響了數(shù)據(jù)所有者開(kāi)放數(shù)據(jù)的積極性;四是數(shù)據(jù)倉(cāng)儲(chǔ)知名度和國(guó)際參與度低,大部分?jǐn)?shù)據(jù)倉(cāng)儲(chǔ)未被國(guó)際知名期刊認(rèn)可,甚至國(guó)內(nèi)用戶(hù)對(duì)本研究領(lǐng)域內(nèi)的數(shù)據(jù)倉(cāng)儲(chǔ)也缺乏認(rèn)識(shí)和了解;五是目前國(guó)內(nèi)數(shù)據(jù)倉(cāng)儲(chǔ)基于公共財(cái)政支持,其平臺(tái)建設(shè)、標(biāo)準(zhǔn)規(guī)范的建立、數(shù)據(jù)保存與日常維護(hù)、人員管理等的經(jīng)費(fèi)投入十分巨大,且隨著數(shù)據(jù)量的增加、服務(wù)的拓展等,其單一的經(jīng)費(fèi)投入難以可持續(xù)。
本文對(duì)上述問(wèn)題提出了以下建議:一是各出版主體之間應(yīng)該加強(qiáng)合作,如學(xué)習(xí)西方主流學(xué)術(shù)期刊,將數(shù)據(jù)公開(kāi)可獲取作為一個(gè)強(qiáng)制性要求,并與數(shù)據(jù)倉(cāng)儲(chǔ)合作進(jìn)行論文關(guān)聯(lián)數(shù)據(jù)的公開(kāi)出版等,不僅從數(shù)據(jù)政策上加強(qiáng)要求,也可以打通雙方平臺(tái),方便作者一站式完成論文和數(shù)據(jù)的提交。二是規(guī)范科學(xué)數(shù)據(jù)出版要求,逐漸形成完善的數(shù)據(jù)出版過(guò)程中的權(quán)益保護(hù)機(jī)制,保障數(shù)據(jù)所有者權(quán)益,如數(shù)據(jù)發(fā)布時(shí)均明確數(shù)據(jù)出版許可協(xié)議、數(shù)據(jù)使用要求、數(shù)據(jù)引用規(guī)范、提供數(shù)據(jù)下載和引用統(tǒng)計(jì),將數(shù)據(jù)共享成果納入科研人員的成果和貢獻(xiàn)度等評(píng)價(jià)中。三是對(duì)標(biāo)國(guó)際數(shù)據(jù)期刊,大力發(fā)展我國(guó)的數(shù)據(jù)期刊,實(shí)現(xiàn)從少到多、打造有國(guó)際影響力的數(shù)據(jù)期刊的逐級(jí)突破,并同步建立數(shù)據(jù)專(zhuān)家?guī)?,讓更多的科研工作者了解?shù)據(jù)出版的概念,并自主發(fā)表更多的數(shù)據(jù)論文。當(dāng)然以上建議的落實(shí)離不開(kāi)國(guó)家相關(guān)政策的出臺(tái),也離不開(kāi)科學(xué)數(shù)據(jù)出版環(huán)節(jié)中所有利益相關(guān)者的共同推進(jìn)。
本文僅基于我國(guó)空間科學(xué)數(shù)據(jù)共享現(xiàn)狀,分析和總結(jié)有一定的局限性。相信隨著國(guó)家數(shù)據(jù)共享政策的逐步完善,社會(huì)共享生態(tài)的逐步改善,以及信息技術(shù)的不斷應(yīng)用,數(shù)據(jù)倉(cāng)儲(chǔ)、出版界工作不斷推進(jìn)和創(chuàng)新,我國(guó)科學(xué)數(shù)據(jù)共享和出版將邁上新的臺(tái)階。