張玲玲 陳媛媛,2
(1. 黑龍江大學(xué)信息管理學(xué)院,哈爾濱 150080;2. 南開大學(xué)商學(xué)院,天津 300071)
科學(xué)數(shù)據(jù)是科研活動(dòng)重要內(nèi)容和主要產(chǎn)物[1],對(duì)科學(xué)數(shù)據(jù)進(jìn)行出版,在有效避免重復(fù)勞動(dòng)、防止學(xué)術(shù)造假、提高數(shù)據(jù)發(fā)表者知名度的同時(shí),能夠促進(jìn)數(shù)據(jù)共享和重用,推動(dòng)科技創(chuàng)新和經(jīng)濟(jì)的發(fā)展。數(shù)據(jù)出版也是解決數(shù)據(jù)知識(shí)產(chǎn)權(quán)保護(hù)和推動(dòng)數(shù)據(jù)廣泛共享難題的有效機(jī)制[2]。因此,科學(xué)數(shù)據(jù)出版逐漸引起各個(gè)國(guó)家的高度重視。2018年,一批國(guó)家科研資助機(jī)構(gòu)推出cOAlition S計(jì)劃;2019年5月31日,cOAlition S發(fā)布了修訂的開放獲取Plan S和實(shí)施指南,并指出自2021年起,所有由地區(qū)、國(guó)家、國(guó)際研究理事會(huì)和資助機(jī)構(gòu)提供的公共或私人資助的學(xué)術(shù)出版物,必須在開放獲取期刊、開放獲取平臺(tái)上出版,或通過(guò)開放獲取知識(shí)庫(kù)立即提供,而不受封禁[3]。近年來(lái),我國(guó)也開始重視科學(xué)數(shù)據(jù)出版平臺(tái)建設(shè),如2014年我國(guó)創(chuàng)建了全球變化科學(xué)研究數(shù)據(jù)出版系統(tǒng),被科學(xué)技術(shù)部稱贊為“中國(guó)科技數(shù)據(jù)共享新的里程碑”[4];2017年我國(guó)創(chuàng)建了地質(zhì)科學(xué)數(shù)據(jù)出版中心,它是集元數(shù)據(jù)、實(shí)體數(shù)據(jù)、論文關(guān)聯(lián)一體化出版的數(shù)據(jù)平臺(tái);2018年國(guó)務(wù)院辦公廳發(fā)布了《科學(xué)數(shù)據(jù)管理辦法》,其中明確提出要積極推動(dòng)科學(xué)數(shù)據(jù)出版和傳播工作[5]。我國(guó)的科學(xué)數(shù)據(jù)出版和傳播活動(dòng)開始逐漸步入正軌。
數(shù)據(jù)出版模式有很多種,但仍可歸為3種模式,即獨(dú)立數(shù)據(jù)出版模式、作為論文關(guān)聯(lián)和輔助資料的出版模式以及數(shù)據(jù)論文出版模式[6]。這些出版模式主要借助于數(shù)據(jù)倉(cāng)儲(chǔ)、機(jī)構(gòu)庫(kù)以及期刊自行發(fā)表3種方式對(duì)外公布,其中以數(shù)據(jù)倉(cāng)儲(chǔ)和機(jī)構(gòu)庫(kù)為數(shù)據(jù)出版形式的數(shù)據(jù)質(zhì)量、數(shù)據(jù)規(guī)范性最強(qiáng)。相關(guān)學(xué)者對(duì)數(shù)據(jù)出版平臺(tái)進(jìn)行了研究,段青玉等[7]根據(jù)FAIR原則調(diào)研了人文社科的平臺(tái),總結(jié)出數(shù)據(jù)出版平臺(tái)需要從5個(gè)方面實(shí)現(xiàn)數(shù)據(jù)的利用;王丹丹[8]對(duì)數(shù)據(jù)管理的技術(shù)平臺(tái)進(jìn)行調(diào)研,總結(jié)出平臺(tái)的基本功能和用戶體驗(yàn)要求;秦順等[9]對(duì)歐美14個(gè)數(shù)據(jù)出版平臺(tái)的5個(gè)方面展開調(diào)研,并針對(duì)各方面要素歸納其服務(wù)特點(diǎn)。但我國(guó)還沒(méi)有對(duì)某一學(xué)科領(lǐng)域的數(shù)據(jù)出版平臺(tái)建設(shè)情況進(jìn)行針對(duì)性研究。隨著地理信息系統(tǒng)、全球定位系統(tǒng)的不斷發(fā)展[10],關(guān)于地理數(shù)據(jù)的出版平臺(tái)建設(shè)也在不斷完善。因此,本文就中美地理科學(xué)領(lǐng)域的數(shù)據(jù)出版平臺(tái)情況展開調(diào)研分析,以期為我國(guó)科學(xué)數(shù)據(jù)出版平臺(tái)服務(wù)建設(shè)提供啟示。
美國(guó)科學(xué)數(shù)據(jù)出版平臺(tái)服務(wù)長(zhǎng)期處于領(lǐng)先地位,實(shí)踐經(jīng)驗(yàn)豐富,因此本文以美國(guó)創(chuàng)建的地理數(shù)據(jù)出版平臺(tái)為對(duì)比研究對(duì)象。為了使選取的數(shù)據(jù)出版平臺(tái)具有代表性,以已在科研數(shù)據(jù)知識(shí)庫(kù)注冊(cè)目錄系統(tǒng)(re3data.org)注冊(cè)的平臺(tái)為樣本,以平臺(tái)創(chuàng)立時(shí)間、合作機(jī)構(gòu)、存儲(chǔ)數(shù)據(jù)量、數(shù)據(jù)更新速度為主要依據(jù),選取以下平臺(tái)。主要包括美國(guó)地質(zhì)調(diào)查局(United States Geological Survey,USGS)、美國(guó)國(guó)家海洋和大氣管理局(National Oceanic and Atmospheric Administration,NOAA)、美國(guó)地?zé)釘?shù)據(jù)系統(tǒng)(National Geothermal Data System,NGDS)和美國(guó)國(guó)家冰雪數(shù)據(jù)中心(National Snow and Ice Data Center,NSIDC)四大典型性代表平臺(tái)。國(guó)內(nèi)方面,經(jīng)過(guò)文獻(xiàn)閱讀和網(wǎng)絡(luò)調(diào)研,選取我國(guó)的全球變化科學(xué)研究數(shù)據(jù)出版系統(tǒng)、國(guó)家地球系統(tǒng)科學(xué)數(shù)據(jù)共享服務(wù)平臺(tái)、國(guó)家氣象信息中心及中國(guó)南北極數(shù)據(jù)中心進(jìn)行調(diào)研分析。
數(shù)據(jù)出版不是簡(jiǎn)單的數(shù)據(jù)發(fā)布,而是包括數(shù)據(jù)提交、同行評(píng)審、數(shù)據(jù)發(fā)布和永久存儲(chǔ)、數(shù)據(jù)引用、影響評(píng)價(jià)5個(gè)基本環(huán)節(jié)[11]。下文據(jù)此對(duì)中美8家地理科學(xué)數(shù)據(jù)出版平臺(tái)的發(fā)展情況展開網(wǎng)絡(luò)調(diào)研。
2.1.1 描述數(shù)據(jù)
為提高科學(xué)數(shù)據(jù)的利用價(jià)值,數(shù)據(jù)提交者在提交數(shù)據(jù)時(shí)對(duì)數(shù)據(jù)進(jìn)行規(guī)范性、完整性描述。其中,全球變化科學(xué)研究數(shù)據(jù)出版系統(tǒng)和NSIDC做出了很好的規(guī)范,數(shù)據(jù)描述包括標(biāo)題、關(guān)鍵詞、摘要、相關(guān)圖表、文件格式、資料收集方法等要素,并進(jìn)行了字符長(zhǎng)度規(guī)范,如數(shù)據(jù)集標(biāo)題不可超過(guò)85個(gè)ASCII字符等。為使數(shù)據(jù)使用者了解數(shù)據(jù)存在的價(jià)值,平臺(tái)要求填寫數(shù)據(jù)的可用性說(shuō)明,包括數(shù)據(jù)提供的內(nèi)容、背景、潛在應(yīng)用程序和參數(shù)等的概述。地理科學(xué)學(xué)科的數(shù)據(jù)格式有很多種,如GIF、JPG、TIFF等,但這些格式結(jié)構(gòu)簡(jiǎn)單,無(wú)法存放更多有用信息。NOAA和NSIDC選擇HDF作為數(shù)據(jù)提交格式之一,它具有的異構(gòu)性、跨平臺(tái)性、簡(jiǎn)單分享性等特點(diǎn),使存儲(chǔ)不同類型的圖像和數(shù)碼數(shù)據(jù)的文件格式,可以在不同類型的機(jī)器上傳輸,同時(shí)還有統(tǒng)一處理這種文件格式的函數(shù)庫(kù)[12]。USGS和NOAA選擇netCDF(網(wǎng)絡(luò)通用數(shù)據(jù)表單)為另一種數(shù)據(jù)提交格式,該格式具有自我描述性、隨身攜帶性、可擴(kuò)展性、可追加性、可分享性等特點(diǎn),支持創(chuàng)建、訪問(wèn)和共享面向陣列的科學(xué)數(shù)據(jù)。而我國(guó)地理科學(xué)數(shù)據(jù)出版平臺(tái)對(duì)數(shù)據(jù)描述內(nèi)容、數(shù)據(jù)格式要求較為單一。
2.1.2 數(shù)據(jù)提交方式
為了保證數(shù)據(jù)的嚴(yán)謹(jǐn)性,8家地理科學(xué)數(shù)據(jù)出版平臺(tái)在數(shù)據(jù)提交之前,都需要完成平臺(tái)的注冊(cè)登錄。在數(shù)據(jù)提交過(guò)程中,USGS要求提交者根據(jù)相關(guān)調(diào)查表收集元數(shù)據(jù)內(nèi)容,或者根據(jù)元數(shù)據(jù)創(chuàng)建工具收集元數(shù)據(jù),收集的數(shù)據(jù)通過(guò)USGS元數(shù)據(jù)解析器或Microsoft XML記事本驗(yàn)證元數(shù)據(jù)是否創(chuàng)建正確,創(chuàng)建正確方可提交。NOAA對(duì)數(shù)據(jù)集提交的大小有一定規(guī)范,數(shù)據(jù)集小于20GB,要求使用Send2NCEI(S2N)在線工具記錄并提交數(shù)據(jù);數(shù)據(jù)集大于20GB,要求提交至用于檔案館藏的高級(jí)跟蹤和資源工具(Advanced Tracking and Resource Tool for Archive Collections,ATRAC)中。NGDS要求數(shù)據(jù)提交者根據(jù)給定信息交換方案的標(biāo)準(zhǔn)文件填寫信息,并在指定網(wǎng)頁(yè)對(duì)文件進(jìn)行驗(yàn)證方可提交。我國(guó)四大地理科學(xué)數(shù)據(jù)出版平臺(tái)中數(shù)據(jù)提交方式都是以網(wǎng)頁(yè)形式填寫數(shù)據(jù)集相關(guān)信息并進(jìn)行提交。
同行評(píng)審主要是對(duì)數(shù)據(jù)內(nèi)容進(jìn)行評(píng)審,科學(xué)數(shù)據(jù)出版中的數(shù)據(jù)評(píng)審主要包括科學(xué)性、技術(shù)性以及監(jiān)護(hù)性3種評(píng)審維度[13]。科學(xué)性評(píng)審主要體現(xiàn)在對(duì)數(shù)據(jù)內(nèi)容的準(zhǔn)確性、真實(shí)性等進(jìn)行評(píng)審,技術(shù)性評(píng)審主要體現(xiàn)在對(duì)數(shù)據(jù)及元數(shù)據(jù)的質(zhì)量進(jìn)行技術(shù)評(píng)審,監(jiān)護(hù)性評(píng)審主要體現(xiàn)在對(duì)數(shù)據(jù)以外的相關(guān)文檔進(jìn)行管理和評(píng)估。美國(guó)數(shù)據(jù)出版平臺(tái)在這3種數(shù)據(jù)評(píng)審維度中有較好的體現(xiàn)。其中NOAA規(guī)定了信息質(zhì)量和傳播前的審查標(biāo)準(zhǔn),主要體現(xiàn)在信息的效用、完整性和客觀性。信息質(zhì)量是傳播前審查不可或缺的一部分,它也是NOAA收集信息的組成部分,并已納入《減少文書工作法》(PRA)要求的審批流程中,以幫助提高NOAA向公眾傳播信息的質(zhì)量。為了更加準(zhǔn)確收集信息,NOAA采用數(shù)據(jù)收集和相關(guān)培訓(xùn)等方法對(duì)數(shù)據(jù)進(jìn)行有效監(jiān)管,并使用一級(jí)或二級(jí)標(biāo)準(zhǔn)、基礎(chǔ)工程和科學(xué)方法對(duì)儀器進(jìn)行校準(zhǔn),旨在滿足目標(biāo)用戶的要求。為了避免數(shù)據(jù)存儲(chǔ)過(guò)程中存在丟失,NOAA會(huì)對(duì)標(biāo)準(zhǔn)操作程序(SOP)進(jìn)行定期審查和修改。為了保證數(shù)據(jù)的規(guī)范性,NOAA提供了DMP Tool、DMP Editor等工具,對(duì)如何獲取或收集數(shù)據(jù)、數(shù)據(jù)收集的時(shí)間以及預(yù)算、如何對(duì)數(shù)據(jù)進(jìn)行質(zhì)量檢查、數(shù)據(jù)如何存儲(chǔ),以及訪問(wèn)和保護(hù)等問(wèn)題進(jìn)行詳細(xì)的管理規(guī)劃。在同行評(píng)審相關(guān)政策中,USGS和NOAA皆采用了美國(guó)管理和預(yù)算局(OMB)所發(fā)布的同行評(píng)審信息質(zhì)量公報(bào)(Final Information Quality Bulletin for Peer Review)[14],該公報(bào)規(guī)定了科學(xué)信息何時(shí)需要同行評(píng)審的最低標(biāo)準(zhǔn),以及各機(jī)構(gòu)在不同情況下應(yīng)考慮的同行評(píng)審類型,提出同行評(píng)審計(jì)劃應(yīng)建立一個(gè)透明的過(guò)程,包括對(duì)同行評(píng)審計(jì)劃的網(wǎng)絡(luò)可訪問(wèn)描述。在決定何種類型的同行審查機(jī)制適用于特定的信息產(chǎn)品時(shí),該公報(bào)要求機(jī)構(gòu)應(yīng)考慮個(gè)人審查還是小組審查,同行評(píng)審時(shí)間,審查范圍,審稿人的選擇,信息披露和歸因,公眾參與評(píng)論,審稿人意見的處理,以及事先的同行審查是否充分等問(wèn)題,關(guān)于審稿人在審稿過(guò)程中可能存在的利益沖突進(jìn)行了詳細(xì)的規(guī)避措施闡述。
我國(guó)4家地理科學(xué)數(shù)據(jù)出版平臺(tái)中,只有全球變化科學(xué)研究數(shù)據(jù)出版系統(tǒng)對(duì)同行評(píng)審內(nèi)容進(jìn)行了闡述,且于2014年起草了《科學(xué)數(shù)據(jù)DOI注冊(cè)與發(fā)表同行評(píng)議規(guī)定和評(píng)議表》[13],評(píng)審的內(nèi)容包括數(shù)據(jù)集的產(chǎn)權(quán)是否清晰,實(shí)體數(shù)據(jù)內(nèi)容與數(shù)據(jù)論文闡述是否一致,實(shí)體數(shù)據(jù)在內(nèi)容或格式上是否具有智力投入,實(shí)體數(shù)據(jù)的質(zhì)量是否符合誤差小于10%原則,以及引用他人數(shù)據(jù)記錄是否符合小于10%原則等,在諸多方面確保了數(shù)據(jù)的質(zhì)量[2]。但在管理員對(duì)數(shù)據(jù)技術(shù)性評(píng)審和監(jiān)護(hù)性評(píng)審方面缺乏相關(guān)審核制度。其他3個(gè)出版平臺(tái)都采用內(nèi)部評(píng)估的方式進(jìn)行同行評(píng)審,并未給予對(duì)外公布。
美國(guó)地理科研數(shù)據(jù)出版平臺(tái)建設(shè)時(shí)間較長(zhǎng),平臺(tái)數(shù)據(jù)服務(wù)較為成熟。其中USGS要求需滿足7個(gè)要素方可發(fā)布數(shù)據(jù):①數(shù)據(jù)管理計(jì)劃(Data Management Plan,DMP),USGS要求對(duì)于每個(gè)項(xiàng)目都需要制定數(shù)據(jù)管理計(jì)劃,該計(jì)劃應(yīng)在開始項(xiàng)目工作之前編寫,并在整個(gè)項(xiàng)目中進(jìn)行更新;②科學(xué)數(shù)據(jù)格式確定,通過(guò)確保數(shù)據(jù)提交者的數(shù)據(jù)采用開放格式,以保證數(shù)據(jù)使用壽命;③符合FGDC的元數(shù)據(jù)標(biāo)準(zhǔn);④USGS數(shù)據(jù)對(duì)象標(biāo)識(shí)符(DOI),在USGS中發(fā)布的所有數(shù)據(jù)都必須具有DOI;⑤數(shù)據(jù)和元數(shù)據(jù)審查,USGS要求發(fā)布的任何數(shù)據(jù)都必須經(jīng)過(guò)審查和批準(zhǔn),從而確保數(shù)據(jù)的完整性、真實(shí)性、準(zhǔn)確性和有用性;⑥可接受的數(shù)據(jù)存儲(chǔ)庫(kù),發(fā)布的數(shù)據(jù)的位置應(yīng)該是USGS“受信任的數(shù)字存儲(chǔ)庫(kù)”的組成部分;⑦數(shù)據(jù)提交者發(fā)布的數(shù)據(jù)必須通過(guò)USGS科學(xué)數(shù)據(jù)目錄向公眾和科研社區(qū)共享。為了使數(shù)據(jù)利用者快速了解并獲取平臺(tái)信息,8家數(shù)據(jù)出版平臺(tái)中有5家選擇以API的形式進(jìn)行科學(xué)數(shù)據(jù)交互(見表1),其中USGS選擇REST風(fēng)格(Representational State Transfer,表述性狀態(tài)傳遞)進(jìn)行數(shù)據(jù)描述和數(shù)據(jù)交互。RESTful API具有統(tǒng)一接口URL,能夠基于HTTP協(xié)議實(shí)現(xiàn)多種格式的數(shù)據(jù)調(diào)用,極大地?cái)U(kuò)展了科學(xué)數(shù)據(jù)出版的覆蓋面,有助于科學(xué)數(shù)據(jù)的永久存儲(chǔ)[9]。我國(guó)的全球變化科學(xué)研究數(shù)據(jù)出版系統(tǒng)、國(guó)家地球系統(tǒng)科學(xué)數(shù)據(jù)共享服務(wù)平臺(tái)、國(guó)家氣象信息中心選擇了自主研發(fā)框架進(jìn)行科學(xué)數(shù)據(jù)交互,這為數(shù)據(jù)交互和共享帶來(lái)了一定的阻礙,而選取作為統(tǒng)一規(guī)范路徑的API接口對(duì)數(shù)據(jù)進(jìn)行標(biāo)識(shí)、關(guān)聯(lián)與交互可有效避免這一障礙。
表1 數(shù)據(jù)出版平臺(tái)數(shù)據(jù)交互、數(shù)據(jù)標(biāo)識(shí)、許可協(xié)議調(diào)查表
數(shù)據(jù)引用是數(shù)據(jù)出版的關(guān)鍵環(huán)節(jié),是保障數(shù)據(jù)作者與管理者數(shù)據(jù)權(quán)益的有效方式[15]。截至目前,應(yīng)用最多的數(shù)字標(biāo)識(shí)符有DOI、URL、OpenURL等。從表1可以看出,大部分?jǐn)?shù)據(jù)平臺(tái)的數(shù)據(jù)引用方式選擇DOI,DOI具有唯一且永久命名、解釋鏈接、多重解析、唯一標(biāo)識(shí)符、點(diǎn)擊即鏈接、元數(shù)據(jù)和鏈接地址可更新、元數(shù)據(jù)/DOI可查詢等特點(diǎn),數(shù)據(jù)標(biāo)識(shí)貫穿數(shù)據(jù)出版整個(gè)過(guò)程,在數(shù)據(jù)出版過(guò)程中可做到版權(quán)保護(hù),對(duì)數(shù)據(jù)資源的可信度和質(zhì)量做到有效保障,因此,DOI的應(yīng)用和研究也是最為廣泛的[16]。
阻礙數(shù)據(jù)出版主要體現(xiàn)在數(shù)據(jù)共享與知識(shí)產(chǎn)權(quán)保護(hù)這一矛盾,建立共享協(xié)議有助于解決這一突出問(wèn)題。由表1可知,除了USGS和NOAA放棄版權(quán)將數(shù)據(jù)完全公布到公共領(lǐng)域(public domain)以外,大部分平臺(tái)采取CC BY、CCO共享協(xié)議,十分重視科學(xué)數(shù)據(jù)在出版過(guò)程中的知識(shí)產(chǎn)權(quán)保護(hù)。不同共享協(xié)議有不同的優(yōu)點(diǎn),若原始數(shù)據(jù)采用的是CCO和CC BY許可協(xié)議,其數(shù)據(jù)可采用CC家族的任意類型許可協(xié)議,其中CC BY4.0版本具有較好的兼容性,這將極大地促進(jìn)了數(shù)據(jù)的利用、重用和創(chuàng)造性使用[17]。
對(duì)科學(xué)數(shù)據(jù)進(jìn)行影響評(píng)價(jià)具有兩種目的:一是讓數(shù)據(jù)使用者直觀評(píng)判數(shù)據(jù)質(zhì)量;二是將評(píng)價(jià)指標(biāo)納入科研成效評(píng)價(jià)指標(biāo)中,激勵(lì)科研人員主動(dòng)參與數(shù)據(jù)出版與數(shù)據(jù)共享過(guò)程[11]。NOAA可允許數(shù)據(jù)訪問(wèn)者對(duì)發(fā)布的數(shù)據(jù)進(jìn)行星級(jí)評(píng)價(jià),用戶可通過(guò)星級(jí)分?jǐn)?shù)來(lái)了解數(shù)據(jù)發(fā)布的質(zhì)量。值得關(guān)注的是,為了使平臺(tái)建設(shè)更加完善,NOAA提供了平臺(tái)反饋,點(diǎn)擊反饋鏈接可進(jìn)行填寫網(wǎng)站客戶滿意度調(diào)查問(wèn)卷[18],內(nèi)容為對(duì)網(wǎng)站整體印象、信息組織、尋找特定信息難易程度、改善網(wǎng)站意見等相關(guān)問(wèn)題進(jìn)行調(diào)查。NOAA、USGS、NGDS、NSIDC 4個(gè)平臺(tái)都與社會(huì)媒體進(jìn)行合作,其中USGS合作的社會(huì)媒體較多,如Google、github、Facebook、youtube、TWTTER、FLICHR、instagram等,使科學(xué)數(shù)據(jù)可進(jìn)行廣泛地分享,這不僅可以使更多數(shù)據(jù)得到重用,還可以加快數(shù)據(jù)影響評(píng)價(jià)速度,從而識(shí)別優(yōu)質(zhì)數(shù)據(jù),增強(qiáng)科研人員知名度,進(jìn)而提高科研人員的共享意識(shí)。
我國(guó)地理科學(xué)數(shù)據(jù)出版平臺(tái)除了全球變化科學(xué)研究數(shù)據(jù)出版系統(tǒng)以外,其他出版平臺(tái)對(duì)發(fā)布的科學(xué)數(shù)據(jù)可進(jìn)行星級(jí)評(píng)價(jià)(共分為5個(gè)等級(jí),依次為非常滿意、滿意、一般、不滿意、非常不滿意),其中,國(guó)家氣象信息中心和中國(guó)南北極數(shù)據(jù)中心的數(shù)據(jù)可分享到微信、微博等社交媒體上。4個(gè)出版平臺(tái)都可通過(guò)數(shù)據(jù)訪問(wèn)次數(shù)、下載次數(shù)、引用次數(shù)了解數(shù)據(jù)質(zhì)量。國(guó)家地球系統(tǒng)科學(xué)數(shù)據(jù)共享服務(wù)平臺(tái)與國(guó)家氣象信息中心皆建立了微信公眾號(hào),不定期地分享最新的地理科學(xué)數(shù)據(jù),以供數(shù)據(jù)使用者及時(shí)了解相關(guān)信息。
我國(guó)的科學(xué)數(shù)據(jù)出版平臺(tái)建設(shè)較晚,但隨著人們的數(shù)據(jù)共享意識(shí)不斷提升,該領(lǐng)域的發(fā)展引起國(guó)家和科研機(jī)構(gòu)的高度重視,并在數(shù)據(jù)出版領(lǐng)域做出了有益探索。例如,全球變化科學(xué)研究數(shù)據(jù)出版系統(tǒng)在聯(lián)合國(guó)大會(huì)中得到了一致肯定,并一致認(rèn)為其是發(fā)展中國(guó)家實(shí)現(xiàn)科學(xué)數(shù)據(jù)共享可借鑒的實(shí)踐案例,其通過(guò)互聯(lián)網(wǎng)實(shí)現(xiàn)科學(xué)傳播和公益性共享的機(jī)制為科學(xué)數(shù)據(jù)知識(shí)產(chǎn)權(quán)保護(hù)和數(shù)據(jù)共享這一問(wèn)題的解決起到了很好的借鑒作用。但從整體而言,我國(guó)數(shù)據(jù)出版平臺(tái)實(shí)踐較為薄弱,需要進(jìn)一步吸取美國(guó)等國(guó)家數(shù)據(jù)出版平臺(tái)建設(shè)所積累的經(jīng)驗(yàn)。
數(shù)據(jù)出版過(guò)程面臨復(fù)雜的知識(shí)產(chǎn)權(quán)保護(hù)問(wèn)題,知識(shí)產(chǎn)權(quán)是否能得到有效保護(hù)直接影響科研工作者數(shù)據(jù)共享意識(shí)。因此,為使數(shù)據(jù)出版流程更加順利,制定貫穿科學(xué)數(shù)據(jù)出版流程的規(guī)范化科學(xué)化政策尤為重要?!犊茖W(xué)數(shù)據(jù)管理辦法》的頒布,打破了我國(guó)科學(xué)數(shù)據(jù)無(wú)法可依的局面,為我國(guó)數(shù)據(jù)共享的出版和引用提供了方向,但其對(duì)具微觀的層面還有待加以完善和優(yōu)化[19]。無(wú)論國(guó)內(nèi)、國(guó)外,數(shù)據(jù)出版都處于尚在探索的階段,建立一個(gè)多樣互補(bǔ)的數(shù)據(jù)出版模式,并對(duì)數(shù)據(jù)出版模式流程中數(shù)據(jù)提交、同行評(píng)審、數(shù)據(jù)發(fā)布和永久存儲(chǔ)、數(shù)據(jù)引用及影響評(píng)價(jià)各個(gè)環(huán)節(jié)制定詳細(xì)細(xì)則,明確規(guī)范化、標(biāo)準(zhǔn)化的多方主體合作機(jī)制,推動(dòng)科學(xué)技術(shù)與服務(wù)理念持續(xù)為科學(xué)數(shù)據(jù)出版平臺(tái)服務(wù)。
規(guī)范數(shù)據(jù)提交格式是實(shí)現(xiàn)科學(xué)數(shù)據(jù)出版的前提條件。不同學(xué)科的數(shù)據(jù)存儲(chǔ)格式不同,因此在設(shè)置在線提交系統(tǒng)中需要設(shè)有合適的樣例來(lái)完成此項(xiàng)工作[20]。在數(shù)據(jù)提交流程中要十分注重以下環(huán)節(jié):①數(shù)據(jù)的描述,清晰地?cái)?shù)據(jù)描述有助于數(shù)據(jù)利用者對(duì)數(shù)據(jù)的理解和重用,因此對(duì)數(shù)據(jù)的描述應(yīng)詳細(xì)包括數(shù)據(jù)的標(biāo)題、關(guān)鍵詞、摘要、相關(guān)圖表、文件格式、資料收集方法等,對(duì)于相關(guān)描述信息可進(jìn)行適當(dāng)?shù)淖址拗埔悦膺^(guò)于冗長(zhǎng),NSIDC對(duì)數(shù)據(jù)描述做出了很好的規(guī)范;②可用性說(shuō)明,包括介紹數(shù)據(jù)提供的內(nèi)容、背景、潛在應(yīng)用程序和參數(shù)等的概述;③數(shù)據(jù)提交驗(yàn)證,可通過(guò)創(chuàng)建元數(shù)據(jù)解析器對(duì)提交的數(shù)據(jù)進(jìn)行驗(yàn)證,數(shù)據(jù)驗(yàn)證成功方可提交,這樣將減少大量人力物力,提高數(shù)據(jù)出版流程速度。
我國(guó)在數(shù)據(jù)評(píng)審過(guò)程中,在學(xué)習(xí)借鑒全球變化科學(xué)研究數(shù)據(jù)出版系統(tǒng)平臺(tái)的科學(xué)性評(píng)審的同時(shí),也應(yīng)該加強(qiáng)技術(shù)性評(píng)審及監(jiān)護(hù)性評(píng)審??茖W(xué)數(shù)據(jù)的同行評(píng)審是產(chǎn)生科學(xué)性數(shù)據(jù)的重要保障,一些工具和過(guò)程可能有助于快速、便捷地開展數(shù)據(jù)同行評(píng)審[21],如USGS創(chuàng)建了DMP Tool、DMPEditor、ezDMP、Microsoft Word Templates、Google Forms等工具,極大地簡(jiǎn)化了同行評(píng)審過(guò)程[22]。我國(guó)科學(xué)數(shù)據(jù)出版平臺(tái)也應(yīng)根據(jù)數(shù)據(jù)本身性質(zhì)創(chuàng)建審核工具,提高評(píng)審效率。
國(guó)內(nèi)的數(shù)據(jù)出版平臺(tái)對(duì)數(shù)據(jù)如何發(fā)布、數(shù)據(jù)發(fā)布要素皆無(wú)詳細(xì)的規(guī)范和要求,只是簡(jiǎn)單的發(fā)布與共享,與具質(zhì)量可信、唯一標(biāo)識(shí)、知識(shí)產(chǎn)權(quán)清晰等特征的數(shù)據(jù)出版平臺(tái)仍具有一些差距[9]。從數(shù)據(jù)存儲(chǔ)層面而言,以API作為數(shù)據(jù)編程接口,實(shí)現(xiàn)數(shù)據(jù)交互和關(guān)聯(lián),以DOI作為數(shù)據(jù)永久標(biāo)識(shí)符,實(shí)現(xiàn)數(shù)據(jù)永久追溯,將有助于數(shù)據(jù)出版平臺(tái)有序發(fā)展。
通過(guò)觀察8家數(shù)據(jù)出版平臺(tái)服務(wù)可知,建立有約束力的共享協(xié)議和數(shù)據(jù)引用標(biāo)準(zhǔn)能夠很好地解決數(shù)據(jù)出版過(guò)程中的知識(shí)產(chǎn)權(quán)保護(hù)和數(shù)據(jù)共享問(wèn)題。2017年12月,我國(guó)印發(fā)了《信息技術(shù)科學(xué)數(shù)據(jù)引用》(GB/T35294-2017)國(guó)家標(biāo)準(zhǔn),實(shí)現(xiàn)了基于OID(Object Identifier)數(shù)據(jù)標(biāo)識(shí)符的引用格式,這與國(guó)家層面科學(xué)數(shù)據(jù)引用規(guī)范高度契合[23]。在此基礎(chǔ)上,結(jié)合我國(guó)實(shí)際情況,深化DOI、OID數(shù)據(jù)標(biāo)識(shí)符的應(yīng)用,保護(hù)數(shù)據(jù)創(chuàng)造者知識(shí)產(chǎn)權(quán),與此同時(shí),建立有約束的數(shù)據(jù)共享協(xié)議,實(shí)現(xiàn)科學(xué)數(shù)據(jù)的廣泛應(yīng)用。
數(shù)據(jù)在發(fā)布之前進(jìn)行同行評(píng)審可對(duì)數(shù)據(jù)進(jìn)行質(zhì)量控制,數(shù)據(jù)發(fā)布之后進(jìn)行影響評(píng)價(jià)可擴(kuò)大數(shù)據(jù)發(fā)布者影響力及數(shù)據(jù)的重用。美國(guó)為了使科研數(shù)據(jù)得到廣泛的推廣,與各大社會(huì)媒體合作,如Google、github、Facebook、youtube等,使數(shù)據(jù)可隨時(shí)轉(zhuǎn)發(fā)到各大媒體平臺(tái),實(shí)現(xiàn)數(shù)據(jù)共享以供更多專業(yè)人士參考和評(píng)價(jià)。為了提高數(shù)據(jù)出版平臺(tái)的用戶體驗(yàn),NOAA提供了反饋鏈接并對(duì)用戶進(jìn)行網(wǎng)站滿意度調(diào)查。我國(guó)也應(yīng)積極與各大媒體合作,實(shí)現(xiàn)與百度、微信、微博、QQ等各大媒體平臺(tái)合作,不斷提高數(shù)據(jù)的影響價(jià)值,并將科學(xué)數(shù)據(jù)列入科技成果體系,使科學(xué)數(shù)據(jù)成果列入科研人員對(duì)科學(xué)貢獻(xiàn)的評(píng)價(jià)體系,提高科研人員數(shù)據(jù)共享意識(shí),促進(jìn)更多優(yōu)質(zhì)數(shù)據(jù)得到共享,如此循環(huán),推動(dòng)科學(xué)數(shù)據(jù)出版持續(xù)健康發(fā)展。