黃如花+李楠
摘 要:數(shù)據(jù)期刊政策是促進(jìn)科學(xué)數(shù)據(jù)共享和利用的基礎(chǔ),對(duì)國(guó)外數(shù)據(jù)期刊政策的調(diào)研分析,有利于我國(guó)數(shù)據(jù)期刊政策的研究和制定。文章以數(shù)據(jù)生命周期模型為理論基礎(chǔ),通過(guò)文獻(xiàn)調(diào)研和網(wǎng)站調(diào)研,分析了國(guó)外純數(shù)據(jù)期刊在數(shù)據(jù)計(jì)劃、數(shù)據(jù)確認(rèn)、數(shù)據(jù)描述、數(shù)據(jù)保存、數(shù)據(jù)整合和利用5個(gè)階段的數(shù)據(jù)政策內(nèi)容。我國(guó)數(shù)據(jù)期刊出版應(yīng)制定基于科研數(shù)據(jù)生命周期的數(shù)據(jù)期刊政策、與科研數(shù)據(jù)知識(shí)庫(kù)和圖書(shū)館開(kāi)展合作、注重保護(hù)作者權(quán)益、鼓勵(lì)數(shù)據(jù)引用采用國(guó)際標(biāo)準(zhǔn)格式。
關(guān)鍵詞:科研數(shù)據(jù);數(shù)據(jù)期刊;數(shù)據(jù)生命周期;政策
中圖分類(lèi)號(hào):G255.2 文獻(xiàn)標(biāo)識(shí)碼:A DOI:10.11968/tsyqb.1003-6938.2017048
Abstract The data journal policies are the foundation to promote the sharing and utilization of research data, and the investigation and analysis of foreign data journal policies are conducive to the research and formulation of data journal policies in China. Based on the data lifecycle model, this paper uses literature research and website research methods to analyze the content of data policies of foreign pure data journals in the period of data planning, data validation, data description, data preservation, data integration and utilization. China's data journal publication should establish data journal policies based on the life cycle of research data, cooperate with data repositories and libraries, pay attention to safeguarding the author's rights and interests and encourage the data citation according to international standard format.
Key words research data; data journal; data lifecycle; policy
大數(shù)據(jù)背景下,科學(xué)研究已進(jìn)入“第四范式”,即數(shù)據(jù)密集型研究,科學(xué)數(shù)據(jù)成為科學(xué)研究的心臟,科學(xué)數(shù)據(jù)的共享越來(lái)越重要。英國(guó)皇家學(xué)會(huì)2012年發(fā)布的《科學(xué)是開(kāi)放事業(yè)》(Science as an Open Enterprise)報(bào)告中提出:一篇完整的學(xué)術(shù)論文應(yīng)該包括對(duì)實(shí)驗(yàn)的完整描述、結(jié)果數(shù)據(jù)和確保數(shù)據(jù)能被驗(yàn)證和重復(fù)使用的元數(shù)據(jù),但實(shí)際情況卻是原始數(shù)據(jù)和科學(xué)結(jié)果的發(fā)表被割裂開(kāi)了[1]。國(guó)外科學(xué)界較早認(rèn)識(shí)到科研數(shù)據(jù)的重要性,并創(chuàng)建了數(shù)據(jù)期刊來(lái)發(fā)表描述數(shù)據(jù)集的論文。數(shù)據(jù)期刊目前已成為科研數(shù)據(jù)的三種重要傳播方式之一和重要角色之一[2]。
數(shù)據(jù)期刊是一種新型的學(xué)術(shù)論文出版和科學(xué)數(shù)據(jù)共享模式,出版專(zhuān)門(mén)描述數(shù)據(jù)集的短篇論文,目前國(guó)際上有15家期刊出版商出版110多種數(shù)據(jù)期刊,并且數(shù)據(jù)期刊的數(shù)量還在不斷增加[3]。數(shù)據(jù)期刊對(duì)推動(dòng)科研數(shù)據(jù)開(kāi)放共享,促進(jìn)數(shù)據(jù)重用、數(shù)據(jù)引用和科研評(píng)價(jià)具有重要作用,數(shù)據(jù)期刊政策是創(chuàng)建數(shù)據(jù)期刊的首要環(huán)節(jié),涉及數(shù)據(jù)提交、數(shù)據(jù)描述、數(shù)據(jù)保存、數(shù)據(jù)利用等數(shù)據(jù)生命周期階段。目前國(guó)內(nèi)關(guān)于數(shù)據(jù)期刊政策的研究較少,本文擬調(diào)研國(guó)際數(shù)據(jù)期刊政策,以期為完善我國(guó)數(shù)據(jù)期刊政策提供參考,從而推動(dòng)我國(guó)數(shù)據(jù)期刊和數(shù)據(jù)出版的發(fā)展。
1 研究概述
1.1 研究背景
數(shù)據(jù)期刊是應(yīng)對(duì)科研數(shù)據(jù)共享的大趨勢(shì)之下發(fā)展起來(lái)的新型學(xué)術(shù)期刊,是一種對(duì)數(shù)據(jù)的使用、引用和重用,以及對(duì)數(shù)據(jù)內(nèi)容來(lái)源的準(zhǔn)確識(shí)別和溯源都非常重要的工具[4]。當(dāng)前大多國(guó)外數(shù)據(jù)期刊以開(kāi)放獲取的方式正式出版,以便于科學(xué)數(shù)據(jù)最大程度傳播、共享和利用。數(shù)據(jù)期刊主要出版描述數(shù)據(jù)集的數(shù)據(jù)論文(data paper),旨在使其他研究人員了解可能用于科學(xué)和教育目的的數(shù)據(jù),數(shù)據(jù)論文內(nèi)容不涉及基于科學(xué)假設(shè)和科學(xué)問(wèn)題的研究結(jié)果,描述的數(shù)據(jù)集來(lái)源既可以是對(duì)已發(fā)表論文中數(shù)據(jù)的說(shuō)明描述,也可以是對(duì)新產(chǎn)生數(shù)據(jù)的說(shuō)明描述。數(shù)據(jù)論文描述了用于創(chuàng)建數(shù)據(jù)集的方法、結(jié)構(gòu)、重復(fù)使用價(jià)值以及與其在存儲(chǔ)庫(kù)中的位置的鏈接。
數(shù)據(jù)期刊有兩種類(lèi)型,一類(lèi)是以出版研究性論文為主,將數(shù)據(jù)集作為論文的補(bǔ)充性文件出版的混合型(Mixed)數(shù)據(jù)期刊,如Gigascience、Ecology、F1000 Research、Biodoversity Data Journal;另一類(lèi)是專(zhuān)門(mén)出版數(shù)據(jù)論文的純(Pure)數(shù)據(jù)期刊,目前共有7種純數(shù)據(jù)期刊,分別是《科學(xué)數(shù)據(jù)集論文》(Dataset Papers in Science)、《地球科學(xué)數(shù)據(jù)期刊》(Geoscience Data Journal)、《地球系統(tǒng)科學(xué)數(shù)據(jù)》(Earth System Science Data)、《科學(xué)數(shù)據(jù)》(Scientific Data)、《開(kāi)放健康數(shù)據(jù)》(Open health data)、《開(kāi)放考古學(xué)期刊》(Journal of open Archaeology)、《開(kāi)放心理學(xué)數(shù)據(jù)期刊》(Journal of Open Psychology Data)。endprint
國(guó)際對(duì)數(shù)據(jù)期刊政策內(nèi)容分析的研究相對(duì)較少,由于數(shù)據(jù)期刊政策只是微觀(guān)層面的一個(gè)內(nèi)容點(diǎn),目前更多的研究主題集中在科學(xué)數(shù)據(jù)共享政策、技術(shù)、障礙等方面。國(guó)內(nèi)關(guān)于數(shù)據(jù)期刊政策方面已有一些研究,如劉晶晶等[4]以Scientific Data期刊為案例,根據(jù)實(shí)用主義方法論,以合理競(jìng)替的方法篩選和提煉政策要素,認(rèn)為數(shù)據(jù)期刊應(yīng)該著重于期刊提交規(guī)范、質(zhì)量管理流程以及保障各方權(quán)益;歐陽(yáng)錚錚等[5]選擇15種數(shù)據(jù)期刊進(jìn)行調(diào)研,對(duì)其發(fā)展現(xiàn)狀、學(xué)科分布、出版方式、收錄內(nèi)容、版權(quán)協(xié)議以及出版費(fèi)用等方面進(jìn)行了分析;劉鳳紅等[2]分析了不同類(lèi)型數(shù)據(jù)論文的產(chǎn)生背景、概念、權(quán)益管理以及出版流程;雷秋雨等[6]分析了當(dāng)前幾種典型的數(shù)據(jù)期刊出版模式,即以出版短數(shù)據(jù)論文為特征的數(shù)據(jù)期刊、以整合出版為特征的數(shù)據(jù)期刊、數(shù)據(jù)以補(bǔ)充資料出版特征的數(shù)據(jù)期刊,最后簡(jiǎn)要論述了數(shù)據(jù)期刊出版當(dāng)前的發(fā)展?fàn)顩r、存在的問(wèn)題、建議及數(shù)據(jù)期刊的發(fā)展趨勢(shì)。由上述可知,目前已有的研究并沒(méi)有針對(duì)純數(shù)據(jù)期刊政策的調(diào)研分析。
1.2 研究方法
文章以生命周期理論為理論基礎(chǔ),采用DataOne科學(xué)數(shù)據(jù)生命周期模型[7]。數(shù)據(jù)生命周期是指從數(shù)據(jù)產(chǎn)生,經(jīng)數(shù)據(jù)加工和發(fā)布,最終實(shí)現(xiàn)數(shù)據(jù)再利用的一個(gè)循環(huán)過(guò)程,其實(shí)質(zhì)是依據(jù)科研過(guò)程來(lái)管理數(shù)據(jù)[8]。DataOne科學(xué)數(shù)據(jù)生命周期模型共包括8個(gè)階段,分別是數(shù)據(jù)計(jì)劃、數(shù)據(jù)收集、數(shù)據(jù)確認(rèn)、數(shù)據(jù)描述、數(shù)據(jù)保存、數(shù)據(jù)發(fā)現(xiàn)、數(shù)據(jù)整合、數(shù)據(jù)分析。雖然將數(shù)據(jù)集發(fā)表在數(shù)據(jù)期刊上只涉及數(shù)據(jù)生命周期中的一個(gè)階段,但是數(shù)據(jù)期刊對(duì)其發(fā)表的數(shù)據(jù)集或者數(shù)據(jù)論文的政策要求涉及到了數(shù)據(jù)生命周期的多個(gè)階段,分別是數(shù)據(jù)計(jì)劃、數(shù)據(jù)確認(rèn)、數(shù)據(jù)描述、數(shù)據(jù)保存、數(shù)據(jù)整合階段,本文將從這5個(gè)階段分析數(shù)據(jù)期刊的具體政策。
文章采用網(wǎng)絡(luò)調(diào)查法和內(nèi)容分析法,選取國(guó)際上純數(shù)據(jù)期刊作為研究對(duì)象,通過(guò)廣泛閱讀相關(guān)文獻(xiàn)和訪(fǎng)問(wèn)數(shù)據(jù)期刊的官網(wǎng),具體分析其在科研數(shù)據(jù)生命周期數(shù)據(jù)計(jì)劃、數(shù)據(jù)確認(rèn)、數(shù)據(jù)描述、數(shù)據(jù)保存、數(shù)據(jù)整合階段的政策。由于7種純數(shù)據(jù)期刊中的《開(kāi)放健康數(shù)據(jù)》《開(kāi)放考古學(xué)期刊》《開(kāi)放心理學(xué)數(shù)據(jù)期刊》均是由Ubiquity press出版社出版的數(shù)據(jù)期刊,其期刊政策極為相似,故本文只選取其中一種(《開(kāi)放健康數(shù)據(jù)》期刊)進(jìn)行調(diào)研分析,共5種純數(shù)據(jù)期刊政策(見(jiàn)表1)。
2 科學(xué)數(shù)據(jù)生命周期模型下的數(shù)據(jù)期刊政策分析
2.1 數(shù)據(jù)計(jì)劃階段
數(shù)據(jù)計(jì)劃是指制定科研數(shù)據(jù)計(jì)劃、確定生成的數(shù)據(jù)類(lèi)型、數(shù)據(jù)格式和數(shù)據(jù)的組織方式等。文章所調(diào)查的《科學(xué)數(shù)據(jù)集論文》等五種數(shù)據(jù)期刊均有關(guān)于數(shù)據(jù)計(jì)劃與提交的相關(guān)政策要求。
《科學(xué)數(shù)據(jù)集論文》要求提交電子PDF或Word(DOC、DOCX、RTF)文件,數(shù)據(jù)論文沒(méi)有頁(yè)數(shù)限制。在數(shù)據(jù)論文發(fā)表之前,數(shù)據(jù)應(yīng)該保存在適當(dāng)?shù)臄?shù)據(jù)庫(kù)中,提交作者向稿件的編輯者和審稿人提供登錄信息,編輯者和審稿人可以訪(fǎng)問(wèn)數(shù)據(jù)庫(kù)中的數(shù)據(jù)。數(shù)據(jù)集可以包括一個(gè)或多個(gè)表、圖像或基因序列的組合[9]?!兜厍蛳到y(tǒng)科學(xué)數(shù)據(jù)》于2009 年開(kāi)始出版地球科學(xué)相關(guān)數(shù)據(jù),旨在推動(dòng)地球系統(tǒng)科學(xué)高質(zhì)量科研數(shù)據(jù)的重用。要求提交的數(shù)據(jù)論文包括實(shí)驗(yàn)和觀(guān)測(cè)數(shù)據(jù)的描述等,數(shù)據(jù)論文可先通過(guò)簡(jiǎn)單快速的同行評(píng)審發(fā)表在期刊的論壇上,待稿件正式通過(guò)同行評(píng)審后,則發(fā)表在《地球系統(tǒng)科學(xué)數(shù)據(jù)》期刊上[10]?!兜厍蚩茖W(xué)數(shù)據(jù)》要求作者提交的數(shù)據(jù)論文對(duì)數(shù)據(jù)集進(jìn)行詳細(xì)描述,包括原始數(shù)據(jù)集的收集、處理、以及數(shù)據(jù)集的格式、大小等細(xì)節(jié)信息,如文本和表格的格式推薦使用DOC、DOCX、RTF,動(dòng)畫(huà)和視頻推薦使用GIF、mpeg或AVI格式。在數(shù)據(jù)論文發(fā)表前作者要為數(shù)據(jù)集找到合適的數(shù)據(jù)倉(cāng)儲(chǔ),并獲得DOI[11];《科學(xué)數(shù)據(jù)》期刊中的數(shù)據(jù)主要是指計(jì)算或策劃數(shù)據(jù),以及通過(guò)實(shí)驗(yàn)或觀(guān)察產(chǎn)生的數(shù)據(jù), 論文使用DOC、DOCX、TEX格式,圖片使用PDF、EPS、TIFF、JPG 格式[12];《開(kāi)放健康數(shù)據(jù)》發(fā)表的數(shù)據(jù)類(lèi)型包括:計(jì)算機(jī)模擬數(shù)據(jù)、實(shí)驗(yàn)數(shù)據(jù)、采訪(fǎng)和調(diào)查數(shù)據(jù)、灰色文獻(xiàn)等,圖使用150DPI分辨率(300DPI以上優(yōu)先),文件必須為以下格式:JPG、TIFF、GIF、PNG、EPS(以最大限度地提高質(zhì)量,原始源文件是首選),數(shù)據(jù)格式應(yīng)為ASCII、CSV、Autocad、EPS、JPEG、Excel、SQL等[13]。
2.2 數(shù)據(jù)確認(rèn)階段
科學(xué)數(shù)據(jù)具有數(shù)量大、種類(lèi)多、更為復(fù)雜的特點(diǎn),科學(xué)數(shù)據(jù)確認(rèn)即對(duì)科學(xué)研究最終產(chǎn)生數(shù)據(jù)的完整性和真實(shí)性進(jìn)行復(fù)查核驗(yàn)的過(guò)程[14]。數(shù)據(jù)期刊重視數(shù)據(jù)收集過(guò)程的技術(shù)嚴(yán)謹(jǐn)性、數(shù)據(jù)完整性以及與現(xiàn)有標(biāo)準(zhǔn)的匹配度,數(shù)據(jù)期刊政策通常涉及數(shù)據(jù)確認(rèn)和數(shù)據(jù)驗(yàn)證部分,文章調(diào)查的5種期刊均具有嚴(yán)格的數(shù)據(jù)審查政策。首先,同行評(píng)議是維護(hù)科學(xué)和學(xué)術(shù)研究質(zhì)量和誠(chéng)信的基礎(chǔ)。通過(guò)同行評(píng)審,確保數(shù)據(jù)集和數(shù)據(jù)論文的一致性、數(shù)據(jù)質(zhì)量、數(shù)據(jù)使用價(jià)值和數(shù)據(jù)重用價(jià)值等(同行評(píng)議標(biāo)準(zhǔn)相關(guān)政策見(jiàn)表2)。
其次,數(shù)據(jù)期刊為了確保數(shù)據(jù)質(zhì)量,還采用了反剽竊和預(yù)防偽造數(shù)據(jù)的相應(yīng)措施?!犊茖W(xué)數(shù)據(jù)集論文》使用iThenticate軟件來(lái)檢測(cè)提交的手稿中重疊和類(lèi)似文本的實(shí)例,被發(fā)現(xiàn)是從其他作者手稿中剽竊的手稿,無(wú)論是出版的還是未出版的,都將遭受剽竊制裁,提交的手稿,發(fā)現(xiàn)制造或偽造的實(shí)驗(yàn)結(jié)果,將招致數(shù)據(jù)偽造制裁?!堕_(kāi)放健康數(shù)據(jù)》期刊使用反剽竊軟件(CrossCheck)來(lái)確保學(xué)術(shù)誠(chéng)信,所有文章都由CrossRef的CrossCheck系統(tǒng)自動(dòng)篩選,系統(tǒng)將傳入的文章與大量學(xué)術(shù)內(nèi)容數(shù)據(jù)庫(kù)進(jìn)行比較,并向編輯提醒任何可能出現(xiàn)的數(shù)據(jù)質(zhì)量問(wèn)題[19]。
2.3 數(shù)據(jù)描述階段
在數(shù)據(jù)描述階段數(shù)據(jù)期刊的政策主要是關(guān)于描述數(shù)據(jù)集的數(shù)據(jù)論文結(jié)構(gòu)等方面的政策。數(shù)據(jù)期刊要求數(shù)據(jù)論文的描述結(jié)構(gòu)通常包括標(biāo)題、作者、摘要、方法標(biāo)識(shí)符、技術(shù)驗(yàn)證、日期、主題、資助機(jī)構(gòu)、語(yǔ)言、存儲(chǔ)位置、參考文獻(xiàn)等內(nèi)容(見(jiàn)表3)。其中,《開(kāi)放健康數(shù)據(jù)》期刊對(duì)數(shù)據(jù)論文的長(zhǎng)度有限制,要求科研人員提交的數(shù)據(jù)論文要短,《科學(xué)數(shù)據(jù)集論文》《地球科學(xué)數(shù)據(jù)》《地球系統(tǒng)科學(xué)數(shù)據(jù)》《科學(xué)數(shù)據(jù)》四種數(shù)據(jù)期刊對(duì)數(shù)據(jù)論文的長(zhǎng)度沒(méi)有限制,但《科學(xué)數(shù)據(jù)》對(duì)描述數(shù)據(jù)集的論文標(biāo)題和摘要長(zhǎng)度有要求,標(biāo)題包括空格在內(nèi)不得超過(guò)110字符,摘要不超過(guò)170字符。endprint
科研人員應(yīng)詳細(xì)說(shuō)明在數(shù)據(jù)集論文中描述的實(shí)驗(yàn)、觀(guān)察中使用的方法和材料,應(yīng)盡可能詳細(xì)地介紹其方法,包括如何確保精確的測(cè)量,以及所使用的任何設(shè)備的具體名稱(chēng)和型號(hào)。在數(shù)據(jù)集的描述過(guò)程中,科研人員應(yīng)提供包含在其數(shù)據(jù)集中的每個(gè)表、圖像的詳細(xì)描述,并為表中每列數(shù)據(jù)提供清晰的標(biāo)簽和描述(在每一列的描述中,應(yīng)當(dāng)提供與該列有關(guān)的測(cè)量單位,只要這樣的單位存在,并且在沒(méi)有測(cè)量單位的情況下,應(yīng)該明確地聲明沒(méi)有任何單位)??蒲腥藛T應(yīng)盡可能提供關(guān)于其提交數(shù)據(jù)的元數(shù)據(jù),如果提交的數(shù)據(jù)集或其任何組件已存儲(chǔ)在公開(kāi)可用的數(shù)據(jù)庫(kù)中,應(yīng)提供訪(fǎng)問(wèn)該數(shù)據(jù)所需的所有信息,并確保論文中每個(gè)參考文獻(xiàn)中的信息是完整和準(zhǔn)確的,所描述的數(shù)據(jù)集是可發(fā)現(xiàn)和可引用的。
2.4 數(shù)據(jù)保存階段
科研數(shù)據(jù)保存政策是科研數(shù)據(jù)共享和利用的前提和基礎(chǔ),切實(shí)可行的科研數(shù)據(jù)保存政策能夠?qū)崿F(xiàn)對(duì)科研數(shù)據(jù)的有效管理[20-21]。2015年,歐盟提出了“地平線(xiàn)2020”(Horizon 2020)研究與創(chuàng)新計(jì)劃,以支持將發(fā)表后的研究成果存放到開(kāi)放知識(shí)庫(kù)中長(zhǎng)期保存[22]。
數(shù)據(jù)期刊均要求科研人員在數(shù)據(jù)論文發(fā)表前,將其描述的數(shù)據(jù)集存放到合適的數(shù)據(jù)知識(shí)庫(kù)中保存,如《科學(xué)數(shù)據(jù)集論文》要求作者將數(shù)據(jù)集存放到Portico數(shù)據(jù)庫(kù);《地球系統(tǒng)科學(xué)數(shù)據(jù)》要求作者將數(shù)據(jù)集存放到BODC、CDIAC等數(shù)據(jù)庫(kù);《地球科學(xué)數(shù)據(jù)》推薦的數(shù)據(jù)知識(shí)庫(kù)包括Figshare、PANGAEA、Zenodo等;《科學(xué)數(shù)據(jù)》期刊要求作者承諾在至少五年內(nèi),將數(shù)據(jù)集存在其實(shí)驗(yàn)室或機(jī)構(gòu)的服務(wù)器上,推薦存儲(chǔ)的數(shù)據(jù)知識(shí)庫(kù)包括DNA DataBank of Japan (DDBJ)、GenBank、ArrayExpress等[23];《開(kāi)放健康數(shù)據(jù)》期刊推薦作者存儲(chǔ)的數(shù)據(jù)知識(shí)庫(kù)有特定學(xué)科的數(shù)據(jù)知識(shí)庫(kù)(Dryad、UKDA、Physionet)、普通的數(shù)據(jù)知識(shí)庫(kù)(Open Health Data Dataverse、Figshare、SND、Zenodo)和機(jī)構(gòu)知識(shí)庫(kù)(UCL Discovery、eResearch South、Austrlia)。為了確保所有出版物的永久性,期刊還利用CLOCKSS和LOCKSS歸檔系統(tǒng)創(chuàng)建永久性存檔用于保存和恢復(fù),期刊內(nèi)容定期存檔到世界領(lǐng)先的研究圖書(shū)館。
科研數(shù)據(jù)集的長(zhǎng)期保存是為了促進(jìn)數(shù)據(jù)集的可發(fā)現(xiàn)性和可利用性,許可協(xié)議是作者將數(shù)據(jù)集存儲(chǔ)在數(shù)據(jù)知識(shí)庫(kù)時(shí),為了保留著作權(quán)釋放其他一些權(quán)利的機(jī)制。存儲(chǔ)在不同的數(shù)據(jù)知識(shí)庫(kù)的數(shù)據(jù)集使用不同的許可協(xié)議,如Physionet數(shù)據(jù)知識(shí)庫(kù)使用GPL(GNU General Public License)許可協(xié)議,Open Health Data Dataverse、Dryad、Figshare、SND許可協(xié)議使用的是CC0,UKDA、Zenodo使用CC0、開(kāi)放數(shù)據(jù)共用許可協(xié)議(Open Data Commons License)、開(kāi)放政府許可協(xié)議(Open Government License),數(shù)據(jù)期刊不建議對(duì)數(shù)據(jù)使用施加商業(yè)或其他限制的許可,許可協(xié)議使用的限制越少,數(shù)據(jù)開(kāi)放的程度越高,數(shù)據(jù)產(chǎn)生的科學(xué)影響可能就越大。
《科學(xué)數(shù)據(jù)集論文》期刊的論文作者保留其作品的版權(quán),根據(jù)知識(shí)共享署名許可(CC-BY)發(fā)布,允許在任何媒體中不受限制地使用、分發(fā)和復(fù)制文章,前提是文章被正確引用,數(shù)據(jù)采用CC0許可協(xié)議[28];《地球系統(tǒng)科學(xué)數(shù)據(jù)》期刊使用CC-BY 3.0版本[29];《地球科學(xué)數(shù)據(jù)》和《科學(xué)數(shù)據(jù)》期刊的數(shù)據(jù)論文使用CC-BY許可協(xié)議;《開(kāi)放健康數(shù)據(jù)》數(shù)據(jù)論文使用CC-BY許可協(xié)議,并且強(qiáng)烈地推薦CC0作為開(kāi)放研究數(shù)據(jù)的許可協(xié)議[30]。
2.5 數(shù)據(jù)整合與使用階段
在數(shù)據(jù)整合和使用階段,數(shù)據(jù)期刊特別強(qiáng)調(diào)關(guān)于數(shù)據(jù)引用的相關(guān)政策,支持?jǐn)?shù)據(jù)引用,認(rèn)為科學(xué)數(shù)據(jù)引用和引用論文等學(xué)術(shù)引用一樣重要,數(shù)據(jù)引用可以促進(jìn)對(duì)數(shù)據(jù)做出貢獻(xiàn)的任何作者的學(xué)術(shù)獎(jiǎng)勵(lì)。數(shù)據(jù)引用應(yīng)該包含一個(gè)統(tǒng)一標(biāo)識(shí)符,且這種標(biāo)識(shí)符是機(jī)器可讀的、全球唯一的、能被科學(xué)界廣泛使用的,數(shù)據(jù)引用可以促進(jìn)對(duì)某一數(shù)據(jù)的識(shí)別、訪(fǎng)問(wèn)和驗(yàn)證,關(guān)于元數(shù)據(jù)的引用還應(yīng)該包含出處、數(shù)據(jù)的版本(或者是更新后的和初始數(shù)據(jù)相同的部分?jǐn)?shù)據(jù))的信息,以便可以跟蹤并驗(yàn)證數(shù)據(jù)[31]。
科學(xué)數(shù)據(jù)引用機(jī)制,可有效解決數(shù)據(jù)開(kāi)放共享過(guò)程中的權(quán)益問(wèn)題,也是對(duì)科研人員和數(shù)據(jù)工作者的一種有效激勵(lì)機(jī)制。調(diào)查發(fā)現(xiàn),數(shù)據(jù)期刊較多采用國(guó)際數(shù)據(jù)引用標(biāo)準(zhǔn),如《地球系統(tǒng)科學(xué)數(shù)據(jù)》和《科學(xué)數(shù)據(jù)》兩本期刊采用Force11引用原則,數(shù)據(jù)引用的元素包括創(chuàng)建者、出版年、數(shù)據(jù)知識(shí)庫(kù)名稱(chēng)、版本、持久標(biāo)識(shí)符;《地球科學(xué)數(shù)據(jù)》期刊推薦科研人員使用DataCite引用標(biāo)準(zhǔn),其引用元素包括創(chuàng)建者、 出版年、數(shù)據(jù)集名稱(chēng)、出版商、持久標(biāo)識(shí)符;《開(kāi)放健康數(shù)據(jù)》支持通用的哈佛引用格式。
3 國(guó)外數(shù)據(jù)期刊政策對(duì)我國(guó)的啟示
3.1 制定基于科研數(shù)據(jù)生命周期的數(shù)據(jù)期刊政策
國(guó)際上已有的數(shù)據(jù)期刊均制定了詳細(xì)的基于科研數(shù)據(jù)生命周期的數(shù)據(jù)政策,涉及科研數(shù)據(jù)生命周期的多個(gè)階段(數(shù)據(jù)計(jì)劃、數(shù)據(jù)確認(rèn)、數(shù)據(jù)描述、數(shù)據(jù)保存、數(shù)據(jù)引用),旨在推動(dòng)科學(xué)數(shù)據(jù)的開(kāi)放、交流和引用,推進(jìn)科學(xué)數(shù)據(jù)的長(zhǎng)期保存和數(shù)據(jù)資產(chǎn)管理,探索科學(xué)數(shù)據(jù)的有效評(píng)價(jià)機(jī)制,推動(dòng)數(shù)據(jù)科學(xué)的發(fā)展。在我國(guó),數(shù)據(jù)期刊的創(chuàng)建與經(jīng)營(yíng)尚處于起步和探索階段。2014年,中國(guó)科學(xué)院發(fā)行《地理學(xué)報(bào)增刊》,這是我國(guó)第一本數(shù)據(jù)期刊,配合《全球變化科學(xué)研究數(shù)據(jù)注冊(cè)與出版系統(tǒng)》運(yùn)行[35]。2016年,中國(guó)科學(xué)院和ICSU CODATA 中國(guó)全國(guó)委員會(huì)合辦的數(shù)據(jù)期刊《中國(guó)科學(xué)數(shù)據(jù)》(China Scientific Data)正式在線(xiàn)出版[36],該刊是我國(guó)目前唯一的專(zhuān)門(mén)面向多學(xué)科領(lǐng)域科學(xué)數(shù)據(jù)出版的學(xué)術(shù)期刊。我國(guó)數(shù)據(jù)期刊的發(fā)展尚不成熟,數(shù)據(jù)期刊政策是數(shù)據(jù)期刊出版實(shí)踐的重要要素,因此,我國(guó)在制定數(shù)據(jù)期刊政策時(shí),可參考國(guó)際上發(fā)展較好的數(shù)據(jù)期刊的做法,制定詳細(xì)的基于科研數(shù)據(jù)生命周期的數(shù)據(jù)政策,從而推動(dòng)數(shù)據(jù)科學(xué)和數(shù)據(jù)出版的發(fā)展進(jìn)程。endprint
3.2 與科研數(shù)據(jù)知識(shí)庫(kù)和圖書(shū)館開(kāi)展合作
科研人員在發(fā)表數(shù)據(jù)論文前,將數(shù)據(jù)集存儲(chǔ)在數(shù)據(jù)知識(shí)庫(kù)中并獲得一個(gè)DOI是數(shù)據(jù)期刊出版的首要流程(見(jiàn)圖1),同時(shí),公開(kāi)可用的科學(xué)數(shù)據(jù)分布在眾多不同的存儲(chǔ)庫(kù)中,因而用戶(hù)很難找到相關(guān)的數(shù)據(jù)集,將數(shù)據(jù)由第三方數(shù)據(jù)倉(cāng)儲(chǔ)進(jìn)行管理可實(shí)現(xiàn)數(shù)據(jù)集和數(shù)據(jù)論文的鏈接,極大程度地增加數(shù)據(jù)集的可發(fā)現(xiàn)性。國(guó)外數(shù)據(jù)期刊與科研數(shù)據(jù)知識(shí)庫(kù)開(kāi)展廣泛的合作,將數(shù)據(jù)期刊中描述的數(shù)據(jù)存儲(chǔ)在數(shù)據(jù)倉(cāng)儲(chǔ)或數(shù)據(jù)中心,如DAACs、Dryad、PANGAEA、Figshare、SND、Zenodo等。但是,數(shù)據(jù)知識(shí)庫(kù)需要滿(mǎn)足一定的標(biāo)準(zhǔn),如可以確保數(shù)據(jù)集的長(zhǎng)期保存,為提交的數(shù)據(jù)集提供機(jī)密審查,為提交的數(shù)據(jù)集提供穩(wěn)定的標(biāo)識(shí)符, 允許公眾對(duì)數(shù)據(jù)的訪(fǎng)問(wèn)不受不必要的限制[23]。我國(guó)數(shù)據(jù)期刊應(yīng)選取發(fā)展較好的、穩(wěn)定的數(shù)據(jù)知識(shí)庫(kù)開(kāi)展合作,如Science Data Bank等,在論文出版前將數(shù)據(jù)集存儲(chǔ)到相應(yīng)的數(shù)據(jù)知識(shí)庫(kù)中,并獲得一個(gè)DOI,還可以像《開(kāi)放科學(xué)數(shù)據(jù)》期刊一樣,將數(shù)據(jù)論文定期存放在圖書(shū)館中,以確??蒲袛?shù)據(jù)的長(zhǎng)期保存。
3.3 注重保護(hù)作者權(quán)益
數(shù)據(jù)期刊均十分注重保護(hù)作者權(quán)益,鼓勵(lì)甚至強(qiáng)制規(guī)定作者采用CC-BY許可協(xié)議,但是不建議對(duì)數(shù)據(jù)使用施加商業(yè)或其他限制的許可協(xié)議類(lèi)型。對(duì)于開(kāi)放獲取的數(shù)據(jù)論文,作者通常保留版權(quán),授權(quán)出版商出版論文,授權(quán)第三方在注明原作者的條件下使用論文。對(duì)于數(shù)據(jù)集,期刊通常要求所發(fā)表論文中描述的數(shù)據(jù)集在非商業(yè)使用的情況下提供免費(fèi)獲取,包括評(píng)審階段和被錄用以后,但要求用戶(hù)必須對(duì)所用的科學(xué)數(shù)據(jù)進(jìn)行數(shù)據(jù)引用,以獎(jiǎng)勵(lì)作者的貢獻(xiàn),保護(hù)數(shù)據(jù)集作者的權(quán)益?!犊茖W(xué)數(shù)據(jù)集論文》等期刊推薦使用CC0許可協(xié)議開(kāi)放數(shù)據(jù)集[37]。我國(guó)的《中國(guó)科學(xué)數(shù)據(jù)》期刊建議作者對(duì)其數(shù)據(jù)集使用CC-BY 4.0版本,CC-BY較CC0許可協(xié)議其開(kāi)放程度較低、適用范圍較窄(CC-BY許可協(xié)議不適用于軟件等對(duì)象的描述),可能會(huì)在一定程度上限制科學(xué)數(shù)據(jù)的開(kāi)放共享和利用。
3.4 鼓勵(lì)數(shù)據(jù)引用采用國(guó)際標(biāo)準(zhǔn)格式
促進(jìn)數(shù)據(jù)引用是數(shù)據(jù)期刊創(chuàng)建和出版的重要目標(biāo)之一,國(guó)際數(shù)據(jù)期刊十分鼓勵(lì)科研人員的數(shù)據(jù)引用行為。科學(xué)數(shù)據(jù)引用有利于促進(jìn)科學(xué)數(shù)據(jù)開(kāi)放共享,研究人員愿意共享科研數(shù)據(jù);促進(jìn)科學(xué)數(shù)據(jù)的發(fā)現(xiàn)、重復(fù)利用和溯源,減少數(shù)據(jù)偽造、數(shù)據(jù)造假和數(shù)據(jù)剽竊行為,凈化學(xué)術(shù)風(fēng)氣??茖W(xué)數(shù)據(jù)引用和學(xué)術(shù)論文引用同等重要,是研究人員科研成果的重要組成部分,科學(xué)數(shù)據(jù)引用應(yīng)該被納入科研評(píng)價(jià)體系中,對(duì)研究人員的數(shù)據(jù)貢獻(xiàn)給予相應(yīng)的獎(jiǎng)勵(lì)。數(shù)據(jù)期刊應(yīng)對(duì)科研人員引用其出版的數(shù)據(jù)論文和數(shù)據(jù)集提供詳細(xì)的指導(dǎo)和要求,大多數(shù)數(shù)據(jù)期刊使用國(guó)際組織有關(guān)科學(xué)數(shù)據(jù)引用的標(biāo)準(zhǔn)和格式,如DataCite引用標(biāo)準(zhǔn)、Force11引用標(biāo)準(zhǔn)、哈佛引用格式,我國(guó)目前尚未制定關(guān)于科學(xué)數(shù)據(jù)引用統(tǒng)一的標(biāo)準(zhǔn)規(guī)范,建議我國(guó)數(shù)據(jù)期刊采用國(guó)際組織機(jī)構(gòu)的引用標(biāo)準(zhǔn)。
參考文獻(xiàn):
[1] Science as an Open Enterprise [EB/OL].[2016-12-02].https://royalsociety.org/~/media/royal_society_content/policy/project
s/sape/2012-06-20-saoe.pdf.
[2] 劉鳳紅,崔金鐘,韓芳橋,等.數(shù)據(jù)論文:大數(shù)據(jù)時(shí)代新興學(xué)術(shù)論文出版類(lèi)型探討[J].中國(guó)科技期刊研究,2014,25(12):1451-1456.
[3] Candela L,Castelli D,Manghi P,et al.Data journals:A survey[J].Journal of the Association for Information Science and Technology,2015,66(9):1747-1762.
[4] 劉晶晶,顧立平.數(shù)據(jù)期刊的政策調(diào)研與分析——以Scientific Data為例[J].中國(guó)科技期刊研究,2015,26(4):331-339.
[5] 歐陽(yáng)崢崢,青秀玲,顧立平,等.國(guó)際數(shù)據(jù)期刊出版的案例分析及其特征[J].中國(guó)科技期刊研究,2015,26(5):437-444.
[6] 雷秋雨,馬建玲.數(shù)據(jù)期刊的出版模式與發(fā)展研究[J].圖書(shū)與情報(bào),2015(1):112-116.
[7] DataONE[EB/OL].[2016-12-03].http://www.dataone.org/.
[8] 師榮華,劉細(xì)文,ShiRonghua,等.基于數(shù)據(jù)生命周期的圖書(shū)館科學(xué)數(shù)據(jù)服務(wù)研究[J].圖書(shū)情報(bào)工作,2011,55(1):39-42.
[9] Dataset Papers in Science [EB/OL].[2016-12-06].http://www.hindawi.com/journals/dpis/.
[10] Earth System Science Data[EB/OL].[2016-12-08].http://www.earth-system-science-data.net/.
[11] Geoscience Data Journal[EB/OL].[2016-12-08].http://onlinelibrary.wiley.com/journal/10.1002/(ISSN)2049-6060.
[12] Scientific Data[EB/OL].[2016-12-09].http://www.nature.com/sdata/data-policies.
[13] Open Health Data[EB/OL].[2016-12-09].http://openhealthdata.metajnl.com/about/.endprint
[14] 黃如花,李楠.高校圖書(shū)館參與科學(xué)數(shù)據(jù)驗(yàn)證的前景分析[J].圖書(shū)情報(bào)工作,2016,60(3):15-20.
[15] Interactive Public Peer Review[EB/OL].[2016-12-08].http://www.earth-system-science-data.net/peer_review/interactive_
review_process.html.
[16] Guidelines for Reviewers[EB/OL].[2016-12-08].http://onlinelibrary.wiley.com/journal/10.1002/(ISSN)2049-6060/homepage/guidelines_for_reviewers.htm.
[17] For Referees[EB/OL].[2016-12-11].http://www.nature.com/sdata/policies/for-referees.
[18] Editorial Policies[EB/OL].[2016-12-12].http://openhealthdata.metajnl.com/about/editorialpolicies/.
[19] Research Integrity[EB/OL].[2016-12-12].http://datascience.codata.org/about/research-integrity/.
[20] 王瓊,曹冉.英國(guó)高??蒲袛?shù)據(jù)保存政策調(diào)查與分析[J].中國(guó)圖書(shū)館學(xué)報(bào),2016,42(5):102-115.
[21] 司莉,辛娟娟.英美高校科學(xué)數(shù)據(jù)管理與共享政策的調(diào)查分析[J].圖書(shū)館論壇,2014(9):80-85.
[22] Horizon 2020[EB/OL].[2016-12-07].http://ec.europa.eu/programmes/horizon2020/.
[23] 田稷,陳琿夏.數(shù)據(jù)期刊及數(shù)據(jù)論文定量分析與思考[J].圖書(shū)館論壇,2016,36(3):42-48.
[24] Author Guidelines[EB/OL].[2016-12-08].https://www.hindawi.com/journals/dpis/guidelines/.
[25] Publication policy[EB/OL].[2016-12-10].http://www.earth-system-science-data.net/about/publication_policy.html.
[26] Recommended Data Repositories[EB/OL].[2016-12-10].http://www.nature.com/sdata/policies/repositories.
[27] Recommended Repositories[EB/OL].[2016-12-09].http://openhealthdata.metajnl.com/about/.
[28] Article Processing Charges[EB/OL].[2016-12-09].https://www.hindawi.com/journals/dpis/apc/.
[29] Licence and copyright agreement[EB/OL].[2016-12-13].http://www.earth-system-science-data.net/about/licence_and_copyright.html.
[30] Copyright Notice[EB/OL].[2016-12-13].http://openhealthdata.metajnl.com/about/submissions/.
[31] 黃如花,李楠.國(guó)外科學(xué)數(shù)據(jù)引用規(guī)范調(diào)查分析與啟示[J].圖書(shū)館學(xué)研究,2016(10):2-9.
[32] Data policy[EB/OL].[2016-12-14].http://www.earth-system-science-data.net/about/data_policy.html.
[33] Author Guidelines[EB/OL].[2016-12-14].http://onlinelibrary.wiley.com/journal/10.1002/(ISSN)2049-6060/homepage/For
Authors.html#dataset_reference.
[34] Data policy[EB/OL].[2016-12-13].http://www.nature.com/sdata/policies/data-policies.
[35] 全球變化科學(xué)研究數(shù)據(jù)出版系統(tǒng)[EB/OL].[2016-12-12].http://www.geodoi.ac.cn/WebCn/Default.aspx.
[36] 《中國(guó)科學(xué)數(shù)據(jù)(中英文網(wǎng)絡(luò)版)》[EB/OL].[2016-12-12].http://www.csdata.org/p/.
[37] 伏安娜,張計(jì)龍,殷沈琴.數(shù)據(jù)論文國(guó)內(nèi)外發(fā)展研究綜述[J].圖書(shū)情報(bào)工作,2015,59(24):131-138.
作者簡(jiǎn)介:黃如花(1968-), 女,武漢大學(xué)信息資源研究中心、武漢大學(xué)信息管理學(xué)院教授,博士生導(dǎo)師,研究方向:信息組織、信息檢索與服務(wù)、政府?dāng)?shù)據(jù)開(kāi)放;李楠(1992-), 女,武漢大學(xué)信息管理學(xué)院碩士研究生。endprint