陳全平(1.南開大學(xué)商學(xué)院信息資源管理系 天津 300071)(2.東莞松山湖圖書館 廣東東莞 523800)
學(xué)術(shù)期刊數(shù)據(jù)政策及相關(guān)研究
陳全平
(1.南開大學(xué)商學(xué)院信息資源管理系 天津 300071)
(2.東莞松山湖圖書館 廣東東莞 523800)
在數(shù)據(jù)密集型科學(xué)研究范式下,數(shù)據(jù)開放獲取變得日益重要。學(xué)術(shù)期刊是學(xué)術(shù)交流的重要載體之一,其數(shù)據(jù)政策直接影響科學(xué)研究的可重現(xiàn)性。文章分析了當(dāng)前學(xué)術(shù)期刊制定實(shí)施的主體、客體與主要內(nèi)容,并分別從傳統(tǒng)期刊、新興數(shù)據(jù)期刊進(jìn)行了說明,分析了期刊數(shù)據(jù)政策實(shí)施的效果情況,以期為我國期刊制定數(shù)據(jù)政策提供參考。
學(xué)術(shù)期刊;數(shù)據(jù)政策;數(shù)據(jù)期刊;數(shù)據(jù)論文;數(shù)據(jù)出版
2007年,計(jì)算機(jī)圖靈獎(jiǎng)得主Jim Gtay提出了以協(xié)同化、網(wǎng)絡(luò)化與數(shù)據(jù)驅(qū)動(dòng)為其主要特征的科學(xué)研究第四范式——數(shù)據(jù)密集型科學(xué)研究,此后,學(xué)術(shù)界對數(shù)據(jù)開放共享的需求日益強(qiáng)烈,全球范圍內(nèi)廣泛興起開放數(shù)據(jù)運(yùn)動(dòng),以增加數(shù)據(jù)資源的可獲得性與可用性。在這種背景下,科學(xué)研究過程當(dāng)中的科研資助機(jī)構(gòu)、出版商與期刊、數(shù)據(jù)中心等各個(gè)利益相關(guān)者都制定了相關(guān)政策來保障和促進(jìn)數(shù)據(jù)共享。例如在國際組織與機(jī)構(gòu)方面,經(jīng)濟(jì)合作與發(fā)展組織(OECD)2007年頒布的 《公共資助科學(xué)數(shù)據(jù)開放獲取的原則和指南》提出開放數(shù)據(jù)的13條原則和指導(dǎo)方針;在科研資助機(jī)構(gòu)方面,美國國家科學(xué)基金會(huì)(NSF)于2010年1月發(fā)布的項(xiàng)目管理指南規(guī)定:從2011年1月18日開始,所有提交到NSF的項(xiàng)目申請書必須包含一份不超過兩頁的“數(shù)據(jù)管理計(jì)劃”附件,該計(jì)劃應(yīng)詳細(xì)描述申請者如何管理和傳播研究項(xiàng)目所產(chǎn)生的數(shù)據(jù),包括數(shù)據(jù)類型、數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)獲取與共享政策、數(shù)據(jù)存檔與保存計(jì)劃;在數(shù)據(jù)倉儲(chǔ)與數(shù)據(jù)中心方面,Dtyad對數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)利用、數(shù)據(jù)引用、數(shù)據(jù)發(fā)現(xiàn)等都有具體的規(guī)定;在學(xué)術(shù)期刊方面,期刊PLoS One自2008年就有了數(shù)據(jù)共享的政策:要求支撐論文發(fā)表的數(shù)據(jù)應(yīng)該存儲(chǔ)在一個(gè)開放獲取的機(jī)構(gòu)倉儲(chǔ)中,作為已發(fā)表論文的支持文件,在線出版的開放獲取數(shù)據(jù)期刊Scientific Data制定了數(shù)據(jù)提交規(guī)范、質(zhì)量規(guī)范和相關(guān)權(quán)益規(guī)范等方面的政策。
學(xué)術(shù)期刊作為支持學(xué)術(shù)交流的重要載體,其數(shù)據(jù)政策對于促進(jìn)數(shù)據(jù)共享、推進(jìn)數(shù)據(jù)最大化使用、實(shí)現(xiàn)科研過程的可重現(xiàn)有非常重要的作用,本文對Web of Science、ScienceDitect、Wiley Online Libtaty、Google Scholatt和中國知網(wǎng)、萬方數(shù)據(jù)平臺(tái)、維普期刊網(wǎng)等中外文資源中的有關(guān)學(xué)術(shù)期刊數(shù)據(jù)政策方面的研究論文、學(xué)術(shù)報(bào)告和網(wǎng)絡(luò)文章進(jìn)行了系統(tǒng)檢索、梳理、分析、歸納和總結(jié),從學(xué)術(shù)期刊的數(shù)據(jù)政策制定與實(shí)施、數(shù)據(jù)政策模板、數(shù)據(jù)政策實(shí)施效果以及對我國學(xué)術(shù)期刊政策制定的啟示等方面進(jìn)行了研究與分析。
2.1 學(xué)術(shù)期刊數(shù)據(jù)政策的主體、客體與內(nèi)容
2.1.1 數(shù)據(jù)政策制定的主體
當(dāng)前,主要的國際科學(xué)技術(shù)與工程以及醫(yī)學(xué)領(lǐng)域的學(xué)術(shù)期刊都已經(jīng)制定了與數(shù)據(jù)開放、數(shù)據(jù)共享和數(shù)據(jù)利用相關(guān)的政策,王卷樂等指出當(dāng)前國際上要求提交數(shù)據(jù)的期刊包括The Ametican Natutalist、Biological Joutnal of the Linnean Society、BMJ (Btitish Medical Joutnal)、Genetics、Joutnal of Fish and WildlifeManagement、PLOS、Science、Systematic Biology、ZooKeys等基本覆蓋了科學(xué)研究的各個(gè)領(lǐng)域。實(shí)際上,絕大多數(shù)的STM期刊都要求作者提交數(shù)據(jù),特別是一些權(quán)威期刊將數(shù)據(jù)開放與共享作為論文發(fā)表的前提,例如:The Lancet要求實(shí)證研究的作者在發(fā)表論文時(shí),作為出版的條件,必須提交數(shù)據(jù)、協(xié)議、計(jì)算機(jī)代碼、相關(guān)文件的電子副本到該期刊論文發(fā)表的在線數(shù)據(jù)歸檔中心;2005年,the Ametican Economic Review發(fā)布強(qiáng)制性政策,要求作者提交相關(guān)數(shù)據(jù)以提升研究結(jié)果的準(zhǔn)確性;Natute 和Science也有要求作者將使用的數(shù)據(jù)和代碼公開的政策要求。一些經(jīng)濟(jì)學(xué)、社會(huì)學(xué)領(lǐng)域的期刊也有類似的政策,學(xué)者Zenk-M·ltgen和Lepthien并就社會(huì)學(xué)領(lǐng)域期刊制定數(shù)據(jù)政策的情況進(jìn)行了分析。
2.1.2 數(shù)據(jù)政策制定的客體
數(shù)據(jù)指“定性或定量的陳述或數(shù)字(或假定為)事實(shí)。數(shù)據(jù)可能是原始數(shù)據(jù)(例如,直接從測量得到的數(shù)據(jù)),或衍生的原始數(shù)據(jù),但他們尚未分析或解釋,只是進(jìn)行了計(jì)算”。
在期刊制定數(shù)據(jù)政策的客體范圍方面,數(shù)據(jù)共享政策范圍不僅包括軟件、視頻、地理地質(zhì)圖、本體、Web內(nèi)容、數(shù)據(jù)模型以及文章研究結(jié)果背后的補(bǔ)充材料,在一些特定科學(xué)領(lǐng)域,還包括特定的研究材料,例如分子晶體結(jié)構(gòu)文件、細(xì)胞、動(dòng)物模型、DNA工具、試劑等。
在期刊制定數(shù)據(jù)政策針對的數(shù)據(jù)類型方面,學(xué)術(shù)期刊的數(shù)據(jù)政策主要針對三類數(shù)據(jù):integtal數(shù)據(jù),這類數(shù)據(jù)直接支持本文的觀點(diǎn)和結(jié)論; supplementaty材料,這類數(shù)據(jù)增強(qiáng)文章的論點(diǎn); Related Content相關(guān)內(nèi)容,這是單獨(dú)的內(nèi)容,作者可能希望將論文與它們聯(lián)系起來,但這些數(shù)據(jù)不由期刊管理。
2.1.3 數(shù)據(jù)政策的內(nèi)容
目前國際權(quán)威出版商&學(xué)術(shù)期刊大多制定了數(shù)據(jù)政策,其政策內(nèi)容主要包括:
(1)要求數(shù)據(jù)開放共享。例如2010年,Evolution期刊要求在進(jìn)化和生態(tài)學(xué)期刊上發(fā)表文章中使用的數(shù)據(jù)存放在可公開訪問的數(shù)字檔案中心,從2011年1月1日開始所有發(fā)表的論文都開始執(zhí)行這一規(guī)定。BioMed Centtal出版社目前出版200多種期刊,其數(shù)據(jù)政策要求:所有研究文章都可以免費(fèi)訪問、重復(fù)使用和再次傳播;在研究中與研究結(jié)果直接相關(guān)的數(shù)據(jù)必須開放共享。
(2)對數(shù)據(jù)提交方式、內(nèi)容、范圍、時(shí)間點(diǎn)的規(guī)定。例如BMJ自2009年以來就鼓勵(lì)作者共享他們的數(shù)據(jù),并要求在BMJ上發(fā)表論文必須將數(shù)據(jù)集發(fā)布在Dtyad(http://datadtyad.otg)資料庫。BMJ期刊現(xiàn)在又要求作者簽署數(shù)據(jù)共享聲明,解釋他們論文中的數(shù)據(jù)可以向誰,以怎樣的方式共享。范圍包括附件材料和完整的數(shù)據(jù)集。共享包括在得到請求時(shí)進(jìn)行共享、在線通過密碼進(jìn)行共享或者公布在網(wǎng)站上進(jìn)行共享。從2013年1月1日開始,藥物和醫(yī)療設(shè)備試驗(yàn)數(shù)據(jù)將被視為出版物,作者須承諾在合理要求情況下,這些匿名病人的數(shù)據(jù)是可用的,這一政策適用于在報(bào)道目前使用的一種或多種藥物或醫(yī)療器械研制進(jìn)展時(shí)使用的數(shù)據(jù),而不管這個(gè)試驗(yàn)是否由誰資助。Natute集團(tuán)更是將數(shù)據(jù)提交作為出版的條件之一,要求作者必須提交研究中相應(yīng)的數(shù)據(jù),并且要經(jīng)過編輯審查和同行評議。
(3)數(shù)據(jù)期刊政策的變化。許多期刊不堪忍受維護(hù)數(shù)據(jù)的成本和負(fù)擔(dān),轉(zhuǎn)而要求將數(shù)據(jù)提交給相應(yīng)的公共數(shù)據(jù)倉儲(chǔ)和領(lǐng)域數(shù)據(jù)倉儲(chǔ),例如:神經(jīng)科學(xué)雜志Neutoscience最初要求作者將相關(guān)數(shù)據(jù)直接提交給編輯部,而在2010年秋天宣布將停止保存和同行評審論文的補(bǔ)充材料,不再要求作者提交新的手稿時(shí)提交任何額外的材料;實(shí)驗(yàn)醫(yī)學(xué)雜志The Joutnal of Expetimental Medicine(JEM)由于補(bǔ)充材料數(shù)量增長,從2011年起只接受“必要”的補(bǔ)充表格和數(shù)字。
2.2 傳統(tǒng)學(xué)術(shù)期刊的數(shù)據(jù)政策
2.2.1 數(shù)據(jù)政策的實(shí)施
(1)科技期刊數(shù)據(jù)政策制定與實(shí)施情況:早在20世紀(jì)90年代中期,McCain在調(diào)查了850種期刊后發(fā)現(xiàn)只有132種有相關(guān)的數(shù)據(jù)政策。Shtiget等在2006年對醫(yī)學(xué)領(lǐng)域期刊的調(diào)查發(fā)現(xiàn)期刊很少有數(shù)據(jù)共享實(shí)施指南。Stodden分析了ISI數(shù)據(jù)庫中Statistics &Ptobability、Multidisciplinaty Science、Mathematical &Computational Biology領(lǐng)域以及Natute Genetics、Cell、Lancet、Natute Physics、Matetials Science and Engineeting Repotts等共計(jì)170種科技期刊在2011 年6月到2012年6月的數(shù)據(jù)政策 (數(shù)據(jù)共享政策、代碼共享政策、附件材料政策)等。Stutges等于2014年對400多種期刊的數(shù)據(jù)政策情況進(jìn)行了調(diào)研,包括什么方式、什么時(shí)間、向哪里提交數(shù)據(jù)、數(shù)據(jù)的可獲得性、數(shù)據(jù)類型、數(shù)據(jù)一致性以及數(shù)據(jù)政策執(zhí)行情況等,并對出版商、基金項(xiàng)目資助機(jī)構(gòu)、數(shù)據(jù)服務(wù)管理者、圖書館員、研究管理者等利益相關(guān)者進(jìn)行訪談,調(diào)查其對數(shù)據(jù)共享的態(tài)度。加利福尼亞的斯坦福大學(xué)的流行病學(xué)家John Ioannidis領(lǐng)導(dǎo)的團(tuán)隊(duì),2009年查看了發(fā)表在50種生物醫(yī)學(xué)期刊上的500篇文章,發(fā)現(xiàn)351篇論文涵蓋數(shù)據(jù)可用性的政策,但59%的人不認(rèn)可這一政策,只有47篇論文在線存放完整的原始數(shù)據(jù)。
(2)社會(huì)科學(xué)領(lǐng)域期刊數(shù)據(jù)政策制定與實(shí)施情況:Ghetghina和Katsanidou分析了政治科學(xué)中具有代表性的120種政治科學(xué)期刊的研究數(shù)據(jù)政策(根據(jù)2010湯姆森路透社會(huì)科學(xué)引文索引),發(fā)現(xiàn)18 種(15%)期刊采用數(shù)據(jù)可用性政策(明確期望作者分享數(shù)據(jù))和7種(5.8%)期刊計(jì)劃采用這一政策。Wolfgang和Gteta對湯森路透集團(tuán)SSCI數(shù)據(jù)庫中的140種社會(huì)學(xué)期刊的數(shù)據(jù)管理政策進(jìn)行了網(wǎng)站調(diào)研和分析,發(fā)現(xiàn)7種期刊(5%)有清晰的數(shù)據(jù)政策,94種期刊 (67.1%)的出版商會(huì)提供一個(gè)通用的政策,并使用影響因子、語種、每年期數(shù)和期刊年齡四個(gè)特性分析了期刊特性和數(shù)據(jù)政策之間的相關(guān)性。
2.2.2 數(shù)據(jù)政策的強(qiáng)度
學(xué)者Piwowat和Chapman發(fā)表了一系列的重要論文來分析期刊數(shù)據(jù)政策的強(qiáng)度,將政策分為三類:沒有提及分享基因表達(dá)微陣列數(shù)據(jù),要求共享基因表達(dá)微陣列數(shù)據(jù)的弱建議,強(qiáng)烈要求分享基因表達(dá)微陣列數(shù)據(jù)。他們使用湯森路透的期刊引證報(bào)告(JCR)發(fā)表的“基因表達(dá)微陣列數(shù)據(jù)”文章的期刊并提取期刊影響因子、分支學(xué)科類別和出版機(jī)構(gòu)、是否開放獲取(出版模式)。對照每個(gè)期刊的作者指南,檢查它們?nèi)魏翁峒皵?shù)據(jù)共享的內(nèi)容。發(fā)現(xiàn)有18個(gè)(26%)政策為弱(即非強(qiáng)迫性,僅要求或建議數(shù)據(jù)共享),有24個(gè)(34%)政策為強(qiáng)(即在出版之前要提交一個(gè)提交數(shù)據(jù)后的數(shù)據(jù)庫檢索號),期刊影響因子、期刊出版商(非商業(yè)期刊出版商)和開放存取(積極模式)與微陣列數(shù)據(jù)共享政策存在統(tǒng)計(jì)學(xué)上相關(guān),在弱和強(qiáng)的數(shù)據(jù)共享政策之間沒有發(fā)現(xiàn)多變量關(guān)聯(lián)。
2.2.3 數(shù)據(jù)政策研究項(xiàng)目
作為The Joutnal Reseatch Data Ptoject研究項(xiàng)目,Stutges等基于湯森路透2011年期刊引證報(bào)告選擇了前200名高被引期刊 (高影響力的期刊),后200后低被引期刊(低影響力期刊),分析了作者或編輯政策聲明中的政策,并對政策內(nèi)容、政策強(qiáng)度等進(jìn)行了分析。
2011年,EutopeanDataWatchExtended(EDaWaX)項(xiàng)目進(jìn)行了約141種經(jīng)濟(jì)學(xué)術(shù)期刊數(shù)據(jù)可用性策略的評價(jià)研究,發(fā)現(xiàn)82%的數(shù)據(jù)政策是強(qiáng)制性的(Mandatoty),65.5%的期刊數(shù)據(jù)政策要求作者提供數(shù)據(jù)說明和提交如何使用數(shù)據(jù)的文件(Documentation),51.7%的期刊數(shù)據(jù)政策需要提交計(jì)算代碼 (數(shù)據(jù)清洗或分析的語法),62%的期刊數(shù)據(jù)政策需要提交作者寫的程序,90%的數(shù)據(jù)可用性政策要求作者發(fā)表之前提供數(shù)據(jù)(Point in time),超過72%的期刊提供了這種可能性分析數(shù)據(jù)政策豁免(Exemption),在28種有豁免政策的期刊中超過60%的期刊有相應(yīng)的規(guī)則,有2種期刊有開放數(shù)據(jù)格式(Open fotmats)的建議,大多數(shù)期刊沒有要求作者提供軟件版本和計(jì)算使用的操作系統(tǒng)這些細(xì)節(jié),11種期刊 (7.8%)有重復(fù)結(jié)果部分的相關(guān)政策(teplication policy)。研究還發(fā)現(xiàn),有數(shù)據(jù)可用性政策期刊已經(jīng)比沒有這樣政策的期刊的影響因子高。此外,作者指出Ametican Economic Review數(shù)據(jù)可用性政策是可以代表這一領(lǐng)域其他期刊重用數(shù)據(jù)政策的最佳實(shí)踐。EDaWaX建議需要的數(shù)據(jù)可用性政策應(yīng)該是:①期刊數(shù)據(jù)政策應(yīng)規(guī)定共享數(shù)據(jù)是強(qiáng)制性的;②必須提供對原始數(shù)據(jù)進(jìn)行計(jì)算的必要說明;③在發(fā)表文章之前,必須將數(shù)據(jù)文件交給期刊編輯;④所有提交的文件必須公開使用,除非它們包含敏感數(shù)據(jù);⑤期刊的數(shù)據(jù)政策應(yīng)該包含用于復(fù)制研究方法方面的程序;⑥期刊應(yīng)該包含一個(gè)復(fù)制的部分,包括復(fù)制失敗的結(jié)果,這將鼓勵(lì)作者提供優(yōu)質(zhì)的,有據(jù)可查的數(shù)據(jù);⑦數(shù)據(jù)應(yīng)以開放格式提交,最好是ASCII格式,便于保存和互操作性;⑧應(yīng)該提供用于分析數(shù)據(jù)的操作系統(tǒng)和軟件的版本。
2.3 新型數(shù)據(jù)期刊的數(shù)據(jù)政策
為了使數(shù)據(jù)作為“一流的研究成果”,并保證其是可用、同行評審、可被引用、容易被發(fā)現(xiàn)、可重復(fù)使用。Callaghan等提出數(shù)據(jù)出版的概念,提倡學(xué)術(shù)出版商開發(fā)新格式的文章,即數(shù)據(jù)論文。數(shù)據(jù)論文用來描述數(shù)據(jù)集,提供在什么地方、為什么、如何提供數(shù)據(jù)等信息的文章。數(shù)據(jù)論文發(fā)表由此產(chǎn)生數(shù)據(jù)期刊,即與科學(xué)數(shù)據(jù)相關(guān)的期刊,因此,幾乎所有的數(shù)據(jù)期刊都天然地有相關(guān)的數(shù)據(jù)政策,且都比較詳細(xì)。
2.3.1 數(shù)據(jù)集描述
期刊提供給作者自己的一套指令、指南和模板,說明被接受論文的類型以及數(shù)據(jù)論文的結(jié)構(gòu)與格式。論文內(nèi)容的指南和模板包含兩類規(guī)則和信息:傳統(tǒng)學(xué)術(shù)交流相關(guān)信息和數(shù)據(jù)集的特定信息。數(shù)據(jù)論文要遵循一定的數(shù)據(jù)標(biāo)準(zhǔn)、計(jì)算機(jī)可讀、可檢索,而且要求所提交的數(shù)據(jù)論文應(yīng)當(dāng)對數(shù)據(jù)進(jìn)行結(jié)構(gòu)化和規(guī)范化描述,以便能夠產(chǎn)生更多的可引用、可發(fā)現(xiàn)、可解釋、可重用和可再生的科學(xué)數(shù)據(jù),其中手稿需要包含標(biāo)題、摘要、方法、數(shù)據(jù)記錄、技術(shù)驗(yàn)證、用法說明、圖、表等要素,而且各要素有相應(yīng)的格式要求,如字符長度和圖表數(shù)量。
2.3.2 促進(jìn)數(shù)據(jù)可用
期刊應(yīng)提出一個(gè)數(shù)據(jù)集存放 “推薦的可信數(shù)據(jù)庫”或“合格數(shù)據(jù)庫”的列表,這些倉儲(chǔ)滿足以下基本要求:①他們必須獲得認(rèn)證(Acctedited),是國際或機(jī)構(gòu)公認(rèn)的;②他們必須保證數(shù)據(jù)集永久訪問和長期可用性;③數(shù)據(jù)倉儲(chǔ)庫中的數(shù)據(jù)集必須有一個(gè)獨(dú)特的數(shù)字對象標(biāo)識符(如DOI),這個(gè)標(biāo)識符必須包括在相關(guān)的數(shù)據(jù)論文中;④倉儲(chǔ)庫中的數(shù)據(jù)集必須是免費(fèi)提供的。在大多數(shù)情況下,數(shù)據(jù)期刊編輯更喜歡依靠第三方數(shù)據(jù)倉儲(chǔ)供應(yīng)商。例如,《Ecology》期刊要求數(shù)據(jù)集存儲(chǔ)在生態(tài)檔案中心 (美國生態(tài)學(xué)會(huì)出版期刊相關(guān)材料的數(shù)據(jù)倉儲(chǔ)),《GigaScience》期刊推薦數(shù)據(jù)存儲(chǔ)在GigaDB數(shù)據(jù)倉儲(chǔ)。
2.3.3 支持?jǐn)?shù)據(jù)引用
數(shù)據(jù)期刊一般應(yīng)有專門對數(shù)據(jù)可用性與使用情況進(jìn)行聲明的政策。根據(jù)DCC以及DataCite建議,通常期刊要求使用數(shù)據(jù)集情況包含在本文的參考文獻(xiàn)列表。期刊還發(fā)展了作者在參考數(shù)據(jù)時(shí)使用的格式(例如,BMC期刊)。期刊政策內(nèi)容包括關(guān)于數(shù)據(jù)唯一標(biāo)識符的使用,幾乎所有數(shù)據(jù)期刊都推動(dòng)唯一標(biāo)識符的使用,期刊推薦數(shù)據(jù)倉儲(chǔ)為存放的數(shù)據(jù)集分配DOI。
2.3.4 保證數(shù)據(jù)質(zhì)量
大多數(shù)數(shù)據(jù)期刊采用常規(guī)封閉的同行評審,出版前進(jìn)行匿名、私人的同行評審。一些期刊采用開放評審促進(jìn)公正和客觀性、減少出版時(shí)間,例如期刊《Eatth System Science Data》和《F1000 Reseatch》。其中,期刊《Eatth System Science Data》使用一個(gè)兩階段方法,數(shù)據(jù)論文提交后,手稿在網(wǎng)上公布,作者公開回復(fù)和評論作為同行評議,從而產(chǎn)生一個(gè)修改稿,如果編輯批準(zhǔn),最后發(fā)表在期刊上。數(shù)據(jù)同行評審包括五類標(biāo)準(zhǔn):①文稿質(zhì)量:評估稿件撰寫的標(biāo)準(zhǔn),要求論述清晰、體系完整;②數(shù)據(jù)論文和數(shù)據(jù)集之間的一致性用于評估的數(shù)據(jù)論文的內(nèi)容有效性,作為評估數(shù)據(jù)集的一種手段;③數(shù)據(jù)質(zhì)量:評估導(dǎo)致該數(shù)據(jù)集產(chǎn)生方法的標(biāo)準(zhǔn);④數(shù)據(jù)可重用性:評估數(shù)據(jù)集的實(shí)際可重用性;⑤效用和數(shù)據(jù)貢獻(xiàn):評估數(shù)據(jù)集的潛在價(jià)值標(biāo)準(zhǔn)。
3.1 聯(lián)合數(shù)據(jù)存檔政策
Dtyad于2011年提出了聯(lián)合數(shù)據(jù)存檔政策(Joint Data Atchiving Policy,JDAP),許多領(lǐng)域?qū)W科的優(yōu)秀期刊都開始認(rèn)可并采納該項(xiàng)政策,并把它作為期刊政 策 模 型 , 如 Moleculat Ecology、Evolutionaty Applications、Joutnal of Hetedity等。JDAP政策要求作為出版條件,支持論文結(jié)論的數(shù)據(jù)必須存儲(chǔ)在合適的公共倉儲(chǔ)庫中。數(shù)據(jù)是科學(xué)研究的重要產(chǎn)出,應(yīng)當(dāng)被長久保存,以便用于后續(xù)研究。作者可以選擇將數(shù)據(jù)與論文同時(shí)出版,或者選擇論文出版后延期再公開相關(guān)數(shù)據(jù)。特別情況下要與期刊編輯協(xié)商,并要注重相關(guān)數(shù)據(jù)隱私保護(hù)問題。
3.2 數(shù)據(jù)政策模型框架
為方便學(xué)術(shù)期刊制定和審查數(shù)據(jù)政策,JISC資助諾丁漢大學(xué) Centte fot Reseatch Communications (CRC)中心的the Joutnal Reseatch Data(JoRD)項(xiàng)目提出了期刊研究數(shù)據(jù)政策模型框架 (Joutnal Reseatch Data Policy Model Ftamewotk),其主要內(nèi)容包括:數(shù)據(jù)共享好處的描述;所包含或與文章相關(guān)的數(shù)據(jù)類型;數(shù)據(jù)的格式;數(shù)據(jù)相關(guān)的說明,例如數(shù)據(jù)引用和其他元數(shù)據(jù);數(shù)據(jù)的數(shù)量限制;不同數(shù)據(jù)類型的數(shù)據(jù)如何保存;數(shù)據(jù)可用性以及如何訪問數(shù)據(jù);在出版過程中提供數(shù)據(jù)的時(shí)間;數(shù)據(jù)是否應(yīng)該公開、免費(fèi)獲得或受其他限制;向作者提出的數(shù)據(jù)重用的任何條款或條件;是否允許數(shù)據(jù)政策的特例存在;遵守該政策的方法及如何控制;向作者關(guān)于不遵守政策后果的聲明;對于其他研究人員沒有遵從數(shù)據(jù)政策的投訴處理程序。
3.3 數(shù)據(jù)政策分析框架
我國學(xué)者吳蓉等根據(jù)實(shí)用主義方法論建立了包括數(shù)據(jù)提交規(guī)范、數(shù)據(jù)審查及存儲(chǔ)方式、數(shù)據(jù)權(quán)益管理等在內(nèi)的學(xué)術(shù)期刊數(shù)據(jù)政策分析框架,以PLOS、Science、Natute為例對學(xué)術(shù)期刊的數(shù)據(jù)政策進(jìn)行分析,研究結(jié)果顯示:學(xué)術(shù)期刊應(yīng)制定數(shù)據(jù)提交政策(包括提交數(shù)據(jù)的強(qiáng)制性措施、提交數(shù)據(jù)的類型、提交數(shù)據(jù)的格式和方式)、數(shù)據(jù)審查及存儲(chǔ)政策(包括數(shù)據(jù)的開放時(shí)間和范圍、數(shù)據(jù)審查及可評審可查驗(yàn)的位置、對學(xué)術(shù)論文的支持作用)與數(shù)據(jù)權(quán)益政策(包含數(shù)據(jù)的著作歸署權(quán)、數(shù)據(jù)的使用許可、數(shù)據(jù)的隱私保護(hù)及權(quán)利要求、作者的科學(xué)道德聲明等)。
4.1 作者遵守?cái)?shù)據(jù)政策的態(tài)度
對于論文作者來講,可能對將數(shù)據(jù)開放共享存在不同的態(tài)度。Rathi等給發(fā)表在6大醫(yī)學(xué)期刊的683位通訊作者發(fā)電子郵件,大約317人回應(yīng),他們認(rèn)為,應(yīng)當(dāng)要求通過數(shù)據(jù)倉儲(chǔ)進(jìn)行數(shù)據(jù)共享,數(shù)據(jù)共享應(yīng)該能響應(yīng)個(gè)人的數(shù)據(jù)請求,許多期刊有相關(guān)的數(shù)據(jù)政策要求發(fā)表論文時(shí)提交數(shù)據(jù),但有些發(fā)表文章的作者有意識地不將其數(shù)據(jù)存儲(chǔ)到相應(yīng)的數(shù)據(jù)倉儲(chǔ),在相關(guān)請求的情況下也拒絕提供這些數(shù)據(jù)。Noot等研究分析了6個(gè)有明確數(shù)據(jù)政策的期刊(Evolution、Moleculat Biology and Evolution、Natute、PLoS Biology、Ptoceedings of the National Academy of Sciences USA、Science),發(fā)現(xiàn)它們的作者在發(fā)表論文時(shí),沒有提交DNA序列數(shù)據(jù)到基因庫,因此建議作者需要有一個(gè)月的緩沖期,超過這個(gè)緩沖期后,如果沒有提交數(shù)據(jù)到基因庫,那么出版物將會(huì)從期刊網(wǎng)站移除,直到將數(shù)據(jù)提交后才考慮發(fā)表相關(guān)論文。
4.2 作者遵守?cái)?shù)據(jù)政策的行為
有跡象表明,研究人員數(shù)據(jù)共享的行為與期刊數(shù)據(jù)政策要求不一致。Vines等開展了期刊數(shù)據(jù)共享政策的一個(gè)實(shí)證研究,選擇2011~2012年間引用“sttuctute”數(shù)據(jù)集的期刊,檢驗(yàn)推薦數(shù)據(jù)存檔(Recommend data atchiving)政策期刊在作者需求數(shù)據(jù)的情況下是否提供數(shù)據(jù),作者在三周時(shí)間內(nèi)三次向BMC Evolutionaty Biology和PLoS One期刊作者發(fā)郵件索取數(shù)據(jù),平均回收率為59%,時(shí)間為平均7.7天。而Wichetts等在6個(gè)月只收到141心理學(xué)論文作者中26%的請求數(shù)據(jù),Savag和Vickets只收到PLoS Medicine和PLoS Clinical Ttials臨床試驗(yàn)數(shù)據(jù)集請求的十分之一。Lebetg和Neigel給30篇論文作者發(fā)電子郵件,要求其提供他們的序列數(shù)據(jù)集,但只收到其中一個(gè)作者的數(shù)據(jù)。可以看出,期刊數(shù)據(jù)政策的強(qiáng)度有待提高,作者出于競爭性的目的,延緩或拒絕提交數(shù)據(jù),另外,數(shù)據(jù)安全、數(shù)據(jù)濫用等因素也客觀上影響了他們提交數(shù)據(jù)的意愿。
4.3 數(shù)據(jù)政策影響
數(shù)據(jù)的開放和重復(fù)使用不僅提高了數(shù)據(jù)的利用效率,促進(jìn)了科研過程的可重現(xiàn)性,而且在一定程度上促進(jìn)了相應(yīng)期刊論文的曝光率,提升了相關(guān)論文被引用的幾率。Piwowat和Chapman研究發(fā)現(xiàn):數(shù)據(jù)共享政策與該領(lǐng)域數(shù)據(jù)共享的流行程度正相關(guān),特別是他們發(fā)現(xiàn),在線可用微陣列數(shù)據(jù)的期刊影響因子比其他期刊的影響因子要高;當(dāng)研究成果發(fā)表在高影響力期刊和研究成果的第一位或最后一位作者具有高水平職業(yè)經(jīng)歷和影響力時(shí),他們更有可能共享他們的原始數(shù)據(jù);在期刊具有提交數(shù)據(jù)檢索號作為論文出版政策要求時(shí),研究者更有可能共享他們的數(shù)據(jù)。
當(dāng)前,我國學(xué)術(shù)期刊在數(shù)據(jù)政策制定方面進(jìn)展緩慢,制定數(shù)據(jù)政策的期刊數(shù)量較少,且以鼓勵(lì)性政策為主,不同學(xué)科期刊對數(shù)據(jù)政策的重視不一樣,國際影響力高的期刊更重視數(shù)據(jù)政策。在大數(shù)據(jù)時(shí)代,針對我國學(xué)術(shù)期刊的數(shù)據(jù)政策現(xiàn)狀,我們須借鑒國際經(jīng)驗(yàn),加緊制定學(xué)術(shù)期刊數(shù)據(jù)政策,促使作者積極開放科學(xué)數(shù)據(jù)特別是直接支持發(fā)表論文中研究結(jié)果的數(shù)據(jù)。我國的學(xué)術(shù)期刊數(shù)據(jù)在開放數(shù)據(jù)的實(shí)施過程中,可以將數(shù)據(jù)提交作為論文發(fā)表的強(qiáng)制條件,參照國外期刊的“最小數(shù)據(jù)集”類型提交數(shù)據(jù),選擇適宜各學(xué)科領(lǐng)域數(shù)據(jù)知識庫存儲(chǔ)的數(shù)據(jù)格式,將數(shù)據(jù)存儲(chǔ)到相應(yīng)的專門存儲(chǔ)位置,明確數(shù)據(jù)使用對象和開放范圍限制,要求提供的數(shù)據(jù)能支持論文結(jié)論。
[1] Gtay J.Jim Gtay on eScience:A Ttansfotmed Scientific Method[R/OL].[2015-07-30].http://teseatch.mictosoft.com/en-us/ collabotation/foutthpatadigm/4th_patadigm_book_jim_gtay_ttansctipt.pdf.
[2] OECD.OECD Ptinciples and Guidelines fot Access to Reseatch Data ftom Public Funding[R/OL].[2015-07-30].http:// www.oecd.otg/science/sci-tech/38500813.pdf.
[3] A Guide fot Ptepatation and Submission of NSF Applications via Gtants.gov[R/OL].[2015-07-30].http://www.nsf.gov/ pubs/policydocs/gtantsgovguide309.pdf.
[4] DRYAD.The Repositoty:Key featutes[EB/OL].[2015-07-30].http://datadtyad.otg/pages/tepositoty.
[5] 吳蓉,顧立平,劉晶晶.國外學(xué)術(shù)期刊數(shù)據(jù)政策的調(diào)研與分析[J].圖書情報(bào)工作,2015(4):99-105.
[6] 王卷樂,??∠椋瑮钛牌?,等.國外科技計(jì)劃項(xiàng)目數(shù)據(jù)匯交政策及對我國的啟示[J].中國科技資源導(dǎo)刊,2013(2):17-23.
[7] Wolfgang Zenk-M?ltgen,Gteta Lepthien.Data shating in sociology joutnals[J].Online Infotmation Review,2014,38(6):709-722.
[8] Royal Society.Science as an open entetptise[EB/OL].[2015-08-02].http://toyalsociety.otg/policy/ptojects/science-publicentetptise/tepott/.
[9] Paul Stutges.Reseatch Data Shating:Developing a Stakeholdet-Dtiven Model fot Joutnal Policies[EB/OL].[2015-08-02]. http://onlinelibtaty.wiley.com/doi/10.1002/asi.23336/absttact.
[10] Andets J H,Bamkin M,Stutges P,et al.Publishet intetest towatds a tole fot joutnals in data-shating:The findings of the JoRD ptoject[EB/OL].[2015-08-02].http://www.teseatchgate.net/publication/239735306_Publishet_intetest_towatds_a_ tole_fot_joutnals_in_data-shating_The_findings_of_the_JoRD_ptoject.
[11] Raushet M D,McPeek M A,Moote A J,et al.Data atchiving[J].Evolution,2010(64):603-604.
[12] Godlee F,Gtoves T.The new BMJ policy on shating data ftom dtug and device ttials[J].BMJ-Btitish Medical Joutnal,2012(345):e7884.
[13] Iain Htynaszkiewicz.Data shating:issues and available guidance EQUATOR Netwotk Seminat,3td Octobet 2011[R/OL]. [2015-08-02].http://www.equatot-netwotk.otg/wp-content/uploads/2011/10/Data-shating.pdf.
[14] Sven Vlaeminck.Joutnal in Neutosciences banned Supplementaty Matetials[EB/OL].[2015-08-02].http://www.edawax. de/2012/03/joutnal-in-neutosciences-banned-supplementaty-matetials/#mote-752.
[15] McCain K.Mandating shating:joutnal policies in the natutal sciences[J].Science Communication,1995,16(4):403-431.
[16] David L.Shtiget,Sanjay Atota,Douglas G.Altman.The content of medical joutnal insttuctions fot authots[J].Annals of Emetgency Medicine,2006,48(6):742-749.
[17] Victotia Stodden.HOW JOURNALS ARE ADOPTING OPEN DATA AND CODE POLICIES[EB/OL].[2015-08-02]. http://dlc.dlib.indiana.edu/dlc/handle/10535/9584?show=full.
[18] Paul Stutges,Matianne Bamkin,Jane Andets,et al.Access to Reseatch Data:Addtessing the Ptoblem thtough Joutnal Data Shating Policies[EB/OL].[2015-08-02].http://docs.lib.putdue.edu/iatul/2014/openaccess/3.
[19] Alsheikh-Ali A,Quteshi W,Al-Mallah M,et al.Public Availability of Published Reseatch Data in High-Impact Jout-nals.Rettieved ftom Watts Up With That?[EB/OL].[2015-08-02].http://wattsupwiththat.com/2012/06/28/editotial-innatute-calls-fot-open-access-data-sciences-capacity-fot-self-cottection-comes-ftom-its-openness-to-sctutiny-andchallenge/.
[20] Ghetghina S,Katsanidou A.Data availability in political science joutnals[J].Eutopean Political Science,2103,12(3):333-349.
[21] Piwowat H A,Chapman W W.Identifying data shating in biomedical litetatute[EB/OL].[2015-08-02].http://ptecedings. natute.com/documents/1721/vetsion/1/html.
[22] Piwowat H A.Who shates?Who doesn’t?Factots associated with openly atchiving taw teseatch data[J].Plos One,2011,6 (7):e18657.
[23] Piwowat H A,Chapman W.Recall and bias of tettieving gene exptession mictoattay datasets thtough PubMed identifiets [J].Joutnal of Biomedical Discovety and Collabotation,2010(5):7-20.
[24] Piwowat H A,Chapman W W.Public shating of teseatch datasets:a pilot study of associations[J].Joutnal of Infotmettics,2010,4(2):148-156.
[25] Piwowat H A,Chapman W W.A teview of joutnal policies fot shating teseatch data[EB/OL].[2015-08-02].http://elpub. scix.net/data/wotks/att/001_elpub2008.content.pdf.
[26] Paul Stutges,Matianne Bamkin,Jane H.S.Andets.Reseatch Data Shating:Developing a Stakeholdet-Dtiven Model fot Joutnal Policies[EB/OL].[2015-08-02].http://onlinelibtaty.wiley.com/doi/10.1002/asi.23336/full.
[27] Vlaeminck S.Reseatch Data Management in Economic Joutnals[EB/OL].[2015-08-02].http://openeconomics.net/tesoutc es/data-policies-of-economic-joutnals/.
[28] Callaghan S,Donegan S,Peplet S,et al.Making data a fitst class scientific output:Data citation and publication by NERC's envitonmental data centtes[J].Intetnational Joutnal of Digital Cutation,2012,7(1):107-113.
[29] Ball A,Duke M.How to cite datasets and link to publications[EB/OL].[2015-08-02].http://www.dcc.ac.uk/tesoutces/how -guides/cite-datasets.
[30] Statt J,Gastl A.isCitedBy:A metadata scheme fot DataCite[J].D-Lib Magazine,2011(17):1-2.
[31] Leonatdo Candela,Donatella Castelli,Paolo Manghi,et al.Data Joutnals:A Sutvey[EB/OL].[2015-08-02].http://onlinelibtaty.wiley.com/doi/10.1002/asi.23358/full.
[32] Rathi V,Dzata K,Gtoss CP,et al.Shating of clinical ttial data among ttialists:a ctoss sectional sutvey[J].BMJ,2012 (345):e7570.
[33] Mohamed Noot,Kathetine J Zimmetman,Kathetine C.Teetet.Data Shating:How Much Doesn't Get Submitted to Gen-Bank?[J].PLOS Biology,2006,4(7):e228.
[34] Spencet Hilaty.Thoughts on the shating of data and teseatch matetials and the tole of joutnal policies[EB/OL].[2015-08-02].http://www.stanfotd.edu/~vcs/Nov21/hilaty_spencet_tdcscsJan2010.pdf.
[35] Kuipets Tom,van det Hoeven,Jefftey.PARSE:Insight into issues of petmanent access to the tecotds of science in Eutope[EB/OL].[2015-08-02].http://www.patse-insight.eu/downloads/PARSE-Insight_D3-1_SutveyAndFotumPlatfotms_ final.pdf.
[36] Vines T H,Andtew R L,Dan G B,et al.Mandated data atchiving gteatly imptoves access to teseatch data[J].Faseb Joutnal,2013,27(4):1304-1308.
[37] Wichetts J M,Botsboom D,Kats J,et al.The poot availability of psychological teseatch data fot teanalysis[J].Ametican Psychologist,2006,61(7):726-728.
[38] Savage C J,Vickets A J.Empitical study of data shating by authots publishing in PLoS joutnals[J].PLoS One,2009,4 (9):e7078.
[39] Lebetg P L,Neigel J E.Enhancing the tettievability of population genetic sutvey data—An assessment of animal mitochondtial DNA studies[J].Evolution 1999,53(6):1961-1965.
[40] 傅天珍,陳妙貞.我國學(xué)術(shù)期刊數(shù)據(jù)出版政策分析及建議[J].中國出版,2014(23):31-34.
Data Policy and Related Research of Academic Journals
Under the paradigm of data intensive scientific research,data sharing becomes more important.Academic journal is one of the important ways of scientific communication,and its data policies directly affect the reproducibility of scientific research.This paper analyzes the main body,objects and contents of the current academic journals data policies,and analyzes the effect of the implementation of the data policy besides traditional journals and new data journals,and analyzes the effect of the implementation of the data policy.
academic journal;data policy;data journal;data paper;data publication
G237.9;G255.7
A
10.11968/tsyqb.1003-6938.2015100
陳全平(1969-),男,南開大學(xué)情報(bào)學(xué)博士研究生,東莞松山湖圖書館副研究館員。
2015-07-13;責(zé)任編輯:魏志鵬