■秦長江 吳思潔 王丹丹
河南科技大學(xué)管理學(xué)院,河南省洛陽市開元大道263號 471000
大數(shù)據(jù)時代,以科研數(shù)據(jù)為主要學(xué)術(shù)資源的數(shù)據(jù)密集型科學(xué)正改變著科學(xué)研究的模式??蒲袛?shù)據(jù)(Research Data)是指科研人員在產(chǎn)生原創(chuàng)性研究成果過程中收集、觀察或創(chuàng)建的各種信息,也稱作科學(xué)數(shù)據(jù)(Scientific Data)。它類型豐富,格式多樣,包括文本、數(shù)值、多媒體、模型、軟件以及特定工具格式等[1]。科研數(shù)據(jù)作為科學(xué)研究過程的重要組成部分,其開放性、可見性和共享程度被視為科學(xué)研究完整性的關(guān)鍵評價指標(biāo)。更好地開發(fā)利用科研數(shù)據(jù)不僅有助于提高研究透明度和學(xué)術(shù)論文質(zhì)量,還有利于全面推進科技創(chuàng)新[2]。因此,近年來科研數(shù)據(jù)的管理和共享受到了國際學(xué)術(shù)界、專業(yè)協(xié)會、學(xué)術(shù)期刊和出版社以及各國政府和國際組織的重點關(guān)注[3]。
國外開展科研數(shù)據(jù)相關(guān)研究的時間較早。20世紀80年代,F(xiàn)ienberg等[4]就提出,推進科研數(shù)據(jù)共享可以增強對研究結(jié)果的證實,推動科研領(lǐng)域的創(chuàng)新與發(fā)展。之后,國外學(xué)者對學(xué)術(shù)期刊等出版機構(gòu)科研數(shù)據(jù)政策制定原則與內(nèi)容框架展開了較為系統(tǒng)、全面的研究。在社會科學(xué)(以下簡稱“社科”)科研數(shù)據(jù)研究和實踐方面,美國心理學(xué)會(American Psychological Association,APA)的科學(xué)事務(wù)委員會于2015年提出數(shù)據(jù)共享政策制定原則及影響因素,影響因素包括利益相關(guān)方責(zé)任、數(shù)據(jù)共享訪問限制條件和時間要求、數(shù)據(jù)可用性及數(shù)據(jù)引用標(biāo)準等[5]。2011年,BMC(BioMed Central)出版社旗下期刊制定了要求或鼓勵作者在其出版物中“提供支持數(shù)據(jù)”的政策;2015年,BMC更新了數(shù)據(jù)政策,(強制)要求旗下所有期刊(超過250種)使用數(shù)據(jù)可用性聲明 (Data Availability Statement, DAS)[6]。2015年,Sturges等[7]根據(jù)2011年度《期刊引證報告》(JournalCitationReports, JCR)確定了371種樣本期刊,歸納出230條期刊政策,并根據(jù) Piwowar 與 Chapman[8]對期刊數(shù)據(jù)政策強弱的定義,將這些政策分為弱政策(76%)與強政策(24%)。Gherghina等[9]指出,數(shù)據(jù)政策與期刊影響因子之間具有較強的正相關(guān)性,數(shù)據(jù)被引頻次越高的期刊越有可能制定數(shù)據(jù)政策。
筆者通過中國知網(wǎng)檢索發(fā)現(xiàn),我國對科研數(shù)據(jù)管理和政策的研究起步較晚,研究成果較少,有關(guān)社科科研數(shù)據(jù)的研究成果更少。傅天珍等[10]調(diào)查分析了我國學(xué)術(shù)期刊數(shù)據(jù)出版政策的制定情況,指出我國學(xué)術(shù)期刊亟須借鑒國外先進經(jīng)驗,制定和構(gòu)建特色化數(shù)據(jù)共享政策體系。馬海群等[11]建立了較為系統(tǒng)、全面的量化期刊數(shù)據(jù)政策評價體系,該體系包含4個一級指標(biāo)和14個二級指標(biāo),具有一定的可操作性和參考價值。2019年,彭琳和韓燕麗[12]從數(shù)據(jù)提交、政策強度、存儲和引用要求等方面對中國科學(xué)院主辦的65種SCI收錄的英文科技期刊的數(shù)據(jù)政策進行分析,指出國內(nèi)科技期刊必須完善數(shù)據(jù)政策,促進我國科研數(shù)據(jù)的管理和共享。
相關(guān)研究表明,目前多數(shù)發(fā)達國家已經(jīng)制定、推行了科研數(shù)據(jù)政策,并日趨完善,涵蓋從采集、存儲、處理、分析到出版、共享數(shù)據(jù)的全過程[13]。我國科研數(shù)據(jù)管理工作起步晚,學(xué)術(shù)期刊參與科研數(shù)據(jù)的實踐還未形成規(guī)模,對科研數(shù)據(jù)重視的程度遠遠不夠,對科研數(shù)據(jù)開放獲取的理念還未得到強化,導(dǎo)致我國目前擁有科研數(shù)據(jù)政策的學(xué)術(shù)期刊數(shù)量非常有限[14]。同時,學(xué)科特點的差異性導(dǎo)致不同學(xué)科期刊對科研數(shù)據(jù)的重視程度不同,國內(nèi)擁有科研數(shù)據(jù)政策的期刊學(xué)科分布嚴重不均衡。社科科研數(shù)據(jù)規(guī)模小,收集方法靈活多樣,影響因素更為復(fù)雜,敏感數(shù)據(jù)的處理問題也更為突出,從而導(dǎo)致歸檔和共享該領(lǐng)域的數(shù)據(jù)面臨許多挑戰(zhàn),數(shù)據(jù)開放與再利用需要付出更多的努力。此外,與自然科學(xué)學(xué)科相比,社科學(xué)科的科研數(shù)據(jù)管理意識和能力遠未形成氣候[15-16]。
學(xué)術(shù)期刊作為學(xué)術(shù)交流的重要載體,其科研數(shù)據(jù)政策對于促進數(shù)據(jù)共享、推進數(shù)據(jù)最大化使用、實現(xiàn)科研過程的可重現(xiàn)有著非常重要的作用[7],社科科研數(shù)據(jù)對于國家政策制定和社科研究均具有重要價值。因此,本研究對國外社科期刊科研數(shù)據(jù)政策的調(diào)研結(jié)果,將為我國各利益相關(guān)群體(國家、資助機構(gòu)、學(xué)術(shù)期刊等出版機構(gòu))共同制定科研數(shù)據(jù)政策提供參考和建議,以指導(dǎo)和幫助我國社科期刊盡快推出適合期刊個性化需求的、有效的且符合國際最佳實踐的科研數(shù)據(jù)政策,推進我國社科科研數(shù)據(jù)共享和重用,促進開放科學(xué)背景下我國社科研究的創(chuàng)新。
期刊的影響因子和排名可以大致體現(xiàn)出期刊的影響力,因此本研究將影響因子作為篩選有代表性的高影響力期刊的標(biāo)準。本研究根據(jù)JCR,從社科期刊中選擇期刊種類最多的6個學(xué)科:管理學(xué)、經(jīng)濟學(xué)、社會學(xué)、政治學(xué)、教育學(xué)、語言學(xué),將這6個學(xué)科中每一學(xué)科影響因子排名前30的學(xué)術(shù)期刊(6個學(xué)科共計180種期刊)作為研究對象。
采用網(wǎng)站調(diào)研法和內(nèi)容分析法,通過解讀期刊規(guī)定的科研數(shù)據(jù)政策(例如:政策是否說明數(shù)據(jù)應(yīng)歸檔在哪里,或作者應(yīng)如何引用自己或他人的數(shù)據(jù))、明確標(biāo)注關(guān)于作者不遵守規(guī)定需承擔(dān)的后果(例如:如果沒有基礎(chǔ)數(shù)據(jù)或沒有解釋為什么無法提供數(shù)據(jù)共享的作者聲明,則不予以發(fā)表文章)等內(nèi)容,具體分析這些期刊的科研數(shù)據(jù)政策(主要包括政策制定情況、共享程度、數(shù)據(jù)存儲位置及方式、數(shù)據(jù)引用方式以及數(shù)據(jù)可用性聲明等)。
如表1所示,按照各學(xué)科內(nèi)執(zhí)行數(shù)據(jù)政策的期刊數(shù)量占比從高到低進行排序,依次為語言學(xué)(93.3%)、管理學(xué)(73.3%)、教育學(xué)(73.3%)、經(jīng)濟學(xué)(66.6%)、社會學(xué)(63.3%)、政治學(xué)(60.0%),這在一定程度上說明國外大部分社科期刊已經(jīng)意識到科研數(shù)據(jù)管理的重要性,并制定了科研數(shù)據(jù)管理與共享政策。
表1 6個學(xué)科中擁有科研數(shù)據(jù)政策的樣本期刊比例
按照文獻[7]對期刊數(shù)據(jù)政策強弱的定義,將數(shù)據(jù)政策分為強政策和弱政策。強政策即為強制要求數(shù)據(jù)共享,要求作者“必須”將研究過程中產(chǎn)生的原始數(shù)據(jù)提交到指定存儲庫或平臺,期刊將上傳數(shù)據(jù)“作為文章發(fā)表的條件”, 即數(shù)據(jù)政策的執(zhí)行程度為強,作者必須遵循期刊數(shù)據(jù)政策,否則不予發(fā)表。弱政策“鼓勵”作者分享數(shù)據(jù),僅說明數(shù)據(jù)應(yīng)該存儲到數(shù)據(jù)庫,只起建議的作用,沒有強制性。如表2所示,各學(xué)科數(shù)據(jù)政策的嚴格程度依次為經(jīng)濟學(xué)(52.4%)、政治學(xué)(21.7%)、教育學(xué)(18.0%)、社會學(xué)(10.5%)、語言學(xué)(3.5%)、管理學(xué)(2.0%)。在調(diào)查的180種期刊中,有25種(13.9%)期刊嚴格要求在論文發(fā)表時必須上傳研究數(shù)據(jù)。總體來說,國外社科期刊還是以鼓勵數(shù)據(jù)分享為主。
表2 各學(xué)科樣本期刊科研數(shù)據(jù)政策的嚴格程度
2.3.1 科研數(shù)據(jù)政策制定機構(gòu)
學(xué)術(shù)期刊采用的科研數(shù)據(jù)政策有3個主要來源:期刊所屬出版機構(gòu)、期刊及其編輯委員會、對期刊有影響的專業(yè)協(xié)會。表3所示結(jié)果表明不同機構(gòu)對期刊數(shù)據(jù)政策制定有較大影響,將機構(gòu)產(chǎn)生的影響從大到小進行排列,依次為專業(yè)協(xié)會、期刊及其編輯委員會、出版機構(gòu)。幾乎所有的專業(yè)協(xié)會,例如美國經(jīng)濟協(xié)會(American Economic Association,AEA)、美國政治科學(xué)協(xié)會(American Political Science Association,APSA)、環(huán)境與資源經(jīng)濟學(xué)家協(xié)會(Association of Environmental and Resource Economists)和美國社會學(xué)協(xié)會(American Sociological Association,ASA)都明確要求數(shù)據(jù)共享,36%的期刊及其編輯委員會明確要求數(shù)據(jù)共享。出版機構(gòu)是最常見的數(shù)據(jù)政策制定機構(gòu),這幾大國際知名出版機構(gòu)旗下的期刊大都采用“弱”數(shù)據(jù)政策,目前已有10.6%的期刊開始強制要求共享數(shù)據(jù),可見期刊制定“強”數(shù)據(jù)政策是未來的趨勢。
表3 各學(xué)科中樣本期刊科研數(shù)據(jù)政策來源統(tǒng)計
2.3.2 科研數(shù)據(jù)存儲位置
本研究調(diào)查了樣本期刊規(guī)定的數(shù)據(jù)存儲位置,結(jié)果如表4所示。在129種具有數(shù)據(jù)政策的期刊中,116種(89.9%)期刊建議或要求建立數(shù)據(jù)存儲庫來共享數(shù)據(jù),采用這種方式的期刊數(shù)量最多。具體來說:語言學(xué)、教育學(xué)和經(jīng)濟學(xué)期刊均有90%以上的期刊對數(shù)據(jù)存放位置作了明確規(guī)定;還有一些期刊設(shè)有專門的Dataverse存儲庫,供作者上傳與論文相關(guān)的數(shù)據(jù),如《比較政治學(xué)》(ComparativePoliticalStudies,CPS)的Dataverse提出定量分析論文只有在相關(guān)數(shù)據(jù)(數(shù)據(jù)、代碼、文件等)存放在CPS Dataverse的網(wǎng)站(https:∥dataverse.harvard.edu/dataverse/)上,才能被最終錄用;另有13種期刊希望科研人員把論文數(shù)據(jù)提交期刊網(wǎng)站。
由表5可知,大多數(shù)期刊出版機構(gòu)均推薦作者選擇符合FAIR原則的數(shù)據(jù)存儲庫,如Figshare、Mendeley Data、Dryad等。若作者首選的數(shù)據(jù)存儲庫不在推薦之列,則建議作者使用FAIRsharing.org和/或re3data.org來搜索合適的存儲庫,兩者都提供了認證的數(shù)據(jù)存儲庫列表。
Elsevier的做法更有特色。Elsevier與多個存儲庫合作,將ScienceDirect數(shù)據(jù)庫的論文與相關(guān)存儲庫鏈接在一起,使讀者能夠快捷地訪問論文的研究數(shù)據(jù)。Elsevier著重說明了Mendeley Data存儲庫遵從FAIR原則。Mendeley Data是經(jīng)過認證的、供研究人員免費使用的存儲庫。它托管所有學(xué)科、所有格式(原始數(shù)據(jù)、處理后的數(shù)據(jù)、表格、代碼和軟件)的開放數(shù)據(jù)。作者在提交論文時,可以將數(shù)據(jù)上傳并存儲到Mendeley Data,也可以將數(shù)據(jù)直接上傳到存儲庫。無論使用哪種方式提交數(shù)據(jù),作者都會收到一個唯一的DOI,使得數(shù)據(jù)可獨立引用,且可鏈接到ScienceDirect上的任何相關(guān)論文。ScienceDirect的讀者就可以一鍵訪問相關(guān)數(shù)據(jù),輕松查找和重用數(shù)據(jù)。
表4 各學(xué)科中樣本期刊科研數(shù)據(jù)的存儲位置
2.3.3 開放協(xié)議(TOP和JETS)對科研數(shù)據(jù)策略的影響
為了促進更開放的科學(xué)研究,開放科學(xué)中心(Center for Open Science)發(fā)布了“透明和開放促進”(Transparency and Openness Promotion,TOP)指南[17],有數(shù)百種高水平學(xué)術(shù)期刊簽署了該指南。另一個規(guī)模和影響相對較小的指南是“期刊編輯透明度聲明”(Journal Editors′ Transparency Statement,JETS)。兩份指南都把作者共享數(shù)據(jù)作為論文發(fā)表的條件。調(diào)查發(fā)現(xiàn),指南的簽署有利于促進學(xué)術(shù)期刊制定科研數(shù)據(jù)政策。簽署TOP指南的25種樣本期刊中,22種(88%)期刊有數(shù)據(jù)政策,而未簽署TOP指南的期刊中,擁有數(shù)據(jù)政策的期刊只占49%。簽署JETS的15種期刊中,14種(93%)期刊有數(shù)據(jù)政策,其中11種期刊強制要求共享數(shù)據(jù)。而未簽署JETS的期刊中只有46%期刊的有數(shù)據(jù)政策,這16種期刊中只有4種期刊強制要求共享數(shù)據(jù)。
表5 各學(xué)科中樣本期刊科研數(shù)據(jù)存儲方式統(tǒng)計
2.3.4 科研數(shù)據(jù)可用性聲明
數(shù)據(jù)可用性聲明是學(xué)術(shù)期刊普遍采用的一種作者聲明機制,旨在使作者更好地遵從期刊數(shù)據(jù)管理政策,用于確認論文所支撐的數(shù)據(jù)存儲在何處,是否提供數(shù)據(jù)共享,什么條件下可訪問數(shù)據(jù)等。數(shù)據(jù)可用性聲明將研究過程中產(chǎn)生的科研數(shù)據(jù)作為補充文件發(fā)布,使得數(shù)據(jù)更加透明和可靠,研究更清晰和可再現(xiàn)。強有力的期刊科研數(shù)據(jù)政策與作者使用數(shù)據(jù)可用性聲明密切正相關(guān),因此,期刊鼓勵或強制作者提交數(shù)據(jù)可用性聲明來說明如何獲取數(shù)據(jù)就非常重要(如果數(shù)據(jù)涉及隱私和敏感問題,作者需要聲明數(shù)據(jù)不能公開的原因,同時要說明數(shù)據(jù)是否可在讀者請求的基礎(chǔ)上有條件分享)。聲明能夠使讀者等第三方進一步理解、分析、復(fù)制和評估研究結(jié)果,有利于提高科研效率。
調(diào)研發(fā)現(xiàn),樣本期刊中有105種期刊(81%)的數(shù)據(jù)政策提到了數(shù)據(jù)可用性說明 (表6) 。期刊鼓勵作者提交數(shù)據(jù)可用性說明,特別指出如果對數(shù)據(jù)可用性有限制,投稿的時候必須在投稿信、論文方法部分進行說明。表7所示為樣本期刊中較為常見的數(shù)據(jù)可用性聲明樣例。
2.3.5 科研數(shù)據(jù)引用
引用是科學(xué)研究的基本要求,規(guī)范引用科研數(shù)據(jù)和引用學(xué)術(shù)論文一樣重要。規(guī)范引用數(shù)據(jù)能實現(xiàn)對科研數(shù)據(jù)的溯源,驗證科學(xué)研究的準確性和真實性,可評估數(shù)據(jù)集的影響力,有助于科研數(shù)據(jù)的共享與傳播,從而促進科技創(chuàng)新。因此,要求作者在論文中以一致和清晰的方式廣泛地獲取和引用數(shù)據(jù)尤為重要。
表6 各學(xué)科樣本期刊科研數(shù)據(jù)可用性聲明強度統(tǒng)計
表8所示為樣本期刊的各種數(shù)據(jù)引用規(guī)定,調(diào)查的樣本期刊在引用原則上普遍支持FORCE 11引用原則聯(lián)合聲明,雖然期刊有各自不同的引用格式,但基本上都包括作者、數(shù)據(jù)集名稱、數(shù)據(jù)集存儲庫名稱、數(shù)據(jù)集唯一標(biāo)識符4個最基本、最重要的要素。
表7 科研數(shù)據(jù)可用性聲明樣例
表8 各學(xué)科樣本期刊科研數(shù)據(jù)引用的規(guī)定
本研究根據(jù)期刊影響因子排名選出6個社科學(xué)科(每個學(xué)科選擇前30種期刊)的180種國際同行評議期刊,對這些期刊的科研數(shù)據(jù)政策進行多維度分析。結(jié)果表明,國外優(yōu)秀社科期刊制定和采用數(shù)據(jù)政策的數(shù)量較多,類型多樣,部分期刊的數(shù)據(jù)管理與共享政策已近乎完善。
限于篇幅和科研數(shù)據(jù)量龐大,本研究在調(diào)研過程中剔除了國內(nèi)樣本期刊,沒有進行國內(nèi)外期刊的對比分析,將另文闡述。選取的國外樣本期刊也只是擁有數(shù)據(jù)量較多的6個學(xué)科,樣本期刊也是本學(xué)科影響因子排名靠前的30種期刊,并未涵蓋所有社科學(xué)科和期刊,其結(jié)論是否適用于整個社科領(lǐng)域,需進行更深入的研究。
社科科研數(shù)據(jù)的管理與共享有利于數(shù)據(jù)價值的發(fā)揮,推動社科學(xué)科的發(fā)展,而科研數(shù)據(jù)的管理和共享離不開科研數(shù)據(jù)政策的規(guī)范和指導(dǎo)。因此,社科科研數(shù)據(jù)政策的制定,對我國社科研究具有重要意義。希望本研究結(jié)果能對我國社科科研數(shù)據(jù)管理和共享政策的制訂及實施產(chǎn)生積極影響。