桂婕 楊波 屈寶強 劉蔚 陳曉文
1.中國科學(xué)技術(shù)信息研究所 北京 100038;
2.北京科技審評中心 北京 101117
引用是表達對他人科研成果利用和致謝的重要方式之一??茖W(xué)數(shù)據(jù)引用(scientific data citation)指通過一定的標(biāo)識技術(shù)和機制,對所使用的科學(xué)數(shù)據(jù)資源進行描述,標(biāo)識數(shù)據(jù)的來源,通過科學(xué)數(shù)據(jù)引用在一定程度上促進了科學(xué)數(shù)據(jù)的知識產(chǎn)權(quán)保護,便于科學(xué)數(shù)據(jù)使用狀況的追蹤與統(tǒng)計分析。
學(xué)者Dodd 于1979 年就提出把數(shù)據(jù)看作智力作品,以與美國書目參考文獻標(biāo)準(zhǔn)一致的方式描述和引用數(shù)據(jù)集[1]。21 世紀(jì)以來,隨著數(shù)據(jù)在科研活動中的重要性不斷增加,對科學(xué)數(shù)據(jù)引用的重要性認(rèn)識不斷提升,許多機構(gòu)在推進科學(xué)數(shù)據(jù)引用方面做了大量工作。在科學(xué)數(shù)據(jù)唯一標(biāo)識體系方面,2009 年成立Datacite,將提供科學(xué)數(shù)據(jù)的DOI 注冊、管理與應(yīng)用作為一項重要服務(wù)。在科學(xué)數(shù)據(jù)引用索引體系構(gòu)建方面,2012 年,湯森路透旗下知識產(chǎn)權(quán)與科技事業(yè)部正式推出科學(xué)數(shù)據(jù)引文索引(DCI)數(shù)據(jù)庫,提供用戶工具來搜索和發(fā)現(xiàn)與研究有關(guān)的研究數(shù)據(jù)。在科學(xué)數(shù)據(jù)引用原則方面, “FORCE11”于2014 年發(fā)布了“FORCE11數(shù)據(jù)引用原則共同宣言”,提出了數(shù)據(jù)引用的八個原則:重要性、榮譽和署名、證據(jù)、唯一標(biāo)識、可獲取、永久性、專指性和可驗證性、互操作性和靈活性[2]。在科學(xué)數(shù)據(jù)出版方面,2012 年5 月,自然出版集團推出數(shù)據(jù)期刊《科學(xué)數(shù)據(jù)》。在科學(xué)數(shù)據(jù)引用著錄方面,許多國際組織、數(shù)據(jù)中心和研究人員提出了不同的引用標(biāo)準(zhǔn)[3-6],引用涉及的主要元素包括:作者、標(biāo)題、出版日期、版本、出版商、標(biāo)識符、位置等,我國也于2018 年1 月發(fā)布科學(xué)數(shù)據(jù)引用標(biāo)準(zhǔn)。在實現(xiàn)科學(xué)數(shù)據(jù)引用的關(guān)鍵技術(shù)和體系方面,自動生成引用和創(chuàng)建人機可讀的引用[7]、使用時間戳查詢[8]和版本控制方法[9]等相關(guān)方法開展動態(tài)科學(xué)數(shù)據(jù)引用方面都進行了相關(guān)探索。但是在學(xué)術(shù)交流實踐當(dāng)中,依然存在科學(xué)數(shù)據(jù)引用意識不強、科學(xué)數(shù)據(jù)引用著錄標(biāo)準(zhǔn)推廣不夠、科學(xué)數(shù)據(jù)引用基礎(chǔ)設(shè)施不完備以及科學(xué)數(shù)據(jù)粒度和版本帶來的技術(shù)問題等。本研究主要從理論上剖析科學(xué)數(shù)據(jù)引用的前提和動機,分析存在的相關(guān)問題,提出科學(xué)數(shù)據(jù)引用實現(xiàn)的相關(guān)措施。
2014 年1 月荷蘭萊頓舉辦的洛倫茲研討會上首次提出FAIR 原則,2016 年3 月Wilkinson等學(xué)者在《科學(xué)數(shù)據(jù)》(Scientific Data)上發(fā)表文章對它進行了系統(tǒng)性論述。FAIR 原則即Findable(可查找),Accessible(可訪問),Interoperable(可互操作)和Reusable(可重用),要求在科學(xué)研究中產(chǎn)生的數(shù)據(jù)都需遵從這一原則。從科學(xué)數(shù)據(jù)生命周期管理的角度出發(fā),科學(xué)數(shù)據(jù)引用發(fā)生在數(shù)據(jù)被研究者使用后,因此在研究過程中發(fā)現(xiàn)、獲取并真正使用了這些數(shù)據(jù),是引用產(chǎn)生的重要前提。
1.1.1 科學(xué)數(shù)據(jù)應(yīng)該被認(rèn)為是重要的研究產(chǎn)出
在學(xué)術(shù)記錄中,數(shù)據(jù)引用應(yīng)與其他研究對象(如出版物)的引用同等重要。隨著數(shù)據(jù)驅(qū)動科研范式的發(fā)展,數(shù)據(jù)越來越成為重要科研資源,同時科學(xué)數(shù)據(jù)作為研究過程中的重要產(chǎn)出形式得到了認(rèn)可。例如,2011 年在哈佛大學(xué)舉辦的IQSS 會議有關(guān)數(shù)據(jù)引用的討論中,明確提出引用數(shù)據(jù)“第一原理”:數(shù)據(jù)應(yīng)被視為和文獻同等重要的一流產(chǎn)出而實施引用,否則科研人員則不會在使用數(shù)據(jù)后主動地對其進行引用。
1.1.2 科學(xué)數(shù)據(jù)可以被發(fā)現(xiàn)和獲取
科學(xué)數(shù)據(jù)必須要存在于科研過程,只有科研人員能夠比較容易地獲取數(shù)據(jù)(有可能是自己制作),才有可能在研究過程中使用并引用。如果數(shù)據(jù)不能被發(fā)現(xiàn)并獲取,就談不上對其引用。因此科學(xué)數(shù)據(jù)引用依賴于數(shù)據(jù)的出版發(fā)布,以及幫助科研人員發(fā)現(xiàn)數(shù)據(jù)的基礎(chǔ)設(shè)施,包括用于發(fā)現(xiàn)數(shù)據(jù)的索引、導(dǎo)航、門戶等。
1.1.3 科學(xué)數(shù)據(jù)的內(nèi)容和價值應(yīng)得到使用者的認(rèn)可且被使用
真正滿足研發(fā)過程需求的科學(xué)數(shù)據(jù)不僅依賴于數(shù)據(jù)本身的內(nèi)容質(zhì)量,更依賴于其對研究過程中的適應(yīng)性、可開發(fā)性、可運算性。只有使用者認(rèn)可了數(shù)據(jù)內(nèi)容,并認(rèn)為其可以在研究過程中起到相關(guān)作用,才會觸發(fā)實施數(shù)據(jù)引用。實施數(shù)據(jù)引用要求科學(xué)數(shù)據(jù)被真正使用,為了某些計量學(xué)指標(biāo)看上去很好的虛假引用是學(xué)術(shù)規(guī)范所不容許的,必須是在實際研究過程中支撐研究內(nèi)容、對研究結(jié)論的形成有所幫助的數(shù)據(jù),才能對其進行引用。
1.1.4 使用和重用科學(xué)數(shù)據(jù)所產(chǎn)生的成果正式發(fā)布或者發(fā)表
使用和重用科學(xué)數(shù)據(jù)所產(chǎn)生的成果必須正式發(fā)布或者發(fā)表,且在發(fā)表的成果中以通用、可理解的格式表達出來才能真正實現(xiàn)科學(xué)數(shù)據(jù)引用,這些發(fā)表的成果是引用表達的場所,著錄的文字表達是其表現(xiàn)形式。
科學(xué)數(shù)據(jù)引用的核心動力來自于對科研人員數(shù)據(jù)工作認(rèn)可的需求、對科學(xué)研究過程再現(xiàn)的需求、對科學(xué)數(shù)據(jù)共享和利用效率提升的需求[10]。隨著科學(xué)數(shù)據(jù)引用的發(fā)展,在數(shù)據(jù)管理、科技管理和情報研究領(lǐng)域,數(shù)據(jù)發(fā)現(xiàn)和影響力追蹤也成了引用的重要動機。
1.2.1 科學(xué)數(shù)據(jù)引用是承認(rèn)數(shù)據(jù)工作者貢獻的重要方式
隨著科學(xué)研究活動協(xié)作的不斷擴展,在科研過程中需要涉及到科學(xué)數(shù)據(jù)工作相關(guān)人員的參與。這就需要記錄不同類型參與者的貢獻,以平衡合作過程中各利益相關(guān)者的需求和利益。
承認(rèn)數(shù)據(jù)對相關(guān)研究產(chǎn)生貢獻的方式可以有很多,包括致謝、引用、合著[11]。引用行為理論[12]通常認(rèn)為,引用之前的作品是為了承認(rèn)知識債務(wù),提供知識的歷史傳承,并引導(dǎo)讀者追本溯源。引用數(shù)據(jù)集的動力來自對在研究過程中產(chǎn)生的數(shù)據(jù)進行價值認(rèn)可,同時數(shù)據(jù)也會存在于學(xué)術(shù)發(fā)展的歷史傳承中。對于研究人員來講,這種在學(xué)術(shù)領(lǐng)域通過歷史傳承或者當(dāng)前發(fā)布數(shù)據(jù)而得到尊重、職業(yè)發(fā)展和獲得基金資助等是衡量其成功與否的重要內(nèi)容。這導(dǎo)致學(xué)術(shù)群體內(nèi)產(chǎn)生對規(guī)范性數(shù)據(jù)引用的期望,同時也引發(fā)通過各種方式對數(shù)據(jù)引用的宣傳和培訓(xùn)。
1.2.2 科學(xué)數(shù)據(jù)引用是提升科學(xué)活動透明度的重要途徑
引用數(shù)據(jù)提供了驗證科研過程的途徑,讀者能夠通過引用機制直接或間接獲取用于論文的數(shù)據(jù)文件,把數(shù)據(jù)用于其他假設(shè)、建立模型或與其他數(shù)據(jù)相結(jié)合,對研究結(jié)果和過程的驗證,從而使讀者對論文進行評價。例如Applications in Plant Sciences(APPS) 2016 年8 月簽署The Center for Open Science’s Transparency and Openness Promotion(TOP)[13]指南,提出促進數(shù)據(jù)透明、開放共享和可重現(xiàn)的8 個標(biāo)準(zhǔn),其中引用是第一標(biāo)準(zhǔn)。數(shù)據(jù)引用在提高科學(xué)透明度和結(jié)果再現(xiàn)性方面起著核心作用[14],這在生物醫(yī)學(xué)[15]、公共衛(wèi)生[16]和生物學(xué)[17]等領(lǐng)域都得到體現(xiàn)。另外,在計算機科學(xué)領(lǐng)域,也有通過共享結(jié)果、代碼及數(shù)據(jù)庫研究腳本的方式實現(xiàn)研究過程和結(jié)果再現(xiàn)的嘗試[18]。
1.2.3 科學(xué)數(shù)據(jù)引用是開展數(shù)據(jù)評價的重要依據(jù)
數(shù)據(jù)引用要求將更加完整的研究過程和結(jié)果提供給其他人,特別是通過適當(dāng)方式將出版物與支撐其研究結(jié)論形成的數(shù)據(jù)鏈接[19],數(shù)據(jù)引用著錄內(nèi)容從客觀上可以提供必要的信息來解釋數(shù)據(jù)的合法性,這可以作為是數(shù)據(jù)評價的重要基礎(chǔ)。科學(xué)數(shù)據(jù)引用還可實現(xiàn)通過跟蹤和溯源數(shù)據(jù)來間接進行數(shù)據(jù)質(zhì)量評價,并且利用科學(xué)計量的方法對引用行為記錄進行分析,通過計量結(jié)果間接評價數(shù)據(jù)質(zhì)量(假設(shè)使用頻率越高,說明該數(shù)據(jù)質(zhì)量越高;數(shù)據(jù)存儲依托的數(shù)據(jù)倉儲權(quán)威度越高,說明該數(shù)據(jù)質(zhì)量越高),還可以基于數(shù)據(jù)使用能力和水平開展科研人員、科研機構(gòu)乃至區(qū)域數(shù)據(jù)能力評價。
1.2.4 科學(xué)數(shù)據(jù)引用是學(xué)術(shù)交流的重要內(nèi)容
在表達形式方面,科學(xué)數(shù)據(jù)引用往往通過標(biāo)準(zhǔn)化形式體現(xiàn)引用行為和相關(guān)過程。通過研究人員、出版商、讀者等認(rèn)可的標(biāo)準(zhǔn)模板實現(xiàn)了科學(xué)數(shù)據(jù)引用創(chuàng)造、傳播、組織和檢索。科學(xué)數(shù)據(jù)引用則實現(xiàn)了科學(xué)共同體內(nèi)對數(shù)據(jù)利用行為的認(rèn)同[20]。在目前的科研管理體系當(dāng)中,科學(xué)數(shù)據(jù)引用已經(jīng)成為期刊出版商、資助機構(gòu)和數(shù)據(jù)倉儲的強制要求。科研人員遵從這些要求,主動或者被動地開展數(shù)據(jù)引用,將支撐論文主要觀點的數(shù)據(jù)、論文使用的數(shù)據(jù)等內(nèi)容清晰地著錄,可以幫助科學(xué)數(shù)據(jù)在學(xué)術(shù)共同體內(nèi)傳播,也是體現(xiàn)學(xué)術(shù)素養(yǎng)和學(xué)術(shù)規(guī)范的重要內(nèi)容。
從科學(xué)數(shù)據(jù)本身來講,由于數(shù)據(jù)的格式、類型、表現(xiàn)方式不同,數(shù)據(jù)引用面臨諸多挑戰(zhàn)。
1.3.1 科學(xué)數(shù)據(jù)多重粒度帶來引用識別不清晰
在科學(xué)出版物中引用的數(shù)據(jù)可能是全部數(shù)據(jù)集或者子集,也可能是數(shù)據(jù)集不同部分的資源聯(lián)合或不同數(shù)據(jù)集的組合。因此,數(shù)據(jù)被引用范圍可以從單一數(shù)據(jù)記錄到數(shù)據(jù)子集或數(shù)據(jù)集合,形態(tài)和結(jié)構(gòu)差異較大,這對科學(xué)數(shù)據(jù)引用實施會產(chǎn)生較大影響,也導(dǎo)致難以發(fā)現(xiàn)真正的數(shù)據(jù)引用行為。
1.3.2 科學(xué)數(shù)據(jù)多種來源帶來引用溯源不穩(wěn)定
科學(xué)數(shù)據(jù)引用需要明確科學(xué)數(shù)據(jù)來源,連同上下文信息一起來識別和發(fā)現(xiàn)數(shù)據(jù),在此基礎(chǔ)上開展數(shù)據(jù)溯源,掌握數(shù)據(jù)的原始狀態(tài),因此溯源模型對于將數(shù)據(jù)引用集成到數(shù)據(jù)管理流程具有較強的影響。由于科學(xué)數(shù)據(jù)來源的不確定,以及引用數(shù)據(jù)類型的多樣化,造成了引用溯源不穩(wěn)定,從而使得數(shù)據(jù)追蹤和評價不準(zhǔn)確。
1.3.3 科學(xué)數(shù)據(jù)多地存儲帶來引用關(guān)聯(lián)不準(zhǔn)確
科學(xué)數(shù)據(jù)引用機制實現(xiàn)的關(guān)鍵是數(shù)據(jù)有固定的存儲位置,且能夠長久存儲??茖W(xué)數(shù)據(jù)存儲位置及時效性差異導(dǎo)致引用追蹤、論文與數(shù)據(jù)關(guān)聯(lián)不準(zhǔn)確等問題。如果數(shù)據(jù)存儲在正式的、可信的數(shù)據(jù)倉儲,則可以更好地保證可以通過永久標(biāo)識關(guān)聯(lián)或解析到數(shù)據(jù)內(nèi)容;如果數(shù)據(jù)存儲在個人或者研究團隊個人電腦的硬盤,則很難保證準(zhǔn)確關(guān)聯(lián)。
科學(xué)數(shù)據(jù)引用著錄形式不統(tǒng)一,位置多樣,可能在摘要、致謝和方法部分。例如在對某期刊的引用情況分析中發(fā)現(xiàn),在242 次科學(xué)數(shù)據(jù)引用中,出現(xiàn)在標(biāo)題4 次,摘要59 次,正文167 次,而參考文獻僅為12 次。有些引用著錄描述模糊,讀者不清楚具體是什么數(shù)據(jù)(無數(shù)據(jù)名、無作者信息、無獲取信息,無永久的唯一標(biāo)識符),例如“以德溫特創(chuàng)新索引作為數(shù)據(jù)源”“利用網(wǎng)頁爬蟲技術(shù)獲取新浪微博數(shù)據(jù)”之類的表達[20]。這種多樣化、模糊的引用著錄造成了對同一文獻中不同數(shù)據(jù)、不同文獻中同一數(shù)據(jù)的引用追蹤無從下手。
科學(xué)數(shù)據(jù)引用對于數(shù)據(jù)生產(chǎn)者、管理者、使用者等圍繞數(shù)據(jù)價值實現(xiàn)的利益平衡具有重要作用,其實現(xiàn)依賴于各個利益相關(guān)者的共同努力。數(shù)據(jù)提供者主要是產(chǎn)生特定科學(xué)數(shù)據(jù)的個人、團體、組織,在科學(xué)數(shù)據(jù)引用實現(xiàn)過程中的主要職責(zé)包括產(chǎn)生科學(xué)數(shù)據(jù),對科學(xué)數(shù)據(jù)進行加工整理,提升數(shù)據(jù)質(zhì)量;形成科學(xué)數(shù)據(jù)描述性內(nèi)容和元數(shù)據(jù)確保數(shù)據(jù)以可引用的格式存檔,以合適的元數(shù)據(jù)提交數(shù)據(jù);將元數(shù)據(jù)和數(shù)據(jù)提交數(shù)據(jù)倉儲或者存儲中心;在學(xué)術(shù)履歷中列出其生產(chǎn)的數(shù)據(jù)集,將其作為一種學(xué)術(shù)成果。數(shù)據(jù)用戶指使用科學(xué)數(shù)據(jù)的科研人員。他們應(yīng)充分了解數(shù)據(jù)引用規(guī)范、遵守數(shù)據(jù)使用的各種約束,在使用過程中應(yīng)對使用的科學(xué)數(shù)據(jù)進行合理規(guī)范著錄,盡可能地使用數(shù)據(jù)集的唯一標(biāo)識符(比如DOI),并且通知數(shù)據(jù)提供者有關(guān)數(shù)據(jù)使用所形成的成果。在發(fā)表相關(guān)成果時,將數(shù)據(jù)作為出版物的附件一起提交或者建立出版物與數(shù)據(jù)之間的有效關(guān)聯(lián)。數(shù)據(jù)分發(fā)者是數(shù)據(jù)生產(chǎn)者和使用者之間的中介,這些機構(gòu)主要管理來自學(xué)者或機構(gòu)提交的科學(xué)數(shù)據(jù),參與建立統(tǒng)一的數(shù)據(jù)引用標(biāo)準(zhǔn),支持并促進唯一標(biāo)識符使用,推動形成完整的數(shù)據(jù)出版體系,推動建設(shè)科學(xué)數(shù)據(jù)描述、發(fā)現(xiàn)、使用的基礎(chǔ)設(shè)施和技術(shù)體系,使用自動化工具跟蹤數(shù)據(jù)查看、搜索、下載、鏈接或引用行為,并反饋給數(shù)據(jù)生產(chǎn)和提供者。數(shù)據(jù)共享促進者包括相關(guān)國際組織、政府部門、基金資助者、學(xué)術(shù)共同體、公眾。這些角色應(yīng)積極參與制定數(shù)據(jù)共享政策、數(shù)據(jù)出版政策與引用規(guī)范,開發(fā)數(shù)據(jù)管理工具及支持性服務(wù)并且推動將科學(xué)數(shù)據(jù)納入科研評價體系。
如本文第一部分指出的,上述各個利益相關(guān)者圍繞數(shù)據(jù)引用標(biāo)準(zhǔn)制定、技術(shù)設(shè)施建設(shè)、政策制度出臺開展了大量工作,但是科學(xué)數(shù)據(jù)引用仍存在較大挑戰(zhàn)。首先,從引用對象角度,需要確??茖W(xué)數(shù)據(jù)大規(guī)模穩(wěn)定存儲、科學(xué)精細(xì)化管理、詳盡細(xì)致性描述,永久長期性標(biāo)識,把數(shù)據(jù)當(dāng)作重要資產(chǎn)看待;其次,從引用行為角度,需要不斷促進引用中的標(biāo)準(zhǔn)化著錄、數(shù)據(jù)化追蹤、指標(biāo)化計算和真實性評價反饋,形成科學(xué)數(shù)據(jù)引用的運行體系;從引用實現(xiàn)環(huán)境角度,要求進行科學(xué)數(shù)據(jù)引用便捷性著錄、評價方法針對性植入、技術(shù)工具全流程覆蓋、引用意識和水平大幅度提升,將引用嵌入到科研活動過程中去。
基于上述考慮,本研究認(rèn)為,科學(xué)數(shù)據(jù)引用的實現(xiàn)需要從以下幾個方面推進:
圖1 科學(xué)數(shù)據(jù)引用的實現(xiàn)路徑
將科學(xué)數(shù)據(jù)引用融入科學(xué)數(shù)據(jù)生產(chǎn)制作、發(fā)布出版、共享利用、分析計量的過程,并且全面準(zhǔn)確記錄與分析。從科學(xué)數(shù)據(jù)生命周期來看,數(shù)據(jù)被不同實體基于不同目的而生產(chǎn)、出版、傳播、利用、評價、共享和重用,這些行為之間相互聯(lián)系,相互作用,共同構(gòu)成數(shù)據(jù)生命周期??茖W(xué)數(shù)據(jù)引用的出現(xiàn)和推廣改變了傳統(tǒng)的數(shù)據(jù)管理和使用生態(tài)體系,同時改變了學(xué)術(shù)交流的模式。
因此,需要在現(xiàn)有的生命周期中將引用作為重要環(huán)節(jié),強調(diào)其對科學(xué)數(shù)據(jù)生產(chǎn)、出版、計量、共享的作用。數(shù)據(jù)引用可以被視為使用數(shù)據(jù)的信號,間接體現(xiàn)了數(shù)據(jù)工作者的能力和水平。數(shù)據(jù)計量可以測度和評價數(shù)據(jù)共享貢獻度,促使數(shù)據(jù)引用走向規(guī)范化和標(biāo)準(zhǔn)化,方便了數(shù)據(jù)發(fā)現(xiàn)與獲取,使得數(shù)據(jù)共享更可能發(fā)生。數(shù)據(jù)出版使得科學(xué)數(shù)據(jù)引用可以更好融入現(xiàn)有學(xué)術(shù)交流體系,允許更高質(zhì)量數(shù)據(jù)以更加正式的方式被使用者發(fā)現(xiàn),促進數(shù)據(jù)流轉(zhuǎn),從而產(chǎn)生數(shù)據(jù)引用。數(shù)據(jù)引用為數(shù)據(jù)計量提供了對象和內(nèi)容,同時豐富和充實了科學(xué)計量相關(guān)方法和指標(biāo)。
通過政策引導(dǎo)、基礎(chǔ)設(shè)施保障、著錄規(guī)則設(shè)定,不斷完善在學(xué)術(shù)交流體系中科學(xué)數(shù)據(jù)引用行為、特征的規(guī)范化表達。政策指導(dǎo)層面提出數(shù)據(jù)引用的導(dǎo)向和要求,規(guī)范層面制定數(shù)據(jù)引用描述與表達的著錄標(biāo)準(zhǔn),基礎(chǔ)設(shè)施層面建設(shè)支撐數(shù)據(jù)引用的工具及服務(wù)。
2.2.1 科學(xué)數(shù)據(jù)引用政策體系
在科學(xué)數(shù)據(jù)管理和共享過程中,涉及一些硬性的責(zé)權(quán)約束體系(例如法律政策、合同協(xié)議等)以及軟性的約束體系(例如操作指南、倫理規(guī)范、學(xué)術(shù)要求等),通過這些可以實現(xiàn)科學(xué)數(shù)據(jù)共享中各個利益相關(guān)者的權(quán)益[21],提出科學(xué)數(shù)據(jù)引用實施的內(nèi)容、要求和方法。科學(xué)數(shù)據(jù)引用需要從政策體系、共享協(xié)議和倫理規(guī)范角度分析各個利益方的責(zé)任與權(quán)益,并通過制定政策、編纂數(shù)據(jù)共享協(xié)議約束各方的利益關(guān)系與行為、規(guī)范數(shù)據(jù)用戶和數(shù)據(jù)提供者之間的權(quán)利和義務(wù),反思數(shù)據(jù)獲取中的倫理問題。通過保障科學(xué)數(shù)據(jù)利用過程中各利益相關(guān)者權(quán)益,使得數(shù)據(jù)使用更加順暢,進而保障數(shù)據(jù)引用的實現(xiàn)。
2.2.2 科學(xué)數(shù)據(jù)著錄標(biāo)準(zhǔn)
科學(xué)數(shù)據(jù)引用需要對引用行為進行一致的形式化描述、規(guī)范化表達。各類組織、專業(yè)協(xié)會和期刊可以通過提供重要的數(shù)據(jù)引用標(biāo)準(zhǔn)促進規(guī)范化,同時提出這些表達的模板。由于各類標(biāo)準(zhǔn)化數(shù)據(jù)引用方法被鼓勵并使用,以及長期穩(wěn)定的數(shù)據(jù)存儲和技術(shù)體系,使得數(shù)據(jù)使用者可以通過數(shù)據(jù)引用著錄內(nèi)容很容易查找和使用數(shù)據(jù)。
引用是學(xué)術(shù)作品交流傳播的足跡,根據(jù)這些足跡可以判斷數(shù)據(jù)流通和傳播的方向,可以為使用/重用這些數(shù)據(jù)的用戶進行畫像,這些行為的分散和多樣性可以為使用數(shù)據(jù)是否有序、有目的性提供線索。由引用著錄所體現(xiàn)出客觀存在的數(shù)據(jù)被不同科研人員使用的特點、模式和規(guī)律,可以不斷充實和豐富科學(xué)計量的相關(guān)應(yīng)用,基于數(shù)據(jù)引用著錄內(nèi)容開展分析可以幫助分析科研人員思想譜系,形成數(shù)據(jù)用戶和數(shù)據(jù)提供者之間的有向網(wǎng)絡(luò),更好把握數(shù)據(jù)的利用情況。
2.2.3 科學(xué)數(shù)據(jù)引用基礎(chǔ)設(shè)施
科學(xué)數(shù)據(jù)引用的基礎(chǔ)設(shè)施用來支撐數(shù)據(jù)引用格式和標(biāo)準(zhǔn)形成、確認(rèn)數(shù)據(jù)及引用的永久性、方便數(shù)據(jù)集檢索和互操作、理解數(shù)據(jù)溯源和貢獻追蹤。科學(xué)數(shù)據(jù)引用基礎(chǔ)設(shè)施應(yīng)該解決幾個問題:第一,解決科學(xué)數(shù)據(jù)大規(guī)模存儲和管理的問題,為引用實施中數(shù)據(jù)溯源和驗證提供基礎(chǔ)。主要通過數(shù)據(jù)倉儲的專業(yè)數(shù)據(jù)監(jiān)管工作來實現(xiàn)。第二,解決科學(xué)數(shù)據(jù)精細(xì)化描述與標(biāo)識的問題,為引用過程中準(zhǔn)確定位和導(dǎo)航提供基礎(chǔ)。主要是通過科學(xué)數(shù)據(jù)唯一標(biāo)識(DOI、ARK)及其解析系統(tǒng)來實現(xiàn)。第三,解決科學(xué)數(shù)據(jù)引用著錄和生成的問題,為引用行為記錄和自動分析提供基礎(chǔ)。主要是通過統(tǒng)一著錄標(biāo)準(zhǔn)以及相應(yīng)的工具體系來實現(xiàn)。第四,解決科學(xué)數(shù)據(jù)識別和計量的問題,為引用行為挖掘和規(guī)律總結(jié)提供基礎(chǔ)。主要是通過建設(shè)不同形式的科學(xué)數(shù)據(jù)引文索引庫,以及以此為數(shù)據(jù)基礎(chǔ)開展分析評價來實現(xiàn)。
科學(xué)數(shù)據(jù)引用要求數(shù)據(jù)生產(chǎn)者、數(shù)據(jù)使用者以及其他利益相關(guān)者各司其職,協(xié)同推進科學(xué)數(shù)據(jù)引用意識提升、標(biāo)準(zhǔn)執(zhí)行、挖掘利用。從改變科學(xué)數(shù)據(jù)利益相關(guān)者關(guān)系角度來看,數(shù)據(jù)引用改變了傳統(tǒng)的科學(xué)研究過程中的權(quán)益分配和職責(zé)范疇。表面上看,數(shù)據(jù)引用行為主要發(fā)生在數(shù)據(jù)的使用環(huán)節(jié),但是在數(shù)據(jù)引用實施過程中,需要各個利益相關(guān)者在數(shù)據(jù)查詢獲取、分析處理、歸檔保存、交流重用等行為各個環(huán)節(jié)各司其職,共同努力[22]。沒有所有利益相關(guān)者合作,不可能有效開展科學(xué)數(shù)據(jù)開放共享,建立引用機制,并進行數(shù)據(jù)影響力度量。
從參與主體角度來看,科學(xué)數(shù)據(jù)引用的實現(xiàn)依賴于各利益相關(guān)者對科學(xué)數(shù)據(jù)引用的認(rèn)同,從而形成學(xué)術(shù)群體內(nèi)遵守的通用行為準(zhǔn)則,并協(xié)同進行技術(shù)、標(biāo)準(zhǔn)、行為等各個方面的努力。
我國將科學(xué)數(shù)據(jù)引用作為推進科學(xué)數(shù)據(jù)共享與管理的重要手段,開展了一系列相關(guān)工作。在科學(xué)數(shù)據(jù)引用相關(guān)政策方面,2018 年發(fā)布的《科學(xué)數(shù)據(jù)管理辦法》中明確要求:科學(xué)數(shù)據(jù)使用者應(yīng)遵守知識產(chǎn)權(quán)相關(guān)規(guī)定,在論文發(fā)表、專利申請、專著出版等工作中注明所使用和參考引用的科學(xué)數(shù)據(jù)。在科學(xué)數(shù)據(jù)著錄標(biāo)準(zhǔn)方面,國家參考文獻著錄標(biāo)準(zhǔn)(GB/T 7714-2015)添加文獻類型標(biāo)識“DS”數(shù)據(jù)集,科學(xué)數(shù)據(jù)的引用納入?yún)⒖嘉墨I著錄內(nèi)容,同時2018 年實施的科學(xué)數(shù)據(jù)引用標(biāo)準(zhǔn)(GB/T 35294-2017)規(guī)定了科學(xué)數(shù)據(jù)引用元素描述方法、引用元素詳細(xì)說明、引用格式等方面的內(nèi)容。在科學(xué)數(shù)據(jù)引用基礎(chǔ)設(shè)施建設(shè)方面,已經(jīng)形成“國家高能物理科學(xué)數(shù)據(jù)中心”等20 個國家科學(xué)數(shù)據(jù)中心、“國家重要野生植物種質(zhì)資源庫”等30 個國家生物種質(zhì)與實驗材料資源庫,為可引用科學(xué)數(shù)據(jù)資源的長期存儲和科學(xué)管理提供重要基礎(chǔ)。圍繞實現(xiàn)科學(xué)數(shù)據(jù)引用的重要路徑,結(jié)合我國科學(xué)數(shù)據(jù)管理辦法落實相關(guān)要求,為推動我國科學(xué)數(shù)據(jù)引用的發(fā)展,提出以下建議。
鼓勵各類基金資助機構(gòu)、期刊出版社、數(shù)據(jù)中心形成促進科學(xué)數(shù)據(jù)引用的相關(guān)政策,引導(dǎo)和加強學(xué)者的數(shù)據(jù)引用意識。同時,加強科學(xué)數(shù)據(jù)引用的宣傳推廣,讓每一個科研人員能夠認(rèn)識到其重要性,營造整個科學(xué)領(lǐng)域“用則引”的氛圍。在科研過程產(chǎn)生的不同類型、不同形式的產(chǎn)出中盡可能對引用行為開展著錄,體現(xiàn)數(shù)據(jù)工作的重要性??梢钥紤]使用GB/T 2015-7714 參考文獻著錄標(biāo)準(zhǔn)開展著錄,利用“DS”標(biāo)識數(shù)據(jù)引用。也可以以我國2018 年1 月發(fā)布的《信息技術(shù)科學(xué)數(shù)據(jù)引用》(GB/T 35294-2017)標(biāo)準(zhǔn)為基礎(chǔ)開展著錄。
破除“四唯”是我國深化科技體制改革激發(fā)創(chuàng)新活力的重要舉措,當(dāng)“破四唯”成為廣泛共識,如何“立新標(biāo)”成為重點,科學(xué)數(shù)據(jù)工作理應(yīng)成為科研評價的重要內(nèi)容。可以通過記錄數(shù)據(jù)發(fā)現(xiàn)、瀏覽、使用等全過程,強化計量分析,為科學(xué)數(shù)據(jù)工作改善和價值發(fā)揮提供支撐。在此過程中,加強科學(xué)數(shù)據(jù)描述、檢索、關(guān)聯(lián)、發(fā)現(xiàn)、計量等理論方法的研究,開展數(shù)據(jù)共現(xiàn)、數(shù)據(jù)共引、數(shù)據(jù)聚類、數(shù)據(jù)網(wǎng)絡(luò)分析,探索研究提出數(shù)據(jù)H 指數(shù)、數(shù)據(jù)引用指數(shù)等,豐富科學(xué)評價內(nèi)容。加強數(shù)據(jù)與各類科研產(chǎn)出之間的關(guān)聯(lián)分析,以論文與數(shù)據(jù)之間的鏈接分析為基礎(chǔ),拓展數(shù)據(jù)與數(shù)據(jù)、數(shù)據(jù)與專利、數(shù)據(jù)與報告等其他產(chǎn)出關(guān)聯(lián)分析的理論方法。
深化國家科學(xué)數(shù)據(jù)中心、領(lǐng)域數(shù)據(jù)中心、機構(gòu)數(shù)據(jù)倉儲的綜合服務(wù)體系建設(shè),既兼顧宏觀上總體領(lǐng)域、區(qū)域布局的合理性,同時注重每個數(shù)據(jù)倉儲在科學(xué)數(shù)據(jù)獲取、存儲、質(zhì)量控制、安全等方面的系統(tǒng)性。通過元數(shù)據(jù)互聯(lián)互通,構(gòu)建全國一體化科學(xué)數(shù)據(jù)服務(wù)網(wǎng)絡(luò),實現(xiàn)從單個數(shù)據(jù)存儲機構(gòu)(數(shù)據(jù)中心、機構(gòu)知識庫、共享平臺等)服務(wù)到協(xié)同服務(wù)網(wǎng)絡(luò)過渡。探索從其他科技信息資源管理系統(tǒng)的工作流中抽取數(shù)據(jù),將科學(xué)數(shù)據(jù)與研究過程中的實體、產(chǎn)出、活動關(guān)聯(lián)。