劉少芳
(廣東省科技圖書館(廣東省科學(xué)院信息研究所),廣東 廣州 510070)
隨著5G、云計(jì)算、大數(shù)據(jù)、物聯(lián)網(wǎng)及人工智能等技術(shù)的飛速發(fā)展,數(shù)據(jù)量急劇增加,網(wǎng)絡(luò)安全威脅也持續(xù)放大。 數(shù)據(jù)作為網(wǎng)絡(luò)運(yùn)行的核心載體,保護(hù)其安全是應(yīng)對(duì)網(wǎng)絡(luò)安全挑戰(zhàn)的重中之重。 2017 年實(shí)施的《中華人民共和國網(wǎng)絡(luò)安全法》明確規(guī)定鼓勵(lì)開發(fā)網(wǎng)絡(luò)數(shù)據(jù)安全保護(hù)和利用技術(shù),促進(jìn)公共數(shù)據(jù)資源開放,采取重要數(shù)據(jù)備份和加密等措施,維護(hù)網(wǎng)絡(luò)數(shù)據(jù)的保密性、完整性和可用性[1]。 2021 年發(fā)布的《中華人民共和國國民經(jīng)濟(jì)和社會(huì)發(fā)展第十四個(gè)五年規(guī)劃和2035 年遠(yuǎn)景目標(biāo)綱要》14 次提及網(wǎng)絡(luò)安全,5 次提及數(shù)據(jù)安全[2],對(duì)加強(qiáng)網(wǎng)絡(luò)安全保障體系及能力建設(shè)、確保公共數(shù)據(jù)安全做出了重要部署,可見網(wǎng)絡(luò)安全和數(shù)據(jù)安全是國家安全體系的核心要素,并已逐步成為國家戰(zhàn)略。 此外,2021 年我國又相繼發(fā)布了《中華人民共和國數(shù)據(jù)安全法》和《網(wǎng)絡(luò)數(shù)據(jù)安全管理?xiàng)l例(征求意見稿)》,網(wǎng)絡(luò)數(shù)據(jù)安全的重要性日益凸顯。
研究數(shù)據(jù)作為網(wǎng)絡(luò)數(shù)據(jù)的重要組成部分,是科學(xué)研究過程中產(chǎn)生的原始記錄及其衍生數(shù)據(jù),承載著重要的研究信息,是支撐科學(xué)研究發(fā)展的重要戰(zhàn)略資源,其安全問題不容小覷,尤其在網(wǎng)絡(luò)安全背景下,研究數(shù)據(jù)安全管理越來越受到關(guān)注。
筆者選取加拿大10 家具有代表性的圖書館為調(diào)研對(duì)象,包含9 家研究型大學(xué)的圖書館,1 家公共圖書館,通過網(wǎng)絡(luò)調(diào)研和文獻(xiàn)調(diào)研等方法,從政策管理、組織實(shí)施、基礎(chǔ)設(shè)施保障、教育培訓(xùn)等方面梳理加拿大圖書館在研究數(shù)據(jù)安全管理服務(wù)領(lǐng)域的實(shí)踐經(jīng)驗(yàn),詳見下頁表1。
表1 加拿大圖書館調(diào)研清單
在政策規(guī)劃方面,加拿大通過聯(lián)邦政府、資助機(jī)構(gòu)、圖書館等層級(jí)頒布政策予以支持引導(dǎo)。 2014年,加拿大政府啟動(dòng)“開放數(shù)據(jù)”行動(dòng),旨在促進(jìn)科學(xué)研究產(chǎn)出數(shù)據(jù)的開放獲取,驅(qū)動(dòng)科技創(chuàng)新[3]。2016 年,加拿大自然科學(xué)和工程研究理事會(huì)、加拿大衛(wèi)生研究院、加拿大社會(huì)科學(xué)和人文科學(xué)研究理事會(huì)三大基金組織聯(lián)合頒布《關(guān)于數(shù)字?jǐn)?shù)據(jù)管理原則的三方聲明》,明確了研究人員、研究群體、研究機(jī)構(gòu)和科研資助機(jī)構(gòu)在研究數(shù)據(jù)管理過程中各自所應(yīng)承擔(dān)的職責(zé)[4]。 2018 年,加拿大出臺(tái)《三部門研究數(shù)據(jù)管理政策咨詢草案》,目的是通過推廣完善的數(shù)據(jù)管理實(shí)踐促進(jìn)開展追求卓越的科研活動(dòng)[5]。多家加拿大圖書館從信息安全、數(shù)據(jù)保密、知識(shí)產(chǎn)權(quán)、數(shù)據(jù)館藏發(fā)展等不同維度制定了數(shù)據(jù)管理內(nèi)部政策,如:皇后大學(xué)圖書館制定了《研究數(shù)據(jù)管理的數(shù)據(jù)保存政策》,對(duì)研究數(shù)據(jù)的保存標(biāo)準(zhǔn)、數(shù)據(jù)庫建設(shè)及數(shù)據(jù)存儲(chǔ)等提出了指導(dǎo)性建議。
在研究數(shù)據(jù)管理計(jì)劃(DMP)方面,DMP 規(guī)定了項(xiàng)目每個(gè)階段如何組織、存儲(chǔ)、共享研究數(shù)據(jù),這是一種實(shí)時(shí)文檔,可以調(diào)整項(xiàng)目研究過程的變化,主要包括工具和計(jì)劃清單兩種服務(wù)方式。 工具有三種,即DMP 助手、DMP 工具和DMP 在線,DMP 助手是加拿大自主開發(fā)的雙語工具(英語和法語),可內(nèi)置個(gè)性化模板,適應(yīng)性好,從管理工具層面就開始保護(hù)研究數(shù)據(jù)的安全性;DMP 工具由加利福尼亞數(shù)字圖書館托管,美國國家科學(xué)基金會(huì)等10 多家美國資助機(jī)構(gòu)提供定制DMP 模板;DMP 在線是由英國數(shù)據(jù)監(jiān)管中心創(chuàng)建的免費(fèi)DMP 工具。 計(jì)劃清單服務(wù)內(nèi)容包括數(shù)據(jù)采集、文檔和元數(shù)據(jù)、儲(chǔ)存與備份、數(shù)據(jù)共享、責(zé)任與資源、道德與知識(shí)產(chǎn)權(quán)等,覆蓋研究數(shù)據(jù)全生命周期。
資助者或其他有意者建立新聯(lián)系,提供安全存儲(chǔ)的權(quán)威數(shù)據(jù)副本,可能被另一項(xiàng)研究發(fā)現(xiàn)并應(yīng)用等。在數(shù)據(jù)共享方面,麥吉爾大學(xué)圖書館介紹了如何合理合法地共享研究數(shù)據(jù),包括獲得知情同意后才能共享數(shù)據(jù)、通過匿名保護(hù)個(gè)人/機(jī)密/敏感信息、限制數(shù)據(jù)訪問量或添加禁令、申請(qǐng)?jiān)S可證等方式[7]。 阿爾伯塔大學(xué)圖書館和維多利亞大學(xué)圖書館則推薦采用Dataverse 共享數(shù)據(jù)。 Dataverse 系統(tǒng)在上傳文件時(shí)會(huì)頒發(fā)一個(gè)已在DataCite 注冊(cè)的永久性標(biāo)識(shí)(DOI),而DataCite 允許通過各種搜索工具挖掘數(shù)據(jù)。 此外,加拿大國家圖書館暨檔案館與加拿大各地的學(xué)術(shù)機(jī)構(gòu)和圖書館等共同制定了共享館藏管理策略,包括跟蹤、分類和保存加拿大出版物的最新版本。 在數(shù)據(jù)引用方面,英屬哥倫比亞大學(xué)圖書館建議通過開放獲取的數(shù)據(jù)庫查找和引用研究數(shù)據(jù),可在谷歌學(xué)術(shù)等網(wǎng)站注冊(cè)免費(fèi)賬戶,同時(shí)將研究數(shù)據(jù)唯一的網(wǎng)址或DOI 鏈接添加到用戶配置文件當(dāng)中[8],以保障研究數(shù)據(jù)安全。
數(shù)據(jù)共享引用為發(fā)現(xiàn)和重復(fù)利用數(shù)據(jù)集提供了途徑,同時(shí)也有助于評(píng)估研究數(shù)據(jù)的影響力[6]。 在信任的數(shù)據(jù)庫中共享研究數(shù)據(jù)具有以下優(yōu)點(diǎn):允許他人驗(yàn)證數(shù)據(jù),增加引用量,有利于與潛在合作方、整個(gè)項(xiàng)目周期會(huì)不斷產(chǎn)出研究數(shù)據(jù),數(shù)據(jù)丟失對(duì)推動(dòng)項(xiàng)目研究進(jìn)程極其不利,因而保障項(xiàng)目全周期的數(shù)據(jù)儲(chǔ)存安全、備份和維護(hù)至關(guān)重要。 多倫多大學(xué)圖書館等建議研究數(shù)據(jù)存儲(chǔ)應(yīng)遵循3—2—1 備份規(guī)則,即至少存儲(chǔ)三份數(shù)據(jù)副本,將副本存儲(chǔ)于兩種不同介質(zhì)(如硬盤、云存儲(chǔ)、光盤),將一份備份副本存儲(chǔ)在異地。 加拿大圖書館研究數(shù)據(jù)的長期存儲(chǔ)和共享方式主要有校內(nèi)/校外研究數(shù)據(jù)機(jī)構(gòu)庫、特定學(xué)科數(shù)據(jù)庫和數(shù)據(jù)機(jī)構(gòu)庫聯(lián)盟等4 種,其中3 家圖書館建有校內(nèi)研究數(shù)據(jù)機(jī)構(gòu)庫,分別是英屬哥倫比亞大學(xué)圖書館的UBC IT Storage、阿爾伯塔大學(xué)圖書館的ERA 和渥太華大學(xué)圖書館的uOResearch;使用較多的校外數(shù)據(jù)機(jī)構(gòu)庫有Compute Canada、ICPSR和Dryad 等,系統(tǒng)定期備份,以保護(hù)用戶數(shù)據(jù)的安全性和完整性。 此外,阿爾伯塔大學(xué)圖書館等還推薦使用特定的學(xué)科數(shù)據(jù)庫,如Re3data.org、OAD 等,以滿足不同研究者的需求。 Re3data. org 由德國研究基金會(huì)資助,是涵蓋不同學(xué)科的研究數(shù)據(jù)存儲(chǔ)庫,為研究人員、資助機(jī)構(gòu)、出版商和學(xué)術(shù)機(jī)構(gòu)提供永久存儲(chǔ)和訪問數(shù)據(jù)集服務(wù)。 在數(shù)據(jù)機(jī)構(gòu)庫聯(lián)盟方面,除了英屬哥倫比亞大學(xué)圖書館和加拿大國家圖書館暨檔案館,其他8 家圖書館均使用Dataverse。 Dataverse 是一個(gè)可公開訪問的免費(fèi)數(shù)據(jù)存儲(chǔ)庫,能夠保護(hù)和共享研究數(shù)據(jù),還可設(shè)置訪問權(quán)限,與特定個(gè)人共享數(shù)據(jù),保障數(shù)據(jù)安全。
除了阿爾伯塔大學(xué)圖書館和加拿大國家圖書館暨檔案館,其他8 家圖書館均提供教育培訓(xùn),形式包括在線培訓(xùn)、論壇、專題研討會(huì)、講座等。 其中,6 家圖書館推薦MANTRA 培訓(xùn)課程,該課程面向研究生、科學(xué)家、高學(xué)歷人員和信息專業(yè)人員,培訓(xùn)內(nèi)容包括數(shù)據(jù)管理計(jì)劃、元數(shù)據(jù)、文件格式與轉(zhuǎn)換、存儲(chǔ)與安全、共享與引用等;5 家圖書館推薦使用加拿大數(shù)字圖書館聯(lián)盟的培訓(xùn)資源[9],該聯(lián)盟提供了一系列可免費(fèi)獲取的培訓(xùn)材料,涵蓋研究數(shù)據(jù)的生命周期,包括一頁指南、在線培訓(xùn)模塊、在線視頻等,資源面向研究人員、圖書館數(shù)據(jù)專家、數(shù)據(jù)管理人員以及相關(guān)領(lǐng)域的學(xué)科專家。
政府層面的政策是實(shí)現(xiàn)研究數(shù)據(jù)安全管理與共享的基石。 加拿大的研究數(shù)據(jù)管理政策可分為“政府—資助機(jī)構(gòu)—圖書館”三個(gè)層面,從頂層設(shè)計(jì)開始規(guī)劃數(shù)據(jù)安全管理。 我國也應(yīng)構(gòu)建“中央—地方政府—科研管理部門—圖書館”自上而下的政策體系,按照“誰擁有,誰負(fù)責(zé)”“誰開放,誰受益”原則,明確研究數(shù)據(jù)管理各環(huán)節(jié)主體的職責(zé)分工。 目前,國務(wù)院已出臺(tái)我國首個(gè)國家層面的科學(xué)數(shù)據(jù)管理辦法,四川、山東、吉林、安徽等省份也相繼頒布了科學(xué)數(shù)據(jù)管理政策,后續(xù)應(yīng)進(jìn)一步完善多層級(jí)的政策體系,鼓勵(lì)科研管理部門和圖書館制定相應(yīng)的內(nèi)部政策,通過強(qiáng)化頂層設(shè)計(jì),逐步引導(dǎo)全社會(huì)提高研究數(shù)據(jù)管理和維護(hù)意識(shí),促進(jìn)研究數(shù)據(jù)安全管理和共享氛圍的形成。
加拿大圖書館在研究數(shù)據(jù)管理的計(jì)劃制訂、存儲(chǔ)及共享引用等環(huán)節(jié)均有相應(yīng)的安全管理措施。 我國圖書館可借鑒其經(jīng)驗(yàn),在研究數(shù)據(jù)管理的關(guān)鍵環(huán)節(jié)上下功夫,切實(shí)做好數(shù)據(jù)安全管理工作,如:在數(shù)據(jù)管理方面鼓勵(lì)有能力的機(jī)構(gòu)自主研發(fā)符合本地實(shí)際且能滿足科研人員需求的個(gè)性化DMP 工具,通過本土管理工具保護(hù)數(shù)據(jù)安全;在數(shù)據(jù)存儲(chǔ)方面鼓勵(lì)科研人員對(duì)重要的研究數(shù)據(jù)進(jìn)行異地備份,同時(shí)加強(qiáng)研究數(shù)據(jù)安全管理制度和宣傳保護(hù)工作;在數(shù)據(jù)共享引用方面推薦安全的數(shù)據(jù)共享、獲取途徑,引導(dǎo)科研人員通過獲得知情同意、申請(qǐng)?jiān)S可等方式共享研究數(shù)據(jù),并在其科研成果中規(guī)范引用所使用和參考的研究數(shù)據(jù)。 此外,我國圖書館還可將研究數(shù)據(jù)安全管理服務(wù)嵌入科研項(xiàng)目的研究過程,通過一站式服務(wù)調(diào)動(dòng)科研人員參與數(shù)據(jù)管理的積極性和主動(dòng)性,在保證數(shù)據(jù)安全的基礎(chǔ)上,提升研究數(shù)據(jù)的開放共享水平。
研究數(shù)據(jù)的長期安全保存和共享需要強(qiáng)大的基礎(chǔ)設(shè)施作保障。 加拿大圖書館有的通過自主研發(fā)或二次開發(fā)Dataverse 等開源軟件的方法搭建數(shù)據(jù)機(jī)構(gòu)庫,有的借助外部數(shù)據(jù)機(jī)構(gòu)庫儲(chǔ)存數(shù)據(jù),還有的提供國內(nèi)外外部存儲(chǔ)庫導(dǎo)航服務(wù)。 我國圖書館可以借鑒上述做法,通過設(shè)立數(shù)據(jù)管理平臺(tái)專項(xiàng)加大基金扶持力度,鼓勵(lì)有能力的圖書館自主研發(fā)數(shù)據(jù)機(jī)構(gòu)庫,從數(shù)據(jù)儲(chǔ)存的源頭保障數(shù)據(jù)安全;加強(qiáng)圖書館界的合作交流,利用開源軟件合力搭建可提供定制服務(wù)的研究數(shù)據(jù)管理平臺(tái)。 搭建研究數(shù)據(jù)管理平臺(tái)不僅可以確保數(shù)據(jù)安全,還是實(shí)現(xiàn)研究數(shù)據(jù)開放獲取、開放共享的有力保障。
加拿大圖書館開展了內(nèi)容多樣化、渠道多元化、服務(wù)差異化的研究數(shù)據(jù)管理培訓(xùn)活動(dòng),線下方式涵蓋課程、講座、研討會(huì)等,線上方式主要是在線課程、網(wǎng)絡(luò)資源導(dǎo)航等。 我國圖書館的研究數(shù)據(jù)管理培訓(xùn)工作可借鑒其線上線下相結(jié)合的模式,根據(jù)服務(wù)對(duì)象知識(shí)層面和需求的不同開展個(gè)性化培訓(xùn)服務(wù),如:針對(duì)高校學(xué)生開設(shè)研究數(shù)據(jù)管理課程,從教育階段開始培養(yǎng)數(shù)據(jù)安全管理意識(shí)和技能;針對(duì)科研人員開設(shè)嵌入式研究數(shù)據(jù)管理流程培訓(xùn),通過開展一系列教育培訓(xùn)活動(dòng)強(qiáng)化科研人員管理和維護(hù)研究數(shù)據(jù)的意識(shí),提高其數(shù)據(jù)獲取和利用能力;針對(duì)圖書館員開設(shè)研究數(shù)據(jù)的服務(wù)培訓(xùn)課程,提升其數(shù)據(jù)管理能力和服務(wù)水平。