国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

荷蘭數(shù)據(jù)歸檔和網(wǎng)絡(luò)服務(wù)中心的科學(xué)數(shù)據(jù)長(zhǎng)期保存機(jī)制*

2021-12-09 08:48:10耿志杰陳佳慧
圖書(shū)館論壇 2021年11期
關(guān)鍵詞:科學(xué)工作

耿志杰,陳佳慧

0 引言

科學(xué)數(shù)據(jù)管理已成為全球科學(xué)事業(yè)的重點(diǎn)工作,歐盟地平線(xiàn)2020計(jì)劃、歐洲科學(xué)數(shù)據(jù)永久性保存計(jì)劃項(xiàng)目(PARSE.Insight)、開(kāi)放存取Plan S等項(xiàng)目不斷發(fā)起,推動(dòng)區(qū)域內(nèi)科學(xué)數(shù)據(jù)的保存與共享??茖W(xué)數(shù)據(jù)長(zhǎng)期保存工作是指為維護(hù)數(shù)據(jù)的真實(shí)完整性,“無(wú)限期提供對(duì)科學(xué)數(shù)據(jù)持續(xù)訪(fǎng)問(wèn)的能力”[1]所采取的一系列存儲(chǔ)與管理行為。對(duì)科學(xué)數(shù)據(jù)進(jìn)行長(zhǎng)期保存是開(kāi)放存取的前提,能夠?yàn)榇笠?guī)模開(kāi)放活動(dòng)積累數(shù)據(jù)資源,并在信息集成過(guò)程中提供新方法和創(chuàng)新點(diǎn)[2],從而提升研究成果質(zhì)量,加速世界科學(xué)發(fā)展步伐。

隨著對(duì)科學(xué)數(shù)據(jù)價(jià)值認(rèn)識(shí)的加深,我國(guó)開(kāi)始相關(guān)嘗試,各類(lèi)科學(xué)數(shù)據(jù)平臺(tái)建設(shè)初具雛形,《科學(xué)數(shù)據(jù)管理辦法》更是站在國(guó)家高度,為保障科學(xué)數(shù)據(jù)安全、提升數(shù)據(jù)開(kāi)放共享水平提供制度規(guī)范。相較于國(guó)外,我國(guó)科學(xué)數(shù)據(jù)長(zhǎng)期保存工作屬于“短板中的短板”[3]:政策體系不完善,科學(xué)數(shù)據(jù)保存工作令出無(wú)門(mén);長(zhǎng)期保存工作未成體系,各領(lǐng)域數(shù)據(jù)平臺(tái)各行其是;技術(shù)策略的統(tǒng)一性、全面性不足,制約數(shù)據(jù)的整合與存儲(chǔ)。

荷蘭數(shù)據(jù)歸檔和網(wǎng)絡(luò)服務(wù)中心(Digital Archiving and Networked Services,DANS)成立于2005年,由荷蘭皇家藝術(shù)學(xué)院(KNAW)和荷蘭研究委員會(huì)(NWO)共同組建,以促進(jìn)人文、藝術(shù)、社會(huì)科學(xué)等領(lǐng)域的數(shù)據(jù)開(kāi)放獲取和持續(xù)訪(fǎng)問(wèn)為使命[4]。在16年實(shí)踐中,DANS不斷完善存儲(chǔ)技術(shù)設(shè)施建設(shè)、優(yōu)化保存方式,形成了系統(tǒng)的長(zhǎng)期保存機(jī)制。本文在對(duì)DANS長(zhǎng)期保存機(jī)制進(jìn)行調(diào)查與分析基礎(chǔ)上,總結(jié)其保存舉措的特點(diǎn)及優(yōu)勢(shì),為我國(guó)科學(xué)數(shù)據(jù)長(zhǎng)期保存工作提出優(yōu)化建議,以期促進(jìn)數(shù)據(jù)保存技術(shù)和管理方式的優(yōu)化創(chuàng)新。

1 研究回顧

1.1 理論研究現(xiàn)狀

國(guó)內(nèi)外科學(xué)數(shù)據(jù)長(zhǎng)期保存的理論研究聚焦于三方面:(1)對(duì)多學(xué)科領(lǐng)域科學(xué)數(shù)據(jù)長(zhǎng)期保存的研究。Jonh Clark[5]、Mohammad Khayat等[6]、Julie Doyle等[7]分別就歷史地理空間數(shù)據(jù)、地球科學(xué)數(shù)據(jù)、3D數(shù)據(jù)長(zhǎng)期保存工作的經(jīng)驗(yàn)及技術(shù)進(jìn)行分析。(2)對(duì)各國(guó)各高??茖W(xué)數(shù)據(jù)長(zhǎng)期保存經(jīng)驗(yàn)的總結(jié)與分享。Pierre-Yves Burgi等[8]描述瑞士數(shù)據(jù)生命周期國(guó)家項(xiàng)目的計(jì)劃準(zhǔn)則、管理方案、存儲(chǔ)選項(xiàng)、精益啟動(dòng)模板等;Koopman等[9]發(fā)現(xiàn)南非研究數(shù)據(jù)存在歸檔與保存不系統(tǒng)等問(wèn)題;莊曉喆[10]在對(duì)美、英、澳高校的科學(xué)數(shù)據(jù)保存政策內(nèi)容進(jìn)行分析基礎(chǔ)上,提出我國(guó)科學(xué)數(shù)據(jù)管理政策應(yīng)添加保存條款、共享觀(guān)念、權(quán)責(zé)意識(shí)等。(3)對(duì)科學(xué)數(shù)據(jù)長(zhǎng)期保存過(guò)程中的技術(shù)和管理策略的探索。技術(shù)策略包括DANS的新格式遷移方案[11];Bruce Barkstrom等[12]借助“backof-the-envelope”模型說(shuō)明復(fù)制方法在長(zhǎng)期保存工作中的優(yōu)勢(shì)所在。管理策略包括司莉等[13]對(duì)國(guó)際組織科學(xué)數(shù)據(jù)長(zhǎng)期保存會(huì)議動(dòng)態(tài)、政策、服務(wù)等的探索;Anna Palaiologk等[14]開(kāi)發(fā)ABC成本核算模型保障DANS保存工作中的財(cái)務(wù)可持續(xù)性;Rebecca Frank等[15]認(rèn)為資金、法律、存儲(chǔ)庫(kù)狀態(tài)都會(huì)影響人們對(duì)科學(xué)數(shù)據(jù)的保存態(tài)度。

1.2 實(shí)踐探索現(xiàn)狀

實(shí)踐探索主要以科學(xué)數(shù)據(jù)管理平臺(tái)及科學(xué)數(shù)據(jù)長(zhǎng)期保存項(xiàng)目?jī)煞N形式進(jìn)行,現(xiàn)有成果包括:歐洲社會(huì)科學(xué)數(shù)據(jù)存檔委員會(huì)(CESSDA)、美國(guó)高校政治與社會(huì)研究聯(lián)盟(ICPSR)、英國(guó)國(guó)家數(shù)據(jù)資料庫(kù)(UKDA)、荷蘭數(shù)據(jù)歸檔和網(wǎng)絡(luò)服務(wù)中心(DANS)、中國(guó)國(guó)家科學(xué)資源共享服務(wù)平臺(tái)、北京大學(xué)開(kāi)放研究數(shù)據(jù)平臺(tái)、斯坦福大學(xué)的LOCKSS項(xiàng)目、歐盟的PARSE.Insight項(xiàng)目等。各平臺(tái)、項(xiàng)目對(duì)科學(xué)數(shù)據(jù)長(zhǎng)期保存工作的研究?jī)?nèi)容各有側(cè)重,致使它們?cè)陂L(zhǎng)期保存的規(guī)劃、政策及運(yùn)營(yíng)方向上存在不同程度的傾斜。例如UKDA[16]以英國(guó)范圍內(nèi)的社會(huì)科學(xué)數(shù)據(jù)及人口研究數(shù)據(jù)為保存對(duì)象,但由于其與英國(guó)數(shù)據(jù)服務(wù)中心直接對(duì)接,以提供長(zhǎng)期可用的數(shù)據(jù)資源為主要職責(zé);LOCKSS項(xiàng)目[17]重點(diǎn)致力于電子期刊的長(zhǎng)期保存與訪(fǎng)問(wèn),重視的是長(zhǎng)期保存開(kāi)源軟件應(yīng)用程序的開(kāi)發(fā)和全球的分布式保存網(wǎng)絡(luò)的構(gòu)建,其在科學(xué)數(shù)據(jù)長(zhǎng)期保存方面的參考價(jià)值具有較強(qiáng)的針對(duì)性;PARSE.Insight項(xiàng)目[18]為長(zhǎng)期保存短期項(xiàng)目,研究重點(diǎn)是延長(zhǎng)歐盟國(guó)家科學(xué)數(shù)據(jù)的壽命,改善存儲(chǔ)環(huán)境和利用情況,從長(zhǎng)期保存工作的整體上看時(shí)間短、缺少系統(tǒng)規(guī)劃,影響范圍有限;DANS作為全球領(lǐng)先的科學(xué)數(shù)據(jù)存儲(chǔ)平臺(tái)[19],一方面擁有來(lái)自多個(gè)學(xué)科領(lǐng)域超過(guò)15萬(wàn)個(gè)科學(xué)數(shù)據(jù)集,保存對(duì)象豐富;另一方面,工作內(nèi)容囊括數(shù)據(jù)存儲(chǔ)、基礎(chǔ)設(shè)施建設(shè)、長(zhǎng)期保存工作培訓(xùn)等方面,日常運(yùn)行還形成了詳盡、穩(wěn)定的長(zhǎng)期保存規(guī)劃和機(jī)制,它還幫助建立歐洲數(shù)據(jù)基礎(chǔ)架構(gòu),并為存儲(chǔ)庫(kù)開(kāi)發(fā)國(guó)際認(rèn)可的質(zhì)量標(biāo)志,影響深遠(yuǎn)。上述國(guó)外平臺(tái)或項(xiàng)目,無(wú)論是保存對(duì)象、保存規(guī)劃,還是影響范圍,都更為全面、系統(tǒng),對(duì)我國(guó)科學(xué)數(shù)據(jù)管理現(xiàn)狀而言,具有借鑒意義。

2 DANS科學(xué)數(shù)據(jù)長(zhǎng)期保存機(jī)制

DANS科學(xué)數(shù)據(jù)長(zhǎng)期保存實(shí)踐由外部保障機(jī)制、整體運(yùn)行機(jī)制、業(yè)務(wù)支撐機(jī)制及風(fēng)險(xiǎn)防控機(jī)制四部分構(gòu)成,其中外部保障機(jī)制聚焦長(zhǎng)期保存工作運(yùn)轉(zhuǎn)的必要前提和基礎(chǔ)動(dòng)力,整體運(yùn)行機(jī)制是立足于DANS長(zhǎng)期保存整體工作的一般性方式總結(jié),業(yè)務(wù)支撐機(jī)制是長(zhǎng)期保存具體操作過(guò)程中的重要管理舉措,風(fēng)險(xiǎn)防控機(jī)制則主要發(fā)揮后勤力量,鞏固整體運(yùn)行和業(yè)務(wù)支撐機(jī)制的有效運(yùn)轉(zhuǎn)??傮w看四者圍繞DANS科學(xué)數(shù)據(jù)長(zhǎng)期保存工作的內(nèi)部與外部、一般與具體、全程與后勤等方面,共同描繪、再現(xiàn)DANS長(zhǎng)期保存工作的全景和成功經(jīng)驗(yàn)。

2.1 外部保障機(jī)制

DANS科學(xué)數(shù)據(jù)長(zhǎng)期保存工作的外部保障機(jī)制由政策和資金兩方面構(gòu)成,內(nèi)外法規(guī)政策環(huán)境的塑造和穩(wěn)定的資金來(lái)源為科學(xué)數(shù)據(jù)保存提供外部性、基礎(chǔ)性支持。

2.1.1 內(nèi)外法規(guī)政策體系的塑造

DANS遵循內(nèi)外協(xié)同的法規(guī)政策體系(見(jiàn)表1)進(jìn)行長(zhǎng)期保存工作。外部法規(guī)政策解決科學(xué)數(shù)據(jù)長(zhǎng)期保存全流程中的管理問(wèn)題;內(nèi)部制度針對(duì)具體操作層進(jìn)行制定,內(nèi)容涵蓋科學(xué)數(shù)據(jù)獲取、數(shù)據(jù)版權(quán)歸屬問(wèn)題、數(shù)據(jù)存儲(chǔ)庫(kù)建設(shè)、敏感信息及個(gè)人數(shù)據(jù)保護(hù)、文件格式推薦、數(shù)據(jù)存儲(chǔ)要求、保存規(guī)劃的制定、訪(fǎng)問(wèn)權(quán)限設(shè)置等。從長(zhǎng)期保存角度看,外部政策遵循能夠驗(yàn)證科學(xué)數(shù)據(jù)長(zhǎng)期保存工作的合法性和可行性,保證長(zhǎng)期保存各環(huán)節(jié)貼合外部的法律大環(huán)境,在國(guó)家法律可接納、可保障的范圍內(nèi)開(kāi)展;內(nèi)部制度的規(guī)定則能理順工作流程,指明操作方向,增強(qiáng)各環(huán)節(jié)的互操作性。兩者的協(xié)調(diào)性主要表現(xiàn)在外部法律為內(nèi)部制度的定立提供依據(jù)和基礎(chǔ),內(nèi)部制度則是外部法律在科學(xué)數(shù)據(jù)長(zhǎng)期保存中的具體落實(shí),兩者互相支撐,共同制約。這種協(xié)同的體系為DANS塑造內(nèi)外法律認(rèn)同空間,保證保存工作既貼合政策環(huán)境,又順應(yīng)技術(shù)更迭變化,提升科學(xué)數(shù)據(jù)保管過(guò)程的有序性和可靠性。

表1 DANS科學(xué)數(shù)據(jù)長(zhǎng)期保存遵循的法規(guī)政策體系[4]

2.1.2 持續(xù)、穩(wěn)定的活動(dòng)資金支持

DANS的資金來(lái)源主要包括3個(gè)方面:一是組建者KNAW和NWO承擔(dān)日常管理活動(dòng)的主要支持方,提供基礎(chǔ)的資金援助[4]。二是荷蘭政府、歐洲的相關(guān)科學(xué)研究基金會(huì),主要針對(duì)其開(kāi)展的數(shù)據(jù)長(zhǎng)期保存項(xiàng)目進(jìn)行支持。三是各領(lǐng)域科學(xué)研究機(jī)構(gòu),以數(shù)據(jù)管理費(fèi)用形式為DANS提供活動(dòng)資金??茖W(xué)數(shù)據(jù)長(zhǎng)期保存是一項(xiàng)持續(xù)性的系統(tǒng)工程,需要長(zhǎng)期、穩(wěn)定的資金投入作為活動(dòng)支撐。DANS在保障穩(wěn)定的經(jīng)濟(jì)支持基礎(chǔ)上,通過(guò)建立聯(lián)盟或提供數(shù)據(jù)管理服務(wù)開(kāi)拓新的經(jīng)濟(jì)來(lái)源途徑,多源資金的持續(xù)流入為其長(zhǎng)期保存項(xiàng)目的開(kāi)展奠定堅(jiān)實(shí)的物質(zhì)基礎(chǔ),確保管理人才招募、科學(xué)數(shù)據(jù)存儲(chǔ)、技術(shù)升級(jí)等相關(guān)活動(dòng)能夠“應(yīng)支即支”,保持?jǐn)?shù)據(jù)保存的延續(xù)性和可行性。

2.2 “集中存儲(chǔ)-集中管理”的整體運(yùn)行機(jī)制

DANS科學(xué)數(shù)據(jù)長(zhǎng)期保存工作整體上主要采用“集中存儲(chǔ)-集中管理”的運(yùn)行機(jī)制實(shí)現(xiàn)其長(zhǎng)期保存目標(biāo)。集中存儲(chǔ)體現(xiàn)為對(duì)保存場(chǎng)所的統(tǒng)一。EASY存儲(chǔ)庫(kù)是DANS進(jìn)行科學(xué)數(shù)據(jù)長(zhǎng)期保存的唯一場(chǎng)所和中心存儲(chǔ)庫(kù),主要用于存儲(chǔ)和重用科學(xué)數(shù)據(jù),長(zhǎng)期保存工作從數(shù)據(jù)提交環(huán)節(jié)到最終的訪(fǎng)問(wèn)共享環(huán)節(jié)均在此進(jìn)行。目前EASY存儲(chǔ)庫(kù)已保存有157,170個(gè)數(shù)據(jù)集[20],最早的數(shù)據(jù)可追溯到1964年,構(gòu)成了數(shù)據(jù)量龐大的科學(xué)數(shù)據(jù)資源庫(kù)和開(kāi)放訪(fǎng)問(wèn)系統(tǒng),促進(jìn)荷蘭范圍內(nèi)科學(xué)數(shù)據(jù)的匯交與整合。除集中存儲(chǔ)外,DANS還對(duì)科學(xué)數(shù)據(jù)實(shí)行了統(tǒng)一的管理。儲(chǔ)戶(hù)將預(yù)存儲(chǔ)數(shù)據(jù)集的原始版本打包為提交信息包(Submission Information Package,SIP)上傳至EASY后,DANS會(huì)將許可證明和唯一持久標(biāo)識(shí)符以郵件形式告知儲(chǔ)戶(hù);在對(duì)數(shù)據(jù)集進(jìn)行質(zhì)量驗(yàn)證、文件格式轉(zhuǎn)換、元數(shù)據(jù)創(chuàng)建等操作后,形成歸檔信息 包(Archival Information Package,AIP),并將按學(xué)科領(lǐng)域分類(lèi)存于存儲(chǔ)庫(kù)中;到了最終訪(fǎng)問(wèn)共享環(huán)節(jié),需將數(shù)據(jù)集轉(zhuǎn)化為發(fā)布信息包(Dissemination Information Package,DIP)形態(tài)進(jìn)行傳遞。其中,數(shù)據(jù)管理、系統(tǒng)監(jiān)督、協(xié)議定立等責(zé)任均由DANS內(nèi)部成員承擔(dān),實(shí)現(xiàn)管理責(zé)任的集中管控。從長(zhǎng)期保存角度看,DANS的運(yùn)行機(jī)制,一方面通過(guò)EASY將多個(gè)學(xué)科領(lǐng)域的科研成果匯集在DANS中進(jìn)行統(tǒng)一保存與管控,實(shí)現(xiàn)國(guó)家層面科學(xué)數(shù)據(jù)集的高度整合;另一方面,統(tǒng)一管理流程,實(shí)現(xiàn)保存環(huán)節(jié)的標(biāo)準(zhǔn)化,提升科學(xué)數(shù)據(jù)長(zhǎng)期保存的質(zhì)量。DANS的運(yùn)行機(jī)制對(duì)我國(guó)確立科學(xué)數(shù)據(jù)長(zhǎng)期保存模式具有借鑒價(jià)值。

2.3 業(yè)務(wù)支撐機(jī)制

2.3.1 基礎(chǔ)設(shè)施:可信存儲(chǔ)庫(kù)的建設(shè)

國(guó)際上有多個(gè)級(jí)別的認(rèn)證體系支持存儲(chǔ)庫(kù)的評(píng)估工作,如數(shù)字認(rèn)證印章DSA、核心認(rèn)證CoreTrustSeal、擴(kuò)展級(jí)別認(rèn)證nestor-Seal、正式級(jí)別認(rèn)證ISO 16363[21]。EASY存儲(chǔ)庫(kù)即DANS機(jī)構(gòu)內(nèi)部進(jìn)行科學(xué)數(shù)據(jù)長(zhǎng)期保存的唯一可信存儲(chǔ)庫(kù)。DANS自開(kāi)辦以來(lái)就致力于EASY認(rèn)證工作,通過(guò)MIXED、ARIADNE、persid等項(xiàng)目[22]完善EASY的基礎(chǔ)架構(gòu)、遷移技術(shù)及永久標(biāo)識(shí)符解析,提升存儲(chǔ)庫(kù)的可信度和安全性。目前EASY擁有DSA,并通過(guò)核心級(jí)、擴(kuò)展級(jí)及正式級(jí)認(rèn)證,是值得信賴(lài)的數(shù)據(jù)基礎(chǔ)架構(gòu),在長(zhǎng)期存儲(chǔ)、質(zhì)量控制、數(shù)據(jù)可訪(fǎng)問(wèn)性等方面具備可持續(xù)性。DANS對(duì)可信存儲(chǔ)庫(kù)建設(shè)的固守為開(kāi)放科學(xué)數(shù)據(jù)整合、文件遷移、長(zhǎng)期保存及持續(xù)訪(fǎng)問(wèn)提供可靠、安全的活動(dòng)場(chǎng)域,通過(guò)不斷地創(chuàng)新探索,存儲(chǔ)庫(kù)不斷貼合用戶(hù)需求,取得目標(biāo)客戶(hù)的信賴(lài),從而吸引更多的科學(xué)數(shù)據(jù)入庫(kù)存儲(chǔ),提升科學(xué)數(shù)據(jù)存儲(chǔ)質(zhì)量,值得各數(shù)據(jù)管理機(jī)構(gòu)學(xué)習(xí)借鑒。

2.3.2 保存標(biāo)準(zhǔn):文件保存格式的推薦

DANS對(duì)大量文件格式進(jìn)行評(píng)估,認(rèn)為最適合長(zhǎng)期保存及訪(fǎng)問(wèn)的文件格式應(yīng)具備經(jīng)常使用、能夠獨(dú)立于特定軟件及具備開(kāi)放規(guī)范等條件[23],列舉了18種數(shù)據(jù)類(lèi)型的首選格式和可接受格式(見(jiàn)表2)。對(duì)文件格式進(jìn)行統(tǒng)一是DANS科學(xué)數(shù)據(jù)長(zhǎng)期保存標(biāo)準(zhǔn)中的重點(diǎn)之一,格式推薦列表以國(guó)際標(biāo)準(zhǔn)或國(guó)際通用格式作為推薦依據(jù),并隨著時(shí)間推移或外部技術(shù)環(huán)境的變化定期調(diào)整,以避免格式太舊或與軟件不適配的風(fēng)險(xiǎn)。這種方式能夠在源頭阻斷后期因過(guò)時(shí)引發(fā)的讀取危機(jī),減輕后續(xù)環(huán)節(jié)的管理壓力,確??茖W(xué)數(shù)據(jù)的持續(xù)性保存和長(zhǎng)期可用。對(duì)保存格式的統(tǒng)一化和規(guī)范化還能夠減少由格式造成的傳輸風(fēng)險(xiǎn),便于科學(xué)數(shù)據(jù)實(shí)現(xiàn)跨區(qū)域、跨機(jī)構(gòu)的交換,從而為攝取環(huán)節(jié)、歸檔環(huán)節(jié)及最終的訪(fǎng)問(wèn)共享環(huán)節(jié)創(chuàng)造便利。

表2 DANS文件首選格式和可接受格式列表

2.3.3 管理舉措:科學(xué)數(shù)據(jù)的遷移

遷移策略分為存儲(chǔ)介質(zhì)遷移和文件格式遷移[24]。DANS以格式轉(zhuǎn)換作為主要遷移策略??茖W(xué)數(shù)據(jù)集入庫(kù)后,DANS對(duì)文件原始格式的可讀性和可持續(xù)性進(jìn)行全周期評(píng)估,并對(duì)其所在的系統(tǒng)環(huán)境進(jìn)行監(jiān)測(cè),將穩(wěn)定性不佳或過(guò)時(shí)的格式轉(zhuǎn)換為更具持久性的首選格式,以防因文件格式過(guò)時(shí)而帶來(lái)的信息不可用及丟失風(fēng)險(xiǎn)。在格式遷移后,文件的原始格式和保存格式都會(huì)被存檔,但在數(shù)據(jù)集的訪(fǎng)問(wèn)環(huán)節(jié)只會(huì)以保存格式顯示。從長(zhǎng)期保存角度看,相較于存儲(chǔ)介質(zhì)遷移,格式遷移不影響文件內(nèi)容結(jié)構(gòu)及管理功能,使數(shù)據(jù)保存更為簡(jiǎn)潔和穩(wěn)定。DANS選其作為長(zhǎng)期保存的主要技術(shù)策略,并對(duì)遷移前后的文件版本及管理元數(shù)據(jù)均進(jìn)行存檔處理,有利于維護(hù)數(shù)據(jù)集的完整性及有效性,實(shí)現(xiàn)科學(xué)數(shù)據(jù)的長(zhǎng)期存儲(chǔ)。

2007年DANS開(kāi)展MIXED項(xiàng)目,提出一種表示數(shù)據(jù)庫(kù)和電子表格一般結(jié)構(gòu)的可擴(kuò)展標(biāo)記語(yǔ)言——M-XML作為所有數(shù)據(jù)庫(kù)和數(shù)據(jù)表的中間通用格式,并構(gòu)建從現(xiàn)有應(yīng)用格式到M-XML,及從M-XML到需求格式的轉(zhuǎn)換器[11]。MIXED項(xiàng)目的開(kāi)展體現(xiàn)了DANS對(duì)于保存策略的重視和持續(xù)探索。其原有的文件格式遷移方式的缺點(diǎn)在于隨著遷移行為不斷發(fā)生將會(huì)堆積多個(gè)文件版本和管理元數(shù)據(jù),為長(zhǎng)期保存工作帶來(lái)管理負(fù)擔(dān)。而后來(lái)提出的M-XML格式作為“遷移助推器”,是文件保存在存儲(chǔ)庫(kù)中的常態(tài)格式,在數(shù)據(jù)發(fā)布環(huán)節(jié)才按需進(jìn)行轉(zhuǎn)換,不僅有利于科學(xué)數(shù)據(jù)集的穩(wěn)定存儲(chǔ),還能有效緩解版本與格式的管理壓力,使管理更為高效便捷。

2.4 風(fēng)險(xiǎn)防控機(jī)制

2.4.1 全面的信息安全防范舉措

DANS的信息安全防范舉措具體表現(xiàn)為設(shè)置訪(fǎng)問(wèn)權(quán)限及隱私信息保護(hù)兩方面。首先是訪(fǎng)問(wèn)權(quán)限方面DANS設(shè)有開(kāi)放訪(fǎng)問(wèn)、受限訪(fǎng)問(wèn)兩個(gè)權(quán)限選擇[25]。開(kāi)放訪(fǎng)問(wèn)即所有注冊(cè)用戶(hù)都可以無(wú)限制地訪(fǎng)問(wèn)數(shù)據(jù);受限訪(fǎng)問(wèn)則是有限制的訪(fǎng)問(wèn)數(shù)據(jù),DANS將訪(fǎng)問(wèn)需求傳遞給所有者,經(jīng)同意后才能獲得該數(shù)據(jù)集的訪(fǎng)問(wèn)許可證。受限訪(fǎng)問(wèn)中還可設(shè)置臨時(shí)禁運(yùn)權(quán)限,禁運(yùn)期內(nèi)任何人都無(wú)法訪(fǎng)問(wèn)該數(shù)據(jù)。而在隱私信息保護(hù)方面,根據(jù)《通用數(shù)據(jù)保護(hù)條例》規(guī)定,數(shù)據(jù)集包含能體現(xiàn)個(gè)人身份的元素信息,則須簽訂《個(gè)人數(shù)據(jù)處理協(xié)議》[26],共同協(xié)商個(gè)人數(shù)據(jù)的處理方式和開(kāi)放程度,在協(xié)議達(dá)成的基礎(chǔ)上將數(shù)據(jù)集設(shè)置為“受限訪(fǎng)問(wèn)”權(quán)限,并對(duì)個(gè)人數(shù)據(jù)進(jìn)行刪除或匿名化處理。

上述兩方面的防范舉措,從長(zhǎng)期保存角度看,一方面能建起堅(jiān)實(shí)的安全屏障,隔絕非法訪(fǎng)問(wèn)和利用。特別是針對(duì)受限訪(fǎng)問(wèn)的數(shù)據(jù)集,DANS加強(qiáng)對(duì)數(shù)據(jù)集利用情況的把關(guān)和掌控,防止涉密數(shù)據(jù)集或未發(fā)表的科研成果的非授權(quán)訪(fǎng)問(wèn)、隨意使用或惡意破壞,保障長(zhǎng)期保存過(guò)程中數(shù)據(jù)集的安全性和完整性。另一方面,維護(hù)科學(xué)數(shù)據(jù)集中的個(gè)人數(shù)據(jù)安全,保障被試者人身權(quán)益。DANS秉持“盡可能開(kāi)放,必要時(shí)保護(hù)”[27]的保存原則,個(gè)人數(shù)據(jù)識(shí)別、脫敏操作也均嚴(yán)格參照國(guó)際條例進(jìn)行,努力將個(gè)人信息泄露風(fēng)險(xiǎn)最小化,保障儲(chǔ)戶(hù)及實(shí)驗(yàn)被試者的隱私權(quán)和財(cái)產(chǎn)權(quán)。

2.4.2 全程性的監(jiān)控策略

DANS的風(fēng)險(xiǎn)監(jiān)控包含機(jī)構(gòu)內(nèi)部與外部7個(gè)主要對(duì)象[4]:內(nèi)部主要是針對(duì)數(shù)據(jù)集文件完整性、存儲(chǔ)庫(kù)系統(tǒng)安全、長(zhǎng)期保存規(guī)劃及DANS總體政策戰(zhàn)略4個(gè)內(nèi)容進(jìn)行監(jiān)視與檢查;外部對(duì)象有國(guó)際上通用技術(shù)或文件格式更新、個(gè)人數(shù)據(jù)相關(guān)法律變更、互聯(lián)網(wǎng)潛在風(fēng)險(xiǎn)威脅三方面。對(duì)于每個(gè)監(jiān)控對(duì)象均配備明確的責(zé)任主體,分別規(guī)定有日常檢查、持續(xù)監(jiān)測(cè)、定期檢查、半年一次、五年一次等五種監(jiān)控頻率,以保證風(fēng)險(xiǎn)監(jiān)控能夠覆蓋到科學(xué)數(shù)據(jù)生命周期的各個(gè)節(jié)點(diǎn)。DANS的風(fēng)險(xiǎn)監(jiān)控策略有效保障科學(xué)數(shù)據(jù)長(zhǎng)期保存過(guò)程中的安全性和可持續(xù)訪(fǎng)問(wèn)性。一方面,堅(jiān)持對(duì)數(shù)據(jù)格式、系統(tǒng)安全進(jìn)行長(zhǎng)效的跟蹤監(jiān)控,并不斷追蹤長(zhǎng)期保存相關(guān)技術(shù)、政策的更新情況,有利于時(shí)刻把握存儲(chǔ)庫(kù)的運(yùn)行狀態(tài),并借助內(nèi)外部的技術(shù)差異不斷優(yōu)化保存技術(shù),從而提升存儲(chǔ)庫(kù)安全系數(shù)。另一方面,監(jiān)控責(zé)任的明確分配提升了保存過(guò)程中風(fēng)險(xiǎn)識(shí)別的精準(zhǔn)性和可追溯性。DANS根據(jù)監(jiān)測(cè)對(duì)象的所屬專(zhuān)業(yè)配備責(zé)任主體,有助于提升風(fēng)險(xiǎn)識(shí)別精準(zhǔn)度,且使得長(zhǎng)期保存過(guò)程中的潛在風(fēng)險(xiǎn)全程可追溯,科學(xué)數(shù)據(jù)存儲(chǔ)更具持續(xù)性。

3 啟示

3.1 規(guī)范與賦能共存

DANS堅(jiān)實(shí)的外部保障機(jī)制則是以法律和經(jīng)濟(jì)支持作為動(dòng)力要素,能夠理順并規(guī)范長(zhǎng)期保存各環(huán)節(jié)工作,維護(hù)長(zhǎng)期保存工作的可持續(xù)性。然而在我國(guó),由于總體統(tǒng)籌規(guī)劃不足,導(dǎo)致國(guó)家層面的政策法規(guī)數(shù)量較少,科學(xué)數(shù)據(jù)宏觀(guān)管理體系尚待拓展[28],長(zhǎng)期保存工作的保障機(jī)制存在不完備、不清晰等問(wèn)題。因此,我國(guó)也應(yīng)積極發(fā)揮內(nèi)外法律制度的協(xié)同和引導(dǎo)作用,為科學(xué)數(shù)據(jù)長(zhǎng)期保存工作及其體系完善尋求法律認(rèn)同環(huán)境和良好的發(fā)展條件。這一建議可具體落實(shí)于對(duì)《科學(xué)數(shù)據(jù)管理辦法》[29]中“第三章:采集、匯交與保存”及“第五章:保密與安全”兩部分的相關(guān)規(guī)定進(jìn)行細(xì)化,制定專(zhuān)門(mén)的科學(xué)數(shù)據(jù)長(zhǎng)期保存實(shí)施細(xì)則,著重對(duì)長(zhǎng)期保存工作中的主體權(quán)責(zé)關(guān)系、知識(shí)產(chǎn)權(quán)、數(shù)據(jù)所有權(quán)和使用權(quán)、個(gè)人信息保密等內(nèi)容進(jìn)行詳細(xì)說(shuō)明。同時(shí),推進(jìn)各類(lèi)科學(xué)數(shù)據(jù)可信存儲(chǔ)庫(kù)的規(guī)范化建設(shè),使得人員、資金及軟硬件設(shè)施等各要素都能得到強(qiáng)有力的法律保障。資金方面,需保障長(zhǎng)期保存項(xiàng)目經(jīng)濟(jì)支持的穩(wěn)定性和多來(lái)源。首先要加強(qiáng)財(cái)政資金的統(tǒng)籌調(diào)度,在分析科學(xué)數(shù)據(jù)長(zhǎng)期保存需求基礎(chǔ)上,及時(shí)兌現(xiàn)科學(xué)數(shù)據(jù)管理的各項(xiàng)補(bǔ)貼政策;其次要開(kāi)辟多種資金來(lái)源,通過(guò)對(duì)研究機(jī)構(gòu)、國(guó)際組織、企業(yè)等開(kāi)展科學(xué)數(shù)據(jù)服務(wù),與異質(zhì)機(jī)構(gòu)建立聯(lián)盟等,拓寬項(xiàng)目經(jīng)費(fèi)來(lái)源,為科學(xué)數(shù)據(jù)保存工作續(xù)航。

3.2 集中與分布協(xié)同

從DANS的運(yùn)行模式來(lái)看,構(gòu)建專(zhuān)門(mén)的、可信賴(lài)的存儲(chǔ)平臺(tái)整合全國(guó)范圍內(nèi)的數(shù)字資源是長(zhǎng)期保存工作的首要任務(wù)。但由于我國(guó)科學(xué)數(shù)據(jù)數(shù)量龐大,且高校及研究機(jī)構(gòu)眾多,數(shù)據(jù)來(lái)源較為分散,借鑒DANS的“集中存儲(chǔ)-集中管理”模式并不現(xiàn)實(shí)。因此根據(jù)我國(guó)的發(fā)展實(shí)際和《科學(xué)數(shù)據(jù)管理辦法》相關(guān)規(guī)定,宜采取“統(tǒng)一管理-分布存儲(chǔ)-集中整合”的長(zhǎng)期保存模式(如圖1所示)。(1)統(tǒng)一管理:由國(guó)務(wù)院科學(xué)技術(shù)行政部門(mén)負(fù)責(zé)科學(xué)數(shù)據(jù)長(zhǎng)期保存工作的總體規(guī)劃和統(tǒng)籌管理[29],并承擔(dān)可信數(shù)據(jù)存儲(chǔ)庫(kù)建設(shè)的主要職責(zé);(2)分布存儲(chǔ):各高校、研究機(jī)構(gòu)、政府部門(mén)等根據(jù)地緣、領(lǐng)域等因素建立合作聯(lián)盟,成為國(guó)家科學(xué)數(shù)據(jù)存儲(chǔ)平臺(tái)的分站點(diǎn),建立多個(gè)科學(xué)數(shù)據(jù)存儲(chǔ)庫(kù),成員機(jī)構(gòu)在研究結(jié)束后將科學(xué)數(shù)據(jù)上傳至分站點(diǎn)存儲(chǔ)庫(kù)中進(jìn)行保存;(3)集中整合:各分站點(diǎn)的科學(xué)數(shù)據(jù)存儲(chǔ)庫(kù)與國(guó)家科學(xué)數(shù)據(jù)存儲(chǔ)平臺(tái)建立網(wǎng)絡(luò)集成鏈接,定期將權(quán)威的、高質(zhì)量的科學(xué)數(shù)據(jù)同步到平臺(tái)上,以避免科學(xué)數(shù)據(jù)的重復(fù)性建設(shè),提升我國(guó)科學(xué)數(shù)據(jù)的數(shù)量和質(zhì)量。

圖1 “統(tǒng)一管理-分布存儲(chǔ)-集中整合”長(zhǎng)期保存模式

3.3 “點(diǎn)”與“面”交織

DANS制定了詳細(xì)的策略體系為科學(xué)數(shù)據(jù)長(zhǎng)期保存工作提供技術(shù)支撐。而我國(guó)各領(lǐng)域科學(xué)數(shù)據(jù)管理平臺(tái)各行其是,存儲(chǔ)方式不一,導(dǎo)致保存策略和標(biāo)準(zhǔn)上存在整體分散的特點(diǎn)。為實(shí)現(xiàn)對(duì)多學(xué)科科學(xué)數(shù)據(jù)的統(tǒng)一管理,應(yīng)制定有點(diǎn)面結(jié)合的長(zhǎng)期保存策略?!懊妗鄙系耐ūP(pán)考慮:在國(guó)家相關(guān)政策法規(guī)的整體框架下制定全學(xué)科領(lǐng)域通用的保存標(biāo)準(zhǔn)體系與實(shí)施策略,避免保存舉措與國(guó)家法律或機(jī)構(gòu)的規(guī)定相抵牾,使開(kāi)放科學(xué)數(shù)據(jù)長(zhǎng)期保存真正融入我國(guó)的科學(xué)研究事業(yè)之中,服務(wù)于各項(xiàng)科技創(chuàng)新工作?!包c(diǎn)”上的分別規(guī)范:參照不同學(xué)科的專(zhuān)業(yè)分類(lèi)法,規(guī)范類(lèi)目設(shè)置;繼而結(jié)合各類(lèi)科學(xué)數(shù)據(jù)的特殊性,對(duì)元數(shù)據(jù)描述、文件保存格式及轉(zhuǎn)換、數(shù)據(jù)集命名規(guī)則、安全備份、訪(fǎng)問(wèn)限制、永久標(biāo)識(shí)符設(shè)定等細(xì)節(jié)進(jìn)行分情況、具體化規(guī)范。此外,保存策略制定應(yīng)實(shí)現(xiàn)開(kāi)放與保護(hù)的權(quán)衡,既要以開(kāi)放共享為最終目標(biāo),又要重視個(gè)人信息安全問(wèn)題,對(duì)科學(xué)數(shù)據(jù)中的敏感信息實(shí)施保護(hù)。

3.4 跟蹤與驗(yàn)證同行

DANS長(zhǎng)效的風(fēng)險(xiǎn)監(jiān)控活動(dòng)維護(hù)科學(xué)數(shù)據(jù)的信息安全和系統(tǒng)安全,保障數(shù)據(jù)的長(zhǎng)期可用性和可持續(xù)性。我國(guó)應(yīng)借鑒DANS管理經(jīng)驗(yàn),在對(duì)科學(xué)數(shù)據(jù)進(jìn)行長(zhǎng)期保存時(shí)建立貫穿全生命周期的監(jiān)控機(jī)制。首先,明確各階段的責(zé)任主體,確保監(jiān)控工作落實(shí)在每個(gè)細(xì)節(jié)、每個(gè)數(shù)據(jù)集,使得安全威脅能夠及時(shí)識(shí)別、有跡可循。其次,監(jiān)控內(nèi)容大致分為兩個(gè)方面:(1)針對(duì)存儲(chǔ)庫(kù)中的SIP、AIP、DIP信息包進(jìn)行定期的質(zhì)量檢測(cè)和格式檢查,及時(shí)遷移處理格式不佳、過(guò)時(shí)的數(shù)據(jù),完成首選格式轉(zhuǎn)換,避免科學(xué)數(shù)據(jù)因格式問(wèn)題無(wú)法讀取或丟失的風(fēng)險(xiǎn);(2)要對(duì)科學(xué)數(shù)據(jù)的存儲(chǔ)環(huán)境進(jìn)行排查,開(kāi)展系統(tǒng)漏洞掃描,為數(shù)據(jù)的物理安全和信息安全把關(guān)。再次,按需制定確切的監(jiān)控時(shí)段、頻率,針對(duì)不同環(huán)節(jié)進(jìn)行定期或?qū)崟r(shí)的監(jiān)測(cè),例如數(shù)據(jù)集格式、元數(shù)據(jù)的監(jiān)測(cè)宜定期開(kāi)展,而系統(tǒng)安全摸查則需實(shí)時(shí)監(jiān)控,防止病毒或黑客的突然侵入。此外,存儲(chǔ)庫(kù)的管理人員還需提高對(duì)國(guó)家技術(shù)大環(huán)境動(dòng)向的敏感度,把握新興技術(shù)和主流技術(shù)趨勢(shì),比較新興技術(shù)與存儲(chǔ)庫(kù)現(xiàn)有技術(shù)的差異性,考量其在科學(xué)數(shù)據(jù)存儲(chǔ)庫(kù)中的可行性和適配性,使得科學(xué)數(shù)據(jù)存儲(chǔ)庫(kù)能夠順應(yīng)外部發(fā)展趨勢(shì),實(shí)現(xiàn)保存技術(shù)的創(chuàng)新、升級(jí)。

4 結(jié)語(yǔ)

基于DANS科學(xué)數(shù)據(jù)長(zhǎng)期保存的成功經(jīng)驗(yàn),文章從外部保障、保存模式、保存策略、監(jiān)控機(jī)制四方面提出長(zhǎng)期保存工作的優(yōu)化路徑,旨在實(shí)現(xiàn)全國(guó)科學(xué)數(shù)據(jù)的聚合和共享,提升我國(guó)的科學(xué)技術(shù)創(chuàng)新水平。當(dāng)然上述設(shè)想還只是較為宏觀(guān)且理論化的構(gòu)思,特別是對(duì)于模式的構(gòu)建,落實(shí)到具體的實(shí)踐工作還需考慮到人才、資金、技術(shù)等因素的共同配合。我國(guó)的科學(xué)數(shù)據(jù)長(zhǎng)期保存工作的完善還有很長(zhǎng)的一段路要走,需依靠學(xué)習(xí)、融合和創(chuàng)新來(lái)進(jìn)行優(yōu)化調(diào)整。

猜你喜歡
科學(xué)工作
點(diǎn)擊科學(xué)
點(diǎn)擊科學(xué)
科學(xué)大爆炸
不工作,爽飛了?
桃之夭夭B(2017年8期)2017-10-25 14:53:20
科學(xué)
我要出艙工作
再說(shuō)還有工作忙
兒童繪本(2015年6期)2015-05-25 17:55:54
科學(xué)拔牙
選工作
厭煩工作了該如何自救
伊金霍洛旗| 红安县| 桑植县| 昌宁县| 蓝田县| 南投市| 北碚区| 定安县| 手机| 南靖县| 卓尼县| 武汉市| 伊吾县| 定结县| 鲜城| 浑源县| 称多县| 台湾省| 林西县| 耿马| 民勤县| 巫溪县| 衡山县| 集贤县| 玉门市| 沂南县| 二连浩特市| 泽普县| 南漳县| 洛浦县| 阳原县| 衡阳市| 富平县| 包头市| 泰兴市| 拜泉县| 旌德县| 太和县| 偏关县| 同心县| 西华县|