孔祥盛
(中國(guó)科學(xué)院檔案館,北京,100190)
2018年,國(guó)務(wù)院辦公廳印發(fā)了《科學(xué)數(shù)據(jù)管理辦法》[1](以下簡(jiǎn)稱P1),明確提出“政府預(yù)算資金資助的各級(jí)科技計(jì)劃(專項(xiàng)、基金等)項(xiàng)目所形成的科學(xué)數(shù)據(jù),應(yīng)由項(xiàng)目牽頭單位匯交到相關(guān)科學(xué)數(shù)據(jù)中心”。2019年12月,科技部印發(fā)《科技計(jì)劃項(xiàng)目科學(xué)數(shù)據(jù)匯交工作方案(試行)》(以下簡(jiǎn)稱P2),科學(xué)數(shù)據(jù)匯交工作開始走向規(guī)范化和常態(tài)化。本文聚焦科學(xué)數(shù)據(jù)管理中的匯交環(huán)節(jié),選取典型的匯交政策進(jìn)行分析,一方面總結(jié)目前科學(xué)數(shù)據(jù)匯交現(xiàn)狀以及不同科學(xué)數(shù)據(jù)中心的匯交政策異同,另一方面對(duì)比科研檔案管理要求,梳理協(xié)同管理的困境,并提出總結(jié)思考。
2019年,科技部、財(cái)政部發(fā)布了《國(guó)家科技資源共享服務(wù)平臺(tái)優(yōu)化調(diào)整名單的通知》,其中包括首批20家國(guó)家科學(xué)數(shù)據(jù)中心,承擔(dān)相關(guān)領(lǐng)域科學(xué)數(shù)據(jù)的整合匯交工作。調(diào)研發(fā)現(xiàn),目前20家國(guó)家科學(xué)數(shù)據(jù)中心均提供了數(shù)據(jù)匯交服務(wù),其中除國(guó)家極地科學(xué)數(shù)據(jù)中心官網(wǎng)暫無法訪問外,13家提供了成文的政策文本,6家僅有網(wǎng)頁介紹匯交政策內(nèi)容(表格中用*標(biāo)記)。因此,本研究選取了19家國(guó)家科學(xué)數(shù)據(jù)中心的25份數(shù)據(jù)匯交相關(guān)政策(見表1),使用文本分析法開展研究。
表1 19家國(guó)家科學(xué)數(shù)據(jù)中心的數(shù)據(jù)匯交相關(guān)政策清單
(1)匯交來源
根據(jù)P1要求,所有的科學(xué)數(shù)據(jù)中心均按照規(guī)定接收科技計(jì)劃(含專項(xiàng)、基金等)項(xiàng)目來源的科學(xué)數(shù)據(jù)。除此之外,有4家科學(xué)數(shù)據(jù)中心(C4,C5,C6,C8)將觀測(cè)設(shè)施或裝置(含網(wǎng)絡(luò))來源的科學(xué)數(shù)據(jù)納入?yún)R交范疇,7家科學(xué)數(shù)據(jù)中心(C4,C5,C7,C8,C13,C14,C18)將論文來源的科學(xué)數(shù)據(jù)納入?yún)R交范疇,5家科學(xué)數(shù)據(jù)中心(C5,C8,C9,C14,C19)支持其他來源(如個(gè)人、機(jī)構(gòu)、團(tuán)隊(duì)等)科學(xué)數(shù)據(jù)匯交。
(2)匯交內(nèi)容
根據(jù)P2要求,科學(xué)數(shù)據(jù)匯交主要內(nèi)容包括科學(xué)數(shù)據(jù)實(shí)體、科學(xué)數(shù)據(jù)描述信息和科學(xué)數(shù)據(jù)輔助工具軟件三部分。各科學(xué)數(shù)據(jù)中心對(duì)數(shù)據(jù)實(shí)體的界定不一致,差異主要體現(xiàn)在對(duì)項(xiàng)目管理性文件和成果性文件的判定。幾乎所有的科學(xué)數(shù)據(jù)中心都要求提交項(xiàng)目任務(wù)書、數(shù)據(jù)管理計(jì)劃等管理性文件。大部分科學(xué)數(shù)據(jù)中心(C3,C6,C11,C12,C15,C18,C19)要求將項(xiàng)目相關(guān)論文、標(biāo)準(zhǔn)、專利等進(jìn)行匯交。僅個(gè)別科學(xué)數(shù)據(jù)中心(C2,C14)明確在政策中指出匯交范圍不包括論文、專利、軟件著作權(quán)、未來研究計(jì)劃等信息。
(3)匯交流程
P2提出了科學(xué)數(shù)據(jù)匯交的7個(gè)環(huán)節(jié),基本覆蓋了科學(xué)數(shù)據(jù)管理的全流程。所有科學(xué)數(shù)據(jù)中心都遵循這一操作流程,但在各自政策中有細(xì)微差異。一是科學(xué)數(shù)據(jù)匯交計(jì)劃制定環(huán)節(jié)。C4將“制定科學(xué)數(shù)據(jù)匯交計(jì)劃”拆分為“制定數(shù)據(jù)管理計(jì)劃”和“制定數(shù)據(jù)匯交方案”,在項(xiàng)目不同階段實(shí)施。部分科學(xué)數(shù)據(jù)中心(C1,C13,C18,C19)允許在項(xiàng)目使用自定義的元數(shù)據(jù)模板/字典。二是科學(xué)數(shù)據(jù)制備環(huán)節(jié)。大多數(shù)科學(xué)數(shù)據(jù)中心都提供了相關(guān)領(lǐng)域的標(biāo)準(zhǔn)規(guī)范參考、格式要求以及相關(guān)培訓(xùn)資料和視頻等,為科學(xué)數(shù)據(jù)的制備工作提供了較為充分的指導(dǎo)。例如C4提供了CDF、FITS、VOTable、HDF5、SAO等數(shù)據(jù)格式標(biāo)準(zhǔn)要求。三是科學(xué)數(shù)據(jù)提交環(huán)節(jié)。流程上,少部分科學(xué)數(shù)據(jù)中心(C1,C10,C14,C15)在政策中明確了科學(xué)數(shù)據(jù)質(zhì)量自查流程,大多數(shù)科學(xué)數(shù)據(jù)中心一般采取項(xiàng)目負(fù)責(zé)人線上審核或線下簽字蓋章等形式確保數(shù)據(jù)質(zhì)量。提交方式上,大部分科學(xué)數(shù)據(jù)中心都提供了線上提交方式,用戶可以在線完成科學(xué)數(shù)據(jù)匯交工作,一般可通過HTTP、FTP、Aspera命令行等多種方式在線批量提交。在面對(duì)大體量(通常為TB級(jí)別)科學(xué)數(shù)據(jù)一次性匯交時(shí),所有的科學(xué)數(shù)據(jù)中心都建議采用線下郵寄存儲(chǔ)介質(zhì)(如硬盤、U盤、光盤等)的方式協(xié)助完成匯交。C18在面對(duì)單個(gè)項(xiàng)目科學(xué)數(shù)據(jù)總量超出處理能力時(shí),采取了部分邏輯匯交方式,將部分?jǐn)?shù)據(jù)實(shí)體暫存項(xiàng)目單位。[2]四是科學(xué)數(shù)據(jù)審核環(huán)節(jié)。一般分為形式審核和內(nèi)容審核兩部分。形式審核一般由系統(tǒng)審核與人工審核相結(jié)合,通常要求數(shù)據(jù)實(shí)體匯交數(shù)量大于等于匯交計(jì)劃中的數(shù)量。比如C6會(huì)對(duì)匯交數(shù)據(jù)進(jìn)行完整性與規(guī)范性、一致性和數(shù)據(jù)質(zhì)量審核,并對(duì)不符合規(guī)定的數(shù)據(jù)要求整改或拒絕其接收;C13會(huì)在填報(bào)完成后自動(dòng)檢測(cè)元數(shù)據(jù)的完整性和規(guī)范性; C15提供實(shí)體數(shù)據(jù)檢查工具,便于統(tǒng)計(jì)數(shù)據(jù)條目數(shù)量。[3]內(nèi)容審核目前主要分為三種模式:專家/同行評(píng)審(C1,C4,C7)、用戶評(píng)價(jià)(C4,C6,C7,C8,C10,C13)和科學(xué)數(shù)據(jù)中心審核(C2,C3,C5)。雖然P2要求組織開展科學(xué)數(shù)據(jù)質(zhì)量同行評(píng)議等方式進(jìn)行評(píng)估,但部分科學(xué)數(shù)據(jù)中心(C2,C13)的匯交流程并未將此作為匯交通過的必要條件。五是科學(xué)數(shù)據(jù)匯總環(huán)節(jié)。在分類方式上,科學(xué)數(shù)據(jù)中心會(huì)采取多種維度的分類方式進(jìn)行匯總,便于用戶發(fā)現(xiàn)和利用。在編目方式上,C2,C3采用“項(xiàng)目—樣本/標(biāo)本—數(shù)據(jù)”三級(jí)分類方式進(jìn)行著錄關(guān)聯(lián),不同來源的數(shù)據(jù)按類型分別匯交到各庫(kù)中。而其他大多數(shù)科學(xué)數(shù)據(jù)中心通常以數(shù)據(jù)集為單位進(jìn)行編目。在標(biāo)識(shí)方面,除了C2,C3采用自編號(hào)外,其他所有科學(xué)數(shù)據(jù)中心均提供通用唯一標(biāo)識(shí)符,如CSTR、DOI、PID、Handle。其中C5,C18還采用了本學(xué)科領(lǐng)域的專用標(biāo)識(shí)編號(hào)。六是科學(xué)數(shù)據(jù)的發(fā)布與共享環(huán)節(jié)。科學(xué)數(shù)據(jù)在匯交時(shí)需要明確數(shù)據(jù)開放發(fā)布時(shí)間、共享方式、引用方式等信息。通常建議科學(xué)數(shù)據(jù)保護(hù)期不超過一年,大部分
科學(xué)數(shù)據(jù)中心都提供了超過一年的數(shù)據(jù)保護(hù)期限選擇。比如FAST項(xiàng)目的數(shù)據(jù)一般情況擁有12個(gè)月數(shù)據(jù)保護(hù)期,到期后根據(jù)數(shù)據(jù)類型將分批公開。共享方式方面,根據(jù)共享范圍分為暫不共享、完全開放共享、協(xié)議共享等;根據(jù)是否收費(fèi)分為公益、無償共享和收費(fèi)、有償共享等。七是科學(xué)數(shù)據(jù)的使用與維護(hù)更新。由于科學(xué)數(shù)據(jù)可能需要持續(xù)更新和完善,P1也規(guī)定“項(xiàng)目/課題驗(yàn)收后產(chǎn)生的科學(xué)數(shù)據(jù)也應(yīng)進(jìn)行匯交”,因此科學(xué)數(shù)據(jù)中心都支持?jǐn)?shù)據(jù)更新或追加。出于某些特殊原因(如侵權(quán)、剽竊、作假等),匯交負(fù)責(zé)人或科學(xué)數(shù)據(jù)中心有權(quán)提出撤回?cái)?shù)據(jù)。
(1)科學(xué)數(shù)據(jù)匯交來源復(fù)雜和流向混亂
P1針對(duì)匯交提及了三種不同來源的科學(xué)數(shù)據(jù):政府預(yù)算資金資助的各級(jí)科技計(jì)劃(專項(xiàng)、基金等)項(xiàng)目所形成的科學(xué)數(shù)據(jù)、學(xué)術(shù)論文數(shù)據(jù)和社會(huì)資金資助形成的科學(xué)數(shù)據(jù)。這三類來源在邏輯分類上既不全面,也存在交叉,比如學(xué)術(shù)論文數(shù)據(jù)通常屬于科技項(xiàng)目數(shù)據(jù)的一部分;再比如對(duì)于多資金來源的項(xiàng)目,較難區(qū)分?jǐn)?shù)據(jù)來源。從各科學(xué)數(shù)據(jù)中心的政策來看,不同科學(xué)數(shù)據(jù)中心對(duì)于“匯交”的認(rèn)知存在差異,存在項(xiàng)目、樣本、裝置設(shè)施、野外臺(tái)站、論文、機(jī)構(gòu)/團(tuán)隊(duì)、個(gè)人等不同來源的數(shù)據(jù)。此外,現(xiàn)有的20家國(guó)家科學(xué)數(shù)據(jù)中心一方面存在領(lǐng)域交叉,另一方面也不能完全覆蓋所有學(xué)科領(lǐng)域,導(dǎo)致無法在政策層面完全明確匯交數(shù)據(jù)歸屬流向。實(shí)際匯交過程中,數(shù)據(jù)流向可能受項(xiàng)目領(lǐng)域、項(xiàng)目來源、用戶意愿等多個(gè)因素影響,造成混亂局面。對(duì)于檔案部門而言,長(zhǎng)期以來都以項(xiàng)目(任務(wù))為單元開展科研檔案管理工作,檔案來源明確,已經(jīng)形成了一套較為成熟固定的管理模式。科學(xué)數(shù)據(jù)與科研檔案協(xié)同管理首先需要理清科學(xué)數(shù)據(jù)的來源問題,即哪些來源的科學(xué)數(shù)據(jù)可以納入科研檔案管理、不同來源的科學(xué)數(shù)據(jù)如何融入現(xiàn)有的檔案管理體系。
(2)科學(xué)數(shù)據(jù)與科研檔案管理主要目的差異
雖然科學(xué)數(shù)據(jù)與科研檔案都具有支撐和服務(wù)科研創(chuàng)新的作用,但是從更主要的目的來看,科研檔案管理強(qiáng)調(diào)憑證價(jià)值,傾向于保存;而科學(xué)數(shù)據(jù)匯交強(qiáng)調(diào)情報(bào)價(jià)值,更傾向于共享利用。科研檔案作為我國(guó)特有的一種門類檔案,一直承擔(dān)收集、整理、保管科技文件資料并提供利用服務(wù)的職能。長(zhǎng)期以來,受知識(shí)產(chǎn)權(quán)保護(hù)、安全保密等因素影響,檔案管理“重藏輕用”的傾向明顯,在開發(fā)利用方面較為保守。目前,F(xiàn)AIR原則早已成為科學(xué)數(shù)據(jù)管理的共識(shí),可發(fā)現(xiàn)(Findable)、可訪問(Accessible)、可互操作(Interoperable)和可重用(Reusable)四點(diǎn)要求也是基于共享利用這一需求提出的。相較于科研檔案相對(duì)嚴(yán)格的利用管理要求,科學(xué)數(shù)據(jù)在匯交時(shí)就要求數(shù)據(jù)提交者明確開放發(fā)布時(shí)間、共享方式等,故而在提供利用時(shí)一般無需再次征求形成者意見,顯得更加靈活和開放。作為科研檔案一部分的科學(xué)數(shù)據(jù),是否需要嚴(yán)格遵循科研檔案的相對(duì)嚴(yán)格的利用范圍限制,仍需進(jìn)一步討論。
(1)科學(xué)數(shù)據(jù)與科研檔案的管理粒度不統(tǒng)一
不同學(xué)科領(lǐng)域科學(xué)數(shù)據(jù)產(chǎn)生方式和管理要求存在差異,導(dǎo)致其在管理粒度上差異較大。目前科學(xué)數(shù)據(jù)通常以“數(shù)據(jù)集”為最小單位進(jìn)行管理,但是數(shù)據(jù)集的概念并不明確,實(shí)際操作中一個(gè)數(shù)據(jù)集既可以是單個(gè)電子文件,也可以是某個(gè)時(shí)空序列或某個(gè)主題下多個(gè)電子文件的集合;數(shù)據(jù)集除了包含數(shù)據(jù)實(shí)體外,還可能包含數(shù)據(jù)對(duì)應(yīng)的說明文檔和縮略圖等其他文件;數(shù)據(jù)集既可以是一個(gè)純文本格式文件(如基因組數(shù)據(jù)),也可以是多條數(shù)據(jù)組成一個(gè)結(jié)構(gòu)化數(shù)據(jù)文件(如標(biāo)本名錄數(shù)據(jù)),還可以是多維數(shù)組和二維表數(shù)據(jù)組成的一個(gè)多維數(shù)據(jù)集文件(如天文文件、大氣文件等)……即使在形式上科學(xué)數(shù)據(jù)完全屬于電子文件范疇,但在實(shí)際工作中也并不能完全套用檔案領(lǐng)域以“件”或“卷—件”為單位的管理方式。
(2)科學(xué)數(shù)據(jù)與科研檔案的領(lǐng)域差異
科研檔案強(qiáng)調(diào)通用性,沒有明顯的領(lǐng)域差別。而科學(xué)數(shù)據(jù)強(qiáng)調(diào)學(xué)科領(lǐng)域差異,因此在描述時(shí)除了通用的核心元數(shù)據(jù)外,還會(huì)擴(kuò)展本領(lǐng)域元數(shù)據(jù),比如地理位置信息、數(shù)據(jù)產(chǎn)品分級(jí)信息、實(shí)驗(yàn)樣本信息等。相較于檔案領(lǐng)域較為單一、通用的著錄項(xiàng),這部分元數(shù)據(jù)信息能夠直接揭示科學(xué)數(shù)據(jù)內(nèi)容,更易于滿足利用者需求。一些領(lǐng)域(如天文、空間、環(huán)境等)科學(xué)數(shù)據(jù)的產(chǎn)生具有連續(xù)性和可持續(xù)性,匯交可能只是一個(gè)階段性工作。在后續(xù)匯交中可能還會(huì)對(duì)數(shù)據(jù)集的內(nèi)容進(jìn)行修改和更新,這也意味著元數(shù)據(jù)需要同步修改更新,一定程度上有悖于檔案管理中對(duì)原始性的基本要求。
(1)科學(xué)數(shù)據(jù)匯交內(nèi)容與科研檔案歸檔范圍交叉
P2明確匯交內(nèi)容包括科學(xué)數(shù)據(jù)實(shí)體、科學(xué)數(shù)據(jù)描述信息和科學(xué)數(shù)據(jù)輔助工具軟件三類,這與《科學(xué)技術(shù)研究檔案管理規(guī)定》中“歸檔的科研電子文件及其……元數(shù)據(jù)等應(yīng)當(dāng)符合國(guó)家相關(guān)規(guī)范要求”以及“歸檔范圍包括數(shù)據(jù)、軟件等”的規(guī)定本質(zhì)是一致的。目前各科學(xué)數(shù)據(jù)中心對(duì)科學(xué)數(shù)據(jù)實(shí)體的界定并不一致,大多數(shù)科學(xué)數(shù)據(jù)中心的匯交范圍還包括了論文、專利、軟著等成果性文件,與現(xiàn)有的科研檔案歸檔范圍產(chǎn)生較大重合,造成項(xiàng)目相關(guān)數(shù)據(jù)重復(fù)歸檔。而這部分交叉的文件往往載體形式上也不夠規(guī)范,通常只是數(shù)字化副本或流式電子文檔,而非真正具有效力的電子文件。從邏輯上看,科學(xué)數(shù)據(jù)作為科研檔案的一部分,其匯交內(nèi)容必然也屬于歸檔范圍??蒲袡n案管理更“求全”,即注重全過程的成套性;而科學(xué)數(shù)據(jù)更“求精”,即聚焦關(guān)鍵性數(shù)據(jù)和最終成果。但目前割裂管理的方式既削弱了科研檔案的完整性,也容易造成重復(fù)歸檔。
(2)科學(xué)數(shù)據(jù)匯交與科研檔案歸檔流程重而不同
雖然宏觀上科學(xué)數(shù)據(jù)的匯交流程基本與科研檔案歸檔流程保持重合,但是在細(xì)節(jié)流程要求上差異較大。一是科研檔案強(qiáng)調(diào)科研項(xiàng)目各階段、全流程產(chǎn)生的文件的系統(tǒng)性和完整性,而科學(xué)數(shù)據(jù)管理更聚焦項(xiàng)目成果性文件的完整性。二是科研檔案強(qiáng)調(diào)真實(shí)性和原始性,而科學(xué)數(shù)據(jù)通常需要進(jìn)行一定的加工處理,如去隱私化、匿名化等。三是科研檔案的主要整理環(huán)節(jié)發(fā)生在移交前,由文件生成者負(fù)責(zé);而科學(xué)數(shù)據(jù)的編目、整理等環(huán)節(jié)發(fā)生在提交后,由科學(xué)數(shù)據(jù)中心完成。四是科研檔案審核偏重形式,科學(xué)數(shù)據(jù)審核可以深入具體內(nèi)容。五是科學(xué)數(shù)據(jù)在結(jié)題后仍可以更新完善,而科研檔案一般歸檔后較難持續(xù)跟進(jìn)更新。
(3)科學(xué)數(shù)據(jù)的格式繁多且不規(guī)范
科學(xué)數(shù)據(jù)通常表現(xiàn)為一維、二維或多維數(shù)組,也有圖片、音視頻等多種形式,雖然本質(zhì)上仍是文本、表格、柵格圖像或多維數(shù)據(jù)集合,但是為了便于開展數(shù)據(jù)分析和交換,各學(xué)科領(lǐng)域一般都會(huì)根據(jù)本領(lǐng)域特點(diǎn)和需求,采用特有的數(shù)據(jù)格式標(biāo)準(zhǔn)(如測(cè)序數(shù)據(jù)常用的fastq、fasta等;地理信息數(shù)據(jù)常用的Geotiff;空間、天文數(shù)據(jù)常用的CDF、FITS、VOTable、HDF5等),科學(xué)界在此基礎(chǔ)上開發(fā)了專用的分析和可視化工具,這也導(dǎo)致科學(xué)數(shù)據(jù)出現(xiàn)繁多的數(shù)據(jù)格式。出于長(zhǎng)期保存考慮,檔案領(lǐng)域通常要求電子文件轉(zhuǎn)換為通用格式或版式格式保存,而大多數(shù)科學(xué)數(shù)據(jù)格式并未經(jīng)過格式注冊(cè)和評(píng)估,很難直接轉(zhuǎn)換為通用格式或版式格式。隨著技術(shù)的不斷迭代發(fā)展,科學(xué)數(shù)據(jù)的格式還在持續(xù)更新和增加,這也為科研檔案電子化管理帶來難題。
(1)認(rèn)知層面:科學(xué)數(shù)據(jù)與科研檔案的泛化與交叉
無論是政策對(duì)科學(xué)數(shù)據(jù)定義與分類的“語焉不詳”,還是科學(xué)數(shù)據(jù)中心在匯交實(shí)踐中“來者不拒”,都體現(xiàn)出科學(xué)數(shù)據(jù)的泛化趨勢(shì)。同樣,電子文件正日益成為檔案工作關(guān)注焦點(diǎn),檔案自身的概念也在不知不覺中走向“泛化”。而隨著雙方管理要求的細(xì)化,原本模糊的交叉地帶也逐漸清晰起來。但這種泛化與交叉并不是偶然。追溯歷史可以發(fā)現(xiàn),我國(guó)科學(xué)數(shù)據(jù)的匯交管理模式起源于1963年《全國(guó)地質(zhì)資料匯交辦法》,雖然叫作“資料”,但是實(shí)際上仍屬于檔案范疇,也按照科技檔案要求管理。電子形態(tài)數(shù)據(jù)的大量出現(xiàn),和紙質(zhì)檔案管理模式的巨大差異,導(dǎo)致兩者逐漸分化發(fā)展。而《科學(xué)技術(shù)研究檔案管理規(guī)定》對(duì)數(shù)據(jù)的強(qiáng)調(diào),更像是一次概念上的“撥亂反正”,重新明確了科研檔案的范圍。因此,雖然這種概念上的泛化與業(yè)務(wù)上的交叉,客觀上的確會(huì)給傳統(tǒng)檔案管理觀念和現(xiàn)有管理模式帶來挑戰(zhàn),但也是檔案工作數(shù)字轉(zhuǎn)型的趨勢(shì)和機(jī)遇,是兩者未來開展協(xié)同的基礎(chǔ)之一,總體上是有益的。
(2)實(shí)踐層面:科學(xué)數(shù)據(jù)與科研檔案的異化與融合
在上述的協(xié)同困境中,大多數(shù)問題都是由于科學(xué)數(shù)據(jù)與科研檔案管理的差異性造成的。科學(xué)數(shù)據(jù)的學(xué)科領(lǐng)域?qū)傩詫?dǎo)致了其管理的復(fù)雜和多樣,而正是這種靈活性恰恰滿足了科學(xué)界對(duì)科學(xué)數(shù)據(jù)的利用共享需求??茖W(xué)數(shù)據(jù)本就是科研檔案的子集,相較于傳統(tǒng)科研檔案管理,擺脫了紙質(zhì)載體桎梏的科學(xué)數(shù)據(jù)在管理流程上明顯更加高效和扁平。因此,盲目地將傳統(tǒng)科研檔案的管理要求強(qiáng)加于科學(xué)數(shù)據(jù)既不科學(xué),也不現(xiàn)實(shí)。數(shù)字時(shí)代檔案管理部門要重新思考現(xiàn)有的管理要求是否合理,并及時(shí)做出新的調(diào)整和解釋。從目前的科學(xué)數(shù)據(jù)匯交政策來看,科學(xué)數(shù)據(jù)的管理整體較為粗放,匯交工作仍處于起步階段,尤其是不同學(xué)科間不平衡問題凸顯,檔案部門可以找準(zhǔn)場(chǎng)景切入,推進(jìn)與科學(xué)數(shù)據(jù)融合發(fā)展。
(1)建立科學(xué)數(shù)據(jù)與科研檔案協(xié)同管理共識(shí)
統(tǒng)一的認(rèn)知,是科學(xué)數(shù)據(jù)與科研檔案協(xié)同管理的基礎(chǔ)。對(duì)于科學(xué)數(shù)據(jù)管理方,需要認(rèn)識(shí)到匯交科學(xué)數(shù)據(jù)的檔案屬性,建立起清晰的管理邊界。對(duì)于科研檔案管理方,要充分認(rèn)識(shí)科學(xué)數(shù)據(jù)自身復(fù)雜特點(diǎn)和科學(xué)界的需求,在不影響科學(xué)數(shù)據(jù)良性發(fā)展的前提下努力提供檔案管理經(jīng)驗(yàn)。一是理清科學(xué)數(shù)據(jù)匯交來源,將科技計(jì)劃(含專項(xiàng)、基金等)項(xiàng)目來源的數(shù)據(jù)與其他來源的數(shù)據(jù)區(qū)分開。二是明確科學(xué)數(shù)據(jù)匯交內(nèi)容,多數(shù)情況下不要把文章、標(biāo)準(zhǔn)、專利、實(shí)驗(yàn)報(bào)告和研究報(bào)告等內(nèi)容作為首要的匯交內(nèi)容。[4]三是規(guī)范科學(xué)數(shù)據(jù)流向,除了將學(xué)科領(lǐng)域作為劃分標(biāo)準(zhǔn)外,也要考慮數(shù)據(jù)形成單位科研檔案的完整性不受破壞。
(2)創(chuàng)新形式開展領(lǐng)域科學(xué)數(shù)據(jù)歸檔工作
科學(xué)數(shù)據(jù)匯交實(shí)質(zhì)上就是一種歸檔機(jī)制,不過目前的匯交在細(xì)節(jié)上并不完全符合科研檔案管理要求。考慮到科學(xué)數(shù)據(jù)極強(qiáng)的領(lǐng)域特點(diǎn)和專業(yè)性,亟待創(chuàng)新工作形式使科學(xué)數(shù)據(jù)匯交工作規(guī)范化、合理化。一是建立系統(tǒng)的科學(xué)數(shù)據(jù)歸檔能力認(rèn)證機(jī)制,科學(xué)數(shù)據(jù)目前主流的匯交方式是按領(lǐng)域匯交,通過認(rèn)證的領(lǐng)域科學(xué)數(shù)據(jù)中心可以認(rèn)定為具有效力的科學(xué)數(shù)據(jù)歸檔部門。二是通過協(xié)議等方式,將檔案部門的一部分歸檔管理職責(zé)委托給科學(xué)數(shù)據(jù)管理部門,并對(duì)其加以監(jiān)管和定期檢查。
(3)整合優(yōu)化科學(xué)數(shù)據(jù)與科研檔案管理流程
由于科學(xué)數(shù)據(jù)匯交與科研檔案歸檔關(guān)注的側(cè)重點(diǎn)不同,導(dǎo)致其在流程上不能完全吻合,為整合優(yōu)化管理流程提供可能。一是加強(qiáng)前端控制環(huán)節(jié)整合,科學(xué)數(shù)據(jù)匯交計(jì)劃與科研檔案歸檔范圍都是在項(xiàng)目立項(xiàng)前期制定,內(nèi)容上科學(xué)數(shù)據(jù)匯交計(jì)劃更加具體,可以嵌入科研檔案歸檔范圍。二是加強(qiáng)中間環(huán)節(jié)共性流程整合,如人員培訓(xùn)、業(yè)務(wù)督導(dǎo)、審核驗(yàn)收等環(huán)節(jié)可以相互補(bǔ)位,提高項(xiàng)目管理的效率,切實(shí)減輕科研人員負(fù)擔(dān)。三是加強(qiáng)利用流程的整合,通過賦予匯交科學(xué)數(shù)據(jù)檔號(hào)或賦予科研檔案科技資源標(biāo)識(shí)符等方式,建立科研檔案和科學(xué)數(shù)據(jù)之間的雙向關(guān)聯(lián)。
(4)協(xié)同推進(jìn)科學(xué)數(shù)據(jù)長(zhǎng)期保存工作
對(duì)于科學(xué)數(shù)據(jù)管理部門而言,科學(xué)數(shù)據(jù)的長(zhǎng)期保存是確??茖W(xué)數(shù)據(jù)開放共享的前提;對(duì)于檔案部門而言,長(zhǎng)期保存是檔案管理的優(yōu)勢(shì)和使命職責(zé)。而長(zhǎng)期保存本就是一項(xiàng)涉及全流程、多主體的復(fù)雜工作,因此雙方存在較大協(xié)同空間。一是開展科學(xué)數(shù)據(jù)格式的評(píng)估、注冊(cè)和管理,亟需建立科學(xué)領(lǐng)域較完整和權(quán)威的格式信息庫(kù)。二是明確生命周期結(jié)束的科學(xué)數(shù)據(jù)流向和管理職責(zé),做好數(shù)據(jù)從科學(xué)數(shù)據(jù)中心向檔案管理部門移交冷保存的準(zhǔn)備。三是協(xié)同開展多節(jié)點(diǎn)異地備份以及存證工作,確??茖W(xué)數(shù)據(jù)資源長(zhǎng)期真實(shí)可用。