安新宇 錢毅
摘要:備份是防范風(fēng)險(xiǎn)、維護(hù)檔案數(shù)字資源安全的重要手段。綜合檔案館進(jìn)行備份介質(zhì)選型時(shí),存在選型要素研究零散、介質(zhì)管理動(dòng)態(tài)性強(qiáng)、備份數(shù)據(jù)分級(jí)策略不清等問題。論文在分析備份介質(zhì)技術(shù)基礎(chǔ)與實(shí)踐現(xiàn)狀的基礎(chǔ)上,對(duì)選型要素進(jìn)行多來源的全面收集和重新聚類,構(gòu)建了涵蓋介質(zhì)、管理、對(duì)象三個(gè)維度的選型要素整合框架,有助于綜合檔案館形成更有針對(duì)性的備份介質(zhì)選型方案。
關(guān)鍵詞:備份介質(zhì) 檔案數(shù)字資源備份 介質(zhì)選型
Abstract: Backup is an important means to pre? vent risks and maintain the security of digital archival resources. The selection of backup media for compre? hensive archives has problems such as fragmented research on selection elements, dynamic media man? agement and unclear classification strategy of back? up data. Based on the analysis of the technical foun? dation and practice status of backup media, this pa? per comprehensively collects and re-clusters the se? lection elements from multiple sources, and con? structs an integrated framework of selection ele? ments covering three dimensions of media, manage? ment and object, which helps comprehensive ar? chives form a more targeted backup media selection scheme.
Keywords:Backup media;Digital archival resourc? es backup;The selection of backup media
檔案數(shù)字資源對(duì)技術(shù)環(huán)境的強(qiáng)依賴特點(diǎn)導(dǎo)致數(shù)據(jù)災(zāi)難發(fā)生的風(fēng)險(xiǎn)增加。根據(jù)IBM報(bào)告,2022年數(shù)據(jù)泄露或丟失等安全事故頻發(fā),數(shù)據(jù)恢復(fù)成本相比2020年攀升了12.7%。[1]安全技術(shù)公司SOPHOS的一項(xiàng)調(diào)查顯示,在網(wǎng)絡(luò)攻擊勒索中,通過備份(56%)找回?cái)?shù)據(jù)的人數(shù)是支付贖金(26%)的兩倍之多。[2]備份已經(jīng)成為綜合檔案館重要的工作內(nèi)容,但如何選擇合適的備份介質(zhì)、如何在全面考量選型要素的基礎(chǔ)上形成針對(duì)性的介質(zhì)選型方案一直是困擾綜合檔案館的難題。綜合檔案館作為檔案數(shù)字資源保存主體,亟須依據(jù)館藏特點(diǎn)、管理需求和多介質(zhì)性能差異,形成有針對(duì)性的備份介質(zhì)選型方案。本文擬就備份介質(zhì)選型展開研究。
綜合檔案館備份工作的實(shí)質(zhì)是在資源對(duì)象復(fù)雜化的現(xiàn)實(shí)中實(shí)現(xiàn)支撐災(zāi)難恢復(fù)、維護(hù)檔案安全的目標(biāo),備份介質(zhì)選型方案的形成需要以此為準(zhǔn)繩,為綜合檔案館備份工作提供良好的物質(zhì)基礎(chǔ)。
(一)適應(yīng)備份對(duì)象復(fù)雜化是備份工作的現(xiàn)實(shí)任務(wù)
備份工作的主要對(duì)象是以檔案數(shù)字資源為代表的海量數(shù)據(jù),其復(fù)雜化特征主要體現(xiàn)在三個(gè)方面。一是檔案數(shù)字資源對(duì)象愈發(fā)多元,數(shù)量規(guī)模將急劇攀升。綜合檔案館館藏檔案數(shù)字資源類型發(fā)展很快,從紙質(zhì)件的數(shù)字化副本,到自身攜帶大量元數(shù)據(jù)的增量電子文件,再到蘊(yùn)含大量規(guī)則信息和數(shù)據(jù)內(nèi)容的數(shù)據(jù)態(tài)對(duì)象,包括數(shù)據(jù)庫、三維模型等。各省“十四五”規(guī)劃在館藏量、歸檔率方面制定了目標(biāo),如山東省提出全省館藏檔案數(shù)量增長45%以上,[3]綜合檔案館備份的數(shù)據(jù)量預(yù)計(jì)將大幅攀升。二是綜合檔案館備份對(duì)象將逐步從冷數(shù)據(jù)為主拓展到冷熱溫兼具。當(dāng)前綜合檔案館的備份對(duì)象以數(shù)據(jù)量大、訪問頻率和活躍度低的檔案冷數(shù)據(jù)為主,隨著技術(shù)升級(jí),備份對(duì)象將逐漸拓展,從單純的冷數(shù)據(jù)載體托管型備份,逐漸向維系業(yè)務(wù)連續(xù)性的熱數(shù)據(jù)備份拓展。三是備份對(duì)象將從相對(duì)單純的數(shù)字資源擴(kuò)展到系統(tǒng)。國家“十四五”規(guī)劃已經(jīng)提出建設(shè)國家電子檔案戰(zhàn)略備份中心的任務(wù),綜合檔案館的備份對(duì)象將不再止步于目前主要的檔案數(shù)字資源,有望進(jìn)一步延伸擴(kuò)展至應(yīng)用系統(tǒng)、應(yīng)用環(huán)境乃至數(shù)字檔案館基礎(chǔ)設(shè)施整體。
(二)支撐災(zāi)難恢復(fù)是備份工作的直接目標(biāo)
備份工作的直接目的是應(yīng)對(duì)各類風(fēng)險(xiǎn)因素引發(fā)的災(zāi)害事故,如信息系統(tǒng)的嚴(yán)重故障甚至癱瘓。在災(zāi)害發(fā)生導(dǎo)致檔案數(shù)字資源丟失、損壞時(shí),能夠通過備份資源進(jìn)行有效恢復(fù)。從某種程度上看,備份數(shù)據(jù)只有在災(zāi)難發(fā)生后才有意義。備份工作是為了災(zāi)難發(fā)生后將數(shù)據(jù)恢復(fù)至某一時(shí)間點(diǎn)的完整狀態(tài),其實(shí)施需要合適的備份方式與合理的備份周期等策略的配合。在災(zāi)難未發(fā)生時(shí),備份主體對(duì)于備份數(shù)據(jù)的需求是較低的,備份介質(zhì)能夠支持?jǐn)?shù)據(jù)正常讀取即可。在備份實(shí)踐中,需要在備份周期內(nèi)維護(hù)備份載體自身的物理安全,并保證備份數(shù)據(jù)的正常讀取,因此選擇適宜的載體完成備份任務(wù)對(duì)綜合檔案館來說尤為重要。
(三)維護(hù)檔案安全是備份工作的基本使命
備份是指“為防止出現(xiàn)操作失誤或系統(tǒng)故障導(dǎo)致數(shù)據(jù)丟失,將全部或部分?jǐn)?shù)據(jù)集合從應(yīng)用主機(jī)復(fù)制到其他的存儲(chǔ)媒體或系統(tǒng)的過程”《信息技術(shù)備份儲(chǔ)存?zhèn)浞菁夹g(shù)應(yīng)用要求》(GB/T 36092—2018)。因此進(jìn)行備份活動(dòng)的基本使命在于維護(hù)檔案安全,為館藏檔案數(shù)字資源打造一張“防墜網(wǎng)”,盡力實(shí)現(xiàn)檔案數(shù)字資源不丟失、檔案館服務(wù)不停擺。館藏資源是檔案館的立身之本,在規(guī)范形成、實(shí)體保護(hù)、技術(shù)保存、語義管護(hù)的基礎(chǔ)上,[4]備份進(jìn)一步降低不可抗力等通過有效管理無法解決的風(fēng)險(xiǎn)因素,使檔案即使在已經(jīng)損毀甚至滅失的情況下,仍能迎來“重生”。
進(jìn)行備份介質(zhì)選型研究,有必要對(duì)各類主流備份介質(zhì)的基本特性、優(yōu)缺點(diǎn)及當(dāng)前技術(shù)發(fā)展的態(tài)勢(shì)進(jìn)行了解。
(一)磁帶
作為存儲(chǔ)介質(zhì)中的“世紀(jì)老人”,磁帶一貫具有容量大密度高的優(yōu)點(diǎn),當(dāng)前最新的存儲(chǔ)型磁帶LTO-9標(biāo)準(zhǔn)容量據(jù)稱能夠躍升至18TB~45TB,在10年總擁有成本比較研究中,LTO-8磁帶比磁盤存儲(chǔ)便宜7倍,比云系統(tǒng)便宜3倍。[5]近年來磁帶相關(guān)技術(shù)也在逐步升級(jí),如現(xiàn)代磁帶庫能夠自動(dòng)監(jiān)測(cè)磁帶盒、驅(qū)動(dòng)器和其他組件的狀態(tài)和健康狀況,使得老式磁帶容易出錯(cuò)的刻板印象被打破。但磁帶與生俱來的線性存儲(chǔ)和順序讀取特點(diǎn)是其固有缺陷,在一定程度上影響其存儲(chǔ)與讀取效率。此外,磁帶還有較明顯的技術(shù)與品牌綁定趨勢(shì),即使同為LTO格式,但不同品牌和隔代產(chǎn)品之間的兼容性存在問題,復(fù)制與恢復(fù)等操作也比較受限。
(二)磁盤與磁盤陣列
磁盤存儲(chǔ)容量大、單位價(jià)格低、讀取速度快,西部數(shù)據(jù)設(shè)備和平臺(tái)業(yè)務(wù)高級(jí)副總裁Yusuf Jamal評(píng)價(jià)磁盤“能為超大規(guī)模的數(shù)據(jù)中心提供大規(guī)模的總擁有價(jià)值”[6]。磁盤屬于非易失性載體,斷電后存儲(chǔ)數(shù)據(jù)也不會(huì)消失,因而具有較強(qiáng)的離線備份能力。在速度上磁盤相較于磁帶和光盤具有比較優(yōu)勢(shì),某品牌5TB的磁盤讀取速度能夠達(dá)到140MB/S。國際數(shù)據(jù)公司IDC預(yù)測(cè)“來自云服務(wù)提供商和超大規(guī)模數(shù)據(jù)中心客戶的磁盤需求將保持強(qiáng)勁,在2020—2025年預(yù)測(cè)期內(nèi),全球磁盤行業(yè)PB級(jí)出貨量的復(fù)合年增長率將達(dá)到18.5%”[7]。在規(guī)模性備份活動(dòng)中還會(huì)采用由多個(gè)磁盤構(gòu)成的磁盤陣列來進(jìn)一步提升性能。但磁盤復(fù)雜的機(jī)械結(jié)構(gòu)同時(shí)也增加了它的脆弱性,存在磁頭碰撞和磁干擾的風(fēng)險(xiǎn),冬季靜電放電、夏季盤體過熱等也在威脅著磁盤壽命。
(三)光盤系列
光盤在我國綜合檔案館的備份工作中曾占據(jù)重要位置,目前有三項(xiàng)專門的行業(yè)標(biāo)準(zhǔn)《檔案數(shù)字化光盤標(biāo)識(shí)規(guī)范》(DA/T 52—2014)、《電子檔案存儲(chǔ)用可錄類藍(lán)光光盤(BD-R)技術(shù)要求和應(yīng)用規(guī)范》(DA/T 74—2019)、《檔案級(jí)可錄類光盤CD-R、DVD-R、DVD+R技術(shù)要求和應(yīng)用規(guī)范》(DA/T 38—2021)對(duì)光盤介質(zhì)的技術(shù)要求及應(yīng)用進(jìn)行規(guī)范。檔案級(jí)可錄類光盤具體包括CD-R、DVD-R、BD-R等多種規(guī)格,其中BD-R指可錄類藍(lán)光光盤,技術(shù)指標(biāo)優(yōu)于光盤工業(yè)標(biāo)準(zhǔn),保存壽命大于30年,已得到世界各國的廣泛認(rèn)可。光盤的讀取速度也在隨著技術(shù)更新而提高,現(xiàn)有檔案級(jí)光盤生產(chǎn)廠商宣稱其產(chǎn)品最大寫入速度可達(dá)1.5Gbps,讀取速度可達(dá)3Gbps。[8]在記錄原理上,采用pit-land模式記錄的信息坑一旦受燒灼形成后就無法被改變或者覆蓋,實(shí)現(xiàn)了真正意義上的不可篡改。由于光盤的配套管理相對(duì)復(fù)雜,與磁盤產(chǎn)品相比,其盤片與驅(qū)動(dòng)器管理都需要備份機(jī)構(gòu)進(jìn)行專業(yè)管理,甚至需要配套光盤庫才能進(jìn)行,存在較大的技術(shù)和管理風(fēng)險(xiǎn)。同時(shí)優(yōu)質(zhì)檔案級(jí)光盤在價(jià)格上也不具有明顯優(yōu)勢(shì),主流檔案級(jí)藍(lán)光光盤的官方報(bào)價(jià)高于磁盤和LTO-8磁帶。光盤的優(yōu)缺點(diǎn)使得不同檔案館在選型時(shí)存在較大的差異。
(四)縮微膠片
縮微膠片在檔案數(shù)字資源備份領(lǐng)域的應(yīng)用亦有突破,存在數(shù)字圖像和數(shù)字信號(hào)寫入兩種方式??s微技術(shù)是以膠片為介質(zhì)將紙質(zhì)檔案原件按不同比例進(jìn)行縮拍記錄在感光膠片上的傳統(tǒng)轉(zhuǎn)換技術(shù)。21世紀(jì)以來出現(xiàn)了數(shù)轉(zhuǎn)膠技術(shù),較為成熟的是數(shù)字圖像轉(zhuǎn)縮微方式,《數(shù)字檔案信息輸出到縮微膠片上的技術(shù)規(guī)范》(DA/T 44—2009)與《紙質(zhì)檔案縮微數(shù)字一體化技術(shù)規(guī)范》(DA/T 71—2018)都是關(guān)于紙質(zhì)檔案數(shù)字化圖像輸出到縮微膠片的規(guī)范。目前業(yè)界已經(jīng)出現(xiàn)直接將數(shù)字信號(hào)寫入膠片的技術(shù),挪威Piql公司研制的數(shù)字縮微技術(shù)可以將數(shù)據(jù)和文件元數(shù)據(jù)編碼為二維條碼圖像寫入膠片,每一幀能保存2MB以上數(shù)據(jù),寫入速度為40MB/s,讀取速度為24MB/s。[9]縮微膠片具有長壽的優(yōu)勢(shì),國際原子能機(jī)構(gòu)認(rèn)為在適當(dāng)?shù)臏貪穸葪l件下壽命或可達(dá)到500年以上,[10]但縮微膠片與其他介質(zhì)相比檢索讀取速度仍較低,當(dāng)前數(shù)字縮微技術(shù)有待進(jìn)一步標(biāo)準(zhǔn)化,技術(shù)成熟度也有待進(jìn)一步提升。所以縮微膠片常用作異質(zhì)備份,較少作為承擔(dān)大規(guī)模檔案數(shù)字資源備份的主要介質(zhì)。
為了解當(dāng)前檔案數(shù)字資源備份介質(zhì)選型中出現(xiàn)的實(shí)際問題,筆者深度訪談了數(shù)家已經(jīng)規(guī)模性開展備份工作并已具備較為豐富實(shí)踐經(jīng)驗(yàn)的省級(jí)綜合檔案館。同時(shí)為了解備份介質(zhì)市場(chǎng)趨勢(shì)以及產(chǎn)品選擇空間,補(bǔ)充訪談了產(chǎn)品較為成熟且有一定市場(chǎng)競(jìng)爭力的備份企業(yè)。同時(shí)結(jié)合關(guān)于備份介質(zhì)選型已有研究成果,從研究與實(shí)踐兩個(gè)層面洞察選型現(xiàn)狀,總結(jié)了現(xiàn)有支撐介質(zhì)選型的多樣要素。
(一)國內(nèi)外備份介質(zhì)選型要素研究現(xiàn)狀
1.國外:國家檔案館為主體提供選型指導(dǎo)。國外備份介質(zhì)選型過程中國家檔案館發(fā)揮了重要作用,通過指南等形式為備份工作推薦參考要素。其中,澳大利亞國家檔案館2004年的《創(chuàng)建、管理和保存數(shù)字記錄指南》概括了政府機(jī)構(gòu)在進(jìn)行介質(zhì)選型時(shí)應(yīng)考量的八個(gè)要素,即利用頻率、讀取速度、多功能性、壽命、兼容性、技術(shù)開放性、環(huán)境敏感性和總擁有成本。[11]美國檔案與文件管理局(NARA)2006年的《電子記錄存儲(chǔ)介質(zhì)的選擇和維護(hù)》提供了介質(zhì)選擇時(shí)推薦參考的七要素,包括記錄的壽命、保留記錄所需的維護(hù)、存儲(chǔ)和檢索記錄的成本、記錄的密度、檢索存儲(chǔ)記錄的訪問時(shí)間、媒介的可移植性、介質(zhì)是否符合當(dāng)前聯(lián)邦信息處理標(biāo)準(zhǔn)等。[12]英國國家檔案館2008年編制的備份工作指導(dǎo)說明關(guān)注介質(zhì)壽命、容量、可行性、技術(shù)成熟度、成本(兼顧總體擁有成本)和環(huán)境敏感性等六大要素。[13]新西蘭國家檔案館2020年的《關(guān)于數(shù)字存儲(chǔ)和保存的最佳實(shí)踐指南》認(rèn)為在進(jìn)行數(shù)字存儲(chǔ)系統(tǒng)選型時(shí)需要關(guān)注安全性、可訪問性、壽命、耐用性和過時(shí)風(fēng)險(xiǎn)。[14]
2.國內(nèi):學(xué)術(shù)研究與標(biāo)準(zhǔn)化引領(lǐng)選型實(shí)踐。由于事關(guān)檔案與數(shù)據(jù)安全,備份介質(zhì)相關(guān)研究在我國受到相當(dāng)?shù)闹匾?,最早可以追溯?998年。[15]伴隨存儲(chǔ)技術(shù)的發(fā)展,針對(duì)備份介質(zhì)選什么、如何選的研究成果不斷積累,對(duì)于影響備份選型要素的認(rèn)識(shí)也逐漸深化。中國檔案學(xué)會(huì)[16]在《數(shù)字檔案的存儲(chǔ)載體》中確定的存儲(chǔ)載體選擇六大量化參數(shù),包括技術(shù)成熟度、保存期、存取速度、容量、成本和數(shù)據(jù)關(guān)聯(lián)支持度;張靜等[17]在中國科學(xué)院檔案館的實(shí)踐中按照長期保存從高到低的需求將存儲(chǔ)載體性能指標(biāo)歸納為壽命、防篡改安全性、總體擁有成本、讀取速度和容量;袁鈞[18]強(qiáng)調(diào)了存儲(chǔ)介質(zhì)的穩(wěn)定性;楊道玲[19]提出要考慮部門具體情況以及參考國內(nèi)外相關(guān)標(biāo)準(zhǔn)、規(guī)定以及行業(yè)推薦意見。在要素分類上,李從衛(wèi)[20]進(jìn)一步將要素分為基本性能因素、外界環(huán)境因素和利用效能因素三類;陳蘇琪等[21]認(rèn)為選擇歸檔電子文件存儲(chǔ)載體時(shí)主要關(guān)注存儲(chǔ)載體本身、歸檔電子文件本身、電子文件的存儲(chǔ)方式和存儲(chǔ)載體所需的環(huán)境要求四方面。在標(biāo)準(zhǔn)化上,我國《公務(wù)電子郵件歸檔與管理規(guī)則》(DA/T 32—2005)附錄中,將一次性寫入磁帶、CD-ROM、CD-R、DVD-R光盤等納入備份用途;《電子文件歸檔與電子檔案管理規(guī)范》(GB/T 18894—2016)指出,應(yīng)按備份形式選擇載體,宜采用磁帶備份系統(tǒng)進(jìn)行近線備份,離線備份采用一次性寫入光盤、磁帶、硬磁盤等離線存儲(chǔ)介質(zhì)。
總體來看,國內(nèi)外在研究介質(zhì)選型時(shí)都綜合考慮了多個(gè)因素,包括介質(zhì)的壽命、兼容性、可訪問性等。但要素研究仍以分散列舉為主,不同的研究者提出了不同的要素分類和參數(shù),缺乏體系性支持和具體場(chǎng)景,尤其對(duì)綜合檔案館的指導(dǎo)性不足,抑或形成了簡單分類,但其類別無法有效涵蓋所有相關(guān)要素,因而需要從新的視角出發(fā)對(duì)要素進(jìn)行重新組織。
(二)變化管理成為綜合檔案館備份介質(zhì)選型常態(tài)
綜合檔案館在開展備份介質(zhì)選型時(shí)需要秉持變化管理理念。首先,存儲(chǔ)技術(shù)更新?lián)Q代速度快,新技術(shù)應(yīng)用與備份需求需要?jiǎng)討B(tài)平衡。與芯片領(lǐng)域的摩爾定律類似,數(shù)據(jù)存儲(chǔ)廠商也一直在快速迭代升級(jí)各類存儲(chǔ)設(shè)備和技術(shù)方案以獲得競(jìng)爭優(yōu)勢(shì),這就需要綜合檔案館及時(shí)掌握發(fā)展動(dòng)態(tài),合理應(yīng)用新產(chǎn)品。其次,備份產(chǎn)品多元,存在復(fù)雜的品牌與代際兼容關(guān)系。檔案數(shù)字資源備份介質(zhì)目前以磁帶、磁盤、光盤等產(chǎn)品為主,各個(gè)系列內(nèi)部與彼此之間存在較為復(fù)雜的關(guān)聯(lián)關(guān)系,對(duì)綜合檔案館持續(xù)開展備份工作提出了挑戰(zhàn)。最后,綜合檔案館備份工作需要考慮備份介質(zhì)及持續(xù)運(yùn)維過程中的綜合風(fēng)險(xiǎn),如技術(shù)層面的專利風(fēng)險(xiǎn)和市場(chǎng)層面的斷供風(fēng)險(xiǎn)等。
(三)現(xiàn)有備份數(shù)據(jù)分級(jí)策略缺乏針對(duì)性
綜合檔案館資源類型復(fù)雜、數(shù)據(jù)體量龐大,既有存量紙質(zhì)檔案的數(shù)字化副本,又有包含版式電子文件、音視頻、三維數(shù)據(jù)等多種類型的檔案數(shù)字資源。因此,有必要根據(jù)一定策略劃分資源類型,以便匹配不同的備份方案,綜合利用優(yōu)缺點(diǎn)各異的備份介質(zhì),實(shí)現(xiàn)安全可靠的備份目標(biāo)。但在訪談中,受訪綜合檔案館和企業(yè)對(duì)如何實(shí)施檔案數(shù)字資源備份數(shù)據(jù)分級(jí)策略莫衷一是,都認(rèn)為目前的備份策略對(duì)于檔案數(shù)字資源狀況的針對(duì)性不強(qiáng)。這一模糊狀況不利于備份介質(zhì)選型形成兼顧安全與成本的方案。
根據(jù)訪談結(jié)果,綜合檔案館依據(jù)自己的實(shí)踐經(jīng)驗(yàn)主要根據(jù)數(shù)據(jù)穩(wěn)定性劃分活躍與非活躍數(shù)據(jù),同時(shí)重點(diǎn)關(guān)注是否涉密;而備份企業(yè)所提供的備份服務(wù)中使用的分級(jí)策略則主要關(guān)注備份數(shù)據(jù)的利用頻率,同時(shí)兼顧數(shù)據(jù)穩(wěn)定性和性能要求、系統(tǒng)能耗。檔案數(shù)字資源備份分級(jí)標(biāo)準(zhǔn)各行其是、缺乏針對(duì)性,一方面是由于備份工作標(biāo)準(zhǔn)建設(shè)仍處于探索過程中,另一方面則是由于日益龐大的數(shù)據(jù)量、不斷增長的數(shù)據(jù)預(yù)期以及時(shí)時(shí)變化的資源狀況,不利于備份介質(zhì)選型形成兼顧安全與成本的方案。
基于對(duì)綜合檔案館備份介質(zhì)選型需要關(guān)注的要素總結(jié)與分析,本文提出進(jìn)行備份介質(zhì)選型工作時(shí)需要密切關(guān)注的三大維度,包括關(guān)注介質(zhì)本身客觀性能的介質(zhì)維、關(guān)注備份主體管理需求的管理維和關(guān)注備份檔案數(shù)字資源對(duì)象特征的對(duì)象維(見圖1)。介質(zhì)、管理、對(duì)象三維能夠最大限度地覆蓋前面所梳理的選型要素,為備份介質(zhì)選型提供綜合參考和具體情境。
(一)介質(zhì)維:備份介質(zhì)客觀屬性為備份介質(zhì)選型提供基礎(chǔ)
備份介質(zhì)選型的基本出發(fā)點(diǎn)是建立在備份介質(zhì)自身的各項(xiàng)性能上,介質(zhì)維要素可總結(jié)為九個(gè),它們較為全面地呈現(xiàn)了備份介質(zhì)的綜合屬性。
壽命、容量、成本、技術(shù)成熟度是備份介質(zhì)的核心要素。壽命指介質(zhì)的物理壽命,是備份介質(zhì)能夠保障檔案數(shù)字資源安全可用的時(shí)間期限。需要關(guān)注的是,在數(shù)字環(huán)境中介質(zhì)壽命也并不是越長越好,用于讀取介質(zhì)的驅(qū)動(dòng)技術(shù)的過時(shí)通常比備份介質(zhì)本身的物理惡化更重要,因而需要關(guān)注介質(zhì)全程維護(hù)成本。容量關(guān)注介質(zhì)實(shí)際能夠提供的備份數(shù)據(jù)規(guī)模,選擇時(shí)需要與館藏資源數(shù)據(jù)量、成本進(jìn)行平衡。成本要素在介質(zhì)維中指狹義的載體成本。技術(shù)成熟度可參考國際咨詢公司Gartner提出的技術(shù)成熟度曲線進(jìn)行判斷,新技術(shù)的發(fā)展傳播被劃分為科技誕生期、泡沫巔峰期、泡沫破裂低谷期、穩(wěn)步爬升期、規(guī)模應(yīng)用期五個(gè)階段,[22]綜合檔案館備份介質(zhì)選型求穩(wěn)不求新,故而從技術(shù)成熟度角度看備份介質(zhì)可考慮后兩個(gè)階段的產(chǎn)品。
介質(zhì)維還包括環(huán)境敏感性、存取速度、防篡改安全性、機(jī)械穩(wěn)定性、多功能性等五個(gè)相關(guān)要素。環(huán)境敏感性指介質(zhì)對(duì)物理環(huán)境變化的敏感程度。備份介質(zhì)需要選擇環(huán)境敏感性低的產(chǎn)品,例如,低環(huán)境敏感的磁性介質(zhì)能夠減少被暴露于磁場(chǎng)導(dǎo)致的意外擦除的概率。存取速度是介質(zhì)性能的重要指標(biāo),需要與對(duì)象維的備份數(shù)據(jù)穩(wěn)定性以及管理維的總體擁有成本結(jié)合考量。防篡改安全性關(guān)乎備份數(shù)據(jù)的真實(shí)完整,只有未經(jīng)篡改的備份數(shù)據(jù)才有資格進(jìn)行災(zāi)難恢復(fù)。機(jī)械穩(wěn)定性則指?jìng)浞萁橘|(zhì)的出錯(cuò)、故障情況是否頻繁發(fā)生。多功能性指?jìng)浞萁橘|(zhì)適應(yīng)備份對(duì)象大小、數(shù)量和復(fù)雜性的能力,這回應(yīng)了當(dāng)前備份對(duì)象復(fù)雜化的趨勢(shì)。
(二)管理維:介質(zhì)選型應(yīng)滿足綜合檔案館備份管理工作需求
管理維側(cè)重綜合檔案館的管理需求,篩選后管理維要素主要包含可移植性、總體擁有成本、合規(guī)性、國產(chǎn)化程度和備份管理配置等??梢浦残灾笇?duì)不同類型、不同品牌、不同代際介質(zhì)的兼容,可移植性強(qiáng)的備份介質(zhì)能夠在多個(gè)廠家提供的設(shè)備上運(yùn)行,支持備份信息完好無損地從一種介質(zhì)轉(zhuǎn)移到另一種介質(zhì)上,同時(shí)支持在不同代際之間的遷移??傮w擁有成本是占有某項(xiàng)資產(chǎn)所需要花費(fèi)的全部成本,該要素對(duì)綜合檔案館備份而言更具實(shí)際意義,要求綜合檔案館選型時(shí)考慮固定成本外的維修養(yǎng)護(hù)、培訓(xùn)人員等可變成本。合規(guī)性要求在備份介質(zhì)選型時(shí)符合國家、行業(yè)要求,備份工作標(biāo)準(zhǔn)化既能夠減少問題發(fā)生,也能滿足監(jiān)督檢查要求。國產(chǎn)化程度要求在同類產(chǎn)品中注重品牌選擇,防范市場(chǎng)斷供風(fēng)險(xiǎn)。備份管理配置指綜合檔案館的備份目的、備份對(duì)象、經(jīng)濟(jì)能力等,它使得管理場(chǎng)景進(jìn)一步具體化,不同的備份管理配置也對(duì)應(yīng)著介質(zhì)維和對(duì)象維的不同側(cè)面。
(三)對(duì)象維:檔案數(shù)字資源本身特征指導(dǎo)備份數(shù)據(jù)分級(jí)分類
精準(zhǔn)的介質(zhì)選型方案應(yīng)該與備份數(shù)據(jù)分級(jí)結(jié)果相匹配,而常用的分級(jí)策略則來源于檔案數(shù)字資源本身的特征,這也構(gòu)成了對(duì)象維的要素。
對(duì)象維要素主要包含數(shù)據(jù)穩(wěn)定性、備份對(duì)象基本狀況、保密性等。數(shù)據(jù)穩(wěn)定性是在檔案數(shù)字對(duì)象生命周期的框架下討論的,可將數(shù)據(jù)區(qū)分為穩(wěn)定數(shù)據(jù)和活躍數(shù)據(jù),活躍數(shù)據(jù)對(duì)備份介質(zhì)讀取速度要求更高,在轉(zhuǎn)化為穩(wěn)定數(shù)據(jù)后需要向容量大、速度較慢但是壽命更長的載體遷移。這也是冷溫?zé)釘?shù)據(jù)動(dòng)態(tài)備份方案必須考慮的要素。備份對(duì)象基本狀況指摸清館藏家底,詳細(xì)開展館藏檔案數(shù)字資源的基本統(tǒng)計(jì),包括館藏檔案數(shù)字資源的數(shù)量、類型、格式、增長預(yù)期等。維護(hù)涉密檔案安全是綜合檔案館不容有失的重要工作內(nèi)容,保密性要求備份介質(zhì)將涉密檔案與不涉密檔案進(jìn)行區(qū)隔,看重介質(zhì)的防篡改能力、加密驗(yàn)證功能。
在應(yīng)用三維選型框架時(shí),可將其視為由介質(zhì)、管理和對(duì)象三維架構(gòu)起的立方體。綜合檔案館在運(yùn)用備份介質(zhì)選型框架開展工作時(shí),需要首先關(guān)注管理維和對(duì)象維要素交叉形成的二維平面。這個(gè)交叉平面代表了特定的綜合檔案館館藏對(duì)象和管理手段的配置情況,涵蓋了該館在備份工作方面的個(gè)性化需求。將該平面向介質(zhì)維延伸,依據(jù)本館檔案數(shù)字資源狀況確定基本分級(jí)分類策略,就能夠在這個(gè)三維模型中確定總體管理配置下不同類別數(shù)據(jù)對(duì)于介質(zhì)性能的需求,最終得出兼顧管理、資源和介質(zhì)三個(gè)維度的最適宜的備份介質(zhì)選型方案。
*本文系國家檔案局“檔案數(shù)字資源戰(zhàn)略備份中心技術(shù)規(guī)范研究”項(xiàng)目。
注釋及參考文獻(xiàn):
[1]IBM.Cost of a data breach 2022:A million-dollar race to detect and respond[EB/OL]. [2022-12-12].https://www.ibm. com/downloads/cas/A48NDEYW.
[2]SOPHOS. The state of ransomware 2020–Sophos News[EB/OL].[2022- 09- 07]. https://news.sophos.com/enus/2020/05/12/the-state-of-ransomware-2020/.
[3]中國人民大學(xué)檔案事業(yè)發(fā)展研究中心.中國檔案事業(yè)發(fā)展報(bào)告(2022)[M].北京:中國人民大學(xué)出版社,2022:71–77.
[4]錢毅.從保護(hù)到管護(hù):對(duì)象變遷視角下的檔案保管思想演變[J].檔案學(xué)通訊,2022(2):82–88.
[5]Arcilla A. Quantifying the Economic Benefits of LTO-8 Technology[EB/OL].[2022- 09- 20].https://www.tapetember. com/portals/0/tapetember/resources/esg%20-%20quantifying% 20the%20economic%20benefits%20of%20lto-8%20technology% 20(sep%202018).pdf.
[6]Media O. Expert Predictions for 2020, Part 2: IoT and the Cloud[EB/OL]. [2022- 09- 20]. http://embeddedcomput? ing.com/technology/iot/expert- predictions- for- 2020- part- 2-iot-and-the-cloud.
[7]IDC. IDC Forecasts Solid Growth for the Hard Disk Drive and Solid State Drive Markets to Meet Increasing Demand for Data Storage Capacity[EB/OL].[2022- 09- 20]. https:// www.idc.com/getdoc.jsp?containerId=prUS47975921.
[8]Sony.ODC5500R - Optical Disc Archive Cartridge Generation 3 - Sony Pro[EB/OL]. [2022-09-21].https://pro. sony/en_HR/products/optical- disc- archive- cartridges/opti? cal- disc- archive- cartridge- generation- 3#ProductSpecifica? tionsBlock-optical-disc-archive-cartridge-generation-3.
[9]SABLINSKI J, TRUJILLO A. Piql. Long-term preser? vation technology study[J]. Archeion, 2021(122):13-32.
[10]International Atomic Energy Agency. Long term preser? vation of information for decommissioning projects[M]. Vienna: International Atomic Energy Agency,2008:68.
[11]National Archives Of Australia. Digital recordkeeping: guidelines for creating, managing and preserving digital records.[M].Canberra:NationalArchivesofAustralia,2004:41.
[12] NARA.National Archives and Record Administrations (NARA) Standards for Guidance on Maintenance and Storage of Electronic Records[EB/OL].[2022-09-22]. https://dor.mo. gov/taxation/business/audit/documents/erecords_000.pdf.
[13] Brown A. Document Reference: DPGN-02 Issue: 2 Is? sue Date: August 2008[EB/OL]. (2008)[2022-08-12].https:// cdn.nationalarchives.gov.uk/documents/information- manage? ment/selecting-storage-media.pdf.
[14] Archives New Zealand. Best practice guidance on digi? tal storage and preservation–archives new zealand[EB/OL].[2022-09-27].https://www.archives.govt.nz/manage-informa? tion/how- to- manage- your- information/digital/best- prac? tice-guidance-on-digital-storage-and-preservation.
[15]馬可為.淺談數(shù)據(jù)備份[J].金融電子化,1998(6):50–51.
[16]中國檔案學(xué)會(huì).數(shù)字檔案的存儲(chǔ)載體[M].北京:中國文史出版社,2016:144-148.
[17]張靜,王夢(mèng)瑤,單嵩巖,等.磁光電混合存儲(chǔ)在數(shù)字檔案資源長期保存中的應(yīng)用研究[J].圖書情報(bào)工作,2020,64(20):89–95.
[18]袁鈞.數(shù)字地質(zhì)檔案存儲(chǔ)介質(zhì)的選擇[J].蘭臺(tái)世界,2014(23):10–11.
[19]楊道玲.數(shù)字存儲(chǔ)媒體選擇策略[J].湖北檔案,2004(11):12–14.
[20]李從衛(wèi).基于長期保存的數(shù)字檔案存儲(chǔ)載體選擇研究[D].北京:中國人民大學(xué),2012:29-33.
[21]陳蘇琪,劉雨嬌.對(duì)選擇歸檔電子文件存儲(chǔ)載體的思考[J].機(jī)電兵船檔案,2017(3):3.
[22] Gartner.Whats New in the 2022 Gartner Hype Cycle for Emerging Technologies[EB/OL]. [2022- 10- 02].https:// www.gartner.com/en/articles/what- s- new- in- the- 2022-gartner-hype-cycle-for-emerging-technologies.
作者單位:1.中國人民大學(xué)信息資源管理學(xué)院
2.中國人民大學(xué)電子文件管理研究中心