吳瑋
(西安航空職業(yè)技術(shù)學(xué)院黨政辦公室 西安 710089)
關(guān)鍵字:數(shù)字檔案館;云環(huán)境;建設(shè)模式
我國(guó)從2000年開始數(shù)字檔案館建設(shè),至今已經(jīng)取得一些建設(shè)成果。在20年的發(fā)展過(guò)程中,數(shù)字檔案館建設(shè)從無(wú)到有、由點(diǎn)到面,逐步發(fā)展壯大起來(lái),出現(xiàn)了青島、北京、深圳等一些有代表性的數(shù)字檔案館,取得了一定的成績(jī),開啟了我國(guó)檔案館發(fā)展的新篇章。隨著信息化的發(fā)展,電子文件、電子檔案大量產(chǎn)生,并且在館藏中所占的比例越來(lái)越大。在信息化的沖擊之下,傳統(tǒng)的以紙質(zhì)檔案為管理對(duì)象、以手工管理為主要管理方式的檔案館,受到了新的管理方式和管理對(duì)象的挑戰(zhàn)。從管理方式上看,傳統(tǒng)的以手工方式的管理,在信息爆炸時(shí)代顯然已經(jīng)不適用,檔案館雖然保存了大量的檔案信息,但如果不借助現(xiàn)代計(jì)算機(jī)信息技術(shù),不能及時(shí)地查找到用戶所需要的信息,不能將用戶所需要的信息及時(shí)傳遞給用戶,這些檔案就無(wú)法發(fā)揮其應(yīng)有的價(jià)值。從管理對(duì)象上看,檔案館傳統(tǒng)的管理對(duì)象是紙質(zhì)檔案,而當(dāng)下電子文件、電子檔案正成為館藏的主角。由于電子文件不同于紙質(zhì)檔案的特征,檔案管理部門如果不采用新的技術(shù)和方法對(duì)電子文件進(jìn)行管理,就不能完成為社會(huì)保護(hù)歷史面貌的任務(wù)和職能。因此,利用計(jì)算機(jī)技術(shù)和網(wǎng)絡(luò)技術(shù)來(lái)改變檔案館的管理方式、工作模式,就是時(shí)代發(fā)展的必然,這也是發(fā)展數(shù)字檔案館的背景之一。那么隨著云技術(shù)的發(fā)展,數(shù)字檔案館的建設(shè)模式也將隨之變化。[1]
我國(guó)數(shù)字檔案館建設(shè)起步比較晚,數(shù)字檔案館建設(shè)對(duì)于大多數(shù)檔案館來(lái)說(shuō),還是一個(gè)新生事物,數(shù)字檔案館建設(shè)的進(jìn)程整體比較緩慢,與社會(huì)信息化的發(fā)展進(jìn)程以及人們對(duì)檔案的信息需求相比,還存在大量的不適應(yīng)。數(shù)字檔案館的整體建設(shè),還處于初級(jí)發(fā)展階段,表面上看似“轟轟烈烈”,成就卓著,實(shí)際還存在著諸多問(wèn)題。
數(shù)字檔案館的建設(shè),需要資金、技術(shù)、人才的支持。這些因素分布的不均衡,造成了我國(guó)綜合檔案館發(fā)展過(guò)程的不平衡。地區(qū)不平衡是數(shù)字檔案館發(fā)展的主要影響因素。東部地區(qū)由于經(jīng)濟(jì)較發(fā)達(dá),檔案館的經(jīng)費(fèi)相對(duì)充足,人才技術(shù)力量較強(qiáng),數(shù)字檔案館應(yīng)用系統(tǒng)大多采取定制開發(fā),數(shù)字資源建設(shè)也大多外包給專門的檔案技術(shù)公司實(shí)際操作,數(shù)字檔案館建設(shè)步伐明顯較快,西部地區(qū)則由于經(jīng)濟(jì)原因,數(shù)字檔案館建設(shè)的經(jīng)費(fèi)較少,在經(jīng)費(fèi)、人才都缺乏的情況下,只能購(gòu)買一些商業(yè)性軟件,數(shù)字資源建設(shè)更是進(jìn)展緩慢。[2]此外,不同級(jí)別的綜合檔案館發(fā)展也不平衡。相對(duì)來(lái)說(shuō),中央級(jí)、省級(jí)以及東部地區(qū)的一些市級(jí)檔案館發(fā)展較快,而縣級(jí)的發(fā)展較慢。如何帶動(dòng)落后地區(qū)的數(shù)字檔案館建設(shè),是需要考慮的問(wèn)題。
數(shù)字檔案館建設(shè)的核心內(nèi)容是檔案信息資源。各地的數(shù)字檔案館建設(shè)項(xiàng)目大多把建設(shè)重點(diǎn)放在存量檔案的數(shù)字化方面,對(duì)在政務(wù)、業(yè)務(wù)系統(tǒng)中正在形成的電子文件的接收有所忽視。許多項(xiàng)目還在沿用傳統(tǒng)檔案館的工作模式,僅將原來(lái)的紙質(zhì)內(nèi)容變成數(shù)字化內(nèi)容,對(duì)政務(wù)微博、微信中形成的重要文件、各類業(yè)務(wù)數(shù)據(jù)庫(kù)中形成的新型檔案資源鮮有收集。數(shù)字資源建設(shè)的質(zhì)量也不高。在數(shù)字檔案館建設(shè)中,還存在重指標(biāo)、輕實(shí)效的現(xiàn)象。如有的檔案館將電視臺(tái)每天的新聞視頻捕捉下來(lái),卻沒有給每條新聞做著錄標(biāo)引,致使以后無(wú)法檢索到某天具體的某條新聞;有的檔案館將大量照片檔案掃描后,卻無(wú)法檢索到具體的某張照片中的重要人物;有的檔案館的著錄數(shù)據(jù)過(guò)于簡(jiǎn)單,造成檢索中重復(fù)率、誤檢率過(guò)高等問(wèn)題。
建設(shè)一個(gè)數(shù)字檔案館涉及技術(shù)規(guī)范、業(yè)務(wù)流程、網(wǎng)絡(luò)平臺(tái)、數(shù)據(jù)庫(kù)管理等多方面的內(nèi)容。而我國(guó)的綜合檔案館,尤其是基層的市縣級(jí)檔案館普遍存在知識(shí)結(jié)構(gòu)不合理的情況,尤其缺乏計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)方面的知識(shí),更對(duì)云計(jì)算、大數(shù)據(jù)等前沿技術(shù)缺乏了解,無(wú)法在數(shù)字檔案應(yīng)用系統(tǒng)開發(fā)時(shí)提供有效的建議。一些基層檔案館甚至缺少對(duì)數(shù)據(jù)庫(kù)和系統(tǒng)進(jìn)行日常管理的技術(shù)人員,一旦出現(xiàn)問(wèn)題就只能求助于軟件公司,數(shù)據(jù)丟失、應(yīng)用系統(tǒng)無(wú)法正常運(yùn)行的情況時(shí)有發(fā)生。信息人才的缺乏使數(shù)字檔案館建設(shè)舉步維艱。
數(shù)字檔案館運(yùn)行于網(wǎng)絡(luò)空間中,網(wǎng)絡(luò)的安全性直接威脅到數(shù)字檔案館的安全性。如何防范數(shù)字檔案館受到非法入侵、黑客攻擊,如何防止數(shù)字檔案館中的電子檔案被篡改,如何保證數(shù)字檔案館中的電子檔案的長(zhǎng)期保存,如何加強(qiáng)數(shù)字檔案館對(duì)突發(fā)事件的應(yīng)對(duì),這些問(wèn)題如果解決不好,會(huì)直接影響到數(shù)字檔案館的建設(shè)和運(yùn)行。
云計(jì)算不僅是技術(shù)的組合與創(chuàng)新,也是一種管理組織思想的創(chuàng)新,即整合資源進(jìn)行服務(wù),通過(guò)對(duì)大量物理上分散的資源進(jìn)行整合,以邏輯上統(tǒng)一的方式,對(duì)外進(jìn)行服務(wù)。云計(jì)算技術(shù)的出現(xiàn),代表了先進(jìn)IT架構(gòu)的產(chǎn)生,對(duì)IT架構(gòu)和社會(huì)的發(fā)展都產(chǎn)生了重大的影響,同時(shí),它對(duì)我國(guó)檔案館檔案來(lái)源的前端一一電子政務(wù)也產(chǎn)生了重大的影響。云計(jì)算技術(shù)的發(fā)展,為解決當(dāng)前數(shù)字檔案館建設(shè)存在的問(wèn)題,帶來(lái)了新的契機(jī),提供了一種新的路徑。
建設(shè)數(shù)字檔案館的關(guān)鍵是開發(fā)和運(yùn)維數(shù)字檔案館應(yīng)用管理系統(tǒng)。數(shù)字檔案館應(yīng)用管理系統(tǒng)是建立在計(jì)算機(jī)硬件、網(wǎng)絡(luò)設(shè)備、系統(tǒng)軟件、數(shù)據(jù)庫(kù)軟件等平臺(tái)之上的,伴隨著數(shù)據(jù)量越來(lái)越大,數(shù)據(jù)處理的要求越來(lái)越高,對(duì)這些設(shè)備的要求也越來(lái)越高。一個(gè)數(shù)據(jù)中心往往由多臺(tái)服務(wù)器、網(wǎng)絡(luò)存儲(chǔ)設(shè)備、網(wǎng)絡(luò)安全設(shè)備等構(gòu)成,需要專業(yè)的技術(shù)人員進(jìn)行維護(hù)和管理,其造價(jià)高昂。如果每個(gè)檔案館都建立自己的數(shù)據(jù)中心,擁有獨(dú)立的操作系統(tǒng)和數(shù)據(jù)庫(kù)系統(tǒng),各自開發(fā)檔案館應(yīng)用管理系統(tǒng),彼此間不能互操作,這種分別建設(shè)、分散管理、各自維護(hù)的信息化建設(shè)模式,再加上標(biāo)準(zhǔn)和網(wǎng)絡(luò)規(guī)范的缺失,最終會(huì)成為一個(gè)個(gè)“信息孤島”,難以和政府各部門、各檔案館之間進(jìn)行信息交流溝通,難以適應(yīng)政府各部門文件形成前端的業(yè)務(wù)變化需要。而采用云計(jì)算技術(shù)建設(shè)數(shù)字檔案館,會(huì)大幅降低檔案館在建設(shè)方面的重復(fù)投資。在統(tǒng)一的云計(jì)算平臺(tái)下,還可以解決以前個(gè)體模式下的“信息孤島”問(wèn)題。[3]
傳統(tǒng)的數(shù)字檔案館開發(fā)模式不僅需要軟硬件的投資,更需要信息人才的儲(chǔ)備,一個(gè)檔案數(shù)據(jù)中心最少也需要10名以上的IT技術(shù)人員才能完成硬件維護(hù)、軟件升級(jí)、修補(bǔ)漏洞、數(shù)據(jù)備份等工作。云模式是一種“集中力量辦大事”的模式,在云模式下,各市縣級(jí)檔案館不再需要建立自己的數(shù)據(jù)中心,將IT硬件、平臺(tái)的維護(hù)工作集中在省級(jí)檔案云數(shù)據(jù)中心。省級(jí)檔案云數(shù)據(jù)中心往往位于省會(huì)城市,這些城市的經(jīng)濟(jì)相對(duì)發(fā)達(dá),薪資水平也較高,可以吸引更多優(yōu)秀的IT人才,專注于數(shù)據(jù)中心的管理和維護(hù)。困擾數(shù)字檔案館建設(shè)的人才瓶頸難題,在云模式下也將被破解。
云計(jì)算不僅是一種技術(shù),同時(shí)也是一種管理模式,在應(yīng)用云計(jì)算模式時(shí),要求對(duì)原有的檔案業(yè)務(wù)流程、模式進(jìn)行梳理,剔除不符合技術(shù)要求的、繁瑣的業(yè)務(wù)流程,突破原有管理模式,大膽創(chuàng)新,以適應(yīng)新技術(shù)的需要。隨著電子政務(wù)的普及,各政府部門的檔案室若要接收在網(wǎng)絡(luò)辦公中形成的電子公文,必須配備相應(yīng)的服務(wù)器和管理軟件,如果每個(gè)政府部門都購(gòu)買服務(wù)器和管理軟件,就會(huì)形成相當(dāng)大的一筆投入。但如果采用云模式,可以在檔案管理云平臺(tái)中為每個(gè)政府部門開設(shè)一個(gè)“虛擬的”檔案室,各政府部門的業(yè)務(wù)和檔案管理人員可以利用這個(gè)虛擬檔案室完成檔案的云歸檔。采用云模式還可以通過(guò)網(wǎng)絡(luò),在多個(gè)云計(jì)算中心之間,互相建立災(zāi)備中心進(jìn)行云備份。2009年,聯(lián)機(jī)計(jì)算機(jī)圖書館中心宣布引入云計(jì)算服務(wù),推動(dòng)圖書館工作流程的變革與創(chuàng)新。云模式作為一種新的管理模式,也必將促進(jìn)檔案管理的創(chuàng)新,相信今后還會(huì)有云安全、云加密等更多的新業(yè)務(wù)形式產(chǎn)生。
檔案信息相較于圖書、期刊等形式的信息,具有零散、雜亂的特點(diǎn)。將檔案信息有序化,使人們?cè)谛枰獧n案時(shí)能快速準(zhǔn)確地找到相應(yīng)的檔案信息,始終是檔案管理的目的。從早期的手工分類、排序、裝卷,到對(duì)檔案信息進(jìn)行著錄、標(biāo)引,錄入數(shù)據(jù)庫(kù)系統(tǒng)進(jìn)行檢索,無(wú)不是為了實(shí)現(xiàn)這一目的。隨著數(shù)據(jù)庫(kù)技術(shù)的發(fā)展,信息的整序、檢索已不再是難題,但新的問(wèn)題又產(chǎn)生了,如何在數(shù)字檔案館存儲(chǔ)的這個(gè)龐大體系中找到知識(shí),發(fā)現(xiàn)人們感興趣的內(nèi)容?如何發(fā)揮龐大檔案信息庫(kù)的價(jià)值?因此,有必要利用大數(shù)據(jù)分析和挖掘技術(shù),從海量的檔案信息中找到知識(shí),在更大的范圍內(nèi)共享檔案信息,進(jìn)一步實(shí)現(xiàn)檔案的價(jià)值。[4]
數(shù)字檔案館的概念已經(jīng)被提出多年,許多國(guó)家和地區(qū)已經(jīng)啟動(dòng)了多個(gè)數(shù)字檔案館建設(shè)項(xiàng)目,因此,在建設(shè)我國(guó)云環(huán)境下的綜合數(shù)字檔案館時(shí),就需要對(duì)這些已有的數(shù)字檔案館建設(shè)項(xiàng)目進(jìn)行考察分析,對(duì)其中合理的部分進(jìn)行保留。對(duì)眾多的數(shù)字檔案館建設(shè)項(xiàng)目進(jìn)行考察以后,可以對(duì)數(shù)字檔案館的建設(shè)項(xiàng)目從不同的維度進(jìn)行分類。
項(xiàng)目模式往往不以一個(gè)具體的實(shí)體檔案館館藏為基礎(chǔ),而是以信息共享為基礎(chǔ),由圖書館或檔案館聯(lián)合共建。項(xiàng)目模式涉及不同的機(jī)構(gòu)、不同類型的數(shù)字化信息資源的集成,另外,檔案資源還涉及安全及開放權(quán)限等一系列較為復(fù)雜的問(wèn)題,實(shí)現(xiàn)難度比較大。但項(xiàng)目模式中各類信息高度集成、分布式存儲(chǔ)、統(tǒng)一管理、跨類型檢索等特點(diǎn),代表了信息資源管理發(fā)展的方向,也是今后數(shù)字檔案館和各類數(shù)字資源管理機(jī)構(gòu)合作時(shí)應(yīng)該參考的模式;實(shí)體模式的數(shù)字檔案館,往往以具體的檔案館實(shí)體的館藏檔案為基礎(chǔ),重視對(duì)館藏檔案進(jìn)行數(shù)字化處理,并在此基礎(chǔ)上強(qiáng)調(diào)檔案的信息化管理。實(shí)體模式是我國(guó)現(xiàn)階段數(shù)字檔案館建設(shè)的主導(dǎo)模式,它以檔案館的現(xiàn)有館藏?cái)?shù)字化為主體,同時(shí)接收政府和其他機(jī)構(gòu)形成的數(shù)字化文件信息,建設(shè)基于網(wǎng)絡(luò)的、集中統(tǒng)一管理的數(shù)字化館藏資源,方便用戶對(duì)檔案資源的存取。實(shí)體模式的難點(diǎn)在于對(duì)其他機(jī)構(gòu)形成的原生數(shù)字化文件的接收和安全保存。[5]
個(gè)體模式以單個(gè)的檔案館投資建設(shè)為主,主要解決單個(gè)具體的檔案館的數(shù)字檔案資源的管理利用和開發(fā)問(wèn)題。個(gè)體模式具有功能相對(duì)單一、目標(biāo)明確、形式簡(jiǎn)單、便于管理的優(yōu)點(diǎn),但也有巨大的不足,如資金投入效率低下、缺乏長(zhǎng)遠(yuǎn)規(guī)劃等;聯(lián)合模式是由多個(gè)檔案館共同投資合作統(tǒng)一建設(shè)的一個(gè)數(shù)字檔案館平臺(tái),各檔案館共同利用這一數(shù)字平臺(tái)進(jìn)行數(shù)字檔案資源的管理利用;云模式則是對(duì)聯(lián)合模式在云環(huán)境下的一次升級(jí),如現(xiàn)在的北京市、陜西省檔案館在建設(shè)過(guò)程中提出以云計(jì)算技術(shù)為基礎(chǔ)的數(shù)字檔案館建設(shè)項(xiàng)目。其以國(guó)家或地區(qū)的檔案館為主體,采用云計(jì)算技術(shù),將某一區(qū)域內(nèi)的各個(gè)檔案館的數(shù)字資源集合在一個(gè)統(tǒng)一平臺(tái)之中,統(tǒng)一管理。云模式代表了數(shù)字檔案館建設(shè)的方向。[6]
云環(huán)境下的數(shù)字檔案館,從國(guó)家的角度來(lái)看,理想化的狀態(tài)是集國(guó)家的力量,建設(shè)全國(guó)范圍內(nèi)的檔案私有云,在這個(gè)系統(tǒng)中,基礎(chǔ)設(shè)施建設(shè)、平臺(tái)建設(shè)、應(yīng)用系統(tǒng)開發(fā)都由國(guó)家統(tǒng)一部署,各檔案館僅是這個(gè)云環(huán)境的租戶,可以通過(guò)它來(lái)進(jìn)行本館資源的管理以及接收本級(jí)范圍的各類電子文件信息。從國(guó)家的角度來(lái)講,只需要在不同地區(qū)建設(shè)若干個(gè)檔案云數(shù)據(jù)中心,互相連接,就可以完成異地實(shí)時(shí)災(zāi)備、網(wǎng)絡(luò)實(shí)時(shí)歸檔等一系列工作。在國(guó)家模式建設(shè)周期長(zhǎng)、費(fèi)用昂貴的狀態(tài)下,各省市檔案館提出了建設(shè)區(qū)域性云檔案中心的設(shè)想,如北京市檔案館、陜西省檔案館、青島市檔案館。其設(shè)想都是在本轄區(qū)內(nèi),采用云計(jì)算技術(shù),建設(shè)統(tǒng)一的云計(jì)算檔案中心,以解決本轄區(qū)內(nèi)數(shù)字檔案的集成管理問(wèn)題。區(qū)域模式具有投資規(guī)模小、靈活性高的好處,它既避免了各個(gè)檔案館各自為政,獨(dú)自開發(fā)數(shù)字檔案館系統(tǒng)的弊端,也具有統(tǒng)一規(guī)劃、充分利用云計(jì)算技術(shù)、節(jié)省資源的優(yōu)勢(shì),應(yīng)該是我國(guó)綜合檔案館在建設(shè)數(shù)字檔案館時(shí)的首選模式。
云模式下的數(shù)字檔案館,應(yīng)該由多層資源構(gòu)成,最基本的是物理資源層,然后在其之上為虛擬資源層、資源服務(wù)與調(diào)度層、數(shù)據(jù)服務(wù)層、中間件服務(wù)層、應(yīng)用層等多個(gè)不同的層次,還涉及對(duì)整個(gè)云的管理。電子政務(wù)云的發(fā)展給數(shù)字檔案館的發(fā)展帶來(lái)新的契機(jī),近年來(lái),國(guó)家非常重視電子政務(wù)的發(fā)展,在發(fā)展的過(guò)程中,也提出了政務(wù)云,一些省市提出了建立電子政務(wù)云計(jì)算中心,將以前各政府機(jī)構(gòu)分散的計(jì)算資源整合到“政務(wù)云”中,各政府機(jī)構(gòu)不再建立自己的數(shù)據(jù)中心,逐步將已有的數(shù)據(jù)中心遷移到政務(wù)云數(shù)據(jù)中心,以建立基于云的統(tǒng)一軟硬件平臺(tái)。各個(gè)政府機(jī)構(gòu)只需要在統(tǒng)一的云平臺(tái)上,開發(fā)自己的應(yīng)用,而資源調(diào)度、硬件維護(hù)、安全管理等工作,交給政務(wù)云中心統(tǒng)一進(jìn)行。各個(gè)政府機(jī)構(gòu)只需要在統(tǒng)一的云平臺(tái)上,進(jìn)行應(yīng)用系統(tǒng)的開發(fā),既節(jié)省了大量的資金,也節(jié)省了后期的運(yùn)維成本。傳統(tǒng)的以綜合檔案館為主導(dǎo)的數(shù)字檔案館建設(shè)模式,是一種低效能的模式,必然會(huì)被以采用云計(jì)算技術(shù)并且以電子政務(wù)云平臺(tái)為基礎(chǔ)的共用平臺(tái)模式數(shù)字檔案館系統(tǒng)即云模式所取代。
在大數(shù)據(jù)時(shí)代,由于保管能力的增強(qiáng),檔案信息越來(lái)越豐富,但如何使大量豐富的信息產(chǎn)生價(jià)值,使靜態(tài)的信息變?yōu)榭捎玫闹R(shí),將是數(shù)字檔案館的重要責(zé)任。如何實(shí)現(xiàn)檔案管理從手工管理向信息管理的轉(zhuǎn)變,從而實(shí)現(xiàn)知識(shí)管理、社會(huì)記憶管理。從國(guó)家層面看,單個(gè)的數(shù)字檔案館是很難實(shí)現(xiàn)知識(shí)管理、社會(huì)記憶管理的,要想向更高層面發(fā)展,必須利用網(wǎng)絡(luò)技術(shù),在更大的范圍內(nèi)共享檔案信息,利用數(shù)據(jù)挖掘、大數(shù)據(jù)等技術(shù)對(duì)海量的檔案信息進(jìn)行分析,才能在龐大的檔案信息庫(kù)中發(fā)現(xiàn)知識(shí),實(shí)現(xiàn)檔案的價(jià)值。