隨著現(xiàn)代信息技術的迅速發(fā)展和大量電子文件的產(chǎn)生,在檔案管理數(shù)字化的建設過程中,還存在著諸多的難點和問題,亟待深入研究和妥善解決。
一、對數(shù)字檔案憑證價值的認識與操作
檔案的基本價值有兩方面,憑證價值和參考價值,尤以憑證價值最為重要。目前,人們對數(shù)字化檔案具有參考價值這一點已無疑義,但由于一系列技術和立法問題還未解決,數(shù)字化檔案目前還不具備法律憑證效力,這無疑使數(shù)字檔案的作用大打折扣。確認數(shù)字檔案的憑證價值就成為檔案管理數(shù)字化建設中無法回避的問題。主要表現(xiàn)為:
1.認識上的不到位。從甲骨檔案到簡牘檔案再到紙質檔案,只是載體的耐久性有差別,并沒有改變其直觀性。數(shù)字檔案不具備“白紙黑字”的直觀性,必須依賴特定設備加以解讀,完全脫離了以往人們對檔案“原件”的認識,而且有些數(shù)字檔案不像紙質檔案那樣,載體與內容“一損俱損,一榮俱榮”,即使載體保存完好,內容亦可能在無形中丟失。數(shù)字檔案的非人工識讀性與其他載體的檔案有著質的區(qū)別。由此引起人們對其原始性、可靠性產(chǎn)生懷疑,其憑證價值自然受到影響。
2.技術上的局限性。其一,數(shù)字檔案具有易復制、修改、刪除的特點,使得檔案“原件”的概念變得難以確認。其二,計算機硬、軟件技術不斷更新?lián)Q代,迫使數(shù)字檔案必須不斷適應新的“生存環(huán)境”,不斷地變換載體、格式,因而無法通過載體、格式的鑒定來判定其原始性。其三,數(shù)字檔案不再具有特定的字跡,傳統(tǒng)的字跡鑒定技術無法分辨數(shù)字檔案的原始性。其四,數(shù)字檔案對背景信息和元數(shù)據(jù)具有很強的依賴性。一旦失去背景信息,文件的內容即便仍有意義,但也不再具有憑證價值。元數(shù)據(jù)由于其隱含性而易被忽視,而元數(shù)據(jù)一旦丟失或破壞,電子文件的原始性就會改變。
3.制度上的滯后性。傳統(tǒng)檔案之所以具有憑證價值,在一定程度上取決于嚴格的管理制度,而目前從電子文件的生成到歸檔都缺乏十分規(guī)范的程序化管理,缺乏嚴格而科學的標準體系和業(yè)務管理制度。一些標準、制度雖已制定,但全面推行尚需時日,而且有一定的難度。
二、數(shù)字檔案信息的長期存取問題
1.存儲的介質材料。一般說來,磁盤的壽命是3~5年,光盤也不過30年左右,與能保存千年以上的紙質載體相比,其壽命相差甚遠,而且它還要受到溫度、磁場、記錄存儲格式、硬件配置等多方面的影響,10年前還經(jīng)常使用的5.25英寸的軟盤,現(xiàn)在幾乎沒有一臺普通電腦可以讀出來。
2.機讀語言格式。計算機語言平均每三個月就會問世一種,而語言之間的互換大部分存在問題。很難想象,若干年以后,我們用現(xiàn)行的機器語言描述的數(shù)據(jù),還能百分之百的還原。
3.對設備的依賴。數(shù)字檔案必須依賴于計算機設備才能讀出,這個特征對其長期存取帶來很多問題。如:設備發(fā)生故障、系統(tǒng)癱瘓,電子文件就讀不出來;電子文件對其它設備環(huán)境的不兼容性,使其只能在某種設備上處理,而不能在其它設備上處理等等。
三、數(shù)字檔案信息的安全問題
安全問題是計算機網(wǎng)絡世界最為頭痛的問題,也是檔案管理數(shù)字化中的重大問題之一。
1.計算機病毒。網(wǎng)絡信息安全的最主要的敵人就是計算機病毒。有人統(tǒng)計,現(xiàn)在計算機病毒的傳染每兩個月增加1倍。網(wǎng)絡病毒的泛濫已對計算機網(wǎng)絡系統(tǒng)構成嚴重的威脅。
2.計算機黑客。由于網(wǎng)絡的加密性和匿名性,使入侵者難以被發(fā)現(xiàn)。黑客對信息資源的攻擊,不僅僅是好奇和自我挑戰(zhàn),程序設計高手可以篡改系統(tǒng)控制參數(shù)。
3.有竊取行為的間諜活動。窺視其機密信息進行復制或擴散。
4.有意破壞。摧毀系統(tǒng)的信息處理功能或破壞電子通訊裝置。
5.人為或偶然事故造成的威脅。如工作人員操作失誤而產(chǎn)生的不可預知的事件、網(wǎng)絡系統(tǒng)軟件硬件的故障、電子系統(tǒng)故障引發(fā)的系統(tǒng)問題等。
四、檔案管理數(shù)字化建設的諸多技術問題
檔案管理數(shù)字化完全是高新技術、電子設備和計算機網(wǎng)絡技術支撐起來的產(chǎn)物,離開了高新技術的支撐,就沒有了檔案管理數(shù)字化。諸多的技術問題成為制約檔案管理數(shù)字化建設的難點。
1.數(shù)字化設備技術條件。網(wǎng)絡系統(tǒng)中的硬件技術之一是必須有足夠的帶寬,以保證快捷地傳輸文本、語音、圖像、影像檔案,以便實現(xiàn)多網(wǎng)互連、高速互訪,實現(xiàn)跨平臺、跨系統(tǒng)、跨語種的互相轉換和鏈接。毫無疑問,足夠的帶寬條件和用戶對網(wǎng)絡信息傳輸?shù)男枨髮⒁恢笔且粚γ荏w。
2.技術問題。檔案管理數(shù)字化是以信息源、網(wǎng)絡、數(shù)據(jù)庫為基礎的,其相關技術是較復雜較先進并且不斷發(fā)展的,它幾乎囊括了計算機網(wǎng)絡技術所需要解決的所有問題,如數(shù)字化圖像的存儲與壓縮、數(shù)據(jù)組織技術、信息檢索技術、多語言平臺互換互訪技術、海量信息存儲與調配技術等,既是計算機網(wǎng)絡技術的難關,也是制約檔案管理數(shù)字化建設發(fā)展的問題。此外,檔案管理數(shù)字化的建設和運行需要解決一些特殊問題,為此必須開發(fā)應用一系列新技術,如:身份認定、智能檢索、信息隱蔽、數(shù)字水印、電子簽章、操作跟蹤、信息加密等,其中有很多技術有創(chuàng)新性。這些技術也都是不容易解決的問題。
3.技術過時問題。在飛速發(fā)展的IT業(yè)中,電腦硬件、操作系統(tǒng)、應用軟件及存儲載體等不斷地被新產(chǎn)品所替代,IT產(chǎn)品是真正的“短命鬼”。雖然絕大多數(shù)新產(chǎn)品承諾向下兼容,但其兼容的“代”數(shù)在跨越若干年后,舊的數(shù)字信息就很難被新的硬件設備和軟件系統(tǒng)讀出?!凹夹g過時”的陰影一直會籠罩著數(shù)字信息。專家們提出的解決方案是數(shù)據(jù)遷移,但遷移卻存在著一個致命弱點,就是每次遷移總會丟失一定的相關信息,這些丟失的信息積累起來會造成數(shù)字檔案信息無法準確恢復原貌。
五、數(shù)字檔案的失真問題
數(shù)字化的主要方式是掃描加工,在這一過程中造成數(shù)字檔案失真的原因還有以下幾個方面:
1.技術參數(shù)選擇不當。針對不同色調、紙質和字跡,有時需調整不同的技術參數(shù),如分辨率、明暗度、對比度等,選擇不當會直接影響掃描的質量,造成信息丟失、圖像模糊或產(chǎn)生額外信息,客觀上造成檔案原貌的改變。
2.工作失誤。檔案掃描是大量的重復勞動,難免有時失誤。如掃錯檔案或打錯順序,或存錯,或在建索引時鏈接錯誤等,如不及時發(fā)現(xiàn),將直接導致數(shù)字化檔案失真。
3.轉換過程中的失真。在進行數(shù)字檔案的遷移或在提供利用時,往往需要將掃描后形成的圖像文件轉換成另一種格式的文件,如果格式選擇不當,同樣會導致數(shù)據(jù)發(fā)生變化。