留 巍
浙江星漢信息技術股份有限公司
檔案信息資源是國家信息的重要組成部分,檔案數(shù)字化則是現(xiàn)代檔案信息化建設和數(shù)字化建設的基礎工作,如何保證項目符合相關質量標準,確保檔案信息的準確利用,是目前檔案數(shù)字化項目實施的重點和難點。
目前檔案數(shù)字化項目普遍存在項目質量難以控制、評估等問題,其原因主要有以下幾種:
標準眾多,有國家標準、行業(yè)標準、地方標準、項目標準,甚至一些項目委托方不同人員有不同標準。如歷史文書檔案數(shù)字化中文件所涉人名的著錄項,相關國家標準中并未明確該字段的著錄標準,因此會出現(xiàn)各個委托單位各自的標準。在人名著錄范圍上,有些委托單位考慮到檔案利用價值,會要求涉及人員任免、處分、工資等相關的信息,而有些委托單位則要求有名單的均需著錄。在人名著錄格式上,有些委托單位要求將同一件中的所有人名著錄在同一個條目上,有些則要求10個人名為一條。
又如對《紙質檔案數(shù)字化規(guī)范》(DA/T 31—2017)中圖像處理的“因遵循展現(xiàn)檔案原貌的原則”的理解存在差異。有些委托單位經(jīng)辦人員認為,應當完全展現(xiàn)檔案原貌,不去除裝訂孔、污漬等;有些則認為,應當去除這些不影響檔案內(nèi)容的部分,并盡量保持檔案頁面的趕緊,這也是符合以上原則。
仍以《紙質檔案數(shù)字化規(guī)范》(DA/T 31—2017)中圖像處理的圖像糾偏標準為例,標準中的描述為:“對出現(xiàn)偏斜的圖像應進行糾偏處理,以達到視覺上基本不感覺偏斜為準。”不同的人員對此的感覺不同,也就意味著質量標準不同。以目前常見的1°的質量標準為例,1°一般人是明顯感覺偏斜的,但從量化質量標準上看是符合質量要求的。
檔案數(shù)字化項目工作量少則幾十萬頁,多則上千萬頁,而且項目不少流程環(huán)節(jié)只能通過人工完成,尤其是在存量檔案數(shù)字化方面。比如檔案前處理、檔案著錄、檔案裝訂等等環(huán)節(jié)。存量檔案因歷史原因,紙張類型復雜,字跡難以辨認。如此復雜的、海量的工作量,完全由人工完成,質量的穩(wěn)定輸出難度極高。
以浙江省為例,據(jù)不完全統(tǒng)計,全省從事檔案行業(yè)的公司約有200家,而僅有10家具有檔案數(shù)字化加工設計乙級資質;具有自主知識產(chǎn)權檔案數(shù)字化加工軟件的也寥寥無幾,大部分公司的數(shù)字化軟件是通過各種簡單功能的軟件組合以及OFFICE來實現(xiàn)的。在體制和技術上完全無法保障項目質量。
以綜合檔案館的歷史存量檔案為例,檔案形成時間跨度大,一般來說,從新中國成立后開始也有70年之久,紙張質量較差。因檔案館中館藏檔案來自各個單位、個人,早期檔案工作缺乏規(guī)范指導,甚至同一卷中出現(xiàn)不同全宗單位檔案,與現(xiàn)行檔案歸檔標準相去甚遠。
通過長期的行業(yè)項目積累和積極探索,我認為提高檔案數(shù)字化項目交付質量,應當從項目機制、人員、技術手段等多方面入手。
檔案數(shù)字化行業(yè)門檻較低,從業(yè)人員檔案業(yè)務能力普遍較低,流動性較大;而檔案數(shù)字化行業(yè)又有勞動密集型行業(yè)的特征,因此加強從業(yè)人員的業(yè)務技能,對提高檔案數(shù)字化項目的交付質量起到至關重要的作用。具體來說,業(yè)務技能培訓分為兩個層面,對項目負責人的業(yè)務培訓以及對操作人員的技能培訓。由于大部分檔案數(shù)字化項目均在委托方場所實施,項目負責人駐場交付,遠離承建方公司本部,因此,項目負責人對項目交付起到非常重要的作用。對項目負責人的業(yè)務能力進行系統(tǒng)培訓、綜合評估,實行持證上崗。對操作人員進行崗前培訓,確保在正式上崗前對流程標準已理解和掌握。操作人員層面可以由項目負責人進行培訓,也可以由公司進行培訓;應當做到崗前培訓,確保上崗前合理正確掌握質量標準。
很多項目委托方和承建方都不重視機制的建立,正因為檔案數(shù)字化項目具有上述特征,建立上述機制能有效提升項目交付質量,降低大批量項目質量不合格的風險。項目因質量問題返工或者無法通過驗收,帶來的不僅僅是承建方的經(jīng)濟損失,對委托方也是一種損失,更有可能給檔案實體帶來破壞性風險。在項目啟動階段,盡可能對項目涉及的檔案進行試加工,封存樣品,作為后續(xù)階段質量標準的實物參考和評估依據(jù)。在項目交付過程中,委托方可以以年度、目錄號等建立檢驗批,通過對檢驗批的質量檢查,以確保質量問題能得以及時發(fā)現(xiàn),控制在較小范圍內(nèi)。
檔案數(shù)字化行業(yè)中常見的質量問題可分為系統(tǒng)類、圖像類、條目類。系統(tǒng)類的常見問題有檔號重復、檔號錯誤等;圖像類的常見問題有掃描頁數(shù)不匹配、空白頁、掃描參數(shù)不正確等;條目類的常見問題有字段格式類型錯誤、錯別字。據(jù)此,通過對生產(chǎn)系統(tǒng)的研發(fā)、升級,實現(xiàn)流程控制、自動檢測、OCR識別、消息回退、系統(tǒng)隨機抽檢等技術提升交付質量。
提高檔案數(shù)字化行業(yè)的交付質量是一項復雜的系統(tǒng)工程,從機制、體系到技術,質量管理的目標是過程的持續(xù)改進,質量關注的焦點從結果或產(chǎn)品轉移到產(chǎn)生結果或產(chǎn)品的過程。