張勇
摘要:在大數(shù)據(jù)時(shí)代的背景下,檔案館出現(xiàn)新的工作重心,主要是對(duì)檔案數(shù)字信息資源的管理。其業(yè)務(wù)全流程包括:檔案接收、檔案數(shù)據(jù)管理、檔案數(shù)據(jù)存?zhèn)?、檔案數(shù)字信息資源利用等,本文以北京市檔案館為研究對(duì)象,對(duì)綜合檔案館檔案數(shù)字信息資源業(yè)務(wù)全流程管理進(jìn)行了探討。
關(guān)鍵詞:檔案數(shù)字信息資源檔案工作業(yè)務(wù)流程紙質(zhì)檔案數(shù)字化副本
當(dāng)今社會(huì)在大數(shù)據(jù)時(shí)代的背景下信息技術(shù)飛速發(fā)展,為檔案數(shù)字信息資源的管理和傳播提供了便利條件和技術(shù)手段,同時(shí)也使其面臨諸多挑戰(zhàn)。電子檔案的大量產(chǎn)生,以及館藏檔案數(shù)字化進(jìn)程的加速推進(jìn),使北京市綜合檔案館檔案數(shù)字資源以驚人的速度增長(zhǎng),數(shù)據(jù)量級(jí)將完成太字節(jié)(TB)向拍字節(jié)(PB)的邁進(jìn),檔案工作本身也相應(yīng)產(chǎn)生變化:檔案實(shí)體的管理與檔案數(shù)字資源的管理正逐步分離,傳統(tǒng)的檔案實(shí)體將更傾向于充當(dāng)異質(zhì)保存的角色,而檔案數(shù)字資源的管理則將逐步成為檔案工作重心。如何對(duì)檔案數(shù)字信息資源開(kāi)展全流程管理,克服相關(guān)管理中存在的問(wèn)題,是擺在檔案工作者面前的新課題。本文選取在業(yè)務(wù)特性、數(shù)據(jù)規(guī)模都具備代表性的北京市檔案館作為研究樣本。
一、檔案數(shù)字信息資源業(yè)務(wù)的全流程管理
檔案數(shù)字信息資源業(yè)務(wù)全流程管理涵蓋檔案接收、檔案數(shù)據(jù)管理、檔案數(shù)據(jù)存?zhèn)?、檔案數(shù)字信息利用等主體業(yè)務(wù)環(huán)節(jié)的規(guī)范管理。綜合檔案館對(duì)檔案數(shù)字信息資源開(kāi)展全流程規(guī)范管理,具有以下幾個(gè)方面的意義:
(一)提高檔案數(shù)字信息資源的質(zhì)量、增加數(shù)量
檔案館和利用者都渴望大量的數(shù)字資源可供利用,檔案數(shù)字信息資源業(yè)務(wù)流程的管理帶來(lái)數(shù)字資源的規(guī)范化,將使檔案館可以按照同樣的標(biāo)準(zhǔn)和質(zhì)量進(jìn)行組織加工,加工速度也得以提高。
(二)增強(qiáng)專業(yè)化協(xié)作,減少浪費(fèi)、增加實(shí)效檔案數(shù)字信息資源業(yè)務(wù)流程管理的規(guī)范可以減少資源加工過(guò)程中的重復(fù)性工作,從而減少不必要的重復(fù)勞動(dòng),將復(fù)雜的問(wèn)題簡(jiǎn)單化,充分利用前人的勞動(dòng)成果。數(shù)字檔案資源管理業(yè)務(wù)流程的規(guī)范為檔案館的管理提供了條件。在檔案館內(nèi)各部門之間,通過(guò)技術(shù)、管理和工作的規(guī)范,管理得以正常實(shí)施。另外,使檔案館管理與檔案館外部協(xié)作得以順利實(shí)現(xiàn)。專業(yè)化協(xié)作是社會(huì)生產(chǎn)組織的先進(jìn)形式之一,是生產(chǎn)社會(huì)化和生產(chǎn)分工的產(chǎn)物。專業(yè)化把社會(huì)生產(chǎn)分解為各個(gè)獨(dú)立的生產(chǎn)部門,而協(xié)作又把被分解的各個(gè)部門聯(lián)結(jié)成為有機(jī)的整體。專業(yè)化協(xié)作的條件是規(guī)范化。沒(méi)有統(tǒng)一的規(guī)范,專業(yè)化協(xié)作無(wú)法進(jìn)行。
(三)促進(jìn)世界檔案信息技術(shù)標(biāo)準(zhǔn)建立,促進(jìn)檔案信息技術(shù)進(jìn)步
數(shù)字檔案資源業(yè)務(wù)流程管理的規(guī)范一旦實(shí)施,一定會(huì)產(chǎn)生必要的技術(shù)規(guī)程或標(biāo)準(zhǔn),同時(shí)促進(jìn)檔案信息技術(shù)的進(jìn)步。
二、北京市檔案館的相關(guān)管理現(xiàn)狀和主要問(wèn)題
目前,北京市綜合檔案館缺乏針對(duì)檔案數(shù)字信息資源的全流程管理規(guī)范。
(一)檔案接收
現(xiàn)狀:北京市檔案館目前采用離線方式接收電子檔案,使用光盤、移動(dòng)硬盤作為接收載體介質(zhì)。接收文件類型多樣,包含電子照片、電子文檔、程序文件、網(wǎng)站系統(tǒng)、辦公系統(tǒng)、音頻視頻文件、多媒體文件等。檔案進(jìn)館時(shí)與立檔單位辦理檔案移交手續(xù),進(jìn)行數(shù)據(jù)校驗(yàn)、核對(duì)數(shù)目、介質(zhì)查殺病毒、介質(zhì)可讀性檢驗(yàn)、文檔打開(kāi)檢驗(yàn)、音視頻隨機(jī)播放檢驗(yàn)等。
主要問(wèn)題:北京市檔案館因?yàn)闆](méi)有用于在線接收的軟件平臺(tái),數(shù)據(jù)校驗(yàn)之后,接收進(jìn)館的檢索目錄和電子文件沒(méi)有進(jìn)入系統(tǒng),而以光盤載體形式存放,并且沒(méi)有元數(shù)據(jù)采集和著錄交接信息,利用方式為檔案光盤調(diào)閱。
(二)檔案數(shù)據(jù)管理
現(xiàn)狀:北京市檔案館紙質(zhì)檔案數(shù)字化副本可以在線查詢,電子文件不封裝,數(shù)據(jù)按照明文方式存儲(chǔ)。
主要問(wèn)題:北京市檔案館接收的電子檔案全部處于應(yīng)用系統(tǒng)之外,不能在線檢索利用;檔案館應(yīng)用系統(tǒng)在檔案數(shù)字資源憑證性保障功能方面空缺;檔案館應(yīng)用系統(tǒng)沒(méi)有館藏檔案數(shù)字資源統(tǒng)計(jì)報(bào)表模塊,統(tǒng)計(jì)仍然依靠手工方式進(jìn)行。
(三)檔案數(shù)據(jù)存?zhèn)?/p>
現(xiàn)狀:北京市檔案館采用在線、近線、離線備份策略,分別對(duì)應(yīng)本地、同城、異地三級(jí)數(shù)據(jù)備份。接收電子檔案載體存放于專用防磁庫(kù)房,介質(zhì)包括光盤、移動(dòng)硬盤等。
主要問(wèn)題:缺乏電子檔案的定期檢查和銷毀機(jī)制。
(四)檔案數(shù)字信息資源利用
現(xiàn)狀:北京市檔案館采用三種方式提供檔案數(shù)字資源利用和信息發(fā)布:一是內(nèi)部數(shù)據(jù)專網(wǎng)提供電子檔案載體介質(zhì)調(diào)閱和檔案數(shù)字化副本在線查詢;二是北京市檔案信息網(wǎng)門戶網(wǎng)站網(wǎng)上檢索服務(wù);三是檔案館舉辦主題展覽和檔案編研出版。
主要問(wèn)題:檔案館應(yīng)用系統(tǒng)沒(méi)有編研模塊。由于大量的數(shù)字資源存放于檔案管理應(yīng)用系統(tǒng)之外,檔案館不能進(jìn)行大數(shù)據(jù)挖掘,不能對(duì)公眾開(kāi)展數(shù)據(jù)推送服務(wù)。
三、提升檔案數(shù)字信息資源業(yè)務(wù)全流程管理績(jī)效的建議
根據(jù)以上分析,北京市檔案館在數(shù)字信息資源業(yè)務(wù)全流程管理中存在的主要問(wèn)題可以歸納為:檔案接收沒(méi)有建立在線接收機(jī)制;檔案數(shù)據(jù)管理沒(méi)有形成完整體系;檔案數(shù)據(jù)存?zhèn)錄](méi)有檢查銷毀機(jī)制;檔案數(shù)字資源利用方面缺乏數(shù)據(jù)挖掘等。針對(duì)上述問(wèn)題,筆者提出了如下建議:
(一)檔案接收
針對(duì)檔案館無(wú)在線接收機(jī)制問(wèn)題,建議首先建立在線接收系統(tǒng),并確定相應(yīng)的接收流程。
關(guān)于電子檔案接收的主要流程,筆者的建議是:檢驗(yàn)電子檔案數(shù)據(jù)、辦理交接手續(xù)、接收電子檔案數(shù)據(jù)、著錄保存交接信息、遷移和轉(zhuǎn)換電子檔案數(shù)據(jù)、存儲(chǔ)電子檔案數(shù)據(jù)等。數(shù)據(jù)移交形式為在線和離線。
數(shù)據(jù)檢驗(yàn)環(huán)節(jié)第一步進(jìn)行數(shù)據(jù)安全性檢驗(yàn),查看有無(wú)計(jì)算機(jī)病毒;第二步進(jìn)行數(shù)據(jù)的真實(shí)性、完整性、有效性檢驗(yàn);第三步進(jìn)行數(shù)據(jù)準(zhǔn)確性檢驗(yàn),核實(shí)機(jī)讀目錄是否準(zhǔn)確規(guī)范;第四步進(jìn)行數(shù)據(jù)可讀性檢驗(yàn),如采取的是離線移交方式,則還需核實(shí)光盤目錄是否準(zhǔn)確規(guī)范,檢查移交光盤的盤面是否清潔、有無(wú)劃痕、是否具有可讀性。移交單位和檔案館交接雙方共同辦理檔案資料交接文據(jù),由交接雙方簽字、蓋章,各自留存,文據(jù)可采用電子形式并以電子簽名方式予以確認(rèn)。檔案館正式接收電子檔案數(shù)據(jù),應(yīng)當(dāng)對(duì)接收的電子檔案載體保存5年以上。檔案館應(yīng)當(dāng)將電子檔案交接、遷移、轉(zhuǎn)換、存儲(chǔ)等信息補(bǔ)充到電子檔案元數(shù)據(jù)中。檔案館應(yīng)當(dāng)對(duì)電子檔案數(shù)據(jù)遷移和轉(zhuǎn)換前后的一致性進(jìn)行校驗(yàn)。檔案館對(duì)電子檔案載體應(yīng)當(dāng)按照DA/T 38《電子文件歸檔光盤技術(shù)要求和應(yīng)用規(guī)范》和DA/T 15《磁性載體檔案管理與保護(hù)規(guī)范》進(jìn)行存儲(chǔ)管理。
(二)檔案數(shù)據(jù)管理
建議建立以資源庫(kù)為核心的數(shù)據(jù)管理體系,該管理體系應(yīng)包含以下內(nèi)容:
1.檔案數(shù)字資源庫(kù)維護(hù)。檔案數(shù)字資源庫(kù)維護(hù)是一項(xiàng)經(jīng)常性的數(shù)據(jù)管理工作,也是數(shù)字檔案館建設(shè)的核心內(nèi)容。檔案資源庫(kù)一般包括目錄數(shù)據(jù)庫(kù)或元數(shù)據(jù)庫(kù)、內(nèi)容數(shù)據(jù)集等。元數(shù)據(jù)采集方式主要是通過(guò)對(duì)電子文件或數(shù)字檔案的背景、結(jié)構(gòu)和管理過(guò)程信息進(jìn)行自動(dòng)生成和適當(dāng)人工添加而形成。內(nèi)容數(shù)據(jù)集是數(shù)字檔案資源建設(shè)的主體,它是通過(guò)數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)等技術(shù)方法將檔案全文按照一定的分類、排序方式排列形成的集合。內(nèi)容數(shù)據(jù)一般通過(guò)與目錄數(shù)據(jù)掛接方式實(shí)施有效管理,隨著信息技術(shù),特別是檢索技術(shù)的發(fā)展,將來(lái)也會(huì)采用其他技術(shù)方法對(duì)內(nèi)容數(shù)據(jù)進(jìn)行有效管理,對(duì)于由電子文件歸檔形成的電子檔案,其內(nèi)容數(shù)據(jù)還應(yīng)與其元數(shù)據(jù)建立持久有效的聯(lián)系,防止非法修改,采取技術(shù)措施,確保其可靠和可用。檔案數(shù)字資源庫(kù)還包含一些需要維護(hù)的數(shù)據(jù)庫(kù)表,包括:代碼庫(kù)(代碼表如密級(jí)、專業(yè)、部門)、主題詞表、綜合信息庫(kù)(庫(kù)房管理)、編研庫(kù)。
2.數(shù)據(jù)整理數(shù)據(jù)整理。包括元數(shù)據(jù)增刪改維護(hù)、元數(shù)據(jù)配置、元數(shù)據(jù)庫(kù)管理、價(jià)值鑒定。
3.數(shù)據(jù)歸檔數(shù)據(jù)歸檔。包括格式轉(zhuǎn)換、電子文件封裝。
4.數(shù)據(jù)統(tǒng)計(jì)。包括報(bào)表統(tǒng)計(jì)和報(bào)表打印。
(三)檔案數(shù)據(jù)存?zhèn)?/p>
建議對(duì)檔案館藏的電子檔案建立定期檢查、遷移備份和銷毀機(jī)制。
1.保管與檢查。電子檔案的保管環(huán)境應(yīng)符合GB 50174-2008《電子信息系統(tǒng)機(jī)房設(shè)計(jì)規(guī)范》、GB/T 2887-2011《計(jì)算機(jī)場(chǎng)地通用規(guī)范》、GB/T 9361-2011《計(jì)算機(jī)場(chǎng)地安全要求》等國(guó)家標(biāo)準(zhǔn)的要求,以上標(biāo)準(zhǔn)始終以最新修訂版本為準(zhǔn)。在定期檢查過(guò)程中發(fā)現(xiàn)問(wèn)題應(yīng)及時(shí)采取補(bǔ)救措施,檢查方法包括人工抽檢和技術(shù)檢測(cè)。
2.遷移與備份。電子檔案的脫機(jī)備份載體應(yīng)選用磁帶或硬磁盤,保存在脫機(jī)載體中的電子檔案應(yīng)每滿4年遷移一次,數(shù)據(jù)遷移至新載體后即刻進(jìn)行一次檢查,原備份載體至少再保存4年,保存期滿后按相關(guān)保密規(guī)定處理。用作電子檔案?jìng)浞莸妮d體不得用于其他任何用途,檔案數(shù)字信息資源可以按照三級(jí)備份體系實(shí)施,即以本地備份為基礎(chǔ)、以同城備份為重大保障、以異地備份為重要補(bǔ)充。
3.銷毀與處置。根據(jù)《電子文件歸檔與管理規(guī)范》(GB/T18894-2002),歸檔電子文件的鑒定銷毀,參照國(guó)家關(guān)于檔案鑒定銷毀的有關(guān)規(guī)定執(zhí)行,且應(yīng)在辦理審批手續(xù)后實(shí)施。屬于保密范圍的歸檔電子文件,如存儲(chǔ)在不可擦除載體上,應(yīng)連同存儲(chǔ)體一起銷毀,并在網(wǎng)絡(luò)中徹底清除,不屬于保密范圍的歸檔電子文件可進(jìn)行邏輯刪除。
(四)檔案數(shù)字信息資源利用
建議檔案館根據(jù)檔案信息的利用需求和網(wǎng)絡(luò)條件,分別通過(guò)公眾網(wǎng)、政務(wù)網(wǎng)、局域網(wǎng)等建立利用窗口系統(tǒng),并且應(yīng)實(shí)現(xiàn)如下系統(tǒng)功能:
1.檔案編研。系統(tǒng)應(yīng)當(dāng)能夠輔助進(jìn)行檔案信息資源智能編研、深度挖掘,對(duì)數(shù)據(jù)重新收集、編輯、提煉。首先建立新的編研專題,通過(guò)系統(tǒng)提供的自動(dòng)分類、自動(dòng)聚類、智能發(fā)現(xiàn)、自動(dòng)摘要、自動(dòng)關(guān)聯(lián)推送等功能將符合新專題條件的檔案目錄放入專題庫(kù),然后對(duì)專題庫(kù)中數(shù)據(jù)進(jìn)行編輯,形成新的說(shuō)明信息,再對(duì)專題庫(kù)中的資料進(jìn)行提煉,形成編研材料,最終形成的編研材料通過(guò)信息發(fā)布的流程發(fā)布或出版。
2.綜合查閱。系統(tǒng)應(yīng)當(dāng)能夠運(yùn)用最新檢索技術(shù)方法滿足利用者在各種利用平臺(tái)對(duì)檔案數(shù)據(jù)進(jìn)行快速、準(zhǔn)確、全面的利用查詢要求。綜合查閱提供目錄檢索、全文檢索、元數(shù)據(jù)檢索。使得所有用戶在嚴(yán)格的權(quán)限控制下有效且高效地查詢利用本人權(quán)限范圍內(nèi)的檔案數(shù)據(jù)和擴(kuò)展資源數(shù)據(jù),包括條目信息和電子原文信息,并能對(duì)常用檢索途徑進(jìn)行優(yōu)化,滿足用戶對(duì)查全率、查準(zhǔn)率的要求。系統(tǒng)可實(shí)現(xiàn)自然語(yǔ)言搜索和相似性搜索等智能搜索,支持對(duì)自動(dòng)搜索到的全部信息進(jìn)行智能分類,并可對(duì)設(shè)定的主題,將全部相關(guān)信息進(jìn)行聚類,系統(tǒng)的自動(dòng)分類和聚類功能可以以圖形方式展示,方便用戶定位到關(guān)心的信息以及了解信息分類之間的關(guān)系,從而實(shí)現(xiàn)檔案數(shù)據(jù)的廣泛利用。
參考文獻(xiàn):
[1]馮惠玲,劉越男.電子文件管理國(guó)家戰(zhàn)略[M] .北京:中國(guó)人民大學(xué)出版社,2011: 2.
[2]梁建梅,陳少慧.教學(xué)檔案的管理與信息化建設(shè)[M] .北京:中國(guó)書(shū)籍出版社,2013: 4.