李澤鋒+于紅焱+顧周東
摘要:本文通過分析捕獲的內(nèi)容、時(shí)機(jī)、方法與過程,明確捕獲定義的內(nèi)涵與外延,結(jié)合國家標(biāo)準(zhǔn)研究捕獲的功能,提出捕獲協(xié)議的概念,將捕獲的內(nèi)容、時(shí)機(jī)、功能等在捕獲協(xié)議里加以明確約束,以此作為捕獲接口的需求指南,以便捕獲接口具有最大程度的開放度與適應(yīng)不同立檔單位的靈活性。最后以實(shí)際案例提出幾種捕獲接口的實(shí)現(xiàn)方式,提出文件生成系統(tǒng)與ERMS均應(yīng)以XML為標(biāo)準(zhǔn)格式、以Web service構(gòu)建捕獲接口。
關(guān)鍵詞:全生命周期管理電子文件管理捕獲
Abstract: By analyzing the content, timing, meth? od and process of capture, the paper defines the con? notation and denotation of capture. Based on the re? search of national standard, the paper proposes the concept of capture protocol, and clearly defines the capture of the content, timing, function, etc. in the cap? ture protocol. The capture protocol serves as a guide to capture interface requirements in order that the cap? ture interface has the greatest degree of openness and flexibility to adapt to different units. Finally the pa? per proposes several practical methods of capture in? terface, and presents that the file generation system and ERMS should take XML as the standard format and build the capture interface with web service.
Keywords: Life cycle management; Electronic re? cord management; Capture
數(shù)據(jù)捕獲最初是計(jì)算機(jī)學(xué)科術(shù)語,意思是利用一種裝置,將來自各種數(shù)據(jù)源的數(shù)據(jù)自動(dòng)收集到一個(gè)裝置中。隨著電子文件研究深入,“捕獲”被引入到檔案界,并成為電子文件的術(shù)語之一,捕獲工作則成為電子文件管理實(shí)現(xiàn)前端控制的重要環(huán)節(jié)。
一、對(duì)捕獲(capture)概念的理解
檔案行業(yè)標(biāo)準(zhǔn)《電子檔案管理基本術(shù)語》(DA/T58-2014,以下簡(jiǎn)稱《基本術(shù)語》)將捕獲(capture)定義為“對(duì)電子文件及其元數(shù)據(jù)進(jìn)行收集和存儲(chǔ)的方法與過程”,[1]行業(yè)標(biāo)準(zhǔn)《文書類電子文件元數(shù)據(jù)方案》(DA/T 46-2009,以下簡(jiǎn)稱《元數(shù)據(jù)方案》)定義捕獲為“適時(shí)獲取電子文件及其元數(shù)據(jù)的方法和過程”,[2]國家標(biāo)準(zhǔn)《電子文件管理系統(tǒng)通用功能要求》中的(GB/T29194-2012,以下簡(jiǎn)稱《通用功能要求》)捕獲(capture)是“按照既定要求將電子文件及其元數(shù)據(jù)納入ERMS加以管理的過程”。[3]這三個(gè)標(biāo)準(zhǔn)的定義共同點(diǎn)是捕獲對(duì)象均為電子文件及其元數(shù)據(jù)。然而,由于三個(gè)標(biāo)準(zhǔn)關(guān)注重點(diǎn)不同,還是有很多方面不盡相同。
(一)捕獲時(shí)機(jī)
《元數(shù)據(jù)方案》增加了元數(shù)據(jù)這個(gè)捕獲對(duì)象,是站在元數(shù)據(jù)管理的角度做出的改動(dòng)。因?yàn)殡娮游募梢詫?shí)時(shí),元數(shù)據(jù)則貫穿于電子文件全生命周期,需要在全生命周期中進(jìn)行捕獲,難以做到實(shí)時(shí)獲取,可能要在文件捕獲后補(bǔ)充,該標(biāo)準(zhǔn)用“適時(shí)”這個(gè)看似準(zhǔn)確實(shí)則模糊化的詞語,便于各檔案部門根據(jù)自己管理實(shí)際來確定什么是適合本單位的適時(shí)。
《通用功能要求》提出“按照既定要求”,[4]進(jìn)一步模糊化,不僅僅包含時(shí)機(jī),更能涵蓋更多信息,給檔案人員留下更多的操作空間?!鞍凑占榷ㄒ蟆?,說明捕獲前一定要明確捕獲對(duì)象、動(dòng)作、時(shí)機(jī)、方法等,這些捕獲內(nèi)容應(yīng)與電子文件管理系統(tǒng)(Electronic Record Management System,簡(jiǎn)稱ERMS)的保存規(guī)劃相關(guān)聯(lián)。捕獲對(duì)象、動(dòng)作、時(shí)機(jī)、方法可以根據(jù)檔案部門實(shí)際工作流以及所用系統(tǒng)而不同。
《基本術(shù)語》增加了捕獲對(duì)象“元數(shù)據(jù)”,同時(shí)刪除了“實(shí)時(shí)”二字。應(yīng)該說,作為概念,這樣的定義適用面最廣。
就文件生成系統(tǒng)的捕獲而言,實(shí)時(shí)捕獲電子文件及其元數(shù)據(jù)是最好的選擇。一份電子文件在文件生成系統(tǒng)中一旦生成,其相應(yīng)元數(shù)據(jù)同時(shí)生成,這時(shí)不論其是否辦理完畢、是否退出現(xiàn)行,均按照既定要求進(jìn)行捕獲。
(二)捕獲動(dòng)作
這幾個(gè)標(biāo)準(zhǔn)使用了“收集”“存儲(chǔ)”“獲取”“納入ERMS加以管理”等動(dòng)作。按照《基本術(shù)語》,捕獲定義中的存儲(chǔ)是指以經(jīng)濟(jì)、有效、安全的方式保護(hù)、存取和管理電子檔案以便利用的過程。[5]從這個(gè)定義看,捕獲不僅是捕捉、獲取,還有保護(hù)、管理的內(nèi)容?!凹{入ERMS加以管理”,納入ERMS是捕捉、獲取,“加以管理”就又有了管理的含義。
就文件生成系統(tǒng)的捕獲而言,捕捉、獲取(或收集)是恰當(dāng)?shù)膭?dòng)作,其他管理動(dòng)作在ERMS中有相應(yīng)的功能來實(shí)現(xiàn)。捕捉、獲取是順序的動(dòng)作,捕捉要求文件一旦在系統(tǒng)中生成,就應(yīng)該進(jìn)行捕捉。即使不是實(shí)時(shí)而是適時(shí),也應(yīng)該通過生成系統(tǒng)的審計(jì)跟蹤功能進(jìn)行文件固定以留待適時(shí)的捕捉,避免文件流失。
同歸檔一樣,獲取有邏輯與物理兩種方式。邏輯方式是指獲取文件的存放路徑,通過指針指向文件。這就要求生成系統(tǒng)審計(jì)跟蹤功能具有審計(jì)甚至禁止更換文件存放位置的功能,這也是前文認(rèn)為實(shí)時(shí)捕獲比較合適的原因,待歸檔時(shí)再實(shí)施物理歸檔。物理方式是指捕獲時(shí)獲取文件本身及其相應(yīng)元數(shù)據(jù),文件生成系統(tǒng)依然審計(jì)捕獲的動(dòng)作并記入日志。這種捕獲對(duì)于文件收集歸檔來說最好。
需要明確的是,不管哪種方式,捕獲不是歸檔,其捕獲范圍也不是歸檔范圍,應(yīng)該是生成系統(tǒng)生成的所有文件及其元數(shù)據(jù),等納入到ERMS中后適時(shí)進(jìn)行鑒定,確定其是否具有歸檔價(jià)值。
(三)方法與過程
前面分析了捕獲時(shí)機(jī)、動(dòng)作與范圍,定義中還有一個(gè)需要關(guān)注,就是“方法”“過程”。前三個(gè)標(biāo)準(zhǔn)均表明捕獲是方法與過程,《通用功能要求》定義中雖沒有方法二字,“按照既定要求”已隱含了方法在里面。
過程容易理解,方法包含內(nèi)容較多。方法是為實(shí)現(xiàn)目標(biāo)而采取的手段與行為方式,比如文件與元數(shù)據(jù)的封裝方式、捕獲接口、捕獲協(xié)議等,這些都應(yīng)該在“既定要求”中提前確定。方法一旦確定,過程也就明確了。
二、捕獲功能
《通用功能要求》關(guān)于捕獲的條款是5.2.1.1中的5.2.1.1.1和5.2.1.1.2,分別規(guī)定了電子文件與元數(shù)據(jù)的捕獲。其中5.2.1.1.1主要描述捕獲范圍與捕獲方式,包含27個(gè)詳細(xì)條目(序號(hào)1到序號(hào)27),5.2.1.1.2主要描述元數(shù)據(jù)的捕獲方式及該階段的元數(shù)據(jù)管理要求,包含12個(gè)項(xiàng)目條目(序號(hào)1到序號(hào)12)。限于篇幅以及與本文的高相關(guān)性,本文對(duì)5.2.1.1.1中的前17個(gè)條目做一個(gè)分析,即從序號(hào)1到序號(hào)17,這17個(gè)條目規(guī)定了捕獲的基本功能。
序號(hào)1規(guī)定ERMS應(yīng)支持定義、維護(hù)捕獲活動(dòng)中電子文件的捕獲范圍。按照前面的分析,這個(gè)捕獲范圍應(yīng)該是生成系統(tǒng)與ERMS協(xié)商確定好的。按照標(biāo)準(zhǔn),要自定義和維護(hù),說明捕獲范圍是可以動(dòng)態(tài)變化的。這就要求接口設(shè)計(jì)時(shí),生成系統(tǒng)盡可能多地傳遞文件,最好是生成的全部文件,ERMS才能自定義、維護(hù)捕獲范圍,也就是說前者應(yīng)大于等于后者。
序號(hào)3和4,ERMS應(yīng)支持以原始格式捕獲,說明捕獲的電子文件應(yīng)有兩個(gè)格式:原始格式與轉(zhuǎn)換后的標(biāo)準(zhǔn)格式,但這些格式應(yīng)對(duì)應(yīng)同一條目,以此建立有效聯(lián)系。
序號(hào)5和6是對(duì)復(fù)合文件捕獲的約束。要求將各個(gè)組件作為一個(gè)整體進(jìn)行捕獲,以便捕獲后的檢索、顯示與管理。這樣的捕獲,一般應(yīng)將主組件作為其他組件的容器,依托容器從而建立各組件的關(guān)系。比如包含圖片、視頻的網(wǎng)頁,則把網(wǎng)頁作為主組件,以此為容器將圖片、視頻等組件包含進(jìn)來,確定圖片、視頻在容器中的位置。
序號(hào)7、8與9是對(duì)組合文件的捕獲。對(duì)于組合文件,沒有主從文件之分,主要是通過文件關(guān)聯(lián)建立組合文件多個(gè)文檔間的聯(lián)系。相對(duì)于復(fù)合文件,組合文件各文檔沒有位置要求,捕獲相對(duì)簡(jiǎn)單。一般在著錄時(shí)標(biāo)清有多少文檔組成、彼此關(guān)系,將其關(guān)聯(lián)起來即可。
序號(hào)10與11是進(jìn)一步對(duì)文檔格式捕獲時(shí)的約束。標(biāo)準(zhǔn)要求ERMS應(yīng)支持授權(quán)用戶定義和維護(hù)能夠捕獲的文件格式類型,說明標(biāo)準(zhǔn)要求用戶能按照需要改變捕獲文件的格式,如前文分析,用戶改變了捕獲格式,應(yīng)該通知生成系統(tǒng)。對(duì)于復(fù)合文件內(nèi)各組件的格式類型ERMS必須能識(shí)別,并將格式類型作為元數(shù)據(jù)予以捕獲。復(fù)合文件內(nèi)組件的格式類型繁雜多樣,ERMS必須有格式管理功能。
序號(hào)13、14、15、16、17說明了捕獲的自動(dòng)與人工、主動(dòng)與被動(dòng)、批量與逐個(gè)。自動(dòng)捕獲的前提是ERMS與生成系統(tǒng)有應(yīng)用程序接口。
三、捕獲協(xié)議
捕獲最重要的是質(zhì)量良好的電子文件與元數(shù)據(jù)。從現(xiàn)狀來看,大多數(shù)文件生成系統(tǒng)生成電子文件與元數(shù)據(jù)時(shí)并沒有完全考慮長(zhǎng)久保存問題,沒有足夠適應(yīng)長(zhǎng)久保存需要的元數(shù)據(jù),其封裝方式也可能不同于檔案館。正如已有的紙質(zhì)檔案移交范圍,要想滿足《通用功能要求》中的捕獲功能,需要在生成系統(tǒng)與ERMS之間制定電子文件捕獲的制度、規(guī)范或標(biāo)準(zhǔn)來約束文件生成者,文中把這樣的制度、規(guī)范或標(biāo)準(zhǔn)稱之為捕獲協(xié)議(Capture Protocol)。
捕獲協(xié)議規(guī)定了電子文件捕獲的術(shù)語和環(huán)境以及捕獲范圍、類型、時(shí)機(jī)、動(dòng)作、封裝方式等,制定了文件元數(shù)據(jù)編碼規(guī)則、捕獲規(guī)程以及捕獲與保存規(guī)劃、與審計(jì)跟蹤之間的通信與反饋機(jī)制??紤]到電子文件特性和捕獲的自動(dòng)化程度,捕獲協(xié)議還應(yīng)該有文件與其元數(shù)據(jù)的映射規(guī)程、電子文件的格式、日期、標(biāo)識(shí)符、捕獲安全規(guī)程、隱私與密級(jí)、封裝方式、元數(shù)據(jù)集標(biāo)識(shí)與格式等內(nèi)容(有些內(nèi)容在相關(guān)標(biāo)準(zhǔn)中具體制定,該標(biāo)準(zhǔn)可引用,如元數(shù)據(jù)編碼規(guī)則、電子文件保管期限表、捕獲安全規(guī)程、捕獲接口封裝標(biāo)準(zhǔn)等)。
上述內(nèi)容對(duì)于文檔部門以及其使用的系統(tǒng)來說,基本在一定時(shí)期內(nèi)是比較固定的,可以定性或定量表述,適合將其制定成為國家或行業(yè)標(biāo)準(zhǔn)或區(qū)域性規(guī)定普遍遵守。這種做法并不是創(chuàng)新,實(shí)際上,在傳統(tǒng)檔案的移交中,有相應(yīng)的行業(yè)標(biāo)準(zhǔn)來約束紙質(zhì)文件的移交(如《機(jī)關(guān)文件材料歸檔范圍和文書檔案保管期限規(guī)定》中的相關(guān)規(guī)定)。只有將上述更詳盡內(nèi)容納入到協(xié)議中,才能真正實(shí)現(xiàn)適應(yīng)長(zhǎng)期保存的前端控制?,F(xiàn)有移交或歸檔標(biāo)準(zhǔn)或不齊全或操作性差,難以真正對(duì)我國分離的文檔工作進(jìn)行全生命周期關(guān)鍵環(huán)節(jié)的約束。
和元數(shù)據(jù)特性相關(guān)的移交規(guī)范內(nèi)容往往隨立檔單位和檔案館的不同而有所不同,有了可普遍遵守的捕獲規(guī)定,立檔單位可以根據(jù)自己電子文件與元數(shù)據(jù)的特點(diǎn)與檔案部門協(xié)商形成自己的捕獲規(guī)范。[6]
和紙質(zhì)文件移交規(guī)范不一樣的是,捕獲協(xié)議應(yīng)能用計(jì)算機(jī)語言進(jìn)行描述并固化在程序中,以提高ERMS捕獲的自動(dòng)化程度。具體是捕獲協(xié)議相對(duì)固定的部分(如封裝、移交安全規(guī)程、元數(shù)據(jù)標(biāo)識(shí)等)應(yīng)該直接固化在系統(tǒng)編程中,靈活可變的部分則可以用XML文件描述出來,通過對(duì)文件生成系統(tǒng)的改造嵌入到系統(tǒng)功能模塊中,同時(shí)建立與其他規(guī)范或標(biāo)準(zhǔn)的關(guān)聯(lián)。文件生成系統(tǒng)調(diào)用該XML文件,根據(jù)相應(yīng)的規(guī)定自動(dòng)生成元數(shù)據(jù)、封裝,并做好安全移交的準(zhǔn)備。該XML文件還應(yīng)該建立與其他規(guī)范的關(guān)聯(lián),如在封裝元數(shù)據(jù)時(shí)需要密級(jí)和保管期限,系統(tǒng)就調(diào)用與捕獲規(guī)范相關(guān)聯(lián)的電子文件保管期限表(XML格式),就可以自動(dòng)對(duì)電子文件進(jìn)行鑒定。
捕獲協(xié)議的可機(jī)讀性使得提交、收集、保存規(guī)劃、保存、著錄等活動(dòng)的自動(dòng)化大大增強(qiáng),減少了人工干預(yù)的程度。可以說,檔案館電子文件管理的規(guī)范、制度可機(jī)讀越多,其管理過程的自動(dòng)化程度就越高。例如,電子文件管理系統(tǒng)的格式管理模塊對(duì)每一個(gè)格式記錄有大量詳細(xì)的、可機(jī)讀的技術(shù)與管理元數(shù)據(jù),就可以用元數(shù)據(jù)自動(dòng)驗(yàn)證文件格式。如果接收到新的格式,系統(tǒng)或?qū)⑵滢D(zhuǎn)換成已有的格式,或登記、注冊(cè)新格式的表示信息(技術(shù)和管理元數(shù)據(jù))存儲(chǔ)在格式管理模塊,使電子文件的格式適應(yīng)檔案館的需要。如果格式信息只是一張簡(jiǎn)單描述格式的紙質(zhì)列表,電子文件的格式驗(yàn)證就只有手動(dòng)實(shí)施了。
將規(guī)范、制度、規(guī)程等描述為可機(jī)讀對(duì)象,需要檔案館投入相當(dāng)大的精力。一般來說,自動(dòng)化最適合那些從相同的文件生成者移交電子文件的檔案館,只有當(dāng)新的文件形成者或新的文件類型出現(xiàn),檔案館才會(huì)做出相應(yīng)調(diào)整。
四、捕獲接口
要想實(shí)現(xiàn)電子文件及其元數(shù)據(jù)從生成系統(tǒng)捕獲到ERMS,最好的做法是在兩個(gè)系統(tǒng)間建立接口。所謂接口,就是在文件生成系統(tǒng)與ERMS間按照預(yù)定的數(shù)據(jù)交換格式建立數(shù)據(jù)導(dǎo)入/導(dǎo)出的軟件模塊,實(shí)現(xiàn)兩個(gè)系統(tǒng)的數(shù)據(jù)流動(dòng)與流程銜接。
這樣的導(dǎo)入導(dǎo)出模塊可以是手動(dòng)操作的,也可以是系統(tǒng)自動(dòng)進(jìn)行的。早期的檔案移交過程,就是一個(gè)手動(dòng)操作的典型接口案例,如從OA中導(dǎo)出電子文件到光盤,然后將光盤內(nèi)容再導(dǎo)入到檔案管理系統(tǒng)中,這個(gè)過程中的導(dǎo)入、導(dǎo)出功能實(shí)際就是一個(gè)接口?,F(xiàn)在應(yīng)重點(diǎn)研究的是自動(dòng)捕獲,即不需要人工干預(yù),即可實(shí)現(xiàn)電子文件及其元數(shù)據(jù)自動(dòng)從生成系統(tǒng)捕獲到ERMS,從而避免了捕獲過程中人為改動(dòng)數(shù)據(jù)的可能性,也是電子文件真實(shí)性保障與證明的一個(gè)重要手段。
編制接口程序,要求必須同時(shí)了解生成系統(tǒng)與ERMS兩個(gè)系統(tǒng)的數(shù)據(jù)接口,尤其是需要徹底清晰地了解捕獲數(shù)據(jù)的結(jié)構(gòu),比如相應(yīng)表結(jié)構(gòu)、字段值的特殊含義等。實(shí)際上,這些內(nèi)容都已經(jīng)在捕獲協(xié)議中進(jìn)行了明確規(guī)定和清晰描述。通過捕獲接口將捕獲協(xié)議嚴(yán)格實(shí)現(xiàn),完成捕獲的各項(xiàng)任務(wù),從而實(shí)現(xiàn)電子文件的前端控制。
(一)接口具體實(shí)現(xiàn)方式
接口是兩個(gè)系統(tǒng)數(shù)據(jù)交互的工具,通過接口,業(yè)務(wù)系統(tǒng)傳遞數(shù)據(jù),ERMS接收數(shù)據(jù),所有的要求必須在接口設(shè)計(jì)時(shí)得到滿足。
1.利用EXCEL表格。該實(shí)現(xiàn)方式將元數(shù)據(jù)寫入EX? CEL表格,并與相應(yīng)的電子文件建立關(guān)聯(lián)即可。或?qū)⒃獢?shù)據(jù)寫入用TAB分割的文本文件,每一個(gè)這樣的文本文件對(duì)應(yīng)一個(gè)電子文件。這樣的封裝可以進(jìn)行在線移交或離線移交。在線移交可以根據(jù)唯一標(biāo)識(shí)符來識(shí)別要移交的電子文件,離線移交則可以根據(jù)光盤中的TAB文件和文件名稱列表來識(shí)別要移交的電子文件。無論哪種方式,都需要對(duì)批量移交的數(shù)據(jù)生成一個(gè)說明來描述數(shù)據(jù)包的結(jié)構(gòu),還需要在綜合檔案館ERMS中開發(fā)一個(gè)接口來接收數(shù)據(jù)包。需要注意的是,由于業(yè)務(wù)系統(tǒng)數(shù)據(jù)包封裝的元數(shù)據(jù)一般不完全,移交的數(shù)據(jù)包應(yīng)暫存在ERMS的收集庫中。
這是非常簡(jiǎn)單的一種方式,簡(jiǎn)單易行,檔案人員容易理解并操作。但缺點(diǎn)很明顯,難以控制電子文件及其元數(shù)據(jù)的修改,不易保障并證明其真實(shí)性。在檔案信息化早期管理系統(tǒng)應(yīng)用尚不成熟尚未普及時(shí),該種方式可保障電子文件與元數(shù)據(jù)的有機(jī)聯(lián)系。
2.利用數(shù)據(jù)庫技術(shù)。封裝有多種方式,數(shù)據(jù)庫技術(shù)其實(shí)也是一種封裝。它把元數(shù)據(jù)作為二維表格存儲(chǔ)起來,每一條元數(shù)據(jù)的記錄與相應(yīng)的電子文件建立關(guān)聯(lián),這其實(shí)就實(shí)現(xiàn)了內(nèi)容信息與元數(shù)據(jù)的簡(jiǎn)單封裝。目前數(shù)據(jù)庫管理系統(tǒng)均支持XML,可很方便地將數(shù)據(jù)庫記錄用XML描述出來。
3.XML封裝。業(yè)務(wù)系統(tǒng)將元數(shù)據(jù)導(dǎo)出為XML文件,同時(shí)將公文內(nèi)容(如Doc文檔)導(dǎo)出為實(shí)體文件。XML定義如下:
上述XML描述應(yīng)按照標(biāo)準(zhǔn)DA/T 48-2009規(guī)定的元數(shù)據(jù)項(xiàng)與Schema來實(shí)現(xiàn)。
對(duì)于ERMS來說,其接收接口傳遞來的XML文檔后,即可進(jìn)行解釋并將數(shù)據(jù)納入到自己的系統(tǒng)中。如果XML文件為外部系統(tǒng)生成,ERMS的捕獲子系統(tǒng)必須提供XML驗(yàn)證模塊,以便和其他系統(tǒng)銜接前驗(yàn)證采集數(shù)據(jù)的合法性。
(二)動(dòng)態(tài)前端控制與接口的數(shù)據(jù)雙向傳輸
接口既包含生成系統(tǒng)接口,也包含ERMS的接口,前者的主要功能是對(duì)生成系統(tǒng)的電子文件及其元數(shù)據(jù)按照既定要求封裝,并進(jìn)行傳遞,后者則將傳遞來的數(shù)據(jù)納入到ERMS中。通常研究的大多是數(shù)據(jù)的單向傳輸,即從生成系統(tǒng)到ERMS。
前文提到ERMS的保存規(guī)劃功能需要進(jìn)行前端控制,比較好的辦法就是通過接口將ERMS生成的控制信息通過接口傳遞給文件生成系統(tǒng),生成系統(tǒng)根據(jù)接收的控制信息進(jìn)行相應(yīng)的改變以適應(yīng)ERMS的變化滿足ERMS的需求。比如,電子文件的標(biāo)準(zhǔn)格式發(fā)生了改變,這時(shí)ERMS將改變后的標(biāo)準(zhǔn)格式以XML封裝方式通過接口傳遞給文件生成系統(tǒng)。生成系統(tǒng)通過人機(jī)交互,改變格式轉(zhuǎn)換的功能,比如將原來格式轉(zhuǎn)換中將原格式向原標(biāo)準(zhǔn)格式轉(zhuǎn)換變更為新的標(biāo)準(zhǔn)格式。再如,接口還可具有真實(shí)性、完整性的檢測(cè)功能,也是一種數(shù)據(jù)雙向傳輸?shù)捏w現(xiàn)。
這種由ERMS到生成系統(tǒng)的數(shù)據(jù)傳輸,是前端控制的進(jìn)一步深化,是一種動(dòng)態(tài)的前端控制,也是ERMS保存規(guī)劃具體實(shí)現(xiàn)并深入到前端的較好辦法。
五、結(jié)語
電子文件捕獲是實(shí)現(xiàn)前端控制原則重要的一個(gè)環(huán)節(jié)。為實(shí)現(xiàn)捕獲的自動(dòng)進(jìn)行,以及最大程度的靈活性,必須在捕獲前由文件生成單位與檔案部門以捕獲協(xié)議的方式明確捕獲的內(nèi)容、時(shí)機(jī)、功能等,以此作為捕獲接口的需求指南,以便捕獲接口的開發(fā)具有最大程度的開放性與適應(yīng)不同立檔單位的靈活性。這樣做并不表示給檔案部門帶來了許多工作量。檔案室針對(duì)自己?jiǎn)挝坏亩鄠€(gè)業(yè)務(wù)系統(tǒng)可以根據(jù)其電子文件不同制定相應(yīng)的捕獲協(xié)議,綜合檔案館對(duì)應(yīng)的立檔單位在幾十家或更多,但這些立檔單位捕獲的同類別檔案基本相類似,因此,綜合檔案館可以制定若干個(gè)具體的捕獲協(xié)議即可滿足其所有立檔單位的電子文件捕獲。
捕獲接口推薦用XML格式,以Web service技術(shù)來構(gòu)建,從而為立檔單位、檔案館之間業(yè)務(wù)流程的集成提供一個(gè)通用機(jī)制,便于將來的擴(kuò)展。需要指出的是,由于業(yè)務(wù)生成系統(tǒng)往往先于ERMS建設(shè),要想實(shí)現(xiàn)捕獲功能,還需要對(duì)文件生成系統(tǒng)進(jìn)行改造。如果業(yè)務(wù)系統(tǒng)即將建設(shè)或正在建設(shè),檔案部門應(yīng)參與到系統(tǒng)的規(guī)劃、設(shè)計(jì)與實(shí)施中,將捕獲的相關(guān)功能充分體現(xiàn)在業(yè)務(wù)系統(tǒng)中。
*本文為河南省科技廳軟科學(xué)項(xiàng)目“政務(wù)內(nèi)網(wǎng)中機(jī)關(guān)電子文件管理系統(tǒng)評(píng)估體系研究”(項(xiàng)目編號(hào):142400410149)、國家社科基金項(xiàng)目“我國數(shù)字檔案信息長(zhǎng)期保存的策略體系研究”(項(xiàng)目編號(hào):13CTQ051)的中期研究成果之一。
注釋及參考文獻(xiàn):
[1][5]國家檔案局.DA/T58-2014電子檔案管理基本術(shù)語[S].
[2]國家檔案局.DA/T 46-2009文書類電子文件元數(shù)據(jù)方案[S].
[3][4]中華人民共和國家質(zhì)量監(jiān)督檢驗(yàn)檢疫總局,中國國家標(biāo)準(zhǔn)化管理委員會(huì)GB/T29194-2012,電子文件管理系統(tǒng)通用功能要求[S].
[6]劉越男.電子文件的捕獲——基于電子文件管理系統(tǒng)的分析[J].中國檔案,2013(7):68.