楊文剛 崔杰 田偉
摘要:檔案元數(shù)據(jù)核心集是依據(jù)魂系歷史主義思想,從檔案歷史聯(lián)系的三個(gè)維度(來(lái)源、事由、時(shí)間)提出的,它既是對(duì)檔案元數(shù)據(jù)標(biāo)準(zhǔn)的一種精簡(jiǎn),又承載著記錄社會(huì)實(shí)踐活動(dòng)的歷史使命。為了更好地記錄和管理檔案元數(shù)據(jù)核心集,構(gòu)建檔案元數(shù)據(jù)核心集系統(tǒng)勢(shì)在必行。本文以檔案元數(shù)據(jù)核心集系統(tǒng)的設(shè)計(jì)要求為基礎(chǔ),提出系統(tǒng)的整體設(shè)計(jì)框架,依據(jù)檔案元數(shù)據(jù)核心集系統(tǒng)的設(shè)計(jì)原則,歸納檔案元數(shù)據(jù)標(biāo)準(zhǔn),最后介紹元數(shù)據(jù)的著錄流程,并強(qiáng)調(diào)對(duì)著錄后元數(shù)據(jù)進(jìn)行動(dòng)態(tài)維護(hù)的重要意義。
關(guān)鍵詞:檔案元數(shù)據(jù)核心集檔案資源整合檔案管理系統(tǒng)
Abstracts:Archive metadata core set is come from three dimensions of the archival historical rela? tion,which is based on the thought of historical spir? it, it is not only one compact form of archive meta? data standard, but also bearing the history mission of recording the social practice activity. In order to better record and manage the archive metadata core set , it is imperative for building the system of archive metadata core set. This article is based on the design requirement of archive metadata core set system, put forward the overall design of the system framework, according to design principle of archive metadata core set, summarized the archive metadata criterion, lastly explain the record work? flow of archive metadata, and emphasize the signif? icance that it is important to dynamically maintain the existing metadata.
Keywords: Archive metadata core set; Archive resource integration; Archive management system
在檔案管理中,元數(shù)據(jù)是描述檔案資源的內(nèi)容、結(jié)構(gòu)、背景環(huán)境及其管理過(guò)程的數(shù)據(jù)。它既是保障電子檔案原始性、真實(shí)性、完整性、一致性、關(guān)聯(lián)性、可讀性和長(zhǎng)期保存性的基礎(chǔ),又是檔案資源整合和信息集成共享體系中必不可少的工具。[1]
目前,雖然許多元數(shù)據(jù)標(biāo)準(zhǔn)被廣泛應(yīng)用于圖書、情報(bào)、檔案等信息領(lǐng)域,但是相似的元數(shù)據(jù)標(biāo)準(zhǔn)被應(yīng)用到不同的文獻(xiàn)領(lǐng)域卻顯得較為泛化。從本質(zhì)上看,檔案與圖書、情報(bào)有所不同,它的研究對(duì)象、覆蓋范圍、管理方法以及服務(wù)模式與圖情管理存在較大差異,使得將已在圖情領(lǐng)域成功應(yīng)用的元數(shù)據(jù)標(biāo)準(zhǔn)直接移植到檔案管理中顯得不切實(shí)際。在這種情況下,檔案界亟需建立屬于本領(lǐng)域的元數(shù)據(jù)標(biāo)準(zhǔn),而這就需要結(jié)合歷史主義精神,[2]從檔案的本質(zhì)屬性中挖掘出檔案所特有的元數(shù)據(jù)標(biāo)準(zhǔn),即檔案元數(shù)據(jù)核心集。
在此基礎(chǔ)上,筆者提出檔案元數(shù)據(jù)核心集系統(tǒng)的概念,簡(jiǎn)單來(lái)說(shuō),它是一種面向檔案元數(shù)據(jù)核心集管理的應(yīng)用系統(tǒng)。即通過(guò)構(gòu)建檔案元數(shù)據(jù)核心集系統(tǒng),賦予檔案元數(shù)據(jù)核心集以生命空間,發(fā)揮檔案元數(shù)據(jù)核心集的作用,客觀、真實(shí)、完整地記錄檔案歷史聯(lián)系,揭示檔案內(nèi)在的聯(lián)系,實(shí)現(xiàn)檔案記錄歷史的功能??梢哉f(shuō),建立檔案元數(shù)據(jù)核心集系統(tǒng),一方面,可以使用戶通過(guò)系統(tǒng)提供的人性化界面對(duì)元數(shù)據(jù)進(jìn)行操作,實(shí)現(xiàn)用戶與元數(shù)據(jù)的直線通話,降低元數(shù)據(jù)的操作門檻;另一方面,系統(tǒng)通過(guò)科學(xué)合理的設(shè)計(jì),能夠最大限度地發(fā)揮檔案元數(shù)據(jù)核心集的記錄功能,承載檔案的歷史使命。它既是對(duì)檔案元數(shù)據(jù)核心集理論的一種應(yīng)用和實(shí)踐,又是對(duì)檔案元數(shù)據(jù)核心集理論的一種驗(yàn)證。所以,設(shè)計(jì)并實(shí)施檔案元數(shù)據(jù)核心集管理系統(tǒng),不僅具有實(shí)踐的應(yīng)用意義,而且對(duì)檔案界元數(shù)據(jù)的理論研究具有促進(jìn)作用。
一、檔案元數(shù)據(jù)核心集系統(tǒng)的設(shè)計(jì)要求
檔案元數(shù)據(jù)核心集系統(tǒng),是以對(duì)檔案元數(shù)據(jù)的捕獲和著錄為基礎(chǔ),以文件的整個(gè)生命周期為有效期,以信息挖掘與資源整合為技術(shù)手段,以輸出全面、準(zhǔn)確、關(guān)聯(lián)的檔案信息為目標(biāo),以紙質(zhì)檔案與電子檔案為管理對(duì)象而實(shí)施的全過(guò)程管理系統(tǒng)。
經(jīng)過(guò)深入分析,檔案元數(shù)據(jù)核心集系統(tǒng)需要滿足以下要求:一是系統(tǒng)需要針對(duì)不同類型的用戶設(shè)計(jì)不同的元數(shù)據(jù)項(xiàng)目,并在這些用戶完成各自元數(shù)據(jù)著錄之后,將所有的元數(shù)據(jù)組合起來(lái),形成最終的檔案元數(shù)據(jù)核心集。因?yàn)闄n案管理本身就是一項(xiàng)復(fù)雜的系統(tǒng)性工作,形成檔案的文書部門或檔案室是無(wú)法單獨(dú)完成檔案元數(shù)據(jù)的全部著錄任務(wù)的,這就要求文書部門、檔案室、檔案館協(xié)同合作來(lái)實(shí)現(xiàn)元數(shù)據(jù)的著錄。二是系統(tǒng)在元數(shù)據(jù)著錄方式中應(yīng)采用人工手動(dòng)著錄和系統(tǒng)自動(dòng)著錄相結(jié)合的方式,部分描述型檔案元數(shù)據(jù)可由人工進(jìn)行著錄,而部分管理型元數(shù)據(jù)(如文件的生成時(shí)間、歸檔時(shí)間、借閱情況等),可以由系統(tǒng)根據(jù)對(duì)檔案的跟蹤實(shí)現(xiàn)自動(dòng)著錄。三是系統(tǒng)元數(shù)據(jù)應(yīng)具有較強(qiáng)的擴(kuò)展性,由于元數(shù)據(jù)標(biāo)準(zhǔn)不是一成不變的,這就需要系統(tǒng)動(dòng)態(tài)地添加新的元數(shù)據(jù),并將新的元數(shù)據(jù)注冊(cè)到系統(tǒng)中,使系統(tǒng)在管理元數(shù)據(jù)方面更加靈活。四是系統(tǒng)需要為元數(shù)據(jù)提供存儲(chǔ)空間,來(lái)實(shí)現(xiàn)元數(shù)據(jù)的導(dǎo)入導(dǎo)出功能和電子檔案的封裝功能。這樣既可以實(shí)現(xiàn)對(duì)元數(shù)據(jù)及電子檔案的永久保存或異地備份,又可以為今后系統(tǒng)之間進(jìn)行數(shù)據(jù)交換或資源共享提供數(shù)據(jù)接口。五是系統(tǒng)需要設(shè)計(jì)一些管理型元數(shù)據(jù),用來(lái)監(jiān)控系統(tǒng)中電子檔案在其生命周期內(nèi)的所有動(dòng)態(tài),從而保障電子檔案的真實(shí)性和完整性。例如可以利用電子檔案的操作記錄和數(shù)字簽名等管理型元數(shù)據(jù)來(lái)檢測(cè)電子檔案是否被惡意篡改。
二、檔案元數(shù)據(jù)核心集系統(tǒng)的總體設(shè)計(jì)框架
基于對(duì)檔案元數(shù)據(jù)核心集系統(tǒng)的需求導(dǎo)向,系統(tǒng)的總體框架(如圖1所示)可以分為數(shù)據(jù)層、用戶層、業(yè)務(wù)層、應(yīng)用層和存儲(chǔ)層。其中,數(shù)據(jù)層是整個(gè)系統(tǒng)的基礎(chǔ),并貫穿電子檔案管理的整個(gè)生命周期,原因在于用戶層、業(yè)務(wù)層、應(yīng)用層、存儲(chǔ)層各自的功能都是基于對(duì)元數(shù)據(jù)的獲取、解析和應(yīng)用來(lái)實(shí)現(xiàn)的。
(一)數(shù)據(jù)層
數(shù)據(jù)層主要用來(lái)建立檔案元數(shù)據(jù)的模型。所涉檔案元數(shù)據(jù)包括核心元數(shù)據(jù)和擴(kuò)展元數(shù)據(jù),核心元數(shù)據(jù)是系統(tǒng)中不可缺少的檔案元數(shù)據(jù),而擴(kuò)展元數(shù)據(jù)則是根據(jù)額外需求補(bǔ)充添加的元數(shù)據(jù)。在系統(tǒng)的具體設(shè)計(jì)中,必須對(duì)元數(shù)據(jù)進(jìn)行明確的分類和定義,包括元數(shù)據(jù)描述、元數(shù)據(jù)結(jié)構(gòu)、元數(shù)據(jù)功能和元數(shù)據(jù)關(guān)聯(lián)。
(二)用戶層
用戶層主要是指系統(tǒng)的使用者。它是檔案元數(shù)據(jù)著錄的主要參與者,也是該系統(tǒng)的服務(wù)對(duì)象,所以系統(tǒng)應(yīng)主要圍繞用戶層的需求對(duì)數(shù)據(jù)層、業(yè)務(wù)層、應(yīng)用層和存儲(chǔ)層進(jìn)行功能設(shè)計(jì)。在用戶層中,按照角色的不同,可以分為文書部門、檔案室、檔案館和檔案利用者。這些不同角色的用戶可以根據(jù)自身權(quán)限,通過(guò)業(yè)務(wù)層或應(yīng)用層來(lái)實(shí)現(xiàn)工作職責(zé),同時(shí)享有對(duì)檔案元數(shù)據(jù)的獲取和利用。
(三)業(yè)務(wù)層
業(yè)務(wù)層涵蓋了檔案管理的各項(xiàng)功能。從文件的創(chuàng)建開始,業(yè)務(wù)層就開始將檔案的元數(shù)據(jù)著錄到系統(tǒng)中,此后經(jīng)過(guò)對(duì)文件的修改、移交、接收、鑒定、歸檔等過(guò)程而形成了檔案,再由檔案管理部門對(duì)檔案進(jìn)行整理、保管、監(jiān)控、統(tǒng)計(jì)和開放利用,之后由檔案利用者對(duì)檔案進(jìn)行利用和反饋,最后由檔案管理部門對(duì)檔案進(jìn)行鑒定和銷毀。在這一完整的過(guò)程中,業(yè)務(wù)層始終需要?jiǎng)討B(tài)地將元數(shù)據(jù)著錄到系統(tǒng)中。
(四)應(yīng)用層
應(yīng)用層側(cè)重對(duì)系統(tǒng)底層操作的實(shí)現(xiàn),它是業(yè)務(wù)層得以實(shí)現(xiàn)的一種功能封裝和技術(shù)支持,同時(shí)也是對(duì)業(yè)務(wù)層的一種功能擴(kuò)展。一般來(lái)說(shuō),它包括元數(shù)據(jù)的注冊(cè)、元數(shù)據(jù)的解析、元數(shù)據(jù)的封裝、數(shù)字簽名與簽名校驗(yàn)的實(shí)現(xiàn)、文件關(guān)聯(lián)的建立方式、數(shù)據(jù)交換的應(yīng)用接口等。
(五)存儲(chǔ)層
存儲(chǔ)層是為元數(shù)據(jù)及電子文件的永久保存而設(shè)計(jì)的。它提供關(guān)系型數(shù)據(jù)庫(kù)、XML文件和封裝后的電子文件三種存儲(chǔ)方式。其中,關(guān)系型數(shù)據(jù)庫(kù)用于存儲(chǔ)系統(tǒng)中著錄的元數(shù)據(jù),在數(shù)據(jù)檢索時(shí)能夠體現(xiàn)較快的響應(yīng)速度。缺點(diǎn)是數(shù)據(jù)的存儲(chǔ)與讀取依賴數(shù)據(jù)庫(kù)平臺(tái),脫離數(shù)據(jù)庫(kù)平臺(tái)后,數(shù)據(jù)將無(wú)法被識(shí)別。XML文件,用于存儲(chǔ)系統(tǒng)導(dǎo)出的元數(shù)據(jù),它屬于國(guó)際通用的標(biāo)準(zhǔn),具有較強(qiáng)的數(shù)據(jù)描述能力,同時(shí)不依賴任何平臺(tái)。缺點(diǎn)是檢索速度慢,只能存儲(chǔ)文字,不能存儲(chǔ)電子文件的附件,一般應(yīng)用于元數(shù)據(jù)信息交換的中間組件。封裝后的電子文件,將電子文件附件和元數(shù)據(jù)打包進(jìn)行存儲(chǔ)。優(yōu)點(diǎn)是將電子文件的全文和元數(shù)據(jù)完整地存儲(chǔ)下來(lái),缺點(diǎn)是不易被其他系統(tǒng)識(shí)別。一般應(yīng)用于電子文件及元數(shù)據(jù)的永久保存和異地備份。
三、檔案元數(shù)據(jù)核心集系統(tǒng)的數(shù)據(jù)標(biāo)準(zhǔn)
(一)檔案元數(shù)據(jù)核心集系統(tǒng)的元數(shù)據(jù)設(shè)計(jì)原則
通過(guò)對(duì)檔案元數(shù)據(jù)核心集系統(tǒng)的整體分析,可以看到元數(shù)據(jù)模型的建立是系統(tǒng)正常運(yùn)行的前提,而對(duì)元數(shù)據(jù)模型的描述和功能定位也直接牽動(dòng)著檔案資源建設(shè)、檔案信息整合和檔案利用服務(wù)的命脈。因此在創(chuàng)建檔案元數(shù)據(jù)時(shí),需要遵循以下原則:
1.尊重檔案的歷史原則。歷史原則是歷史主義精神[2]的一種表現(xiàn)形式,即尊重歷史、尊重客觀、尊重整體聯(lián)系或有機(jī)聯(lián)系。也就是說(shuō)在元數(shù)據(jù)的設(shè)計(jì)中,既要客觀真實(shí)地記錄歷史事件,又要通過(guò)對(duì)元數(shù)據(jù)的設(shè)計(jì)來(lái)實(shí)現(xiàn)檔案文件內(nèi)部的關(guān)聯(lián),并將隱藏在文件內(nèi)部的聯(lián)系通過(guò)可視化的描述或可被理解的形式展現(xiàn)出來(lái)。
2.注重文件前端控制和全程管理的原則。元數(shù)據(jù)的著錄工作不是一蹴而就的,而是在文件生命周期內(nèi)的不同階段分步著錄的。注重文件的前端控制要求文件在產(chǎn)生時(shí)就開始對(duì)元數(shù)據(jù)進(jìn)行著錄,而不是當(dāng)文件歸檔后成為檔案時(shí)才對(duì)元數(shù)據(jù)進(jìn)行著錄。文件的全過(guò)程管理則要求檔案在未被鑒定銷毀之前,系統(tǒng)應(yīng)該一直利用元數(shù)據(jù)來(lái)監(jiān)控檔案文件的運(yùn)行狀態(tài)。
3.堅(jiān)持元數(shù)據(jù)標(biāo)準(zhǔn)化、擴(kuò)展性和互操作性。元數(shù)據(jù)標(biāo)準(zhǔn)化是指檔案元數(shù)據(jù)的建立并不是憑空而來(lái)的,而是建立在參考國(guó)內(nèi)外檔案元數(shù)據(jù)標(biāo)準(zhǔn)的基礎(chǔ)上提出符合檔案元數(shù)據(jù)管理的標(biāo)準(zhǔn)。擴(kuò)展性則是指元數(shù)據(jù)的設(shè)計(jì)需要具有動(dòng)態(tài)擴(kuò)展的功能?;ゲ僮餍允侵冈谠O(shè)計(jì)元數(shù)據(jù)時(shí),要考慮到不同系統(tǒng)的數(shù)據(jù)交換問(wèn)題,通過(guò)建立不同元數(shù)據(jù)的映射關(guān)系,來(lái)實(shí)現(xiàn)系統(tǒng)之間的數(shù)據(jù)交換和信息共享。[3]
(二)檔案元數(shù)據(jù)核心集系統(tǒng)的元數(shù)據(jù)標(biāo)準(zhǔn)
檔案元數(shù)據(jù)核心集系統(tǒng)的元數(shù)據(jù)包括核心元數(shù)據(jù)和擴(kuò)展元數(shù)據(jù),如圖2所示。其中,核心元數(shù)據(jù)應(yīng)遵循檔案的歷史原則,從檔案的本質(zhì)出發(fā),依據(jù)檔案歷史聯(lián)系的三個(gè)要素(來(lái)源、事由、年代),將核心元數(shù)據(jù)集通過(guò)三個(gè)維度(來(lái)源維度、事由維度、年代維度)展現(xiàn)出來(lái)??蓺w納為27項(xiàng)元數(shù)據(jù):來(lái)源標(biāo)識(shí)、來(lái)源名稱、來(lái)源類型、全宗號(hào)、全宗名稱、來(lái)源關(guān)聯(lián)標(biāo)識(shí)、來(lái)源關(guān)聯(lián)關(guān)系、來(lái)源關(guān)聯(lián)程度、事件標(biāo)識(shí)、事件參與者、事件動(dòng)作、事件開始時(shí)間、事件結(jié)束時(shí)間、事件環(huán)境、事件起因、事件經(jīng)過(guò)、事件結(jié)果、事件關(guān)聯(lián)標(biāo)識(shí)、事件關(guān)聯(lián)關(guān)系、事件關(guān)聯(lián)程度、年代標(biāo)識(shí)、年代開始時(shí)間、年代結(jié)束時(shí)間、重要時(shí)間點(diǎn)、年代關(guān)聯(lián)標(biāo)識(shí)、年代關(guān)聯(lián)關(guān)系、年代關(guān)聯(lián)程度。另外,擴(kuò)展元數(shù)據(jù)則側(cè)重對(duì)電子檔案的管理功能進(jìn)行描述,分為描述型和管理型元數(shù)據(jù),應(yīng)遵循文件的全程管理與元數(shù)據(jù)的擴(kuò)展性等原則,便于系統(tǒng)實(shí)現(xiàn)對(duì)檔案的全程監(jiān)控及對(duì)元數(shù)據(jù)的互操作等功能??蓺w納為12項(xiàng)元數(shù)據(jù):文件題名、保管期限、密級(jí)、檔號(hào)、關(guān)鍵詞、責(zé)任者、分類號(hào)、文件權(quán)限、存儲(chǔ)地址、電子文件、文件屬性、數(shù)字簽名。
四、檔案元數(shù)據(jù)核心集系統(tǒng)的著錄及維護(hù)
(一)檔案元數(shù)據(jù)核心集系統(tǒng)的著錄
元數(shù)據(jù)的著錄工作不能完全依靠檔案形成部門實(shí)施,依據(jù)文件運(yùn)動(dòng)周期理論,元數(shù)據(jù)的著錄應(yīng)是伴隨文件的生命周期呈現(xiàn)出一種實(shí)時(shí)的、動(dòng)態(tài)的著錄過(guò)程,這就需要文書部門、檔案室、檔案館協(xié)同參與,并依據(jù)檔案的文件級(jí)、案卷級(jí)、全宗級(jí)、全宗群四個(gè)形態(tài)進(jìn)行分層級(jí)著錄。其著錄流程是:首先,由文書部門將各種事件、活動(dòng)記錄下來(lái)形成文件,按照事由原則將屬于同一事件的文件組成案卷。同時(shí)完成事件相關(guān)元數(shù)據(jù)的著錄,并將案卷移交至檔案室。其次,檔案室根據(jù)來(lái)源原則,將不同立卷部門形成的案卷分別歸置到不同的全宗下,同時(shí)完成全宗相關(guān)的元數(shù)據(jù)著錄,并將不同全宗的檔案歸入檔案館。最后,由檔案館綜合參照事由原則、來(lái)源原則和年代原則,建立不同的事由全宗、來(lái)源全宗和年代全宗,最終形成全宗群。并通過(guò)對(duì)關(guān)聯(lián)元數(shù)據(jù)的定義和著錄,實(shí)現(xiàn)文件與文件、案卷與案卷、全宗與全宗之間的內(nèi)在關(guān)聯(lián),使檔案館資源成為一個(gè)內(nèi)在相互關(guān)聯(lián)的全宗群。如圖3所示。
(二)檔案元數(shù)據(jù)核心集系統(tǒng)的維護(hù)
檔案元數(shù)據(jù)著錄的最終目標(biāo)是通過(guò)元數(shù)據(jù)建立文件之間的內(nèi)部關(guān)聯(lián),使檔案資源得到有效整合,為檔案利用提供優(yōu)質(zhì)信息。利用元數(shù)據(jù)實(shí)現(xiàn)文件內(nèi)部關(guān)聯(lián)是通過(guò)檔案管理者對(duì)元數(shù)據(jù)著錄來(lái)實(shí)現(xiàn)的,其著錄項(xiàng)一般包括關(guān)聯(lián)文件的標(biāo)識(shí)、文件之間的關(guān)聯(lián)關(guān)系及關(guān)聯(lián)程度,這些元數(shù)據(jù)的著錄大多是檔案管理者根據(jù)自身工作經(jīng)驗(yàn)判斷而生成的,具有一定的主觀性,在某種程度上影響了文件關(guān)聯(lián)的準(zhǔn)確性,所以文件之間的關(guān)聯(lián)性是否客觀真實(shí)還要放到檔案利用中去檢驗(yàn)。檔案管理者應(yīng)該根據(jù)用戶對(duì)檔案利用的反饋信息,結(jié)合對(duì)文件本身的內(nèi)在關(guān)聯(lián)進(jìn)行綜合考慮,不斷調(diào)整或更新文件之間關(guān)聯(lián)的元數(shù)據(jù),客觀地揭示檔案文件內(nèi)部的關(guān)聯(lián)。
檔案資源整合與檔案利用是相互推動(dòng)、相互促進(jìn)的,良好的資源整合可以為檔案利用提供優(yōu)質(zhì)的信息,而通過(guò)對(duì)檔案利用的準(zhǔn)確評(píng)價(jià),又可以更好地揭示檔案文件內(nèi)部的關(guān)聯(lián)性,從而進(jìn)一步優(yōu)化檔案資源整合。所以我們?cè)跈n案管理中,除了要重視文件的前端控制以外,更要意識(shí)到檔案利用的信息跟蹤及后端反饋對(duì)檔案元數(shù)據(jù)揭示的重大意義。
*本文為2015年度教育部人文社會(huì)科學(xué)研究項(xiàng)目“‘魂系歷史主義的檔案元數(shù)據(jù)核心集的構(gòu)建研究”(項(xiàng)目編號(hào):15YJC870007)的階段性研究成果之一。
注釋及參考文獻(xiàn):
[1]金更達(dá),何嘉蓀.檔案信息資源集成管理中的元數(shù)據(jù)問(wèn)題及對(duì)策研究[J].中國(guó)圖書館學(xué)報(bào),2006(4):56-59.
[2]黃霄羽.魂系歷史主義——西方檔案學(xué)支柱理論發(fā)展研究[J].檔案學(xué)通訊,2004(1):57-60.
[3]王健,姜偉,趙瑞紅.電子文件元數(shù)據(jù)自動(dòng)采集的原則與實(shí)施路徑研究[J].北京檔案,2015(9):29-32.