劉越男
在檔案界對電子文件管理方案的探求過程中,元數(shù)據(jù)一直備受關注。國際化意識的提高,國家層面元數(shù)據(jù)標準長時間的空缺,這兩方面的因素致使越來越多的業(yè)內(nèi)人士從國際標準、國外標準中尋求支持,2006年1月出臺的ISO 23081-1《信息與文獻——文件管理流程——文件元數(shù)據(jù)——原則》①和2007年7月出臺的ISO/TS 23081-2《信息與文獻——文件管理流程——文件元數(shù)據(jù)——概念及實施》②規(guī)定完備,闡述詳細,一經(jīng)頒布,影響立現(xiàn)。國家檔案局今年3月份公布的兩份元數(shù)據(jù)標準征求意見稿中,都可以清楚地見到ISO23081的痕跡。
一、ISO23081的定位和主要內(nèi)容
ISO23081是文件管理國際標準家族中的一員,它置身于相互配套的一系列文件管理國際標準中。該標準族由國際標準化組織信息與文獻委員會下的檔案/文件管理分技術委員會負責起草,以ISO15489《信息與文獻——文件管理》③為核心。ISO23081旨在引導機構(gòu)以合適的元數(shù)據(jù)管理支撐ISO15489的文件管理框架。
ISO23081本身也是配套標準,共包括四個部分。ISO23081-1闡明了文件管理中元數(shù)據(jù)管理的原則性、一般性問題,如元數(shù)據(jù)的視角和作用、元數(shù)據(jù)管理的角色和職責、文件管理元數(shù)據(jù)與其他領域中元數(shù)據(jù)之間的關系、元數(shù)據(jù)管理流程等,并明確了支持ISO15489的元數(shù)據(jù)類型。ISO23081-2則闡明了與元數(shù)據(jù)實施相關的概念、程序與方法問題。ISO23081-3《信息與文獻—文件管理流程—文件元數(shù)據(jù)—文件管理元數(shù)據(jù)集的評估》依據(jù)ISO15489和ISO23081-1對現(xiàn)有元數(shù)據(jù)集進行評價,ISO23081-4《信息與文獻—文件管理流程—文件元數(shù)據(jù)—實施核查表》為元數(shù)據(jù)實施工作提供一份核查清單,這兩個部分的標準正在制定過程中。
二、來自ISO23081的啟示
1、豐富了對元數(shù)據(jù)及其作用的認識
元數(shù)據(jù)是描述文件背景、內(nèi)容、結(jié)構(gòu)及其管理過程的數(shù)據(jù)。ISO23081從元數(shù)據(jù)的表達形式、用途、與文件之間的關系等方面進一步揭示元數(shù)據(jù)的含義。從表達形式來看,元數(shù)據(jù)是結(jié)構(gòu)化或半結(jié)構(gòu)化的信息;從用途看,元數(shù)據(jù)旨在確保文件跨時空的形成、管理及利用;從與文件的關系上來看,無論在物理上元數(shù)據(jù)和文件是否分開存儲,都應被當作是文件的一個組成部分。這些表述明確地表達了元數(shù)據(jù)與文件、元數(shù)據(jù)管理和文件管理唇齒相依的關系,比起我們既有的“元數(shù)據(jù)是文件管理的工具,元數(shù)據(jù)管理是文件管理的一項內(nèi)容”這樣一般性的認識,ISO23081無疑更進一步。
我國檔案界對元數(shù)據(jù)作用是這樣認識的:提供了對文件的全面描述,有助于保障文件的真實性、完整性、可讀性,支持文件信息的組織和查詢、支持文件的全程控制、支持文件管理流程的集成與優(yōu)化 ④。盡管表述的風格、角度、詳略程度不同,但是中外對于元數(shù)據(jù)作用的主要闡釋基本是一致的,不一致的地方在于:ISO23081未明確元數(shù)據(jù)對文件管理流程集成與優(yōu)化的支持作用,而它提出的元數(shù)據(jù)“便于對文件的理解”、“支持互操作性”這兩點作用則是中方相對忽視的。
(1)便于對文件的理解。我們對于元數(shù)據(jù)之于文件真實性的保障作用給予了足夠的重視,卻較少注意其對文件可理解性的貢獻。當文件脫離于原有業(yè)務環(huán)境時,有什么比保證其可理解性更急迫呢?元數(shù)據(jù)揭示了文件之間的關聯(lián),提供了文件生命周期的全景描述,可以讓我們看到文件及其記錄事件的來龍去脈。
(2)支持互操作性。互操作性是ISO23081反復強調(diào)的一個概念。所謂互操作性,是指兩個或多個自動化系統(tǒng)可以順利地互換信息,并且能夠識別、處理和利用信息。業(yè)務系統(tǒng)之間、文件管理系統(tǒng)與業(yè)務系統(tǒng)之間、新舊系統(tǒng)之間、跨機構(gòu)的系統(tǒng)之間均存在互操作的需求,標準化的元數(shù)據(jù)是保證系統(tǒng)互操作性的必要前提。目前,為解決互操作性問題,一般采用接口的方式。ISO23081指出,短期內(nèi)這種方式是可行的,但是隨著系統(tǒng)的變化升級其效用不能持久,且成本很高。相比而言,建立統(tǒng)一的元數(shù)據(jù)方案登記機制,在不同系統(tǒng)的元數(shù)據(jù)方案之間建立映射關系,并加以保存和維護,實現(xiàn)實時更新和動態(tài)化、自動化的翻譯,這種方式更為靈活,受系統(tǒng)升級的影響較小。
若將中外認識加以結(jié)合,我們對于元數(shù)據(jù)能干什么的解答會更為全面、細致。
2、擴展了多級著錄的范疇
多級著錄是《國際標準——檔案著錄規(guī)則(總則)》確立的檔案著錄工作的基本原則,它明確檔案著錄必須由總到分進行,即依次對全宗、大類、小類、案卷直至單份文件進行描述,且以等級結(jié)構(gòu)形式對不同級別的著錄結(jié)果加以連接。多級著錄是全宗原則在著錄領域的具體要求,是維系文件之間多級關系的手段。
我國《檔案著錄規(guī)則》(DA/T-1999)僅規(guī)定了案卷、文件兩個級別的著錄,且未對兩級著錄的關聯(lián)加以規(guī)定。當我們還在思考如何完善所有層次文件集合的著錄的時候,ISO23081擴展了多級著錄的范疇,將多級著錄進行得更為徹底。ISO23081指出元數(shù)據(jù)所描述的四類實體——文件、人員、業(yè)務、規(guī)范都具有多個層次,都需要予以著錄,其中文件實體涉及全宗、系列、案卷、文件等層級,人員實體包括機構(gòu)、部門、工作組、個人等層級,業(yè)務實體包括聯(lián)合職能、職能、活動、事務等層級,規(guī)范實體包括立法、政策、業(yè)務規(guī)則等層級??梢钥闯?,文件實體的多個層級乃多級著錄的既定范疇,人員、業(yè)務、規(guī)范實體的多個層級則為拓展范疇。借助于這樣廣泛的多級著錄,不僅展現(xiàn)文件之間的內(nèi)在聯(lián)系,還可以全面描繪出文件得以產(chǎn)生、管理和利用的機構(gòu)背景、業(yè)務背景和制度背景,切實履行了特里·庫克當年提出的檔案人員從“實體保管者”到“背景的知識提供者”的轉(zhuǎn)變 ⑤,也為元數(shù)據(jù)為何便于對文件的理解做了最好的說明。
3、有效實現(xiàn)了文件管理和業(yè)務管理的集成
(1)管理視角的集成。針對元數(shù)據(jù)可能存在多個共存的視角,包括業(yè)務視角、文件管理視角和文件利用視角。
(2)管理職責的集成。ISO23081一再申明:元數(shù)據(jù)管理是業(yè)務管理和文件管理職責的一部分,其職能分工是面向全員的。其中,一般員工保證其負責的元數(shù)據(jù)的準確和完整;文件管理專業(yè)人員負責確保元數(shù)據(jù)的真實、可靠和可用,參與元數(shù)據(jù)方案的制訂,制定相關的方針和戰(zhàn)略,監(jiān)督元數(shù)據(jù)的形成過程,并負責相關工作培訓;執(zhí)行主管負責實施內(nèi)部控制,提供行政支持;信息技術人員負責系統(tǒng)保障和技術支持;等等。
(3)元數(shù)據(jù)來源和用途的集成。除了文件管理之外,元數(shù)據(jù)還可能應用于電子業(yè)務、保管、資源描述、資源發(fā)現(xiàn)和權限管理等多個領域。這些領域中的元數(shù)據(jù)可以共享,某一項元數(shù)據(jù)可以同時具備多種用途,比如文件管理元數(shù)據(jù)可以直接來自電子業(yè)務系統(tǒng),可以借用資源描述元數(shù)據(jù),擴展后可以用于資源發(fā)現(xiàn)。
集成視角提醒我們不能為了管理文件而管理文件,為了管理元數(shù)據(jù)而管理元數(shù)據(jù),而要將元數(shù)據(jù)管理、文件管理納入到機構(gòu)整體業(yè)務建設中,并在其中發(fā)現(xiàn)根本動力,在現(xiàn)有政策、方法和工具中尋求支持。
4、明確了元數(shù)據(jù)管理的兩個層次
ISO23081指出元數(shù)據(jù)管理流程包括兩個層次:業(yè)務層,即形成、捕獲和管理元數(shù)據(jù);支撐層,即制定、實施、維護和管理元數(shù)據(jù)規(guī)則及元數(shù)據(jù)結(jié)構(gòu)。業(yè)務層是元數(shù)據(jù)管理的主體部分,支撐層則是其基礎部分。沒有詳盡合理的規(guī)則設計和結(jié)構(gòu)設計,元數(shù)據(jù)的形成、捕獲、利用、維護和監(jiān)控就沒有科學統(tǒng)一的依據(jù),元數(shù)據(jù)管理的成效也就無法得到保障。
相較而言,雖然我國檔案工作者同樣認為對元數(shù)據(jù)結(jié)構(gòu)應進行設計,對元數(shù)據(jù)管理應該進行規(guī)劃,應確定元數(shù)據(jù)管理的職責分工,不過并沒有這些內(nèi)容納入元數(shù)據(jù)管理中。將元數(shù)據(jù)管理區(qū)分為業(yè)務層和支撐層,有助于掌握與元數(shù)據(jù)管理直接相關的所有工作內(nèi)容及其相互聯(lián)系,特別是提醒我們在具體開展元數(shù)據(jù)管理業(yè)務之前,須一一明確其支撐性工作內(nèi)容:職責分配、應該形成并捕獲什么樣的元數(shù)據(jù)、何時以何種渠道獲得元數(shù)據(jù)、何種元數(shù)據(jù)結(jié)構(gòu)是有效的、應采用何種標準和何種支持系統(tǒng)等。
5、揭示了元數(shù)據(jù)標準應用的完整流程
元數(shù)據(jù)標準的制定一直是我們建設元數(shù)據(jù)標準的重點,ISO23081-2則將我們的視線從標準的制定導向了標準的應用,詳細闡述了在一個組織機構(gòu)的范圍內(nèi)設計、表達、登記、施元數(shù)據(jù)方案的完整過程和方法,具有較強的實踐指導價值。筆者將元數(shù)據(jù)方案理解為組織機構(gòu)實際應用的元數(shù)據(jù)標準。
(1)元數(shù)據(jù)方案的設計。除了要明確元數(shù)據(jù)元素之外,設計一份元數(shù)據(jù)方案,還要明確元數(shù)據(jù)元素之間的相互關系(即元數(shù)據(jù)結(jié)構(gòu)),明確元數(shù)據(jù)的著錄規(guī)則(如默認值、約束性、可重復性、相關性、著錄方式、著錄條件等)和編碼體系;如果采取XML將元數(shù)據(jù)和文件予以封裝,以此來實現(xiàn)兩者的關聯(lián),還要明確XML封裝格式。若要采納其他領域元數(shù)據(jù)方案,要對其元數(shù)據(jù)元素的語義、著錄規(guī)則、編碼體系進行詳細檢查,以滿足文件管理的要求。
(2)元數(shù)據(jù)方案的表達。在電子環(huán)境中,元數(shù)據(jù)方案需要納入文件管理軟件,在系統(tǒng)中實現(xiàn)。ISO23081指出,可供人理解的元數(shù)據(jù)方案的需求和建立機器可操作的格式要求是不同的,若采用XML來表達元數(shù)據(jù)方案,需要特別注意確認其返回結(jié)果的準確性、處理多級元數(shù)據(jù)及其相互關系、保證每個元數(shù)據(jù)元素的功能,并識別和管理元素之間的依賴性。
(3)元數(shù)據(jù)方案的登記。為了讓各系統(tǒng)能夠?qū)υ獢?shù)據(jù)方案有充分的理解,滿足跨機構(gòu)、跨時間、跨系統(tǒng)的互操作性要求,應將文件管理元數(shù)據(jù)方案同其他元數(shù)據(jù)方案一起納入到組織機構(gòu)的元數(shù)據(jù)登記機制中,提供對元數(shù)據(jù)方案及其規(guī)定的元數(shù)據(jù)元素的詳細說明,并予以維護與更新。
(4)元數(shù)據(jù)方案的實施。ISO23081對于這個部分的規(guī)定非常細致,除了明確元數(shù)據(jù)的捕獲、存儲、長期管理等常規(guī)性業(yè)務方法之外,還特別提到在文件鑒定、轉(zhuǎn)存、遷移等操作中元數(shù)據(jù)的處理方式,為元數(shù)據(jù)管理注入了新內(nèi)容。以鑒定為例,鑒定時不僅要決定需要保存哪些文件,還需要決定必須捕獲哪些元數(shù)據(jù),這些元數(shù)據(jù)需要保存多久;銷毀文件時,需要決定元數(shù)據(jù)需要銷毀還是單獨保存下來,以作為文件曾經(jīng)存在的證明。
三、ISO23081帶來的困惑
1、術語差別問題
多年以來,很多學者在不同場合中都提到:國內(nèi)外關于文件、檔案的術語不一致。隨著中外學術交流得頻繁,我們越來越多地借鑒應用國外的文件、檔案管理理論和方法,但是術語差別并沒有得到應有的重視??傮w而言,我國的文件、檔案概念均大于文件管理國際標準中的概念。在我國,文件是指業(yè)務活動的直接記錄,而ISO15489中文件則是指被保存的記錄,大致對應于我國“立檔單位的檔案”的概念,但涵蓋了歸檔前的文件生命階段;而西方英語國家的檔案多指具有永久保存價值的,通常在檔案館保存的,且具有一定文化、歷史價值的那部分文件。如ISO23081將元數(shù)據(jù)管理劃分為文件捕獲和文件捕獲之后這兩個階段,若用我國現(xiàn)有術語來解釋,則為文件歸檔和檔案管理這兩個階段。面對這樣的術語差別,我們有如下兩條路可以走,每條路都有自己的問題。
(1)明晰化處理。即用我國現(xiàn)有術語體系來翻譯、解釋文件管理國際標準,用機構(gòu)檔案替換文件的概念。這種處理易于理解,易于中外管理方法的比較和改進,但是由于檔案在我國不是一個覆蓋文件整個生命周期的概念,所以無益于我國文件管理前端控制、全程控制難度大這個缺陷的彌補,甚至有可能會固化分段管理的模式。
(2)模糊化處理。維持現(xiàn)有的翻譯,這種做法有助于打破現(xiàn)有管理體制的限制,有助于文件全程管理的展開,有助于記錄保存工作的社會認同;但不易在中外管理方法之間進行關聯(lián),也可能造成文件管理國際標準主要面向文件管理,檔案部門難以借鑒和實施的印象,還可能因為國內(nèi)對于文件的理解過寬而削弱其管理的專業(yè)性。
2、文件管理方法體系的差別問題
《檔案學通訊》論壇上的一則帖子“元數(shù)據(jù)能夠證明電子文件的真實性嗎”,吸引了逾4000的點擊量 ⑥ ,不少跟帖者或多或少地表達著這樣的懷疑:元數(shù)據(jù)的作用真有那么大嗎?元數(shù)據(jù)是否被萬能化了?這種懷疑是有道理的。元數(shù)據(jù)產(chǎn)生和應用于其他各項文件管理活動,如果它能夠發(fā)揮預期作用,就必然要求其他各項文件管理活動都合乎預期規(guī)范。換句話說,元數(shù)據(jù)管理的成效決定于各項文件管理活動的整體成效,一環(huán)滯后,便可能產(chǎn)生連鎖反應。因此,如果要應用ISO23081,就必須對各項文件管理活動都進行檢視,看看是否具備實施標準的條件。
當我們嘗試著開展這項檢視工作時,便發(fā)現(xiàn)了重要的中外差別,包括文件管理職責分工,文件管理法規(guī)要求,文件分類、鑒定、歸檔方法等多個方面。在此僅以文件分類為例,目前我們主要將分類定位為一項便于檢索的工作,而在關鍵詞檢索盛行的信息時代,檢索越來越少地依賴于分類體系,大量機構(gòu)因而簡化文件分類。而文件管理國際標準則將文件分類視為全程管理的工具,統(tǒng)一實施職能分類法、職能鑒定法以及相應的文件控制,即按照文件反映職能的類別區(qū)分文件類別,一旦文件類別得以確定,即文件類別的元數(shù)據(jù)得以形成,便可以按照職能重要性自動化、批量化地判斷文件價值的大小,隨即自動歸檔文件,并實施對重要文件的監(jiān)控、存儲、維護。因此,分類是構(gòu)建文件管理方法體系的基礎,在該方法體系中,職能分析是貫穿文件管理全過程的主線?;诼毮芊治龅奈募芾矸椒w系有其深刻的理論根源——新來源觀,新來源觀主張文件來源的本質(zhì)并非文件形成機構(gòu),而是形成文件的職能活動。20世紀90年代以來,加拿大、英國、澳大利亞等國陸續(xù)制定了多個基于職能的分類方案指導實踐。⑦
相比而言,我國的文件分類、鑒定、歸檔、存儲和維護等更多從經(jīng)驗出發(fā),相對分散,欠缺理論的嚴密性和方法的一致性,尚未有意識地應用職能分析構(gòu)建文件管理方法體系。ISO23081所代表的精細化、專業(yè)化的管理體系和我國實踐領域中簡單務實甚至粗放的方法取向之間有相當?shù)牟罹?,存在著巨大的管理文化差異。如果要?gòu)建基于職能分析的文件管理方法體系,文件鑒定方法、保管期限表、文件分類方法、分類方案都需要重新建構(gòu),從何開始才可行?新舊工作如何銜接?如果不應用職能分析的方法,我們是否還有更好的選擇?
3、元數(shù)據(jù)概念模型的應用問題
ISO23081明確的元數(shù)據(jù)概念模型是整個標準中最為醒目的一部分。該模型揭示了元數(shù)據(jù)描述的文件、人員、業(yè)務和法規(guī)要求這四類實體及其相互關系,形成了一個邏輯嚴密的概念體系,如下圖所示。上文中提到的廣泛的多級著錄即以此模型為基礎。我國制定的《電子文件元數(shù)據(jù)標準》、《電子文件管理細則 第一部分 文書電子文件元數(shù)據(jù)方案》這兩個標準征求意見稿都采用了該模型。筆者一方面感受到了其邏輯上的嚴謹性,也對其實施產(chǎn)生諸多困惑,包括:
(1)法規(guī)要求實體的實施問題。我國兩個元數(shù)據(jù)標準征求意見稿都將法規(guī)要求實體排除在外,這樣也排除了文件管理國際標準最重要的實施根基——法制根基。根據(jù)ISO15489的規(guī)定,文件是機構(gòu)履行法定義務的記錄成果,文件真實性的本質(zhì)內(nèi)涵是指文件產(chǎn)生與既定法規(guī)要求相符,整個文件管理標準家族都是以文件法制化管理為契機出臺的。的確,我國的檔案著錄工作沒有描述形成、保管文件的法規(guī)要求的傳統(tǒng),相關法規(guī)要求不多,也不配套,社會整體法制環(huán)境還不完善,但是文件的法治化形成、保管是不是發(fā)展方向呢?我們是要兼顧現(xiàn)實暫時屏蔽,還是應該抓住方向先行推進?
(2)文件實體元數(shù)據(jù)的設置問題。ISO23081中,四大實體四足鼎立。而已經(jīng)出臺的一些國家的元數(shù)據(jù)標準則多以文件實體為中心,將人員、業(yè)務、法規(guī)要求實體元數(shù)據(jù)納入背景類或管理過程類元數(shù)據(jù),最具代表性的便是采納了戴維·比爾曼“可為業(yè)務活動接受的通信的元數(shù)據(jù)參照模式”⑧的《澳大利亞聯(lián)邦機關文件保管元數(shù)據(jù)標準》,該模型將元數(shù)據(jù)劃分為登記、期限和條件、結(jié)構(gòu)、背景、內(nèi)容、利用史六類,和“元數(shù)據(jù)是描述文件內(nèi)容、結(jié)構(gòu)、背景、管理過程的數(shù)據(jù)”這樣的認識關系密切,故而容易理解和接受。如果直接采用ISO23081的概念模型,將導致文件實體元數(shù)據(jù)的包容面過大而類別模糊。我國《電子文件元數(shù)據(jù)標準》征求意見稿中文件實體元數(shù)據(jù)元素有46個,業(yè)務和人員實體元數(shù)據(jù)元素一共49個;而《電子文件管理細則 第一部分 文書電子文件元數(shù)據(jù)方案》征求意見稿中的文件實體元數(shù)據(jù)元素達到90個,業(yè)務和人員實體元數(shù)據(jù)元素共18個。顯然,ISO23081也認識到了這個問題,進一步將文件實體元數(shù)據(jù)劃分為標識、描述、利用、事件計劃、事件歷史、關聯(lián)六個類別。但是這種劃分又自成一個概念體系,和既有認識有一定距離。我們花了很長的時間才逐漸接受“元數(shù)據(jù)是描述文件內(nèi)容、結(jié)構(gòu)、背景、管理過程的數(shù)據(jù)”,在這個認識還不牢固的時候,又要重新構(gòu)建新的概念體系,而且這個概念體系尚未經(jīng)受實踐的檢驗,可行性如何?
4、科學研究的推進問題
啟示和困惑交織在一起,提醒我們電子文件管理空間無限,任重道遠。
注 釋:
1、ISO 23081-1:2006 Information and documentation -- Records management processes -- Metadata for records -- Part 1: Principles,其最終版本的譯文由安小米和焦紅艷翻譯,由《浙江檔案》2006年第11、12期,2007年第1期連載。
2、ISO/TS 23081-2:2007 Information and documentation - Records management processes - Metadata for records - Part 2: Conceptual and implementation issues,其中主要篇幅的譯文由趙建平翻譯,請參見安小米.基于ISO15489的文件檔案管理核心標準及相關規(guī)范.北京:中國標準出版社,2008.2:110-139
3、安小米、焦紅燕譯:《文件管理國際標準ISO15489》,《城建檔案》2002年第2期、第3期。
4、馮惠玲:《政府電子文件管理》,北京:中國人民大學出版社,2004年版。
5、[加]特里·庫克:《電子文件與紙質(zhì)文件觀念:后保管及后現(xiàn)代主義社會里信息與檔案管理中面臨的一場革命》,《山西檔案》1997年第2期。
6、馬刺王朝:《電子文件能夠證明電子文件的真實性嗎?》,http://www.daxtx.cn/bbs/frame.php?frameon=yes&referer=http%3A//www.daxtx.cn/bbs/,發(fā)布于2008-04-15,訪問于2008-07-02。
7、朱葉吉:《信息資源管理視角下的文件分類體系研究》,中國人民大學信息資源管理學院碩士學位論文,2008.5:9-17。
8、[美]戴維·比爾曼:《虛擬檔案》,《第十三屆國際檔案大會報告集》,北京:第十三屆國際檔案大會組委會學術規(guī)劃部編印,1996年。
作者單位:中國人民大學信息資源管理學院