文 / 趙紅霞
在信息時代,檔案信息資源的數(shù)量日益增加。在整合檔案信息資源的過程中,越來越多的傳統(tǒng)檔案館意識到跨資源平臺建設以及深度挖掘的重要性??缙脚_和跨類別的檔案信息資源整合有利于將分散的檔案信息資源進行有效的管理,提高資源利用效率,完善檔案信息資源配置[1]。用戶對檔案信息資源進行搜索,往往不滿足于單一的檔案數(shù)據(jù)資源,還追求數(shù)據(jù)質(zhì)量以及服務體驗?;ゲ僮鲄f(xié)定下,可以實現(xiàn)信息資源系統(tǒng)之間的數(shù)據(jù)交換和轉換,是一種有效提升資源整合效率的方式。如何實現(xiàn)互操作與檔案信息資源整合的完美融合,是現(xiàn)代檔案館發(fā)展中面臨的挑戰(zhàn)。
檔案信息資源的種類有很多,數(shù)據(jù)資源規(guī)模比較龐大。在計算機出現(xiàn)以前,檔案信息的分類整理主要以人工方式進行,效果并不理想。在信息學領域,檔案信息資源整合被表述為“互操作”?,F(xiàn)有的互操作協(xié)議有很多種,包括OAI-Dienst協(xié)議、DLIOP、STARTS、SDLIP、OAI協(xié)議以及OpenURL等[2]。
較早用在檔案館中的互操作協(xié)議是ANSI/NISO Z39.50協(xié)議。它解決了不同檔案系統(tǒng)之間的數(shù)據(jù)交流和數(shù)據(jù)庫異構問題,擴大了檔案檢索范圍。此后,Eliot Christian提出采用XML的編碼方式,對Z39.50進行了編碼規(guī)范,實現(xiàn)了檔案系統(tǒng)間的多源數(shù)據(jù)檢索和擴領域搜索。
1990年代以來,美國一些大學針對檔案資源的“隱藏”文檔進行了研究,并推出了STARTS和SDLIP等互操作協(xié)議。STARTS和SDLIP協(xié)議可以支持用戶的分布式搜索,實現(xiàn)檔案數(shù)據(jù)系統(tǒng)以及分布式檔案機構之間的服務通信。隨后,OAI協(xié)議以及OpenURL等互操作協(xié)議逐步加入到了檔案信息資源整合中。挪威檔案數(shù)字館利用OAI互操作協(xié)議實現(xiàn)了用戶對檔案目錄的搜索訪問,使得OAI協(xié)議成為了檔案信息資源整合過程中比較常用的互操作協(xié)議之一。
在大數(shù)據(jù)時代,圖片、音頻以及影像等檔案資源庫的建設,豐富了檔案信息資源的類別。然而,在檔案信息增多的同時,資源的信息化程度卻不高,給檔案信息資源整合的互操作帶來了負面的影響。
互操作以互聯(lián)網(wǎng)信息技術為基礎,通過對同類資源或者同型資源進行數(shù)據(jù)交換和轉換,實現(xiàn)檔案信息資源的有效整合。我國檔案信息化發(fā)展的時間并不長,很多檔案信息資源未能實現(xiàn)信息化,比如一些歷史文件、訪談資料以及案例紀要等,阻礙了檔案信息資源整合中的互操作進程[3]。
檔案資源的信息化是檔案信息資源整合的前提。在互操作過程中,可以通過對檔案信息進行交換或轉換,來實現(xiàn)檔案信息資源整合的目標。它以信息化的資源載體形式為基礎,如果資源的信息化程度不高,會給整個互操作過程帶來阻礙,甚至導致檔案信息資源整合失效。
構建檔案信息資源系統(tǒng)時,會設置多個子系統(tǒng),以此實現(xiàn)不同類別檔案信息的查找、讀取和保存等。檔案系統(tǒng)和子系統(tǒng)中,元數(shù)據(jù)結構以及系統(tǒng)語義結構相互之間存在很大的差別,限制了檔案信息整合過程中的互操作。
除了元數(shù)據(jù)結構和系統(tǒng)語義結構,系統(tǒng)語言編程、數(shù)據(jù)庫系統(tǒng)、應用軟件、數(shù)據(jù)格式等因素的差異,也會限制檔案信息資源整合的異構系統(tǒng)互操作。圖片檔案信息系統(tǒng)以及文字檔案信息系統(tǒng)之間的互操作,由于系統(tǒng)屬性存在很大差別,文字檔案和圖片檔案間的互操作轉化存在很大的困難。
異構系統(tǒng)的互操作需要跨越多個不同系統(tǒng),實現(xiàn)跨資源類型的檔案信息整合。目前,還沒有研發(fā)出可以兼容各種計算機編程語言的檔案信息資源系統(tǒng)。由于技術條件的限制,跨系統(tǒng)和跨資源類型的互操作很難取得良好的成效,也造成檔案信息資源整合的質(zhì)量和效果不佳。
檔案信息資源整合在互操作協(xié)議下,可以實現(xiàn)資源系統(tǒng)間的文件交換和轉換。在進行檔案信息互操作之前,需要獲得系統(tǒng)的權限認可,由于互操作系統(tǒng)的智能識別不足,檔案搭建平臺、數(shù)據(jù)庫系統(tǒng)等不能準確地給予相關文件訪問、閱讀權限,使得檔案信息整合的過程受到了影響,甚至不能進行檔案信息的交換或轉換。
檔案信息資源整合的過程涉及到多個檔案信息系統(tǒng)或子系統(tǒng),不同系統(tǒng)間的檔案信息閱讀、訪問權限互不相同。在互操作協(xié)議下,實現(xiàn)檔案信息整合的目標必須打破權限帶來的限制。由于互操作系統(tǒng)智能識別的障礙,系統(tǒng)往往會將互操作行為認定為非法入侵,導致檔案信息整合的失敗。
互操作系統(tǒng)智能識別不足不僅表現(xiàn)在身份識別上,而且包括資源內(nèi)容、數(shù)量大小等方面的識別處理上,容易導致操作人員訪問權限過大,在進行頻繁、大量的數(shù)據(jù)轉換訪問后容易造成檔案信息資源的受損甚至破壞,給檔案信息資源庫帶來不利的影響。
在網(wǎng)絡時代,人們可以通過網(wǎng)絡實現(xiàn)信息資源的交流和共享,但也帶來了安全隱患。檔案信息系統(tǒng)處在一個開放的網(wǎng)絡環(huán)境中,在對檔案信息進行整合時,涉及到大量的數(shù)據(jù)信息的處理,網(wǎng)絡病毒、惡意軟件以及系統(tǒng)安全漏洞等因素的存在,給檔案信息資源整合帶來了很大的安全隱患[4]。
檔案信息資源整合的互操作涉及到信息的轉換和交換,但是目前檔案機構沒有做好文件安全防范的相關工作,給檔案信息資源帶來了安全上的風險。此前出現(xiàn)的企業(yè)檔案信息泄露、保險檔案信息泄露等,給人們帶來了很大的負面影響。
互操作協(xié)議下,對檔案信息訪問、處理以及轉換更加頻繁,且涉及到系統(tǒng)訪問權限的開放,使得檔案信息整合過程更加容易遭受安全威脅。在文件安全防護上,現(xiàn)在比較常見的是防火墻技術、加密與認證技術、網(wǎng)絡入侵檢測以及網(wǎng)絡安全漏洞的掃描。這些手段可以進行常規(guī)的網(wǎng)絡安全防護,對于一些高級病毒等就很難進行有效的識別處理,給檔案信息整合帶來安全隱患。
檔案資源的全面信息化是檔案信息資源整合的必要前提。通過建立圖片、文字、音頻以及影像等不同類型的檔案信息資源庫,將檔案資源以數(shù)字化的形式上傳到檔案信息資源系統(tǒng)中來提高檔案資源的信息化。
實現(xiàn)檔案全面信息化,可以通過加強電子檔案的建設來實現(xiàn)。目前,電子檔案的普及程度還不高,主要是由于電子檔案系統(tǒng)的不完善使得電子檔案的安全防護難以得到保證。不少檔案機構在進行檔案建設時,多采用紙質(zhì)形式來進行檔案信息建設,以加強信息安全,這也降低了檔案信息的信息化程度。通過轉變檔案機構相關人員的理念,在紙質(zhì)檔案的基礎上加強電子檔案的建設,是實現(xiàn)檔案全面信息化重要的一步。
檔案信息資源存在不同的系統(tǒng),運營各個資源系統(tǒng)的編程語言、數(shù)據(jù)庫、操作協(xié)議等都存在很大的差別,給網(wǎng)絡檔案資源整合的互操作帶來了很多異構系統(tǒng)產(chǎn)生的限制。構建異構系統(tǒng)的互操作體系,將各個資源系統(tǒng)進行聯(lián)合,通過體系化的資源系統(tǒng)建設,打破各個系統(tǒng)內(nèi)資源數(shù)據(jù)訪問的限制,可以更好地在互操作協(xié)議下進行檔案信息資源整合。
構建異構系統(tǒng)互操作體系需要解決系統(tǒng)中存在的元數(shù)據(jù)結構、系統(tǒng)語義結構以及數(shù)據(jù)庫結構上存在的差異問題。在這個構建過程中,需要建立一個可以對各種編程語言環(huán)境都進行兼容的檔案信息資源系統(tǒng),實現(xiàn)異構系統(tǒng)間的語義轉換,從而促成檔案信息資源整合過程中數(shù)據(jù)信息交換或轉換的實現(xiàn)。構建異構系統(tǒng)互操作體系需要搭建一個基于異構系統(tǒng)互操作體系的訪問協(xié)議,打破過去由異構系統(tǒng)間的差異帶來的數(shù)據(jù)訪問和轉換限制,這個協(xié)議可以看做是異構系統(tǒng)互操作體系內(nèi)的“通行證”。它不僅使檔案信息資源整合過程中文件安全能夠得到有效保障,而且能促進整合效率和質(zhì)量的提高。構建異構系統(tǒng)互操作體系需要搭建具備規(guī)范、統(tǒng)一標準的異構系統(tǒng)互操作檔案信息資源平臺,這樣可以達成各個檔案信息資源系統(tǒng)間的“默契”,優(yōu)先給體系內(nèi)的成員開辟數(shù)據(jù)信息訪問權限,提高檔案信息資源整合過程中的效率。
互操作系統(tǒng)的智能識別關系到檔案信息資源整合的質(zhì)量和效率。在當前的互操作系統(tǒng)中,由于數(shù)據(jù)庫系統(tǒng)、語言環(huán)境以及語義結構等方面存在的一些技術障礙,導致互操作系統(tǒng)智能識別能力的不足。
提高互操作系統(tǒng)智能識別,首先需要加強對不同檔案信息資源之間的識別。以圖片檔案信息和文字檔案信息為例,兩者的文件內(nèi)容形式不同,導致檔案信息存儲方法存在很大的差別。圖片檔案信息需要互操作系統(tǒng)對圖片內(nèi)容進行掃描轉化,以特殊的語義翻譯工具將其翻譯成文字檔案信息,再在文字檔案信息資源系統(tǒng)中進行相應的匹配,從而實現(xiàn)檔案信息資源整合過程中的數(shù)據(jù)信息交換和轉換。這個過程中,互操作系統(tǒng)涉及到跨資源類型的識別,如果系統(tǒng)的跨資源智能識別能力不足,就會導致整合檔案信息資源整合過程的互操作失效。
提高互操作系統(tǒng)的智能識別還需要加強系統(tǒng)的數(shù)據(jù)識別的兼容性。兩個檔案信息資源系統(tǒng)的構建可能會采取不一樣的編程語言,對系統(tǒng)的定義也會產(chǎn)生很大的分歧。在兩個檔案信息資源系統(tǒng)之間的資源整合過程中,文件內(nèi)容的編碼等存在很大的不同,需要提高互操作系統(tǒng)的智能識別兼容性,更好地對各個系統(tǒng)的編碼進行準確的讀出,實現(xiàn)檔案信息資源整合目標。
檔案信息安全問題是檔案信息資源整合過程中涉及到的一個重大的問題。如果檔案信息遭到病毒的入侵,不僅會造成檔案信息資源的損壞,而且可能導致檔案信息的泄露,造成個人隱私受到侵害,甚至泄露國家機密。加強互操作下檔案信息資源整合的安全防護需要兼顧檔案信息資源的內(nèi)部安全和外部安全。
強化檔案信息資源的內(nèi)部安全,首先要加強檔案信息資源的安全防護,通過改進文件加密技術對文件進行保護。文件加密技術可以有效地防止非相關人員的文件訪問,防止文件信息的泄露。此外,還需要加強檔案信息資源系統(tǒng)的建設,以更加高級的編程語言以及語言邏輯搭建系統(tǒng),讓一些非法人員找不到系統(tǒng)的漏洞,從而提高內(nèi)部檔案信息資源的保護。
強化檔案信息資源的外部安全,可以利用防火墻技術對檔案信息資源進行安全保護。防火墻技術能夠?qū)W(wǎng)絡環(huán)境中的一些危險因素如病毒、惡意軟件等進行識別,將其擋在防火墻之外,通過杜絕與危險因素的接觸來保障檔案信息資源的安全。檔案信息資源的整合會產(chǎn)生大量的數(shù)據(jù)讀取、訪問,在這個過程中需要對訪問人員的身份進行準確的識別,掃描出一些借助“身份”的非法訪問行為,保障檔案信息資源的安全。強化檔案信息資源的外部安全還可以通過設立異常情況預警系統(tǒng)來加強檔案信息資源整合過程的安全防護,當系統(tǒng)對一些危險因素進行識別后,系統(tǒng)會產(chǎn)生異常,通過預警系統(tǒng)可以做出一些預先的防護措施,保障檔案信息資源整合的安全。