国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

電子檔案封裝策略選擇

2021-02-23 05:17:40張學(xué)干焦同生
山東檔案 2021年6期
關(guān)鍵詞:格式文件文檔內(nèi)容

文·張學(xué)干 焦同生

電子檔案封裝是將電子檔案和元數(shù)據(jù)按指定結(jié)構(gòu)打包的過程,自從20世紀(jì)90年代澳大利亞州公共文件局提出用數(shù)據(jù)(即電子檔案和元數(shù)據(jù)的封裝包)的方式來實(shí)現(xiàn)電子文件的長期保存以來,封裝在電子文件和電子檔案領(lǐng)域備受關(guān)注。近年來,隨著電子文件“單套制”歸檔和電子檔案“單套制”管理的逐步推開,按照規(guī)范格式封裝的電子文件、電子檔案封裝包被廣泛應(yīng)用于跨部門、跨系統(tǒng)之間的數(shù)據(jù)交換、整理歸檔和移交接收等工作中。

一、電子檔案封裝包的種類

封裝包通過將電子檔案內(nèi)容和元數(shù)據(jù)按照規(guī)范結(jié)構(gòu)封裝在一個(gè)信息包里或者在電子檔案內(nèi)容里嵌入元數(shù)據(jù)信息的方式,用于維護(hù)電子檔案與其元數(shù)據(jù)的可靠聯(lián)系,實(shí)現(xiàn)電子檔案的自包含、自描述、自證明,確保電子檔案的真實(shí)性、完整性和有效性。目前,國內(nèi)采用的封裝包主要有三種,一是2009年批準(zhǔn)發(fā)布的檔案行業(yè)標(biāo)準(zhǔn)《基于XML的電子文件封裝規(guī)范》規(guī)定的基于XML封裝的EEP封裝包;二是國家檔案局2012年印發(fā)的《電子檔案移交和接收辦法》規(guī)定的電子文件包;三是2020年批準(zhǔn)發(fā)布的國家標(biāo)準(zhǔn)《黨政機(jī)關(guān)電子公文歸檔規(guī)范》提出的OFD格式文件。前兩個(gè)采用信息包封裝的方式,第三個(gè)采用元數(shù)據(jù)嵌入電子檔案內(nèi)容里的方式形成封裝包。

二、封裝方法優(yōu)缺點(diǎn)比較

上述介紹的三類封裝包雖然都是基于XML語言進(jìn)行封裝,元數(shù)據(jù)為XML格式,但是封裝包內(nèi)電子檔案的數(shù)據(jù)內(nèi)容和元數(shù)據(jù)在組織結(jié)構(gòu)、內(nèi)容呈現(xiàn)等方面存在著諸多差異,各有優(yōu)缺點(diǎn)。

(一)組織結(jié)構(gòu)比較

EEP封裝包基于OAIS參考模型中的AIP(檔案信息包)模型,可以被視作一個(gè)“洋蔥型”結(jié)構(gòu)(如圖1所示)。

圖1:EEP封裝包樹形結(jié)構(gòu)

一個(gè)封裝包邏輯上被分為三層,核心是電子檔案內(nèi)容,其以Base64編碼的方式,嵌入到XML文件中;中間層是與電子檔案相關(guān)的元數(shù)據(jù);最外層是封裝的描述信息即封裝包元數(shù)據(jù)。EEP封裝包中包含文件、文件處理單、元數(shù)據(jù)、電子簽名、封裝描述信息等,一個(gè)封裝包中可以封裝多個(gè)文檔(如正文與附件),一個(gè)文檔可以包含多個(gè)版本(如正本、定稿、草稿),文檔的同一版本還可以包含不同格式的計(jì)算機(jī)文件(如PDF格式和DOC格式),并且還有電子簽名驗(yàn)證功能,既滿足了電子檔案封裝的需求,同時(shí)可以保障電子檔案的真實(shí)可靠性。EEP封裝包支持對電子檔案數(shù)據(jù)或其元數(shù)據(jù)封裝后的再修改,如果對原始封裝包進(jìn)行修改,每修改一次會(huì)在原封裝包的基礎(chǔ)上增加封裝一個(gè)修訂層,修訂層包含全部電子文件元數(shù)據(jù)、被修改的電子檔案數(shù)據(jù)和修訂封裝包元數(shù)據(jù)。但是經(jīng)過多次修改后,“洋蔥型”的層數(shù)會(huì)越來越多,既造成元數(shù)據(jù)的大量冗余,也給計(jì)算機(jī)系統(tǒng)的解析、識(shí)讀增加負(fù)擔(dān)。另外,電子檔案內(nèi)容采用Base64編碼時(shí),對文件大小有限制要求,封裝的文件一般在5兆以內(nèi),因?yàn)檩^大的電子檔案占用的封裝時(shí)間相對較長,而且在網(wǎng)絡(luò)環(huán)境下,可能還會(huì)因?yàn)榫W(wǎng)絡(luò)帶寬限制造成更大延時(shí),而導(dǎo)致封裝失敗。同時(shí),編碼后,文件大小會(huì)增大1/3,也會(huì)對數(shù)據(jù)的存儲(chǔ)帶來一定壓力。

電子文件包是將電子文件和元數(shù)據(jù)分別保存為格式文件,然后將這些文件按照一定關(guān)系組織在一起,形成一個(gè)“包”形式的文件組合,存儲(chǔ)結(jié)構(gòu)采用層級(jí)的文件夾結(jié)構(gòu)(如圖2所示)。

圖2:電子文件包存儲(chǔ)結(jié)構(gòu)

電子文件夾層次結(jié)構(gòu)一般按照檔案整理和分類方法來設(shè)置,例如年度—保管期限—機(jī)構(gòu)(問題)—文件,最底層文件夾一般以檔號(hào)來命名,用于存放一份電子檔案的內(nèi)容和元數(shù)據(jù)。電子文件包內(nèi)的電子檔案元數(shù)據(jù)一般包括電子檔案的基本信息、流程信息、電子文件屬性信息等,并通過XML語言封裝,電子檔案內(nèi)容數(shù)據(jù)放在文件夾內(nèi)依次排列。電子文件包的結(jié)構(gòu)層級(jí)清晰,數(shù)據(jù)包實(shí)現(xiàn)技術(shù)比較簡單,電子檔案內(nèi)容不進(jìn)行編碼,可以有效降低封裝時(shí)間和電子檔案內(nèi)容的打開瀏覽時(shí)間,但由于電子檔案和元數(shù)據(jù)分體式保存,給管理上也帶來一定難度,而且存在電子檔案被非法修改的風(fēng)險(xiǎn)。一般情況下,在電子檔案移交時(shí),為了便于傳輸、管理和保存,電子文件包以ZIP壓縮包的方式進(jìn)行打包,并通過電子簽名、數(shù)字摘要、時(shí)間戳等方式對ZIP壓縮包進(jìn)行固化。

OFD格式文件基于XML技術(shù)來描述文檔數(shù)據(jù),格式開放,利于理解,長期可讀可用,是我國自主研發(fā)制定的適合我國電子文件長期存儲(chǔ)和交換的自主可控版式文件格式標(biāo)準(zhǔn)??梢宰鳛殡娮訖n案的長期保存格式,用于電子文件的格式轉(zhuǎn)換,在電子文件歸檔時(shí)將各種主流格式的文件統(tǒng)一轉(zhuǎn)換為OFD格式,或者將不符合國家標(biāo)準(zhǔn)的、格式即將被淘汰的等進(jìn)行統(tǒng)一轉(zhuǎn)化,例如將PDF格式轉(zhuǎn)換為OFD格式。 OFD格式采用ZIP壓縮打包,可有效支持電子檔案信息包的封裝,用于電子檔案的存儲(chǔ)和交換(如圖3所示)。

圖3:OFD格式文件存儲(chǔ)結(jié)構(gòu)

把一份電子檔案包含的正本、文件處理單、定稿、歷次修改稿以及電子檔案的元數(shù)據(jù)和呈現(xiàn)形式封裝成一個(gè)文件,形式層用于保持文件的原始性,在瀏覽、利用時(shí)顯示,內(nèi)容層通過OCR等方式實(shí)現(xiàn)電子檔案的全文檢索,元數(shù)據(jù)以XML語言嵌入到OFD格式文件中,既可以用于檢索,也可使OFD格式文件作為完整電子檔案格式不依賴于文件系統(tǒng)、數(shù)據(jù)庫等運(yùn)行環(huán)境獨(dú)立存在。OFD格式文件把構(gòu)成一份電子檔案的所有內(nèi)容數(shù)據(jù)及元數(shù)據(jù)都物理聚合在一起,還可以根據(jù)電子檔案管理的需求補(bǔ)充擴(kuò)展相關(guān)元數(shù)據(jù),且支持?jǐn)?shù)字簽名技術(shù),一定程度上保證了電子檔案的完整性和真實(shí)性,適用于電子檔案的長期保存。

(二)內(nèi)容呈現(xiàn)比較

EEP封裝包把一份電子檔案的內(nèi)容和元數(shù)據(jù)封裝在一起,打開一個(gè)封裝包就可以瀏覽該電子檔案從“出生”以來的管理全過程和電子檔案的全部內(nèi)容,但由于電子檔案內(nèi)容進(jìn)行了Base64編碼,不通過解析工具無法直接查看電子檔案內(nèi)容,需要使用符合標(biāo)準(zhǔn)要求的封裝包瀏覽器,才能查看封裝包元數(shù)據(jù)、瀏覽電子檔案內(nèi)容。

電子文件包不需要專用的文件解析工具就可以方便打開電子檔案內(nèi)容,但由于電子文件歸檔時(shí)采用不同的格式,如PDF、DOC、JPG、WAV、MPG等,需要在電子檔案管理系統(tǒng)中安裝各種的瀏覽插件或工具。而且由于元數(shù)據(jù)和電子檔案內(nèi)容分類保存,查看某一份電子檔案和元數(shù)據(jù)時(shí)需要分別打開不同的XML文件和內(nèi)容,比EEP封裝包要復(fù)雜。

OFD文件采用“容器+文檔”的方式描述和存儲(chǔ)電子檔案,是一種開放式的版式文檔格式,獨(dú)立于軟硬件、操作系統(tǒng)和輸出設(shè)備,其版面固定、不跑版、所見即所得,可以被視為計(jì)算機(jī)時(shí)代的“數(shù)字紙張”。其采用“層次文本+壓縮打包”的技術(shù)機(jī)制,比同樣內(nèi)容的DOC、PDF等格式文件體積更小,在線閱讀時(shí)文件加載、打開速度快,適應(yīng)電子檔案長期保存的需求,保證了電子檔案的長期可讀、可解析、可理解。

三、封裝策略的選擇

EEP封裝包作為國內(nèi)推廣使用較早的一款封裝包,是在《文書類電子文件元數(shù)據(jù)方案》的基礎(chǔ)上進(jìn)行改造而來的,一定程度上推動(dòng)了電子檔案封裝技術(shù)的進(jìn)步,但是其封裝復(fù)雜,且每對封裝包做一次修改,都要增加一個(gè)修訂層,會(huì)產(chǎn)生大量冗余的元數(shù)據(jù),尤其是對電子檔案內(nèi)容進(jìn)行Base64編碼后,需要專用的瀏覽器打開,以及解析時(shí)會(huì)耗費(fèi)大量計(jì)算資源,而且占用存儲(chǔ)空間較大的電子檔案不適合進(jìn)行Base64編碼,導(dǎo)致這種封裝方式正在逐步被淘汰。

建立規(guī)范的存檔信息包,并通過接口技術(shù)實(shí)現(xiàn)存檔信息包在系統(tǒng)之間的切換,是電子文件歸檔的關(guān)鍵。目前通過電子文件包封裝存檔信息包,在電子文件歸檔和電子檔案歸檔方面應(yīng)用較廣,包括2019年批準(zhǔn)發(fā)布的檔案行業(yè)標(biāo)準(zhǔn)《政務(wù)服務(wù)事項(xiàng)電子文件歸檔規(guī)范》中,對政務(wù)服務(wù)事項(xiàng)電子檔案的封裝也是采用改進(jìn)后的電子文件包。

PDF、PDF/A等格式文件被國外長期壟斷,格式解析、標(biāo)準(zhǔn)解釋等掌握在國外的企業(yè)手中,使用和服務(wù)受制于人,且文檔信息容易被“劫持”,存在安全風(fēng)險(xiǎn)。OFD格式就是為實(shí)現(xiàn)國產(chǎn)自主可控替代計(jì)劃,突破國外技術(shù)壟斷,維護(hù)國家網(wǎng)絡(luò)安全應(yīng)運(yùn)而生的。OFD格式目前還處于起步階段,用戶的使用習(xí)慣、價(jià)格成本等都會(huì)影響到推廣應(yīng)用,但從長期來看,OFD格式自身的優(yōu)越性,以及國家對自主可控推動(dòng)的決心,OFD格式的應(yīng)用是大勢所趨。

在實(shí)際的檔案工作中,要分析各種封裝包的優(yōu)缺點(diǎn),根據(jù)檔案在交換、保存、利用等不同階段的特點(diǎn),靈活使用,如電子文件包中電子檔案的版式文檔可以采用OFD格式;為便于存儲(chǔ)和訪問,在電子檔案管理和利用階段可以采用電子文件包的存儲(chǔ)結(jié)構(gòu);OFD格式符合檔案行業(yè)標(biāo)準(zhǔn)《版式電子文件長期保存格式需求》,用于長期保存的電子檔案可以采用OFD格式封裝等等。

猜你喜歡
格式文件文檔內(nèi)容
內(nèi)容回顧溫故知新
有人一聲不吭向你扔了個(gè)文檔
使用“格式文件”將徠卡儀器數(shù)據(jù)導(dǎo)出成cass 格式的方法
基于RI碼計(jì)算的Word復(fù)制文檔鑒別
主要內(nèi)容
臺(tái)聲(2016年2期)2016-09-16 01:06:53
編寫徠卡TS02型全站儀格式文件的方法探索
Persistence of the reproductive toxicity of chlorpiryphos-ethyl in male Wistar rat
回歸基礎(chǔ) 到底什么是RAW格式文件?
基于Office Open XML格式文件的電子取證方法研究
不讓他人隨意下載Google文檔
電腦迷(2012年4期)2012-04-29 06:12:13
阳山县| 临海市| 天等县| 新巴尔虎左旗| 阿拉善右旗| 桦南县| 贡嘎县| 承德县| 京山县| 长岭县| 浦北县| 德钦县| 教育| 东港市| 阿荣旗| 吕梁市| 基隆市| 忻州市| 盘山县| 同江市| 英超| 孝义市| 雅安市| 神农架林区| 商水县| 塔河县| 西盟| 雷山县| 招远市| 托里县| 宜城市| 南投县| 泗阳县| 韶山市| 包头市| 谷城县| 琼海市| 象州县| 辰溪县| 彭泽县| 沈阳市|