關(guān)鍵詞:政府網(wǎng)站,網(wǎng)頁(yè)電子文件,元數(shù)據(jù),標(biāo)準(zhǔn),應(yīng)用
0 引言
隨著網(wǎng)絡(luò)技術(shù)和計(jì)算機(jī)技術(shù)的高速發(fā)展,我國(guó)各級(jí)政府部門(mén)及企事業(yè)單位的網(wǎng)站信息化程度日益提高。作為直接面對(duì)社會(huì)公眾提供相應(yīng)服務(wù)的政府網(wǎng)站,承擔(dān)著電子政務(wù)服務(wù)前臺(tái)的功能,也是政府提供在線(xiàn)公共政務(wù)服務(wù)的重要工具。2014年11月,國(guó)務(wù)院辦公廳印發(fā)了《關(guān)于加強(qiáng)政府網(wǎng)站信息內(nèi)容建設(shè)的意見(jiàn)》,對(duì)加強(qiáng)政府網(wǎng)站的建設(shè)和網(wǎng)站內(nèi)容的管理,信息收集、加工、篩選等重要的工作環(huán)節(jié)把關(guān)等提出了明確的要求,以確保信息的準(zhǔn)確可靠[1]。2017年6月,國(guó)務(wù)院辦公廳印發(fā)了《政府網(wǎng)站發(fā)展指引》,提出“政府網(wǎng)站遇整合遷移、改版等情況,要對(duì)有價(jià)值的原網(wǎng)頁(yè)進(jìn)行歸檔處理”[2]。元數(shù)據(jù)是實(shí)現(xiàn)“對(duì)有價(jià)值的原網(wǎng)頁(yè)進(jìn)行歸檔處理”必不可少的工具,是網(wǎng)頁(yè)電子文件管理活動(dòng)中極其重要的一部分。元數(shù)據(jù)是定義和描述其他數(shù)據(jù)的數(shù)據(jù)。用元數(shù)據(jù)來(lái)描述網(wǎng)頁(yè)電子文件的內(nèi)容、結(jié)構(gòu)、背景、管理過(guò)程的數(shù)據(jù),能夠完整展示政府網(wǎng)站網(wǎng)頁(yè)信息內(nèi)容,可以實(shí)現(xiàn)“對(duì)有價(jià)值的原網(wǎng)頁(yè)進(jìn)行歸檔處理”的目的。研究政府網(wǎng)站網(wǎng)頁(yè)電子文件元數(shù)據(jù)標(biāo)準(zhǔn)及應(yīng)用情況,實(shí)現(xiàn)標(biāo)準(zhǔn)化的管理模式,為我國(guó)政府網(wǎng)站網(wǎng)頁(yè)的建設(shè)和發(fā)展提供動(dòng)力,是深化政府管理改革的必然要求和重要內(nèi)容。
1 我國(guó)政府網(wǎng)站建設(shè)及相關(guān)標(biāo)準(zhǔn)化工作情況
從20世紀(jì)80年代起,我國(guó)各級(jí)政府部門(mén)開(kāi)始建設(shè)辦公自動(dòng)化工程。這個(gè)政府內(nèi)部的信息化辦公網(wǎng)絡(luò)為計(jì)算機(jī)和通信網(wǎng)絡(luò)的利用奠定了基礎(chǔ)。1998年4月,“青島政府信息公開(kāi)網(wǎng)”作為我國(guó)第一個(gè)真正意義上的政府網(wǎng)站正式投入使用,這是我國(guó)政府網(wǎng)站建設(shè)和運(yùn)營(yíng)的重要標(biāo)志。1999年1月,“政府上網(wǎng)工程啟動(dòng)大會(huì)”在北京舉行,各級(jí)政府部門(mén)、電信部門(mén)、軟硬件廠商和新聞單位都對(duì)政府上網(wǎng)工程給予了大力協(xié)助與支持,引起了很大的社會(huì)反響。這是我國(guó)政府網(wǎng)站建設(shè)的起步階段,奠定了我國(guó)政府網(wǎng)站建設(shè)的基礎(chǔ),并揭開(kāi)了政府上網(wǎng)迅速發(fā)展的序幕[3]。
目前,政府上網(wǎng)工程啟動(dòng)已近20年,各級(jí)政府均建立了相應(yīng)的政府網(wǎng)站,取得了很大的成績(jī)。在政府網(wǎng)站建設(shè)過(guò)程中,標(biāo)準(zhǔn)化工作發(fā)揮了非常重要的作用。2005年,國(guó)家電子政務(wù)標(biāo)準(zhǔn)化總體組主持研究制定并發(fā)布了《電子政務(wù)標(biāo)準(zhǔn)體系》和《電子政務(wù)標(biāo)準(zhǔn)化指南》。這兩個(gè)文件全面闡述了電子政務(wù)標(biāo)準(zhǔn)化的重要意義、電子政務(wù)標(biāo)準(zhǔn)化的組織結(jié)構(gòu)及工作思路、電子政務(wù)標(biāo)準(zhǔn)體系和近期擬開(kāi)展的標(biāo)準(zhǔn)項(xiàng)目。同時(shí),北京、上海、深圳等地前后制定了電子政務(wù)應(yīng)用服務(wù)系列規(guī)范。這些工作的開(kāi)展,進(jìn)一步推動(dòng)了我國(guó)電子政務(wù)標(biāo)準(zhǔn)化的發(fā)展。
2 網(wǎng)頁(yè)電子文件元數(shù)據(jù)標(biāo)準(zhǔn)內(nèi)容分析
實(shí)現(xiàn)政府網(wǎng)站網(wǎng)頁(yè)電子文件的有效管理以及實(shí)現(xiàn)對(duì)有價(jià)值的網(wǎng)頁(yè)進(jìn)行歸檔處理,離不開(kāi)元數(shù)據(jù)相關(guān)標(biāo)準(zhǔn)的制定與實(shí)施。元數(shù)據(jù)的標(biāo)準(zhǔn)化,能夠有效保障元數(shù)據(jù)在網(wǎng)頁(yè)電子文件應(yīng)用實(shí)施中的整體性和規(guī)范性,否則難以實(shí)現(xiàn)網(wǎng)頁(yè)電子文件的憑證性。標(biāo)準(zhǔn)是政府網(wǎng)站發(fā)揮自身價(jià)值與優(yōu)勢(shì)的基礎(chǔ)支撐,標(biāo)準(zhǔn)化是元數(shù)據(jù)在網(wǎng)頁(yè)電子文件中實(shí)施應(yīng)用的前提。
2001年6月,中國(guó)國(guó)家圖書(shū)館負(fù)責(zé)制定并發(fā)布了《中文元數(shù)據(jù)方案》,提出適應(yīng)我國(guó)中文及文獻(xiàn)特點(diǎn)的通用元數(shù)據(jù)框架。該方案在總體框架結(jié)構(gòu)上采用了開(kāi)放檔案信息系統(tǒng)(OAIS,Open ArchivalInformation System)參考模型。該系統(tǒng)是ISO 14721《空間數(shù)據(jù)和信息傳輸系統(tǒng) 開(kāi)放檔案信息系統(tǒng) 參考模型》最早提出的,也被行業(yè)內(nèi)諸多電子文件(檔案)管理領(lǐng)域所認(rèn)可。在元數(shù)據(jù)集方面,參考了國(guó)外較為成熟的元數(shù)據(jù)集,保持與DC元數(shù)據(jù)集的對(duì)應(yīng)關(guān)系,便于有效利用。
我國(guó)第一個(gè)正式的政府信息管理元數(shù)據(jù)標(biāo)準(zhǔn)是2007年國(guó)家標(biāo)準(zhǔn)委發(fā)布的GB/T 21063.3—2007《政務(wù)信息資源目錄體系 第3部分:核心元數(shù)據(jù)》。該標(biāo)準(zhǔn)作為政府信息資源目錄體系的一部分,主要用于信息資源目錄的描述、編目、建庫(kù)、發(fā)布和查詢(xún)。
2022年,GB/T 42147—2022《政府網(wǎng)站網(wǎng)頁(yè)電子文件元數(shù)據(jù)》正式發(fā)布[4]。該標(biāo)準(zhǔn)結(jié)合目前我國(guó)政府網(wǎng)站網(wǎng)頁(yè)電子文件管理和電子檔案管理實(shí)際,構(gòu)建了政府網(wǎng)站網(wǎng)頁(yè)電子文件元數(shù)據(jù)實(shí)體及其相互關(guān)系,各實(shí)體或數(shù)字對(duì)象是基于管理業(yè)務(wù)活動(dòng)的需求制定的,在采集、轉(zhuǎn)化、歸檔、封裝、存儲(chǔ)與備份、處置的全過(guò)程中對(duì)網(wǎng)頁(yè)電子文件加以管理和利用,再以實(shí)體相互關(guān)系為紐帶,將各個(gè)實(shí)體聯(lián)系起來(lái),實(shí)現(xiàn)整個(gè)管理業(yè)務(wù)活動(dòng)的互聯(lián),具有實(shí)踐操作性,能夠指導(dǎo)和推進(jìn)我國(guó)政府網(wǎng)站網(wǎng)頁(yè)電子文件的管理工作。該標(biāo)準(zhǔn)在ISO 23081-1《信息和文件 記錄管理過(guò)程 記錄元數(shù)據(jù) 第1部分:原則》設(shè)計(jì)的文件實(shí)體類(lèi)元數(shù)據(jù)頂層框架模型的基礎(chǔ)上,設(shè)計(jì)了符合網(wǎng)頁(yè)電子文件管理需求的元數(shù)據(jù)實(shí)體關(guān)系[5],如圖1所示。
GB/T 42147—2022描述了網(wǎng)頁(yè)電子文件管理流程中涉及到的實(shí)體及實(shí)體之間的關(guān)系,包括網(wǎng)頁(yè)電子文件實(shí)體、網(wǎng)頁(yè)電子文件管理機(jī)構(gòu)人員實(shí)體、網(wǎng)頁(yè)電子文件記錄的業(yè)務(wù)實(shí)體、網(wǎng)頁(yè)電子文件管理過(guò)程實(shí)體、網(wǎng)頁(yè)電子文件操作權(quán)限實(shí)體、實(shí)體相互關(guān)系實(shí)體。明確了實(shí)體,也就明確了涉及到的元數(shù)據(jù)種類(lèi),六大實(shí)體內(nèi)部根據(jù)各類(lèi)實(shí)體的屬性與內(nèi)容確定了不同類(lèi)別的元數(shù)據(jù)元素。該標(biāo)準(zhǔn)共有83項(xiàng)元數(shù)據(jù)元素,如表1所示。
3 元數(shù)據(jù)標(biāo)準(zhǔn)應(yīng)用分析
元數(shù)據(jù)在網(wǎng)頁(yè)電子文件管理中的應(yīng)用,應(yīng)以實(shí)施元數(shù)據(jù)標(biāo)準(zhǔn)為前提。元數(shù)據(jù)標(biāo)準(zhǔn)的相關(guān)要求,為元數(shù)據(jù)的實(shí)際應(yīng)用提供基礎(chǔ)支撐和指導(dǎo),使元數(shù)據(jù)在網(wǎng)頁(yè)電子文件管理的每個(gè)階段真正發(fā)揮出應(yīng)有的作用。元數(shù)據(jù)在政府網(wǎng)站網(wǎng)頁(yè)電子文件的應(yīng)用場(chǎng)景主要集中在網(wǎng)頁(yè)電子文件的生命周期的四個(gè)方面:采集、歸檔、封裝、存儲(chǔ)。
3.1 網(wǎng)頁(yè)電子文件元數(shù)據(jù)的采集
元數(shù)據(jù)的采集是網(wǎng)頁(yè)電子文件在形成過(guò)程中,將網(wǎng)頁(yè)電子文件和相關(guān)聯(lián)的元數(shù)據(jù)保存到網(wǎng)頁(yè)電子文件管理系統(tǒng)中,通過(guò)監(jiān)控等方式將網(wǎng)頁(yè)電子文件的內(nèi)容信息如實(shí)記錄。采集登記的網(wǎng)頁(yè)電子文件及其元數(shù)據(jù)具有原始性,可以確保元數(shù)據(jù)的來(lái)源準(zhǔn)確,從而保證網(wǎng)頁(yè)電子文件的真實(shí)性。通常情況下,由網(wǎng)頁(yè)電子文件管理系統(tǒng)自動(dòng)采集的元數(shù)據(jù)是不被篡改的。對(duì)于一些無(wú)法由系統(tǒng)自動(dòng)采集的元數(shù)據(jù),需要通過(guò)人工補(bǔ)錄的方式采集相應(yīng)的元數(shù)據(jù)。
網(wǎng)頁(yè)電子文件元數(shù)據(jù)是管理網(wǎng)頁(yè)電子文件的關(guān)鍵,是網(wǎng)頁(yè)電子文件管理系統(tǒng)的核心組成部分。網(wǎng)頁(yè)電子文件元數(shù)據(jù)標(biāo)準(zhǔn)可以規(guī)范、引導(dǎo)網(wǎng)頁(yè)電子文件管理系統(tǒng)的建設(shè),有助于不同文件管理系統(tǒng)間的信息資源共享、互通和利用,使網(wǎng)頁(yè)電子文件容易管理和檢索利用。政府網(wǎng)站網(wǎng)頁(yè)電子文件管理系統(tǒng)組成架構(gòu)可提供網(wǎng)頁(yè)電子文件的元數(shù)據(jù)方案管理、在線(xiàn)和離線(xiàn)閱讀等功能,通過(guò)對(duì)政府網(wǎng)站進(jìn)行網(wǎng)頁(yè)信息元數(shù)據(jù)采集登記,將網(wǎng)頁(yè)內(nèi)容及其元數(shù)據(jù)采集到網(wǎng)頁(yè)電子文件管理系統(tǒng),實(shí)現(xiàn)長(zhǎng)期的保存和利用。用元數(shù)據(jù)描述網(wǎng)頁(yè)電子文件,將伴隨網(wǎng)頁(yè)電子文件全生命周期,跟隨網(wǎng)頁(yè)電子文件的形成和運(yùn)行,元數(shù)據(jù)不斷得到補(bǔ)充和擴(kuò)展。網(wǎng)頁(yè)電子文件管理系統(tǒng)建設(shè)需要根據(jù)系統(tǒng)功能來(lái)制定元數(shù)據(jù)方案,選擇元數(shù)據(jù)元素并建立其相互關(guān)系。元數(shù)據(jù)方案的建立應(yīng)用為網(wǎng)頁(yè)電子文件管理系統(tǒng)提供建立、維護(hù)和采集配置等功能,能更好地實(shí)現(xiàn)元數(shù)據(jù)在管理過(guò)程中的系統(tǒng)化應(yīng)用,也能更好地支撐系統(tǒng)信息化管理,滿(mǎn)足網(wǎng)頁(yè)電子文件全過(guò)程的各階段的管理和維護(hù)。
3.2 網(wǎng)頁(yè)電子文件元數(shù)據(jù)的歸檔
元數(shù)據(jù)是網(wǎng)頁(yè)電子文件歸檔的重要內(nèi)容之一。為了確保網(wǎng)頁(yè)電子文件沒(méi)有缺失、破壞或被更改,在網(wǎng)頁(yè)電子文件歸檔移交和接收過(guò)程中需清點(diǎn)和檢測(cè)網(wǎng)頁(yè)電子文件的元數(shù)據(jù),以確保網(wǎng)頁(yè)電子文件的真實(shí)性和完整性,對(duì)有價(jià)值的網(wǎng)站網(wǎng)頁(yè)進(jìn)行有效歸檔管理。歸檔的元數(shù)據(jù)包括網(wǎng)頁(yè)電子文件實(shí)體(數(shù)字對(duì)象)的元數(shù)據(jù)、網(wǎng)頁(yè)電子文件管理機(jī)構(gòu)人員的元數(shù)據(jù)、網(wǎng)頁(yè)電子文件記錄的業(yè)務(wù)的元數(shù)據(jù)、網(wǎng)頁(yè)電子文件管理過(guò)程的元數(shù)據(jù)、實(shí)體相互關(guān)系的元數(shù)據(jù),以及其他元數(shù)據(jù)。元數(shù)據(jù)是網(wǎng)頁(yè)電子文件檔案真實(shí)可用、長(zhǎng)期保存的重要保障,能夠真實(shí)記錄電子文件的信息內(nèi)容,能夠把網(wǎng)頁(yè)內(nèi)容完整的表現(xiàn)出來(lái),保證其真實(shí)性、完整性和有效性,有效實(shí)現(xiàn)網(wǎng)頁(yè)電子文件的管理和利用。
揚(yáng)州市從2002年開(kāi)始由政府資源管理中心進(jìn)行政府網(wǎng)站網(wǎng)頁(yè)的歸檔工作。目前,揚(yáng)州市已初步實(shí)現(xiàn)了部分元數(shù)據(jù)在政府網(wǎng)站網(wǎng)頁(yè)歸檔中的應(yīng)用。元數(shù)據(jù)在網(wǎng)頁(yè)電子文件歸檔過(guò)程中起到了技術(shù)保障作用,可以保證網(wǎng)頁(yè)電子文件的憑證價(jià)值[6]。
3.3 網(wǎng)頁(yè)電子文件元數(shù)據(jù)的封裝
封裝是將網(wǎng)頁(yè)電子文件及其元數(shù)據(jù)等內(nèi)容按指定結(jié)構(gòu)進(jìn)行打包的過(guò)程。在網(wǎng)頁(yè)電子文件管理過(guò)程中,需要維護(hù)網(wǎng)頁(yè)電子文件的真實(shí)性和完整性,可以通過(guò)封裝的方式把網(wǎng)頁(yè)電子文件及其元數(shù)據(jù)打包在一個(gè)數(shù)據(jù)包中,經(jīng)元數(shù)據(jù)封裝的網(wǎng)頁(yè)電子文件,可以實(shí)現(xiàn)網(wǎng)頁(yè)電子文件交換、長(zhǎng)期保存和利用,具有實(shí)際的完整性?xún)r(jià)值。
GB/T 42146—2022《政府網(wǎng)站網(wǎng)頁(yè)電子文件封裝要求》是符合XML標(biāo)準(zhǔn)的封裝標(biāo)準(zhǔn),支持將網(wǎng)頁(yè)電子文件內(nèi)容以多種文件格式的形式封裝保存,用XML語(yǔ)言將多個(gè)網(wǎng)頁(yè)電子文件及按《政府網(wǎng)站網(wǎng)頁(yè)電子文件元數(shù)據(jù)》要求所記錄的元數(shù)據(jù)按照封裝結(jié)構(gòu)和封裝方法以一定的業(yè)務(wù)邏輯封裝在一個(gè)數(shù)據(jù)包中,并保障網(wǎng)頁(yè)電子文件及其元數(shù)據(jù)之間的可靠聯(lián)系,使網(wǎng)頁(yè)電子文件及其元數(shù)據(jù)在相當(dāng)長(zhǎng)的時(shí)間內(nèi)得到保護(hù),實(shí)現(xiàn)網(wǎng)頁(yè)電子文件的管理和利用。在實(shí)際應(yīng)用中,應(yīng)根據(jù)網(wǎng)頁(yè)電子文件的特點(diǎn)、文件管理系統(tǒng)需要,選擇合適的元數(shù)據(jù)封裝存儲(chǔ)方式。
3.4 網(wǎng)頁(yè)電子文件元數(shù)據(jù)的儲(chǔ)存
將具有價(jià)值或具有永久保存價(jià)值的網(wǎng)頁(yè)電子文件歸檔保存在網(wǎng)頁(yè)電子文件管理系統(tǒng)中,應(yīng)保證網(wǎng)頁(yè)電子文件在管理應(yīng)用過(guò)程中處于受控狀態(tài)。隨著計(jì)算機(jī)技術(shù)的快速變化發(fā)展,基于存儲(chǔ)系統(tǒng)、存儲(chǔ)介質(zhì)的不斷更新變化,網(wǎng)頁(yè)電子文件資源需不斷的遷移保存。為確保網(wǎng)頁(yè)電子文件在管理應(yīng)用中的記錄信息真實(shí)、完整,可以通過(guò)與“存儲(chǔ)”相關(guān)聯(lián)的元數(shù)據(jù)來(lái)描述網(wǎng)頁(yè)電子文件在存儲(chǔ)更新時(shí)的真實(shí)狀況和完整信息。
目前使用的歸檔儲(chǔ)存格式有很多,例如PDF、OFD、WARC等,不同的網(wǎng)頁(yè)電子文件歸檔格式可以滿(mǎn)足不同的需求。OFD在顯示效果、信息檢索、安全性、可靠性等方面優(yōu)勢(shì)顯著,OFD格式是國(guó)內(nèi)普遍使用的歸檔格式,也符合我國(guó)檔案管理習(xí)慣使用的文件格式。GB/T 42147—2022《政府網(wǎng)站網(wǎng)頁(yè)電子文件元數(shù)據(jù)》也推薦使用GB/T 33190《電子文件存儲(chǔ)與交換格式 版式文檔》規(guī)定的存儲(chǔ)格式,也不排斥使用其他符合要求的存儲(chǔ)格式。GB/T 39677《OFD在政府網(wǎng)站網(wǎng)頁(yè)歸檔中的應(yīng)用指南》在網(wǎng)頁(yè)歸檔和技術(shù)建設(shè)方面提出了指導(dǎo)建議,列出了網(wǎng)頁(yè)內(nèi)容元素、結(jié)構(gòu)元素等主要組成元素,可實(shí)現(xiàn)網(wǎng)頁(yè)電子文件的內(nèi)容及其元數(shù)據(jù)統(tǒng)一固化歸檔到OFD格式的文件中,利于實(shí)現(xiàn)網(wǎng)頁(yè)電子文件的管理和長(zhǎng)期保存利用[7]。
4 結(jié)語(yǔ)
元數(shù)據(jù)在網(wǎng)頁(yè)電子文件管理過(guò)程中各階段的應(yīng)用是極其重要的。2022年發(fā)布的GB/ T 42147—2022《政府網(wǎng)站網(wǎng)頁(yè)電子文件元數(shù)據(jù)》提出了宏觀的元數(shù)據(jù)方案,但在具體的實(shí)踐應(yīng)用中,還需要立足于政府自身的實(shí)際情況,對(duì)元數(shù)據(jù)進(jìn)行擴(kuò)展應(yīng)用。目前,元數(shù)據(jù)在網(wǎng)頁(yè)電子文件中的應(yīng)用仍存在許多問(wèn)題和挑戰(zhàn)。需要更加深入地研究元數(shù)據(jù)標(biāo)準(zhǔn)與應(yīng)用技術(shù),大力推動(dòng)政府網(wǎng)站網(wǎng)頁(yè)電子文件管理的創(chuàng)新發(fā)展。