国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

政府網(wǎng)站網(wǎng)頁歸檔體系建構(gòu)研究*

2022-03-08 13:13:54吳琳周麗霞
山西檔案 2022年1期
關(guān)鍵詞:網(wǎng)頁檢索政府

吳琳 周麗霞

(黑龍江大學(xué)信息管理學(xué)院 哈爾濱 150080)

網(wǎng)絡(luò)化背景下海量信息以數(shù)字化形式存在且不斷增加,新型的文件形式產(chǎn)生新型的歸檔對(duì)象,也必然帶來新的歸檔需求[1]。近年來,網(wǎng)頁作為一種新型的歸檔對(duì)象成為熱門討論問題,而隨著電子政務(wù)工作的推進(jìn),政府網(wǎng)頁歸檔也逐漸得到重視。2018年國務(wù)院發(fā)布了《進(jìn)一步深化“互聯(lián)網(wǎng)+政務(wù)服務(wù)”推進(jìn)政務(wù)服務(wù)“一網(wǎng)、一門、一次”改革實(shí)施方案》,加快推進(jìn)全國范圍內(nèi)政務(wù)服務(wù)“一網(wǎng)通辦”改革的進(jìn)程[2],隨之而來的是數(shù)量快速增長的政府網(wǎng)頁應(yīng)該如何歸檔的問題。

近年來我國已開始重視網(wǎng)站網(wǎng)頁歸檔工作。2018年,國家檔案局確定四家單位開展網(wǎng)站網(wǎng)頁歸檔試點(diǎn),分別為北京市檔案局、寧波市檔案局、自然資源部信息中心和國家電網(wǎng)江蘇電力公司。但是截至目前,我國政府網(wǎng)頁歸檔工作仍然沒有一個(gè)統(tǒng)一的歸檔體系,在本文中,筆者匯總整理與現(xiàn)有政府歸檔項(xiàng)目有關(guān)的文檔,根據(jù)國外和國內(nèi)的歸檔實(shí)踐,試圖構(gòu)建一個(gè)政府網(wǎng)站網(wǎng)頁歸檔體系,梳理歸檔體系中各要素之間的關(guān)系,并就歸檔體系中的問題提出政府網(wǎng)站網(wǎng)頁歸檔的發(fā)展策略。

1 政府網(wǎng)頁歸檔理論與實(shí)踐發(fā)展

政府網(wǎng)頁歸檔是有必要的,一方面,政府網(wǎng)頁作為電子數(shù)據(jù)具有作為法律證據(jù)的資格[3],2019年10月14日,最高人民法院審判委員會(huì)第1777次會(huì)議通過了修改《關(guān)于民事訴訟證據(jù)的若干規(guī)定》的決定,《規(guī)定》第十四條表明電子數(shù)據(jù)包括網(wǎng)頁、博客、微博客等網(wǎng)絡(luò)平臺(tái)發(fā)布的信息可作為民事訴訟證據(jù)[4];另一方面,政府網(wǎng)頁具有學(xué)術(shù)研究價(jià)值,政府網(wǎng)頁記錄政府部門、機(jī)構(gòu)團(tuán)體或社會(huì)組織的官方信息發(fā)布、辦事服務(wù)、互動(dòng)反饋等過程,這些權(quán)威數(shù)據(jù)和電子記錄已經(jīng)成為各領(lǐng)域?qū)W者學(xué)術(shù)研究的重要引文來源[5];當(dāng)然,網(wǎng)頁信息也是社會(huì)記憶的組成部分。如果沒有依據(jù)合理的標(biāo)準(zhǔn)對(duì)政府網(wǎng)頁信息及時(shí)歸檔保存,這些原生性網(wǎng)頁失效或意外丟失后就再也無法找到,其損失是不可逆的。

1.1 政府網(wǎng)頁歸檔理論研究回顧

在中國知網(wǎng)(CNKI)數(shù)據(jù)庫中以六種檢索式對(duì)政府網(wǎng)站網(wǎng)頁歸檔相關(guān)主題進(jìn)行檢索,力求檢索結(jié)果全面精確。截至2020年底,經(jīng)過篩選共得到相關(guān)中文文獻(xiàn)40條(如表1所示)。從檢索結(jié)果看,與檢索主題相關(guān)的研究從2007年開始,最早開始研究的學(xué)者是唐瓊,她認(rèn)為政府網(wǎng)絡(luò)信息資源保存應(yīng)該注意的問題包括收集策略、抓取周期、知識(shí)產(chǎn)權(quán)和隱私權(quán)保護(hù)幾個(gè)方面,并根據(jù)美國相關(guān)項(xiàng)目的發(fā)展情況對(duì)我國政府網(wǎng)絡(luò)信息資源長期保存提出建議。該文獻(xiàn)被引12次,為后續(xù)該主題的研究提供學(xué)術(shù)方向的引導(dǎo)[6]。檢索結(jié)果在2017年出現(xiàn)第一個(gè)發(fā)文量高峰,共有6篇,2020年達(dá)到發(fā)表最大值7篇。2020年發(fā)文量增加可能與2019年國家檔案局最新發(fā)布的《政府網(wǎng)站網(wǎng)頁歸檔指南》(以下稱《指南》)有關(guān),這是我國首次官方發(fā)布的政府網(wǎng)站網(wǎng)頁歸檔標(biāo)準(zhǔn),在2020年發(fā)表的相關(guān)主題的文獻(xiàn)中,有兩篇是對(duì)《指南》的解讀。從所有檢索結(jié)果的內(nèi)容來看,目前學(xué)者主要從以下幾個(gè)方面開展研究:一是從國外政府網(wǎng)站網(wǎng)頁歸檔實(shí)踐中獲得對(duì)我國應(yīng)用實(shí)踐的啟示,在這里多數(shù)學(xué)者選擇總結(jié)英國政府網(wǎng)頁歸檔經(jīng)驗(yàn),可見英國政府網(wǎng)頁歸檔工作相關(guān)的指導(dǎo)標(biāo)準(zhǔn)以及法律規(guī)范已經(jīng)比較完善,值得我國借鑒學(xué)習(xí);二是基于新的信息技術(shù)對(duì)政府網(wǎng)站網(wǎng)頁長期保存的研究,包括云計(jì)算、大數(shù)據(jù)、區(qū)塊鏈以及數(shù)據(jù)起源技術(shù)等;三是構(gòu)建政府網(wǎng)站信息資源保存體系,但是其中大部分文獻(xiàn)都是在《指南》還沒有發(fā)布的情況下構(gòu)建的政府網(wǎng)站網(wǎng)頁歸檔體系,總體來看還比較籠統(tǒng)模糊,本文將根據(jù)《指南》具體要求和標(biāo)準(zhǔn)構(gòu)建出一個(gè)更加合理的政府網(wǎng)站網(wǎng)頁歸檔體系,以期為政府網(wǎng)站網(wǎng)頁歸檔實(shí)踐提供參考。

表1 年度發(fā)文量統(tǒng)計(jì)

1.2 政府網(wǎng)頁歸檔國內(nèi)外實(shí)踐概覽

最早開展網(wǎng)頁歸檔實(shí)踐的機(jī)構(gòu)有英國國家檔案館、澳大利亞國家圖書館、美國國家檔案館等,這些機(jī)構(gòu)在網(wǎng)頁歸檔方面的經(jīng)驗(yàn)較為豐富。

1.2.1 國外政府網(wǎng)站網(wǎng)頁歸檔實(shí)例

(1)英國政府網(wǎng)頁歸檔

自2010年起,英國國家檔案館開始對(duì)政府網(wǎng)頁以及社交媒體進(jìn)行收集和保存。UK Government Web Archive(UKGWA https://webarchive.nationalarchives.gov.uk/*/http:/www.hefce.ac.uk/)主要對(duì)發(fā)布在網(wǎng)絡(luò)上的英國中央政府信息進(jìn)行捕獲、保存并提供訪問。該網(wǎng)頁檔案包括1996年至今的視頻、推文以及圖像等[7]。用戶可以直接在英國國家檔案館網(wǎng)站中找到入口鏈接,并通過進(jìn)入鏈接獲取多種檢索方式,包括搜索整個(gè)英國政府網(wǎng)站存檔和按字母從A到Z的順序?yàn)g覽網(wǎng)頁存檔,也可以直接選擇社交媒體檔案、Twitter檔案、視頻檔案、Flicker檔案等分類目錄檢索方式檢索。歸檔的網(wǎng)頁內(nèi)容包括社交媒體推文、圖片、視頻等多種類型。英國政府網(wǎng)頁歸檔對(duì)象不僅來自網(wǎng)頁,社交媒體信息也是重要的一部分,社交媒體信息既包含政府網(wǎng)站發(fā)布的公告和新聞資訊,又有與公民的直接互動(dòng),為學(xué)術(shù)研究和政務(wù)活動(dòng)的開展提供基礎(chǔ)憑證,因此非常具有歸檔價(jià)值。

(2)澳大利亞政府網(wǎng)頁歸檔

澳大利亞國家圖書館收集并保存那些記錄和反映澳大利亞社會(huì)和文化的網(wǎng)站快照,以供長期訪問。圖書館的網(wǎng)站和網(wǎng)絡(luò)文檔集合被稱為澳大利亞網(wǎng)絡(luò)檔案館(AGWA),澳大利亞政府網(wǎng)站網(wǎng)頁檔案可通過Trove公開訪問(https://trove.nla.gov.au/)。在Trove瀏覽頁面的網(wǎng)站檢索欄中限制到gov.au網(wǎng)絡(luò)域名后即可檢索到澳大利亞政府網(wǎng)站檔案,檢索時(shí)可以限制一些信息(如檢索詞組以及快照的日期范圍等)以獲得更精確的檢索結(jié)果。此外,國家圖書館還與Internet檔案館(IA)合作,通過一項(xiàng)名為Archive-It(https://archive-it.org/)的服務(wù)來選擇、收集和歸檔亞洲/太平洋網(wǎng)站的副本,其中就包括與中國有關(guān)的網(wǎng)頁收藏,有關(guān)中國的最新網(wǎng)頁收藏是“2019香港反引渡法案抗議”,這些存檔內(nèi)容在未來會(huì)具有重要的研究價(jià)值。

(3)美國政府網(wǎng)頁歸檔

美國國家檔案管理局(NARA)在2004年對(duì)聯(lián)邦機(jī)構(gòu)的公共網(wǎng)站進(jìn)行了網(wǎng)絡(luò)搜集(又稱網(wǎng)絡(luò)捕獲)。從2006年開始,NARA在每次國會(huì)結(jié)束時(shí)都開始對(duì)國會(huì)網(wǎng)站進(jìn)行網(wǎng)絡(luò)搜集(https://www.webharvest.gov/)。國會(huì)收集的網(wǎng)絡(luò)存檔包括會(huì)員(Members)、委員會(huì)(Committees)、組織(Organizations)和組織者(Leadership)網(wǎng)站,現(xiàn)在國會(huì)收集范圍擴(kuò)大,還可以捕獲許多社交媒體網(wǎng)站上的內(nèi)容,其中包括總統(tǒng)社交媒體網(wǎng)頁。對(duì)聯(lián)邦政府機(jī)構(gòu)和國會(huì)網(wǎng)頁的歸檔主要由IA使用Heritrix搜索器代表美國國家檔案局(館)收錄政府網(wǎng)頁,通過Wayback Machine顯示存檔網(wǎng)頁,目前收獲館藏包括121TB的存檔網(wǎng)站。美國國家檔案局(館)在2005年1月發(fā)布了《NARA網(wǎng)頁檔案管理指南》[8],為執(zhí)行網(wǎng)頁歸檔工作提供依據(jù)。

1.2.2 我國政府網(wǎng)站網(wǎng)頁歸檔實(shí)例

相較于國外,我國政府網(wǎng)站網(wǎng)頁歸檔工作仍處于起步階段,發(fā)展相對(duì)緩慢,但是已經(jīng)得到重視。國家檔案局在2016年印發(fā)的《全國檔案事業(yè)發(fā)展“十三五”規(guī)劃綱要》中指出要“研究制定重要網(wǎng)頁資源的采集和社交媒體文件的歸檔管理辦法”[9],在“十三五規(guī)劃”的指導(dǎo)下,我國開展了一系列試點(diǎn)工作,并且積極研究推出《政府網(wǎng)站網(wǎng)頁歸檔指南》(DA/T80—2019),為我國政府網(wǎng)站歸檔工作提供標(biāo)準(zhǔn),我國也做了很多努力,進(jìn)行了相關(guān)的探索和實(shí)踐。

(1)自然資源部信息中心試點(diǎn)

作為國家檔案局網(wǎng)站網(wǎng)頁資源歸檔試點(diǎn)項(xiàng)目,自然資源部信息中心積極投入網(wǎng)站網(wǎng)頁歸檔實(shí)踐,2013年起對(duì)歸檔采集范圍、歸檔機(jī)制、歸檔文件格式有了明確規(guī)范并展開網(wǎng)頁歸檔工作。歸檔采集范圍限定于mnr.gov.cn域名下的網(wǎng)頁,采用網(wǎng)絡(luò)爬蟲技術(shù)實(shí)現(xiàn)多種類型網(wǎng)頁資源的抓取,歸檔流程是從網(wǎng)頁采集到建立副本生成網(wǎng)頁歸檔文件再到定期匯交部檔案室最后長期保存。自然資源部信息中心將歸檔分為三類,分別為風(fēng)貌、內(nèi)容和專題。除了內(nèi)容,網(wǎng)頁歸檔格式也是需要考慮的問題,對(duì)于歸檔文件格式有WARC和OFD兩種選擇,權(quán)衡利弊后自然資源部信息中心選擇OFD格式,OFD格式有很多優(yōu)勢但是還存在影響網(wǎng)頁交互性等問題,所以會(huì)保存一份WARC格式的網(wǎng)頁副本備用。歸檔后的文件既可以在線瀏覽,也可以脫離系統(tǒng)支撐直接由OFD閱讀器離線閱讀。自然資源部信息中心的網(wǎng)頁歸檔探索實(shí)踐比較成功,相關(guān)技術(shù)也被其他政府部門參考作為網(wǎng)站網(wǎng)頁歸檔要求和規(guī)范[10]。

(2)浙江省檔案館抗疫網(wǎng)頁歸檔

浙江省檔案館在2020年2月及時(shí)開展抗疫網(wǎng)頁檔案采集工作,參照相關(guān)標(biāo)準(zhǔn)起草制定新冠疫情防控專題網(wǎng)頁檔案收集與歸檔工作方案,明確職責(zé)分工、采集范圍以及移交接收等規(guī)范,并指出采集工作應(yīng)該注意的問題。采集工作主要是圍繞政府及相關(guān)部門和重要媒體官方網(wǎng)站網(wǎng)頁開展,對(duì)指定網(wǎng)站自2020年1月新冠肺炎疫情發(fā)生之后發(fā)布的有關(guān)各地疫情防控工作的通知、公告、通報(bào)、新聞報(bào)道等內(nèi)容進(jìn)行采集,注重多種形態(tài)內(nèi)容的留存??挂邫n案采集需貫穿整個(gè)疫情防控的工作周期,不斷補(bǔ)充采集內(nèi)容,實(shí)現(xiàn)抗疫專題網(wǎng)頁信息采集的完整。到2020年11月為止,已對(duì)25個(gè)重要門戶及官方媒體網(wǎng)站共采集有關(guān)抗疫網(wǎng)頁文本計(jì)132543頁,對(duì)中國疾控中心、浙江省衛(wèi)生健康委員會(huì)官網(wǎng)、新藍(lán)網(wǎng)等11個(gè)網(wǎng)站采集多媒體文件13599個(gè)。這些網(wǎng)頁信息都是各大網(wǎng)站公開信息,目前在互聯(lián)網(wǎng)上都能搜索到[11]。

2 政府網(wǎng)站網(wǎng)頁歸檔體系建構(gòu)

基于國外與我國網(wǎng)站網(wǎng)頁歸檔項(xiàng)目實(shí)踐以及最新發(fā)布的《指南》,歸納構(gòu)建我國政府網(wǎng)站網(wǎng)頁歸檔體系參考框架,如圖1所示。該參考框架主要由三個(gè)環(huán)節(jié)構(gòu)成,分別為選擇采集、組織保存、開發(fā)利用與訪問檢索,該參考框架分別對(duì)三個(gè)環(huán)節(jié)的具體工作步驟展開闡述,指出歸檔對(duì)象的類型和備份格式,同時(shí)分析了在整個(gè)歸檔體系中涉及的歸檔主體之間的關(guān)系。

圖1 我國政府網(wǎng)站網(wǎng)頁歸檔體系參考框架

2.1 歸檔主體

政府網(wǎng)站網(wǎng)頁歸檔工作涉及的主體主要包括形成網(wǎng)頁的政府網(wǎng)站和對(duì)網(wǎng)頁長期歸檔保存的檔案部門,學(xué)界普遍認(rèn)可的是“誰形成誰歸檔”[12],也就是說,不論是中央政府還是地方政府及相關(guān)政務(wù)的網(wǎng)站管理部門,都應(yīng)對(duì)自己網(wǎng)站的網(wǎng)頁信息作歸檔處理,政府網(wǎng)站的管理部門應(yīng)依據(jù)2019年發(fā)布的《指南》中的歸檔標(biāo)準(zhǔn)實(shí)施網(wǎng)站信息的采集、分類、著錄、鑒定?!吨改稀芬呀?jīng)給出了政府網(wǎng)站歸檔范圍與保管期限參考表,根據(jù)對(duì)政府網(wǎng)站保存價(jià)值的鑒定明確其保管期限,并定期移交到檔案部門。檔案部門除了接收和保管政府網(wǎng)站移交的網(wǎng)頁檔案,還負(fù)責(zé)制定相應(yīng)的規(guī)章制度并監(jiān)督網(wǎng)頁歸檔工作。明確政府網(wǎng)站歸檔主體權(quán)責(zé)后,應(yīng)由政府信息化部門根據(jù)官方提供的標(biāo)準(zhǔn)和實(shí)際情況設(shè)計(jì)網(wǎng)頁歸檔功能模塊,提供信息化支持。

2.2 歸檔對(duì)象

很多學(xué)者在討論政府網(wǎng)頁歸檔問題時(shí)都模糊了歸檔對(duì)象,我們必須明確的是政府網(wǎng)站網(wǎng)頁歸檔不僅僅是網(wǎng)站的信息資源,還包括元數(shù)據(jù)。一方面,單純的信息資源獨(dú)立保存很容易丟失,需要元數(shù)據(jù)來描述,兩者結(jié)合后歸檔保存可以使網(wǎng)頁更安全;另一方面,通過元數(shù)據(jù)對(duì)歸檔網(wǎng)頁進(jìn)行描述分類,可以為后期檢索利用帶來便利?!吨改稀芬步o出了網(wǎng)頁歸檔基本元數(shù)據(jù)參考表,必選的元數(shù)據(jù)有網(wǎng)站名稱、網(wǎng)站域名、標(biāo)題、發(fā)布時(shí)間、來源以及采集時(shí)間和采集人。同時(shí),明確具體歸檔對(duì)象后,還要針對(duì)歸檔對(duì)象的不同形態(tài)和類型給予相對(duì)應(yīng)的歸檔標(biāo)準(zhǔn)和規(guī)范,包括一些可視靜態(tài)內(nèi)容,如文本、靜態(tài)圖片等,頁面中的動(dòng)畫、音視頻等類型的內(nèi)容的歸檔格式也需要規(guī)范化。

2.3 歸檔流程

根據(jù)國內(nèi)外政府網(wǎng)頁歸檔實(shí)踐,筆者將政府網(wǎng)站網(wǎng)頁歸檔流程大致分為三個(gè)環(huán)節(jié),分別為選擇采集、組織保存、訪問檢索與開發(fā)利用。在這三個(gè)環(huán)節(jié)中,最重要也是最難的一步就在于網(wǎng)頁采集范圍的確定,最后的訪問檢索步驟涉及的法律問題也是阻礙政府網(wǎng)站網(wǎng)頁歸檔工作的一個(gè)難題,組織保存環(huán)節(jié)在《指南》中已經(jīng)給出明確的標(biāo)準(zhǔn),只需按照要求并結(jié)合實(shí)際情況組織保存即可。

2.3.1 選擇采集環(huán)節(jié)

選擇采集實(shí)際上包括兩部分工作,即選擇和采集。選擇就是對(duì)網(wǎng)頁采集范圍的確定,這里的選擇就像是檔案管理的鑒定工作一樣有難度,檔案是否具有保存價(jià)值很難有一個(gè)明確的鑒定標(biāo)準(zhǔn),同樣,政府網(wǎng)站網(wǎng)頁是否具有保存價(jià)值也是沒有明確的選擇標(biāo)準(zhǔn)。有的部門對(duì)網(wǎng)站的所有網(wǎng)頁全部采集,又叫廣泛式采集,中國 Web博物館項(xiàng)目和 WICP等項(xiàng)目采取的就是全面網(wǎng)頁采集方式,這種方式可以避免選擇網(wǎng)頁采集的范圍,容易操作,但是同時(shí)反映出的問題也很明顯。根據(jù)第46次中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告,截至2020年6月,我國共有政府網(wǎng)站14467個(gè),各行政級(jí)別政府網(wǎng)站共開通欄目數(shù)量29.4萬個(gè),各行政級(jí)別網(wǎng)站首頁文章更新量較2019年底增長20.1%,在線政務(wù)服務(wù)用戶規(guī)模達(dá)7.73億[13],可見政府網(wǎng)站網(wǎng)頁數(shù)量增長速度驚人,在這種情況下對(duì)政府網(wǎng)頁信息全部采集會(huì)非常耗時(shí)耗力,而且并不是所有的網(wǎng)頁都具有保存價(jià)值,如果對(duì)歸檔網(wǎng)頁內(nèi)容不加以鑒別和篩選,就可能導(dǎo)致無用網(wǎng)頁信息堆積,占據(jù)大量存儲(chǔ)空間[14]?!吨改稀芬呀?jīng)給出了網(wǎng)頁歸檔范圍的參考目錄,范圍包括網(wǎng)站首頁及欄目首頁,信息發(fā)布類頁面、解讀回應(yīng)類頁面、辦事服務(wù)類頁面、互動(dòng)交流類頁面以及其他具有保存價(jià)值的頁面。在實(shí)際歸檔工作中,政府網(wǎng)站應(yīng)綜合分析網(wǎng)頁信息的重要程度制定相應(yīng)的網(wǎng)頁信息歸檔范圍,根據(jù)歸檔范圍選擇性采集。

采集方式分兩種,對(duì)于歸檔范圍確定的網(wǎng)頁直接利用爬蟲工具進(jìn)行自動(dòng)采集;而對(duì)于其他沒有明確規(guī)定的內(nèi)容則需要人工采集。一般比較常用的爬蟲工具包括由IA、IIPC成員圖書館開發(fā)的Heritrix工具、法國圖書館開發(fā)的HTTrack工具以及Heritrix的升級(jí)版Smart Crawler工具?!吨改稀窙]有指定具體的采集工具,但是對(duì)采集的文件格式有所限制。國際歸檔格式標(biāo)準(zhǔn)是WARC,WARC格式是由ARC擴(kuò)展而來的,國外對(duì)網(wǎng)站網(wǎng)頁和社交媒體歸檔普遍采用WARC格式,WARC格式的特點(diǎn)包括采集資源描述詳細(xì)、支持資源內(nèi)容分割重組、支持外部語義關(guān)聯(lián)、便于存檔和壓縮等[15]。因此我國一些試點(diǎn)單位采用WARC格式歸檔。

2.3.2 組織保存

利用爬蟲工具采集信息后要對(duì)采集到的網(wǎng)頁進(jìn)行歸檔保存,因此接下來的組織保存工作更為關(guān)鍵。這個(gè)步驟同樣包括兩個(gè)環(huán)節(jié),即整理分類和內(nèi)部存儲(chǔ)。和紙質(zhì)檔案歸檔工作一樣,采集到的信息須進(jìn)行有序地整理分類后再歸檔保存,這樣才能方便后期的檢索利用,如果不分類整理,后期將很難檢索到滿足需求的網(wǎng)頁內(nèi)容。網(wǎng)頁分類可包括欄目首頁、信息發(fā)布、解讀回應(yīng)、辦事服務(wù)或其他等,政府網(wǎng)站主辦單位應(yīng)根據(jù)本單位具體政務(wù)活動(dòng)內(nèi)容制定個(gè)性化的分類標(biāo)準(zhǔn),如自然資源部門戶網(wǎng)站網(wǎng)頁歸檔分類就包括風(fēng)貌、內(nèi)容和專題三類。分類后根據(jù)歸檔時(shí)間、年度、分類名稱、保管期限等信息參考《指南》中提到的編號(hào)標(biāo)準(zhǔn)為網(wǎng)頁檔案編號(hào),完成編號(hào)的網(wǎng)頁檔案就可以采用層級(jí)文件夾的形式存儲(chǔ)。上文提到采集到的網(wǎng)頁格式是WARC格式,WARC格式雖然有很多優(yōu)勢并且得到普遍應(yīng)用,但是它也存在一些不足:各種靜態(tài)和動(dòng)態(tài)的網(wǎng)頁格式在不同時(shí)期或不同版本的瀏覽器上會(huì)出現(xiàn)顯示的差異,因此單純地歸檔WARC格式很難保障網(wǎng)頁長期保存的可用性[16],對(duì)歸檔網(wǎng)頁雙格式備份保存很有必要。我國自然資源部信息中心試點(diǎn)就是采用OFD格式對(duì)歸檔網(wǎng)頁備份,這樣更能保障歸檔網(wǎng)頁的可用性,OFD格式也會(huì)損失一些動(dòng)態(tài)網(wǎng)頁,具有一定局限,未來還需要探究和發(fā)掘更適用網(wǎng)頁歸檔的格式,但是目前還是需要采用雙格式備份以保障政府網(wǎng)頁歸檔的真實(shí)性和可用性。另一方面,政府網(wǎng)站主辦單位應(yīng)定期向檔案館移交網(wǎng)頁檔案,確保政府網(wǎng)頁檔案更好得到利用。在保存方面,我們也應(yīng)注意到,政府網(wǎng)頁數(shù)量飛速增長,網(wǎng)頁檔案的存儲(chǔ)空間需求劇增,除了普遍的存儲(chǔ)環(huán)節(jié),還應(yīng)積極利用云存儲(chǔ)空間為政府網(wǎng)站網(wǎng)頁歸檔提供支持和保障,同時(shí)也可以確保未來各類網(wǎng)站網(wǎng)頁歸檔擁有充足的存儲(chǔ)空間。

2.3.3 開發(fā)利用與訪問檢索

政府網(wǎng)頁記錄政務(wù)公開與政務(wù)服務(wù)工作,具有憑證和保存價(jià)值。對(duì)于歸檔保存的政府網(wǎng)頁應(yīng)充分地開發(fā)與挖掘,為用戶提供利用服務(wù)。英國國家檔案館網(wǎng)站首頁設(shè)置一項(xiàng)功能欄為“幫助您的研究(Help with your research)”,其中的英國政府網(wǎng)站檔案就是幫助學(xué)者研究的信息資源的一部分,可見政府網(wǎng)站檔案對(duì)于學(xué)者來說是研究的重要來源。開發(fā)與利用是政府網(wǎng)頁信息資源的深層次挖掘,而允許用戶訪問與檢索已歸檔的政府網(wǎng)頁是網(wǎng)頁歸檔的根本目的和價(jià)值所在。在訪問與檢索環(huán)節(jié),將會(huì)面臨權(quán)限和法律等的限制。一方面,歸檔的網(wǎng)頁涉及的采集權(quán)、保管權(quán)、利用權(quán)和隱私權(quán)等都需要嚴(yán)格符合法律標(biāo)準(zhǔn),以確保訪問檢索的權(quán)限范圍;另一方面,影響政府網(wǎng)頁資源開發(fā)與利用的因素還有涉及呈繳制度和知識(shí)產(chǎn)權(quán)等法律問題,這些客觀問題則需要對(duì)法律權(quán)限有嚴(yán)格的控制,保護(hù)各方的利益和權(quán)利。政府網(wǎng)頁內(nèi)容涉及的主體多樣,內(nèi)容來源復(fù)雜,因此涉及某個(gè)機(jī)構(gòu)或個(gè)人的權(quán)利時(shí)需要遵循各方意愿。例如英國國家檔案館的移除與封閉政策就規(guī)定,要對(duì)機(jī)構(gòu)或個(gè)人提出的對(duì)某個(gè)網(wǎng)頁不開放或刪除的要求進(jìn)行評(píng)議,通過評(píng)議后封閉或刪除相關(guān)內(nèi)容[17]。

3 我國政府網(wǎng)頁歸檔體系發(fā)展策略

隨著電子文件數(shù)量的增長和對(duì)電子文件長期保存問題研究的深入,政府網(wǎng)站網(wǎng)頁歸檔在近些年逐漸受到關(guān)注,我國對(duì)政府網(wǎng)站網(wǎng)頁歸檔工作的實(shí)踐不夠成熟,還沒有科學(xué)系統(tǒng)的政府網(wǎng)頁歸檔體系,除了按照《指南》和前文所構(gòu)建的政府網(wǎng)頁歸檔體系的流程實(shí)施外,要想使體系更加成熟可行,需要從以下幾個(gè)方面完善優(yōu)化。

3.1 多方合作

政府網(wǎng)頁歸檔工作單獨(dú)依靠檔案部門是無法順利開展的,因此必須積極與外界合作,共同實(shí)現(xiàn)政府網(wǎng)頁歸檔。通過合作獲得包括資金、技術(shù)以及理念的支持,可以學(xué)習(xí)英國政府網(wǎng)頁檔案館,立足自己的需求,尋求與技術(shù)供應(yīng)商、研究所、基金會(huì)、用戶等組織和個(gè)人開展廣泛合作[18]。網(wǎng)頁歸檔后需要定期對(duì)系統(tǒng)進(jìn)行維護(hù),同時(shí)還要確保網(wǎng)頁信息的安全,技術(shù)維護(hù)和系統(tǒng)運(yùn)行都需要一定的資金支持,這就需要政府機(jī)構(gòu)申請(qǐng)用于已歸檔政府網(wǎng)頁的后續(xù)維護(hù)和保存的資金。同樣可以參考各個(gè)國家和試點(diǎn)成功部門的經(jīng)驗(yàn),結(jié)合實(shí)際需求和現(xiàn)實(shí)狀況制定歸檔策略。當(dāng)然,從利用的角度出發(fā),政府網(wǎng)頁歸檔還需要用戶需求調(diào)研,為網(wǎng)頁歸檔采集范圍提供參考。只有多方協(xié)同合作,才能使政府部門不斷適應(yīng)理念和技術(shù)的更迭,保持技術(shù)先進(jìn)性和活力,為利用者提供最佳用戶體驗(yàn)。

3.2 法律完善

阻礙政府歸檔網(wǎng)頁開放利用的主要因素就在于法律權(quán)限問題,主要涉及呈繳制度和知識(shí)產(chǎn)權(quán)等相關(guān)法律。我國對(duì)政府網(wǎng)頁歸檔的法律法規(guī)制定不完善,因此在工作執(zhí)行過程中缺乏法律保障,開放范圍也會(huì)受限。美國已經(jīng)通過立法規(guī)定圖書館或其他機(jī)構(gòu)有權(quán)力保存和開放利用這部分資源,為網(wǎng)頁歸檔項(xiàng)目的實(shí)施和發(fā)展提供了法律支持。同時(shí),美國版權(quán)法支持的“合理使用”和“默示許可”,逐漸成為普遍的網(wǎng)絡(luò)資源保存和利用的適用法律準(zhǔn)則,許多網(wǎng)頁歸檔項(xiàng)目的實(shí)施主體也在研究“免責(zé)條款”以規(guī)避法律風(fēng)險(xiǎn)[19]。我國也應(yīng)該積極建議立法部門針對(duì)政府網(wǎng)頁內(nèi)涉及的權(quán)利主體完善法律規(guī)定,保障各方權(quán)益。例如,很多國家已經(jīng)將政府社交媒體的內(nèi)容劃分到政府網(wǎng)頁歸檔部分,這里應(yīng)對(duì)政府社交媒體中的網(wǎng)民評(píng)論的采集權(quán)、利用權(quán)、隱私權(quán)等作出明確規(guī)定,對(duì)于侵權(quán)部分,公民可以依照法律法條維護(hù)自身權(quán)益,提交撤銷相應(yīng)內(nèi)容的申請(qǐng)。法律法條先行,才能讓政府網(wǎng)頁歸檔工作有法可依,從而確保政府歸檔網(wǎng)頁資源的開放與利用。

3.3 利用為王

雖然國外網(wǎng)頁歸檔工作先于我國并取得一定的成績,有很多成功案例和經(jīng)驗(yàn),但是我國在借鑒經(jīng)驗(yàn)的同時(shí)也要走出自己的特色,符合我國國情,不應(yīng)照搬照抄?;趪馀老x工具和法律制定經(jīng)驗(yàn),針對(duì)采集內(nèi)容和范圍我們要遵循“利用為王”的原則,政府網(wǎng)頁歸檔最終目的是利用,因此對(duì)于最復(fù)雜最困難的采集工作以及開放范圍的確定,應(yīng)做好前期工作,調(diào)研用戶利用需求,優(yōu)化政府網(wǎng)頁檢索與利用界面,豐富歸檔資源類型。這些工作除了需要用戶配合調(diào)研外,離不開技術(shù)部門和信息部門的支持,對(duì)于不同類型的信息資源,還沒有全部具有穩(wěn)定的技術(shù)保障,這就需要政府部門聯(lián)合技術(shù)研究部門,提供足夠的資金保障技術(shù)研發(fā)。這個(gè)過程不是一蹴而就的,而是需要不斷實(shí)驗(yàn)和調(diào)整優(yōu)化的進(jìn)步過程,這一切都是為了最終用戶的檢索利用體驗(yàn),實(shí)現(xiàn)網(wǎng)頁信息資源的價(jià)值。

4 結(jié)語

政府網(wǎng)站網(wǎng)頁歸檔在國外研究和應(yīng)用較早,隨著網(wǎng)絡(luò)時(shí)代網(wǎng)頁數(shù)量的增加,我國網(wǎng)頁歸檔工作提上日程,政府部門政務(wù)工作形成的網(wǎng)頁和網(wǎng)頁資源具有研究價(jià)值、憑證價(jià)值,同時(shí)也是社會(huì)記憶的重要組成部分,應(yīng)當(dāng)對(duì)其長久保存。本文參考最新發(fā)布的《政府網(wǎng)站網(wǎng)頁歸檔指南》,通過國內(nèi)外網(wǎng)頁歸檔實(shí)踐構(gòu)建了一個(gè)比較清晰的框架體系,體系包含的網(wǎng)頁歸檔工作內(nèi)容較為全面,為我國實(shí)際網(wǎng)頁歸檔工作提供借鑒。但是由于篇幅限制,沒有將云存儲(chǔ)在政府網(wǎng)頁歸檔工作中的應(yīng)用展開研究,這也將是該主題未來的研究熱點(diǎn)。事實(shí)上,構(gòu)建的政府網(wǎng)頁歸檔體系只是參考框架,實(shí)際應(yīng)用還需要各個(gè)政府部門借鑒成功經(jīng)驗(yàn),根據(jù)本部門的實(shí)際情況構(gòu)建適合自己的歸檔體系,積極展開合作,推動(dòng)相關(guān)法律的完善,這是一個(gè)循序漸進(jìn)的過程,需要多方共同努力促進(jìn)政府網(wǎng)頁歸檔體系的完善。

猜你喜歡
網(wǎng)頁檢索政府
2019年第4-6期便捷檢索目錄
知法犯法的政府副秘書長
基于CSS的網(wǎng)頁導(dǎo)航欄的設(shè)計(jì)
電子制作(2018年10期)2018-08-04 03:24:38
基于URL和網(wǎng)頁類型的網(wǎng)頁信息采集研究
電子制作(2017年2期)2017-05-17 03:54:56
專利檢索中“語義”的表現(xiàn)
專利代理(2016年1期)2016-05-17 06:14:36
依靠政府,我們才能有所作為
網(wǎng)頁制作在英語教學(xué)中的應(yīng)用
電子測試(2015年18期)2016-01-14 01:22:58
政府手里有三種工具
10個(gè)必知的網(wǎng)頁設(shè)計(jì)術(shù)語
國際標(biāo)準(zhǔn)檢索
洛隆县| 渝北区| 城口县| 湘潭县| 高邮市| 宣武区| 宁河县| 清远市| 河东区| 龙山县| 福海县| 乌兰察布市| 竹北市| 通许县| 惠州市| 清涧县| 龙里县| 大姚县| 冷水江市| 临澧县| 驻马店市| 荆州市| 阿鲁科尔沁旗| 和林格尔县| 定远县| 浦江县| 衡水市| 北流市| 准格尔旗| 延庆县| 长垣县| 卓资县| 曲水县| 远安县| 温宿县| 伊川县| 金阳县| 洱源县| 达州市| 遵化市| 达日县|