国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于云計(jì)算的政府網(wǎng)站網(wǎng)頁(yè)在線歸檔管理平臺(tái)構(gòu)建研究

2019-12-30 01:45:07黃新平
北京檔案 2019年12期
關(guān)鍵詞:網(wǎng)頁(yè)利用政府

摘要:將云計(jì)算應(yīng)用到政府網(wǎng)站網(wǎng)頁(yè)的長(zhǎng)期保存中,發(fā)揮其技術(shù)與管理優(yōu)勢(shì),能夠高效率、低成本地實(shí)現(xiàn)海量政府網(wǎng)頁(yè)的在線歸檔和集成管理。文章依據(jù)文件生命周期理論、OAIS參考模型等理論,設(shè)計(jì)了政府網(wǎng)站網(wǎng)頁(yè)在線歸檔的業(yè)務(wù)流程。在此基礎(chǔ)上,文章結(jié)合云計(jì)算服務(wù)體系結(jié)構(gòu),界定了云環(huán)境下政府網(wǎng)站網(wǎng)頁(yè)歸檔的邏輯體系,并依此構(gòu)建基于云計(jì)算的政府網(wǎng)站網(wǎng)頁(yè)在線歸檔管理平臺(tái),平臺(tái)具有云上在線采集、云下數(shù)據(jù)管理、云中資源保存、云端訪問(wèn)利用等重要功能。

關(guān)鍵詞:云計(jì)算政府網(wǎng)站網(wǎng)頁(yè)存檔長(zhǎng)期保存

Abstract: Applying cloud computing to the longterm preservation of government website pages, le? veraging its technical and management advantages, it can realize massive government web pages online archiving and integrated management with high effi? ciency and low cost. According to the theory of docu? ment life cycle and OAIS reference model, this paper designs the business process of government web? site pages online archiving. On this basis, combined with the architecture of cloud computing services, de? fines the logical system of government website pag? es archiving in cloud environment, and builds a cloud- based online archiving management platform for government website pages, which has important functions such as online cloud collection, data man? agement under cloud, resource preservation in cloud, and cloud access utilization.

Key words: Cloud computing; Government web? site; Web archive; Long-term preservation

近年來(lái),隨著我國(guó)政府信息公開(kāi)工作的不斷推進(jìn),政府部門主動(dòng)公開(kāi)信息的范圍和深度日益擴(kuò)大,越來(lái)越多的政務(wù)信息通過(guò)政府門戶網(wǎng)站以網(wǎng)頁(yè)的形式創(chuàng)建、發(fā)布、傳播和利用。這些網(wǎng)頁(yè)作為互聯(lián)網(wǎng)時(shí)代政府行政過(guò)程的真實(shí)記錄,具有重要的追溯憑證、決策參考與科學(xué)研究?jī)r(jià)值。然而,由于網(wǎng)絡(luò)資源的易消失性、動(dòng)態(tài)不穩(wěn)定性,大量以“孤本”形式存在的政府網(wǎng)頁(yè)會(huì)因網(wǎng)站的整合遷移、改版更新等操作面臨“丟失”“無(wú)法顯示”的風(fēng)險(xiǎn)。2017年國(guó)務(wù)院辦公廳印發(fā)了《政府網(wǎng)站發(fā)展指引》的通知,要求各級(jí)政府網(wǎng)站做好網(wǎng)頁(yè)歸檔工作。[1]如何有效實(shí)現(xiàn)具有保存價(jià)值的政府網(wǎng)站網(wǎng)頁(yè)的長(zhǎng)期可存取已成為當(dāng)前政府面臨的新挑戰(zhàn)和學(xué)界探索的新課題。

云計(jì)算作為一種新型的IT服務(wù)資源,應(yīng)用日益廣泛,它所采用的集約化、虛擬化、分布式計(jì)算等綠色節(jié)能技術(shù),以及即插即用、動(dòng)態(tài)架構(gòu)、智能運(yùn)作的服務(wù)方式,能高效、低成本地實(shí)現(xiàn)政府網(wǎng)站網(wǎng)頁(yè)的在線歸檔和集成管理。[2]本文將“云計(jì)算”創(chuàng)新性地應(yīng)用到政府網(wǎng)站網(wǎng)頁(yè)的長(zhǎng)期保存中,發(fā)揮其技術(shù)、管理與成本優(yōu)勢(shì),突破原有的網(wǎng)絡(luò)資源歸檔管理平臺(tái)建設(shè)模式,構(gòu)建基于云計(jì)算的政府網(wǎng)站網(wǎng)頁(yè)在線歸檔管理平臺(tái),為大數(shù)據(jù)環(huán)境下政府網(wǎng)站網(wǎng)頁(yè)長(zhǎng)期可存取問(wèn)題的解決提供新思路和新方案。

一、政府網(wǎng)站網(wǎng)頁(yè)在線歸檔的業(yè)務(wù)流程設(shè)計(jì)

政府網(wǎng)站網(wǎng)頁(yè)是政府部門在履行行政職能和處理行政事務(wù)過(guò)程中,利用其門戶網(wǎng)站創(chuàng)作或接收的具有特定內(nèi)容、結(jié)構(gòu)和背景信息的原始記錄,它符合文件的基本特征,是政府電子文件的重要組成部分。[3]因此,指導(dǎo)電子文件歸檔管理的文件生命周期理論、開(kāi)放檔案信息系統(tǒng)(OAIS)模型等同樣適用于政府網(wǎng)站網(wǎng)頁(yè)的歸檔管理。根據(jù)文件生命周期理論,可以將政府網(wǎng)頁(yè)的創(chuàng)建、發(fā)布、獲取、存檔、利用等視為一個(gè)完整的生命過(guò)程。OAIS模型是當(dāng)前國(guó)際上公認(rèn)的實(shí)現(xiàn)電子文件等數(shù)字資源長(zhǎng)期可存取的標(biāo)準(zhǔn)參考模型和基本概念框架,其功能結(jié)構(gòu)包含信息采集、數(shù)據(jù)管理、資源存儲(chǔ)、系統(tǒng)管控、保存規(guī)劃、訪問(wèn)利用等模塊,不同功能模塊之間以信息包的形式對(duì)資源內(nèi)容信息和保存描述信息等信息對(duì)象進(jìn)行傳遞,從而實(shí)現(xiàn)歸檔資源的長(zhǎng)久保存與利用。[4]基于以上分析,參照政府網(wǎng)站網(wǎng)頁(yè)的生命運(yùn)動(dòng)規(guī)律,以及OAIS模型的標(biāo)準(zhǔn)業(yè)務(wù)與功能邏輯,可將其歸檔流程劃分為采集、分類、著錄、鑒定、保存、利用等主要階段,每個(gè)階段的任務(wù)各不相同。

(一)網(wǎng)頁(yè)采集

網(wǎng)頁(yè)采集作為政府網(wǎng)站網(wǎng)頁(yè)在線歸檔的首要環(huán)節(jié),就是利用相關(guān)工具,以既定的頻率和方式,及時(shí)選擇值得保存的政府網(wǎng)頁(yè)內(nèi)容。網(wǎng)頁(yè)采集的第一步是要確定采集對(duì)象,政府網(wǎng)頁(yè)歸檔保存的信息采集對(duì)象是域名中含有“gov.cn”的政府網(wǎng)站,為確保政府網(wǎng)頁(yè)的采集質(zhì)量,需要對(duì)目標(biāo)網(wǎng)站進(jìn)行評(píng)價(jià),將那些信息規(guī)模大、原生性信息多、更新頻繁的政府網(wǎng)站選定為采集對(duì)象。[5]在確定要采集的目標(biāo)政府網(wǎng)站之后,還應(yīng)根據(jù)實(shí)際需求選擇相應(yīng)的采集方式。完整性采集和選擇性采集是目前比較常用的網(wǎng)絡(luò)資源采集方式,它們各有優(yōu)缺點(diǎn),為了彌補(bǔ)其各自的不足,可以實(shí)現(xiàn)兩種采集方式的優(yōu)勢(shì)互補(bǔ),采用融合二者優(yōu)點(diǎn)的混合型采集方式,在對(duì)選定的政府網(wǎng)站中所有網(wǎng)頁(yè)進(jìn)行完整性采集的同時(shí),通過(guò)人工干預(yù)的方式對(duì)網(wǎng)頁(yè)內(nèi)容進(jìn)行甄別,對(duì)其中有證據(jù)價(jià)值、歷史價(jià)值、研究?jī)r(jià)值的重要網(wǎng)頁(yè),有選擇性地進(jìn)行深層次的頻繁采集,這樣既考慮到了政府網(wǎng)頁(yè)采集面的廣度,同時(shí)又照顧到了重要網(wǎng)頁(yè)采集的深度。而網(wǎng)頁(yè)的采集與捕獲最終還需要依靠相應(yīng)的網(wǎng)絡(luò)爬蟲(chóng)工具來(lái)實(shí)現(xiàn),目前面向網(wǎng)頁(yè)存檔的爬蟲(chóng)工具比較多,其中Heritrix、HTTrack最為常用,可利用這些工具來(lái)有針對(duì)性地完成對(duì)目標(biāo)政府網(wǎng)站網(wǎng)頁(yè)的自動(dòng)批量在線采集。

(二)數(shù)據(jù)管理

利用網(wǎng)絡(luò)爬蟲(chóng)工具從不同目標(biāo)政府網(wǎng)站中采集獲取的網(wǎng)頁(yè)是海量且無(wú)序的,還應(yīng)對(duì)其實(shí)施整理、分類、著錄、編目、鑒定等數(shù)據(jù)管理操作,實(shí)現(xiàn)信息的規(guī)則排序,使其具備增值的潛能,為后續(xù)的資源存儲(chǔ)和訪問(wèn)利用奠定基礎(chǔ)。[6]首先,資源分類。根據(jù)采集網(wǎng)頁(yè)資源的特點(diǎn),可以按照來(lái)源機(jī)構(gòu)、資源主題、格式類型等分類標(biāo)準(zhǔn),將其中具有某種共同屬性特征的網(wǎng)頁(yè)資源進(jìn)行歸類和整合,建立規(guī)范統(tǒng)一的政府網(wǎng)站網(wǎng)頁(yè)資源分類體系,通過(guò)不同類別的屬性特征來(lái)對(duì)海量的政府網(wǎng)頁(yè)內(nèi)容進(jìn)行區(qū)分。其次,編目著錄。對(duì)分類后的網(wǎng)頁(yè)資源還應(yīng)基于統(tǒng)一的元數(shù)據(jù)標(biāo)準(zhǔn)對(duì)其內(nèi)容及結(jié)構(gòu)、來(lái)源、背景等特征進(jìn)行揭示和描述,并在相關(guān)元數(shù)據(jù)之間建立聯(lián)系,形成政府網(wǎng)站網(wǎng)頁(yè)資源目錄體系,實(shí)現(xiàn)對(duì)海量無(wú)序網(wǎng)頁(yè)信息的序化組織。最后,鑒定整理。政府網(wǎng)頁(yè)的鑒定整理主要包括內(nèi)容的識(shí)別以及內(nèi)容的可用性判斷,其中內(nèi)容的識(shí)別就是確保實(shí)現(xiàn)政府網(wǎng)頁(yè)長(zhǎng)期可存取的元數(shù)據(jù)、保存策略等信息要素齊全。內(nèi)容的可用性判斷即是通過(guò)人工干預(yù)來(lái)對(duì)政府網(wǎng)頁(yè)的形成背景、內(nèi)容質(zhì)量、重要程度等屬性特征進(jìn)行全面分析,并根據(jù)保管期限表對(duì)要?dú)w檔的政府網(wǎng)頁(yè)標(biāo)記相應(yīng)的鑒定標(biāo)識(shí)。

(三)資源保存

資源保存是實(shí)現(xiàn)政府網(wǎng)站網(wǎng)頁(yè)在線歸檔的核心,與靜態(tài)的數(shù)字資源存儲(chǔ)不同,政府網(wǎng)頁(yè)資源結(jié)構(gòu)復(fù)雜且動(dòng)態(tài)增長(zhǎng),其復(fù)雜性、動(dòng)態(tài)性、技術(shù)依賴性強(qiáng)等特點(diǎn)對(duì)存儲(chǔ)管理提出了挑戰(zhàn),它更依賴能夠滿足海量歸檔網(wǎng)頁(yè)資源的動(dòng)態(tài)存儲(chǔ)需求及長(zhǎng)期可訪問(wèn)要求的長(zhǎng)久保存策略和相應(yīng)的存儲(chǔ)架構(gòu)。[7]在長(zhǎng)久保存策略的設(shè)計(jì)上,通??筛鶕?jù)歸檔網(wǎng)頁(yè)資源的類型和結(jié)構(gòu),有針對(duì)性地選擇數(shù)據(jù)加密、檢測(cè)、備份、遷移、仿真、封裝等相結(jié)合的長(zhǎng)期保存技術(shù)策略,確保歸檔網(wǎng)頁(yè)資源的安全、完整、可靠及長(zhǎng)期可用。在存儲(chǔ)架構(gòu)的選擇上,可以在當(dāng)前數(shù)字資源長(zhǎng)期保存采用的直接連接存儲(chǔ)、網(wǎng)絡(luò)連接存儲(chǔ)等傳統(tǒng)存儲(chǔ)架構(gòu)的基礎(chǔ)上,引入云存儲(chǔ)技術(shù),將分布在網(wǎng)絡(luò)中的數(shù)據(jù)倉(cāng)庫(kù)、數(shù)據(jù)庫(kù)、文件存儲(chǔ)系統(tǒng)等不同類型的存儲(chǔ)設(shè)備“聯(lián)合”在一起,利用云存儲(chǔ)的分布式存取和存儲(chǔ)節(jié)點(diǎn)可動(dòng)態(tài)擴(kuò)展的技術(shù)優(yōu)勢(shì),以及云存儲(chǔ)服務(wù)端提供的數(shù)據(jù)備份、容災(zāi)處理、數(shù)據(jù)加密等安全保障機(jī)制,實(shí)現(xiàn)對(duì)海量歸檔政府網(wǎng)頁(yè)資源的實(shí)時(shí)動(dòng)態(tài)存儲(chǔ)和長(zhǎng)期安全保存。

(四)訪問(wèn)利用

訪問(wèn)利用是政府網(wǎng)站網(wǎng)頁(yè)在線歸檔要完成的最后一個(gè)環(huán)節(jié),這既是歸檔的最終目的,也是歸檔的價(jià)值所在。通常可以提供以下幾種服務(wù)方式,來(lái)將歸檔的政府網(wǎng)頁(yè)提供給用戶使用。一是檢索查詢。瀏覽檢索是用戶訪問(wèn)和獲取存儲(chǔ)資源的基本服務(wù),為了方便用戶快速、準(zhǔn)確地找到所需的資源,需要提供功能完善的檢索系統(tǒng)。二是網(wǎng)頁(yè)還原??衫镁W(wǎng)頁(yè)重現(xiàn)技術(shù)將歸檔存儲(chǔ)的網(wǎng)頁(yè)內(nèi)容以其原有的樣貌呈現(xiàn)給用戶,即當(dāng)用戶訪問(wèn)政府網(wǎng)站遇到網(wǎng)頁(yè)無(wú)法鏈接或無(wú)法顯示等錯(cuò)誤信息時(shí),將被自動(dòng)定向到對(duì)應(yīng)的歸檔網(wǎng)頁(yè)鏈接地址,以還原歸檔網(wǎng)頁(yè)的原始內(nèi)容。三是決策參考。利用大數(shù)據(jù)分析、Web挖掘等技術(shù)對(duì)歸檔的海量政府網(wǎng)頁(yè)進(jìn)行深度的數(shù)據(jù)挖掘,獲取隱含其中的有用知識(shí),為用戶決策提供參考。四是可視化分析。利用數(shù)據(jù)可視化組件、工具和技術(shù),將歸檔存儲(chǔ)的海量政府網(wǎng)頁(yè)數(shù)據(jù)分析結(jié)果以可視化圖形或圖像的形式呈現(xiàn)。

二、基于云計(jì)算的政府網(wǎng)站網(wǎng)頁(yè)歸檔的邏輯體系

云計(jì)算是在網(wǎng)格計(jì)算、分布式計(jì)算、并行計(jì)算的基礎(chǔ)上發(fā)展形成的一種新的計(jì)算模式,其核心思想是遵循數(shù)據(jù)資源即服務(wù)(DaaS)、軟件即服務(wù)(SaaS)、基礎(chǔ)設(shè)施即服務(wù)(IaaS)、平臺(tái)即服務(wù)(PaaS)、創(chuàng)新管理即服務(wù)(MaaS)、渠道即服務(wù)(CaaS)等新生的服務(wù)理念,利用先進(jìn)的網(wǎng)絡(luò)技術(shù)整合大量計(jì)算、存儲(chǔ)等IT資源,通過(guò)對(duì)IT資源的集成共享與便捷利用,使終端用戶擺脫煩瑣的資源管理和系統(tǒng)建設(shè),只需專注于業(yè)務(wù)。[8]基于云計(jì)算的思想,政府網(wǎng)站網(wǎng)頁(yè)歸檔的邏輯體系可以分為云技術(shù)、云業(yè)務(wù)、云服務(wù)三個(gè)層次,如圖1所示。

(一)云技術(shù)

利用虛擬化技術(shù)和分布式資源調(diào)度程序?qū)⒎?wù)器、存儲(chǔ)設(shè)備、網(wǎng)絡(luò)設(shè)備、安全防護(hù)設(shè)備等硬件資源連接起來(lái),并進(jìn)行邏輯分割,形成可以動(dòng)態(tài)管理、統(tǒng)一調(diào)度的“資源池”,通過(guò)物理資源的集成共享,為政府網(wǎng)站網(wǎng)頁(yè)歸檔業(yè)務(wù)流程的實(shí)現(xiàn)提供所需的計(jì)算、存儲(chǔ)、服務(wù)等IT資源;進(jìn)而通過(guò)整合政府網(wǎng)頁(yè)歸檔所需的基礎(chǔ)設(shè)施、平臺(tái)及軟硬件資源,使歸檔工作專注于網(wǎng)頁(yè)采集、數(shù)據(jù)管理、資源存儲(chǔ)、訪問(wèn)利用等業(yè)務(wù)操作和管理,而非歸檔系統(tǒng)的構(gòu)建和維護(hù),實(shí)現(xiàn)政府網(wǎng)站網(wǎng)頁(yè)歸檔系統(tǒng)的云端部署與自由訪問(wèn)。

(二)云業(yè)務(wù)

參照電子文件歸檔的相關(guān)標(biāo)準(zhǔn)規(guī)范,對(duì)政府網(wǎng)站網(wǎng)頁(yè)歸檔的業(yè)務(wù)流程進(jìn)行拆分和封裝,使業(yè)務(wù)流程具備可復(fù)制、可重組和可遷移的特性。在此基礎(chǔ)上,采用基于彈性部署的云計(jì)算業(yè)務(wù)處理中間件及其提供的API接口,通過(guò)數(shù)據(jù)交互、資源共享、動(dòng)態(tài)拓展、智能運(yùn)作等方式實(shí)現(xiàn)政府網(wǎng)站網(wǎng)頁(yè)歸檔相關(guān)應(yīng)用程序的整合,并對(duì)云技術(shù)支撐的網(wǎng)頁(yè)采集管理、元數(shù)據(jù)管理、保存策略管理、數(shù)據(jù)安全管理、訪問(wèn)利用管理等業(yè)務(wù)邏輯實(shí)施協(xié)同管理,從而實(shí)現(xiàn)政府網(wǎng)頁(yè)歸檔流程的業(yè)務(wù)協(xié)同與云端處理。

(三)云服務(wù)

對(duì)政府網(wǎng)站網(wǎng)頁(yè)歸檔的體系結(jié)構(gòu)與業(yè)務(wù)流程進(jìn)行解構(gòu)、標(biāo)準(zhǔn)化,在云技術(shù)與云業(yè)務(wù)支持下,重塑政府網(wǎng)頁(yè)歸檔的資源組織、流程部署和管理方式,使其可以實(shí)現(xiàn)按需彈性調(diào)度和分配。同時(shí)通過(guò)構(gòu)建面向終端服務(wù)的瀏覽器/服務(wù)器模式,解決“云端”用戶獲取系統(tǒng)提供的各項(xiàng)業(yè)務(wù)功能服務(wù)問(wèn)題?;谠撃J娇蓪⑾到y(tǒng)應(yīng)用程序的流程管理、資源分配、業(yè)務(wù)處理、數(shù)據(jù)存取等操作集中在云業(yè)務(wù)層進(jìn)行處理。用戶利用各種終端設(shè)備,通過(guò)瀏覽器即可獲得相應(yīng)的網(wǎng)頁(yè)采集、管理、保存、利用等業(yè)務(wù)服務(wù)。

三、基于云計(jì)算的政府網(wǎng)站網(wǎng)頁(yè)在線歸檔管理平臺(tái)構(gòu)建

(一)平臺(tái)構(gòu)建的思路

目前學(xué)術(shù)界關(guān)于云環(huán)境下數(shù)字資源歸檔系統(tǒng)的構(gòu)建主要借鑒OAIS模型的分層思想對(duì)系統(tǒng)進(jìn)行設(shè)計(jì),[9][10][11]這種思路是按照OAIS模型的功能實(shí)體與云計(jì)算服務(wù)體系結(jié)構(gòu)之間的邏輯映射關(guān)系來(lái)設(shè)計(jì)的。該思路的層級(jí)維度比較清晰,可較為系統(tǒng)地反映數(shù)字資源歸檔過(guò)程中各個(gè)環(huán)節(jié)的功能要素與業(yè)務(wù)流程。在實(shí)踐層面,國(guó)外已經(jīng)有存儲(chǔ)機(jī)構(gòu)將云計(jì)算應(yīng)用到網(wǎng)絡(luò)資源的長(zhǎng)期保存中,并構(gòu)建了相應(yīng)的網(wǎng)絡(luò)服務(wù)平臺(tái),F(xiàn)edorazon、DuraCloud是其中兩個(gè)有代表性的項(xiàng)目,這些平臺(tái)利用云環(huán)境下的各種服務(wù)資源實(shí)現(xiàn)了歸檔網(wǎng)絡(luò)資源的實(shí)時(shí)歸檔、全程控制、長(zhǎng)期存取及創(chuàng)新服務(wù)功能,主要包括采集、保存、訪問(wèn)、再利用和云分享等。以上這些理論研究與實(shí)踐探索成果為平臺(tái)的構(gòu)建提供了重要參考與指導(dǎo)。

(二)平臺(tái)的體系架構(gòu)

在以上研究?jī)?nèi)容的基礎(chǔ)上,筆者根據(jù)云計(jì)算服務(wù)體系結(jié)構(gòu),參照國(guó)內(nèi)外相關(guān)的行業(yè)標(biāo)準(zhǔn)規(guī)范,結(jié)合上述政府網(wǎng)站網(wǎng)頁(yè)在線歸檔的業(yè)務(wù)流程,以及云環(huán)境下政府網(wǎng)站網(wǎng)頁(yè)歸檔的邏輯體系,設(shè)計(jì)如圖2所示的基于云計(jì)算的政府網(wǎng)站網(wǎng)頁(yè)在線歸檔管理平臺(tái)的體系架構(gòu)。

1.基礎(chǔ)設(shè)施層。作為平臺(tái)建構(gòu)的基礎(chǔ),基礎(chǔ)設(shè)施層主要提供政府網(wǎng)站網(wǎng)頁(yè)在線歸檔各業(yè)務(wù)流程所需的網(wǎng)絡(luò)、計(jì)算、存儲(chǔ)等IT資源。該層利用虛擬化技術(shù)對(duì)現(xiàn)有的物理設(shè)備資源進(jìn)行邏輯分割,形成可管理、可調(diào)度的虛擬IT資源,從而將一臺(tái)服務(wù)器上的資源,合理分配給多個(gè)虛擬服務(wù)器,通過(guò)物理資源的共享提高平臺(tái)的整體運(yùn)作效率,保障平臺(tái)應(yīng)用層各類應(yīng)用程序的最佳運(yùn)行狀態(tài)。同時(shí)由于操作系統(tǒng)與硬件環(huán)境相互獨(dú)立,使得隸屬于不同操作系統(tǒng)的虛擬機(jī),可以在相同的物理環(huán)境下獨(dú)立運(yùn)行,從而方便各節(jié)點(diǎn)資源的全面互聯(lián)與統(tǒng)一調(diào)度管理,以實(shí)現(xiàn)較高的計(jì)算性能,滿足政府網(wǎng)頁(yè)在線歸檔不斷增長(zhǎng)的計(jì)算與存儲(chǔ)需要。

2.平臺(tái)層。該層作為整個(gè)平臺(tái)的核心部分,包含數(shù)據(jù)庫(kù)與業(yè)務(wù)邏輯兩個(gè)部分。為了有效應(yīng)對(duì)政府網(wǎng)頁(yè)存檔面臨的海量存儲(chǔ)及存檔數(shù)據(jù)的高效存取問(wèn)題,該層基于分布式數(shù)據(jù)存儲(chǔ)管理系統(tǒng),應(yīng)用數(shù)據(jù)訪問(wèn)組件,為政府網(wǎng)站網(wǎng)頁(yè)采集、管理、保存、利用等業(yè)務(wù)功能的實(shí)現(xiàn)提供相應(yīng)數(shù)據(jù)庫(kù)的數(shù)據(jù)存取服務(wù)。平臺(tái)層還提供應(yīng)用程序運(yùn)行、監(jiān)管與維護(hù)等相關(guān)的服務(wù),包括中間件管理、元數(shù)據(jù)管理、格式轉(zhuǎn)換、數(shù)據(jù)封裝、策略管理、數(shù)據(jù)檢查、備份恢復(fù)、遷移管理、安全控制和歸檔管理等。此外,該層所提供的API接口能夠?qū)崿F(xiàn)現(xiàn)有應(yīng)用程序的整合以及新應(yīng)用程序的加載,進(jìn)而可支撐整個(gè)平臺(tái)應(yīng)用功能的擴(kuò)展。

3.應(yīng)用層。該層以人機(jī)交互接口的形式為用戶提供政府網(wǎng)站網(wǎng)頁(yè)歸檔涉及的信息采集、數(shù)據(jù)管理、資源保存、訪問(wèn)利用等各項(xiàng)業(yè)務(wù)相關(guān)的服務(wù)內(nèi)容。應(yīng)用層的主要作用就是將平臺(tái)層中的各種業(yè)務(wù)功能和各類數(shù)據(jù)庫(kù)中存儲(chǔ)的政府網(wǎng)頁(yè)數(shù)據(jù)以統(tǒng)一的人機(jī)交互方式呈現(xiàn)給用戶,通過(guò)為用戶提供簡(jiǎn)單便捷的操作界面,方便用戶獲取所需的服務(wù)信息。同時(shí),該層還提供可擴(kuò)展的應(yīng)用服務(wù)接口以及用戶管理、權(quán)限管理等通用的管理服務(wù),并根據(jù)需要為不同類型用戶提供相應(yīng)的應(yīng)用接口,實(shí)現(xiàn)平臺(tái)的差異化功能服務(wù)。

4.表現(xiàn)層。表現(xiàn)層是平臺(tái)的最后一層,也被稱作門戶平臺(tái),它直接面向用戶提供各類Web服務(wù),用戶可以利用各種聯(lián)網(wǎng)的終端設(shè)備登錄平臺(tái)門戶網(wǎng)站,通過(guò)瀏覽器即可在權(quán)限允許的范圍內(nèi)直接訪問(wèn)平臺(tái)應(yīng)用層提供的各種服務(wù),獲取平臺(tái)層數(shù)據(jù)庫(kù)中存儲(chǔ)的信息。而且與傳統(tǒng)的網(wǎng)絡(luò)平臺(tái)不同,該平臺(tái)的表現(xiàn)層可以利用云計(jì)算高效的數(shù)據(jù)處理能力,將復(fù)雜的計(jì)算交由云端處理,極大降低了平臺(tái)對(duì)終端設(shè)備的要求。這樣用戶所使用的訪問(wèn)設(shè)備只需具備簡(jiǎn)單的交互功能即可獲得快速的平臺(tái)服務(wù)響應(yīng),從而能夠擁有良好的訪問(wèn)體驗(yàn)。

(三)平臺(tái)的功能模塊

與傳統(tǒng)的數(shù)字資源長(zhǎng)期保存系統(tǒng)一樣,基于云計(jì)算的政府網(wǎng)站網(wǎng)頁(yè)在線歸檔管理平臺(tái)也同樣具備采集、管理、保存、利用等基本業(yè)務(wù)功能。

1.云上在線采集功能模塊。該模塊利用能夠兼容多種數(shù)據(jù)格式的云端數(shù)據(jù)采集接口,基于一站式云服務(wù)模式,在線完成對(duì)政府網(wǎng)站上的文本、圖像、音頻、視頻等不同類型網(wǎng)頁(yè)資源的采集任務(wù),對(duì)采集獲取的網(wǎng)頁(yè)資源進(jìn)行統(tǒng)一格式轉(zhuǎn)換處理,將其批量保存到采集數(shù)據(jù)庫(kù)中。該模塊通過(guò)新增監(jiān)控與變動(dòng)監(jiān)控實(shí)時(shí)更新獲取目標(biāo)政府網(wǎng)站的最新數(shù)據(jù),確保網(wǎng)頁(yè)采集的質(zhì)量。同時(shí)采用數(shù)據(jù)加密、安全傳輸協(xié)議等方法保證網(wǎng)頁(yè)傳輸安全,確保網(wǎng)頁(yè)數(shù)據(jù)真實(shí)、完整、可信和可用。

2.云下數(shù)據(jù)管理功能模塊。該模塊主要包括內(nèi)容管理與元數(shù)據(jù)管理兩大功能。其中內(nèi)容管理的功能是對(duì)云端在線采集獲取的各類政府網(wǎng)頁(yè)進(jìn)行線下的分類、著錄、標(biāo)引、編目、鑒定整理,即按照設(shè)定的分類方案,對(duì)采集獲取的海量政府網(wǎng)頁(yè)進(jìn)行自動(dòng)分類,然后將添加元數(shù)據(jù)描述信息的政府網(wǎng)頁(yè)保存到相應(yīng)的管理數(shù)據(jù)庫(kù)。元數(shù)據(jù)管理的功能則是通過(guò)確定元數(shù)據(jù)元素以及元數(shù)據(jù)的格式,明確政府網(wǎng)頁(yè)內(nèi)容、結(jié)構(gòu)、背景和管理過(guò)程等信息與元數(shù)據(jù)之間的關(guān)系,在相關(guān)元數(shù)據(jù)之間建立聯(lián)系,實(shí)現(xiàn)元數(shù)據(jù)信息的序化組織,確保政府網(wǎng)頁(yè)信息能夠長(zhǎng)期可利用。

3.云中資源保存功能模塊。該模塊基于云存儲(chǔ)動(dòng)態(tài)易擴(kuò)展的技術(shù)特性,通過(guò)調(diào)用云存儲(chǔ)服務(wù)端的應(yīng)用程序,對(duì)其存儲(chǔ)集群中相應(yīng)數(shù)據(jù)庫(kù)進(jìn)行數(shù)據(jù)的插入、刪除、修改等操作,實(shí)現(xiàn)對(duì)海量政府網(wǎng)頁(yè)資源的實(shí)時(shí)動(dòng)態(tài)歸檔保存。此外,該模塊還具備存儲(chǔ)數(shù)據(jù)的云備份、云遷移等功能,能夠根據(jù)存儲(chǔ)數(shù)據(jù)的更新情況,利用云存儲(chǔ)數(shù)據(jù)加密、云端數(shù)據(jù)隔離訪問(wèn)、完整性驗(yàn)證及可用性保護(hù)等方法,定期進(jìn)行存儲(chǔ)數(shù)據(jù)的在線備份和遷移等處理,確保云環(huán)境下歸檔政府網(wǎng)頁(yè)數(shù)據(jù)的長(zhǎng)期安全保存。

4.云端訪問(wèn)利用功能模塊。該模塊以瀏覽器/服務(wù)器方式為用戶提供歸檔政府網(wǎng)站網(wǎng)頁(yè)的云端利用服務(wù)。通過(guò)該模塊,用戶可以通過(guò)瀏覽器直接訪問(wèn)云平臺(tái),在權(quán)限許可的范圍內(nèi),查詢、瀏覽、批量下載所需的歸檔政府網(wǎng)頁(yè)數(shù)據(jù),并能夠利用輔助決策的數(shù)據(jù)挖掘、數(shù)據(jù)分析等功能,實(shí)現(xiàn)對(duì)歸檔網(wǎng)頁(yè)信息的在線統(tǒng)計(jì)分析與深度挖掘。同時(shí)為了實(shí)現(xiàn)歸檔政府網(wǎng)頁(yè)資源的開(kāi)放共享和高效利用,該模塊為用戶之間及用戶與管理員之間提供了在線交流的機(jī)制,進(jìn)而實(shí)現(xiàn)資源共享、參考咨詢等多種服務(wù)方式。

*本文為國(guó)家社會(huì)科學(xué)青年基金項(xiàng)目“基于云計(jì)算的政府網(wǎng)站網(wǎng)頁(yè)在線歸檔與開(kāi)發(fā)利用研究”(項(xiàng)目編號(hào):18CTQ040)研究成果之一。

注釋及參考文獻(xiàn):

[1]國(guó)務(wù)院辦公廳.國(guó)務(wù)院辦公廳印發(fā)《政府網(wǎng)站發(fā)展指引》[EB/OL].[2019- 07- 23].http://www.gov.cn/ zhengce/content/2017-06/08/content_5200760.htm.

[2]王萍,黃新平,陳為東,等.政府網(wǎng)站原生數(shù)字政務(wù)信息云歸檔模型及策略研究[J].情報(bào)理論與實(shí)踐,2016,39(4):60-65.

[3]王熹.網(wǎng)站文件歸檔問(wèn)題的若干思考[J].中國(guó)檔案, 2017(10):68-69.

[4] The Consultative Committee for Space Data Sys? tems. OAIS Reference Model [EB/OL].[2019- 07- 28]. https://public.ccsds.org/pubs/650x0m2.pdf.

[5]李宗富,黃新平.基于5W2H視角的政府網(wǎng)站信息存檔研究[J].檔案學(xué)通訊,2016(2):68-72.

[6]何歡歡.政府網(wǎng)站信息資源保存體系研究[D].武漢:武漢大學(xué),2010.

[7]黃新平.基于集體智慧的政府社交媒體文件檔案化管理研究[J].北京檔案,2016(11):12-15.

[8]牛力,韓小汀.云計(jì)算環(huán)境下的檔案信息資源整合與服務(wù)模式研究[J].檔案學(xué)研究,2013(5):26-29.

[9]劉準(zhǔn).政府網(wǎng)絡(luò)信息存檔策略研究及系統(tǒng)實(shí)現(xiàn)[J].中國(guó)檔案,2017(12):60-61.

[10]Yan Han. Cloud storage for digital preservation: optimal uses of Amazon S3 and Glacier[J].Library Hi Tech, 2015, 33(2): 261-271.

[11]Mcleod J, Gormly B. Using the cloud for records storage: issues of trust[J]. Archival Science, 2017, 17(2):1-22.

作者單位:清華大學(xué)公共管理學(xué)院

猜你喜歡
網(wǎng)頁(yè)利用政府
利用min{a,b}的積分表示解決一類絕對(duì)值不等式
利用一半進(jìn)行移多補(bǔ)少
知法犯法的政府副秘書長(zhǎng)
利用數(shù)的分解來(lái)思考
Roommate is necessary when far away from home
基于CSS的網(wǎng)頁(yè)導(dǎo)航欄的設(shè)計(jì)
電子制作(2018年10期)2018-08-04 03:24:38
基于URL和網(wǎng)頁(yè)類型的網(wǎng)頁(yè)信息采集研究
電子制作(2017年2期)2017-05-17 03:54:56
依靠政府,我們才能有所作為
網(wǎng)頁(yè)制作在英語(yǔ)教學(xué)中的應(yīng)用
政府手里有三種工具
兴仁县| 安义县| 拉萨市| 江山市| 响水县| 清水河县| 大同市| 米易县| 丽水市| 庆城县| 上饶县| 和田市| 郯城县| 循化| 马龙县| 广丰县| 仪陇县| 沙河市| 安泽县| 开化县| 吉林市| 吉安县| 衡阳县| 武陟县| 黎川县| 清徐县| 江达县| 舟曲县| 临潭县| 泗洪县| 左权县| 华蓥市| 介休市| 鹿邑县| 吴桥县| 民县| 板桥市| 钟祥市| 德庆县| 鸡泽县| 竹北市|