張煒,敦文杰,周笑盈
(國家圖書館,北京 100081)
國家數(shù)字圖書館網(wǎng)絡(luò)資源保存的實踐與探索*
張煒,敦文杰,周笑盈
(國家圖書館,北京 100081)
互聯(lián)網(wǎng)環(huán)境下,網(wǎng)絡(luò)資源已成為人類文明的重要載體。作為我國公共文化服務(wù)體系的重要組成部分,國家數(shù)字圖書館一直重視網(wǎng)絡(luò)信息的保存與服務(wù),自2003年開展試驗性項目以來,經(jīng)過十多年的積極探索和發(fā)展,在網(wǎng)絡(luò)資源遴選、管理平臺搭建和服務(wù)方式創(chuàng)新等方面已積累豐富實踐經(jīng)驗。通過對國家數(shù)字圖書館網(wǎng)絡(luò)資源保存工作實踐的分析,以期為業(yè)界提供有益參考和借鑒。
網(wǎng)絡(luò)資源保存;國家數(shù)字圖書館;互聯(lián)網(wǎng);文化服務(wù)
人類的發(fā)展離不開信息傳遞與交流,以互聯(lián)網(wǎng)為代表的信息技術(shù)日新月異,世界正處在信息化快速發(fā)展的進(jìn)程中,信息的生產(chǎn)、傳播和利用方式也發(fā)生根本性變革。據(jù)CNNIC發(fā)布的第39次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計報告》顯示[1],截至2016年年底,我國網(wǎng)民規(guī)模已達(dá)7.3億人,相當(dāng)于歐洲人口總量,互聯(lián)網(wǎng)普及率達(dá)到53.2%,以“.cn”結(jié)尾的域名總數(shù)達(dá)到2 061萬,同比增長25.9個百分點。網(wǎng)絡(luò)信息資源已深入滲透至我國的社會、經(jīng)濟(jì)、文化領(lǐng)域,成為記錄人類活動和文明的重要載體和戰(zhàn)略資產(chǎn),網(wǎng)絡(luò)信息的及時保存和有效利用對推動我國社會和文化發(fā)展、增強(qiáng)國家綜合實力具有重要意義。
國際社會高度重視網(wǎng)絡(luò)信息資源的保存與利用,西方發(fā)達(dá)國家或組織密集出臺多項專門政策給予支持。我國在2016年發(fā)布的《促進(jìn)大數(shù)據(jù)發(fā)展行動綱要》提出,要加強(qiáng)互聯(lián)網(wǎng)信息采集利用,加強(qiáng)頂層設(shè)計,加強(qiáng)互聯(lián)網(wǎng)信息采集、保存和分析能力建設(shè),制定完善互聯(lián)網(wǎng)信息保存相關(guān)法律法規(guī),構(gòu)建互聯(lián)網(wǎng)信息保存和信息服務(wù)體系[2]。從世界范圍看,網(wǎng)絡(luò)信息的保存保護(hù)一直是國內(nèi)外圖書情報界的研究與工作重點,且進(jìn)行網(wǎng)絡(luò)信息采集的機(jī)構(gòu)一般為國家級圖書館。目前,國際上已完成或正在推進(jìn)的網(wǎng)絡(luò)信息保存項目大約有100個,從影響力和成果看,較重要的主要有美國Internet Archive的Archive-It項目[3]、美國國會圖書館MINERVA項目、澳大利亞國家圖書館Pandora項目、大英圖書館和英國國家檔案館等機(jī)構(gòu)發(fā)起的UKWAC項目、法國國家圖書館BnF項目、芬蘭國家圖書館Finnish Web Archive項目、瑞典國家圖書館Kulturarw項目等[4]。以這些項目為代表的各國公共文化機(jī)構(gòu)對國際上或所在地區(qū)有重要戰(zhàn)略價值的網(wǎng)絡(luò)資源進(jìn)行采集,形成各具特色的網(wǎng)絡(luò)信息保存體系,為傳承人類文明、促進(jìn)文化發(fā)展提供重要保障。
中國國家圖書館也十分重視網(wǎng)絡(luò)信息資源的采集與保存。2003年開展“網(wǎng)絡(luò)信息采集與保存試驗項目”[5],2007年加入國際互聯(lián)網(wǎng)保存聯(lián)盟,并于2009年成立國家圖書館互聯(lián)網(wǎng)信息保存保護(hù)中心,通過國內(nèi)外的廣泛合作,致力于網(wǎng)絡(luò)信息資源的長期保存和利用服務(wù)。經(jīng)過十多年積累和發(fā)展,已形成涵蓋國內(nèi)外政治、經(jīng)濟(jì)、社會、文化、科技等領(lǐng)域重要網(wǎng)站和重大專題網(wǎng)絡(luò)資源的特色化網(wǎng)絡(luò)資源建設(shè)體系,數(shù)據(jù)量達(dá)到114.73TB,成為我國數(shù)字圖書館資源建設(shè)的重要組成部分,為政府決策、科學(xué)研究和滿足民眾信息需求提供重要支持。在國家圖書館的示范和帶動下,各地方圖書館也開始根據(jù)自身需求開展具有地方文化特色的網(wǎng)絡(luò)資源建設(shè),網(wǎng)絡(luò)信息保存的規(guī)?;б嬷饾u顯現(xiàn)。通過積極實踐與探索,國家數(shù)字圖書館已初步形成較科學(xué)客觀的網(wǎng)絡(luò)資源評估和面向全國的長期保存與有效服務(wù)機(jī)制,對在互聯(lián)網(wǎng)環(huán)境下,提高國家數(shù)字圖書館網(wǎng)絡(luò)資源建設(shè)的規(guī)范性和質(zhì)量水平,促進(jìn)網(wǎng)絡(luò)信息綜合應(yīng)用與服務(wù)能力提升具有重要意義。本文旨在通過對國家數(shù)字圖書館在網(wǎng)絡(luò)資源遴選、平臺技術(shù)架構(gòu)和資源服務(wù)等方面進(jìn)行總結(jié)和分析,為進(jìn)一步改進(jìn)網(wǎng)絡(luò)資源的保存與服務(wù)工作,不斷滿足社會各界的文化信息需求提供參考和借鑒。
2.1 網(wǎng)絡(luò)資源保存范圍確定
信息資源指在人類社會活動中積累的以信息為核心要素的資源集合。網(wǎng)絡(luò)信息資源區(qū)別于傳統(tǒng)信息資源,是指以電子數(shù)據(jù)形式存儲,借助計算機(jī)通過互聯(lián)網(wǎng)進(jìn)行傳播的各類信息資源[6]。鑒于網(wǎng)絡(luò)信息的海量性和復(fù)雜性,確定合適的網(wǎng)絡(luò)資源保存范圍是決定資源采集效益和內(nèi)容質(zhì)量的重要因素。結(jié)合國內(nèi)外網(wǎng)絡(luò)信息資源保存工作實踐,在開展規(guī)模性采集過程中,既要做到網(wǎng)絡(luò)資源的重點采集,也要防范垃圾信息的堆積。在保證信息采集全面性的同時,也應(yīng)注重資源內(nèi)容的權(quán)威性和保存價值。圍繞我國公共圖書館的職能定位和服務(wù)需求,國家數(shù)字圖書館通過全面采集和重點采集的方式實現(xiàn)對不同領(lǐng)域和范圍的重要網(wǎng)絡(luò)資源的有效采集。同時,在采集過程中充分考慮采集內(nèi)容的延續(xù)性和采集后數(shù)據(jù)的有效利用,不斷修正網(wǎng)絡(luò)資源采集范圍。目前,國家數(shù)字圖書館全面保存的網(wǎng)絡(luò)資源主要包括:黨中央各部門及直屬事業(yè)單位網(wǎng)站;全國人大、政協(xié),及其他與國家立法、決策相關(guān)機(jī)構(gòu)網(wǎng)站;最高人民法院、最高人民檢察院網(wǎng)站;國務(wù)院各組成機(jī)構(gòu)及其直屬單位和行業(yè)協(xié)會網(wǎng)站;各民主黨派中央機(jī)關(guān)網(wǎng)站;中央級社會團(tuán)體網(wǎng)站等。重點保存的網(wǎng)絡(luò)資源包括:我國經(jīng)濟(jì)領(lǐng)域重要機(jī)構(gòu)、組織、研究單位網(wǎng)站;我國重要的科研教育機(jī)構(gòu)網(wǎng)站;我國歷史文化、傳統(tǒng)藝術(shù)、地理人文、科技科普、國學(xué)研究類網(wǎng)站和專題;國家一級博物館、省級及以上主要美術(shù)館、藝術(shù)館、展覽館等公益文化類機(jī)構(gòu),以及重要圖情組織機(jī)構(gòu)網(wǎng)站;我國重要歷史人物和事件的紀(jì)念館及專題網(wǎng)站;我國社會保障、勞動就業(yè)、人才法律、人口健康等領(lǐng)域重要機(jī)構(gòu)和網(wǎng)站;國土資源監(jiān)測與利用、環(huán)境氣象、生態(tài)保護(hù)、防災(zāi)減災(zāi)等領(lǐng)域的重要機(jī)構(gòu)、研究單位和專題網(wǎng)站;國家重大項目和工程建設(shè)網(wǎng)站;國際重要組織機(jī)構(gòu)、國外主要國家和周邊國家的官方網(wǎng)站,及其公開發(fā)布的重要文件和資料等。
2.2 網(wǎng)絡(luò)資源評估和遴選
與傳統(tǒng)文獻(xiàn)資源相比,網(wǎng)絡(luò)信息資源通常呈現(xiàn)出質(zhì)量的不均衡性與內(nèi)容的不確定性,這將嚴(yán)重地制約圖書館數(shù)字資源服務(wù)向深度應(yīng)用發(fā)展。所以,網(wǎng)絡(luò)信息資源保存與應(yīng)用服務(wù)的第一步需要開展網(wǎng)絡(luò)資源評估,確定網(wǎng)絡(luò)資源質(zhì)量,選擇優(yōu)質(zhì)的網(wǎng)絡(luò)資源進(jìn)行采集和保存。
2.2.1 網(wǎng)絡(luò)資源評估
國家數(shù)字圖書館在總結(jié)業(yè)界相關(guān)研究成果的基礎(chǔ)上,利用定性與定量相結(jié)合的方法構(gòu)建較科學(xué)合理的網(wǎng)絡(luò)信息評價指標(biāo)和評估流程。通過對國際上各種數(shù)字資源評價方案的深入調(diào)研和分析,國家數(shù)字圖書館采用德爾菲法對待采集的網(wǎng)絡(luò)資源進(jìn)行分析和排名[7],評估流程如圖1所示。
圖1 網(wǎng)絡(luò)資源評估流程
2.2.2 網(wǎng)絡(luò)資源評估指標(biāo)確定
基于以上流程,國家數(shù)字圖書館采用定量指標(biāo)和定性指標(biāo)相結(jié)合的綜合評估方法對網(wǎng)絡(luò)資源進(jìn)行評估。定量指標(biāo)屬于客觀性指標(biāo),是通過軟件工具或相關(guān)評測網(wǎng)站能夠?qū)W(wǎng)絡(luò)資源給出具體評測值的指標(biāo),評測過程不需人工干預(yù);定性指標(biāo)屬于主觀性指標(biāo),是評分者根據(jù)評估說明并結(jié)合資源具體情況給出評測值的評價指標(biāo),主要面向網(wǎng)站的內(nèi)容表現(xiàn)形式與特征。初步確定的網(wǎng)絡(luò)資源評估指標(biāo),如表1所示。
表1 網(wǎng)絡(luò)資源評估的定性指標(biāo)和定量指標(biāo)
2.2.3 網(wǎng)絡(luò)資源評估流程確定
在初步確定評估指標(biāo)的基礎(chǔ)上,經(jīng)過多次專家組論證,確定最終的評估指標(biāo)及其權(quán)重。
如圖2所示,評估指標(biāo)及其權(quán)重的確定共經(jīng)過三輪專家論證。第一輪調(diào)查表的內(nèi)容是向?qū)<艺髟円庖?,以百分比形式展現(xiàn)專家所選各項指標(biāo)的比例;第二輪調(diào)查表由第一輪的指標(biāo)和專家新增指標(biāo)構(gòu)成;第三輪調(diào)查表展現(xiàn)各項指標(biāo)的專家所選比例,依據(jù)各項指標(biāo)最后得分進(jìn)行權(quán)重分配。在最終確定的網(wǎng)絡(luò)信息評價指標(biāo)體系基礎(chǔ)上,由工作人員對國內(nèi)外符合采集范圍的網(wǎng)站二級指標(biāo)進(jìn)行打分,并對所有網(wǎng)站按照加權(quán)分?jǐn)?shù)進(jìn)行降序排列,得到最終的網(wǎng)站評估排名,審核后的網(wǎng)站列表即作為最終采集任務(wù)列表。
圖2 基于多輪專家論證的評估指標(biāo)確定流程圖
3.1 云管理系統(tǒng)平臺技術(shù)架構(gòu)
隨著網(wǎng)絡(luò)信息保存業(yè)務(wù)的發(fā)展,網(wǎng)絡(luò)信息總量快速增長,傳統(tǒng)的硬軟件基礎(chǔ)架構(gòu)已不適合海量網(wǎng)絡(luò)資源的存儲與管理。為實現(xiàn)網(wǎng)絡(luò)信息長期保存的可持續(xù)發(fā)展,國家數(shù)字圖書館加強(qiáng)設(shè)施改造和技術(shù)創(chuàng)新,建設(shè)基于分布式云存儲管理平臺以實現(xiàn)對網(wǎng)絡(luò)信息的有效保存。
國家數(shù)字圖書館云管理系統(tǒng)平臺包括采集層、存儲層、管理層、應(yīng)用層四級架構(gòu)。在采集層,采用分布式采集結(jié)構(gòu),通過部署多個省級采集節(jié)點和機(jī)構(gòu)節(jié)點進(jìn)行具體的采集工作,以完整采集和重點采集相結(jié)合的方式由Heritrix軟件完成對網(wǎng)絡(luò)資源的采集和保存;在存儲層,通過分布式文件系統(tǒng)實現(xiàn)資源的分布式存儲和集中式管理;在管理層,通過云管理平臺對采集層多個采集節(jié)點進(jìn)行統(tǒng)一調(diào)度與配置,實現(xiàn)工作的高效運(yùn)行;在應(yīng)用層,搭建訪問服務(wù)平臺、嵌入第三方信息查詢和檢索接口,為用戶提供資源訪問和獲取服務(wù),并使用數(shù)據(jù)分析工具對存儲資源進(jìn)行分析與挖掘。
國家數(shù)字圖書館通過硬件基礎(chǔ)設(shè)施共享來為海量網(wǎng)絡(luò)信息管理提供最基本的物理資源(包括計算、存儲、數(shù)據(jù)和網(wǎng)絡(luò)設(shè)備),通過虛擬化技術(shù)和集群技術(shù)把內(nèi)存、I/O設(shè)備、存儲和計算能力匯集起來成為一個虛擬的資源池,以虛擬化環(huán)境提供支撐平臺硬件系統(tǒng)統(tǒng)一的管理能力。硬件系統(tǒng)處于平臺技術(shù)結(jié)構(gòu)的最底層,包括硬件設(shè)備和虛擬化。硬件設(shè)備由現(xiàn)有各類數(shù)字資源管理服務(wù)器、存儲設(shè)備、網(wǎng)絡(luò)設(shè)備等構(gòu)成;虛擬化則運(yùn)用虛擬化技術(shù)對物理硬件層進(jìn)行管理,向上提供計算、數(shù)據(jù)存儲和網(wǎng)絡(luò)通信等虛擬資源,其主要目的是將異構(gòu)的底層物理資源整合成相同類型的資源池(如計算資源池、存儲資源池等),以便創(chuàng)造協(xié)同、統(tǒng)一的工作基礎(chǔ)。
國家數(shù)字圖書館網(wǎng)絡(luò)信息保存平臺硬件系統(tǒng)建設(shè)方面主要包括計算資源(服務(wù)器等)建設(shè)和存儲建設(shè)。計算資源用于運(yùn)行支撐平臺基礎(chǔ)軟件系統(tǒng)、應(yīng)用服務(wù)集成系統(tǒng)及未來擴(kuò)展系統(tǒng)等。支撐平臺以共享的“云存儲池”為基礎(chǔ),通過基礎(chǔ)軟件系統(tǒng)中的云管理系統(tǒng)實現(xiàn)對全國硬件系統(tǒng)資源的統(tǒng)一管理和調(diào)度。
國家數(shù)字圖書館網(wǎng)絡(luò)信息保存平臺軟件架構(gòu)主要由平臺基礎(chǔ)軟件系統(tǒng)(即云管理系統(tǒng))組成,分別在國家數(shù)字圖書館的不同層級和機(jī)構(gòu)進(jìn)行部署,形成一一對接。云管理系統(tǒng)實現(xiàn)對不同層級圖書館硬件系統(tǒng)的綜合使用管理并形成統(tǒng)一視圖,實現(xiàn)對全國圖書館存檔網(wǎng)絡(luò)信息數(shù)據(jù)服務(wù)的基礎(chǔ)支撐作用(見圖3)。
圖3 國家數(shù)字圖書館網(wǎng)絡(luò)信息保存平臺架構(gòu)
3.2 分級式資源共享與集成管理
資源的共享和集成是實現(xiàn)國家數(shù)字圖書館網(wǎng)絡(luò)信息采集規(guī)模化、管理規(guī)范化、應(yīng)用高效化的重要環(huán)節(jié)。通過對全國參與網(wǎng)絡(luò)信息保存的各機(jī)構(gòu)應(yīng)用系統(tǒng)的“容器”作用,不斷“共享”存檔資源和應(yīng)用軟件,形成具有一定規(guī)模的“資源集成管理中心”,從而推動以網(wǎng)絡(luò)信息應(yīng)用系統(tǒng)為服務(wù)“窗口”的全國數(shù)字圖書館網(wǎng)絡(luò)信息服務(wù)新業(yè)態(tài)。國家數(shù)字圖書館網(wǎng)絡(luò)信息集成管理系統(tǒng)架構(gòu)如圖4所示。
統(tǒng)一認(rèn)證鑒權(quán)系統(tǒng)可實現(xiàn)對聯(lián)建機(jī)構(gòu)系統(tǒng)管理員和公眾用戶實現(xiàn)統(tǒng)一認(rèn)證,系統(tǒng)管理員只需登錄一次,即可訪問接入統(tǒng)一認(rèn)證的不同機(jī)構(gòu)業(yè)務(wù)系統(tǒng)和各地存檔資源;機(jī)構(gòu)權(quán)限管理可實現(xiàn)對各聯(lián)建機(jī)構(gòu)存檔網(wǎng)絡(luò)信息資源的有效共享和管理。公眾用戶、各級文化共享機(jī)構(gòu)需要在平臺注冊登記用戶和機(jī)構(gòu)的信息,系統(tǒng)管理員可授權(quán)用戶與機(jī)構(gòu)不同的訪問或管理權(quán)限;合作單位在系統(tǒng)提交資源發(fā)布申請后,經(jīng)審核通過即可實現(xiàn)所有申請單位的資源集成共享;開發(fā)者可使用應(yīng)用構(gòu)建工具按照應(yīng)用規(guī)范開發(fā)出各類應(yīng)用組件,并發(fā)布到內(nèi)容展現(xiàn)門戶或應(yīng)用門戶,供公眾或其他機(jī)構(gòu)和加工者使用。
同時,為提高國家數(shù)字圖書館的網(wǎng)絡(luò)信息資源共享能力,系統(tǒng)提供接入國家各省市縣及其他文化機(jī)構(gòu)的應(yīng)用系統(tǒng)能力,包括為各種應(yīng)用系統(tǒng)提供受控的運(yùn)行環(huán)境(由云平臺基礎(chǔ)資源提供)、應(yīng)用監(jiān)督和管理、應(yīng)用自動化部署和監(jiān)控,系統(tǒng)門戶整合、業(yè)務(wù)處理整合、數(shù)據(jù)交換和數(shù)據(jù)整合等。
圖4 國家數(shù)字圖書館網(wǎng)絡(luò)信息集成管理系統(tǒng)構(gòu)架
滿足社會各界的信息需求是國家數(shù)字圖書館服務(wù)的根本目標(biāo)?;ヂ?lián)網(wǎng)環(huán)境下,國家數(shù)字圖書館充分利用網(wǎng)絡(luò)信息保存成果,以全面采集、組織和分析后的網(wǎng)絡(luò)數(shù)據(jù)信息應(yīng)用手段與現(xiàn)代信息技術(shù)針對不同需求提供高水平、多層次的服務(wù),為促進(jìn)我國文化事業(yè)的發(fā)展以及國家軟實力的提高提供支持。目前,國家數(shù)字圖書館開展網(wǎng)絡(luò)資源服務(wù)的方式主要有以下五種。
4.1 制定元數(shù)據(jù)規(guī)范,加強(qiáng)資源整合與揭示能力
元數(shù)據(jù)是描述資源關(guān)鍵信息的一種結(jié)構(gòu)化數(shù)據(jù)。制定規(guī)范化的元數(shù)據(jù)標(biāo)準(zhǔn)能實現(xiàn)對數(shù)字資源的查找揭示和有效管理,對用戶發(fā)現(xiàn)資源、利用資源具有重要作用。與傳統(tǒng)數(shù)字資源相比,網(wǎng)絡(luò)信息資源無論是在結(jié)構(gòu)、分布、種類,還是在傳播范圍、載體形態(tài)、對象格式等方面都顯示出新的特點。為對網(wǎng)絡(luò)資源進(jìn)行客觀深度描述,實現(xiàn)對資源內(nèi)容最大限度的揭示,同時便于網(wǎng)絡(luò)資源的組織整合與檢索,國家數(shù)字圖書館在研究現(xiàn)有數(shù)字資源元數(shù)據(jù)規(guī)范的基礎(chǔ)上,根據(jù)實際需求建立了一套較完善的網(wǎng)絡(luò)資源元數(shù)據(jù)著錄規(guī)范,實現(xiàn)對國內(nèi)外網(wǎng)站資源、網(wǎng)絡(luò)專題資源等的規(guī)范化著錄。同時,為促進(jìn)網(wǎng)絡(luò)資源聯(lián)建與共享,還制定“數(shù)字圖書館推廣工程”網(wǎng)絡(luò)資源元數(shù)據(jù)規(guī)范,并成為各地方館資源建設(shè)的參考標(biāo)準(zhǔn)?;诰W(wǎng)絡(luò)資源元數(shù)據(jù)著錄規(guī)范,國家數(shù)字圖書館對國家圖書館及各地方館存檔的網(wǎng)絡(luò)資源進(jìn)行有序整合與統(tǒng)一發(fā)布服務(wù),實現(xiàn)資源的一站式檢索,提高資源發(fā)現(xiàn)與服務(wù)效益。
4.2 建設(shè)專題資源庫,開展多樣化、特色化網(wǎng)絡(luò)資源服務(wù)
國家數(shù)字圖書館十分重視優(yōu)質(zhì)網(wǎng)絡(luò)文化資源的建設(shè)與服務(wù),每年都會圍繞國家重要領(lǐng)域和熱點議題,遴選并采集相當(dāng)數(shù)量的網(wǎng)絡(luò)資源,并通過門戶網(wǎng)站發(fā)布。目前提供服務(wù)的網(wǎng)絡(luò)專題資源涵蓋治國理政、文化與民俗、科學(xué)技術(shù)、環(huán)境保護(hù)等14個分類,專題數(shù)量超過175個,每個專題匯集約200個從國內(nèi)各大門戶網(wǎng)站精選的優(yōu)質(zhì)網(wǎng)絡(luò)資源。此外,國家數(shù)字圖書館緊密結(jié)合國家重大發(fā)展戰(zhàn)略,重點建設(shè)“一帶一路”和“大眾創(chuàng)業(yè),萬眾創(chuàng)新”資源庫,通過多種方式和手段對相關(guān)領(lǐng)導(dǎo)講話、政策文件、重要事件、新聞報道、地方踐行、背景知識等內(nèi)容作出集中整合與展示,為相關(guān)科學(xué)研究和信息獲取提供支持。此外,在“數(shù)字圖書館推廣工程”的支持下,各地方圖書館積極開展具有當(dāng)?shù)匚幕厣木W(wǎng)絡(luò)專題資源庫建設(shè)與服務(wù),進(jìn)一步加強(qiáng)國家數(shù)字圖書館在公共互聯(lián)網(wǎng)文化領(lǐng)域發(fā)揮的重要作用和影響力。
4.3 應(yīng)用可視化技術(shù)手段,提升資源展示與服務(wù)效果
國家數(shù)字圖書館一直重視現(xiàn)代信息技術(shù)在文化資源建設(shè)和服務(wù)中的重要作用,通過技術(shù)創(chuàng)新構(gòu)建基于互聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)、廣播電視網(wǎng)等渠道的文化服務(wù)網(wǎng)絡(luò),不斷變革網(wǎng)絡(luò)信息資源的組織和服務(wù)方式,較大程度提升了網(wǎng)絡(luò)信息服務(wù)效果,取得良好社會效益。國家數(shù)字圖書館建有專門網(wǎng)絡(luò)資源發(fā)布與服務(wù)網(wǎng)站,通過資源推薦、快照保存、信息檢索、資源分類瀏覽等實現(xiàn)資源的有序組織與呈現(xiàn)、信息發(fā)現(xiàn)與檢索,通過知識庫向用戶介紹網(wǎng)絡(luò)信息保存相關(guān)知識和內(nèi)容,并提供代存檔服務(wù)?!耙粠б宦贰焙汀按蟊妱?chuàng)業(yè),萬眾創(chuàng)新”重大專題資源庫中大量使用現(xiàn)代信息技術(shù),通過時間軸、地域軸、地圖、知識圖譜等可視化手段進(jìn)行資源展示與用戶交互,以熱門關(guān)鍵詞實現(xiàn)資源推薦檢索??梢暬夹g(shù)的應(yīng)用改善資源組織與呈現(xiàn)方式,極大提升用戶體驗,較大程度提高網(wǎng)絡(luò)資源服務(wù)效果,取得良好社會效益。
4.4 開展定制化資源服務(wù),滿足用戶個性化內(nèi)容需求
為用戶提供準(zhǔn)確的信息資源,使其享受到個性化的服務(wù)體驗是信息時代國家數(shù)字圖書館追求的主要目標(biāo)。當(dāng)前,我國數(shù)字圖書館服務(wù)人數(shù)急劇增多,年齡、學(xué)歷、地域、民族情況復(fù)雜,若文化服務(wù)缺乏針對性,文化內(nèi)容和服務(wù)手段千篇一律,不但會造成資源浪費(fèi),也容易降低數(shù)字圖書館的用戶黏性,從而降低在文化信息傳播和服務(wù)領(lǐng)域的影響力。鑒于此,國家數(shù)字圖書館主動尋求社會需求,積極與社會機(jī)構(gòu)開展合作。特別是在與全國人大圖書館的合作中,國家數(shù)字圖書館針對其業(yè)務(wù)與服務(wù)需求,對其網(wǎng)絡(luò)資源建設(shè)與發(fā)布進(jìn)行定制化開發(fā),建設(shè)“人民代表大會網(wǎng)站典藏”資源庫,旨在通過對各地市級以上人大官方網(wǎng)站資源進(jìn)行采集、保存與整合,提供在線資源展示與信息檢索,從而促進(jìn)全國人大網(wǎng)站資源長期保存和服務(wù)體系構(gòu)建,為政府立法決策和服務(wù)提供支持。該資源庫是國家數(shù)字圖書館聯(lián)合政府機(jī)構(gòu)開展資源和服務(wù)合作的重要示范項目,對于掌握我國人大組織和工作情況、研究我國人大事業(yè)發(fā)展歷程,為全國人大事業(yè)提供資源保障有重要意義。
4.5 依托國家重點文化工程,實現(xiàn)分布式合作模式
目前,國家圖書館作為社會記憶的保存機(jī)構(gòu),擔(dān)負(fù)著網(wǎng)絡(luò)信息資源構(gòu)建的重要職責(zé),依托國家“數(shù)字圖書館推廣工程”,聯(lián)合各地市級圖書館,共同構(gòu)建面向全國的分布式保存機(jī)制。各機(jī)構(gòu)合作選擇需要保存的網(wǎng)絡(luò)信息資源,統(tǒng)一實施網(wǎng)絡(luò)資源評估標(biāo)準(zhǔn),交流并分享網(wǎng)絡(luò)信息資源保存的采集策略,形成規(guī)?;4嫘袆?,各展所長,實現(xiàn)經(jīng)驗和技術(shù)層面的融合。
國家圖書館與各省級、市級及鄉(xiāng)鎮(zhèn)級圖書館間存在縱向關(guān)聯(lián)關(guān)系,通過建立共同聯(lián)盟機(jī)構(gòu)可實現(xiàn)聯(lián)合評估、分工采集、聯(lián)合編目、建立統(tǒng)一管理平臺和聯(lián)機(jī)檢索。近年來,依托“數(shù)字圖書館推廣工程”,省級公共圖書館開展了網(wǎng)絡(luò)信息資源聯(lián)建工作,隨著業(yè)務(wù)的推進(jìn)和不斷深入,各地圖書館存檔的網(wǎng)絡(luò)信息種類和數(shù)據(jù)量預(yù)計會有顯著增長。
國家圖書館與其他數(shù)字文化保存機(jī)構(gòu)存在平行關(guān)聯(lián)關(guān)系,以國家圖書館為示范,輻射其他數(shù)字文化保存機(jī)構(gòu),形成分布式網(wǎng)絡(luò)信息采集與保存機(jī)制;共同協(xié)商,劃分各機(jī)構(gòu)保存范圍;統(tǒng)一開發(fā)和共享保存技術(shù),由國家圖書館主導(dǎo)開發(fā)采集軟件與網(wǎng)頁回放工具,建立統(tǒng)一管理平臺;使用統(tǒng)一數(shù)據(jù)存儲格式和元數(shù)據(jù)保存標(biāo)準(zhǔn),節(jié)省開發(fā)成本,共享技術(shù)成果。同時,國家圖書館與各機(jī)構(gòu)聯(lián)合開展人員培訓(xùn),交流采集、編目、保存經(jīng)驗,與圖書館外機(jī)構(gòu)合作,打破機(jī)構(gòu)壁壘,與更多國家網(wǎng)絡(luò)信息保存項目合作,借鑒先進(jìn)經(jīng)驗、技術(shù)與標(biāo)準(zhǔn)。
國家數(shù)字圖書館以保存人類文明為職責(zé),是國內(nèi)重要的文化知識傳播中心。加快推進(jìn)網(wǎng)絡(luò)信息資源采集、保存和服務(wù)利用,對承載中華數(shù)字記憶、弘揚(yáng)優(yōu)秀文化、促進(jìn)人類信息發(fā)展具有重要戰(zhàn)略意義。國家數(shù)字圖書館將繼續(xù)深入推進(jìn)網(wǎng)絡(luò)信息的資源聯(lián)建和共享,構(gòu)建全國統(tǒng)一的網(wǎng)絡(luò)信息保存與服務(wù)平臺,加強(qiáng)技術(shù)研發(fā)與創(chuàng)新,通過多種手段和方式面向全國不同用戶群體開展知識化、個性化、精準(zhǔn)化、一站式信息服務(wù),為擴(kuò)大國家數(shù)字圖書館服務(wù)范圍和提高服務(wù)能力提供支持。
[1]中國互聯(lián)網(wǎng)絡(luò)信息中心.第39次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計報告》[EB/OL].(2017-01-22)[2017-05-22].http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/hlwtjbg/201701/t20170122_66437.htm.
[2]國務(wù)院關(guān)于印發(fā)促進(jìn)大數(shù)據(jù)發(fā)展行動綱要的通知[EB/OL].(2015-09-05)[2017-05-22].http://www.gov.cn/zhengce/content/2015-09/05/content_10137.htm.
[3]王爍.美國網(wǎng)頁歸檔項目——Internet Archive發(fā)展研究[J].蘭臺世界,2012(6):18-19.
[4]HAKALA J. Archiving the web:European experiences[J].Program,2 004,38(3):176-183.
[5]趙麗琴.我國網(wǎng)絡(luò)信息保存研究述評[J].圖書館學(xué)研究,2011(2):5-7.
[6]馬費(fèi)成,賴茂生.信息資源管理[M].北京:高等教育出版社,2006.
[7]KAVOURA A,ANDERSSON T.Applying delphi method for strategic design of social entrepreneurship[J].Library Review,2016,65(3):185-205.
Network Resource Preservation Practice and Exploration of National Digital Library
ZHANG Wei, DUN WenJie, ZHOU XiaoYing
(National Library of China, Beijing 100081, China)
In the internet environment, network resource has become an important carrier of human’s civilization. As the important component of our country’s public culture service system, the National Digital Library paid attention to the network resource preservation and service. Since developed the web information collection and preservation program in 2003, the National Digital Library has made a big progress on selecting network resource, building manage platform and innovating service,and accumulated a lot of practice experience. This paper summarizes and analyses the work of National Digital Library’s network resource preservation, and it is hoped for providing reference resources for future work and relevant practitioner.
Network Resource Preservation; National Digital Library; Internet; Culture Service
G250.76
10.3772/j.issn.1673-2286.2017.06.005
張煒,女,1973年生,碩士,研究館員,研究方向:數(shù)字圖書館資源建設(shè)與服務(wù),E-mail:zhw@nlc.cn。
敦文杰,男,1982年生,博士,副研究館員,研究方向:數(shù)字資源整合與服務(wù),E-mail:dunwj@nlc.cn。
周笑盈,女,1989年生,碩士,助理館員,研究方向:數(shù)字圖書館新媒體服務(wù),E-mail:zhouxy@nlc.cn。
2017-05-24)
* 本研究得到國家社會科學(xué)基金項目“網(wǎng)絡(luò)信息采集與保存策略研究”(編號:15BTQ019)資助。