張林華 徐維晨
摘要:互聯(lián)網(wǎng)不斷發(fā)展的今天,網(wǎng)頁已經(jīng)成為重要的數(shù)字檔案資源,對網(wǎng)頁進行合理的歸檔利用具有重要意義。文章通過對國外網(wǎng)頁檔案實踐進行調查,了解其法律規(guī)章環(huán)境營造的同時,將其實踐流程歸納為網(wǎng)頁檔案采集、整理、利用三個方面,并對此進行探討。最后從完善法規(guī)、主體合作、立足用戶、打造平臺四個方面提出對我國的啟示,以期我國網(wǎng)頁檔案實踐得到更好的發(fā)展。
關鍵詞:國外網(wǎng)頁檔案實踐;政策環(huán)境;實踐流程
分類號:G279
The Practice of Foreign Webpage Archives and Its Inspirations to China
Zhang Linhua, Xu Weichen
(Department of Library, Information and Archives of Shanghai University, Shanghai, 200444)
Abstract:With the continuous development of the Internet, webpages have become an important digital archive resource, and it is of great significance to archive and utilize webpages reasonably. Through the investigation of the practice of foreign Webpage archives, we can understand the policy environment deeply, and at the same time, we can summarizes its practice process into three aspects of Webpages archives collection, collation and utilization, and discusses this. Finally, from four aspects of improving policy, keeping the main body cooperation, basing on users and building a platform, this paper puts forward the enlightenment to our country, in order to develop the practice of webpage archives in our country better.
Keywords:PracticeofForeignWebpageArchives;PolicyEnvironment; PracticeProcess
網(wǎng)頁歸檔是由美國互聯(lián)網(wǎng)檔案館(Internet Archive,以下簡稱IA)在1996年發(fā)起的[1]。網(wǎng)頁是社會組織或個人在社會實踐活動中直接形成的文字、圖像、音頻視頻等多媒體數(shù)字信息,是對以往社會活動的清晰、確定的原始記錄,具有鮮明的原始記錄性和憑證價值,將網(wǎng)頁納入歸檔范圍,是數(shù)字檔案館建設的重要范疇[2]。
當前,在我國檔案界,有關網(wǎng)頁檔案實踐的研究主要集中以下幾個方面:第一,國外網(wǎng)頁歸檔具體案例研究。主要包括美國[3-6]、英國[7-8]、法國[9]、加拿大[10]等國家的網(wǎng)頁歸檔項目。第二,項目對比研究。文振興對比了東亞地區(qū)四個網(wǎng)頁檔案項目,為我國開展網(wǎng)頁歸檔項目提供了借鑒[11];王靜則從法律環(huán)境、參與單位、采集策略、網(wǎng)站分析了中美網(wǎng)頁歸檔項目[12]。第三,網(wǎng)頁歸檔對策研究。有的學者重點研究了網(wǎng)頁檔案的采集策略[13-14];有的學者提倡將云計算[15]、云存儲[16]等技術應用于網(wǎng)頁歸檔;黃新榮等人則從生態(tài)系統(tǒng)的視角提出了網(wǎng)頁歸檔推進策略[17]。
在具體實踐方面,我國有兩大具有代表性的網(wǎng)頁檔案實踐項目,一是由北京大學主持開發(fā)的Web信息博物館項目,二是由國家圖書館主導的WICP項目。在檔案界, 2018年,北京市檔案局、寧波市檔案局、自然資源部信息中心、國家電網(wǎng)江蘇電力公司4家單位的網(wǎng)站網(wǎng)頁資源歸檔試點工作方案通過了國家檔案局組織的專家評審,成為國家檔案局網(wǎng)站網(wǎng)頁資源歸檔試點單位[18]。2019年12月,國家檔案局在其官方網(wǎng)站上公布了《政府網(wǎng)站網(wǎng)頁歸檔指南》,詳細給出了網(wǎng)頁歸檔范圍及保管期限表[19]。
綜上所述,我國檔案界有關網(wǎng)頁檔案實踐的研究較少,且大多集中于簡單介紹國外的具體項目,而關于網(wǎng)頁檔案的具體實踐也還處于探索階段。鑒于此,本文通過分析國外網(wǎng)頁檔案實踐的政策環(huán)境,對其實踐流程進行劃分,提出對我國的啟示,以期我國網(wǎng)頁檔案實踐得到優(yōu)化和升級。
網(wǎng)頁檔案實踐活動的展開需要法律規(guī)章的支持和引導。良好的法律規(guī)章環(huán)境是保障網(wǎng)頁檔案資源得到有效的采集、共享利用的前提條件之一。由大英圖書館董事會經(jīng)營的UK Web Archive(以下簡稱UKWA)項目遵循英國2003年頒布的《法定呈繳圖書館法》,將現(xiàn)行的呈繳范圍擴大到了電子出版物,其中包括網(wǎng)站。此外,進一步遵循2013年頒布的《呈繳圖書館(非印刷作品)條例》,該條例規(guī)定六個法定圖書館有權收集所有的英國網(wǎng)站,但所收集的網(wǎng)站在獲得許可之后,才能在圖書館內查看[20]。在服務方面,大英圖書館遵循專門的網(wǎng)絡服務條款,來自英國各地的精選網(wǎng)站必須依據(jù)該條款提供給用戶使用。針對網(wǎng)頁檔案資源,該條款對利用者的利用行為進行了限定,明令禁止利用者出于商業(yè)目的利用網(wǎng)頁檔案,同時對自身的權限也進行了明確規(guī)定[21]。蘇格蘭的National Records of Scotland(以下簡稱NRS)成立于2011年4月1日,是在蘇格蘭總登記處(GROS)和蘇格蘭國家檔案館(NAS)合并后成立的,目的是收集、保存有關蘇格蘭人民和歷史的記錄,并使之能夠為后代提供利用[22]。其開展了Web連續(xù)性服務項目,網(wǎng)頁的歸檔利用是其中一部分。NRS依據(jù)1937年、2011年的《公共記錄(蘇格蘭)法》、2007年的《查詢(蘇格蘭)規(guī)則》等法律來保障其服務的有序開展,該項目制定了專門的《采集指南》,指南中明確了存檔網(wǎng)站的范圍和類型[23]。
筆者通過梳理國外關于網(wǎng)頁檔案的實踐項目,發(fā)現(xiàn)其網(wǎng)頁檔案實踐流程可劃分為三部分:網(wǎng)頁檔案采集、網(wǎng)頁檔案整理、網(wǎng)頁檔案利用。
2.1網(wǎng)頁檔案采集
網(wǎng)頁檔案采集工作就是通過各種方法對具有保存價值的網(wǎng)頁資源進行收集與歸檔,以備利用。網(wǎng)頁檔案采集主要涉及三個方面:采集范圍、采集頻率和采集工具。
(1)采集范圍
網(wǎng)頁檔案的采集有不同的采集策略,不同的采集策略決定了不同的采集范圍,可分為完整型采集、選擇型采集以及混合型采集[24]。
完整型采集是對特定網(wǎng)域的全域進行自動化采集,采集范圍廣、內容多。美國的IA宗旨是保存互聯(lián)網(wǎng)的全面記錄,對全球公開的網(wǎng)站進行定期采集。每兩個月,網(wǎng)站頁面快照都會被互聯(lián)網(wǎng)存檔,自IA項目啟動以來,互聯(lián)網(wǎng)存檔已經(jīng)存儲了2730億個網(wǎng)頁[25]。
選擇型采集是有針對性地捕獲特定的網(wǎng)站,通常是根據(jù)事件、主題進行選擇采集,采集范圍小,需要借助人力。例如,澳大利亞的PANDORA項目只采集與澳大利亞相關,且具有文化意義的網(wǎng)站[26];美國國會圖書館的Library of Congress Web Archives(以下簡稱LCWA)項目,重點采集與國家利益主題相關的網(wǎng)頁資源,包括美國選舉、伊拉克戰(zhàn)爭和911事件[27];蘇格蘭的NRS網(wǎng)頁檔案項目,事先制定指南,根據(jù)指南采集其范圍內組織創(chuàng)建和擁有的網(wǎng)站,包括蘇格蘭政府、蘇格蘭議會、蘇格蘭法院等[28]。
混合型采集是將兩種策略相結合,先大范圍地對網(wǎng)站進行完整采集,再有重點地針對某些特定的網(wǎng)站進行深度、頻繁的選擇性采集。英國的UKWA項目,首先爬網(wǎng)內容是在英國發(fā)布的網(wǎng)站,如那些在英國頂級域名上的網(wǎng)站.uk、.cymru和. scot,以及可以手動識別出在英國發(fā)布的網(wǎng)站,再由工作人員定期關注、收集有關特定事件、主題或興趣領域的網(wǎng)站[29]。
(2)采集頻率及采集工具
采集頻率的確定需要考慮網(wǎng)站的更新速度和網(wǎng)頁內容的重要程度,一般認為自動獲取每半年采集一次比較合適[30]。“對于更新頻率高的網(wǎng)站要提高采集頻率,如新聞網(wǎng)頁、社交媒體網(wǎng)絡;對于更新頻率較低的且信息量穩(wěn)定的網(wǎng)站可以延長采集頻率,如機構的官方網(wǎng)站?!盵31]采集頻率的高低還與采集范圍的確定密切相關。完整型采集范圍廣、內容多、耗費時間長,因此采集頻率較低;選擇型采集范圍小、內容少,因此采集頻率相對較高。英國的UKWA項目每年至少完成一次對英國所有網(wǎng)站的自動收集任務,但是對一些重要的網(wǎng)站(通常是新聞網(wǎng)站)會進行更頻繁的采集活動,有時甚至一天一采集。
在采集工具的選擇上面,大部分網(wǎng)頁檔案項目都會運用到網(wǎng)絡爬蟲技術,在此基礎上設計的Heritrix和HTTrack是使用較多的兩種采集工具[32]。
2.2網(wǎng)頁檔案整理
相對簡單的整理方法是根據(jù)網(wǎng)站標題的首字母從A到Z的順序排列,蘇格蘭的NRS項目網(wǎng)站按照這種方法整理網(wǎng)頁,之后再就是按照采取時間排列[33]。除此之外還有其他整理方法:
(1)按主題整理
大部分網(wǎng)頁檔案采集完畢后,為了方便用戶利用,會按網(wǎng)站的主題進行整理。例如,英國UKWA項目網(wǎng)站上的“Topics and Themes”[34]板塊匯集了100多個網(wǎng)站集合,按照各個網(wǎng)站的主題將其分門別類。在“19世紀英國文學”的主題下匯集了與19世紀英國文學和文學人物有關的網(wǎng)頁資源,收藏包括專門介紹作家協(xié)會的網(wǎng)站,主要文學活動、周年紀念活動和其他新聞報道性、轉發(fā)性、介紹性網(wǎng)站,博物館和粉絲網(wǎng)站以及學術網(wǎng)站;在“脫歐”這個主題下包括了利益集團、企業(yè)和工會、新聞機構、慈善機構、政治家、金融組織的網(wǎng)站。此外,還有單獨的集合網(wǎng)站涉及脫歐對蘇格蘭、威爾士、北愛爾蘭和愛爾蘭的影響。按照網(wǎng)站主題對所歸檔的網(wǎng)頁進行分門別類,可滿足不同類型用戶的多樣化需求。
(2)按所屬機構整理
網(wǎng)頁檔案還可以按照網(wǎng)站歸屬機構進行整理,美國的LCWA項目的存儲成果,包括國會的網(wǎng)頁檔案、立法機構的網(wǎng)頁檔案、國會法院圖書館的網(wǎng)頁檔案等[35]。
2.3網(wǎng)頁檔案利用
為了更好地發(fā)揮網(wǎng)頁檔案的價值,越來越多的國家由最開始關注網(wǎng)頁的歸檔轉向網(wǎng)頁檔案的利用,絕大多數(shù)網(wǎng)頁檔案項目提供在線公開訪問和利用。美國的IA一開始只是進行數(shù)據(jù)存檔,支持線下利用,后來打造了“Way Back Machine”,更注重用戶的多樣化需求,提供原始頁面在線訪問服務[36]。蘇格蘭的NRS項目依托網(wǎng)頁存檔提供Web連續(xù)性服務,該服務可以將用戶從其活動網(wǎng)站的丟失頁面帶到NRS Web存檔中,并在其中搜索丟失頁面的最新存檔版本。如果找到存檔版本,則會直接向用戶提供該版本,并顯示頁面是存檔版本的橫幅[37]。
網(wǎng)頁檔案項目還提供多種檢索途徑,主要有URL檢索、目錄檢索/高級檢索以及全文檢索[38]。在NRS網(wǎng)站上,可以瀏覽A—Z索引以查找要查看的網(wǎng)站,也可以使用頁面頂部的搜索欄按其URL搜索網(wǎng)站(或特定頁面)。訪問者單擊任何存檔的網(wǎng)站標題都將進入該網(wǎng)站的“索引”頁,索引頁列出了該特定網(wǎng)站的存檔快照,按捕獲日期排列。同時,還包括一個實時網(wǎng)站的鏈接,這個鏈接可以幫助用戶獲取網(wǎng)站的最新網(wǎng)頁信息。
3.1完善法規(guī),貫穿始終,保障項目運行
網(wǎng)頁檔案從采集到共享利用涉及諸多方面,需要完善的法律法規(guī)來保障其實踐項目的有序開展。在網(wǎng)頁檔案采集方面,英國的UKWA項目遵循其法定呈繳法,劃定了采集范圍;蘇格蘭的NRS項目依據(jù)多部國家法律法規(guī)制定了自身的《采集指南》。在網(wǎng)頁檔案共享利用方面,大英圖書館依據(jù)其網(wǎng)絡服務條款對網(wǎng)頁檔案利用者的行為進行了明確的限定,同時明確指出只有獲得了網(wǎng)站所有者授權,才可將網(wǎng)頁檔案資源公開利用。
在網(wǎng)頁檔案實踐方面,我國的法律法規(guī)還不健全。目前,在檔案界具有針對性的法規(guī)是國家檔案局于2019年12月16日發(fā)布的《政府網(wǎng)站網(wǎng)頁歸檔指南》(DA/T80—2019),指南自2020年5月1日起實施。該指南引用了《電子文件歸檔與電子檔案管理規(guī)范》(GB/ T18894—2016)、《電子文件存儲與交換格式版式文件》(GB/T33190—2016)、《版式電子文件長期保存格式需求》(DA/T47—2009)[39]?!斑@些引用標準內容豐富、覆蓋面廣,涵蓋電子文件格式、電子文件歸檔、電子檔案管理、電子文件信息系統(tǒng)建設、電子檔案信息系統(tǒng)建設等多個方面,圍繞政府網(wǎng)站網(wǎng)頁歸檔標準共同構成標準體系,體現(xiàn)出體系性?!盵40]在具體內容方面,指南對網(wǎng)頁檔案、網(wǎng)頁歸檔、網(wǎng)頁歸檔功能模塊術語進行了明確定義,規(guī)定了政府網(wǎng)頁歸檔的總則,網(wǎng)頁的歸檔范圍和網(wǎng)頁檔案的保管期限,給出了網(wǎng)頁歸檔收集、整理、移交接收以及網(wǎng)頁歸檔功能模塊建設的一般方法。該指南的發(fā)布為我國開展網(wǎng)頁檔案實踐活動提供了有力的支持。依托指南,我國應盡快完善多種類型網(wǎng)站網(wǎng)頁歸檔的相關政策,不僅限于政府網(wǎng)站。借鑒國外的相關經(jīng)驗,在網(wǎng)頁檔案采集方面,我國可依據(jù)當今的《中華人民共和國著作權法》對采集者權限進行具體規(guī)定,賦予采集者相應的合法權限,明確指定采集范圍和采集種類,以確保后續(xù)活動的有效展開。在網(wǎng)頁檔案共享利用方面,針對不同類型的網(wǎng)頁檔案資源,對利用者的共享利用行為進行具體的限定,不同的網(wǎng)頁檔案實踐項目可依托現(xiàn)今的法律法規(guī),制定適合自身的標準規(guī)范。在法律法規(guī)不完善的情況下,項目的主要負責人應積極主動地與網(wǎng)站所有者進行溝通,通過簽訂協(xié)議、合同,來獲取相關的網(wǎng)站所有權限,依法對網(wǎng)站進行采集和利用,為項目開展營造良好的法律環(huán)境。
3.2善于合作,多元主體協(xié)同推進實踐開展
網(wǎng)頁資源數(shù)量龐大,只有積極地開展合作才能有效地完成網(wǎng)頁歸檔利用工作。國外開展網(wǎng)頁檔案實踐項目的機構具有多元合作的特點,涵蓋圖書館、檔案館、政府、個人等。例如,美國的IA為了全方位地收集互聯(lián)網(wǎng)的記錄,與其他國家的圖書館、檔案館、大學等機構聯(lián)合成立了國際互聯(lián)網(wǎng)保存聯(lián)盟,極大地促進了國際上關于網(wǎng)頁存檔項目實踐的合作和交流共享[41],有效地推動了其對全網(wǎng)范圍內網(wǎng)頁檔案的采集工作;而前文所提到的UKWA項目,是由包含大英圖書館在內的十個成員合作開展的,其中英國國家檔案館也在其范圍內,該項目成員各有側重地完成網(wǎng)頁檔案采集工作[42]。
我國網(wǎng)頁檔案實踐與國外相比,在項目主體多元合作方面有所欠缺。目前,已落實的兩個主要網(wǎng)頁檔案實踐項目均未有檔案館的參與,國家檔案局開展的實踐項目還處于試點階段。網(wǎng)頁檔案作為重要的數(shù)字檔案資源,理應作為檔案館工作的一部分。檔案館在長期的實踐過程中累積了大量的檔案收集、整理、利用經(jīng)驗,可為網(wǎng)頁歸檔利用項目提供重要的理論和方法指導,其內部館藏資源也可作為網(wǎng)頁檔案資源的補充信息配合使用[43]。因此,我國檔案館應積極主動地開展網(wǎng)頁檔案實踐,把握機遇,借力現(xiàn)今國家檔案局開展的網(wǎng)頁歸檔試點工作,依托數(shù)字檔案館建設,有效發(fā)揮自身的優(yōu)勢,積極促成與政府、圖書館、高校等組織機構合作,充分利用人才、技術等資源,結合項目外包或者技術外包等形式協(xié)同推進項目的展開。
3.3立足用戶,注重交互式體驗,提升服務質量
為了更好地實現(xiàn)網(wǎng)頁檔案資源的價值,國外的實踐活動非常注重用戶的體驗,盡可能為用戶提供更為便捷的服務。各個項目都對所采集到的網(wǎng)頁檔案資源進行整理,并提供多種檢索途徑,用戶只需簡單操作便可找到自己想要的網(wǎng)頁檔案資源。蘇格蘭的NRS項目還依托所采集到的網(wǎng)頁檔案資源開展Web連續(xù)性服務,將存檔的網(wǎng)頁與實時網(wǎng)頁相關聯(lián),極大地提升了網(wǎng)頁檔案資源的利用率,有效減少用戶在訪問實時網(wǎng)頁時“404頁未找到”或者網(wǎng)頁丟失的現(xiàn)象,為互聯(lián)網(wǎng)用戶帶來了更好的體驗效果。此外,國外的一些項目還十分注重與用戶的互動。英國的UKWA項目專門為用戶開通了網(wǎng)站推薦渠道,民眾可主動提供其認為應該存檔的英國網(wǎng)站,借助公眾的力量補充其網(wǎng)頁檔案采集范圍。同時,該服務網(wǎng)站下設“Contact us”[44]板塊,用戶可以采用填表的形式將網(wǎng)頁存檔的一些問題及時反饋給工作人員。
我國網(wǎng)頁檔案資源在開發(fā)利用的過程中,也應做到以用戶為中心,關注用戶的利用感受。只有優(yōu)質的利用服務,才能引起用戶對網(wǎng)頁檔案資源的關注,提高網(wǎng)頁檔案的利用率,有效實現(xiàn)網(wǎng)頁檔案的價值。我國網(wǎng)頁檔案實踐項目可以充分利用微博、微信公眾號等社交媒體平臺,與用戶進行有效互動與溝通。例如,UKWA項目就開通了博客,主動推送一些與網(wǎng)頁檔案資源有關的博文,吸引用戶關注,用戶也可以在其博客上面發(fā)表評論,表達看法。
3.4打造平臺,開放利用,有效發(fā)揮檔案價值
國外大部分的網(wǎng)頁檔案在采集整理之后,都會通過其建設的服務平臺公開地提供給用戶使用。UKWA項目的服務網(wǎng)站由大英圖書館委員會監(jiān)管,該平臺承諾其展示的材料是合法的,如果訪問者對網(wǎng)頁檔案中的任何材料有異議,可通過其開通的投訴渠道進行投訴。在使用其平臺的過程中,訪問者可以根據(jù)需要更改對比度級別和字體,既可放大到200%防止文本從屏幕溢出,也可只使用鍵盤或語音識別軟件瀏覽大部分網(wǎng)站、使用屏幕閱讀器收聽大部分網(wǎng)站(包括Jaws、Nvda和Voiceover的最新版本)。使用者如果有技術上的問題可通過訪問“Ability Net”來解決問題。此外,筆者發(fā)現(xiàn)其服務網(wǎng)站兼容性很強,用手機客戶端打開時,能很好地適應屏幕。
一個有效的開放利用平臺,是連通用戶和網(wǎng)頁檔案資源的樞紐。我國在開展網(wǎng)頁檔案利用項目時,應積極主動地打造平臺,充分利用互聯(lián)網(wǎng)的優(yōu)勢,將可公開的網(wǎng)頁檔案資源通過合法渠道及時提供給用戶利用。我國的Web信息博物館,此前面向公眾開通了服務網(wǎng)站,有效地開發(fā)了網(wǎng)頁檔案利用功能,廣受好評,為今后我國網(wǎng)頁歸檔利用實踐活動打下了良好的基礎。
隨著互聯(lián)網(wǎng)的深入發(fā)展,以及網(wǎng)上政務工作的持續(xù)開展,在網(wǎng)絡活動中產(chǎn)生的大量網(wǎng)頁將會成為我國重要的數(shù)字檔案資源。而我國網(wǎng)頁檔案實踐項目尚處在起步階段,面對數(shù)量眾多的網(wǎng)頁檔案資源,如何有效采集、管理和提供利用成了亟待解決的問題。國外網(wǎng)頁檔案實踐項目的成功給了我們啟示和參考,我們應該在吸收和借鑒國外成功經(jīng)驗的同時,結合本國國情,積極主動地探索出一條適合我國網(wǎng)頁檔案實踐活動開展的有效路徑,充分采集我國的網(wǎng)頁檔案,并立足用戶提供相關網(wǎng)頁檔案共享服務,更好地發(fā)揮網(wǎng)頁檔案資源的價值。
*本文系國家社會科學基金項目“基于區(qū)域性遠程服務實踐的檔案資源共享研究”(項目編號:15BTQ073)階段性研究成果。
[1]Feise J. Accessing the History of the Web: A Web WayBack Machine, Berlin, Heidelberg, 2000[C]. Springer Berlin Heidelberg, 2000.
[2]畢云平,謝海洋.檔案學視角下網(wǎng)頁歸檔與保存研究綜述[J].檔案學研究,2015(4):74-78.
[3]張莉,顏祥林.美國網(wǎng)頁歸檔項目發(fā)展的新動向——基于NDSA2016年和2017年調查報告的分析[J].檔案與建設, 2019(10):39-42+33.
[4][35][38]曹玲,顏祥林.美國國會圖書館網(wǎng)頁歸檔項目的新動向[J].檔案學研究,2018(2):125-128.
[5]王爍,丁宇.美國網(wǎng)頁歸檔項目Web Citation發(fā)展狀況研究[J].檔案,2012(4):42-44.
[6]王爍.美國網(wǎng)頁歸檔項目——Internet Archive發(fā)展研究[J].蘭臺世界,2012(17):18-19.
[7]何玉顏.英國政府網(wǎng)頁歸檔與開發(fā)的新實踐及其啟示[J].檔案與建設,2018(9):22-25.
[8]王爍.英國國家圖書館網(wǎng)頁歸檔項目(UK WA)研究[J].湖北檔案,2012(4):25-27.
[9]王爍.法國國家圖書館網(wǎng)頁歸檔項目發(fā)展狀況研究[J].陜西檔案,2012(3):46-47.
[10]王爍,丁宇.加拿大圖書館網(wǎng)頁歸檔項目研究[J].檔案學研究,2012(6):83-85.
[11]文振興.東亞重要Web Archive項目建設比較研究[J].浙江檔案,2013(12):22-25.
[12][43]王靜.中美網(wǎng)頁歸檔項目的對比研究[J].檔案與建設,2015(7):19-23+14.
[13][31][32]周祺.網(wǎng)絡信息檔案化采集管窺[J].檔案, 2019(7):48-51.
[14]王爍,魏虹,于麗曼.網(wǎng)頁歸檔項目中的“采集策略”研究[J].辦公室業(yè)務,2013(3):157-158.
[15]黃新平.基于云計算的政府網(wǎng)站網(wǎng)頁在線歸檔管理平臺構建研究[J].北京檔案,2019(12):16-20.
[16]徐飛,鄭秋生,高艷霞.基于云存儲的網(wǎng)頁歸檔方案的研究[J].計算機時代,2017(4):21-24+28.
[17]黃新榮,曾薩.網(wǎng)頁歸檔推進策略研究——基于網(wǎng)頁歸檔生態(tài)系統(tǒng)視角[J].圖書館學研究,2018(16):63-70+16.
[18]國家檔案局[EB/OL].[2020-03-17].http://www.saac.gov. cn/daj/daxxh/201807/b7ee27b2500a4a3cbda3c8cb5a787bda.shtml.
[19][39]國家檔案局.政府網(wǎng)站網(wǎng)頁歸檔指南(DA/T80—2019)[EB/OL][2020- 03- 17].http://www.saac.gov.cn/daj/hybz/ 201912/5e653e193bd747659d78783c8c4c8818.shtml.
[20][29]UK Web Archive[EB/OL].[2020-02-13].https:// www.webarchive.org.uk/.
[21]Websites and online services[EB/OL].[2020-02-13]. https://www.bl.uk/about-us/terms-and-conditions/websites-and-online-services.
[22][33]National Records of Scotland Web[EB/OL].[2020-02-05].http://webarchive.nrscotland.gov.uk/#!/.
[23][28]National Records of Scotland. Selection Policy for the National Records of Scotland Web Continuity Service[EB/ OL].[2020- 2- 13].https://www.nrscotland.gov.uk/files/research/ web-continuity-selection-policy.pdf.
[24]劉蘭,吳振新,張智雄,徐麒.Web Archive的采集策略研究[J].現(xiàn)代圖書情報技術,2009(1):10-15.
[25][26][27][36]Thouvenin F, Hettich P, Burkert H, et al. 4 Web Archives[M]//Remembering and Forgetting in the Digital Age. Cham: Springer International Publishing, 2018:84-101.
[30]楊道玲.Web資源采集與保存研究[D].武漢:武漢大學, 2005.
[34]Topics and Themes Topics and Themes[EB/OL].[2020-2-13]. https://www.webarchive.org.uk/en/ukwa/collection.
[37]National Records of Scotland. National Records of Scotland Web Continuity Service Model[EB/OL].[2020-2-13]. https://www.nrscotland.gov.uk/files//research/web- continuity- servicemodel.pdf.
[40]金凡.《政府網(wǎng)站網(wǎng)頁歸檔指南》(DA/T80—2019)內容解讀與思考[J].北京檔案,2020(3):21-25.
[41]閆曉創(chuàng).全球網(wǎng)頁存檔項目發(fā)展狀況研究:以國際互聯(lián)網(wǎng)保存聯(lián)盟(IIPC)成員為例[J].浙江檔案,2016(8):10-14.
[42]王爍,丁宇.網(wǎng)頁歸檔項目重點問題研究[J].云南檔案, 2012(8):42-43.
[44]Contact us[EB/OL].[2020-2-13].https://www.webarchive.org.uk/en/ukwa/Contact.