国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

國內(nèi)外數(shù)字保存研究發(fā)展分析

2024-06-27 22:27:59張鶴揚臧國全
檔案管理 2024年2期
關鍵詞:發(fā)文領域文獻

張鶴揚 臧國全

關鍵詞:數(shù)字保存;數(shù)字資源;圖書;檔案;合作網(wǎng)絡;知識圖譜;數(shù)字保存;信息技術

1 引言

數(shù)字保存是一系列必要的確保數(shù)字資源可持續(xù)利用的管理活動。2022年6月23日國務院發(fā)布了《關于加強數(shù)字政府建設的指導意見》[1],進一步推動數(shù)字政府建設,同時也對檔案部門的數(shù)字檔案歸檔和長期保存能力提出挑戰(zhàn)。《“十四五”全國檔案事業(yè)發(fā)展規(guī)劃》指出2025年要基本實現(xiàn)數(shù)字轉(zhuǎn)型[2],數(shù)字檔案資源有效保存成為一個重要問題。數(shù)字保存可確保對數(shù)字信息跨時間、技術和語義轉(zhuǎn)換的長期訪問,并具有諸如社會效益(政府證據(jù))、文化效益(國家認同)和經(jīng)濟效益(利用與再利用、創(chuàng)新)等長期效益。因此,數(shù)字遺產(chǎn)的長期訪問和可信保存已引起全球的關注。

2012年9月,在加拿大溫哥華召開了旨在探討數(shù)字遺產(chǎn)保存關鍵問題的國際會議。會上通過了《溫哥華宣言》(UNESCO/UBC VANCOUVER DECLARATION),為數(shù)字遺產(chǎn)領域的理論與實踐發(fā)展提供了指南與參考。2013年12月聯(lián)合國教科文組織正式啟動“全球增強信息社會可持續(xù)性發(fā)展平臺”(Platform to Enhance the Sustainability ofthe Information Society Transglobally,PERSIST)項目,共同推動數(shù)字保存政策、技術、內(nèi)容與最佳實踐等核心主題的發(fā)展。2016年,聯(lián)合國教科文組織發(fā)布《數(shù)字遺產(chǎn)長期保存鑒選指南》(The UNESCO/PERSIST Guidelinesfor the Selection of Digital Heritage for Long-TermPreservation)(第一版),旨在為圖書館、檔案館、博物館和其他遺產(chǎn)機構(gòu)制定數(shù)字遺產(chǎn)長期可持續(xù)性保存的鑒選政策提供重要支撐。2021年,聯(lián)合國教科文組織發(fā)布了《數(shù)字遺產(chǎn)長期保存鑒選指南》第二版。在國際組織的推動下,各國也開展了數(shù)字保存的相關規(guī)劃。例如,2017年8月,美國國家檔案與文件署(National Archives and RecordsAdministration,NARA)發(fā)布了首個《數(shù)字檔案資源長期保存策略》(Strategy for Preserving Digital ArchivalMaterials),專門針對數(shù)字檔案資源的長期保存進行戰(zhàn)略規(guī)劃。[3]2022年6月,NARA在此基礎上修訂并發(fā)布了《數(shù)字保存戰(zhàn)略2022—2026》(Digital Preservation Strategy2022-2026),提出了8項關鍵性戰(zhàn)略來確保數(shù)字資產(chǎn)的長期保存和有效訪問。加拿大國家圖書檔案館于2017年11 月發(fā)布了《數(shù)字保存計劃戰(zhàn)略》,并于2022年8月對該戰(zhàn)略進行了修訂并重新發(fā)布。[4]丹麥國家檔案館發(fā)布了《數(shù)字保存戰(zhàn)略2025》(Digital Preservation Strategy 2025),提出數(shù)字保存未來發(fā)展的重點領域及實施意見。[5]

為從整體上把握國內(nèi)外數(shù)字保存領域研究的脈絡與現(xiàn)狀,本文對國內(nèi)外數(shù)字保存領域研究文獻進行計量分析,以期探索數(shù)字保存領域研究發(fā)展的基本脈絡。

2 研究設計

2.1 數(shù)據(jù)來源。本文利用中國知網(wǎng)(CNKI)數(shù)據(jù)庫和Webof Science作為中英文文獻數(shù)據(jù)源檢索平臺,開展數(shù)字保存領域的文獻研究。以2023年12月為截止時間,對1997年以來的文獻進行檢索,共獲得11 85篇中文文獻,見圖1;1207篇外文文獻(其中622篇來自Web of Science核心合集),見圖2。通過人工逐篇篩查,剔除相關程度較低和非學術類文獻,最終有11 21篇中文文獻,1073篇英文文獻(其中514篇來自Web of Science核心合集)。

2.2 研究與分析方法。本文應用Co-Occurrence14.9(后文簡稱COOC)[6]研究文獻數(shù)量發(fā)展特征、主體特征、熱點主題,綜合使用CiteSpace、VOSviewer展示研究趨勢發(fā)展特征。

3 國內(nèi)外數(shù)字保存研究建制化過程

3.1 研究趨勢分析

(1)國內(nèi)數(shù)字保存研究趨勢分析。國內(nèi)對數(shù)字保存的研究始于20世紀90年代末,根據(jù)發(fā)文趨勢,可將研究進程大致分為三個階段。

第一階段:1997年—2004年,即數(shù)字保存研究的起步階段。該階段年發(fā)文量低于20篇,主要探討電子信息時代的新挑戰(zhàn),研究如何走出傳統(tǒng)知識保存的束縛,強調(diào)利用數(shù)字圖像技術開展保護與利用并軌的重要性。

第二階段:2005年—2019年,即數(shù)字保存研究的快速發(fā)展階段。該階段文獻發(fā)表數(shù)量增長迅速且累計發(fā)文量呈指數(shù)增長,圖書館、檔案館等信息機構(gòu)也加大了在數(shù)字保存上的研究力度。研究主要包括:日益豐富和復雜的數(shù)字對象類型、長期保存關鍵技術問題、長期保存的可持續(xù)發(fā)展問題等。

第三階段:2020年至今,即數(shù)字保存研究的成熟階段。年發(fā)文量開始回落,發(fā)文速度逐漸放緩。這一階段,云計算和大數(shù)據(jù)技術等新技術的出現(xiàn)為數(shù)字保存提供了高效、可持續(xù)的策略。

(2)國外數(shù)字保存研究趨勢分析。國外關于數(shù)字保存的實踐最早開始于1998年由歐洲國家圖書館啟動的“書目記錄計算機化行動NEDLIB(Networked European DepositLibrary)項目”。該項目研制了DLS(數(shù)字圖書館系統(tǒng))中的編目、信息采集、DSEP(deposit system electronicpublication)等11 個模塊。國外最早關于數(shù)字保存的文獻出現(xiàn)在2000年,根據(jù)發(fā)文量趨勢,可將國外研究劃分為兩個階段。

第一階段:2000年—2008年,即數(shù)字保存研究的起步階段。該階段,年發(fā)文量低于20篇。2001年,聯(lián)機計算機圖書館中心(OCLC)和研究圖書館集團(Research LibraryGroup,RLG)聯(lián)合發(fā)布了《數(shù)字對象保存元數(shù)據(jù)現(xiàn)狀回顧》白皮書(Preservation Metadata for Digital Objects:A Review of the State of the Art)開啟了數(shù)字信息資源長期保存元數(shù)據(jù)的研究。2003年開放檔案信息系統(tǒng)(Open Archival Information System,OAIS)模型正式成為ISO標準。2004年開始舉辦數(shù)字資源長期保存國際會議(International Conference on Digital Preservation,iPRES)促進了該領域的研究發(fā)展。

第二階段:2009年至今,即數(shù)字保存研究的快速發(fā)展階段。該階段,數(shù)字保存技術和理論的研究獲得了顯著進展,包括數(shù)字存儲介質(zhì)的演進、保存格式的多樣化以及保護策略的創(chuàng)新。2023年的研究開始轉(zhuǎn)向利用數(shù)字領域新技術解決數(shù)字保存出現(xiàn)的新挑戰(zhàn),如人工智能在保存中的應用,以及運用新技術應對不斷演變的數(shù)字格式。在實踐方面,自2017年開始,美國、澳大利亞、加拿大、丹麥等為防范因設備、軟件過時或存儲介質(zhì)故障等造成的無法訪問和使用的風險,實施了相應的數(shù)字保存戰(zhàn)略,在戰(zhàn)略中都注重風險監(jiān)測和標準制定,并強調(diào)保存好數(shù)字檔案資源的重要性。

對比國內(nèi)外文獻發(fā)文趨勢可見,我國在數(shù)字保存領域文獻研究早于國外,且我國先于國外進入該領域發(fā)展的成長階段和成熟階段。從發(fā)文數(shù)量可見,我國每年的發(fā)文數(shù)量占據(jù)了該領域全球發(fā)文量的半邊天。

3.2 研究機構(gòu)及其合作網(wǎng)絡可視化分析。對研究機構(gòu)及其合作關系分析可以揭示該領域的研究力量和研究網(wǎng)絡特征。本文對文獻的研究機構(gòu)進行統(tǒng)計(僅統(tǒng)計第一作者所在機構(gòu),如果第一作者有多個所在機構(gòu),則僅計入第一機構(gòu)),以揭示研究機構(gòu)發(fā)展特征。

(1)國內(nèi)研究機構(gòu)統(tǒng)計及分析。通過對CNKI數(shù)據(jù)庫中數(shù)字保存領域研究機構(gòu)進行統(tǒng)計,發(fā)文數(shù)量最多的機構(gòu)分別是鄭州大學(108篇)、武漢大學(83篇)和中國科學院文獻情報中心(67篇)。發(fā)文量排名前10的研究機構(gòu)以及具體的發(fā)文數(shù)量如表1所示。由此可見,該領域的國內(nèi)研究力量主要聚集于鄭州大學、武漢大學、中國科學院文獻情報中心、國家圖書館和中國人民大學等。

進一步探索該領域研究機構(gòu)間的合作網(wǎng)絡,利用CiteSpace對國內(nèi)研究機構(gòu)合作關系網(wǎng)絡進行可視化,見圖3。

由國內(nèi)研究機構(gòu)合作網(wǎng)絡可見,目前形成了以武漢大學、中國科學院文獻情報中心和中國人民大學為中心的合作網(wǎng)絡研究集群,體現(xiàn)出當前對于數(shù)字保存的研究呈現(xiàn)出全域性合作的研究特征。此外,鄭州大學、河北大學、東北師范大學等,雖然發(fā)文量較大,但較少參與研究機構(gòu)間的合作。在這些研究機構(gòu)中,鄭州大學、武漢大學和中國科學院文獻情報中心較早進入該領域進行研究,并在該領域持續(xù)深耕至今。

(2)國外研究機構(gòu)統(tǒng)計及分析。通過對W e b o fScience核心集中的文獻進行統(tǒng)計,總發(fā)文數(shù)量最多的機構(gòu)分別是University of Maryland(11 篇)、TechnischeUniversitat Wien(10篇)和Old Dominion University(10篇),其中發(fā)文量排名前10的研究機構(gòu)以及具體的發(fā)文數(shù)量如表2所示。由此可見該領域的國外研究力量主要聚集于University of Maryland、Technische Universitat Wien、Old Dominion University和University of Illinois等。

使用CiteSpace軟件對國外研究機構(gòu)的合作關系網(wǎng)絡進行可視化(見圖4),可見,國外合作網(wǎng)絡整體較為松散,故將軟件中的過濾方式調(diào)整為顯示最大K個子網(wǎng)絡,得出合作關系較為緊密的若干研究機構(gòu)合作網(wǎng)絡,分別是以Technische Universitat Wien為中心的研究子群,DrexelUniversity和Old Dominion University為中心構(gòu)成的研究子群,以及以University System of Maryland等為中心的研究子群。這些研究子群進入數(shù)字保存領域各有先后,尚未形成在該領域長期深耕的研究機構(gòu)。

3.3 核心作者合作網(wǎng)絡可視化分析。核心作者被認為是在特定研究領域中具有較深的造詣、較高的行業(yè)影響力,并且獲得行業(yè)領域認可,科研成果較多,能提出較為新穎學術思想與觀點的學者。[7]通過對數(shù)字保存領域核心作者進行分析,能更好地把握該領域發(fā)展的趨勢和熱點。

(1)國內(nèi)核心作者合作關系網(wǎng)絡分析。為了更好地呈現(xiàn)作者之間的合作關系,使用CiteSpace軟件對作者間的合作關系網(wǎng)絡進行可視化,見圖5。圖中節(jié)點面積的大小代表其發(fā)文量,節(jié)點間的連線代表作者間的合作關系,網(wǎng)絡密度由節(jié)點間連線的稀疏程度反映。國內(nèi)數(shù)字保存領域的核心作者為臧國全、吳振新、董曉莉等,且形成了以臧國全和吳振新為核心的研究子群。

(2)國外核心作者合作關系網(wǎng)絡分析。使用CiteSpace軟件對英文文獻作者間的合作關系網(wǎng)絡進行可視化,見圖6。國外核心作者合作關系呈整體分散,局部密集的特點。國外數(shù)字保存領域的核心作者為Christoph Becker,MichealL Nelson,Richard Marciano等人,且形成了以核心作者為中心的合作研究子群。

3.4 高被引論文分析。論文的影響程度和在學術交流中的地位、作用可以在一定程度上通過論文被引頻次的高低所反映,引用次數(shù)高且引用周期長的論文被稱為高被引論文。高被引論文在一定程度上反映了該學科領域的知識源流。[8]

(1)國內(nèi)高被引論文分析。本文將從中國知網(wǎng)中檢索到的文獻按被引次數(shù)進行降序排列,其中排名前10的高被引文獻如表3所示。

通過對高被引文獻逐一閱讀,按照內(nèi)容關注點的不同,可以把論文主題分成三個方面:

一是數(shù)字保存發(fā)展過程中遇到的問題和挑戰(zhàn)。主要觀點包括區(qū)塊鏈技術雖然具有存儲、傳輸和數(shù)據(jù)信任方面的實用性,但對于數(shù)字檔案可靠性和可用性、多節(jié)點管理等方面還存在不足和風險,以及知識產(chǎn)權問題[9,10]。

二是數(shù)字保存的技術策略。該項研究成果主要體現(xiàn)為區(qū)塊鏈技術應用發(fā)展的可能性、非物質(zhì)文化遺產(chǎn)數(shù)字化采集保存和開發(fā)、云存儲技術應用和安全風險等[11 —13]。

三是數(shù)字保存推進的管理策略。馮惠玲[14]認為檔案單軌管理制是推進數(shù)字保存的重要環(huán)節(jié),并給出了單軌管理制實施的法律、政策和管理方面的必要條件。其他方面的相關研究包括:歐美國家在數(shù)據(jù)管護和數(shù)字資源長期保存方面的研究進展和啟示[15,16],主體責任和建立數(shù)字信息歸檔系統(tǒng)和選擇策略[17],非遺數(shù)字信息保護和管理的理論和知識體系[18],中歐數(shù)字資源長期保存國際研討會關于管理和技術策略的介紹[19]和標準化等方面[20]。

(2)國外高被引論文分析。將Web of Science的檢索結(jié)果按被引次數(shù)最高優(yōu)先的模式排序,排名前10的高被引論文如表4所示。通過仔細研讀Web of Science數(shù)據(jù)庫中10篇高被引論文,按照研究主題可分成硬件和軟件兩個方面。

一是數(shù)字保存的硬件解決方案。Gomes等[21]提出了運用3D技術對文化遺產(chǎn)進行數(shù)字化保存的策略。Abel等[22]提出創(chuàng)建在線虛擬博物館對數(shù)據(jù)進行保存。Bok等[23]提出利用一種創(chuàng)新的手持融合傳感器系統(tǒng),為大規(guī)模文化遺產(chǎn)的3D重建和數(shù)字化保存提供了一個實用且高效的解決方案。Kerne等[24]討論了Information-Based Ideation(IBI)的框架和評估方法,并且強調(diào)了數(shù)字策展在IBI任務中的重要作用。Lemieux[25]提出了區(qū)塊鏈技術記錄保存數(shù)據(jù)存在的問題以及三種類型的解決方案。Vincent等[26]認為眾包攝影測量技術(Crowd-Sourced Photogrammetric Reconstructions)能夠重建失落遺產(chǎn)和對遺產(chǎn)進行記憶。Li等[27]介紹了3D數(shù)字化技術在數(shù)字檔案、3D線圖繪制、虛擬修復和虛擬展示等方面的作用。Blanco-Pons等[28]討論了通過AR技術,以交互式虛擬信息展示方式解析暗淡、受損巖畫和數(shù)字化長期保存的途徑。

二是數(shù)字保存的軟件解決方案。Malone[29]介紹了專門為生物醫(yī)學領域數(shù)據(jù)分析和保存而開發(fā)的軟件本體(SWO),并為其在存儲、管理和分析數(shù)據(jù)等方面的應用提供了一個詳細的描述框架。Uhl等[30]通過整合 Convolutional NeuralNetworks(CNNs)和弱監(jiān)督學習方法,提供了一個能高效提取歷史地圖中人類聚居模式的方法。

4 國內(nèi)外數(shù)字保存研究議題嬗變的可視化分析

通過對檢索文獻進行關鍵詞共現(xiàn)分析、聚類分析以及突變分析后,可得到數(shù)字保存研究的關鍵詞共現(xiàn)圖、關鍵詞聚類表及關鍵詞突現(xiàn)圖,由此可分析國內(nèi)外數(shù)字保存研究領域的發(fā)展脈絡、主題分布及熱點前沿。

4.1 國內(nèi)外數(shù)字保存領域關鍵詞共現(xiàn)可視化分析

(1)國內(nèi)數(shù)字保存領域文獻關鍵詞共現(xiàn)分析。運用COOC軟件,對1 121篇中文文獻進行統(tǒng)計,共有關鍵詞1 652個,其中單元頻次大于等于10的關鍵詞共有34個。由于在文獻檢索時使用“數(shù)字保存”和“數(shù)字長期保存”作為檢索詞,所以在關鍵詞分析時不對上述關鍵詞進行分析,并排除掉同義詞“長期保存”與無意義詞“對策”“綜述”,余下的30個高頻關鍵詞見表5。

根據(jù)關鍵詞兩兩共現(xiàn)原則,統(tǒng)計出30個高頻關鍵詞共同出現(xiàn)的頻次,形成30×30的共詞矩陣,并根據(jù)共詞矩陣,使用VOSviewer軟件進行關鍵詞共現(xiàn)知識圖譜可視化(圖7),發(fā)現(xiàn)“數(shù)字信息資源”“圖書館”“數(shù)字圖書館”“保存策略”“數(shù)字檔案”等為數(shù)字保存相關研究領域的重要熱點。

(2)國外數(shù)字保存領域文獻關鍵詞共現(xiàn)分析。由于Web of Science數(shù)據(jù)庫中并非所有在庫的文獻都存在關鍵詞,因此只對Web of Science核心合集中的514篇英文文獻進行統(tǒng)計,得到關鍵詞1588個,其中出現(xiàn)頻次大于等于7的關鍵詞共有22個。由于在檢索文獻時使用“DigitalPreservation”和“Digital Curation”作為檢索詞,所以在關鍵詞分析時不對上述關鍵詞進行分析,余下的20個高頻關鍵詞展示見表6。

根據(jù)兩兩共現(xiàn)原則,統(tǒng)計出20個高頻關鍵詞在514篇中共同出現(xiàn)的頻次,形成20×20的共詞矩陣,并根據(jù)共詞矩陣,使用VOSviewer進行可視化(圖8)。根據(jù)節(jié)點大小,可以看出“Cultural Heritage”“Digital Humanities”“Metadata”“OAIS”等關鍵詞是國外研究數(shù)字保存領域的熱點話題??梢妵庵饕晕幕z產(chǎn)為對象研究數(shù)字人文解決方案,重點關注元數(shù)據(jù)和開放檔案管理系統(tǒng)。

4.2 國內(nèi)外數(shù)字保存領域關鍵詞聚類分析

(1)國內(nèi)文獻關鍵詞聚類分析。使用VOSviewer軟件將研究領域中具有高度相似特性的關鍵詞進行聚類,在分辨率為1.00的條件下形成7個簇,見表7。

Cluster1聚焦于數(shù)字檔案的管理,包括數(shù)字檔案信息、數(shù)字檔案館建設以及與電子文件相關的議題,尤其探討了美國在該方面的研究;Cluster2著重于研究數(shù)字圖書館,及數(shù)字圖書館信息資源數(shù)字化過程中的知識產(chǎn)權;Cluster3更關注數(shù)字資源有效保存的策略、資源以及與之相關的風險管理;Cluster4更關注于數(shù)字保存具體的技術解決方案,如OAIS、元數(shù)據(jù)在保存中的應用,以及監(jiān)測數(shù)字保存風險的方法;Cluster5側(cè)重于圖書館中的數(shù)字文獻保存;Cluster6聚焦于公共圖書館的數(shù)字化進程、大數(shù)據(jù)應用以及LOCKSS的使用;Cluster7專注于云存儲技術在數(shù)字保存中的應用和實踐。

(2)國外文獻關鍵詞聚類分析。對Web of Science核心合集中的514篇英文文獻,使用VOSviewer設置分辨率為1.00對高頻關鍵詞進行聚類,形成7個不同的簇(表8)。

Cluster1和Cluster7專注于3D技術在文化遺產(chǎn)數(shù)字化方面的應用,著重使用三維技術通過對文化遺產(chǎn)的物理形態(tài)進行掃描、建模等方式實施數(shù)字化,以便長期保存;Cluster2集中于數(shù)據(jù)的組織、管理和標準化,Metadata和Ontology作為信息的橋梁確保信息以一種標準化和互操作的方式被記錄和共享;Cluster3涉及數(shù)字資料的真實性以及檔案信息系統(tǒng)的標準(OAIS和Premis);Cluster4聚焦利用圖像捕捉技術對物理實體進行記錄和保護;Cluster5關注于CNNs(卷積神經(jīng)網(wǎng)絡)在數(shù)字人文領域中的應用,例如CNNs在圖像識別、語音處理和自然語言理解等方面為人文學科的研究提供了新的工具;Cluster6包括數(shù)字圖書館和網(wǎng)絡存檔,著重于數(shù)字信息資源的保管、檢索以及長期可用性。

4.3 國內(nèi)外數(shù)字保存領域關鍵詞突現(xiàn)可視化分析。為了進一步把握數(shù)字保存領域研究熱點的演進趨勢,并推斷和預測出可能對未來研究和發(fā)展具有重大影響的新概念或前沿話題,使用COOC軟件對數(shù)字保存領域中英文文獻的關鍵詞進行突發(fā)性檢測,并將結(jié)果進行可視化,以清晰地展示在不同時間段內(nèi)關鍵詞的流行程度以及關注度的變化。

(1)國內(nèi)文獻關鍵詞突現(xiàn)分析。使用COOC軟件的突現(xiàn)檢測功能,過濾掉單元頻次小于5的關鍵詞,按照順序?qū)⑶?0個關鍵詞保留并進行可視化(圖9),以分析各階段研究主題關注度的演變。

在數(shù)字保存研究的起步階段(2000年—2004年)主要關注數(shù)字圖書館。

在數(shù)字保存研究的快速發(fā)展階段,研究出現(xiàn)了三個階段的變化。2005年—2011 年關鍵詞突現(xiàn)為OAIS、LOCKSS、數(shù)字信息保存、檔案館、長期保存、數(shù)字信息資源、質(zhì)量標準框架、數(shù)字保存系統(tǒng)。這一時期的研究者著重關注于數(shù)字信息資源保存的途徑、方式以及統(tǒng)一的規(guī)范,表明了數(shù)字化資源管理成了研究和實踐的焦點。2011 年—2015年關鍵詞突現(xiàn)為知識產(chǎn)權、認知調(diào)查、實踐調(diào)查、保存成本、數(shù)字保存項目。在這個階段數(shù)字保存的知識產(chǎn)權問題開始受到重視,并且數(shù)字保存項目及其成本也受到了關注。2015年—2019年關鍵詞突現(xiàn)包括美國、數(shù)字檔案、電子文件、風險檢測。在這4年間研究者更關注于電子文件和檔案以及對于它們保存系統(tǒng)的風險評估,以保證這些資料的安全、可靠和完整性。

在數(shù)字保存研究的成熟階段(2019年—2023年)產(chǎn)生的突現(xiàn)詞為公共圖書館和檔案數(shù)字資源。學者們更多地關注公共圖書館在提供數(shù)字保存服務方面的作用以及檔案數(shù)字資源的保存。

(2)國外文獻關鍵詞突現(xiàn)分析。Web of Science核心合集中從2009年開始出現(xiàn)關鍵詞。使用COOC軟件的突現(xiàn)檢測功能,過濾掉單元頻次小于3的關鍵詞,并按照順序?qū)⑶?0個關鍵詞保留并進行可視化(圖10),以分析各階段研究主題關注度的演變。

2009年—2011 年的突現(xiàn)詞有Digital Libraries、Preservation。在這一階段數(shù)字圖書館以及對文獻和數(shù)字內(nèi)容長期保存的方法和策略得到了廣泛關注。

2012年—2015年突現(xiàn)的關鍵詞包括Image Processing、Ontology、Cloud、Web Archiving,這一時期的學者著重于數(shù)字信息資源的結(jié)構(gòu)化保存以及通過在線的方式將數(shù)字信息資源進行長期的存儲。

2 0 1 6 年— 2 0 2 0 年產(chǎn)生了較多的突現(xiàn)詞, 包括Convolution Neural Networks、Ontology、Deep Learning、Conservation、Digitization、Computational ArchivalScience、Research Data Management、Interoperability、Computational Thinking、Privacy、Virtual Reality??梢钥闯觯@一時期數(shù)字保存領域的發(fā)展比較活躍,同時機器學習和人工智能開始在數(shù)字保存領域得到重視。

2021年—2023年隨著大數(shù)據(jù)和數(shù)據(jù)科學的發(fā)展,該階段突現(xiàn)詞包括Data Management、Digital Humanities、Cultural Heritage,數(shù)據(jù)管理在數(shù)字保存中的作用得到重視。

5 結(jié)論與啟示

基于文獻計量分析和文獻研究方法,本文在橫向上勾勒了數(shù)字保存研究建制化過程;在縱向上梳理了數(shù)字保存研究趨勢、研究主題的演進脈絡??傮w而言,數(shù)字保存文獻研究始于20世紀90年代末,發(fā)展至今已有20余載,文獻數(shù)量從年發(fā)文量個位數(shù)實現(xiàn)了累計發(fā)文量指數(shù)級增長。隨著數(shù)字資源采購經(jīng)費的大幅增加,館藏資源結(jié)構(gòu)越來越向數(shù)字資源方向傾斜,相關研究與實踐愈加豐富。本文綜合運用Co-Occurrence軟件及其他輔助軟件,直觀形象地揭示了國內(nèi)外數(shù)字保存領域發(fā)展脈絡。

(1)國內(nèi)外數(shù)字保存的發(fā)文量經(jīng)歷了緩慢起步和快速發(fā)展兩個階段。我國在文獻研究方面起步較早,國外則在相關實踐方面起步較早,我國先于國外進入成熟階段。數(shù)字檔案長期保存是一項艱巨的系統(tǒng)工程,文獻研究的側(cè)重點也越來越多樣化,包括:日益豐富和復雜的數(shù)字對象類型、長期保存關鍵技術問題、長期保存可持續(xù)發(fā)展的管理策略等。

(2)從研究主體角度分析,通過對比國內(nèi)外研究機構(gòu)合作網(wǎng)絡圖譜可見,我國的研究機構(gòu)主要集中于大學、情報中心和圖書館等研究機構(gòu),且發(fā)文量較大,而國外研究機構(gòu)主要集中于大學,且發(fā)文量較小。我國在該領域形成了以核心節(jié)點為中心的較為緊密的合作網(wǎng)絡,且核心節(jié)點在該領域持續(xù)深耕,保持了較好的研究傳承;國外合作關系整體較為松散,存在規(guī)模較小的研究子群,且核心節(jié)點在該領域持續(xù)深耕現(xiàn)象并不明顯。通過對比國內(nèi)外核心作者合作網(wǎng)絡圖譜可見,在國內(nèi)形成了以臧國全和吳振新為核心的較大的合作網(wǎng)絡,且核心作者在該領域持續(xù)深耕;國外合作網(wǎng)絡呈整體分散,局部密集的特點,形成了進入該領域早晚不一的研究子群。

(3)從研究議題角度分析,國內(nèi)側(cè)重于研究圖書館、數(shù)字檔案等“數(shù)字信息資源”的“保存管理策略”,而國外則側(cè)重于研究基于元數(shù)據(jù)的文化遺產(chǎn)、數(shù)字人文方面的開放檔案信息系統(tǒng),以及先進數(shù)字技術在數(shù)字保存應用中的研究,側(cè)重于數(shù)字保存的技術解決方案。綜合國內(nèi)外文獻關鍵詞聚類分析可見,國內(nèi)外均關注于數(shù)字信息資源的組織、管理和標準化;在數(shù)字保存方法上均探討了OAIS、元數(shù)據(jù)等方式的使用。國外更多側(cè)重于使用3D技術和圖像捕捉等技術在文化遺產(chǎn)數(shù)字化方面的應用。綜合國內(nèi)外數(shù)字保存高頻關鍵詞突現(xiàn)分析,可見我國數(shù)字保存的文獻研究從2005年開始進入了多元化研究領域,國外2012年開始多元化;我國的研究側(cè)重于數(shù)字保存的管理方式和風險規(guī)避等方面,國外則側(cè)重于數(shù)字保存技術的研究;OAIS、LOCKSS等圖書館數(shù)字資源長期保存新方式和新機制的研究是國內(nèi)外共同的研究熱點。

猜你喜歡
發(fā)文領域文獻
Hostile takeovers in China and Japan
速讀·下旬(2021年11期)2021-10-12 01:10:43
10條具體舉措! 山東發(fā)文做好返鄉(xiāng)留鄉(xiāng)農(nóng)民工就地就近就業(yè)
Cultural and Religious Context of the Two Ancient Egyptian Stelae An Opening Paragraph
大東方(2019年12期)2019-10-20 13:12:49
領域·對峙
青年生活(2019年23期)2019-09-10 12:55:43
校園拾趣
爺孫趣事
以牙還牙
The Application of the Situational Teaching Method in English Classroom Teaching at Vocational Colleges
The Role and Significant of Professional Ethics in Accounting and Auditing
商情(2017年1期)2017-03-22 16:56:36
新常態(tài)下推動多層次多領域依法治理初探
德清县| 青冈县| 江永县| 神农架林区| 建平县| 嘉定区| 房产| 沂源县| 克拉玛依市| 临邑县| 那曲县| 辽中县| 旅游| 台南县| 昌邑市| 汾阳市| 安阳市| 道孚县| 上蔡县| 灵川县| 焦作市| 新昌县| 申扎县| 盐津县| 泽库县| 中江县| 吉林市| 望都县| 南投市| 武鸣县| 丹东市| 大足县| 方正县| 罗平县| 肃南| 平度市| 长子县| 海阳市| 开化县| 铁岭县| 牡丹江市|