趙雪芹 黨昭 李天娥
摘要:數(shù)字人文為檔案信息資源開發(fā)工作帶來了先進的技術和思維,推動了檔案信息資源開發(fā)工作的創(chuàng)新發(fā)展。文章探討檔案信息資源開發(fā)工作應該如何結(jié)合數(shù)字人文與時俱進。首先,從檔案信息資源開發(fā)工作的開發(fā)主體、開發(fā)客體、開發(fā)過程、開發(fā)成果和檔案信息用戶五個角度分析了數(shù)字人文帶來的積極影響;其次,指出了目前檔案信息資源開發(fā)還處在數(shù)字化階段、開發(fā)項目規(guī)模較小且分散、檔案館參與的數(shù)字人文項目占比較低、開發(fā)項目涉及領域單一;最后,可從轉(zhuǎn)變數(shù)字檔案信息資源整合方式、擴大開發(fā)工作規(guī)模、深化與數(shù)字人文研究團隊的合作、拓寬開發(fā)工作涉及的領域四個方面來改進上述問題。
關鍵詞:檔案信息資源開發(fā) 數(shù)字人文 數(shù)字檔案館
Abstract:Digital humanity brings advanced technology and thinking to the development of ar? chival information resources, and promotes the in? novative development of archival information re? sources development. This paper discusses how the development of archival information resources should be combined with Digital Humanities to keep pace with the times. Firstly, it analyzes the positive impact of Digital Humanities on the devel? opment of archival information resources from five perspectives: the subject, the object, the process, the results and the users. Secondly, it points out that the current development of archives informa? tion resources is still in the digital stage, the scale of development projects is small and scattered, the proportion of Digital Humanities projects that archives participate in is relatively low, and the de? velopment projects involve a single field. Finally, we can improve the above problems from four as? pects: changing the integration mode of digital ar? chives information resources, expanding the scale of development work, deepening the cooperation with the Digital Humanities Research team, and broadening the areas involved in the development work.
Keywords:Archives information resources de? velopment; Digital humanities; Digital archives
檔案信息資源開發(fā)一直是檔案學領域的重要研究方向,同時也是檔案實踐工作中最具活力的一個環(huán)節(jié),因此檔案信息資源開發(fā)既是實現(xiàn)檔案自身價值的根本途徑,也是發(fā)展檔案事業(yè)、傳播檔案文化的重要途徑。如今正是一個數(shù)字技術與人文科學相互交融的時代,數(shù)字技術為人文學科的發(fā)展提供了工具和發(fā)展的新思路。我國檔案工作者應該抓住數(shù)字人文浪潮的機遇,創(chuàng)新檔案信息資源開發(fā)的技術和形式,整合數(shù)字檔案資源,以滿足公眾對檔案信息資源的多樣化需求,進而增強檔案部門的信息服務能力。
目前我國利用數(shù)字人文進行檔案信息資源開發(fā)正處于初級發(fā)展階段,相關理論研究還比較少。朱令俊通過分析歐洲聯(lián)合數(shù)字檔案基礎設施(CENDARI)項目和威尼斯時光機項目構(gòu)建了基于數(shù)字人文的檔案信息資源開發(fā)模式[1];楊千結(jié)合檔案數(shù)字人文項目的主體、目標和實施三個方面構(gòu)建了一個數(shù)字人文框架下檔案資源開發(fā)的新模式[2];趙生輝介紹了國外檔案數(shù)字人文項目的特點并據(jù)此提出了對我國檔案數(shù)字人文項目實踐的啟示[3];張衛(wèi)東等人詳細介紹了基于數(shù)字人文的檔案文化資源整合過程[4];董聰穎通過分析威尼斯時光機項目闡述了數(shù)字人文對檔案信息資源開發(fā)利用帶來的影響[5]。
綜上所述,國內(nèi)關于檔案數(shù)字人文的理論研究包括經(jīng)驗總結(jié)、介紹國內(nèi)外先進案例并進行比較研究、構(gòu)建新的檔案信息資源開發(fā)模式等,暫時缺少對數(shù)字人文環(huán)境下的檔案信息資源開發(fā)工作現(xiàn)存問題的研究和探索。因此,本文在數(shù)字人文視角下,從檔案信息資源開發(fā)工作的五要素角度分析了數(shù)字人文對檔案信息資源開發(fā)工作帶來的積極影響,提出了工作中現(xiàn)存的一些問題,并探討了可行的改進思路。從數(shù)字人文的視角來探究檔案信息資源開發(fā)的新思路有利于全面認識技術與人文交融的現(xiàn)實狀態(tài),也可以在一定程度上豐富檔案信息資源開發(fā)方面的理論研究,有助于促進檔案信息資源開發(fā)與數(shù)字人文的跨界合作。
數(shù)字人文是指充分運用計算機技術開展的合作性、跨學科的研究、教學與出版的新型學術模式和組織形式。[6]其歷史可以追溯到20世紀40年代末期,發(fā)展至今可粗略劃分為三個階段。
(一)早期計算機與人文研究時代(20世紀中期)
1949年,意大利耶穌會學者羅貝托·博薩(Ro? berto Busa)與IBM合作,使用基于計算機的自動化技術為神學家托馬斯·阿奎那的作品建立了《托馬斯著作索引》,開創(chuàng)了“人文計算”的先河。隨后誕生了數(shù)字人文領域的第一本專業(yè)期刊《計算機和人文學》以及專門研究機構(gòu)“文學與語言學計算協(xié)會”。這一時期的數(shù)字人文活動通常集中在文學、語言學領域,主要是運用計算機進行人文語料庫建設和文本分析。[7]
(二)人文計算向數(shù)字人文過渡時代(20世紀后期—21世紀初)
20世紀90年代初,“人文計算”開始被當作一個獨立的交叉學科進行研究。隨著計算機圖形用戶界面和萬維網(wǎng)的誕生和發(fā)展,人文學者開始運用多媒體技術來組織分析人文知識。超文本數(shù)字技術的運用逐漸削弱了文本的核心地位,并且人文計算的研究領域也從文學、語言學擴展到了歷史、地理、圖書情報等多個領域?!叭宋挠嬎恪币呀?jīng)不能全面、準確地指代這一研究領域的內(nèi)涵與外延,學界認為應采用新的術語來代表此領域的研究。2001年,布萊克維爾出版社出版了《數(shù)字人文指南》一書,此后,“數(shù)字人文”一詞逐漸取代“人文計算”,成為代表這一研究領域的新術語。[8]
(三)當代數(shù)字人文時代(21世紀至今)
進入21世紀以來,世界范圍內(nèi)的數(shù)字人文項目取得了較快發(fā)展,美國的相關研究在世界范圍內(nèi)處于前沿地位。美國國家人文基金會(NEH)肯定了數(shù)字人文在推動人文學科發(fā)展上的巨大潛力,于2006年專門設置了“數(shù)字人文辦公室”,以資助數(shù)字人文項目的順利開展。各國紛紛建立數(shù)字人文中心展開數(shù)字人文項目實踐,當代數(shù)字人文超越了簡單的數(shù)據(jù)倉儲建設和文本編輯與分析,更強調(diào)動態(tài)的視圖化的知識生產(chǎn)和組織模式。
數(shù)字人文的發(fā)展對檔案信息資源開發(fā)工作的影響是探討數(shù)字人文視角下檔案信息資源開發(fā)工作改進思路的前提。
(一)檔案信息資源開發(fā)主體多元化
隨著數(shù)字技術的發(fā)展,原生電子檔案和數(shù)字化檔案資源越來越豐富,世界各國都在嘗試建設檔案數(shù)字人文項目,如美國的“影谷項目”、英國的“沃頓小鎮(zhèn)”項目,以及我國的“津沽史料”“上海記憶”等項目[9]。同時,價值是主客體之間的關系范疇,主體的需要是構(gòu)成檔案價值的前提條件。[10]如果僅以檔案館作為檔案信息資源開發(fā)的主體,難免會出現(xiàn)開發(fā)成果與用戶需求不匹配的問題,使檔案的價值難以實現(xiàn)。特里·庫克等檔案學家呼吁檔案工作者在數(shù)字時代應該成為輔導員、宣傳員,鼓勵社會公眾參與到社會記憶構(gòu)建中來,以客觀公正地反映歷史、記錄歷史。[11]因此,檔案領域數(shù)字人文項目使檔案部門與數(shù)字人文研究團隊的合作更加深入,檔案館、數(shù)字人文研究團隊和社會公眾逐漸成為檔案信息資源開發(fā)的多主體。
(二)檔案信息資源開發(fā)客體微觀化
檔案信息資源是檔案信息資源開發(fā)活動的客體[12],是檔案信息資源開發(fā)工作的基礎?,F(xiàn)實中,檔案館受到管理能力和資金等客觀因素的限制,檔案鑒定工作必然會造成某些文件、文件形成者、職能、活動以及社會群體受到優(yōu)待,而另一些則被邊緣化或沉默化。[13]因此,研究者們開始把目光移向社交媒體檔案上來,如英國國家檔案館在2009年開始對政府網(wǎng)頁和社交媒體進行收集和保存[14];美國國會圖書館在2010年開始對推特(Twitter)自2006年產(chǎn)生的推文進行保存[15]。社交媒體檔案的收集和保存意味著檔案信息資源的開發(fā)工作不應該只專注于宏觀的國家大事、名人事跡,普通民眾的真實生活和見聞也應該被記錄下來。
(三)檔案信息資源開發(fā)過程合作化
檔案信息資源開發(fā)過程是將檔案信息經(jīng)過開發(fā)轉(zhuǎn)化為相關成果的系統(tǒng)程序。[16]傳統(tǒng)檔案信息資源開發(fā)強調(diào)館藏基礎原則,這種開發(fā)方式未實現(xiàn)館藏檔案信息資源與用戶需求的有效銜接。數(shù)字人文的開源共享理念和先進技術促進了檔案領域與數(shù)字科技的跨界合作,創(chuàng)新了檔案信息資源開發(fā)的觀念并催生了新的開發(fā)模式。當前,越來越多的檔案數(shù)字人文項目以用戶需求為導向,以海量檔案信息資源為基礎,依托先進技術和創(chuàng)新視角,進行檔案信息資源深度開發(fā)。[17]
(四)檔案信息資源開發(fā)成果多樣化
傳統(tǒng)檔案信息資源開發(fā)成果的類型主要是文本和影音,僅能供人們閱讀和傾聽,數(shù)字人文的加入使得檔案信息資源開發(fā)成果更加豐富多樣。如英國紐卡斯爾市的泰恩·威爾檔案館和博物館、市圖書館等多家機構(gòu)聯(lián)合開發(fā)的一款App——“隱秘的紐卡斯爾”。[18]使用這款App漫步在紐卡斯爾的街道上,它將像智能導游一樣根據(jù)位置信息實時向用戶推送相關的照片、影像等檔案信息。這種即時的歷史與現(xiàn)實碰撞的沉浸式體驗遠比靜態(tài)展示檔案信息文本更有效果。數(shù)字人文的發(fā)展對檔案信息資源開發(fā)提出了新要求、提供了新方法,未來的檔案信息資源開發(fā)成果將朝著多樣化方向發(fā)展。
(五)檔案信息用戶普遍化
用戶是否滿意是檢驗檔案信息資源開發(fā)工作是否合格的重要標準。由于用戶的教育背景和成長環(huán)境具有很大差異,檔案利用需求也是多種多樣的,而傳統(tǒng)的檔案信息資源開發(fā)成果過于單調(diào),難以滿足廣大群眾的多樣化利用需求。在數(shù)字人文熱潮下,檔案信息資源開發(fā)工作開始對更貼近人們生活的題材進行開發(fā),講述人們自己的故事;開發(fā)工作涉及的主體更多元,普通公眾有機會參與其中;開發(fā)成果也更加多樣化。這些變化降低了檔案信息資源利用的門檻,必然會吸引更多普通公眾利用檔案信息資源,推動檔案信息利用由小眾走向大眾。
雖然數(shù)字人文的發(fā)展為我國檔案信息資源開發(fā)帶來了很多積極影響,促進了開發(fā)工作的進步與創(chuàng)新,但與國外先進地區(qū)相比,我國的檔案信息資源開發(fā)工作仍存在不足。
(一)檔案信息資源開發(fā)還處在數(shù)字化階段
我國的檔案信息資源開發(fā)主要還停留在“數(shù)字化”階段,即主要是通過檔案數(shù)字化以及檢索途徑的豐富來建設數(shù)據(jù)庫。其目的在于減輕人文研究者的負擔,把他們從機械的資料收集勞動中解放出來,但發(fā)現(xiàn)問題、分析問題的工作還是由人腦完成,未能發(fā)揮數(shù)字技術統(tǒng)計分析海量數(shù)據(jù)的優(yōu)勢,尚未進入“數(shù)據(jù)化”階段。檔案信息資源開發(fā)深度不足,不能將檔案信息的粒度從文件級轉(zhuǎn)變?yōu)閿?shù)據(jù)級,從信息單元轉(zhuǎn)變?yōu)橹R節(jié)點[19],機器無法識別檔案數(shù)字化掃描件中的具體內(nèi)容,這給數(shù)據(jù)的管理和分析工作帶來了很大的不便,檔案數(shù)據(jù)化加工的工作任重道遠。
(二)檔案信息資源開發(fā)項目規(guī)模較小且分散
我國的檔案信息資源開發(fā)項目主要由高校、圖書館、檔案館等研究機構(gòu)展開,未能與更多領域展開合作,也未能吸引社會公眾的廣泛參與,缺乏社會性。由于開發(fā)主體較為分散,各機構(gòu)、各地區(qū)“各自為政”,也未形成科學的項目開發(fā)模式。一方面,這樣難以形成廣泛的社會影響力;另一方面也難以保障項目成果的質(zhì)量。如青島市檔案館的“老青島”項目、上海市檔案館的“上海記憶”項目的規(guī)模都比較小,僅局限于該城市的檔案館內(nèi),其開發(fā)成果都只在各自對應的檔案門戶網(wǎng)站上呈現(xiàn),并且在網(wǎng)站上所占的位置也比較隱蔽,普通用戶很難找到,其所呈現(xiàn)的內(nèi)容也相對單薄,只包含了少量的文字和圖片。
(三)檔案館參與的數(shù)字人文項目占比較低
目前國內(nèi)具有代表性的數(shù)字人文項目大多由高?;驁D書館牽頭發(fā)起,如上海圖書館的“上海年華”項目、中國人民大學的“北京記憶”項目等。而檔案館參與的數(shù)字人文項目很少,目前所知的只有“老青島”項目、“上海記憶”項目、“津沽史料”等寥寥數(shù)個,并且在開發(fā)成果的質(zhì)量和影響力上與圖書館和高校的數(shù)字人文開發(fā)成果相比差距較大。由圖書館或高校開展的數(shù)字人文項目都以獨立網(wǎng)站的形式展示其開發(fā)成果,內(nèi)容比較豐富,檢索體系比較完整。而由檔案館開展的項目成果通常只在其相對應的檔案館門戶網(wǎng)站中展示,其內(nèi)容比較單薄,檢索途徑也比較單一。
(四)檔案信息資源開發(fā)項目涉及領域單一
在儒家注重學史的教育思想、歷朝歷代重視編史修志以及5000年深厚歷史底蘊的影響之下,我國的檔案信息資源開發(fā)工作主要致力于史學研究和社會記憶留存,在其他領域還存在較大空白。美國的檔案數(shù)字人文項目涉及的領域很多,除歷史學外,還涉及文學、地理學、建筑學等學科。如哈佛大學的“漫步伊甸園”項目,它由哈佛大學地理信息中心利用地理信息系統(tǒng)將保羅·薩洛佩克在全球范圍內(nèi)徒步行走的過程中產(chǎn)生的照片、影像、手稿,以及其行程中的GPS數(shù)據(jù)繪制成可視化地圖,該項目還涉及歷史學和文學。[20]而我國的“北京記憶”“盛宣懷檔案知識庫”等檔案數(shù)字人文項目主要還是服務于歷史文化研究。
(一)轉(zhuǎn)變數(shù)字檔案信息資源整合方式
檔案數(shù)字人文項目必須基于一定規(guī)模和體系的檔案數(shù)字資源才能有效開展,因此按照特定主題對現(xiàn)有的館藏檔案資源進行系統(tǒng)整合是開展檔案數(shù)字人文項目的基礎工作之一。檔案信息資源整合可以分為實體檔案資源整合和數(shù)字檔案信息資源整合兩個方面。我國實體檔案資源整合的經(jīng)典案例是“深圳、廣東順德、上海浦東新區(qū)的‘多檔合一模式”和“安徽和縣的集中管理模式”[21],其將本行政區(qū)劃內(nèi)的多個檔案館進行合并統(tǒng)一管理,實現(xiàn)了檔案資源的重新整合與共享,破除了各檔案館之間的信息壁壘,有效避免了檔案資源重復管理的資源浪費現(xiàn)象。數(shù)字檔案信息資源整合應借鑒實體檔案資源整合的實踐經(jīng)驗,破除“本館”“本室”的界限,自覺將“本館”“本室”納入本地區(qū)、全國乃至全球的檔案信息資源網(wǎng)絡體系中來。
(二)擴大檔案信息資源開發(fā)工作的規(guī)模
我國的檔案信息資源項目開發(fā)主體較為分散,大多由圖書館、檔案館以及高??蒲袡C構(gòu)開展,未能形成各領域間的聯(lián)動。為擴大數(shù)字人文背景下檔案信息資源開發(fā)工作的社會影響力,國家應在宏觀層面出臺相關政策支持、引導檔案部門與數(shù)字人文研究團隊以及其他學科領域進行合作,建立健全相關技術標準,規(guī)范檔案數(shù)字人文項目開展流程,避免因各地區(qū)標準差異造成的開發(fā)成果冗雜和資源浪費。此外,檔案館應加強國際交流與合作。檔案館可以積極與國外高校、數(shù)字人文中心進行合作與交流,借鑒國外檔案數(shù)字人文項目的先進管理經(jīng)驗和技術。如浙江大學和哥倫比亞大學合作的“甲骨文數(shù)字化”項目,北京大學、哈佛大學費正清中國研究中心等合作的“中國歷代人物傳記資料庫”項目等。[22]
(三)深化檔案部門與數(shù)字人文研究團隊的合作
檔案部門應該重視對檔案信息內(nèi)容的深層次開發(fā),創(chuàng)新檔案信息開發(fā)成果的呈現(xiàn)形式,從整合的檔案信息資源中創(chuàng)造出新信息、新知識。然而,檔案部門受自身數(shù)字技術水平的限制,想要獨立達到這種開發(fā)水平的難度較大、成本較高。而數(shù)字人文研究團隊匯集了信息技術領域的專業(yè)技術人員,能夠為檔案信息資源開發(fā)提供技術支持和新的思維方式。因此,檔案部門應積極參與檔案數(shù)字人文項目,通過數(shù)字人文研究團隊提供的先進技術開發(fā)更富創(chuàng)造力、競爭力的成果,實現(xiàn)檔案部門與數(shù)字人文研究團隊的優(yōu)勢互補,也為檔案開發(fā)工作的未來儲備優(yōu)秀人才。
(四)拓寬檔案信息資源開發(fā)涉及的領域
一是應將公眾納入開發(fā)主體中,發(fā)揮集體智慧。檔案館可以通過“眾包”鼓勵公眾參與檔案信息資源開發(fā)。檔案館作為發(fā)包方可在前期設置一定的準入門檻并對報名者進行甄選,以控制志愿者的數(shù)量和質(zhì)量,然后,制定項目的整體規(guī)劃,粗略估計項目進程;在項目進行期間,應及時對參與者進行指導并嚴格監(jiān)督項目執(zhí)行過程和完成情況,在此基礎上調(diào)整項目計劃;在項目完成后,檔案館應審查項目成果,及時修正發(fā)現(xiàn)的問題,確保最終成果的質(zhì)量。[23]通過這種形式可使公眾從檔案信息資源開發(fā)的利用者轉(zhuǎn)變?yōu)殚_發(fā)者,檔案館能夠從中獲取檔案信息用戶的真實需求,擴大檔案信息資源開發(fā)成果的適用范圍。
二是應促進檔案部門與其他學科進行合作開發(fā)。檔案作為人類社會生活實踐的原始記錄,能夠為其他學科的科學研究提供優(yōu)質(zhì)資料。檔案部門可以與其他學科領域展開合作,針對該領域的特殊需求共同開發(fā)檔案信息資源,這樣檔案信息資源開發(fā)涉及的領域也會得到擴展。如流行病學家馬塞爾·薩拉西與“威尼斯時光機”項目展開合作,研究17世紀中葉鼠疫肆虐威尼斯的情況。檔案數(shù)字人文項目可以與醫(yī)學、政治經(jīng)濟學等眾多學科領域進行跨界合作,以精準需求為導向,開發(fā)檔案資源。
隨著數(shù)字技術的快速發(fā)展和廣泛應用,越來越多的人文學者開始探索數(shù)字技術與人文研究深度融合的新模式。利用數(shù)字人文的方法與技術創(chuàng)新檔案信息資源開發(fā)工作,既符合國家的發(fā)展規(guī)劃,也順應了時代的發(fā)展趨勢。檔案信息資源的整合、開發(fā)、涉及領域以及檔案部門與數(shù)字人文團隊的合作是數(shù)據(jù)時代檔案開發(fā)利用的創(chuàng)新體現(xiàn),數(shù)據(jù)可視化、數(shù)據(jù)挖掘分析等數(shù)字技術為檔案數(shù)字人文項目奠定了技術基礎。數(shù)字人文的興起為檔案信息資源開發(fā)工作的轉(zhuǎn)型和發(fā)展提供了契機,檔案工作者應該抓住機遇,提高檔案信息資源開發(fā)工作的水平,更好地維護檔案機構(gòu)科學文化事業(yè)中心的地位,發(fā)揮好其科學文化傳播的作用。
注釋及參考文獻:
[1]朱令俊.基于數(shù)字人文的檔案信息資源開發(fā)模式構(gòu)建和實施研究[J].浙江檔案,2018(12):21-23.
[2][19]楊千.數(shù)字人文視域下我國檔案資源合作開發(fā)模式研究[J].檔案與建設,2019(10):8-12.
[3]趙生輝.國外檔案領域數(shù)字人文項目的實踐與啟示[J].浙江檔案,2015(9):14-17.
[4]張衛(wèi)東,張?zhí)煲唬戣?基于數(shù)字人文的檔案文化資源整合研究[J].蘭臺世界,2018(2):17-20;16.
[5]董聰穎.穿梭千年:數(shù)字人文對檔案信息資源開發(fā)利用的影響[J].檔案管理,2018(2):11-14.
[6][7][8]伯倫克,德魯克,倫恩費爾德,等.數(shù)字人文:改變知識創(chuàng)新與分享的游戲規(guī)則[M].北京:中國人民大學出版社, 2018: 51-52.
[9][20]劉晉如.中美檔案數(shù)字人文項目比較研究[J].檔案管理,2019(2):33-36.
[10]馮惠玲.檔案學概論[M].北京:中國人民大學,2006: 47-48.
[11][13]庫克,李音.四個范式:歐洲檔案學的觀念和戰(zhàn)略的變化:1840年以來西方檔案觀念與戰(zhàn)略的變化[J].檔案學研究,2011(3):81-87.
[12][16][21]金波.檔案學導論[M].上海:上海大學出版社, 2018: 263-264.
[14]梁皆璇.英國政府網(wǎng)頁檔案項目及其啟示[J].北京檔案,2014(12):38-40.
[15]張小飛,曹航.新媒體視角下的檔案信息資源開發(fā)理念創(chuàng)新[J].北京檔案,2018(9):40-43.
[17]牛力,劉慧琳,曾靜怡,等.數(shù)字時代檔案資源開發(fā)利用的重新審視[J].檔案學研究,2019(5):67-71.
[18]Tyne and Wear Archive & Museums.About Hidden Newcastle[EB/OL].[2019-08-07].http://www. hiddennewcastle.org.
[22]鄧要然.美國圖書館領域數(shù)字人文項目研究[J].圖書館工作與研究,2017(8):29-35.
[23]詹逸珂.數(shù)字人文項目前端歷史檔案資源眾包探析:特征、風險及其控制[J].山西檔案, 2020(2): 77-84.
作者單位:湖北大學歷史文化學院