李妲
關(guān)鍵詞:數(shù)字人文;檔案編研;編研主體;編研素材;數(shù)字倉(cāng)儲(chǔ);多元化;可視化
數(shù)字人文(Digital Humanities)于21世紀(jì)初逐漸興起,[1]是指將計(jì)算機(jī)技術(shù)與人文學(xué)科進(jìn)行深度融合,以可視化分析、大數(shù)據(jù)挖掘、知識(shí)圖譜關(guān)聯(lián)等為代表的相關(guān)技術(shù)作為重要研究方法的交叉研究領(lǐng)域。從數(shù)字人文視域探討檔案編研模式問(wèn)題,通過(guò)借助數(shù)字人文理念、技術(shù)與方法,將有助于在檔案編研中提升選題、選材的科學(xué)性,使檔案內(nèi)容實(shí)現(xiàn)深度挖掘,最終使檔案編研成果在內(nèi)容呈現(xiàn)上更加豐富,從而充分發(fā)揮檔案的各種潛在價(jià)值。
1 文獻(xiàn)回顧
國(guó)內(nèi)外學(xué)界對(duì)檔案編研模式研究主要呈現(xiàn)的特征包括等主體、理念、技術(shù)三個(gè)方面。
在檔案編研模式所涉主體方面。傳統(tǒng)環(huán)境下檔案編研模式主要以檔案部門(mén)獨(dú)立編研或是與機(jī)關(guān)單位合作編研的模式為主,受限于主體思維單一性,很難對(duì)檔案資源進(jìn)行深入挖掘、分析研究,[2]選題上也存在明顯局限性,主要以大事記、文件匯編等內(nèi)容為主,未能充分利用信息技術(shù)擴(kuò)大編研主體范圍,[3]吸收公眾參與檔案編研,構(gòu)建新范式下公眾參與的檔案編研模式。[4]
在檔案編研模式所持理念方面。數(shù)字人文基本活動(dòng)主要包含對(duì)檔案、資料等各種資源的儲(chǔ)存、分析、建模等工作,[5]在已開(kāi)展的數(shù)字人文工作中,已有不少結(jié)合檔案存檔、收集和保存的研究。[6]因此,檔案編研模式也須順應(yīng)趨勢(shì),改變編研理念,如把眾包模式引入檔案編研工作,營(yíng)造社會(huì)化的編研氛圍。[7]并且,還可引入價(jià)值共創(chuàng)理念,構(gòu)建以用戶為主導(dǎo)邏輯的檔案文獻(xiàn)編研模式,以此增強(qiáng)檔案編研用戶的參與感,促進(jìn)檔案編研質(zhì)量的提升。[8]
在檔案編研模式所用技術(shù)方面。數(shù)字人文科學(xué)提出了一個(gè)新興的跨學(xué)科框架,[9]運(yùn)用數(shù)字技術(shù)參與檔案信息資源采集、分析、呈現(xiàn)等全過(guò)程[10]處理,促進(jìn)檔案內(nèi)容深度挖掘,提升檔案編研質(zhì)量。將數(shù)字技術(shù)融入搜索、加工、展示等檔案編研工作的相關(guān)層面,[11 ]有助于提升編研工作的效率。
綜上所述,目前國(guó)內(nèi)外檔案界對(duì)檔案編研模式的研究主要集中在探討檔案編研模式的新策略,有少數(shù)成果涉及數(shù)字人文理念、方法等。本文通過(guò)分析檔案編研模式現(xiàn)狀,結(jié)合數(shù)字人文相關(guān)理念及技術(shù),構(gòu)建了數(shù)字人文視域下的檔案編研模式,提出了相應(yīng)的實(shí)現(xiàn)策略,為檔案編研提供參考。
2 檔案編研模式現(xiàn)狀分析
傳統(tǒng)環(huán)境下的檔案編研模式已難以適應(yīng)新時(shí)代檔案編研工作的發(fā)展需求,并在一定程度上成了新時(shí)代檔案編研進(jìn)一步發(fā)展和突破的阻礙。[12]
2.1 檔案編研模式的類型。檔案編研模式可分為獨(dú)立編研模式和合作編研模式兩種類型。
獨(dú)立編研模式在檔案編研工作中占據(jù)主導(dǎo)地位。北京市各市屬機(jī)關(guān)和檔案機(jī)構(gòu)的編研成果中以檔案部門(mén)自編的有687種,占90.51%,與其他部門(mén)合編的有72種,僅占9.49%。[13]選題上主要涉及重大事件類、文化類、經(jīng)濟(jì)與城市建設(shè)類等,如《北京的名園名山》《檔案中的北京文化》等書(shū)籍,服務(wù)對(duì)象主要為各級(jí)各類黨政機(jī)關(guān)或單位及專家學(xué)者,面向社會(huì)公眾的成果較少。[14]
就合作編研模式而言,檔案界尚未形成常態(tài)化的合作開(kāi)發(fā)機(jī)制,[15]合作編研成果占比較小,合作模式在當(dāng)前編研模式中并非主流。此外,從合作模式主體構(gòu)成來(lái)看,主要為檔案館館際之間以及檔案館與機(jī)關(guān)機(jī)構(gòu)之間,編研成果主要以史料、文件匯編等出版物或是網(wǎng)絡(luò)圖文展覽等為主,與獨(dú)立編研模式所形成的成果并無(wú)太大區(qū)別。如自1949年以來(lái),廣西文獻(xiàn)編研的合作成果主要包括有廣西區(qū)檔案館與中央檔案館合編的《廣西革命歷史文件匯集1926-1936》,區(qū)檔案館與廣西區(qū)民族事務(wù)委員會(huì)合編的《廣西民族工作檔案選編1950-1965》,區(qū)檔案館與廣西書(shū)畫(huà)院一起攜手編輯的 《紀(jì)念廣西壯族自治區(qū)檔案館成立五十周年書(shū)畫(huà)作品集》。[16]
總之,當(dāng)前我國(guó)檔案編研工作中合作編研模式不僅開(kāi)展少,而且合作對(duì)象也較為單一,與數(shù)字人文所倡導(dǎo)的跨界、跨領(lǐng)域的合作理念不相匹配。
2.2 檔案編研模式的理念。在選題、選材理念方面,目前還是滿足資政參考、檔案業(yè)務(wù)、史學(xué)研究等內(nèi)部工作需求為主,社會(huì)化編研選題較少,選題較為單一。編研選材上,其內(nèi)容集中于政務(wù)文書(shū),[17]具一定的局限性。
在編研方式理念方面,獨(dú)立與合作的編研模式均存在一定的問(wèn)題,如圖1所示,且存在編研成果物理載體的局限性。在提供利用的方式上主要以用戶到檔案館利用或是將編研成果出版物掃描上網(wǎng),提供網(wǎng)絡(luò)展覽的形式為主。
目前,我國(guó)數(shù)字化檔案資源已經(jīng)有了巨大的存量,2019年全國(guó)各級(jí)國(guó)家綜合檔案館館藏電子檔案已達(dá)到11 9.3萬(wàn)GB。[18]隨著我國(guó)文件“單軌制”的持續(xù)發(fā)展推進(jìn),必將大力推動(dòng)檔案編研方式進(jìn)行數(shù)字化轉(zhuǎn)型,使編研工作能夠合理根據(jù)研究需要,提供個(gè)性化、智能化和可視化的編研成果,活化檔案館藏、拓展界域,實(shí)現(xiàn)資源增值與文化共享。[19]
3 基于數(shù)字人文視域的檔案編研模式構(gòu)建
該模式與傳統(tǒng)環(huán)境下檔案編研模式主要區(qū)別是編研主體構(gòu)成上更為多樣,可達(dá)到主體跨領(lǐng)域合作、公眾參與、容深度挖掘的目的。
3.1 編研主體層。主體由檔案機(jī)構(gòu)、數(shù)字人文研究團(tuán)隊(duì)和社會(huì)公眾構(gòu)成[20]。檔案機(jī)構(gòu)的任務(wù)主要體現(xiàn)在標(biāo)準(zhǔn)規(guī)范、整合優(yōu)化資源、組織合作隊(duì)伍、打通公眾交互渠道等方面。數(shù)字人文研究團(tuán)隊(duì)則將計(jì)算機(jī)技術(shù)融入檔案編研過(guò)程中,實(shí)現(xiàn)數(shù)據(jù)采集、處理等。公眾參與檔案編研主要承擔(dān)協(xié)作式檔案信息分析和輔助式研究開(kāi)發(fā)工作,[21]通過(guò)交互平臺(tái)積極與檔案館、數(shù)字人文研究團(tuán)隊(duì)溝通,反饋成果的利用體驗(yàn)。
3.2 數(shù)字倉(cāng)儲(chǔ)層。數(shù)字人文倉(cāng)儲(chǔ)即基于知識(shí)本體的數(shù)字檔案資源的采集、加工、組織和保存,[22]包含數(shù)字檔案資源集合,以及對(duì)數(shù)字檔案資源進(jìn)行加工處理的各類程序。
數(shù)字檔案資源集合是合作編研主體之間經(jīng)過(guò)數(shù)據(jù)采集后形成的數(shù)據(jù)保存?zhèn)}庫(kù)。利用數(shù)據(jù)挖掘工具從數(shù)字檔案資源集合中將與檔案編研主題相關(guān)的數(shù)據(jù)進(jìn)行收集,并對(duì)收集后的數(shù)據(jù)進(jìn)行分析處理。數(shù)據(jù)分析的過(guò)程主要分為數(shù)據(jù)提取過(guò)程和數(shù)據(jù)處理過(guò)程,可利用自動(dòng)分類聚類工具、資源描述框架工具(RDF)等可視化分析工具進(jìn)行處理。
3.3 內(nèi)容詮釋層。內(nèi)容詮釋層即利用關(guān)聯(lián)數(shù)據(jù)所要表現(xiàn)出來(lái)的具體事件進(jìn)行內(nèi)容呈現(xiàn),根據(jù)數(shù)據(jù)所揭示出來(lái)的各類事件或是知識(shí)點(diǎn)探尋檔案編研的選題和選材。
經(jīng)過(guò)數(shù)字人文倉(cāng)儲(chǔ)的數(shù)據(jù)挖掘和數(shù)據(jù)分析程序后,數(shù)據(jù)之間已建立關(guān)聯(lián)特征,關(guān)聯(lián)數(shù)據(jù)可為某個(gè)事件、某個(gè)知識(shí)點(diǎn)或是某個(gè)事實(shí)的描述。[23]對(duì)此,可利用模型工具、主題分析、聚類分析等方法對(duì)關(guān)聯(lián)數(shù)據(jù)所描述的內(nèi)容進(jìn)行詮釋,通過(guò)解釋分析知識(shí)圖譜和數(shù)據(jù)報(bào)告找到編研選題和選材從而形成編研成果。如上海市圖書(shū)館主導(dǎo)的家譜知識(shí)服務(wù)平臺(tái)利用了關(guān)聯(lián)數(shù)據(jù)技術(shù)將《中國(guó)家譜總目》收錄的六百多個(gè)姓氏進(jìn)行了數(shù)據(jù)處理,多部家譜數(shù)據(jù)由此建立了數(shù)據(jù)關(guān)聯(lián),隱含在不同家譜文獻(xiàn)中的知識(shí)被有機(jī)地組織了起來(lái),梳理出了家族的可視化遷徙圖。
3.4 成果呈現(xiàn)層。成果呈現(xiàn)層利用數(shù)字人文方法及技術(shù)體系以實(shí)現(xiàn)視覺(jué)化和知識(shí)化服務(wù)。
數(shù)字人文研究主張跨領(lǐng)域合作理念,數(shù)字人文視域下的檔案編研模式由不同領(lǐng)域的合作編研主體構(gòu)成,通過(guò)搭建數(shù)字人文倉(cāng)儲(chǔ)對(duì)數(shù)據(jù)進(jìn)行分析處理,將編研成果內(nèi)容進(jìn)行可視化呈現(xiàn)的模式,正是將數(shù)字人文理念與數(shù)字人文工具深度融合實(shí)現(xiàn)對(duì)檔案內(nèi)容充分挖掘的過(guò)程。
4 數(shù)字人文視域下檔案編研模式實(shí)現(xiàn)路徑
數(shù)字人文視域下檔案編研模式以更為創(chuàng)新的思維,以人文研究為導(dǎo)向,更好地實(shí)現(xiàn)編研成果的利用服務(wù)。
4.1 編研主體多元化的合作。伴隨著數(shù)字人文研究項(xiàng)目的不斷發(fā)展,檔案機(jī)構(gòu)可尋求多方支持。哈佛大學(xué)主導(dǎo)開(kāi)展的“中國(guó)歷代人物傳記資料庫(kù)(CBDB)”[26]項(xiàng)目,融合了哈佛大學(xué)費(fèi)正清研究中心、我國(guó)臺(tái)灣中央研究院歷史語(yǔ)言研究所、北京大學(xué)中國(guó)古代史研究中心等眾多檔案、歷史、計(jì)算機(jī)領(lǐng)域的數(shù)字人文研究專家,為該項(xiàng)目順利開(kāi)展提供了強(qiáng)力支撐。以眾包模式吸收公眾成為編研主體也是合作的重要形式。類似做法在圖書(shū)館界已有了成功的案例,如上海市圖書(shū)館通過(guò)眾包項(xiàng)目建設(shè)了歷史文獻(xiàn)眾包平臺(tái)、驗(yàn)證碼項(xiàng)目[27]。
4.2 編研素材多維度的融合。利用本體語(yǔ)言設(shè)計(jì)理念、數(shù)據(jù)清洗、概念模型工具對(duì)各類編研素材進(jìn)行知識(shí)組織,使之聚類與重組,形成多個(gè)專題數(shù)據(jù)庫(kù),從而實(shí)現(xiàn)對(duì)編研素材的優(yōu)化、融合。如“影谷項(xiàng)目”的開(kāi)展聚合了美國(guó)南北戰(zhàn)爭(zhēng)期間從“戰(zhàn)爭(zhēng)前夕”到“戰(zhàn)爭(zhēng)期間”再到“戰(zhàn)爭(zhēng)過(guò)后”各個(gè)階段的各類信件、日記、報(bào)紙等全部素材,海量素材經(jīng)過(guò)優(yōu)化融合后為人文研究提供了重要的參考文獻(xiàn)。[28]
4.3 編研理念多元化的敘事。數(shù)字人文項(xiàng)目的目標(biāo)導(dǎo)向關(guān)注補(bǔ)充多元敘事視角,聚焦隱性內(nèi)容挖掘。[31]檔案機(jī)構(gòu)可開(kāi)展案例試點(diǎn)工作,將與編研主題相關(guān)的數(shù)字檔案資源進(jìn)行數(shù)據(jù)挖掘,利用語(yǔ)義分析工具、資源描述框架(RDF三元組)、數(shù)據(jù)自動(dòng)批處理、地理信息系統(tǒng)工具(GIS)等技術(shù)將其進(jìn)行數(shù)據(jù)關(guān)聯(lián),形成“以點(diǎn)帶面”的形式,在日后其他的檔案編研工作中,讓關(guān)聯(lián)數(shù)據(jù)的規(guī)模不斷擴(kuò)大,讓更多的隱性內(nèi)容得到挖掘。如“威尼斯時(shí)光機(jī)項(xiàng)目”,從2012年推出至今已歷時(shí)11 年,項(xiàng)目?jī)?nèi)容每年都在增加。項(xiàng)目組通過(guò)利用關(guān)鍵詞建立不同類型文檔的鏈接,這種大量數(shù)據(jù)之間的交叉引用將信息組織成一個(gè)巨大的關(guān)聯(lián)數(shù)據(jù)資源庫(kù),[29]海量信息資源進(jìn)行關(guān)聯(lián)組織后便可不斷發(fā)現(xiàn)新的研究線索,項(xiàng)目的規(guī)模也隨之不斷擴(kuò)大。
4.4 編研技術(shù)可視化的應(yīng)用。充分運(yùn)用虛擬現(xiàn)實(shí)技術(shù)(VR)等相關(guān)技術(shù)構(gòu)建具有歷史厚重感的線上線下虛擬展廳,實(shí)現(xiàn)感官的體驗(yàn)效果,如美國(guó)國(guó)家航空航天局(NASA)與阿波羅計(jì)劃?rùn)n案館利用VR技術(shù)在USA Today網(wǎng)站上提供了體驗(yàn)式的服務(wù),用戶進(jìn)入該網(wǎng)站通過(guò)VR可體驗(yàn)到月球漫步的感覺(jué)。[30]同時(shí),建立編研成果利用平臺(tái)。通過(guò)知識(shí)圖譜、詞云、電子書(shū)籍等形式過(guò)強(qiáng)檢索功能。如美國(guó)馬里蘭州檔案館開(kāi)展的奴隸制文化遺產(chǎn)項(xiàng)目形成的在線可視化網(wǎng)站,對(duì)250多例黑奴案例故事進(jìn)行了可視化展示,[31]呈現(xiàn)的形式有電子書(shū)籍、圖片集、音視頻以及利用地理信息系統(tǒng)(GIS)構(gòu)建的可視化地圖。既滿足了普通公眾視覺(jué)化的體驗(yàn),也滿足了學(xué)者們知識(shí)化的研究需求。
數(shù)字人文檔案編研模式是多元化合作編研選題、選材,形成可視化編研成果,充分發(fā)揮檔案價(jià)值的有效路徑,有待開(kāi)展更深入的理論和應(yīng)用研究。