摘 要:隨著檔案領(lǐng)域參與數(shù)字人文這一議題的開(kāi)展,學(xué)者們站在不同視角對(duì)學(xué)科發(fā)展路徑不斷探索,相關(guān)科技文獻(xiàn)的數(shù)量也在不斷增長(zhǎng)。為了梳理研究脈絡(luò)、把握研究趨勢(shì),采用BERTopic主題模型對(duì)相關(guān)科技文獻(xiàn)進(jìn)行主題挖掘,從而發(fā)現(xiàn)當(dāng)下的主流研究課題,更具建設(shè)性地參與到研究中。結(jié)果顯示,當(dāng)前的研究課題主要集中在檔案數(shù)字人文探索、檔案資源的開(kāi)發(fā)利用以及學(xué)科建設(shè)三個(gè)方面。
關(guān)鍵詞:檔案;數(shù)字人文;人文計(jì)算;社會(huì)記憶;文化遺產(chǎn);主題挖掘;知識(shí)發(fā)現(xiàn);開(kāi)發(fā)利用
數(shù)字人文作為結(jié)合了計(jì)算機(jī)技術(shù)與社會(huì)人文思潮的產(chǎn)物,自誕生以來(lái)便對(duì)各類人文學(xué)科產(chǎn)生了深刻的影響,而注重學(xué)科交叉融合、善于利用新興技術(shù)開(kāi)展人文研究的信息資源管理學(xué)科在理念與體系上與之有著內(nèi)在的聯(lián)系。學(xué)者們?cè)谔剿餍畔①Y源管理和數(shù)字人文的過(guò)程中,發(fā)現(xiàn)二者具有一致的內(nèi)核。無(wú)論是數(shù)字人文還是信息資源管理學(xué)科,信息活動(dòng)都是二者的核心,在信息資源建設(shè)、方法和理論的深化方面二者相互推進(jìn)、相互完善。[1]2020年,國(guó)家推出《新文科建設(shè)宣言》戰(zhàn)略,更進(jìn)一步強(qiáng)調(diào)了打破學(xué)科之間界限、跨學(xué)科融合研究的重要性,在國(guó)家發(fā)展戰(zhàn)略層面強(qiáng)化了信息資源管理參與數(shù)字人文研究的意義。
已有研究從兩種途徑對(duì)數(shù)字人文研究現(xiàn)狀做出了分析:一種是基于引文和共詞分析的方法,例如利用VOSviewer科學(xué)知識(shí)圖譜分析工具提取數(shù)據(jù)源中的關(guān)鍵詞數(shù)據(jù),繪制我國(guó)信息資源管理領(lǐng)域數(shù)字人文研究關(guān)鍵詞共現(xiàn)知識(shí)圖譜,識(shí)別出當(dāng)前階段研究的內(nèi)容及特征;[2]另一種則是以文本聚類、主題模型為代表的文本挖掘方法,例如利用LDA主題模型識(shí)別我國(guó)數(shù)字人文領(lǐng)域的研究框架。[3]這類研究在一定程度上揭示了學(xué)科發(fā)展的現(xiàn)狀與趨勢(shì),在學(xué)術(shù)熱點(diǎn)發(fā)現(xiàn)方面也提供了支持。
在信息資源管理領(lǐng)域中,由于檔案擁有的真實(shí)性、證據(jù)性等特征,檔案學(xué)科在數(shù)字人文研究中具有特殊的地位。在《“十四五”全國(guó)檔案事業(yè)發(fā)展規(guī)劃》中特別強(qiáng)調(diào)了檔案參與數(shù)字人文的重要性。也有學(xué)者專門(mén)針對(duì)檔案學(xué)參與數(shù)字人文的現(xiàn)狀進(jìn)行了研究。[4-11]
BERTopic是一種新興的基于深度學(xué)習(xí)框架的交互式主題模型,近年來(lái)在自然語(yǔ)言處理領(lǐng)域受到廣泛使用。本文利用BERTopic主題模型,對(duì)信息資源管理領(lǐng)域中檔案學(xué)科參與數(shù)字人文的現(xiàn)狀以及當(dāng)前聚焦的主題進(jìn)行挖掘,從宏觀和微觀層面發(fā)現(xiàn)學(xué)術(shù)熱點(diǎn),為檔案學(xué)與數(shù)字人文深度融合提供參考。
1 數(shù)字人文相關(guān)研究
1.1 數(shù)字人文。數(shù)字人文起源于人文計(jì)算,標(biāo)志事件是20世紀(jì)40年代由羅伯特·布薩使用計(jì)算機(jī)技術(shù)編寫(xiě)了托馬斯·阿奎納的作品索引集。這種將繁瑣的分類、檢索工作全部交由計(jì)算機(jī)處理的新興方式,改變了學(xué)者們的傳統(tǒng)工作模式,使其迅速受到社會(huì)各界的關(guān)注與廣泛應(yīng)用。
人文計(jì)算這種將計(jì)算機(jī)技術(shù)與人文學(xué)科聯(lián)系起來(lái)的思路,對(duì)于后續(xù)的信息儲(chǔ)存、知識(shí)發(fā)現(xiàn)等也起到了奠基的作用。隨后人們跨入信息時(shí)代,根基于計(jì)算機(jī)技術(shù)的人文計(jì)算也在不斷地變革與進(jìn)化,再結(jié)合人們對(duì)于分析工具要求愈發(fā)提高的現(xiàn)實(shí)因素,數(shù)字人文概念應(yīng)運(yùn)而生。由于數(shù)字人文在表達(dá)上更能兼顧“數(shù)字技術(shù)”與“人文研究”的特點(diǎn),因此其迅速取代了人文計(jì)算,成為人文學(xué)者中廣為流傳的新名詞。時(shí)至今日,各類人文學(xué)科的發(fā)展和研究?jī)?nèi)容仍然受到數(shù)字人文理念的深遠(yuǎn)影響。
1.2 數(shù)字人文與信息資源管理。數(shù)字人文在2009年現(xiàn)代語(yǔ)言協(xié)會(huì)年會(huì)上受到了眾多學(xué)者的廣泛討論,成了國(guó)外的學(xué)術(shù)熱點(diǎn)。[12]同年,我國(guó)武漢大學(xué)王曉光教授將數(shù)字人文概念正式引入國(guó)內(nèi)。[13]隨后,我國(guó)各個(gè)高校陸續(xù)成立了數(shù)字人文研究機(jī)構(gòu),如武漢大學(xué)的數(shù)字人文研究中心、南京大學(xué)數(shù)字人文創(chuàng)研中心等,主要參與者集中在信息資源管理領(lǐng)域。在此階段,我國(guó)數(shù)字人文領(lǐng)域的相關(guān)研究呈厚積薄發(fā)之勢(shì),新成果不斷涌現(xiàn)。
自2018年開(kāi)始,數(shù)字人文主題連續(xù)數(shù)次入選信息資源管理學(xué)界研究熱點(diǎn)。[14]圖書(shū)館學(xué)是信息資源管理領(lǐng)域最先融入數(shù)字人文研究中的,2012年,周瓊與胡禮忠[15]號(hào)召圖書(shū)館學(xué)者要積極發(fā)揮資源和專業(yè)人才優(yōu)勢(shì),參與到數(shù)字人文研究浪潮中。很快,圖書(shū)館學(xué)與數(shù)字人文相結(jié)合成為圖書(shū)館學(xué)的熱點(diǎn)主題并一直持續(xù)至今。[16]二者的結(jié)合創(chuàng)新出了很多新興研究形式,例如不同于傳統(tǒng)大數(shù)據(jù)注重的規(guī)模、多樣性的特點(diǎn),而是聚焦于價(jià)值應(yīng)用的智慧數(shù)據(jù)[17]、面向人文研究的數(shù)據(jù)基礎(chǔ)設(shè)施[18]等。
目前信息資源管理領(lǐng)域仍然不斷與數(shù)字人文交流互動(dòng),在二者的融合過(guò)程中,以對(duì)信息的利用為橋梁,通過(guò)找準(zhǔn)結(jié)合點(diǎn)和切入點(diǎn),可以使信息資源管理不斷吸收新興的技術(shù)方法與理念,實(shí)現(xiàn)學(xué)科發(fā)展模式和方向的創(chuàng)新。
1.3 數(shù)字人文與檔案學(xué)。數(shù)字人文參與信息組織與服務(wù),與提供原始真實(shí)文本資源的檔案學(xué)不斷融合和互動(dòng)。檔案部門(mén)和數(shù)字人文在技術(shù)應(yīng)用方面的理念相同,都很注重通過(guò)計(jì)算機(jī)技術(shù)來(lái)助力人文研究。在過(guò)去的工作中,雖然檔案也將數(shù)字技術(shù)應(yīng)用到自身工作中,但往往只是將檔案數(shù)字化,很少去做進(jìn)一步的處理,缺乏工作上的創(chuàng)新。正因?yàn)榇?,學(xué)者們才呼吁檔案部門(mén)應(yīng)該摒棄陳舊理念,積極引入現(xiàn)代信息技術(shù)優(yōu)化自身工作。[19]
2015年趙生輝的《國(guó)外檔案領(lǐng)域數(shù)字人文項(xiàng)目的實(shí)踐與啟示》[20]綜述了國(guó)外檔案學(xué)界參與數(shù)字人文的現(xiàn)狀,為我國(guó)檔案學(xué)者參與數(shù)字人文提供了參考。與其他文本資源不同,由于檔案資源具有真實(shí)性、證據(jù)性、記載著豐富的國(guó)家民族記憶的特征,極大豐富了數(shù)字人文研究的多樣性并保證了其參與數(shù)字人文項(xiàng)目的權(quán)威性。2009年由檔案教育研究會(huì)(AERI)舉辦的“數(shù)字人文與檔案課程開(kāi)發(fā)”研討會(huì)指出,數(shù)字人文和檔案領(lǐng)域合作仍然是數(shù)字人文計(jì)劃的關(guān)鍵組成部分。二者結(jié)合的優(yōu)勢(shì)也體現(xiàn)在可以通過(guò)在合作的過(guò)程中不斷吸收和完善彼此的知識(shí)體系和技術(shù)結(jié)構(gòu),為知識(shí)利用者提供更好的服務(wù)。
當(dāng)前,數(shù)字人文與檔案學(xué)的研究仍在持續(xù)并不斷深化,如對(duì)我國(guó)檔案學(xué)領(lǐng)域高質(zhì)量論文進(jìn)行文獻(xiàn)計(jì)量,發(fā)現(xiàn)數(shù)字人文是我國(guó)檔案學(xué)研究關(guān)注的焦點(diǎn)議題以及近五年我國(guó)信息資源管理領(lǐng)域文獻(xiàn)的主題。[21,22]在未來(lái),數(shù)字人文將持續(xù)助力檔案資源開(kāi)發(fā)和數(shù)據(jù)化、參與國(guó)家經(jīng)濟(jì)社會(huì)發(fā)展進(jìn)程。[23]
2 研究設(shè)計(jì)
2.1 研究思路。本文的研究框架如圖1所示。
從中國(guó)知網(wǎng)數(shù)據(jù)庫(kù)中初步檢索獲取文獻(xiàn),經(jīng)過(guò)人工判讀去除不相關(guān)文獻(xiàn)后構(gòu)建數(shù)據(jù)集。隨后,分別進(jìn)行數(shù)量性的分析以及對(duì)論文摘要部分的主題挖掘。本研究采用的主題挖掘工具是基于深度學(xué)習(xí)的BERTopic模型,是一種基于詞向量的主題建模方法。與傳統(tǒng)主題模型相比,其優(yōu)勢(shì)在于具有更高的主題一致性,[24]并克服了傳統(tǒng)建模方法中基于密度聚類與基于中心采樣之間不兼容的缺點(diǎn),可以快速實(shí)現(xiàn)數(shù)量巨大的短文本數(shù)據(jù)解析。[25]BERTopic的這種特性使其非常適合短篇幅、內(nèi)容復(fù)雜的論文摘要建模分析,從而能夠更好地挖掘主題,發(fā)現(xiàn)檔案參與數(shù)字人文的熱點(diǎn)研究問(wèn)題。
2.2 數(shù)據(jù)獲取與預(yù)處理。以中國(guó)知網(wǎng)數(shù)據(jù)庫(kù)作為數(shù)據(jù)源,采用主題=(“檔案”+“檔案館”+“檔案管理”)*(“數(shù)字人文”+“人文計(jì)算”)專業(yè)檢索式,不限制發(fā)表時(shí)間,檢索日期為2024年7月7日,共檢索到677篇文獻(xiàn)。經(jīng)人工判讀去除會(huì)議、報(bào)紙、選題指南等不相關(guān)文獻(xiàn),共得到有效文獻(xiàn)599篇。
在數(shù)量分析部分,分別提取出論文的發(fā)表年份、所屬期刊和作者信息,用來(lái)進(jìn)行發(fā)文數(shù)量趨勢(shì)和詞頻統(tǒng)計(jì)工作。在發(fā)文數(shù)量統(tǒng)計(jì)中,最終日期設(shè)置為2023年12月31日。在主題挖掘部分,提取論文的關(guān)鍵詞和摘要信息,用來(lái)進(jìn)行針對(duì)摘要的主題挖掘工作。為了保證分詞的準(zhǔn)確度,在分詞前將論文關(guān)鍵詞作為自定義的新詞添加到j(luò)ieba詞庫(kù)中,并且基于中文常用停詞表進(jìn)行去停用詞處理。
2.3 數(shù)量分析。在主題識(shí)別之前,首先對(duì)獲取到的599篇文獻(xiàn)進(jìn)行數(shù)量上的統(tǒng)計(jì),從檔案學(xué)參與數(shù)字人文研究領(lǐng)域的高產(chǎn)作者、重要期刊和近幾年的發(fā)文數(shù)量層面初步分析目前的研究現(xiàn)狀,結(jié)果如表1和圖2所示。由發(fā)文數(shù)量趨勢(shì)可知,相關(guān)研究最早從2015年開(kāi)始,當(dāng)下處于研究的熱點(diǎn)時(shí)期,進(jìn)一步明確了挖掘研究熱點(diǎn)主題的現(xiàn)實(shí)意義。
3 主題識(shí)別
對(duì)收集到的論文摘要部分進(jìn)行主題建模,共識(shí)別出9個(gè)主題,可視化結(jié)果以條形圖的形式展現(xiàn),如圖3所示。Topic0(檔案支持?jǐn)?shù)字人文)、Topic2(檔案館數(shù)字人文開(kāi)發(fā))、Topic3(數(shù)字人文項(xiàng)目實(shí)踐)、Topic7(檔案與記憶)4個(gè)主題呈現(xiàn)了檔案領(lǐng)域是如何結(jié)合到數(shù)字人文研究中的,可以歸納為“檔案數(shù)字人文探索”課題;Topic1(中國(guó)歷史研究)、Topic4(文化遺產(chǎn)研究)、Topic5(紅色檔案資源開(kāi)發(fā))、Topic8(少數(shù)民族文化遺產(chǎn))4個(gè)主題呈現(xiàn)了各類人文資源對(duì)于檔案數(shù)字人文研究的重要性,可以歸納為“檔案資源開(kāi)發(fā)與利用”課題;Topic6(圖情檔學(xué)科)是“學(xué)科發(fā)展”課題。主題脈絡(luò)如圖4所示。
3.1 檔案參與數(shù)字人文的理論探討。長(zhǎng)期以來(lái),檔案所蘊(yùn)含的豐富人文價(jià)值使其一直不斷地參與到各種人文研究中[26],學(xué)者們圍繞檔案與這些人文學(xué)科的關(guān)系、檔案在其中的參與機(jī)制不斷地探索。[27]
目前,學(xué)界普遍認(rèn)為檔案是數(shù)字人文研究的核心對(duì)象,數(shù)字人文項(xiàng)目的實(shí)現(xiàn),也需要與具有文化服務(wù)性的檔案館合作,需要他們提供豐富的館藏資源。[28]檔案在為數(shù)字人文研究提供豐富原始資源的同時(shí),也在不斷地吸收和接納開(kāi)展數(shù)字人文工作所需的技術(shù)。[29]因此,數(shù)字人文不僅助力檔案領(lǐng)域的資源建設(shè)和內(nèi)容表現(xiàn),還在一定程度上創(chuàng)新了其思維方式,為新方向新課題的開(kāi)展提供了可能性。
面對(duì)“檔案參與”,一種觀點(diǎn)認(rèn)為其內(nèi)涵是檔案領(lǐng)域的工作者或?qū)W者參與到非傳統(tǒng)的檔案管理相關(guān)的研究或活動(dòng),關(guān)注如何將檔案元素融入跨學(xué)科研究中。[30]目前對(duì)于檔案是如何參與到數(shù)字人文中的,檔案在數(shù)字人文中的參與機(jī)制等問(wèn)題,學(xué)界尚未形成完整的體系。學(xué)者嘗試以復(fù)雜適應(yīng)系統(tǒng)理論為模型,基于系統(tǒng)化思考方式探討檔案參與數(shù)字人文機(jī)制的方式,在一定程度上拓展了此類研究的思路。[31]
3.2 檔案參與數(shù)字人文項(xiàng)目實(shí)踐。數(shù)字人文項(xiàng)目是將人文思想融入現(xiàn)代數(shù)字技術(shù)的社會(huì)實(shí)踐活動(dòng),可以將傳統(tǒng)的人文研究以新穎的、極具吸引力的形式展現(xiàn)出來(lái),對(duì)社會(huì)公眾具有很強(qiáng)的影響力。
我國(guó)學(xué)者也站在不同的視角上對(duì)數(shù)字人文項(xiàng)目的內(nèi)涵進(jìn)行了一些解讀,如認(rèn)為數(shù)字人文項(xiàng)目是將數(shù)字技術(shù)和人文資源進(jìn)行整合,專為解決某一主題的人文問(wèn)題而生并認(rèn)為數(shù)字人文項(xiàng)目是數(shù)字人文理論通向?qū)嵺`的橋梁。[32,33]我國(guó)檔案領(lǐng)域?qū)W者在開(kāi)展數(shù)字人文研究時(shí),對(duì)中外的各種數(shù)字人文項(xiàng)目進(jìn)行了分析和梳理。其中,國(guó)外一些比較具有代表性的項(xiàng)目取得了較大的成果,例如龍格等學(xué)者利用傳統(tǒng)檔案內(nèi)容和數(shù)字人文技術(shù)重構(gòu)了奧森·威爾電影中丟失的影像序列,以可視化的形式展示了檔案研究成果;以及利用了多所大學(xué)和研究所的檔案資源,專注于美國(guó)內(nèi)戰(zhàn)記錄的影谷項(xiàng)目。[34]2023年,上海市檔案館聯(lián)合多個(gè)單位,整合海量檔案資源,推出了“跟著檔案觀上?!表?xiàng)目,[35]運(yùn)用人工智能和3D建模等技術(shù)復(fù)現(xiàn)了地標(biāo)性建筑,彰顯了當(dāng)?shù)氐莫?dú)特景觀和文化底蘊(yùn)。
3.3 檔案與記憶?!坝洃洝笔菣n案學(xué)很早便開(kāi)始研究的課題。早在1925年法國(guó)學(xué)者莫里斯·哈布瓦赫提出“集體記憶”概念后,“社會(huì)記憶”開(kāi)始進(jìn)入人們的視野,許多學(xué)者對(duì)其進(jìn)行了系統(tǒng)性的研究。
社會(huì)記憶不僅存在于社會(huì)個(gè)體,也廣泛存在于檔案、文學(xué)作品等各種人文資源中。隨著社會(huì)記憶理論的不斷完善,以及文化、意識(shí)形態(tài)和后現(xiàn)代主義思潮的發(fā)展,20世紀(jì)末,檔案學(xué)興起了一種“檔案記憶觀”觀點(diǎn),[36]強(qiáng)調(diào)檔案具有記憶屬性,是一種社會(huì)、歷史記憶,檔案館則是保存記憶的場(chǎng)所。可以說(shuō),檔案是實(shí)現(xiàn)社會(huì)記憶的一種重要資源,與社會(huì)記憶有著千絲萬(wàn)縷的聯(lián)系。國(guó)內(nèi)外學(xué)者也針對(duì)檔案參與社會(huì)記憶的內(nèi)涵和機(jī)制、[37]對(duì)檔案工作的實(shí)際影響[38]等做出了探討。
近年來(lái)由于數(shù)字人文在檔案領(lǐng)域的應(yīng)用,社會(huì)記憶又誕生了新的可能性,例如數(shù)字人文通過(guò)技術(shù)加持,對(duì)社會(huì)記憶進(jìn)行挖掘重組和強(qiáng)化改寫(xiě),可以實(shí)現(xiàn)社會(huì)記憶再生產(chǎn)。[39]隨著數(shù)字化時(shí)代到來(lái),催生了數(shù)字記憶概念,學(xué)界認(rèn)為數(shù)字記憶是一種將人文資源以數(shù)字化形式采集組織、傳播再現(xiàn)的記憶形態(tài)。[40]
數(shù)字人文和數(shù)字記憶共同誕生于數(shù)字化浪潮,二者在擁有著新興事物蓬勃生命力的同時(shí),其資源和項(xiàng)目也有著很大程度的重合,有著相似的人文本質(zhì),因此對(duì)二者關(guān)系和內(nèi)涵的探討也層出不窮。一種觀點(diǎn)認(rèn)為,二者雖然在資源和項(xiàng)目等方面具有趨同性,但在研究側(cè)重、表現(xiàn)形式等方面也呈現(xiàn)出差異性,因此二者實(shí)質(zhì)上是并列的關(guān)系。[41]另一種觀點(diǎn)則認(rèn)為,數(shù)字記憶是數(shù)字人文實(shí)踐中的一種特殊呈現(xiàn)方式,其本質(zhì)上是包含關(guān)系。[42]當(dāng)下,此類關(guān)于記憶的有益討論還在持續(xù)進(jìn)行,而可以明確的一點(diǎn)是:檔案、記憶、數(shù)字人文已經(jīng)成為互相融合、共同發(fā)展、緊密聯(lián)系的學(xué)術(shù)體系。
3.4 歷史文化遺產(chǎn)。我國(guó)檔案文獻(xiàn)資源記載著豐富的國(guó)家民族記憶,時(shí)間跨度上涵蓋了從古至今的朝代更迭,材質(zhì)上包含甲骨文、簡(jiǎn)牘以及現(xiàn)代數(shù)字檔案,領(lǐng)域上更是包含經(jīng)濟(jì)文化政治等各方面的歷史記錄,是珍貴的歷史文化遺產(chǎn)。這些檔案資源蘊(yùn)含著深刻的思想與哲學(xué)智慧,對(duì)其進(jìn)行開(kāi)發(fā)利用有著重要的現(xiàn)實(shí)意義和價(jià)值。
在技術(shù)手段不夠成熟的早期,對(duì)歷史文化遺產(chǎn)的記錄形式是以實(shí)體文本為主。進(jìn)入21世紀(jì),人們對(duì)文化遺產(chǎn)的記錄與表現(xiàn)形式提出了更高的要求,愈發(fā)重視可視化與交互體驗(yàn),注重呈現(xiàn)方式的多元性以及可傳播性。
數(shù)字人文作為擅長(zhǎng)將文化資源以現(xiàn)代技術(shù)手段呈現(xiàn)的研究領(lǐng)域,為我國(guó)文化遺產(chǎn)開(kāi)發(fā)與管理提供了新的形式。學(xué)者們也從內(nèi)涵解讀、技術(shù)探索等多個(gè)角度探究了數(shù)字人文背景下的文化遺產(chǎn)資源利用與保護(hù)。如借助數(shù)字人文相關(guān)理論與方法,從多角度對(duì)歷史文化記憶工程這一示范性實(shí)例進(jìn)行全方位觀察梳理,由此提出推動(dòng)中國(guó)歷史文化資源深度開(kāi)發(fā)的有效對(duì)策。[43,44]國(guó)家層面也從數(shù)字人文領(lǐng)域的文化遺產(chǎn)開(kāi)發(fā)戰(zhàn)略出發(fā),在理念、機(jī)制與應(yīng)用方面做出了探索,[45-47]并在2022年出臺(tái)了《關(guān)于推進(jìn)實(shí)施國(guó)家文化數(shù)字化戰(zhàn)略的意見(jiàn)》,提出要統(tǒng)籌利用文化領(lǐng)域已建或在建的數(shù)字化工程和數(shù)據(jù)庫(kù)所形成的成果,關(guān)聯(lián)形成中華文化數(shù)據(jù)庫(kù)。
3.5 紅色檔案資源。紅色檔案是承載紅色基因的載體,它以文字、圖片等形式記錄了黨領(lǐng)導(dǎo)中華兒女開(kāi)展社會(huì)主義建設(shè)的過(guò)程,具有深刻的教育價(jià)值,是弘揚(yáng)愛(ài)國(guó)精神、傳播紅色文化的生動(dòng)素材。[48]
當(dāng)前紅色檔案資源的相關(guān)研究主要圍繞內(nèi)涵和價(jià)值、保護(hù)和開(kāi)發(fā)利用[49]等幾個(gè)方面。數(shù)據(jù)和技術(shù)是數(shù)字人文研究的核心,如有學(xué)者指出運(yùn)用數(shù)字人文理念創(chuàng)新紅色檔案資源建設(shè)的研究范式和方法論。[50-53]
3.6 少數(shù)民族檔案遺產(chǎn)。少數(shù)民族檔案遺產(chǎn)是我國(guó)少數(shù)民族在漫長(zhǎng)的生產(chǎn)生活活動(dòng)中逐漸積累起來(lái)的寶貴文化財(cái)富,是中華民族多元文化特色的體現(xiàn)。學(xué)者們大都關(guān)注對(duì)少數(shù)民族檔案遺產(chǎn)的開(kāi)發(fā)利用研究和數(shù)字化保護(hù)研究。
3.6.1 開(kāi)發(fā)利用研究。少數(shù)民族檔案遺產(chǎn)記載著當(dāng)?shù)氐牡乩硖卣?、文化?xí)俗、歷史事件等,蘊(yùn)含著大量的文化儲(chǔ)備,因此有著極為重要的開(kāi)發(fā)利用價(jià)值。深度且充分地挖掘少數(shù)民族檔案遺產(chǎn),對(duì)其具有文化傳承特色的內(nèi)容進(jìn)行開(kāi)發(fā)提取和利用,有利于豐富中華民族的文化表達(dá),深化文化底蘊(yùn),是實(shí)現(xiàn)文化自信的途徑之一,對(duì)中華民族精神文明的建設(shè)起到重要的作用。目前,已有學(xué)者從國(guó)家戰(zhàn)略和具體案例出發(fā),討論對(duì)少數(shù)民族檔案遺產(chǎn)的開(kāi)發(fā)利用問(wèn)題,取得了系列研究成果。[54,55]
3.6.2 數(shù)字化保護(hù)研究。與其他類型的檔案資源不同,少數(shù)民族檔案資源的保護(hù)與保存長(zhǎng)期以來(lái)都在受著各種挑戰(zhàn)。例如以保存環(huán)境為主的自然因素,以載體形式多樣、民間收藏為主的來(lái)源因素都對(duì)檔案遺產(chǎn)的保護(hù)保存工作造成了不少的困擾。再加上有些檔案資源存在海外流失[56]的情況,當(dāng)下對(duì)其進(jìn)行數(shù)字化保護(hù)任重道遠(yuǎn)。
少數(shù)民族檔案遺產(chǎn)的數(shù)字化保護(hù)與注重文化內(nèi)容和數(shù)字技術(shù)的數(shù)字人文內(nèi)在關(guān)聯(lián)度較高,以數(shù)字人文視角對(duì)少數(shù)民族檔案遺產(chǎn)開(kāi)展數(shù)字化保護(hù)的思路是數(shù)字人文研究通常依附于大量的檔案資源,擅于利用數(shù)字化技術(shù)對(duì)文化資源進(jìn)行保護(hù)和開(kāi)發(fā)利用。[57,58]
3.7 學(xué)科發(fā)展。檔案學(xué)科演變過(guò)程中,一直以文化傳承、科學(xué)研究、人才培養(yǎng)和服務(wù)社會(huì)為己任,形成了一套較為完善的技術(shù)體系和方法論。數(shù)字化時(shí)代,檔案學(xué)科的應(yīng)用場(chǎng)景和環(huán)境發(fā)生了深刻的改變,迎來(lái)了理論結(jié)構(gòu)和方法論的重塑。
在學(xué)科人才培養(yǎng)方面,學(xué)者們結(jié)合新文科發(fā)展背景,重視數(shù)字人文技能和數(shù)據(jù)素質(zhì)過(guò)硬的專業(yè)人才培養(yǎng)。[59]
技術(shù)、理念的不斷碰撞,引起了數(shù)字人文的學(xué)科影響以及發(fā)展策略的討論。一般認(rèn)為數(shù)字人文賦予了檔案學(xué)科新的發(fā)展活力和內(nèi)容,對(duì)學(xué)科思維方式和技術(shù)體系的創(chuàng)新有巨大推進(jìn)作用,與數(shù)字人文項(xiàng)目相融合的檔案理論與實(shí)踐也將促進(jìn)檔案知識(shí)體系的完善,提升檔案學(xué)科影響力。[60-63]
然而,由于數(shù)字人文對(duì)“檔案”概念的重新界定,檔案學(xué)不得不面臨“泛檔案化”的概念沖擊。[64]例如,在一些數(shù)字人文項(xiàng)目中所利用的“檔案”資源其實(shí)是文學(xué)或其他方面的資源,造成檔案特色的湮沒(méi)。[65]正視數(shù)字人文帶來(lái)的機(jī)遇和挑戰(zhàn),對(duì)理論和技術(shù)體系進(jìn)行合理的創(chuàng)新和重塑,對(duì)于檔案價(jià)值的提升和學(xué)科長(zhǎng)足發(fā)展具有重要意義和深遠(yuǎn)影響。
4 結(jié)語(yǔ)
本文以知識(shí)發(fā)現(xiàn)的視角,探討了目前檔案參與數(shù)字人文研究的現(xiàn)狀,挖掘了當(dāng)下的研究熱點(diǎn)主題。從結(jié)果來(lái)看,數(shù)字人文的參與、開(kāi)發(fā)、發(fā)展是檔案領(lǐng)域主流研究方向。未來(lái),檔案學(xué)應(yīng)深度融入數(shù)字人文研究,深化理論、開(kāi)展跨學(xué)科合作以提升檔案資源價(jià)值,協(xié)同促進(jìn)兩學(xué)科領(lǐng)域的創(chuàng)新發(fā)展。
本文系國(guó)家社會(huì)科學(xué)基金項(xiàng)目“融合敘事視域下圖書(shū)館數(shù)字記憶開(kāi)放建構(gòu)研究”(項(xiàng)目號(hào):23BTQ007)研究成果之一。
參考文獻(xiàn):
[1]周文泓,劉靜.數(shù)字人文和圖書(shū)情報(bào)與檔案管理的雙向構(gòu)建要點(diǎn)研究[J].圖書(shū)與情報(bào),2019,(06):101-110.
[2]劉陽(yáng).我國(guó)信息資源管理領(lǐng)域數(shù)字人文研究的內(nèi)容及特征識(shí)別[J].情報(bào)科學(xué),2023,41(11):170-175.
[3]冷雪卓,張濤,崔文波.國(guó)內(nèi)數(shù)字人文領(lǐng)域文獻(xiàn)主題識(shí)別及框架研究:基于LDA和Word2Vec的分析[J].圖書(shū)館學(xué)刊,2024,46(03):104-110.
[4]王睿嘉,趙彥昌.基于數(shù)字人文視域下檔案學(xué)研究成果述評(píng)(2015-2020)[J].山西檔案,2020,(06):89-95+78.
[5]宋飛.數(shù)字人文檔案與國(guó)家記憶工程的相互關(guān)系與作用研究[J].檔案管理,2024(01):65-68.
[6]陳慧,南夢(mèng)潔.數(shù)字人文視域下大型體育賽事檔案資源整合模式研究[J].山西檔案,2022(01):27-39.
[7]張華.國(guó)內(nèi)數(shù)字人文與檔案管理研究綜述[J].檔案與建設(shè),2021(01):31-36+30.
[8]丁家友,李慧珺.面向數(shù)字人文的檔案內(nèi)容管理問(wèn)題及對(duì)策分析[J].山西檔案,2020(06):62-68+51.
[9]陳偉斌,田岱靈.數(shù)字人文視域下僑批檔案資源開(kāi)發(fā)研究[J].北京檔案,2022,(09):26-28.
[10]陳晶晶,覃芳,董小熔.數(shù)字人文背景下檔案館知識(shí)服務(wù):價(jià)值闡釋與運(yùn)行邏輯[J].北京檔案,2021,(12):23-27.
[11]周林興,崔云萍.面向數(shù)字人文的鄉(xiāng)村檔案記憶資源開(kāi)發(fā):價(jià)值、機(jī)制及路徑選擇[J].北京檔案,2021,(10):10-14.
[12]陳靜.歷史與爭(zhēng)論:英美“數(shù)字人文”發(fā)展綜述[J].文化研究,2013,(04):206-221.
[13]王曉光.“數(shù)字人文”的產(chǎn)生、發(fā)展與前沿[M]// 全國(guó)高校社會(huì)科學(xué)科研管理研究會(huì).方法創(chuàng)新與哲學(xué)社會(huì)科學(xué)發(fā)展.武漢:武漢大學(xué)出版社,2010.
[14]平碩,黃永勤,楊安蓮.國(guó)內(nèi)外檔案領(lǐng)域數(shù)字人文研究進(jìn)展[J].浙江檔案,2022,(05):28-31.
[15]周瓊,胡禮忠.圖書(shū)館員在“數(shù)字人文”中的作為:“ 2 0 1 1 數(shù)字人文國(guó)際大會(huì)” 后的感想[ J ] . 圖書(shū)館建設(shè),2012,(03):82-84.
[16]李鈺鑫,魏崇輝.中國(guó)圖書(shū)館學(xué)專業(yè)期刊的刊文情況與研究熱點(diǎn):基于《中國(guó)圖書(shū)館學(xué)報(bào)》和《大學(xué)圖書(shū)館學(xué)報(bào)》近五年數(shù)據(jù)的對(duì)比[J].圖書(shū)館學(xué)刊,2023,45(10):94-99.
[ 1 7 ] 曾蕾, 王曉光, 范煒. 圖檔博領(lǐng)域的智慧數(shù)據(jù)及其在數(shù)字人文研究中的角色[ J ] . 中國(guó)圖書(shū)館學(xué)報(bào),2018,44(01):17-34.
[18]夏翠娟.面向人文研究的“數(shù)據(jù)基礎(chǔ)設(shè)施”建設(shè):試論圖書(shū)館學(xué)對(duì)數(shù)字人文的方法論貢獻(xiàn)[J].中國(guó)圖書(shū)館學(xué)報(bào),2020,46(03):24-37.
[19]朱本軍,聶華.跨界與融合:全球視野下的數(shù)字人文[J]大學(xué)圖書(shū)館學(xué)報(bào),2016(05):16-21.
[20]趙生輝.國(guó)外檔案領(lǐng)域數(shù)字人文項(xiàng)目的實(shí)踐與啟示[J].浙江檔案,2015,(09):14-17.
[21]徐擁軍,張群群,嘎拉森.2023年中國(guó)檔案學(xué)研究現(xiàn)狀、特點(diǎn)及發(fā)展趨勢(shì)[J].檔案學(xué)研究,2024(02):13-21.
[22]楊思洛,于永浩.基于BERTopic模型的國(guó)內(nèi)信息資源管理研究主題挖掘與演化分析[J/OL].情報(bào)科學(xué):1-18[2024-07-06].
[23]張新芳.數(shù)字人文視角下的檔案數(shù)據(jù)化與國(guó)家記憶保護(hù)和傳承[J].檔案管理,2024,(01):69-72.
[24]CONTRERAS K,VERBEL G,SANCHEZ J,et al.Usingt o p i c m o d e l l i n g f o r a n a l y z i n g P a n a m a n i a nP a r l i a m e n t a r y p r o c e e d i n g s w i t h n e u r a l a n dstatistical methods[C]// 2022 IEEE 40th CentralA m e r i c a a n d P a n a m a C o n v e n t i o n ( C o n c a p a n ) .Panama:IEEE,2022:1-6.
[ 2 5 ] 曹樹(shù)金, 曹茹燁. 基于研究主題和引文分析的信息資源管理學(xué)科發(fā)展探究[ J ] . 信息資源管理學(xué)報(bào),2023,13(02):12-29.
[26]任越,王梓萱.文化自信視域下檔案機(jī)構(gòu)參與工業(yè)文化遺產(chǎn)保護(hù)探究[J].蘭臺(tái)世界,2024(04):21-25.
[27]章岸婧,譚必勇,黃閩敏.國(guó)家文化公園建設(shè)中檔案深度參與機(jī)制與路徑[J].蘭臺(tái)世界,2022(06):20-25.
[28]李子林,王玉玨,龍家慶.數(shù)字人文與檔案工作的關(guān)系探討[J].浙江檔案,2018,(07):13-16.
[29]吳加琪.數(shù)字人文興起及檔案工作的參與機(jī)制[J].檔案與建設(shè),2017,(12):12-15+28.
[30]于英香,張雅頡.“檔案參與”科學(xué)數(shù)據(jù)監(jiān)管:緣起、現(xiàn)狀與動(dòng)因[J].檔案學(xué)研究,2021,(02):104-110.
[ 3 1 ]張衛(wèi)東,左娜.檔案領(lǐng)域參與數(shù)字人文的適應(yīng)性推進(jìn)模型構(gòu)建:從焦點(diǎn)透視到系統(tǒng)考量[J].檔案學(xué)研究,2022,(05):4-10.
[32]崔浩男,鄭曉丹,邵亞偉.公眾參與數(shù)字人文項(xiàng)目的影響因素[J].圖書(shū)館論壇,2022,42(08):138-147.
[33]龍家慶,崔浩男,張晨文,等.2012—2019年度國(guó)際“數(shù)字人文獎(jiǎng)”獲獎(jiǎng)項(xiàng)目概覽與解析[J].數(shù)字人文研究,2021,1(02):85-98+121-122.
[34]K RISSEEAUW;W SAMPSON;L Ellison.DigitalHumanities in Early Online Archives[J].The LibraryQuarterly.2013(83):112-130.
[ 3 5 ]李穎,沈保棟.數(shù)字人文視域下的歷史檔案開(kāi)發(fā)路徑: 以“ 跟著檔案觀上?!?為例[ J ] . 檔案與建設(shè),2024,(03):56-62.
[36]丁華東.檔案記憶觀的興起及其理論影響[J].檔案管理,2009,(01):16-20.
[37]BUSSELL H.Digitized Indigenous knowledgec o l l e c t i o n s : i m p a c t o n c u l t u r a l k n o w l e d g etransmission,social connections,and culturalidentity[J].Evidence Based Library and InformationPractice,2022(03):147-149.
[38]李俊哲,徐擁軍,張丹.社會(huì)記憶視角下北京冬奧檔案征集工作研究[J].檔案學(xué)研究,2024(01):77-84.
[39]丁華東,周子晴.數(shù)字人文:數(shù)字時(shí)代社會(huì)記憶再生產(chǎn)的新景觀[J].情報(bào)科學(xué),2023,41(11):1-7+27.
[40]馮惠玲.數(shù)字記憶:文化記憶的數(shù)字宮殿[J].中國(guó)圖書(shū)館學(xué)報(bào),2020(03):4-16.
[41]馮惠玲.數(shù)字人文視角下的數(shù)字記憶:兼議數(shù)字記憶的方法特點(diǎn)[J].數(shù)字人文研究,2021(01):87-95.
[42]加小雙,史林玉,秦楊.加小雙老師談檔案與數(shù)字人文/數(shù)字記憶:2020年“國(guó)際檔案周學(xué)者談”第三期[J].中國(guó)檔案研究,2020(02):249-259.
[43]付靖宜,程慧平.數(shù)字人文視域下社會(huì)記憶資源深度開(kāi)發(fā)路徑探究:以浙江歷史文化記憶工程為例[J].浙江檔案,2021,(12):21-25.
[44]王思琪,黃鐘雨,付亞楠,等.數(shù)字人文視域下戲曲檔案資源開(kāi)發(fā)路徑探析[J].北京檔案,2022,(02):26-28.
[ 4 5 ] 蔣楠, 張菁. 數(shù)字人文視角下文化遺產(chǎn)信息的演進(jìn)、呈現(xiàn)與管理[ J ] . 同濟(jì)大學(xué)學(xué)報(bào)( 社會(huì)科學(xué)版),2023,34(06):82-93.
[46]鄭慧,王清楠,韋兆焯.數(shù)字創(chuàng)意產(chǎn)業(yè)背景下僑批檔案的文化價(jià)值實(shí)現(xiàn)[J].北京檔案,2023,(06):15-18.
[47]孟鑫,姚靜.國(guó)外藝術(shù)檔案管理的特征與啟示[J].北京檔案,2022,(03):44-49.
[48]孫大東,白路浩.心流理論視域下紅色檔案?jìng)鞒屑t色基因的向度與路徑[J].檔案學(xué)通訊,2022(01):15-22.
[49]翟樂(lè),李金格.數(shù)字人文視閾下紅色檔案資源的遴選、組織與開(kāi)發(fā)策略研究[J].情報(bào)科學(xué),2021,39(12):174-178+186.
[50]梁文超.數(shù)字人文視域下湘鄂贛紅色檔案在線知識(shí)服務(wù)創(chuàng)新路徑研究[J].檔案學(xué)研究,2023(06):85-92.
[51]王昊,薛文萍,周昊,等.數(shù)字人文視角下的紅色文化傳承:以紅嫂精神為例[J].山西檔案,2020,(02):92-100.
[52]戴柏清,秦順.國(guó)家文化數(shù)字化戰(zhàn)略下檔案館發(fā)展向度與實(shí)踐路徑[J].北京檔案,2022,(08):16-20.
[53]李金格.紅色檔案提升黨史學(xué)習(xí)教育實(shí)效性的問(wèn)題及策略研究[J].北京檔案,2021,(11):39-41.
[54]朱天梅,朱曉晨.國(guó)家文化數(shù)字化戰(zhàn)略下少數(shù)民族檔案文化資源重構(gòu)[J].檔案學(xué)刊,2024,(01):16-25.
[55]陳子丹,譙丹,廖可佳.云南少數(shù)民族檔案資源開(kāi)發(fā)利用的思考[J].檔案學(xué)通訊,2018,(01):67-70.
[56]華林,侯明昌.流失海外少數(shù)民族檔案文獻(xiàn)的分布與追索[J].檔案學(xué)研究,2010(02):34-36.
[57]周耀林,吳化.數(shù)字人文視野下少數(shù)民族檔案文獻(xiàn)遺產(chǎn)數(shù)字化保護(hù)研究[J].檔案學(xué)研究,2022,(05):123-129.
[58]周晨.國(guó)際數(shù)字人文研究特征與知識(shí)結(jié)構(gòu)[J].圖書(shū)館論壇,2017(04):1-8..
[59]張小林,曹如中,向洪,等.新文科建設(shè)背景下圖情檔學(xué)科向數(shù)字人文轉(zhuǎn)型發(fā)展的理論契合及邏輯進(jìn)路[J].圖書(shū)館,2023,(05):15-20+33.
[ 6 0 ] 龍家慶, 王玉玨, 李子林. 融合與建構(gòu): 數(shù)字人文研究與檔案工作的關(guān)聯(lián)及路徑探索[ J ] . 檔案與建設(shè),2018,(12):4-7+12.
[61]尹良鑫.數(shù)字人文視域下鄉(xiāng)村檔案文化建設(shè):生成邏輯、價(jià)值體現(xiàn)與路徑選擇[J].山西檔案,2023(04):110-116.
[62]周欣然.基于數(shù)字人文視角的高校檔案館檔案服務(wù)體系構(gòu)建[J].檔案與建設(shè),2021(01):24-30.
[ 6 3 ]周林興,黃星.國(guó)家文化數(shù)字化戰(zhàn)略背景下紅色檔案資源建設(shè): 價(jià)值、任務(wù)與實(shí)踐路向[ J ] . 北京檔案,2024,(01):7-12.
[64]加小雙.檔案學(xué)與數(shù)字人文:檔案觀的脫節(jié)與共生[J].圖書(shū)館論壇,2019,39(05):10-16.
[65]孫大東,張麗華.檔案參與數(shù)字人文工作的SWOT分析[J].山西檔案,2020,(04):34-40.
(作者單位:鄭州航空工業(yè)管理學(xué)院 任紅娟,博士,副教授,碩士生導(dǎo)師;秦勇豪,碩士研究生,通信作者;宋京京,碩士研究生;李賽玲,碩士研究生 來(lái)稿日期:2024-07-25)