摘 要:數(shù)字人文視角下,檔案資源的開發(fā)與利用是將技術(shù)理性和價值理性進行彌合的過程,其信息技術(shù)與人文研究相融合的特點不僅有助于推動人文歷史類檔案的深入研究,也有助于豐富專題檔案內(nèi)容,促進檔案信息化建設(shè)。本文以數(shù)字人文視角下檔案資源開發(fā)與利用的價值意蘊為切入點,發(fā)現(xiàn)數(shù)字視角下檔案資源開發(fā)與利用存在的開發(fā)主體協(xié)同不夠、開發(fā)技術(shù)應(yīng)用薄弱、開發(fā)成果形式有限、開發(fā)內(nèi)容延伸乏力等問題。從數(shù)據(jù)組織、價值挖掘和服務(wù)創(chuàng)新三個層面尋找突破口,為實現(xiàn)數(shù)字人文在檔案領(lǐng)域的深度融合提供參考。
關(guān)鍵詞:數(shù)字人文;檔案資源;開發(fā)利用
數(shù)字人文是數(shù)字技術(shù)與人文學(xué)科交流碰撞而成的新興領(lǐng)域,是一種全球性的、超越歷史并跨越媒介的創(chuàng)建知識及意義的路徑,現(xiàn)已滲透到許多學(xué)科并對其產(chǎn)生重大影響[1]。數(shù)字人文開發(fā)過程應(yīng)用的理念、技術(shù)、工具和對檔案資源組織的方法給檔案資源開發(fā)與利用帶來的新的思路,對于豐富社會和民族記憶、傳承優(yōu)秀傳統(tǒng)文化、促進人文歷史研究都具有積極意義。對此,檔案部門應(yīng)充分把握數(shù)字人文視角下檔案資源開發(fā)與利用的價值意蘊,堅持技術(shù)與人文有機結(jié)合,運用數(shù)字人文方式方法,提升檔案資源開發(fā)與利用效能。
1 數(shù)字人文的內(nèi)涵及特點
數(shù)字人文融合傳統(tǒng)的人文研究與新興的數(shù)字技術(shù),既是對人文研究的具體實踐,也是應(yīng)用新興信息技術(shù)的全新建模方式,更是對知識和資源的重組與開發(fā)。數(shù)字人文與檔案資源開發(fā)與利用在資源組織、研究方法上具有一定的重合,這也為二者的融合發(fā)展提供基礎(chǔ)。目前,數(shù)字人文尚處于快速發(fā)展期,社會各界對于數(shù)字人文的開發(fā)也處于探索實踐階段,各學(xué)科對于數(shù)字人文的定義也尚未形成統(tǒng)一認(rèn)知。從檔案資源開發(fā)與利用的角度來看,數(shù)字人文就是融合各種人文研究方法、數(shù)字工具和檔案資源相結(jié)合的新范式,以人文研究者和社會公眾的需求為導(dǎo)向,以檔案資源為基礎(chǔ),以數(shù)字研究方法和技術(shù)為工具,以資源開發(fā)與利用為目標(biāo),呈現(xiàn)出跨機構(gòu)、跨學(xué)科融合、開放性和協(xié)作性的特點。
1.1 跨學(xué)科
數(shù)字人文自誕生起就融合人文科學(xué)、社會科學(xué)和自然科學(xué)的研究方法和工具,隨著數(shù)字人文項目開發(fā)不斷成熟,學(xué)科間交叉和融合愈加頻繁。數(shù)字人文在傳統(tǒng)人文研究和理工科研究之間搭建起了橋梁,其開發(fā)項目也從一開始?xì)v史、藝術(shù)和文學(xué)擴展到了其他學(xué)科。
1.2 跨機構(gòu)
數(shù)字人文跨學(xué)科的突出特點也決定了其開發(fā)需要多個機構(gòu)的參與。目前,數(shù)字人文項目開發(fā)的開發(fā)主體主要為學(xué)術(shù)機構(gòu)和高校,資源機構(gòu)主要是檔案館、博物館和圖書館,其他諸如系統(tǒng)供應(yīng)商、傳播團隊等主要負(fù)責(zé)前端運營工作。
1.3 開放性
與傳統(tǒng)人文研究和檔案服務(wù)項目相比,數(shù)字人文檔案項目具有高度的開放性,體現(xiàn)在資金來源、內(nèi)容獲取、用戶服務(wù)等方方面面。在互聯(lián)網(wǎng)環(huán)境下,數(shù)字人文中設(shè)計的知識生產(chǎn)、組織的傳播都是開放包容的。這種開放性有助于各個參與主體的充分溝通,也有利于充分了解用戶的需求,以最大化的發(fā)揮檔案資源價值。
1.4 協(xié)作性
數(shù)字人文跨學(xué)科和跨結(jié)構(gòu)的特點決定了其在開發(fā)和應(yīng)用過程中也需要多個主體的協(xié)同工作,通常包含大學(xué)、研究機構(gòu)、軟硬件供應(yīng)商和用戶,即使是在同一主體內(nèi),也具有高度的協(xié)作性。
2 數(shù)字人文與檔案資源開發(fā)與利用的適應(yīng)性分析
2.1 數(shù)字人文有助于推動人文歷史類檔案的深入研究
檔案領(lǐng)域中的數(shù)字人文項目多聚焦于人文歷史類檔案的組織與利用,“全國數(shù)字人文年會”中獲獎的多數(shù)項目便體現(xiàn)了這一特性。數(shù)字人文是一種將計算機方法與技術(shù)融入人文研究,進而提出并回答人文問題的新范式,其在檔案領(lǐng)域的應(yīng)用具有三重優(yōu)勢:一是提高檔案內(nèi)容的閱讀與查詢效率。隨著檔案信息化建設(shè)的推進,數(shù)字化資源已逐漸成為檔案館最為主要的館藏資源,如果運用傳統(tǒng)的內(nèi)容分析和查詢方式,從海量數(shù)字化資源中獲取有用信息需要消耗大量人力物力,但應(yīng)用關(guān)聯(lián)聚合、內(nèi)容聚合和知識圖譜等數(shù)字技術(shù),能夠快速且準(zhǔn)確地完成對內(nèi)容的抓取和提煉,同時還能夠避免人工檢索的失誤。如中國歷代人物傳記資料庫,共收錄超過42萬條人物傳記資料,記錄了各方面的詳細(xì)數(shù)據(jù),這些數(shù)據(jù)可以為各領(lǐng)域的人物關(guān)系和歷史事件研究提供基礎(chǔ)數(shù)據(jù)支撐,檢索技術(shù)可以幫助研究者快速獲取所需數(shù)據(jù)[2]。二是提升文學(xué)類檔案研究的深度。對于人文歷史類檔案的研究,不能只聚焦某一時間段和某一類型的作品,而是要從多個維度和要素切入。如對于文學(xué)類檔案,傳統(tǒng)的細(xì)讀方法已無法滿足研究者和社會大眾的需求,運用可視化技術(shù)和社會網(wǎng)絡(luò)分析的方法對文本中出現(xiàn)的人物、事件乃至敘事結(jié)構(gòu)進行描繪,就給文本閱讀與研究提供了全新的思路和研究路徑。三是推動不同機構(gòu)、部門間的協(xié)作。目前,檔案資源開發(fā)與利用的協(xié)同化已成為數(shù)字人文項目的重要特征,能夠滿足創(chuàng)新要素整合、資源組織協(xié)調(diào)和利用服務(wù)多元等多項要求,主要體現(xiàn)在檔案館在數(shù)字人文項目開發(fā)過程中,需要推進與圖書館、博物館、文化館、黨史陳列館和信息技術(shù)公司等機構(gòu)的跨界合作[3]。
2.2 數(shù)字人文有助于豐富專題檔案內(nèi)容
數(shù)字人文項目開發(fā)的覆蓋面廣、涉及主題內(nèi)容豐富,極大地擴充檔案內(nèi)容建設(shè),為專題檔案的編研、著錄提供參考。目前,采用數(shù)字人文方法和技術(shù)構(gòu)建而成的檔案資源體系具有豐富多樣的主題內(nèi)容,包括但不限于文化遺產(chǎn)、城市記憶、歷史名人、弱勢群體、專業(yè)知識、重大活動和突發(fā)事件等[4]。如由中國人民大學(xué)開發(fā)的《高遷古村數(shù)字記憶網(wǎng)站》,旨在以數(shù)字人文新的知識生產(chǎn)與傳播方式,構(gòu)建古村落數(shù)字記憶,為古村落原生態(tài)保護提供新的范式。武漢大學(xué)數(shù)字人文中心開發(fā)的《基于IIIF的敦煌壁畫數(shù)字?jǐn)⑹孪到y(tǒng)》,綜合運用多項數(shù)字人文技術(shù)實現(xiàn)對數(shù)字圖像的增強展示。上述數(shù)字人文項目都是以人文歷史中的問題為切入點,回應(yīng)社會公眾對多樣化檔案資源的訴求,而這種訴求就要求檔案館或研究機構(gòu)對檔案資源進行數(shù)據(jù)組織、價值挖掘和服務(wù)創(chuàng)新,其中數(shù)據(jù)組織就需要建立多樣化的專題檔案資源庫,為后續(xù)的知識關(guān)聯(lián)和知識發(fā)現(xiàn)提供基礎(chǔ)。
2.3 數(shù)字人文有助于檔案數(shù)字化建設(shè)
當(dāng)前,數(shù)字化已成為檔案領(lǐng)域的重要發(fā)展方向,大數(shù)據(jù)、云計算、區(qū)塊鏈和人工智能等新興信息技術(shù)的應(yīng)用給檔案管理帶來的新的機遇和挑戰(zhàn)。首先,數(shù)字人文推動檔案學(xué)研究。與自然科學(xué)、社會科學(xué)相比,檔案科學(xué)對信息技術(shù)的采納較為單一和滯后。通過數(shù)字人文的快速發(fā)展,人們對于“人文”與“數(shù)據(jù)”關(guān)系的認(rèn)識得以進一步更新。數(shù)字人文不僅強調(diào)知識生產(chǎn)、表現(xiàn)與傳播,在科研方面也表現(xiàn)出開放、創(chuàng)新、共享的精神,特別是學(xué)術(shù)活動中推動協(xié)同、眾包、互聯(lián)、交互、跨學(xué)科、跨國界、跨專業(yè)合作等學(xué)術(shù)理念的普及與范式創(chuàng)新,能夠有效促進檔案科學(xué)的發(fā)展與進步。其次,數(shù)字人文有助于推進檔案信息化建設(shè)。數(shù)字人文中大量應(yīng)用新興計算機科學(xué),在基礎(chǔ)設(shè)施建設(shè)、硬件適配和軟件開發(fā)上都有一定要求,而作為面向人文研究者和社會大眾的文化產(chǎn)品,不僅提高了人文歷史的傳播力和影響力,其巨大的社會效益和經(jīng)濟效益還能夠反哺檔案數(shù)字化建設(shè)[5]。在數(shù)字人文項目開發(fā)過程中形成的管理模型、系統(tǒng)軟件和硬件設(shè)施也能夠為檔案信息化建設(shè)提供一定的方向指引。
3 數(shù)字人文視角下檔案資源的開發(fā)與利用對策
3.1 建立面向數(shù)字人文的數(shù)據(jù)組織
3.1.1應(yīng)明確檔案資源開發(fā)與利用的數(shù)據(jù)類型。從檔案產(chǎn)生主體的視角看,應(yīng)用與數(shù)字人文的檔案資源主要涵蓋了結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和無結(jié)構(gòu)化數(shù)據(jù),從載體上看則多為數(shù)字化資源。在實際的應(yīng)用中,數(shù)字人文對檔案資源結(jié)構(gòu)化、規(guī)范化、標(biāo)準(zhǔn)化的要求較高,因此應(yīng)用最多的是結(jié)構(gòu)化數(shù)據(jù),為推動分散的檔案資源轉(zhuǎn)為結(jié)構(gòu)化的檔案數(shù)據(jù),可從以下三個方面入手:一是立足數(shù)字人文的要求,對館藏檔案進行全面摸底,加快紙質(zhì)檔案資源的數(shù)字化轉(zhuǎn)化;二是進一步提升檔案規(guī)范化與標(biāo)準(zhǔn)化水準(zhǔn),通過檔案數(shù)據(jù)化技術(shù)將碎片化的檔案資源整合到一起;三是推動政府部門、社會機構(gòu)、社群和個人的廣泛參與,在豐富檔案資源的基礎(chǔ)上提升檔案治理水平。
3.1.2基于數(shù)字人文的需要構(gòu)建檔案數(shù)據(jù)集。在總體規(guī)劃上,以數(shù)字人文的管理與實踐為基礎(chǔ),綜合運用數(shù)據(jù)庫技術(shù)(數(shù)據(jù)挖掘與分析等)對檔案文本進行深度分析,特別是對檔案的著錄、編目、標(biāo)引等,為檔案的組織與利用提供基礎(chǔ)保障,同時打造以數(shù)字人文為核心的專題數(shù)據(jù)庫。從具體實踐層面來看,應(yīng)重點關(guān)注前端與后端的開發(fā)與管理[6]。前端應(yīng)加強控制體系建設(shè),擬定面向數(shù)字人文的數(shù)據(jù)及建設(shè)規(guī)范與標(biāo)準(zhǔn),推動數(shù)字人文檔案的共建共享,同時建立通用管理框架,內(nèi)部嵌入不同類型數(shù)字人文的具體應(yīng)用,為數(shù)字人文資源的多樣化管理與利用提供平臺。后端應(yīng)做好數(shù)據(jù)集的建設(shè)與開放工作,分模塊確定好數(shù)字人文的檔案數(shù)據(jù)集范圍,并根據(jù)數(shù)據(jù)特點選擇合適的前端發(fā)布平臺。
3.1.3組建面向數(shù)字人文的檔案數(shù)據(jù)描述方法。在傳統(tǒng)的數(shù)據(jù)庫系統(tǒng)建設(shè)中,邏輯層承擔(dān)數(shù)據(jù)庫的控制和處理,其最主要的工作就是對實體、實體屬性和實體之間的關(guān)系進行處理,而關(guān)鍵就在于如何把抽象化的檔案信息資源通過一系列的加工以可視化的形式呈現(xiàn)在前端,同時也要將前端的數(shù)據(jù)邏輯通過一系列的處理編碼成數(shù)據(jù)庫中的信息。在數(shù)字人文視角下,就應(yīng)根據(jù)其面向人文研究者和社會公眾的特點靈活增減實體,例如,可采用時序與空間分析相結(jié)合等方法對時序內(nèi)容信息與空間內(nèi)容信息進行整合,并從人、地、時、事、物等維度來描述與組織相關(guān)的面向數(shù)字人文實踐需求的檔案數(shù)據(jù)。
3.2 運用數(shù)字人文工具挖掘檔案價值
基于上文中建立的面向數(shù)字人文的數(shù)據(jù)組織,應(yīng)綜合運用多種數(shù)字人文工具(如語義網(wǎng)、關(guān)聯(lián)數(shù)據(jù)等)實現(xiàn)對基礎(chǔ)數(shù)據(jù)集的知識化和語義化,進而結(jié)合社會公眾和人文研究人員的需要通過文本分析、時序分析和可視化等前端技術(shù)讓檔案知識重新呈現(xiàn)在利用者面前。主要分為三個步驟:一是實現(xiàn)檔案數(shù)據(jù)的知識化組織。主要目的是將原本無序和雜亂的檔案知識轉(zhuǎn)化為對應(yīng)的知識單元。在實踐中,多采用“元數(shù)據(jù)標(biāo)注-本體建?!钡姆椒▽n案資源進行組織,一方面可以根據(jù)數(shù)字人文應(yīng)用的具體需求對相關(guān)的元素進行抽取,另一方面也可以數(shù)字人文應(yīng)用的特殊性自主設(shè)計元數(shù)據(jù)標(biāo)準(zhǔn)的元素,能夠?qū)崿F(xiàn)個性化的知識組織。二是檔案知識關(guān)聯(lián)。在完成元數(shù)據(jù)標(biāo)準(zhǔn)和本體建模后,檔案知識實際上還是獨立單位的形式存在著的,單元間缺乏關(guān)聯(lián)。為實現(xiàn)知識單元間的聚合,常用的方法是采用知識圖譜的形式對各個單元的關(guān)系進行解析、界定和融合。如北京大學(xué)數(shù)字人文研究中心搭建的宋元學(xué)案知識圖譜可視化系統(tǒng),就對《宋元學(xué)案》這部理學(xué)巨著的全文本進行文本挖掘和深度分析,將學(xué)案中的人物、時間、地點、著作以及它們之間的復(fù)雜語義關(guān)系提取出來構(gòu)造成知識圖譜,在此基礎(chǔ)上提供數(shù)字人文遙讀、多種可視化呈現(xiàn)、交互式瀏覽等功能。三是檔案知識發(fā)現(xiàn)。檔案知識組織和關(guān)聯(lián)是對原有資源的再組織,而知識發(fā)現(xiàn)則是在二者的基礎(chǔ)上進一步挖掘檔案中蘊含的價值,讓原本難以被發(fā)現(xiàn)的關(guān)鍵信息和隱藏要素通過細(xì)粒度更低的挖掘方式形成新的圖譜。如上海博物館開發(fā)的《董其昌數(shù)字人文展示系統(tǒng)》,通過對數(shù)據(jù)的深度分析,以可視化的處理方法展示了董其昌生平、交游、以及人脈關(guān)系,還原出一個以董其昌為中心而構(gòu)筑的晚明時代的藝術(shù)生態(tài)圈。
除此之外,還要實現(xiàn)檔案利用的協(xié)同化。推動檔案館的外部合作,提升檔案館服務(wù)社會能力,可以與人文研究者、高校、研究機構(gòu)加強溝通聯(lián)系。個人用戶需求方面,建立起良好的溝通反饋機制和用戶服務(wù)體系,注重發(fā)揮數(shù)字人文的經(jīng)濟效益和社會效益,根據(jù)用戶需求的變化調(diào)整館藏結(jié)構(gòu),更好的為各主體服務(wù)。與此同時也可以將編研成果通過展覽、檔案網(wǎng)站發(fā)布等形式進行宣傳,緊密聯(lián)系社會各界的人文信息發(fā)布平臺,擴大數(shù)字人文應(yīng)用的宣傳范圍,使數(shù)字人文成果得到充分的轉(zhuǎn)化,實現(xiàn)檔案的價值。
3.3 開發(fā)面向數(shù)字人文的檔案服務(wù)方式
3.3.1檔案服務(wù)接口設(shè)計。根據(jù)數(shù)字人文應(yīng)用的不同場景,在服務(wù)接入可采用web服務(wù)程序,通過標(biāo)準(zhǔn)的Web協(xié)議提供服務(wù),目的是保證不同平臺的應(yīng)用服務(wù)可以互操作。服務(wù)接口除了集成數(shù)字人文應(yīng)用外,還應(yīng)提供其中涉及檔案內(nèi)容的過程信息,如版本號、時間、操作管理員等,借助統(tǒng)一接口實現(xiàn)集中管理、集中開發(fā),形成完備的數(shù)據(jù)庫,集成檢索服務(wù),構(gòu)建一站式的服務(wù)平臺。同時,構(gòu)建個性化的檔案服務(wù)方式。具體而言,提供模塊化的服務(wù)功能,用戶可根據(jù)個人需求在管理系統(tǒng)的各個服務(wù)模塊查詢和獲取信息,這就改變了傳統(tǒng)檔案的中心服務(wù)模式,用戶與檔案資源直接的距離進一步縮短,點對點的利用方式也有助于提高檔案利用率,化解傳統(tǒng)模式下的信息孤島難題,構(gòu)建出多主體參與的協(xié)同服務(wù)模式。
3.3.2以主體需求為導(dǎo)向創(chuàng)新服務(wù)方式。檔案類型眾多,數(shù)字人文背景下的開發(fā)以結(jié)構(gòu)化數(shù)據(jù)開發(fā)為主,但隨著個體成為檔案產(chǎn)生的重要主體之一,碎片化和分散化檔案資源的開發(fā)利用也必將成為檔案開發(fā)與利用的趨勢。對此,檔案部門應(yīng)根據(jù)檔案資源特點和主體需求創(chuàng)新服務(wù)方式。如針對個體用戶,數(shù)字人文項目要重點開發(fā)資源的個性化檢索與組織,同時還要探索更為深入的內(nèi)容服務(wù),接入圖書文化、文化自信相關(guān)內(nèi)容的數(shù)據(jù)接口,讓民眾能夠更方便、更直接地享受檔案服務(wù)。針對人文歷史研究者,則更要突出檔案利用與開發(fā)的技術(shù)特點,可以將多種閱讀模式結(jié)合,獲得全新知識圖景,提供跨學(xué)科、跨時空的全新閱讀方式。
參考文獻
[1]張鈺桐,徐健.數(shù)字人文視域下的家譜檔案資源重構(gòu):價值、邏輯及框架[J].檔案學(xué)研究,2022(05):94-101.DOI:10.16065/j.cnki.issn1002-1620.2022.05.013.
[2]向敏.數(shù)字人文視角下綜合檔案館檔案利用服務(wù)發(fā)展策略研究[J].蘭臺世界,2022(09):104-106.DOI:10.16565/j.cnki.1006-7744.2022.09.26.
[3]廖蓓蓓.基于數(shù)字人文視域下檔案資源整合與服務(wù)轉(zhuǎn)型[J].黑龍江檔案,2022(04):311-313.
作者簡介:李楠,大學(xué)學(xué)歷,國網(wǎng)天津市電力公司電力科學(xué)研究院綜合管理部文書檔案管理、工程師,研究方向:科技項目檔案未來發(fā)展趨勢及前沿方向/檔案電子信息化前沿。