国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

數(shù)字人文視域下文書檔案的開發(fā)與利用研究

2024-04-26 01:35國家廣播電視總局五二三臺張倩
辦公室業(yè)務(wù) 2024年5期
關(guān)鍵詞:文書人文檔案管理

文/國家廣播電視總局五二三臺 張倩

數(shù)字人文是人文學(xué)科和計算機(jī)科學(xué)相結(jié)合的產(chǎn)物,能夠彌補(bǔ)傳統(tǒng)人文學(xué)科研究中存在的缺陷和不足,同時也為社會大眾提供了了解歷史文化、提高文化素養(yǎng)、增強(qiáng)文化自信的途徑。數(shù)字人文對傳統(tǒng)人文學(xué)科研究模式產(chǎn)生了深遠(yuǎn)影響,數(shù)字人文研究的本質(zhì)是“以數(shù)據(jù)為核心”,以數(shù)據(jù)為驅(qū)動,強(qiáng)調(diào)研究成果的可靠性和實用性。文書檔案是歷史、文化與社會記憶的載體,數(shù)字人文視域下文書檔案的開發(fā)與利用應(yīng)以數(shù)據(jù)驅(qū)動為核心理念,強(qiáng)化數(shù)據(jù)安全,優(yōu)化利用流程,整合開發(fā)資源,形成以大數(shù)據(jù)為基礎(chǔ)的文書檔案數(shù)字人文服務(wù)模式,更好地服務(wù)社會和人類發(fā)展。

一、數(shù)字人文研究的本質(zhì):“以數(shù)據(jù)為核心”

數(shù)字人文是以數(shù)字技術(shù)為工具,以數(shù)據(jù)為核心的一種人文學(xué)科研究方法,強(qiáng)調(diào)通過數(shù)字技術(shù)和數(shù)據(jù)分析的方式來獲取、處理和理解人文學(xué)科中的文本、圖像、聲音等形式。隨著數(shù)字技術(shù)與人文學(xué)科的深度融合,數(shù)字人文研究呈現(xiàn)出“以數(shù)據(jù)為核心”“以數(shù)據(jù)為驅(qū)動”等特點(diǎn)。數(shù)字人文以計算機(jī)技術(shù)和人工智能為基礎(chǔ),主要使用自然語言處理技術(shù)、計算機(jī)視覺技術(shù)、知識圖譜技術(shù)以及機(jī)器學(xué)習(xí)算法等方法,對人類的認(rèn)知過程進(jìn)行模擬。數(shù)字人文研究強(qiáng)調(diào)以數(shù)據(jù)為核心,將一切可量化、可分析的信息進(jìn)行數(shù)字化處理,通過對大量文本、圖像等信息的整合,從不同維度深入挖掘文本背后隱藏的歷史文化信息,進(jìn)而探究社會和文化發(fā)展規(guī)律,促進(jìn)社會的發(fā)展。數(shù)字人文研究認(rèn)為傳統(tǒng)人文學(xué)科研究中存在大量的“黑箱”問題,導(dǎo)致研究者無法準(zhǔn)確判斷研究成果是否符合實際需求,此研究可有效解決其中存在的問題。

二、數(shù)字人文視域下文書檔案的開發(fā)方向

(一)運(yùn)用文本挖掘技術(shù)挖掘文書檔案的潛在價值。文本挖掘是對文本內(nèi)容進(jìn)行自動分析并發(fā)現(xiàn)其中蘊(yùn)含的信息的過程。通過對文本內(nèi)容的挖掘,可以對用戶需求、知識圖譜等相關(guān)信息進(jìn)行挖掘,進(jìn)而生成用戶需要的信息和知識,同時也能從文本挖掘中發(fā)現(xiàn)問題和規(guī)律,從而為文書檔案的開發(fā)與利用提供新的思路。在文書檔案開發(fā)與利用的過程中,首先要明確開發(fā)與利用目的。目前,文獻(xiàn)檔案的開發(fā)與利用方向主要是:滿足用戶閱讀需求,為專業(yè)人員提供研究支持。對于前者來說,要進(jìn)一步挖掘現(xiàn)有文獻(xiàn)檔案的潛在價值,通過深度加工并整合現(xiàn)有的文獻(xiàn)資源,充分發(fā)揮其在歷史、文化和社會記憶方面的作用;對于后者來說,要進(jìn)一步挖掘文書檔案的潛在價值,為人文研究提供新思路。在文書檔案的開發(fā)與利用過程中,要明確當(dāng)前研究存在的問題并及時解決,將已有的數(shù)據(jù)資源進(jìn)行整合,充分發(fā)揮其在歷史、文化和社會記憶方面的作用,為不同環(huán)境下歷史、地理、科學(xué)等學(xué)科的發(fā)展提供信息與數(shù)據(jù)支持。

要建立基于大數(shù)據(jù)和文本挖掘技術(shù)的文書檔案開發(fā)與利用系統(tǒng),需根據(jù)研究目標(biāo)制定科學(xué)的系統(tǒng)設(shè)計方案和框架;明確系統(tǒng)功能模塊和數(shù)據(jù)流程;運(yùn)用大數(shù)據(jù)技術(shù)和文本挖掘技術(shù)進(jìn)行數(shù)據(jù)分析;建立科學(xué)的指標(biāo)體系、搭建文書檔案管理平臺等,對系統(tǒng)的運(yùn)行效果進(jìn)行評估。在文書檔案開發(fā)與利用過程中,充分運(yùn)用大數(shù)據(jù)技術(shù)、人工智能等現(xiàn)代信息技術(shù)進(jìn)行輔助。例如:利用自然語言處理技術(shù)實現(xiàn)對文書檔案的自動標(biāo)引和自動生成摘要;運(yùn)用機(jī)器學(xué)習(xí)技術(shù)對文書檔案進(jìn)行分類;利用文本挖掘技術(shù)對文書檔案進(jìn)行語義分析、構(gòu)建知識圖譜;利用機(jī)器翻譯技術(shù)自動評估相關(guān)文獻(xiàn)的翻譯結(jié)果。

(二)運(yùn)用數(shù)據(jù)管理技術(shù)充分發(fā)揮文書檔案數(shù)據(jù)的作用。在數(shù)字人文研究中,數(shù)據(jù)是開展研究的基礎(chǔ)和保障。隨著數(shù)據(jù)量的增長,傳統(tǒng)的基于人工整理、統(tǒng)計的檔案管理模式越來越難以適應(yīng)目前檔案管理的需要,文書檔案數(shù)字化、信息化、網(wǎng)絡(luò)化管理模式在實現(xiàn)檔案數(shù)字化過程中得到越來越廣泛的使用,數(shù)據(jù)管理技術(shù)可將文書檔案從實體檔案轉(zhuǎn)化為電子文檔,也可將紙質(zhì)檔案轉(zhuǎn)化為電子檔案,為檔案管理人員對文書檔案進(jìn)行全流程管理提供便利。在保存方面,未來可結(jié)合數(shù)字技術(shù)與傳統(tǒng)技術(shù)形成不同類型文書檔案的長期保存模式。如建國初期的民間契約、公文、電報等較為久遠(yuǎn)的檔案、文獻(xiàn)等資料,根據(jù)其性質(zhì)與價值特征進(jìn)行分類保存,以滿足需求;在數(shù)字化進(jìn)程方面,可對各類文書檔案進(jìn)行掃描、識別、去重、分類、標(biāo)注等處理;在開發(fā)利用方面,可加強(qiáng)對文書檔案數(shù)據(jù)的開放共享和深度挖掘利用。但數(shù)字人文研究同樣面臨著數(shù)據(jù)共享與價值挖掘之間的矛盾,一方面,數(shù)字人文研究需要海量數(shù)據(jù)的支撐;另一方面,數(shù)字人文研究成果的價值在于對數(shù)據(jù)的應(yīng)用和價值的挖掘。因此,在開發(fā)利用過程中應(yīng)注重數(shù)據(jù)質(zhì)量和數(shù)據(jù)安全問題。通過對各種類型文書檔案信息進(jìn)行分類管理和整理加工,建立完善的文書檔案資源體系,搭建文書檔案管理平臺。

(三)結(jié)合GIS技術(shù)將人文歷史地理脈絡(luò)與現(xiàn)代科技相結(jié)合。利用地理信息系統(tǒng)技術(shù)可以滿足歷史檔案資料、人文歷史發(fā)展、地理環(huán)境保護(hù)等學(xué)科的發(fā)展,為文書檔案管理工作提供數(shù)據(jù)支撐,尤其是在不同區(qū)域下文書檔案的整理與匯總,以及各種與地理信息數(shù)據(jù)相關(guān)的文書檔案整理方面,人文歷史地理等學(xué)科與現(xiàn)代科技的結(jié)合可為信息使用者、閱讀者提供更加全面、有效的數(shù)據(jù)。因此,文書檔案開發(fā)可從地理空間數(shù)據(jù)管理、分析和制圖等方面展開,發(fā)揮自身優(yōu)勢,將數(shù)字人文的研究成果與GIS技術(shù)結(jié)合,建立基于GIS的數(shù)字人文平臺。這一平臺可以從文書檔案中獲取海量信息,包括文書檔案信息、歷史地圖、地理空間數(shù)據(jù)等,并利用GIS技術(shù)進(jìn)行數(shù)據(jù)分析,建立基于地理空間數(shù)據(jù)的數(shù)字人文模型,實現(xiàn)文書檔案中地理信息數(shù)據(jù)的有效整合。對于有不同使用需求的人員、部門、單位、企業(yè)以及其他使用者來說,有利于文書檔案在多部門之間實現(xiàn)共享和利用,提升對文書檔案資源的開發(fā)利用效率。與此同時,將數(shù)字人文與GIS技術(shù)結(jié)合的另一大優(yōu)勢是可以進(jìn)行空間分析與空間制圖。通過空間分析和空間制圖將相關(guān)文書檔案信息進(jìn)行有效整合與管理,實現(xiàn)對地理空間數(shù)據(jù)的可視化呈現(xiàn),為用戶提供多種空間分析功能和可視化展示手段。例如,可將電子地圖上的文字信息、圖像信息等進(jìn)行直接顯示或轉(zhuǎn)換,對數(shù)據(jù)進(jìn)行有效管理。

(四)結(jié)合VR技術(shù)提升文書檔案的展示效果。VR技術(shù)是指利用計算機(jī)仿真技術(shù),通過創(chuàng)建虛擬環(huán)境,使用戶身臨其境地感受真實場景中的視覺、聽覺、觸覺等信息,并在此基礎(chǔ)上產(chǎn)生深度感知和思維活動。VR技術(shù)被廣泛應(yīng)用于博物館、圖書館、檔案館等人文社會科學(xué)機(jī)構(gòu),展示形式多種多樣。目前,我國博物館在數(shù)字人文平臺展示的館內(nèi)情況與展品通過計算機(jī)圖形圖像處理技術(shù),以三維數(shù)據(jù)形式對博物館檔案進(jìn)行數(shù)字化處理,以實體博物館檔案為基礎(chǔ),制作一套完整的博物館檔案的數(shù)字化產(chǎn)品目錄,將紙質(zhì)檔案、圖片檔案、視頻檔案轉(zhuǎn)化為數(shù)字產(chǎn)品。通過該目錄,用戶可以清晰地了解博物館文書檔案的數(shù)字化產(chǎn)品內(nèi)容及其使用方式等信息。在展示效果上,用戶可以通過360度視角感受博物館檔案的真實面貌。當(dāng)前我國各地方博物館、中國科技博物館、國家博物館均在發(fā)展此項技術(shù),且得到了一定的應(yīng)用。除了博物館文書檔案外,利用VR技術(shù)還可以將其他類型的檔案進(jìn)行展示,如司法文書、訴訟檔案、司法卷宗等。

三、數(shù)字人文視野下文書檔案開發(fā)利用的策略

(一) 搭建文書檔案數(shù)字人文研究平臺,助推文書檔案的轉(zhuǎn)型升級。在數(shù)字人文視野下,文書檔案的開發(fā)利用工作應(yīng)該圍繞數(shù)字人文理念,搭建具有特色的數(shù)字人文研究平臺。平臺可以在傳統(tǒng)的檔案管理基礎(chǔ)上,通過大數(shù)據(jù)技術(shù)分析整理各類歷史檔案數(shù)據(jù)資源,從而實現(xiàn)對歷史文化資源的開發(fā)和利用。此外,文書檔案開發(fā)單位還可以將數(shù)字人文理念應(yīng)用于文書檔案開發(fā)利用工作,構(gòu)建數(shù)字人文研究平臺。數(shù)字人文檔案在技術(shù)層面可利用互聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)等技術(shù),實現(xiàn)對歷史信息的有效采集、存儲和檢索,并進(jìn)行數(shù)字化處理;對于數(shù)字人文檔案內(nèi)容,可利用數(shù)字技術(shù)將大量分散于各領(lǐng)域的文獻(xiàn)資料進(jìn)行整合,形成統(tǒng)一的研究框架。數(shù)字人文作為近幾年新興發(fā)展起來的研究領(lǐng)域,涉及人文學(xué)科多個領(lǐng)域的交叉學(xué)科,注重將傳統(tǒng)人文研究方式與現(xiàn)代科學(xué)技術(shù)相結(jié)合,實現(xiàn)對歷史文化的深度解讀。

(二)建立數(shù)字倉儲,實現(xiàn)文書檔案資源的整合與長期保存。文書檔案作為我國歷史文化的重要組成部分,是國家歷史文化的重要載體。隨著社會的發(fā)展,文書檔案數(shù)量也在不斷增加。為了避免文書檔案資源分散資源利用率低等問題,需要將文書檔案資源進(jìn)行整合并長期保存,從而更好地滿足人們對文書檔案信息資源的需求。數(shù)字倉儲作為數(shù)字人文技術(shù)的重要組成部分,能夠?qū)ξ臅鴻n案進(jìn)行統(tǒng)一管理和長期保存。利用數(shù)字倉儲技術(shù)能夠?qū)⒎稚⒃诓煌I(lǐng)域、不同單位、民間遺落的文書檔案資源進(jìn)行整合并長期保存。在整合時,可以先對文書檔案資源的類別、時間等要素進(jìn)行統(tǒng)計分析,然后根據(jù)需要制定統(tǒng)一的管理標(biāo)準(zhǔn),最后統(tǒng)一存儲和長期保存。

(三)推動項目委托,進(jìn)行文書檔案的數(shù)字人文開發(fā)。目前,我國高校和科研機(jī)構(gòu)中都設(shè)有數(shù)字人文研究中心,且已將數(shù)字人文研究中心委托給國家圖書館、中國社會科學(xué)院圖書館等單位進(jìn)行開發(fā)利用。以國家圖書館為例,該機(jī)構(gòu)每年都會組織相關(guān)領(lǐng)域的專家學(xué)者申報數(shù)字人文項目,國家圖書館還會組織相關(guān)領(lǐng)域的專家學(xué)者進(jìn)行評審。從這些申報項目可以看出,這些單位都在積極探索文書檔案的開發(fā)利用與數(shù)字人文技術(shù)結(jié)合工作,為高校教育、社會信息的獲取提供路徑。數(shù)字人文項目一般都是由特定機(jī)構(gòu)發(fā)起并完成,數(shù)字人文研究中心、圖書館、檔案館等都是主要參與者,由于我國現(xiàn)有的數(shù)字人文研究大多是以項目委托形式展開的,也就是將相關(guān)研究項目委托給科研機(jī)構(gòu),由科研機(jī)構(gòu)根據(jù)用戶需求和社會需求開展具體研究,從而推動數(shù)字人文研究的發(fā)展。對于我國文書檔案而言,由于其本身具有較強(qiáng)的穩(wěn)定性和保密性,因此在數(shù)字人文視野下開展文書檔案的開發(fā)利用工作時,可以采用項目委托的方式促進(jìn)人文檔案管理技術(shù)的升級。除此之外,對于一些大型文獻(xiàn)資源豐富的機(jī)構(gòu),可以直接將相關(guān)文獻(xiàn)資源以項目委托的形式委托給數(shù)字人文研究中心進(jìn)行開發(fā),豐富和優(yōu)化人文檔案開發(fā)模式與管理技術(shù)。

(四)加強(qiáng)教育培訓(xùn),提升文書檔案工作人員的專業(yè)素養(yǎng)。數(shù)字人文視野下,文書檔案的開發(fā)利用工作需要工作人員具有專業(yè)的知識儲備和實踐經(jīng)驗,數(shù)字人文在很大程度上依賴于工作人員對數(shù)字人文的理解和掌握程度,因此,加強(qiáng)對文書檔案工作人員的教育培訓(xùn)十分必要。在數(shù)字人文視野下,文書檔案開發(fā)工作人員要具備扎實的理論知識,熟悉數(shù)字人文技術(shù),了解文書檔案管理中涉及的相關(guān)知識和概念,掌握文書檔案管理中涉及的技術(shù)標(biāo)準(zhǔn)。具體而言,可以從以下幾方面入手:第一,加強(qiáng)對工作人員專業(yè)素養(yǎng)的培訓(xùn),提升工作人員的專業(yè)知識水平,可以通過組織系統(tǒng)學(xué)習(xí)數(shù)字人文的相關(guān)知識和理論,也可以邀請數(shù)字人文領(lǐng)域的專家為工作人員授課或組織開展專題培訓(xùn),幫助工作人員提升數(shù)字人文知識水平。第二,建立完善的教育培訓(xùn)體系??梢酝ㄟ^設(shè)置數(shù)字人文課程、邀請專家授課等方式提高工作人員對數(shù)字人文理論和方法的掌握程度;也可以通過舉辦培訓(xùn)班、研討會等形式對文書檔案管理人員進(jìn)行有針對性的教育培訓(xùn)。第三,注重對工作人員實踐能力的培養(yǎng)。文書檔案的開發(fā)利用工作涉及檔案管理、信息資源整合、數(shù)字人文技術(shù)等多方面,需要文書檔案工作人員具有一定的實踐經(jīng)驗和創(chuàng)新能力。

四、結(jié)語

綜上所述,數(shù)字人文技術(shù)的發(fā)展為文書檔案資源的開發(fā)與利用帶來了新機(jī)遇,數(shù)字人文與檔案管理的融合為文書檔案資源的開發(fā)提供了新思路?;诖?,本文從數(shù)字人文視域下文書檔案的開發(fā)與利用出發(fā),分析數(shù)字人文視域下文書檔案開發(fā)的方向,提出了相應(yīng)的發(fā)展策略,以期為之后文書檔案的開發(fā)提供思路引導(dǎo),滿足數(shù)字檔案管理工作的升級及優(yōu)化、工作人員專業(yè)能力提升、數(shù)字檔案開發(fā)技術(shù)的升級與探索等工作需要,為我國科學(xué)技術(shù)和文化發(fā)展提供良好的技術(shù)與平臺支撐。

猜你喜歡
文書人文檔案管理
人文
太行山文書精品選(17)
監(jiān)獄執(zhí)法文書規(guī)范探討
黑水城出土《宋西北邊境軍政文書》中“砲”類文書再討論
檔案管理中的電子檔案管理
檔案管理與企業(yè)內(nèi)部控制關(guān)系的思考
人文紹興
人文社科
讓人文光輝照耀未來
健康檔案管理的“云”前景