国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

檔案信息智能化利用:從數(shù)字化到數(shù)據(jù)化

2023-09-06 08:24:03陸國強(qiáng)橫店集團(tuán)控股有限公司檔案館
浙江檔案 2023年5期
關(guān)鍵詞:檔案管理利用數(shù)字化

陸國強(qiáng)/橫店集團(tuán)控股有限公司檔案館

在計算機(jī)科學(xué)和互聯(lián)網(wǎng)技術(shù)迅猛發(fā)展的工業(yè)3.0社會,新一代的信息技術(shù)在生產(chǎn)生活領(lǐng)域的應(yīng)用不斷深入,促使社會生活及不同行業(yè)的生產(chǎn)組織方式、工作流程等都發(fā)生了重大變革?!吨腥A人民共和國國民經(jīng)濟(jì)和社會發(fā)展第十四個五年規(guī)劃和2035年遠(yuǎn)景目標(biāo)綱要》中指出:“加快數(shù)字化發(fā)展,建設(shè)數(shù)字中國”“以數(shù)字轉(zhuǎn)型整體驅(qū)動生產(chǎn)方式、生活方式和治理方式的變革”[1]。這表明中共中央國務(wù)院在戰(zhàn)略上高度重視社會的數(shù)字化轉(zhuǎn)型與新時代背景下的數(shù)字化建設(shè),各行業(yè)的數(shù)字化轉(zhuǎn)型工作是建設(shè)中國特色社會主義現(xiàn)代化的重要組成部分。與此同時,檔案數(shù)字化建設(shè)也開始被廣泛關(guān)注,《“十四五”全國檔案事業(yè)發(fā)展規(guī)劃》指出:“新一代信息技術(shù)廣泛應(yīng)用,檔案工作環(huán)境、對象、內(nèi)容發(fā)生巨大變化,迫切要求創(chuàng)新檔案工作理念、方法、模式,加快全面數(shù)字轉(zhuǎn)型和智能升級?!盵2]由此可見,檔案工作的數(shù)字化轉(zhuǎn)型是數(shù)字中國建設(shè)的必然要求。同時也是檔案管理事業(yè)進(jìn)一步發(fā)展的必由之路。在檔案管理的對象和方式發(fā)生巨變的情況下,怎樣在數(shù)字化建設(shè)的基礎(chǔ)上,進(jìn)一步提高檔案資源利用效率,怎樣將大數(shù)據(jù)、區(qū)塊鏈、云計算等互聯(lián)網(wǎng)技術(shù)整合統(tǒng)一進(jìn)檔案數(shù)據(jù)化管理,以實現(xiàn)檔案資源數(shù)據(jù)化利用、轉(zhuǎn)存和共享等,是我們亟需思考的問題。學(xué)者趙躍認(rèn)為大數(shù)據(jù)背景下檔案管理數(shù)據(jù)化是檔案數(shù)字化的新階段,認(rèn)為“檔案數(shù)據(jù)化”是檔案部門以用戶、業(yè)務(wù)需要為導(dǎo)向,將數(shù)字檔案資源轉(zhuǎn)換為可閱讀、分析和處理的檔案數(shù)據(jù)資源的過程[3];學(xué)者王小云提出檔案信息與檔案載體以數(shù)據(jù)化表達(dá)形成分離,從而實現(xiàn)檔案信息的確定性、獨(dú)立性以及可交換性,檔案數(shù)據(jù)化是檔案信息價值進(jìn)一步被挖掘的前提[4]。各位學(xué)者對檔案數(shù)據(jù)化的具體定義不盡相同,就學(xué)界對檔案數(shù)據(jù)化研究的共識而言,檔案數(shù)據(jù)化對新形勢新時代背景下的檔案工作轉(zhuǎn)型與發(fā)展都有著重要的意義。

筆者認(rèn)為檔案數(shù)字化轉(zhuǎn)型在面對新興計算機(jī)技術(shù)的背景下,對檔案資源進(jìn)行數(shù)據(jù)化處理,降低檔案數(shù)據(jù)的顆粒度,是檔案數(shù)字化建設(shè)的發(fā)展方向。在梳理檔案的數(shù)字化與數(shù)據(jù)化概念的聯(lián)系和區(qū)別的基礎(chǔ)上,本文嘗試分析檔案數(shù)據(jù)化過程中的難點(diǎn)和堵點(diǎn),并提出檔案數(shù)據(jù)化的策略與建議,以促進(jìn)檔案信息資源的深度開發(fā),推動檔案管理現(xiàn)代化事業(yè)的高質(zhì)量發(fā)展。

1 檔案的數(shù)字化與數(shù)據(jù)化

數(shù)字化概念自20世紀(jì)90年代被提出來[5],經(jīng)過30多年的發(fā)展,檔案管理的數(shù)字化轉(zhuǎn)型建設(shè)已經(jīng)取得了長足的進(jìn)步。以浙江省為例:自“數(shù)字浙江”建設(shè)開展以來,全省檔案館貫徹落實 “檔案登記備份戰(zhàn)略”,開展室藏重要檔案數(shù)字備份,目前全省已完成80% 以上存量館藏檔案數(shù)字化。全面開展政務(wù)服務(wù)等重點(diǎn)領(lǐng)域的電子化歸檔工作,提出政務(wù)大數(shù)據(jù)歸檔管理的基本思路和實施路徑,研發(fā)部署全省政務(wù)數(shù)據(jù)歸檔交換平臺,同時接入各類業(yè)務(wù)系統(tǒng)(含浙江政務(wù)服務(wù)網(wǎng)和市統(tǒng)建的政務(wù)服務(wù)網(wǎng))221個,其中接入省級平臺34個,目前累計電子歸檔達(dá)1億件[6]。由此可見,檔案數(shù)字化工作主要可以分成兩個部分內(nèi)容:一是對已形成的紙質(zhì)檔案的數(shù)字化轉(zhuǎn)換及對正在形成的文件的電子化歸檔,建立檔案目錄數(shù)據(jù)庫和檔案全文檢索數(shù)據(jù)庫;二是針對檔案管理工作的各個環(huán)節(jié)的數(shù)字化改造。

檔案管理的根本目的是實現(xiàn)更好地利用檔案資源中的海量信息,為領(lǐng)導(dǎo)決策、社會各方面提供有效利用服務(wù)提供輔助。數(shù)字化管理一體化平臺及檔案資源管理的數(shù)字化建設(shè)的逐步推進(jìn),將是實現(xiàn)檔案資源利用從傳統(tǒng)的紙媒閱讀利用轉(zhuǎn)變?yōu)榫?xì)數(shù)據(jù)利用的基礎(chǔ)[7]。檔案數(shù)據(jù)化的核心在于進(jìn)一步細(xì)化電子化檔案的信息顆粒度,使得信息顆粒度重組為計算機(jī)可識別語義的精細(xì)化數(shù)據(jù),目的在于充分挖掘和利用數(shù)字化的檔案信息資源。

檔案數(shù)字化轉(zhuǎn)型過程中針對檔案資源的數(shù)字化提法,實際上采用的是“二進(jìn)制語言數(shù)據(jù)”的定義,將原有的檔案資源利用OCR文字識別技術(shù)將紙質(zhì)檔案的文字內(nèi)容轉(zhuǎn)換成數(shù)字化版本,同時進(jìn)行元數(shù)據(jù)的著錄;而檔案數(shù)據(jù)化概念本身還有數(shù)值型數(shù)據(jù)、原料型數(shù)據(jù)和結(jié)構(gòu)化數(shù)據(jù)的區(qū)別[8]。檔案數(shù)據(jù)化是對檔案數(shù)字化更進(jìn)一步的細(xì)分,核心要素是利用計算機(jī)技術(shù)連同數(shù)據(jù)科學(xué)降低檔案信息的顆粒度,解決傳統(tǒng)檔案管理過程中 “粗放”“碎片化”“信息單一”等問題,并在實現(xiàn)智能化管理精細(xì)化信息資源的同時,由原來的邏輯型數(shù)據(jù)庫提供簡單的信息查閱、利用方式,轉(zhuǎn)變?yōu)橛上嚓P(guān)性主導(dǎo)的大數(shù)據(jù)關(guān)聯(lián)模式。

可見,檔案數(shù)字化概念有廣義和狹義之分。廣義的檔案數(shù)字化涵蓋檔案數(shù)字化和檔案數(shù)據(jù)化,不同的階段有不同的側(cè)重。狹義的檔案數(shù)字化是形成數(shù)字化檔案的過程,數(shù)字化檔案只是檔案數(shù)字形式復(fù)制品,而檔案數(shù)據(jù)化是檔案管理部門面對人工智能時代的精準(zhǔn)化、智能化服務(wù)需求,致力于解決檔案內(nèi)容信息碎片化問題,構(gòu)建多元主體協(xié)同參與的檔案數(shù)據(jù)生態(tài),推動粗粒度檔案文檔服務(wù)向細(xì)粒度、智能化檔案數(shù)據(jù)服務(wù)轉(zhuǎn)型。

2 推進(jìn)檔案數(shù)據(jù)化的難點(diǎn)

就檔案管理數(shù)字化建設(shè)的成果來看,當(dāng)前的檔案管理數(shù)字化主要集中在檔案資源由原來的傳統(tǒng)載體轉(zhuǎn)變?yōu)閿?shù)字載體,檔案的收集、管理由傳統(tǒng)的紙媒文件收集保管轉(zhuǎn)變?yōu)殡娮游臋n的自動收集歸檔,但在對已實現(xiàn)的數(shù)字化檔案資源利用方面,并沒有取得突破性的進(jìn)展。問題主要集中在還未實現(xiàn)計算機(jī)可讀、可理解的數(shù)據(jù)粒度層級管理與開發(fā),尤其是研究型用戶全面多元的利用需求仍無法被滿足[9]。我們說,檔案數(shù)據(jù)化是檔案數(shù)字化建設(shè)中的“高級階段”,而檔案資源數(shù)字化后要實現(xiàn)數(shù)據(jù)化利用,則關(guān)鍵在于如何降低數(shù)字檔案的信息顆粒度,實現(xiàn)計算機(jī)可識別,這是推進(jìn)檔案數(shù)據(jù)化工作,實現(xiàn)檔案利用朝精細(xì)化、智能化方向發(fā)展的難點(diǎn)和堵點(diǎn)。目前要推動檔案數(shù)據(jù)化工作,主要面臨以下困境:

2.1 新形勢與傳統(tǒng)檔案管理思維的沖突

傳統(tǒng)的檔案管理思維主要強(qiáng)調(diào)“收得齊、管得好”,小而全的傳統(tǒng)檔案思維延伸出檔案開放問題決策上的保守傾向,對于數(shù)據(jù)化利用來說,檔案資源的開放是智能化利用的前提和基礎(chǔ)。此外,由于長久以來的檔案管理工作過多地強(qiáng)調(diào)檔案的保密性,檔案的開放與共享容易受到“多做多錯,封閉安全”的保守思維的影響,因此“怎么用”這一環(huán)節(jié)似乎只停留在檔案查閱和編研階段。然而在數(shù)據(jù)化時代中,海量的檔案都是可被串聯(lián)成具有相關(guān)性的信息資源,可以做到檔案信息利用的“精確化”和“智能化”。

2.2 技術(shù)支撐不足,復(fù)合型人才缺乏

現(xiàn)有的檔案數(shù)字化工作主要依賴于OCR文字識別技術(shù),但由于年代、個人字跡、語言習(xí)慣、語種、印刷方式等等諸多原因的影響,OCR識別成功率雖然一直在穩(wěn)步提高,但實際上仍有一些無法被識別的文件需要人工轉(zhuǎn)譯。其次是對其他載體,例如照片、錄音、圖像等傳統(tǒng)概念中已經(jīng)“數(shù)字化”的檔案進(jìn)行數(shù)據(jù)化提取的難度較大,甚至可以說,并沒有一個普遍適用的方案可以解決這一問題。再次,對已形成的數(shù)字化檔案進(jìn)行歸檔過程如何保證電子檔案的“四性”,主要是真實性、完整性、可用性、安全性等,如何使用技術(shù)手段進(jìn)行保證,似乎有許多方案,但究竟哪種方案更好,更具有一般性,更值得推廣,并沒有定論。同時對已實現(xiàn)數(shù)字化的檔案資源,數(shù)字化向數(shù)據(jù)化轉(zhuǎn)換程度較低,數(shù)據(jù)化利用程度不高。要進(jìn)行數(shù)據(jù)化利用,原有的以檔案邏輯關(guān)系為主導(dǎo)的數(shù)據(jù)庫并不能做到檔案信息的智能化管理和利用。這一困境反映出的更深層的問題在于,客觀上檔案管理人員普遍存在學(xué)歷水平還不夠高,學(xué)術(shù)背景單一等問題,對于高學(xué)歷和擁有計算機(jī)科學(xué)、數(shù)據(jù)科學(xué)背景的檔案管理人才嚴(yán)重缺乏,在技術(shù)和發(fā)展?jié)摿ι铣钢鈾n案數(shù)據(jù)化工作的推進(jìn)。

2.3 統(tǒng)籌依賴嚴(yán)重,自我推進(jìn)動力不足

政策導(dǎo)向和檔案事業(yè)管理規(guī)劃一直是檔案事業(yè)發(fā)展的重要動力。盡管在宏觀層面上,國家對“數(shù)字化”建設(shè)足夠重視,2021年《“十四五”全國檔案事業(yè)發(fā)展規(guī)劃》上指明“檔案信息化建設(shè)進(jìn)一步融入數(shù)字中國建設(shè),新一代信息技術(shù)在檔案工作中的應(yīng)用更為廣泛,信息化與檔案事業(yè)各項工作深度融合,檔案管理數(shù)字化、智能化水平得到提升,檔案工作基本實現(xiàn)數(shù)字轉(zhuǎn)型?!比欢绾握嬲龑崿F(xiàn)檔案資源數(shù)據(jù)化、智慧化利用,國家層面缺乏頂層設(shè)計、統(tǒng)籌安排和政策引導(dǎo),各級各類檔案館對于推進(jìn)檔案數(shù)字化缺乏積極性與主動性。從檔案管理數(shù)據(jù)化推進(jìn)工作來說,管理決策層缺乏對檔案數(shù)據(jù)化建設(shè)的認(rèn)識,對檔案管理數(shù)據(jù)化的人力物力支持都比較薄弱。因此,檔案管理部門在數(shù)據(jù)化建設(shè)上存在起步晚、起點(diǎn)低、發(fā)展動力不足等困境。

3 推進(jìn)檔案數(shù)據(jù)化的策略

面對檔案管理新形勢下產(chǎn)生的新問題,就要用新思維新技術(shù)去解決。筆者認(rèn)為主要可從“思維轉(zhuǎn)變”“技術(shù)利用”“政策引領(lǐng),項目推進(jìn)”等角度嘗試推進(jìn)檔案數(shù)據(jù)化工作。

3.1 檔案管理思維轉(zhuǎn)變

要推進(jìn)檔案數(shù)據(jù)化工作,首先要求檔案工作者摒棄不敢開放的保守思維和“小而全”的資源獨(dú)占思維,推動“存取”思維向“開發(fā)”思維的轉(zhuǎn)變、數(shù)字化思維向數(shù)據(jù)化思維的轉(zhuǎn)變[10]。著眼于數(shù)據(jù)時代的社會需求與用戶需求的變化,通過數(shù)據(jù)化以及智慧檔案建設(shè)來推進(jìn)檔案開放利用的深度與廣度,提升檔案業(yè)務(wù)工作智能化水平,面向未來、面向社會積極尋求新的職能拓展與服務(wù)轉(zhuǎn)型,這就要求檔案管理部門在掌握海量檔案資源的基礎(chǔ)上,將原先的“存取”思維優(yōu)先轉(zhuǎn)換成“開發(fā)”思維,這是檔案資源進(jìn)行數(shù)據(jù)化利用的第一步。其次,對于已經(jīng)開展數(shù)字化工作并取得一定成績的檔案管理部門,要著眼于檔案“數(shù)字化”向“數(shù)據(jù)化”利用思維的轉(zhuǎn)變,可以說檔案資源的數(shù)據(jù)化利用是順應(yīng)社會發(fā)展潮流,符合檔案管理科學(xué)發(fā)展規(guī)律的必然趨勢。

3.2 政策引領(lǐng)與項目推進(jìn)并重

在我國檔案事業(yè)改革與轉(zhuǎn)型的十字路口,國家檔案局等各級檔案事業(yè)管理部門需要對檔案數(shù)據(jù)化的發(fā)展前景有清晰的認(rèn)識,統(tǒng)籌推進(jìn)全國智慧檔案建設(shè)工作。建立健全檔案數(shù)字化建設(shè)標(biāo)準(zhǔn),出臺實施細(xì)則。同時,地方基層檔案機(jī)構(gòu)也要努力尋求檔案工作與大數(shù)據(jù)戰(zhàn)略以及智慧社會發(fā)展的融合,通過一時一地的具體項目數(shù)字化建設(shè)和數(shù)據(jù)化應(yīng)用契機(jī),推動檔案數(shù)據(jù)化建設(shè)進(jìn)程,實現(xiàn)宏觀上跟著政策走,具體實踐過程中也有充分的發(fā)展動力。

3.3 人才興檔與技術(shù)應(yīng)用

一方面要積極尋求復(fù)合型檔案管理人才,檔案管理人員的學(xué)科背景最好結(jié)合計算機(jī)科學(xué)、互聯(lián)網(wǎng)技術(shù)與數(shù)據(jù)科學(xué)等理工學(xué)科。通過相應(yīng)的學(xué)科特點(diǎn)發(fā)揮檔案管理數(shù)據(jù)化建設(shè)的積極性。通過人才集聚效應(yīng),爭取管理部門對檔案數(shù)據(jù)化建設(shè)的重視,獲得更多的財政支持。由人才帶動,政策引領(lǐng)的方式形成“破圈”效應(yīng),不僅要在檔案管理學(xué)界破圈,更要將檔案數(shù)據(jù)化利用后的檔案精細(xì)檢索、智能檢索推向社會各行業(yè),在多方面形成良性循環(huán)互助推動。一方面,地方檔案館要充當(dāng)排頭兵,將檔案數(shù)據(jù)化工作過程中形成的可行推進(jìn)路徑規(guī)范化,形成編寫檔案數(shù)據(jù)化標(biāo)準(zhǔn)與指南的參考案例。另一方面,要通過人才建設(shè)的方式,引入新興技術(shù)以解決檔案工作中現(xiàn)有的難題。例如針對傳統(tǒng)的數(shù)據(jù)庫服務(wù)器在面對增量巨大存量日增的檔案數(shù)據(jù)時出現(xiàn)的依賴網(wǎng)絡(luò)帶寬、資源調(diào)動速度緩慢、物理數(shù)據(jù)中心維護(hù)成本過高、現(xiàn)有的OCR文字識別技術(shù)無法有效降低檔案數(shù)據(jù)顆粒度等問題,可以引入云計算、區(qū)塊鏈、人工智能和大數(shù)據(jù)相關(guān)技術(shù)。通過整合一系列新興技術(shù),不僅在檔案信息的安全保密基礎(chǔ)上實現(xiàn)檔案數(shù)據(jù)化利用,而且可以進(jìn)一步實現(xiàn)“智慧檔案”管理,更可以根據(jù)需要快速啟動檔案資源,節(jié)約存儲成本以及共享難度,并且通過整合檔案數(shù)據(jù)后形成數(shù)據(jù)湖,依靠大數(shù)據(jù)技術(shù)實現(xiàn)對現(xiàn)有檔案數(shù)據(jù)進(jìn)行條目之間的相關(guān)性分析、項目可行性分析、更精準(zhǔn)地預(yù)計投入產(chǎn)出比等,真正做到精細(xì)化智能化利用檔案數(shù)據(jù),對單位決策提供幫助。

總的來說,檔案數(shù)字化轉(zhuǎn)型與數(shù)據(jù)化建設(shè)各有側(cè)重點(diǎn),檔案數(shù)字化注重檔案的基礎(chǔ)工作環(huán)節(jié)的數(shù)字化轉(zhuǎn)變,而檔案數(shù)據(jù)化則更強(qiáng)調(diào)對檔案資源的數(shù)據(jù)化分析利用。未來是“數(shù)據(jù)為王”的時代,隨著計算機(jī)技術(shù)的快速發(fā)展,對檔案資源的數(shù)據(jù)化利用是檔案管理事業(yè)跟上時代潮流的必由之路,也是檔案管理事業(yè)發(fā)展的必然要求。因此,針對當(dāng)前存在的三大困境:思維保守、技術(shù)落后、發(fā)展動力不足等,本文從宏觀角度提出了相應(yīng)的策略,為檔案事業(yè)管理部門提供參考,以期檔案管理部門能抓住轉(zhuǎn)型與改革的契機(jī),推動檔案資源數(shù)據(jù)化進(jìn)程,實現(xiàn)創(chuàng)新檔案管理技術(shù)和服務(wù)的智能化,數(shù)字檔案資源數(shù)據(jù)化,最終實現(xiàn)檔案資源利用成果最大化。

猜你喜歡
檔案管理利用數(shù)字化
利用min{a,b}的積分表示解決一類絕對值不等式
家紡業(yè)亟待數(shù)字化賦能
利用一半進(jìn)行移多補(bǔ)少
高中數(shù)學(xué)“一對一”數(shù)字化學(xué)習(xí)實踐探索
高中數(shù)學(xué)“一對一”數(shù)字化學(xué)習(xí)實踐探索
檔案管理中的電子檔案管理
利用數(shù)的分解來思考
Roommate is necessary when far away from home
檔案管理與企業(yè)內(nèi)部控制關(guān)系的思考
數(shù)字化制勝
洪江市| 光泽县| 凌云县| 柞水县| 甘孜| 盐边县| 手机| 资源县| 乌鲁木齐县| 迁西县| 尉氏县| 华蓥市| 满城县| 九江市| 柘城县| 罗源县| 公主岭市| 逊克县| 泰来县| 嘉荫县| 蒲城县| 双桥区| 广饶县| 丰宁| 苍溪县| 四子王旗| 昆明市| 棋牌| 萍乡市| 郁南县| 恭城| 尚义县| 汤原县| 涡阳县| 衡阳县| 梁河县| 永善县| 武冈市| 云浮市| 象山县| 乌兰浩特市|