摘 要:檔案信息化建設(shè)已經(jīng)進入了數(shù)據(jù)化時代,大數(shù)據(jù)背景下檔案管理逐步實現(xiàn)模式精細化、服務(wù)精準化、檔案資源共享化、檔案價值數(shù)智化。目前,加快檔案數(shù)據(jù)化轉(zhuǎn)型的過程中,還面臨著存量檔案數(shù)字化識別開發(fā)水平低、增量檔案重復(fù)性保存資源浪費大、檔案網(wǎng)絡(luò)綜合性利用水平待提高的問題,需要在加強頂層規(guī)劃,建立數(shù)字賦能檔案管理體制機制,加強檔案資源整合、檔案共享平臺建設(shè)、數(shù)字人文賦能,搭建反饋機制等方面加以改進。
關(guān)鍵詞:大數(shù)據(jù);檔案信息化;數(shù)字賦能
基于大數(shù)據(jù)時代帶來的深刻變化,傳統(tǒng)的檔案管理模式已經(jīng)無法滿足實際的工作需要,各種信息、數(shù)據(jù)的作用越來越大,為信息化建設(shè)指引了發(fā)展的方向。隨著信息化進程的加快,管理的安全性問題、系統(tǒng)體系和制度不夠健全的問題等也越來越突出。為了有效處理相關(guān)問題,最大限度地降低或者消除這些問題帶來的不良影響,要在加強頂層規(guī)劃等方面下功夫。
1 大數(shù)據(jù)背景下檔案信息化的新特征
1.1 管理模式精細化
隨著云計算、區(qū)塊鏈等新技術(shù)的廣泛應(yīng)用,以紙質(zhì)檔案管理的傳統(tǒng)模式已經(jīng)落后于時代發(fā)展,檔案管理逐步進入了“單套制”管理階段。目前,檔案信息化的建設(shè)仍然處于初級階段,計算機工具主義的作用凸顯,檔案信息處于孤立狀態(tài),沒有形成固定單元,檔案信息的挖掘未達到更高層次。檔案數(shù)據(jù)的井噴式增長是檔案信息化的必然結(jié)果,也是需要提升的關(guān)鍵點。讓檔案管理工作在大數(shù)據(jù)技術(shù)的幫助下進行,不僅可以讓海量的數(shù)據(jù)信息集成有效,也可以更好地服務(wù)于大眾。在收集檔案時,“大數(shù)據(jù)”技術(shù)也可以按照篩選要求,過濾掉無用的數(shù)據(jù)信息,不僅可以對大量檔案資源進行收納和聚集,也對其進行分類化、秩序化管理;在存儲檔案時,“大數(shù)據(jù)”技術(shù)可以存儲海量結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù),形成數(shù)據(jù)持久層;在使用數(shù)據(jù)時,“大數(shù)據(jù)”技術(shù)對于檔案的信息挖掘可以使檔案的儲存與查找更有效率。
1.2 服務(wù)模式精準化
信息化打破傳統(tǒng)檔案管理的孤島模式,實現(xiàn)跨館查詢、遠程訪問、即時利用,檔案服務(wù)進入全新模式。大數(shù)據(jù)技術(shù)能夠基于用戶需要和習(xí)慣識別,打造個性化的檔案服務(wù)。搭建技術(shù)賦能管理模式從用戶需求出發(fā),改變以往的閱覽、展示、咨詢等被動工作模式。新型的數(shù)字體驗服務(wù)管理模式,了解用戶的習(xí)慣和想法,構(gòu)建檔案智慧平臺,利用數(shù)據(jù)挖掘、新媒體服務(wù)、精準推送等方式切實高效、有針對性地解決用戶問題,提高用戶認可度。由此可見,“大數(shù)據(jù)”優(yōu)勢在于提高對數(shù)據(jù)的優(yōu)化和整合能力,通過優(yōu)化和整合實現(xiàn)數(shù)據(jù)的增值。“大數(shù)據(jù)”從可視化分析、數(shù)據(jù)挖掘、預(yù)測性分析、語義分析、數(shù)據(jù)質(zhì)量管理等方面,對看似無關(guān)聯(lián)的各門類檔案數(shù)據(jù)進行關(guān)聯(lián)、萃取和分析,實現(xiàn)檔案資源與用戶需求的雙向控制達到最優(yōu)化,使檔案服務(wù)模式走向精細化。
1.3 檔案資源共享化
大數(shù)據(jù)時代,云計算為數(shù)字檔案信息的跨行業(yè)、跨地域、跨時間提供了新的選擇模式[1]。云計算和大數(shù)據(jù)是相輔相成的,辦公自動化和信息化的迅速發(fā)展,使亟待處理的電子檔案數(shù)據(jù)與日俱增[2],云計算為海量數(shù)據(jù)資源提供了大量的存儲空間,而大數(shù)據(jù)的目的是對海量數(shù)據(jù)進行較好的分析、計算和處理。云計算技術(shù)的廣泛應(yīng)用,也使數(shù)字檔案資源的儲存進入新模式,突破了空間限制。通過搭建檔案資源系統(tǒng)“云平臺”,可以將搜集的檔案數(shù)字信息存儲在該平臺,相關(guān)信息數(shù)據(jù)通過安全保護網(wǎng)絡(luò)和身份認證實現(xiàn)異地查詢使用,使得查詢利用不再受存儲能力等限制,隨時隨地都可以查詢,極大節(jié)約了人力物力,提升了檔案利用的滿意度。依托云計算構(gòu)建不同級別的共享空間或平臺可以提供在線式服務(wù)和交互式信息,從而可使檔案知識服務(wù)的功能得到加強[3]。
1.4 檔案價值數(shù)智化
大數(shù)據(jù)技術(shù)對檔案資料數(shù)據(jù)進行識別、規(guī)范、整合和再造,構(gòu)架基于數(shù)據(jù)庫模式的大數(shù)據(jù)分析模型,以相關(guān)查詢、趨勢分析、可視化圖片等形式展現(xiàn)和分析。依托檔案管理大數(shù)據(jù)平臺,根據(jù)資料類型和用戶需求,系統(tǒng)能夠自動聚焦于數(shù)據(jù)挖掘和價值分析,實現(xiàn)分析、描述、指導(dǎo)、預(yù)測、開發(fā)等功能,為用戶提供更有效的參考決策,使檔案管理從被動走向了主動,一定程度上實現(xiàn)智能化自動決策。如某個部門可通過數(shù)據(jù)分析技術(shù)進行用戶市場預(yù)測,同時構(gòu)建用戶畫像和用戶關(guān)系圖,實現(xiàn)精準服務(wù)。此外,以智慧化的服務(wù)增強用戶體驗,可以提高用戶決策的精準度,發(fā)揮檔案資源輔助能力,提升用戶的參與度和幸福感。
2 檔案數(shù)字化轉(zhuǎn)型的問題及原因分析
“加強數(shù)字社會、數(shù)字政府建設(shè),提升公共服務(wù)、社會治理等數(shù)字化智能化水平”是新時代做好檔案工作的要求。加快檔案數(shù)字化轉(zhuǎn)型是信息化技術(shù)突飛猛進的必然要求,也是檔案工作更好資政育人、展現(xiàn)檔案價值的必由之路,將推動檔案治理體系和治理能力現(xiàn)代化。近年來,我國在檔案數(shù)字化轉(zhuǎn)型取得長足進步,但仍存在如下諸多問題。
2.1 檔案數(shù)字化整體水平不高
國家檔案局有關(guān)統(tǒng)計數(shù)據(jù)顯示,2021年全國館藏檔案數(shù)字化成果1.9萬TB。但是由于各館藏數(shù)量體積龐大[4],而且主要以文本、圖片的形式存儲,占用了較大的信息存儲單元,數(shù)字化識別開發(fā)難度較大。從現(xiàn)狀來看,檔案內(nèi)容識別的準確率不高,存儲單元不夠,影響著檔案資源的查詢、開發(fā)和利用。主要包括:一是數(shù)據(jù)重復(fù)復(fù)制率高。個別缺乏責任感的外包服務(wù)商或崗位工作人員將數(shù)據(jù)復(fù)制充數(shù),這種追求數(shù)量而不顧及質(zhì)量的做法,在目前普遍采用人工抽檢的模式下,給業(yè)主方及外包服務(wù)商在數(shù)據(jù)質(zhì)量方面埋下了諸多隱患。二是影像傾斜合格率和影像裁剪合格率不高。中標服務(wù)企業(yè)在數(shù)字化過程中,作業(yè)的設(shè)備在所難免發(fā)生顛簸,質(zhì)量檢查崗位人員也無法張張頁頁檢查到位,裁剪崗位人員對裁剪值和分辨數(shù)值難以統(tǒng)一把握,完全憑個人主觀判斷,致使后期驗收過程中不達標和返工,來回地辦理領(lǐng)取搬運原始數(shù)據(jù)核對、修正等工作,也相應(yīng)增加了相關(guān)方的管理投入和成本支出。
2.2 紙質(zhì)檔案重復(fù)數(shù)字化浪費嚴重
目前,“單套制”的管理和推廣已經(jīng)積累了一定的經(jīng)驗,但是電子文件“單套制”模式對信息化軟硬件的要求較高,同時也面臨著系統(tǒng)安全、身份識別等問題,經(jīng)驗推廣需要一定的周期。同時,大部分黨政機關(guān)單位還依然延續(xù)過去的辦公習(xí)慣,公文流轉(zhuǎn)中使用紙質(zhì)文件,導(dǎo)致了既有電子文件的存儲,后期還會對紙質(zhì)文件再數(shù)字化,造成了資源的浪費。主要原因是管理理念未能向現(xiàn)代管理方式轉(zhuǎn)變,沒有根據(jù)檔案管理實際和技術(shù)變革改變管理方式。檔案資料形成過程中,也存在收集重復(fù)的問題,比如在某些檔案的審批過程中,會涉及審批前的論證、審批中的批復(fù)、審批后的監(jiān)管等資料,為了全面準確反映事實,需要對這些資料進行系統(tǒng)的整理,但是資料又是分散不系統(tǒng)的,在形成檔案后,既有整理后歸檔的部分,也有零散部分,存在重復(fù)性管理的格局。
2.3 檔案資源開發(fā)利用水平有待提升
檔案數(shù)字化轉(zhuǎn)型要著眼于為全社會提供高效的信息服務(wù),雖然目前單就檔案工作服務(wù)方式而言已經(jīng)基本實現(xiàn)網(wǎng)絡(luò)化,但由于對檔案資源的開發(fā)利用不足、協(xié)同性和共享性不夠、被動式服務(wù)本質(zhì)并未明顯改善等,導(dǎo)致基于網(wǎng)絡(luò)等信息化共享平臺的檔案資源綜合性利用水平不高,難以滿足新時期用戶高效化、知識化和個性化需求[5]。有的部門共享推進緩慢,造成了專業(yè)檔案就無法下沉一線,無法讓數(shù)據(jù)“跑路”代替群眾“跑腿”,影響了檔案利用的時效。專業(yè)檔案館、民生檔案跨館查詢程度不夠,還未形成高效的服務(wù)。對檔案開放主體來說,開放鑒定工作滯后,對檔案的開放內(nèi)容未樹立嚴謹?shù)墓ぷ骼砟?,無法最大限度滿足單位和個人不斷擴大的查檔需求。
3 大數(shù)據(jù)時代檔案管理信息化的路徑選擇
在當前5G技術(shù)和大數(shù)據(jù)信息技術(shù)的驅(qū)動下,檔案信息和用戶需求總量明顯上升,充分利用數(shù)字技術(shù),能夠減少煩瑣流程和工作環(huán)節(jié),實現(xiàn)檔案管理的轉(zhuǎn)型升級。
3.1 加強頂層規(guī)劃,建立數(shù)字賦能檔案管理體制機制
3.1.1積極融入國家數(shù)字戰(zhàn)略。要因地制宜、實事求是,根據(jù)信息化進程,爭取上級和主管部門數(shù)字戰(zhàn)略的政策支持。加強組織領(lǐng)導(dǎo),出臺指導(dǎo)性的文件和政策標準,助推信息化建設(shè)數(shù)字化轉(zhuǎn)型。比如浙江省檔案管理部門就主動融入省戰(zhàn)略,檔案工作數(shù)字轉(zhuǎn)型納入政府數(shù)字型轉(zhuǎn)型的方案。
3.1.2摸清底數(shù),有序推進。評估檔案數(shù)字化程度,主要看是否達到《“十四五”全國檔案事業(yè)發(fā)展規(guī)劃》的要求和電子文件歸檔要求,要評估現(xiàn)有設(shè)備的承載程度是否能適應(yīng)云計算、區(qū)塊鏈、人工智能的發(fā)展。比如,數(shù)字化轉(zhuǎn)型中,高性能服務(wù)器、大容量存儲和備份設(shè)備,以及操作系統(tǒng)、高可靠性的信息安全系統(tǒng)、數(shù)據(jù)庫管理系統(tǒng)等都是不可缺少的必備條件。
3.1.3健全保障體系建設(shè)。完善檔案信數(shù)字化建設(shè)體系和規(guī)范,對數(shù)字化操作流程、技術(shù)規(guī)范、保密要求等各方面出臺指導(dǎo)標準;加強對數(shù)據(jù)庫、數(shù)字人文、多媒體技術(shù)的綜合運用,推廣建設(shè)集約高效的檔案數(shù)字化平臺,為檔案數(shù)字化轉(zhuǎn)型提供科技基礎(chǔ)條件。
3.2 加強檔案資源整合,打通數(shù)據(jù)孤島
檔案館館藏資源數(shù)字化是將檔案資源原有的文本、影像、圖表的固態(tài)形式,經(jīng)過數(shù)字技術(shù)加工處理轉(zhuǎn)換成電子檔案和數(shù)據(jù)。常用的技術(shù)形式是人工智能的通用層技術(shù):機器人、圖譜識別、語音識別、自然語言處理、語義關(guān)聯(lián)、專家系統(tǒng)等。通過這些技術(shù)手段助力檔案資源整合,可以極大提高工作效率,還可以將檔案資源融入各類數(shù)據(jù)庫的資源系統(tǒng)。如影視影像數(shù)據(jù)庫、專業(yè)檔案數(shù)據(jù)庫、自然科學(xué)數(shù)據(jù)庫、社會科學(xué)數(shù)據(jù)庫等。
開放資源整合是指收集政府機關(guān)、社會團體、個人(包括社交媒體、新聞媒介、文化系統(tǒng))的數(shù)據(jù)服務(wù)平臺的檔案資源,打造能夠滿足不同用戶興趣偏好、個性需求的多領(lǐng)域數(shù)據(jù)資源庫,打破“信息孤島”,形成“數(shù)據(jù)湖”。這些數(shù)據(jù)資源的整合極大地增加了檔案體量,提升了檔案服務(wù)質(zhì)效果,使檔案服務(wù)更加有精準性,提升檔案用戶服務(wù)體驗,但整合數(shù)據(jù)資源需要面對與多部門合作的困難,因此要同步強化安全技術(shù)管控,確保檔案信息安全。
3.3 加強檔案共享平臺建設(shè),推進信息互聯(lián)互通
檔案平臺技術(shù)化以數(shù)字技術(shù)為支撐,依賴于信息軟件、人工智能、大數(shù)據(jù)等信息技術(shù)。要實現(xiàn)檔案科學(xué)化管理,搭建技術(shù)化平臺是檔案數(shù)據(jù)化管理工作的前提,建立檔案部門與數(shù)據(jù)管理部門系統(tǒng)發(fā)展機制,依托地域大數(shù)據(jù)平臺,制定統(tǒng)一的數(shù)據(jù)模式、接口標準、查詢規(guī)則,打造協(xié)同化、區(qū)域化、安全化的數(shù)據(jù)對接和共享模式。技術(shù)賦能應(yīng)用到各項檔案工作中,從而提升檔案服務(wù)的精準性和便利性。打造檔案信息區(qū)域共享體系,建設(shè)數(shù)據(jù)互聯(lián)、共享開發(fā)、綜合利用的公共檔案資源數(shù)據(jù)服務(wù)平臺,構(gòu)建全方位、全覆蓋的服務(wù)體系。比如,通過云計算、大數(shù)據(jù)技術(shù)建立檔案精準服務(wù)云平臺,減少人工成本,實現(xiàn)跨行業(yè)、跨地域的查詢利用。尤其在智慧檢索、模糊查詢等方面,能夠提供既快速、又準確的檔案服務(wù)。
3.4 數(shù)字人文賦能,提升檔案利用實效
虛擬智慧引導(dǎo),通過人工智能、3D掃描、虛擬/增強現(xiàn)實等優(yōu)勢,深度分析館內(nèi)檔案資源及用戶服務(wù)數(shù)據(jù),構(gòu)建虛擬時空的畫面,打破空間限制,充分滿足用戶的需求??蓪⒌乩硇畔⒖茖W(xué)、歷史史料與文獻內(nèi)容相匹配整合,使檔案中所載的歷史事件生動“再現(xiàn)”和被“體驗”。將經(jīng)度、緯度等地理方位信息嵌入某一檔案事件發(fā)生地的地名和年代中,并對其進行系統(tǒng)編碼和模擬,實現(xiàn)地名與歷史事件及背景的關(guān)聯(lián)。交互式推送是堅持遵循用戶需求的原則,構(gòu)建基于用戶喜好的對應(yīng)服務(wù)模式,為用戶提供后臺信息服務(wù),實現(xiàn)多元雙向的信息交互。精準把握用戶需求是建立在完善可靠的數(shù)字化深度算法基礎(chǔ)上的,利用數(shù)字人工智能技術(shù),提升服務(wù)的質(zhì)量和針對性,滿足不同知識水平、偏好、習(xí)慣的用戶個性化需要,持續(xù)性提高檔案智慧服務(wù)提供了堅實基礎(chǔ)。
3.5 搭建反饋機制,優(yōu)化系統(tǒng)服務(wù)
反饋與評價是指數(shù)字賦能檔案管理模式需要通過服務(wù)后評價,實現(xiàn)平臺系統(tǒng)自動更新,根據(jù)用戶反饋內(nèi)容不斷提升各項檔案服務(wù)水平。服務(wù)反饋與評價主要是面向檔案服務(wù)對象,對檔案智慧服務(wù)的資源內(nèi)容、個性化的體驗感等方面及時做出反饋,運用數(shù)字化算法進行總結(jié)。改進與優(yōu)化是數(shù)字化技術(shù)在嵌入檔案管理工作中發(fā)揮系統(tǒng)自動更新優(yōu)化的過程,自動收集用戶的反饋與評價內(nèi)容,在總結(jié)分析后進行智能優(yōu)化升級,通過實現(xiàn)檔案管理服務(wù)的良性循環(huán),吸引更多的用戶。自動優(yōu)化過程能夠篩選用戶感興趣的資源內(nèi)容、區(qū)分資源類別、過濾吸引力較差的資源,不斷提升檔案用戶服務(wù)的精準度和滿意度。
結(jié)語
數(shù)字賦能檔案管理模式為檔案管理工作帶來變革性影響,將數(shù)字技術(shù)嵌入檔案管理工作,構(gòu)建數(shù)字賦能檔案管理模式,能夠智慧性地滿足用戶對檔案的需求,實現(xiàn)檔案工作的升級轉(zhuǎn)型。在保證檔案信息安全性的前提下,改變傳統(tǒng)檔案工作中技術(shù)落后、效率低下等問題,在檔案管理工作中發(fā)揮重要影響力。
參考文獻
[1]馮占江,郭妙英.大數(shù)據(jù)時代的數(shù)字檔案管理思維[J].辦公室業(yè)務(wù),2019(02):05.
[2]秦美峰.云計算服務(wù)在數(shù)字檔案館中應(yīng)用途徑探析[J].網(wǎng)友世界,2013(04):30.
[3]關(guān)于進一步推進我國檔案數(shù)字化轉(zhuǎn)型及綜合利用的提案[J].中國檔案,2022(03):30.
作者簡介:牛麗(1973— ),山東省德州生態(tài)環(huán)境監(jiān)測中心綜合室主任副研究館員,研究方向:檔案管理。