李軼昶 林空/浙江省檔案館
黨的十八大以來,以習近平同志為核心的黨中央高度重視數(shù)字化發(fā)展,作出了一系列重大部署,擘畫了數(shù)字中國建設(shè)的宏偉藍圖?!丁笆奈濉比珖鴻n案事業(yè)發(fā)展規(guī)劃》明確:加強大數(shù)據(jù)、人工智能等新一代信息技術(shù)在數(shù)字檔案館(室)建設(shè)中的應用,推動數(shù)字檔案館(室)建設(shè)優(yōu)化升級。
檔案數(shù)據(jù)化生存與數(shù)據(jù)檔案化管理日益明顯,檔案工作環(huán)境、內(nèi)容、模式發(fā)生深刻調(diào)整,迫切要求檔案事業(yè)“數(shù)智化”蛻變。2020年,浙江省檔案館正式啟動省檔案數(shù)據(jù)中心建設(shè)項目,建設(shè)的主要內(nèi)容包括檔案數(shù)據(jù)共享服務和檔案業(yè)務智慧治理兩方面,全面開啟以“數(shù)智”為目標的數(shù)字檔案館向檔案智能化管理系統(tǒng)的迭代升級。
利用先進的計算機技術(shù),加強系統(tǒng)集成、管理集成、技術(shù)集成,優(yōu)化檔案接收征集、檔案資源管理、檔案開發(fā)利用等方面的工作流程,加強內(nèi)部管理協(xié)同,促進檔案實體管理和檔案數(shù)據(jù)管理一體化、智能化,檔案業(yè)務流程自動化、可留痕。在檔案接收征集方面,加強檔案接收工作過程管理、檔案數(shù)字復制件質(zhì)量檢測、實體入庫過程管理等工作的智能化;在檔案資源管理方面,加強全宗、目錄、涉密篩查等智能化;在檔案開發(fā)利用方面,優(yōu)化調(diào)卷、自助查檔、外借審批、智能編研等應用。著力推動檔案工作與大數(shù)據(jù)、人工智能等新一代信息技術(shù)深度融合,實現(xiàn)檔案服務創(chuàng)新性變革,助力數(shù)字檔案館建設(shè)從“數(shù)字”向“數(shù)智”的目標邁進。
迭代升級后的檔案智能化管理系統(tǒng)整體采用“3+2”的架構(gòu)設(shè)計,“3”是前置接收子系統(tǒng)、長久保存子系統(tǒng)和數(shù)字檔案館子系統(tǒng)共行支撐檔案資源收管存用的全方位管理;“2”是檔案資源治理和檔案業(yè)務治理并重形成全新的檔案館管理體系。
2.1.1 前置接收子系統(tǒng)。前置接收子系統(tǒng)部署在館內(nèi)政務外網(wǎng),與部署在政務云上的接收系統(tǒng)進行對接,通過接口實現(xiàn)電子檔案的在線接收與移交,是電子檔案的“總收發(fā)室”。
2.1.2 長久保存子系統(tǒng)。長久保存子系統(tǒng)用于保存原始存檔信息包和數(shù)字檔案館系統(tǒng)中轉(zhuǎn)換為長期保存格式后形成的返回信息包,以ZIP包為管理單位進行長久保存管理,采用可信時間戳、數(shù)據(jù)保全、OFD 格式轉(zhuǎn)換等技術(shù)策略,優(yōu)化數(shù)據(jù)監(jiān)測、監(jiān)管和保真功能,做到實時檢測、實時預警、實時保全,真正實現(xiàn)檔案資源的存、用分離。
2.1.3 數(shù)字檔案館子系統(tǒng)。數(shù)字檔案館子系統(tǒng)結(jié)合工作人員與查檔用戶長期使用的實際情況提出的意見建議,作了大量的適用性改造和優(yōu)化,各項功能進一步滿足開展數(shù)字檔案資源移交、接收、整理、編目、審核、管理、保存、編研、利用、統(tǒng)計等工作的需要。
2.2.1 檔案資源治理體系。為實現(xiàn)檔案實體管理和檔案數(shù)據(jù)管理一體化、智能化的目標,打造檔案資源治理體系。順應浙江省數(shù)字化改革的大趨勢,結(jié)合浙江省檔案館實際需求,既考慮傳統(tǒng)檔案數(shù)字化成果的管理利用問題,又充分考慮電子文件歸檔、電子檔案移交、接收、保存和共享利用的規(guī)定與流程,著力打造存量數(shù)字化和增量電子化并重的檔案資源治理體系。
2.2.2 檔案業(yè)務治理體系。為實現(xiàn)檔案業(yè)務流程自動化、可留痕的目標,打造檔案業(yè)務治理體系。以“定準核心業(yè)務—確定業(yè)務模塊—拆解業(yè)務單元—梳理業(yè)務事項—確定業(yè)務流程—明確協(xié)同關(guān)系—建立指標體系—匯總數(shù)據(jù)需求”為路徑,從梳理館內(nèi)核心業(yè)務出發(fā),逐層拆解到最具體最基本的單元,以各職能處室為主體,逐一明確業(yè)務流程的數(shù)據(jù)指標,實現(xiàn)事項的標準化、數(shù)字化。
3.1.1 新增AI輔助開放審核功能,采用NLP技術(shù)結(jié)合專家訓練和機器學習,探索AI輔助檔案開放審核核心算法引擎,從成熟的審核樣本中尋找規(guī)律,并運用這些規(guī)律對各類檔案的內(nèi)容價值進行判斷,作為檔案人員審核的參考,在一定程度上統(tǒng)一開放審核標準,從而有效提高開放審核工作效率;開發(fā)正文拆分模塊,針對開放審核時認定全文中部分不能開放的內(nèi)容,可以對全文進行拆分,生成新的全文進行開放,利用和導出時,可只導出可以開放的部分;開發(fā)復審理由記錄功能,工作人員可以記錄敏感詞庫和規(guī)則庫中不存在的詞條,并在人工審定后將規(guī)則和敏感詞增加到規(guī)則庫和敏感詞庫中;預警提醒功能也能同時對到期需要開放審核的館藏檔案進行開放審核提醒。
3.1.2 新增檔案多維分類管理功能,通過定義檔案數(shù)據(jù)標簽并對館藏檔案進行賦值標簽的操作,對館藏檔案添加自定義標簽進行分類,打破傳統(tǒng)數(shù)字檔案館檔案管理的固有模式,對復雜檔案數(shù)據(jù)資源進行簡易化統(tǒng)計、篩選、加工、沉淀,通過可視化線索分析精準定位,實現(xiàn)海量檔案數(shù)據(jù)資源的多維分類管理,為后續(xù)的工作提供更有力的支撐。
3.1.3 新增系統(tǒng)糾錯功能,工作人員或查檔用戶可以在日常的查檔用檔過程中發(fā)現(xiàn)錯誤,并上報錯誤,以便系統(tǒng)數(shù)據(jù)管理員對錯誤數(shù)據(jù)進行修改,不斷提高館藏檔案的數(shù)據(jù)質(zhì)量。
3.2.1 優(yōu)化全文搜索功能,在基于關(guān)鍵字搜索全文內(nèi)容的基礎(chǔ)上新增音視頻檢索,采用人臉識別技術(shù),在視頻檔案存儲過程中,檢測提取人臉,建立視頻人臉庫,支持“1vN”人臉庫信息檢測,關(guān)聯(lián)視頻所在事件文本信息,打破視頻文件傳統(tǒng)存儲模式,打造“視頻+音頻+文字+人臉+目錄”創(chuàng)新存儲模式,加速視頻文件內(nèi)容的快速檢索利用。
3.2.2 新增檔案編研功能,采用NLP技術(shù)探索建設(shè)檔案智能檢索場景,形成檔案知識圖譜,建立檔案編研“中央廚房化”,初步探索檔案智能挖掘、檔案智能檢索、檔案智能關(guān)聯(lián)等檔案利用新模式,并支持多人同時在線編研。
3.3.1 新增流程管理功能,根據(jù)檔案資源管理收管存用的總體要求對檔案接收(含實體檔案接收、數(shù)字化成果接收、電子檔案接收等)、檔案開放審核、檔案查閱、館藏檔案數(shù)字化掃描、檔案修復、檔案數(shù)轉(zhuǎn)模、檔案征集編研、檔案展覽等核心業(yè)務流程進行拆解重組、逐項明確,每項流程均涵蓋任務制定、任務執(zhí)行、任務完成等環(huán)節(jié),形成閉環(huán)式管理,所有環(huán)節(jié)按需定制功能點,適應多部門、多應用、多業(yè)務場景的需求。
浙江省檔案館檔案智能化管理系統(tǒng)迭代升級明細表
3.3.2新增流程監(jiān)控中心功能,記錄流程管理模塊中所有業(yè)務流程流轉(zhuǎn)的系統(tǒng)日志,并根據(jù)日志中記錄的返回狀態(tài)來實時監(jiān)控各流程實例的全流程周期,包括待辦監(jiān)控、隊列監(jiān)控、消息監(jiān)控、接口監(jiān)控、緩存監(jiān)控等,通過視圖可快速查看當前異常流程、告警信息,可供管理人員快速發(fā)現(xiàn)問題,定位問題,實現(xiàn)流程的執(zhí)行全過程管理和監(jiān)控。同時集成核心業(yè)務完成情況的統(tǒng)計及工作量統(tǒng)計的功能。
優(yōu)化用戶權(quán)限管理模式,以“用戶—角色”替代“用戶—模塊”權(quán)限控制方式。多年實踐經(jīng)驗表明,檔案智能化管理系統(tǒng)中的用戶(主要指工作人員)數(shù)量眾多且工作崗位經(jīng)常變動應該,這就增加了權(quán)限授權(quán)管理的難度,通過根據(jù)調(diào)研核心業(yè)務流程建立的《智能化管理系統(tǒng)模塊角色對應表》和《智能化管理系統(tǒng)權(quán)限分配表》,引入角色(與特定業(yè)務工作流程相關(guān)的一個功能模塊集合)這一中介,實現(xiàn)了用戶與功能模塊的邏輯分離,采用“用戶—角色”的權(quán)限控制方式。當用戶改變工作崗位時只需進行角色的撤銷和重新分配即可。采用這種權(quán)限控制方式的優(yōu)勢在于,從系統(tǒng)管理員的視角來看,管理用戶對應的角色代替用戶對應的功能模塊,權(quán)限管理的壓力減??;從用戶視角來看,無需了解自己在系統(tǒng)所需使用的功能模塊,而只需要定位自己的業(yè)務流程中的角色,系統(tǒng)的學習成本降低。
以館內(nèi)核心業(yè)務流程重塑為基礎(chǔ),從單向以檔案數(shù)字資源的收管存用驅(qū)動發(fā)展為“檔案資源+檔案業(yè)務”雙向驅(qū)動的檔案智能化管理模式,將傳統(tǒng)線下業(yè)務和以數(shù)字檔案館為載體的線上業(yè)務相結(jié)合,實現(xiàn)數(shù)字環(huán)境下檔案業(yè)務工作的流程自動化、可留痕。
在館藏檔案高數(shù)字化率(突破90%)的基礎(chǔ)上,轉(zhuǎn)而關(guān)注館藏檔案的“數(shù)據(jù)化”工作。通過數(shù)字檔案資源的“數(shù)據(jù)化”,打破版式文檔、圖片、音頻、視頻等數(shù)字檔案資源格式對計算機理解檔案內(nèi)容的限制,實現(xiàn)維度跨越與知識互通,實現(xiàn)檔案價值從數(shù)據(jù)向信息乃至知識的躍升。
將大數(shù)據(jù)、人工智能等信息技術(shù)應用在數(shù)字檔案資源建設(shè)中,推動檔案數(shù)據(jù)化與智能化之間緊密融合,檔案數(shù)據(jù)與智能技術(shù)相互嵌入。以AI輔助開放審核、輔助音視頻檔案管理利用,建設(shè)檔案編研“中央廚房化”、檔案多維分類管理等,實現(xiàn)檔案管理和利用層面的技術(shù)賦能與能力提升,充分延伸檔案價值空間。
檔案智能化管理系統(tǒng)的核心在于云計算、大數(shù)據(jù)、人工智能等信息技術(shù)在數(shù)字檔案資源建設(shè)中的應用,數(shù)據(jù)化與智能化之間緊密融合,檔案數(shù)據(jù)與智能技術(shù)相互嵌入。前文所提到的場景諸如AI輔助開放審核、AI輔助音視頻檔案管理利用、檔案編研“中央廚房化”、檔案多維分類管理等很大程度上依賴于數(shù)字檔案資源“數(shù)據(jù)化”程度,可以說,數(shù)字檔案資源“數(shù)據(jù)化”的數(shù)量和質(zhì)量決定了這些場景的應用前景。
隨著現(xiàn)代信息技術(shù)的廣泛應用,檔案館從傳統(tǒng)的手工管理模式逐步走向數(shù)字化、智能化、智慧化,檔案服務也從被動接待走向主動提供和推送檔案信息的新境界。迭代升級后的檔案智能化管理系統(tǒng)將繼續(xù)通過自然語言處理、音頻轉(zhuǎn)譯、人臉識別等技術(shù)對館藏檔案數(shù)據(jù)進行聚合處理,實現(xiàn)檔案管理系統(tǒng)的互通融合、檔案信息資源的深度挖掘,全方位滿足用戶個性化、精準化、知識化的檔案利用需求。