文/孔琳俊 鄒志鑫
2021 年2 月18 日,浙江省委省政府在全省數(shù)字化改革大會明確,浙江省的數(shù)字化改革要適應數(shù)字化浪潮,樹立數(shù)字意識和思維、培養(yǎng)數(shù)字能力和方法、構建數(shù)字治理體系和機制,主動引領全球數(shù)字變革的跨越。為更好地推進數(shù)字化改革,會議要求最大程度開放數(shù)據(jù)資產(chǎn),促進數(shù)據(jù)關聯(lián)應用,激發(fā)數(shù)據(jù)生產(chǎn)要素對經(jīng)濟社會的放大、疊加、倍增作用;同時,還應加快構建一體化智能化公共數(shù)據(jù)平臺,按照“統(tǒng)一規(guī)劃、統(tǒng)一支撐、統(tǒng)一架構、統(tǒng)一平臺、統(tǒng)一標準、統(tǒng)一建設、統(tǒng)一管理、統(tǒng)一運維”的要求,采用一體化數(shù)據(jù)目錄,利用公共應用支撐組件,對數(shù)據(jù)和信息進行智能分析、研判評價,推動科學決策和高效執(zhí)行。
浙江財經(jīng)大學審計大數(shù)據(jù)管理一體化系統(tǒng),正是基于學?!皵?shù)據(jù)中樞”的成功實踐而建立的。此系統(tǒng)使常態(tài)化審計數(shù)據(jù)報送機制和模式得以創(chuàng)新突破,解決了傳統(tǒng)模式下審計數(shù)據(jù)報送以人為中心的痼疾,有效提升了審計信息化工作的質量和效率。
浙江財經(jīng)大學審計數(shù)據(jù)管理一體化系統(tǒng)建設,依照2020 年浙江省教育廳提出的針對涵蓋校內20 個業(yè)務域(含教務、資產(chǎn)、圖書館、人事、科研、學工、財務、采購等)的高校審計數(shù)據(jù)報送要求,依托學校現(xiàn)有“數(shù)據(jù)中樞”建設成果,實現(xiàn)了審計數(shù)據(jù)統(tǒng)一采集、規(guī)范入庫、安全存儲,同時建立“省—高校兩級常態(tài)化”審計數(shù)據(jù)報送機制,實現(xiàn)審計數(shù)據(jù)從業(yè)務源頭采集直至報送和分析的全鏈路閉環(huán)管理。項目的總體設計思路如下:
1.依托學?,F(xiàn)有“數(shù)據(jù)中樞”進行增量開發(fā)、迭代升級。審計數(shù)據(jù)管理一體化系統(tǒng)建設是在學校現(xiàn)有新一代全域數(shù)據(jù)中心和數(shù)據(jù)治理成果的基礎上,按照審計數(shù)據(jù)上報要求,以增量開發(fā)和迭代升級的方式進行的設計。這樣可以復用學校前期在數(shù)據(jù)層面的建設成果,實現(xiàn)對現(xiàn)有數(shù)據(jù)架構的橫向擴展。系統(tǒng)在大大減輕整體開發(fā)工作量的同時,還保障了現(xiàn)有數(shù)據(jù)體系的持續(xù)運行。
2.針對不同數(shù)據(jù)來源,完成數(shù)據(jù)統(tǒng)一采集、集中管理、標準化輸出。審計數(shù)據(jù)報送覆蓋了學校20 個業(yè)務域的數(shù)據(jù),其中部分數(shù)據(jù)存在于學校的業(yè)務管理系統(tǒng),還有部分數(shù)據(jù)沒有業(yè)務管理系統(tǒng)作支撐,存于線下Excel。針對這種情況,系統(tǒng)需要對不同的數(shù)據(jù)來源采用不同的采集架構進行統(tǒng)一采集,業(yè)務數(shù)據(jù)通過“數(shù)據(jù)中樞”統(tǒng)一采集規(guī)范入庫、線下數(shù)據(jù)通過填報導入集中入庫;針對統(tǒng)一采集的數(shù)據(jù)進行集中管理,包含數(shù)據(jù)標準管理、數(shù)據(jù)模型管理等;建設審計數(shù)據(jù)標準倉庫和審計專題數(shù)據(jù)集市,對接教育廳數(shù)據(jù)接口,提供數(shù)據(jù)標準化輸出。
3.構建數(shù)據(jù)核查模型,全流程、可視化監(jiān)測數(shù)據(jù)質量。審計數(shù)據(jù)在報送前,需要對相關數(shù)據(jù)的質量進行核查。數(shù)據(jù)質量問題可分為結構性和內容性兩種情況:針對結構性數(shù)據(jù)質量問題,在數(shù)據(jù)統(tǒng)一入庫后,由“數(shù)據(jù)中樞”的相關軟件工具進行結構化清洗;針對內容性數(shù)據(jù)質量問題,需要以報表形式對待核查數(shù)據(jù)進行集中呈現(xiàn),并對數(shù)據(jù)的表間關系進行校驗,構建完善的數(shù)據(jù)核查模型,對校驗異常的數(shù)據(jù)做出提醒標識,由相關審核人員對數(shù)據(jù)內容進行瀏覽、審核、修改、確認。通過這樣一套完整的可視化的數(shù)據(jù)質量監(jiān)測閉環(huán)流程,最終生成高質量的審計數(shù)據(jù)專題庫,完成數(shù)據(jù)上報。
4.通過報表工具對審計數(shù)據(jù)進行多維可視化分析,指導學校相關決策。審計數(shù)據(jù)管理一體化系統(tǒng)除了可以完成審計數(shù)據(jù)的“采集—核驗—標準化—入庫—報送”全鏈路閉環(huán)管理工作外,還可以通過報表工具對每年度的審計數(shù)據(jù)進行多維度、深層次、可視化的分析,加強審計數(shù)據(jù)在關聯(lián)分析、趨勢預測等方面的綜合應用,切實推進審計業(yè)務的數(shù)字化轉型工作,提升學校審計部門的精準管理與科學決策水平。
基于大數(shù)據(jù)計算技術構建的數(shù)據(jù)審計核查系統(tǒng),按照數(shù)據(jù)架構層次可分為采集層、梳理層、審計核查層、審計報送層四個部分,具體如圖1 所示。
1.采集層。統(tǒng)一全量采集審計數(shù)據(jù)要求的校內各業(yè)務系統(tǒng)數(shù)據(jù)源、線下電子表格數(shù)據(jù)以及文件文本類非結構化數(shù)據(jù),并針對不同類型的數(shù)據(jù)源,采用不同的采集架構。同時,考慮到常態(tài)化的審計數(shù)據(jù)報送工作要求,采集方式可配置為全量或增量兩種模式。通過采集層將業(yè)務數(shù)據(jù)1:1集中至數(shù)據(jù)全量集中庫,該全量庫是基于Hadoop 的大數(shù)據(jù)存儲架構,支持分布式部署,且支持多種類型的數(shù)據(jù)源種類。
2.梳理層。本層是審計數(shù)據(jù)資產(chǎn)化管理的重要層級,可以幫助實現(xiàn)數(shù)據(jù)的審計標準化、結構性質量提升和數(shù)據(jù)結構整合。將數(shù)據(jù)按照審計數(shù)據(jù)報送要求整合后進行統(tǒng)一存儲,以方便后續(xù)的查詢和分析。標準數(shù)據(jù)倉庫作為數(shù)據(jù)集中存儲、整合的核心,幫助實現(xiàn)數(shù)據(jù)的融合共享,可避免系統(tǒng)間數(shù)據(jù)的重復存儲和加工。審計專題集市庫主要存儲基于標準數(shù)據(jù)倉庫提供的原始數(shù)據(jù)和衍生數(shù)據(jù),根據(jù)審計數(shù)據(jù)報送的業(yè)務需求進行相應的加工處理,并提供所需的結果數(shù)據(jù)。
3.審計核查層。通過大數(shù)據(jù)可視化分析平臺,將審計專題集市庫里面的結果數(shù)據(jù)進行可視化核查界面開發(fā),方便審計人員對數(shù)據(jù)內容進行審計核查。如果有內容性數(shù)據(jù)質量問題,審計人員可以將其及時反饋到數(shù)據(jù)源頭部門進行數(shù)據(jù)修正。審核通過完成后,數(shù)據(jù)會流轉至審計定稿庫,該庫中的數(shù)據(jù)結構與審計數(shù)據(jù)報送要求的數(shù)據(jù)結構完全一致。同時,該層還會產(chǎn)生一份當年的歷史數(shù)據(jù)備份,并置于審計歷史數(shù)據(jù)庫中,以便歷史數(shù)據(jù)留存和后續(xù)查閱。還可通過該平臺對整合后的數(shù)據(jù)進行深度分析,采用不同方式對數(shù)據(jù)處理結果進行展現(xiàn),包括固定報表、多維分析、靈活查詢等。
4.審計報送層。根據(jù)審計數(shù)據(jù)報送要求,定制開發(fā)輕量級API 接口、文本上傳、數(shù)據(jù)庫直連等方式,支持數(shù)據(jù)上報業(yè)務。
浙江財經(jīng)大學審計數(shù)據(jù)管理一體化系統(tǒng)的總體功能分為五大模塊,分別為業(yè)務系統(tǒng)數(shù)據(jù)采集模塊、數(shù)據(jù)填報模塊、數(shù)據(jù)倉庫管理模塊、數(shù)據(jù)集市模塊,以及數(shù)據(jù)報表模塊,具體設計如圖2 所示。
圖2 系統(tǒng)總體功能模塊
一是業(yè)務系統(tǒng)數(shù)據(jù)采集模塊。主要完成對學校業(yè)務管理系統(tǒng)中的數(shù)據(jù)進行統(tǒng)一采集匯聚,包含接口管理、存儲管理、任務調度管理等功能。
1.接口管理,是對業(yè)務系統(tǒng)數(shù)據(jù)采集的自定義接口、開發(fā)者接口的管理,具體包括:自定義接口模塊用于對創(chuàng)建的ETL接口進行管理,可展示當前已創(chuàng)建的ETL接口情況,支持根據(jù)接口名稱/描述、接口類型、接口狀態(tài)對ETL 接口進行檢索;開發(fā)者接口模塊用于對開發(fā)者創(chuàng)建的接口進行管理,可展示當前全部開發(fā)者創(chuàng)建的接口信息,支持根據(jù)開發(fā)者名稱進行檢索。
2.存儲管理,支持對已接入數(shù)據(jù)的存儲過程進行管理,支持根據(jù)存儲過程名稱、描述說明、數(shù)據(jù)庫類型進行檢索。
3.任務調度管理,可對當前的數(shù)據(jù)采集調度任務進行管理,支持創(chuàng)建、分類、刪除采集接口任務,支持按調度名稱、關聯(lián)接口名稱、調度類型、調度狀態(tài)進行檢索;同時還支持通過日志查看接口任務運行狀態(tài)詳情。
二是數(shù)據(jù)填報模塊。主要完成針對沒有業(yè)務管理系統(tǒng)支撐的線下Excel 數(shù)據(jù)的統(tǒng)一填報、導入與管理,包含數(shù)據(jù)源管理、數(shù)據(jù)表管理、用戶管理等功能。
1.數(shù)據(jù)源管理,主要完成數(shù)據(jù)填報模塊的數(shù)據(jù)源管理功能,目前支持MySQL、MsSQL、Oracle 等結構化數(shù)據(jù)庫,可直觀展現(xiàn)數(shù)據(jù)源當前的連接狀態(tài)和連接信息,并支持快速檢索。
2.數(shù)據(jù)表管理,是數(shù)據(jù)填報模塊最主要的功能,支持用戶按照統(tǒng)一制訂的數(shù)據(jù)規(guī)范、數(shù)據(jù)標準導入Excel 電子表格文件數(shù)據(jù);并支持用戶在線填報與編輯數(shù)據(jù)(實時保存至數(shù)據(jù)庫,無需擔心數(shù)據(jù)丟失),也可下載至本地編輯,然后上傳至數(shù)據(jù)庫中進行統(tǒng)一存儲管理。
3.用戶管理,主要實現(xiàn)對用戶權限的管理,支持為不同的用戶分配不同的操作權限,包括數(shù)據(jù)查看、編輯以及刪除;并能滿足多人協(xié)同工作的業(yè)務需求,可以將同一張表的不同字段賦予不同用戶以不同的編輯權限,編輯權限包括增刪改查等功能。
三是數(shù)據(jù)倉庫管理模塊。主要包括數(shù)據(jù)標準管理、數(shù)據(jù)模型管理以及數(shù)據(jù)質量管理3 個子模塊。
1.數(shù)據(jù)標準管理,用以規(guī)范審計數(shù)據(jù)的結構和格式,以實現(xiàn)數(shù)據(jù)的準確性和一致性,包含標準檢索、代碼集管理、編碼規(guī)則管理等功能。標準檢索是通過輸入關鍵字的方式,在審計數(shù)據(jù)標準信息項中快速匹配出相應的標準細項,用戶依據(jù)需求在結果中瀏覽明細,程序通過算法記憶搜索熱詞,減少檢索操作的復雜程度。代碼集管理用以將審計數(shù)據(jù)要求的各類代碼集進行統(tǒng)一管理,可以被公共屬性、數(shù)據(jù)集市清單的字段引用,在查看綁定了代碼集的字段時,支持查看或下載綁定的代碼集。編碼規(guī)則管理用以對按照設定規(guī)則自動生成的編碼規(guī)則進行管理,編碼規(guī)則可以和審計數(shù)據(jù)的公共屬性進行綁定,對實體表中的數(shù)據(jù)進行檢測,查看數(shù)據(jù)是否符合審計數(shù)據(jù)編碼規(guī)則的標準。
2.數(shù)據(jù)模型管理,審計數(shù)據(jù)管理一體化系統(tǒng)建設的核心目標是打通數(shù)據(jù)孤島,構建符合教育廳標準的、統(tǒng)一的審計數(shù)據(jù)倉庫。數(shù)據(jù)模型管理模塊提供數(shù)據(jù)模型相關可視化建模功能,采用自上而下和自下而上相結合的方法進行模型設計,輔助設計標準化的審計數(shù)據(jù)模型,包含數(shù)據(jù)模型管理、數(shù)據(jù)模型設計、實體表管理等功能。數(shù)據(jù)模型管理支持審計數(shù)據(jù)模型的歷史版本管理,實現(xiàn)數(shù)據(jù)模型建設全過程的流程化和透明化,可以對不同版本的模型進行比對,查看變更明細,輔助審計人員對不同版本的模型進行管理,并可回溯到任意節(jié)點的模型設計狀態(tài),強化模型管控能力;數(shù)據(jù)模型設計根據(jù)審計數(shù)據(jù)標準,進行標準化的數(shù)據(jù)模型設計,確保從源頭上保證數(shù)據(jù)的一致性。實體表管理是在數(shù)據(jù)模型建立后,需要在標準的審計數(shù)據(jù)倉庫中生成數(shù)據(jù)實體表,實體表管理功能用于對數(shù)據(jù)模型生成的實體表進行管理,可展示當前通過數(shù)據(jù)模型生成的實體表列表。
3.數(shù)據(jù)質量管理,為了實現(xiàn)對審計數(shù)據(jù)質量的全面管理及智能監(jiān)控,可通過數(shù)據(jù)質量管理模塊中的“規(guī)則設置”,完成相關數(shù)據(jù)質量檢核規(guī)則的設定,之后可將這些規(guī)則與需要質量檢查的數(shù)據(jù)對象進行綁定,完成對數(shù)據(jù)的質量檢測,主要包含對數(shù)據(jù)質量規(guī)則、報告進行管理等功能。數(shù)據(jù)質量規(guī)則管理可以對審計數(shù)據(jù)的質量檢測規(guī)則進行配置,支持對多種數(shù)據(jù)結構性質量檢測規(guī)則的創(chuàng)建,包括值域規(guī)則、枚舉規(guī)則、正則規(guī)則以及唯一性規(guī)則等。數(shù)據(jù)質量報告管理,主要是在數(shù)據(jù)質量檢測后,可定期生成數(shù)據(jù)質量報告,通過豐富多樣的圖標展示形式,進行多維度的統(tǒng)計,使得枯燥的數(shù)據(jù)質量更加形象生動,幫助各部門對其負責的相關數(shù)據(jù)的質量建立統(tǒng)一認識視角,為提升審計數(shù)據(jù)的質量情況尋找優(yōu)化空間,為制定質量提升方案提供依據(jù)和指導。
四是數(shù)據(jù)集市模塊。審計標準數(shù)據(jù)倉庫作為數(shù)據(jù)集中存儲、整合的核心,可以實現(xiàn)數(shù)據(jù)的融合共享,避免系統(tǒng)間數(shù)據(jù)重復存儲和加工。數(shù)據(jù)集市模塊可形成審計專題集市庫,主要存儲基于標準數(shù)據(jù)倉庫提供的原始數(shù)據(jù)和衍生數(shù)據(jù),并根據(jù)審計數(shù)據(jù)報送的業(yè)務需求進行相應的加工處理,提供所需的結果數(shù)據(jù),并完成數(shù)據(jù)報送。此模塊包含數(shù)據(jù)集市清單、部門數(shù)據(jù)目錄、數(shù)據(jù)開放管理等功能。
五是數(shù)據(jù)報表模塊。為滿足審計數(shù)據(jù)的統(tǒng)計分析需要,保證報送數(shù)據(jù)的準確性、可信性,數(shù)據(jù)報表模塊支持將審計數(shù)據(jù)集市中的上報數(shù)據(jù)通過報表的形式進行可視化展示;支持對報表之間有關聯(lián)關系的字段進行校驗,對校驗異常的數(shù)據(jù)有提醒、標識等機制;支持對報表數(shù)據(jù)進行瀏覽、審核與確認。同時,可通過報表工具對審計數(shù)據(jù)進行多維度統(tǒng)計分析,讓審計數(shù)據(jù)活起來,用以指導學校的相關決策。
2020 年底,審計數(shù)據(jù)管理一體化系統(tǒng)在兼顧安全性、準確性的前提下,順利支撐浙江財經(jīng)大學14 個職能部門,完成涉及27 個業(yè)務系統(tǒng)、59 張表、約900項、1200 萬條審計數(shù)據(jù)信息的定期報送。作為浙江省教育領域數(shù)字化改革第一批創(chuàng)新試點項目,審計數(shù)據(jù)報送一體化系統(tǒng)與學校“新一代全域數(shù)據(jù)中心”的融合,豐富了學校數(shù)字跨場景應用,進一步推進了學校的數(shù)字化改革,也為浙江省高校審計數(shù)據(jù)管理業(yè)務數(shù)字化改造提供借鑒思路。
1.以“數(shù)據(jù)中樞”為系統(tǒng)支撐。學校建設的審計數(shù)據(jù)管理一體化系統(tǒng),本質上不是一個獨立的新建系統(tǒng),相反,為了避免單一系統(tǒng)“煙囪式”管理的弊端,系統(tǒng)從頂層規(guī)劃上依托學校全域數(shù)據(jù)中心,對數(shù)據(jù)中樞平臺做橫向功能擴展,建設數(shù)據(jù)填報和數(shù)據(jù)報表模塊。系統(tǒng)在學校前期全量數(shù)據(jù)治理成果的基礎上,實現(xiàn)學校審計數(shù)據(jù)統(tǒng)一采集、規(guī)范入庫、安全存儲、審計核查、集中報送、統(tǒng)計分析。
2.以“用”促“管”。學校數(shù)據(jù)層面的建設,在完成數(shù)據(jù)基座和管理體系搭建的同時,也提升了用戶對數(shù)據(jù)建設成果的感知度。從某種意義上講,教育廳審計數(shù)據(jù)上報工作,提供了一個非常典型的數(shù)據(jù)應用場景,實現(xiàn)了審計數(shù)據(jù)“采集—核驗—標準化—入庫—報送”的全鏈路閉環(huán)管理。通過這樣典型的數(shù)據(jù)應用,可以反向促進學校數(shù)據(jù)管理能力的提升。同時,該建設模式可以較快復用于其他應用場景,目前已覆蓋學校思政、黨建、學工等應用場景。
3.管服結合,數(shù)字賦能。該系統(tǒng)將管理與服務相結合,除完成數(shù)據(jù)管理工作外,還將進一步提升服務能力,利用統(tǒng)一的可視化平臺,對審計數(shù)據(jù)進行多維度、深層次、可視化分析;系統(tǒng)通過對數(shù)據(jù)的質量分析以及跨部門數(shù)據(jù)的關聯(lián)分析,做到“讓數(shù)據(jù)說真話”,及時掌握學校業(yè)務運行的整體情況,找到業(yè)務中的薄弱環(huán)節(jié)并加以改進,以數(shù)字賦能審計業(yè)務的數(shù)字化改革工作。
在整個系統(tǒng)建設推進工作中,既取得了較大進展和突破,同時也遇到了一些難點與挑戰(zhàn),主要有以下幾個方面:
1.審計數(shù)據(jù)歸屬部門的確認。浙江省教育廳審計數(shù)據(jù)報送覆蓋了學校20 個核心業(yè)務域的數(shù)據(jù),包括人事、教務、資產(chǎn)、學工、一卡通、采購、科研、財務、招生、就業(yè)、繼續(xù)教育、出國管理、校園交通管理、宿舍管理系統(tǒng)等。確認這些數(shù)據(jù)的歸屬部門和系統(tǒng),包括哪些數(shù)據(jù)來源于哪個部門、哪個系統(tǒng)(或者還沒有管理系統(tǒng)進行數(shù)據(jù)線上維護)、線下數(shù)據(jù)導入與填報、又由誰進行數(shù)據(jù)權責認領等等,是一項非常復雜的工作,需要從組織架構上成立工作專班對全校各部門進行統(tǒng)籌協(xié)調,才能有效推進該項工作的開展。
2.審計數(shù)據(jù)標準模型的建立。審計數(shù)據(jù)標準模型的建立工作,在學?,F(xiàn)有“數(shù)據(jù)中樞”體系下,基于現(xiàn)有校級數(shù)據(jù)標準,需要按照教育廳審計數(shù)據(jù)標準規(guī)范進行標準化字段轉換與映射,這部分工作量非常龐大,需要技術部門人力和平臺工具的有效支撐。
3.“數(shù)據(jù)中樞”能力的橫向擴展。審計數(shù)據(jù)管理一體化系統(tǒng)是依托于學校的“數(shù)據(jù)中樞”進行的增量開發(fā)、迭代升級,新增建設的數(shù)據(jù)填報模塊、數(shù)據(jù)報表模塊需要在原有“數(shù)據(jù)中樞”能力架構上,進行橫向功能擴展,既需要滿足審計數(shù)據(jù)管理的要求,又要保持和原有數(shù)據(jù)體系的一致性。這對系統(tǒng)的開發(fā)建設提出了不小的挑戰(zhàn),包括產(chǎn)品功能兼容性設計、數(shù)據(jù)安全性設計、用戶權限體系搭建等各方面。