葛佳歡 楊淑峰 徐歡歡
摘要:隨著信息化的不斷發(fā)展,數(shù)據(jù)作為人工智能和大數(shù)據(jù)的核心要素,將對教育領(lǐng)域發(fā)展帶來深刻影響,如何使用和管理數(shù)據(jù)成為已成為當前學校信息化建設(shè)的重點和難點。文章以臺州科技職業(yè)學院為例,探索如何在數(shù)字化改革背景下深化校園數(shù)據(jù)治理,力求營造校園數(shù)據(jù)治理生態(tài),推動學校各領(lǐng)域的數(shù)字化改革工作。
關(guān)鍵詞:數(shù)字化改革;數(shù)據(jù)治理;數(shù)據(jù)目錄
中圖法分類號:TP311文獻標識碼:A
Exploration of deepening campus data governance underbackground of digital reform
—Taking 'Taizhou Vocational College of Science& Technology as an example
GE Jiahuan,YANGShufeng,XUHuanhuan
(Taizhou Vocational College of Science&.Technology,Taizhou,Zhejiang 318020,China)
Abstract:With the continuous development of informatization, data , as the core element of artificialintelligence and big data , will have a profound impact on the development of the education field.Howto use and manage data has become a key difficulty in the current school informatization construction.Taking Taizhou Vocational College of Science&.Technology as an example,this paper explores how todeepen campus data governance in the context of digital reform , striving to create a campus datagovernanceecosystem,and promoting digital reform in various fields of the school.
Key words: digital reform,data governance,data directory
1 引言
2021年3月15日,教育部發(fā)布的《教育部關(guān)于加強新時代教育管理信息化工作的通知》提道,推動教育決策由經(jīng)驗驅(qū)動向數(shù)據(jù)驅(qū)動轉(zhuǎn)變,提高教育數(shù)據(jù)管理水平。隨后,浙江省也印發(fā)《浙江省教育領(lǐng)域數(shù)字化改革工作方案》《2021年浙江省教育領(lǐng)域數(shù)字化改革工作要點》的通知,指出數(shù)據(jù)是現(xiàn)代教育體系建設(shè)過程中的重要生產(chǎn)要素和核心驅(qū)動力。由此可見,數(shù)據(jù)在學校的信息化發(fā)展過程中占據(jù)了越來越重要的地位。隨著數(shù)據(jù)容量的快速積累、數(shù)據(jù)質(zhì)量和運算能力的不斷提高,如何使用和管理數(shù)據(jù)已成為教育領(lǐng)域的一個重要課題[1]。
2 存在的問題
目前,大部分高職院校在“十三五”期間已初步完成了“數(shù)字化校園平臺”建設(shè),建立了基礎(chǔ)數(shù)據(jù)庫,數(shù)據(jù)的容量也越來越大。隨著業(yè)務(wù)數(shù)據(jù)的不斷積累,學校對數(shù)據(jù)管理的要求越來越高,相應(yīng)的弊端也逐漸顯現(xiàn)。以臺州科技職業(yè)學院為例,目前數(shù)據(jù)管理主要存在四個問題。
2.1 數(shù)據(jù)缺乏統(tǒng)一標準
學校擁有眾多信息管理系統(tǒng),各個系統(tǒng)數(shù)據(jù)標準不統(tǒng)一,各自為政,“信息孤島”仍然存在,沒有形成定義明確、格式統(tǒng)一、職責明確的數(shù)據(jù)標準。部門之間存在數(shù)據(jù)重復(fù)、數(shù)據(jù)混亂現(xiàn)象,導(dǎo)致跨部門數(shù)據(jù)交換共享困難。比如,“在校生統(tǒng)計”分為“在籍(包括休學、參軍)”“在校(真正在學校上學的學生,還可能包括成教學生)”“在籍在?!睅追N類型,各個部門關(guān)注的重點不一樣,就會形成不同的定義,最后統(tǒng)計的數(shù)據(jù)相互之間就會有出入,造成數(shù)據(jù)不統(tǒng)一。
2.2 數(shù)據(jù)質(zhì)量不高
前期信息系統(tǒng)建設(shè)普遍存在“重功能輕數(shù)據(jù)”的情況,缺少整體數(shù)據(jù)標準規(guī)劃,無校核機制,導(dǎo)致問題數(shù)據(jù)不斷積累,數(shù)據(jù)統(tǒng)計不準確,影響各項報表準確性,許多預(yù)期需求無法實現(xiàn),對學校上層的決策和分析也帶來不同程度的影響。
2.3 數(shù)據(jù)存在安全隱患
數(shù)據(jù)安全管理工作機制不完善,部分信息系統(tǒng)數(shù)據(jù)授權(quán)管理不嚴,缺乏管控,可能造成數(shù)據(jù)濫用和隱私數(shù)據(jù)泄露情況。部分師生缺乏數(shù)據(jù)安全責任意識,對安全隱患不夠重視,系統(tǒng)賬號弱密碼、亂授權(quán)和系統(tǒng)操作、數(shù)據(jù)填報不認真現(xiàn)象比較普遍。學校部分網(wǎng)絡(luò)建設(shè)與運維服務(wù)采用外包形式,由于承包商的技術(shù)水平和責任意識參差不齊[2],并不能完全保障數(shù)據(jù)安全。
2.4 數(shù)據(jù)管理責任不明確
因缺乏數(shù)據(jù)全生命周期管理,出現(xiàn)數(shù)據(jù)質(zhì)量問題時無法溯源。并且,由于數(shù)據(jù)交換技術(shù)復(fù)雜,業(yè)務(wù)人員難以進行數(shù)據(jù)交換管理操作,無法實現(xiàn)數(shù)據(jù)“誰產(chǎn)生、誰維護、誰負責”。
3 數(shù)字化改革背景下深化校園數(shù)據(jù)治理思路
以數(shù)字化改革為抓手,全面推進學校治理體系和治理能力的現(xiàn)代化建設(shè),提升校園整體“智治”水平,成為高職院校推動“雙高”建設(shè)的一個重點目標,其中推動校園數(shù)據(jù)治理是實現(xiàn)該目標的一個重要途徑。本文以我校當前的數(shù)據(jù)治理環(huán)境為基礎(chǔ),探索在數(shù)字化改革背景下深化校園數(shù)據(jù)治理的一種思路。
3.1 數(shù)據(jù)確權(quán)
數(shù)據(jù)確權(quán)是大數(shù)據(jù)應(yīng)用和數(shù)據(jù)產(chǎn)業(yè)發(fā)展必須解決的核心問題之一,它針對不同來源的數(shù)據(jù),以法律形式明確其產(chǎn)權(quán)歸屬,推動數(shù)據(jù)整合,加速數(shù)據(jù)共享和流通,從而激活龐大的數(shù)據(jù)資產(chǎn)價值和創(chuàng)新應(yīng)用,使數(shù)據(jù)產(chǎn)業(yè)得以迅速發(fā)展[3]。數(shù)據(jù)確權(quán)可以解決我校的數(shù)據(jù)管理責任不明確,無法精確溯源的問題。對學校各個業(yè)務(wù)系統(tǒng)的數(shù)據(jù)進行摸底排查,并對學校的部門組織架構(gòu)、管理機制、數(shù)據(jù)管理現(xiàn)狀進行針對性調(diào)研了解,確定權(quán)威數(shù)據(jù)來源,建立標準統(tǒng)一、職責明確、結(jié)構(gòu)清晰的校園數(shù)據(jù)目錄,確保數(shù)據(jù)歸屬責任明確。
數(shù)據(jù)目錄是數(shù)據(jù)共享和實現(xiàn)數(shù)據(jù)前后臺聯(lián)通、業(yè)務(wù)與數(shù)據(jù)管理聯(lián)動的載體。對于我校而言,以目錄的形式,將數(shù)據(jù)按照業(yè)務(wù)屬性或部門歸屬,劃分到各個目錄中,可以按照目錄對數(shù)據(jù)進行統(tǒng)計、監(jiān)測和溯源,包括資產(chǎn)內(nèi)容、資產(chǎn)質(zhì)量等,如圖1所示。比如,按照部門劃分,可以分為人事處(教師發(fā)展中心)、信息中心(圖書館)、計劃財務(wù)處、學生處(學生工作部、武裝部)、后勤管理處等部門。
3.2 元數(shù)據(jù)血緣關(guān)系梳理
元數(shù)據(jù)是描述數(shù)據(jù)的數(shù)據(jù),如數(shù)據(jù)庫的配置、表編目信息等[4]。元數(shù)據(jù)的血緣關(guān)系描述的是一種層次結(jié)構(gòu),即目標數(shù)據(jù)來源于哪些源數(shù)據(jù),又生成了哪些子數(shù)據(jù)。血緣關(guān)系的梳理可以為學校數(shù)據(jù)的合規(guī)性提供驗證手段,幫助業(yè)務(wù)部門與 IT 支撐部門實現(xiàn)信息共享、提升協(xié)調(diào)工作效率。對學校各業(yè)務(wù)部門進行實地的走訪調(diào)研,以明確數(shù)據(jù)來源。調(diào)研的內(nèi)容主要包括:(1)各業(yè)務(wù)部門數(shù)據(jù)現(xiàn)狀。了解業(yè)務(wù)部門內(nèi)部數(shù)據(jù)的生產(chǎn)過程、數(shù)據(jù)存放的形式等;(2)數(shù)據(jù)來源。確定本部門、其他部門產(chǎn)生的權(quán)威數(shù)據(jù)以及交叉維護的數(shù)據(jù);(3)數(shù)據(jù)字典。是否有數(shù)據(jù)字典,信息是否正確完整,電子格式或紙質(zhì)文檔;(4)數(shù)據(jù)交換與共享。對外提供數(shù)據(jù)面臨的問題、使用其他業(yè)務(wù)部門數(shù)據(jù)面臨的問題;(5)研究數(shù)據(jù)質(zhì)量問題。討論現(xiàn)階段發(fā)現(xiàn)的數(shù)據(jù)質(zhì)量問題,分析原因,討論處理方式;(6)數(shù)據(jù)分析需求。本部門的數(shù)據(jù)分析需求及其他部門對本部門數(shù)據(jù)的分析需求;(7)可用的數(shù)據(jù)標準資源?,F(xiàn)有系統(tǒng)哪些代碼、元數(shù)據(jù)可以采集引用為校級標準;(8)數(shù)據(jù)質(zhì)量問題。當前已經(jīng)明確有哪些數(shù)據(jù)問題,數(shù)據(jù)質(zhì)量檢測規(guī)則、管理流程和制度。
最后,根據(jù)調(diào)研結(jié)果,確定數(shù)據(jù)血緣關(guān)系表。
3.3 元數(shù)據(jù)治理
元數(shù)據(jù)治理是對數(shù)據(jù)進行采集、清洗及轉(zhuǎn)換,并生成標準化數(shù)據(jù)倉庫的過程,也是數(shù)據(jù)治理的核心步驟。對全校的所有數(shù)據(jù)進行采集,采集的數(shù)據(jù)對象包括業(yè)務(wù)系統(tǒng)數(shù)據(jù)庫中的數(shù)據(jù),重要的線下文件中的數(shù)據(jù),來自于網(wǎng)絡(luò)系統(tǒng)的日志數(shù)據(jù)、來自于各物聯(lián)網(wǎng)系統(tǒng)的物聯(lián)網(wǎng)數(shù)據(jù)和來自互聯(lián)網(wǎng)的外部數(shù)據(jù)等。采集完成后,進行數(shù)據(jù)質(zhì)量檢查,繼而通過結(jié)構(gòu)化數(shù)據(jù)清洗、轉(zhuǎn)換的手段進行數(shù)據(jù)質(zhì)量的提升,并生成標準化數(shù)據(jù)倉庫。
3.3.1 數(shù)據(jù)采集
數(shù)據(jù)采集可以通過批量采集或者已有數(shù)據(jù)導(dǎo)入的方式進行,通過 MySQL 數(shù)據(jù)庫進行存儲。對采集后的原始數(shù)據(jù)進行識別理解,從中挑選出有效的數(shù)據(jù)。數(shù)據(jù)識別完成后,通過配置 ETL 接口的方式,將原始數(shù)據(jù)采集為目標數(shù)據(jù)。
3.3.2 數(shù)據(jù)質(zhì)量檢查
數(shù)據(jù)質(zhì)量是保證數(shù)據(jù)應(yīng)用效果的基礎(chǔ)。數(shù)據(jù)質(zhì)量檢查是數(shù)據(jù)治理中的重要一環(huán),是通過數(shù)據(jù)反哺業(yè)務(wù),發(fā)揮數(shù)據(jù)價值的基石,也是大數(shù)據(jù)建設(shè)的重要前提。設(shè)定質(zhì)量檢查規(guī)則,包括但不限于對產(chǎn)品對數(shù)據(jù)資產(chǎn)數(shù)據(jù)空置率、填充率、合規(guī)性、總量、用戶量、數(shù)據(jù)重復(fù)率、數(shù)據(jù)格式驗證、數(shù)據(jù)一致性通用數(shù)據(jù)質(zhì)量規(guī)則進行自定義配置。通過數(shù)據(jù)質(zhì)量檢查,可以獲得干凈、清晰、完整的數(shù)據(jù)。系統(tǒng)從數(shù)據(jù)使用的角度監(jiān)控數(shù)據(jù)資產(chǎn)的質(zhì)量,并以可視化報告的形式反映質(zhì)量問題,輔助學校不斷地提升數(shù)據(jù)質(zhì)量。
3.3.3 數(shù)據(jù)清洗轉(zhuǎn)換
數(shù)據(jù)清洗轉(zhuǎn)換可以解決數(shù)據(jù)中存在的大部分結(jié)構(gòu)性問題和小部分內(nèi)容性問題,從而提升數(shù)據(jù)質(zhì)量,主要是對原始數(shù)據(jù)中存在的明顯錯誤進行識別和處理,包括遺漏值處理、噪音數(shù)據(jù)處理、不一致數(shù)據(jù)處理等內(nèi)容。針對遺漏值處理,可以采取人工處理或者自動處理的方法,當發(fā)現(xiàn)一個記錄的屬性值有遺漏時,通過查找原始的記錄,或者請業(yè)務(wù)專家手工填補所缺失的數(shù)值,以及通過已有的程序自動處理。噪音數(shù)據(jù)主要是指錯誤數(shù)據(jù)和重復(fù)數(shù)據(jù),可分為內(nèi)噪聲數(shù)據(jù)和外噪聲數(shù)據(jù)。針對噪音數(shù)據(jù)處理,可根據(jù)整體數(shù)據(jù)的數(shù)據(jù)分布來辨識,并進行適當處理。
3.3.4 標準化數(shù)據(jù)倉庫
標準化數(shù)據(jù)倉庫用來支持全校的流程服務(wù)、數(shù)據(jù)調(diào)用、交換共享、大數(shù)據(jù)分析、精準管理、科學決策等事務(wù)。對采集的結(jié)構(gòu)化數(shù)據(jù)提供標準化存儲服務(wù)。確保數(shù)據(jù)的組織方式和存儲結(jié)構(gòu)符合學校的校級數(shù)據(jù)標準相關(guān)要求。整個數(shù)據(jù)倉庫的建設(shè)都依照數(shù)據(jù)標準進行建模分類和格式規(guī)范,生成相應(yīng)的數(shù)據(jù)倉庫表結(jié)構(gòu),通過采集學校的各種有價值數(shù)據(jù),按照質(zhì)量要求進行清洗治理,按照數(shù)據(jù)標準的格式進行建模,利用大數(shù)據(jù)基礎(chǔ)技術(shù)架構(gòu)進行存儲,從而形成標準化數(shù)據(jù)倉庫。圖2為數(shù)據(jù)治理核心內(nèi)容。
3.4 數(shù)據(jù)安全
數(shù)據(jù)安全管理是指通過技術(shù)手段,對數(shù)據(jù)的安全進行定級,保證數(shù)據(jù)資產(chǎn)使用過程的安全。數(shù)據(jù)安全是數(shù)據(jù)共享、開放的前提,也是數(shù)據(jù)管理的底線。針對我校數(shù)據(jù)管理存在的安全威脅,按照數(shù)據(jù)安全相關(guān)法律政策的要求和高校實際的業(yè)務(wù)場景,通過評估數(shù)據(jù)安全風險、制定數(shù)據(jù)安全管理制度規(guī)范,對數(shù)據(jù)進行安全分級分類,根據(jù)不同安全等級,對數(shù)據(jù)定制不同的申請審批和使用策略,全方位地保證數(shù)據(jù)的安全,建立體系化的數(shù)據(jù)保障措施,為充分發(fā)揮數(shù)據(jù)價值提供安全可靠的環(huán)境,從而保證數(shù)據(jù)被合法合規(guī)、安全地采集、傳輸、存儲和使用。圖3為數(shù)據(jù)安全測試界面。
4 結(jié)束語
目前,相關(guān)部門高度重視數(shù)字化改革工作,明確提出要建設(shè)網(wǎng)絡(luò)強國、數(shù)字中國,國家“十四五”規(guī)劃專門設(shè)置“加快數(shù)字化發(fā)展建設(shè)數(shù)字中國”章節(jié),并對加快建設(shè)數(shù)字經(jīng)濟、數(shù)字社會、數(shù)字政府,營造良好數(shù)字生態(tài)作出明確部署。數(shù)字化改革也是浙江省近年來的熱點和重點工作,相關(guān)部門對其高度重視,多次召開數(shù)字化改革工作推進會。在數(shù)字化時代,深化數(shù)據(jù)治理,對于支撐高校教學、科研和管理,推動學校數(shù)字化改革系統(tǒng)迭代、整體提升都起到至關(guān)重要的作用。本文提出的深化校園數(shù)據(jù)治理的解決思路,可以將分散、無序的“碎片化”數(shù)據(jù)轉(zhuǎn)換成有效的資產(chǎn),實現(xiàn)從無序到關(guān)聯(lián)、從靜態(tài)到動態(tài)、從隱性到顯性,從數(shù)據(jù)到價值的轉(zhuǎn)換。同時,可以加快推動數(shù)據(jù)的開放與共享,打破“數(shù)據(jù)孤島”,提升數(shù)據(jù)質(zhì)量,真正助推學校打造特色鮮明的高水平高職院校。
參考文獻:
[1]梁正,吳培熠.數(shù)據(jù)治理的研究現(xiàn)狀及未來展望[ J].陜西師范大學學報(哲學社會科學版).2021,50(2):65?71.
[2]呂庚.新時期下職業(yè)院校數(shù)字化校園安全隱患及應(yīng)對策略[J].現(xiàn)代職業(yè)教育.2019(36):44?45.
[3]杜振華,茶洪旺.數(shù)據(jù)確權(quán)是大數(shù)據(jù)應(yīng)用的核心[ J].重慶社會科學,2016(8):21.
[4]程世豪.面向元數(shù)據(jù)血緣關(guān)系的映射技術(shù)及實現(xiàn)[ D].成都:西南財經(jīng)大學,2020.
作者簡介:
葛佳歡(1987—),碩士,研究方向:信息技術(shù)。