樊蓮花 楊令平
摘? 要: 加強數(shù)據(jù)質(zhì)量管理是推進義務(wù)教育均衡發(fā)展的必然要求。當前,我國義務(wù)教育均衡發(fā)展數(shù)據(jù)質(zhì)量管理體系已初步建立,但還存在著信息不對稱導致數(shù)據(jù)采集的科學性困境,管理流程復雜性導致數(shù)據(jù)審核的規(guī)范性困境,技術(shù)手段滯后性導致數(shù)據(jù)挖掘的修復力困境、人員素質(zhì)不高和機制不完善導致數(shù)據(jù)應(yīng)用的交互性困境。強化“伴隨性”收集,構(gòu)建新型數(shù)據(jù)生態(tài)系統(tǒng);優(yōu)化審核流程,提高數(shù)據(jù)精準度;深化技術(shù)創(chuàng)新,延展數(shù)據(jù)內(nèi)涵價值;固化權(quán)責評估,推動數(shù)據(jù)高質(zhì)量應(yīng)用,是破解“數(shù)據(jù)質(zhì)量管理困境”的有效對策。
關(guān)鍵詞: 義務(wù)教育;均衡發(fā)展;數(shù)據(jù)質(zhì)量管理困境;數(shù)據(jù)生態(tài)系統(tǒng)
當前,國家已在義務(wù)教育均衡發(fā)展評估驗收中建立了較為完整的數(shù)據(jù)質(zhì)量管理系統(tǒng),但與數(shù)據(jù)驅(qū)動下的監(jiān)測評估要求還存在一定差距。如何加強縣域義務(wù)教育均衡發(fā)展數(shù)據(jù)質(zhì)量管理,確保數(shù)據(jù)的準確性、及時性、相關(guān)性、可比性、可獲取性、一致性和適用性,成為推進縣域義務(wù)教育均衡發(fā)展進程中學術(shù)界和實踐界關(guān)注的熱點和難點。
一、加強數(shù)據(jù)質(zhì)量管理是實現(xiàn)義務(wù)教育均衡發(fā)展目標的必然要求
從學理上分析,數(shù)據(jù)質(zhì)量是指數(shù)據(jù)產(chǎn)品滿足特定用戶期望的程度,可分為數(shù)據(jù)自身質(zhì)量(如數(shù)據(jù)完整性、規(guī)范性、一致性、準確性、唯一性等)、數(shù)據(jù)傳遞中的質(zhì)量(如比較性、聯(lián)結(jié)性)以及數(shù)據(jù)控制過程中的質(zhì)量(如有效性)。1 以此為依據(jù),數(shù)據(jù)質(zhì)量管理是指運用各種技術(shù)手段,對數(shù)據(jù)收集、審核、挖掘、應(yīng)用的全過程實施控制,以確保數(shù)據(jù)的真實性、準確性和完整性的活動。在縣域義務(wù)教育均衡發(fā)展中,數(shù)據(jù)質(zhì)量管理是指對所有能夠表征均衡發(fā)展質(zhì)量、規(guī)模、結(jié)構(gòu)、效益等狀態(tài)主題的數(shù)據(jù)源進行從源頭到終端的全面質(zhì)量管理。大數(shù)據(jù)背景下的縣域義務(wù)教育均衡發(fā)展監(jiān)測評估越來越強調(diào)數(shù)據(jù)驅(qū)動,即利用現(xiàn)代信息技術(shù)持續(xù)收集、深入分析均衡發(fā)展數(shù)據(jù),從數(shù)據(jù)中萃取知識,讓數(shù)據(jù)說話,直觀呈現(xiàn)義務(wù)教育均衡發(fā)展狀態(tài),為多元主體價值判斷和科學決策提供客觀依據(jù)。1 理想的義務(wù)教育均衡發(fā)展數(shù)據(jù)應(yīng)滿足數(shù)據(jù)采集的可靠性、數(shù)據(jù)審核的規(guī)范性、數(shù)據(jù)挖掘的科學性、數(shù)據(jù)應(yīng)用的交互性等質(zhì)量要求。
然而,反觀我國義務(wù)教育均衡發(fā)展監(jiān)測評估數(shù)據(jù),其在具體管理實踐與流變中卻明顯地出現(xiàn)了質(zhì)量不高、管理不善、效能不佳等現(xiàn)象,這在數(shù)據(jù)質(zhì)量管理的頂層設(shè)計中可被詮釋為“數(shù)據(jù)質(zhì)量管理困境”。
二、當前縣域義務(wù)教育均衡發(fā)展數(shù)據(jù)質(zhì)量管理面臨的主要困境
從數(shù)據(jù)生命周期和數(shù)據(jù)質(zhì)量形成規(guī)律看,縣域義務(wù)教育均衡發(fā)展數(shù)據(jù)質(zhì)量管理主要面臨以下困境:
1.信息不對稱導致的數(shù)據(jù)采集科學性困境
縣域義務(wù)教育均衡發(fā)展數(shù)據(jù)主要采用報送式采集方式,借助基礎(chǔ)均衡數(shù)據(jù)采集系統(tǒng)和滿意度問卷調(diào)查系統(tǒng),由均衡發(fā)展利益相關(guān)者填寫,自下而上進行數(shù)據(jù)逐級報送。這種方式具有操作性好、權(quán)威性強等優(yōu)勢,但同時存在以下問題:其一,部分客觀數(shù)據(jù)不一致或相互矛盾。由于涉及的數(shù)據(jù)龐大而復雜,監(jiān)測部門無法獨立地承擔所有的數(shù)據(jù)采集工作,需要與其他部門合作,由他們進行原始數(shù)據(jù)的采集并交給監(jiān)測部門匯總與收錄。但各部門間的統(tǒng)計數(shù)據(jù)存在重疊與分離現(xiàn)象,彼此間統(tǒng)計口徑不一,致使不同來源、不同結(jié)構(gòu)的數(shù)據(jù)源在定義、存儲和管理標準上存在差異,導致數(shù)據(jù)準確性較差,且數(shù)據(jù)不一致或存在矛盾。如在“適齡人口數(shù)”的統(tǒng)計中,有的部門采用“當?shù)爻W∪丝凇边M行測算,有的根據(jù)“戶籍人口”測算。這種統(tǒng)計口徑的不一致,致使“適齡人口數(shù)”不準確。其二,滿意度數(shù)據(jù)弄虛作假。問卷調(diào)查系統(tǒng)數(shù)據(jù)主要來自問卷調(diào)查和隨機實地走訪,如社會認可度的調(diào)查,即對縣級人民政府和有關(guān)職能部門在落實教育公平政策、推動資源共享以及義務(wù)教育學校規(guī)范辦學行為、實施素質(zhì)教育、考試評估制度改革、提高教育質(zhì)量等方面的成效評估,主要通過向?qū)W生、家長、教師、校長等發(fā)放問卷獲得。由于問卷最后要轉(zhuǎn)化成分數(shù)進行量化考核,調(diào)研過程中部分縣政府和學校為了得高分,存在“干涉家長、學生、教師等填寫數(shù)據(jù),進而致使問卷統(tǒng)計結(jié)果過高”等虛假現(xiàn)象。
導致以上困境出現(xiàn)的主要原因在于信息不對稱。這種不對稱主要表現(xiàn)在:
第一,數(shù)據(jù)提供者與數(shù)據(jù)收集者對監(jiān)測指標的認識存在信息不對稱。由于不同部門對元數(shù)據(jù)的描述和理解不統(tǒng)一,導致“數(shù)出多門,數(shù)數(shù)不同”。如前述對“適齡人口數(shù)”理解的不同造成數(shù)據(jù)不一致。
第二,數(shù)據(jù)核算管理者與實際信息不對稱,數(shù)據(jù)審核隨意性過大。在實地抽查走訪過程中,抽查的樣本縣數(shù)量過少,數(shù)據(jù)來源不充分,無法對數(shù)據(jù)填報員主觀推斷和虛假填報的數(shù)據(jù)進行核實,致使數(shù)據(jù)準確性難以保證。數(shù)據(jù)收集者和數(shù)據(jù)提供者之間的信息不對稱使數(shù)據(jù)采集的準確性遭到質(zhì)疑,盡管近年來各級教育行政部門加大了數(shù)據(jù)稽查和追責力度,但面對海量的教育數(shù)據(jù),事后補救終是亡羊補牢。
第三,均衡發(fā)展數(shù)據(jù)與政府人員績效考核存在“利益關(guān)系”。部分學校填報人在數(shù)據(jù)填報過程中,未能秉持客觀、公正、嚴謹?shù)脑瓌t,而是出于自我利益考慮,僅提供能給自己“貼金”的數(shù)據(jù)信息,忽略甚至掩飾存在問題的數(shù)據(jù)。因此,監(jiān)測評估所獲得的數(shù)據(jù)可能是經(jīng)過被評估方篩選過的、僅能支撐縣域均衡發(fā)展成就的數(shù)據(jù)。
第四,數(shù)據(jù)系統(tǒng)缺乏統(tǒng)一標準。從實用角度看,縣域義務(wù)教育均衡發(fā)展數(shù)據(jù)可分為達標數(shù)據(jù)、差異數(shù)據(jù)和模糊數(shù)據(jù)。2 不同類型的數(shù)據(jù)屬性各異、表達不一、在結(jié)構(gòu)化程度上也存在差異,若缺乏統(tǒng)一的系統(tǒng)化標準,數(shù)據(jù)一致性、可比性和效用性將難以保障。
2.管理流程的復雜性導致的數(shù)據(jù)審核規(guī)范性困境
義務(wù)教育均衡發(fā)展數(shù)據(jù)審核采取“縣域內(nèi)學校填報員初審—縣(市、區(qū))督導員自審—市級督導復審—省級督導終審”的流程。這一流程層次清晰且富有操作性,但在具體執(zhí)行過程中往往存在以下偏差:一是數(shù)據(jù)審核流于形式。無論是學校填報員的初審還是省級督導的終審,都存在“重形式、輕實質(zhì)”現(xiàn)象,即只注重拼寫錯誤、重復記錄等形式,忽視數(shù)據(jù)真實性、完整性和一致性的實質(zhì)性審查。二是數(shù)據(jù)審核缺乏制度保障。現(xiàn)階段各級數(shù)據(jù)審核缺少統(tǒng)一的校核標準和整體的規(guī)劃制度,即使發(fā)現(xiàn)數(shù)據(jù)有問題也沒有相應(yīng)的校核機制,致使問題數(shù)據(jù)不斷沉積,數(shù)據(jù)質(zhì)量出了問題也無法溯源追責。
導致以上困境的主要原因是管理流程過于復雜。當前縣域義務(wù)教育均衡發(fā)展數(shù)據(jù)質(zhì)量管理流程中存在著管理主體模糊、管理程序偏多、管理環(huán)節(jié)復雜等狀況,直接或間接地導致了如下問題:
第一,管理流程前后相互影響與制約。如數(shù)據(jù)標準是教育數(shù)據(jù)質(zhì)量管理的基本環(huán)節(jié),也是實現(xiàn)教育數(shù)據(jù)共同理解、診斷錯誤的重要依據(jù)。1 但現(xiàn)階段均衡監(jiān)測各審核部門間缺乏明確的數(shù)據(jù)質(zhì)量標準,導致不同部門對數(shù)據(jù)質(zhì)量管理的要求缺乏相關(guān)依據(jù),進而使得數(shù)據(jù)審核難以有效開展。
第二,均衡發(fā)展數(shù)據(jù)源的多樣性加大了審核難度??h域義務(wù)教育均衡發(fā)展數(shù)據(jù)具有“開放性、爆炸性、自由性”2 等特點,其類型多源異構(gòu),種類千差萬別,頻率需實時更新,數(shù)據(jù)存儲分散且格式各異,智能化檢測與人工審查需交叉呈現(xiàn),這從客觀上加劇了均衡發(fā)展數(shù)據(jù)的審核難度。
第三,“數(shù)利關(guān)系”的客觀存在異化了審核主體與被審數(shù)據(jù)間的關(guān)系。理想的數(shù)據(jù)審核狀態(tài)是審核主體秉承客觀、公正、公平的職責立場,對數(shù)據(jù)進行嚴格審核校對。然而,由于被審核的數(shù)據(jù)與審核主體間存在一定的“數(shù)利關(guān)系”,即部分審核主體為特定目的,可能存在自行修改、人為捏造、刻意隱瞞數(shù)據(jù)等現(xiàn)象。
3.技術(shù)手段的滯后性導致的數(shù)據(jù)挖掘修復力困境
縣域義務(wù)教育均衡發(fā)展監(jiān)測數(shù)據(jù)挖掘一般包含三大目標,即判斷縣域內(nèi)資源配置度、政府保障度、社會認可度等是否達標;明確義務(wù)教育發(fā)展特色及存在的問題;形成縣域義務(wù)教育發(fā)展的“前景地圖”。依據(jù)上述目標,當前縣域義務(wù)教育均衡發(fā)展數(shù)據(jù)挖掘中存在以下問題:一是數(shù)據(jù)挖掘以推斷統(tǒng)計為主,深度不夠?,F(xiàn)階段義務(wù)教育數(shù)據(jù)分析人員主要采用“抽樣調(diào)查”,輔之以“實地走訪”的方法,以獲得的樣本數(shù)據(jù)簡單推斷整體數(shù)據(jù)質(zhì)量。由于樣本數(shù)據(jù)基數(shù)有限,推斷出的整體數(shù)據(jù)質(zhì)量往往與實際狀況存在一定偏差。二是缺乏數(shù)據(jù)質(zhì)量控制機制,檢測與校正能力薄弱。在縣域義務(wù)教育均衡發(fā)展數(shù)據(jù)收集和審核過程中,對記錄錯誤的單源數(shù)據(jù)和冗余、矛盾以及前后不一致的多源數(shù)據(jù),要進行離群值、缺失值和重復值的檢測與校正,而現(xiàn)階段的數(shù)據(jù)分析人員缺乏統(tǒng)計學、人工智能和機器學習等知識,難以采用神經(jīng)網(wǎng)絡(luò)、模糊理論和聚類分析等方法進行數(shù)據(jù)的檢測與修復。
導致上述困境的主要原因在于技術(shù)滯后。影響縣域義務(wù)教育均衡發(fā)展數(shù)據(jù)挖掘質(zhì)量的技術(shù)因素,主要包括數(shù)據(jù)融合分析、數(shù)據(jù)檢測識別、數(shù)據(jù)預測預警等技術(shù)。首先,數(shù)據(jù)融合分析技術(shù)滯后。一是數(shù)據(jù)分析技術(shù)與實踐需求匹配度不夠。面對實時性、多樣性的海量數(shù)據(jù),監(jiān)測的模型、算法和工具還不夠成熟,難以針對給定數(shù)據(jù)類型和規(guī)模因地制宜進行自適應(yīng)分析。二是數(shù)據(jù)整合優(yōu)化技術(shù)較為匱乏?,F(xiàn)階段均衡發(fā)展數(shù)據(jù)的集成和融合技術(shù)還不夠成熟,難以在縱向上實現(xiàn)宏觀和微觀的貫通,更難以在橫向上使數(shù)據(jù)從碎片化走向網(wǎng)絡(luò)化、系統(tǒng)化,導致“數(shù)據(jù)孤島”或“數(shù)據(jù)矛盾”現(xiàn)象的出現(xiàn)。
其次,數(shù)據(jù)檢測識別技術(shù)相對滯后。一方面,數(shù)據(jù)檢測識別技術(shù)滯后會影響異常數(shù)據(jù)的剔除及修復。檢測識別技術(shù)方法的適切性與技術(shù)應(yīng)用的嫻熟度影響數(shù)據(jù)質(zhì)量。當前縣域義務(wù)教育均衡發(fā)展數(shù)據(jù)中,不可避免地存在著數(shù)據(jù)冗余、矛盾和不一致、拼寫錯誤、重復記錄等問題,而現(xiàn)有義務(wù)教育均衡發(fā)展檢測識別技術(shù)無法有效識別這些離群值、缺失值和重復值,并對其進行及時校正與修復。另一方面,數(shù)據(jù)檢測識別技術(shù)需要整合各地區(qū)的數(shù)據(jù)中心,形成全國統(tǒng)一的數(shù)據(jù)平臺和數(shù)據(jù)中心,在數(shù)據(jù)整合的過程中必然會涉及數(shù)據(jù)創(chuàng)建、數(shù)據(jù)獲取、數(shù)據(jù)傳輸、數(shù)據(jù)裝載、數(shù)據(jù)使用、數(shù)據(jù)維護等環(huán)節(jié),但現(xiàn)階段該類技術(shù)還不能滿足這一需求。
再次,數(shù)據(jù)預測預警技術(shù)的滯后性。數(shù)據(jù)的深度挖掘需利用數(shù)據(jù)關(guān)聯(lián)性,為區(qū)域內(nèi)和區(qū)域間的均衡發(fā)展態(tài)勢預測及預警提供技術(shù)支撐?,F(xiàn)階段縣域義務(wù)教育均衡發(fā)展預測預警技術(shù)還處于初級階段,無法對數(shù)據(jù)進行動態(tài)的“隨動而謀”,更多的是靜態(tài)的“謀而后動”。
4.權(quán)責不明確導致的數(shù)據(jù)應(yīng)用交互性困境
當前縣域義務(wù)教育均衡發(fā)展數(shù)據(jù)應(yīng)用主要有兩種形式:一是在教育部網(wǎng)站上公開發(fā)布;二是以《義務(wù)教育均衡發(fā)展自查報告》《義務(wù)教育均衡發(fā)展督導評估工作報告》等書面報告形式反饋給省級和縣級政府教育督導部門,省教育廳、統(tǒng)計局也會以一定方式將部分監(jiān)測結(jié)果向社會利益相關(guān)者公布。這種數(shù)據(jù)使用方式具有權(quán)威性,但存在以下不足:一是數(shù)據(jù)可視化程度低?,F(xiàn)階段義務(wù)教育均衡發(fā)展結(jié)果數(shù)據(jù)的可視化展示,既無法滿足社會大眾“看得懂”“記得住”“用得上”的需求,又無法實現(xiàn)學校、學生個體以及社會公眾對源數(shù)據(jù)的查詢、搜索、比較等功能。二是數(shù)據(jù)的預警反饋功能未充分發(fā)揮??h域義務(wù)教育均衡發(fā)展書面報告中缺乏均衡驗收的細節(jié)數(shù)據(jù),單項指標數(shù)據(jù)的預警無法體現(xiàn),數(shù)據(jù)橫向之間可比性較差,監(jiān)測的預警反饋功能大打折扣。
導致以上困境的主要原因在于管理體制中權(quán)責不明確。一是數(shù)據(jù)管理人員質(zhì)量意識和數(shù)據(jù)素養(yǎng)不高。數(shù)據(jù)質(zhì)量管理人員在數(shù)據(jù)收集、錄入、審查與使用過程中扮演著重要角色,其數(shù)據(jù)理念、專業(yè)水平和職責立場將直接影響數(shù)據(jù)應(yīng)用質(zhì)量。1 現(xiàn)階段縣域義務(wù)教育均衡發(fā)展數(shù)據(jù)管理人員存在以下問題:首先,評估主體與客體在數(shù)據(jù)指標的概念內(nèi)涵與實施細則上尚未達成廣泛共識,導致采集的數(shù)據(jù)存在差異。其次,數(shù)據(jù)管理人員配備不足。填報員工作任務(wù)重,隊伍穩(wěn)定性差,業(yè)務(wù)能力偏低,從源頭上影響數(shù)據(jù)可靠性。再次,管理人員的數(shù)據(jù)素養(yǎng)偏低。如果說均衡發(fā)展數(shù)據(jù)是義務(wù)教育均衡發(fā)展狀態(tài)的“化驗單”,那么數(shù)據(jù)管理人員不僅要把“化驗單”數(shù)據(jù)厘清,還要能夠在此基礎(chǔ)上分析“診斷”,利用現(xiàn)代統(tǒng)計分析方法對數(shù)據(jù)進行挖掘。而當前數(shù)據(jù)管理人員的專業(yè)知識、崗位知識以及問題分析能力,還不能完全勝任均衡發(fā)展數(shù)據(jù)的分析與挖掘要求,導致均衡發(fā)展統(tǒng)計數(shù)據(jù)應(yīng)用質(zhì)量不高。
二是數(shù)據(jù)管理規(guī)則與標準、規(guī)定與執(zhí)行、技術(shù)與行為等系統(tǒng)耦合度不夠。首先,我國義務(wù)教育均衡發(fā)展缺乏專門的數(shù)據(jù)質(zhì)量標準,所參照的統(tǒng)計標準與國際標準存在差距,這在一定程度上影響了均衡發(fā)展數(shù)據(jù)的有效性。其次,數(shù)據(jù)管理機制不健全。義務(wù)教育均衡發(fā)展數(shù)據(jù)的收集使用、開放共享、報告使用、問責約談機制等還不夠健全完善。再次,數(shù)據(jù)可視化技術(shù)使用制度缺乏。數(shù)據(jù)可視化技術(shù)是在計算機圖形學和視覺設(shè)計、人機交互基礎(chǔ)上發(fā)展起來的,強調(diào)以直觀方式傳達抽象信息,增進人們對數(shù)據(jù)的理解,在增強認知、減少搜索、加強記憶、促進推理等方面具有獨特作用。但從目前發(fā)展實際看,縣域義務(wù)教育均衡發(fā)展還缺乏數(shù)據(jù)報告可視化的技術(shù)規(guī)范與制度,影響了數(shù)據(jù)質(zhì)量的呈現(xiàn)。
三、改進縣域義務(wù)教育均衡發(fā)展數(shù)據(jù)質(zhì)量管理的路徑
“讓數(shù)據(jù)說話、用數(shù)據(jù)決策、靠數(shù)據(jù)管理”2 是新時代推進縣域義務(wù)教育均衡發(fā)展治理的必然要求。針對縣域義務(wù)教育均衡發(fā)展數(shù)據(jù)質(zhì)量管理方面存在的困境,我們應(yīng)確立“全面質(zhì)量管理”理念,借鑒大數(shù)據(jù)管理思維和方法,加強數(shù)據(jù)全過程、全要素、全方位管理,實現(xiàn)數(shù)據(jù)高質(zhì)量發(fā)展。
1.強化“伴隨性收集”,構(gòu)建新型數(shù)據(jù)生態(tài)系統(tǒng)
數(shù)據(jù)采集的規(guī)范性決定數(shù)據(jù)內(nèi)容的精準度、監(jiān)測決策的科學化。針對當前數(shù)據(jù)采集的科學性困境,需要如下操作:一是構(gòu)建統(tǒng)一的數(shù)據(jù)采集規(guī)劃,注重數(shù)據(jù)的“伴隨性收集”??蓞⒖冀逃俊督逃芾硇畔ⅲ航逃芾砘A(chǔ)代碼》等七個教育信息化標準文件,分別制定監(jiān)測基礎(chǔ)類數(shù)據(jù)采集標準和指標類數(shù)據(jù)標準,以統(tǒng)一的“數(shù)據(jù)采集標準”緩解“數(shù)出多門,數(shù)數(shù)不同”的采集壁壘,借助穿戴設(shè)備、物聯(lián)網(wǎng)、人工智能技術(shù),對均衡發(fā)展過程中相伴產(chǎn)生的數(shù)據(jù)集合進行及時采集,以“伴隨性收集”彌補因“信息不對稱”造成的“報送式數(shù)據(jù)準確性不高”問題。二是構(gòu)建無縫流轉(zhuǎn)的均衡數(shù)據(jù)運用生態(tài)系統(tǒng)。在區(qū)域范圍內(nèi)探索構(gòu)建集“高效快捷的數(shù)據(jù)采集、安全的數(shù)據(jù)存儲、智能動態(tài)的分析挖掘與預測以及可視化的結(jié)果輸出”為一體的新型數(shù)據(jù)生態(tài)系統(tǒng)。這一無縫流轉(zhuǎn)的均衡發(fā)展開放數(shù)據(jù)生態(tài)系統(tǒng),能夠打通區(qū)域間信息流通渠道,利用均衡數(shù)據(jù)的流動性,以“積極開放”“互聯(lián)互通”的數(shù)據(jù)流動改變以往“逐級報送”的“條線煙囪”狀態(tài),引導教育行政部門、教育機構(gòu)以及社會大眾廣泛、深入運用均衡發(fā)展數(shù)據(jù),以均衡數(shù)據(jù)的逐級廣泛運用帶動均衡數(shù)據(jù)采集,從而提高數(shù)據(jù)采集質(zhì)量。三是引入新的數(shù)據(jù)采集工具和手段。在人工智能、“互聯(lián)網(wǎng)+”、大數(shù)據(jù)等技術(shù)革命的沖擊下,應(yīng)當充分利用豐富的數(shù)據(jù)采集手段來保障數(shù)據(jù)采集的準確性、完整性、連續(xù)性和一致性,如可充分利用計算機、地理信息系統(tǒng)、八爪魚、圖像識別等數(shù)據(jù)采集工具進行均衡發(fā)展數(shù)據(jù)的云采集。
2.優(yōu)化審核流程,提高數(shù)據(jù)精準度
數(shù)據(jù)審核是保障數(shù)據(jù)質(zhì)量的門檻。針對數(shù)據(jù)審核過程中的“規(guī)范性”困境,需要如下操作:一是樹立數(shù)據(jù)質(zhì)量核心理念,加大稽核檢查力度。審核管理人員要全面落實《統(tǒng)計法》,嚴格遵照《關(guān)于嚴把統(tǒng)計數(shù)據(jù)質(zhì)量關(guān)確保2016年統(tǒng)計數(shù)據(jù)匯總工作順利進行的通知》,自覺踐行數(shù)據(jù)核查工作責任,杜絕隨意編造和篡改數(shù)據(jù)。二是構(gòu)建縣域義務(wù)教育均衡發(fā)展數(shù)據(jù)處理流程框架。借鑒其他行業(yè)數(shù)據(jù)處理流程控制辦法,將縣域義務(wù)教育均衡發(fā)展數(shù)據(jù)處理流程劃分為數(shù)據(jù)采集層、數(shù)據(jù)審核層、數(shù)據(jù)挖掘?qū)?、?shù)據(jù)發(fā)布層。1 數(shù)據(jù)采集層以均衡數(shù)據(jù)系統(tǒng)和問卷調(diào)查系統(tǒng)的數(shù)據(jù)為主,輔之實地走訪的數(shù)據(jù)。數(shù)據(jù)審核層在審核的過程中,要關(guān)注原始數(shù)據(jù)及其結(jié)構(gòu)和質(zhì)量,對數(shù)據(jù)取值范圍、數(shù)據(jù)注釋、數(shù)據(jù)來源進行核查。重點對提取的元數(shù)據(jù)的完整性、一致性、可識別性進行審核。對不同部門提交的數(shù)據(jù),如政府統(tǒng)計網(wǎng)等數(shù)據(jù),要注重數(shù)據(jù)的結(jié)構(gòu)一致性和語義一致性,避免出現(xiàn)統(tǒng)計口徑不一致的現(xiàn)象。此外,要充分發(fā)揮數(shù)據(jù)挖掘?qū)拥臄?shù)據(jù)檢測與數(shù)據(jù)矯正功能,重視對數(shù)據(jù)發(fā)布層的可視化展示與可視化分析結(jié)果,利用后續(xù)處理流程的反作用倒逼數(shù)據(jù)質(zhì)量提升。三是實施人機雙重校對,明晰各層級數(shù)據(jù)審查責任。開發(fā)數(shù)據(jù)編輯檢查程序,及時檢測所提交數(shù)據(jù)的完整性,同時在提交過程中精準識別錯誤數(shù)據(jù),核驗數(shù)據(jù)報告是否一致,是否有遺漏、錯誤,是否符合預期。與此同時,在不同層級教育政府部門設(shè)專門的數(shù)據(jù)管理員,依照數(shù)據(jù)管理規(guī)范,再次審核已提交的數(shù)據(jù),以進一步發(fā)現(xiàn)系統(tǒng)中存在的數(shù)據(jù)異常。一旦發(fā)現(xiàn)數(shù)據(jù)異常則立即處理,并向數(shù)據(jù)提交者反饋,要求其詳細解釋數(shù)據(jù)異常的原因,以解決潛在的數(shù)據(jù)質(zhì)量問題。
3.深化技術(shù)創(chuàng)新,延展數(shù)據(jù)內(nèi)涵價值
數(shù)據(jù)挖掘是矯正異常數(shù)據(jù)與發(fā)揮數(shù)據(jù)監(jiān)測、預警及預測功能的關(guān)鍵。針對技術(shù)手段滯后帶來的數(shù)據(jù)修復力困境,需要如下操作:一是拓寬數(shù)據(jù)挖掘技術(shù)功能。在明確均衡發(fā)展標準紅線基礎(chǔ)上,加強數(shù)據(jù)挖掘技術(shù)在聚類分析、預測分析、關(guān)聯(lián)分析等方面的實踐應(yīng)用,拓展其在數(shù)據(jù)整合、識別和診斷等方面的功能。二是加大數(shù)據(jù)清洗技術(shù)創(chuàng)新??衫媒y(tǒng)計軟件,通過變量取值和邏輯關(guān)系,識別出數(shù)據(jù)中的異常值,及時發(fā)現(xiàn)邏輯不合理、數(shù)值矛盾的數(shù)據(jù),采用適當算法實現(xiàn)數(shù)據(jù)修復;也可通過忽略元組(均衡發(fā)展數(shù)據(jù)庫中的記錄或行,每個元祖代表一個對象)、人工填寫缺失組、屬性均值、進行中位數(shù)填充等辦法修復數(shù)據(jù)中的缺失值;或利用“R語言、Weka語言、Trificata Wrangler、Google Refine等軟件”2 對采集中的重復數(shù)據(jù)進行去重,以保障縣域義務(wù)教育均衡發(fā)展中的數(shù)據(jù)滿足完整性、一致性、有效性等目標。三是引入大數(shù)據(jù)預測、預警算法與技術(shù)。將大數(shù)據(jù)的預測、預警功能引入均衡發(fā)展監(jiān)測領(lǐng)域,釋放均衡發(fā)展數(shù)據(jù)的預測與預警價值。具體說來,可采用知識圖譜等分析技術(shù)區(qū)分正常和危險數(shù)據(jù)類型組合;利用深度學習方法挖掘均衡發(fā)展歷史數(shù)據(jù)規(guī)律,進行均衡發(fā)展趨勢預測;借助瀕危參數(shù)初始值、最大值等臨界點與預測值的比較,實現(xiàn)均衡發(fā)展?jié)撛趩栴}的預測等。
4.固化權(quán)責評估,推動數(shù)據(jù)高質(zhì)量應(yīng)用
對數(shù)據(jù)的分析應(yīng)用是推動均衡發(fā)展數(shù)據(jù)質(zhì)量提升的動力。針對數(shù)據(jù)應(yīng)用的交互性困境,需要如下操作:一是更新數(shù)據(jù)質(zhì)量管理理念,扭轉(zhuǎn)部分數(shù)據(jù)工作人員“視數(shù)據(jù)收集和審核為行政任務(wù),缺乏數(shù)據(jù)質(zhì)量管理理念”的錯誤認識??杉訌妼?shù)據(jù)質(zhì)量管理新理念的學習和研討,彰顯“以學生為中心、重視數(shù)據(jù)賦能、精準使用數(shù)據(jù)”的理念,進而明晰各利益相關(guān)者在數(shù)據(jù)質(zhì)量管理中的權(quán)責范圍。二是放寬數(shù)據(jù)使用權(quán)限。對數(shù)據(jù)的應(yīng)用不能僅停留在均衡驗收達標上,還需將數(shù)據(jù)與教育資源配置、學校布局調(diào)整、校園特色發(fā)展、教師教學創(chuàng)新、學生特質(zhì)開發(fā)、家校交流合作、教育研究轉(zhuǎn)型等主題融合起來,以數(shù)據(jù)的深度運用來推動數(shù)據(jù)質(zhì)量管理的常態(tài)化。三是暢通數(shù)據(jù)質(zhì)量反饋渠道。數(shù)據(jù)質(zhì)量的核心就是滿足用戶需求,因此管理應(yīng)注重公開、透明與互動。縣域義務(wù)教育均衡發(fā)展數(shù)據(jù)管理者可通過會議、公開討論、用戶問卷調(diào)查等方式,向?qū)W校、學生、家長、第三方等利益相關(guān)群體及時了解信息,使數(shù)據(jù)質(zhì)量管理措施有的放矢,進而達到提高數(shù)據(jù)質(zhì)量的目的。四是加強數(shù)據(jù)管理團隊力量。將數(shù)據(jù)素養(yǎng)作為數(shù)據(jù)管理人員考核標準,確保每一位數(shù)據(jù)管理人員都具備“知”(知道如何獲取、分析數(shù)據(jù))、“思”(思考如何做好數(shù)據(jù)規(guī)劃、鑒定數(shù)據(jù)、評價數(shù)據(jù))、“行”(能將數(shù)據(jù)應(yīng)用到監(jiān)測實踐中)的能力。1 此外,還可構(gòu)建專門的數(shù)據(jù)質(zhì)量管理機構(gòu),如通過定期開展均衡發(fā)展數(shù)據(jù)質(zhì)量管理研討會,總結(jié)分析數(shù)據(jù)采集、輸入、審查、挖掘與應(yīng)用中的典型問題,提升數(shù)據(jù)管理人員的質(zhì)量意識和數(shù)據(jù)素養(yǎng)。五是構(gòu)建數(shù)據(jù)質(zhì)量評估體系。數(shù)據(jù)的深度運用要以及時、準確、適用的質(zhì)量評估標準為起點,以完善的數(shù)據(jù)質(zhì)量評估體系為保障。在縣域義務(wù)教育均衡發(fā)展數(shù)據(jù)質(zhì)量管理中,可通過引入數(shù)據(jù)質(zhì)量評估信念,出臺數(shù)據(jù)質(zhì)量評估政策,建立數(shù)據(jù)質(zhì)量評估機構(gòu),營造良好數(shù)據(jù)質(zhì)量文化,來保障評估體系的落實與執(zhí)行。