李書欽,史運(yùn)濤,馬時來,李琳
(北方工業(yè)大學(xué)信息中心,北京 100144)
隨著大數(shù)據(jù)技術(shù)的日益完善,用大數(shù)據(jù)促進(jìn)教育信息化已成為廣泛共識,近年來,國家陸續(xù)出臺了《促進(jìn)大數(shù)據(jù)發(fā)展行動綱要(2015)》、《教育信息化“十三五”規(guī)劃(2016)》、《2016教育信息化工作要點》等文件,明確提出利用大數(shù)據(jù)技術(shù)加快教育信息化的發(fā)展步伐,建立“用數(shù)據(jù)說話、用數(shù)據(jù)決策、用數(shù)據(jù)管理、用數(shù)據(jù)創(chuàng)新”的管理機(jī)制,實現(xiàn)基于數(shù)據(jù)的科學(xué)決策[1]。
高校信息化建設(shè)經(jīng)過了基礎(chǔ)設(shè)施建設(shè)階段、數(shù)字化校園建設(shè)階段,正在朝著“環(huán)境全面感知、網(wǎng)絡(luò)無縫互通、海量數(shù)據(jù)支撐、師生個性服務(wù)”的智慧校園階段邁進(jìn)[2],如何利用已有業(yè)務(wù)系統(tǒng)(教務(wù)、科研、人事、財務(wù)、卡務(wù)、網(wǎng)絡(luò))的結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)(無線網(wǎng)絡(luò)日志),進(jìn)行數(shù)據(jù)加工和大數(shù)據(jù)分析,實現(xiàn)學(xué)生行為分析、學(xué)生畫像、學(xué)生異常狀態(tài)預(yù)警等功能,全面掌握學(xué)生情況,以便及時、準(zhǔn)確地應(yīng)對突發(fā)事件與公共危機(jī);及早識別學(xué)業(yè)預(yù)警、心理異常、沉迷游戲的學(xué)生,提升學(xué)生素質(zhì);對發(fā)展態(tài)勢做出準(zhǔn)確預(yù)測和判斷,提前預(yù)警、及時干預(yù)、消除隱患,等等,顯得尤為重要[3]。因此,擬結(jié)合大數(shù)據(jù)和無線網(wǎng)絡(luò)技術(shù),研究校園智慧決策系統(tǒng)相關(guān)技術(shù)和實現(xiàn)方法,為學(xué)校領(lǐng)導(dǎo)、管理部門等提供科學(xué)決策和智慧決策。
北方工業(yè)大學(xué)無線網(wǎng)絡(luò)服務(wù)于全校學(xué)生和教職工,約13000多人,截至2018年6月,共部署無線AP點位3780個,最大同時接入終端總數(shù)超過7000個,無線網(wǎng)絡(luò)流量峰值超過2GBps。目前,北方工業(yè)大學(xué)數(shù)字化校園建設(shè)和信息化建設(shè)都比較完善,包括一卡通系統(tǒng)、教務(wù)系統(tǒng)、OA辦公系統(tǒng)、網(wǎng)絡(luò)教學(xué)平臺、圖書館管理系統(tǒng)、人事系統(tǒng)、科研管理系統(tǒng)、上網(wǎng)認(rèn)證系統(tǒng)、資產(chǎn)管理系統(tǒng)、數(shù)據(jù)交換平臺、財務(wù)系統(tǒng)等,并且學(xué)校已對部分業(yè)務(wù)系統(tǒng)數(shù)據(jù)進(jìn)行了整理及標(biāo)準(zhǔn)化。
北方工業(yè)大學(xué)積累了海量的教育數(shù)據(jù),即學(xué)生服務(wù)類數(shù)據(jù)、學(xué)校管理類、教學(xué)類以及設(shè)備類的數(shù)據(jù)都比較豐富。但是學(xué)校還未有效利用相關(guān)數(shù)據(jù)進(jìn)行挖掘分析,為學(xué)校展示學(xué)生、教師以及資產(chǎn)的相關(guān)信息。另外,校領(lǐng)導(dǎo)無法及時掌握學(xué)校業(yè)務(wù)數(shù)據(jù)、學(xué)生管理數(shù)據(jù),這就需要建立各類預(yù)警模型,例如針對學(xué)生、教師信息呈現(xiàn),促進(jìn)學(xué)校教學(xué)、科研提升、校園管理等。因此擬通過建設(shè)全量及增量原始大數(shù)據(jù)倉庫,并針對數(shù)據(jù)源進(jìn)行標(biāo)準(zhǔn)化和建模清洗,構(gòu)建服務(wù)學(xué)生、教師和領(lǐng)導(dǎo)的校園智慧決策系統(tǒng)。
本研究擬利用無線網(wǎng)絡(luò)和各業(yè)務(wù)系統(tǒng)(教務(wù)、科研、人事、財務(wù)、卡務(wù)、網(wǎng)絡(luò))的結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)(無線網(wǎng)絡(luò)日志),進(jìn)行數(shù)據(jù)整合、數(shù)學(xué)建模分析,對學(xué)生狀態(tài)、學(xué)生異常行為等做出準(zhǔn)確預(yù)判或預(yù)測,為校領(lǐng)導(dǎo)和管理部門等提供詳盡的數(shù)據(jù)支撐和科學(xué)決策。
首先,利用教室、圖書館、餐廳、宿舍內(nèi)安裝的校園無線,從無線AP獲取學(xué)生的在線用戶信息,包括上網(wǎng)賬號、上網(wǎng)IP、MAC地址等結(jié)構(gòu)化數(shù)據(jù),進(jìn)行數(shù)據(jù)分析,確定學(xué)生軌跡,進(jìn)行上網(wǎng)行為分析、逃課行為分析、課堂出勤分析和疑似失聯(lián)預(yù)警等預(yù)測預(yù)警。其次,利用各業(yè)務(wù)系統(tǒng)(教務(wù)、科研、人事、財務(wù)、卡務(wù)、網(wǎng)絡(luò))的結(jié)構(gòu)化數(shù)據(jù),進(jìn)行數(shù)據(jù)整合、數(shù)據(jù)建模和統(tǒng)計分析,對學(xué)校輿情、學(xué)業(yè)預(yù)警、沉迷游戲、疑似貧困學(xué)生、教師畫像等做多維呈現(xiàn)和準(zhǔn)確預(yù)測預(yù)判。最后,結(jié)合上述分析預(yù)測結(jié)果,開發(fā)領(lǐng)導(dǎo)駕駛艙,將領(lǐng)導(dǎo)關(guān)注的板塊進(jìn)行展現(xiàn),為領(lǐng)導(dǎo)和管理部門提供全方位的科學(xué)決策和智慧決策。
我校無線AP包括華為和思科2個品牌,在無線AC上可以實時獲取每個AP的在線用戶信息,如圖1所示。無線AP的在線用戶信息包括用戶名、接入終端MAC地址,接入IP地址和接入AP名稱,輸入某個無線AP,可以直接查找該AP的在線用戶信息。目前,華為和思科的無線AC均提供第三方接口,可以供用戶直接調(diào)用,獲取無線AP的實時在線用戶信息。
我校信息門戶和數(shù)據(jù)中心已經(jīng)建設(shè)完成,信息門戶已經(jīng)集成了包括一卡通系統(tǒng)、教務(wù)系統(tǒng)、OA辦公系統(tǒng)、網(wǎng)絡(luò)教學(xué)平臺、圖書館管理系統(tǒng)、人事系統(tǒng)、科研管理系統(tǒng)、上網(wǎng)認(rèn)證系統(tǒng)、資產(chǎn)管理系統(tǒng)、數(shù)據(jù)交換平臺、財務(wù)系統(tǒng)等,而且大部分業(yè)務(wù)系統(tǒng)已經(jīng)建設(shè)多年。目前,學(xué)校已經(jīng)對部分?jǐn)?shù)據(jù)進(jìn)行了整理及標(biāo)準(zhǔn)化,積累了海量的教育數(shù)據(jù),即學(xué)生服務(wù)類數(shù)據(jù)、學(xué)校管理類、教學(xué)類以及設(shè)備類的數(shù)據(jù)都比較豐富。
對各業(yè)務(wù)系統(tǒng)結(jié)構(gòu)化數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗及標(biāo)準(zhǔn)化處理,如認(rèn)證計費系統(tǒng)、互聯(lián)網(wǎng)絡(luò)數(shù)據(jù)等海量分散數(shù)據(jù)進(jìn)行清洗預(yù)處理,并分析適配,形成數(shù)據(jù)分析表、入庫存儲,對傳統(tǒng)的關(guān)系型數(shù)據(jù)庫,也包括XML等半結(jié)構(gòu)化數(shù)據(jù),以及以視頻、音頻、文本和其他形式存在的非結(jié)構(gòu)化數(shù)據(jù),將如殘缺數(shù)據(jù)、錯誤數(shù)據(jù)和重復(fù)數(shù)據(jù)進(jìn)行處理,把結(jié)果集入庫,并記錄清洗結(jié)果,形成標(biāo)準(zhǔn)化數(shù)據(jù)庫倉庫,最后通過建模分析,針對模型建立模型分析主題數(shù)據(jù)倉庫。
圖1 無線AP在線用戶信息
在獲取結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)后,需要對建立的數(shù)據(jù)倉庫進(jìn)行數(shù)據(jù)整合,并采用建模和統(tǒng)計分析等算法進(jìn)行數(shù)據(jù)分析,例如關(guān)聯(lián)和推薦、深度機(jī)器學(xué)習(xí)、統(tǒng)計、分類、聚類、回歸、貝葉斯等算法[4,5]。下面以學(xué)業(yè)預(yù)警預(yù)測模塊為例,分別使用回歸算法、貝葉斯方法、人工神經(jīng)網(wǎng)絡(luò)等3種不同的預(yù)測算法,進(jìn)行1萬次以上的機(jī)器訓(xùn)練,得出學(xué)業(yè)預(yù)警預(yù)測準(zhǔn)確率如表1所示(僅列出8次結(jié)果),可以看出人工神經(jīng)網(wǎng)絡(luò)算法的準(zhǔn)確率明顯高于回歸算法與貝葉斯方法。
表1 學(xué)業(yè)預(yù)測預(yù)警模塊不同算法預(yù)測準(zhǔn)確率對比分析
基于大數(shù)據(jù)和無線網(wǎng)絡(luò)的校園智慧決策系統(tǒng)包含學(xué)生行為分析、學(xué)生畫像、學(xué)生異常狀態(tài)預(yù)警等功能,下面以學(xué)生行為軌跡分析模塊為例,闡述結(jié)合大數(shù)據(jù)和無線網(wǎng)絡(luò)的具體實現(xiàn)方法。通過校園無線獲取終端用戶的MAC地址,與計費認(rèn)證系統(tǒng)結(jié)合獲取終端用戶賬號,然后與校內(nèi)地圖結(jié)合,實現(xiàn)對校內(nèi)人員行為軌跡分析,實現(xiàn)終端軌跡定位和用戶信息分步定位,追蹤各師生在校園的Wi-Fi軌跡情況,以及全校的行為軌跡分析地圖,同時實時監(jiān)控校園的人員分布和流向。經(jīng)過大數(shù)據(jù)分析,可預(yù)測未來24小時內(nèi)的人流密集程度,以便于及時發(fā)現(xiàn)潛在的風(fēng)險與問題,校園智慧決策系統(tǒng)軌跡分析模塊運(yùn)行效果如圖2所示。
圖2 校園智慧決策系統(tǒng)軌跡分析模塊運(yùn)行效果
隨著高等教育事業(yè)快速發(fā)展,各高校的日常管理工作變得更加繁重,針對學(xué)校管理中面臨的綜合管理難度大、學(xué)生管理問題多、信息孤島、學(xué)校對學(xué)生感知不全面等問題,本著“用數(shù)據(jù)說話、用數(shù)據(jù)決策、用數(shù)據(jù)管理、用數(shù)據(jù)創(chuàng)新”實現(xiàn)基于數(shù)據(jù)的科學(xué)決策為根本目的[6],本研究結(jié)合大數(shù)據(jù)和無線網(wǎng)絡(luò)技術(shù),研究校園智慧決策系統(tǒng),實現(xiàn)學(xué)生生活行為和學(xué)習(xí)行為等的智能管理和智慧決策,為領(lǐng)導(dǎo)決策等提供數(shù)據(jù)支撐和可視化參考。
基于大數(shù)據(jù)和無線網(wǎng)絡(luò)的校園智慧決策系統(tǒng),不僅能進(jìn)一步提升我校日常管理的科學(xué)化水平,達(dá)到科學(xué)決策、智慧決策的目標(biāo),還可以對發(fā)展態(tài)勢做出準(zhǔn)確預(yù)測和判斷,提前預(yù)警、及時干預(yù)、消除隱患,將有效減少和化解學(xué)校管理中的風(fēng)險點。