王軍 孫蓓
摘? 要:隨著高職院校數(shù)字化建設(shè)的快速推進(jìn),校園一卡通系統(tǒng)成為高職基礎(chǔ)數(shù)據(jù)建設(shè)的方向,也是搜集學(xué)生行為與消費(fèi)狀況的重要手段。當(dāng)前多數(shù)學(xué)生利用校園一卡通服務(wù)平臺(tái),開展校內(nèi)外的餐飲、出行或其他消費(fèi)行為,從而完成大數(shù)據(jù)與學(xué)生行為管理之間的深度對(duì)接。本文以Hadoop開源平臺(tái)架構(gòu)為基礎(chǔ),建立高職學(xué)生行為分析及預(yù)警管理系統(tǒng),對(duì)學(xué)生的日常消費(fèi)行為進(jìn)行預(yù)測(cè)與管理,以實(shí)現(xiàn)學(xué)生信息管理的數(shù)字化、安全化。
關(guān)鍵詞:大數(shù)據(jù);高職學(xué)生;行為分析;預(yù)警機(jī)制
中圖分類號(hào):TP393.18? ? ? ?文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2096-4706(2019)08-0013-03
Abstract:With the rapid advancement of digital construction in higher vocational colleges,the campus card system has become the direction of the construction of high-level basic data,and is also an important means of collecting student behavior and consumption. At present,most students use the campus card service platform to carry out catering,travel or other consumer behaviors inside and outside the school,thus completing the deep connection between big data and student behavior management. Based on the Hadoop open source platform architecture,this paper establishes a behavioral analysis and early warning management system for vocational students to predict and manage students’ daily consumption behaviors,so as to realize the digitization and security of student information management.
Keywords:big data;vocational students;behavior analysis;early warning mechanism
0? 引? 言
大數(shù)據(jù)作為一項(xiàng)海量數(shù)據(jù)存儲(chǔ)與計(jì)算技術(shù),開始廣泛應(yīng)用于高職院校的教學(xué)與行政管理中,校園一卡通即為高職院校信息管理系統(tǒng)的組成部分。校園信息管理系統(tǒng)采用Hadoop分布式任務(wù)調(diào)度模式,從多個(gè)節(jié)點(diǎn)獲取需要處理的數(shù)據(jù)內(nèi)容,并將其分配到不同的虛擬機(jī)平臺(tái),來(lái)實(shí)現(xiàn)對(duì)海量數(shù)據(jù)的并行處理與存儲(chǔ)。通過(guò)將Hadoop大數(shù)據(jù)框架管理模式,引入到一卡通管理系統(tǒng)中,能完成對(duì)學(xué)生日常行為與消費(fèi)的安全管控。
1? 高職學(xué)生日常行為的價(jià)值及大數(shù)據(jù)組織架構(gòu)分析
1.1? 高職學(xué)生行為及校園一卡通消費(fèi)數(shù)據(jù)的價(jià)值
在我國(guó)高職院校智慧化校園建設(shè)的前提下,學(xué)校的日常教學(xué)活動(dòng)、行政管理活動(dòng),都將與校園一卡通系統(tǒng)進(jìn)行關(guān)聯(lián),并在短時(shí)間內(nèi)生成大量的結(jié)構(gòu)化數(shù)據(jù)。這些數(shù)據(jù)主要由教師、學(xué)生、教職工等的行為活動(dòng)而產(chǎn)生,包括教學(xué)、學(xué)習(xí)、飲食、出行或其他消費(fèi)數(shù)據(jù),學(xué)校領(lǐng)導(dǎo)或教師等主體可以登錄網(wǎng)絡(luò)客戶端,查詢自身或其他人的參與教學(xué)、學(xué)習(xí)、公益活動(dòng)等行為,還可以對(duì)自我的行為狀態(tài)或工作價(jià)值進(jìn)行評(píng)估。基于此可以看出,在高職院校校園一卡通系統(tǒng)建設(shè)的過(guò)程中,對(duì)學(xué)生的行為及消費(fèi)數(shù)據(jù)進(jìn)行搜集,可以充分掌握學(xué)生在某一時(shí)間段的學(xué)習(xí)、生活狀況,并據(jù)此制定相應(yīng)的學(xué)生管理策略。
學(xué)校領(lǐng)導(dǎo)可以通過(guò)“校園一卡通”終端管理系統(tǒng),對(duì)教育基礎(chǔ)設(shè)施數(shù)據(jù)、行政管理數(shù)據(jù)、教學(xué)與管理資源數(shù)據(jù)、教師學(xué)生的行為數(shù)據(jù)等,進(jìn)行分層與分步驟管理。針對(duì)高職院校課程教學(xué)、日常生活等場(chǎng)景,構(gòu)建學(xué)生行為分析模型,對(duì)學(xué)生的上課遲到、早退、曠課,以及學(xué)生宿舍出入、大門出入與消費(fèi)狀況進(jìn)行記錄,并上傳至校園一卡通數(shù)據(jù)管理及預(yù)警系統(tǒng)。然后由校園管理者、輔導(dǎo)員等根據(jù)預(yù)警信息,對(duì)學(xué)生的學(xué)習(xí)、生活與消費(fèi)情況作出評(píng)價(jià),從而真正做到學(xué)生行為評(píng)價(jià)的數(shù)字化、公正化。
1.2? 學(xué)生行為分析及預(yù)警系統(tǒng)的Hadoop平臺(tái)架構(gòu)
Hadoop分布式系統(tǒng)基礎(chǔ)架構(gòu),是由Google公司開發(fā)的分布式文件處理與存儲(chǔ)系統(tǒng),其能夠利用較為低廉的硬件,來(lái)完成海量數(shù)據(jù)的訪問(wèn)、處理與存儲(chǔ)。當(dāng)前高職院校使用的Hadoop平臺(tái)組織架構(gòu),通常是以映射、歸約的方式進(jìn)行兩組數(shù)據(jù)的映射操作,并將已經(jīng)完成映射的數(shù)據(jù)進(jìn)行歸約操作。利用Apache Hadoop大數(shù)據(jù)框架,開展海量數(shù)據(jù)的任務(wù)調(diào)度與處理的過(guò)程中,分布式文件系統(tǒng)會(huì)將不同的數(shù)據(jù)內(nèi)容,主動(dòng)分配至不同的主節(jié)點(diǎn)、從節(jié)點(diǎn),主節(jié)點(diǎn)會(huì)優(yōu)先對(duì)提交的用戶數(shù)據(jù)進(jìn)行執(zhí)行,從節(jié)點(diǎn)在數(shù)據(jù)處理過(guò)程中遵從“就近原則”,最終完成所有數(shù)據(jù)命令或指令的操作執(zhí)行。利用Hadoop分布式系統(tǒng)進(jìn)行數(shù)據(jù)計(jì)算,能夠?qū)崿F(xiàn)整個(gè)終端管理內(nèi)部的負(fù)載均衡,并有效保證批量數(shù)據(jù)處理、存儲(chǔ)與管理的高效率化。Apache Hadoop平臺(tái)的基本組織架構(gòu)如圖1所示。
對(duì)于高職學(xué)生日常消費(fèi)情況,以及學(xué)習(xí)、生活行為的分析與管理,可以借助于Hadoop分布式大數(shù)據(jù)系統(tǒng),主動(dòng)對(duì)學(xué)生日常行為的數(shù)據(jù)進(jìn)行搜集,并據(jù)此作出行政事務(wù)、教育教學(xué)等方面管理模式的創(chuàng)新。通過(guò)將學(xué)生日常行為、學(xué)習(xí)情況的數(shù)據(jù)信息,上傳至Apache Hadoop大數(shù)據(jù)分布式系統(tǒng),能夠完成對(duì)海量數(shù)據(jù)的分類與分析,并將最終的預(yù)測(cè)結(jié)果交由管理部門、教師等進(jìn)行處理,然后制定出對(duì)學(xué)生心理輔導(dǎo)、網(wǎng)絡(luò)消費(fèi)行為管理的策略,從而有效防范學(xué)生日常學(xué)習(xí)、生活與消費(fèi)的潛在風(fēng)險(xiǎn)。
2? 大數(shù)據(jù)環(huán)境下高職學(xué)生行為分析的數(shù)據(jù)采集及預(yù)測(cè)模型
2.1? 高職學(xué)生日常行為分析、消費(fèi)狀況的數(shù)據(jù)采集
當(dāng)前高職學(xué)生校園行為、消費(fèi)狀況等數(shù)據(jù)的采集,主要通過(guò)校園一卡通系統(tǒng)、云化ETL工具、網(wǎng)絡(luò)爬蟲等,進(jìn)行結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)的搜集操作。以智慧校園系統(tǒng)為例,校園一卡通系統(tǒng)中的學(xué)生數(shù)據(jù),包括學(xué)生在不同時(shí)間、不同地點(diǎn)的學(xué)習(xí)、生活或消費(fèi)數(shù)據(jù)。從校園一卡通網(wǎng)絡(luò)監(jiān)控平臺(tái)中,獲取到存在關(guān)聯(lián)性的海量數(shù)據(jù)后,要利用決策樹、交叉表格等方式,對(duì)數(shù)據(jù)進(jìn)行分類與預(yù)處理,將其存儲(chǔ)到HDFS分布式系統(tǒng)之中,以保證原始數(shù)據(jù)、關(guān)系型數(shù)據(jù)庫(kù)之間的靈活轉(zhuǎn)換。之后使用Scala語(yǔ)言交互命令,對(duì)不同數(shù)據(jù)信息進(jìn)行類似分組的聚類分析,最后運(yùn)用Hadoop系統(tǒng)對(duì)數(shù)據(jù)進(jìn)行分布式處理與存儲(chǔ)。
而以云化ETL工具、網(wǎng)絡(luò)爬蟲等為主的數(shù)據(jù)采集,是針對(duì)那些碎片化的非結(jié)構(gòu)數(shù)據(jù),借助于多個(gè)網(wǎng)絡(luò)數(shù)據(jù)采集平臺(tái),使用網(wǎng)絡(luò)爬蟲、云化ETL、流數(shù)據(jù)處理(FoxTable)等工具,進(jìn)行網(wǎng)頁(yè)數(shù)據(jù)信息的抓取與采集。因此可得出,多種校園信息系統(tǒng)對(duì)高職學(xué)生行為的分析,通常涵蓋數(shù)據(jù)分類、特征分析、關(guān)聯(lián)性分析與異常分析等,教師在掌握學(xué)生日常學(xué)習(xí)、生活狀態(tài)的情況下,就能夠?qū)ζ浜罄m(xù)的消費(fèi)行為作出預(yù)測(cè)與管理。
2.2? 高職學(xué)生行為分析、消費(fèi)數(shù)據(jù)的預(yù)測(cè)模型
高職管理部門對(duì)學(xué)生校園行為、消費(fèi)數(shù)據(jù)等的分析,需要根據(jù)搜集到的學(xué)生行為軌跡、學(xué)習(xí)情況、消費(fèi)與課下活動(dòng)數(shù)據(jù),來(lái)對(duì)學(xué)生精神狀況、心理健康等進(jìn)行了解,從而實(shí)現(xiàn)學(xué)生個(gè)性喜好、心理狀態(tài)與生活習(xí)慣的深入剖析。在高職學(xué)生行為分析預(yù)測(cè)模型建立的過(guò)程中,應(yīng)先對(duì)不同系統(tǒng)模塊的權(quán)重、分級(jí)指標(biāo)進(jìn)行設(shè)置,通常該預(yù)測(cè)模型包括數(shù)據(jù)感知層、分布式數(shù)據(jù)分析層、數(shù)據(jù)交互服務(wù)層、數(shù)據(jù)可視化層等層次,不同層級(jí)中存在著不同的功能與服務(wù)項(xiàng)目。
圖2? 高職學(xué)生行為分析、消費(fèi)數(shù)據(jù)的預(yù)測(cè)模型
首先數(shù)據(jù)感知層為預(yù)測(cè)模型的最底層,主要負(fù)責(zé)對(duì)學(xué)生一卡通數(shù)據(jù)、上課考勤數(shù)據(jù)進(jìn)行采集。其次,分布式數(shù)據(jù)分析層為數(shù)據(jù)處理、存儲(chǔ)層,負(fù)責(zé)海量數(shù)據(jù)信息的分布式處理與存儲(chǔ)。之后數(shù)據(jù)交互服務(wù)層,通常負(fù)責(zé)學(xué)生行為數(shù)據(jù)的分析與結(jié)果預(yù)測(cè),包括對(duì)學(xué)生行為特征、學(xué)習(xí)與消費(fèi)情況的預(yù)測(cè),通過(guò)對(duì)學(xué)生學(xué)習(xí)狀況、人際交往、行動(dòng)軌跡與消費(fèi)等數(shù)據(jù)的分析,能夠作為后續(xù)學(xué)生行為管理的參考內(nèi)容。而數(shù)據(jù)可視化層是將整理好的預(yù)測(cè)模型,由Web可視化展示平臺(tái)進(jìn)行展示,以方便管理人員動(dòng)態(tài)掌握學(xué)生的行為數(shù)據(jù),具體模型如圖2所示。
3? 大數(shù)據(jù)環(huán)境下高職學(xué)生行為分析的預(yù)警管理機(jī)制研究
高職學(xué)生行為分析的預(yù)警平臺(tái),是以大數(shù)據(jù)云計(jì)算為基礎(chǔ)的數(shù)據(jù)管控系統(tǒng),其主要包含數(shù)據(jù)資源層、數(shù)據(jù)處理層、應(yīng)用層等三個(gè)層級(jí),不同層次又涵蓋一系列的硬件設(shè)備與軟件,多種設(shè)備組件之間的關(guān)聯(lián)作用,可以實(shí)現(xiàn)對(duì)半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)的搜集與處理。
第一,數(shù)據(jù)資源層作為預(yù)警平臺(tái)的最底層,主要用于搜集校園一卡通、教務(wù)系統(tǒng)與網(wǎng)絡(luò)文檔等方面的數(shù)據(jù),在學(xué)生學(xué)習(xí)、日常行為軌跡等數(shù)據(jù)批量化采集完成后,將這些數(shù)據(jù)交由數(shù)據(jù)處理與存儲(chǔ)層進(jìn)行管理。
第二,數(shù)據(jù)處理層中包含Hadoop平臺(tái)、主數(shù)據(jù)倉(cāng)庫(kù)、分布式數(shù)據(jù)庫(kù)等構(gòu)件,不同組成部分分別負(fù)責(zé)數(shù)據(jù)的分類整理、處理與存儲(chǔ)。
第三,應(yīng)用層是包含一系列數(shù)據(jù)挖掘、分析組件的層級(jí),是由FTP、SQL、API、WS、MDX等組件組成的預(yù)警平臺(tái),通常負(fù)責(zé)對(duì)海量數(shù)據(jù)的進(jìn)行實(shí)時(shí)監(jiān)測(cè)、智能預(yù)警,并將最終的數(shù)據(jù)預(yù)警結(jié)果在數(shù)據(jù)報(bào)表中公布,具體如圖3所示。
根據(jù)以上學(xué)生校園行為管理系統(tǒng)可以看出,大數(shù)據(jù)校園管理系統(tǒng)是以基礎(chǔ)大數(shù)據(jù)網(wǎng)絡(luò)平臺(tái)Hadoop為構(gòu)架,搭建起的元數(shù)據(jù)資源管理模型。該模型中包含基礎(chǔ)運(yùn)行環(huán)境、數(shù)據(jù)采集模塊、關(guān)聯(lián)性數(shù)據(jù)運(yùn)算與存儲(chǔ)模塊,以及數(shù)據(jù)分析挖掘模塊、智能預(yù)警與調(diào)度管理模塊,多個(gè)模塊之間的共同作用,可以完成對(duì)校園一卡通數(shù)據(jù)、第三方數(shù)據(jù)的搜集與轉(zhuǎn)化。之后將學(xué)生課堂考勤、學(xué)習(xí)成績(jī)、校園網(wǎng)絡(luò)接入、圖書借閱或消費(fèi)等數(shù)據(jù),轉(zhuǎn)化為元數(shù)據(jù)資源,交由數(shù)據(jù)存儲(chǔ)平臺(tái)進(jìn)行數(shù)據(jù)明細(xì)的記錄、匯總與存儲(chǔ),并上傳至綜合分析挖掘平臺(tái)、智能預(yù)警平臺(tái),以完成對(duì)學(xué)生的日常行為、消費(fèi)數(shù)據(jù)的分析與預(yù)警。最后,高職學(xué)生行為分析預(yù)警系統(tǒng)的應(yīng)用層,負(fù)責(zé)將學(xué)生多方面行為數(shù)據(jù)進(jìn)行挖掘與融合,整理出可視化的數(shù)據(jù)報(bào)表或模型,方便管理人員對(duì)相應(yīng)指標(biāo)的監(jiān)測(cè)、預(yù)警與管理。通過(guò)在校園一卡通消費(fèi)數(shù)據(jù)分析中,使用元數(shù)據(jù)管理、數(shù)據(jù)處理、綜合分析與挖掘、安全預(yù)警與監(jiān)控等管理流程,可以對(duì)學(xué)生未來(lái)行為的發(fā)展做出預(yù)判。
4? 結(jié)? 論
大數(shù)據(jù)云計(jì)算作為互聯(lián)網(wǎng)前沿技術(shù),可以廣泛應(yīng)用到智能網(wǎng)絡(luò)生態(tài)系統(tǒng)的建設(shè)中,并實(shí)現(xiàn)對(duì)海量數(shù)據(jù)信息資源的安全處理與管理。高職學(xué)生校園行為分析與預(yù)警機(jī)制的建設(shè),也要借助于Hadoop大數(shù)據(jù)網(wǎng)絡(luò)框架,進(jìn)行數(shù)據(jù)采集、處理與存儲(chǔ)模塊的構(gòu)建,然后對(duì)得到的校園一卡通數(shù)據(jù)信息進(jìn)行綜合挖掘與分析,才能完成學(xué)生日常學(xué)習(xí)、生活及消費(fèi)行為的智能預(yù)警,并提出相應(yīng)的管理策略對(duì)其作出安全管理與控制。
參考文獻(xiàn):
[1] 劉少偉,趙長(zhǎng)在,雷少飛.基于數(shù)據(jù)分析的學(xué)習(xí)者在線學(xué)習(xí)行為研究 [J].中國(guó)成人教育,2016(23):11-14.
[2] 李超,程罡,石磊.基于層次分析法的在線學(xué)習(xí)行為指標(biāo)體系構(gòu)建 [J].河北廣播電視大學(xué)學(xué)報(bào),2017,22(2):18-21.
[3] 李海洋,吳學(xué)琴.信息化背景下大學(xué)生網(wǎng)絡(luò)學(xué)習(xí)行為實(shí)證研究 [J].重慶科技學(xué)院學(xué)報(bào)(社會(huì)科學(xué)版),2017(12):117-120+136.
[4] 姜強(qiáng),趙蔚,王朋嬌,等.基于大數(shù)據(jù)的個(gè)性化自適應(yīng)在線學(xué)習(xí)分析模型及實(shí)現(xiàn) [J].中國(guó)電化教育,2015(1):85-92.
作者簡(jiǎn)介:王軍(1981-),男,漢族,江蘇南通人,高級(jí)工程師,碩士,研究方向:大數(shù)據(jù)、網(wǎng)絡(luò);孫蓓(1983-),女,漢族,江蘇南通人,助理研究員,碩士,研究方向:學(xué)生行為分析、學(xué)籍管理。