李有增 曾浩
摘要:隨著高校信息化建設(shè)的發(fā)展,“校園大數(shù)據(jù)”被越來(lái)越多的人關(guān)注,將大數(shù)據(jù)技術(shù)和教育資源相結(jié)合,是互聯(lián)網(wǎng)時(shí)代信息科技帶給智慧校園建設(shè)的新思路、新方法和新途徑。然而在智慧校園建設(shè)中還存在著現(xiàn)有數(shù)據(jù)標(biāo)準(zhǔn)不統(tǒng)一、數(shù)據(jù)孤島現(xiàn)象突出、數(shù)據(jù)資源利用不到位等問(wèn)題。為有效解決以上問(wèn)題,該文設(shè)計(jì)開(kāi)發(fā)了校園大數(shù)據(jù)分析平臺(tái),并構(gòu)建包含學(xué)生基本信息、課堂學(xué)習(xí)、課外學(xué)習(xí)、校園生活、娛樂(lè)五個(gè)維度的學(xué)生行為分析模型,將校園大數(shù)據(jù)技術(shù)運(yùn)用到學(xué)校的科研、教學(xué)、管理和服務(wù)等各個(gè)方面,促進(jìn)學(xué)校綜合治理能力的全面提升。最后,以北京某高校智慧校園建設(shè)實(shí)踐為例,從學(xué)校宏觀(guān)決策、校園管理和服務(wù)、個(gè)性化教學(xué)、貧困生分析與資助等不同角度開(kāi)展大數(shù)據(jù)應(yīng)用的效果分析。經(jīng)在該校應(yīng)用試驗(yàn)效果看,基于學(xué)生行為分析模型的高校智慧校園教育大數(shù)據(jù)應(yīng)用值得在教育領(lǐng)域普遍推廣。
關(guān)鍵詞:智慧校園;大數(shù)據(jù);個(gè)性化教學(xué);學(xué)習(xí)行為分析
中圖分類(lèi)號(hào):G434 文獻(xiàn)標(biāo)識(shí)碼:A
習(xí)近平同志指出:“教育興則國(guó)家興,教育強(qiáng)則國(guó)家強(qiáng)?!蔽覈?guó)一直都高度重視教育事業(yè)的發(fā)展,黨的十九大報(bào)告中也明確提出“優(yōu)先發(fā)展教育事業(yè)”。多年來(lái)的教育信息化建設(shè),支撐和引領(lǐng)了我國(guó)教育現(xiàn)代化發(fā)展,有力推動(dòng)了教育理念更新、模式變革和體系重構(gòu)。
隨著大數(shù)據(jù)、物聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)等新型信息技術(shù)的廣泛應(yīng)用,高校信息化已經(jīng)從“數(shù)字化”走到了“智慧化”的路口,邁入了一個(gè)新的階段一智慧校園。其中,大數(shù)據(jù)作為智慧校園建設(shè)的關(guān)鍵支撐技術(shù),對(duì)智慧校園建設(shè)具有無(wú)可替代的作用。大數(shù)據(jù)是指那些規(guī)模大到傳統(tǒng)的軟件工具無(wú)法采集、存儲(chǔ)和分析的數(shù)據(jù)集,擁有“4V”特點(diǎn)(即Volume,Varity,Velocity,Value)。大數(shù)據(jù)服務(wù)學(xué)校管理領(lǐng)域關(guān)鍵在于啟發(fā)和輔助決策。智慧校園所建設(shè)的各類(lèi)系統(tǒng)數(shù)據(jù)全部匯聚到大數(shù)據(jù)交換平臺(tái)之中,將海量的異構(gòu)多維校園數(shù)據(jù)進(jìn)行接入、共享、分發(fā)和挖掘應(yīng)用。通過(guò)大數(shù)據(jù)綜合分析,掌握校園里師生的行為規(guī)律和學(xué)校的整體運(yùn)行水平,對(duì)學(xué)校整體教學(xué)科研形勢(shì)和發(fā)展態(tài)勢(shì)整體研判、動(dòng)態(tài)監(jiān)測(cè),從被動(dòng)應(yīng)對(duì)到主動(dòng)服務(wù)轉(zhuǎn)型,實(shí)現(xiàn)源頭發(fā)現(xiàn)、智慧服務(wù)。
《教育信息化十年發(fā)展規(guī)劃(2011-2020年)》明確提出,“學(xué)校教育教學(xué)方式的變革要在學(xué)生多樣性、個(gè)性化學(xué)習(xí)方面的改變上取得突破”;“到2020年形成與國(guó)家教育現(xiàn)代化發(fā)展目標(biāo)相適應(yīng)的教育信息化體系,教育信息化強(qiáng)調(diào)的是信息技術(shù)在教育教學(xué)中的普及和廣泛應(yīng)用”。而校園大數(shù)據(jù)的出現(xiàn),為支持個(gè)性化教學(xué)和管理帶來(lái)了可能,也提供了強(qiáng)大的技術(shù)支撐。通過(guò)對(duì)每一個(gè)學(xué)生個(gè)體的日常行為習(xí)慣和學(xué)習(xí)行為特征數(shù)據(jù)進(jìn)行挖掘分析,為校園綜合治理提供數(shù)據(jù)支撐,初步構(gòu)建科學(xué)管理、個(gè)性服務(wù)、智慧應(yīng)用的校園治理新模式。
2013年開(kāi)始,我國(guó)很多研究者開(kāi)始開(kāi)展大數(shù)據(jù)技術(shù)在教育領(lǐng)域的應(yīng)用研究,徐鵬、沈?qū)W珺等多名學(xué)者都開(kāi)始關(guān)注教育與大數(shù)據(jù)技術(shù)的關(guān)系和面臨的挑戰(zhàn)等問(wèn)題。而從2014年開(kāi)始,“教育大數(shù)據(jù)”首次作為文章關(guān)鍵詞出現(xiàn)在眾多研究文獻(xiàn)中。蔣東興、王曉光等大量學(xué)者也將教育大數(shù)據(jù)研究的重點(diǎn)開(kāi)始轉(zhuǎn)向數(shù)據(jù)如何深度應(yīng)用和推進(jìn)教學(xué)改革等課題上。而在近年來(lái)教育數(shù)據(jù)應(yīng)用和實(shí)踐過(guò)程中,仍然存在著現(xiàn)有數(shù)據(jù)標(biāo)準(zhǔn)不統(tǒng)一、數(shù)據(jù)孤島現(xiàn)象突出、數(shù)據(jù)資源利用不到位等問(wèn)題。因此,本文所提校園大數(shù)據(jù)應(yīng)用的研究?jī)?nèi)容主要包括以下幾個(gè)方面。
(一)整合高校基礎(chǔ)數(shù)據(jù)資源。對(duì)高?;A(chǔ)數(shù)據(jù)進(jìn)行有效整合,建設(shè)各類(lèi)標(biāo)準(zhǔn)數(shù)據(jù)庫(kù),包括學(xué)生信息、教師信息、一卡通消費(fèi)數(shù)據(jù)、圖書(shū)館借閱數(shù)據(jù)等基礎(chǔ)數(shù)據(jù)的整合。
(二)實(shí)現(xiàn)對(duì)全校各類(lèi)信息資源的共享。打破學(xué)校內(nèi)部各職能部門(mén)之間的信息壁壘。建立規(guī)范化的數(shù)據(jù)共享協(xié)同機(jī)制,優(yōu)化資源在部門(mén)間的轉(zhuǎn)換、調(diào)度。
(三)開(kāi)展校園大數(shù)據(jù)深度應(yīng)用。對(duì)各類(lèi)學(xué)校教學(xué)和管理數(shù)據(jù)進(jìn)行多維度的復(fù)雜應(yīng)用、分析、挖掘和展示,將這些數(shù)據(jù)精細(xì)化地分析、系統(tǒng)化地歸類(lèi),利用這些數(shù)據(jù)找到真正影響教育的重要因素,進(jìn)而提供更加科學(xué)合理的教學(xué)指導(dǎo)和管理服務(wù)。
為研究解決以上關(guān)鍵問(wèn)題,校園大數(shù)據(jù)分析平臺(tái)采用多層架構(gòu),將大數(shù)據(jù)處理、數(shù)據(jù)交換與共享、基于關(guān)系型和統(tǒng)計(jì)型大數(shù)據(jù)存儲(chǔ)、權(quán)限管理、大數(shù)據(jù)分析挖掘進(jìn)行有效整合,貫通校園大數(shù)據(jù)管理和應(yīng)用的各個(gè)環(huán)節(jié),從而適應(yīng)于多維異構(gòu)環(huán)境下校園大數(shù)據(jù)處理要求,實(shí)現(xiàn)海量數(shù)據(jù)的高效管理。
如圖1所示,在統(tǒng)一的分布式存儲(chǔ)之上數(shù)據(jù)平臺(tái)通過(guò)YARN(Hadoop資源管理器)提供統(tǒng)一的資源管理調(diào)度,結(jié)合LDAP(Lightweight Directory Access Protocol),輕量目錄訪(fǎng)問(wèn)協(xié)議1提供完備的權(quán)限管理控制,不同的部門(mén)可以按需創(chuàng)建計(jì)算集群訪(fǎng)問(wèn)其授權(quán)數(shù)據(jù),包括基于Spark計(jì)算框架的SQL類(lèi)統(tǒng)計(jì)分析應(yīng)用與數(shù)據(jù)挖掘類(lèi)應(yīng)用,以及基于MapReduce計(jì)算框架的應(yīng)用等。同時(shí),平臺(tái)通過(guò)使用Hbase結(jié)合SQL計(jì)算執(zhí)行引擎,為用戶(hù)提供基于SQL的高并發(fā)的查詢(xún)以及分析能力。在數(shù)據(jù)導(dǎo)人與交換方面,數(shù)據(jù)平臺(tái)提供多樣的數(shù)據(jù)導(dǎo)人與交換形式,包括Sqoop提供與關(guān)系型數(shù)據(jù)庫(kù)的數(shù)據(jù)交換以及Kafka消息隊(duì)列集群接收實(shí)時(shí)流數(shù)據(jù)。校園大數(shù)據(jù)分析平臺(tái)具備以下大數(shù)據(jù)服務(wù)能力。
(一)從不同異構(gòu)數(shù)據(jù)源同步數(shù)據(jù)的能力,例如學(xué)校各部門(mén)系統(tǒng)的建設(shè)技術(shù)方案和技術(shù)路線(xiàn)不盡相同,需要有能力匯聚數(shù)據(jù)且方法簡(jiǎn)易可行;
(二)向異構(gòu)數(shù)據(jù)源共享數(shù)據(jù)的能力,能適應(yīng)學(xué)校各部門(mén)的不同需求,根據(jù)共享數(shù)據(jù)的分類(lèi)用不同的方式共享數(shù)據(jù);
(三)易于在線(xiàn)擴(kuò)容的能力,在建設(shè)初期的投入成本可控,隨著項(xiàng)目后期需求的增加,容易擴(kuò)展系統(tǒng)容量和處理能力;
(四)處理海量數(shù)據(jù)分析的能力,例如能基于海量一卡通消費(fèi)信息統(tǒng)計(jì)分析出學(xué)生的用餐、打水、洗澡等行為規(guī)律,從門(mén)禁數(shù)據(jù)中分析出行異常行為,以便更好地服務(wù);
(五)進(jìn)行海量數(shù)據(jù)挖掘的能力,例如能挖掘出具有異常行為特征的學(xué)生之間的關(guān)聯(lián)關(guān)系和關(guān)鍵重點(diǎn)人群的聯(lián)系網(wǎng)絡(luò)圖;
(六)海量數(shù)據(jù)高并發(fā)查詢(xún)檢索的能力,例如提供基礎(chǔ)數(shù)據(jù)給學(xué)校各部門(mén)查詢(xún)檢索,能支持同時(shí)幾千人在線(xiàn)查詢(xún);
(七)支持實(shí)時(shí)流數(shù)據(jù)接入與分析能力,例如根據(jù)門(mén)禁刷卡數(shù)據(jù)和人臉識(shí)別數(shù)據(jù)分析人流密度變化與預(yù)警;
(八)平臺(tái)有開(kāi)放性,能支持各種主流標(biāo)準(zhǔn)接口,例如標(biāo)準(zhǔn)SQL2003和PL/SQL便于應(yīng)用開(kāi)發(fā)和應(yīng)用移植。
依托校園大數(shù)據(jù)分析平臺(tái),本文構(gòu)建了一種以學(xué)生日常行為的五個(gè)關(guān)鍵指標(biāo)為分析維度的學(xué)生行為分析模型,并基于學(xué)生個(gè)性化行為序列節(jié)點(diǎn)分析方法開(kāi)展校園大數(shù)據(jù)應(yīng)用。
本文所采用的學(xué)生個(gè)性化行為序列節(jié)點(diǎn)分析方法首先以個(gè)性心理學(xué)和學(xué)習(xí)分析理論等為基礎(chǔ),構(gòu)建學(xué)生行為分析模型,并通過(guò)基于頻繁模式樹(shù)的數(shù)據(jù)挖掘算法分析挖掘出每一位學(xué)生的知識(shí)掌握水平、學(xué)習(xí)方式偏好、課外興趣、娛樂(lè)生活等個(gè)性化情況,從而實(shí)現(xiàn)更加個(gè)性化的校園管理和服務(wù)。
具體來(lái)說(shuō),通過(guò)對(duì)中、美、英三國(guó)高校學(xué)生事務(wù)管理的對(duì)比研究,依托個(gè)性心理學(xué)、學(xué)習(xí)分析理論和大學(xué)生事務(wù)管理學(xué)等相關(guān)理論,我們構(gòu)建了多維時(shí)空下基于校園時(shí)空大數(shù)據(jù)的學(xué)生行為分析模型(如圖2所示)。該模型涵蓋學(xué)生在校期間的吃、住、行、學(xué)、娛等個(gè)人行為關(guān)鍵信息,從而為教育、服務(wù)和管理等高校學(xué)生事務(wù)管理提供科學(xué)的數(shù)據(jù)支撐。學(xué)生個(gè)性化行為序列節(jié)點(diǎn)分析法則是基于該模型中的學(xué)生基本信息、課堂學(xué)習(xí)、課外學(xué)習(xí)、校園生活、娛樂(lè)五個(gè)維度來(lái)評(píng)估和分析每一名學(xué)生的日常行為情況,依托相關(guān)的系統(tǒng)數(shù)據(jù)庫(kù),對(duì)學(xué)生行為信息進(jìn)行分類(lèi)匯聚,并運(yùn)用校園大數(shù)據(jù)技術(shù)進(jìn)行離散點(diǎn)分析和聚類(lèi)分析,從而形成實(shí)現(xiàn)更加科學(xué)合理的校園綜合治理。
如下頁(yè)表1所示,學(xué)生行為分析模型中的每個(gè)分析維度都有相應(yīng)的評(píng)價(jià)指標(biāo),同時(shí)通過(guò)對(duì)應(yīng)數(shù)據(jù)庫(kù)提供數(shù)據(jù)支撐。以學(xué)生課堂學(xué)習(xí)維度為例,依托選課數(shù)據(jù)、上課數(shù)據(jù)、作業(yè)數(shù)據(jù)、課程平時(shí)成績(jī)、課程期末成績(jī)和互動(dòng)交流評(píng)價(jià)數(shù)據(jù)等數(shù)據(jù)資源,將學(xué)生知識(shí)掌握水平、綜合素質(zhì)和成績(jī)?cè)u(píng)價(jià)等作為課堂學(xué)習(xí)行為分析項(xiàng)。其中,學(xué)生的知識(shí)掌握水平則重點(diǎn)分析學(xué)生對(duì)于所學(xué)課程的掌握和應(yīng)用的能力和水平,兼顧其圖書(shū)借閱信息的分析;綜合素質(zhì)則包含學(xué)生科研能力、創(chuàng)新能力、藝術(shù)修養(yǎng)、心理健康、班級(jí)活動(dòng)等。學(xué)生的成績(jī)?cè)u(píng)價(jià)基于課程平時(shí)成績(jī)、期末成績(jī)、試驗(yàn)成績(jī)以及實(shí)習(xí)成績(jī)綜合評(píng)判。通過(guò)對(duì)學(xué)生課堂學(xué)習(xí)行為的分析,將具有相同學(xué)習(xí)興趣和能力水平的學(xué)生進(jìn)行聚類(lèi),從而為不同民族、不同學(xué)習(xí)偏好、不同能力水平的學(xué)生提供差異化、個(gè)性化的課堂教學(xué)輔導(dǎo)服務(wù)、學(xué)習(xí)推薦以及校園優(yōu)質(zhì)服務(wù)。
通過(guò)在北京某高校開(kāi)展智慧校園建設(shè)的實(shí)踐,我們以該校良鄉(xiāng)校區(qū)作為試驗(yàn)對(duì)象,采用本文所提出的基于學(xué)生行為分析模型的校園大數(shù)據(jù)分析方法,開(kāi)展校園大數(shù)據(jù)應(yīng)用。
通過(guò)整合該校相關(guān)數(shù)據(jù)資源(如表2所示),我們開(kāi)展了以下幾個(gè)方面高校智慧校園教育大數(shù)據(jù)的挖掘分析與應(yīng)用。
(一)為學(xué)校發(fā)展決策提供科學(xué)依據(jù)
通過(guò)對(duì)該校的歷年高基表數(shù)據(jù)進(jìn)行提取、清洗、去噪、整合等,形成能夠支持高基表數(shù)據(jù)分析應(yīng)用的數(shù)據(jù)倉(cāng)庫(kù),為校領(lǐng)導(dǎo)日常管理及對(duì)外信息發(fā)布提供統(tǒng)一、規(guī)范、準(zhǔn)確、及時(shí)的統(tǒng)計(jì)數(shù)據(jù),為學(xué)校雙一流學(xué)科建設(shè)、高層次人才培養(yǎng)、海外人才引進(jìn)、專(zhuān)業(yè)課程設(shè)置、重大科研創(chuàng)新等戰(zhàn)略管理決策提供數(shù)據(jù)支撐(如圖3所示)。
以近10年教職工職稱(chēng)變化情況為例(如圖4所示),通過(guò)大數(shù)據(jù)分析可以發(fā)現(xiàn),該校專(zhuān)任教師數(shù)量逐年增加,教輔人員及工勤人員逐年遞減,這要求學(xué)校應(yīng)加大對(duì)科研教育方面的投入,做好教師教育的保障工作。
(二)實(shí)現(xiàn)科學(xué)化校園管理和服務(wù)
通過(guò)對(duì)該校1400多萬(wàn)條一卡通消費(fèi)流水?dāng)?shù)據(jù)進(jìn)行數(shù)據(jù)挖掘和關(guān)聯(lián)分析(如下頁(yè)圖5所示),可以從學(xué)生消費(fèi)頻次、圖書(shū)館刷卡次數(shù)、學(xué)生教室刷卡打水時(shí)間、宿舍門(mén)禁刷卡數(shù)據(jù)等一卡通的海量數(shù)據(jù)中挖掘分析出一個(gè)學(xué)生的在校和外出習(xí)慣、圖書(shū)借閱、晚自習(xí)時(shí)間等有價(jià)值的行為信息,使學(xué)校對(duì)學(xué)生的學(xué)習(xí)生活情況有了更加理性、清晰的認(rèn)識(shí),引導(dǎo)高校形成健康科學(xué)的學(xué)生培養(yǎng)模式和教學(xué)生活管理方式。
以該校學(xué)生生活習(xí)慣分析結(jié)果為例,學(xué)??稍趯W(xué)生早餐、中餐、晚餐和打水洗澡的高峰時(shí)段,通過(guò)增加窗口、延長(zhǎng)營(yíng)業(yè)時(shí)間、設(shè)立人流疏導(dǎo)屏等方式來(lái)減少人員聚集、等待時(shí)間過(guò)長(zhǎng)等現(xiàn)象。此外,我們基于門(mén)禁數(shù)據(jù)對(duì)學(xué)生夜間未按時(shí)歸校、長(zhǎng)時(shí)間離校未歸等異常情況進(jìn)行預(yù)警;基于學(xué)生一卡通消費(fèi)數(shù)據(jù)分析出受歡迎菜品、餐廳及窗口等學(xué)生就餐喜好情況,從而為相關(guān)食堂改進(jìn)提供更加科學(xué)合理的建議。
(三)個(gè)性化的教學(xué)和管理
我們通過(guò)對(duì)該校師生教學(xué)互動(dòng)和學(xué)生學(xué)習(xí)過(guò)程的大數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘和關(guān)聯(lián)分析,挖掘分析出一個(gè)學(xué)生的學(xué)習(xí)生活行為信息,勾勒出每一名學(xué)生的“個(gè)性化行為畫(huà)像”(如圖6所示),從而指導(dǎo)學(xué)校按照依據(jù)每一名學(xué)生的“個(gè)性化行為畫(huà)像”,針對(duì)每一名學(xué)生提供個(gè)性化的教學(xué)和管理,不斷優(yōu)化完善教學(xué)方式和指導(dǎo)方法。
(四)貧困學(xué)生分析與資助
在個(gè)性化管理服務(wù)方面,通過(guò)校園大數(shù)據(jù)技術(shù),我們開(kāi)展了自動(dòng)篩選受資助對(duì)象等大數(shù)據(jù)應(yīng)用服務(wù),如圖7所示。在該應(yīng)用實(shí)踐中,我們通過(guò)設(shè)定相應(yīng)的受資助對(duì)象尋找策略,基于該校61961名學(xué)生在去年3月至5月的一卡通消費(fèi)數(shù)據(jù),依托兩個(gè)關(guān)鍵參數(shù)(消費(fèi)金額小于10元,消費(fèi)次數(shù)大于10次)找尋該校受資助對(duì)象。通過(guò)數(shù)據(jù)分析,可以發(fā)現(xiàn)3、4、5月份都是刷卡消費(fèi)的金額小于等于10元且消費(fèi)總次數(shù)大于10次為1人,因此推測(cè)受資助對(duì)象為生命科學(xué)學(xué)院的一名專(zhuān)業(yè)碩士。以此為依據(jù),通過(guò)學(xué)校學(xué)生工作處對(duì)該名學(xué)生的情況進(jìn)行核實(shí),開(kāi)展諸如經(jīng)濟(jì)資助、心理疏導(dǎo)等關(guān)愛(ài)行動(dòng),提供勤工助學(xué)崗位,避免學(xué)生因生活費(fèi)用不足引起的就讀困難或心理問(wèn)題的發(fā)生。通過(guò)以上措施,該名貧困生的學(xué)習(xí)生活狀況得到了很大的改善。
在該校智慧校園建設(shè)和實(shí)踐過(guò)程中,學(xué)校也逐步建立了一套完整的校園數(shù)據(jù)應(yīng)用管理制度體系,同時(shí)明確由數(shù)字校園管理中心負(fù)責(zé)校園大數(shù)據(jù)的匯聚、共享和應(yīng)用管理工作,其它各部門(mén)和院系則按權(quán)限開(kāi)展相關(guān)應(yīng)用工作。這些規(guī)章制度的建立,也為校園教育大數(shù)據(jù)的應(yīng)用提供了有力的制度保障。經(jīng)在該校應(yīng)用試驗(yàn)效果看,基于學(xué)生行為分析模型的高校智慧校園教育大數(shù)據(jù)應(yīng)用值得在教育領(lǐng)域普諞推廣。
眾多高校都把智慧校園作為其信息化建設(shè)的重點(diǎn)內(nèi)容,校園大數(shù)據(jù)技術(shù)作為最重要的技術(shù)支撐,可有效提升校園信息化建設(shè)水平和建設(shè)效果。本文所提出的基于學(xué)生行為分析模型的校園大數(shù)據(jù)應(yīng)用,對(duì)海量、異構(gòu)、多維的校園數(shù)據(jù)進(jìn)行清洗、整合、挖掘和應(yīng)用,從中提取出潛在的、有價(jià)值、極具潛在應(yīng)用價(jià)值的信息,為學(xué)校的教學(xué)、科研、后勤、管理、安保等各項(xiàng)工作提供科學(xué)的數(shù)據(jù)支撐,這對(duì)于實(shí)現(xiàn)教育強(qiáng)國(guó)夢(mèng)想具有重要的現(xiàn)實(shí)意義。