宋楚平 李少芹 蔡彬彬
1(南京科技職業(yè)學(xué)院信息工程學(xué)院 江蘇 南京 210048)2(江蘇工程職業(yè)技術(shù)學(xué)院建筑工程學(xué)院 江蘇 南通 226007)
目前,我國已建成世界上規(guī)模最大的高等教育,在向高等教育普及化和教育大眾化的邁進(jìn)過程中正面臨嚴(yán)峻的挑戰(zhàn),如學(xué)生沉迷于手游、視頻和網(wǎng)絡(luò)小說等,將大量的時(shí)間花在與學(xué)習(xí)無關(guān)的活動(dòng)上;也有部分學(xué)生過度熱衷于課外兼職和社團(tuán)活動(dòng),嚴(yán)重影響了正常的學(xué)習(xí)效果;還有部分學(xué)生面對紛繁的在線學(xué)習(xí)任務(wù)時(shí),止于淺表的學(xué)習(xí)和應(yīng)付,甚至自暴自棄。這些學(xué)生都無一例外地難逃陷入“學(xué)困泥潭”的命運(yùn),最后導(dǎo)致逃學(xué)、棄學(xué)、輟學(xué)、延期畢業(yè)和大面積“清考”等學(xué)習(xí)危機(jī),在浪費(fèi)教育教學(xué)資源的同時(shí),也給個(gè)人、家庭和社會(huì)造成一定程度的傷害,是新勢態(tài)下高校人才培養(yǎng)質(zhì)量問題日益突出的集中體現(xiàn)。令人欣慰的是,高校數(shù)字校園的普及和云計(jì)算、大數(shù)據(jù)、物聯(lián)網(wǎng)和人工智能等各種新興信息技術(shù)與教育的融合發(fā)展,為該問題的解決提供了無限可能。然而,學(xué)習(xí)危機(jī)一直是一個(gè)復(fù)雜的學(xué)習(xí)現(xiàn)象,由于學(xué)生個(gè)體多樣性和差異性的特點(diǎn),受家庭結(jié)構(gòu)、師生關(guān)系、學(xué)習(xí)環(huán)境、學(xué)校管理制度、教育方式和社會(huì)環(huán)境等多因素影響,目前高校還沒有完善的技術(shù)手段對學(xué)習(xí)危機(jī)進(jìn)行監(jiān)控和預(yù)測,這導(dǎo)致學(xué)生管理難度大,學(xué)困生數(shù)量居高不下,畢業(yè)生質(zhì)量呈逐年下降趨勢,影響了學(xué)校的辦學(xué)聲譽(yù)和人才競爭力。因此,針對該問題,立足高等教育教學(xué)現(xiàn)狀和特點(diǎn),利用教育大數(shù)據(jù),從技術(shù)層面和應(yīng)用層面開展學(xué)習(xí)預(yù)警相關(guān)研究,是教育信息化、“智能+教育”下提高高校社會(huì)聲譽(yù)和辦學(xué)效益的必然產(chǎn)物,也是國家戰(zhàn)略層面高等教育創(chuàng)新的必然訴求。
縱觀國內(nèi)外聚焦“學(xué)習(xí)危機(jī)”、“學(xué)習(xí)預(yù)警”或“學(xué)業(yè)預(yù)警”等方面的研究,總體而言,國外比國內(nèi)起步早、實(shí)證研究成果也更為豐富。文獻(xiàn)[1-2]指出:不同群體學(xué)生來自不同地區(qū),具有不同的文化背景,對新環(huán)境的適應(yīng)需要時(shí)間,相比而言新生更容易出現(xiàn)學(xué)習(xí)危機(jī);學(xué)習(xí)動(dòng)機(jī)不足和目標(biāo)評估不清晰都是學(xué)習(xí)危機(jī)學(xué)生的明顯特征,在面對挑戰(zhàn)和困難時(shí),學(xué)困生在學(xué)習(xí)主動(dòng)性方面明顯較低。美國阿拉巴馬大學(xué)、馬里蘭大學(xué)等高校利用多源數(shù)據(jù)對預(yù)測學(xué)困生進(jìn)行了相關(guān)研究和實(shí)踐探索,這對學(xué)生的學(xué)業(yè)成功和學(xué)生保有率有明顯影響[3];歐洲地區(qū)的一些高校建立了專門的學(xué)習(xí)預(yù)警機(jī)構(gòu)、流程和系統(tǒng),對學(xué)生的學(xué)習(xí)興趣、學(xué)習(xí)效能和學(xué)習(xí)能力進(jìn)行評價(jià),并評估學(xué)習(xí)預(yù)警對學(xué)生的積極和消極影響;新加坡、日本的個(gè)別高校建立了家-校-生三位一體的學(xué)習(xí)預(yù)警平臺(tái),根據(jù)學(xué)生的學(xué)習(xí)狀況、出勤和課外活動(dòng)等指標(biāo)定期發(fā)布學(xué)習(xí)風(fēng)險(xiǎn)提示,督促學(xué)生及時(shí)糾正不良學(xué)習(xí)習(xí)慣[4]。國內(nèi)的袁安府等[5]、潘凌理等[6]和王球琳等[7]就學(xué)業(yè)預(yù)警評價(jià)指標(biāo)體系、預(yù)警機(jī)制、預(yù)警保障體系等方面進(jìn)行研究,為學(xué)業(yè)預(yù)警提供了一些理論基礎(chǔ),但現(xiàn)有的相關(guān)研究多集中于邏輯思辨,缺乏系統(tǒng)的理論指導(dǎo)和實(shí)踐層面的實(shí)證研究,側(cè)重于對結(jié)果數(shù)據(jù)的靜態(tài)分析研究,幾乎沒有對過程數(shù)據(jù)的動(dòng)態(tài)研究,研究成果在高校的實(shí)證應(yīng)用也鮮有所聞。綜上,在大數(shù)據(jù)視域下關(guān)于高校學(xué)習(xí)危機(jī)的相關(guān)研究主要存在以下不足。
(1) 缺乏對學(xué)生群體的系統(tǒng)分析?,F(xiàn)有相關(guān)研究多集中于對學(xué)生學(xué)業(yè)結(jié)果的研究,缺乏對學(xué)生有針對性的系統(tǒng)研究,如學(xué)生的心理、性格、家庭情況,以及入校高考成績和職業(yè)抱負(fù)等個(gè)體因素是學(xué)習(xí)的原生動(dòng)力,在一定程度上往往比外界因素更能影響學(xué)生的學(xué)習(xí)成績。另外,不同的高校無論是在教育制度、管理流程、學(xué)習(xí)環(huán)境、授課方式、評價(jià)標(biāo)準(zhǔn)等方面,還是在生源的素質(zhì)、生源結(jié)構(gòu)等方面都存在較大的差異,簡單將研究成果遷用于所有高校學(xué)生的學(xué)業(yè)預(yù)警,無疑是“張冠李戴”、“ 淺嘗輒止”。厘清研究對象有哪些內(nèi)涵、外延數(shù)據(jù),有哪些個(gè)體特征和特定的學(xué)習(xí)環(huán)境是進(jìn)行研究的基礎(chǔ),只有對學(xué)習(xí)危機(jī)進(jìn)行追根溯源,充分認(rèn)識(shí)高校學(xué)生的“本來面目”,才能為學(xué)習(xí)預(yù)警的研究內(nèi)容、研究方式指明方向。
(2) 忽視了大數(shù)據(jù)環(huán)境。隨著教育領(lǐng)域大數(shù)據(jù)的到來和大數(shù)據(jù)的普及,學(xué)習(xí)危機(jī)、學(xué)業(yè)預(yù)警等課題的研究不可避免地置身于大數(shù)據(jù)環(huán)境,忽視甚至擯棄大數(shù)據(jù)環(huán)境的研究必然帶有局限性和視角盲區(qū)。因此要在現(xiàn)有研究的基礎(chǔ)上,采集學(xué)生基本信息、學(xué)習(xí)過程、考核結(jié)果、課外活動(dòng)等多方數(shù)據(jù),實(shí)現(xiàn)校內(nèi)各管理平臺(tái)間的互通互聯(lián),利用數(shù)據(jù)挖掘、智能分析等工具從教育大數(shù)據(jù)中提取、發(fā)現(xiàn)新的信息和知識(shí),提供學(xué)習(xí)預(yù)警和干預(yù)幫扶等服務(wù),為學(xué)習(xí)危機(jī)研究提供新的方法和視角。同時(shí),尤其對于高校教育而言,教、學(xué)、研、做中心分布廣泛,學(xué)生群體數(shù)據(jù)離散度高,學(xué)習(xí)數(shù)據(jù)量大,靜態(tài)數(shù)據(jù)和動(dòng)態(tài)數(shù)據(jù)分隔嚴(yán)重,研究者站在怎樣的視點(diǎn),如何針對大數(shù)據(jù)解決學(xué)習(xí)預(yù)警問題也需要進(jìn)行深入的研究。
(3) 預(yù)警方法單一。Romero等[8]通過抓取在線學(xué)習(xí)平臺(tái)上學(xué)生的信息發(fā)布數(shù)、郵件數(shù)、完成測驗(yàn)數(shù)量、學(xué)生活躍度等指標(biāo)數(shù)據(jù)來預(yù)測學(xué)生期末學(xué)習(xí)危機(jī)趨勢,該方法只利用了學(xué)習(xí)過程數(shù)據(jù),忽視了學(xué)生個(gè)體靜態(tài)基本信息,該預(yù)警視角影響了預(yù)警整體效果;金義富等[9]提出一種基于離群挖掘與分析技術(shù)的課程、課堂、課外數(shù)據(jù)“三位一體”的學(xué)業(yè)預(yù)警方法,通過相似度和離群次數(shù)來判別離群對象進(jìn)而發(fā)現(xiàn)學(xué)習(xí)危機(jī)者,該方法在界定離群對象的關(guān)鍵屬性和離群閾值上缺乏理論指導(dǎo),一定程度上影響了該方法的實(shí)用性;牟智佳等[10]主張從個(gè)人檔案、課堂學(xué)習(xí)行為、網(wǎng)絡(luò)學(xué)習(xí)行為三個(gè)維度獲取預(yù)警數(shù)據(jù)源,構(gòu)建評價(jià)矩陣并計(jì)算各指標(biāo)值權(quán)重,最后通過個(gè)體偏離平均值的幅度來預(yù)測危機(jī)狀態(tài),該方法較全面地考慮了預(yù)警內(nèi)涵和自變量屬性,但在異常個(gè)體較多時(shí)就顯得力不從心;趙惠瓊等[11]通過篩選在線學(xué)習(xí)行為數(shù)據(jù),利用多元線性回歸分析法來預(yù)測學(xué)生學(xué)習(xí)某一課程的績效分類,該方法并不能較好解釋學(xué)生復(fù)雜的學(xué)習(xí)行為,且變量之間可能存在的相關(guān)關(guān)系影響了該方法的有效性;劉博鵬等[12]基于過往課程成績及關(guān)聯(lián)行為特征數(shù)據(jù),利用支持向量機(jī)(SVM)預(yù)測學(xué)生學(xué)習(xí)某門課程的好、中、差三種狀態(tài),但實(shí)際生活中很難界定學(xué)生某行為特征與單一課程的對應(yīng)關(guān)系,因而影響了該方法分析結(jié)論的可信度??傮w來看,學(xué)習(xí)危機(jī)預(yù)測既要考慮個(gè)體信息、生活環(huán)境等靜態(tài)數(shù)據(jù),又要突出學(xué)習(xí)過程大數(shù)據(jù)動(dòng)態(tài)特征,抓住影響因子和預(yù)警方法兩個(gè)關(guān)鍵要素,以信息共享、數(shù)據(jù)挖掘、人工智能技術(shù)為手段,為不同學(xué)生提供個(gè)性化預(yù)警服務(wù),彰顯教育個(gè)性化、精準(zhǔn)化的價(jià)值。
當(dāng)前該領(lǐng)域研究提出了利用貝葉斯網(wǎng)絡(luò)、神經(jīng)網(wǎng)絡(luò)、關(guān)聯(lián)規(guī)則、支持向量機(jī)等數(shù)據(jù)挖據(jù)技術(shù)來創(chuàng)新預(yù)警手段,但由于學(xué)習(xí)危機(jī)本身的復(fù)雜性和技術(shù)應(yīng)用的局限性,預(yù)測效果有待進(jìn)一步提升??紤]到當(dāng)下學(xué)習(xí)預(yù)警具有“大數(shù)據(jù)驅(qū)動(dòng)、非線性變化、預(yù)警分類化”的特征,本研究在甄別學(xué)習(xí)危機(jī)評價(jià)指標(biāo)的基礎(chǔ)上,結(jié)合徑向基函數(shù)(Radial Basis Function,RBF)神經(jīng)網(wǎng)絡(luò),其具有唯一最佳逼近任意連續(xù)函數(shù)、收斂速度快、特別適合解決分類問題的特點(diǎn),經(jīng)過模型對比,決定采用RBF來解決學(xué)習(xí)危機(jī)非線性演變問題的擬合和預(yù)測。
查閱和梳理大量的相關(guān)文獻(xiàn),結(jié)合學(xué)生的基本信息、日常生活、課堂表現(xiàn)、學(xué)業(yè)成績等情況,對學(xué)業(yè)預(yù)警指標(biāo)要素進(jìn)行了初步的選取,并請多位具有教學(xué)教育管理經(jīng)驗(yàn)的老師對指標(biāo)進(jìn)行分析評價(jià),另外結(jié)合專家的意見,增加了在線學(xué)習(xí)這項(xiàng)一級指標(biāo),最終形成上述五個(gè)維度的指標(biāo)體系。根據(jù)“綜合考量成因,抓住關(guān)鍵要素,減低預(yù)測成本,有利問題求解”的原則,將各指標(biāo)要素細(xì)化至容易測量的層級,這樣的降級處理使得最后的指標(biāo)要素更具可操作價(jià)值,同時(shí)為今后的信息搜集奠定了確切的基礎(chǔ)數(shù)據(jù)保障,最后提煉出影響學(xué)習(xí)危機(jī)的22個(gè)評價(jià)指標(biāo)。顯然,各項(xiàng)指標(biāo)對學(xué)習(xí)危機(jī)所作貢獻(xiàn)大小并不一樣,其貢獻(xiàn)權(quán)重系數(shù)采用AHP層次分析法,構(gòu)成22×22的權(quán)重矩陣,各元素值先由召集的專家和教師獨(dú)立打分,再統(tǒng)計(jì)頻次最后集中評議確定,各指標(biāo)及其權(quán)重系數(shù)計(jì)算結(jié)果如表1所示。
表1 評價(jià)指標(biāo)及貢獻(xiàn)權(quán)重系數(shù)
由表1可知,有些指標(biāo)的貢獻(xiàn)系數(shù)相對很小,為抓住關(guān)鍵要素,并考慮到指標(biāo)之間的關(guān)聯(lián)重合性和減少預(yù)測模型的計(jì)算量,將課堂參與度、課堂學(xué)習(xí)任務(wù)完成度兩項(xiàng)指標(biāo)合并為課堂表現(xiàn),過濾掉系數(shù)小于0.01的指標(biāo)項(xiàng)。最后得到心理健康評估、進(jìn)入圖書館頻率、玩游戲時(shí)長、違規(guī)違紀(jì)、課堂出勤情況、課堂表現(xiàn)、期末不及格課程門數(shù)、期末臨界不及格課程門數(shù)、已取必考證書、選修課未修滿學(xué)分、及時(shí)提交學(xué)習(xí)作業(yè)、學(xué)習(xí)作業(yè)成績和參與交流和討論共13項(xiàng)主要指標(biāo)。日常的學(xué)生評價(jià)指標(biāo)數(shù)據(jù)通過智慧校園中的教務(wù)管理、學(xué)業(yè)管理、愛課程等相關(guān)系統(tǒng)自動(dòng)提取,并結(jié)合學(xué)校的學(xué)生預(yù)警自評系統(tǒng)進(jìn)行補(bǔ)充和修正。
RBF神經(jīng)網(wǎng)絡(luò)是由輸入層、隱藏層和輸出層三部分組成的前饋神經(jīng)網(wǎng)絡(luò),其拓?fù)浣Y(jié)構(gòu)如圖1所示。
圖1 RBF網(wǎng)絡(luò)結(jié)構(gòu)
(1) 輸入層的計(jì)算。輸入層直接輸入學(xué)生樣本數(shù)據(jù),樣本數(shù)據(jù)由N×K的矩陣構(gòu)成,其中,N是輸入向量X=(x1,x2,…,xN)的維度,即上述學(xué)習(xí)危機(jī)評價(jià)指標(biāo)個(gè)數(shù),等于輸入層神經(jīng)元個(gè)數(shù),此處N=13,K為樣本數(shù),輸入層節(jié)點(diǎn)到隱藏層節(jié)點(diǎn)的連接權(quán)值為1。
(2) 隱藏層的計(jì)算。隱藏層有m個(gè)節(jié)點(diǎn),節(jié)點(diǎn)激活函數(shù)是徑向基函數(shù)φ(r),徑向基函數(shù)有多種形式,如高斯函數(shù)、反演S型函數(shù)、擬多二次函數(shù)等,此處選高斯函數(shù),則隱藏層節(jié)點(diǎn)j的輸出φj(X)為:
(1)
式中:‖X-cj‖是歐式范數(shù);cj為函數(shù)隱藏層第j個(gè)高斯節(jié)點(diǎn)中心;σj是徑向基函數(shù)的寬度,用來調(diào)節(jié)網(wǎng)絡(luò)靈敏度。在MATLAB中利用NEWRB函數(shù)設(shè)計(jì)近似RBF網(wǎng)絡(luò),設(shè)定網(wǎng)絡(luò)目標(biāo)均方誤差為10-8,m初值為4,迭代訓(xùn)練過程中m加1,直至訓(xùn)練誤差穩(wěn)定在目標(biāo)誤差之下,經(jīng)試驗(yàn),m=9時(shí)網(wǎng)絡(luò)性能較為穩(wěn)定,故隱藏層節(jié)點(diǎn)數(shù)取值為9。
(3) 輸出層的計(jì)算。學(xué)習(xí)危機(jī)的預(yù)警級別有正常、關(guān)注、嚴(yán)重和危險(xiǎn)四個(gè)級別,用數(shù)值1、2、3、4表示,RBF神經(jīng)網(wǎng)絡(luò)的輸出范圍為[1,4],按四舍五入取整對應(yīng)四個(gè)預(yù)警級別,因此輸出層的節(jié)點(diǎn)數(shù)k為1,該節(jié)點(diǎn)的輸出值為:
(2)
式中:wjk為第j個(gè)隱藏層節(jié)點(diǎn)到輸出節(jié)點(diǎn)k的權(quán)值,根據(jù)輸出層的輸出值y就可以得到學(xué)習(xí)危機(jī)的4種分類,從而為學(xué)習(xí)預(yù)警干預(yù)工作提供決策依據(jù)。
(3)
輸入:訓(xùn)練集D={(X1,y1),(X2,y2),…,(Xk,yk)}、BP學(xué)習(xí)率η、訓(xùn)練誤差ΔE、訓(xùn)練總輪數(shù)P、遺傳變異種群數(shù)L、最大迭代次數(shù)K、收斂系數(shù)Pk。/*Xk是第k個(gè)樣本的輸入向量,yk是第k個(gè)樣本的實(shí)際輸出值*/
輸出:(W1,W2,…,Wj,Wk)p。/*p次迭代后網(wǎng)絡(luò)隱藏層、輸出層的權(quán)重向量Wj、Wk*/
1 D的歸一化;/*區(qū)間[0.2,0.8]*/
2 取一組權(quán)重向量種群S0=(W1,W2,…,Wj,Wk);/*Wj為隱藏層第j個(gè)神經(jīng)元的權(quán)重輸入向量,j=1,2,…,9;Wk為輸出層神經(jīng)元的權(quán)重輸入向量,k=1,取值范圍均為[-0.5,0.5]*/
3 repeat
4 for all(W1,W2,…,Wj,Wk)∈Stdo /*t為迭代次數(shù),初值為0*/
5 計(jì)算個(gè)體i被選中概率Pi,用賭輪法選擇新的個(gè)體進(jìn)入下一代St;
6 完成交叉、變異算子操作,形成一組新染色體種群St;
7 end for
8t=t+1;
9 計(jì)算種群均方誤差和E(w)(t);
10 untilE(w)(t)<=Pk‖t>K
11 end repeat
12 得到最優(yōu)個(gè)體的染色體(W1,W2,…,Wj,Wk)1;
13 repeat /*置p=0*/
14 for all (Xi,yi)∈Ddo
16 依式(3)更新(W1,W2,…,Wj,Wk);
17 end for
18p=p+1;
19 計(jì)算樣本的E(w)(p);
20 untilE(w)(p)<=ΔE‖p>P
21 end repeat
基于預(yù)測模型對學(xué)生的學(xué)習(xí)危機(jī)進(jìn)行評估,要經(jīng)歷樣本數(shù)據(jù)采集、模型參數(shù)設(shè)定、模型訓(xùn)練和模型測試4個(gè)階段,其工作流程如圖2所示。
圖2 學(xué)習(xí)危機(jī)預(yù)測流程
(1) 數(shù)據(jù)采集與處理。直接采集的學(xué)習(xí)危機(jī)13項(xiàng)指標(biāo)數(shù)據(jù)(用向量X0表示)不能直接作為網(wǎng)絡(luò)的輸入數(shù)據(jù),必須進(jìn)行歸一化處理,以提高模型訓(xùn)練速度和靈敏性以及有效避免量綱影響,保證模型具有一定的外推能力。歸一化公式如下:
(4)
因?yàn)楦鞣至恐祵W(wǎng)絡(luò)輸出“預(yù)警級別”的貢獻(xiàn)大小是不同的,其對應(yīng)的初始權(quán)重向量W由AHP層次分析法重新計(jì)算來確定,而非采用[-0.5,0.5]內(nèi)的隨機(jī)數(shù),以避免模型訓(xùn)練過程中出現(xiàn)梯度飽和與梯度消失的問題,保證輸出依然有著良好的分布,顯著降低訓(xùn)練時(shí)間。計(jì)算后的值為W={0.012 9,0.013 5,0.068 4,0.052 6,0.014 8,0.010 6,0.280 9,0.085 8,0.110 7,0.076 3,0.030 6,0.229 6,0.013 5}。
(2) 模型參數(shù)設(shè)定。由式(1)和式(2)可知,模型的學(xué)習(xí)包括RBF函數(shù)中心cj、寬度σj和隱藏層與輸出層的連接權(quán)值wjk三個(gè)部分的學(xué)習(xí)。
① 基函數(shù)中心cj。本文采用文獻(xiàn)[13]提出的基于輪廓系數(shù)的自適應(yīng)K-means算法來計(jì)算輸入樣本的各類中心cp,用cp來替代傳統(tǒng)的基于所有樣本的隱藏層各個(gè)高斯節(jié)點(diǎn)中心cj(j=1,2,…,9)。cp的準(zhǔn)則評價(jià)函數(shù)如下:
(5)
式中:n為樣本數(shù);xi表示樣本i和同屬c類的其他樣本之間的平均距離;xi′表示樣本i和其他類所屬樣本平均距離的最小值。顯然,cp越大,所有樣本的類內(nèi)平均距離與類間平均距離的差距越明顯,則說明對樣本的聚類達(dá)到了最優(yōu)效果。
② 基函數(shù)寬度σj。根據(jù)聚類結(jié)果來確定σj,其值等于各聚類中心到訓(xùn)練樣本距離的平均值,由式(1)可知σj表示了m個(gè)基函數(shù)的方差,則其寬度為:
(6)
式中:dmax表示中心cj兩兩之間的最大距離值;m是基函數(shù)個(gè)數(shù)。
③ 連接權(quán)值wjk。在確定隱藏層節(jié)點(diǎn)數(shù)m、高斯函數(shù)中心cj后,利用最小二乘法計(jì)算隱藏層各節(jié)點(diǎn)到輸出層的權(quán)值為:
(7)
式中:cmax為訓(xùn)練后最終的基函數(shù)中心。
(3) 模型訓(xùn)練。從某院校2018畢業(yè)生中抽取200個(gè)學(xué)生樣本,其中順利畢業(yè)的學(xué)生50人,困難畢業(yè)和未畢業(yè)的學(xué)生150人,非順利畢業(yè)包括有補(bǔ)考記錄、學(xué)分不夠、無英語、計(jì)算機(jī)和專業(yè)必考證書等情況。采集該200個(gè)學(xué)生在第四學(xué)期的學(xué)習(xí)記錄數(shù)據(jù),經(jīng)人工標(biāo)注得到50條正常樣本,61條關(guān)注樣本,54條嚴(yán)重樣本,35條危險(xiǎn)樣本共4個(gè)數(shù)據(jù)集,從這4個(gè)數(shù)據(jù)集分別隨機(jī)選取80%共160個(gè)樣本作為訓(xùn)練樣本,余下的作為測試樣本,模型訓(xùn)練中損失函數(shù)Ft的變化如圖3所示,損失函數(shù)Ft為:
(8)
圖3 損失函數(shù)變化曲線
式中:TP為正確分類的學(xué)習(xí)危機(jī)類樣本數(shù);TN為正確分類的正常學(xué)習(xí)狀態(tài)類樣本數(shù);N為總樣本數(shù)。
可見,改進(jìn)的RBF算法比原始RBF算法的訓(xùn)練誤差小,準(zhǔn)確性更高,在網(wǎng)絡(luò)訓(xùn)練方面明顯優(yōu)于原始算法。另外,改進(jìn)算法的訓(xùn)練速度更快,比原始算法具有更快的收斂速度和更小的極小值,這主要得益于更合理的初始權(quán)重向量W和遺傳算法的全局優(yōu)先策略。
(4) 模型測試。為進(jìn)一步評估模型的性能,利用訓(xùn)練后的模型對40個(gè)測試樣本進(jìn)行測試,結(jié)果如圖4所示。
圖4 預(yù)測結(jié)果與實(shí)際結(jié)果關(guān)系圖
可以看出,預(yù)測值與實(shí)際值非常接近,只有5個(gè)樣本的預(yù)測值與實(shí)際值有偏大誤差,2個(gè)關(guān)注樣本被錯(cuò)分到嚴(yán)重類,2個(gè)嚴(yán)重樣本錯(cuò)分到危險(xiǎn)類,1個(gè)正常樣本錯(cuò)分到關(guān)注類。分類結(jié)果整體呈現(xiàn)偏大的趨勢,學(xué)習(xí)危機(jī)預(yù)測偏于保守,這可能與學(xué)習(xí)危機(jī)評價(jià)中突出“差表現(xiàn)”的貢獻(xiàn)、重視“危害程度”有關(guān),說明模型的訓(xùn)練精度能滿足學(xué)習(xí)危機(jī)預(yù)測要求;預(yù)測值與實(shí)際值的總體發(fā)展趨勢基本一致,較好反映了學(xué)習(xí)危機(jī)的實(shí)際演變規(guī)律,說明模型具有較好的泛化能力,預(yù)測結(jié)果應(yīng)用于危機(jī)干預(yù)較為理想。
將發(fā)生學(xué)習(xí)危機(jī)定為正類,非學(xué)習(xí)異常定為負(fù)類,測試樣本的正確率A和召回率R分別為:
這說明模型的整體分類精度較高,針對學(xué)習(xí)危機(jī)趨勢預(yù)測這樣的應(yīng)用場景,上述分類精度完全能夠滿足預(yù)警工作要求,對于發(fā)生的學(xué)習(xí)危機(jī)該模型均能夠識(shí)別,說明模型對學(xué)習(xí)危機(jī)的敏感性高,正確識(shí)別能力強(qiáng)。
第一時(shí)間獲知學(xué)習(xí)預(yù)警情報(bào)是高等院校在教育教學(xué)中必須面對的一個(gè)現(xiàn)實(shí)問題。本文在分析學(xué)習(xí)危機(jī)成因和評價(jià)指標(biāo)的基礎(chǔ)上,結(jié)合數(shù)據(jù)挖掘技術(shù),提出了一種學(xué)習(xí)危機(jī)預(yù)測方法,為學(xué)習(xí)預(yù)警的情報(bào)偵測提供了一種智慧手段和方法。但學(xué)習(xí)危機(jī)是一個(gè)已知和未知、規(guī)律性和突發(fā)性并存的問題,想利用現(xiàn)有的智慧校園觀測數(shù)據(jù)來準(zhǔn)確預(yù)測未來的學(xué)習(xí)危機(jī)發(fā)展趨勢仍有困難,如果將學(xué)習(xí)危機(jī)量化過程與學(xué)生的學(xué)習(xí)考核和相關(guān)管理標(biāo)準(zhǔn)進(jìn)行精準(zhǔn)對接來提高樣本質(zhì)量,并進(jìn)一步考慮優(yōu)化模型算法勢必會(huì)提高模型預(yù)測精度和泛化能力,這也是下一步要研究的問題??傊?,在智慧教育2.0支撐下的高校學(xué)習(xí)生態(tài)發(fā)生了全面和深度的變化,面對學(xué)習(xí)危機(jī)問題,要抓住高等教育的內(nèi)涵和特征,以教育的“大數(shù)據(jù)”為基礎(chǔ),以學(xué)校系統(tǒng)和社會(huì)系統(tǒng)的“聯(lián)通共享”為要義,以教育大數(shù)據(jù)的“挖掘”為策略,以學(xué)習(xí)監(jiān)測的“智能智慧”為驅(qū)動(dòng),建設(shè)科學(xué)立體的學(xué)習(xí)危機(jī)情報(bào)系統(tǒng),為真正實(shí)現(xiàn)個(gè)性化教育提供技術(shù)支持和精準(zhǔn)供給服務(wù)。