姜志旺 張紅霞 申晨 劉曉樂
摘? ?要:文章針對不同課程各種課堂記錄數(shù)據(jù)對學(xué)生成績的影響,分析不同課程中的共同規(guī)律,從而得知哪些因素對學(xué)生成績的影響更大,以使智慧課堂更好地指導(dǎo)和管理教學(xué)過程。
關(guān)鍵詞:隨機森林;重要性;學(xué)生成績分類;智慧教學(xué)管理
通過大數(shù)據(jù)挖掘、機器學(xué)習(xí)的相關(guān)技術(shù)深入挖掘智慧教學(xué)爾雅課堂的相關(guān)數(shù)據(jù),挖掘內(nèi)在的規(guī)律和結(jié)論,可以更好地促進智慧教學(xué)管理改革,使教學(xué)管理更加智能化和精準化。在我國當(dāng)前的發(fā)展過程中,許多新型教和學(xué)的模式已經(jīng)逐漸開始出現(xiàn),例如云教育、泛在學(xué)習(xí)、移動學(xué)習(xí)、一對一數(shù)字化學(xué)習(xí),而這些模式的特征均是交互性的、嵌入性的、縮小化的。智慧教育會成為以后教育發(fā)展的突破口與沖擊點,將會直接引起教育方面的改革,包括教育理念的改革、教學(xué)模式的改革、學(xué)習(xí)改革、教學(xué)管理和教學(xué)評價的變革[1]。
本文通過大數(shù)據(jù)、數(shù)據(jù)挖掘?qū)虒W(xué)數(shù)據(jù)進行建模,通過模型建立和數(shù)據(jù)分析來挖掘教學(xué)數(shù)據(jù)中表現(xiàn)出來的規(guī)律,來更好地進行智慧教學(xué)管理改革,這是根本的研究目的。
1? ? 數(shù)據(jù)預(yù)處理
通過爾雅課堂學(xué)習(xí)數(shù)據(jù),提取對本研究有用的數(shù)據(jù),即提取的特征屬性,包括任務(wù)完成率、視頻任務(wù)點完成率、章節(jié)測驗完成率、視頻任務(wù)點學(xué)生觀看時長(單位:min)、章節(jié)測驗平均分、考試完成率、考試平均分、學(xué)習(xí)訪問量等信息,得到如圖1所示的數(shù)據(jù)。
將數(shù)據(jù)進行如下保留信息的轉(zhuǎn)換:
(1)將任務(wù)點完成率、視頻任務(wù)點完成率、章節(jié)測驗完成率、考試完成率轉(zhuǎn)化為2位小數(shù)。
(2)刪除空數(shù)據(jù)與噪音數(shù)據(jù)。
經(jīng)過上述準換,得到最終可用的數(shù)據(jù)如圖2所示。
將學(xué)生記錄按照學(xué)生成績進行分類,98~100分為優(yōu)秀,90~98分為良好,45~90分為合格,0~40分為不合格,對應(yīng)的標簽為0,1,2,3,按照此得到如圖3所示的數(shù)據(jù)。
2? ? 特征值提取
隨機森林是一種有監(jiān)督學(xué)習(xí)算法。首先,對數(shù)據(jù)進行歸一化來統(tǒng)一量綱;其次,研究學(xué)習(xí)記錄信息對學(xué)生成績評級(優(yōu)秀、良好、合格、不合格)的特征貢獻度,即對學(xué)生成績評級的分類結(jié)果,哪些特征對于決定學(xué)生成績評級的貢獻度較高。
本研究需要將隨機森林擬合得到的特征的重要性排序和統(tǒng)計圖,規(guī)定>0.2為可以決定學(xué)生成績的分割線重要性值,以“創(chuàng)新創(chuàng)業(yè)”課程為例,隨機森林得到重要程度數(shù)據(jù)如表1所示。
首先,“創(chuàng)新創(chuàng)業(yè)”課程視頻任務(wù)點學(xué)生觀看時長的重要性最高,為0.529 267 97,高出其他的特征,說明視頻任務(wù)點學(xué)生觀看時長是學(xué)生成績評定的最重要特征。其次,是學(xué)習(xí)訪問量,為0.383 433 07。通過以上統(tǒng)計不難發(fā)現(xiàn),在爾雅課堂中對于學(xué)生成績評級起決定性的就是視頻任務(wù)點學(xué)生觀看時長與學(xué)習(xí)訪問量。
3? ? 學(xué)習(xí)數(shù)據(jù)分類
通過研究特征任務(wù)點完成率、視頻任務(wù)點完成率、章節(jié)測驗完成率、視頻任務(wù)點學(xué)生觀看時長(單位:min)、考試完成率以及學(xué)習(xí)訪問量能否有較高的教師評學(xué)成成績評定價的分類準確率。
需要對數(shù)據(jù)進行分類預(yù)測,預(yù)測的算法可以支持向量機(Support Vector Machine,SVM)算法、邏輯回歸(Logistic Regression,LR)算法、樸素貝葉斯算法、決策樹算法、鄰近算法(K-NearestNeighbor,KNN)算法,要通過分類算法參數(shù)的不斷調(diào)整來規(guī)避過擬合和欠擬合的現(xiàn)象。
調(diào)整好分類器的參數(shù)后,需要對不同分類器進行統(tǒng)計,統(tǒng)計的標準為模型分類準確率,將常用分類器對應(yīng)的模型準確率針對不同課程分別進行統(tǒng)計。其中,“創(chuàng)新創(chuàng)業(yè)”課程分類結(jié)果如表2所示。
如表2所示,基本分類算法的效果都極差,其中,LR的分類效果相對于其他的分類器效果更好一些,為52.38%,原因是數(shù)據(jù)基本為離散數(shù)據(jù),且更符合更偏向于直接線性關(guān)系,所以邏輯回歸有較高的分類準確率。
從上述分類的過程可以得到針對其他課程學(xué)生視頻觀看時長對學(xué)生成績評級的影響可以說起導(dǎo)向性的作用,通過對上述整個分類過程的研究發(fā)現(xiàn),對于第一門課程完整數(shù)據(jù)做分類預(yù)測,分類準確率并沒有預(yù)測的效果好。
4? ? 結(jié)語
在以后的教育管理中應(yīng)該積極關(guān)注本研究結(jié)果中最重要因素:學(xué)生觀看視頻的時長與學(xué)習(xí)訪問次數(shù),觀看視頻時間長的且具有較高學(xué)習(xí)訪問量的學(xué)生成績的等級會更高。
分類結(jié)果給以后的系統(tǒng)發(fā)展優(yōu)化帶來了更加明確的方向,通過輸入這些重要指標的數(shù)值,可以直接、快速地反映出學(xué)生的成績評定,教師快速了解每個學(xué)生在學(xué)習(xí)過程中的進度與知識掌握情況,使智慧教學(xué)的管理系統(tǒng)更加智能化,為今后的教學(xué)管理工作提供更科學(xué)的決策依據(jù)。
[參考文獻]
[1]曹培杰,尚俊杰.未來大學(xué)的新圖景“互聯(lián)網(wǎng)+高等教育”的變革路徑探析[J].現(xiàn)代遠距離教育,2016(5):9-14.
Abstract:In view of the influence of various classroom record data on students performance in different courses, this paper analyzes the common laws in different courses, so as to find out which factors have a greater influence on students performance, so as to make the wisdom classroom better guide and manage the teaching process.
Key words:random forest; importance; classification of students grade; intelligent teaching management