李宣冬
摘 要:為了探究素質(zhì)教育的管理模式并將其運用到高職院校的素質(zhì)教育工作中,本文引入了數(shù)據(jù)挖掘技術(shù),將素質(zhì)教育學(xué)分化和數(shù)據(jù)化,從而實現(xiàn)對素質(zhì)教育學(xué)分的分析與評價,為學(xué)生的素質(zhì)教育提供更寬闊的發(fā)展空間和制度保障,使素質(zhì)教育成為高職院校教育教學(xué)工作的有機(jī)組成部分。
關(guān)鍵詞:素質(zhì)教育;學(xué)分制系統(tǒng);決策樹算法;數(shù)據(jù)挖掘
1 概述
素質(zhì)教育教學(xué)過程中,尤其是將學(xué)分制引入素質(zhì)教育中后,相關(guān)數(shù)據(jù)具有數(shù)據(jù)容量大、不完全、有噪聲、隨機(jī)性、模糊性等特點。傳統(tǒng)的數(shù)據(jù)處理方法根本無法勝任如此復(fù)雜的數(shù)據(jù)處理工作,因此必須采用數(shù)據(jù)挖掘相關(guān)技術(shù),提取對素質(zhì)教育發(fā)展有價值的數(shù)據(jù)信息,然后再進(jìn)行更深層次的研究。
2 C4.5決策樹算法在素質(zhì)教育學(xué)分成績評價與分析中的適用性分析
決策樹(Decision Tree)是運用于分類的一種樹型結(jié)構(gòu),可以對未知的數(shù)據(jù)通過分析進(jìn)行分類或預(yù)測。在數(shù)據(jù)挖掘的研究與應(yīng)用中,決策樹是一種經(jīng)常要用到的技術(shù),在數(shù)據(jù)分析和預(yù)測中發(fā)揮著重要作用,決策樹算法是目前應(yīng)用非常廣泛的一種學(xué)習(xí)方法,其中C4.5算法應(yīng)用最廣泛,其既能處理分類問題,又能處理回歸問題,它產(chǎn)生的規(guī)則容易理解,準(zhǔn)確率高。分析學(xué)生素質(zhì)教育成績優(yōu)良與哪些因素有關(guān),屬于預(yù)測中的分類數(shù)據(jù)挖掘。
3 基于C4.5決策樹算法的素質(zhì)教育學(xué)分評價模型的構(gòu)建
3.1 數(shù)據(jù)收集 本文的數(shù)據(jù)由某高職院校學(xué)工部提供,分別取自“會計”與“商務(wù)管理”兩個專業(yè),數(shù)據(jù)源包括學(xué)生的基本信息(來自學(xué)生學(xué)籍管理系統(tǒng))、教師信息(來自教務(wù)管理系統(tǒng))、素質(zhì)教育學(xué)分成績等,然后最終用到的數(shù)據(jù)就是以這三者為基礎(chǔ)的關(guān)系數(shù)據(jù)庫。
3.2 數(shù)據(jù)預(yù)處理 ①數(shù)據(jù)屬性刪除。通過對某高職院校的素質(zhì)教育學(xué)分制應(yīng)用情況進(jìn)行調(diào)研,結(jié)果發(fā)現(xiàn),學(xué)生信息庫中幾張數(shù)據(jù)庫表格中的很多屬性,與其他的數(shù)據(jù)顯然存在著較大的區(qū)別,存在很大的不一致性,是不相關(guān)的,因此必須刪除,以減少后期數(shù)據(jù)挖掘不必要的時間、精力以及財力的浪費。②數(shù)據(jù)屬性泛化:通過對某高職院校的素質(zhì)教育學(xué)分制應(yīng)用情況進(jìn)行調(diào)研,應(yīng)用數(shù)據(jù)泛化原理,對大學(xué)生信息中的“學(xué)分成績”進(jìn)行了泛化處理,3.0分以上為“優(yōu)秀”;2-2.9分之間為“中”;其他為“一般”。到課率泛化為:到課率>=95的為“高”,90%至95%之間的為“中”,<90%的為“低”。教師教學(xué)經(jīng)驗泛化為:具有五年以上教學(xué)經(jīng)歷的為“豐富”,五年以下的為“不豐富”。特長愛好根據(jù)學(xué)生的登記信息對比相關(guān)課程,泛化為“愛好”和“不愛好”。③數(shù)據(jù)清理:通過對某高職院校的素質(zhì)教育學(xué)分制應(yīng)用情況進(jìn)行調(diào)研,結(jié)果發(fā)現(xiàn),雖然學(xué)生信息、教師信息等數(shù)據(jù)相對比較完整,但仍然存在某些記錄不完整、沒有填寫或者填寫錯誤等問題,需要進(jìn)行數(shù)據(jù)清理,針對不同的數(shù)據(jù)類型,采用不同的數(shù)據(jù)清理技術(shù)來處理。
3.3 創(chuàng)建決策樹模型
3.3.1 信息增益率的計算(略)。
根據(jù)公式GainRatio(S,A)=,依次計算出所有屬性的信息增益率:
Gainratio(性別)==0.0024
Gainratio(專業(yè))==0.00006
Gainratio(音樂愛好)=)=0.00005
Gainratio(到課率)=)=0.0794
Gainratio(教師經(jīng)驗)=)=0.0438
3.3.2 遞歸創(chuàng)建決策樹。從以上計算結(jié)果得知,“到課率”屬性的信息增益率最高,因此,“到課率”被選為第一個測試屬性。創(chuàng)建根節(jié)點,用“到課率”標(biāo)記,并根據(jù)它的三個屬性值,引出三個分枝,樣本以此劃分,然后再分別計算各個分枝節(jié)點的劃分,根據(jù)算法繼續(xù)計算,得出當(dāng)“到課率”=“高”時的劃分,如圖1所示。
重復(fù)以上步驟,完成各個分枝的劃分,遞歸得到學(xué)生音樂課學(xué)分成績決策樹模型。如圖2所示。
圖2 ?素質(zhì)教育音樂學(xué)分成績決策樹模型
4 素質(zhì)教育學(xué)分成績評價模型的評估與分析
依據(jù)上述素質(zhì)教育音樂學(xué)分成績決策樹模型,對音樂成績保留的160個樣本進(jìn)行測試,通過測試其準(zhǔn)確率達(dá)到88.75%,通過測試來判斷它的合理性,以檢驗分類規(guī)則的準(zhǔn)確率,由此我們可以看到,經(jīng)過測試,采用C4.5決策樹算法生成的分類規(guī)則的準(zhǔn)確率大于85%,基本符合要求,如果再進(jìn)行適當(dāng)?shù)男藜簦_率會更高。因此該模型較為合理,可以加以應(yīng)用。通過對學(xué)生音樂課成績的分析,得到以下建議:一是到課率對學(xué)生學(xué)習(xí)成績的影響較大,學(xué)生應(yīng)該在學(xué)習(xí)過程中嚴(yán)格遵守學(xué)校的學(xué)習(xí)紀(jì)律,按時上課,端正學(xué)習(xí)態(tài)度,按時完成老師要求完成的學(xué)習(xí)任務(wù)。二是學(xué)生的專業(yè)對學(xué)習(xí)成績也有一定的影響,不同專業(yè)的學(xué)生的性格、愛好都不一樣。三是教師的教學(xué)經(jīng)驗對學(xué)生的學(xué)習(xí)成績影較大,教師應(yīng)該通過各種途徑不斷地豐富自己的教學(xué)經(jīng)驗,提高音樂專業(yè)技能和音樂教學(xué)水平,以此來進(jìn)一步提高學(xué)生的到課率。
綜上所述,C4.5決策樹算法對于素質(zhì)教育學(xué)分成績的分析與評價的應(yīng)用研究具有較好的適用性,通過對成績的分析與評價,可以了解影響學(xué)生成績的主要因素,從而幫助學(xué)生改進(jìn)學(xué)習(xí)方法,輔助教師提高教學(xué)水平,為教學(xué)管理者提供決策依據(jù),從而提高高職院校素質(zhì)教育的整體水平。
參考文獻(xiàn):
[1]杜玉波.全面推進(jìn)素質(zhì)教育,培養(yǎng)高素質(zhì)創(chuàng)新人才[J].中國高教研究,2012,01:1-4.
[2]哈申花,張春生.基于C4.5決策樹學(xué)生成績數(shù)據(jù)挖掘方法[J].內(nèi)蒙古民族大學(xué)學(xué)報(自然科學(xué)版),2010,02:151-152+158.