齊暢 章葉璐 晏建學(xué)
摘 要:學(xué)生成績(jī)是衡量學(xué)生對(duì)課程的掌握情況及教師的教學(xué)效果最直接的指標(biāo),傳統(tǒng)的成績(jī)分析方法是按分?jǐn)?shù)段劃分并根據(jù)正態(tài)分布計(jì)算平均成績(jī)和方差。本文主要從正態(tài)分布模型檢驗(yàn)及聚類分析兩方面入手,利用SPSS軟件對(duì)財(cái)經(jīng)大學(xué)2010學(xué)年至2017學(xué)年部分班級(jí)公共數(shù)學(xué)成績(jī)進(jìn)行分析,更科學(xué)、合理地反映學(xué)生對(duì)課程的掌握情況,并檢驗(yàn)教師的教學(xué)效果。
關(guān)鍵詞:正態(tài)模型檢驗(yàn) 聚類分析 SPSS
基金項(xiàng)目:本文為“第十三屆云南財(cái)經(jīng)大學(xué)本科生科研訓(xùn)練計(jì)劃(SRTP)(項(xiàng)目編號(hào)47《云南財(cái)經(jīng)大學(xué)近年來(lái)公共數(shù)學(xué)成績(jī)聚類分析》)”項(xiàng)目成果。
本文以2010~2017級(jí)部分授課班級(jí)成績(jī)?yōu)槔?,?shù)據(jù)包括學(xué)號(hào)、姓名、班級(jí)編號(hào)、課程名稱、教學(xué)老師、年級(jí)、學(xué)生總成績(jī)等。數(shù)據(jù)情況如下:
首先檢驗(yàn)學(xué)生成績(jī)是否服從正態(tài)分布,然后用聚類分析功能對(duì)學(xué)生成績(jī)進(jìn)行分析,并檢驗(yàn)不同班級(jí)、年級(jí)、教師之間學(xué)生成績(jī)分布差異是否明顯,同一老師所帶不同班級(jí)、不同年級(jí)學(xué)生成績(jī)差異是否明顯,不同老師不同學(xué)院不同班級(jí)學(xué)生成績(jī)差異是否明顯,不同年級(jí)之間學(xué)生成績(jī)差異是否明顯。用聚類分析彌補(bǔ)傳統(tǒng)按分?jǐn)?shù)段劃分及根據(jù)正態(tài)分布計(jì)算平均成績(jī)和方差的不足,更加科學(xué)、合理地反映學(xué)生對(duì)課程的掌握情況及教師的教學(xué)成果。
1 對(duì)數(shù)據(jù)分課程進(jìn)行正態(tài)分布模型檢驗(yàn)
將2010~2017級(jí)的概率論與數(shù)理統(tǒng)計(jì)(理工類)、微積分(經(jīng)管類)、微積分(理工類)、線性代數(shù)(經(jīng)管類)、線性代數(shù)(理工類)這五門不同的公共數(shù)學(xué)課程作為分類的依據(jù)。
分別對(duì)上述課程的學(xué)生成績(jī)進(jìn)行正態(tài)分布模型檢驗(yàn)。按照“分析-描述統(tǒng)計(jì)-探索”的步驟進(jìn)行操作,將“成績(jī)”作為因變量,得到輸出結(jié)果(詳見附錄)。對(duì)數(shù)據(jù)的正態(tài)性進(jìn)行擬合優(yōu)度檢驗(yàn),首先進(jìn)行“數(shù)據(jù)-加權(quán)個(gè)案”操作,再由“分析-非參數(shù)檢驗(yàn)-卡方”進(jìn)行操作,將“成績(jī)”作為因變量,得到輸出結(jié)果(詳見附錄)。
從輸出結(jié)果中,可以看到各個(gè)課程的成績(jī)都沒有均勻地分布在某個(gè)特定的區(qū)間內(nèi),而是存在有很多偏離區(qū)域很大的點(diǎn)。同時(shí),可以看到各個(gè)課程的成績(jī)漸進(jìn)顯著性均為0,而卡方擬合優(yōu)度檢驗(yàn)中,該項(xiàng)值小于0.05即視為不滿足預(yù)期頻數(shù),因此可以得出:成績(jī)沒有服從正態(tài)分布。
2 采用K-Means聚類對(duì)成績(jī)分課程進(jìn)行聚類分析
經(jīng)過多次嘗試,最終確定聚類數(shù)目為3類,以下進(jìn)描述聚類數(shù)目為的聚類結(jié)果。
將上述不同課程的學(xué)成成績(jī)進(jìn)行聚類分析。按照“分析-分類-聚類”步驟操作,將“成績(jī)”作為變量,并將聚類數(shù)設(shè)置3,勾選“保存”中的“聚類成員”“與聚類中心的距離”項(xiàng)目和“選項(xiàng)”中的“每個(gè)個(gè)案的聚類信息”項(xiàng)目,得到輸出結(jié)果。
從輸出結(jié)果中以“概率論與數(shù)理統(tǒng)計(jì)(理工類)學(xué)生成績(jī)聚類分析結(jié)果”為例可以看到,三個(gè)類的聚類中心點(diǎn),分別是29、63、80。最終聚類中心間的距離,第一類與第二類的距離為34.527,第一類和第三類之間的距離為51.458,第二類和第三類之間的距離為16.931。
從輸出結(jié)果還可以看出,在以63為聚類中心點(diǎn)的第二類數(shù)據(jù)樣本數(shù)是最多的,而以80為聚類中心點(diǎn)的第三類數(shù)據(jù)樣本數(shù)次之,以29為聚類中心點(diǎn)的第一類數(shù)據(jù)樣本數(shù)最少。
縱觀另外四組輸出結(jié)果,除了微積分(理工類)和線性代數(shù)(經(jīng)管類)之外,微積分(經(jīng)管類)和線性代數(shù)(理工類)均符合這樣的規(guī)律。因此我們將對(duì)數(shù)據(jù)進(jìn)行分課程、年級(jí)、老師進(jìn)行聚類分析,以期得到一個(gè)普適的規(guī)律。
3 采用K-Means聚類對(duì)成績(jī)分課程、年級(jí)、老師進(jìn)行聚類
通過2010~2017年公共數(shù)學(xué)學(xué)生成績(jī),進(jìn)行分課程、老師、年級(jí),再對(duì)每組數(shù)據(jù)進(jìn)行聚類分析。具體操作步驟如上所述,得到輸出結(jié)果:當(dāng)以課程、年級(jí)、老師作為分類的依據(jù),對(duì)學(xué)生成績(jī)以3個(gè)類進(jìn)行聚類時(shí),基本上剛好可以劃分為不及格,剛及格,高分這三個(gè)類別。其中,不及格的聚點(diǎn)在8~56之間,其中33為眾數(shù)。及格的聚點(diǎn)在60~73之間,其中62、64為眾數(shù)。高分的聚點(diǎn)在75~87之間,其中77為眾數(shù)。自2010年起到2017年的八年中,不及格的學(xué)生成績(jī)雖有略微提高,但是變化不大。及格的學(xué)生成績(jī)則變化較大,提升了6~7分。高分組的學(xué)生成績(jī)比較穩(wěn)定,上下浮動(dòng)不大。同時(shí)從輸出結(jié)果中可以看到教師的不同對(duì)學(xué)生成績(jī)的分布并無(wú)太大影響。
4 采用K-Means聚類對(duì)成績(jī)分課程、老師進(jìn)行聚類
由于考慮到不同老師的教學(xué)方法的不同,將所采集到的數(shù)據(jù)分老師、課程再次進(jìn)行聚類分析。具體操作步驟如上所述,得到輸出結(jié)果如下:
通過對(duì)不同老師相同課程的橫向比較發(fā)現(xiàn):每位老師的各個(gè)課程的橫向比較,學(xué)生成績(jī)的劃分大致相同,且所占比例最多的聚類中心點(diǎn)在成績(jī)65左右。
5 對(duì)數(shù)據(jù)分課程得出的聚類進(jìn)行正態(tài)分布模型檢驗(yàn)
從正態(tài)分布模型中看出雖然整體并不服從正態(tài)分布,現(xiàn)探究是否存在某一定區(qū)域內(nèi)的數(shù)據(jù)服從正態(tài)分布。
將2010~2017級(jí)的概率論與數(shù)理統(tǒng)計(jì)(理工類)、微積分(經(jīng)管類)、微積分(理工類)、線性代數(shù)(理工類)這四門不同的公共數(shù)學(xué)課程對(duì)按3類聚類進(jìn)行聚類分析輸出的結(jié)果再次根據(jù)各自的聚類再次進(jìn)行正態(tài)分布模型檢驗(yàn)。
從輸出結(jié)果中,可以看到各個(gè)課程的每個(gè)聚類成績(jī)都是均勻地分布在某個(gè)特定的區(qū)間內(nèi),并沒有存在有很多偏離區(qū)域很大的點(diǎn)。同時(shí),可以看到各個(gè)課程的成績(jī)漸進(jìn)顯著性,該項(xiàng)值均大于0.05,即視為滿足預(yù)期頻數(shù)。
因此可以得出結(jié)論:各個(gè)課程聚類分析后每個(gè)聚類成績(jī)各自服從正態(tài)分布。
6 對(duì)各個(gè)課程聚類分析后每個(gè)聚類各自再次進(jìn)行K-Means聚類
經(jīng)過多次的嘗試,最終確定聚類數(shù)目仍為3類。
具體操作步驟如上所述,得到的輸出結(jié)果如下所示:
從輸出結(jié)果來(lái)看,通過將各個(gè)課程的聚類分析后得到的每個(gè)聚類再次進(jìn)行聚類分析,聚類中心點(diǎn)以及每個(gè)聚類所占比例均沒有明顯的差別。
7 結(jié)論
本文中共統(tǒng)計(jì)數(shù)據(jù)7854條:概率論與數(shù)理統(tǒng)計(jì)(理工類)課程學(xué)生成績(jī)1871條,微積分(經(jīng)管類)課程學(xué)生成績(jī)1684條,微積分(理工類)學(xué)生成績(jī)1725條,線性代數(shù)(經(jīng)管類)學(xué)生成績(jī)539條,線性代數(shù)(理工類)學(xué)生成績(jī)2035條。
對(duì)所得數(shù)據(jù)通過正態(tài)分布模型檢驗(yàn)得到,學(xué)生成績(jī)并不像預(yù)計(jì)的一樣服從正態(tài)分布。
對(duì)數(shù)據(jù)進(jìn)行聚類分析發(fā)現(xiàn):
基本上每個(gè)課程的學(xué)生成績(jī)都呈現(xiàn)“不及格—及格—高分”這三個(gè)成績(jī)區(qū)間,且處于“及格”區(qū)間的人數(shù)多于其他區(qū)間。
之后,通過課程、老師、年級(jí)分類,再進(jìn)行聚類分析。分析輸出的結(jié)果,發(fā)現(xiàn)不同課程、老師、年級(jí)的學(xué)生成績(jī)基本上剛好可以劃分為“不及格—及格—高分”這三個(gè)類別。其中不及格的聚點(diǎn)在8~56之間,其中33為眾數(shù)。及格的聚點(diǎn)在60~73之間,其中62、64為眾數(shù)。高分的聚點(diǎn)在75~87之間,其中77為眾數(shù)。
自2010年起到2017年的八年中,不及格學(xué)生的成績(jī)雖有略微提高,但是變化不大。及格學(xué)生的成績(jī)則變化較大,提升了6~7分。高分組學(xué)生的成績(jī)比較穩(wěn)定,上下浮動(dòng)不大。
通過課程、老師分類,再進(jìn)行聚類分析。分析輸出結(jié)果顯示,教師的不同對(duì)學(xué)生成績(jī)的劃分并無(wú)太大影響,不同課程對(duì)學(xué)生成績(jī)的劃分也不存在太大的影響。
鑒于通過對(duì)各個(gè)課程的正態(tài)分布模型檢驗(yàn)看到整體雖然不服從正態(tài)分布,但通過對(duì)各個(gè)課程聚類分析后得出的聚類再次進(jìn)行正態(tài)分布模型檢驗(yàn),發(fā)現(xiàn)各個(gè)聚類中的成績(jī)是服從正態(tài)分布。
因此,對(duì)各個(gè)課程聚類分析后每個(gè)聚類各自再次進(jìn)行K-Means聚類。通過輸出結(jié)果可以看到聚類中心點(diǎn)以及每個(gè)聚類所占比例均沒有明顯的差別。由此可得出結(jié)論:不同班級(jí)、年級(jí)、教師之間學(xué)生成績(jī)分布差異不明顯。
綜上所述,近年來(lái),該校學(xué)生公共數(shù)學(xué)成績(jī)60多分人數(shù)居多,80分以上高分人數(shù)相對(duì)較少。原因之一是在時(shí)間安排上,十八周課程一結(jié)束就開始考試,考試時(shí)間、科目密集,學(xué)生缺乏充足的考前復(fù)習(xí)歸納總結(jié)時(shí)間,使得學(xué)生往往考前突擊復(fù)習(xí),導(dǎo)致大部分學(xué)生考試成績(jī)普遍偏低,高分相對(duì)較少;近年來(lái)學(xué)校擴(kuò)招,降低了生源的準(zhǔn)入門檻,導(dǎo)致學(xué)生總體素質(zhì)下降,成績(jī)出現(xiàn)在高分區(qū)間的數(shù)量也就相應(yīng)下降;另外,學(xué)校設(shè)置計(jì)算總成績(jī)的方法是當(dāng)學(xué)生期末成績(jī)高于50分,將平時(shí)、期中、期末成績(jī)加權(quán)平均為總成績(jī),導(dǎo)致總成績(jī)?cè)?0~59分?jǐn)?shù)段的數(shù)據(jù)缺失。
參考文獻(xiàn):
[1]高惠璇.應(yīng)用多元統(tǒng)計(jì)分析[M].北京:北京大學(xué)出版社,2014:1-419.
[2]范金城,梅長(zhǎng)林.數(shù)據(jù)分析[M].北京:科學(xué)出版社,2002:205-241.
[3]薛薇.SPSS統(tǒng)計(jì)分析方法及應(yīng)用[M].北京:電子工業(yè)出版社,2013:1-382.
[4]李春林.應(yīng)用多元統(tǒng)計(jì)分析[M].北京:清華大學(xué)出版社,2013:1-223.
[5]薛薇.統(tǒng)計(jì)分析與SPSS的應(yīng)用[M].北京:中國(guó)人民大學(xué)出版社,2014.1-307.
[6]楊維忠,張?zhí)?SPSS統(tǒng)計(jì)分析與行業(yè)應(yīng)用案例詳解[M].北京:清華大學(xué)出版社,2013:1-412.
[7]馮巖松.SPSS22.0統(tǒng)計(jì)分析應(yīng)用教程[M].北京:清華大學(xué)出版社,2015:1-439.
[8]吳贛昌 概率論與數(shù)理統(tǒng)計(jì)(理工類·第五版) [M].北京:中國(guó)人民大學(xué)出版社,2017:212-217.
[9]戴維·R·安德森.商務(wù)與經(jīng)濟(jì)統(tǒng)計(jì)(第八版)[M].北京:中信出版社,2003:505.
◇責(zé)任編輯 趙麗斌◇