吳楠 胡堯 李小林 王丹 胡娟 李玉凱 舒丹 陳青鳳
摘 要:學生成績是教學評估的一項重要衡量指標,考慮學生考試成績特點提出了一種基于試卷難度系數(shù)變化的GM(1,1)修正模型,并運用此模型對花溪一中考試成績進行預測,實踐證明該修正模型能減少誤差,提升預測精度。
關(guān)鍵詞:成績預測; 發(fā)展灰數(shù);后驗差檢驗; 小誤差概率;難度系數(shù)
中圖分類號:O212
文獻標識碼: A
隨著科技數(shù)據(jù)信息的發(fā)展,探索新的教學方法、前瞻性數(shù)據(jù)化建設(shè)校園是校方義不容辭的責任。合理運用信息技術(shù)能有效地解決教學中許多問題。目前中小學對數(shù)據(jù)的應用多限于成績查詢和一些常規(guī)統(tǒng)計,如平均分、及格率、最高分等。這些描述性統(tǒng)計分析只是某一次考試當前情況的體現(xiàn),無法挖掘數(shù)據(jù)中存在的關(guān)系和規(guī)則,無法根據(jù)現(xiàn)有的各項數(shù)據(jù)預測學生成績以及學生今后發(fā)展趨勢。本文通過與中學老師的溝通,了解中學考試成績展現(xiàn)特性,結(jié)合當前考試形式,對學生成績進行整理分析,通過搭建數(shù)學模型,實現(xiàn)對學生最終中考成績進行預測分析,并選取貴州省貴陽市花溪區(qū)第一中學(簡稱花溪一中)考試成績進行分析,驗證模型有效性。
1 數(shù)據(jù)預處理
數(shù)據(jù)來源于花溪一中2017屆學生初中各次考試成績(以下簡稱學生成績)??紤]中考科目為:數(shù)學、語文、英語、理綜(物理、化學),故選取花溪一中2017屆學生8年級至9年級數(shù)學、語文、英語、物理、化學成績進行整理,統(tǒng)計共634名學生的成績。為方便數(shù)據(jù)讀取和分析,引入一些符號標記對原始各次考試進行重新標記,例如:“數(shù)學分數(shù)81”表示“八年級上學期期末考試成績”,“數(shù)學分數(shù)911”表示“九年級上學期第一次月考數(shù)學成績”,其他類似。表1展現(xiàn)了整理后的數(shù)學成績的部分數(shù)據(jù)。
1.1 缺失值情況分析
數(shù)據(jù)缺失值分布情況與分析結(jié)果息息相關(guān),圖1是數(shù)學考試成績的缺失數(shù)據(jù)情況。圖中,淺色為缺失值,深色為完整數(shù)據(jù),圖(a)體現(xiàn)各次考試的缺失數(shù)據(jù)量,圖(b)展示缺失數(shù)據(jù)在整個數(shù)據(jù)中的位置。數(shù)學成績總數(shù)據(jù)為634×16的數(shù)據(jù)框,其中616名的成績數(shù)據(jù)完整有效,僅18名同學的數(shù)學成績有缺失。缺失值共21個,占總數(shù)據(jù)量10144的0.21%,缺失率小于10%,指標的信息完整度均在理論范圍內(nèi)[1]。
同樣的方法,可得出各科成績數(shù)據(jù)缺失情況如表2所示,數(shù)據(jù)缺失比率均小于10%,故不會影響分析結(jié)果。
1.2 缺失值補齊
結(jié)合花溪一中實際考試成績情況,對學生考試成績進行填補,同一考生缺失數(shù)據(jù)較多的予以剔除,最終建立634名考生成績總表。為便于后期建模分析,選取學生八年級上下學期期末考試成績、九年級全部數(shù)據(jù)及花溪區(qū)區(qū)考成績和貴陽市適應性考試作為最終分析的數(shù)據(jù),并對缺失部分予以補齊。常用的缺失值補齊方法有均值補齊法、中位數(shù)補齊法、眾數(shù)補齊法等,結(jié)合學生成績實際情況,采取均值補齊法。
2 灰色預測模型概述
2.1 灰色預測模型
灰色預測對既含有已知信息又含有不確定信息的系統(tǒng)進行預則,即對在一定范圍內(nèi)變化的、與時間有關(guān)的灰色過程進行預測。灰色預測通過鑒別系統(tǒng)因素之間發(fā)展趨勢的相異程度,并對原始數(shù)據(jù)進行生成處理來尋找系統(tǒng)變動的規(guī)律,生成有較強規(guī)律性的數(shù)據(jù)序列,然后建立相應的微分方程模型,從而預測事物未來發(fā)展趨勢的狀況[2]。
在充分使用數(shù)據(jù)的基礎(chǔ)上,建立GM(1,1)模型,分別對考生各科成績進行預測。
2.2 灰色預測GM(1,1)模型
3.2 基于GM(1,1) 試卷難度系數(shù)修正模型的實現(xiàn)
為提高模型預測精度,通常會選取殘差修正模型,但是在計算殘差時,常常發(fā)現(xiàn)殘差的波動較大,根據(jù)原始數(shù)據(jù)的特征會出現(xiàn)正負交替現(xiàn)象,即使用殘差模型修正,也不能很好地改善擬合效果。通過實踐發(fā)現(xiàn),學生成績數(shù)據(jù)與每次考試的試卷難度系數(shù)息息相關(guān),所以在修正模型的過程中,
得到模型修正預測值后重新驗證模型精度,進行后驗差檢驗,得到新的殘差如表6所示。
類似方法對花溪一中全體同學所有科目進行建模及模型檢驗,部分同學數(shù)學成績的各項指標如表7所示。
經(jīng)計算,所有數(shù)據(jù)的發(fā)展系數(shù)a均小于1,故均可使用GM(1,1)進行建模預測,通過殘差符號結(jié)合難度系數(shù)得到各模型調(diào)整系數(shù)對模型進行修正,最終得到修正后的模型預測值,并進行新的后驗比檢驗,結(jié)果除極少部分同學考試成績波動特別大導致模型預測效果欠佳,其余均顯示模型預測通過后驗比檢驗和小誤差概率檢驗,效果良好。
3.3 花溪一中學生中考成績預測
綜上可以用修正后的GM(1,1)模型分別對花溪一中學生中考單科和總分成績(預測總分加上50分體育成績所得)進行預測。首先對總分進行預測。據(jù)了解,貴陽市今年中考難度系數(shù)在0.75,以該難度系數(shù)為標準,對學生中考成績預測,預測結(jié)果如表8所示(僅選取前50名展示)。
由預測結(jié)果統(tǒng)計:600以上約為30人。據(jù)最終花溪一中公布的2017年中考考試成績(由于資源有限,僅獲取了600以上同學總成績和1班同學的各科目成績),600以上為35人(含加分政策),根據(jù)修正后GM(1,1)模型預測出來的30人均包含在內(nèi)。利用修正后GM(1,1)模型預測的花溪一中學生中考成績分布如圖2所示。
其次,對花溪一中學生中考單科成績進行預測,表9展示部分同學各科成績預測結(jié)果。
為驗證預測結(jié)果的準確率,利用獲得的1班同學的總分及單科成績數(shù)據(jù)對預測結(jié)果進行誤差分析,經(jīng)計算總成績預測的均方誤差為:-4.866;語文、數(shù)學、英語、物理、化學的均方誤差分別為:0.197、0.545、0.258、2.924,平均誤差均不超過5分,說明模型預測效果良好。
4 結(jié)論
從學生成績殘差特性出發(fā),提出一種基于試卷難度系數(shù)變化的GM(1,1)修正模型,這符合“灰色系統(tǒng)理論的研究對象信息不完全,準則具有多重性,模型非惟一性”的特點。且經(jīng)實踐表明,修正后的模型能提升學生成績預測模型精度。在預測學生成績時,可以推廣使用。
參考文獻:
[1]COHEN J,COHEN P,WEST S G, et al.Applied multiple regression/correlation analysis for the behavioral sciences[J].Journal of the Royal Statistical Society, 2003,52(4):691.
[2]楊華龍,劉金霞,鄭斌.灰色預測GM(1,1)模型的改進及應用[J].數(shù)學的實踐與認識,2011,41(23):39-46.
[3]李夢婉,沙秀艷.基于GM(1,1)灰色預測模型的改進與應用[J].計算機工程與應用,2016,52(4):24-30.
[4]羅黨, 劉思峰, 黨耀國. 灰色模型GM(1,1)優(yōu)化[J].中國工程科學,2003,5(8):50-53.
[5]何瑞林. 中考試卷難度系數(shù)7:2:1[N].揚州日報,2008-06-13(A03).
(責任編輯:周曉南)