劉麗峰,黃海明
(1.山東理工大學(xué),淄博255049;2.32148 部隊(duì)61 分隊(duì))
學(xué)生的考試成績對在一定程度上能夠反映學(xué)生學(xué)習(xí)狀況,通過分析考試成績的特征,對進(jìn)一步提高學(xué)生的學(xué)習(xí)效率,分析學(xué)生學(xué)習(xí)的規(guī)律,從而能提高培養(yǎng)學(xué)生的質(zhì)量意義重大。學(xué)生的入學(xué)時的基礎(chǔ)知識水平存在客觀的差異,采用固定的標(biāo)準(zhǔn)衡量學(xué)生的學(xué)習(xí)狀況難以反映學(xué)生學(xué)習(xí)的真實(shí)情況,因此建立能夠反映學(xué)生入學(xué)成績差異的考試成績模型對客觀學(xué)習(xí)狀態(tài)有重要意義,對教師掌握學(xué)生學(xué)習(xí)的情況,如何找出影響學(xué)生學(xué)習(xí)成績的相關(guān)因素,為提高教學(xué)工作的效率提供一些理論和事實(shí)依據(jù)。
目前國內(nèi)外學(xué)者對考試成績分析方法、分布特征及其影響因素已經(jīng)進(jìn)行了深入的研究:孫高強(qiáng)利用數(shù)據(jù)分析技術(shù)分析評教成績,再將分析的結(jié)果和結(jié)論通過數(shù)據(jù)可視化的方式進(jìn)行展示[1];陳瀟瀟使用數(shù)據(jù)挖掘知識對學(xué)生的成績進(jìn)行數(shù)據(jù)分析預(yù)測,應(yīng)用Apriori 關(guān)聯(lián)規(guī)則算法挖掘出影響學(xué)生成績的潛在的規(guī)律[2];楊王黎等人研究了學(xué)生考試成績的統(tǒng)計規(guī)律,采用χ2檢驗(yàn)法實(shí)現(xiàn)了成績的正態(tài)性檢驗(yàn),建立了根據(jù)學(xué)生成績評價試卷質(zhì)量的模型[3];劉麗峰提出一種以Zernike 矩模式識別為基礎(chǔ)的工程測量課程分類方法,建立工程測量成績評定的數(shù)學(xué)模型[4]。梁利亭對如何在高職院校的成績分析當(dāng)中使用決策樹算法進(jìn)行了分析[5]。王進(jìn)和陳曉思采用學(xué)校固定效應(yīng)模型,分析不同的班級環(huán)境對學(xué)生學(xué)習(xí)成績造成的影響及其性別差異,研究結(jié)果顯示在較差的學(xué)校中,女生比男生較不易在同伴群體中形成反學(xué)校的認(rèn)知、態(tài)度和行為,因而容易造成學(xué)習(xí)成績上的性別差異[6]。賀超凱和陳云芳通過對現(xiàn)行的學(xué)生平均學(xué)分績點(diǎn)的計算方法進(jìn)行分析,指出了存在的問題,并提出改進(jìn)的計算方法[7]。李金屏等人提出了一個定量的研究學(xué)生成績分布的數(shù)學(xué)模型,該模型可以預(yù)測學(xué)生考試成績的分布規(guī)律[8]。李翔等人利用三次Hermite 樣條和B-spline 構(gòu)造了新的考試成績標(biāo)準(zhǔn)分布函數(shù),并對成績分布特征進(jìn)行了分析[9]。張國才認(rèn)為成績分布模型與學(xué)生人數(shù)、學(xué)生群體和教師的能動性、學(xué)生的素質(zhì)和基礎(chǔ)以及成績評定的標(biāo)準(zhǔn)四方面因素密切相關(guān)。師生的教學(xué)活動可改變成績分布模型,負(fù)偏態(tài)分布具有合理性[10]。鑒于以上文獻(xiàn)的研究發(fā)現(xiàn),考慮學(xué)生的基礎(chǔ)知識水平的研究較少,本文則以入
學(xué)考試成績?yōu)榛A(chǔ)綜合考慮影響學(xué)生考試成績的主、客觀因素,對成績進(jìn)行分析并建立其分布模型。
(1)考試成績的影響因素
根據(jù)影響學(xué)生學(xué)習(xí)的主要因素:自主學(xué)習(xí)、就業(yè)形勢影響、游戲娛樂和基礎(chǔ)知識水平,選擇三個指標(biāo)構(gòu)造加權(quán)平均分函數(shù),其中自主學(xué)習(xí)通過考試成績體現(xiàn),由于考試難度中等,由于本模型中假設(shè)各指標(biāo)相互獨(dú)立,因此在不考慮基礎(chǔ)知識水平差異的情況下,自主學(xué)習(xí)的時間與考試成績(y)成正比。就業(yè)形勢好壞直接反映在招生的人數(shù)上,因此由班級總?cè)藬?shù)(NT)代表這一指標(biāo)。針對游戲、娛樂方面的因素,這里僅考慮影響學(xué)習(xí)成績的游戲、娛樂,由受不及格人數(shù)影響的平均成績反映這一指標(biāo),該指標(biāo)僅在模型結(jié)果分析時應(yīng)用?;A(chǔ)知識水平對學(xué)生學(xué)習(xí)難易程度影響較大,由于學(xué)生學(xué)號(N)跟入學(xué)成績呈反比,即學(xué)號末尾數(shù)值越小,高考成績越高,理論基礎(chǔ)越扎實(shí)。
分析模型評定等級標(biāo)準(zhǔn):根據(jù)成績分布一般服從正態(tài)分布的特點(diǎn),將成績分為三個等級:大于1 倍標(biāo)準(zhǔn)差之外(或?qū)?yīng)學(xué)號加權(quán)平均分)的成績?yōu)閮?yōu)異(Y1),小于60 分(或?qū)?yīng)學(xué)號加權(quán)平均分)的為不及格(Y2),余者為良(Y3)。
定義1 加權(quán)平均分模型(ACG,y=ln(TN+2-N*Si)*Ai):以學(xué)號、學(xué)生總數(shù)為自變量的自然對數(shù)函數(shù),在10 為底的對數(shù)坐標(biāo)軸的雷達(dá)圖表示,成績圖形近似為圓形,該圓上對應(yīng)學(xué)號的點(diǎn)表示良好或中等學(xué)生,圓外部及外切的點(diǎn)成績?yōu)閮?yōu)異,點(diǎn)在外部距離圓越遠(yuǎn)成績越優(yōu)異;反之,內(nèi)部或內(nèi)切的點(diǎn)為不及格,點(diǎn)在內(nèi)部距離圓越遠(yuǎn)成績越差,且要求該函數(shù)為班級學(xué)生成績最優(yōu)或近似最優(yōu)擬合函數(shù)。
(2)影響因素定權(quán)(Si,Ai)
為評定各影響因素在考試成績中的貢獻(xiàn)率,本文采用了兩種方法進(jìn)行確定:區(qū)間法加權(quán)平均分模型(IACG)圖為圓環(huán)通過值域區(qū)間確定[Vmin,Vmax](Rmin=Vmin,Rmin=Vmax),使不及格數(shù)據(jù)位于圓環(huán)的內(nèi)部(Y2<Vmin),成績優(yōu)異數(shù)據(jù)位于圓環(huán)的外部(Y1<Vmax),其余數(shù)據(jù)則位于包含的區(qū)域內(nèi)(Vmin<Y3<Vmax)內(nèi);綜合型加權(quán)平均分模型(CACG)通過最優(yōu)非線性擬合的方法確定各個指標(biāo)的權(quán)重,采用最小二乘法計算學(xué)號N學(xué)生的加權(quán)平均函數(shù)值與其考試成績的殘差,使殘差平方和最小的參數(shù)為最優(yōu)。
圖1“區(qū)間型”加權(quán)平均分模型(IACG)和“綜合型”(CACG)加權(quán)平均分模型
(3)模型優(yōu)化
區(qū)間法(IACG)采用基于和諧度方程的參數(shù)優(yōu)化方法:由步驟(2)確定的指標(biāo)權(quán)重不一定能滿足與全班考試成績的誤差和最小,因此采用和諧方程使其累計和最?。?/p>
上式中,y1N為學(xué)號末尾2 位數(shù)(以下簡稱為學(xué)號)為N個學(xué)生分?jǐn)?shù),GN為學(xué)號N學(xué)生的考試成績,NT為班級學(xué)生總數(shù)。為解決圖形大小變化點(diǎn)值相切隨之改變,選擇1 倍標(biāo)準(zhǔn)差作為點(diǎn)值的起算標(biāo)準(zhǔn)線。
(4)模型分析
定義2 點(diǎn)值比(PVR):加權(quán)平均分函數(shù)曲線上的數(shù)據(jù)之和與全班人數(shù)之比稱為點(diǎn)值比。
利用以上步驟確定的加權(quán)平均分函數(shù)計算各個學(xué)生的加權(quán)平均分,并計算點(diǎn)值比,通過例子和理論證明點(diǎn)值比與平均成績一致性,從而驗(yàn)證模型的有效性。
定理1 點(diǎn)值比(PVR)的百分?jǐn)?shù)與平均分?jǐn)?shù)成正比,在人數(shù)增多的情況下趨近于平均成績。
證明:將全班成績集合TG及其3 個子集(優(yōu)異G、中等M和不及格F)所對應(yīng)的人數(shù)分別設(shè)為Ntg,Ng,Nm,Nf,考試成績用Gi表示,符合正態(tài)分布,可得:
那么PVR 可以表示為:
上式中,a1、a2、a3,分別表示成績優(yōu)異、良好和不及格學(xué)生的平均成績,根據(jù)正態(tài)函數(shù)的概率統(tǒng)計分布特征,在班級考試成績已知時為Ntg、Ng、Nm、Nf常數(shù)。點(diǎn)值比與平均分之差在人數(shù)無限多的情況下是相等的,人數(shù)有限的情況下,點(diǎn)值比逼近平均分,即PVR與平均分(Gˉ)之差(Dap)趨近于零,證明如下:
當(dāng)班級人數(shù)Ntg無限多時Dap趨近于0;反之,根據(jù)正態(tài)分布的性質(zhì),落入兩側(cè)(1 倍標(biāo)準(zhǔn)差、2 倍標(biāo)準(zhǔn)差、3倍標(biāo)準(zhǔn)差之外)的區(qū)域概率為小概率事件(分別為31.74%、4.56%、0.26%),根據(jù)10 個班的統(tǒng)計結(jié)果,以1倍標(biāo)準(zhǔn)差為例,由正態(tài)分布的對稱性,選擇不及格、優(yōu)秀的比例都為0.1587,優(yōu)良和中等的比例為0.6826,據(jù)此可以構(gòu)造隸屬度函數(shù)。
各因素的權(quán)重:
將(9)和(10)式代入公式(8)可得:
上式可以看作3 個直線函數(shù)的合成(圖2):
圖2 成績函數(shù)解析
由圖3 可以看出y1和y3屬于同一函數(shù),區(qū)別僅在于不同的值域,因此可以用一個函數(shù)y4=0.1587*x,x∈(0,60)∪(80,100)表示,因此,y=y2+y4,而y2、y4之和在其值域范圍內(nèi)逐漸靠近,在(130.29,20.68)點(diǎn)函數(shù)y(即Dap)為0。由此命題得證。
定理2 加權(quán)平均函數(shù)(y1N)與擬合加權(quán)平均函數(shù)(y2N)相逼近或成比例關(guān)系,即y1N/y2N=1。證明如下:
由于擬合加權(quán)平均函數(shù)(y2)趨近于考試成績,因此y2趨近于平均成績,因此只要證明加權(quán)平均函數(shù)(y1)趨近于平均成績即可。
由于在一個班級內(nèi)考試成績相差不大的情況下,加權(quán)平均函數(shù)趨近于圓,a1表示加權(quán)平均函數(shù)相對于圓的變化情況,因此a1趨近于零,當(dāng)班級人數(shù)TN 一定時,N/T<1 為小于1 的固定值,因此N/T*a1趨近于零,ln(1+N/T*a1)也趨近于零;由于針對某一班級最優(yōu)加權(quán)平均分模型具有唯一性,因此為a2具有唯一性和不變性,y1趨近于固定值lnT*a2,因此有:
采用區(qū)間法加權(quán)平均函數(shù)模型和綜合法加權(quán)平均模型的計算步驟見圖3。
圖3 IACG(a)和CACG(b)建模
下面采用某職業(yè)大學(xué)的工程測量成績分析區(qū)間法和綜合法加權(quán)平均函數(shù)的應(yīng)用。
本例子采用某職業(yè)大學(xué)2011-2015 屆10 個班工程測量考試成績(不含平時成績和實(shí)驗(yàn)成績),每個班的人數(shù)招生規(guī)模為40 人,女生比例為2.6%~26.4%,在班級總?cè)藬?shù)下降的情況下,呈現(xiàn)逐年上升的趨勢。
(1)考試成績原始數(shù)據(jù)的特征分析
由于學(xué)生考試成績的隨機(jī)性,根據(jù)學(xué)號順序難以找到理想的擬合模型,因此對10 個班級的學(xué)生成績按升序排列,并對排列后的成績進(jìn)行擬合,擬合結(jié)果見表1,相關(guān)系數(shù)(R2)>0.754,屬于強(qiáng)相關(guān),因此加權(quán)平均分函數(shù)選擇自然對數(shù)函數(shù)y=a*ln(x)+b進(jìn)行擬合,其中a表示班內(nèi)成績變化的速率,變化的速率越大說明班級成績差異越大,在不考慮邊遠(yuǎn)地區(qū)招生影響的情況下,學(xué)生之間高分和低分分異明顯,說明部分學(xué)生由于內(nèi)外部因素的影響,部分學(xué)生成績出現(xiàn)大幅度下降,b 表示班級內(nèi)的最低分,比較10 個班的擬合公式發(fā)現(xiàn):b 值有逐年下降的趨勢,也說明考試成績的差距逐年增大。
表1 某職業(yè)大學(xué)10 個班級工程測量擬合函數(shù)比較
(2)加權(quán)評分函數(shù)模型計算結(jié)果
分別采用區(qū)間法加權(quán)評分函數(shù)模型(IACG)和綜合法加權(quán)評分函數(shù)模型(CACG)對10 個班的考試成績進(jìn)行建模,并計算了各個班級分平均考試成績和點(diǎn)值比(表2),兩者的點(diǎn)值比之差最大值為14.29%,最小值為0,平均值為3.72%,由此可見兩者的差異不大,也說明了IACG 是反映學(xué)生成績基礎(chǔ)差異的近似最優(yōu)解。為比較兩者方法的點(diǎn)值比(PVR)與平均成績、和標(biāo)準(zhǔn)差的變化關(guān)系,計算了10 個班級的均值和標(biāo)準(zhǔn)差(圖4)。
圖4 點(diǎn)值比與均值、標(biāo)準(zhǔn)差對比
表2 工程測量考試成績加權(quán)分析函數(shù)統(tǒng)計表
表3 某職業(yè)大學(xué)考試成績加權(quán)平均分?jǐn)M合結(jié)果
均值與由區(qū)間法、綜合法加權(quán)成績加權(quán)模型函數(shù)計算的IACGPVR、CACGPVR 在變化趨勢上都有很好的一致性,說明該模型在1 倍標(biāo)準(zhǔn)差范圍內(nèi)(68.28%)的擬合值能夠在均值上下一定范圍內(nèi)波動,證明了該模型的收斂性和正確性;在數(shù)值上IACGPVR 更加接近平均值,CACGPVR 變化幅度較小,這是由于綜合法加權(quán)成績分析模型要求模型在整體式達(dá)到殘差最小的原因,因此數(shù)值上更趨于10 個班級平均值的均值,而標(biāo)準(zhǔn)差卻與平均值(IACGPVR、CACGPVR)有相反的變化趨勢,這說明考試成績優(yōu)秀的學(xué)生越分散,部分入學(xué)前成績較好的學(xué)生進(jìn)入大學(xué)后由于某些外界因素或主觀對專業(yè)愛好程度的影響,致使學(xué)習(xí)興趣下降,成績出現(xiàn)了大幅度下滑,反之,某些學(xué)生通過個人努力成績有了很大程度提高。
面對著嚴(yán)峻的就業(yè)形勢職業(yè)大學(xué)測繪工程專業(yè)的人數(shù)趨于飽和,也出現(xiàn)了縮招的現(xiàn)象,例如某職業(yè)大學(xué)的由原來的每屆4 個班(每個班40 人以上),下降到兩個班(每個班30 人左右),對5 年內(nèi)10 個采礦工程卓越班的招生人數(shù)進(jìn)行擬合,公式如下:
上式的相關(guān)性(R2=0.7202)達(dá)顯著水平,這是學(xué)校招生方面對就業(yè)形勢的應(yīng)對策略。學(xué)生對就業(yè)前景的擔(dān)憂,表現(xiàn)出專業(yè)課不努力學(xué)習(xí),如轉(zhuǎn)修第二專業(yè)、參加其他社會就業(yè)考試等,減少了用于專業(yè)課的時間,平均考試成績也呈現(xiàn)一定程度的下滑趨勢。
(3)結(jié)果分析
由表2 可以看出區(qū)間法和綜合法加權(quán)平均函數(shù)計算得到的點(diǎn)值比除(1102 班較大,14.3%),這是由于1102 班考試沒有出現(xiàn)不及格的現(xiàn)象,跟正態(tài)分布差異較大的原因。面積指數(shù)Ai表示在極坐標(biāo)下加權(quán)成績分析函數(shù)包含的面積,由于兩者都近似于同一考試成績,因此相差不大(1.9%~8.9%)。形狀指數(shù)Si越趨近于0,加權(quán)成績分析函數(shù)就越趨近于平均分,其形狀就越趨近與半徑為分析分的圓形;區(qū)間法中的形狀指數(shù)逐漸減小,及綜合法的SI 大于0,說明了:①部分入學(xué)成績好的學(xué)生由于受到主客觀原因(如對學(xué)習(xí)失去興趣、就業(yè)形勢影響、網(wǎng)絡(luò)、手機(jī)等游戲影響)導(dǎo)致成績明顯下降,反之入學(xué)成績較低的學(xué)生通過認(rèn)真學(xué)習(xí),成績則不斷提高,從而減小了學(xué)號之間的差距,使得區(qū)間法表現(xiàn)出形狀指數(shù)下降,綜合法則表現(xiàn)出不降反增的趨勢;②除1101 班外都有1~3 名邊遠(yuǎn)地區(qū)的特招生,入學(xué)成績較普招生低100~200 分,但由于人數(shù)較少,對形狀指數(shù)的影響不明顯(相關(guān)指數(shù)僅為-0.0103),但他們由于入學(xué)基礎(chǔ)較差及格率極低(7.14%);③部分女生作為調(diào)劑生,學(xué)號排在班級的末尾,平時上課認(rèn)真聽講,因此考試成績偏高,隨著女生的比例逐漸增加(由2.6%增致26.4%),對形狀指數(shù)影響顯著(0.7817)。
從網(wǎng)絡(luò)上下載的某職中一年級32 名學(xué)生語文、數(shù)學(xué)、英語、政治、歷史、物理、生物和地理8 門的中考考試,其中成績分布的雷達(dá)圖見圖5。由圖5 可以看出該班的各科成績也與學(xué)號之間存在很強(qiáng)的相關(guān)性,隨著學(xué)號的增加成績下降明顯。
圖5 某初中(1)8門課程成績分布雷達(dá)圖
在表4 班級考試平均分與點(diǎn)值比的誤差英語課程最?。?0.55%),地理課程誤差最大(8.50%),平均誤差0.86%,平均成績的誤差率為8.50%,總成績轉(zhuǎn)換為百分制的誤差率為3.70%。由此也說明了入學(xué)基礎(chǔ)理論成績的影響對學(xué)生來說在各門課程都很顯著,而且形狀系數(shù)SI 變化不大,標(biāo)準(zhǔn)差僅為0.0542,也說明了入學(xué)成績對各門課程的平均影響程都相同,但形狀因子的平均值0.7395 明顯大于大學(xué),這也是職中和職業(yè)大學(xué)課程特點(diǎn)的不同,從小學(xué)到初中學(xué)習(xí)的各門課程都有很緊密的聯(lián)系,差生不容易有大幅度的提高,且入學(xué)成績好的學(xué)生不受外界因素(手機(jī)、網(wǎng)絡(luò)等)因素的影響,成績依然保持很好;另外職業(yè)大學(xué)則由于學(xué)習(xí)了專業(yè)課,與職高學(xué)習(xí)的內(nèi)容有較大差異,相對來說受到入學(xué)成績影響較小。
表4 某職中(1)考試成績加權(quán)平均分?jǐn)M合結(jié)果
形狀指數(shù)為負(fù)數(shù)也說明考試成績跟入學(xué)基礎(chǔ)知識有重要的關(guān)系,已經(jīng)能夠體現(xiàn)區(qū)間法加權(quán)指數(shù)分析模型的要求,即形狀指數(shù)(Si)<0,學(xué)生學(xué)號N>0,那么N*Si<0,且N*Si隨著學(xué)號N 的增加遞減,那么(NT+2+N*Si)就表示出學(xué)號增加權(quán)重減少,即入學(xué)基礎(chǔ)與學(xué)號呈反比的關(guān)系,因此本實(shí)例不需要再采用區(qū)間法進(jìn)行分析。
該班級學(xué)生各科考試成績的最優(yōu)擬合模型為:班級各科成績的全集合擬合函數(shù)y=ln(TN+2-N*0.02)*23.41 的擬合結(jié)果最好,形狀指數(shù)Si小于零也說明了初中班級學(xué)生的學(xué)號對成績有重要的影響。由于沒有相關(guān)的數(shù)據(jù)資料,因此采用各科的平均分對模型進(jìn)行驗(yàn)證:平均值與點(diǎn)值比的誤差為-9.4531%。
為了對比對數(shù)模型在職中、職高、職業(yè)大學(xué)二年級學(xué)習(xí)的適用情況,選擇某職高(1)的期末各科考試成績進(jìn)行比較結(jié)果見表5,由IACG 擬合的模型有71.43%的課程Si小于零,稍微低于初中的100%,但大于職業(yè)大學(xué)的40%,說明學(xué)生的入學(xué)基礎(chǔ)知識對高中成績影響仍比較大,只有語文、英語兩門語言類課程考試成績與學(xué)號無關(guān),也表明了這兩門課程成績差的學(xué)生通過努力學(xué)習(xí)可以短期內(nèi)有較大提高;適合于該班級各科的最優(yōu)擬合模型為y=ln(TN+2+N*0.03)*17.31。
表5 職高中(1)理科考試成績加權(quán)平均分?jǐn)M合結(jié)果
用該校職高(1)大致相同程度的文科班相同科目(語文、數(shù)學(xué)和英語)的考試成績進(jìn)行驗(yàn)證,結(jié)果見表6。
由表6 可以看到語文成績的誤差最?。?.83),英語成績誤差為13.68%,由于文科生數(shù)學(xué)較理科弱,因此誤差最大33.93%,這也反映了文理科的差異。
表6 某高中(1)文科考試成績加權(quán)平均分?jǐn)M合結(jié)果
針對考試成績的分布模式,本文定義了點(diǎn)值比的概念,并證明了點(diǎn)值比(PVR)與平均分?jǐn)?shù)成正比,在人數(shù)增多的情況下點(diǎn)值比(PVR)的百分?jǐn)?shù)趨近于平均成績;同時建立了“區(qū)間型”加權(quán)平均分模型(IACG)和“綜合型”(CACG)加權(quán)平均分模型,并對大學(xué)的多門專業(yè)課程考試成績、職高和職中的考試成績計算出的考試成績與實(shí)際考試成績進(jìn)行比較,并通過兩者的差異分析影響學(xué)生成績的關(guān)鍵因素。與傳統(tǒng)的考試成績統(tǒng)計模型相比,IACG 和CACG 模型能反映學(xué)生的基礎(chǔ)成績對當(dāng)前考試的成績的影響,同時也能反映出學(xué)生在已有基礎(chǔ)知識水平上學(xué)習(xí)狀況,為因人制宜地、客觀地評價學(xué)生的學(xué)習(xí)狀況提供了指導(dǎo)。所以,將IACG 和CACG 考試評價模型應(yīng)用到教學(xué)中,具有很好的實(shí)用價值,為考試教學(xué)改革提供了更切合實(shí)際的評價方法。