李 萍
(陜西學(xué)前師范學(xué)院計(jì)算機(jī)系,陜西西安 710100)
考試是教學(xué)工作的重要環(huán)節(jié),是檢驗(yàn)學(xué)生學(xué)習(xí)效果和教學(xué)效果的主要手段。用科學(xué)的方法對(duì)學(xué)生的考試成績(jī)進(jìn)行鑒定與考核,可以對(duì)教學(xué)質(zhì)量進(jìn)行定量的評(píng)價(jià)與分析。本文從提高教學(xué)質(zhì)量出發(fā),對(duì)學(xué)生考試成績(jī)分布作正態(tài)性檢驗(yàn)(質(zhì)量指標(biāo)之一),從而較準(zhǔn)確地評(píng)判考試的狀況,以期對(duì)改進(jìn)我們的教學(xué)工作提供參考。
按照教育測(cè)量學(xué)的原理和考試系統(tǒng)的特征,對(duì)考試成績(jī)進(jìn)行正態(tài)分布檢驗(yàn)的意義主要有兩點(diǎn)[1]。一是許多重要的考試質(zhì)量評(píng)價(jià)指標(biāo)[2]的計(jì)算都以成績(jī)服從正態(tài)分布為前提,例如在對(duì)考試成績(jī)及試題參數(shù)的統(tǒng)計(jì)過程中,使用的均值、方差等主要統(tǒng)計(jì)參數(shù)的估計(jì)和檢驗(yàn),只適用于正態(tài)分布或近似正態(tài)分布的情況,因此在使用這些統(tǒng)計(jì)方法前,必須進(jìn)行正態(tài)性檢驗(yàn)。二是用于對(duì)考試成績(jī)的解釋,不同的成績(jī)分布可以解釋為試題的難度分布情況和學(xué)生的學(xué)習(xí)情況,或者在不同類型的考試中可以解釋為教師的教學(xué)情況。
研究證實(shí)自然人群中個(gè)體智力分布特征為處于中等智力附近的個(gè)體數(shù)量較多,由中間向兩端(智力低下和智力超強(qiáng))數(shù)量逐漸減少,從形態(tài)上看是一條單峰、對(duì)稱呈鐘形的分布曲線,該曲線符合統(tǒng)計(jì)學(xué)上的正態(tài)分布(normaldistribution)[3]。在教學(xué)過程中,教師如果按照課程的教學(xué)大綱和教學(xué)基本要求組織教材,結(jié)合學(xué)生的實(shí)際選定適當(dāng)?shù)慕虒W(xué)方法,備好課,講好課,認(rèn)真地批改作業(yè),那么學(xué)生成績(jī)應(yīng)受智力影響較大,則服從正態(tài)分布。同時(shí)成績(jī)的正態(tài)分布性也反映了試題的知識(shí)點(diǎn)全面,難易程度適中,學(xué)生對(duì)本門課程在知識(shí)結(jié)構(gòu)和能力發(fā)展方面已達(dá)到基本教學(xué)目標(biāo)。因此,成績(jī)分布的正態(tài)性檢驗(yàn)可為教師提高教學(xué)質(zhì)量和教學(xué)行政部門改進(jìn)教學(xué)管理提供科學(xué)依據(jù)。
學(xué)生總體學(xué)習(xí)成績(jī)分布有以下幾種情況:(1)正態(tài)分布:說明測(cè)試結(jié)果與學(xué)生的實(shí)際情況一致,試題的知識(shí)點(diǎn)全面,難易程度適中。(2)正偏態(tài)分布:說明試題難度偏高。(3)負(fù)偏態(tài)分布:說明試題難度偏低。(4)雙峰型分布:說明試題存在兩極分化現(xiàn)象,即難度偏高的和難度偏低的項(xiàng)目較多,而中等難度的項(xiàng)目偏少,項(xiàng)目難度的分布缺乏梯度,不夠合理。(5)平坡型分布:說明試題中各種難度的項(xiàng)目比例接近,梯度較大(如圖1)。
成績(jī)是否服從正態(tài)分布通常采用直方圖描繪分?jǐn)?shù)分布曲線的方法大致地判斷,但沒有定量的標(biāo)準(zhǔn)。下面介紹一種簡(jiǎn)單實(shí)用的正態(tài)性檢驗(yàn)方法,擬合優(yōu)度的χ2檢驗(yàn)法[4],從而可以對(duì)試題質(zhì)量進(jìn)行粗略的評(píng)價(jià),實(shí)現(xiàn)對(duì)教學(xué)質(zhì)量的定量分析。
圖1
χ2檢驗(yàn)是利用隨機(jī)樣本對(duì)總體分布與某種特定分布的擬合程度的檢驗(yàn),也就是檢驗(yàn)觀測(cè)值與理論值(期望值)之間的緊密程度。當(dāng)我們研究n(n>2)個(gè)事件時(shí),可以測(cè)定n個(gè)觀測(cè)值與相應(yīng)的理論值之間的差異,為此而構(gòu)造的統(tǒng)計(jì)量稱為χ2統(tǒng)計(jì)量。χ2是1900年由英國統(tǒng)計(jì)學(xué)家K.Pearson提出的定理。該定理說明,當(dāng)樣本容量充分大時(shí),樣本分成k類,每類實(shí)際出現(xiàn)的觀測(cè)頻數(shù)用f0表示,其理論頻數(shù)用fe表示,則統(tǒng)計(jì)量Σ(f0-fe)2/fe服從自由度為k-1的χ2分布。在非參數(shù)統(tǒng)計(jì)中,擬合優(yōu)度的χ2檢驗(yàn)法是檢驗(yàn)總體是否來自已知分布函數(shù)的常用方法,它的優(yōu)點(diǎn)在于不管總體分布函數(shù)是何類型,都可用此方法。
但是考試成績(jī)總體是一個(gè)很特殊的總體,用χ2的擬合優(yōu)度檢驗(yàn)法對(duì)其進(jìn)行正態(tài)檢驗(yàn)時(shí)存在明顯缺陷。例如,一批含有負(fù)值但有對(duì)稱性的數(shù)據(jù),經(jīng)χ2檢驗(yàn)后也可被認(rèn)為服從正態(tài)分布,但它作為學(xué)生的考試成績(jī)就不具有實(shí)際意義。所以,對(duì)考試成績(jī)總體進(jìn)行正態(tài)分布檢驗(yàn)時(shí),僅按通常χ2擬合優(yōu)度檢驗(yàn)是不夠的。設(shè)學(xué)生成績(jī)總分為W,根據(jù)教育統(tǒng)計(jì)學(xué)的基本原理,在正常的教學(xué)條件下,學(xué)生成績(jī)應(yīng)該服從均值為W*70%,標(biāo)準(zhǔn)差為W*10%的正態(tài)分布。因?yàn)榫岛蜆?biāo)準(zhǔn)差的值過低或過高,說明我們?cè)诮虒W(xué)過程中貫徹教學(xué)基本要求,組織課堂教學(xué),課程考試等工作環(huán)節(jié)出現(xiàn)了較大的失誤,此時(shí)進(jìn)行正態(tài)性檢驗(yàn)已失去應(yīng)有的實(shí)際意義。為了能反映在正常教學(xué)條件下,教和學(xué)的具體情況,找出教學(xué)過程中成功的經(jīng)驗(yàn)和存在的問題,在對(duì)考試成績(jī)這一特殊總體進(jìn)行χ2的擬合優(yōu)度檢驗(yàn)時(shí),合理服從正態(tài)分布的成績(jī)應(yīng)滿足以下條件:
Ⅱ 根據(jù)概率論中的3σ原則,標(biāo)準(zhǔn)差σ∈〔5,15〕
Ⅲ 按通常擬合優(yōu)度的χ2檢驗(yàn)法,檢驗(yàn)學(xué)生成績(jī)總體服從正態(tài)分布。
設(shè)x1,x2,…,xn是從學(xué)生成績(jī)總體中提取的樣本試卷,并把成績(jī)區(qū)間劃分為k個(gè)區(qū)間,即(0,t1),(t1,t2],… ,(tk,W),從而全部n個(gè)樣本分成k組。用Vi表示x1,x2,…,xn落入第i段的個(gè)數(shù)(觀測(cè)頻數(shù)),(i=1,2,…,k),Vi/n表示頻率。
判斷是否滿足條件ⅠⅡ,若不滿足則認(rèn)為成績(jī)不服從正態(tài)分布,若滿足則進(jìn)行以下步驟。
隨機(jī)在某學(xué)校抽取了某年級(jí)某學(xué)期的多媒體技術(shù)基礎(chǔ)試卷,具體成績(jī)數(shù)據(jù)見表1。對(duì)其成績(jī)分布進(jìn)行正態(tài)性檢驗(yàn)。
(1)計(jì)算樣本的均值和方差
結(jié)果滿足條件ⅠⅡ,可進(jìn)行χ2的擬合優(yōu)度性檢驗(yàn)。
(2)假設(shè)H :成績(jī)總體Χ服從正態(tài)分布;H :成績(jī)總體Χ不服從正態(tài)分布。其成績(jī)分組與2計(jì)算結(jié)果見表2。
表1 學(xué)生成績(jī)表
圖2 成績(jī)分布直方圖
說明:表2的第5欄是各組實(shí)上限對(duì)應(yīng)的左尾部面積比例,根據(jù)相應(yīng)的標(biāo)準(zhǔn)分Z查正態(tài)布表所得。表2的第6欄是從最低組算起,0.0212直接來自第5欄,其他值由第5欄中上下相鄰兩組的表值相減得到。
(3)根據(jù)原始數(shù)據(jù)的統(tǒng)計(jì)作頻數(shù)直方圖如圖2。
經(jīng)由步驟(1)(2)(3)(4)知,這次多媒體技術(shù)基礎(chǔ)的成績(jī)服從“成績(jī)正態(tài)分布”。它反映了本期的教學(xué)活動(dòng)正常,教學(xué)措施有力,正確地貫徹了該課程教學(xué)大綱和教學(xué)基本要求,認(rèn)真進(jìn)行課堂教學(xué),教學(xué)效果較好。
[1]王孝玲.教育測(cè)量學(xué)[M].上海:華東師范大學(xué)出版社,2001.
[2]張志英.教育統(tǒng)計(jì)學(xué)[M].北京:中國財(cái)經(jīng)經(jīng)濟(jì)出版社,2002.
[3][美]M.R斯皮格爾,J.希勒,R.A.斯里尼瓦桑.概率與統(tǒng)計(jì)[M].2版.孫山澤,等譯.北京:科學(xué)出版社,2002.
[4][美]斯皮格爾(Spiegel,M.R),等.統(tǒng)計(jì)學(xué)[M].3版.楊記龍,等譯.北京:科學(xué)出版社,2002.