基于SPSS軟件的初中數(shù)學(xué)試卷定量分析研究

2015-04-15 20:07楊雪峰

數(shù)學(xué)教學(xué)通訊·小學(xué)版 2015年3期

楊雪峰

[摘要] 本文通過實(shí)例介紹了在大數(shù)據(jù)時(shí)代背景下，如何運(yùn)用SPSS統(tǒng)計(jì)軟件對試卷質(zhì)量，以期幫助教師科學(xué)分析測驗(yàn)試卷，進(jìn)而根據(jù)測驗(yàn)情況反饋及時(shí)改進(jìn)教學(xué)工作，并從測驗(yàn)中篩選出優(yōu)秀試題，建立試題庫，為實(shí)施標(biāo)準(zhǔn)化考試服務(wù).

[關(guān)鍵詞] SPSS；質(zhì)量分析；成績分析.考試是教育評價(jià)的重要手段之一，而試卷質(zhì)量分析正是考試評價(jià)的重要組成部分，選擇科學(xué)的分析方法是有效分析試卷質(zhì)量的關(guān)鍵.本文以筆者所在學(xué)校初一年級2013—2014學(xué)年第二學(xué)期數(shù)學(xué)期末考試試卷為例，利用SPSS 19.0軟件對試卷質(zhì)量進(jìn)行了定量分析和檢驗(yàn)，目的是幫助廣大同行教師能夠運(yùn)用SPSS軟件對試卷進(jìn)行定量分析，以期提高教師分析試卷、命制試卷的能力.

試卷定量分析主要包括試卷質(zhì)量分析和試卷成績分析兩部分. 根據(jù)教育評價(jià)理論，試卷分析的指標(biāo)有：難度、區(qū)分度、信度、效度等.成績分析指標(biāo)主要有參加考試的人數(shù)、最高分、最低分、平均值、標(biāo)準(zhǔn)差以及等級分布、班級間的差異性檢驗(yàn)等. 本文從筆者所在學(xué)校初一年級2013—2014學(xué)年第二學(xué)期數(shù)學(xué)期末考試試卷中隨機(jī)抽取100份試卷進(jìn)行試卷質(zhì)量的定量分析，試卷分值分布情況見表1.

1. 定義變量

用鼠標(biāo)單擊數(shù)據(jù)編輯器下方的“變量視圖”標(biāo)簽，進(jìn)入變量命名定義界面.在“名稱”標(biāo)題下依次定義題號Q1—Q27，總分定義為Total. 在“標(biāo)簽”標(biāo)題下注明對應(yīng)各行定義的內(nèi)容：第1題—第27題以及總分.其中題號和總成績均定義成“數(shù)值”類型，“小數(shù)”（小數(shù)點(diǎn)后長度）為0，其余各項(xiàng)均使用默認(rèn).

2. 輸入數(shù)據(jù)

數(shù)據(jù)文件的建立可用以下2種方法：第一，對于Excel，oxpro，Access等文件，采用SPSS軟件直接調(diào)入的方法；第二，用SPSS提供的數(shù)據(jù)編輯窗口直接輸入數(shù)據(jù)，這兩種方法是最為簡單易行的方式. 采用第二種方式時(shí)，返回?cái)?shù)據(jù)編輯器界面，從第一行第一列起直接輸入題目成績，依次每行輸入一個(gè)學(xué)生的成績，每列輸入一個(gè)題目的成績，最后一列輸入每名學(xué)生的總成績.

1. 建立樣本分?jǐn)?shù)段分布直方圖

根據(jù)錄入的數(shù)據(jù)表，運(yùn)行菜單：“分析→描述統(tǒng)計(jì)→頻率”，得到頻數(shù)表，然后得到復(fù)選框，導(dǎo)入要建立頻數(shù)分布表和直方圖的項(xiàng)目（即總分），同時(shí)運(yùn)行菜單：“分析→描述統(tǒng)計(jì)→頻率→圖表→直方圖”，勾選“在直方圖上顯示正態(tài)曲線”，即可得到分?jǐn)?shù)段分布直方圖. 通過學(xué)生成績分布直方圖和頻數(shù)分布表可以看出，這100名學(xué)生的成績接近正態(tài)分布，平均分為74.75分，最高分100分，最低分8分，極差達(dá)到92分，標(biāo)準(zhǔn)偏差為20.682，標(biāo)準(zhǔn)差比較大，說明學(xué)生個(gè)體間存在較大的差異，不及格的人數(shù)占20%，60—80分之間的人數(shù)占27%，85分以上高分段人數(shù)較多. 說明除個(gè)別學(xué)生外，大部分學(xué)生答題情況較好.

2. 難度分析

難度（Difficulty）是指試題的難易程度. 對于客觀性試題（通常指選擇題），其難度計(jì)算公式為P=，式中P為難度指標(biāo)值，R為答對某題的人數(shù)，N為考生人數(shù). 對于主觀性試題，其難度計(jì)算公式為P=，式中為學(xué)生在該題得分的平均值，W為該題的滿分值. 通過難度的定義可以看出：P值越大，說明題目越簡單；P值越小，說明題目越難. 一般認(rèn)為，難度適中更能客觀反映出學(xué)生的學(xué)習(xí)效果情況，多數(shù)試題難度分布在0.3—0.7之間，選拔性測試P=0.5左右為宜，通常期末考試為目標(biāo)參照性考試，P可適當(dāng)偏高，全卷平均難度以0.7左右為宜，0.6—0.8為正常.

使用SPSS進(jìn)行難度分析的具體操作方法為：運(yùn)行菜單“分析→描述統(tǒng)計(jì)→描述”，將全部字段選入變量中，單擊“確定”按鈕，可得到各題的均值和極值，然后建立一個(gè)包含均值和各題滿分值的數(shù)據(jù)文件，單擊“轉(zhuǎn)換→計(jì)算變量”，出現(xiàn)“計(jì)算變量”對話框，在“目標(biāo)變量”中輸入要計(jì)算的難度系數(shù)P，在“數(shù)字表達(dá)式”中輸入公式“均值/滿分”，得到各題的難度系數(shù).本次考試的難度統(tǒng)計(jì)結(jié)果如表2所示.

通過表2可見，試卷整體難度為0.75，適合期末考試難度目標(biāo)，難易適中，大部分題目難易程度尚可，其中第2、3、4、5、7、11、13題偏易，可適當(dāng)增加難度，但由于期末考試屬于目標(biāo)參照性考試，不是選拔性考試，第27題難度稍大，對初一學(xué)生來說可適當(dāng)增加解題梯度提示.從題型來看，難度分配合適，試卷編排較合理.

3. 區(qū)分度分析

區(qū)分度（Discrimination）是指測驗(yàn)題目對學(xué)業(yè)水平不同的學(xué)生的區(qū)分程度或鑒別能力. 具有良好區(qū)分度的測驗(yàn)，實(shí)際水平高的被試應(yīng)得高分，水平低的被試應(yīng)得低分. 它是測驗(yàn)是否有效的“指示器”，被作為評價(jià)試題質(zhì)量，篩選試題的主要指標(biāo)與依據(jù).

試題區(qū)分度的計(jì)算方法很多，在此介紹一種比較方便的方法. 對于客觀題，使用等級相關(guān)分析，使用斯皮爾曼（Spearman）等級相關(guān)分析；對于主觀題，看成是非等距間距測度的連續(xù)變量，并且樣本數(shù)大于30，采用皮爾遜（Pearson）相關(guān)分析來對試題進(jìn)行分析，即求總分與每個(gè)試題得分間的積差相關(guān)系數(shù)作為試題的區(qū)分度. 一般地，區(qū)分度D≥0.4表示區(qū)分度很好；0.3≤D<0.4表示區(qū)分度良好，如能改進(jìn)更好；0.2≤D<0.3表示尚可，需改進(jìn)；D<0.2表示區(qū)分度差，需淘汰.

在本文使用的樣本中，第1～10題為客觀題；第11～27題為主觀題. 具體的分析方法：運(yùn)行菜單“分析→相關(guān)→雙變量”，在彈出的“雙變量相關(guān)”對話框中選擇各個(gè)客觀題字段和總分進(jìn)入“變量”，然后在“相關(guān)系數(shù)”中勾選“Spearman”，完成后即可得到客觀題的區(qū)分度. 主觀題的區(qū)分度方法同上，區(qū)別在于在“相關(guān)系數(shù)”中勾選“Pearson”即可. 通過各題的區(qū)分度可以看出，第2題的區(qū)分度不夠，樣本中得分率為100%，需要淘汰，第4、7題的區(qū)分度分別為0.268和0.217，區(qū)分度尚可，但需改進(jìn). 從題型來看，主觀題的區(qū)分度明顯高于客觀題.同時(shí)結(jié)合各題的難度可以看出，并不是難度越高，區(qū)分度就越好，譬如第20題難度系數(shù)為0.81，題目偏簡單，但它的區(qū)分度達(dá)到了0.789，區(qū)分度很好，第26題難度系數(shù)是0.56，難度并不是最高，而區(qū)分度達(dá)到了0.808，是整卷區(qū)分度最高的，而試卷最后的壓軸題即第27題，難度系數(shù)為0.28，屬于難度最大的題，但它的區(qū)分度是0.608，這充分說明平時(shí)我們教師在命制試卷時(shí)，認(rèn)為難題具有較好的區(qū)分度是不科學(xué)的，不能一味追求難題甚至怪題、偏題，而應(yīng)在大綱要求內(nèi)，科學(xué)合理靈活地考查學(xué)生對知識的掌握.

4. 信度分析

信度（Reliability）r是反映試卷題目得分一致性程度的統(tǒng)計(jì)量，表示考試的可靠性，取值范圍為0～1，其值越大，信度越高. 一般認(rèn)為r在0.9以上可靠性較好.在試卷信度的檢驗(yàn)中一般采用的是同質(zhì)性信度. 具體的分析方法：運(yùn)行菜單“分析→度量→可靠性分析”，打開信度分析對話框，在彈出的對話框中將所有表示題目的字段全部選擇進(jìn)入“項(xiàng)目”框中，在“模型”欄后的下拉列表采用默認(rèn)的Alpha方法，得到分析結(jié)果如表3所示. 從分析結(jié)果可以看出，本次考試的信度系數(shù)為0.887，信度較高，在教師自編的試卷中，試題的信度系數(shù)一般應(yīng)要求在0.85以上，而標(biāo)準(zhǔn)化考試應(yīng)在0.9以上.本文所研究的試卷信度為0.887，結(jié)果說明本次考試的信度較好.而為了提高試卷的信度，可以從以下幾方面改進(jìn)：適當(dāng)增加試題的數(shù)量、保持所有試題的難度接近正態(tài)分布、努力提高試題的區(qū)分度、嚴(yán)格監(jiān)考和按評分標(biāo)準(zhǔn)給分.

試卷分析表的生成

經(jīng)過以上分析得到各項(xiàng)指標(biāo)的值和圖形，使用復(fù)制、粘貼功能將它們粘貼到Word文檔相對應(yīng)報(bào)表欄目中，合成試卷分析報(bào)告. 試卷分析包括定量分析和定性分析，本文主要涉及的是試卷的定量分析.

考試是一種測量，試卷就是測量工具，用科學(xué)的測量理論對組成試卷的每一道題進(jìn)行定量分析，取優(yōu)棄劣，為本課程教學(xué)積累資料，將進(jìn)行分析后的試題進(jìn)行分類入庫，可以降低出現(xiàn)類似本次考試個(gè)別試題選題不科學(xué)的概率，防止出題的隨意性，能夠促進(jìn)考試的科學(xué)化與標(biāo)準(zhǔn)化，進(jìn)而有效地測出被測對象的真實(shí)水平. SPSS在教學(xué)評價(jià)中有著極為廣泛的應(yīng)用，除了可以對不同科目的成績的相關(guān)性進(jìn)行分析之外，還可對評價(jià)效度進(jìn)行測量，以及對多個(gè)平行班級的成績進(jìn)行差異性檢驗(yàn). 充分利用SPSS的各種統(tǒng)計(jì)功能將有助提升我們教學(xué)研究的分析水平，進(jìn)而使我們的教學(xué)方式有所改進(jìn)，整體教學(xué)效果質(zhì)量有所提升.

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

基于SPSS軟件的初中數(shù)學(xué)試卷定量分析研究