国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于SPSS軟件的初中數(shù)學(xué)試卷定量分析研究

2015-04-15 20:07楊雪峰
關(guān)鍵詞:區(qū)分度直方圖信度

楊雪峰

[摘 要] 本文通過實(shí)例介紹了在大數(shù)據(jù)時(shí)代背景下,如何運(yùn)用SPSS統(tǒng)計(jì)軟件對試卷質(zhì)量,以期幫助教師科學(xué)分析測驗(yàn)試卷,進(jìn)而根據(jù)測驗(yàn)情況反饋及時(shí)改進(jìn)教學(xué)工作,并從測驗(yàn)中篩選出優(yōu)秀試題,建立試題庫,為實(shí)施標(biāo)準(zhǔn)化考試服務(wù).

[關(guān)鍵詞] SPSS;質(zhì)量分析;成績分析.考試是教育評價(jià)的重要手段之一,而試卷質(zhì)量分析正是考試評價(jià)的重要組成部分,選擇科學(xué)的分析方法是有效分析試卷質(zhì)量的關(guān)鍵.本文以筆者所在學(xué)校初一年級2013—2014學(xué)年第二學(xué)期數(shù)學(xué)期末考試試卷為例,利用SPSS 19.0軟件對試卷質(zhì)量進(jìn)行了定量分析和檢驗(yàn),目的是幫助廣大同行教師能夠運(yùn)用SPSS軟件對試卷進(jìn)行定量分析,以期提高教師分析試卷、命制試卷的能力.

試卷定量分析主要包括試卷質(zhì)量分析和試卷成績分析兩部分. 根據(jù)教育評價(jià)理論,試卷分析的指標(biāo)有:難度、區(qū)分度、信度、效度等.成績分析指標(biāo)主要有參加考試的人數(shù)、最高分、最低分、平均值、標(biāo)準(zhǔn)差以及等級分布、班級間的差異性檢驗(yàn)等. 本文從筆者所在學(xué)校初一年級2013—2014學(xué)年第二學(xué)期數(shù)學(xué)期末考試試卷中隨機(jī)抽取100份試卷進(jìn)行試卷質(zhì)量的定量分析,試卷分值分布情況見表1.

1. 定義變量

用鼠標(biāo)單擊數(shù)據(jù)編輯器下方的“變量視圖”標(biāo)簽,進(jìn)入變量命名定義界面.在“名稱”標(biāo)題下依次定義題號Q1—Q27,總分定義為Total. 在“標(biāo)簽”標(biāo)題下注明對應(yīng)各行定義的內(nèi)容:第1題—第27題以及總分.其中題號和總成績均定義成“數(shù)值”類型,“小數(shù)”(小數(shù)點(diǎn)后長度)為0,其余各項(xiàng)均使用默認(rèn).

2. 輸入數(shù)據(jù)

數(shù)據(jù)文件的建立可用以下2種方法:第一,對于Excel,oxpro,Access等文件,采用SPSS軟件直接調(diào)入的方法;第二,用SPSS提供的數(shù)據(jù)編輯窗口直接輸入數(shù)據(jù),這兩種方法是最為簡單易行的方式. 采用第二種方式時(shí),返回?cái)?shù)據(jù)編輯器界面,從第一行第一列起直接輸入題目成績,依次每行輸入一個(gè)學(xué)生的成績,每列輸入一個(gè)題目的成績,最后一列輸入每名學(xué)生的總成績.

1. 建立樣本分?jǐn)?shù)段分布直方圖

根據(jù)錄入的數(shù)據(jù)表,運(yùn)行菜單:“分析→描述統(tǒng)計(jì)→頻率”,得到頻數(shù)表,然后得到復(fù)選框,導(dǎo)入要建立頻數(shù)分布表和直方圖的項(xiàng)目(即總分),同時(shí)運(yùn)行菜單:“分析→描述統(tǒng)計(jì)→頻率→圖表→直方圖”,勾選“在直方圖上顯示正態(tài)曲線”,即可得到分?jǐn)?shù)段分布直方圖. 通過學(xué)生成績分布直方圖和頻數(shù)分布表可以看出,這100名學(xué)生的成績接近正態(tài)分布,平均分為74.75分,最高分100分,最低分8分,極差達(dá)到92分,標(biāo)準(zhǔn)偏差為20.682,標(biāo)準(zhǔn)差比較大,說明學(xué)生個(gè)體間存在較大的差異,不及格的人數(shù)占20%,60—80分之間的人數(shù)占27%,85分以上高分段人數(shù)較多. 說明除個(gè)別學(xué)生外,大部分學(xué)生答題情況較好.

2. 難度分析

難度(Difficulty)是指試題的難易程度. 對于客觀性試題(通常指選擇題),其難度計(jì)算公式為P=,式中P為難度指標(biāo)值,R為答對某題的人數(shù),N為考生人數(shù). 對于主觀性試題,其難度計(jì)算公式為P=,式中為學(xué)生在該題得分的平均值,W為該題的滿分值. 通過難度的定義可以看出:P值越大,說明題目越簡單;P值越小,說明題目越難. 一般認(rèn)為,難度適中更能客觀反映出學(xué)生的學(xué)習(xí)效果情況,多數(shù)試題難度分布在0.3—0.7之間,選拔性測試P=0.5左右為宜,通常期末考試為目標(biāo)參照性考試,P可適當(dāng)偏高,全卷平均難度以0.7左右為宜,0.6—0.8為正常.

使用SPSS進(jìn)行難度分析的具體操作方法為:運(yùn)行菜單“分析→描述統(tǒng)計(jì)→描述”,將全部字段選入變量中,單擊“確定”按鈕,可得到各題的均值和極值,然后建立一個(gè)包含均值和各題滿分值的數(shù)據(jù)文件,單擊“轉(zhuǎn)換→計(jì)算變量”,出現(xiàn)“計(jì)算變量”對話框,在“目標(biāo)變量”中輸入要計(jì)算的難度系數(shù)P,在“數(shù)字表達(dá)式”中輸入公式“均值/滿分”,得到各題的難度系數(shù).本次考試的難度統(tǒng)計(jì)結(jié)果如表2所示.

通過表2可見,試卷整體難度為0.75,適合期末考試難度目標(biāo),難易適中,大部分題目難易程度尚可,其中第2、3、4、5、7、11、13題偏易,可適當(dāng)增加難度,但由于期末考試屬于目標(biāo)參照性考試,不是選拔性考試,第27題難度稍大,對初一學(xué)生來說可適當(dāng)增加解題梯度提示.從題型來看,難度分配合適,試卷編排較合理.

3. 區(qū)分度分析

區(qū)分度(Discrimination)是指測驗(yàn)題目對學(xué)業(yè)水平不同的學(xué)生的區(qū)分程度或鑒別能力. 具有良好區(qū)分度的測驗(yàn),實(shí)際水平高的被試應(yīng)得高分,水平低的被試應(yīng)得低分. 它是測驗(yàn)是否有效的“指示器”,被作為評價(jià)試題質(zhì)量,篩選試題的主要指標(biāo)與依據(jù).

試題區(qū)分度的計(jì)算方法很多,在此介紹一種比較方便的方法. 對于客觀題,使用等級相關(guān)分析,使用斯皮爾曼(Spearman)等級相關(guān)分析;對于主觀題,看成是非等距間距測度的連續(xù)變量,并且樣本數(shù)大于30,采用皮爾遜(Pearson)相關(guān)分析來對試題進(jìn)行分析,即求總分與每個(gè)試題得分間的積差相關(guān)系數(shù)作為試題的區(qū)分度. 一般地,區(qū)分度D≥0.4表示區(qū)分度很好;0.3≤D<0.4表示區(qū)分度良好,如能改進(jìn)更好;0.2≤D<0.3表示尚可,需改進(jìn);D<0.2表示區(qū)分度差,需淘汰.

在本文使用的樣本中,第1~10題為客觀題;第11~27題為主觀題. 具體的分析方法:運(yùn)行菜單“分析→相關(guān)→雙變量”,在彈出的“雙變量相關(guān)”對話框中選擇各個(gè)客觀題字段和總分進(jìn)入“變量”,然后在“相關(guān)系數(shù)”中勾選“Spearman”,完成后即可得到客觀題的區(qū)分度. 主觀題的區(qū)分度方法同上,區(qū)別在于在“相關(guān)系數(shù)”中勾選“Pearson”即可. 通過各題的區(qū)分度可以看出,第2題的區(qū)分度不夠,樣本中得分率為100%,需要淘汰,第4、7題的區(qū)分度分別為0.268和0.217,區(qū)分度尚可,但需改進(jìn). 從題型來看,主觀題的區(qū)分度明顯高于客觀題.同時(shí)結(jié)合各題的難度可以看出,并不是難度越高,區(qū)分度就越好,譬如第20題難度系數(shù)為0.81,題目偏簡單,但它的區(qū)分度達(dá)到了0.789,區(qū)分度很好,第26題難度系數(shù)是0.56,難度并不是最高,而區(qū)分度達(dá)到了0.808,是整卷區(qū)分度最高的,而試卷最后的壓軸題即第27題,難度系數(shù)為0.28,屬于難度最大的題,但它的區(qū)分度是0.608,這充分說明平時(shí)我們教師在命制試卷時(shí),認(rèn)為難題具有較好的區(qū)分度是不科學(xué)的,不能一味追求難題甚至怪題、偏題,而應(yīng)在大綱要求內(nèi),科學(xué)合理靈活地考查學(xué)生對知識的掌握.

4. 信度分析

信度(Reliability)r是反映試卷題目得分一致性程度的統(tǒng)計(jì)量,表示考試的可靠性,取值范圍為0~1,其值越大,信度越高. 一般認(rèn)為r在0.9以上可靠性較好.在試卷信度的檢驗(yàn)中一般采用的是同質(zhì)性信度. 具體的分析方法:運(yùn)行菜單“分析→度量→可靠性分析”,打開信度分析對話框,在彈出的對話框中將所有表示題目的字段全部選擇進(jìn)入“項(xiàng)目”框中,在“模型”欄后的下拉列表采用默認(rèn)的Alpha方法,得到分析結(jié)果如表3所示. 從分析結(jié)果可以看出,本次考試的信度系數(shù)為0.887,信度較高,在教師自編的試卷中,試題的信度系數(shù)一般應(yīng)要求在0.85以上,而標(biāo)準(zhǔn)化考試應(yīng)在0.9以上.本文所研究的試卷信度為0.887,結(jié)果說明本次考試的信度較好.而為了提高試卷的信度,可以從以下幾方面改進(jìn):適當(dāng)增加試題的數(shù)量、保持所有試題的難度接近正態(tài)分布、努力提高試題的區(qū)分度、嚴(yán)格監(jiān)考和按評分標(biāo)準(zhǔn)給分.

試卷分析表的生成

經(jīng)過以上分析得到各項(xiàng)指標(biāo)的值和圖形,使用復(fù)制、粘貼功能將它們粘貼到Word文檔相對應(yīng)報(bào)表欄目中,合成試卷分析報(bào)告. 試卷分析包括定量分析和定性分析,本文主要涉及的是試卷的定量分析.

考試是一種測量,試卷就是測量工具,用科學(xué)的測量理論對組成試卷的每一道題進(jìn)行定量分析,取優(yōu)棄劣,為本課程教學(xué)積累資料,將進(jìn)行分析后的試題進(jìn)行分類入庫,可以降低出現(xiàn)類似本次考試個(gè)別試題選題不科學(xué)的概率,防止出題的隨意性,能夠促進(jìn)考試的科學(xué)化與標(biāo)準(zhǔn)化,進(jìn)而有效地測出被測對象的真實(shí)水平. SPSS在教學(xué)評價(jià)中有著極為廣泛的應(yīng)用,除了可以對不同科目的成績的相關(guān)性進(jìn)行分析之外,還可對評價(jià)效度進(jìn)行測量,以及對多個(gè)平行班級的成績進(jìn)行差異性檢驗(yàn). 充分利用SPSS的各種統(tǒng)計(jì)功能將有助提升我們教學(xué)研究的分析水平,進(jìn)而使我們的教學(xué)方式有所改進(jìn),整體教學(xué)效果質(zhì)量有所提升.

猜你喜歡
區(qū)分度直方圖信度
符合差分隱私的流數(shù)據(jù)統(tǒng)計(jì)直方圖發(fā)布
《廣東地區(qū)兒童中醫(yī)體質(zhì)辨識量表》的信度和效度研究
淺談試卷分析常用的幾個(gè)參數(shù)及其應(yīng)用
用直方圖控制畫面影調(diào)
淺觀一道題的“區(qū)分度”
基于空間變換和直方圖均衡的彩色圖像增強(qiáng)方法
科技成果評價(jià)的信度分析及模型優(yōu)化
單維參數(shù)型與非參數(shù)型項(xiàng)目反應(yīng)理論項(xiàng)目參數(shù)的比較研究*
耳鳴殘疾問卷中文版的信度和效度檢驗(yàn)及其臨床應(yīng)用
基于直方圖平移和互補(bǔ)嵌入的可逆水印方案
宁强县| 丹江口市| 论坛| 邵东县| 临朐县| 城步| 恩平市| 丹阳市| 渭源县| 明溪县| 扶沟县| 潼关县| 滦平县| 连云港市| 光山县| 温宿县| 屏边| 禄劝| 浪卡子县| 沧源| 喜德县| 新巴尔虎左旗| 工布江达县| 九江市| 宝清县| 天水市| 伊吾县| 龙南县| 南京市| 榆中县| 图们市| 和田县| 蚌埠市| 都江堰市| 缙云县| 青河县| 铁力市| 鲁山县| 吉水县| 灯塔市| 九龙城区|