国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于SPSS數(shù)據(jù)的中學(xué)物理教師命題質(zhì)量分析

2016-09-10 07:22:44高遠(yuǎn)靜吳炳光
中學(xué)物理·初中 2016年11期
關(guān)鍵詞:區(qū)分度信度試卷

高遠(yuǎn)靜 吳炳光

形形色色的考試是備受老師、學(xué)生和家長關(guān)注的熱點(diǎn),然而在這個強(qiáng)調(diào)逐漸淡化分?jǐn)?shù)的新課改時代,大家關(guān)注的依然是卷面成績.一張不起眼的試卷,一個小小的數(shù)字為什么常年在老師學(xué)生和家長心目中占有重要的一席,甚至引其他問題?無非就是大家都認(rèn)可的試卷對學(xué)生學(xué)習(xí)能力的重要測量和評價功能.可是很多老師往往在命題時忽略了試卷本身的教育測量與評價目的,甚至評價觀念是模糊的,導(dǎo)致試卷本身的命題質(zhì)量不高,測量結(jié)果的可信度就大大降低了.目前我國普遍教師的命題能力都亟須提高,如此才能保證產(chǎn)出優(yōu)質(zhì)試卷以供學(xué)生的學(xué)習(xí)評價使用.

教師命題能力的評定需要引入量化指標(biāo)使教學(xué)評價可視化,試卷作為命題的可視化產(chǎn)出結(jié)果,以試卷質(zhì)量分析入手,利用教育統(tǒng)計(jì)學(xué)手段進(jìn)行評價指標(biāo)量化是教師命題能力研究的切入點(diǎn).中學(xué)階段大規(guī)??荚囈l(fā)大規(guī)模的試卷數(shù)據(jù),在大數(shù)據(jù)背景下中學(xué)老師缺乏試卷挖掘的數(shù)據(jù)力成為制約教師命題能力發(fā)展的一個重要瓶頸.本文以廣東省最近一次高二期末聯(lián)考數(shù)據(jù)為例,基于SPSS數(shù)據(jù)方法分析教師的命題質(zhì)量.

1 命題質(zhì)量統(tǒng)計(jì)分析

從教育測量與評價的角度看,學(xué)校的期末考試其實(shí)是一種終結(jié)性評價,應(yīng)該凸顯其對學(xué)生該階段相應(yīng)學(xué)力水平的評定功能,同時還對后階段的學(xué)習(xí)有預(yù)測和評估的作用.要實(shí)現(xiàn)從考試到評價的轉(zhuǎn)變,科學(xué)的考試評價體系應(yīng)該從理念、方法和技術(shù)三個維度構(gòu)建,而通俗易懂、操作便利、分析功能強(qiáng)大的數(shù)字化統(tǒng)計(jì)軟件無疑是迫切的現(xiàn)實(shí)需求之一.SPSS軟件是一款通用的數(shù)據(jù)處理軟件,筆者利用它來分析本次高二期末三校聯(lián)考試卷的命題質(zhì)量.

1.1 命題基本情況

本次聯(lián)考物理試卷共8道選擇題、1道實(shí)驗(yàn)題、2道計(jì)算題和1道選做題,考試時間為60分鐘,命題人是佛山市某特級教師,聯(lián)考考生為廣佛兩地三所市屬名校的高二學(xué)生.本次研究選取考試后的625份有效樣本數(shù)據(jù)進(jìn)行質(zhì)量分析,樣本容量大,分析結(jié)論可信度高.

1.2 信度和效度分析

期末考試過程采取嚴(yán)格的監(jiān)考管理,測試結(jié)果可靠度高,具有較高的測試信度.客觀題全部機(jī)評,主觀題每道題都有詳細(xì)的評分標(biāo)準(zhǔn),物理試題的答案比較單一,客觀性強(qiáng),評分者信度高.由于試題無法考察分半信度,故本研究采用Cronbach的а系數(shù)方法來評估試題的內(nèi)部一致性信度,SPSS分析總體樣本的а系數(shù)值為0.663,在可接受范圍內(nèi).

為了保證測試的準(zhǔn)確性,測試卷要具有較高的內(nèi)容效度.本次考試由業(yè)內(nèi)專家命題,具有一定的專家效度,可是沒有編制命題雙向細(xì)目表,也沒有審稿人,暴露了一線教師命題缺乏科學(xué)性問題,試卷的內(nèi)容效度有待商榷.由于無法考察效標(biāo)關(guān)聯(lián)效度,在此用SPSS軟件統(tǒng)計(jì)相關(guān)系數(shù)來檢驗(yàn)試卷的構(gòu)想效度.表1給出第9~11題與總分相關(guān)性檢驗(yàn)試卷效度.

統(tǒng)計(jì)結(jié)果表明,不同題目得分與總分之間的所有相關(guān)系數(shù)在0.285至0.539之間,而且顯著性p值(Sig)均在0.001以下,有99.9%的置信概率,其中客觀題與總分的相關(guān)系數(shù)偏低,說明試卷題目并不能十分準(zhǔn)確地考查學(xué)生的學(xué)力水平.而各題目與總分的相關(guān)性超過各題目之間的相關(guān)系數(shù),即該試卷命題做到了題目之間的關(guān)聯(lián)度不會太高,各題目考查的知識能力不同.總體而言該試卷的構(gòu)想效度一般.

1.3 難度和區(qū)分度

難度往往是命題者最重視又較難把控的一項(xiàng)試卷質(zhì)量指標(biāo),它具有個人風(fēng)格特質(zhì),命題者需要對測試對象的平均學(xué)力水平和題目的匹配程度有較準(zhǔn)確的把握才能使難度控制在理想范圍之內(nèi).單項(xiàng)選擇題的難度一般是指通過率,即該題目的通過人數(shù)和總?cè)藬?shù)的比例.主觀題則以得分率作為難度系數(shù),即該題總體平均分和滿分的比,系數(shù)越高,難度越小.難度系數(shù)算法簡單,用Excel即能處理,不需要用統(tǒng)計(jì)軟件.

良好的區(qū)分度也是命題者的一個理想試卷質(zhì)量追求,它比難度系數(shù)更難把控在于它需要命題者對不同層次的學(xué)生的學(xué)力水平都要有準(zhǔn)確的甄別能力.區(qū)分度同時也是篩選試題的重要指標(biāo).一般的測試可以用極端分組法來算區(qū)分度,即考慮高分組和低分組的得分率的差值.但是這種方法沒有使用全部數(shù)據(jù),分析不夠科學(xué),通常在大規(guī)模標(biāo)準(zhǔn)化測試中不采用這種方法,而采用相關(guān)分析法,即以試題與總分的相關(guān)系數(shù)作為區(qū)分度的指標(biāo),相關(guān)性越高,區(qū)分能力越好.即本文提及的檢驗(yàn)構(gòu)想效度的方法.

由此可見,在教育測量研究中,難度系數(shù)和區(qū)分度對測試卷的信度和效度都有直接影響.

在此采用一般的方法計(jì)算本次聯(lián)考物理試卷的難度和區(qū)分度,如圖1所示.

全卷來看難度是0.541,區(qū)分度是0.362,兩項(xiàng)指標(biāo)都不太理想.各題區(qū)分度總體偏低,除了第5題其余都低于0.4.各題難度不一,有2道題難度過大,難度系數(shù)低于0.3,而系數(shù)高于0.7有2道題,難度太低,不合理難度試題占總試題的36%.試卷的難度分布不均,沒有體現(xiàn)難度梯度變化.從這兩項(xiàng)指標(biāo)的分析可以看出,首先命題者沒有明確定位此次考試的評價功能,期末考試旨在檢驗(yàn)學(xué)生是否達(dá)到本學(xué)期的教學(xué)目標(biāo),作為一種終結(jié)性評價,應(yīng)該弱化考試的選撥功能,試題難度不宜太高;其次,普遍較低的區(qū)分度說明試題的甄別評價功能較差,選題不合適;最后,從較混亂的難度分布可以看出,命題有隨意拼湊的嫌疑,或者命題者沒有難度梯度意識,只想著利用難題和易題來平衡平均分.科學(xué)的命題應(yīng)該是在選題之后把所有題目由易到難進(jìn)行排序,保證測試者有較穩(wěn)定的心理狀態(tài)才能提高試題的信度.

1.4 正態(tài)分布檢驗(yàn)

一份好的試題能夠符合被試的能力特質(zhì)呈正態(tài)分布的自然規(guī)律,同時正態(tài)分布也是試題做描述統(tǒng)計(jì)分析的基本前提.次聯(lián)考數(shù)據(jù)樣本量大于50,可以用SPSS的非參數(shù)檢驗(yàn)的獨(dú)立樣本K-S檢驗(yàn)其正態(tài)分布情況(圖2)偏度0.158,峰度0.201,漸進(jìn)顯著性p值0.471,近似符合正態(tài)分布.

2 命題質(zhì)量凸顯的問題及對策

由上述的統(tǒng)計(jì)分析發(fā)現(xiàn)目前教師的命題質(zhì)量仍然有待提高,體現(xiàn)有三個主要問題:第一,命題缺乏規(guī)范.無論是平時的測驗(yàn)還是大規(guī)??荚?,很多老師都沒有編制雙向細(xì)目表命題的習(xí)慣,覺得細(xì)目表的編制工作繁瑣,主要憑個人經(jīng)驗(yàn)和直覺去進(jìn)行組卷編題,導(dǎo)致試卷的內(nèi)容效度無保障.除此之外,大多數(shù)老師也不重視試卷格式的規(guī)范整理工作;第二,命題缺乏科學(xué)性.教師在命題時往往忽略考慮考試的評價目標(biāo),容易把選拔性考試和過程性評價混淆,沒有明確的目標(biāo)導(dǎo)向.很多老師的命題過程是“信手拈來”的,沒有系統(tǒng)的編制流程作依托,試題漏洞百出.試題最關(guān)鍵的難度和區(qū)分度把控仍然依靠主觀經(jīng)驗(yàn),缺乏科學(xué)把控方法;第三,命題缺乏反思.考試數(shù)據(jù)輸出是命題質(zhì)量的體現(xiàn),教師們對試卷分析僅停留在“看”數(shù)據(jù)的階段,忽視挖掘數(shù)據(jù)評價試卷質(zhì)量,同時忽視總結(jié)命題經(jīng)驗(yàn)和教訓(xùn),沒有發(fā)揮大規(guī)模測試應(yīng)有的數(shù)據(jù)力作用.

針對以上三個主要問題提出以下建議措施:首先,教研室和學(xué)校層面要重視對老師的命題規(guī)范操作培訓(xùn)和命題質(zhì)量監(jiān)管.教師本人要形成良好的命題習(xí)慣,只有提高普遍教師的命題能力,編制優(yōu)質(zhì)的試題,才能發(fā)揮考試的評價功能;其次,亟須進(jìn)行提高教師命題能力的相關(guān)策略研究,把資深教師豐富的主觀經(jīng)驗(yàn)整合成科學(xué)操作化技術(shù),形成一套科學(xué)的命題策略體系,作為命題操作和質(zhì)量把控的重要依據(jù);最后,引入教育測量與評價方法到試卷質(zhì)量分析中,尤其是物理學(xué)科的定量特點(diǎn)使其試卷評價的量化操作更容易實(shí)現(xiàn).通過考試后的大數(shù)據(jù)挖掘,形成多維數(shù)據(jù)模型,有利于形成優(yōu)質(zhì)試題庫,總結(jié)命題經(jīng)驗(yàn),提升命題質(zhì)量.

猜你喜歡
區(qū)分度信度試卷
《廣東地區(qū)兒童中醫(yī)體質(zhì)辨識量表》的信度和效度研究
淺談試卷分析常用的幾個參數(shù)及其應(yīng)用
圖形推理測量指標(biāo)相關(guān)性考察*
江淮論壇(2018年4期)2018-08-24 01:22:30
Module5 A Trip Along the Three Gorges
Module5 Great People and Great Inventions of Ancient China
Module 4 Sandstorms in Asia
Module 1 Europe
淺觀一道題的“區(qū)分度”
科技成果評價的信度分析及模型優(yōu)化
單維參數(shù)型與非參數(shù)型項(xiàng)目反應(yīng)理論項(xiàng)目參數(shù)的比較研究*
孟津县| 堆龙德庆县| 霍山县| 阿拉善右旗| 蓝田县| 西昌市| 康平县| 永善县| 南京市| 灵宝市| 竹北市| 武隆县| 武城县| 涞水县| 正蓝旗| 鸡泽县| 交城县| 徐汇区| 新巴尔虎右旗| 滕州市| 浦城县| 延庆县| 甘谷县| 乌鲁木齐市| 衡水市| 铜梁县| 临泉县| 江华| 昆明市| 老河口市| 襄城县| 固原市| 丰县| 清新县| 禄劝| 武夷山市| 泾源县| 河东区| 黄龙县| 四川省| 德州市|