国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

數(shù)學試卷常用的測量分析法

2013-04-29 21:41:09吳小平
博覽群書·教育 2013年7期
關鍵詞:應試者區(qū)分度效度

吳小平

一份較為重要的數(shù)學試卷(如:學期考試或學年考試,最后上升至中考或高考)一定會有相應的評定參考指標來進行評價;既有定量分析方法,也會有定性分析方法,用來衡量或矯正試卷命制的達成程度,既符合國家課程改革的理念與數(shù)學學科的思想方法,又適合本次考試的任務目標(學業(yè)的水平性考試或學業(yè)的選拔性考試)。

常用的教育測量學將對試卷進行定量的四個維度的統(tǒng)計、分析;試卷分析的四個度:難度、區(qū)分度、信度、效度。

一、難度

難度是指試卷中試題的難易程度,它是衡量試卷質量的一個重要指標參數(shù),一般的把它和區(qū)分度的共同影響度,確定著試卷的鑒別功能。一般認為,此類升學性考試的每一個試題的難度指數(shù)在0.3-0.85之間比較合適,高于0.85和低于0.3的試題不能太多。整份試卷的平均難度最好在0.50~0.65之間,本省中考數(shù)學試卷難度系數(shù)約為0.60,高考數(shù)學試卷難度指數(shù)約為0.50。

1.難度的通常定義

在樣本容量n有一定大的前提下,難度系數(shù) ,x為某題得分的平均分數(shù),w為該題的滿分;這種定義法,難度值小時表明試題難,難度值大時表明試題容易;最小值為0,最大值為1,0≤P ≤1。

2.難度系數(shù)的計算

為了簡約的統(tǒng)計,通常無論是主觀性試題、還是客觀性試題的難度,其難度系數(shù)均以公式 為準,x為某題得分的平均分數(shù),w為該題的滿分;因而整張試卷的難度系數(shù)也以公式 為準,x為統(tǒng)計容量n(位)考生得分的平均分數(shù),w為該試卷的滿分值。

3.一般升學性考試試題難度系數(shù)與難度評價

二、區(qū)分度

區(qū)分度是區(qū)分應試者能力水平高低的指標。試題區(qū)分度高,可以拉開不同水平應試者分數(shù)的距離,使高水平者得高分,低水平者得低分,而區(qū)分度低則反映不出不同應試者的水平差異。

試題的區(qū)分度與試題的難度直接相關,通常來說,中等難度的試題區(qū)分度較高,容易題或過難試題的區(qū)分度就要低一些。另外,試題的區(qū)分度也與應試者的水平分化密切相關,一般的試題難度只有等于或略低于應試者的實際能力,其區(qū)分性能才能充分顯現(xiàn)出來。

1.區(qū)分度的計算方法:

通常的基本公式: (D代表區(qū)分度系數(shù), 代表高分組(設統(tǒng)計對象得分較高的前27%名次考生為高分組)得分的均分值, 代表低分組(設統(tǒng)計對象得分較低的后27%名次考生為低分組)得分的均分值, 代表該題的滿分值。一般認為:某一道試題的區(qū)分度系數(shù)高于0.4,試題的區(qū)分度較好;若試題的區(qū)分度系數(shù)低于0.2,則試題難以被接受。

2.區(qū)分度系數(shù)與試題的區(qū)分度評價

三、信度

信度是指測得結果的一致性或穩(wěn)定性,穩(wěn)定性越大,意味著測評結果越可靠。相反,如果用某套試題對于同一應試者先后進行兩次測試,結果第一次得80分,第二次得50分,結果的可靠性就值得懷疑了。

信度通常以兩次測評結果的相關系數(shù)來表示。相關系數(shù)為1,表明測評工具如試卷完全可靠;相關系數(shù)為0,則表明該試卷完全不可靠。一般來說,要求信度在0.7以上。

1.評價信度的方法:

(1)重測法,(2)復本法—副題,(3)折半法,或者說:用再測信度、復本信度和內(nèi)部一致信度三種方法來進行評估。

再測信度是指將同一試卷在相同的條件下對同一組考生先后實施兩次,兩次測評結果的相關系數(shù)。

復本信度是指用兩份或幾份在構想、內(nèi)容、難度、題型和題量等方面都平行的試卷進行測試,測評結果之間的相關系數(shù)。

內(nèi)部一致信度是指試卷內(nèi)部各題之間的一致性,通常是將試卷一分為二,然后計算一半試卷與另一半試卷之間的相關系數(shù)。

2.對試卷的信度評價

參照《全國中考數(shù)學考試評價指標量表(2007年修訂版)》,對試卷的信度評價可歸結以下四方面:①、試卷所規(guī)定的系統(tǒng)誤差小,公平性能夠實現(xiàn);②、試卷所賦予的評分標準,準確無理解歧義;③、試卷的陳述準確無歧義;④、試卷呈現(xiàn)規(guī)范不會導致考生產(chǎn)生理解歧義。其操作性能好,較好處理。

四、效度

效度是一個測試能夠測試出它所要測試的東西的程度,即測試結果與測試目標的符合程度。

任何測試工具,無論其它方面有多好,若效度太低,測試的結果不是它要測試的東西(如用英語試卷測試學生的數(shù)學思維能力,或者數(shù)學試卷測試諸如英語翻譯、理解能力等偏頗內(nèi)容),那么,對目前所要測試的東西,這個測試將是無價值的。

由于心理現(xiàn)象本身的特點,測評的效度尤為重要。心理屬于精神方面的東西,目前人們還無法直接觀察它,只能通過一個人的行為模式或者對測試題目的反應,來推論其心理特質。如智力水于主要是借助于個體對一些問題的反應及正誤等結果來推斷的。

1.效度是一個相對概念。效度是一個相對概念,即效度只有高低之分,沒有全部有效和全部無效之分。效度從種類上可分為卷面效度、內(nèi)容效度、構想效度、預測效度和共時效度。

2.對試卷的效度評價。參照《全國中考數(shù)學考試評價指標量表(2007年修訂版)》,對試卷的效度評價可歸結以下六方面:①、體現(xiàn)數(shù)學課程標準所規(guī)定的學習要求(包含內(nèi)容、結構覆蓋率以及難度不超標);②、有利于考生展示在數(shù)學課程學習中取得的成就(整卷試題設計有利于學生展示、整卷的字圖式表述有利于考生的發(fā)揮、試題的背景公平、試題的閱讀量適合);③、試題的科學性;④、試卷評分標準的合理性;⑤、題型運用的合理性;⑥、分數(shù)與能力一致性的程度。

試卷的信度與效度的評價可操作性較難,不易被中學所量化測評。另外一份試卷質量的分析常常通過兩個層面來進行,試卷分析與試題分析。

對于已經(jīng)考過的試卷進行科學評價,對以后的命題將會起到非常重要的參考作用。一般的評價分析往往基于考試后對考試結果進行分析。但是,如果能在考試后結合答卷情況來對試卷進行科學地分析,發(fā)現(xiàn)和進一步體會預設的亮點,反思試卷中的瑕疵或不足,對于試卷命制今后的完善、完美更是有非常意義的價值。因此,如何建立對試卷的定量分析模型、質性評價分析方法,包括預測考試的成績分布情況、考試的有效性和穩(wěn)定性等,就是一項很有意義的工作。

猜你喜歡
應試者區(qū)分度效度
How AI experts influence our decisions
指紋識別在大學生應試者身份核驗中的運用
慈善募捐規(guī)制中的國家與社會:兼論《慈善法》的效度和限度
淺談試卷分析常用的幾個參數(shù)及其應用
面試中常見的12種錯誤
圖形推理測量指標相關性考察*
江淮論壇(2018年4期)2018-08-24 01:22:30
淺觀一道題的“區(qū)分度”
單維參數(shù)型與非參數(shù)型項目反應理論項目參數(shù)的比較研究*
心理學探新(2015年3期)2015-12-27 06:25:14
被看重感指數(shù)在中國大學生中的構念效度
心理學探新(2015年4期)2015-12-10 12:54:02
外語形成性評估的效度驗證框架
五原县| 伽师县| 台前县| 获嘉县| 常宁市| 葫芦岛市| 永仁县| 鸡西市| 儋州市| 梨树县| 襄樊市| 阿图什市| 南阳市| 改则县| 伊宁市| 保定市| 安吉县| 许昌县| 怀化市| 铅山县| 安阳市| 诸暨市| 四平市| 维西| 平塘县| 清新县| 樟树市| 军事| 淅川县| 巨鹿县| 阳江市| 昌图县| 什邡市| 山西省| 醴陵市| 青海省| 望奎县| 西丰县| 阳泉市| 谢通门县| 黑水县|