国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

數(shù)學(xué)模型之試卷質(zhì)量綜合評價(jià)研究

2024-09-11 00:00:00寸宇瀟
科技風(fēng) 2024年25期

摘要:對試卷質(zhì)量綜合評分,即實(shí)現(xiàn)試卷質(zhì)量的定量分析?;凇案叩葦?shù)學(xué)”課程期末考試成績,首先,利用χ2擬合優(yōu)度檢驗(yàn)法判斷考試成績是否達(dá)到服從正態(tài)分布的基本要求;其次,分析計(jì)算試卷的難度、區(qū)分度、效度和信度;最后,將這四個(gè)指標(biāo)作為影響試卷質(zhì)量的關(guān)鍵因素,利用模糊數(shù)學(xué)綜合評價(jià)方法構(gòu)建試卷質(zhì)量綜合評分函數(shù)。

關(guān)鍵詞:試卷質(zhì)量;難度;區(qū)分度;效度;信度;模糊綜合評價(jià)

1概述

當(dāng)前,學(xué)校普遍以教學(xué)為中心和重心,隨著教學(xué)改革的深入發(fā)展,對教學(xué)評價(jià)的要求越來越客觀,對教學(xué)效果的分析越來越重視,顯然,考試是教育教學(xué)評價(jià)的最有效手段之一。而考試成績能否有效地體現(xiàn)教育教學(xué)質(zhì)量的關(guān)鍵在于試題的命制,即試卷的質(zhì)量。綜合評價(jià)試卷質(zhì)量,對提高教育教學(xué)質(zhì)量、分析教學(xué)效果、分析學(xué)生學(xué)習(xí)效果、提升教學(xué)測評工作都具有重要意義。[1]

本文基于2022—2023學(xué)年第一學(xué)期“高等數(shù)學(xué)”課程120名學(xué)生的期末考試成績,綜合評判分析高等數(shù)學(xué)試卷質(zhì)量得分。首先,利用χ2擬合優(yōu)度檢驗(yàn)法判斷考試成績是否服從正態(tài)分布;其次,對試卷的難度、區(qū)分度、效度和信度進(jìn)行計(jì)算分析;最后,將這四個(gè)指標(biāo)作為影響試卷質(zhì)量的關(guān)鍵因素,利用模糊數(shù)學(xué)綜合評價(jià)方法構(gòu)建試卷質(zhì)量綜合評分函數(shù)。

2試卷質(zhì)量分析

2.1考試成績正態(tài)性檢驗(yàn)

根據(jù)統(tǒng)計(jì)資料及統(tǒng)計(jì)理論可知,符合教學(xué)規(guī)律的任意考試或測驗(yàn),其成績都應(yīng)呈現(xiàn)或接近正態(tài)分布,否則就認(rèn)為試卷的試題命制不合理。

檢驗(yàn)考試成績呈正態(tài)性分布的方法眾多,本文運(yùn)用χ2擬合優(yōu)度檢驗(yàn)法利用SPSS軟件判別考試成績是否服從正態(tài)分布。

具體方法:在SPSS中單擊Analyze→NonparametricTests→LegacyDialogs→Chisquare,彈出對話框選擇Total字段進(jìn)入Listoftestvariables,在ChisquareTest中利用自定義比例操作進(jìn)行檢驗(yàn),得到χ2=60.7,p值=0.011,故這120名學(xué)生考試成績服從正態(tài)分布。

2.2試卷的評價(jià)指標(biāo)及其量化

考試試卷由判斷、單選、填空、計(jì)算、解答等五種題型共29題構(gòu)成,其中,判斷、單選為客觀題,填空、計(jì)算、解答為主觀題。試卷題型分值分布見表1。

2.2.1難度P

難度主要反映試卷中考試試題的難易程度[2]。它是考試試題對學(xué)生知識技能適配程度高低的指標(biāo)。顯然,試題成績越高則該試題難度越小,成績越低則該試題難度越大。

客觀性試題難度為:

Pi=1-NiN

其中,Ni為第i題答對人數(shù),N為考生總數(shù),Pi為第i題的難度系數(shù)。

主觀性試題難度為:

Pi=1-XiXi

其中,Xi為第i題的平均分,Xi為第i題的滿分,Pi為第i題的難度系數(shù)。

試卷平均難度為:

P=1X∑Ti=1XiPi

其中,Xi為第i題的滿分,X為試卷滿分,Pi為第i題的難度系數(shù),T為試卷總題數(shù)。

計(jì)算得“高等數(shù)學(xué)”課程考試試卷平均難度P=0.5726。

2.2.2區(qū)分度D

區(qū)分度主要反映試卷中試題對不同水平考生的區(qū)分力,區(qū)分度應(yīng)該使得水平高的學(xué)生得高分、水平低的考生得低分,區(qū)分度又稱為鑒別力。

試題區(qū)分度求解方法眾多[3],在此介紹操作簡便易求解的相關(guān)分析方法。對客觀性試題,采用斯皮爾曼(Spearman)等級相關(guān)分析,將總分與各試題間的相關(guān)系數(shù)作為試題區(qū)分度;對主觀性試題,將其看作非等間距測度的連續(xù)變量,在樣本數(shù)大于30基礎(chǔ)上,采用皮爾遜(Pearson)相關(guān)分析,將總分與各試題間的積差相關(guān)系數(shù)作為試題區(qū)分度。

具體的方法:對客觀題,在SPSS中單擊Analyze→Correlate,在BivariateCorrelations對話框中選擇各客觀題和總分等字段進(jìn)入Variables,選擇Spearman,即可得客觀題的區(qū)分度。主觀題的區(qū)分度求解同上,在BivariateCorrelations對話框中選擇各主觀題和總分等字段進(jìn)入Variables,選擇Pearson,即可得主觀題的區(qū)分度。

試卷平均區(qū)分度為:

D=1X∑Ti=1XiDi

其中,Xi為第i題的滿分,X為試卷滿分,Di為第i題區(qū)分度,T為試卷試題總數(shù)。

計(jì)算得“高等數(shù)學(xué)”課程考試試卷平均區(qū)分度D=0.3164。

2.2.3效度V

效度主要反映試卷測驗(yàn)結(jié)果的有效性,即測量學(xué)生實(shí)際學(xué)習(xí)水平的有效程度,效度一定程度上反映了考試中系統(tǒng)誤差的大小。經(jīng)典且被公認(rèn)的效度主要有內(nèi)容效度、結(jié)構(gòu)效度和效標(biāo)關(guān)聯(lián)效度,具體使用的效度類型依據(jù)測驗(yàn)?zāi)康臎Q定。效標(biāo)關(guān)聯(lián)效度(criterionrelatedvalidity)[4]是以考試成績與效標(biāo)的相關(guān)系數(shù)作為考試成績的效度。在此采用效標(biāo)關(guān)聯(lián)效度,將期中成績作為校標(biāo),利用積差相關(guān)法(Pearson法)求得試卷效度。

具體方法:在SPSS中單擊Analyze→Correlate→Bivariate,選擇總分和期中成績進(jìn)入Items,在CorrelationCoefficients中選擇Pearson,得試卷效度V=0.206。

2.2.4信度R

信度主要反映試卷的穩(wěn)定性和可靠性,也是衡量隨機(jī)誤差的大小,即評判測試結(jié)果是否真實(shí)、客觀反映了學(xué)生的實(shí)際學(xué)習(xí)水平。信度越高測試結(jié)果越可信,信度太低則無法對學(xué)生學(xué)習(xí)水平做出公平合理的評價(jià)。信度求解方法眾多,試卷信度求解一般采用同質(zhì)性信度,在此采用克朗巴赫(Cronbach)方法[5]。

試卷信度為:

R=TT-11-∑S2iS2

其中,S為試卷標(biāo)準(zhǔn)差,Si為第i題得分的標(biāo)準(zhǔn)差,T為試卷的試題總數(shù),R代表試卷的信度。

具體方法:在SPSS中單擊Analyze→Scale→ReliabilityAnalysis,選擇全體題號進(jìn)入Items,在Model選擇Alpha(Cronbachα系數(shù)),得試卷信度R=0.541。

3試卷質(zhì)量模糊綜合評價(jià)[68]

模糊綜合評價(jià)法基于模糊數(shù)學(xué),對受到多種因素制約的事物做出總體評價(jià)。該評價(jià)法利用模糊數(shù)學(xué)的隸屬度理論把定性評價(jià)轉(zhuǎn)化為定量評價(jià),具有結(jié)果清晰、系統(tǒng)性強(qiáng)的特點(diǎn),能較好解決模糊的、難以量化的問題,適合各種非確定性問題的解決。

模糊綜合評價(jià)首先確定被評價(jià)對象的因素(指標(biāo))集和評價(jià)(等級)集;再分別確定各因素的權(quán)重及它們的隸屬度向量,獲得模糊評判矩陣;接著把模糊評判矩陣與因素的權(quán)向量進(jìn)行模糊運(yùn)算并作歸一化處理,得到模糊綜合評價(jià)結(jié)果。

3.1確定評價(jià)指標(biāo)

本文選取試卷難度、區(qū)分度、效度、信度等4個(gè)評價(jià)指標(biāo)作為評價(jià)試卷綜合質(zhì)量的因素集。

3.2確定指標(biāo)權(quán)重

各指標(biāo)的權(quán)重體現(xiàn)FJQv+JzEGfAm1hoXxOXyflcOR1bddOKHU/KgLDASrT8=了這些指標(biāo)相對于上一級指標(biāo)的重要程度,對于“成績—水平”考試,難度指標(biāo)比較重要,對權(quán)重的具體確定采用專家征詢的方法。

3.2.1構(gòu)造評判矩陣

本文用專家征詢法完成評判矩陣的構(gòu)造,記第k位專家的aij值為a(k)ij,求n位專家對指標(biāo)i、j的標(biāo)度a(1)ij,a(2)ij,…,a(n)ij的幾何平均值作為評判矩陣的標(biāo)度,即aij=n∏nk=1a(k)ij,得到評判矩陣R=a11…a1n

an1…ann。

本文經(jīng)專家征詢各指標(biāo)重要性后經(jīng)幾何平均得到評判矩陣為:

R=PDVR

11.192.711.41

0.8412.711.19

0.370.3710.45

0.710.842.211

3.2.2求權(quán)向量

計(jì)算評判矩陣R中每行元素的幾何平均作為該行指標(biāo)對應(yīng)的權(quán)重W′i,再對W′i作歸一化處理,則Wi=W′i∑W′i,所求各指標(biāo)的權(quán)重為W=(W1,W2,…,Wn)。

評判矩陣R中各行元素的幾何平均W′i=(1.46,1.28,0.50,1.07),對其歸一化處理得各指標(biāo)的權(quán)重為W=(0.34,0.30,0.12,0.25)。

3.2.3一致性檢驗(yàn)

對求得的權(quán)重向量使用公式:CR=CIRI進(jìn)行一致性檢驗(yàn),RI為R的平均一致性指標(biāo),CI為R的一般一致性指標(biāo),CI=1n-1(λmax-n),λmax為R的最大特征值,λmax=∑ni=1(RW)inWi,n為R的階數(shù)[9]。

當(dāng)CR<0.1時(shí),就認(rèn)為評判矩陣R具有滿意的一致性,即各指標(biāo)的權(quán)重分配合理。

對權(quán)重向量為W進(jìn)行一致性檢驗(yàn),計(jì)算得λmax=4.0032,CI=0.0010,n=4時(shí)RI=0.9,一致性比率CR=0.0012<0.1,據(jù)此知評判矩陣R具體滿意的一致性,即得難度P、區(qū)分度D、效度V和信度R的權(quán)系數(shù)。

3.3確定隸屬函數(shù)

本文對評判試卷質(zhì)量的4個(gè)指標(biāo)根據(jù)表2所示的量級[1011]規(guī)定給出如下隸屬函數(shù)[12]。

3.4試卷質(zhì)量綜合評價(jià)

對試卷質(zhì)量進(jìn)行綜合評價(jià)時(shí),利用綜合評分公式:

S(X)=0.34μP+0.3μD+0.12μV+0.25μR

把S(X)命名為試卷質(zhì)量綜合評分函數(shù),基于“高等數(shù)學(xué)”課程考試試卷四度代入對應(yīng)隸屬函數(shù)計(jì)算得:μP=00441,μD=0.3938,μV=0.2082,μR=0.6899,代入綜合評分函數(shù)得S(X)=0.63。

顯然,根據(jù)試卷綜合評分可知:該試卷質(zhì)量較低,其中試卷難度P=0.5726、區(qū)分度D=0.3164、效度V=0.206、信度R=0.541,對照表2,此套試卷從難度、區(qū)分度、效度和信度分別應(yīng)劃入差、尚可、差、良好檔次,故該試卷綜合評分尚合理。

為驗(yàn)證試卷質(zhì)量綜合評分函數(shù),現(xiàn)進(jìn)行試驗(yàn),結(jié)果見表3。

根據(jù)表3可知,當(dāng)試卷難度、區(qū)分度、效度、信度都好,試卷質(zhì)量綜合評分就高;當(dāng)4個(gè)指標(biāo)都不好,則試卷質(zhì)量綜合評分就低;當(dāng)難度、區(qū)分度優(yōu)秀,而效度、信度為差,則試卷質(zhì)量綜合評分還行,這與“成績—水平”考試難度指標(biāo)比較重要相吻合。

結(jié)語

根據(jù)影響試卷質(zhì)量的難度、區(qū)分度、效度和信度,利用模糊數(shù)學(xué)綜合評價(jià)方法構(gòu)建了試卷質(zhì)量綜合評分函數(shù),由此將試卷質(zhì)量得分通過0~1之間的分值進(jìn)行量化,得分越高即試卷越好。由此,考試成績作為評判教學(xué)效果的客觀性越強(qiáng)、可信度越高。試卷質(zhì)量綜合評分的高低,為今后編制試題和檢驗(yàn)教師教學(xué)、學(xué)生學(xué)習(xí)效果都提供了依據(jù)和方向。

參考文獻(xiàn):

[1]任艷玲,朱明放.基于統(tǒng)計(jì)軟件SPSS的學(xué)生試卷分析方法[J].重慶工學(xué)院學(xué)報(bào)(自然科學(xué)版),2007(04):9598.

[2]吳承禎,何麗華,林立群,等.試卷質(zhì)量分析方法及其應(yīng)用[J].中國林業(yè)教育,2008(03):2630.

[3]董喆.利用統(tǒng)計(jì)軟件SPSS進(jìn)行試卷質(zhì)量分析[J].中國科技信息,2009(15):100102.

[4]楊代慶,李晟,梁典.幾種利用SPSS對試卷進(jìn)行分析的方法[J].貴州教育學(xué)院學(xué)報(bào)(自然科學(xué)),2005(04):7578.

[5]趙珂.試卷質(zhì)量指標(biāo)分析[J].新疆教育學(xué)院學(xué)報(bào),2001(04):134136.

[6]李敬明,阮素梅,劉奎戶.基于改進(jìn)模糊綜合評價(jià)法的小微企業(yè)金融風(fēng)險(xiǎn)分析模型研究[J].運(yùn)籌與管理,2015,24(06):217224.

[7]王靜.基于模糊評價(jià)模型的教學(xué)評價(jià)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].計(jì)算機(jī)與數(shù)字工程,2016,44(09):17371742+1751.

[8]黃正陽,陳鑫.數(shù)學(xué)模型之試卷綜合評價(jià)模型[J].數(shù)學(xué)學(xué)習(xí)與研究,2018(03):142.

[9]呂洪芹.基于模糊綜合評判方法的交通運(yùn)輸部救助飛行隊(duì)安全運(yùn)行評估研究[J].中國水運(yùn),2018(02):3436.

[10]張雅波,李媛媛.試卷質(zhì)量的分析評價(jià)模型[J].職業(yè)教育研究,2008(05):5152.

[11]萬玉成,嚴(yán)斌輝,王金德.基于屬性數(shù)學(xué)模型的試卷質(zhì)量綜合評價(jià)方法[J].大學(xué)數(shù)學(xué),2009,25(03):150156.

[12]陳修素.多指標(biāo)分析在綜合評價(jià)試卷質(zhì)量中的應(yīng)用[J].工科數(shù)學(xué),2000(02):1923.

項(xiàng)目基金:2021年滇西應(yīng)用技術(shù)大學(xué)校級教學(xué)質(zhì)量工程項(xiàng)目“基于試卷質(zhì)量‘四度’分析的綜合評價(jià)模型構(gòu)建與機(jī)制研究”(編號:21JG06)

作者簡介:寸宇瀟(1992—),女,漢族,云南保山人,碩士,講師,研究方向:教育評價(jià)。

乌苏市| 巴彦县| 九江县| 信阳市| 宁都县| 阳原县| 宜良县| 稻城县| 珲春市| 博客| 唐河县| 和政县| 大田县| 石棉县| 石嘴山市| 兴宁市| 甘肃省| 明星| 巴里| 杨浦区| 吴堡县| 文山县| 弥勒县| 宁乡县| 确山县| 临沂市| 门头沟区| 宁强县| 安丘市| 富锦市| 达拉特旗| 香河县| 台南市| 江安县| 太湖县| 柞水县| 黄浦区| 郸城县| 漳浦县| 如皋市| 沿河|