基于AHP理論的數(shù)學(xué)高考試題綜合難度模型構(gòu)建與應(yīng)用

2020-04-22 10:28:48武小鵬孔企平

數(shù)學(xué)教育學(xué)報(bào) 2020年2期

武小鵬，孔企平

武小鵬1，2，孔企平2

（1．黔南民族師范學(xué)院數(shù)學(xué)與統(tǒng)計(jì)學(xué)院，貴州都勻 558000；2．華東師范大學(xué) 教師教育學(xué)院，上海 200062）

高考作為中國(guó)高利害性考試，其試題的難易程度直接影響著測(cè)試的質(zhì)量和測(cè)量的公平性，綜合難度系數(shù)模型能夠在測(cè)試前對(duì)試題的整體難度做出評(píng)估，為有效合理的測(cè)量提供了保障．綜合難度系數(shù)模型認(rèn)為，影響數(shù)學(xué)高考試題難度的因素分為背景、是否含有參數(shù)、運(yùn)算水平、推理能力、知識(shí)含量、思維方向、認(rèn)知水平7個(gè)因素，各因素之間分為不同水平．研究選取16位數(shù)學(xué)學(xué)科專家對(duì)綜合難度系數(shù)各因素與不同水平的難度做出比較評(píng)判，在此數(shù)據(jù)的基礎(chǔ)上采用層次分析理論（AHP）對(duì)不同因素的權(quán)重和同一維度中不同水平的權(quán)重進(jìn)行求解，進(jìn)而建立了更為切合實(shí)際的綜合難度系數(shù)模型．利用該模型對(duì)2019年理科數(shù)學(xué)全國(guó)Ⅰ和全國(guó)Ⅱ卷進(jìn)行評(píng)價(jià)，并對(duì)該模型的應(yīng)用前景和未來(lái)研究的方向進(jìn)行了討論．

層次分析法；測(cè)試項(xiàng)目；綜合難度；數(shù)學(xué)高考；難度模型

教育測(cè)評(píng)作為一項(xiàng)非常重要且又十分復(fù)雜的教育活動(dòng)，它對(duì)整個(gè)教育起到“牛鼻子”的引領(lǐng)功能[1]．測(cè)試作為學(xué)習(xí)者學(xué)習(xí)結(jié)果檢測(cè)和教育教學(xué)效果監(jiān)測(cè)的重要方法，在整個(gè)教育過(guò)程中得到廣泛的使用．一項(xiàng)測(cè)試項(xiàng)目的質(zhì)量往往受到多個(gè)因素的影響，如測(cè)試的信度、效度、區(qū)分度和難度等．然而在這些因素中試題的難度最能引起社會(huì)的高度關(guān)注．試題的難度在一定程度上影響著測(cè)試的公平性，尤其是在高利害性的測(cè)試中，難度更能夠決定應(yīng)試者的成敗，如中考、高考、研究生入學(xué)考試等．然而，目前對(duì)難度的計(jì)算都是在測(cè)試完成后，基于測(cè)試數(shù)據(jù)得到的，雖然這種計(jì)算難度的方法比較科學(xué)[2]．但是大多高利害性的測(cè)試都不允許提前大規(guī)模預(yù)測(cè)，以免造成試題曝光，導(dǎo)致試題泄漏．現(xiàn)有的評(píng)價(jià)注重綜合性，在評(píng)價(jià)的意義上分析，已超越了僅僅依靠定量評(píng)價(jià)的自然方法論[3]．綜合難度系數(shù)模型從影響測(cè)試項(xiàng)目的因素出發(fā)，依據(jù)數(shù)學(xué)學(xué)科特點(diǎn)對(duì)測(cè)試項(xiàng)目進(jìn)行深入的邏輯分析，能對(duì)測(cè)試項(xiàng)目的難易程度提前做出預(yù)判，能夠較大幅度提升測(cè)試的質(zhì)量[4]．雖然綜合難度系數(shù)模型已有較多的研究者在不同學(xué)科領(lǐng)域做了研究，如數(shù)學(xué)[5–6]、物理[7]、地理等[8]，但是對(duì)于難度系數(shù)模型中各因素之間的權(quán)重和同一因素中不同水平之間的權(quán)重計(jì)算存在很大的弊端．各因素之間一般采取簡(jiǎn)單相加，不同水平之間也采用簡(jiǎn)單的1、2、3分的主觀記分方式．這里采用專家評(píng)分的方式，借用AHP理論對(duì)該模型中的權(quán)重進(jìn)行計(jì)算，進(jìn)一步完善了綜合難度系數(shù)模型，使得模型更加貼近實(shí)際情況．

1 綜合難度系數(shù)模型

綜合難度系數(shù)模型是對(duì)表1中的因素和水平進(jìn)行有效的加權(quán)，聚合成一個(gè)指標(biāo)的過(guò)程．因素的難度系數(shù)為d：

表1 測(cè)試項(xiàng)目的綜合難度系數(shù)模型界定

其中，k是指第個(gè)因素的權(quán)重系數(shù)．

該模型充分考慮到不同影響因素對(duì)整個(gè)測(cè)試項(xiàng)目難度的影響．但在模型求解過(guò)程中，不同因素的權(quán)重系數(shù)k和同一因素中不同水平的權(quán)重系數(shù)k是未知的．已有研究的做法是方便權(quán)重，即認(rèn)為k都等于1，k則按照從低到高的水平分別為1、2、3等．這種計(jì)算方法顯然存在較大的問(wèn)題．權(quán)重的大小沒(méi)有科學(xué)依據(jù)．以下研究以專家評(píng)判的方式，利用AHP理論計(jì)算得出k與k的值．從而較為科學(xué)地完善了綜合難度系數(shù)模型．

2 基于AHP的權(quán)重計(jì)算方法

1990年，Satty教授“如何做決定——層次分析的過(guò)程”一文中提出了計(jì)算不同影響因素權(quán)重的方法[16]．該方法歸結(jié)起來(lái)由以下4個(gè)過(guò)程構(gòu)成[17]．

2.1 構(gòu)造判斷矩陣

在計(jì)算不同影響因素的權(quán)重系數(shù)之前需要給不同的指標(biāo)進(jìn)行重要性排序，排序通常用9點(diǎn)法評(píng)分，標(biāo)度表如表2．

表2 指標(biāo)評(píng)分標(biāo)度

依據(jù)以上評(píng)分規(guī)則，可建立判斷矩陣，

其中a表示第個(gè)指標(biāo)與第個(gè)指標(biāo)相比得到的標(biāo)度．

2.2 權(quán)重系數(shù)的計(jì)算[18]

2.3 權(quán)重系數(shù)的一致性檢驗(yàn)

通常一致性檢驗(yàn)指標(biāo)采用[19]

表3 RI取值

當(dāng)≤0.01，權(quán)重系數(shù)具有可接受的一致性．

3 綜合難度系數(shù)模型中各權(quán)重系數(shù)的建構(gòu)

為了較為合理地獲得權(quán)重系數(shù)，利用專家法構(gòu)建評(píng)判矩陣．專家組由16人組成，其中6人是具有多年教學(xué)經(jīng)驗(yàn)的教學(xué)名師，有深入的一線教學(xué)經(jīng)驗(yàn)和應(yīng)試能力，10人為具有試題研究經(jīng)歷的博士研究生，部分博士具有奧賽研究和輔導(dǎo)經(jīng)歷．通過(guò)專家組評(píng)判得到評(píng)分標(biāo)度數(shù)據(jù)．

3.1 各因素的權(quán)重系數(shù)計(jì)算

依據(jù)上述計(jì)算方法，通過(guò)對(duì)16位教師計(jì)算的結(jié)果求平均找近似的方法得到了如表4的數(shù)據(jù)．

表4 各因素標(biāo)度值

因此，不同因素的判別矩陣為：

在層次分析法中，判別矩陣的計(jì)算方法可以將人主觀評(píng)判進(jìn)行定量化的分析，這是將定性描述轉(zhuǎn)化為定量計(jì)算的重要環(huán)節(jié)[20]．依據(jù)進(jìn)一步計(jì)算得到

3.2 不同水平的權(quán)重系數(shù)計(jì)算

依據(jù)專家對(duì)不同水平的評(píng)判結(jié)果和AHP理論對(duì)權(quán)重的計(jì)算方法，得到不同水平權(quán)重系數(shù)計(jì)算信息表，如表5所示．

表5 不同水平權(quán)重系數(shù)計(jì)算數(shù)據(jù)

再依據(jù)一致性檢驗(yàn)指出計(jì)算方法得到1=0.008?12，2=0.007?38，3=0.004?09，4=0.000?93，5=0.006?17，6=0.009?01，7=0.003?90．其值均小于0.01的標(biāo)準(zhǔn)，因此，不同水平的權(quán)重系數(shù)存在較好的一致性．

4 綜合難度系數(shù)模型的應(yīng)用

為了驗(yàn)證以上建立的綜合難度系數(shù)模型的有效性．選取了2019年全國(guó)高考理科Ⅰ卷和Ⅱ卷作為分析對(duì)象．對(duì)試題依據(jù)表1的界定，從7個(gè)因素共19個(gè)水平進(jìn)行編碼統(tǒng)計(jì)．由于考慮到試題分值帶來(lái)的影響．編碼過(guò)程中將解答題進(jìn)行分布編碼，即作為兩道獨(dú)立的題目編碼兩次，以達(dá)到分值的平衡．同時(shí)為了檢驗(yàn)編碼的一致性，編碼采用兩組研究人員分別編碼，編碼一致性為89.17%，再對(duì)不一致的編碼項(xiàng)進(jìn)行討論得到最終編碼結(jié)果．

4.1 各因素不同水平對(duì)比分析

通過(guò)對(duì)每個(gè)影響因素不同水平編碼數(shù)量進(jìn)行統(tǒng)計(jì)，計(jì)算在整個(gè)測(cè)試中的比例，并繪制出圖1的水平對(duì)比折線圖．由于“是否含參”這一因素，卷Ⅰ和卷Ⅱ的數(shù)據(jù)完全一致，因此，這一圖像沒(méi)有呈現(xiàn)．

圖1反映了兩個(gè)測(cè)試在各因素不同水平上考查的對(duì)比結(jié)果，從圖1中可以看出，除了“是否含參”因素完全保持一致并且有參數(shù)和無(wú)參數(shù)各占一半外，“背景因素”“推理水平”“思維方向”這3個(gè)因素也基本保持一致．“背景因素”中無(wú)背景的題目占據(jù)絕大多數(shù)，占整個(gè)題目的80%左右，實(shí)際生活背景和科學(xué)背景的題目很少，僅不到20%．這說(shuō)明項(xiàng)目考查中情境性很低，沒(méi)有將試題融入到具體情境中考查，數(shù)學(xué)問(wèn)題的考查僅僅圍繞學(xué)科本身，降低了試題的趣味性．現(xiàn)有對(duì)核心素養(yǎng)的測(cè)評(píng)認(rèn)為，項(xiàng)目的考查需要關(guān)注的是課程學(xué)習(xí)的“真實(shí)性學(xué)業(yè)成就”[21]真實(shí)性學(xué)業(yè)成就不只是習(xí)得事實(shí)性的學(xué)科知識(shí)和概念，而是能夠運(yùn)用這些知識(shí)或概念解決復(fù)雜的現(xiàn)實(shí)性問(wèn)題[22]．在“推理能力”這一因素中，可以看出簡(jiǎn)單推理和復(fù)雜推理的比例基本在6∶4，說(shuō)明試題的考查在注重基本推理的基礎(chǔ)上，保證了復(fù)雜推理的考查，因此，也符合選拔性考試的特征．“思維方向”的影響因素中，卷Ⅰ的逆向思維項(xiàng)目略高于卷Ⅱ，逆向思維開始于高級(jí)推理，是創(chuàng)新思維的基礎(chǔ)，屬于高階思維水平[23]．可見(jiàn)卷Ⅰ在思維方向難度略高于卷Ⅱ．

圖1 各因素不同水平對(duì)比折線圖

在“運(yùn)算水平”“知識(shí)含量”“認(rèn)知水平”3個(gè)因素上，卷Ⅰ和卷Ⅱ有較大的差異．卷Ⅱ的運(yùn)算水平相對(duì)要高于卷Ⅰ，尤其是卷Ⅰ占有較大比例的簡(jiǎn)單數(shù)值運(yùn)算，但卻在簡(jiǎn)單符號(hào)運(yùn)算方面卷Ⅱ高于卷Ⅰ．運(yùn)算水平在一定的程度上體現(xiàn)了試卷的復(fù)雜程度，尤其是作答需要的時(shí)間，在這個(gè)方面來(lái)看，卷Ⅱ要略高于卷Ⅰ．在“知識(shí)含量”因素上，卷Ⅰ在兩個(gè)知識(shí)點(diǎn)和3個(gè)及3個(gè)以上知識(shí)點(diǎn)的水平上表現(xiàn)出更高的難度，數(shù)據(jù)均高于卷Ⅰ．但兩個(gè)測(cè)試項(xiàng)目在知識(shí)含量方面多集中在單個(gè)知識(shí)點(diǎn)的考查，跨章節(jié)跨領(lǐng)域知識(shí)的考查很少．在“認(rèn)知水平”因素來(lái)看，同樣卷Ⅰ在高認(rèn)知水平上的比例要大于卷Ⅱ，尤其是在分析層次水平上的項(xiàng)目明顯高于卷Ⅱ．在這一因素上，卷Ⅰ有更高的難度．

4.2 各因素綜合難度分析

利用上述研究獲得的權(quán)重系數(shù)，將編碼數(shù)據(jù)帶入公式（1），可以得到各個(gè)因素的難度系數(shù)．各因素的難度系數(shù)得到的雷達(dá)圖，如圖2所示．

圖2 卷Ⅰ和卷Ⅱ不同因素綜合難度系數(shù)雷達(dá)圖

圖2在一定程度上反映了整個(gè)測(cè)試的難度構(gòu)成，以及不同測(cè)試在各因素上的難度差異．從綜合難度系數(shù)來(lái)分析，整個(gè)測(cè)試的難度主要集中在“思維方向”“推理能力”“是否含參”這3個(gè)因素上．并且這3個(gè)因素遠(yuǎn)遠(yuǎn)高于其它因素．學(xué)生要突破難點(diǎn)則需要在思維的靈活性，尤其是逆向思維的培養(yǎng)訓(xùn)練方面下功夫．教師也應(yīng)該多關(guān)注學(xué)生逆向思維的培養(yǎng)．推理能力是數(shù)學(xué)教育的最核心問(wèn)題之一，在數(shù)學(xué)的學(xué)習(xí)過(guò)程中起到至關(guān)重要的作用[24]．這一因素成為影響試卷難度的重要部分，是符合數(shù)學(xué)學(xué)科本質(zhì)特點(diǎn)的．參數(shù)作為由“靜態(tài)”到“動(dòng)態(tài)”轉(zhuǎn)變的關(guān)鍵指標(biāo)，對(duì)測(cè)試難度也起到至關(guān)重要的作用．由不含參數(shù)到含參數(shù)的變化，是由靜態(tài)知識(shí)向動(dòng)態(tài)能力提升的過(guò)程．“背景因素”承載的難度最小，這與高考試題中很少出現(xiàn)實(shí)際生活背景和科學(xué)背景的原因有直接關(guān)系．“認(rèn)知水平”和“知識(shí)含量”的難度系數(shù)處于中間地位，在一定的程度上影響了試題的難度．從兩個(gè)測(cè)試的各難度系數(shù)的差異上分析，兩者基本保持難度分布的一致性，僅有個(gè)別因素有一定的差異，如在“認(rèn)知水平”“知識(shí)含量”這兩個(gè)維度上，卷Ⅰ難度明顯高于卷Ⅱ，在“運(yùn)算水平”上卷Ⅱ反而要高于卷Ⅰ．但總體來(lái)看，卷Ⅰ的各難度系數(shù)不同程度的要高于卷Ⅱ．

4.3 測(cè)試項(xiàng)目綜合難度系數(shù)

5 討論與展望

5.1 討論

（1）綜合難度系數(shù)模型大幅度提升了測(cè)試的內(nèi)容效度和結(jié)構(gòu)效度．

綜合難度系數(shù)模型從數(shù)學(xué)學(xué)科特點(diǎn)和影響學(xué)生問(wèn)題解決的因素出發(fā)，就測(cè)試項(xiàng)目本身進(jìn)行多維度深層次的分析，并將分析結(jié)果通過(guò)加權(quán)聚類的方式進(jìn)行量化處理．這一模型打破了只有測(cè)試后才能得到試題難度這一壁壘，能夠有效地對(duì)測(cè)試項(xiàng)目測(cè)前預(yù)測(cè)試題難度．尤其是在大規(guī)模和高利害性考試中有重要的作用，由于從7個(gè)方面、19個(gè)水平對(duì)試題做了分析，因此試題在內(nèi)容上和結(jié)構(gòu)上有了進(jìn)一步的保障，使得測(cè)試更加具有實(shí)踐可行性．綜合難度系數(shù)模型是將學(xué)生問(wèn)題解決的認(rèn)知障礙進(jìn)行量化分析，這種分析過(guò)程在幫助教師了解教學(xué)重點(diǎn)，幫助學(xué)生提升問(wèn)題解決能力等方面起到了一定的作用．教師通過(guò)分析測(cè)試考查情況（如對(duì)高考試題的分析），可以進(jìn)一步有針對(duì)性地對(duì)學(xué)生提出補(bǔ)救教學(xué)的方案．學(xué)生通過(guò)對(duì)試題的分析和自己的作答結(jié)果對(duì)比，可以更深層次地進(jìn)行反思，彌補(bǔ)自己的不足．

（2）綜合難度系數(shù)模型對(duì)學(xué)生的認(rèn)知診斷測(cè)評(píng)提供了基本架構(gòu)．

綜合難度系數(shù)模型，有著明顯的結(jié)構(gòu)化特征，可以對(duì)測(cè)試項(xiàng)目進(jìn)行較為嚴(yán)格的編碼分析．雖然綜合難度系數(shù)模型僅僅是對(duì)試題的難度做出前期的預(yù)測(cè)．但如果這種編碼分析和學(xué)生的作答建立聯(lián)系．其本質(zhì)上講，綜合難度系數(shù)模型的編碼框架就構(gòu)成了學(xué)生測(cè)試的認(rèn)知模型，就可以和認(rèn)知診斷測(cè)評(píng)過(guò)程進(jìn)行有效地銜接．認(rèn)知診斷理論是在項(xiàng)目反應(yīng)理論的基礎(chǔ)上發(fā)展起來(lái)的新一代測(cè)評(píng)理論，它是以項(xiàng)目的形式呈現(xiàn)給反應(yīng)者任務(wù)，把反應(yīng)者的反應(yīng)結(jié)果作為診斷的數(shù)據(jù)，反應(yīng)者的潛在特質(zhì)作為屬性，將這些屬性表示為潛在變量的變量，再用心理測(cè)評(píng)模型加以分析，得到認(rèn)知診斷結(jié)果的測(cè)評(píng)技術(shù)[25]．通過(guò)綜合難度系數(shù)模型的分析，可以將一個(gè)傳統(tǒng)的測(cè)試改編成一個(gè)具有現(xiàn)代測(cè)量特征的認(rèn)知診斷測(cè)評(píng)，這樣可以依據(jù)認(rèn)知診斷測(cè)評(píng)的結(jié)果對(duì)學(xué)生做出個(gè)性化的補(bǔ)救方案，大幅度提升因材施教的能力．

（3）綜合難度系數(shù)模型為測(cè)試項(xiàng)目的自動(dòng)化評(píng)判和自適應(yīng)測(cè)評(píng)提供了基礎(chǔ)．

從研究分析的過(guò)程來(lái)看，對(duì)于綜合難度系數(shù)模型的計(jì)算有一定的復(fù)雜性，如果僅僅依靠手工計(jì)算存在一定的難度，同時(shí)也降低了綜合難度系數(shù)模型的可操作性和應(yīng)用價(jià)值，因此，可以將綜合難度系數(shù)模型的操作過(guò)程進(jìn)行計(jì)算機(jī)輔助處理，將計(jì)算過(guò)程程序化．不僅如此，更進(jìn)一步地，可以將綜合難度系數(shù)模型的過(guò)程嵌入到計(jì)算機(jī)自適應(yīng)測(cè)評(píng)系統(tǒng)中，達(dá)到對(duì)測(cè)試項(xiàng)目綜合難度分析和自適應(yīng)測(cè)評(píng)的雙重目的．現(xiàn)有的學(xué)習(xí)測(cè)評(píng)分析工具，可通過(guò)學(xué)生的在線學(xué)習(xí)和測(cè)評(píng)，將結(jié)果以可視化形式呈現(xiàn)給學(xué)生，幫助學(xué)生分析自身學(xué)習(xí)的問(wèn)題，促進(jìn)反思，調(diào)整學(xué)習(xí)策略，以獲得更大進(jìn)步[26]．學(xué)習(xí)測(cè)評(píng)技術(shù)自適應(yīng)性具有傳統(tǒng)測(cè)評(píng)無(wú)法達(dá)到的眾多優(yōu)點(diǎn)，學(xué)習(xí)測(cè)評(píng)走向計(jì)算機(jī)自適應(yīng)化是測(cè)評(píng)發(fā)展的必然局勢(shì)．

5.2 展望

綜合難度系數(shù)模型雖在預(yù)測(cè)測(cè)試項(xiàng)目的難度和分析測(cè)試內(nèi)容的量化處理方面有著較大的優(yōu)勢(shì)，但任何測(cè)評(píng)模型都會(huì)存在不同程度的不完善之處，綜合難度系數(shù)模型也不例外．因此，要完善綜合難度系數(shù)模型還有許多工作可做．首先，雖然對(duì)綜合難度系數(shù)模型的各個(gè)影響因素和不同因素水平的權(quán)重進(jìn)行了計(jì)算，較大幅度地提升了綜合難度系數(shù)模型的可信度，但是在綜合難度系數(shù)模型中對(duì)測(cè)試難度影響因素的產(chǎn)生僅憑理論分析，還缺乏數(shù)據(jù)支撐，后期可以通過(guò)探索性因子分析和驗(yàn)證性因子分析對(duì)影響因素進(jìn)行校正，再通過(guò)結(jié)構(gòu)方程模型建構(gòu)測(cè)試項(xiàng)目難度影響因素的結(jié)構(gòu)框架，其結(jié)果應(yīng)該會(huì)更加合理；其次，綜合難度系數(shù)模型的程序化處理和認(rèn)知診斷測(cè)評(píng)、計(jì)算機(jī)自適應(yīng)測(cè)評(píng)的結(jié)合還會(huì)有很多問(wèn)題有待研究．

[1] 謝維和．教育評(píng)價(jià)的雙重約束——兼以高考改革為案例[J]．教育研究，2019，40（9）：4–13．

[2] 任子朝，佟威，趙軒．高考試題難度預(yù)估的校準(zhǔn)與改進(jìn)研究[J]．?dāng)?shù)學(xué)教育學(xué)報(bào)，2019，28（6）：1–4．

[3] JOHN W. The greenwood dictionary of education [M]. New York: Greenwood Press, 2003: 130.

[4] 付鈺，張景斌．中美數(shù)學(xué)教材三角函數(shù)習(xí)題的比較研究[J]．?dāng)?shù)學(xué)教育學(xué)報(bào)，2018，27（3）：14–18．

[5] 王建磐，鮑建生．高中數(shù)學(xué)教材中例題的綜合難度的國(guó)際比較[J]．全球教育展望，2014，43（8）：101–110．

[6] 覃淋．“中國(guó)大陸”“日本”和“中國(guó)臺(tái)灣”高中數(shù)學(xué)教材統(tǒng)計(jì)習(xí)題難度比較研究[J]．?dāng)?shù)學(xué)教育學(xué)報(bào)，2019，28（1）：55–60．

[7] 仲扣莊，郭玉英．高中物理課程標(biāo)準(zhǔn)教科書內(nèi)容難度定量分析——以“量子理論”為例[J]．課程·教材·教法，2010，30（4）：67–71．

[8] 王冰，揭毅．基于綜合難度系數(shù)模型的2018年高考地理試題評(píng)析[J]．教育測(cè)量與評(píng)價(jià)，2018（12）：40–48．

[9] NOHARA D, GOLDSTEIN A A. A comparison of the national assessment of educational progress (NAEP), the third international mathematics and science study repeat (TIMSS-R), and the program for international student assessment (PISA) [R]. US Department of Education, National Center for Education Statistics (NCES), 2001: 97–110.

[10] 鮑建生．中英兩國(guó)初中數(shù)學(xué)期望課程綜合難度的比較[J]．全球教育展望，2002，31（9）：48–52．

[11] 史寧中，孔凡哲，李淑文．課程難度模型：我國(guó)義務(wù)教育幾何課程難度的對(duì)比[J]．東北師大學(xué)報(bào)（哲學(xué)社會(huì)科學(xué)版），2005（6）：151–155．

[12] 廖伯琴，左成光，蘇蘊(yùn)娜．國(guó)際中學(xué)科學(xué)教材實(shí)驗(yàn)內(nèi)容難度比較——以高中物理為例[J]．全球教育展望，2017，46（4）：23–29，108．

[13] 趙凌云，王秀秀，陳志輝．上海與臺(tái)灣初中數(shù)學(xué)“三角形”內(nèi)容習(xí)題認(rèn)知難度比較——以滬教版和康軒版為例[J]．?dāng)?shù)學(xué)教育學(xué)報(bào)，2018，27（5）：66–71，98．

[14] 武小鵬，張怡．中國(guó)和韓國(guó)高考數(shù)學(xué)試題綜合難度比較研究[J]．?dāng)?shù)學(xué)教育學(xué)報(bào)，2018，27（3）：19–24，29．

[15] 張怡，武小鵬．綜合難度系數(shù)模型在2016年高考數(shù)學(xué)試題評(píng)價(jià)中的應(yīng)用[J]．教育測(cè)量與評(píng)價(jià)，2016（12）：47–53．

[16] ?SAATY T L. How to make a decision: The analytic hierarchy process [J]. European Journal of Operational Research, 1990, 48 (1): 9–26.

[17] 張怡，武小鵬．基于AHP—模糊矩陣的翻轉(zhuǎn)課堂綜合評(píng)價(jià)系統(tǒng)設(shè)計(jì)[J]．現(xiàn)代遠(yuǎn)距離教育，2018（5）：19–26．

[18] 郭亮，鄧?yán)誓荩瘟纾贔uzzy-AHP的應(yīng)用BIM教學(xué)評(píng)價(jià)研究[J]．?dāng)?shù)學(xué)的實(shí)踐與認(rèn)識(shí)，2017，47（1）：8–15．

[19] ?CHICLANA F, HERRERA F, HERRERA-VIEDMA E. Integrating three representation models in fuzzy multipurpose decision making based on fuzzy preference relations [J]. Fuzzy Sets and Systems, 1998, 97 (1): 33–48.

[20] 張燕，董玉琦，王煒．基于層次分析法的高中信息技術(shù)教師專業(yè)知識(shí)水平評(píng)價(jià)——以東北地區(qū)為例[J]．中國(guó)電化教育，2014（9）：34–39，58．

[21] 楊向東．指向?qū)W科核心素養(yǎng)的考試命題[J]．全球教育展望，2018，47（10）：39–51．

[22] ?CHI M T H, FELTOVICH P J, GLASER R. Categorization and representation of physics problems by experts and novices [J]. Cognitive Science, 1981, 5 (2): 121–152.

[23] 王佑鎂．設(shè)計(jì)型學(xué)習(xí)：探究性教學(xué)新樣式——兼論尼爾森的逆向思維學(xué)習(xí)過(guò)程模型[J]．現(xiàn)代教育技術(shù)，2012，22（6）：12–15．

[24] 吳亞萍．美國(guó)數(shù)學(xué)教育的核心問(wèn)題——推理能力的培養(yǎng)[J]．外國(guó)教育資料，1999（5）：59–55．

[25] ?RUPP A A, TEMPLIN J, HENSON R A. Diagnostic measurement: Theory, methods, and applications [M]. New York: Guilford, 2010: 92–125.

[26] 郭炯，鄭曉?。诖髷?shù)據(jù)的學(xué)習(xí)分析研究綜述[J]．中國(guó)電化教育，2017（1）：121–130．

The Construction and Application of the Comprehensive Difficulty Model of Mathematical Advanced Examination Questions Based on AHP Theory

WU Xiao-peng1, 2, KONG Qi-ping2

(1. Qiannan Normal University for Nationalities, School of Mathematics and Statistics, Guizhou Qiannan 558000, China; 2. East China Normal University, College of Teacher Education, Shanghai 200062, China)

As China’s national college entrance examination, the difficulty of the test questions directly affected the quality of the test and the fairness of the measurement. The comprehensive difficulty coefficient model could evaluate the overall difficulty of the test questions before the test, providing a guarantee for effective and reasonable measurement. According to the comprehensive difficulty coefficient model, the factors influencing the difficulty of the mathematics college entrance examination test could be divided into seven factors: background, whether or not the test contains parameters, operation level, reasoning ability, knowledge content, thinking direction and cognitive level, and each factor could be divided into different levels. In this study, 16 subject experts were selected to make a comparative evaluation on the difficulty of each dimension of the comprehensive difficulty coefficient. Based on this data, the analytic hierarchy process (AHP) was applied to solve the weights of different factors and weights at different levels in the same dimension, and then a more appropriate and practical comprehensive difficulty coefficient model was established. This model was used to evaluate the national I and national II volumes of science mathematics in 2019, and its application and future research directions were discussed.

analytic hierarchy process; test items; comprehensive difficulty; mathematics college entrance examination; difficulty model

G424.74

1004–9894（2020）02–0029–06

2019–12–13

2019年貴州省哲學(xué)社會(huì)科學(xué)規(guī)劃青年課題——貴州民族地區(qū)高中學(xué)生核心素養(yǎng)的認(rèn)知診斷測(cè)評(píng)體系構(gòu)建研究（19GZQN29）；2019年貴州省哲學(xué)社會(huì)科學(xué)聯(lián)合基金課題——黔南民族地區(qū)高中學(xué)生數(shù)學(xué)核心素養(yǎng)的認(rèn)知診斷測(cè)評(píng)研究（LHKT2019YB19）

武小鵬（1986—），男，甘肅天水人，黔南民族師范學(xué)院副教授，華東師范大學(xué)與美國(guó)普渡大學(xué)聯(lián)合培養(yǎng)博士生，碩士生導(dǎo)師，主要從事數(shù)學(xué)教育、課堂教學(xué)評(píng)價(jià)、認(rèn)知診斷測(cè)評(píng)研究．

武小鵬，孔企平．基于AHP理論的數(shù)學(xué)高考試題綜合難度模型構(gòu)建與應(yīng)用[J]．?dāng)?shù)學(xué)教育學(xué)報(bào)，2020，29（2）：29?34．

[責(zé)任編校：周學(xué)智、陳雋]

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

基于AHP理論的數(shù)學(xué)高考試題綜合難度模型構(gòu)建與應(yīng)用

1 綜合難度系數(shù)模型

2 基于AHP的權(quán)重計(jì)算方法

2.1 構(gòu)造判斷矩陣

2.2 權(quán)重系數(shù)的計(jì)算[18]

2.3 權(quán)重系數(shù)的一致性檢驗(yàn)

3 綜合難度系數(shù)模型中各權(quán)重系數(shù)的建構(gòu)

3.1 各因素的權(quán)重系數(shù)計(jì)算

3.2 不同水平的權(quán)重系數(shù)計(jì)算

4 綜合難度系數(shù)模型的應(yīng)用

4.1 各因素不同水平對(duì)比分析

4.2 各因素綜合難度分析

4.3 測(cè)試項(xiàng)目綜合難度系數(shù)

5 討論與展望

5.1 討論

5.2 展望