基于剔除抄襲因素和學(xué)生能力因素的題目難度預(yù)測(cè)研究

2019-12-30 09:37王詩(shī)吳瑤王春瑩朱笑瑩

中國(guó)教育信息化·高教職教 2019年12期

王詩(shī) 吳瑤王春瑩朱笑瑩

摘? ?要：在高等院校的教學(xué)中，針對(duì)學(xué)生不同的學(xué)習(xí)階段和不同的教學(xué)目的，教師需要在不同情況下布置難度不同的習(xí)題以滿足教學(xué)期望。文章通過(guò)開(kāi)發(fā)自定義習(xí)題生成系統(tǒng)，設(shè)計(jì)了相應(yīng)的實(shí)驗(yàn)過(guò)程，通過(guò)對(duì)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行相關(guān)性檢驗(yàn)，得到抄襲因素對(duì)正確率影響的理性判斷。排除抄襲因素影響后，通過(guò)對(duì)題目正確率、學(xué)生能力進(jìn)行相關(guān)性檢驗(yàn)，結(jié)合學(xué)生能力因素，建立二元回歸分析模型，構(gòu)建出習(xí)題難度的預(yù)測(cè)模型，從而精確預(yù)測(cè)習(xí)題預(yù)期正確率。此外，文章的研究方法及研究流程具有普遍性和適用性，文中涉及的自定義習(xí)題生成系統(tǒng)和習(xí)題難度預(yù)測(cè)模型，可以推廣運(yùn)用在高等院校電子與通信技術(shù)學(xué)科、物理學(xué)學(xué)科、數(shù)學(xué)相關(guān)科目的習(xí)題布置中。

關(guān)鍵詞：教育;回歸模型;難度預(yù)測(cè);抄襲率;學(xué)生能力

中圖分類號(hào)：G642.0 文獻(xiàn)標(biāo)志碼：A 文章編號(hào)：1673-8454（2019）23-0022-06

一、引言

在高等院校的教學(xué)中，習(xí)題布置是幫助學(xué)生鞏固課堂教授的知識(shí)點(diǎn)、考察學(xué)生對(duì)知識(shí)點(diǎn)的掌握程度的重要手段，是一種被廣泛使用的教學(xué)評(píng)價(jià)方法。針對(duì)學(xué)生不同的學(xué)習(xí)階段和不同的教學(xué)目的，教師需要在不同情況下布置難度不同的習(xí)題以滿足教學(xué)期望。因此，對(duì)題目難度進(jìn)行量化分級(jí)對(duì)于教育的改革發(fā)展有著重要幫助。合理把握題目難度可以幫助教師有針對(duì)性地命題，使題目難度達(dá)到預(yù)設(shè)效果，使教師能夠更好地規(guī)范其對(duì)概念、方法及其關(guān)系的教學(xué)，幫助教師更加科學(xué)地在教學(xué)的不同階段進(jìn)行相應(yīng)難度題目的布置，從而提高教學(xué)質(zhì)量。同時(shí)，難度量化分級(jí)可以使學(xué)生對(duì)題目的難易程度有更為直觀的判斷，根據(jù)所做題目的難度，更客觀地了解自身學(xué)習(xí)水平?！峨姶艌?chǎng)與電磁波》是一門內(nèi)容概念抽象、公式繁多、課程體系嚴(yán)謹(jǐn)且對(duì)電子與通信技術(shù)學(xué)科極為重要的科目[1]。所以對(duì)《電磁場(chǎng)與電磁波》這門科目進(jìn)行難度量化分級(jí)有著重要意義。

經(jīng)典測(cè)量理論（Classic Test Theory，CTT）采用通過(guò)率法表示題目難度;項(xiàng)目反應(yīng)理論（Item Response Theory，IRT）用項(xiàng)目特征曲線的拐點(diǎn)位置反映該題的難度。CTT或IRT框架下的難度參數(shù)，都需要通過(guò)實(shí)際測(cè)試考生獲得，這種預(yù)測(cè)方式的實(shí)施具有一定的局限性[2]。這種局限性主要體現(xiàn)在獲取大規(guī)模樣本存在極大的操作難度。因此早期的難度預(yù)估主要依賴專家主觀經(jīng)驗(yàn)直接判斷題目難度，這種方法是比較傳統(tǒng)并廣泛使用的一種難度預(yù)估方法。近年來(lái)，隨著信息技術(shù)的普及和深入，數(shù)據(jù)分析在教育領(lǐng)域的應(yīng)用也越來(lái)越普遍，測(cè)試樣本收集導(dǎo)致的局限性不再明顯，通過(guò)被測(cè)樣本數(shù)據(jù)進(jìn)行難度量化分級(jí)在現(xiàn)實(shí)情景中應(yīng)用的可操作性逐步提升。

然而，實(shí)踐中對(duì)于題目難度的預(yù)估往往不能盡如人意，其根本原因在于各因素對(duì)難度的影響是十分復(fù)雜的。2006 年，LEONG? See? Cheng 總結(jié)了四個(gè)影響試卷難度的因素：內(nèi)容方面，主要指知識(shí)量;材料方面，指詞匯和信息呈現(xiàn)方式等難度;被試者因素，主要指被試者的心理和生理等素質(zhì);命題者的決策，指命題者對(duì)考試所期望的難易程度[3]。王希年提出難度設(shè)計(jì)與預(yù)測(cè)應(yīng)結(jié)合題目本質(zhì)難度與考生狀況進(jìn)行，題目的得分率與其難度因素和考生學(xué)業(yè)水平二元相關(guān)[4]。通過(guò)文獻(xiàn)分析得知，考慮抄襲因素和學(xué)生能力對(duì)難度分級(jí)影響的研究相對(duì)較少，但抄襲因素和學(xué)生能力是難度分級(jí)研究中不可忽視的影響因素，故本研究為難度量化分級(jí)提供了更為完善的理論依據(jù)，做出了如下貢獻(xiàn)：

（1）在教學(xué)實(shí)踐中，布置習(xí)題作業(yè)后收到的結(jié)果，受多方面因素影響，使得習(xí)題的情況往往無(wú)法客觀準(zhǔn)確地反映教學(xué)效果的好壞。這些因素包括：①習(xí)題相對(duì)固定，難以避免抄襲;②頻繁更新習(xí)題，質(zhì)量難保證;③使用多樣化的題組，難度難以統(tǒng)一把握。針對(duì)上述問(wèn)題，筆者設(shè)計(jì)開(kāi)發(fā)了自定義習(xí)題系統(tǒng)，可以定制題干相同但題目?jī)?nèi)具體數(shù)值不相同的多套習(xí)題。

（2）通過(guò)正確率客觀量化題目難度，排除人為量化題目難度時(shí)專家經(jīng)驗(yàn)、情感等個(gè)人主觀因素的影響，客觀量化題目難度。同時(shí)剔除了抄襲因素對(duì)實(shí)驗(yàn)數(shù)據(jù)的影響，通過(guò)對(duì)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行卡方檢驗(yàn)，得到抄襲因素對(duì)正確率影響的理性判斷。

（3）探究學(xué)生能力因素對(duì)習(xí)題對(duì)錯(cuò)的影響，作者根據(jù)《電磁場(chǎng)與電磁波》科目特征，對(duì)相關(guān)科目進(jìn)行相關(guān)性檢驗(yàn)，得到針對(duì)《電磁場(chǎng)與電磁波》可以代表學(xué)生能力因素的科目。

（4）綜合考慮抄襲因素對(duì)實(shí)驗(yàn)數(shù)據(jù)正確率的影響和學(xué)生能力因素對(duì)題目對(duì)錯(cuò)的影響，通過(guò)對(duì)各影響因素和題目對(duì)錯(cuò)進(jìn)行回歸性分析，成功建立《電磁場(chǎng)與電磁波》題目難度預(yù)測(cè)模型。

通過(guò)剔除抄襲因素，使被測(cè)樣本數(shù)據(jù)的代表性得到保障。同時(shí)，考慮學(xué)生能力對(duì)難度分級(jí)的影響，使難度預(yù)測(cè)模型更為完善。本文希望通過(guò)以對(duì)《電磁場(chǎng)與電磁波》科目難度預(yù)測(cè)模型的建立為例，給出剔除抄襲因素并考慮學(xué)生能力對(duì)難度分級(jí)影響的更為完善的建模方法。

二、通過(guò)正確率反映題目難度

1.題目難度的概念

《教育測(cè)量與評(píng)價(jià)》一書(shū)中將題目的難度定義為被測(cè)試者完成題目（項(xiàng)目）時(shí)所遇到的困難程度[5]。難度具有雙重特性：一是客觀性，難度由其本身的復(fù)雜程度所決定;二是相對(duì)性，難度除了與測(cè)試內(nèi)容本身的難易程度有關(guān)外，還與被測(cè)者的知識(shí)經(jīng)驗(yàn)和測(cè)驗(yàn)的編制技術(shù)有關(guān)。

2.難度的表示方式

反映題目難度的指標(biāo)稱為題目的難度系數(shù)，也簡(jiǎn)稱為題目難度。問(wèn)題解決者在解決問(wèn)題的過(guò)程中所花費(fèi)的時(shí)間越長(zhǎng)、正確率越低，說(shuō)明問(wèn)題越難，反之，則說(shuō)明問(wèn)題相對(duì)容易[6]。在經(jīng)典測(cè)量理論中，通常以通過(guò)率作為難度指標(biāo)，表示為：

P=R/N

P表示難度系數(shù)，N為全體被測(cè)人數(shù)，R為答對(duì)或通過(guò)該項(xiàng)目的人數(shù)。難度系數(shù)可以理解為“正確率”。故本文中對(duì)難度的定義如下：正確率數(shù)值越大，可以認(rèn)為題目總體越容易，反之，正確率數(shù)值越小，則表示題目難度越大。

三、自定義習(xí)題生成系統(tǒng)

自定義習(xí)題系統(tǒng)是利用python語(yǔ)言生成所需的LaTeX源碼，進(jìn)而利用LaTeX組卷排版生成可定制組數(shù)且各組題型相同、題目中數(shù)值不同的n組試卷，其中n為定制組數(shù)。該系統(tǒng)可以實(shí)現(xiàn)多種功能：①同時(shí)定制題干相同但題目?jī)?nèi)具體數(shù)值不相同的多套習(xí)題;②自動(dòng)生成規(guī)范示意圖;③自動(dòng)計(jì)算參考答案;④自動(dòng)排版。通過(guò)該套系統(tǒng)，在避免學(xué)生作業(yè)抄襲的同時(shí)，也大幅提高了教師的命題效率，并形成標(biāo)準(zhǔn)化的批閱流程和客觀評(píng)價(jià)指標(biāo)。

四、研究方法和步驟

筆者使用正確率描述題目難度，相關(guān)科目成績(jī)描述學(xué)生能力，假設(shè)通過(guò)難度和學(xué)生能力可以判斷學(xué)生能否做對(duì)相關(guān)習(xí)題。

在研究開(kāi)始，筆者通過(guò)開(kāi)發(fā)的自定義習(xí)題系統(tǒng)定制題干相同但題目?jī)?nèi)具體數(shù)值不相同的多套習(xí)題，將該套習(xí)題和傳統(tǒng)習(xí)題分發(fā)給知識(shí)水平相近的兩組學(xué)生完成，得到作業(yè)評(píng)估數(shù)據(jù)的對(duì)錯(cuò)結(jié)果。

如圖1所示，通過(guò)自定義習(xí)題系統(tǒng)生成三道習(xí)題A1、A2、A3，三道習(xí)題題型、題干相同，但題目?jī)?nèi)具體數(shù)值不相同。

本次課程中，一共進(jìn)行了兩次關(guān)于剔除抄襲因素影響的實(shí)驗(yàn)。試驗(yàn)中學(xué)生分組按照教授該課程教師的不同進(jìn)行分組，每組學(xué)生該課程的授課教師相同。

（1）第一次實(shí)驗(yàn)，一組學(xué)生使用傳統(tǒng)的習(xí)題布置方式;另一組學(xué)生使用定制化習(xí)題系統(tǒng)批量生成習(xí)題方式。

（2）第二次實(shí)驗(yàn)，一組學(xué)生（第一次試驗(yàn)使用定制化習(xí)題系統(tǒng)批量生成習(xí)題方式）使用傳統(tǒng)的習(xí)題布置方式;另一組（第一次試驗(yàn)使用傳統(tǒng)的習(xí)題布置方式）學(xué)生使用定制化習(xí)題系統(tǒng)批量生成習(xí)題方式。

下文將做“題干相同但題目?jī)?nèi)數(shù)值不同”題目的學(xué)生組稱為甲組、做傳統(tǒng)題目的學(xué)生組稱為乙組。

1.抄襲因素的統(tǒng)計(jì)檢驗(yàn)與排除

本文將以量化分析和統(tǒng)計(jì)檢驗(yàn)的研究方法，分析甲組數(shù)據(jù)和乙組數(shù)據(jù)的統(tǒng)計(jì)特征，檢驗(yàn)抄襲因素是否真正對(duì)習(xí)題正確率產(chǎn)生顯著影響，如果有影響，在接下來(lái)的難度估計(jì)模型建模中，只使用剔除抄襲因素影響的數(shù)據(jù)。徐敏在論文中調(diào)查了學(xué)生獨(dú)立完成作業(yè)的情況，并結(jié)合習(xí)題正確率，指出當(dāng)存在抄襲情況時(shí)，習(xí)題正確率會(huì)提高[7]。本文以量化分析和統(tǒng)計(jì)檢驗(yàn)的研究方法，分析甲組數(shù)據(jù)和乙組數(shù)據(jù)的統(tǒng)計(jì)特征，檢驗(yàn)抄襲因素是否真正對(duì)習(xí)題正確率產(chǎn)生顯著影響。在檢驗(yàn)開(kāi)始，筆者首先提出以下假設(shè)：①如果存在抄襲，會(huì)使得正確率與不存在抄襲不同;②甲組習(xí)題每題的數(shù)值不同，筆者因此假設(shè)甲組不存在抄襲;③如果甲組和乙組經(jīng)檢驗(yàn)來(lái)自于不同總體，且乙組正確率較甲組高，認(rèn)為乙組存在抄襲行為。

確立了統(tǒng)計(jì)檢驗(yàn)的前提條件后，筆者對(duì)兩組樣本進(jìn)行卡方檢驗(yàn)，判斷兩組樣本是否來(lái)自同一總體，操作過(guò)程如下：①確立卡方檢驗(yàn)的檢驗(yàn)水準(zhǔn)和檢驗(yàn)假設(shè);②對(duì)檢驗(yàn)統(tǒng)計(jì)量和概率值進(jìn)行求解，并將概率值和檢驗(yàn)水準(zhǔn)進(jìn)行比較，從而對(duì)兩組樣本是否來(lái)自同一總體做出判斷。具體實(shí)現(xiàn)的理論和方法如下：

（1）建立檢驗(yàn)假設(shè)，確立檢驗(yàn)水準(zhǔn)

本文中，運(yùn)用卡方檢驗(yàn)的檢驗(yàn)方法，分析兩組樣本數(shù)據(jù)的關(guān)聯(lián)性，判斷兩組樣本數(shù)據(jù)是否來(lái)自同一整體。檢驗(yàn)開(kāi)始，首先要確立檢驗(yàn)假設(shè)和檢驗(yàn)水準(zhǔn)。

以四格表資料為例，見(jiàn)表1，該表統(tǒng)計(jì)了某道題的對(duì)錯(cuò)情況，判斷甲組和乙組的正確率是否有差異。其中a、b、c、d是兩個(gè)樣本率比較的基本數(shù)據(jù)，R1、R2、C1、C2是R行、C列邊緣合計(jì)數(shù)據(jù)。

提出假設(shè)H0和H1，并確定檢驗(yàn)水準(zhǔn)為α。令兩組總體的正確率分別為π1和π2，假設(shè)兩組的總體正確率相同，檢驗(yàn)兩組樣本率是否由于抽樣誤差引起的檢驗(yàn)水準(zhǔn)為0.05。其統(tǒng)計(jì)學(xué)符號(hào)表示為：

H0：π1=π2（甲組和乙組總體正確率相等）

H1：π1≠π2（甲組和乙組總體正確率不等）

α=0.05

如果假設(shè)H0成立，則兩組總體正確率相等;如果假設(shè)H1成立，則兩組總體正確率不等。

（2）計(jì)算檢驗(yàn)統(tǒng)計(jì)量和概率

假設(shè)和檢驗(yàn)水準(zhǔn)確立后，需要對(duì)具體的檢驗(yàn)統(tǒng)計(jì)量和概率P值進(jìn)行求解。通過(guò)四格表數(shù)據(jù)計(jì)算得出γ2的大小，結(jié)合自由度ν，從而確定概率P。最后將概率P值和檢驗(yàn)水準(zhǔn)α進(jìn)行比較，從而對(duì)總體做出判斷。

對(duì)于四格表資料，計(jì)算統(tǒng)計(jì)量χ2的四格表專用公式為：

χ2=

四格表的自由度為：ν=（R-1）（C-1）=（2-1）（2-1）=1，式中R為行數(shù)，C為列數(shù)。

根據(jù)χ2，在ν=1的卡方分布曲線下找到比χ2更極端的尾部面積，即為P值。在四格表的χ2檢驗(yàn)中，其自由度為1，常用的χ2界值是χ2

0.05，1=3.84。

將概率P值與α進(jìn)行比較，P≤α則拒絕H0，得出兩樣本來(lái)自不同總體的結(jié)論;P>α，則不拒絕H0，認(rèn)為兩樣本來(lái)自同一整體。

2.難度預(yù)測(cè)模型的建立

選取典型的《電磁場(chǎng)與電磁波》習(xí)題作為相關(guān)性分析的對(duì)象，將電子與通信技術(shù)學(xué)科學(xué)生部分科目的成績(jī)與《電磁場(chǎng)與電磁波》習(xí)題的答題情況進(jìn)行量化分析，得到與習(xí)題之間的聯(lián)系有統(tǒng)計(jì)學(xué)意義的科目。最后對(duì)這些數(shù)據(jù)進(jìn)行l(wèi)ogistics回歸分析，得到相應(yīng)的回歸系數(shù)，從而建立《電磁場(chǎng)與電磁波》習(xí)題難度估計(jì)模型。本文通過(guò)二項(xiàng)分類logistic回歸算法，用logistic函數(shù)預(yù)測(cè)一個(gè)樣本屬于正樣本的概率值，從而建立難度預(yù)測(cè)模型。模型建立的過(guò)程如下：①作者首先通過(guò)單變量分析從眾多變量中篩掉一些可能無(wú)意義的變量，再將剩余變量構(gòu)建logistic回歸模型。②模型建立后，作者通過(guò)似然比檢驗(yàn)的算法，對(duì)回歸模型進(jìn)行全局性檢驗(yàn)，從而判斷整個(gè)模型的擬合情況。③最后根據(jù)logistic回歸參數(shù)估計(jì)方法，用最大似然估計(jì)方法去求模型具體的參數(shù)數(shù)值，從而建立難度估計(jì)模型。具體實(shí)現(xiàn)的理論與方法如下：

（1）單變量分析

考慮到《電磁場(chǎng)與電磁波》科目的內(nèi)容和特點(diǎn)，筆者選取了一些科目的成績(jī)作為能夠代表學(xué)生能力量化指標(biāo)的樣本數(shù)據(jù)。在進(jìn)行l(wèi)ogistic回歸前，由于變量較多，筆者先通過(guò)單變量分析（卡方檢驗(yàn)）考慮所有自變量和應(yīng)變量之間的關(guān)系，篩掉一些可能無(wú)意義的變量。為了避免遺漏某些重要科目，在分析時(shí)，作者將P值放寬，定為0.1?？ǚ綑z驗(yàn)中，采用有與無(wú)一個(gè)自變量的-2LL改變量作為卡方統(tǒng)計(jì)量，具體操作步驟與上文抄襲因素的統(tǒng)計(jì)檢驗(yàn)相同。

（2）回歸模型的全局性檢驗(yàn)

回歸模型建立后，需要對(duì)整個(gè)模型的擬合情況做出判斷。以單變量分析篩選后的各科成績(jī)及《電磁場(chǎng)與電磁波》習(xí)題難度作為自變量，《電磁場(chǎng)與電磁波》習(xí)題對(duì)錯(cuò)作為應(yīng)變量。在logistic回歸模型擬合中，可采用似然比檢驗(yàn)進(jìn)行全局性假設(shè)檢驗(yàn)。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

基于剔除抄襲因素和學(xué)生能力因素的 題目難度預(yù)測(cè)研究

基于剔除抄襲因素和學(xué)生能力因素的題目難度預(yù)測(cè)研究