王勤云
山東師范大學(xué)傳播學(xué)院 濟(jì)南 250014
計(jì)算機(jī)自適應(yīng)測驗(yàn)中基礎(chǔ)數(shù)據(jù)模擬方法
王勤云
山東師范大學(xué)傳播學(xué)院 濟(jì)南 250014
在計(jì)算機(jī)自適應(yīng)測驗(yàn)中,利用計(jì)算機(jī)來模擬生成被試和題庫,對于選題策略的實(shí)驗(yàn)?zāi)M是非常重要的。主要敘述均勻分布、正態(tài)分布樣本的生成算法以及正態(tài)分布的檢驗(yàn)方法。
計(jì)算機(jī)自適應(yīng)測驗(yàn);均勻分布;正態(tài)分布
計(jì)算機(jī)自適應(yīng)測驗(yàn)(Computerized Adaptive Testing,簡稱CAT)是在測驗(yàn)過程中,根據(jù)考試者的當(dāng)前測試估計(jì)能力值,自適應(yīng)地選擇合理難度的題目。CAT被廣泛地應(yīng)用于GRE、 TOEFL等各類考試。隨著CAT的廣泛應(yīng)用,測驗(yàn)安全性成為研究重點(diǎn)。選題策略作為CAT中一個重要環(huán)節(jié),對測驗(yàn)的安全性有很大影響。合理的選題策略可以有效控制項(xiàng)目曝光率,提高測驗(yàn)安全性。
一種新型選題策略必須經(jīng)過大量實(shí)驗(yàn)才能實(shí)際應(yīng)用。如果每次實(shí)驗(yàn)都選取大量的被試和搜集大量項(xiàng)目來組建題庫,需要花費(fèi)大量財力、物力與人力。但如果利用計(jì)算機(jī)來模擬這些被試和題庫,可以節(jié)省大量資源,使實(shí)驗(yàn)高效、便捷。本文主要闡述被試與題庫的生成算法以及正態(tài)分布的檢驗(yàn)方法。
在CAT中,被試的能力取值在理論上是(,)?∞+∞,但是在實(shí)際中,取值范圍一般在(-4,4)之間,被試通常服從標(biāo)準(zhǔn)正態(tài)分布N(0,1)或者某一區(qū)間上的均勻分布。題庫中每一個項(xiàng)目都有3個參數(shù)a、b、c,其中a為項(xiàng)目的區(qū)分度,b為項(xiàng)目的難度,c為項(xiàng)目的猜測系數(shù)。項(xiàng)目參數(shù)一般來說服從標(biāo)準(zhǔn)正態(tài)分布N(0,1)或某一區(qū)間上的均勻分布,具體服從何種分布是由研究者自己確定的。本文主要闡述標(biāo)準(zhǔn)正態(tài)分布N(0,1)、均勻分布的生成算法。
在C/C++語言中提供的rand()函數(shù)可以產(chǎn)生一個0到32 767之間的正整數(shù)A,(double)A/32 767,得到一個(0,1)區(qū)間上的隨機(jī)數(shù) ri。為了得到U(a,b)隨機(jī)數(shù),令為[a,b]區(qū)間上均勻分布隨機(jī)數(shù)。在使用rand()時,需要給該函數(shù)提供一個種子,一般采用系統(tǒng)的當(dāng)前時間作為種子,目的是保證每次得到的偽隨機(jī)數(shù)都不相同,而且相互獨(dú)立,互不影響。
服從標(biāo)準(zhǔn)正態(tài)分布N(0,1)隨機(jī)數(shù)是在(0,1)區(qū)間均勻分布隨機(jī)數(shù)的基礎(chǔ)之上產(chǎn)生的。設(shè)在(a,b)區(qū)間上服從均勻分布的隨機(jī)變量為X,其期望與方差分別為: E ( X)=因此,在(0,1)區(qū)間上服從均勻分布的隨機(jī)變量X,其期望為,方差為。取n(一般取n=12)個在[0,1]均勻分布的隨機(jī)變量X1,X2,X3...Xn,根據(jù)中心極限定理可知,新的隨機(jī)變量y=X1+X2+...+X12-6可以滿足一般精度下的標(biāo)準(zhǔn)正態(tài)分布N(0,1)的要求。設(shè)z=μ+σy,則可將z看成來自正態(tài)分布N(μ,σ2)的一個隨機(jī)數(shù)。
為了檢驗(yàn)樣本X1,X2,X3...Xn是否來自一個正態(tài)總體,先計(jì)算偏度(G1)和峰度(G2)的估計(jì)量:
以上是(0,1)區(qū)間均勻分布隨機(jī)數(shù)、任意區(qū)間均勻分布隨機(jī)數(shù)、標(biāo)準(zhǔn)正態(tài)分布隨機(jī)數(shù)N(0,1)的生成方法以及正態(tài)分布檢驗(yàn)的方法。
在計(jì)算機(jī)自適應(yīng)測驗(yàn)中,一種新型的選題策略的提出不可能直接應(yīng)用于實(shí)際,必須經(jīng)過無數(shù)次的模擬論證,最后再決定是否具有可行性。那么這些隨機(jī)數(shù)的模擬生成對于選題策略的模擬實(shí)驗(yàn)階段是非常重要的,而利用計(jì)算機(jī)來模擬被試和題庫,可以節(jié)省時間以及減少資源的浪費(fèi)等。采用上述方式,可以快速且可重復(fù)地生成被試和題庫供試驗(yàn)使用,極大地降低實(shí)驗(yàn)成本,提高實(shí)驗(yàn)效率。
[1]Chang Huahua, Ying Zhiliang. a-Stratifed Multisage Computerized Adaptive Testing[J].Applied Psychological Measurement,1999,23(3):211-222
[2]茆詩松,程依明,濮曉龍.概率論與數(shù)理統(tǒng)計(jì)教程[M].北京:高等教育出版社,2004
[3]高慧旋.統(tǒng)計(jì)計(jì)算[M].北京:北京大學(xué)出版社,1995
[4]張忠華,謝小慶,鄭日昌.計(jì)算機(jī)自適應(yīng)測驗(yàn)(CAT)選題策略的新進(jìn)展[J].心理發(fā)展與教育,2002(4):91-95
[5]余嘉元.項(xiàng)目反應(yīng)理論研究中的計(jì)算機(jī)模擬方法[J].心理科學(xué),1991(2):47-49
[6]付聰.計(jì)算機(jī)自適應(yīng)測試研究進(jìn)展[J].現(xiàn)代情報,2005(1):61-64
[7]余嘉元,汪存友.項(xiàng)目反應(yīng)理論參數(shù)估計(jì)研究中的蒙特卡羅方法[J].2007(1):87-91
TP273+.2
B
1671-489X(2011)06-0079-01
10.3969 /j.issn.1671-489X.2011.06.079