代闖闖 劉詠晨 畢成
【摘 要】隨著科技的進(jìn)步發(fā)展,考試測(cè)驗(yàn)的方式也不斷發(fā)展。自適應(yīng)測(cè)驗(yàn)是就是測(cè)驗(yàn)方式不斷革新后出現(xiàn)的一種測(cè)驗(yàn)形式,使用計(jì)算機(jī)進(jìn)行的自適應(yīng)測(cè)驗(yàn)也是當(dāng)下被廣泛應(yīng)用的方式,本文關(guān)于計(jì)算機(jī)化的自適應(yīng)測(cè)試做了淺要要就,介紹其概況和一些相關(guān)的研究成果,指出這種測(cè)試方式目前存在的問題最后提出解決方案。
【關(guān)鍵詞】自適應(yīng)測(cè)試 CAT 項(xiàng)目反應(yīng)原理
1 計(jì)算機(jī)化自適應(yīng)測(cè)試的產(chǎn)生與發(fā)展
自適應(yīng)測(cè)試是一種因人而異的測(cè)試,根據(jù)測(cè)試者年齡等的不同選擇不同難易程度的試卷進(jìn)行的測(cè)試,試題不完成的情況下也能達(dá)到測(cè)試的目標(biāo)。計(jì)算機(jī)化自適應(yīng)測(cè)試則是利用計(jì)算機(jī)星星的測(cè)試,試題的選擇與答題都在計(jì)算機(jī)上完成。這種自適應(yīng)的測(cè)試前身是比奈測(cè)試,當(dāng)時(shí)的測(cè)試步驟非常麻煩,也存在一定的缺陷。計(jì)算機(jī)產(chǎn)生之后,這些問題就一一得到解決。這種測(cè)試方式在美國的發(fā)展比較迅速,早在一九四六年美國就有自適應(yīng)的相關(guān)研究出現(xiàn),隨后不斷發(fā)展。我國對(duì)自適應(yīng)測(cè)試也有相關(guān)的研究。計(jì)算機(jī)是自適應(yīng)測(cè)試實(shí)施的重要輔助工具,因測(cè)試試題選擇與結(jié)果評(píng)估都有著較為復(fù)雜的過程,因此計(jì)算機(jī)的使用可減輕人力的投入,并開啟了新的測(cè)試發(fā)展歷程。
2 計(jì)算機(jī)化自適應(yīng)測(cè)試的相關(guān)理論研究
計(jì)算機(jī)化自適應(yīng)測(cè)試的理論基礎(chǔ)是項(xiàng)目反應(yīng)原理,測(cè)試建立題庫到測(cè)試結(jié)果分析都是在項(xiàng)目反映原理的基礎(chǔ)上實(shí)施的,根據(jù)項(xiàng)目反應(yīng)原理建立的數(shù)學(xué)模型有很多種,可在測(cè)試時(shí)根據(jù)被試者情況的不同選擇。根據(jù)被試者答題的具體情況,利用項(xiàng)目反應(yīng)理論建立模型函數(shù)推算被試者的實(shí)際能力,主要有三種參數(shù)的函數(shù)模式?;陧?xiàng)目反應(yīng)理論建立的模型能夠較準(zhǔn)確全面的了解測(cè)試試題的情況以及能夠準(zhǔn)確推斷出被試者的能力情況,其中三參數(shù)的模型最為準(zhǔn)確,因此被自適應(yīng)測(cè)試廣泛應(yīng)用。
測(cè)試的具體程序,自適應(yīng)測(cè)試的進(jìn)行,主要有以下幾個(gè)步驟:(1)開始測(cè)試。這是測(cè)試的第一步,主要是對(duì)被試者的水平進(jìn)行一個(gè)初步的測(cè)試,然后根據(jù)結(jié)果在題庫中選擇一套合適題目給被試者。(2)進(jìn)行測(cè)試。這是在測(cè)試過程中,被試者在回答每一道題目后對(duì)測(cè)試者的能力進(jìn)行的評(píng)估。(3)結(jié)束測(cè)試。這是指在被試者測(cè)試過程中,可以檢測(cè)能力的參數(shù)獲取足夠時(shí),就可以結(jié)束考試。因此題目即使不回答完也可在參數(shù)足夠時(shí)就停止測(cè)試,因此以不是百分制這種傳統(tǒng)的概念來衡量被試者能力的。
3 計(jì)算機(jī)自適應(yīng)測(cè)試的應(yīng)用
國內(nèi)外應(yīng)用自適應(yīng)測(cè)試的成功例子比比皆是,在此列舉一些優(yōu)秀的代表性測(cè)試。漢語水平考試是測(cè)試包括外國人、華僑以及我國國內(nèi)的第一語言非漢語的少數(shù)民族人員在內(nèi)的考生漢語水平的國際漢語能力測(cè)試。簡(jiǎn)稱HSK。HSK測(cè)試從命題到評(píng)卷整個(gè)過程都非常的專業(yè)和標(biāo)準(zhǔn),是較高水平的自適應(yīng)測(cè)試。
美國研究生入學(xué)考試與新托福,也稱托福網(wǎng)考,是現(xiàn)金計(jì)算機(jī)自適應(yīng)考試應(yīng)用最為廣泛、最具影響力的兩種能力測(cè)試。這是一種在考試過程中,通過結(jié)合專題與綜合的知識(shí),對(duì)被試者的實(shí)際水平進(jìn)行比較確切的評(píng)估,這種自適應(yīng)測(cè)試的系統(tǒng)是一種綜合且新穎的學(xué)科,有利于自適應(yīng)測(cè)試系統(tǒng)題庫的擴(kuò)展。
我國英語教學(xué)中閱讀是最為重要的教學(xué)點(diǎn),傳統(tǒng)的英語閱讀是閱讀文章然偶回答幾個(gè)問題,這種測(cè)試方法已受到質(zhì)疑。可考慮的測(cè)試方法是設(shè)置一個(gè)語境,然后在這個(gè)語境中進(jìn)行自適應(yīng)性的閱讀測(cè)試,可以更準(zhǔn)確的測(cè)試出學(xué)生的英語能力。
臺(tái)灣國中的學(xué)力測(cè)試是對(duì)臺(tái)灣國中學(xué)生基本學(xué)力的測(cè)試,主要有四個(gè)優(yōu)勢(shì):(1)測(cè)試的標(biāo)準(zhǔn)化;(2)題目的設(shè)置都有一個(gè)明確的指標(biāo);(3)建立了題目?jī)?yōu)質(zhì)的題目;(4)自測(cè)試的結(jié)構(gòu)可以轉(zhuǎn)化為一定的分?jǐn)?shù)作為衡量尺度,便于能力的比較。
自適應(yīng)心理測(cè)試是專門針對(duì)中國人開發(fā)的一種心理測(cè)試系統(tǒng),利用計(jì)算機(jī)網(wǎng)絡(luò)進(jìn)行。自開發(fā)以來被廣泛的使用,便于通過測(cè)試發(fā)現(xiàn)自我,增強(qiáng)自我了解并提升自我能力。我國從九十年代就開始研究CET4和CET6考試的計(jì)算機(jī)自測(cè)試應(yīng)用,目前四六級(jí)分?jǐn)?shù)的處理已成功應(yīng)用IRT技術(shù),但題庫仍在建設(shè)中,不久的將來會(huì)簡(jiǎn)稱計(jì)算機(jī)輔助的自適應(yīng)測(cè)試系統(tǒng)題庫。
4 機(jī)助自適應(yīng)測(cè)試現(xiàn)存的問題
機(jī)助自適應(yīng)測(cè)驗(yàn)有一定的有點(diǎn)也存在一些問題。主要有以下的問題:(1)題型比較簡(jiǎn)單,一般測(cè)試的題型都是以客觀題為主,測(cè)試者的有些能力可能測(cè)試不出;(2)測(cè)試結(jié)果的解釋不易,人們對(duì)于考試結(jié)果的認(rèn)定都是以分?jǐn)?shù)為準(zhǔn),這種自適應(yīng)的測(cè)試結(jié)果是一定的參數(shù),因此解釋起來比較困難;(3)測(cè)試的成本比較高。因?yàn)閺念}庫的設(shè)置到結(jié)果的分析,都需要利用計(jì)算機(jī),所以研制起來比較費(fèi)時(shí)費(fèi)力,不如傳統(tǒng)的紙質(zhì)測(cè)試來的方便;(4)必須要計(jì)算機(jī)的輔助。若選擇自適應(yīng)測(cè)試的地區(qū)計(jì)算機(jī)不夠普及,測(cè)試進(jìn)行起來就無法進(jìn)行;(5)題庫更新的較慢,比如美國研究生入學(xué)考試管理機(jī)構(gòu)曾經(jīng)在中國和韓國發(fā)現(xiàn)了歷年試題的交流網(wǎng)站,由于題庫內(nèi)容不多,隔年就會(huì)有相似的題目出現(xiàn),一些考生就產(chǎn)生了投機(jī)取巧的心理。
計(jì)算機(jī)輔助的自適應(yīng)性測(cè)試是一種新型并且有效的能力測(cè)試方式,值得在今后被更廣泛的領(lǐng)域應(yīng)用,它有著不同于傳統(tǒng)紙質(zhì)測(cè)試的優(yōu)點(diǎn),但也存在一定的缺點(diǎn)和不足,但只有缺點(diǎn)不斷的出現(xiàn)不斷解決,才有利于自適應(yīng)測(cè)試系統(tǒng)的不斷提升。目前計(jì)算機(jī)輔助自適應(yīng)測(cè)試技術(shù)已比較成熟,但還需要不斷的研究使自適應(yīng)測(cè)試更加完善。
參考文獻(xiàn):
[1] 謝康,曾祥華.計(jì)算機(jī)自適應(yīng)性測(cè)驗(yàn)的數(shù)學(xué)模型研究[J].贛南師范學(xué)院學(xué)報(bào),2002(3).
[2] 何利平.C程序設(shè)計(jì)非標(biāo)準(zhǔn)化試題CAT模型的建立[J].衡陽師范學(xué)院學(xué)報(bào)(自然科學(xué)),2003(3).
[3] 彭云,聶承啟.操作系統(tǒng)自適應(yīng)考試系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].計(jì)算機(jī)與現(xiàn)代化,2001(6).
[4] 李廣洲,丁金芳,鄧海山.基于Web的化學(xué)計(jì)算機(jī)化自適應(yīng)測(cè)驗(yàn)系統(tǒng)的實(shí)現(xiàn)[J].計(jì)算機(jī)與應(yīng)用化學(xué),2002(5).
[5] 謝小慶,任杰.對(duì)從HSK題庫中計(jì)算機(jī)自動(dòng)生成試卷穩(wěn)定性的試驗(yàn)檢驗(yàn)[J].心理學(xué)探新,1999(4).