楊峰 袁天然
摘要:試題庫系統(tǒng)的推行已成為高校教學的一個重要環(huán)節(jié),結合試題庫建設現(xiàn)狀及教學成績的統(tǒng)計、測量原則,展開教育測量理論、試題、試卷三者關系的初步探討,總結提高試題庫建設效率的有效途徑和方法。實踐證明,該理論探討能有效推動教考分離。
關鍵詞:試題庫;教育測量理論;試題;試卷
中圖分類號:G642.0 文獻標志碼:A 文章編號:1674-9324(2015)30-0196-02
隨著信息技術的快速發(fā)展和廣泛應用,試題庫系統(tǒng)逐漸成為高校計算機輔助教學的一種有效方式。受考試制度及傳統(tǒng)題庫建設經驗的限制,現(xiàn)有試題庫系統(tǒng)往往不能深度挖掘試卷、試題,也不能發(fā)揮試卷和試題的診斷及評價功效[1]。怎樣在現(xiàn)代試題庫系統(tǒng)建設中引入先進的教育測量理論,兼有二者的優(yōu)勢[2],用先進理論引導先進技術,保證試題庫建設充分適應現(xiàn)代教學理念的發(fā)展趨勢,切實促進教學,已成為現(xiàn)代試題庫建設發(fā)展過程中必須重視的問題。
一、教育統(tǒng)計與教育測量理論
有效地進行教育測量是我們建設試題庫的目的所在[3]。教育測量要遵循教育規(guī)律,它的理論基礎就是教育統(tǒng)計與教育測量理論[4]。教育測量的最主要的任務準確測量測試者的水平,盡量降低測量誤差。為保證考試更加科學化,就要利用教育測量,而教育測量的研究對象正是命題、閱卷、分析、評價等考試工作的全過程。
考試是目前測量教育水平的最直接方式,期間涉及到教育統(tǒng)計的概念及理論。教育統(tǒng)計的目的主要用來檢測教育的科學性,從而探索教學現(xiàn)象的各種規(guī)律及特征,其主要通過統(tǒng)計學的方法和理論研究教育現(xiàn)象及本質[5]。
試卷是目前考試執(zhí)行的主要形式,其測量結果決定考試的質量[6]。試卷設計的科學與否,成為教學工作中不可忽視的重要一步,其最能客觀反映教師的教學水平及學生的學習效果,也正是本文所要研究的重中之重。
二、教育測量理論在試卷質量評價中的應用
組卷,即在設定的組卷策略下,借助已經存在的試題庫隨機或人為選取合適的測試題形成一份或多份(有的學校要求A/B卷)符合測試要求的試卷。從教育理論角度考慮,衡量試卷質量的基本要素主要包括以下兩個方面,即信度和效度。
1.信度。信度指的是測量結果是不是滿足穩(wěn)定性要求。隨著測量類型的不同,不論是物理測量還是教育測量,即使面對同樣的測量對象,其所得的測量結果幾乎不會全部相同[7]。因為每次的測量結果總會受兩大因素的影響,即被測對象的實際發(fā)揮水平及測量過程中難以避免的誤差。
通過以上定義,不難發(fā)現(xiàn)信度包含實際考試過程中隨機誤差對其影響作用,兩者成反比關系。影響信度的主要因素包括四個方面:(1)接受測試者個體難免有不同程度的差異,這是導致信度真分數(shù)參差不齊的主要原因所在。(2)試卷本身題目的多少,試卷的長短,會導致考試得分受試題抽樣偶然性影響,相對地,適當提高試卷的中題目的數(shù)量對信度有正比例的影響。(3)試卷內容性質的相同與否,對信度成正比例影響關系,即內容性質不同或相差較遠的試卷信度一般偏低,反之則信度較高。(4)試卷的難度,在考試的難度過高或過低時,分數(shù)分布呈偏態(tài)分布。
2.效度。效度,即測量是否有效及其有效程度,也就是此次考試實際測出的與其要測量的特性的接近程度[8]。如果所要測的特性被準確地測量,就認定此次測量的效度是高的。主要從以下幾個重要因素分析對效度有重要的影響:(1)類似于信度,考試內容性質的共同與否,對效度成反比例影響規(guī)律,即試題間的內容一致性越高,效度就會越低。(2)應考者之間的差異性,期間的差異性會導致真分數(shù)差異性的對應變大。(3)試卷的長度,同樣類似于對信度的影響,即適當提高試卷的中題目的數(shù)量對效度有正比例的影響。
三、教育測量理論在試題質量評價中的應用
試題是組成試卷的基本元素,試題的質量對試卷質量的影響較大。如何根據(jù)教育測量理論探索影響試題質量的主要因素是本部分的主要研究內容。
1.難度。難度一詞的含義眾所周知,具體到本文就是指應考者解答題目或完成要求時的困難程度,主要分為相對值及絕對值。相對難度也稱為統(tǒng)計難度,是統(tǒng)計應考者測試后的試卷通過統(tǒng)計分析方法計算出的難度。絕對難度也叫認知難度,與被測試者的實際水平沒有關系。
難度共有三個特點,即相對性、計量性和區(qū)間性。相對性是建立在不同的考試及不同應試對象的基礎上統(tǒng)計的[9,10]。具體來說,若應試者的水平不同,即使相同的試卷,測試統(tǒng)計后的難度值也不會相同。計量性是指難度是一個可以具體量化的指標。在分析、計算考試的難度時,往往只是基于感性的、模糊的、沒有準確理論依據(jù)的判斷,但在經典測量理論中,難度被定義為具體的指標,具體數(shù)值的計算是通過數(shù)學統(tǒng)計方法計算而得的。區(qū)間性即難度永遠介于0至1之間的閉區(qū)間內,其是連續(xù)變化的,在難度值為0時,說明試題越容易;反之亦然。
在統(tǒng)計考試結果中,往往同數(shù)學統(tǒng)計圖來表示。若統(tǒng)計圖顯示考試結果呈正態(tài)分布,則說明試卷的難度趨于中間。當統(tǒng)計結果顯示為負偏態(tài)分布規(guī)律時,說明試卷偏難,且測試分數(shù)偏低。當統(tǒng)計結果顯示為正偏態(tài)分布規(guī)律時,說明試卷偏簡單,且測試分數(shù)偏高[11]。
2.區(qū)分度。試題的區(qū)分度主要為了鑒別應試者的實際學習能力,主要為了區(qū)別被測試者。為了有效區(qū)分不同學習水平的學生的學習能力,往往要求區(qū)分度越高越好。測量專家把區(qū)分度這一指標作為考試是否有效的重要量度,并作為評價項目質量、篩選項目的主要指標與依據(jù)[12]。試題的區(qū)分度越好,說明試題對應考者有較強的考察及測試能力。
區(qū)分度計算往往采用分組法,主要分為以下三步完成:
Step1:分組。將所有被試分為三組,分組順序參考總分順序排列。從最高分開始的前25%定義為第一組;相對地,從最低分開始后25%定義為第二組;余下的50%為第三組。
Step2:統(tǒng)計。采用數(shù)學統(tǒng)計方法計算每個試題的具體得分率,其中第一組、第二組得分率用符號PH、PL表示。
Step3:計算。計算公式為:D=PH-PL。
例如,表1為計算上海電力學院2013—2014學年第一學期《工程力學》期末試卷中的試題區(qū)分度計算。
從表1的統(tǒng)計結果不難看出,第2題和第4題的區(qū)分性能較好,第1題和第3題分別偏向極值。由計算公式可知:從理論上說區(qū)分度同難度一樣,也是介于0到1之間的一個數(shù),難度越低或難度越高的試題區(qū)分度都低。
四、小結
本文通過對教育測量基本原理和方法的運用,將影響試卷的因素加以分析研究,分別從信度、效度探討了影響試卷的影響因素,試題作為試卷的基本組成元素,主要從難度和區(qū)分度兩個重要影響因素進行闡述,探討了兩者對試卷的影響作用,為試題庫結構設計和算法的實現(xiàn)提供理論依據(jù)和重要支持。
參考文獻:
[1]馮雪花,王慧玲.教考分離管理模式的思考[J].中國教育技術裝備,2014,(2):96-98.
[2]辛濤.新課程背景下的學業(yè)評價:測量理論的價值[J].北京師范大學學報:社會科學版,2006,(1):56-59.
[3]吳承禎,何麗華,林立群,等.試卷質量分析方法及其應用[J].中國林業(yè)教育,2008,(3):26-30.
[4]李·斯·舒爾曼,黃甫全,王娜智者.教學活動中的知識生長[J].教師教育學報,2014,(4):44-58.
[5]范明虎,孫斌.通用試題庫管理系統(tǒng)的設計與實現(xiàn)[J].計算機工程與設計,2007,(9):2185-2188.
[6]趙德成.減負背景下的評價與考試改革[J].北京師范大學學報:社會科學版,2014,(4):23-29.
[7]李業(yè)剛,高成琳,李紅玲,等.高校試卷質量分析系統(tǒng)的研究[J].山東理工大學學報:自然科學版,2008,(04):57-60.
[8]袁東華.高校試題庫、試卷庫建設問題的思考[J].黑龍江教育(高教研究與評估),2013,(4):77-78.
[9]楊永,梁金鈐.基于B/S模式的通用試題庫系統(tǒng)的設計與實現(xiàn)[J].計算機工程與科學,2009,(04):143-146.
[10]曾一,冉忠,郭永林.試題庫中自動組卷的算法及試卷測評策略[J].計算機工程與設計,2006,(16):3024-3028.
[11]楊峰.基于遺傳算法的試題庫管理及自動組卷系統(tǒng)的研究[D].山東農業(yè)大學,2008.
[12]周文舉.基于遺傳算法的自動組卷系統(tǒng)研究與實現(xiàn)[D].山東師范大學,2006.