馬 小 俠
(渭南師范學院 期刊管理中心, 陜西 渭南 714099)
教育要發(fā)展,根本靠改革。教育改革是教育事業(yè)發(fā)展的強大動力。改革開放以來,以鄧小平同志、江澤民同志為核心的黨的第二代、第三代中央領導集體,堅持教育面向現(xiàn)代化、面向世界、面向未來的方向,始終強調把教育擺在社會主義現(xiàn)代化建設中優(yōu)先發(fā)展的戰(zhàn)略地位,重點推進教育體制改革,努力構建充滿生機的中國特色社會主義教育體系。[1]146-148
深化教育領域綜合改革,核心目的就是要變。黨的十八大以來,以習近平同志為總書記的黨中央繼往開來,全面動員全黨全社會關心支持教育改革和發(fā)展。我國人才培養(yǎng)體制、考試招生制度、現(xiàn)代學校制度、辦學體制、管理體制等多方面改革都在朝著縱深推進。[2]275-283
在各類考試試題中,有一類如選擇、判斷、配伍等形式的試題,是由考生從事先擬定的答案中辨認出正確的答案,這類試題一般稱之為客觀性試題,也稱固定應答型試題或知識再認型試題。現(xiàn)行廣泛采用的選擇式客觀性試題題型有判斷題、選擇題等,在各類考試中最常用的為四選一和正誤判斷單選題。從概率統(tǒng)計的觀點看,面對四選一題,即使考生完全不會做,任意選取一個答案,其正確率一般也在25%左右。倘若考題中還有正誤判斷題,選項的正確率將會更高。為清楚地看出現(xiàn)行客觀性試題評分方法的缺陷,簡化分析過程,也便于說明問題,本文就以現(xiàn)實考試中經(jīng)常采取的100道四選一單選題(每題1分)為例來說明問題的存在。
在多年的教學實踐中,筆者曾多次對符合以上條件的不同類型的考試成績進行過統(tǒng)計分析,[3]190-199發(fā)現(xiàn)無論何種類型的考試,考生考試成績絕大多數(shù)都分布在20~100分之間,完全不會做題的考生僅靠猜測答案成績一般都在20~40分之間;完全會做的考生發(fā)揮得再好最高也是100分。這與考試組織單位和考題設計者想測試出全體考生的真實成績(即分布在0~100分之間,全然不會者得0分,全部融會貫通者得100分,掌握了百分之多少的知識,就得多少分)就發(fā)生了一定的偏差。為進一步說明猜測答案者的問題所在,筆者從現(xiàn)行的汽車駕駛員科目一考試題庫中任意選取了一套100道四選一的試題及標準答案,并用手頭所存的896份與駕駛員考試毫無關系的機讀卡試卷(100道四選一答題卡)當作其全然不懂不會做題者的答卷,按標準答案評分,各考生成績分布情況見表1。
表1 896名考生成績分布情況
從表1可以看出,896名考生中,有2人分數(shù)最低為13分,有698人分數(shù)在21~30分之間,有105人分數(shù)在30分以上,有1人分數(shù)竟達41分,896名考生平均成績?yōu)?5.2分。896名考生中本應全為0分的考生,竟會有105人得分在30分以上,可見客觀性試題評分方法的缺陷。[4]95-96
為進一步探索客觀性試題評分方法的缺陷,筆者又從汽車駕駛員考試題庫中隨機選取了一份100道四選一考題,將其答案(見表2)作為標準答案,利用計算機隨機模擬方式產生若干份考生答題結果,并計算考生的成績分布。
表2 汽車駕駛員科目一試題(四選一)答案
為簡化計算程序,用數(shù)字1、2、3、4分別代表英文字母A、B、C、D,編制如下BASIC程序:
10 DIM B(100),X(100),Y(100)
20 FOR I=1 TO 100
30 READ B(I)
40 NEXT I
50 PRINT “REN SHU=”;
60 INPUT Q
100 FOR M=1 TO Q
110 Y=0
120 FOR I=1 TO 100
130 W=INT(RND(I)*10)
140 IF W>4 THEN 130
150 IF W<1 THEN 130
160 Y(I)=W
170 IF Y(I)<>B(I)THEN 190
180 Y=Y+1
190 NEXT I
200 X(Y)=X(Y)+1
210 PRINT M,Y
220 NEXT M
230 FOR K=1 TO 100
240 PRINT K,X(K)
250 NEXT K
300 DATA 3,2,2,4,1,2,3,4,1,3,2,2,4,3,1,3,1,2,3,4
310 DATA 2,3,1,3,4,3,4,2,1,2,3,1,4,2,2,1,2,3,3,1
320 DATA 2,2,2,2,1,4,3,3,2,1,4,2,3,2,1,2,4,3,4,2
330 DATA 1,3,2,4,1,3,2,1,4,3,1,4,1,1,2,3,2,3,4,1
340 DATA 2,1,2,4,1,2,1,4,3,2,2,1,3,1,4,2,1,4,2,1
350 END
通過在計算機上進行不同規(guī)??忌哪M計算,發(fā)現(xiàn)不論考試人數(shù)如何變化,得分分布規(guī)律大致相同,最終我們選取了1千人、1萬人、10萬人、100萬人和1000萬人考生的模擬結果,并整理成表3。
從表3不難看出,無論考生人數(shù)如何變化,完全不會做題的考生都可輕易地拿到一定的分值,有96%以上的考生會得到不低于20分的成績,有71%以上的考生會得到不低于25分的成績,有近28%的考生會得到不低于30分的成績,約有0.3%的考生會得到不低于40分的成績。由此可見,現(xiàn)行客觀性試題評分方法存在著較大的缺陷。
作為考試組織單位和考題設計者,想了解的是全體考生對所學知識內容掌握的真實情況,理想的結果是:隨機所出的100道四選一考題,每個考生認真去答,會做的就做,不會做的別猜著去做(用排除法做了的不影響本文的最終結論,在此暫且不論),會做多少道題就得多少分數(shù)。一個考生所得的分數(shù),要代表這名考生對所考知識內容的真實掌握程度,即真成績。但在現(xiàn)實考試中,并非這樣,作為考生為了得到高分,往往幾乎是:會做的都做了,不會做的也猜著全做了(若真的不會做的沒有做,后面將進行分析處理)。這難免使那些不會做題的考生通過猜測也多得了一定的分值,形成了考試成績的虛假性,比如有些高考文科生或藝術生,在數(shù)學科目考試時,僅憑猜測客觀性試題得上20~30分,而他們平時幾乎放棄對數(shù)學課的學習。
馬克思說過,任何科學,只有當其可以用數(shù)學表達時,才算走向成熟。為了便于說明問題和尋找考生考試成績與真實成績間的關系,先以100道四選一單選題(每題1分)為例進行分析。假設100道試題中考生真正會做的為T道,則不會做的就為(100-T)道,從概率統(tǒng)計理論看,四選一題正答率一般在25%左右,設考試成績?yōu)閅,即可推算出考生考試成績與真實成績之間存在如下關系:
Y=T+(100-T)×25%
將其轉化為求真實成績公式,即:T=(4Y-100)÷3
此關系式說明,當考生考試成績等于和低于25分時,其真實成績統(tǒng)一應全為0分;當考生考試成績在26~99分之間時,其真實成績低于考試成績,且考生真實水平越高,其考試成績越接近真實成績;當考生考試成績?yōu)?00分時,其真實成績與考試成績相等??忌荚嚦煽兣c真實成績之間的關系如圖1所示。
圖1考生真實水平與考試成績對比圖
下面,我們再探討以往考試中只有部分試題為客觀性試題的情況。暫且不論考試總共有多少道題,只研究試題中考生所做的若干道客觀性試題。為說明問題,先設定試題考生總共做了M道四選一單選題,且每題不一定為1分而是K分,設M道試題中考生真正會做的為T道,則不會做的就為(M-T)道。同樣從概率統(tǒng)計理論看,四選一題正答率在25%左右,設客觀性試題部分的考試成績?yōu)閅,即可得出考生四選一試題部分考試成績與真實成績之間存在如下關系:Y=T×K+(M-T)×25%×K
轉化為求四選一試題部分真實成績(T×K),即:T×K=(4Y-M×K)÷3
此關系式說明,當把一個考生四選一試題部分的考試成績擴大4倍,如果還不及四選一試題部分的總分值,就應將該考生這部分考題的真實成績統(tǒng)一定為零分。
同樣,設定試題中共有m道判斷題,且每題為k分,設m道試題中考生真正會做的為t道,那么不會做的就為(m-t)道。從概率論的觀點看,判斷題正答率在50%左右,設客觀性判斷題部分的考試成績?yōu)閥,即可得出考生判斷題部分考試成績與真實成績之間存在如下關系:
Y=t×k+(m-t)×50%×k
轉化為求真實成績,即:t×k=(2y-m)×k
此關系式說明,當把一個考生判斷題部分的考試成績擴大2倍,如果還不及判斷題試題部分的總分值,就應將該考生這部分考題的真實成績統(tǒng)一定為零分。
就是將按以往評分方法得到的分數(shù)值,用本文推算出的相應的求真實成績公式進行換算,以求得各考生的真實水平。如100道每題1分的四選一的考卷,評分后再按T=(4Y-100)÷3公式進行換算,這些工作完全可交由計算機順利完成。[5]108-109
適當增加試題答案選項數(shù)目,如將現(xiàn)行常用的四選一改為五選一或六選一等,可縮小考生考試成績與真實成績的差距,較大地提高考試成績對考生真實水平的代表性;同時也方便易行,不會增加較大的考試成本。
這種方法,對正誤判斷題很有必要,在過去的高考中也曾經(jīng)運用過,但在現(xiàn)行考試中并沒有采用,導致一些全然不會的考生亂答一卷。筆者認為,比較合理的方法為:只要考生全做了考題,四選一題答正確給分,答錯倒扣1/3相應分值。比如,100道四選一題,每題1分,完全不會的考生憑借猜測按概率論可猜對25道得25分,猜錯75道倒扣75×1/3=25分,其真實成績?yōu)椋?5-25=0分。正誤判斷題正確給分,答錯倒扣相應分值。比如,40道正誤判斷題,每題3分,完全不會的考生憑借猜測按概率論可猜對20道得3×20=60分,猜錯20道倒扣3×20=60分,其真實成績?yōu)椋?0-60=0分。
教育改革是社會事業(yè)改革創(chuàng)新的重要環(huán)節(jié)。[6-7]進入新世紀以來,國際國內形勢發(fā)生深刻復雜變化,在進入全面建成小康社會階段以來,我國經(jīng)濟社會發(fā)展面臨很多新的挑戰(zhàn),迫切需要我們積極適應經(jīng)濟體制深刻變革、社會結構深刻變動、利益格局深刻調整、思想觀念深刻變化的新形勢,在社會事業(yè)改革創(chuàng)新上邁開新的步伐。[1]147
[1] 習近平,劉云山,張高麗,等.黨的十八屆三中全會《決定》學習輔導百問[M].北京:學習出版社,黨建讀物出版社,2013.
[2] 袁貴仁.深化教育領域綜合改革[M]//習近平,劉云山,張高麗,等.《中共中央關于全面深化改革若干重大問題的決定》輔導讀本.北京:人民出版社,2013.
[3] 胡錦濤.論構建社會主義和諧社會[M].北京:中央文獻出版社,2013.
[4] 朱和平.加強社會管理 促進教育公平[M]//劉漢俊.聚焦中國.北京:人民出版社,2012.
[5] 溫家寶.溫家寶談教育[M].北京:人民出版社,人民教育出版社,2013.
[6] 洪銀興.改革創(chuàng)新人才聘用培養(yǎng)考核機制[J].中國高等教育,2013,(18):25-27.
[7] 焦志勇.章程建設:深化高等教育綜合改革的“助推器”[J].中國高等教育,2013,(24):11-12.