何巧玲
內容提要:本文通過標準化考試及其歷史分析我國標準化考試弊端及原因,指出標準化考試不可簡單否定,并在我國及日本、美國當代考試改革基礎上對多元化評價趨勢作了展望。
關鍵詞:標準化考試 ;多元教育評價; 應試教育
在各種考試中,一直采用標準化考試。通過它可以使優(yōu)者勝出,劣者淘汰。這種挑選人才的方式可以說從古到今都很受歡迎。但是,事到如今,我們尷尬地發(fā)現(xiàn),這種人們認為毫無問題的方式已經出現(xiàn)各種問題。在標準化考試中,我們往往會碰到下面的尷尬,如一道小學會考語文題:雪融化了是什么?選項為:①泥;②水;③春天;④霧氣。有學生選了最有創(chuàng)意的“春天”,但是標準答案是“水”,因此得分為零。著名作家李準做高考語文試卷,成績還不如一般應屆考生。高考、英語四六級、考研不斷受到抨擊,四級甚至近年每考必泄題。這幾大考試改革不止,問題不斷;2002年美國某考試中心狀告中國某考試學校使用盜版其考試真題,堅決不愿和解。真正原因是該校把該中心出題思路摸透了,以致許多中國考生在GRE機考中得分2200甚至滿分2400,而美國考生1900分已是高分,該中心感到很丟臉。
這就是標準化考試?
一、標準化考試的定義
標準化考試是依據現(xiàn)代考試理論,借助現(xiàn)代化統(tǒng)計法和電腦技術,嚴格按科學程序,由學科專業(yè)人員和測驗編制機構共同編制和實施,有效地控制各種誤差,具有統(tǒng)一標準的考試。它是一種常模參照性考試,以考生在同類考試全體考生總成績的平均分數為參照點,來反映該次考試中每個考生分數所處位置來解釋考試結果。標準化考試應具備三個特征:(1)信度,即可靠性與一致性;(2)效度,即準確性與有效性;(3)區(qū)分度。標準化考試有三個優(yōu)越性:(1)據考試程序,考前要預先公布考試范圍、考試說明、考試方法,并公布樣題,利于考生準備,從而考出真實水平;(2)由于試題編制標準化,使試題難易程度相對穩(wěn)定,再加之評分計分標準化,增加了考試間成績可比性;(3)由于采用計算機等工具與科學方法評分計分,最大程度控制誤差,保證考生成績真實性,對高等學校選錄新生和幫中學改進教學無疑是有益的。
二、標準化考試的歷史
標準化考試源于美國,1926年心理學家Brigham創(chuàng)建,首先是為了用考試成績反映應試者智商,幫助大學發(fā)現(xiàn)那些最有潛力在學業(yè)上成功的年輕人。但接著他就擔心培訓機構將置邏輯數學于其他文科課程之上,并使數學只重計算而不重原理。如他所料,幾十年后幾乎所有考試都應用標準化考試,考試變成考試組織方和應考方斗智斗勇的博弈場所。我國是一個考試大國,有1300年科舉史??婆e考試中的帖經、墨義、八股文和糊名譽錄就是考試的標準化。科舉曾為近代西方文官考試制度所借鑒,不少西方學者認為是對世界文明一大貢獻。1905年科舉廢止,逐漸接受西方近現(xiàn)代科學考試。1952年開始高考,較多憑主觀經驗組織實施考試,猜題押題現(xiàn)象嚴重。1985年廣東首先試行英語數學高考標準化考試,逐漸向全國和各個學科推廣?,F(xiàn)在我國幾乎所有大規(guī)模國家教育考試(會考、高考、英語四六級、考研等)、大規(guī)模國家非教育考試和大規(guī)模國際合作考試(GRE、TOFFL、雅思List)等都采用標準化考試。
標準化考試是考試全過程標準化、科學化、公平化。易于計算機閱讀,節(jié)省人力財力,是我國考試史上一大進步。它為考試的大規(guī)模發(fā)展起了重要作用。
三、標準化考試的弊端及原因
任何事物都存在對立統(tǒng)一的矛盾運動,從來沒有包治百病的靈丹妙藥,古今考試一直利弊共存。標準化考試弊端主要有以下幾種:
1.怪題、偏題層出不窮,連專家教授都做不出,其原因是考試目的悖離了標準化考試初衷。標準化考試是常模參照性考試,其目的選拔基礎知識扎實,能力強并有培養(yǎng)前途的人進入高一級學校深造或進入相應崗位。而中國是個人口大國,經濟與教育都不發(fā)達,利益、資源分配兩極分化,所以競爭性強、錄取率低,千軍萬馬過獨木橋。出題者為加強區(qū)分度,選拔性目的異化為淘汰性,千方百計設置陷阱、障礙,達到淘汰大多數的目的。一些人甚至特權利益集團憑此稀缺資源大謀其利,更維護加劇這種狀況。這種供求關系不平衡如果不能解決絕不可能徹底解除這種弊病。但同時供大于求產生的競爭又是社會發(fā)展所需要的,所以這一矛盾恐怕永遠不能完全解決。出怪題、偏題的另一原因正如科舉考試,考試方式單一,時間長了,未出的好題型與內容越來越少,只好逐漸開發(fā)偏題、怪題、難題。
⒉標準化考試的功利作用又導致應試教育。我國是考試發(fā)源地,2800年的考試史使國民性、文化傳統(tǒng)、價值觀念均被打上了深刻烙印。這種深厚的歷史積淀本身已深深影響我國學校教育,使教學帶有濃烈考試色彩與功利性傾向。在中國這個重人性、關系、面子傳統(tǒng)文化環(huán)境中,權力、金錢、關系作用還不可小看,個人力圖在社會縱層里作“垂直向上社會流動”,考試是最直接的有效手段。這對考生的學習目的和學習動力,家長與社會的價值觀具特殊意義。
所以,不少中學一面喊素質教育,一面騰出高三整整一年復習應考。各地錄取分數線還不平衡;復讀生插班高三,升學率比應屆生高,又造成新的不平等。各種培訓學校、模擬試題、考試經濟掀起新的“造富運動”,正如日本歷史上出現(xiàn)過的“考試地獄”“考試學?!?學生把精力花在考試技巧上,而不是真正知識技能掌握。
3.標準化考試克服了傳統(tǒng)考試主觀性,強調了客觀性標準化,卻無法測得人的學力全部領域,易形成學生被動學習態(tài)度。把豐富的質化為量,只好把無法量化的內容排斥于標準化系統(tǒng)之外,勢必使評價存在局限性。以智力為中心,造成學生整體素質發(fā)展片面性;在智能中,又重知識輕能力,再造成智能發(fā)展的片面性。再者考試限于學科范圍,而學科范圍與功能總是有限的,不能考查學生各學科綜合運用能力。其更深層原因是人類至今無法對人腦這個黑匣子的奧秘進行科學解釋。心理學、生理學、解剖學與神經學研究也已經證明,人的智力結果是多維的,至少有語言,數量邏輯、視覺空間、身體動作、音樂、人際和自我等至少七種以上智力方式,標準化考試根本不可能作出這么豐富廣泛的評價。
4.信度、效度的質疑??荚嚪秶c手段局限性決定結果不一定代表考生真正綜合能力。認知技能、情感、道德標準化的缺陷使考生可以通過考試技巧猜測取巧。雖然我國選拔性考試采用部分標準化,如語文、英語、政治增加了作文或論述,但寫的實際上還是應試八股,而不是真正意義上作文。有創(chuàng)造力,有成就的學生,往往不是標準化考試高分者。有些高考狀元進大學后默默無聞,成績平平。標準化考試使舞弊更容易,每逢考季,臺灣、香港、北京、成都等地會出現(xiàn)“考試間諜”,考生往往用手機、助聽器接收考場外“考試間諜”發(fā)出的判斷題與選擇題答案,據聞最近連“最新克格勃產品”都用上來了。
⒌我國尚未有一個獨立統(tǒng)一學生評價標準,而是依據教育目標,依托于課程目標,將抽象目標具體化分成不同階段水平作為考試標準。對標準化考試的社會價值、測量價值、教育價值三者是什么關系?怎樣認識他們的功能及如何使用考試結果?對利弊如何發(fā)揚與防止?歷來存在相當大爭議,認識很不統(tǒng)一,導致管理與實施混亂,且尚未出臺有力的政策與措施。管理、科研、命題、監(jiān)考、評卷、錄取、執(zhí)法與監(jiān)督七支隊全需要全面規(guī)劃建設,需要明確端正的科學合理指導思想,需要足夠資金投入和經費保證,需組織嚴密、機構設置合理、工作效率與效益高的管理措施與實施途徑。
6.迷信標準化考試能一勞永逸,濫用標準化考試與不適合的主觀性試題,迷信標準化答案為唯一正確答案。
綜上所述我們不能迷信標準化考試,但同時也不能簡單否定標準化考試。標準化考試的負面影響來自于社會制約、文化科技水平、濫用誤用、考試建設等多方面,不能全盤歸罪于標準化考試;而標準化考試自身的問題主要是片面性,更不能因噎廢食。漢魏選士導致門閥士族橫行;文革期間推薦入學,80年代前不實行標準化考試,也弊端百出;近年異?;鸨乃囆g招生專業(yè)考試由于主觀性太強,更是屢爆丑聞。所以決不能徹底廢除標準化考試。
四、多元教育評價的發(fā)展趨勢
為走出標準化考試的困境,國內外都作了不少探索。
中國歷史上有獨立于科舉的選士制度。1996年上海海運學院實行按多元化標準考核自主招生辦法,認真考慮中學推薦意見并把高中會考成績作為考核內容。浙江師范大學附中誕生了我國第一個也是目前唯一面向社會招生的高校(本科)直升班。根據中考成績篩選,再通過學校組織的語數外考試和基本素質、語言能力、相貌儀表面試可免考高考直接升入浙江師范大學。
日本也是升學競爭激烈,但考試形式多樣。私立學??勺灾髡猩?多采用單獨考試,公立學校除采用大學入學考試中心的考試外,還單獨考試。兩種學校都有筆試、面試。由于考試類型多,內容不同,避免了應試教育。
80年代后期以來,美國教育界開始尋找到一種能更好配合課堂教學考試辦法,也就是外國實行了幾百年、中國實行了上千年的考試評價辦法。這不是簡單返古,而是考試內容與教學方法的一致,叫“真實水平測驗”或“實際表現(xiàn)評價”,主要特點是讓學生在實際環(huán)境中(或近似環(huán)境中)充分發(fā)揮,從而測出真實水平。實際是在美術、體育人才考試選拔中一直采用的。類似于分步給分,既能讓學生充分的發(fā)揮水平,又能從考試中得到種種反饋利于改進教學,提高質量。美國已有14個州采用,有的州干脆摒棄了純標準化考試。但其缺點是花費人力多,閱卷教師水平要求高。
綜觀世界考試史,共經歷了古代傳統(tǒng)考試、近現(xiàn)代科學測試與當代科學評價三階段。90年代興起了多元教育評價,它源于古代學校對學生學力檢驗,其系統(tǒng)理論與方法的形成直接源于20世紀初興起的一種以追求考查教育效果的客觀性為目的教育測驗運動,其特點為:
⒈倡導構建以發(fā)展為本的學生評價體系,以促進發(fā)展為目的,強調評價者與被評者交流合作,評價目標有層次性與動態(tài)性,尊重被評者的個體差異與多樣性。由于知識體系處于不斷變動狀態(tài),更重視學生探究能力。
2.質性評價模式結合量化評價模式。以多元評價評價多元智力。建構主義興起使評價重視學生知識的認知建構差異。
3.強調測評真實性與情境性。
4.鼓勵學生評價中合作行為。
5.重視思維過程評價,充分體現(xiàn)學生解決問題,收集資料、推理、判斷得出結論的過程。
總的來說,致力于整體性評價,給學生彈性化、人性化發(fā)展空間。具體方式含有實作評價、動態(tài)評價、變通性評價、卷宗評價、真實評價、紙筆測驗等等。
綜上所述不能徹底廢除標準化考試,標準化考試與非標準化考試相結合轉向多元教學評價是大勢所趨。但是在我國大規(guī)模實施多元教學評價還有人力、物力、財力許多困難,不可能一蹴而就,而且多元教育評價以什么方式為中心如何結合?會不會引起混亂、走向形式化?會不會出現(xiàn)其他意外負作用?這一切還需逐步謹慎實踐檢驗和發(fā)展。同時考試制度是建立在一定社會政治、經濟、文化基礎上的,教育資源的投入和分配公平、人才就業(yè)、文化科技水平、濫用誤用、考試研究建設等多方面原因不得到解決,只能治標不治本,改革難免會是水月鏡花。
參考文獻:
[1] 全國十二所重點師范大學.教育學基礎[M]. 北京:教育科學出版社,2002.
[2] 袁振國.當代教育學[M]. 北京:教育科學出版 社,1999.
[3] 王炳照,等.中國簡明教育史[M]. 北京:北京師范大學出版社,1994.
[4] 易凌峰.多元教學評價的發(fā)展與趨勢[EB/OL]. [5] 胡中鋒等.我國高考的回顧與反思[EB/OL].
[6] 邢海洋.拒絕標準化考試[EB/OL].
(責任編輯:郭呈祥)