韓家勛
(教育部考試中心,北京 100084)
公平與科學:高考命題改革的價值追求
韓家勛
(教育部考試中心,北京 100084)
恢復高考40年來,在黨的改革開放政策指引下,借鑒國外考試經驗和技術,高考命題不斷深化考試內容和形式改革,在考什么、怎么考方面,充分考慮我國國情和教學改革需求,正確處理高考與教學關系,從實踐中總結命題規(guī)律,發(fā)展了我國的學科測量理論與技術,形成了從知識考查到能力考查的較為全面的測試體系,有效控制了考試誤差,逐步實現(xiàn)了考試的科學化,保證了考試公平、科學選才。
恢復高考;高考改革;高考命題;能力考查
1977年恢復高考,重建了社會主流價值體系和人才觀念,迎來了通過公平競爭改變個人命運的時代。40年來,高考為國家選才、學生成長、促進社會流動提供了重要通道,許多人圓了大學夢,并在國家經濟發(fā)展和社會變革中發(fā)揮著重要作用。1978年,鄧小平同志在力促恢復高校招生考試的第二年就指出,“要認真研究、試驗,改進考試的內容和形式,使它完善起來。”[1]高考秉持促進公平、科學選才的價值取向,不斷改革完善。今天,高考已成為我國的基本教育制度,也成為我國社會制度的重要組成部分。
筆者作為高考制度恢復的幸運兒,1978年考上大學,畢業(yè)后短期教書,在恢復高考后準備啟動第一輪改革時,有幸成為考試工作者,至今經歷了多輪高考改革。在從事高考命題工作的25年間,深感高考制度的變遷與我國的社會、政治、經濟發(fā)展息息相關,國家的改革開放使高考擺脫了傳統(tǒng)的模式,高考的改革與發(fā)展適應了時代人才培養(yǎng)和選拔的需求。
我國改革開放之初,為了準確選拔出國留學人員,1981年在北京、上海、廣州舉行了第一次美國TOEFL和GRE考試,將一種全新的考試模式引入我國。1982年,引進國外的心理與教育測驗專著,心理學和教育測量學重新受到重視?;謴透呖汲跗冢呖嫉墓芾砟J交旧鲜茄永m(xù)“文化大革命”前“臨時組織經驗型管理”模式,隨著國外現(xiàn)代考試理論和測驗方法的引入,高考傳統(tǒng)的命題方法和考試方式的缺陷逐漸顯露出來。
筆者1984年調到教育部,第一件工作就是參加組織高考前兩個月的與外界隔離的封閉命題會議,又稱“入闈”命題。命題教師都是在集中前幾天才接到通知,且未被告知會議真實內容,因此沒有思想準備和相關資料的收集,高考考什么、怎么考主要憑教師個人經驗。由于當時的印刷條件和交通運輸?shù)穆浜?,入闈兩個月,實際命題時間只有前面的半個月,所以試題質量很難說有基本保證。在完成命題、等待考試的階段,教育部請研究國外教育測量統(tǒng)計理論與技術的專家給命題教師舉辦講座,大家耳目一新,反響強烈,喚起了對考試改革的熱情,并反思我國高考命題存在的問題,認識到為保證高考的公平公正,必須減少考試誤差。但學科專家對全部用選擇題的美國標準化測驗方式并不接受。
在了解教育測量統(tǒng)計理論的基礎上,教育部組織學科專家和測量專家共同對1980—1984年的高考試卷進行分析。在獲得有關試卷信度和效度、試題難度和區(qū)分度等方面的數(shù)據(jù)后,分析并提出傳統(tǒng)高考命題存在的主要缺陷:一是缺乏科學理論指導,考試的質量要求不明確,命題水平不穩(wěn)定;二是試題多為主觀性試題,題量少,導致猜題押題嚴重,不能全面反映學科測量目標,且評分誤差比較大①1983年,北京師范大學針對高考試題閱卷誤差進行專題研究,發(fā)現(xiàn)同一份考生作文的評分誤差竟達到幾十分,其他科目主觀題的評分誤差也比較大。;三是采用臨時組織封閉命題方式,人員不穩(wěn)定,命題盲目性、隨意性大,既不能保證試題質量,又影響中學正常教學。
1985年,教育部在廣東開始標準化考試試驗。借鑒國外考試經驗和技術,在高考命題、考試實施、評卷、考試的統(tǒng)計分析四個環(huán)節(jié),探索適合我國國情的標準化考試,取得了顯著成績,有力地推動了我國教育測量理論與統(tǒng)計技術的研究與實踐,其意義不可低估。某些科目在全國起到了先驅的作用,例如,英語科考試改革試驗為我國高考向標準化過渡,探索出了一條可行的道路。
1987年,國家教委成立考試管理中心(現(xiàn)教育部考試中心,簡稱考試中心),負責高考命題工作。1989年,國家教委頒發(fā)的《普通高等學校招生全國統(tǒng)一考試標準化實施規(guī)劃》中提出:“普通高等學校招生全國統(tǒng)一考試,要在繼承我國寶貴遺產的基礎上,借鑒國外成功經驗,逐步實行標準化?!盵2]
考試中心組織專家組,在繼承我國傳統(tǒng)考試經驗的基礎上,以現(xiàn)代測量理論為指導,借鑒國外考試經驗和技術,將高考設計為按系統(tǒng)的科學程序組織、具有統(tǒng)一標準并對誤差做了嚴格控制的考試。
1.2.1 建立相對穩(wěn)定的命題專家隊伍
從1989年開始,陸續(xù)成立英語、物理、化學、語文、數(shù)學等學科命題委員會。學科命題委員會的職責是:對學科命題工作提出規(guī)劃和建議,推薦命題和審題專家,主持參與有關高考命題改革的科研課題等。
在學科命題委員會的指導下,組成了相對穩(wěn)定的學科命題組。在完成當年命題任務的同時,各學科命題組深入研究教育測量理論,將科研課題的研究成果應用到命題中。同時結合學科特點,提出學科考查目標和考查要求,不斷利用考試反饋信息完善命題方案,在改進命題技術、提高命題質量方面收到明顯成效。
1.2.2 運用教育測量理論指導命題實踐
按照高等學校選拔新生的要求,依據(jù)中學教學大綱,1989年考試中心公布英語科《考試說明》,1990年公布化學科、物理科《考試說明》,到1997年各學科都制定了《考試說明》。
《考試說明》確定了考試性質、考試目標、考查內容及要求等,規(guī)定了試題形式、試題數(shù)量、試題順序、各部分內容所占分值比例、答卷要求等?!犊荚囌f明》的制定是我國在大規(guī)??荚囍惺状芜\用對認知目標分類的研究建立的適合我國教學要求的各學科考試目標,并對考試質量指標進行了較科學的闡述,改變了自科舉以來的傳統(tǒng)模式,使各科考試的內容、形式更加科學、公平、透明,極大地克服了考試工作者和考生的盲目性。
高考命題組根據(jù)《考試說明》制定命題雙向細目表,以此保證考試的信度和效度,從而保證考試的內容范圍、知識和能力要求在試卷中全面、合理、準確地體現(xiàn),有效地控制了命題環(huán)節(jié)的主觀隨意性。
1.2.3 調整試卷結構,控制評分誤差
1990年確定高考各科試卷結構采用主觀題(非選擇題)與客觀題(選擇題)合理搭配的形式。此后,根據(jù)學科特點,經過7年研究、試測,逐步確定各科試卷的題型比例和試題難易比例等,并明確了按照招生錄取率的變化調整試卷的整體難度,根據(jù)能力考查的需要調整題型等命題原則。
選擇題用計算機評卷,改進主觀題命題與評卷辦法,嚴格控制評分誤差。1990年考試中心制訂了主觀題評分誤差控制方案并組織實施,首先從語文作文命題及評分開始。經過多年研究和試驗發(fā)現(xiàn),高考作文考查應重視測量的客觀性,力求避免猜題押題給考試帶來的誤差,減輕評卷時人為因素對考試成績的干擾。為此,高考作文改變試題形式,不再以命題作文的形式出現(xiàn),而是以材料作文為主,同時評分方法采取分項分等法。
1.2.4 開展對試題的量化評價
1988年開始,考試中心對全國的考試數(shù)據(jù)進行考生答題情況抽樣數(shù)據(jù)采集和考生信息數(shù)據(jù)采集等工作,根據(jù)數(shù)據(jù)的代表性推斷全體考生答題情況,分析試題試卷質量。經過多年研究,逐步建立了一套科學的高考統(tǒng)計分析系統(tǒng)。
1989年,考試中心提出命題質量控制方案并付諸實施,其中一項重點工作是根據(jù)抽樣統(tǒng)計數(shù)據(jù)及綜合信息數(shù)據(jù),對考生水平及試題質量進行定量評價,總結高考命題得失,編制評價試題質量的年度報告,改變對試題質量的評價完全憑主觀經驗判斷的做法,反饋給命題教師以改進下一次的命題工作,并提供給教育教學部門及相關人員參考。在此后的命題研究中,部分學科還用因素分析的方法對試卷進行內容效度分析、高考選拔預測效度分析、主觀題評分誤差控制分析等。
多年實踐證明,用教育目標分類學的方法確定考查內容,用教育測量學的方法考查掌握知識與所具備能力的狀況,并且用統(tǒng)計學的方法分析考試結果,從高考命題、閱卷到試題評價進行改革,有效控制了考試誤差,逐步實現(xiàn)了高考命題的科學化。從傳統(tǒng)考試向現(xiàn)代考試轉變,促進了考試的公平公正,提高了我國考試的科學化管理水平。
考試與教學的關系,是一個世界性的問題,也一直困擾著我國的高考與中學教學。“九五”期間,考試中心組織開展重點課題“大學入學考試與中學教學關系研究”。根據(jù)“既有利于高校選拔新生,也有利于中學教學”的高考命題指導思想,提出要遵循“教什么,考什么,考什么,教什么;教多難,考多難,考多難,教多難”[3]的客觀規(guī)律。正確處理高考與教學的關系,即建立雙向評價機制:一方面,凡是有助于提高大學和中學教學質量的教育要求,都應當在高考中得到肯定和鼓勵;另一方面,凡是有助于促進中學不斷改進、完善教學的考試措施,也應當在教學中得到認同。
1990年以前,高考命題范圍以中學《教學大綱》和統(tǒng)編教材為依據(jù),即“以綱為綱,以本為本”。據(jù)此,教育部每年公布考試復習的知識范圍。由于沒有明確考試標準和學科知識、能力考核的具體要求,不僅高考命題的盲目性很大,而且造成各地中學每年在高考前都千方百計地刺探高考命題的信息,如題型、題量、難度等,猜題押題嚴重。多年實踐證明,高考命題只依據(jù)教學大綱是不夠的,因為高考是檢驗要升學的那部分學生的學習結果和繼續(xù)學習能力的終結性考試,而教學大綱面向全體學生,只規(guī)定了教學目的、教學內容及要求等,即“教什么,怎么教”,并沒有體現(xiàn)高校招生需求,沒有提出對大學新生的知識結構和能力水平的評價要求。
為體現(xiàn)考試的公平、科學原則,指導和規(guī)范高校入學考試命題和備考,依據(jù)“兩個有利于”的命題指導思想,考試中心組織學科命題專家在測量理論基礎上,對知識和能力的關系、各類題型功能和學科試卷的題型比例進行了深入的實證性研究,將教育測量理論學科化,制定了適合我國國情、反映學科特點的《考試說明》。各科《考試說明》,根據(jù)普通高等學校對新生文化素質的要求,按照《教學大綱》規(guī)定的教學內容,考慮中學實際,基于檢驗學生學習結果和進入高校繼續(xù)學習的能力水平,明確“考什么,怎么考”,落實“科學、公平、準確、規(guī)范”的高考命題原則?!犊荚囌f明》與《教學大綱》相輔相成,成為高考命題和考生復習備考共同遵循的依據(jù),較好地處理了高考和教學的關系。對廣大教師科學掌握測驗和評價方法、改進教學起到了積極的推進作用,為高考的內容改革打下了良好的理論和實踐基礎。
1999年,高考實施“3+X”科目改革。在對綜合能力考查研究試驗的基礎上,先后制定了文理綜合、文科綜合、理科綜合能力測試的《考試說明》。2004年,為保證統(tǒng)一高考和分省命題的公平性、科學性,在《考試說明》基礎上制定了《考試大綱》,作為統(tǒng)一高考的命題標準。分省命題省份依據(jù)《考試大綱》,制定符合本地實際的《考試說明》。同年,《高中課程標準》開始試行。2005年,考試中心根據(jù)教育部要求,組織課程專家和高考命題專家共同制定了2007年高考《考試大綱》(課程標準實驗版),對各個學科的能力目標進行新的修改與拓展。2016年,根據(jù)新一輪考試招生制度改革有關考試內容改革的研究與實踐,對《考試大綱》進一步修訂完善,充分體現(xiàn)能力立意的命題理念,按照加強能力和素質考查的原則整合了學科考試內容,從而更好地處理了課程改革與考試改革的關系。
經過多年來的實踐檢驗,公布《考試說明》或《考試大綱》,增加了高考的透明度,有利于克服高考命題的盲目性,有利于全體考生在明確的考試要求下復習備考,減輕不必要的負擔,有利于考試對教學積極導向,提升了高考的公平性、科學性。
從1993年起,每年高考后考試中心都召開試題評價會,邀請全國有代表性的?。▍^(qū)、市)閱卷組長(主要是高校教師)、中學教研人員及部分任課教師代表和命題專家,依據(jù)全國抽樣統(tǒng)計數(shù)據(jù),從既有利于高校選才、又有利于中學教學的角度,分析、總結命題和教學的得失,不僅分析難度、區(qū)分度、信度等定量指標,同時也從試題立意、情境設置到對教學導向等方面做定性分析。在此基礎上,編寫發(fā)布高考試題評價報告。
2004年分省命題后,考試中心除繼續(xù)對全國卷進行評價外,還對分省命題試卷進行專業(yè)評價,力圖提高全國高考試題的質量,幫助教師和學生正確理解命題意圖和準確把握學科考查要求??记肮肌犊荚嚧缶V》,考后公布《評價報告》,形成高考與教學的良性交流溝通機制,受到社會各界的普遍贊揚。
1995年,考試中心研究制訂《普通高等學校招生全國統(tǒng)一考試命題工作章程(試行)》。之后,隨著對教育測量理論、技術、方法的不斷研究,在實踐基礎上,對該章程進行完善。2004年分省命題后,在總結全國和分省命題組織管理經驗的基礎上,教育部于2006年頒布《普通高校招生全國統(tǒng)一考試分省命題工作暫行管理辦法》。該管理辦法規(guī)定了命題原則、命題導向,試題難度、區(qū)分度,試卷信度、效度等重要指標的控制標準。辦法的實施不僅提高了考試的科學性,也較好地發(fā)揮了高考對中學教學的積極導向作用,降低了考試的某些負面影響。
教學與考試都服務于教育的育人功能。培養(yǎng)學生能力、提升學生素質(素養(yǎng))是各級學校教育的核心內容,能力的培養(yǎng)和考查影響著學生成長和國家選才。20世紀80年代起,各國都致力于培養(yǎng)適應21世紀需要的人才,紛紛制定本國的學業(yè)能力標準并采用相應的測評手段,以衡量教育教學的進步,促進學生能力的發(fā)展。
國家的發(fā)展、社會的進步、個人的成長都對學生能力素質提出了新的要求,學校教育提升學生的能力素質已成為時代的重要命題,考能力也成為教育考試是否適應社會需要、能否完成時代賦予的重要使命的關鍵。
1990年實行全國高中畢業(yè)會考后,為了使高等學校選拔素質高的新生,教育部提出“高考應注重考能力,在考查基礎知識的同時,注重考查分析問題和解決問題的能力”的命題原則。據(jù)此,考試中心組織開展了“會考后高考能力考查的研究”。該研究根據(jù)中學教學培養(yǎng)目標和高考考查目標,依據(jù)心理測量與教育評價理論,將能力考查目標具體化到各學科之中,研究學科能力考查的影響因素,分析學科的能力結構和成分。在這個研究基礎上,高考各學科逐步完善了能力考查目標和能力層次標準,總結了能力考查原則和命題方法,將能力考查學科化、具體化。同時研究題型功能,改進試卷設計,在命題環(huán)節(jié)中較好地體現(xiàn)了知識和能力的辯證關系,為科學地測量學科知識和能力奠定了理論與技術基礎,對于克服考生死記硬背的弊端、促進中學教學注重學生能力的培養(yǎng)發(fā)揮了作用。
高考旨在合格的高中畢業(yè)生中選拔那些素質高、潛力大的學生,僅僅考查學科知識是不夠的,還要考查綜合運用知識,在新的問題情景中解決問題的能力。1997年,考試中心開展綜合能力測試研究與試驗。在研究分析美國、韓國綜合能力測試的基礎上,結合我國高考和教學改革實際,提出以能力測試為主導,在考查學科能力的基礎上,考查利用相關學科知識綜合解決問題能力的命題改革原則。1998年,在教育部的直接部署下,在黑龍江、四川、河北、湖北、上海五省市的保送生中,進行了“綜合能力測試”的試點。
綜合能力測試突出對學生獲取、解讀、處理信息能力的考查,強調學以致用、理論聯(lián)系實際,試題以現(xiàn)實問題為背景,試題所涉及的材料、情景、問題貼近學生的生活實際和思想實際,考查學生綜合運用多學科的理論、方法分析和解決問題的能力。試卷設置了一些開放性試題,學生可以從不同角度、不同層面回答問題。這些沒有統(tǒng)一答案的問題,不僅可以考核學生對以某個具體結論為依據(jù)的證據(jù)了解得怎樣、整理得怎樣、使用得怎樣,而且可以考核學生對某個具體結論的評價標準和價值取向。綜合能力測試不僅突出對學生批判性思維等思維方法和能力的考查,更為重要的是能夠有效地引導教學重視對學生創(chuàng)新意識的保護與培養(yǎng)。
綜合能力測試在拓展能力考查目標、探索真實情境命題、開放性試題評卷等方面的積極探索,對高考“3+X”改革提出從知識立意向能力立意轉變的命題指導思想,增加應用型和能力型試題,突出能力與素質的考查,加強對學生創(chuàng)新意識和實踐能力的培養(yǎng)導向等都具有重要的理論與實踐意義。
在綜合能力測試試點的同期,教育部在廣東進行高中開設綜合課程的試驗。3年后高中綜合課程試驗沒有成功。由于這種不分文理、覆蓋除外語以外的8個學科的綜合考試方式,與我國高中課程設置、分科教學難以銜接,文理綜合能力測試科目在試驗兩年后,大多數(shù)省份改為文科綜合、理科綜合科目并使用至今。這也再次印證了“教什么,考什么,考什么,教什么”的客觀規(guī)律。
2004年,高中試行新課程標準,倡導“知識與能力、過程與方法、情感態(tài)度與價值觀”三維學習目標,強調學習的選擇性,高中教學內容分選修部分和必修部分。2007年課改后的高考命題,各學科充分汲取新課標的理念,進一步研究適合自身學科的測量目標,拓展了能力考查的內容,增加對創(chuàng)新意識、探究能力的考查,研究探究型、開放性試題的命題方法。調整了試卷結構,設置必考和選考兩部分試題,強調命題要有利于培養(yǎng)和選拔具有學習潛能和創(chuàng)新精神的考生。
2010年頒布的《國家中長期教育改革和發(fā)展規(guī)劃綱要(2010—2020年)》,把“深化考試內容和形式改革,著重考查綜合素質和能力”作為完善高等學校考試招生制度的重要內容[4]。高考命題注重情境性,增加開放性,重視實踐性,試題關注生活、關注社會、關注自然,重視情感、態(tài)度和價值觀的考查,促進學生形成的知識、能力結構及水平能夠適應繼續(xù)學習和社會發(fā)展的需要。注重對學生能力和素質的考查,不僅提升高考選拔的有效性,還推進了高中新課程改革的順利實施。
考慮我國國情和教學的實際,高考命題并沒有完全照搬國外標準化測驗的模式,而是組織命題專家運用現(xiàn)代測量理論,對題型功能與能力考查的關系、不同題型在不同學科所占比例進行了深入的實證性研究。通過試測,得出不同的題型在考查不同知識、能力及其層次上具有不同的功能,選擇題與非選擇題功能各有長短,全部采用任何一種題型都是不全面的,應該根據(jù)各學科考核內容確定題型比例,不同學科試卷的題型結構應有不同等重要結論。高考命題堅持了主客觀題型并重的測驗模式,較好地處理了教學與考試的關系,提出了適合各學科能力考查的題型設計原則和方法,合理使用符合學科特點的題型評價相關能力及其水平。在發(fā)揮主觀題功能的同時,不斷研究改進命題和評分方式以控制誤差。在總結多年命題經驗基礎上,研發(fā)了信息遷移題、材料解析題、材料作文等新題型,力求避免猜題、押題、宿構,有利于真實評價考生能力水平。
多年實踐證明,高考考能力不是要出難題,而且難題未必一定考能力,更不能出偏題、怪題。試題過難,高中教學和復習壓力大,影響學生學習信心和對教師的評價;試題過易,對能力水平較高的學生不利,影響高校錄取。如湖南、云南、海南1991年進行高考科目組改革,要求單獨命題,由于三省學生水平差異太大,故命題時大幅度降低了試卷難度。考后,湖南第一批錄取的重點院校的最低錄取控制分數(shù)線與第二批一般院校的最低錄取控制分數(shù)線相差不大,即優(yōu)秀學生的水平沒有顯示出來,引起重點中學與重點高等學校的不滿。因此,高考試卷需要由不同難度的試題合理搭配,使試卷能夠區(qū)分不同能力水平的考生。
按照教育測量學理論,大規(guī)模常模參照性測驗的試卷難度在0.50左右,標準差比較大,考生分數(shù)較分散,可以使考試對考生總體的區(qū)分能力較大。由于我國中等教育的評價制度尚不健全,高考成績的高低對中學影響比較大,完全按照教育測量理論控制試卷難度困難較多,因此,綜合考慮各種因素,特別是隨著高校招生錄取率的提高,在保持必要區(qū)分度的情況下,高考試卷中的試題以中等難度為主,試卷平均難度也逐步降低。在不影響擇優(yōu)的情況下,盡量降低試題絕對難度,以減輕考生復習備考的負擔。1998年以前高考試卷難度控制在0.50~0.55,1998年即大學擴招后則控制在0.60左右,這是高考命題實踐總結出來的重要經驗。
恢復高考40年以來,高考命題始終堅持公平、科學的價值追求,在不超綱、又不鼓勵死讀書,試題難度不能高、區(qū)分度又不能低,重點難點不回避、試題年年有新意的客觀條件下,努力“考”出學生的真才實學,促進學生成長,為高校選拔人才、提升中學教學質量作出了重要貢獻。
[1]《鄧小平文選》(第二卷)[M].北京:人民出版社,1994:105.
[2]楊學為.高考文獻(下)[M].北京:高等教育出版社,2003:418-419.
[3]楊學為.中國考試改革研究[M].北京:北京大學出版社,2001:99.
[4]教育規(guī)劃綱要輔導讀本[M].北京:教育科學出版社,2010:36.
Fairness and Scientificness:The Value Pursued in the Reform of the National College Entrance Examination
HAN Jiaxun
(National Education Examinations Authority,Beijing 100084,China)
For 40 years since its resumption,to ensure fairness and scientificness in selecting talents,China,under the guidance of the Chinese Communist Party’s reform and open-door policy,has increasingly deepened its reform in the what and how of the College Entrance Examination and has ultimately built a relatively comprehensive testing system for both knowledge and ability.Over the course of the reform process,while learning from foreign experience and technology,China has drawn lessons from practice,which have ultimately added to the knowledge and knowhow of subject assessment and at the same time kept the examination error under control.Simultaneously,while meticulously handling the relationship between the examination and teaching,China has made efforts to take full account of the national conditions and the demands of teaching in the examination reform.
Resumption of the College Entrance Examination;College Entrance Examination Reform;Test Development for the College Entrance Examination;Ability Assessment
G405
A
1005-8427(2017)06-0006-7
10.19360/j.cnki.11-3303/g4.2017.06.002
(責任編輯:陳睿)
韓家勛(1957—),男,教育部考試中心,研究員。