姚春艷+張勇
2013年是中國教育評價與考試改革具有里程碑意義的一年:教育部發(fā)布了《關于推進中小學教育質(zhì)量綜合評價改革的意見》,并在全國批準了28個地級市實驗區(qū)和兩個省級實驗區(qū),標志著新一輪教育評價與考試改革拉開序幕。與以往評價與考試改革不同的是,這次改革最終要實現(xiàn)的是體制、機制以及技術三個方面的變革,其中評價與考試技術的變革是本次改革得以順利完成的重要基礎。
考察第三方教育評價發(fā)展較為成熟的美國,其成功經(jīng)驗給予我們的重要啟示是:專業(yè)機構的專業(yè)技術能被市場和國際所認可,才是教育評價改革成功及第三方教育評價之路得以“走得好、走得遠”的關鍵保證。因此,在當今中國,教育評價技術的科學化、專業(yè)化,是推動教育評價改革、推廣第三方教育評價的首要問題。在筆者看來,無論是哪個第三方專業(yè)機構,要想通過這次評價與考試改革確立其專業(yè)地位,就必須在教育評價與考試技術上取得重大突破。這種突破意味著該技術必須要滿足以下幾個基本的前提條件。
要符合國家提出的關于教育評價與考試改革的新要求。
無論是2002年《教育部關于積極推進中小學評價與考試制度改革的通知》,還是2013年《教育部關于推進中小學教育質(zhì)量綜合評價改革的意見》,都明確指出我國當前教育評價與考試中突出的問題是“評價內(nèi)容上重考試分數(shù)忽視學生綜合素質(zhì)和個性發(fā)展,在評價方式上重視最終結果忽視學校進步和努力程度,在評價結果使用上重甄別證明忽視診斷和改進”,因此嚴重阻礙學生的健康發(fā)展和教師的專業(yè)提升。針對這一問題,2013年教育部出臺的文件特別強調(diào)要“更加注重發(fā)揮評價的引導、診斷、改進、激勵等功能”。從上述兩個文件中不難看出,歷經(jīng)十多年,我國教育評價與考試改革的主題基本未曾發(fā)生變化;這也意味著,教育評價與考試中的難題始終沒有得到根本性破解。因此,任何一項教育評價技術,若不能在“引導、診斷、改進和激勵”功能上取得實質(zhì)性的突破,就無法滿足國家提出的關于評價與考試改革的要求,自然也無法完成本次改革的任務。
要符合新課程改革的課程目標和課程標準要求。
我國新一輪課程改革始于1999年,歷經(jīng)十余年的探索和實踐,在2011年推出了教育改革的重要成果——課程標準(2011版)。以學科教育為例,學科教育的課程目標、標準和評價,是基于“三維目標”(《基礎教育課程改革綱要(試行)》)及“學科學習目標”(《教育部關于積極推進中小學評價與考試制度改革的通知》)的。新版的課程標準,將以往的教學大綱中規(guī)定的“雙基”課程目標調(diào)整為“知識與技能,過程與方法,情感態(tài)度和價值觀”的三維課程目標,并依此形成和完善課程標準。同時,2011版的課程標準中也明確指出課程評價應“全面落實課程目標”。根據(jù)泰勒的課程編制原理,教育評價的科學規(guī)律是:教學服從于課程目標、評價與課程目標標準相匹配,才能使教育的結果向著課程目標、標準所引導的方向發(fā)生。道理似乎很簡單,但是我國現(xiàn)行的考試與評價,由于種種原因(主要是由于體制和技術落后),評價目標依舊是“雙基”課程目標,評價標準實質(zhì)仍是“雙向”細目,評價目標、標準與新課程目標、標準嚴重脫節(jié)。加上評價技術和方法落后,評價手段單一,從而導致國家所倡導的素質(zhì)教育在實踐中成為“鏡中之花,水中之月”。
除了學科教育的這種評價現(xiàn)狀外,基于“基礎性發(fā)展目標”的“綜合素質(zhì)評價”(也稱“基礎素質(zhì)評價”)和基于學業(yè)評價、綜合素質(zhì)評價及人才培養(yǎng)目標的“綜合評價”,在我國目前基本處于空白。2010年教育部發(fā)布了《綜合實踐活動課程指導綱要(2010)》《綜合實踐活動課程標準(2010)》,2013年發(fā)布了《教育部關于推進中小學教育質(zhì)量綜合評價改革的意見》,并給出了《中小學教育質(zhì)量綜合評價指標框架(試行)》,明確提出了基于“基礎性發(fā)展目標”的“綜合素質(zhì)評價”,以及基于學業(yè)評價和綜合素質(zhì)評價及人才培養(yǎng)目標的“綜合評價”。這對我國教育評價提出了更新、更高的要求。
課程改革走到今天,許多學者都紛紛指出,現(xiàn)有的評價目標、標準、理論、技術、方法等若不能有實質(zhì)性的改變,課程改革的瓶頸將無法突破。因此,新型的教育評價技術必須要解決評價目標、標準、內(nèi)容、理論、方法等,與新課程目標和標準相匹配的問題。
第三,要能與國外、國際學業(yè)成績評估接軌。
我國新一輪教育改革發(fā)生的背景是全球化、知識經(jīng)濟以及信息化。作為“教育實施、教育評價、教育咨詢”這個教育自循環(huán)系統(tǒng)中的重要一環(huán),教育評價必然要與國際接軌。
當前,國際上影響較大的教育評價項目主要有兩個,分別是國際經(jīng)濟合作與發(fā)展組織主持的國際學生評價項目(簡稱PISA),以及國際教育成就評價協(xié)會主持的第三次國際數(shù)學和科學教育的再研究(簡稱TIMSS-R)。這兩個國際學業(yè)成就評估項目的參與國家和地區(qū)都超過了40個以上,評估結果也成為各個參與國制訂教育政策、推進教育改革的重要參考。
此外,也有越來越多的國內(nèi)學者在關注和研究美國國內(nèi)唯一的國家基礎教育質(zhì)量監(jiān)測和評價體系——“全國教育進展評價(簡稱NAEP)”。這些評估項目的共同特點是有明確的評估理念,有多元、多維的評估指標。而隨著中國中高考改革工作的推進,中國與其他國家之間考試以及評價成績進行對接、異質(zhì)比較、等值轉換等問題也會日益突出。
因此,中國教育評價若不能從國外評估項目中學習和借鑒先進的理念和經(jīng)驗,發(fā)展出既滿足本土需求,又能與國際接軌的理念、技術和方法,并能有效進行成績之間的異質(zhì)比較或等值轉換,中國教育仍將因為無法有效可靠地與國際接軌而處于被動局面甚至“閉關鎖國”狀態(tài),中國的教育評價改革難以實現(xiàn),教育評價第三方之路也會行將不遠。
新型的教育評價技術應該如何建構才能滿足上述三個基本的要求,進而推進我國的教育評價與考試的改革?筆者認為,評價理念的變革,評價理論的應用,評價技術模型的建構,試題的編制、賦分、分析以及成績報告方式與解釋等方面,都需要有重大的突破。
首先,需要有機整合國際知名教育理論以及教育學、心理學等學科的最新研究成果,建立多元、多維的評價技術模型,使學業(yè)診斷和甄別有據(jù)可依。
其次,在試題賦分、計分和統(tǒng)計分析上,新型學業(yè)評價技術要依據(jù)認知與思維的發(fā)生過程,采用對知識、技能和能力測量點分別賦分的結構化方式,形成以“知識、技能、能力”為顯性分數(shù),以“方法、過程、策略”以及“情感、價值、態(tài)度”為隱形分數(shù)的三維分數(shù)結構,為診斷和甄別提供豐富的信息。
第三,在成績報告方面,要能提供面向不同群體的數(shù)據(jù)報告,也要能提供多元、多維、多重的數(shù)據(jù)比較,從而為教育咨詢,教研、教學、教管以及教師專業(yè)發(fā)展提供科學的工具和操作平臺。
第四,需要有大規(guī)模的實證數(shù)據(jù)支持,以驗證評價技術的可信性和可靠性。
走第三方教育評價之路已經(jīng)是必然的趨勢,社會各方就此問題達成共識不是什么難題,因此不會構成改革的障礙。而教育評價與考試技術上的突破,則將成為改革的重點。由此,筆者認為,更多的專業(yè)機構應該將研發(fā)滿足改革要求的教育評價與考試技術作為發(fā)展的重點,推動我國教育評價與考試整體水平的提升,縮小我國與西方國家之間的差距,這樣才能保證本次教育改革任務的順利完成。