黃志軍
核心素養(yǎng)時代的到來,對學校和教師的日常教學乃至評價都提出了新的要求和挑戰(zhàn)。PISA、PIRLS和TIMSS等國際測評項目在中國的實施,對中國的基礎教育質量評價改革產(chǎn)生了推動和促進作用,國外關于形成性評價的相關研究已經(jīng)有部分成果和操作案例被譯介到國內(nèi),同樣也值得參考。
不過,中國人特有的傳統(tǒng)思維模式也值得重視,它不僅可以為反思“核心素養(yǎng)”提供新視角,也可以為中國學生落實發(fā)展“核心素養(yǎng)”指示路徑。獨具傳統(tǒng)的學與教體現(xiàn)中國思維的辯證法,可以回應“核心素養(yǎng)”框架所反映的教育需求。
當前中國討論核心素養(yǎng)的根本宗旨是使社會良好運行以及個人過上他想要的健康生活,因此,不能僅僅著眼于工作技能。從教育的理想來說,中國未來的課程改革應該培養(yǎng)全面發(fā)展的“完人”。
歐盟指出,“素養(yǎng)”是適應于特定情境的知識、技能和態(tài)度的組合(EU,2005)。我國臺灣學者蔡清田(2010)則認為,“素養(yǎng)”是個體為了健全發(fā)展、必須滿足生活需求所不可或缺的知識、能力或技術能力和態(tài)度??梢姡八仞B(yǎng)”強調(diào)個體發(fā)展的整體性,強調(diào)個體在特定情境下知識、能力和態(tài)度的綜合表現(xiàn),因此比“能力”一詞更加契合當代社會對人才的要求。素養(yǎng)本身具有的情境性和整體性特征,必然要求與之匹配的測評理念、框架和操作。
目前來看,全世界不少國家和地區(qū)已經(jīng)開始推行基于核心素養(yǎng)的課程改革。核心素養(yǎng)時代的到來,無論是對學生素養(yǎng)的跨國比較,還是對一個地區(qū)或者一所學校教育質量的評估,甚至是對學校和教師的日常教學乃至評價都提出了新的要求和挑戰(zhàn)?;诤诵乃仞B(yǎng)的測評應當如何實施,正在持續(xù)成為國際組織、不同國家和地區(qū)教育研究機構的熱點選題,也成為一線教師關注和探討的焦點。本文將在簡要介紹世界范圍內(nèi)核心素養(yǎng)測評研究和實施最新進展的基礎上,重點介紹其他國家和地區(qū)的學校和教師在日常教學層面開展的基于核心素養(yǎng)測評的實踐探索,以饗廣大教育工作者。
一、核心素養(yǎng)測評研究和實施的最新進展
基于核心素養(yǎng)的課程改革要解決的首要問題就是核心素養(yǎng)的轉化。核心素養(yǎng)是高度凝練的,而教學卻必須依托具體的學習目標和內(nèi)容展開?!皩W習結果的具體化為教學和測評打下了重要根基,也為學生核心素養(yǎng)的發(fā)展和展現(xiàn)創(chuàng)造了機會(EU,2012)”。核心素養(yǎng)的具體化是一個細致、復雜的過程,其最終的目的是為了將核心素養(yǎng)變得“可測”,同時能夠有效地指導教師的教和學生的學。至于如何將核心素養(yǎng)具體化,這不是本文討論的重點,需要另外闡述。從目前來看,與傳統(tǒng)學科課程高度相關的核心素養(yǎng)(如:母語交流素養(yǎng)、外語交流素養(yǎng)、數(shù)學素養(yǎng)、科學素養(yǎng))的測評已經(jīng)積累了非常成熟的經(jīng)驗,但是如何分解具有統(tǒng)整性的跨課程素養(yǎng)(如學會學習素養(yǎng)、社交和公民素養(yǎng))并在情境中進行測評,卻成了世界各國專家、學者和教學人員面臨的共同挑戰(zhàn)。好在學者們和一線教師已經(jīng)探索出了一些具有操作性、前瞻性的路徑。從全球范圍來看,基于核心素養(yǎng)的測評研究呈現(xiàn)出以下趨勢:
1.測評方式更加多元化
核心素養(yǎng)蘊含了特定情境中個體知識、能力和態(tài)度的綜合。在這個綜合體里,部分知識和能力可以通過情境性的題目來測查,而個體的情感、態(tài)度卻往往需要借助問卷或其他方式來呈現(xiàn);還有部分知識和能力需要在更為開放、真實的情境中進行探測,如個體的道德執(zhí)行能力、創(chuàng)新意識等。正是因為核心素養(yǎng)涵蓋了個體在特定情境中的知識、能力和態(tài)度,所以必須借助多元化的測評手段(如試題、問卷、訪談、檔案袋等)才能更全面、客觀地呈現(xiàn)出來。PISA素養(yǎng)測試就很好地體現(xiàn)了這一理念。近年來,部分國家(如英國、澳大利亞等)從人才戰(zhàn)略的角度出發(fā),高度關注基于核心素養(yǎng)的課程改革的實效,不僅在國家層面建立了專門的基礎教育質量監(jiān)測和報告制度,還積極推廣學校層面的形成性評價。從相關文獻來看,英國目前開展的形成性評價項目的方式十分多元,包括同儕評價、表現(xiàn)性評價(包含基于項目的檔案袋評價)、自我評價等;澳大利亞在全國范圍內(nèi)積極推廣基于“促進學生學習”理念的測評實踐,同樣鼓勵多元化的形成性評價。可以說,這些多元化評價方式的應用,能夠更加全面地測查學生的核心素養(yǎng),也更有利于培養(yǎng)終身學習者。
2.表現(xiàn)性評價備受青睞
表現(xiàn)性評價是形成性評價中的重要類型。表現(xiàn)性評價通常要求學生在某種特定的真實或模擬情境中,運用先前獲得的知識完成某項任務或解決某個問題,以考查學生知識與技能的掌握程度,或者問題解決、交流合作和批判性思考等多種復雜能力的發(fā)展狀況。表現(xiàn)性評價具有的這些優(yōu)點,與核心素養(yǎng)整體性、情境性的特征十分契合,因此在教學實踐中備受青睞。近年來,檔案袋評價作為表現(xiàn)性評價的一種重要方式,在學校層面的核心素養(yǎng)測評中得到了廣泛應用。例如,法國的部分學校研發(fā)出了根據(jù)一定標準展示學生某方面素養(yǎng)的小冊子。這類測評是基于教師對學生在整個學習過程中的表現(xiàn)來實施的,設定的目的是幫助教師把握學生核心素養(yǎng)發(fā)展的重要方面,同時給學生和家長提供相關信息。斯洛文尼亞在職業(yè)教育中積極引入檔案袋評價方法,教師和學生對學習進程的反思、結果和規(guī)劃都被記錄在檔案袋里。新西蘭在全國范圍內(nèi)推廣的“學習故事”也是一種典型的檔案袋評價。此外,部分國家(如北愛爾蘭、法國)的學校和教師還積極探索電子檔案袋在核心素養(yǎng)測評中的應用。需要說明的是,表現(xiàn)性評價同樣要求教師具備較高的評價素養(yǎng),設置合適的情境性任務,掌握評價的技術和要點,并不等同于評價的隨意和泛化。
3.ICT測評技術帶來曙光
ICT是信息通訊技術英文單詞的縮寫。盡管紙筆測驗在今天仍然比較流行,但是難以提供具體、形象的測試情境,較難考查學生的高層次思維能力。例如:用同一張試卷去檢測能力層次不同的學生,對于一部分學生來說十分簡單,而對另一部分學生來說卻比較困難,這樣就很難反映出不同層次學生的真實水平。計算機和互聯(lián)網(wǎng)技術的出現(xiàn),為避免紙筆測試的這些缺點提供了新的渠道。從目前來看,ICT測評經(jīng)歷了“計算機測試——計算機自適應測試——持續(xù)性測評——智能測評”四個階段,其中前兩個階段的研究重心是如何有效地測評學生的真實水平,而后兩個階段的研究旨趣則發(fā)生了較大轉變:由于數(shù)據(jù)挖掘技術的提升,計算機可以瞬間診斷出不同學生的認知水平,給予即時的反饋,并提供個性化的學習方案,測評的最終目的是精準地促進學生的學習。盡管ICT技術還未大范圍地進入世界各地的基礎教育測評領域,但是已有部分國際組織開始了這方面的探索。如,OECD除了組織閱讀、數(shù)學、科學素養(yǎng)測試之外,還于2012年在全球啟動了“基于計算機的問題解決能力”測評項目,其重心即在于考查學生的創(chuàng)新意識和能力??梢灶A見,隨著ICT技術的成熟,它有可能走進更多學校,輔助教師診斷學情,并給出具有針對性的、個性化的學習方案和即時反饋。
二、學校日常教學中核心素養(yǎng)測評的展開
學校和課堂是核心素養(yǎng)落地的地方。本質上來說,國家或者區(qū)域層面的基礎教育質量監(jiān)測發(fā)布的結果是對核心素養(yǎng)的終結性評價,必然牽涉教育領域的績效考核、對地方政府和學校的問責;學校層面的核心素養(yǎng)測評卻更多地體現(xiàn)為一種形成性評價,其目的應當是“促進學生的學習”。當然,學校和教師也可以根據(jù)一定的標準開發(fā)出情境性的試題和問卷,從而對學生進行階段性學習的終結性評價,但日常的教學評價卻應當指向給學生提供有關學習進程的信息,更好地促進學生的成長。從全世界范圍來看,核心素養(yǎng)在學校層面的測評已經(jīng)有了部分相對成熟的經(jīng)驗,前文提到的新西蘭在全國范圍內(nèi)推行的“學習故事”便是其中一例。以下對“學習故事”在核心素養(yǎng)測評中的應用做簡要介紹。
“學習故事”是一張由教師記錄個別兒童或一群學生在特定學習任務中的行為表現(xiàn)的表格,它是由新西蘭教育學者Carr于本世紀初提出來的一種兒童評估的理論和方法,目前對新西蘭、澳大利亞、英國、加拿大等地的學前教育乃至中小學教育教學實踐都產(chǎn)生了較大影響。一張完整的“學習故事”包括基本信息、評價標準提示、學習故事描述和教師分析四部分(近年來越來越多的學者呼吁增加學生、家長對于教師評價的回應)?;拘畔▽W生和教師的姓名、填寫日期等;評價標準提示是核心素養(yǎng)具體化以后的學習結果,是填寫“學習故事”的前提和參照,一般由有經(jīng)驗的專家或教師團隊擬訂;學習故事描述則由教師參考評價標準記錄特定學習情境中學生的具體表現(xiàn),只聚焦教師觀測到的學生能夠達到的行為表現(xiàn),也可以附上教師抓拍的精彩鏡頭;教師分析部分則主要填寫教師對學生學習結果的分析和解釋,并給出進一步指導建議。以下呈現(xiàn)一份比較規(guī)范的“學習故事”樣例:
顯然,這份“學習故事”聚焦學生的社會和公民素養(yǎng)評估,更具體地說,是對學生社會交往和人際溝通素養(yǎng)的評估。在評估之前,教師已經(jīng)大致明確了評估的維度和具體標準,這樣,在觀察學生特定情境中的行為表現(xiàn)時,教師也會有的放矢??梢韵胂螅皩W習故事”作為一種形成性評價方式,其記錄的內(nèi)容能夠更加真實地反映學生在特定學習情境中的“心智傾向”,尤其是學生的跨學科素養(yǎng),與紙筆測驗相比,有明顯優(yōu)勢。
新西蘭“學習故事”的評價探索為核心素養(yǎng)在學校層面的測評提供了典型經(jīng)驗。總體來看,我國基礎教育質量的評價正在逐步拋棄傳統(tǒng)的應試觀念,向“促進學生學習”的測評觀念轉變。核心素養(yǎng)時代的來臨,不僅對于課程建設和日常教學提出了新的挑戰(zhàn),也對廣大教師的評價素養(yǎng)提出了更高要求。從我國的國情來看,評價恰恰是我們最為薄弱的一環(huán)。廣大教師應當積極學習相關評價理念并在實踐中探索、領悟,從更加全面的角度評價學生和自己的教學。
實際上,PISA、PIRLS和TIMSS等國際測評項目在中國的實施,從多方面對中國的基礎教育質量評價改革產(chǎn)生了推動和促進作用。從國家層面來說,教育部基礎教育質量監(jiān)測中心的成立,加速了我國教育測評研究的進展;從學校層面來說,這三大國際測評項目開始觸動一部分教師積極改善自己的課堂教學,更加注重培育學生的閱讀素養(yǎng)、數(shù)學素養(yǎng)和科技素養(yǎng)。只要教師樂于學習,完全可以從相關材料中受到啟發(fā)。此外,國外關于形成性評價的相關研究已經(jīng)有部分成果和操作案例被譯介到國內(nèi),并有教師開展了大膽探索,同樣也值得參考??梢哉f,相關研究和實踐已經(jīng)為學校層面基于核心素養(yǎng)的測評提供了一定參考和借鑒。
總之,核心素養(yǎng)時代的到來,對教師的評價素養(yǎng)提出了更高要求。我們當然不能完全否定考試的重要價值,但是我們也要充分意識到它的局限。教師應當站在發(fā)展學生核心素養(yǎng)的高度,積極探索基于核心素養(yǎng)的課堂教學,加強教師群體之間的合作、分享,在專業(yè)學習中提升自己的評估素養(yǎng),使日常評估真正起到“促進學生學習”的作用。
(作者單位:華東師范大學教育學部)