彭嬋娟
英格蘭連續(xù)幾屆在“國際學(xué)生評估項(xiàng)目”(Programme for International Student Assessment,PISA)中表現(xiàn)不佳,激發(fā)了民眾對基礎(chǔ)教育質(zhì)量的批判與不滿情緒,直接催化了新一輪國家課程及其評估體系改革。2014年9月,英格蘭以全球表現(xiàn)最佳的教育地區(qū)①全球表現(xiàn)最佳的教育地區(qū), 即英國語境下的“高績效地區(qū)”(High-performing Jurisdictions), 指的是在“國際學(xué)生評估項(xiàng)目”(PISA)、“國際數(shù)學(xué)與科學(xué)趨勢研究”(Trends in International Mathematics and Science Study, TIMSS)等國際測評項(xiàng)目中排名相對較高的司法管轄區(qū), 如中國的香港地區(qū)和上海地區(qū)、新加坡、芬蘭、澳大利亞、日本等。為參照基準(zhǔn),推出了要求更高的新國家課程,旨在為每一個(gè)孩子成功進(jìn)入下一階段的
學(xué)習(xí)提供知識技能準(zhǔn)備。①Department for Education. Primary Assessment in England: Equalities Impact Assessment[R]. London: DfE, 2017: 3.同時(shí),為監(jiān)控新版國家課程標(biāo)準(zhǔn)的實(shí)施和維持,英格蘭建立起相應(yīng)的法定評估框架,以確認(rèn)基礎(chǔ)教育階段的學(xué)生在何種程度上達(dá)到了國家課程中概述的成就目標(biāo)。作為基礎(chǔ)教育質(zhì)量監(jiān)測的較早實(shí)踐者,英格蘭國家課程評估體系變革引發(fā)了國內(nèi)外教育研究者和政策制定者的廣泛關(guān)注。英國學(xué)者普遍關(guān)注國家課程評估的歷史、目的、有效性和可靠性及其對課堂教學(xué)實(shí)踐的促進(jìn)作用。我國學(xué)者對英格蘭新國家課程評估的關(guān)注點(diǎn)則聚焦于政策演進(jìn)、政策內(nèi)容、政策研制方式及實(shí)施問題。研究表明,英格蘭于20世紀(jì)80年代末提出的詳盡而復(fù)雜的評估系統(tǒng),由于成就目標(biāo)體系過于繁雜且涉及教師工作量等巨大的問題,在實(shí)施過程中引發(fā)了教師工會的強(qiáng)烈抵制。為此,標(biāo)準(zhǔn)成就測驗(yàn)(Standard Attainment Tests,SATs)實(shí)現(xiàn)了從教師內(nèi)部評分的標(biāo)準(zhǔn)參考系統(tǒng)向代理機(jī)構(gòu)外部評分的考試系統(tǒng)的轉(zhuǎn)變。②Whetton C. A Brief History of a Testing Time: National Curriculum Assessment in England 1989-2008[J]. Educational Research, 2009, 51(2): 137-159.然而,英格蘭民眾對國家課程評估有效性的批評與爭議仍不曾間斷,如評估目標(biāo)過多以致無法實(shí)現(xiàn)所有目標(biāo)。③Newton P E. Clarifying the Purposes of Educational Assessment[J]. Assessment in Education: Principles, Policy & Practice,2007: 149-170.重總結(jié)性評估、輕形成性評估導(dǎo)致測驗(yàn)結(jié)果在改善課堂教學(xué)實(shí)踐上成效甚微。④Wiliam D, Ryan J. National testing and the improvement of classroom teaching: can they coexist?[J]. British educational research journal, 2000, 26(1): 49-73.測驗(yàn)結(jié)果更強(qiáng)調(diào)問責(zé)但對每個(gè)學(xué)生的實(shí)際影響非常有限,對測驗(yàn)結(jié)果的強(qiáng)調(diào)還導(dǎo)致教師評估的有效性被削弱。⑤Stobart G. The validity of national curriculum assessment[J]. British journal of educational studies, 2001, 49(1): 26-39.高風(fēng)險(xiǎn)的問責(zé)目的對學(xué)校和兒童施加了太大壓力,導(dǎo)致了課程范圍的縮小和“為了測驗(yàn)而教”。⑥Stobart G. Determining Validity in National Curriculum Assessments[J]. Educational Research, 2009, 51(2): 161-179.⑦Wiliam D. Education: The Meanings and Consequences of Educational Assessments[J]. The Critical Quarterly, 2000, 42(1): 105-127.2014年版國家課程評估體系在英格蘭引入之后,我國研究者在對其歷程、背景、內(nèi)容、理念、⑧李國棟, 夏惠賢. 為學(xué)生畢業(yè)后生活做更好的準(zhǔn)備—英國“2014國家課程”述評[J].比較教育研究, 2015, 37(09): 85-90.問題、⑨吳曉玲. 英格蘭中小學(xué)新國家課程與學(xué)業(yè)評價(jià)改革政策述評[J]. 外國教育研究, 2016, 43(04): 36-48.特征、趨勢等進(jìn)行綜合分析的基礎(chǔ)上,提出對我國中小學(xué)課程教學(xué)評價(jià)的啟示與建議,如大力推行課程教學(xué)評價(jià)的發(fā)展性目的、增強(qiáng)學(xué)校和教師在評價(jià)中的主體性、促進(jìn)評價(jià)方法的多元化、提高評價(jià)對象的全納性等。⑩李才靜. 英國國家課程評價(jià)的演變與發(fā)展趨勢—基于英國國家課程評價(jià)方案的分析[J]. 教師教育學(xué)報(bào), 2016, 3(04): 95-101.已有研究仍有一些尚未解答的新問題,包括:當(dāng)前英格蘭基礎(chǔ)教育階段法定評估的完整框架如何?英格蘭如何確?;A(chǔ)教育法定評估的有效實(shí)施?英格蘭基于國家課程的基礎(chǔ)教育評估體系一直以來存在哪些爭議點(diǎn)?因此,本文重點(diǎn)論述當(dāng)前英格蘭基礎(chǔ)教育法定評估的制度與政策安排,分析其實(shí)現(xiàn)路徑和面臨的爭議,以期對我國基礎(chǔ)教育評價(jià)改革提供思考和借鑒。
英格蘭基于國家課程的基礎(chǔ)教育評估與問責(zé)制度始于1988年7月29日通過的《教育改革法》(Education Reform Act 1988),該法案打破了長久以來地方當(dāng)局對教育的壟斷局面,擴(kuò)大了中央政府對課程的控制權(quán),其主要目的在于全面提高基礎(chǔ)教育質(zhì)量。自此,英格蘭建立起統(tǒng)一的國家課程,即義務(wù)教育階段學(xué)生都必須學(xué)習(xí)的課程,并要求在每個(gè)關(guān)鍵階段(Key Stage,以下簡稱KS)末期①1988年《教育改革法》將義務(wù)教育階段劃分為四個(gè)關(guān)鍵階段,包括關(guān)鍵階段1(簡稱KS1, 5—7歲,1—2年級), 關(guān)鍵階段2(簡稱KS2,7-11歲,3-6年級), 關(guān)鍵階段3(簡稱KS3,11—14歲,7—9年級),關(guān)鍵階段4(簡稱KS4,14—16歲,10—11年級),規(guī)定不同階段學(xué)生應(yīng)掌握的知識、技能和理解能力(即學(xué)習(xí)計(jì)劃),并以此為依據(jù)分別對7歲、11歲、14歲和16歲學(xué)生學(xué)習(xí)國家課程各個(gè)科目的情況進(jìn)行全國統(tǒng)一評定。對學(xué)生進(jìn)行評估,以確認(rèn)他們在該階段的預(yù)期成就目標(biāo)上達(dá)到了何種水平,并沿用至今。當(dāng)前,英格蘭僅在關(guān)鍵階段1(以下簡稱KS1)和關(guān)鍵階段2(以下簡稱KS2)結(jié)束的時(shí)候進(jìn)行法定評估,②自2009年以來,KS3末期的國家課程評估已被取消,而KS4末期的“中等教育普通證書(GCSE)”屬于由專門考試機(jī)構(gòu)所組織實(shí)施的資格證書考試,不屬于法定評估,因此也不在本文的討論范疇。旨在為教師和父母提供更準(zhǔn)確和可靠的信息,并實(shí)現(xiàn)對學(xué)校進(jìn)行問責(zé)的目的。除了1988年沿襲至今的KS1和KS2末期的國家課程評估以外,近年來英格蘭依據(jù)國家課程框架將“評估對象”進(jìn)行了延伸和下移,③李麗潔. 英國EYFS(2016): 注重早期教育與初等教育銜接的國家課程評價(jià)體系[J]. 當(dāng)代教育科學(xué), 2018(11): 84-89.當(dāng)前英格蘭基礎(chǔ)階段的學(xué)生還需要接受基準(zhǔn)評估、早期教育基礎(chǔ)階段評估、KS1中期的自然拼讀測試和KS2中期的乘法表測試等法定評估(見表1)。
表 1 英格蘭基礎(chǔ)教育階段法定評估框架
衡量學(xué)生的進(jìn)步(Progress Measure)在英格蘭教育系統(tǒng)的問責(zé)制中發(fā)揮著重要作用,它比單獨(dú)的學(xué)業(yè)成就評價(jià)更為公平。因?yàn)檫@種問責(zé)形式是一種增值評價(jià)方法,它將學(xué)生的成績與全國其他具有相同先驗(yàn)成就水平的學(xué)生成績進(jìn)行比較,“將關(guān)注點(diǎn)從靜態(tài)的絕對成績轉(zhuǎn)向了動態(tài)的成績提升程度”,①尤錚, 王璐. 英格蘭基礎(chǔ)教育增值評價(jià)的實(shí)施與效用探究[J]. 外國教育研究, 2019, 46(07): 42-53.從而提供了一種更利于衡量進(jìn)步與績效的評估工具。這一問責(zé)制度為那些擁有較高比例特殊需要學(xué)生的學(xué)校提供了一種“補(bǔ)償性正義”,使得學(xué)生起點(diǎn)低但成績?nèi)〉幂^大進(jìn)步的學(xué)??冃У玫匠姓J(rèn)。當(dāng)然,此類問責(zé)措施需要基準(zhǔn)來確定學(xué)生的起點(diǎn),以衡量與全國其他起點(diǎn)相近的學(xué)生相比,某一所學(xué)校的學(xué)生在某一階段末期的平均表現(xiàn)如何。因此,基準(zhǔn)必須可靠且值得信賴,并且應(yīng)在學(xué)生入學(xué)后盡早進(jìn)行,以涵蓋學(xué)生在特定學(xué)校中的最大時(shí)間。當(dāng)前英格蘭在KS1末期(小學(xué)二年級)和KS2末期(小學(xué)六年級)之間建立起基于標(biāo)準(zhǔn)分(Scaled Scores)和增值評價(jià)的評估制度,即以KS1末期的國家課程評估結(jié)果作為基準(zhǔn)衡量KS2末期學(xué)生取得的進(jìn)步。但英格蘭這一基準(zhǔn)使得學(xué)生在小學(xué)預(yù)備班(Reception Year)至小學(xué)二年級之間取得的進(jìn)步無法反映在問責(zé)制中,還可能導(dǎo)致學(xué)校產(chǎn)生一種不正當(dāng)?shù)膭訖C(jī),即不將資源集中在早期干預(yù)上,以便最大程度地提升學(xué)生在KS1末期至KS2末期之間的進(jìn)步增值。②Department for Education. Primary Assessment and Accountability under the New National Curriculum[R]. London: DfE, 2013:16.因此,英格蘭在廣泛征詢利益相關(guān)者意見后,決定在2019—2020學(xué)年進(jìn)行大規(guī)模試點(diǎn)之后,于2020年9月起引入新的基準(zhǔn)評估(Baseline Assessments),即在小學(xué)預(yù)備班進(jìn)行新的法定基準(zhǔn)評估,以此作為增值評價(jià)的起點(diǎn)。
英格蘭計(jì)劃讓符合條件的學(xué)校學(xué)生在小學(xué)預(yù)備班入學(xué)之后的六周內(nèi)參加數(shù)學(xué)、識字、交流和發(fā)展等方面的評估。評估的結(jié)果將作為起點(diǎn),了解學(xué)生從剛?cè)雽W(xué)到KS2末期取得的進(jìn)步。值得注意的是,評估的數(shù)據(jù)不會被用來判斷和評價(jià)個(gè)別學(xué)生,每個(gè)兒童與學(xué)校的結(jié)果也不會公布。相反,只有在7年后,當(dāng)學(xué)生達(dá)到KS2末期時(shí),它才會被用于建立學(xué)校層面的平均進(jìn)步指標(biāo)③學(xué)校層面的平均進(jìn)步指標(biāo)是基于每個(gè)學(xué)生在各科目上的進(jìn)步分?jǐn)?shù)計(jì)算出來的均值. 計(jì)算步驟如下:第一步是根據(jù)KS1末期的測驗(yàn)結(jié)果將全國所有學(xué)生分配到先驗(yàn)成就組(Prior Attainment Group),以便擁有彼此起點(diǎn)相近的學(xué)生群體;第二步是確定學(xué)生KS2末期的測驗(yàn)結(jié)果;第三步是計(jì)算每個(gè)學(xué)生的進(jìn)步分?jǐn)?shù),即計(jì)算他們KS2末期的成績與先前成就組的平均成績之間的差異。例如如果Emily在KS2末期的閱讀成績?yōu)?02分,而她所在先驗(yàn)成就組的KS2平均閱讀成績?yōu)?01分,那么她的進(jìn)步分?jǐn)?shù)將為+1;第四步是創(chuàng)建一個(gè)學(xué)校層面的進(jìn)步分?jǐn)?shù),即把所有六年級學(xué)生的進(jìn)步分?jǐn)?shù)相加,除以學(xué)校六年級學(xué)生的人數(shù)。(Average Progress Measures)。④Department for Education. Primary Assessment in England: Equalities Impact Assessment[R]. London: DfE, 2017: 12.此外,英格蘭初步計(jì)劃,一旦完全建立起新的基準(zhǔn)評估,將不再需要KS1末期的評估數(shù)據(jù)來衡量學(xué)生所取得的進(jìn)步,因此可能將于2022—2023學(xué)年結(jié)束KS1末期的法定國家課程評估,將其變更為非法定評估。即英格蘭將在KS1末期繼續(xù)提供可選擇的非法定測驗(yàn),以供學(xué)校視需要使用,用于確定學(xué)生需要獲得更多支持的領(lǐng)域,以及確保家長在小學(xué)階段的中期繼續(xù)獲得有關(guān)孩子成績和進(jìn)步的詳細(xì)信息。①Department for Education. Primary Assessment in England: Equalities Impact Assessment[R]. London: DfE, 2017: 13.
為促進(jìn)早期教育與初等教育的銜接,英格蘭將國家法定評估的對象下移到早期教育末期的全體兒童,于2008年9月起開始實(shí)施早期教育基礎(chǔ)階段評估,并以此作為小學(xué)一年級教師制訂有效課程和學(xué)習(xí)計(jì)劃的依據(jù)。也就是說,在早期教育階段的末期,通常是孩子達(dá)到5歲那一年的最后一個(gè)學(xué)期,從業(yè)者和教師將依據(jù)表2所述的早期教育基礎(chǔ)階段法定框架,基于每位孩子的日?;顒雍捅憩F(xiàn)對他們的發(fā)展水平進(jìn)行評估,并完成早期教育基礎(chǔ)階段報(bào)告(Early Years Foundation Stage Profile,以下簡稱EYFSP),總結(jié)并描述兒童的發(fā)展和學(xué)習(xí)狀況。具體來看,EYFS法定框架設(shè)定了早期學(xué)習(xí)的七大目標(biāo)(包含三大基本能力和四大專業(yè)能力),規(guī)定了兒童從出生到5歲期間發(fā)育、學(xué)習(xí)和受照料的法定標(biāo)準(zhǔn),確保兒童擁有健康、安全和快樂的童年,以及擁有廣泛的知識、廣泛的技能和理解能力,從而為順利進(jìn)入下一階段的教育作好準(zhǔn)備。評估結(jié)果具體分為三個(gè)等級,即達(dá)到預(yù)期發(fā)展水平,超出預(yù)期水平,以及尚未達(dá)到預(yù)期水平。教育部(Department for Education,簡稱DfE)執(zhí)行機(jī)構(gòu)——標(biāo)準(zhǔn)與測試局(Standards and Testing Agency,簡稱STA)負(fù)責(zé)EYFSP法定評估的開發(fā)和實(shí)施,并確保經(jīng)過嚴(yán)格校準(zhǔn)程序(Moderation)的評估結(jié)果是可靠的。EYFSP法定評估體現(xiàn)了英格蘭注重早期干預(yù)和早期評估的理念,其重點(diǎn)強(qiáng)調(diào):確保早期教育環(huán)境的質(zhì)量和一致性,以便每個(gè)孩子都能取得良好的進(jìn)步,并且不會讓任何孩子掉隊(duì);通過早期教育階段的學(xué)習(xí)和發(fā)展機(jī)會為每個(gè)孩子的需求和興趣打下良好基礎(chǔ),并進(jìn)行定期評估和審查;建立從業(yè)者、父母以及看護(hù)者之間的伙伴關(guān)系;踐行機(jī)會均等和反歧視原則,確保每個(gè)兒童都得到包容和支持。①Department for Education. Statutory Framework for the Early Years Foundation Stage[R]. London: DfE, 2017: 5-14.
表 2 EYFS法定框架:目標(biāo)及內(nèi)容
在英格蘭,所有由政府資助的基礎(chǔ)教育階段公立學(xué)校②公立學(xué)校指的是受政府資助的學(xué)校,通常指的是政府資助學(xué)校(Maintained Schools)、特殊學(xué)?;?qū)W院(包括自由學(xué)校);獨(dú)立學(xué)校(Independent School)則采取自愿的原則,自主決定是否參與統(tǒng)一國家課程測驗(yàn)。都必須按照國家課程框架進(jìn)行教學(xué)。英格蘭具體列出了各關(guān)鍵階段所有學(xué)科的法定學(xué)習(xí)計(jì)劃及其成就目標(biāo)。所有符合條件的學(xué)生在KS1結(jié)束之際都要參加國家課程評估(National Curriculum Assessments),包括標(biāo)準(zhǔn)成就測驗(yàn)(Standard Attainment Tests,通常被稱為SATs)和教師評估(Teacher Assessment,簡稱TA),以及KS1中期的自然拼讀測試(Phonics Screening Check)。
1. 標(biāo)準(zhǔn)成就測驗(yàn)(SATs)
標(biāo)準(zhǔn)成就測驗(yàn),也被稱為國家課程測驗(yàn)(National Curriculum Test),旨在衡量學(xué)生對關(guān)鍵階段學(xué)習(xí)計(jì)劃的認(rèn)識和理解。KS1末期的SATs通常在5月份統(tǒng)一進(jìn)行。其中,英語閱讀測驗(yàn)和數(shù)學(xué)測驗(yàn)是學(xué)校按照國家法定程序統(tǒng)一進(jìn)行的,英語語法、標(biāo)點(diǎn)和拼寫測驗(yàn)(Optional English Grammar, Punctuation and Spelling Test)則是學(xué)??梢宰灾鬟x擇的非法定評估。
(1)英語閱讀測驗(yàn)。測驗(yàn)主要分為兩份卷子,均由難度逐漸提高、類型多樣的精選文本組成。其中測驗(yàn)1由閱讀提示和答題冊組成,測試時(shí)間大約需要30分鐘(400—700字閱讀材料),但沒有嚴(yán)格的時(shí)間限制,總分20分;測驗(yàn)2由閱讀冊和單獨(dú)的答題冊組成,包含比測驗(yàn)1更具挑戰(zhàn)性的文本(約800—1 100字),測試大約需要40分鐘,時(shí)間同樣具有靈活性,總分20分。
(2)英語語法、標(biāo)點(diǎn)和拼寫測驗(yàn)。測驗(yàn)分為兩個(gè)部分:測驗(yàn)1是拼寫題,由供測試官朗讀的材料和供學(xué)生拼寫20個(gè)單詞的答案冊組成,測驗(yàn)大概需要15分鐘,總分20分;測驗(yàn)2是一本綜合答卷,著重于評估學(xué)生對語法、標(biāo)點(diǎn)和詞匯的掌握情況,總分20分,測驗(yàn)大約需要20分鐘,時(shí)間同樣可靈活處理。
(3)數(shù)學(xué)測驗(yàn)。測驗(yàn)包含兩個(gè)部分,以兩份測驗(yàn)的形式呈現(xiàn)給學(xué)生。測驗(yàn)1是算數(shù)題,旨在評估學(xué)生在整數(shù)、進(jìn)位制和計(jì)數(shù)方面的學(xué)習(xí)情況,大約需要20分鐘完成,總計(jì)25分;測驗(yàn)2為推理題,旨在評估學(xué)生解決數(shù)學(xué)問題和進(jìn)行數(shù)學(xué)推理的能力,總計(jì)35分,大約需要35分鐘,時(shí)間均不嚴(yán)格。
2. 教師評估
除國家課程測驗(yàn)之外,KS1末期的學(xué)生還需要接受教師評估。教師必須根據(jù)教師評估框架(TA Frameworks)、關(guān)鍵階段前標(biāo)準(zhǔn)(Pre-key Stage Standards)或者P級法定指南(P Scale Statutory Guidance)①關(guān)鍵階段前標(biāo)準(zhǔn)適用于低于國家課程評估總體標(biāo)準(zhǔn)但參與特定學(xué)科學(xué)習(xí)的學(xué)生;P級量表規(guī)定了5—16歲有特殊需要的學(xué)生應(yīng)該達(dá)到的成績目標(biāo)和指標(biāo),這些學(xué)生的學(xué)習(xí)水平低于國家課程測驗(yàn)和評估的標(biāo)準(zhǔn),且尚未開始特定學(xué)科的學(xué)習(xí)。中規(guī)定的標(biāo)準(zhǔn),基于學(xué)生的平時(shí)表現(xiàn)以及SATs成績,對每個(gè)學(xué)生的英語閱讀、英語寫作以及數(shù)學(xué)和科學(xué)的學(xué)習(xí)情況作出評估。其中,TA框架具體規(guī)定了在KS1結(jié)束時(shí)學(xué)生必須達(dá)到的標(biāo)準(zhǔn),教師必須遵循框架中規(guī)定的關(guān)于每門科目的具體指導(dǎo)來作出判斷。例如,在科學(xué)科目上,TA框架僅包含一個(gè)標(biāo)準(zhǔn),即達(dá)到預(yù)期標(biāo)準(zhǔn)。因此,完成KS1學(xué)習(xí)計(jì)劃的學(xué)生將被判定為“達(dá)到預(yù)期標(biāo)準(zhǔn)”或“未達(dá)到預(yù)期標(biāo)準(zhǔn)”。而在英語閱讀、英語寫作和數(shù)學(xué)科目上,TA框架則包含3個(gè)級別,即接近預(yù)期標(biāo)準(zhǔn)、達(dá)到預(yù)期標(biāo)準(zhǔn)以及達(dá)到更高標(biāo)準(zhǔn)。另外,對于在英語閱讀、英語寫作和數(shù)學(xué)科目上尚未達(dá)到預(yù)期標(biāo)準(zhǔn)的學(xué)生,教師將使用關(guān)鍵階段前的標(biāo)準(zhǔn)進(jìn)行評估,具體分為四個(gè)等級,即標(biāo)準(zhǔn)1—4。最后,如果學(xué)生有特殊教育需求,學(xué)習(xí)水平低于國家課程評估的標(biāo)準(zhǔn),且尚未參與具體學(xué)科的學(xué)習(xí),則應(yīng)使用P級1—4的標(biāo)準(zhǔn)進(jìn)行法定評估。②Standards & Testing Agency. Key Stage 1 Assessment and Reporting Arrangements[R]. Coventry: STA, 2019: 34-36.
3. 自然拼讀測試
在KS1階段的中期,所有公立學(xué)校一年級(6歲)兒童都必須接受自然拼讀測試。測驗(yàn)由20個(gè)真詞(Real Words)和20個(gè)假詞(Pseudo-words)組成,學(xué)生可以大聲朗讀給施測者聽,并由教師根據(jù)指導(dǎo)手冊進(jìn)行評分。通過自然拼讀測試可以評估學(xué)生是否達(dá)到預(yù)期標(biāo)準(zhǔn)的語音解碼能力,該能力是學(xué)生閱讀和拼寫所需的基本能力。如果有學(xué)生沒有達(dá)到預(yù)期的標(biāo)準(zhǔn),學(xué)校將確保他們獲得額外的適當(dāng)支持,并在下一年度重新參與測試。國家層面和地方當(dāng)局層面的結(jié)果會公布,但是不會公布學(xué)校層面的數(shù)據(jù),校長還必須向家長報(bào)告他們孩子的自然拼讀測試成績。③Standards & Testing Agency. Key Stage 1 Assessment and Reporting Arrangements[R]. Coventry: STA, 2019: 28-33.自然拼讀測試可以幫助學(xué)校和教師及時(shí)發(fā)現(xiàn)存在解碼障礙的學(xué)生并盡早干預(yù),以幫助解決或緩解學(xué)生在閱讀方面的困難,這進(jìn)一步體現(xiàn)了英格蘭注重早期評估和盡早支持的理念。
在關(guān)鍵階段2結(jié)束的時(shí)候,也就是六年級的5月份,英格蘭需要對在公立學(xué)校注冊的學(xué)生進(jìn)行評估,包括SATs和教師評估,以檢查學(xué)生在國家課程學(xué)習(xí)計(jì)劃上的完成情況。在KS2中期,英格蘭還對全體學(xué)生進(jìn)行乘法表測試(Multiplication Tables Check,簡稱MTC)。
1. 標(biāo)準(zhǔn)成就測驗(yàn)(SATs)
在KS2末期,公立學(xué)校的學(xué)生需要參加三個(gè)標(biāo)準(zhǔn)成就測驗(yàn):英語閱讀,英語語法、標(biāo)點(diǎn)和拼寫,數(shù)學(xué)。在科學(xué)科目上,英格蘭每兩年對選定的學(xué)生樣本進(jìn)行一次抽測,由外部管理人員在選定的學(xué)校中進(jìn)行,以監(jiān)控國家科學(xué)科目的成績表現(xiàn)。
(1)英語閱讀測驗(yàn)。測驗(yàn)包含多種類型的閱讀文本。測驗(yàn)以難度逐漸增加的形式來設(shè)計(jì)。試題包含閱讀冊和單獨(dú)的答題冊兩個(gè)部分,學(xué)生有一個(gè)小時(shí)的時(shí)間閱讀3篇文章并完成相應(yīng)問題,總計(jì)50分。
(2)英語語法、標(biāo)點(diǎn)和拼寫測驗(yàn)。測驗(yàn)包含兩份試卷:第一份是一本問答冊,學(xué)生有45分鐘的時(shí)間回答問題,總計(jì)50分;第二份是拼寫試卷,由供測驗(yàn)實(shí)施者閱讀的材料和答題冊組成,學(xué)生在答題冊上拼寫20個(gè)單詞,測驗(yàn)大致需要15分鐘,但沒有嚴(yán)格的計(jì)時(shí),總計(jì)20分。
(3)數(shù)學(xué)測驗(yàn)。數(shù)學(xué)測驗(yàn)側(cè)重于國家數(shù)學(xué)課程中可評估的要素,包括算數(shù)和推理兩部分,以3份試卷的形式呈現(xiàn)給學(xué)生。試卷1主要評估內(nèi)容是算術(shù),學(xué)生有30分鐘回答問題,總計(jì)40分。試卷2和3側(cè)重評估推理,對于每份試卷學(xué)生將有40分鐘回答問題,分值都是35分。
(4)科學(xué)抽測??茖W(xué)抽測每兩年進(jìn)行一次,由外部管理人員在選定的學(xué)校中進(jìn)行。測驗(yàn)以紙筆考試的形式進(jìn)行,結(jié)束后將進(jìn)行外部評分。最近的一次科學(xué)抽測原計(jì)劃①由于新冠病毒(COVID-19)的全球肆虐,英格蘭取消了2019—2020年度的國家課程評估。這意味著2020年4月至7月間的KS1和KS2評估(包括SATs和教師評估)、自然拼讀測試、乘法表檢查和科學(xué)抽測等都被取消。由于2020年12月底至2021年1月初英國新型冠狀病毒病例數(shù)的迅速攀升,教育大臣加文·威廉姆森(Gavin Williamson)宣布2021年的上述測驗(yàn)也將被取消。于2020年6月進(jìn)行,屆時(shí)STA將在4月27日通知被選定的1900所學(xué)校,并將從每所學(xué)校中選出5名學(xué)生代表,即大約隨機(jī)抽取9 500名學(xué)生作為代表性樣本參與科學(xué)測驗(yàn)。科學(xué)測驗(yàn)具體包括三份試卷,每份試卷的完成時(shí)間不超過25分鐘。②Standards & Testing Agency. Key Stage 2 Assessment and Reporting Arrangements[R]. Coventry: STA, 2019: 47.
2. 教師評估
與KS1相同的是,在KS2結(jié)束時(shí)學(xué)校同樣需要報(bào)告英語寫作和科學(xué)等科目的教師評估。即教師需要根據(jù)TA框架、KS2前標(biāo)準(zhǔn)(Pre-key Stage 2 Standards)或P級法定指南中規(guī)定的標(biāo)準(zhǔn),基于學(xué)生平時(shí)課堂和作業(yè)上的表現(xiàn),對每個(gè)符合條件的學(xué)生作出評估。其中,TA框架具體規(guī)定了在KS2結(jié)束時(shí)學(xué)生必須達(dá)到的標(biāo)準(zhǔn),教師必須遵循框架中規(guī)定的關(guān)于每門科目的具體指導(dǎo)來作出判斷。具體來看,英語寫作框架包含三個(gè)級別的標(biāo)準(zhǔn),即接近預(yù)期標(biāo)準(zhǔn)、達(dá)到預(yù)期標(biāo)準(zhǔn)和達(dá)到更高標(biāo)準(zhǔn)。KS2科學(xué)框架僅包含一個(gè)標(biāo)準(zhǔn),即達(dá)到預(yù)期標(biāo)準(zhǔn),也就是說,完成學(xué)習(xí)計(jì)劃的學(xué)生將被判定為“達(dá)到預(yù)期標(biāo)準(zhǔn)”或“未達(dá)到預(yù)期標(biāo)準(zhǔn)”。在KS2結(jié)束時(shí),對于低于國家課程評估總體標(biāo)準(zhǔn)并參與具體科目學(xué)習(xí)的學(xué)生,必須使用KS2前標(biāo)準(zhǔn)對學(xué)生的英語閱讀、英語寫作和數(shù)學(xué)科目進(jìn)行法定評估。該標(biāo)準(zhǔn)遵循與TA框架相同的原則,具體包含標(biāo)準(zhǔn)1—6個(gè)不同的等級。另外,如果學(xué)生有特殊教育需求,且學(xué)習(xí)水平低于KS2前標(biāo)準(zhǔn),則應(yīng)使用P級1—4的標(biāo)準(zhǔn)對未參與具體學(xué)科學(xué)習(xí)的學(xué)生進(jìn)行法定評估。①Standards & Testing Agency. Key Stage 2 Assessment and Reporting Arrangements[R]. Coventry: STA, 2019: 35-36.
3. 乘法表測試
除了最重要的KS2末期的標(biāo)準(zhǔn)成就測驗(yàn)和教師評估以外,KS2中期的學(xué)生還需要接受乘法表測試。從2019—2020學(xué)年開始,英格蘭在六月對公立學(xué)校的所有四年級末學(xué)生進(jìn)行法定乘法表測試,教師可以采取靈活的方式同時(shí)對學(xué)生個(gè)人、小組或全班進(jìn)行檢查。測試以在線方式(使用連網(wǎng)的計(jì)算機(jī)或平板電腦等IT設(shè)備)進(jìn)行并自動計(jì)分,每題限時(shí)6秒鐘,每兩題之間有3秒鐘的停頓,共計(jì)25題,總時(shí)間不超過5分鐘,一旦測試窗口關(guān)閉,學(xué)校就可以獲得結(jié)果。MTC的目的是確定四年級的學(xué)生是否可以流利地回憶乘法表,這被認(rèn)為是將來在數(shù)學(xué)科目上取得成功的關(guān)鍵。該測驗(yàn)將幫助學(xué)校識別那些還沒有掌握乘法表的學(xué)生,以便提供額外的支持。
英格蘭自1988年建立起來的國家課程及其法定評估制度,旨在保障所有學(xué)生能夠接受廣泛而均衡的教育,而不受地域、學(xué)校、社會經(jīng)濟(jì)狀況的影響,并使得學(xué)生的學(xué)業(yè)成就在全國范圍內(nèi)可衡量且可比較??偟膩碚f,英格蘭基礎(chǔ)教育法定評估的推進(jìn)路徑可以總結(jié)為以下幾點(diǎn)。
英格蘭已經(jīng)建立起從中央到地方,涵蓋獨(dú)立監(jiān)管機(jī)構(gòu)、政府執(zhí)行部門、第三方評價(jià)機(jī)構(gòu)、學(xué)校等不同主體的組織機(jī)構(gòu)框架,全面負(fù)責(zé)和監(jiān)督法定評估工作的有效進(jìn)行。具體地看:(1)教育部的各個(gè)部門,主要負(fù)責(zé)制定國家評估有關(guān)政策。其中,教育大臣負(fù)責(zé)制定課程并決定是否需要進(jìn)行何種國家評估。教育部的執(zhí)行機(jī)構(gòu)——標(biāo)準(zhǔn)與測試局(STA)作為主要負(fù)責(zé)機(jī)構(gòu),負(fù)責(zé)早期教育到KS2國家課程測驗(yàn)的開發(fā)、實(shí)施以及標(biāo)準(zhǔn)的制定和維持,并受資格和考試管理辦公室(Office of Qualifications and Examinations Regulation,簡稱Ofqual)監(jiān)管。STA的具體職責(zé)包括:負(fù)責(zé)KS1和KS2英語、數(shù)學(xué)、科學(xué)等核心科目測驗(yàn)的編制、印刷、分發(fā)、評分等具體事宜;確保測驗(yàn)結(jié)果的準(zhǔn)確性和可靠性,處理與國家評估有關(guān)的結(jié)果復(fù)核申請以及質(zhì)詢和投訴;收集法定教師評估數(shù)據(jù);通過對地方當(dāng)局的監(jiān)督審查,確保教師評估結(jié)果的一致性和準(zhǔn)確性;與供應(yīng)商或第三方實(shí)體評價(jià)機(jī)構(gòu)訂立合同或達(dá)成協(xié)議,另外參與測驗(yàn)的開發(fā)、編制以及印刷和評分等具體流程,并負(fù)責(zé)確保其評估安排的有效性。此外,教育部還負(fù)責(zé)對結(jié)果和績效表的公布。(2)Ofqual和Ofsted擔(dān)任“監(jiān)督員”的角色,負(fù)責(zé)對國家評估的有效性進(jìn)行監(jiān)督和審查。其中,Ofqual作為獨(dú)立的法定監(jiān)管機(jī)構(gòu),全面負(fù)責(zé)英格蘭早期教育基礎(chǔ)階段評價(jià)和國家課程評估的監(jiān)管工作。Ofqual的法定目標(biāo)是提高標(biāo)準(zhǔn)以及公眾對國家評估的信心,其主要職責(zé)是對國家評估的各個(gè)方面進(jìn)行審查,以監(jiān)控、審查并報(bào)告國家評估的有效性,確保STA評分的質(zhì)量。負(fù)責(zé)督導(dǎo)中小學(xué)或早期教育機(jī)構(gòu)的教育、兒童服務(wù)和技能標(biāo)準(zhǔn)辦公室(Office for Standards in Education, Children’s Services and Skills,簡稱Ofsted)也需要考慮國家評估的有效性和公信力等相關(guān)問題。(3)地方當(dāng)局對國家評估負(fù)有一系列法定責(zé)任。地方當(dāng)局必須:監(jiān)控國家課程測驗(yàn)的實(shí)施,確保評估按照預(yù)訂的國家統(tǒng)一流程和要求進(jìn)行;審核學(xué)校和早期教育機(jī)構(gòu)教師評估的準(zhǔn)確性和一致性;從學(xué)校收集教師評估的結(jié)果,并將其統(tǒng)一交給STA。此外,學(xué)校的管理機(jī)構(gòu)、校長,早期教育機(jī)構(gòu)、學(xué)院信托等相關(guān)機(jī)構(gòu)及其管理人員,也需要負(fù)責(zé)國家評估的執(zhí)行、管理與監(jiān)督工作。①Ofqual. Regulatory Framework for National Assessments[R]. Coventry: Ofqual, 2018: 3-5.
為了保證國家課程評估的質(zhì)量及其所蘊(yùn)含多元目標(biāo)的實(shí)現(xiàn),英格蘭建立起清晰明確的五維評價(jià)原則,即必須保證測驗(yàn)的效度、信度、可比性、公平性和可管理性等重要原則。具體表現(xiàn)為:(1)保證測驗(yàn)的效度。效度指的是在測驗(yàn)開發(fā)過程中收集的證據(jù)在多大程度上是支持測驗(yàn)預(yù)期測量的。英格蘭擁有明確的程序來審查評估方法、評估內(nèi)容和評估目的,以衡量測驗(yàn)是否能夠衡量國家課程相關(guān)領(lǐng)域的表現(xiàn),以及是否對學(xué)生所達(dá)到的學(xué)業(yè)水平進(jìn)行了充分有效的評估。(2)保證測驗(yàn)的信度。信度表示的是測驗(yàn)分?jǐn)?shù)的可靠性、一致性或無隨機(jī)測量誤差。英格蘭通過不同的統(tǒng)計(jì)數(shù)據(jù)來衡量測驗(yàn)的信度,旨在測量測驗(yàn)的有效性以及評分的一致性。(3)保證測驗(yàn)的可比性。英格蘭每年都在測驗(yàn)編制過程中使用相同的測驗(yàn)框架,以保證不同年份的評估之間的可比性。例如,在測驗(yàn)編制過程中使用錨測驗(yàn)或錨題將每個(gè)技術(shù)預(yù)測驗(yàn)(Technical Pre-test,簡稱TPT)②技術(shù)預(yù)測驗(yàn),是測驗(yàn)開發(fā)過程中所進(jìn)行的大規(guī)模預(yù)測驗(yàn),目的是收集詳細(xì)可靠的統(tǒng)計(jì)數(shù)據(jù),以幫助支持最終的測驗(yàn)開發(fā)。和實(shí)際測驗(yàn)等同起來,從而確保了2016年之后每一年測驗(yàn)結(jié)果的可比性。(4)保證測驗(yàn)的公平性。在整個(gè)測驗(yàn)編制過程中,對測驗(yàn)中的所有問題進(jìn)行審查,以最大程度地減少偏見,保證僅根據(jù)每個(gè)學(xué)生的學(xué)業(yè)水平進(jìn)行評估,而不受其他無關(guān)因素的不利影響。具體包括來自全納小組(Inclusion Panels)的反饋,以及在數(shù)據(jù)分析過程中對項(xiàng)目功能差異(Differential Item Functioning,簡稱DIF)③“項(xiàng)目功能差異”是一種旨在表明同一水平的不同學(xué)生群體對某一項(xiàng)目的正確率是否相同的統(tǒng)計(jì)數(shù)據(jù)。的監(jiān)控。英格蘭還為學(xué)生提供了一整套的特殊測試安排和修改版測驗(yàn),以確保學(xué)生不受歧視、公平地進(jìn)行測試。(5)具有可管理性。對相關(guān)人員而言,評估應(yīng)該是可管理和可實(shí)施的,應(yīng)該向?qū)W校以及參與評估的其他機(jī)構(gòu)提供必要的信息,以保證評估及時(shí)有效地準(zhǔn)備和實(shí)施。國家課程測驗(yàn)的實(shí)施要遵循KS1和KS2的既定安排,按照正常時(shí)間表實(shí)施測驗(yàn)相關(guān)管理工作。④Standards & Testing Agency. National Curriculum Test Handbook: 2018[R]. Coventry: STA, 2018: 62-64.
英格蘭采用的是基于標(biāo)準(zhǔn)參照的評價(jià)模式,即要求在各個(gè)關(guān)鍵階段末期評估學(xué)生在何種程度上達(dá)到了國家課程中統(tǒng)一設(shè)定的關(guān)于各個(gè)學(xué)科的成就目標(biāo)。同時(shí),英格蘭還具有嚴(yán)格的程序來保證評估工具的信度、效度以及可比性,從而使得全國范圍內(nèi)客觀有效的學(xué)生學(xué)業(yè)成就評價(jià)成為可能。例如,國家課程測驗(yàn)的編制、實(shí)施與評分遵循嚴(yán)格的框架和流程,其中KS2測驗(yàn)由外部獨(dú)立第三方機(jī)構(gòu)進(jìn)行管理和評分,并由STA負(fù)責(zé)確保評分過程以標(biāo)準(zhǔn)化、專業(yè)化和可靠的方式進(jìn)行。此外,標(biāo)準(zhǔn)統(tǒng)一、程序嚴(yán)格的法定評估系統(tǒng)背后還蘊(yùn)含著多重目的。具體來看,首先,國家課程評估的結(jié)果可以用于讓學(xué)校對學(xué)生的成就和進(jìn)步負(fù)責(zé)。法定評估所提供的針對不同學(xué)生群體的的成績和進(jìn)步信息,可以幫助中央和地方政府、公眾以及家長了解學(xué)校的表現(xiàn)。其次,結(jié)果可用于告知家長和學(xué)校關(guān)于每個(gè)學(xué)生的表現(xiàn)。國家課程評估的結(jié)果可以幫助學(xué)校和教師更清楚地了解學(xué)生在整個(gè)學(xué)習(xí)階段所遇到的困難和挑戰(zhàn),從而提供更適當(dāng)和及時(shí)的支持,同時(shí)也有助于家長更有針對性地幫助孩子在需要關(guān)注的領(lǐng)域?qū)崿F(xiàn)提升。最后,全國范圍內(nèi)的數(shù)據(jù)還有助于在學(xué)校之間建立基準(zhǔn),并在本地和全國范圍內(nèi)監(jiān)控績效。國家課程評估使得學(xué)校有機(jī)會將自己與當(dāng)?shù)匾约叭珖骄竭M(jìn)行比較。對于地方政府以及中央政府而言,使用相關(guān)數(shù)據(jù)則可以監(jiān)控地方乃至全國范圍內(nèi)國家課程框架的實(shí)施情況。
為使所有學(xué)生都能夠沒有障礙、不受歧視地參與國家課程評估,英格蘭非常關(guān)注平等性和包容性原則,設(shè)定了諸多針對特殊需要學(xué)生的特別安排。例如,為適應(yīng)特殊需要學(xué)生的需求,STA為有重度視力障礙的學(xué)生設(shè)計(jì)了放大版(Enlarged Print,EP)、修改過的放大版(Modified Large Print,MLP)和盲文版等不同版本的KS2測驗(yàn)。其中,EP版本以更大的版面制作,試題冊以及所有的文本、圖片和非比例圖表均大于標(biāo)準(zhǔn)版本;MLP版本也采用較大的版面,但是存在更多的空白處,且有些圖用高對比度的設(shè)計(jì)來代替,或者需要使用實(shí)體模型;盲文版則專門為視力極差或盲人學(xué)生所設(shè)計(jì),圖以觸覺格式或?qū)嶓w模型呈現(xiàn)。
此外,針對有特殊需要的學(xué)生,英格蘭還采取了一個(gè)獨(dú)立的評估等級體系來對這些兒童的學(xué)習(xí)情況進(jìn)行評估。教師使用P級評價(jià)指南對成績目標(biāo)低于國家課程測驗(yàn)標(biāo)準(zhǔn)且未參與特定學(xué)科學(xué)習(xí)的學(xué)生進(jìn)行評估。并且,英格蘭開始越來越關(guān)注特殊需要學(xué)生的多樣化需求,并逐漸意識到根據(jù)國家課程評估來衡量這部分學(xué)生的表現(xiàn)是不合適的,即便是P級評價(jià)。因此,2018年11月,教育部宣布從2020年開始采用新的基于“參與度”(Aspects of Engagement)的方法來評估有特殊需要的學(xué)生。也就是說,針對未參與特定學(xué)科學(xué)習(xí)的學(xué)生,對他們的評估將集中在認(rèn)知和學(xué)習(xí)方面,具體包括反應(yīng)力、好奇心、發(fā)現(xiàn)、期待、堅(jiān)持、啟蒙以及探究等七個(gè)方面。①Roberts N. Assessment and Testing in Primary Education (England)[R]. House of Commons Library, 2020: 7.
自20世紀(jì)80年代以來,標(biāo)準(zhǔn)化評估儼然已成為一些OECD國家教育改革的關(guān)鍵工具,并被作為一種政治工具以實(shí)現(xiàn)“中央或聯(lián)邦當(dāng)局與地方當(dāng)局之間權(quán)力平衡的轉(zhuǎn)移,大大降低自治程度”以及“強(qiáng)化學(xué)校對普通公眾的責(zé)任制”。在此背景下,英格蘭進(jìn)一步制定了更為嚴(yán)苛的基礎(chǔ)教育評估制度,該制度既被視為有效的“教育系統(tǒng)監(jiān)測工具”又被作為“提高學(xué)生表現(xiàn)的教學(xué)工具”,其背后隱含的邏輯理念是“考試制度的發(fā)展必然促進(jìn)整個(gè)教育系統(tǒng)的績效提升,特別是能夠改善學(xué)生的學(xué)習(xí)成績”。①M(fèi)ons N. Theoretical and Real Effects of Standardized Assessment[R]. Eurydice Network, 2009: 5-7.然而,有意思的是,芬蘭等在PISA中表現(xiàn)優(yōu)異的國家并沒有建立起基于高風(fēng)險(xiǎn)考試制度(High-stakes Testing)的“嚴(yán)格問責(zé)”模型(Hard Accountability Model)。相反,英格蘭所建立起來的基礎(chǔ)教育法定評估體系對課堂教學(xué)以及學(xué)生發(fā)展的成效甚微,②Stobart G. The Validity of National Curriculum Assessment[J]. British Journal of Educational Studies, 2001, 49(1): 26-39.這種嚴(yán)格的外部問責(zé)機(jī)制還在國家內(nèi)部引發(fā)了一股抵制之風(fēng)。
盡管目前英格蘭僅對KS1和KS2末期的學(xué)生進(jìn)行標(biāo)準(zhǔn)成就測驗(yàn),且最終結(jié)果主要用于對學(xué)校進(jìn)行問責(zé),并不對外公布每個(gè)學(xué)生的成績,但公眾對國家基礎(chǔ)教育評估制度的抗議之聲仍不絕于耳,他們普遍認(rèn)為這些測驗(yàn)給學(xué)生施加了太大的壓力。特別是,隨著評價(jià)呈現(xiàn)出的越來越低齡化的趨勢,公眾對幼兒需要接受各種不同測驗(yàn)所可能導(dǎo)致的壓力十分擔(dān)憂。例如,英格蘭原計(jì)劃于2020年9月引入的基準(zhǔn)評估一直以來都存在爭議,政府認(rèn)為基準(zhǔn)是衡量學(xué)生從入學(xué)到關(guān)鍵階段2末期所取得的進(jìn)步的一種認(rèn)可和證據(jù)。但是,一些教育者持有一種相反的觀點(diǎn),他們認(rèn)為不宜在剛?cè)雽W(xué)的時(shí)候就對兒童進(jìn)行評估。拒絕考試聯(lián)盟(More Than a Test)認(rèn)為基準(zhǔn)評估“毫無意義且具有破壞性”,結(jié)果將“不可避免地不可靠”,基準(zhǔn)評估對兒童的后期成績沒有什么預(yù)測價(jià)值,甚至?xí)蓴_學(xué)生對學(xué)校的適應(yīng)程度。③Roberts N. Assessment and Testing in Primary Education (England)[R]. House of Commons Library, 2020: 6.此外,持反對意見的人們還認(rèn)為,測驗(yàn)的結(jié)果容易被解釋為對學(xué)生智力或能力的唯一和總結(jié)性判斷,而不是通過該數(shù)據(jù)來診斷學(xué)習(xí)過程中的成功與不足之處,從而影響學(xué)生的信心和學(xué)習(xí)興趣。
英格蘭統(tǒng)一在每個(gè)關(guān)鍵階段末期對學(xué)生進(jìn)行特定科目的標(biāo)準(zhǔn)化測驗(yàn)和教師評估,要求學(xué)校在排名表(League Tables)中公布測驗(yàn)結(jié)果,并以此為依據(jù)對地區(qū)、學(xué)校甚至教師進(jìn)行問責(zé),勢必會對課程和教學(xué)產(chǎn)生重大影響。由于課程大綱的范圍有限,考試內(nèi)容在很大程度上是可以預(yù)測的,這引發(fā)了各種旨在提高測驗(yàn)結(jié)果的“為應(yīng)試而教”的強(qiáng)化教學(xué)現(xiàn)象,扭曲了教育的本質(zhì)和價(jià)值。國家課程測驗(yàn)還導(dǎo)致學(xué)校過于關(guān)注英語、數(shù)學(xué)和科學(xué)等核心科目的教學(xué),而縮小課程的范圍以及減少內(nèi)容的多樣性。此外,標(biāo)準(zhǔn)化測驗(yàn)還可能導(dǎo)致教師專注于學(xué)習(xí)目標(biāo)所規(guī)定的知識和技能要求,而忽略了學(xué)生社交技能、創(chuàng)造力、獨(dú)立性和公民意識等其他能力的培養(yǎng)。④Mons N. Theoretical and Real Effects of Standardized Assessment[R]. Eurydice Network, 2009: 25-26.這在一定程度上導(dǎo)致了評價(jià)目的與手段的混淆與顛倒,即由“為了學(xué)習(xí)的評價(jià)”走向“為了評價(jià)的學(xué)習(xí)”的泥淖,學(xué)校則有成為考試工廠的傾向。因此,英格蘭的這種標(biāo)準(zhǔn)化、低齡化和越來越嚴(yán)苛的基礎(chǔ)教育評估制度在全國范圍內(nèi)引發(fā)了相關(guān)人士的強(qiáng)烈譴責(zé),他們認(rèn)為這種重測量的教育評價(jià)體系損害了真正的教育價(jià)值。
由家長、教師、校長和教育專家組成的拒絕考試聯(lián)盟不斷合作,以表明他們對高壓測驗(yàn)系統(tǒng)的反對,呼吁政府改變過度測驗(yàn)的制度和現(xiàn)狀。他們認(rèn)為,小學(xué)階段是一個(gè)自我發(fā)現(xiàn)、建立自信和開發(fā)潛能的時(shí)期,應(yīng)該讓學(xué)生享受豐富多彩的課程,并讓他們對學(xué)習(xí)充滿熱愛,而不是花數(shù)月時(shí)間準(zhǔn)備英語和數(shù)學(xué)考試。學(xué)生需要的是能夠幫助拓展知識、開發(fā)創(chuàng)造力以及提升解決問題能力的教師,而不是教他們?nèi)绾慰荚嚨慕處?。但是目前英格蘭的小學(xué)教育系統(tǒng)卻過度沉溺于分?jǐn)?shù)和排行榜,給孩子、家長以及教師帶來了不必要的負(fù)擔(dān)。對此,該聯(lián)盟認(rèn)為,應(yīng)根據(jù)學(xué)校提供的整體教育質(zhì)量來評判學(xué)校,而不是根據(jù)一系列標(biāo)準(zhǔn)化考試的結(jié)果。①M(fèi)ore Than A Score. Children are More Than a Score [EB/OL]. [2020-05-08]. https://www.morethanascore.org.uk.
自1988年建立以來,評價(jià)和考試任務(wù)小組(Task Group on Assessment and Testing,即TGAT)就賦予了國家課程評估系統(tǒng)多重目標(biāo),包括形成性目標(biāo)、診斷性目標(biāo)、總結(jié)性目標(biāo)和評估性目標(biāo)。其中最為著名的還屬保羅·牛頓(Paul E. Newton)于2007年所做的工作,他指出法定評估被廣泛使用的目標(biāo)至少有16種。②Newton P E. Clarifying the purposes of educational assessment[J]. Assessment in education: principles, policy & practice, 2007:149-170.隨后,兒童、學(xué)校和家庭委員會(Children, Schools and Family Committee)于2008年公布的調(diào)查報(bào)告指出,由于英格蘭國家課程評價(jià)系統(tǒng)承載著過多不同的目標(biāo),包括在國家、地方、學(xué)校以及個(gè)人等多維層面,導(dǎo)致在實(shí)際實(shí)施過程中,這些目標(biāo)實(shí)現(xiàn)情況不容樂觀。特別是,在既有形成性目標(biāo)又有總結(jié)性目標(biāo)的情況下,人們總是不可避免地偏向于更加強(qiáng)調(diào)在管理上引起問責(zé)和評估的總結(jié)性功能。③Stobart G. The validity of national curriculum assessment[J]. British journal of educational studies, 2001, 49(1): 26-39.現(xiàn)實(shí)情況也表明,隨著近年來英格蘭對學(xué)校和教師的問責(zé)力度進(jìn)一步加大,評估體系的總結(jié)性目標(biāo)越來越突出,而對每個(gè)孩子學(xué)習(xí)情況的診斷、支持與影響卻非常有限。對此,相關(guān)學(xué)者認(rèn)為應(yīng)該改革全國考試制度,重新審視這些多重目標(biāo),從而消除學(xué)校中所盛行的不惜一切代價(jià)追求考試成績的風(fēng)氣,④Whetton C. A brief history of a testing time: national curriculum assessment in England 1989-2008[J]. Educational research,2009, 51(2): 137-159.基礎(chǔ)教育評價(jià)的最終目標(biāo)在于關(guān)注每一位學(xué)生的發(fā)展與進(jìn)步。然而,英格蘭近年來的基礎(chǔ)教育評價(jià)改革始終未觸及根本,尚未建立起評估結(jié)果對教學(xué)過程的反饋機(jī)制。
目前英格蘭已經(jīng)建立起比較完善的國家課程體系及其法定評估機(jī)制,雖然面臨一些爭議與批評,評估框架也歷經(jīng)數(shù)次調(diào)整,但始終三十年如一日地監(jiān)控著全國范圍內(nèi)基礎(chǔ)教育的整體質(zhì)量。以此反觀我國的基礎(chǔ)教育評價(jià)制度,可獲得一些思考與啟示。
20世紀(jì)80年代以來,隨著新公共管理主義思潮在西方主要發(fā)達(dá)國家興起,量化公共部門的產(chǎn)出,使用科學(xué)的工具測量產(chǎn)出,根據(jù)基于產(chǎn)出而不是基于投入的審核程序來管理公共組織,使擁有更大自主權(quán)的公共機(jī)構(gòu)對管理者和公民負(fù)責(zé)等理念,開始在教育部門滲透和應(yīng)用。在此背景下,標(biāo)準(zhǔn)化評估應(yīng)運(yùn)而生。除了傳統(tǒng)的衡量學(xué)生學(xué)業(yè)成績的這一功能之外,標(biāo)準(zhǔn)化評估還被視為一種蘊(yùn)含多重目標(biāo)的工具,即生成可比較的定量數(shù)據(jù),以支持內(nèi)部學(xué)校問責(zé)制和公民社會的外部問責(zé)制。①M(fèi)ons N. Theoretical and real effects of standardized assessment[R]. Eurydice Network, 2009: 8-10.其中最具代表性的是英格蘭所實(shí)施的國家課程評估和美國的國家教育進(jìn)展評估(National Assessment of Educational Progress,NAEP)。英格蘭這種在全國范圍內(nèi)廣泛收集的關(guān)于基礎(chǔ)教育課程實(shí)施狀況的統(tǒng)一評估數(shù)據(jù),不僅有助于了解課程標(biāo)準(zhǔn)在不同地區(qū)、學(xué)校的實(shí)施效果,加強(qiáng)對處于最低標(biāo)準(zhǔn)以下的學(xué)校的問責(zé)與緊急干預(yù),還能夠幫助及時(shí)掌握基礎(chǔ)教育課程改革過程中的薄弱之處和問題所在,為未來的改革與發(fā)展提供證據(jù)依據(jù)。目前,我國已經(jīng)初步建立起全國范圍的義務(wù)教育質(zhì)量監(jiān)測體系,如何進(jìn)一步完善義務(wù)教育質(zhì)量監(jiān)測制度,有效使用質(zhì)量監(jiān)測數(shù)據(jù)改進(jìn)義務(wù)教育質(zhì)量,并規(guī)避基礎(chǔ)教育評估潛在的風(fēng)險(xiǎn)和不利影響,仍然是一個(gè)亟待研究的問題。
英格蘭十分重視教師評估在基礎(chǔ)教育評價(jià)中的作用,甚至TGAT最初設(shè)計(jì)的國家課程評估框架(包括SATs)是完全由教師進(jìn)行實(shí)施的,主要目的是讓教師從中獲得對教學(xué)有用的反饋。目前,英格蘭所實(shí)施的教師評估具體又包括關(guān)鍵階段末期的總結(jié)性評價(jià)和貫穿教學(xué)始終的形成性評價(jià)。其中前者作為法定評估,主要用于國家層面數(shù)據(jù)的收集和全國教育質(zhì)量的監(jiān)控,后者則主要側(cè)重于讓教師能夠即時(shí)監(jiān)控學(xué)生在核心科目上的學(xué)習(xí)進(jìn)展情況,并采取針對性策略改進(jìn)學(xué)生的學(xué)習(xí)。此外,在法定教師評估上,為了確保終結(jié)性教師評價(jià)的一致性和準(zhǔn)確性,保證全國范圍內(nèi)數(shù)據(jù)的可比性,STA等責(zé)任機(jī)構(gòu)還擁有嚴(yán)格的校準(zhǔn)程序保證教師評估的一致性。盡管在實(shí)際實(shí)施過程中,英格蘭對標(biāo)準(zhǔn)成就測驗(yàn)的重視程度高于教師評估,國家課程評價(jià)的評估性和總結(jié)性目標(biāo)也遠(yuǎn)遠(yuǎn)凌駕于形成性目標(biāo)之上,但這種對教師在不同教育評價(jià)形式上主體作用的重視,以及程序化、流程化和規(guī)范化的教師評估制度,依然值得我們思考。
在基礎(chǔ)教育評估領(lǐng)域,英格蘭建立起架構(gòu)清晰、職責(zé)明確、功能完善的組織機(jī)構(gòu)框架。除了充分發(fā)揮教育部及其執(zhí)行機(jī)構(gòu)等政府部門,獨(dú)立官方監(jiān)管機(jī)構(gòu),地方當(dāng)局、學(xué)校等多元主體的監(jiān)管與執(zhí)行功能以外,英格蘭還非常重視第三方評價(jià)組織在基礎(chǔ)教育評價(jià)中的積極作用,以充分建立公眾對評估體系的信心,滿足不同利益相關(guān)者的多元需求。特別是,Ofqual作為獨(dú)立的法定非內(nèi)閣政府部門(Non-Ministerial Department),直接對議會負(fù)責(zé),這保證了法定監(jiān)管部門的獨(dú)立性,使得基礎(chǔ)教育評估體系具有較強(qiáng)的專業(yè)性、權(quán)威性和公正性。此外,英格蘭負(fù)責(zé)機(jī)構(gòu)將國家課程測驗(yàn)的編制、評分等具體工作外包給可靠的第三方評價(jià)實(shí)體機(jī)構(gòu)(Awarding Organizations),同時(shí)實(shí)行嚴(yán)格的資格審查制度和動態(tài)監(jiān)測機(jī)制,從而保證評估的信度、效度、可比性等重要原則。這在我國注重促進(jìn)教育管辦評分離,全面深化教育評價(jià)制度改革的當(dāng)下,具有現(xiàn)實(shí)啟發(fā)意義。