北京市教育督導(dǎo)與教育質(zhì)量評價(jià)研究中心
我國教育評價(jià)制度正經(jīng)歷著重大變革。傳統(tǒng)以單次升學(xué)考試結(jié)果為指標(biāo)的評價(jià)方法存在諸多弊端,而學(xué)校增值性評價(jià)則可以較好地解決這些問題。學(xué)校增值性評價(jià)指通過收集學(xué)生某段時(shí)間內(nèi)不同時(shí)間點(diǎn)的指標(biāo)表現(xiàn),運(yùn)用一定的統(tǒng)計(jì)分析技術(shù),分析學(xué)生的變化狀況,并分離非學(xué)校因素效應(yīng)與學(xué)校因素效應(yīng),從而科學(xué)客觀地評價(jià)學(xué)校培養(yǎng)能力。2014年以來,北京市啟動(dòng)深化基礎(chǔ)教育領(lǐng)域綜合改革。如何在北京市考試評價(jià)、招生錄取改革后,科學(xué)地利用體現(xiàn)改革方向、優(yōu)質(zhì)精良的評價(jià)指標(biāo),精準(zhǔn)地評價(jià)、診斷和改進(jìn)區(qū)域與學(xué)校教學(xué)質(zhì)量成為亟待解決的現(xiàn)實(shí)問題。
中小學(xué)校增值性評價(jià),北京做了什么
當(dāng)前,在北京市開展過的增值性評價(jià)探索集中于兩個(gè)方面,一方面是結(jié)合熱點(diǎn)問題對學(xué)校、班級、學(xué)生等層面的教育教學(xué)質(zhì)量進(jìn)行分析與反饋,不斷指導(dǎo)改進(jìn)教育教學(xué);另一方面鏈接中高考數(shù)據(jù)進(jìn)行深入綜合的分析,給予多角度的區(qū)域評價(jià)結(jié)果,當(dāng)前已取得了一些經(jīng)驗(yàn)與結(jié)論。
探索一:以學(xué)業(yè)水平測試為數(shù)據(jù)基礎(chǔ)的學(xué)校增值性評價(jià)項(xiàng)目
早在2011年,北京義務(wù)教育教學(xué)質(zhì)量評價(jià)與反饋系統(tǒng)項(xiàng)目(BAEQ)開始對部分連續(xù)抽測區(qū)(縣)的小學(xué)進(jìn)行增值性評價(jià)分析。分析主要包括:(1)學(xué)校增值性評價(jià)。采用國際通常采用的多層線性統(tǒng)計(jì)分析模型,以學(xué)生2009年三年級數(shù)學(xué)測試為前測成績、2011年五年級數(shù)學(xué)測試成績?yōu)楹鬁y成績,分析學(xué)校數(shù)學(xué)學(xué)業(yè)增值的情況。(2)學(xué)業(yè)增值與學(xué)業(yè)成就水平的關(guān)系。教育評價(jià)應(yīng)同時(shí)關(guān)注教育過程與教育結(jié)果,因此該項(xiàng)目分析了學(xué)校的增值分?jǐn)?shù)與合格率、優(yōu)秀率的關(guān)系。結(jié)果與其他國際項(xiàng)目結(jié)論相似,即增值分與合格率、優(yōu)秀率和得分率的變化一致。(3)學(xué)業(yè)增值與課業(yè)負(fù)擔(dān)的關(guān)系。教育者更應(yīng)關(guān)注高學(xué)業(yè)成績、正增值的背后是否增加了學(xué)生的學(xué)習(xí)負(fù)擔(dān)。本項(xiàng)目擬形成課業(yè)負(fù)擔(dān)綜合指標(biāo),計(jì)算每所學(xué)校課業(yè)負(fù)擔(dān)情況。由此可以篩選出高學(xué)業(yè)成績、正增值、低負(fù)擔(dān)學(xué)校,進(jìn)一步開展個(gè)案研究,探索教學(xué)經(jīng)驗(yàn),促進(jìn)區(qū)域教育質(zhì)量的全面提高。
探索二:以中高考成績?yōu)閿?shù)據(jù)基礎(chǔ)的學(xué)校增值性評價(jià)項(xiàng)目
近年來,在借鑒國內(nèi)外學(xué)校增值評價(jià)的研究進(jìn)展及經(jīng)驗(yàn)的基礎(chǔ)上,部分區(qū)域采用國際通常采用的多層線性統(tǒng)計(jì)模型,基于對學(xué)生中考和高考成績的增值分析,著手對高中階段學(xué)校的培養(yǎng)力進(jìn)行研究。分析主要包括:(1)有無控制變量對增值的影響。為更加準(zhǔn)確、科學(xué)地得到學(xué)校凈效應(yīng),分別建立無控制因素和有控制因素下的增值模型,結(jié)果顯示,學(xué)校規(guī)模是影響學(xué)校增值的一個(gè)因素。(2)不同類別學(xué)生的增值情況。按照文理科對學(xué)生進(jìn)行分類,分別提供各校文科、理科在各學(xué)科及總分上的增值情況。(3)增值與中高考分?jǐn)?shù)的關(guān)系。不僅考慮學(xué)校的增值結(jié)果,也分析了增值分?jǐn)?shù)與高考成績、增值分?jǐn)?shù)與中考成績之間的關(guān)系。通過以上三方面,可以從多個(gè)角度來挖掘增值的含義,幫助區(qū)域更加合理、有效地利用中高考數(shù)據(jù)進(jìn)行學(xué)校評價(jià),診斷和改進(jìn)教與學(xué)中存在的問題。
中小學(xué)校增值性評價(jià)的現(xiàn)實(shí)方向
北京市深化基礎(chǔ)教育領(lǐng)域綜合改革是當(dāng)前北京教育發(fā)展的指向與重心,建立服務(wù)于這一改革的學(xué)校增值評價(jià)系統(tǒng)將是現(xiàn)階段的重要任務(wù)之一。
1.建立增值評價(jià)系統(tǒng)是教育改革的一部分學(xué)校教學(xué)改革是北京市深化基礎(chǔ)教育領(lǐng)域綜合改革的核心。那么,采用何種方法來評價(jià)學(xué)校改革的成效是體現(xiàn)明確改革導(dǎo)向、改革價(jià)值的關(guān)鍵。建立具有評估學(xué)校辦學(xué)質(zhì)量“凈增長”情況的增值評價(jià)系統(tǒng)也應(yīng)成為深化綜合改革的一部分。此系統(tǒng)應(yīng)具備如下特征:
基于學(xué)生核心素養(yǎng)的多元化評價(jià)指標(biāo)體系,實(shí)現(xiàn)對學(xué)校教育質(zhì)量的多元評價(jià)。學(xué)生發(fā)展核心素養(yǎng),主要是指學(xué)生應(yīng)具備的,能夠適應(yīng)終身發(fā)展和社會(huì)發(fā)展需要的必備品格和關(guān)鍵能力,培養(yǎng)學(xué)生發(fā)展核心素養(yǎng)是教育的出發(fā)點(diǎn)與歸宿。由“必備品格和關(guān)鍵能力”兩個(gè)重要詞匯就可看出,以往以學(xué)業(yè)成績?yōu)閱我恢笜?biāo)的評價(jià)方法難以滿足以核心素養(yǎng)為導(dǎo)向的教育需求。建立包括學(xué)生意志品質(zhì)、身心健康、學(xué)業(yè)成績在內(nèi)的、指向?qū)W生發(fā)展核心素養(yǎng)的多元化指標(biāo)體系,應(yīng)成為實(shí)現(xiàn)學(xué)校增值評價(jià)的基礎(chǔ)。
當(dāng)前國內(nèi)外的學(xué)校增值評價(jià)系統(tǒng),在指標(biāo)選擇上,大多僅限于對學(xué)業(yè)表現(xiàn)等認(rèn)知因素的分析;在方法上,則大多來自對學(xué)生層面數(shù)據(jù)在學(xué)校層面聚合后的分析。在廣泛借鑒的基礎(chǔ)上,我們也將采集學(xué)生層面數(shù)據(jù),在對現(xiàn)有北京市學(xué)生非學(xué)業(yè)成績調(diào)查結(jié)果進(jìn)行效度分析基礎(chǔ)上,選擇部分具有高效度的指標(biāo)進(jìn)入學(xué)校增值評價(jià)框架,以探索建立基于學(xué)生多元表現(xiàn)的學(xué)校教育質(zhì)量的增值評價(jià)系統(tǒng)。
基于定量研究技術(shù),實(shí)現(xiàn)對學(xué)校教育質(zhì)量的發(fā)展性評價(jià)。發(fā)展性評價(jià)強(qiáng)調(diào)從積極動(dòng)態(tài)的視角來看待事物的成長和進(jìn)步過程,倡導(dǎo)將個(gè)體當(dāng)前的表現(xiàn)與過去的表現(xiàn)進(jìn)行比較、與掌握目標(biāo)相對照來判斷、解釋個(gè)體的進(jìn)步情況。學(xué)校增值評價(jià)就是通過定量研究技術(shù)追蹤多個(gè)時(shí)間點(diǎn)的學(xué)生表現(xiàn),在分析學(xué)生進(jìn)步情況的基礎(chǔ)上評價(jià)學(xué)校的培養(yǎng)力。學(xué)校增值評價(jià)與當(dāng)前學(xué)生表現(xiàn)的絕對水平和生源無關(guān),因此,可以避開學(xué)校生源的巨大差異,使對不同學(xué)校的比較基于同一標(biāo)準(zhǔn),保證教育評價(jià)過程的公平性與客觀性。
2.修補(bǔ)型與重建型是學(xué)校增值評價(jià)系統(tǒng)兩條建立途徑
來自國內(nèi)外的學(xué)校增值評價(jià)系統(tǒng)大多建立在連續(xù)年度大規(guī)模測查數(shù)據(jù)分析基礎(chǔ)上,需要對學(xué)生層面進(jìn)行數(shù)據(jù)的前期追蹤設(shè)計(jì)與采集。而大規(guī)模測查又不可避免會(huì)為參加抽測的學(xué)生帶來一定程度的負(fù)擔(dān)。如何平衡學(xué)校增值評價(jià)系統(tǒng)所需測查實(shí)施與所帶來的學(xué)習(xí)負(fù)擔(dān),可能是當(dāng)前面臨的重要課題。就當(dāng)前而言,可采用兩條路徑:
路徑一(修補(bǔ)型):由市級統(tǒng)籌,對現(xiàn)有大規(guī)模測查數(shù)據(jù)資源進(jìn)行整合、鏈接后,進(jìn)行二次開發(fā)與利用。
建立學(xué)校學(xué)生學(xué)業(yè)成績增值評價(jià)體系。目前北京市區(qū)兩級的大規(guī)模學(xué)業(yè)測查包括各區(qū)統(tǒng)一的初中畢業(yè)會(huì)考、市級統(tǒng)一的中考、高中畢業(yè)會(huì)考和高考??衫帽本┦须娮踊瘜W(xué)生學(xué)籍管理系統(tǒng)(CMIS),將CMIS系統(tǒng)中的背景數(shù)據(jù)、初中畢業(yè)會(huì)考、中考、高中畢業(yè)會(huì)考、高考成績進(jìn)行鏈接,以市中考成績校正各區(qū)(縣)的初中畢業(yè)會(huì)考成績后,建立以初中會(huì)考-高中會(huì)考為主線的高中學(xué)校辦學(xué)質(zhì)量增值分析體系,對初中畢業(yè)會(huì)考成績和高中會(huì)考成績進(jìn)行二次開發(fā)與利用。據(jù)此使得大規(guī)模校外測驗(yàn)的數(shù)據(jù)不再局限于僅對學(xué)生個(gè)體學(xué)業(yè)進(jìn)行終結(jié)性評價(jià),而是將其聯(lián)合起來服務(wù)于學(xué)校教育教學(xué)質(zhì)量的評價(jià)。
建立學(xué)校學(xué)生體質(zhì)健康增值評價(jià)體系。由市級統(tǒng)籌,將反映各學(xué)校學(xué)生體質(zhì)狀況的國家學(xué)生體質(zhì)健康標(biāo)準(zhǔn)數(shù)據(jù)管理系統(tǒng)與北京市電子化學(xué)生學(xué)籍管理系統(tǒng)相鏈接,在調(diào)用并分析連續(xù)年度的體質(zhì)建康數(shù)據(jù)資源基礎(chǔ)上,建立學(xué)校體質(zhì)健康教育質(zhì)量的增值評價(jià)體系。
補(bǔ)充調(diào)查收集反映學(xué)生情緒態(tài)度方面的指標(biāo),建立與學(xué)生意志品質(zhì)有關(guān)的學(xué)校增值評價(jià)體系。北京現(xiàn)有的三個(gè)市級大規(guī)模測查(中考、高中會(huì)考、高考)均無相應(yīng)的情緒態(tài)度方面的調(diào)查工具,建議測驗(yàn)結(jié)束后實(shí)施簡短的問卷調(diào)查信息,在連續(xù)年度追蹤調(diào)查的基礎(chǔ)上,獲得進(jìn)行增值分析的基礎(chǔ)數(shù)據(jù)。
三個(gè)學(xué)校增值評價(jià)體系的建立構(gòu)成了北京市學(xué)校增值評價(jià)系統(tǒng)。然而,由于受到既有客觀條件的限定,此系統(tǒng)也僅限于高中階段。北京市義務(wù)教育階段的學(xué)校增值評價(jià)系統(tǒng),或者北京市基礎(chǔ)教育全階段的學(xué)校增值評價(jià)系統(tǒng)的建立,需要謀求第二種途徑。
路徑二(重建型):市級統(tǒng)籌,將內(nèi)外部測查結(jié)果相結(jié)合,重新建構(gòu)基礎(chǔ)教育階段學(xué)校教育質(zhì)量增值分析系統(tǒng)。
籌建北京市基礎(chǔ)教育全階段的學(xué)校教育質(zhì)量增值評價(jià)系統(tǒng),一方面要建立涵蓋北京市三、六、九、十二年級的大規(guī)模測查系統(tǒng),將抽樣設(shè)計(jì)與追蹤設(shè)計(jì)相結(jié)合,獲得學(xué)校增值分析所需要的基礎(chǔ)數(shù)據(jù)。為避免新測查帶來的壓力,在此過程中,不僅可將具有標(biāo)準(zhǔn)參照性質(zhì)的初中會(huì)考、高中會(huì)考成績分別替代九年級和十二年級測查納入體系中來,而且可采用相應(yīng)文本分析技術(shù)和統(tǒng)計(jì)分析技術(shù),將綜合素質(zhì)評價(jià)部分內(nèi)容(含情緒態(tài)度、意志品質(zhì)等)作為校本評量資料,經(jīng)大規(guī)模校外測查校正提取后,納入測查系統(tǒng)。另一方面則需要建立大規(guī)模測查系統(tǒng)與現(xiàn)有數(shù)據(jù)資源庫的鏈接,例如國家學(xué)生體質(zhì)健康標(biāo)準(zhǔn)數(shù)據(jù)管理庫等,從而獲得基于前期抽樣和追蹤設(shè)計(jì)的、多元化學(xué)校增值分析系統(tǒng)。