梅松竹
(北京師范大學(xué)數(shù)學(xué)科學(xué)學(xué)院,北京100875)
20世紀(jì)60年代開(kāi)始,美國(guó)在全國(guó)范圍內(nèi)開(kāi)展了一項(xiàng)基礎(chǔ)教育質(zhì)量評(píng)價(jià)項(xiàng)目,這也是美國(guó)本土唯一長(zhǎng)期的、全國(guó)性的評(píng)價(jià)項(xiàng)目,因此被稱為“國(guó)家教育進(jìn)步評(píng)價(jià)”(National Assessment of Educational Progress,NAEP)。2007年,我國(guó)開(kāi)始在全國(guó)范圍內(nèi)陸續(xù)開(kāi)展了一項(xiàng)旨在監(jiān)測(cè)基礎(chǔ)教育發(fā)展?fàn)顩r的評(píng)價(jià)項(xiàng)目,即“國(guó)家教育質(zhì)量評(píng)價(jià)”(National Assessment of Educational Quality,NAEQ)。由于國(guó)情和學(xué)情相差甚遠(yuǎn),雖同為全國(guó)性教育評(píng)價(jià)項(xiàng)目,但是,NAEP與NAEQ在其創(chuàng)立、組織與管理、項(xiàng)目的實(shí)施及結(jié)果報(bào)告等方面具有諸多不同。
美國(guó)自建國(guó)伊始,一直實(shí)行教育分權(quán)政策,教育實(shí)權(quán)掌握在州政府或?qū)W區(qū)手中,學(xué)校的辦學(xué)自主權(quán)也非常大。二戰(zhàn)之后,美國(guó)有感于軍事的暫時(shí)失利源于教育的落后,于是,聯(lián)邦政府開(kāi)始關(guān)注并干預(yù)教育。時(shí)任美國(guó)教育委員會(huì)委員弗蘭西斯·凱普爾(Francis Keppel)和拉爾夫·泰勒(Ralph Tyler)及約翰·塔基(John Tucky)[1]在全美范圍內(nèi)發(fā)起了一項(xiàng)基礎(chǔ)教育監(jiān)測(cè)與評(píng)價(jià)項(xiàng)目,即NAEP。由于此項(xiàng)目撬動(dòng)了相關(guān)群體的利益,因此實(shí)施之初異常艱難。相比之下,我國(guó)是典型的教育集權(quán)國(guó)家,中央政府和地方教育行政部門(mén)掌握了絕對(duì)的教育壟斷權(quán),普通民眾和教育中介機(jī)構(gòu)皆沒(méi)有多少話語(yǔ)權(quán)。自我國(guó)恢復(fù)高考以來(lái),基礎(chǔ)教育一直被貼以“應(yīng)試教育”的標(biāo)簽,這顯然與世界教育發(fā)展格格不入。因此,為順應(yīng)課程改革的趨勢(shì)和國(guó)際教育測(cè)量與評(píng)價(jià)的大潮,教育部依托北京師范大學(xué)開(kāi)展了全國(guó)性基礎(chǔ)教育質(zhì)量監(jiān)測(cè),即NAEQ。NAEQ的創(chuàng)立異常順利,一方面反映出教育集權(quán)制度的優(yōu)勢(shì),另一方面也反映出集權(quán)教育環(huán)境下大眾的“失語(yǔ)”現(xiàn)狀和教育權(quán)益意識(shí)的淡薄。
NAEP的組織與管理是多個(gè)機(jī)構(gòu)共同作用的結(jié)果,其管理主體是國(guó)家評(píng)價(jià)管理委員會(huì)(NAGB),由國(guó)會(huì)批準(zhǔn),專為監(jiān)督NAEP的工作而設(shè)立,其主要職責(zé)是確定評(píng)價(jià)科目,制定成績(jī)目標(biāo)、評(píng)價(jià)目標(biāo)、評(píng)價(jià)方法、評(píng)價(jià)規(guī)范,頒布評(píng)估結(jié)果的方針與標(biāo)準(zhǔn),開(kāi)發(fā)成績(jī)比較的標(biāo)準(zhǔn)和程序。[2]NAEP的執(zhí)行機(jī)構(gòu)是國(guó)家教育統(tǒng)計(jì)中心(NCES),負(fù)責(zé)開(kāi)發(fā)試題,設(shè)計(jì)和實(shí)施評(píng)價(jià),收集數(shù)據(jù)并發(fā)布報(bào)告。NAEP將項(xiàng)目的執(zhí)行與管理分立,形成權(quán)力監(jiān)督和責(zé)任追溯機(jī)制,既提升了測(cè)評(píng)的科學(xué)性和嚴(yán)密性,又提高了測(cè)評(píng)的有效性和真實(shí)性。
基礎(chǔ)教育質(zhì)量監(jiān)測(cè)中心是我國(guó)教育部依托北京師范大學(xué)成立的專業(yè)評(píng)價(jià)機(jī)構(gòu),它沒(méi)有獨(dú)立法人地位,也不具有政府機(jī)構(gòu)的行政功能。教育部將NAEQ的組織與管理均委托給基礎(chǔ)教育質(zhì)量監(jiān)測(cè)中心,監(jiān)測(cè)中心集測(cè)評(píng)設(shè)計(jì)、實(shí)施、管理與評(píng)價(jià)于一身。這種組織與管理模式由于上位管理過(guò)于寬泛,下位管理職責(zé)重疊,極易造成教育行政部門(mén)監(jiān)管缺位,也容易使得監(jiān)測(cè)中心權(quán)責(zé)不明,趨利避害。因此,政府應(yīng)該學(xué)會(huì)在教育賦權(quán)與教育監(jiān)管之間尋求一個(gè)“溫和”的平衡,完善權(quán)力監(jiān)督機(jī)制和責(zé)任追溯機(jī)制,提高行政監(jiān)管的效率和有效性。
NAEP分為長(zhǎng)期趨勢(shì)評(píng)估(Long term trend assessment)和主評(píng)估(Main NAEP),主評(píng)估又包括全國(guó)評(píng)估、州評(píng)估,以及試驗(yàn)性城市地區(qū)評(píng)估(NAEP trial Urban District Assessment)。[3]NAEP 全國(guó)評(píng)估和州評(píng)估至少每隔兩年對(duì)4、8年級(jí)的數(shù)學(xué)和閱讀進(jìn)行測(cè)試,還要定期對(duì)外語(yǔ)、藝術(shù)、寫(xiě)作、科學(xué)、地理、歷史、公民學(xué)等科目進(jìn)行測(cè)試。長(zhǎng)期趨勢(shì)評(píng)估則持續(xù)性地對(duì)9、13、17歲學(xué)生進(jìn)行閱讀素養(yǎng)和數(shù)學(xué)素養(yǎng)評(píng)估。[4]
NAEQ的評(píng)估并未完全基于具體科目,而是從思想品德和公民素養(yǎng)、身體和心理健康水平、學(xué)業(yè)水平和學(xué)習(xí)素養(yǎng)、藝術(shù)素養(yǎng)、實(shí)踐能力和創(chuàng)新意識(shí)、教育環(huán)境與社會(huì)環(huán)境[5]幾個(gè)方面來(lái)進(jìn)行評(píng)估。由此可見(jiàn),NAEQ的監(jiān)測(cè)范圍不僅涵蓋學(xué)科知識(shí),也涉及能力、素養(yǎng),還將測(cè)試成績(jī)與外部環(huán)境進(jìn)行相關(guān)分析,這與NAEP有異曲同工之妙。然而,NAEQ的設(shè)計(jì)也存在一個(gè)弊端,即對(duì)非學(xué)科領(lǐng)域的道德、能力、素養(yǎng)的測(cè)評(píng)缺乏充足的經(jīng)驗(yàn)和依據(jù),因?yàn)槲覈?guó)尚未建立起相關(guān)的評(píng)價(jià)標(biāo)準(zhǔn)和規(guī)范,從而直接影響到測(cè)評(píng)結(jié)果的科學(xué)性和公信力。
NAEP的實(shí)施由NAGB負(fù)責(zé)制定框架,由NCES通過(guò)競(jìng)標(biāo)方式選擇專業(yè)教育考試中介公司參與測(cè)評(píng),不同公司的職責(zé)也不盡相同,如“美國(guó)大學(xué)入學(xué)考試”(ACT)負(fù)責(zé)確定測(cè)評(píng)學(xué)科與年級(jí)標(biāo)準(zhǔn),教育考試服務(wù)中心(ETS)負(fù)責(zé)題目開(kāi)發(fā)、考試工具設(shè)計(jì)以及提供數(shù)據(jù)分析報(bào)告,西斯特(Westat)負(fù)責(zé)抽樣設(shè)計(jì)、培訓(xùn)評(píng)價(jià)管理人員、組織實(shí)地測(cè)評(píng),全國(guó)計(jì)算機(jī)系統(tǒng)(NCS)負(fù)責(zé)答卷的識(shí)別與計(jì)分。[6]相比之下,NAEQ的實(shí)施幾乎都是由監(jiān)測(cè)中心來(lái)完成,其他教育中介機(jī)構(gòu)幾乎無(wú)法介入,這種方式容易造成分工粗糙、合作不暢,項(xiàng)目實(shí)施與管理集二者功能于一身,使得整個(gè)監(jiān)測(cè)過(guò)程缺乏技術(shù)保障、質(zhì)量監(jiān)督和權(quán)利制衡,極易造成評(píng)價(jià)結(jié)果偏離真實(shí),或有意迎合某種“期望”的假象。
NAEP的評(píng)價(jià)結(jié)果報(bào)告被稱為“國(guó)家成績(jī)報(bào)告單(Nation's Report Card)”,意在向相關(guān)利益人準(zhǔn)確、科學(xué)、及時(shí)、全面、直觀地報(bào)道NAEP的測(cè)試結(jié)果。NAEP的報(bào)告對(duì)象包括教育官員、教育政策制定者、校長(zhǎng)及董事會(huì)成員、測(cè)驗(yàn)實(shí)施者、測(cè)驗(yàn)研究者、教師、學(xué)生、家長(zhǎng)等,而且根據(jù)不同報(bào)告對(duì)象的理解水平和實(shí)際需求,設(shè)計(jì)了不同類型的報(bào)告卡,如標(biāo)準(zhǔn)報(bào)告卡、焦點(diǎn)報(bào)告卡、州報(bào)告卡、趨勢(shì)報(bào)告卡、技術(shù)報(bào)告卡等。[7]NAEP報(bào)告卡通常由執(zhí)行總結(jié)、評(píng)價(jià)概述、結(jié)果呈現(xiàn)、附錄等幾部分組成[8],并按照成就水平(aehievementlevel)和量尺分?jǐn)?shù)(scale scores)來(lái)報(bào)告成績(jī)。成就水平分為基本(basic)、熟練(proficiency)和高級(jí)(advanced)三個(gè)等級(jí)。[9]量尺分?jǐn)?shù)根據(jù)項(xiàng)目反應(yīng)理論計(jì)算而來(lái),不同的學(xué)科,其量尺分?jǐn)?shù)區(qū)間也有所不同,如數(shù)學(xué)為0~500分,科學(xué)為0~300分。
NAEP為了降低測(cè)試的利害性,以及尊重測(cè)試個(gè)體的隱私,按照學(xué)生的地區(qū)、家庭經(jīng)濟(jì)狀況、種族、殘障狀況與英語(yǔ)能力水平等分類指標(biāo)[10],分別報(bào)告不同亞群體的測(cè)試成績(jī),同時(shí)還按照所測(cè)學(xué)科和年級(jí)的不同,分別報(bào)告其主要內(nèi)容領(lǐng)域、技能領(lǐng)域的進(jìn)展。如NAEP8年級(jí)數(shù)學(xué)測(cè)評(píng)成績(jī)報(bào)告從數(shù)的意義、性質(zhì)、運(yùn)算,測(cè)量,幾何學(xué)和空間感,數(shù)據(jù)的分析、統(tǒng)計(jì)和概率,代數(shù)和函數(shù)五個(gè)維度進(jìn)行報(bào)告。[11]相比之下,NAEQ的報(bào)告則顯得諱莫如深、深藏不露,至今難以從公共資源庫(kù)中搜索到任何成績(jī)報(bào)告和數(shù)據(jù)分析。這種嚴(yán)格的保密性在忠于行政指導(dǎo)的同時(shí),也剝奪了公眾的知情權(quán)和參與權(quán),更凸顯出NAEQ對(duì)行政依附過(guò)多的弊端。因此,借鑒NAEP的成績(jī)報(bào)告系統(tǒng),我們可以考慮建立共享資源庫(kù),構(gòu)建科學(xué)的成就水平和量尺分?jǐn)?shù),設(shè)計(jì)不同類型的報(bào)告卡來(lái)報(bào)告不同亞群體的分?jǐn)?shù)。
由于美國(guó)與我國(guó)國(guó)情不同,教育體制各異,NA-EP和NAEQ的測(cè)試背景也相差甚遠(yuǎn),所以,我們決不能全盤(pán)照搬。然而,作為國(guó)際范圍內(nèi)最先進(jìn)的測(cè)評(píng)項(xiàng)目之一,NAEP的許多措施對(duì)我國(guó)基礎(chǔ)教育質(zhì)量監(jiān)測(cè)體系同樣具有重要的啟示意義。
從NAEP的艱難創(chuàng)立到最終確定為美國(guó)國(guó)內(nèi)唯一的全國(guó)性教育評(píng)價(jià)項(xiàng)目,必然離不開(kāi)聯(lián)邦政府的政策法規(guī)和財(cái)政支持。2011年,《不讓一個(gè)孩子掉隊(duì)法案》(No Child Left Behind Act,NCLB)還特別規(guī)定所有希望接受Ⅰ號(hào)資助(TitleⅠgrant)的州必須參加NAEP州評(píng)估對(duì)閱讀、數(shù)學(xué)的測(cè)量[12],由此可看出政府在全國(guó)性教育監(jiān)測(cè)中的引領(lǐng)作用。NAEQ是我國(guó)教育部依托高校進(jìn)行的全國(guó)性教育監(jiān)測(cè)項(xiàng)目,其執(zhí)行主體是基礎(chǔ)教育質(zhì)量監(jiān)測(cè)中心,然而,國(guó)家和政府的職責(zé)也決不可忽略。當(dāng)然,此職責(zé)并非要政府對(duì)監(jiān)測(cè)的過(guò)程的親力親為(事實(shí)上政府也無(wú)法做到這一點(diǎn)),而是要在宏觀上對(duì)監(jiān)測(cè)進(jìn)行引領(lǐng)、規(guī)范和監(jiān)督,需要制定相關(guān)的政策法規(guī)來(lái)約束NAEQ的實(shí)施,謹(jǐn)防其權(quán)利失衡,執(zhí)行走樣,或流于形式,不能真正地為政府的教育決策提供依據(jù)。另外,NAEQ雖不是一項(xiàng)功利性項(xiàng)目,但卻是一個(gè)利國(guó)利民的千秋偉業(yè)。因此,從長(zhǎng)遠(yuǎn)觀點(diǎn)來(lái)看,政府要為 NAEQ提供大力的財(cái)政支持,以維持NAEQ的正常運(yùn)作和可持續(xù)發(fā)展,這也是政府不可推卸的責(zé)任之一。
從NAEP的運(yùn)行和實(shí)施過(guò)程可以看出,教育中介機(jī)構(gòu)的作用不可小覷,他們承擔(dān)著NAEP的主要技術(shù)性工作,政府則主要充當(dāng)管理和宏觀調(diào)控的角色。然而,縱觀我國(guó)的教育歷史,不難發(fā)現(xiàn)政府一直以“全面管家”自居,政府的管理過(guò)于強(qiáng)勢(shì),完全抑制了其他教育組織和教育中介機(jī)構(gòu)的聲音,政府的管理也過(guò)細(xì)過(guò)全,幾乎觸及到教育的方方面面,這種對(duì)于教育壟斷權(quán)的絕對(duì)青睞和無(wú)限支配無(wú)疑剝奪了教育中介機(jī)構(gòu)的生存空間,也喪失了教育中介機(jī)構(gòu)的專業(yè)支持和技術(shù)輔助,使得大規(guī)模的教育測(cè)評(píng)舉步維艱、發(fā)展緩慢。
由于NAEP和NAEQ都不是高利害(high stake)考試,其甄別和選拔功能減弱,因此需要設(shè)置明確的、可以測(cè)量的標(biāo)準(zhǔn),對(duì)學(xué)生的學(xué)業(yè)表現(xiàn)提出高要求或高期望,并使得課程、評(píng)價(jià)和教師的職業(yè)發(fā)展與標(biāo)準(zhǔn)一致。[13]基于標(biāo)準(zhǔn)的評(píng)價(jià)以促進(jìn)學(xué)生的學(xué)習(xí)為中心,強(qiáng)調(diào)逆向設(shè)計(jì)和事先的規(guī)劃以及評(píng)價(jià)與教學(xué)的融合,可看作一個(gè)有目的地收集關(guān)于學(xué)生在達(dá)成課程標(biāo)準(zhǔn)的過(guò)程中所知和能做的證據(jù)的過(guò)程。評(píng)價(jià)建立在標(biāo)準(zhǔn)的基礎(chǔ)上,先有標(biāo)準(zhǔn),后有評(píng)價(jià),標(biāo)準(zhǔn)決定評(píng)價(jià),評(píng)價(jià)設(shè)計(jì)先于教學(xué)設(shè)計(jì),評(píng)價(jià)的目的是促進(jìn)學(xué)生的自我導(dǎo)向、自我監(jiān)控的學(xué)習(xí)。[14]
NAEP試題設(shè)計(jì)采用了不完全分塊設(shè)計(jì)(Balanced Incomplete Block Design,BIB)和 Imputation計(jì)分法,此法根據(jù)被試的答題情況和背景信息構(gòu)造了一個(gè)模型,從模型中估計(jì)出被試的能力或者得分的后驗(yàn)分布,并從該分布中取一個(gè)隨機(jī)數(shù)作為被試的最后得分[15],而且,NAEP使用了項(xiàng)目反應(yīng)理論(I-tem Response Theory,IRT)來(lái)分析不同成就水平學(xué)生的百分比以及確定“劃界分?jǐn)?shù)”,這兩種處理方法均造成 NAEP的分?jǐn)?shù)可信度廣受質(zhì)疑。因此,NAEQ在分?jǐn)?shù)報(bào)告時(shí)需向報(bào)告對(duì)象清楚地闡釋分?jǐn)?shù)的由來(lái)和含義,避免公眾對(duì)于分?jǐn)?shù)的曲解和誤解。
數(shù)據(jù)污染分為負(fù)向污染和正向污染。一方面,由于NAEP和NAEQ都是低利害設(shè)計(jì),降低了考生的心理負(fù)擔(dān),因而容易造成考生消極應(yīng)付,形成數(shù)據(jù)負(fù)向污染。另一方面,如果將NAEQ測(cè)試結(jié)果納入到“問(wèn)責(zé)系統(tǒng)”中,教師和學(xué)校很可能為此增加額外的測(cè)試訓(xùn)練,提供預(yù)期的“正確”答案,造成數(shù)據(jù)正向污染,既顛覆了項(xiàng)目設(shè)計(jì)的初衷,也使得當(dāng)前某種程度上已存在的“應(yīng)試教學(xué)”雪上加霜。
綜上所述,我們要客觀地分析NAEP和NAEQ的優(yōu)勢(shì)與不足,取NAEP之精華,立足于我國(guó)本土實(shí)際,積極探索適合中國(guó)基礎(chǔ)教育健康發(fā)展和不斷跨越的大規(guī)模教育質(zhì)量評(píng)價(jià)體系。
[1]Archie E.Lapointe.標(biāo)準(zhǔn)化測(cè)驗(yàn)對(duì)美國(guó)社會(huì)的影響——以美國(guó)國(guó)家教育進(jìn)展評(píng)估(NAEP)為例[J].考試研究,2009(4).
[2]NAGB.Responsibilities[EB/OL].http://www.nagb.org/what- we - do/board - works,html.
[3] NCES.Nations report card[EB/OL].http://nationsreportcard.gov.
[4]Maris A.Vinovskis.Overseeing the National's Report Card:the Creation and Evolution of the National Assessment Governing Board[EB/OL].http://www.nagb.org/pubs/pubs.html.
[5]教育部基礎(chǔ)教育質(zhì)量監(jiān)測(cè)中心.中心簡(jiǎn)介[EB/OL].http://www.eachina.org.cn/eac/zxjj.htm.
[6]Lawrence M.Rudner?William D.Schafer.What teachers need to know about assessment[M].NEA,2002.
[7]Devito,P.J.& Koenig,J.A.NAEPReporting Practices::Investigating District-Level and Market-Basket Reporting[M].National Research Council.National Academy Press.Washington,D.C.2001.
[8] NCES.The Nation's Report Card:Mathematics 2011[EB/OL].http://nces.ed.gov/pubsearch/pubsinfo.a(chǎn)sp?pubid=2012458.
[9]施耐德·馬克.美國(guó)國(guó)家教育進(jìn)展評(píng)估[J].考試研究,2011(3).
[10]占盛麗,文劍冰,朱小虎.全球化背景下PISA在美國(guó)基礎(chǔ)教育質(zhì)量評(píng)估體系中的貢獻(xiàn)[J].外國(guó)中小學(xué)教育,2010(5).
[11]黃慧娟,王晞,許明.關(guān)于三項(xiàng)著名國(guó)際學(xué)生評(píng)價(jià)項(xiàng)目的比較[J].福建師范大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版),2004(4).
[12]Maris A.Vinovskis.Overseeing the National's Report Card:the Creation and Evolution of the National Assessment Governing Board[EB/OL].http://www.nagb.org/pubs/pubs.html.
[13]Koretz,D.M.,and L.S.Hamilton.Testing for Accountability in K - 12In R.L.Brenman(ed.),Educational Measurement(fourth Edition)[M].Praeger:American Council Education.2006.
[14]崔允漷,王少非,夏雪梅.基于標(biāo)準(zhǔn)的學(xué)生學(xué)業(yè)成就評(píng)價(jià)[M].上海:華東師范大學(xué)出版社,2008.
[15]張華華,王純.美國(guó)教育進(jìn)展評(píng)估帶給我們什么啟示[J].教育測(cè)量與評(píng)價(jià),2010(2).
天津師范大學(xué)學(xué)報(bào)(基礎(chǔ)教育版)2013年1期