戚利萍
標準化測試和國家教育評估體系是學校管理的重要形式,是政府部門與社會公眾監(jiān)督學校管理的一項重要手段,它們關(guān)系到教育體制改革的進展,并且通常本身就是改革前進的推動力。[1]在全球化的形勢下,各類國家教育評估呈迅速發(fā)展的趨勢,尤其是對小學和初中階段的數(shù)學和語言等學科的評估。資料顯示,從1995年到2005年,開展國家教育評估的發(fā)達國家總數(shù)從28個增加到67個,翻了一倍以上。盡管發(fā)達國家仍然保持領(lǐng)先地位,開展國家教育評估的發(fā)展中國家的總數(shù)也從28個增長到51個,幾乎翻了一倍,[2]然而,國家教育評估的開展仍存在地區(qū)性差異,美國高質(zhì)量的教育水平和先進的評估體系無疑有著重要的借鑒意義。事實上,隨著全球化的發(fā)展,“國際參照物已被認為是取得進步的基礎(chǔ)……只有通過國際參照,各國才能清楚了解各自教育體制的強勢和相對弱勢,并辨明前進的方向”。[3]本文以美國教育為例,探討美國國家教育進展評估的主要模式,以及標準化測試在美國的發(fā)展歷程和深遠影響。
美國國家教育進展評估(NAEP)是由美國教育部下屬的國家教育統(tǒng)計中心(NCES)進行的一項針對學生學習進展的階段性評估。[4]評估結(jié)果的發(fā)布又稱國家讀書報告卡,被政策制定者,各州和各地區(qū)的教育者及校長、教師和家長們用于指導教育管理。從1969年起,該評估已經(jīng)在閱讀、數(shù)學、科學、寫作、歷史、地理和其它學科定期進行。對世界史和外語的評估預計在2012年開始。NAEP通過向國家、州和地區(qū)領(lǐng)導人提供學生學習的客觀信息而成為國家評估和教育發(fā)展不可或缺的一部分。只有與學術(shù)成績有關(guān)的信息才被收集到此項目中去,它確保為涉及的學生和家庭信息保密。[5]NAEP是美國唯一針對學生在各科領(lǐng)域?qū)W習的國家性、持續(xù)的評估。[6]
美國最初的教育潮流是對兒童和奴隸進行家庭教育,后逐漸發(fā)展為對兒童進行學校教育。美國獨立戰(zhàn)爭后,人們對教育的重視普遍增加,認為年輕一代需要在新的合眾國內(nèi)接受教育。然而,全國各地區(qū)的教育卻存在極大的差異。隨著學校在美國國內(nèi)發(fā)展的失衡,建立某種類型的州級教育體制的重要性日益凸顯。為了能夠了解各地區(qū)的教育質(zhì)量,學校主管在自己管轄區(qū)內(nèi)進行測試,但目的只是獲取學生的信息,不與其他地區(qū)作比較。
美國使用評估概念的傳統(tǒng)是在基礎(chǔ)教育實踐領(lǐng)域中產(chǎn)生的。在基礎(chǔ)教育領(lǐng)域中,評估這個概念是對大規(guī)??荚図椖康囊环N事實描述。[7]NAEP這一類大規(guī)模評估的主要目標與重心并非個體的表現(xiàn),而是集體的績效。評估的主要工具是標準化和客觀化考試,目的在于迅速而有效地獲得概要性的與學??冃в嘘P(guān)的統(tǒng)計數(shù)據(jù)。
NAEP的國家級評估主要有兩大類,即主要評估(the main assessments)和長期趨勢評估 (long-term trend assessments)。前者從4年級、8年級和12年級的學生中抽樣評估,后者的評估對象從9歲、13歲和17歲的學生中抽樣。選擇上述年級和年齡,是因為它們代表了學術(shù)發(fā)展過程中的關(guān)鍵期(critical juncture)。
州級評估允許各州自己監(jiān)測在閱讀、數(shù)學、寫作和科學等學科方面的進展。和所有其它類型的NAEP評估一樣,州級評估并不提供個體學生或?qū)W校的分數(shù)。各州可以將自己學生的知識和技能與其它州或和國家標準進行比較。[8]州級評估的程序與國家級評估的程序相同,主要針對4年級和8年級的學生,而不針對12年級的學生。1988年,NAEP只報告全國層面的學術(shù)進步。同年國會通過立法授權(quán)了一項自愿進行的試驗性州級評估,允許各州篩選代表性的學生樣本參加州級評估。試驗性州級評估在1990年、1992年和1994年進行。從1996年評估開始,各州不再將評估定性為“試驗性的”。
州級評估的一次巨大變革發(fā)生在2001年,當年通過了美國《中小學教育法案》,即《不讓一個孩子掉隊法案》。法案要求所有接受政府I號資金的州必須參加每兩年一次的4年級和8年級的州級閱讀和數(shù)學評估。而其它科目(如科學和寫作)的州級評估仍為自愿參加。
TUDA的目的主要是探析通過NAEP報告各地區(qū)公立學校學生成績的可行性。根據(jù)聯(lián)邦法律的授權(quán),一些選定城市地區(qū)對抽樣學生的數(shù)學、閱讀、科學和寫作進行了評估。TUDA最先于2002年在5座城市地區(qū)進行,即亞特蘭大、芝加哥、休斯敦、洛杉磯和紐約。后又增加了波斯頓和圣地亞哥等5座城市地區(qū)。[9]到2009年,測試地區(qū)已達到15個。哥倫比亞區(qū)既進行州級評估又進行城市地區(qū)的試驗性評估。TUDA的測試過程與國家級評估和州級評估相同。
高 中成績 單 研 究 (High School Transcript Study,HSTS)。此項研究于1982年由國家教育統(tǒng)計中心開展,針對當時正在實施的主要課程改革提供高中生有關(guān)課程選修模式的信息,以及課程選修模式和成果之間的關(guān)系。高中成績報告單也提供學生在12年級的模式,為NAEP提供衡量的資料。隨著最近公布的2005年研究,HSTS提供給教育界超過10年的寶貴結(jié)論。
朗讀能力研究(Oral Reading Study)。此項評估的目的在于提供學生朗讀流利程度的信息,以及審查朗讀精確度、速度、流暢性和整體閱讀理解能力之間的關(guān)系。閱讀理解能力的檢驗歷來只通過學生書面或口頭回答關(guān)于閱讀理解問題的選擇,檢驗這些回答有助于了解學生的閱讀能力和思考文本的能力。然而,學生的朗讀表現(xiàn)可以使研究人員有機會審查如準確性和措辭方面的信息,而這些是無法從問題回答中直接獲悉的。
美國特許學校(America’s Charter School)。 美國特許學校是公立學校的另一個選擇,可以接受被分配到普通公立學校的學生。雖然特許學校與其他公立學校之間有許多相似之處,但它們在一些重要方面有所不同,如學生人數(shù)的構(gòu)成和它們的位置。舉例來說,相對于其他公立學校,特許學校四年級的學生中比例較高的是黑人。
技術(shù)為基礎(chǔ)的評估項目(The Technology-Based Assessment,TBA)。TBA是由國家教育統(tǒng)計中心于2000—2003年為NAEP而開展的項目。該項目旨在探討如何利用科技(特別是計算機)來提高教育評估的質(zhì)量和效率。目前幾乎全國所有學校都配備了電腦,學生們使用電腦的次數(shù)也越來越多,該研究旨在考查學生在基于電腦和紙面的數(shù)學、寫作評估方面的表現(xiàn)。TBA有五個組成部分,包括3項實證研究(數(shù)學在線研究、寫作在線研究和利用高科技解決問題研究)、一個概念文件(電腦適性測驗),以及網(wǎng)上學校和教師問卷部分——此項研究已經(jīng)投入使用。
國家印第安教育研究(The National Indian Education Study,NIES)。這項研究的目的是為了描述在美國的印第安人和阿拉斯加學生的學習狀況,以幫助這些地區(qū)的學生達到《不讓一個孩子落后法案》所規(guī)定的要求。研究由印第安教育辦公室(OIE)贊助,由美國教育部下屬的國家教育資料中心開展。負責制訂研究計劃的是一個由來自全國各地的美洲印第安和阿拉斯加本地教育家和研究人員組成的技術(shù)小組。
標準化測試在美國的發(fā)展可追溯到二戰(zhàn)時期,為了對新征士兵的知識和技能進行有效評估,心理學家和人力資源專家設(shè)計了不同類型可以準確有效評估知識和技能的測試。測試隨后被不斷完善以增強其有效性和程序的可靠性。戰(zhàn)后,這些設(shè)計測試的專業(yè)人員成為設(shè)計美國學校各類測試的專家。標準化測試設(shè)計仔細,對考試結(jié)果進行認真檢驗和嚴格的質(zhì)量控制,可以提供可靠、有效的學生學習信息,經(jīng)過不斷改良和完善,很快推廣到全國各學校,在美國占統(tǒng)治地位,并被很多國家廣泛利用。
但國家標準測試在美國的最初推廣并非一帆風順。美國教育長期以來由各州,而不是聯(lián)邦政府負責,美國學校歷來在內(nèi)容和管理上存在多樣化的特征,各州擁有自己制定教學政策的權(quán)利,因而實行全國性的統(tǒng)一測試幾乎是不可能的。然而事實上,由于美國社會的高度流動性,教師的流動促進了課程與教學方法的相似性,并且美國大多數(shù)學校使用的教材都由少數(shù)幾家出版商出版發(fā)行,因此各州學校實際上都在遵循一個相似的課程與教學模式。到了二十世紀六十年代,隨著美國聯(lián)邦政府在教育中地位的日益增強,針對美國缺乏有關(guān)學生學業(yè)信息的現(xiàn)狀,開展一項全國性學生學業(yè)成績評估體系被提上日程。由于美國憲法規(guī)定教育是各州的職責范圍,反對者們認為建立全國性的評估體系是聯(lián)邦政府試圖擴張在州和地方教育上的權(quán)力。最終,心理學家、教育家泰拉爾夫·勒教授,統(tǒng)計學家約翰·塔基教授等人設(shè)計了一項研究計劃,定期對美國國內(nèi)幾所樣本學校中的學生樣本,而不是全國所有學生進行測試,每四年對相似樣本進行重復檢測,結(jié)果以不記名的方式報告;評估結(jié)果并不用于州與州之間的比較,而是按不同區(qū)域進行報告。至1969年,美國各州教育委員會(ECS)接管了評估體系的管理,教育界的重心才真正轉(zhuǎn)向評估體系的發(fā)展和實施。1983年ETS接替ECS,成立項目政策委員會,并將項目更名為國家教育進展評估。
隨著教育的不斷發(fā)展和改革,標準化測試和國家級評估對美國社會的影響日益增加,美國社會掀起了一股提高國家標準的運動。2001年出臺的《不讓一個孩子掉隊法案》規(guī)定,美國各州必須確立各自的教育標準,以及與之相配套的教材、考試制度和評估模式,不遵守法案要求的州和學校將無法獲得聯(lián)邦政府的財政支持。法案還規(guī)定各州必須在四年級和八年級進行NAEP的閱讀、數(shù)學和科學測試,并將測試結(jié)果與各州自己的測試結(jié)果相對比,如果兩個結(jié)果產(chǎn)生較大差距,則該州必須解釋產(chǎn)生差距的原因。標準化測試作為可靠的測量工具,不僅可以準確提供學生的學習信息,對學校和教師來說也意味著一項新的考驗。沒有達到NAEP測試目標的學校和教師將被監(jiān)督并要求改進,因此教師將更關(guān)注學生的學習情況并對學習較差的學生進行有針對性的輔導。
標準化測試不斷改進和發(fā)展,目前已被運用于幾乎所有的國際教育考試,進一步推動了各國國家教育評估的發(fā)展。比如,多米尼加共和國在美國國際開發(fā)署(USAID)的資助下與教育評估研究聯(lián)盟攜手開展了一項長期評估。一些拉美和非洲國家也在聯(lián)合國教科文組織的資助下開展起地區(qū)性的評估項目。[10]創(chuàng)建于1994年的拉美教育質(zhì)量評估聯(lián)合會如今已發(fā)展到19個成員,創(chuàng)建于1990年的南非和東非教育質(zhì)量監(jiān)督聯(lián)盟如今也發(fā)展到15個成員國家,其中7個國家參加了1995年至1997年的第一次評估,14個國家參加了2000年至2003年的評估研究。過去,一些中央教育集權(quán)的國家發(fā)展國家測試體系的目的主要是為了選拔可以繼續(xù)深造的學生,而不是用于評估課程的設(shè)置和實行情況。[11]隨著時代的變化,如今的重點更多的在于利用測試和評估來判斷教育體系的完善性以達到預期的結(jié)果。[12]在這樣一種新形勢下,國家級與州級教育體系對國家評估和測試的影響之間的區(qū)別就不那么明顯了。以最發(fā)達的國家為例,不論是教育權(quán)力高度集中的法國,還是教育權(quán)力高度分散到州的美國,所有發(fā)達國家都開展了大量的國際化標準測試和國家教育評估。盡管各州的組織結(jié)構(gòu)和教育機構(gòu)有差異,但開展測試和評估的動力和壓力是一致的。這一發(fā)展趨勢直接影響到不同類別的教育系統(tǒng)——從以教室教育為基礎(chǔ)的法國教育制度到證書考試廣泛的美國教育制度。
但標準化測試也不可避免地存在一些缺點,如過多的選擇題無法全面反映那些由手寫答案才能反映出的考生素質(zhì)。此外,由于學校和教師過多地重視統(tǒng)一考試的結(jié)果,教學中的生動性、創(chuàng)造性減少,取而代之的是應試教育的泛濫。教師們主要關(guān)注的不再是教育本身,而是如何幫助學生達到標準化測試的要求。目前的許多標準化測試已開始注意增加論述題、作文題等主觀題型的數(shù)量。瑕不掩瑜,相信標準化測試的高效性、可靠性將使其在未來繼續(xù)發(fā)揮不可替代的優(yōu)勢。
[1]Baker,D.P.,and G.K.LeTendre.National Differences,Global Similarities:World Culture and the Future of Schooling[M].Stanford,CA:Stanford University Press,2005.
[2] [10]Kamens,D.H.and Mcneely,C.L.Globalization and the Growth of International Educational Testing and National Assessment [J].Comparative Education Review,2010,(01):5-25.
[3]OECD (Organization for Economic Cooperation and Development).Education at a Glance,2006[J].Paris:OECD,2006:18.
[4] [9]National Assessment of Educational Progress.http://en.wikipedia.org/wiki/National_Assessment_of_Educa tional_Progress.2010.4.
[5]http://nces.ed.gov/nationsreportcard/worldhistory/and.http://nces.ed.gov/nationsreportcard/foreignlang/.
[6]National Assessment of Educational Progress.http://www2.ed.gov/programs/naep/index.html.
[7]周廷勇.美國高等教育評估的演變及其新發(fā)展[J].復旦教育論壇,2009,7,(3):22.
[8]http://nces.ed.gov/nationsreportcard/about/state.asp.
[11]Eckstein,M.,and H.Noah.Secondary School Examinations [M].New Haven,CT:Yale University Press,1993:102.
[12]Travers,K.,and I.Westbury,eds.The IEA Study of Mathematics I:Analysis of Mathematics Curricula[M].New York:Pergamon,1989:58.