● 邵朝友
評價是課程的基本要素,形成性評價是促進學(xué)生學(xué)習(xí)的重要評價手段。然而形成性評價難以實施的事實中外皆然,實施的困境值得深究。在升學(xué)主義重壓下,選拔與甄別是我國中小學(xué)過去評價的主要功能,2001年政府公布第八輪課程改革政策后,評價的發(fā)展性功能得到大力提倡。但歷經(jīng)十多載,中小學(xué)的評價現(xiàn)實似乎巍然不變,那么,形成性評價的困境為何?本文將采用活動理論,針對A校形成性評價的困境展開分析。
形成性評價正式提出可追溯至上世紀六十年代。1967年,斯立克文(M.Scriven)區(qū)分了課程評鑒的兩種形式,即總結(jié)性評鑒(summative evaluation)與形成性評鑒 (formative evaluation)。1969年,布盧姆(B.Bloom)及其同事建議在學(xué)生學(xué)習(xí)評價領(lǐng)域借鑒這兩種課程評鑒形式,此處的學(xué)生學(xué)習(xí)評價就是所謂的學(xué)業(yè)評價(assessment)。[1]此后,形成性評價與總結(jié)性評價逐漸被人們接受,但形成性評價受關(guān)注程度遠遠低于總結(jié)性評價,許多人認為它對于日常學(xué)校教育沒有多少實踐意義。[2]這種格局一直延續(xù)至1998年才有所徹底改變。
1998年,英國學(xué)者布萊克與威廉(P.Black&D.Wiliam)在綜合了250篇文章的研究結(jié)果基礎(chǔ)上,得到一個令人驚訝又激動的結(jié)論:形成性評價能極大提高學(xué)生學(xué)業(yè)成就,對學(xué)生學(xué)業(yè)成就的效值(effect sizes)高達0.4-0.7。[3]事隔多年后,合作者之一威廉認為這樣的發(fā)現(xiàn)之所以令人振奮,是因為研究結(jié)論乃基于證據(jù)。為了進一步用數(shù)據(jù)來說明形成性評價的巨大作用,威廉重新分析當(dāng)今被認為能有效提高學(xué)業(yè)成就的四種因素——教師專業(yè)發(fā)展、教師學(xué)習(xí)風(fēng)格、神經(jīng)科學(xué)、學(xué)科內(nèi)容知識,并比較它們與形成性評價對學(xué)業(yè)成就的實際影響,最終結(jié)論是,前四者要不缺乏證據(jù),要不效值小于形成性評價。[4]
英國評價變革小組深受布萊克與威廉的發(fā)現(xiàn)所鼓舞,認為國家課程評價應(yīng)大力提倡形成性評價。實質(zhì)上,布萊克與威廉的核心發(fā)現(xiàn)是形成性評價對學(xué)業(yè)成就的巨大作用,高達0.4-0.7效值是目前所有教育方案對學(xué)業(yè)成就作用能達到的最高值。在教育政策制定者眼里,形成性評價如此巨大的作用,意味著能提高學(xué)生分數(shù)與成績,將成為各國教育競爭的勝負手。因此,除英國外,其他國家與學(xué)者也紛紛關(guān)注形成性評價。以美國為例,早在1992年,在美國督導(dǎo)與課程發(fā)展協(xié)會(Association for Superision and Curriculum Development,ASCD)年會上,詹姆斯(M.James)就引介形成性評價。此后更多推進工作被采取,如2005年,斯蒂金斯(R.Stiggins)大力普及形成性評價的思想。[5]至目前為止,形成性評價,已成為美國教育系統(tǒng)的重要一員。
形成性評價作用的發(fā)現(xiàn)并不意味著,我們能輕而易舉地開展形成性評價。恰恰相反,形成性評價在實踐中幾乎舉步維艱。深入分析個中原因,教師評價素養(yǎng)、校外考試制度等是重要因素,只是這些分析大多以單個維度來進行,缺乏整體關(guān)懷。而形成性評價涉及方方面面,需要做整體的分析。
分析形成性評價的困境,情境脈絡(luò)的處理是不可忽略的選擇。注重情境的理論是本文選擇理論架構(gòu)的首要考量?;顒永碚摚╝ctivity theory,AT)是當(dāng)前情境處理的一種重要理論與方法。
活動理論又名為文化—歷史活動理論,理論的核心前提是中介。中介概念在恩格斯托姆(Y.Engestrom)延伸的理論中進一步彰顯:活動理論以三角形為分析架構(gòu)(見圖1)凸顯活動的多重復(fù)雜中介結(jié)構(gòu)。[6]
主體(subject)為活動中的成員,透過工具的中介來接近目標,因此三角形的上層有一個工具中介組件。此外,單一主體并非孤立于世、而是社群的一部分,因此上三角形拓展到下層。下層有兩個較為隱諱的社會中介工具:規(guī)則與分工。主體是透過規(guī)則的中介與社群建立關(guān)系,社群通過分工的中介與目標建立關(guān)系。規(guī)則包括外顯與內(nèi)隱,例如該社群的成文法則與既定俗成的運作規(guī)則等。分工指的是活動如何分散在社群各成員間,包括各成員在活動中扮演的角色、各自行使的權(quán)力、所負責(zé)的任務(wù)等。中介具有雙向性的本質(zhì)(圖各組件之間的雙向箭頭),意指社群中的工具、分工、規(guī)則這些中介工具也會反向影響生活其中的主體。圖1右側(cè)組件目標之外,還有一個結(jié)果,即是凸顯目標具有某種程度的理想性,在實踐中歷經(jīng)轉(zhuǎn)化的過程,涌現(xiàn)的結(jié)果通常不同于目標。
圖1 活動體系的中介結(jié)構(gòu)
個案A校為某課程改革試驗區(qū)初中學(xué)校,有9個教學(xué)班。為提高課堂成效,該校近年來一直致力于有關(guān)形成性評價研究。但從相關(guān)信息看,該校在實施形成性評價并不順利,尤其是校長調(diào)換后,形成性評價陷入低谷。
經(jīng)聯(lián)系與協(xié)商后,兩位教師同意筆者的采訪,下面先對三位教師做一簡介。
教師K:任教初中語文,教齡為16年,已獲得中學(xué)高級職稱,長期從事教育科研,在學(xué)區(qū)科研論文評比中多次獲獎。在訪談開始,教師K就表現(xiàn)出坦誠、豪邁性格。
教師T:任教初中科學(xué),教齡6年,已獲得中學(xué)一級職稱,喜歡教育科研,參與過省市骨干教師培訓(xùn),富有新課程理念,注重課堂評價。訪談開始階段略顯拘束。
教師M:任教初中科學(xué),教齡14年,中學(xué)高級職稱、特級教師后選人,是T教師所在學(xué)校的主管教學(xué)業(yè)務(wù)的副校長。能很好地融合新課程理念于教學(xué)實踐,深受學(xué)生喜歡。訪談過程始終表現(xiàn)得比較穩(wěn)重,堅持自己想法,對自己的行動有信心。
上述受訪者的選擇采取了關(guān)鍵個性抽樣,關(guān)鍵個性抽樣選擇那些可以對事情產(chǎn)生定性影響的個案進行研究,目的是將從這些個案中獲得的結(jié)果邏輯地推論至其他個案。推論的邏輯是:“如果這個事情在這里發(fā)生了,那么它也就一定在其他地方發(fā)生。”這類個案通常代表一種“理想”的好狀態(tài),如本研究的三位受訪者及其所在學(xué)校具有開展形成性評價的較好條件,如果連這樣的個案都不能實施某種行為,那么其他個案一般也是無法實施這種行為的。
形成性評價是種學(xué)習(xí)活動,如果把它置于活動理論之下來考察,我們更能明白形成性評價促進學(xué)習(xí)的內(nèi)在機制。下圖中,要促進學(xué)生學(xué)習(xí)(目標),教師與學(xué)生開展各種有效形成性評價實踐。實踐過程中,教師與學(xué)生、學(xué)生與學(xué)生存在合作與分工關(guān)系,他們不斷加深、調(diào)整自己在評價中身份理解。同時,實踐過程中,教師與學(xué)生受隱性或顯性的學(xué)習(xí)觀點(規(guī)則)及所在班級、學(xué)校、社區(qū)的影響與制約。上述分析僅僅從主體出發(fā),實際情況更為復(fù)雜,下圖中任何一個元素都直接或間接作用著其他元素。
圖2 作為活動體系的形成性評價
雖然訪談具有較大的靈活變化特點,一些事先準備的問題可能在訪談過程不會得到運用,但做好事先準備還是必要的。為此,本研究設(shè)計了如下大致提綱。
表1 訪談提綱
通過整理錄音,整理出三次訪談內(nèi)容?,F(xiàn)用下表統(tǒng)一呈現(xiàn)相關(guān)內(nèi)容,由于訪談過程及細節(jié)有所不同,故呈現(xiàn)的每次訪談問題或細節(jié)都不一樣。
表2 訪談內(nèi)容(節(jié)選)
尋找訪談意義需要通過對內(nèi)容進行登錄。登錄是資料分析中最基本一項工作,是一個將資料打散賦予概念和意義,然后再以新的方式重新組合在一起的操作化過程。[7]例如對于下述訪談內(nèi)容,登錄時可開始建立碼號:
(注:碼號翻譯——1=理念吸引人;2=不會評學(xué)生;3=需要耐心;4=教師考核制度)
建立碼號后,我們可以將所有碼號匯集起來,組成一個編碼本。這是一個將所有碼號按照一定分類標準組合起來的系統(tǒng),反映了資料濃縮以后的意義分布和相互關(guān)系。編碼本有兩個主要作用:將碼號系統(tǒng)地排列出來,使得我們了解現(xiàn)有碼號的數(shù)量、類型以及碼號所代表的意義之間之聯(lián)系,由此而決定現(xiàn)有的碼號是否合理、是否需要增加或減少新的碼號、是否需要改進碼號系統(tǒng)的整體結(jié)構(gòu);為我們今后查找碼號提供方便。[8]完成編碼本后,還需要對所有資料進行歸類,最終得到4個主題。
表3 主題化訪談內(nèi)容
1.工具層面:教師評價素養(yǎng)不足。工具中介是主體與目標,主體通過中介接近目標,目標落實過程也可能因工具的中介效果而影響主體,主體于是在一次次工具中介下,可能受到影響而改變動機或目標。
主體達到目標的外顯工具是各種形成性評價實踐,但問題是教師雖然知道形成性評價非常有用,卻沒有相應(yīng)評價知能。
Y(研究者):就您的了解,貴校流行開展形成性評價嗎?
T:上屆校長比較注重教科研,號召大家盡量少點考試,多從學(xué)生角度出發(fā),把評價作為促進學(xué)生學(xué)習(xí)的手段。開始大家還是積極的。
Y:這么積極的原因是什么?
T:其實大家也都覺得考試太多了,學(xué)生學(xué)得好辛苦,也有一些人開始認識到要好好改變考試的性質(zhì)。只是真正行動起來的,也只有那兩三個教研組。
Y:為什么會這樣?
T:很慚愧,不少老師在實施時不知道到底該怎么做,雖然總覺得到處可做形成性評價,但就連怎么寫作業(yè)評語都不知道怎么操作比較合適,加上也沒有得到專家引領(lǐng),最后還是不了了之。
2.規(guī)則層面:教師形成性評價制度缺位。規(guī)則中介是主體與社群的關(guān)系。社群通過規(guī)則來約束主體,主體也可以沖撞規(guī)則來轉(zhuǎn)化社群。教師和學(xué)生之間通過規(guī)則制度,或關(guān)于學(xué)習(xí)的觀點(隱性或顯性)來顯現(xiàn)。
有關(guān)教師關(guān)于形成性評價的觀點與看法在社群里流行,它們對形成性評價的影響巨大,尤其是學(xué)校內(nèi)教師的評價制度。
Y:要開展形成性評價,您有何建議?
M:我個人認為,首先要學(xué)校層面做出行動,如果學(xué)校本身不重視,教師是不會積極參與的,只能是一些自發(fā)性行為。
Y:學(xué)校怎么行動比較好?
M:不說別的,一個重要條件是,提供制度保障。就是說,學(xué)校要在教師考核里加入形成性評價,只有這樣,大家才能放心去做,否則還不如讓學(xué)生多做題目。
3.分工層面:學(xué)生缺學(xué)習(xí)主動性。分工中介是社群與目標。社群通過分工來接近目標,同樣目標可能打亂原有的分工來轉(zhuǎn)化社群。
教師與學(xué)生、學(xué)生與學(xué)生之間的合作與分工,是社群分工主要構(gòu)成。就其本質(zhì),無論是合作還是分工都建立在學(xué)生學(xué)習(xí)積極性上,而實際顯示學(xué)生學(xué)習(xí)積極性非常匱乏。
Y:您認為形成性評價存在哪些主要困難?
K:這個原因很多,嗯,從學(xué)生角度看,形成性評價最終就是讓學(xué)生負責(zé)起自己的學(xué)習(xí)責(zé)任,因此,學(xué)生要有學(xué)習(xí)積極性。
Y:從評價角度看,學(xué)習(xí)積極性怎么體現(xiàn)?
K:我看,一是能自我評價,就是對自己的作業(yè)或作品進行評價:二是對同學(xué)的作品與作業(yè)進行評價。
4.社群層面:學(xué)校和社會缺配合。學(xué)校是個小社會,學(xué)校氛圍對形成性評價有著重大影響,而傳統(tǒng)上考試文化也滲透于學(xué)校評價實踐。此外,校外一些條件,如教師教育課程設(shè)置也是影響形成性評價重要因素。
Y:開展形成性評價過程,您遇到哪些挑戰(zhàn)?
M:這方面的挑戰(zhàn)有校內(nèi)的氛圍,作為主管教務(wù)的副校長,據(jù)我觀察,學(xué)校目前還沒有達成形成性評價的共識,大家都是走著瞧態(tài)度。實事求是地說,就那么幾個老師在做,不過我覺得已經(jīng)很不錯了。
Y:還有其他什么因素嗎?
M:另外一個挑戰(zhàn)是我不大想說的,因為無法改變。不過說說也無妨,這個挑戰(zhàn)就是我們老祖宗留給我們的考試文化,你說這個我們有能力改變嗎?
Y:呵呵,您還有什么補充沒有?
M:我還是認為,教師的個人專業(yè)素養(yǎng)和評價素養(yǎng)是第一位的,但是現(xiàn)在師范畢業(yè)生在這兩方面都不過硬。因此,我建議師范院校要加大學(xué)科內(nèi)容的培養(yǎng),以及開設(shè)評價專業(yè)課程。
本文以活動理論來分析一所初中形成性評價的實施困境,基于上文分析,從中得到如下相關(guān)結(jié)論:
在工具層面教師評價素養(yǎng)不足,在規(guī)則層面教師評價制度缺位,在分工層面學(xué)生缺乏學(xué)習(xí)主動性,在社群層面學(xué)校和社會缺乏配合。
由于本研究訪談問題設(shè)計中,設(shè)計的問題可能略少,不能充分了解被訪談?wù)叩娜肯敕?,或者遺漏一些其他制約形成性評價的因素。
此外,由于研究并沒有收集其他方面的證據(jù)以便開展三角驗證,因此還有待做更深入、全面的調(diào)查來檢驗研究結(jié)論。
[1]Wiliam,D. (2006).Formative assessment:Getting the focus right.Educational Assessment,11(3&4),283.
[2]Popham,W.J. (2008).Transformative assessment.Association for Supervision and Curriculum Development,p4.
[3]Black,P.,& Wiliam,D. (1998). Assessment and classroom learning.Assessment in Education:Principles,Policy and Practice,5(1),7-73.
[4]Wiliam,D. (2011).Embedded formative assessment.US,Solution Tree Press,pp27-33.
[5]Bennett,R.E. (2009).A critical look at the meaning and basis of formative assessment.Princeton,NJ:Educational Testing Service.
[6]Marsh,C.J. (2007).A critical analysis of the use of formative assessment in schools.Educational Research for Policy and Practice,6,25-29.
[7][8]陳向明.質(zhì)的研究方法與社會科學(xué)研究[M].北京:教育科學(xué)出版社,2000:279、286.