朱 麗
2021 年3 月,十三屆全國(guó)人大四次會(huì)議審議通過的《中華人民共和國(guó)國(guó)民經(jīng)濟(jì)和社會(huì)發(fā)展第十四個(gè)五年規(guī)劃和2035 年遠(yuǎn)景目標(biāo)綱要》提出要“建設(shè)高質(zhì)量教育體系”,“這是新時(shí)代教育發(fā)展的新主題、新方向、新目標(biāo)、新任務(wù)”。實(shí)現(xiàn)教育高質(zhì)量發(fā)展成為我國(guó)“十四五”期間乃至更長(zhǎng)一段時(shí)間的教育發(fā)展目標(biāo)。何謂高質(zhì)量教育體系?它指向能夠滿足人民群眾日益增長(zhǎng)的更高質(zhì)量、更加公平、更加滿足多樣需求、更可持續(xù)發(fā)展、更為安全可靠的教育體系,是體現(xiàn)創(chuàng)新、協(xié)調(diào)、綠色、開放、共享的新發(fā)展理念的教育體系。[1]高質(zhì)量教育體系可謂是新發(fā)展理念在教育領(lǐng)域的具體體現(xiàn)。
教育發(fā)展方向既已明晰,接下來(lái)需要思考的就是如何構(gòu)建高質(zhì)量教育體系、如何衡量教育質(zhì)量的高低等一系列問題。眾所周知,質(zhì)量與價(jià)值是一對(duì)緊密相關(guān)的概念,質(zhì)量的高低決定了價(jià)值的大小,而價(jià)值與評(píng)價(jià)又相伴而行。從評(píng)價(jià)的詞源來(lái)看,“評(píng)價(jià)”(evaluation)一詞源于“價(jià)值”(value)這個(gè)詞,甚至有時(shí)評(píng)價(jià)和價(jià)值被當(dāng)作同義語(yǔ)使用,因?yàn)閮r(jià)值的大小往往取決于評(píng)價(jià),當(dāng)然這種理解未必準(zhǔn)確,因?yàn)閮r(jià)值是先于評(píng)價(jià)而獨(dú)立存在的客觀實(shí)體,但足可說明評(píng)價(jià)與價(jià)值是一對(duì)聯(lián)系緊密的詞。通過價(jià)值,質(zhì)量和評(píng)價(jià)也緊密相連。質(zhì)量的高低及其改進(jìn)需要以一定的評(píng)價(jià)標(biāo)準(zhǔn)為依據(jù),評(píng)價(jià)在質(zhì)量的改進(jìn)中往往起著導(dǎo)向與評(píng)定的作用。因此,構(gòu)建高質(zhì)量教育體系同樣需要有相應(yīng)的教育評(píng)價(jià)與其匹配,高質(zhì)量教育評(píng)價(jià)既是高質(zhì)量教育體系的重要組成部分,也是高質(zhì)量教育體系的重要保障。
教育評(píng)價(jià)既有正式評(píng)價(jià),也有非正式評(píng)價(jià),在日常教育教學(xué)實(shí)踐中幾乎無(wú)處不在,“對(duì)教育實(shí)踐具有巨大的導(dǎo)向作用,好的評(píng)價(jià)促進(jìn)教育和個(gè)人的健康發(fā)展,不好的評(píng)價(jià)則會(huì)誤導(dǎo)、阻礙教育和個(gè)人的發(fā)展”[2]。2020 年10 月,中共中央、國(guó)務(wù)院《深化新時(shí)代教育評(píng)價(jià)改革總體方案》(以下簡(jiǎn)稱“《總體方案》”)指出,“教育評(píng)價(jià)事關(guān)教育發(fā)展方向,有什么樣的評(píng)價(jià)指揮棒,就有什么樣的辦學(xué)導(dǎo)向”。教育評(píng)價(jià)的重要性被提升到前所未有的高度,必須深化教育評(píng)價(jià)改革,發(fā)揮好教育評(píng)價(jià)的指揮棒作用。從某種程度上來(lái)說,深化教育評(píng)價(jià)改革的目的就是提升教育評(píng)價(jià)的質(zhì)量,建立與高質(zhì)量教育發(fā)展相匹配的高質(zhì)量教育評(píng)價(jià)體系。
要明白什么樣的教育評(píng)價(jià)可以稱得上“高質(zhì)量”,其前提是需要明白何謂質(zhì)量,如何判定其高低?!百|(zhì)量”是人們?nèi)粘I钪谐R姟⒊S玫囊粋€(gè)詞,通常用于企業(yè)領(lǐng)域。2000 版GB/T19000—ISO9000 系列標(biāo)準(zhǔn)將質(zhì)量界定為“一組固有特性滿足要求的程度”。從其界定來(lái)看,“質(zhì)量”包括兩層意思:第一,質(zhì)量由一組固有特性組成,這些固有特性需要滿足顧客和其他相關(guān)方的要求;第二,質(zhì)量由其滿足要求的程度加以表征。前者是指產(chǎn)品和服務(wù)的特性符合給定的規(guī)格要求,通常是定量化的要求,可以看作是質(zhì)量的客觀性;后者是指產(chǎn)品和服務(wù)滿足顧客期望,是質(zhì)量的主觀性。對(duì)于物品而言,質(zhì)量好壞、高低是決定其價(jià)值大小和市場(chǎng)價(jià)格高低的關(guān)鍵因素。當(dāng)然,從現(xiàn)實(shí)來(lái)看,如果僅以滿足顧客需要的程度來(lái)評(píng)判產(chǎn)品的質(zhì)量有些絕對(duì),如毒品等壞的東西,無(wú)論怎么能夠滿足用戶的需求都不能說是高質(zhì)量的。因而高質(zhì)量的“高”內(nèi)含著正向的價(jià)值判斷,意味著好的、值得欲求的東西。
某種程度上對(duì)教育評(píng)價(jià)質(zhì)量的反思也可看作是對(duì)“什么是好的教育評(píng)價(jià)”的追問。從問題的屬性來(lái)看,對(duì)教育評(píng)價(jià)本身好壞的評(píng)價(jià)屬于元評(píng)價(jià)范疇。元評(píng)價(jià)概念最初產(chǎn)生于美國(guó),由斯克里文(Scriven,M.S)于20 世紀(jì)60 年代末提出,他認(rèn)為元評(píng)價(jià)就是所謂的“二階評(píng)價(jià)”(second-order evaluation),即對(duì)評(píng)價(jià)的評(píng)價(jià),由另外的評(píng)價(jià)者(有別于原評(píng)價(jià)的評(píng)價(jià)者)對(duì)已實(shí)施或已完成的評(píng)價(jià)進(jìn)行評(píng)價(jià),將原評(píng)價(jià)作為評(píng)價(jià)對(duì)象,對(duì)原評(píng)價(jià)活動(dòng)及評(píng)價(jià)者的表現(xiàn)進(jìn)行價(jià)值判斷,以期提升原評(píng)價(jià)的品質(zhì)。[3]斯克里文的元評(píng)價(jià)是對(duì)原評(píng)價(jià)的評(píng)價(jià),但高質(zhì)量教育評(píng)價(jià)并非簡(jiǎn)單地指對(duì)已實(shí)施的評(píng)價(jià)的評(píng)價(jià),“高質(zhì)量”內(nèi)含著更加公平、更加科學(xué)等“好”的價(jià)值,因而可以將高質(zhì)量的教育評(píng)價(jià)等同于好的、理想的教育評(píng)價(jià)。從根本上說,高質(zhì)量教育評(píng)價(jià)具有以下4 條衡量標(biāo)準(zhǔn)。
就本質(zhì)而言,教育評(píng)價(jià)是一種工具、手段,是基于事實(shí)判斷做出的價(jià)值判斷,要基于事實(shí)、尊重事實(shí),強(qiáng)調(diào)實(shí)事求是,這決定了其必須體現(xiàn)科學(xué)性和專業(yè)性,只有這樣才能客觀真實(shí)全面地評(píng)價(jià)不同對(duì)象。
《總體方案》也明確提出要“堅(jiān)持科學(xué)有效,改進(jìn)結(jié)果評(píng)價(jià),強(qiáng)化過程評(píng)價(jià),探索增值評(píng)價(jià),健全綜合評(píng)價(jià),充分利用信息技術(shù),提高教育評(píng)價(jià)的科學(xué)性、專業(yè)性、客觀性”??茖W(xué)的本質(zhì)在于求“真”,是人類主觀世界對(duì)自然、社會(huì)、人類思維領(lǐng)域客觀規(guī)律和本質(zhì)的認(rèn)識(shí)與反映,科學(xué)本身也可看作是一種值得追求的價(jià)值??茖W(xué)性從“真”的意義上規(guī)定著教育評(píng)價(jià),高質(zhì)量的教育評(píng)價(jià)必然要符合“真”的要求,要遵循教育評(píng)價(jià)自身的規(guī)律性。從實(shí)踐來(lái)看,教育評(píng)價(jià)的科學(xué)性體現(xiàn)在方法、技術(shù)、標(biāo)準(zhǔn)、內(nèi)容等方方面面,強(qiáng)調(diào)基于數(shù)據(jù)、客觀信息來(lái)評(píng)價(jià),追求評(píng)價(jià)結(jié)果的客觀性、準(zhǔn)確性及穩(wěn)定性等。
首先,由于教育評(píng)價(jià)是基于事實(shí)基礎(chǔ)的價(jià)值判斷,教育評(píng)價(jià)的科學(xué)性應(yīng)該體現(xiàn)在循證性上,即基于事實(shí)和數(shù)據(jù)的真實(shí)評(píng)價(jià)。符合科學(xué)性的教育評(píng)價(jià)靠真實(shí)的“數(shù)據(jù)”“證據(jù)”說話,其結(jié)果經(jīng)得起事實(shí)的檢驗(yàn)。比如,對(duì)學(xué)校的評(píng)價(jià),不純粹靠“口碑”,而是通過多種途徑,向不同利益群體采集關(guān)于學(xué)校發(fā)展的各種信息來(lái)綜合判斷,只有這樣的評(píng)價(jià)結(jié)果才具有公信力。
其次,教育評(píng)價(jià)的科學(xué)性體現(xiàn)在信度、效度上。信度和效度是教育測(cè)量中常用的兩個(gè)專業(yè)術(shù)語(yǔ)。信度(reliability)通常是指測(cè)量是否可被重復(fù),即如果我們?cè)谀骋惶囟ǖ臈l件下重復(fù)測(cè)量過程,是否能夠從該測(cè)量工具上獲得相同的(或者相似的)結(jié)果。效度(validity)一般指我們是否測(cè)量了想要測(cè)量的東西:一個(gè)測(cè)量是否能夠“很好”地代表一個(gè)特定的構(gòu)念。[4]有效的測(cè)量不應(yīng)該有偏差。高質(zhì)量的教育評(píng)價(jià)應(yīng)該具有較好的信效度,能夠真實(shí)有效地評(píng)價(jià)學(xué)生、教師等群體,不能僅憑經(jīng)驗(yàn),過于主觀地進(jìn)行評(píng)價(jià)。
最后,教育評(píng)價(jià)的科學(xué)性體現(xiàn)在技術(shù)手段的先進(jìn)性上。Schwandt 和Halpern(1988)假設(shè)一個(gè)好的評(píng)價(jià)需要有技術(shù)質(zhì)量的保證、調(diào)整偏差的能力。[5]一項(xiàng)高質(zhì)量的評(píng)價(jià)往往公信力較高,能夠真實(shí)有效地診斷評(píng)價(jià)對(duì)象的發(fā)展水平。在信息技術(shù)時(shí)代,教育評(píng)價(jià)應(yīng)充分利用各種信息技術(shù)(包括互聯(lián)網(wǎng)、大數(shù)據(jù)和人工智能技術(shù)等)改進(jìn)傳統(tǒng)的評(píng)價(jià)方法,對(duì)評(píng)價(jià)對(duì)象做出客觀、全面的評(píng)價(jià),使評(píng)價(jià)結(jié)果具有更高的可信度和參考價(jià)值。
規(guī)定性亦稱“規(guī)定”,即對(duì)事物自身的限定,是一事物區(qū)別于其他事物的本質(zhì)特性。對(duì)教育評(píng)價(jià)而言,合規(guī)定性意味著作為一種手段,教育評(píng)價(jià)應(yīng)該回歸到自身來(lái)考量其價(jià)值。何謂教育評(píng)價(jià)?被譽(yù)為“教育評(píng)價(jià)之父”的美國(guó)學(xué)者泰勒在其著名的“八年研究”(1933—1940)報(bào)告(《史密斯-泰勒?qǐng)?bào)告》)中正式使用“教育評(píng)價(jià)”這一概念,他明確提出:“評(píng)價(jià)過程本質(zhì)上是一個(gè)確定課程與教學(xué)計(jì)劃實(shí)際達(dá)到教育目標(biāo)的程度的過程。但教育目標(biāo)本質(zhì)上是指人的行為變化,因此,評(píng)價(jià)是一個(gè)確定行為發(fā)生實(shí)際變化的程度的過程?!盵6]顯然,從本質(zhì)屬性來(lái)看,評(píng)價(jià)是確定人的行為實(shí)際發(fā)生變化的一種手段。在《第四代評(píng)估》中,古貝和林肯雖然在理論上將評(píng)價(jià)的發(fā)展劃分為“測(cè)量、描述、判斷、建構(gòu)”4 個(gè)階段,但在實(shí)踐中,評(píng)價(jià)的內(nèi)涵依然常常被窄化為“測(cè)量”,甚至等同于標(biāo)準(zhǔn)化測(cè)試,呈現(xiàn)出明顯的功利主義、管理主義等價(jià)值取向,強(qiáng)調(diào)效率至上,對(duì)教育實(shí)踐起到了消極的導(dǎo)向作用,成為當(dāng)前“唯分?jǐn)?shù)、唯升學(xué)、唯文憑、唯論文、唯帽子”頑瘴痼疾的根源之一。
高質(zhì)量的教育評(píng)價(jià)不僅體現(xiàn)為合科學(xué)性,更要突顯其育人價(jià)值,回歸育人本位,著眼于“培養(yǎng)什么樣的人”這一根本問題?!皽y(cè)量”充其量只是評(píng)價(jià)的一種手段、類型。教育評(píng)價(jià)依據(jù)不同維度可以分為多種類型,如《總體方案》中提出了“過程評(píng)價(jià)、結(jié)果評(píng)價(jià)、增值評(píng)價(jià)、綜合評(píng)價(jià)”等“四個(gè)評(píng)價(jià)”,因而不能僅僅關(guān)注教育評(píng)價(jià)的某一類型而忽略了其他類型,在發(fā)揮評(píng)價(jià)的甄別、選拔功能時(shí)要注重發(fā)揮其發(fā)展性功能,為評(píng)價(jià)對(duì)象的發(fā)展提供更精準(zhǔn)的指導(dǎo);不僅關(guān)注效率,強(qiáng)調(diào)標(biāo)準(zhǔn)化,也要關(guān)注個(gè)性化,促進(jìn)評(píng)價(jià)對(duì)象的多元發(fā)展。合規(guī)定性意味著需要對(duì)教育評(píng)價(jià)本身進(jìn)行研究,探索分層、分類評(píng)價(jià),不僅注重評(píng)價(jià)的效率,更要注重評(píng)價(jià)的效益,即評(píng)價(jià)給人和社會(huì)帶來(lái)的好處、整體收益等。
任何行為與行動(dòng)都是由某種或某些目的引導(dǎo)的。何謂目的?按《現(xiàn)代漢語(yǔ)詞典》的解釋,“目的”是指想要達(dá)到的地點(diǎn)或境地、想要得到的結(jié)果。在英文中,可作“目的”解的詞包括aim、end、target、purpose、intention 等,教育的目的一般取“aim”或“end”,但二者也是有區(qū)別的:end更指一個(gè)個(gè)具體的目標(biāo),各個(gè)end 的實(shí)現(xiàn)即aim。另外,在古希臘語(yǔ)中,telos 的意義既是目的、終點(diǎn),又是最高、最好的狀態(tài)。所以目的就是最好的終點(diǎn)。教育評(píng)價(jià)既然是一種教育活動(dòng),它無(wú)疑既要合乎教育目的,又要有助于教育目的的達(dá)成。亞里士多德說:“一切技術(shù),一切規(guī)劃以及一切實(shí)踐和抉擇,都以某種善為目標(biāo)。”[7]只有以善為目標(biāo)的教育評(píng)價(jià)才可以說是合目的性的,而高質(zhì)量教育評(píng)價(jià)的重要標(biāo)準(zhǔn)必然是合目的性的。
合目的性包含兩個(gè)基本問題:一個(gè)是合乎誰(shuí)的目的,另一個(gè)是合乎什么樣的目的。首先,教育評(píng)價(jià)應(yīng)該合乎誰(shuí)的目的?教育作為社會(huì)的一個(gè)子系統(tǒng),屬于社會(huì)的上層建筑,它必然要服務(wù)于特定社會(huì)和國(guó)家的總體利益與發(fā)展,這決定了在不同的國(guó)家以及同一國(guó)家的不同發(fā)展階段,教育評(píng)價(jià)的目的都有可能不同。例如,在我國(guó)封建社會(huì),特別是自隋唐以來(lái),科舉制是選拔人才的一種評(píng)價(jià)方式,是為封建王朝選拔文官的制度,“學(xué)而優(yōu)則仕”是無(wú)數(shù)文人考取功名的唯一途徑。那么,科舉制必然是為封建王朝服務(wù)的,挑選出來(lái)的人才必然是忠實(shí)于封建皇權(quán)的“經(jīng)世治國(guó)”之才。而在今天,教育是黨之大計(jì)、國(guó)之大計(jì),承擔(dān)著為黨育人、為國(guó)育才的重要職責(zé),這決定了我國(guó)當(dāng)下的教育評(píng)價(jià)目的必須合乎黨和國(guó)家的利益,為培養(yǎng)新時(shí)代中國(guó)特色社會(huì)主義的堅(jiān)定信仰者、維護(hù)者及建設(shè)者服好務(wù)。
其次,教育評(píng)價(jià)應(yīng)該合乎什么樣的目的?《說文解字》中這樣解釋:“教,上所施下所效也”“育,養(yǎng)子使作善也”。教育就其本質(zhì)而言是一種使人向善的活動(dòng),是為了“育人”。人是教育的核心,教育是人(教育者)與人(受教者)共同進(jìn)行的活動(dòng),沒有了人,教育不可能發(fā)生。如此,人是教育的出發(fā)點(diǎn),實(shí)現(xiàn)人的全面發(fā)展則是教育的最高鵠的或稱終極目的。教育中所有的手段都應(yīng)該服務(wù)于這個(gè)終極目的,教育評(píng)價(jià)也不例外。合目的性的教育評(píng)價(jià)必須回歸到教育中人的發(fā)展上來(lái),教育評(píng)價(jià)是手段,人的發(fā)展是目的,不能本末倒置。
科學(xué)性可以看作是教育評(píng)價(jià)工具理性的要求,但教育評(píng)價(jià)除了要合乎工具理性,還需要合乎價(jià)值理性。工具理性和價(jià)值理性是德國(guó)哲學(xué)家馬克斯·韋伯提出來(lái)的,他認(rèn)為工具理性關(guān)注有效性、科學(xué)性、專業(yè)性,而價(jià)值理性則關(guān)注價(jià)值的正當(dāng)性,是行為人注重行為本身所能代表的價(jià)值,即是否實(shí)現(xiàn)社會(huì)的公平、正義、忠誠(chéng)、榮譽(yù)等。價(jià)值理性所關(guān)注的是從某些具有實(shí)質(zhì)的、特定的價(jià)值理念的角度來(lái)看待行為的合理性,突顯了善的價(jià)值。
“教育從本質(zhì)上來(lái)說是一種道德實(shí)踐而不是一種技術(shù)事業(yè)”[8],教育的本質(zhì)屬性決定了教育評(píng)價(jià)同樣不是一項(xiàng)單純的技術(shù)活動(dòng),因而難以如自然科學(xué)那樣做到完全的價(jià)值中立。正如古貝和林肯所言,“我們沒有把評(píng)估當(dāng)作一種純粹的科學(xué)過程,因?yàn)槲覀兇_信這樣做會(huì)完全忽略評(píng)估學(xué)的社會(huì)、政治、價(jià)值取向等基本特征”[9]。僅僅關(guān)注教育評(píng)價(jià)的科學(xué)性是不夠的,因?yàn)椤翱茖W(xué)能回答是什么和曾經(jīng)是什么的問題,但回答不了應(yīng)當(dāng)是什么和應(yīng)當(dāng)做什么的問題”[10]。而且科學(xué)的“真”限于人類特定時(shí)期的認(rèn)識(shí)局限性以及人類自身的有限理性,并不是亙古不變的,而是隨著科學(xué)技術(shù)的發(fā)展和人類認(rèn)識(shí)的提高而不斷變化的。因此,如果僅僅關(guān)注教育評(píng)價(jià)的“真”,可能會(huì)忽略掉更多更具價(jià)值的東西。以學(xué)生評(píng)價(jià)為例,由于學(xué)生的情感態(tài)度、思維發(fā)展等特性難以測(cè)量,對(duì)學(xué)生的評(píng)價(jià)如果僅依賴于標(biāo)準(zhǔn)化測(cè)試中知識(shí)的掌握程度,考試分?jǐn)?shù)就會(huì)成為衡量學(xué)生發(fā)展的唯一尺度,從而產(chǎn)生一系列不良后果。正如有論者所言,“對(duì)學(xué)生的每一次評(píng)價(jià),乃至每一次測(cè)驗(yàn)、每一個(gè)分?jǐn)?shù)都會(huì)對(duì)其造成影響。僵化呆板的測(cè)試,不管其技術(shù)成分如何完善,都會(huì)影響學(xué)習(xí)者以后的發(fā)展與創(chuàng)新”[11]。
高質(zhì)量的教育評(píng)價(jià)不僅要以合乎科學(xué)的方式進(jìn)行,還要以合乎道德的方式進(jìn)行。對(duì)于教育評(píng)價(jià)科學(xué)性的重要指標(biāo)“效度”,荷蘭學(xué)者比斯塔將其分為“技術(shù)性效度”和“規(guī)范性效度”:前者是關(guān)于“我們正在測(cè)量的是不是我們想要測(cè)量的”,后者是關(guān)于“我們?cè)跍y(cè)量我們真正重視的,還是僅僅在測(cè)量我們能輕易測(cè)量到并且最終能評(píng)估的東西”[8]。結(jié)構(gòu)效度、內(nèi)容效度均屬于“技術(shù)性效度”。除了重視評(píng)價(jià)的技術(shù)性效度,我們同樣要關(guān)注其“規(guī)范性效度”,不僅要關(guān)注評(píng)價(jià)方法的有效性,還要考慮其價(jià)值性,即對(duì)誰(shuí)有用、為什么有用。英國(guó)評(píng)價(jià)協(xié)會(huì)的指南概括了好的教育評(píng)價(jià)的8 項(xiàng)原則:目的明確(clarity)、結(jié)論真實(shí)(integrity)、獨(dú)立開展(independence)、結(jié)果可及(accessibility)、公正可信(trust)、平等守正(equity)、原理透明(transparency)及多樣性觀照(diversity)[12],這些原則從評(píng)價(jià)的目的、過程、結(jié)果等多個(gè)方面對(duì)“什么是好的教育評(píng)價(jià)”進(jìn)行了規(guī)定性描述,其中公正可信、平等守正、多樣性觀照等都可以看作是教育評(píng)價(jià)合倫理性的表現(xiàn)。
一個(gè)合倫理性的教育評(píng)價(jià)應(yīng)該包括公正、民主、關(guān)懷等多種倫理價(jià)值。公正可以看作是教育評(píng)價(jià)的首要倫理價(jià)值,一個(gè)不公正的教育評(píng)價(jià)無(wú)論技術(shù)多么完美,都是沒有價(jià)值的。公正的教育評(píng)價(jià)不僅要做到程序公正,也要保證結(jié)果公正,正確處理好程序公正與結(jié)果公正之間的關(guān)系;民主體現(xiàn)在教育評(píng)價(jià)的利益相關(guān)者都應(yīng)有權(quán)正當(dāng)表達(dá)自己的利益訴求,并不同程度地參與到評(píng)價(jià)中來(lái),而不僅是評(píng)價(jià)結(jié)果的被動(dòng)接受者;關(guān)懷體現(xiàn)在教育評(píng)價(jià)應(yīng)該關(guān)照評(píng)價(jià)對(duì)象的差異性和多樣性,既要堅(jiān)持同樣的衡量標(biāo)準(zhǔn),又要兼顧個(gè)性與差異。
從現(xiàn)實(shí)來(lái)看,我國(guó)教育評(píng)價(jià)仍存在諸多問題和困境。當(dāng)前乃至今后很長(zhǎng)一段時(shí)間,教育評(píng)價(jià)改革應(yīng)致力于破“五唯”,不僅要“破”,更要做到“立”?!捌啤钡哪繕?biāo)很明確,但為何要“立”、“立”什么,這些需要回到教育評(píng)價(jià)自身去進(jìn)行原點(diǎn)式思考,形成人們對(duì)高質(zhì)量教育評(píng)價(jià)的共識(shí),去除教育評(píng)價(jià)的功利價(jià)值,引導(dǎo)其重歸人的本體價(jià)值,以此建立良好的教育生態(tài),避免陷入“評(píng)價(jià)不改,改革難以成功”的惡性循環(huán)中去。
人的發(fā)展問題是馬克思主義哲學(xué)的一個(gè)根本問題。馬克思主義認(rèn)為,人的發(fā)展是“人以一種全面的方式,也就是說,作為一個(gè)完整的人,占有自己的全面的本質(zhì)”,“人的發(fā)展的最高境界是人的自由全面發(fā)展,是人的本質(zhì)的真正實(shí)現(xiàn)”?!叭说娜姘l(fā)展”可以看作是馬克思主義思想的核心。進(jìn)入新時(shí)代以來(lái),習(xí)近平總書記高度關(guān)注人的發(fā)展,提出以人民為中心的發(fā)展思想,多次指出要“不斷促進(jìn)人的全面發(fā)展”。他在《之江新語(yǔ)》中指出:“人,本質(zhì)上就是文化的人,而不是‘物化’的人;是能動(dòng)的、全面的人,而不是僵化的、‘單向度’的人?!边@是對(duì)馬克思主義人的全面發(fā)展思想的繼承,也是習(xí)近平新時(shí)代中國(guó)特色社會(huì)主義思想的重要內(nèi)容。人的培養(yǎng)是教育的首要職責(zé)與核心使命,而“培養(yǎng)什么樣的人”始終是教育首先要回答的問題,這是方向性的問題。2018 年,在全國(guó)教育大會(huì)上,習(xí)近平總書記站在黨和國(guó)家事業(yè)發(fā)展全局的戰(zhàn)略高度,指出教育工作的根本任務(wù)是“培養(yǎng)德智體美勞全面發(fā)展的社會(huì)主義建設(shè)者和接班人”。教育評(píng)價(jià)是教育工作的“指揮棒”,人的全面發(fā)展需要與此相應(yīng)的評(píng)價(jià)來(lái)引領(lǐng)和保障,否則,全面發(fā)展的育人目標(biāo)永遠(yuǎn)只是“空中樓閣”,可望而不可即。
測(cè)量的效度不能僅考慮其技術(shù)性效度,即是否有效,還要考慮其規(guī)范性效度,即“對(duì)什么有效”,這關(guān)系到對(duì)“什么是高質(zhì)量教育”問題的回答。高質(zhì)量教育必然是關(guān)注人的全面發(fā)展的教育。高質(zhì)量教育評(píng)價(jià)必須服從于、服務(wù)于高質(zhì)量教育的目的,即促進(jìn)人的全面發(fā)展。
元評(píng)價(jià)是教育評(píng)價(jià)專業(yè)化發(fā)展到一定階段后的產(chǎn)物,它基于對(duì)教育評(píng)價(jià)的批判與反思而產(chǎn)生,能夠更好地推動(dòng)教育評(píng)價(jià)的專業(yè)化發(fā)展,對(duì)教育評(píng)價(jià)質(zhì)量起到重要的保障作用。《總體方案》是新時(shí)代引領(lǐng)教育評(píng)價(jià)改革的一個(gè)綱領(lǐng)性文件,彰顯了新時(shí)代教育評(píng)價(jià)改革的重要性和艱巨性,在這一背景下,建立完善的教育元評(píng)價(jià)機(jī)制以提高教育評(píng)價(jià)質(zhì)量就顯得尤為重要了。
一是建立教育元評(píng)價(jià)制度。當(dāng)前,黨和國(guó)家非常重視教育評(píng)價(jià)改革,除了《總體方案》,還陸續(xù)出臺(tái)了《幼兒園保育教育質(zhì)量評(píng)估指南》《義務(wù)教育質(zhì)量評(píng)價(jià)指南》《普通高中學(xué)校辦學(xué)質(zhì)量評(píng)價(jià)指南》等系列文件,對(duì)基礎(chǔ)教育質(zhì)量評(píng)價(jià)進(jìn)行深入、系統(tǒng)的頂層設(shè)計(jì),為基礎(chǔ)教育高質(zhì)量發(fā)展提供了標(biāo)準(zhǔn)和方向。美中不足的是,這些文件均指向教育質(zhì)量,對(duì)教育評(píng)價(jià)的元評(píng)價(jià)尚未涉及,還需要建立教育元評(píng)價(jià)制度,確保教育評(píng)價(jià)自身的高質(zhì)量發(fā)展。
二是制定教育元評(píng)價(jià)標(biāo)準(zhǔn)。標(biāo)準(zhǔn)是衡量一個(gè)產(chǎn)品質(zhì)量好壞的“尺子”,規(guī)定了產(chǎn)品的類型、品種、結(jié)構(gòu)等,對(duì)生產(chǎn)者的行為起著引導(dǎo)和規(guī)范作用。對(duì)于什么是高質(zhì)量的教育評(píng)價(jià)也應(yīng)該制定相應(yīng)的評(píng)價(jià)標(biāo)準(zhǔn)。美國(guó)教育評(píng)估標(biāo)準(zhǔn)聯(lián)合委員會(huì)(JCSEE)制定了元評(píng)價(jià)標(biāo)準(zhǔn),分為4 類:效用性標(biāo)準(zhǔn)(utility standards)、可行性標(biāo)準(zhǔn)(feasibility standards)、適切性標(biāo)準(zhǔn)(propriety standards)及精確性標(biāo)準(zhǔn)(accuracy standards)。[13]2011 年,美國(guó)教育評(píng)估標(biāo)準(zhǔn)聯(lián)合委員會(huì)在此4 條標(biāo)準(zhǔn)的基礎(chǔ)上增加了評(píng)估問責(zé)標(biāo)準(zhǔn)。具體的元評(píng)價(jià)指標(biāo)主要是依據(jù)這5 條標(biāo)準(zhǔn)來(lái)制定的。筆者認(rèn)為,前4 條標(biāo)準(zhǔn)更多的是從科學(xué)性的角度進(jìn)行評(píng)價(jià),而評(píng)估問責(zé)標(biāo)準(zhǔn)則是依據(jù)評(píng)價(jià)結(jié)果來(lái)實(shí)施相應(yīng)的獎(jiǎng)懲,并不能全面評(píng)價(jià)何謂高質(zhì)量的教育評(píng)價(jià)。如前所述,高質(zhì)量教育評(píng)價(jià)具有多重價(jià)值,除了合科學(xué)性和合規(guī)定性,還應(yīng)該包括合目的性和合倫理性,這是由教育自身的工具屬性和道德屬性所共同決定的。
三是確定元評(píng)價(jià)主體。評(píng)價(jià)發(fā)生在評(píng)價(jià)主體與評(píng)價(jià)對(duì)象之間,那么,誰(shuí)來(lái)評(píng)價(jià)教育評(píng)價(jià)呢?元評(píng)價(jià)根據(jù)實(shí)施主體不同可分為內(nèi)部和外部評(píng)價(jià)兩類。內(nèi)部元評(píng)價(jià)主要是元評(píng)價(jià)的實(shí)施主體依據(jù)相關(guān)評(píng)價(jià)標(biāo)準(zhǔn)對(duì)評(píng)價(jià)設(shè)計(jì)、實(shí)施等進(jìn)行評(píng)價(jià),查找元評(píng)價(jià)實(shí)施過程中存在的問題與不足。外部元評(píng)價(jià)主要由評(píng)價(jià)委托方或者其他利益相關(guān)者(如學(xué)校)發(fā)起,獨(dú)立、中立的第三方評(píng)價(jià)機(jī)構(gòu)是實(shí)施元評(píng)價(jià)的主體,它必須獨(dú)立于前二者,且要具有更高的公認(rèn)的權(quán)威性,以便客觀地實(shí)施元評(píng)價(jià)。
在信息技術(shù)時(shí)代,5G、大數(shù)據(jù)、云計(jì)算、人工智能等已深深影響了學(xué)校教育教學(xué)變革,在為教育評(píng)價(jià)改革發(fā)展帶來(lái)挑戰(zhàn)的同時(shí)帶來(lái)了新的機(jī)遇,也為探索“四個(gè)評(píng)價(jià)”改革、破除“唯分?jǐn)?shù)”“唯升學(xué)”的頑瘴痼疾提供了新的思路和技術(shù)支持。高質(zhì)量教育評(píng)價(jià)需要技術(shù)賦能,更充分地掌握評(píng)價(jià)對(duì)象的有效信息,從而對(duì)評(píng)價(jià)對(duì)象做出更加客觀、更加科學(xué)的評(píng)價(jià)。
當(dāng)前,評(píng)價(jià)改革是教育綜合改革進(jìn)程中的難點(diǎn)問題,而信息技術(shù)既需要先進(jìn)的設(shè)施設(shè)備與之配套,也需要評(píng)價(jià)者具備較高的信息素養(yǎng)和評(píng)價(jià)專業(yè)素養(yǎng),因而以技術(shù)賦能高質(zhì)量教育評(píng)價(jià)依然處于探索階段。首先,要設(shè)定多維度的綜合評(píng)價(jià)標(biāo)準(zhǔn)或維度,借助現(xiàn)代信息技術(shù)伴隨式地采集被評(píng)價(jià)者學(xué)習(xí)、生活的長(zhǎng)程數(shù)據(jù),如通過“依靠智能傳感器、智能可穿戴設(shè)備、智能攝像頭、智能學(xué)習(xí)終端等采集非結(jié)構(gòu)化行為數(shù)據(jù)”[14],形成大數(shù)據(jù)庫(kù),依據(jù)評(píng)價(jià)指標(biāo)篩選、處理、分析數(shù)據(jù),對(duì)被評(píng)價(jià)者進(jìn)行全過程、全方位的評(píng)價(jià),形成每一個(gè)個(gè)體的“數(shù)字畫像”,這對(duì)強(qiáng)化過程評(píng)價(jià)、改進(jìn)結(jié)果評(píng)價(jià)能起到很好的支持作用。其次,開發(fā)更加智能化的高質(zhì)量教育評(píng)價(jià)系統(tǒng),探索增值評(píng)價(jià)和綜合評(píng)價(jià)。增值評(píng)價(jià)以發(fā)展為導(dǎo)向,最早由美國(guó)田納西州于20 世紀(jì)80 年代開發(fā),因而又被稱為田納西增值評(píng)價(jià)系統(tǒng)(TVAAS)。為解決以學(xué)生單次測(cè)試成績(jī)衡量教師水平所造成的教育公正問題,增值評(píng)價(jià)以學(xué)生標(biāo)準(zhǔn)化測(cè)試成績(jī)間的進(jìn)步幅度衡量教師效能,綜合考量各種因素對(duì)學(xué)生學(xué)習(xí)結(jié)果的影響,顯然這一做法對(duì)學(xué)校特別是薄弱學(xué)校更加公平。而綜合評(píng)價(jià)不僅是評(píng)價(jià)內(nèi)容的綜合,也是評(píng)價(jià)方法和評(píng)價(jià)主體的多元。開發(fā)現(xiàn)代智能測(cè)評(píng),不僅要評(píng)價(jià)學(xué)生學(xué)業(yè)成績(jī),也要評(píng)價(jià)學(xué)生的學(xué)習(xí)品質(zhì),如學(xué)習(xí)興趣、毅力、思維品質(zhì)等,同時(shí)要積極探索德、體、美、勞等四育評(píng)價(jià),破解學(xué)生綜合素質(zhì)評(píng)價(jià)的難點(diǎn)。在評(píng)價(jià)學(xué)校時(shí),有效剔除學(xué)校自身無(wú)法控制的因素來(lái)測(cè)量學(xué)校系統(tǒng)、教師對(duì)學(xué)生學(xué)業(yè)進(jìn)步的“凈影響”,做到公平、公正,引導(dǎo)學(xué)校樹立正確的人才觀,營(yíng)造更好的教育生態(tài)環(huán)境。