胡 進
在基礎(chǔ)教育領(lǐng)域,基于課程標準對學生學業(yè)成就進行評價,是當前國際上提升基礎(chǔ)教育質(zhì)量的通常做法。[1]為此,研制義務(wù)教育學科評價方案已經(jīng)成為近年來教育評價的熱點問題。德國教育和文化事務(wù)部長常設(shè)會議(簡稱KMK,德國是個聯(lián)邦制國家,教育與文化等管理權(quán)屬于地方各個州政府,KMK 主要負責協(xié)調(diào)德國各州在教育方面的合作)將其工作重點放在制定和推出國家教育標準上,旨在幫助改善和確保德國教育體系的質(zhì)量。[2]2003 年,基于PISA 測試結(jié)果表現(xiàn)不佳的現(xiàn)狀,為了對基礎(chǔ)教育教學質(zhì)量進行反思與改進,KMK 通過了德語、數(shù)學、英語和法語中級Ⅰ標準;2004 年10 月通過了小學德語、數(shù)學標準,以及德語、數(shù)學、英語和法語的初中畢業(yè)標準(中級Ⅱ標準);2004 年12 月通過了科學(生物、化學和物理)中級I 標準;2013 年10 月通過科學(生物、化學和物理)初中畢業(yè)標準(中級Ⅱ標準)。KMK 還要求德意志聯(lián)邦共和國16 個州在2004—2005 學年和2005—2006 學年開始執(zhí)行上述標準。[3]可以看出,德國由原來強調(diào)學科內(nèi)容標準的投入型教育質(zhì)量控制轉(zhuǎn)為強調(diào)學科能力標準的產(chǎn)出型教育質(zhì)量控制。
北京市自2003 年啟動了義務(wù)教育階段教學質(zhì)量分析與評價反饋系統(tǒng)項目研究,之前在多輪的學科評價方案及評價測試研究中,依據(jù)國際學業(yè)測試發(fā)展的最新研究成果,對評價方案進行了不斷修訂與完善。截至2014 年,已經(jīng)形成了義務(wù)教育階段學業(yè)質(zhì)量監(jiān)測15 個學科評價方案(下文簡稱北京市學科評價方案)。2014 年,北京市義務(wù)教育教學質(zhì)量分析與評價反饋系統(tǒng)項目停止,北京市的教育監(jiān)測并入國家監(jiān)測體系。[4]
中小學教育標準或?qū)W科評價方案不僅是評價學生學業(yè)質(zhì)量的根本依據(jù),也是教師開展課堂教學的重要參考。然而,我國目前學業(yè)質(zhì)量評價方案的相關(guān)研究仍處于發(fā)展階段,大部分?。ㄊ小^(qū))開展的學業(yè)測試都是直接依據(jù)學科課程標準對學科內(nèi)容與能力進行測試與評價的,未能基于學科課程標準研發(fā)翔實的評價方案。德國中小學教育標準與北京市學科評價方案均于2003 年開始施行,兩者都是由先進理念引領(lǐng)的、指向教育質(zhì)量監(jiān)測的評價方案。研究兩者在目的意義、結(jié)構(gòu)體系、內(nèi)容呈現(xiàn)等方面的異同,對我國其他?。ㄊ?、區(qū))設(shè)計具有本地特色的學科評價方案有很好的啟示意義。
(1)組建了多元化跨學科團隊開展教育標準或評價方案研究,形成了系統(tǒng)的結(jié)構(gòu)體系
德國中小學教育標準集合了教育學、心理學和學科教學法領(lǐng)域的專家智慧與力量,規(guī)定了學生在學校學習的某一時段應(yīng)具備的學科能力。其主要包括學科的教育意義、學科的能力領(lǐng)域、學科能力領(lǐng)域的標準、任務(wù)示例四個部分。德國中小學教育標準聚焦學生學科能力發(fā)展,對學科能力水平進行了深入研究,從學科能力結(jié)構(gòu)模型、測試開發(fā)、能力等級程序、能力水平模型、能力水平說明、學生能力水平分布情況進行了細化闡述,其中的能力結(jié)構(gòu)模型相當于北京市學科評價方案中的評價框架。德國中小學教育標準聚焦學生學科能力發(fā)展這一核心詞匯,以學生能力發(fā)展為主線,既為學生提供了學科成就水平的清晰描述,也為教師提供了分析、規(guī)劃和檢驗學科核心領(lǐng)域的教學指南,還為學校督導和咨詢提供了基礎(chǔ)性的參照??梢?,德國中小學教育標準關(guān)注學生應(yīng)用知識和技能解決學科問題的能力的發(fā)展,能夠引導學校及教師通過教與學的過程,促進學生學科能力的持續(xù)發(fā)展。
北京市學科評價方案主要包括概述、學科評價框架、內(nèi)容標準、評價方式與題型、評價領(lǐng)域分數(shù)構(gòu)成、學業(yè)成就水平描述、題目示例、測試試題呈現(xiàn)等內(nèi)容。該方案還對關(guān)鍵的核心概念,如學業(yè)水平測試、內(nèi)容標準、學業(yè)成就水平逐一進行了界定。
德國和北京雙方都借鑒并吸納了國際教育測評框架的特色,組建了囊括教育學、心理學和學科教學研究等領(lǐng)域的跨學科研發(fā)團隊開展教育標準或評價方案的研究,形成了完整、系統(tǒng)的結(jié)構(gòu)體系,為學業(yè)質(zhì)量監(jiān)測奠定了扎實的基礎(chǔ)。
(2)注重建構(gòu)多維的學科能力結(jié)構(gòu)模型或評價框架
德國學科能力結(jié)構(gòu)模型與北京市學科評價框架均屬于中小學教育標準或?qū)W科評價方案的核心、關(guān)鍵內(nèi)容。該模型或評價框架是開展學科學業(yè)質(zhì)量監(jiān)測的基礎(chǔ)。德國中小學教育標準中的學科能力結(jié)構(gòu)模型建構(gòu)了統(tǒng)一的跨學科評價框架,即立體的長方體結(jié)構(gòu),包括認知過程、能力、內(nèi)容復(fù)雜性3 個維度(詳見圖1),并進一步細化了以上3 個維度的二級維度。德國學科能力結(jié)構(gòu)模型是建立在跨學科基礎(chǔ)之上的立體結(jié)構(gòu),其中,內(nèi)容復(fù)雜性維度指向?qū)W科知識獲得的復(fù)雜度,認知過程維度指向認知水平的分層,能力維度指向?qū)W科能力的分類與發(fā)展。
1.突出抓好重點領(lǐng)域、重點行業(yè)和重點企業(yè)的節(jié)能減排。對于勝利油田各采油廠、較大規(guī)模的石化、輪胎、造紙等重點企業(yè),加大投資力度,加快重點污染行業(yè)廢水深度處理工程建設(shè),實現(xiàn)廢水資源化利用,減少污染物排放。大力實施電廠脫硫工程建設(shè),進一步改善空氣質(zhì)量。對于勝利發(fā)電廠、全市其他熱電廠進行脫硫升級改造。繼續(xù)加大流域綜合治理,通過實施清淤疏浚、河道綜合整治、沿岸沿線綠化、沿線面源綜合治理等工程,力爭實現(xiàn)“有河有水、有水有魚、河流清澈、生態(tài)和諧”的目標。
圖1 德國學科能力結(jié)構(gòu)模型
以科學學科為例,它包括物理、化學、生物學科,其學科能力結(jié)構(gòu)框架均統(tǒng)一為認知過程、能力、內(nèi)容復(fù)雜性3 個一級維度,且細化了一級維度以下的二級維度。由圖2 可知,科學學科能力結(jié)構(gòu)模型的認知過程包括:復(fù)制、選擇、組織、整合;能力包括處理專業(yè)知識、學習、溝通、評價;內(nèi)容復(fù)雜性包括一級-一個事實、二級-兩個事實、三級-上下文、四級-兩種語境、五級-總體概念。[5]德國中小學教育標準的科學學科能力結(jié)構(gòu)模型打破了物理、化學、生物的學科壁壘,實現(xiàn)了一級、二級維度的完全統(tǒng)一,這樣有機統(tǒng)一的能力結(jié)構(gòu)框架有利于物理、化學、生物學科能力水平的全面、系統(tǒng)呈現(xiàn)。
圖2 科學學科(物理、化學、生物)能力結(jié)構(gòu)模型
圖3 中學數(shù)學學科能力結(jié)構(gòu)模型
以數(shù)學學科為例,其能力結(jié)構(gòu)模型由認知水平、數(shù)學能力、數(shù)學內(nèi)容3 個維度構(gòu)成(見圖3),其中認知水平包括再現(xiàn)、聯(lián)系、概括與反思;數(shù)學能力包括推理和論證、解決問題、建模、表征與應(yīng)用、技能運用和正式程序、交流;數(shù)學內(nèi)容包括數(shù)字、測量、空間與圖形、函數(shù)關(guān)系、數(shù)據(jù)與概率。[3]
北京市學科評價框架中的大部分學科建立了知識、能力的兩維框架,部分學科建立了內(nèi)容、能力、情感態(tài)度與價值觀的三維框架。按照我國學科課程標準的要求,內(nèi)容領(lǐng)域是基于課標的學科內(nèi)容進行劃分的;能力領(lǐng)域分為識記、理解、應(yīng)用3 個層次;情感態(tài)度與價值觀包括經(jīng)歷、反應(yīng)、領(lǐng)悟3 個水平。以北京市2012 年物理學科評價方案為例,物理學科評價框架包括內(nèi)容領(lǐng)域及能力領(lǐng)域。①內(nèi)容領(lǐng)域包括科學探究和科學內(nèi)容兩部分:科學探究部分從過程和方法的角度提出了科學探究的基本要素和程序;科學內(nèi)容則是科學探究的內(nèi)容載體,它分為物質(zhì)、運動和相互作用、能量3 個主題。②按照義務(wù)教育物理學習的認知過程和特點,能力領(lǐng)域分為了解、理解和應(yīng)用3個層次。
分析德國的學科能力結(jié)構(gòu)模型和北京市學科評價框架可以發(fā)現(xiàn),兩者均建立了統(tǒng)一的學科評價結(jié)構(gòu)模型,其目的是以學科知識為載體,促進學生認知能力以及學科能力的發(fā)展。不論是德國的學科能力結(jié)構(gòu)模型還是北京市學科評價框架,它們都是基于學科測試任務(wù)開發(fā)的,聚焦學生學科能力的測量與發(fā)展。
(3)強調(diào)以學科知識為載體,促進學生學科能力的提升
表1 德國能力結(jié)構(gòu)模型與北京市評價框架的比較(以科學學科為例)
德國學科能力結(jié)構(gòu)模型建構(gòu)的是三維結(jié)構(gòu),包括認知過程、能力、內(nèi)容復(fù)雜性3 個維度,其中有一維指向能力相關(guān)的內(nèi)容,一維指向認知水平分層,一維指向?qū)W科能力的分類與發(fā)展;北京市學科評價框架亦是二維或三維結(jié)構(gòu),其中一維指向?qū)W科內(nèi)容,一維指向?qū)W科能力,且學科能力維度細化為識記、理解、應(yīng)用3 個層次。二者建構(gòu)的共同維度是內(nèi)容維度、能力維度,它們均以學科知識為載體,促進學生學科能力水平的發(fā)展。這樣多維的評價框架,保障了學業(yè)質(zhì)量監(jiān)測不再單純固化于單一的學科知識點,而是從學科能力角度進行分析與評價的。詳見表1。
(1)北京市學科評價方案涉及的學科更為廣泛而且全面
北京市義務(wù)教育階段教學質(zhì)量分析與評價反饋系統(tǒng)項目經(jīng)過12 年的發(fā)展,已經(jīng)形成了義務(wù)教育階段學業(yè)質(zhì)量監(jiān)測15 個學科評價方案,學科評價方案以五、八年級為主,部分學科、部分年度涉及三年級語文、數(shù)學、美術(shù)和九年級化學。其中大多數(shù)學科的評價方案,如五、八年級的語文、數(shù)學、英語、音樂、體育,八年級的歷史、地理等,經(jīng)過了幾輪的修訂,內(nèi)容得到不斷改進,趨于完善,呈現(xiàn)出全面性的特點。而德國中小學教育標準只涉及德語、法語、英語、數(shù)學、物理、化學、生物等學科。
德國中小學教育標準關(guān)注學科能力研究,將學科能力結(jié)構(gòu)模型從中小學教育標準中獨立出來成文,對學科能力結(jié)構(gòu)模型、能力等級程序、設(shè)計能力水平模型、說明能力水平分布逐一進行細化。學科能力結(jié)構(gòu)模型設(shè)置了獨立的認知過程與能力維度,對這兩個維度有了清晰、明確的指向與劃分:認知過程維度包括復(fù)制、選擇、組織、整合;能力維度包括處理專業(yè)知識、發(fā)現(xiàn)、溝通、評價。[6]例如,德國中學數(shù)學學科能力結(jié)構(gòu)模型緊緊圍繞數(shù)學學科內(nèi)容描述學生數(shù)學能力,強調(diào)學生通過認知過程的發(fā)展,獲得與數(shù)學學科內(nèi)容相關(guān)能力的提升??茖W學科能力結(jié)構(gòu)模型是統(tǒng)一建構(gòu)物理、化學、生物3 個學科的學科框架,它緊緊圍繞科學學科內(nèi)容描述學生的科學能力,對科學能力進行認知水平劃分,強調(diào)學生應(yīng)該提升的科學能力?;趯W科知識獨立地劃分學科能力與認知水平,能更細致地評估學生的學科能力。
與德國學科能力結(jié)構(gòu)模型單獨形成詳細的實施方案不同的是,北京市學科評價框架仍然屬于學科評價方案的重要組成部分,還沒有獨立出來做細化的闡述。北京市學科評價框架的三維框架中有一維是能力,將其分為了解、理解和應(yīng)用3個認知水平,且參照布盧姆目標分類學理論對這3 個水平的認知層次進行了內(nèi)涵描述,并對每個認知層次進行了行為動詞分類梳理,如表2 中的物理能力領(lǐng)域的認知層級。但是,它沒有對認知過程與學科能力清晰地進行深度區(qū)分。一級維度指向?qū)W科能力,二級維度又指向認知水平層級,在一個能力維度中涵蓋認知要求,缺乏更加上位、概括的學科能力標準。為此,北京市學科評價框架可以借鑒德國學科能力結(jié)構(gòu)模型對能力與認知過程的劃分要求,更好地進行梳理與區(qū)分。
(3)德國學科能力結(jié)構(gòu)模型的內(nèi)容維度突破了學科內(nèi)容主題的分類,探索了知識復(fù)雜性的分層
表2 北京評價框架中物理能力領(lǐng)域的認知層級
德國物理、化學、生物能力結(jié)構(gòu)模型的內(nèi)容維度采用了突破學科內(nèi)容主題的分類方式,從內(nèi)容的復(fù)雜性進行分層,包括了五個層級:一級-一個事實、二級-兩個事實、三級-上下文、四級-兩種語境、五級-總體概念。
而北京市學科評價方案的內(nèi)容維度則是嚴格依照學科課程標準的課程內(nèi)容或課程主題進行劃分的,沒有突破學科課程內(nèi)容或課程主題做進一步的加工分層。北京市學科評價方案按照學科課程標準的內(nèi)容主題這一單一線索設(shè)計內(nèi)容維度,雖然能清晰地對學科內(nèi)容主題進行分類,但未能對學科內(nèi)容復(fù)雜性方面進行細化分層,不能體現(xiàn)學科知識內(nèi)容的發(fā)展與遞進,不利于學業(yè)質(zhì)量監(jiān)測聚焦學生學科能力發(fā)展的評價目的實現(xiàn)。表3 以科學學科為例,展示了德國學科能力結(jié)構(gòu)模型與北京學科評價框架在內(nèi)容維度上的差異。
表3 德國學科能力結(jié)構(gòu)模型與北京市學科評價框架在內(nèi)容維度上的比較(以科學學科為例)
(4)北京市學科評價方案對情感態(tài)度價值觀進行了細化
北京市學科評價方案在12 年的發(fā)展歷史中,依據(jù)重點關(guān)注的問題分為3 個發(fā)展階段。[4]特別是第三階段(2012—2014 年),其學科評價方案聚焦學生學科內(nèi)容、能力與情感態(tài)度價值觀的全面提升,部分學科在保持內(nèi)容、能力二維框架的基礎(chǔ)上,對情感態(tài)度價值觀進行了細化與落實,構(gòu)建了學科內(nèi)容、能力、情感態(tài)度價值觀的三維框架。以2013 年歷史學科評價方案為例,其包括內(nèi)容領(lǐng)域、能力領(lǐng)域以及情感態(tài)度價值觀領(lǐng)域:內(nèi)容領(lǐng)域包括中國古代史、中國近現(xiàn)代史、世界歷史3 個部分的內(nèi)容,要求學生重點掌握中國史和世界史重要的歷史事件、歷史人物、歷史現(xiàn)象和歷史發(fā)展的基本線索;能力領(lǐng)域分為了解、理解和應(yīng)用3 個認知能力層次;情感態(tài)度價值觀領(lǐng)域是指學生在思想和情感等方面所表現(xiàn)出的積極態(tài)度、正確認識和觀點等,如愛國主義情感、歷史進步意識、正確的國際意識、社會責任感、可持續(xù)發(fā)展觀念、積極進取的人生態(tài)度等。2014 年品德與社會學科評價方案學習借鑒了柯爾伯格(Kohlberg)道德發(fā)展理論,對情感態(tài)度價值觀進行細化分層與描述。將情感態(tài)度價值觀納入學科評價方案之中作為一個獨立的維度呈現(xiàn),這是北京市新的探索,有利于學業(yè)質(zhì)量測試在關(guān)注學科能力的同時,采用更多元的方式全面評估學生的發(fā)展。
進入21 世紀,核心素養(yǎng)研究已成為國際共同關(guān)注的議題,歐盟則將核心素養(yǎng)視為統(tǒng)領(lǐng)歐盟教育和培訓系統(tǒng)的總體目標體系,歐盟的核心素養(yǎng)模型促進了德國中小學教育標準更加關(guān)注、聚焦與落實學生適應(yīng)未來世界發(fā)展的學科核心能力與素養(yǎng)的發(fā)展和提升。
學科評價框架要與時俱進,具有前瞻性,要結(jié)合21 世紀教育的發(fā)展特點以及本國的教育改革文件進行架構(gòu)。目前,我國基礎(chǔ)教育領(lǐng)域正進行深化改革,頒布了指向核心素養(yǎng)以及質(zhì)量評價標準的重要文件,如《中國學生發(fā)展核心素養(yǎng)》[7]《中共中央國務(wù)院關(guān)于深化教育教學改革全面提高義務(wù)教育質(zhì)量的意見》[8]。文件倡導“健全質(zhì)量評價監(jiān)測體系。建立以發(fā)展素質(zhì)教育為導向的科學評價體系,國家制定縣域義務(wù)教育質(zhì)量、學校辦學質(zhì)量和學生發(fā)展質(zhì)量評價標準”[8]。為此,基于學科課程標準和教育改革文件,設(shè)計具有本土特色的義務(wù)教育學科評價方案刻不容緩。實現(xiàn)教育質(zhì)量監(jiān)測的目的是促進學生學科能力和素養(yǎng)的發(fā)展,各?。ㄊ?、區(qū))只有形成了本土化的義務(wù)教育階段學科評價方案,才能保證教育質(zhì)量監(jiān)測的科學性和有效性。
德國中小學教育標準體現(xiàn)了結(jié)構(gòu)化、科學性和前瞻性特點,其聚焦能力發(fā)展,包括了學科能力結(jié)構(gòu)模型、測驗開發(fā)、能力等級、能力水平模型、能力描述、能力分布等11 個部分,這樣的學業(yè)質(zhì)量評價方案的研制需要組織多元化的團隊,且只有通過他們的分工協(xié)作才能完成。例如,在學科能力結(jié)構(gòu)模型的構(gòu)建、能力等級程序的設(shè)定、能力水平模型的設(shè)計等方面,需要組織心理學、教育學、測量學專業(yè)人員展開研究;在能力水平、標準的描述、題型示例的呈現(xiàn)方面,則依賴學科專業(yè)人員的參與。只有多領(lǐng)域的專業(yè)人員積極參與才能保證學業(yè)質(zhì)量評價方案的結(jié)構(gòu)化、科學性、前瞻性。
德國中小學教育標準在官方網(wǎng)站上均能查詢、下載與學習。這樣的公開透明方式有明確的導向性,較好地減輕了學校負擔、師生壓力。因為只有保證學科評價方案及時向公眾發(fā)布,讓師生廣泛知曉學科評價方案的構(gòu)成、評價框架的架構(gòu)、評價標準的描述、題型示例的呈現(xiàn)等,才能真正有效減輕因“題海戰(zhàn)術(shù)”造成的過重學業(yè)負擔。
聚焦素養(yǎng)與能力的培養(yǎng)已經(jīng)成為21 世紀基礎(chǔ)教育的共識,我國基礎(chǔ)教育領(lǐng)域也高度重視認知能力的培養(yǎng)。2017 年9 月頒布的《關(guān)于深化教育體制機制改革的意見》指出:“在培養(yǎng)學生基礎(chǔ)知識和基本技能的過程中,強化學生關(guān)鍵能力培養(yǎng)。培養(yǎng)認知能力,應(yīng)引導學生具備獨立思考、邏輯推理、信息加工、學會學習、語言表達和文字寫作的素養(yǎng),養(yǎng)成終身學習的意識和能力?!盵9]教育研究者在研制學科評價方案時應(yīng)該關(guān)注認知過程與學科能力,對它們進行區(qū)分及細化,真正實現(xiàn)以學科知識為載體,促進學生學科能力發(fā)展的評價目的。
德國的學科能力結(jié)構(gòu)模型探索建構(gòu)了認知過程、能力、內(nèi)容復(fù)雜性三維立體結(jié)構(gòu),關(guān)注學科能力發(fā)展,注重探索認知過程與能力的聯(lián)系與區(qū)別,體現(xiàn)了“認知過程是記載能力發(fā)展的過程,能力是認知過程發(fā)展結(jié)果”的理念。區(qū)別能力和認知過程一直以來都是評價框架未解決的難點問題。以北京市學科評價方案為例,它盡管設(shè)立了能力維度,其二級維度卻指向了認知水平分層,從嚴格意義上來看,方案并沒有清晰區(qū)分能力與認知過程。其他?。ㄊ?、區(qū))可以借鑒德國和北京的經(jīng)驗,基于本地區(qū)的義務(wù)教育教學實際情況,對義務(wù)教育階段學科課程標準進行細化分解,建立立體、多維的評價框架,并基于評價框架的內(nèi)容標準、學業(yè)成就水平描述等要求,為本?。ㄊ?、區(qū))的教學質(zhì)量監(jiān)測與評價服務(wù)。