段玉山 姚澤陽(yáng)
(華東師范大學(xué),上海 200062)
隨著新一輪課程標(biāo)準(zhǔn)的公布,核心素養(yǎng)將成為我國(guó)課程改革的新引擎,新修訂的高中地理課程標(biāo)準(zhǔn)構(gòu)建了基于地理學(xué)科核心素養(yǎng)的課程與教學(xué)體系,研制了基于核心素養(yǎng)的學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn),系統(tǒng)闡述了高中階段地理學(xué)科核心素養(yǎng)的發(fā)展水平及其具體表現(xiàn)特征,是高中地理教學(xué)、考試與評(píng)價(jià)的重要依據(jù)與基礎(chǔ)。
從教育測(cè)量學(xué)的視角考量,核心素養(yǎng)是一類(lèi)高度抽象、結(jié)構(gòu)復(fù)雜的高階能力,超越了知識(shí)和一般能力的范疇,傳統(tǒng)教育測(cè)量范式的應(yīng)用面臨著極大的挑戰(zhàn)[1]。本文基于現(xiàn)代測(cè)量理論的視角,結(jié)合地理學(xué)科核心素養(yǎng)的內(nèi)涵與特征,主要論述地理學(xué)科核心素養(yǎng)測(cè)評(píng)的3個(gè)主要階段以及相應(yīng)環(huán)節(jié),旨在解決基于地理學(xué)科核心素養(yǎng)的測(cè)評(píng)編制,以及檢驗(yàn)測(cè)評(píng)與核心素養(yǎng)不同水平表現(xiàn)特征的匹配等問(wèn)題,為核心素養(yǎng)的有效測(cè)評(píng)提供借鑒。
核心素養(yǎng)的提出是為了培養(yǎng)適應(yīng)21世紀(jì)信息時(shí)代的各類(lèi)人才,地理學(xué)科核心素養(yǎng)被定義為學(xué)生在真實(shí)的復(fù)雜環(huán)境中,綜合應(yīng)用地理學(xué)科以及跨學(xué)科的知識(shí)、技能、方法與價(jià)值觀念,創(chuàng)造性地解決復(fù)雜的、不確定性現(xiàn)實(shí)問(wèn)題的關(guān)鍵能力與必備品格。簡(jiǎn)言之,地理學(xué)科核心素養(yǎng)本質(zhì)上是學(xué)生后天習(xí)得的、能夠適應(yīng)和改造環(huán)境的可能性。與此相反,傳統(tǒng)教育所關(guān)注的碎片式、固定的學(xué)科知識(shí)與常規(guī)性問(wèn)題解決技能,已經(jīng)無(wú)法讓學(xué)生成功應(yīng)對(duì)復(fù)雜多變的環(huán)境[2]??梢?jiàn),地理學(xué)科核心素養(yǎng)導(dǎo)向的教育實(shí)踐對(duì)教學(xué)與測(cè)評(píng)提出了新的挑戰(zhàn)。首先,地理學(xué)科核心素養(yǎng)具有綜合性,是知識(shí)與技能、過(guò)程與方法、情感態(tài)度價(jià)值觀合為一體的整體表現(xiàn)[3]。在以往“三維目標(biāo)”為導(dǎo)向的地理教學(xué)與測(cè)評(píng)中,知識(shí)、技能與價(jià)值觀往往被撕裂開(kāi)來(lái),測(cè)評(píng)注重考查碎片式知識(shí)的識(shí)記以及孤立技能的應(yīng)用。綜合性要求學(xué)生能夠創(chuàng)造性運(yùn)用地理知識(shí)與技能解決復(fù)雜情境中的真實(shí)問(wèn)題,而不是在固定的情境中機(jī)械式地套用。這就要求測(cè)評(píng)中要依據(jù)核心素養(yǎng)的內(nèi)涵與不同水平特征,合理設(shè)置真實(shí)任務(wù)情境,為核心素養(yǎng)的表征提供出口,從而實(shí)現(xiàn)有效的測(cè)評(píng)。其次,地理學(xué)科核心素養(yǎng)是學(xué)科“大概念”,體現(xiàn)地理學(xué)的本質(zhì)屬性。地理學(xué)是具有獨(dú)立認(rèn)知論和方法論的學(xué)科,綜合性、區(qū)域性、實(shí)踐性以及人地關(guān)系都是地理學(xué)家認(rèn)識(shí)世界,進(jìn)行地理學(xué)研究特有的視角。對(duì)這些地理學(xué)基本思想與方法的萃取與提煉,奠定了地理學(xué)科核心素養(yǎng)內(nèi)涵與特征的基礎(chǔ)。因此,對(duì)地理學(xué)科核心素養(yǎng)的測(cè)評(píng)要抓住地理學(xué)的“根”,以綜合思維、區(qū)域認(rèn)識(shí)、人地協(xié)調(diào)觀以及地理實(shí)踐力所體現(xiàn)的認(rèn)知成分及所組成的認(rèn)知鏈條與結(jié)構(gòu)為指導(dǎo),將其納入任務(wù)與問(wèn)題解決的過(guò)程之中。最后,地理學(xué)科核心素養(yǎng)具有內(nèi)隱性,測(cè)評(píng)是以學(xué)生完成任務(wù)中的表現(xiàn)為依據(jù)。這就要求測(cè)評(píng)中要明確測(cè)評(píng)任務(wù)和核心素養(yǎng)內(nèi)涵與特征的對(duì)應(yīng)關(guān)系,并以此作為試題編制、評(píng)價(jià)標(biāo)準(zhǔn)以及試題檢驗(yàn)的依據(jù)。
從20世紀(jì)初至今,經(jīng)典測(cè)量理論在教育與心理測(cè)量領(lǐng)域發(fā)揮著重要作用。然而經(jīng)典測(cè)量理論關(guān)注學(xué)生測(cè)驗(yàn)的總分,即測(cè)驗(yàn)中的一般性表現(xiàn),而忽視了學(xué)生在每個(gè)試題上的具體表現(xiàn)[4],無(wú)法滿(mǎn)足核心素養(yǎng)測(cè)評(píng)的需求?,F(xiàn)代測(cè)量理論是以項(xiàng)目反應(yīng)理論為基礎(chǔ)發(fā)展起來(lái)的教育與心理測(cè)量理論體系,它以概率函數(shù)的形式描述試題作答反應(yīng)結(jié)果與學(xué)生能力和試題特性之間的關(guān)聯(lián),解決了學(xué)生能力水平與試題之間的統(tǒng)一性問(wèn)題,為實(shí)現(xiàn)地理學(xué)科核心素養(yǎng)的有效測(cè)評(píng)提供了測(cè)量模型基礎(chǔ)。
現(xiàn)代測(cè)量理論滿(mǎn)足了地理學(xué)科核心素養(yǎng)測(cè)評(píng)的新導(dǎo)向。首先,現(xiàn)代測(cè)量理論是以測(cè)評(píng)對(duì)象的建構(gòu)理論為藍(lán)本和基礎(chǔ),測(cè)評(píng)編制與設(shè)計(jì)的關(guān)鍵環(huán)節(jié)是確定測(cè)評(píng)試題特征與測(cè)評(píng)對(duì)象特征之間的關(guān)聯(lián)[5]。而關(guān)聯(lián)的確立是建立在回答以下問(wèn)題的基礎(chǔ)上:測(cè)評(píng)所測(cè)的對(duì)象究竟是什么,所測(cè)對(duì)象不同水平的具體特征是什么,試題的哪些特征與所測(cè)對(duì)象的特征相互關(guān)聯(lián),通過(guò)操縱試題的這些特征,能否導(dǎo)致測(cè)量學(xué)特征(如難度和區(qū)分度)的變化[6]。對(duì)于地理學(xué)科核心素養(yǎng)來(lái)說(shuō),就是對(duì)核心素養(yǎng)的內(nèi)涵進(jìn)行解讀與界定,確定核心素養(yǎng)不同水平的表現(xiàn)特征,將測(cè)評(píng)試題的任務(wù)特征與不同的表現(xiàn)特征相互關(guān)聯(lián)起來(lái)。其次,現(xiàn)代測(cè)量理論指導(dǎo)下的測(cè)評(píng)體現(xiàn)核心素養(yǎng)縱向發(fā)展的過(guò)程性,以學(xué)生在不同水平的表現(xiàn)為基礎(chǔ)。與以目標(biāo)分類(lèi)學(xué)為基礎(chǔ)的測(cè)評(píng)不同,現(xiàn)代測(cè)量理論視角下的測(cè)評(píng)關(guān)注學(xué)生發(fā)展與進(jìn)階的動(dòng)態(tài)過(guò)程,而不是學(xué)生橫截面即某一階段的終結(jié)性靜態(tài)表現(xiàn)。最后,現(xiàn)代測(cè)量理論能夠基于項(xiàng)目反應(yīng)模型對(duì)實(shí)測(cè)數(shù)據(jù)進(jìn)行計(jì)算,從群體—試卷和個(gè)體—試題層面,檢驗(yàn)試題難度和學(xué)生能力水平與核心素養(yǎng)不同表現(xiàn)水平的對(duì)應(yīng)關(guān)系。從群體—試卷層面上,能夠在同一尺度上刻畫(huà)出試題分布特征與學(xué)生能力水平及群體分布特征;從個(gè)體—試題層面上,能夠測(cè)算與描繪出試題的擬合程度,從而判斷試題質(zhì)量,并評(píng)估學(xué)生的能力水平。
通過(guò)對(duì)地理學(xué)科核心素養(yǎng)測(cè)評(píng)導(dǎo)向的分析,以及現(xiàn)代測(cè)量理論優(yōu)良特性的總結(jié)可以看出,現(xiàn)代測(cè)量理論視角下的地理學(xué)科核心素養(yǎng)測(cè)評(píng)可以分為3個(gè)階段,即界定測(cè)評(píng)對(duì)象、生成測(cè)評(píng)試題、檢驗(yàn)與評(píng)估(如圖1),不同階段包括相對(duì)應(yīng)的環(huán)節(jié)。在對(duì)試題進(jìn)行檢驗(yàn)之后,如果試題質(zhì)量良好則繼續(xù)用于測(cè)評(píng),如果質(zhì)量欠佳,則可以直接刪除,或者回到第2階段再次匹配任務(wù)特征與核心素養(yǎng)表現(xiàn),接著重新編制試題。
圖1 地理學(xué)科核心素養(yǎng)測(cè)評(píng)的階段及環(huán)節(jié)
界定測(cè)評(píng)對(duì)象包括解讀地理學(xué)科核心素養(yǎng)的內(nèi)涵與構(gòu)成以及確定不同水平的核心素養(yǎng)的表現(xiàn)特征2個(gè)環(huán)節(jié)。從內(nèi)涵層面看,地理學(xué)科核心素養(yǎng)包括人地協(xié)調(diào)觀、綜合思維、區(qū)域認(rèn)知和地理實(shí)踐力4個(gè)組成部分,綜合思維和區(qū)域認(rèn)知是地理學(xué)的基本思想與方法體現(xiàn),地理實(shí)踐力是地理學(xué)習(xí)的基本過(guò)程,人地協(xié)調(diào)觀是基本的價(jià)值取向,它們之間相互關(guān)聯(lián),又有各自的內(nèi)涵與表現(xiàn)特征。以區(qū)域認(rèn)知為例,其基本內(nèi)涵是指人們運(yùn)用空間—區(qū)域的觀點(diǎn)和方法認(rèn)識(shí)地理環(huán)境的思維品質(zhì)和能力,具體的構(gòu)成包括:劃區(qū)意識(shí)、認(rèn)識(shí)區(qū)域本身、評(píng)價(jià)區(qū)域開(kāi)發(fā)3個(gè)維度(見(jiàn)表1)。這3個(gè)構(gòu)成維度可以被認(rèn)為是學(xué)生區(qū)域認(rèn)知素養(yǎng)的進(jìn)階變量,不僅闡明了課程的內(nèi)容以及相應(yīng)的測(cè)評(píng)內(nèi)容,還蘊(yùn)含了學(xué)生學(xué)習(xí)內(nèi)容以及學(xué)習(xí)逐步展開(kāi)的過(guò)程與路徑。
表1 “區(qū)域認(rèn)知”具體構(gòu)成與描述
從表現(xiàn)水平來(lái)看,不同構(gòu)成維度作為學(xué)習(xí)進(jìn)階的變量是一種潛在的連續(xù)體(Underlying Continu?um),表2展現(xiàn)區(qū)域認(rèn)知素養(yǎng)中“認(rèn)識(shí)區(qū)域本身”不同水平的表現(xiàn)特征。例如,水平1是“在日常生活情境中,能夠根據(jù)提示將地理現(xiàn)象置于特定區(qū)域中加以認(rèn)識(shí)”,隨著學(xué)習(xí)的深入與發(fā)展,水平3提出“能夠在給定復(fù)雜地理事象中,從空間—區(qū)域尺度、區(qū)域特征、區(qū)域聯(lián)系等認(rèn)識(shí)區(qū)域”,從水平1進(jìn)階到水平3,情境由真實(shí)變?yōu)槌橄?,地理事象由?jiǎn)單變?yōu)閺?fù)雜,認(rèn)識(shí)區(qū)域的維度與方法由單一變?yōu)閺?fù)合,通過(guò)對(duì)“區(qū)域認(rèn)知”3個(gè)構(gòu)成變量的控制,學(xué)習(xí)的層級(jí)與難度逐漸提升。值得注意的是,表現(xiàn)水平的描述具備一定的抽象性和概括性,并不是指向某一具體的試題,是在理論層面對(duì)測(cè)量尺度不同水平的描述,因此,這些描述是試題編制的理論基礎(chǔ),也是制定評(píng)分標(biāo)準(zhǔn)的基礎(chǔ)。
表2 “認(rèn)識(shí)區(qū)域本身”的表現(xiàn)水平
圖2 “認(rèn)識(shí)區(qū)域本身”與水平特征和任務(wù)反應(yīng)的關(guān)系
在確定核心素養(yǎng)的內(nèi)涵、構(gòu)成與不同水平的表現(xiàn)之后,進(jìn)入生成測(cè)評(píng)試題階段。這一階段包括匹配試題特征與不同水平特征、編制試題2個(gè)環(huán)節(jié)。首先,匹配試題任務(wù)特征與不同水平特征,圖2展示了“認(rèn)識(shí)區(qū)域本身”不同水平的表現(xiàn)特征,分別從情境、地理事象、維度與方法3個(gè)變量進(jìn)行了描述,隨著變量的進(jìn)階,學(xué)習(xí)的水平逐漸提高。圖2右側(cè)是相應(yīng)水平特征的反應(yīng),與左側(cè)水平特征一一對(duì)應(yīng)。反應(yīng)1就是在日常情境中,根據(jù)提示將地理事象置于區(qū)域加以認(rèn)識(shí)并總結(jié)區(qū)域特征的作答反應(yīng),能否完成這一任務(wù),在編制試題時(shí)就要體現(xiàn)這一反應(yīng)的要求。假設(shè)任務(wù)1完全體現(xiàn)反應(yīng)1的要求,學(xué)生成功完成任務(wù)1,我們就能夠推斷學(xué)生具備了水平1的能力。因此,測(cè)驗(yàn)編制的核心在于能夠編制出誘發(fā)學(xué)生在不同水平和不同維度作出相應(yīng)反應(yīng)的試題,實(shí)現(xiàn)對(duì)核心素養(yǎng)的合理測(cè)量。以下通過(guò)例題解析方式說(shuō)明試題編制。
例1(2017年高考文科綜合能力測(cè)試全國(guó)Ⅲ卷第2題)
剪紙所反映的景觀的自然條件有
A.溝壑縱橫,降水集中
B.地勢(shì)低平,降水豐沛
C.地形封閉,排水不暢
D.山河相間,降水均勻
例1滿(mǎn)足水平1的表現(xiàn)特征。要求學(xué)生根據(jù)剪紙所反映的景觀來(lái)判斷該區(qū)域的自然條件。剪紙反映的小橋流水是日常生活情境,情境蘊(yùn)含與提示了地形、水文等地理事象特征,依據(jù)景觀的特征判斷區(qū)域所在的位置是我國(guó)的長(zhǎng)江三角洲地區(qū),最終總結(jié)出該區(qū)域的自然條件是地勢(shì)低平,降水豐沛。
例2(2017年高考文科綜合能力測(cè)試全國(guó)Ⅱ卷第4題)
汽車(chē)輪胎性能測(cè)試需在不同路面上進(jìn)行。芬蘭伊瓦洛吸引了多家輪胎企業(yè)在此建設(shè)輪胎測(cè)試場(chǎng),最佳測(cè)試期為每年11月至次年4月,推測(cè)該地輪胎測(cè)試場(chǎng)提供輪胎測(cè)試的路面是
A.冰雪路面 B.濕滑路面
C.松軟路面 D.干燥路面
例2符合水平2表現(xiàn)特征。在特定的情境下(汽車(chē)輪胎測(cè)試),以及特定的地理事象(路面的特征),并根據(jù)圖經(jīng)緯度確定該區(qū)域的位置,依據(jù)測(cè)試時(shí)間信息推斷區(qū)域的主要特征為緯度高,冬半年,氣候低,因此是冰雪路面。
從以上2個(gè)例題可以看出,試題編制體現(xiàn)“認(rèn)識(shí)區(qū)域本身”的不同水平表現(xiàn)特性的具體要求,依據(jù)情境、地理事象、維度與方法3個(gè)方面的具體描述,恰當(dāng)設(shè)置試題的情境、地理事象的復(fù)雜程度以及區(qū)域特征的維度與方法,使得學(xué)生的反應(yīng)與水平的表現(xiàn)特征相互匹配。所追求的效果是,學(xué)生具備何種水平的區(qū)域認(rèn)知素養(yǎng),就能作出相應(yīng)的何種反應(yīng),以此基于項(xiàng)目反應(yīng)模型估計(jì)學(xué)生的能力值,從而實(shí)現(xiàn)素養(yǎng)的真實(shí)測(cè)評(píng)。
基于學(xué)生的測(cè)評(píng)數(shù)據(jù)對(duì)試題質(zhì)量與學(xué)生能力進(jìn)行檢驗(yàn)與評(píng)估。在測(cè)評(píng)—群體層面,以項(xiàng)目反應(yīng)模型中的Rasch模型為基礎(chǔ),使用統(tǒng)計(jì)軟件(如Con?Quest、Winsteps、ConstructMap等)對(duì)學(xué)生的測(cè)評(píng)數(shù)據(jù)進(jìn)行計(jì)算后可以繪制出展現(xiàn)群體能力與試題難度分布的懷特圖(Wright Map)。如圖3所示,試題難度與學(xué)生能力刻畫(huà)在同一尺度上,在左邊,每個(gè)X代表一個(gè)學(xué)生,越往頂端能力越高。在右邊,每個(gè)條目代表一個(gè)試題,越往頂端難度越大。從圖3可以看出,不同水平的試題處在相應(yīng)的難度水平區(qū)間,例如試題L3.1—L3.8處在水平3的區(qū)間,并顯示出不同水平區(qū)間的學(xué)生人數(shù)。通過(guò)懷特圖可以驗(yàn)證不同水平的試題與學(xué)生能力的對(duì)應(yīng)情況。
圖3 群體能力與試題難度分布的懷特圖(Wright Map)
在試題—個(gè)體層面,現(xiàn)代測(cè)量理論可以評(píng)估試題的質(zhì)量,還可以評(píng)估出基于核心素養(yǎng)水平量表的能力分?jǐn)?shù)。首先,統(tǒng)計(jì)軟件可以計(jì)算出試題的真實(shí)數(shù)據(jù)與模型的擬合程度,從而判斷試題的質(zhì)量。圖4(a)顯示真實(shí)數(shù)據(jù)(圓點(diǎn)連線)過(guò)度擬合,過(guò)度擬合表示真實(shí)數(shù)據(jù)與模型相比更具鑒別度,可以保留。圖4(b)表示真實(shí)數(shù)據(jù)欠擬合,從圖中可以看出,能力較低的學(xué)生做對(duì)試題的概率比模型高,而能力較高的學(xué)生做對(duì)的概率比模型低,因此,建議刪除欠擬合的試題。其次,現(xiàn)代測(cè)量理論計(jì)算出來(lái)的學(xué)生能力分?jǐn)?shù)具有更多優(yōu)點(diǎn),經(jīng)典測(cè)量理論下的總分有天然的缺點(diǎn),總分不是試題獨(dú)立的分?jǐn)?shù),受到不同學(xué)生群體和不同試題的影響。而現(xiàn)代測(cè)量理論的能力分?jǐn)?shù)卻具有試題獨(dú)立性和樣本獨(dú)立性,可以使用能力分?jǐn)?shù)比較回答不同試題的學(xué)生能力[7]。也就是說(shuō),能力分?jǐn)?shù)量表是核心素養(yǎng)的絕對(duì)量表,某些情況下也可以認(rèn)為是核心素養(yǎng)的等比量表,并且試題與核心素養(yǎng)表現(xiàn)水平相匹配,這樣透過(guò)能力分?jǐn)?shù)就能夠精準(zhǔn)反映出核心素養(yǎng)的能力水平。
圖4 試題擬合曲線
總之,現(xiàn)代測(cè)量理論為地理學(xué)科核心素養(yǎng)的測(cè)評(píng)提供了新的視角,但將其應(yīng)用于教學(xué)實(shí)踐還需要解決多方面的困難。首先,教師應(yīng)了解地理學(xué)科核心素養(yǎng)的內(nèi)涵與表現(xiàn)水平,無(wú)論試題的編制還是檢驗(yàn),都是基于核心素養(yǎng)的理論構(gòu)建,它既是測(cè)評(píng)的起點(diǎn)也是測(cè)評(píng)的目標(biāo)。其次,依據(jù)核心素養(yǎng)的表現(xiàn)特征編制試題,這樣才能保證測(cè)評(píng)數(shù)據(jù)的有效性。最后,對(duì)廣大中學(xué)教師來(lái)說(shuō),應(yīng)加強(qiáng)現(xiàn)代測(cè)量理論的學(xué)習(xí)與應(yīng)用,實(shí)現(xiàn)核心素養(yǎng)測(cè)評(píng)的現(xiàn)代化與多元化。
[1]袁建林,劉紅云.核心素養(yǎng)測(cè)量:理論依據(jù)與實(shí)踐指向[J].教育研究,2017,38(7):21-28+36.
[2]楊向東.核心素養(yǎng)測(cè)評(píng)的十大要點(diǎn)[J].人民教育,2017(Z1):41-46.
[3]段玉山,姚澤陽(yáng).地理學(xué)科核心素養(yǎng)的幾個(gè)性質(zhì)[J].地理教育,2017(2):4-5.
[4]羅照盛.項(xiàng)目反應(yīng)理論基礎(chǔ)[M].北京:北京師范大學(xué)出版社,2012:1.
[5]EMBRETSON S E.Test design:Developments in psychology and psychometrics[M].Ovlando:Academic Press,2013.
[6]楊向東.理論驅(qū)動(dòng)的心理與教育測(cè)量學(xué)[M].上海:華東師范大學(xué)出版社,2014.
[7]余民寧.試題反應(yīng)理論IRT及其應(yīng)用[M].臺(tái)北:心理出版社,2009.