李 健 宋乃慶 王詩夢(mèng) 孫小堅(jiān)
(1.西南大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)院 重慶 400715;2.西南大學(xué)基礎(chǔ)教育研究中心 重慶 400715;3.中國(guó)基礎(chǔ)教育質(zhì)量監(jiān)測(cè)協(xié)同創(chuàng)新中心西南大學(xué)分中心 重慶 400715;4.西南大學(xué)美育研究院 重慶 400715;5.西南大學(xué)附屬中學(xué) 重慶 400715)
美術(shù)素養(yǎng)是學(xué)生核心素養(yǎng)在美術(shù)學(xué)科的重要體現(xiàn),是學(xué)生心智發(fā)展中獨(dú)特且不可替代的組成部分(李健, 于澤元, 2020),美術(shù)素養(yǎng)能夠完善感官系統(tǒng)并培養(yǎng)想象力(Eisner, 2004),進(jìn)而塑造人的完美品格,提高公民審美品位。美術(shù)素養(yǎng)的提升也是學(xué)校教育的重要目的,良好的美術(shù)素養(yǎng)能夠幫助學(xué)生使用審美參照系來學(xué)習(xí)(Eisner, & Elliot, W.., 1998),例如空間思維與幾何學(xué)習(xí),色彩知識(shí)與物理現(xiàn)象,繪畫表達(dá)與作文撰寫等(楊建濱, 2001)。黨的十八大以來,國(guó)家高度重視學(xué)校美育工作,尤其是2020 年中共中央辦公廳、國(guó)務(wù)院辦公廳首次聯(lián)合印發(fā)《關(guān)于全面加強(qiáng)和改進(jìn)新時(shí)代學(xué)校美育工作的意見》,學(xué)校美育工作受到了前所未有的重視,美育評(píng)價(jià)作為倒逼機(jī)制成為了此意見最重要的標(biāo)志??茖W(xué)地監(jiān)測(cè)學(xué)生美術(shù)素養(yǎng)水平已成為學(xué)校美育工作的硬性要求。但是目前仍缺乏科學(xué)的、系統(tǒng)的、可操作性的美術(shù)素養(yǎng)評(píng)價(jià)工具,因此力圖通過評(píng)價(jià)促進(jìn)美育育人效果提升的內(nèi)在動(dòng)力就沒有充分發(fā)揮,妨礙了學(xué)校美育工作健康、可持續(xù)發(fā)展,這是當(dāng)下學(xué)校美育工作的重大不足,因此對(duì)美術(shù)素養(yǎng)測(cè)評(píng)工具的研發(fā)就顯得尤為迫切。
對(duì)學(xué)生美術(shù)素養(yǎng)進(jìn)行測(cè)評(píng)的實(shí)質(zhì)是通過對(duì)學(xué)生外顯的行為表征來測(cè)量學(xué)生潛在的美術(shù)能力,由于潛在美術(shù)能力是一種不可觀察的特質(zhì),因此將適用于測(cè)量潛變量的項(xiàng)目反應(yīng)理論模型引入至學(xué)生美術(shù)素養(yǎng)測(cè)評(píng)中,以評(píng)價(jià)學(xué)生行為表征背后指向的美術(shù)潛在特質(zhì)具有重要的理論和實(shí)踐價(jià)值。項(xiàng)目反應(yīng)理論假設(shè)在測(cè)試情境中,學(xué)生的潛在特質(zhì)可以通過學(xué)生在測(cè)試中的外在表現(xiàn)來預(yù)測(cè),進(jìn)而可估計(jì)學(xué)生在相關(guān)特質(zhì)上的潛在能力水平和作答反應(yīng)之間的關(guān)系,從而對(duì)學(xué)生的美術(shù)素養(yǎng)進(jìn)行預(yù)測(cè)或解釋。對(duì)學(xué)生美術(shù)素養(yǎng)進(jìn)行測(cè)評(píng)難以用準(zhǔn)確的數(shù)字或分?jǐn)?shù)來進(jìn)行評(píng)判,只能給予美術(shù)作答表現(xiàn)一個(gè)等級(jí)評(píng)判,項(xiàng)目反應(yīng)理論模型是一個(gè)非線性的用來表征題目參數(shù)、學(xué)生潛在特質(zhì)和學(xué)生作答情況之間關(guān)系的數(shù)學(xué)函數(shù)(辛濤, 2005),避免了經(jīng)典測(cè)量理論對(duì)分?jǐn)?shù)的嚴(yán)格要求,具備靈活處理等級(jí)性作答情況的能力,因此美術(shù)測(cè)評(píng)也應(yīng)引入項(xiàng)目反應(yīng)理論來確保其評(píng)判標(biāo)準(zhǔn)的靈活性。項(xiàng)目反應(yīng)理論已應(yīng)用于SAT、PISA 等考試(閆成海, 杜文久, 宋乃慶, 張健, 2014),特別是在1997 年美國(guó)國(guó)家教育進(jìn)步評(píng)估中視覺藝術(shù)項(xiàng)目運(yùn)用了項(xiàng)目反應(yīng)理論來進(jìn)行試題驗(yàn)證(Persky, Sandene, & Askew, 1998),由此,本研究試圖利用項(xiàng)目反應(yīng)理論來開發(fā)美術(shù)素養(yǎng)測(cè)評(píng)工具。
在我國(guó)“美術(shù)”一詞是舶來品,在五四運(yùn)動(dòng)中才開始被普遍運(yùn)用,其原意是指“自然造化”“人工技藝”,因此早期的美術(shù)概念不僅指各種手工制作的藝術(shù)品,還包含文學(xué)、戲劇、音樂等。美術(shù)和藝術(shù)這兩個(gè)詞在翻譯中并沒有明確的區(qū)分,隨著藝術(shù)門類的分化,逐漸演化為“藝術(shù)”一詞包含一切藝術(shù)門類,美術(shù)則主要指在二維或者三維空間上塑造可視的靜態(tài)藝術(shù)形象的活動(dòng)。隨著帶有實(shí)驗(yàn)性質(zhì)的美術(shù)活動(dòng)出現(xiàn),美術(shù)的概念也在不斷變化,美術(shù)不單是“靜止的藝術(shù)形象”,而變成了一個(gè)綜合色(空間要素)、音(時(shí)間要素)、運(yùn)動(dòng)(在時(shí)間和空間中)等一切心理與物理要素的創(chuàng)造行為(梁玖, 2005)??傮w來說,美術(shù)是人類認(rèn)識(shí)世界和表達(dá)世界的一種手段,是人類基于一定的造型元素和形式原理,合理運(yùn)用各種媒材,借助一定的物質(zhì)文化實(shí)體,反映客觀世界和表達(dá)創(chuàng)作者內(nèi)在的情感與思想的表達(dá)形式。
關(guān)于“素養(yǎng)”的內(nèi)涵,在《辭海》中,“素養(yǎng)”有兩種釋義:一是指“修習(xí)涵養(yǎng)”;二是指“平時(shí)所供養(yǎng)”。由此可知,素養(yǎng)并非人們先天就有的,而是后天形成的,是人們?cè)谌辗e月累的“修習(xí)”中逐步形成的。而素養(yǎng)介入到教育領(lǐng)域則源于經(jīng)濟(jì)合作與發(fā)展組織(OECD)啟動(dòng)“素養(yǎng)的界定與遴選:理念和概念基礎(chǔ)”項(xiàng)目中,“competence”被界定為“……不只是知識(shí)與技能。它還是在特定情境中,通過利用和調(diào)動(dòng)心理社會(huì)資源(包括技能和態(tài)度),以滿足復(fù)雜需要的能力(張華, 2016)”。受OECD 組織的影響,2006 年,歐洲議會(huì)和歐洲理事會(huì)聯(lián)合批準(zhǔn)《為了終身學(xué)習(xí)的核心素養(yǎng):歐洲參考框架》,其中指出“competence”是“適用于特定情境的知識(shí)、技能和態(tài)度的綜合”(Gordon et al., 2009)。蔡清田認(rèn)為“素養(yǎng)”是個(gè)體發(fā)展成為一個(gè)健全個(gè)體所不可或缺的(蔡清田, 2010),是可超越傳統(tǒng)教育所強(qiáng)調(diào)的知識(shí)和能力(蔡清田, 2011),包含知識(shí)、能力和態(tài)度(蔡清田, 2011)。張華教授提出“素養(yǎng)是人在特定情境中綜合運(yùn)用知識(shí)、技能和態(tài)度解決問題的高級(jí)能力與人性能力(張華, 2016)”。綜上可以看出,“素養(yǎng)”不僅局限于以往教育研究中所提出的知識(shí)與能力,而是知識(shí)、能力與態(tài)度的綜合體,是一個(gè)整體性 (holistic)和有機(jī)性 (dynamic)概念,包括復(fù)雜需要、社會(huì)心理?xiàng)l件 (包括認(rèn)知、動(dòng)機(jī)、道德)以及在特定環(huán)境中滿足需求的能力。
什么是美術(shù)素養(yǎng)?不同國(guó)家地區(qū)對(duì)美術(shù)素養(yǎng)的界定有所不同:美國(guó)國(guó)家藝術(shù)教育協(xié)會(huì)認(rèn)為美術(shù)素養(yǎng)是指使用傳統(tǒng)的以及當(dāng)代的和新興的媒介,以促進(jìn)思考、決策、溝通和學(xué)習(xí)的方式來解釋、理解、欣賞、使用和創(chuàng)建視覺作品的能力(National Art Education Association, 2018)。新加坡2018 年美術(shù)課程大綱中指出美術(shù)素養(yǎng)是通過視覺的交流,通過與社會(huì)和文化的聯(lián)系來創(chuàng)造意義(Ministry of Education Singapore, 2020)。在澳大利亞昆士蘭州頒布的《藝術(shù)實(shí)踐》課程教學(xué)大綱中指出:“美術(shù)素養(yǎng)”是指藝術(shù)創(chuàng)作所需具備的基礎(chǔ)知識(shí)、理解和技能,包括藝術(shù)交流(Arts communication)、藝術(shù)原則(Arts principles)、審美欣賞(Aesthetic appreciation)三個(gè)要素,同時(shí)指出具備良好藝術(shù)素養(yǎng)的學(xué)生能夠?qū)λ囆g(shù)作品進(jìn)行解讀、欣賞、評(píng)價(jià)和審美活動(dòng)(QCAA, 2020)?!睹绹?guó)國(guó)家核心藝術(shù)標(biāo)準(zhǔn)》中對(duì)“美術(shù)(視覺藝術(shù))素養(yǎng)”的界定為:切實(shí)參與藝術(shù)活動(dòng)所需的知識(shí)和理解,通過運(yùn)用藝術(shù)獨(dú)有的象征性和隱喻性,借助流暢的藝術(shù)語言來進(jìn)行創(chuàng)作、表演/制作/呈現(xiàn)、反應(yīng)和聯(lián)系的能力(國(guó)家核心藝術(shù)標(biāo)準(zhǔn)聯(lián)盟, 2018)。王大根教授認(rèn)為,美術(shù)素養(yǎng)是指學(xué)生學(xué)習(xí)了美術(shù)課程之后,所形成的關(guān)于美術(shù)方面的感知、想象、思維、表達(dá)、設(shè)計(jì)、審美、評(píng)鑒以及參與的意識(shí)與能力,及其所伴隨的個(gè)性品質(zhì)和價(jià)值觀念(王大根, 2007)。在我國(guó)義務(wù)教育美術(shù)課程標(biāo)準(zhǔn)中,主要從三方面對(duì)學(xué)生所需具備的美術(shù)素養(yǎng)進(jìn)行要求:一是對(duì)美術(shù)的內(nèi)容和現(xiàn)象有基本的了解;二是對(duì)美術(shù)的創(chuàng)作方法和過程有基本的了解;三是對(duì)美術(shù)在社會(huì)中的價(jià)值和作用有基本的了解。基本的美術(shù)素養(yǎng)不僅僅指的是對(duì)基本的美術(shù)知識(shí)和技能的掌握,關(guān)鍵是應(yīng)該具備基本的藝術(shù)態(tài)度。其中,基本的藝術(shù)態(tài)度主要是要有敏銳的視覺意識(shí)、能運(yùn)用媒材表達(dá)自己情感、追求更高的審美品位等(美術(shù)課程標(biāo)準(zhǔn)研制組, 2002)。雖然以往研究未形成對(duì)“美術(shù)素養(yǎng)”概念的統(tǒng)一認(rèn)識(shí),但是從各國(guó)的藝術(shù)/美術(shù)課程大綱中對(duì)相關(guān)概念(如:藝術(shù)素養(yǎng)、視覺素養(yǎng)等概念)的闡釋中,對(duì)“美術(shù)素養(yǎng)”概念的內(nèi)涵包含以下幾個(gè)要點(diǎn):
(1)美術(shù)素養(yǎng)關(guān)注傳統(tǒng)經(jīng)典內(nèi)容,重視純藝術(shù)的文史價(jià)值,更加注重學(xué)科整合、更具時(shí)代特性、生活實(shí)用性。
(2)美術(shù)素養(yǎng)不僅僅是美術(shù)知識(shí)和能力的培養(yǎng),更是藝術(shù)態(tài)度和文化素質(zhì)養(yǎng)成的教育,要求將學(xué)生置于人類文化的歷史長(zhǎng)河中(馮紅梅, 2012),陶冶情操,修身養(yǎng)性。
(3)“美術(shù)素養(yǎng)”內(nèi)涵不僅囿于美術(shù)學(xué)科領(lǐng)域,也強(qiáng)調(diào)將美術(shù)和自然、學(xué)習(xí)、社會(huì)聯(lián)系起來,已然成為個(gè)體為適應(yīng)未來社會(huì)所不可或缺的素養(yǎng)。
綜上,我們認(rèn)為“美術(shù)素養(yǎng)”是知識(shí)、技能與品格的統(tǒng)一體,不僅局限于美術(shù)學(xué)科領(lǐng)域,更是指向?qū)W生全面的、未來的發(fā)展,是學(xué)生適應(yīng)未來不斷變化世界所必須具備的素養(yǎng),同時(shí)也十分強(qiáng)調(diào)學(xué)生的自主性以及個(gè)體的感知與體驗(yàn)。因而,本文認(rèn)為“美術(shù)素養(yǎng)”的內(nèi)涵是個(gè)體基于造型元素和形式原理,采用象征、隱喻等視覺方式(李健,于澤元, 2020),對(duì)觀念、情感、事物進(jìn)行感知、表達(dá)、聯(lián)結(jié)和鑒賞等活動(dòng)時(shí)所具備的知識(shí)、技能以及品格的綜合表現(xiàn)。
在某種意義上,評(píng)價(jià)決定教育的價(jià)值,當(dāng)評(píng)價(jià)指向的是完整的學(xué)習(xí)內(nèi)容時(shí),那么評(píng)價(jià)就是好的,反之則會(huì)導(dǎo)致教學(xué)與學(xué)習(xí)走向片面(Wilson, 1996),面對(duì)小學(xué)生美術(shù)素養(yǎng)測(cè)評(píng)工具開發(fā)這一長(zhǎng)期困擾美術(shù)教育領(lǐng)域和教育評(píng)價(jià)領(lǐng)域的難題,我們需要在深層次上對(duì)小學(xué)生美術(shù)素養(yǎng)測(cè)評(píng)的理論體系進(jìn)行探討。
1.美學(xué)基礎(chǔ):模糊美學(xué)理論
模糊思維是人類固有的一種思維方式,主要是在處理模糊的、不確定的、復(fù)雜事物和聯(lián)系中的各個(gè)不同因素時(shí),以一種不確定的、全息式狀態(tài)來對(duì)事物進(jìn)行整體觀照的多維思考方式。美學(xué)從屬于哲學(xué),以藝術(shù)創(chuàng)作為主要研究對(duì)象,美學(xué)具有天然的模糊性,美學(xué)之父鮑姆加登認(rèn)為美學(xué)的目的是感性認(rèn)識(shí)本身的完善(鮑姆加登, 1987),在西方美學(xué)的論述中也有涉及模糊的表述,從理念層面而言,古希臘哲學(xué)家赫拉克利特認(rèn)為最美麗的猴子與人類比起來也是丑陋的(北京大學(xué)哲學(xué)系外國(guó)哲學(xué)史教研室,1961),強(qiáng)調(diào)了美的相對(duì)性、不確定性。德國(guó)哲學(xué)家萊布尼茨闡述了美感屬于既明白又混亂的認(rèn)識(shí),是一種“混亂的知覺”,我們對(duì)它“無法充分說明道理”的朦朧美理論(彭立勛, 2005)。從審美實(shí)踐層面而言,美術(shù)創(chuàng)作也是具有模糊性。首先,就創(chuàng)作者來說,人在觀照、鑒賞客體時(shí),由于審美客體具有模糊性,再加上人本身的審美心理存在著特殊的模糊機(jī)制,因而所產(chǎn)生的美感也必然是模糊的。美術(shù)創(chuàng)作過程需要感性與理性的交融,在形似與神似之間進(jìn)行取舍,利用形象思維和邏輯思維。缺少任何一個(gè)方面都不能傳達(dá)美術(shù)的本意。由此可見,美術(shù)素養(yǎng)是以模糊美學(xué)基礎(chǔ)的。
2.指標(biāo)劃分依據(jù):認(rèn)知心理學(xué)理論
測(cè)評(píng)是為了進(jìn)行評(píng)估而收集信息的各種過程(Beattie, 1997)。美術(shù)素養(yǎng)是學(xué)生的一種視覺認(rèn)知方式,從認(rèn)知心理學(xué)來看,人類藝術(shù)思維的發(fā)展離不開主體的元認(rèn)知系統(tǒng)、藝術(shù)本體工作記憶、本體藝術(shù)知識(shí)三個(gè)系統(tǒng)(琚軍紅, 2015)。小學(xué)生美術(shù)素養(yǎng)是學(xué)生內(nèi)在情感、靈感、經(jīng)驗(yàn)的外顯,首先是學(xué)生自我思維心理的認(rèn)識(shí)與調(diào)節(jié),包含對(duì)對(duì)象有選擇的感知與識(shí)別;其次是主體在執(zhí)行藝術(shù)具體認(rèn)知任務(wù)時(shí)所動(dòng)用的相關(guān)記憶內(nèi)容,這個(gè)階段包含美術(shù)表達(dá)與創(chuàng)意聯(lián)結(jié);最后是本體藝術(shù)經(jīng)驗(yàn)和情感意象的具身建構(gòu)與對(duì)象化映射等認(rèn)知操作環(huán)節(jié)即審美鑒賞階段。
3.評(píng)價(jià)依據(jù):表現(xiàn)性評(píng)價(jià)
評(píng)價(jià)是決定素養(yǎng)能否落地的關(guān)鍵(周文葉,陳銘洲, 2017)。素養(yǎng)是建立在真實(shí)情境之上復(fù)雜、綜合、多元的能力。傳統(tǒng)的評(píng)價(jià)只能推導(dǎo)出學(xué)生知道什么,而不能推導(dǎo)出學(xué)生能做什么。對(duì)素養(yǎng)的測(cè)評(píng)要有真實(shí)的、生動(dòng)的情境,激發(fā)學(xué)生在特定情境用外顯的表現(xiàn)形式進(jìn)行問題解決。表現(xiàn)性評(píng)價(jià)更適合檢測(cè)高水平的、復(fù)雜的思維能力(Darling-Hammond & Adamson, 2010),有很多研究對(duì)其進(jìn)行了界定,美國(guó)學(xué)者斯蒂金斯認(rèn)為:“表現(xiàn)性評(píng)價(jià)為測(cè)量學(xué)習(xí)者運(yùn)用先前所獲得的知識(shí)解決新異問題或完成具體任務(wù)的一系列嘗試(沈南山, 2017)。美國(guó)教育評(píng)定技術(shù)處將表現(xiàn)性評(píng)價(jià)界定為“通過學(xué)習(xí)者自己給出的問題答案和展示的作品來判斷學(xué)習(xí)者所獲得的知識(shí)和技能”(崔允漷, 2016)。表現(xiàn)性評(píng)價(jià)強(qiáng)調(diào)目的素養(yǎng)化、真實(shí)化、能力化,淡化單純的知識(shí)本位和技能本位,不僅評(píng)價(jià)學(xué)生知道什么還評(píng)價(jià)學(xué)生能做什么。
4.相關(guān)理論辨析
不同的理論展現(xiàn)了不同領(lǐng)域的研究對(duì)學(xué)生美術(shù)素養(yǎng)的側(cè)重和切入視角的差異,但彼此能夠融合互補(bǔ)。模糊美學(xué)理論將不確定性引進(jìn)美學(xué)領(lǐng)域,從人類固有的思維模式和現(xiàn)代美學(xué)的基本特征出發(fā),對(duì)美術(shù)素養(yǎng)的本質(zhì)進(jìn)行了剖析,認(rèn)為人類的主觀創(chuàng)作過程、作品的客觀呈現(xiàn)狀態(tài),以及審美主體的主觀解讀過程都是具有模糊性,并不能給予一個(gè)精確的評(píng)價(jià),這是本研究的美學(xué)基礎(chǔ)。對(duì)素養(yǎng)的測(cè)評(píng)還需要采用專業(yè)的技術(shù)路徑,在教育目的與學(xué)習(xí)結(jié)果之間設(shè)置一定的層級(jí),并對(duì)每一層級(jí)的目標(biāo)作出可理解、可傳播、可實(shí)施、可評(píng)價(jià)的陳述(戴海琦, 羅照盛, 2013),而認(rèn)知心理學(xué)理論為美術(shù)素養(yǎng)測(cè)評(píng)提供了指標(biāo)劃分的依據(jù)。對(duì)素養(yǎng)的評(píng)價(jià)需要為學(xué)生提供展示指向素養(yǎng)的學(xué)習(xí)證據(jù)的機(jī)會(huì),而表現(xiàn)性評(píng)價(jià)理論被認(rèn)為是核心素養(yǎng)時(shí)代最有價(jià)值的評(píng)價(jià)設(shè)計(jì)理論。
測(cè)評(píng)工具的研發(fā),需要以系列指標(biāo)為載體(范涌峰, 宋乃慶, 2019),測(cè)量的操作性定義是研究變量與如何測(cè)量之間的橋梁,將抽象的概念變得能夠觀察與測(cè)量。從操作性定義構(gòu)建指標(biāo)體系是切實(shí)可行的做法(宋乃慶, 羅士琰, 2018)。本研究借鑒我國(guó)基礎(chǔ)教育質(zhì)量監(jiān)測(cè)領(lǐng)域成熟的研究范式,如:教科書的難度分析(鄺孔秀, 姚純青, 蔡慶有, 宋乃慶, 2015)、閱讀素養(yǎng)(羅士琰, 宋乃慶, 2016)、信息技術(shù)素養(yǎng)(張輝蓉等, 2017)中測(cè)評(píng)指標(biāo)體系構(gòu)建的路徑,結(jié)合本研究構(gòu)建的小學(xué)生美術(shù)素養(yǎng)的內(nèi)涵,從操作性定義入手,根據(jù)內(nèi)涵界定與理論基礎(chǔ),通過實(shí)證的方式構(gòu)建小學(xué)生美術(shù)素養(yǎng)測(cè)評(píng)指標(biāo)體系,再結(jié)合專家的建議和一線教育工作者的實(shí)踐經(jīng)驗(yàn),修訂完善指標(biāo)體系進(jìn)而計(jì)算各個(gè)維度的權(quán)重。
1.小學(xué)生美術(shù)素養(yǎng)的操作性定義
雖然前文已經(jīng)對(duì)美術(shù)素養(yǎng)概念進(jìn)行了新的內(nèi)涵解讀,但是這個(gè)解讀距離在測(cè)評(píng)中如何具體操作的要求還很遠(yuǎn)。任何一個(gè)概念的意義只有借助于人們使用和檢驗(yàn)這個(gè)概念時(shí)所采用的操作才能加以確定(布里奇曼, 1927)。前期的研究是操作性定義的前提和依據(jù),下操作性定義就是怎樣描述變量與測(cè)量變量,即采用可觀察、可測(cè)量、可操作的特征來界定變量。通過前期的文獻(xiàn)研究可知,對(duì)美術(shù)素養(yǎng)操作性定義的研究付之闕如,因此對(duì)其研究就顯得尤為迫切。本研究采用常用的下操作性定義的方式,首先分析變量的概念性定義,其次根據(jù)概念性定義,明確變量的本質(zhì)特征,最后采用恰當(dāng)?shù)姆椒ǎ鶕?jù)研究需要將變量本質(zhì)特征具體化、操作化(趙軍, 周玉清, 2011)。
美術(shù)素養(yǎng)的操作性定義是對(duì)美術(shù)素養(yǎng)概念的具體化,美術(shù)素養(yǎng)是比較抽象復(fù)雜的概念,并且在不同的情境下的表現(xiàn)也是千變?nèi)f化的,在下操作性定義的過程中,不能將美術(shù)素養(yǎng)的所有因素都測(cè)量出來,但是必須保證操作性定義基本能夠反映美術(shù)素養(yǎng)的固有特性。首先,美術(shù)素養(yǎng)的內(nèi)涵指向個(gè)體在美術(shù)活動(dòng)中表現(xiàn)出對(duì)觀念、情感、事物的觀察與探詢。其次是在過程中觀測(cè)要點(diǎn)感知、表達(dá)、聯(lián)結(jié)和鑒賞方面的表現(xiàn),綜合來說是知識(shí)、技能、品格的水平。第一、根據(jù)操作性定義界定的步驟,學(xué)生美術(shù)素養(yǎng)概念性定義限定為學(xué)生在美術(shù)情境中的各個(gè)環(huán)節(jié)表現(xiàn)水平的價(jià)值判斷,表現(xiàn)為在感知、表達(dá)、鑒賞、聯(lián)結(jié)層面所體現(xiàn)過程與結(jié)果之間的價(jià)值表征。第二,確定變量的本質(zhì)特征。美術(shù)素養(yǎng)在于通過制作可視物體來建構(gòu)、傳達(dá)意義,把美術(shù)作為交流思想的重要工具,特點(diǎn)在于整合智力、情感和身體技能。第三,運(yùn)用指標(biāo)描述法將變量本質(zhì)特征具體化、操作化。因此本研究認(rèn)為美術(shù)素養(yǎng)的操作性定義,即:第一,從更廣泛的信息源中尋找、選擇、統(tǒng)整信息,把握信息的形式特征;第二,運(yùn)用美術(shù)知識(shí)與技能,使用各種媒材將內(nèi)化的信息、感受、情感等內(nèi)容表現(xiàn)為可視化的作品;第三,基于具體問題,用美術(shù)知識(shí)、技能與思維方式,對(duì)跨學(xué)科問題和生活中的實(shí)際問題形成解決方案。第四,運(yùn)用對(duì)比、分析、闡釋等方式對(duì)美術(shù)作品教學(xué)分析,理解與尊重文化多樣性。
2.測(cè)評(píng)指標(biāo)的征集、抽取、發(fā)散和收斂
指標(biāo)的征集,采用訪談與問卷結(jié)合的形式進(jìn)行,首先選取義務(wù)教育美術(shù)課標(biāo)組成員、高校美術(shù)教育研究者、特級(jí)教師、教研員進(jìn)行訪談。圍繞美術(shù)素養(yǎng)的內(nèi)涵、意義以及在我國(guó)義務(wù)教育美術(shù)課程標(biāo)準(zhǔn)及美術(shù)教學(xué)現(xiàn)狀下從哪些方面進(jìn)行測(cè)評(píng)等問題進(jìn)行。對(duì)訪談的結(jié)果進(jìn)行要素分析,結(jié)合對(duì)義務(wù)教育美術(shù)課程標(biāo)準(zhǔn)(2011)進(jìn)行解讀,制定初步指標(biāo)。隨后進(jìn)行問卷調(diào)查請(qǐng)專家們根據(jù)自己的理解在初步指標(biāo)選項(xiàng)上做認(rèn)同度調(diào)查。另外設(shè)計(jì)了開放性問題“您認(rèn)為除了問卷中總結(jié)的指標(biāo)外,還有哪些要測(cè)量的內(nèi)容?以及您認(rèn)同的指標(biāo)應(yīng)該如何才能測(cè)量”等問題展開。
指標(biāo)抽取是建立在訪談與問卷調(diào)查的基礎(chǔ)上,根據(jù)指標(biāo)的內(nèi)涵與所屬關(guān)系分為主要素和次要素,并通過規(guī)范性的陳述將要素表述為適合小學(xué)生美術(shù)素養(yǎng)測(cè)評(píng)的具體指標(biāo)。具體而言,欣賞與文化傳承為主要素抽取為審美鑒賞一級(jí)維度,內(nèi)容的知覺與美學(xué)原理的體驗(yàn)以及對(duì)文化的傳承與詮釋為子要素;制作與表達(dá)為主要素抽取為美術(shù)表達(dá)一級(jí)維度,規(guī)劃、調(diào)查、主旨為子要素;跨學(xué)科思維與創(chuàng)新思維維度為主要素抽取為創(chuàng)意聯(lián)結(jié)一級(jí)維度,綜合、聯(lián)系、關(guān)聯(lián)、解決問題為子要素;感知、識(shí)別為主要素抽取為感知識(shí)別一級(jí)維度,觀察、辨別、感知為子要素。
指標(biāo)發(fā)散過程主要是依據(jù)可觀察、可操作、可測(cè)量性依據(jù)一級(jí)指標(biāo)的涵義對(duì)子要素進(jìn)行分解,進(jìn)而形成二級(jí)指標(biāo)。例如,感知識(shí)別一級(jí)維度是小學(xué)生美術(shù)素養(yǎng)的基礎(chǔ),感知的首要行為是對(duì)信息的抓捕,形成整體的印象,然后根據(jù)學(xué)生的期望、需求、習(xí)慣和態(tài)度對(duì)感知到的信息進(jìn)行轉(zhuǎn)換,進(jìn)而從圖像中獲取有用的信息,因此可以分為圖形感知和圖像識(shí)別兩個(gè)二級(jí)維度。美術(shù)表達(dá)一級(jí)維度是小學(xué)生美術(shù)素養(yǎng)的主要外顯形式,表達(dá)的第一步是通過理解、想象等過程,明確表現(xiàn)主題、意圖、情感走向或者是明確亟待解決的問題,形成結(jié)構(gòu)化的創(chuàng)作意向;其次是能靈活運(yùn)用線條、形狀、形體、空間、色彩、明暗、質(zhì)感等視覺元素,運(yùn)用均衡、重復(fù)、對(duì)比、節(jié)奏、比例等構(gòu)成形式通過意象符號(hào)豐富藝術(shù)形象,并構(gòu)成一個(gè)有意義視覺框架,由此可以發(fā)散出主題構(gòu)思和形式表達(dá)兩個(gè)二級(jí)維度。創(chuàng)意聯(lián)結(jié)一級(jí)維度是美術(shù)素養(yǎng)與外界聯(lián)系紐帶,主要表現(xiàn)為了解美術(shù)與其他學(xué)科及生活的關(guān)系,能夠?qū)⒚佬g(shù)思維與其他知識(shí)技能相融合,形成跨學(xué)科、跨知識(shí)群思考的意識(shí),能以獨(dú)特的視角看待周邊事物,能創(chuàng)造性地解決生活中的實(shí)際問題,由此可以發(fā)散出創(chuàng)想構(gòu)建和實(shí)踐運(yùn)用兩個(gè)二級(jí)維度。審美鑒賞一級(jí)維度是美術(shù)素養(yǎng)內(nèi)化于心的階段,是美術(shù)素養(yǎng)的進(jìn)一步鞏固和發(fā)展,學(xué)生基于圖像信息所表達(dá)的意蘊(yùn)和情感特征,領(lǐng)悟美感的特質(zhì)、認(rèn)知與表現(xiàn)方式,增進(jìn)生活的豐富性與美感體驗(yàn)完善審美知覺能力,美術(shù)來源于生活而高于生活,美術(shù)從文化中衍生,最終也是要促進(jìn)文化的發(fā)展,主要對(duì)文化的傳承與認(rèn)同,由此可以發(fā)散出審美知覺與文化認(rèn)同兩個(gè)二級(jí)維度。
指標(biāo)收斂是指修改和刪除含義重疊或與所屬上級(jí)指標(biāo)關(guān)聯(lián)程度不高的同級(jí)指標(biāo),以達(dá)到同級(jí)指標(biāo)相互獨(dú)立并與上級(jí)指標(biāo)涵義一致的目的。例如,“審美鑒賞”包括審美知覺與文化認(rèn)同兩個(gè)二級(jí)指標(biāo),然而雖然這里的知覺更多的是指向認(rèn)知層面,但是容易和感知識(shí)別維度里面的初級(jí)知覺混淆,也不容易區(qū)分并有一定的重復(fù)性,因此將其修改為“審美闡釋”。在此基礎(chǔ)上形成了小學(xué)生美術(shù)素養(yǎng)測(cè)評(píng)指標(biāo)體系初稿。
3.指標(biāo)的修訂與認(rèn)同度調(diào)查
經(jīng)過多輪征求意見,專家和一線教師對(duì)測(cè)評(píng)指標(biāo)體系認(rèn)同度較高,同時(shí)對(duì)部分指標(biāo)表述的規(guī)范性以及指標(biāo)劃分的合理性和測(cè)評(píng)的可操作性提出了具體的修改意見,根據(jù)修改意見本研究對(duì)指標(biāo)體系進(jìn)行了多次修訂與再次征求意見。具體而言,一級(jí)指標(biāo)劃分中對(duì)感知識(shí)別維度,是否能測(cè)以及是否存在,有專家提出修改意見;二級(jí)指標(biāo)主要存在部分指標(biāo)劃分后重疊、與認(rèn)知心理學(xué)有較大的差異,與兒童藝術(shù)心理學(xué)有較大的差異,綜合意見后修改3 項(xiàng)指標(biāo);觀測(cè)點(diǎn)主要存在描述不清晰和重疊的問題,還存在著二級(jí)指標(biāo)修訂進(jìn)而涉及觀測(cè)點(diǎn)的調(diào)整,主要涉及5 項(xiàng)指標(biāo)修改。
為進(jìn)一步檢驗(yàn)“小學(xué)生美術(shù)素養(yǎng)測(cè)評(píng)指標(biāo)體系”的適切性與科學(xué)性,對(duì)高校美術(shù)測(cè)評(píng)領(lǐng)域權(quán)威專家以及一線美術(shù)教師進(jìn)行了實(shí)證調(diào)查。結(jié)合學(xué)生美術(shù)學(xué)習(xí)特點(diǎn),我們編制了“小學(xué)生美術(shù)素養(yǎng)測(cè)評(píng)指標(biāo)體系認(rèn)同度問卷”,通過問卷星平臺(tái)定向發(fā)送給美術(shù)教育領(lǐng)域研究人員,調(diào)查了京、滬、渝等20 個(gè)省份以及國(guó)外的高校專家、教科院所研究人員、一線教師,共回收有效問卷643 份,其中包含高校專家17 份、高級(jí)教師71 份、一級(jí)教師221 份。專家對(duì)感知識(shí)別、美術(shù)表達(dá)、創(chuàng)意聯(lián)結(jié)、審美鑒賞四個(gè)維度認(rèn)同度的平均值分別為92.2%、95.3%、96.4%、94.6%,其中感知識(shí)別下的圖形感知和圖像識(shí)別指標(biāo)的認(rèn)同度平均值分別為93.31%和92.42%,美術(shù)表達(dá)下的主題構(gòu)思和形式表達(dá)指標(biāo)的認(rèn)同度平均值分別為94.56% 和95.96%,創(chuàng)意聯(lián)結(jié)下的思維建構(gòu)和實(shí)踐運(yùn)用指標(biāo)的認(rèn)同度平均值分別為95.49% 和96.43%,審美鑒賞下的審美闡釋和文化認(rèn)同指標(biāo)的認(rèn)同度平均值分別為94.87%和87.93%。由此可以初步判斷所構(gòu)建的小學(xué)生表現(xiàn)素養(yǎng)測(cè)評(píng)指標(biāo)體系是基本合理的。
4.小學(xué)生美術(shù)素養(yǎng)測(cè)評(píng)指標(biāo)體系的確定
國(guó)內(nèi)關(guān)于小學(xué)生美術(shù)素養(yǎng)測(cè)評(píng)的本土化研究不多,并且并未涉及到權(quán)重賦值的工作,需要對(duì)其進(jìn)行賦值研究。本研究采用主觀賦權(quán)法和客觀賦權(quán)法結(jié)合的方式進(jìn)行賦值,以確保指標(biāo)權(quán)重更加準(zhǔn)確。本研究首先征求了19 位美術(shù)教育專家關(guān)于指標(biāo)的權(quán)重賦值意見,經(jīng)過一致性檢驗(yàn)后確定各指標(biāo)的主觀權(quán)重。其次,使用本研究獲得的測(cè)評(píng)數(shù)據(jù)進(jìn)行熵值法計(jì)算客觀權(quán)重。最后,合并主客觀權(quán)重,確定小學(xué)生美術(shù)素養(yǎng)綜合權(quán)重值,如下表1,在前期研究的基礎(chǔ)上構(gòu)建了小學(xué)生美術(shù)素養(yǎng)測(cè)評(píng)指標(biāo)體系。四個(gè)一級(jí)指標(biāo)的綜合權(quán)重值的作用在于說明哪個(gè)指標(biāo)在表征美術(shù)素養(yǎng)時(shí)相對(duì)重要一些。這四個(gè)綜合權(quán)重值將用于計(jì)算學(xué)生總體美術(shù)素養(yǎng)水平的IRT 分?jǐn)?shù),具體而言,通過IRT 模型得到學(xué)生在各一級(jí)指標(biāo)(維度)上的能力估計(jì)值之后,將各能力估計(jì)值乘以相應(yīng)權(quán)重再相加,用公式表示成:Y=0.288*X1+0.278*X2+0.255*X3+0.179*X4,其中Y 表示學(xué)生總體美術(shù)素養(yǎng)水平,X1-X4 分別表示四個(gè)一級(jí)指標(biāo)的IRT 能力估計(jì)值。
表1 小學(xué)生美術(shù)素養(yǎng)測(cè)評(píng)指標(biāo)體系
在教育和心理學(xué)領(lǐng)域中,人的潛在心理特質(zhì)(如態(tài)度、能力等)通常無法直接觀察得到,只能通過相應(yīng)的刺激使個(gè)體展示出能體現(xiàn)該潛在特質(zhì)的外在行為表現(xiàn)(戴海琦, 羅照盛, 2013)。教育測(cè)驗(yàn)通常是通過給學(xué)生呈現(xiàn)一套測(cè)驗(yàn)題目,根據(jù)學(xué)生在測(cè)驗(yàn)題目上的作答情況來推測(cè)學(xué)生的潛在特質(zhì)。美術(shù)素養(yǎng)測(cè)評(píng)的難點(diǎn)在于,學(xué)生創(chuàng)作的藝術(shù)作品是一個(gè)有意義的對(duì)象,反映了自身的藝術(shù)價(jià)值和審美意圖,并為觀賞者提供了感官感知和欣賞,涉及到深層次的動(dòng)機(jī)和學(xué)生與環(huán)境之間的互動(dòng)等不可直接觀察因素(Dorn, 2014)。IRT 通過非線性的數(shù)學(xué)函數(shù)將可觀察到的應(yīng)試者外部表現(xiàn)和不可觀察的潛在特質(zhì)或能力之間的關(guān)系給予刻畫,較為合理地反映了學(xué)生外在的美術(shù)作品和其潛在美術(shù)素養(yǎng)間的內(nèi)在關(guān)系。經(jīng)典測(cè)量理論雖然也可以通過測(cè)試對(duì)學(xué)生能力進(jìn)行測(cè)量,但由于其理論體系上的先天不足,因而具有許多局限性,如只含有一個(gè)測(cè)量誤差,導(dǎo)致誤差估計(jì)的不精確性和籠統(tǒng)性,另外,題目難易估計(jì)值受不同能力水平的學(xué)生群體的影響,當(dāng)學(xué)生群體的整體能力水平較高時(shí),題目難度較低,反之難度較高。IRT 在潛在特質(zhì)的測(cè)量上則更加科學(xué),如IRT 框架下,各測(cè)驗(yàn)題目對(duì)于不同潛特質(zhì)水平均有相應(yīng)的測(cè)量誤差給予表征,有利于研究者判斷估計(jì)結(jié)果的準(zhǔn)確性,再者IRT 框架下的題目難易估計(jì)值則不依賴于學(xué)生群體。因此,項(xiàng)目反應(yīng)理論可更加科學(xué)地用來揭示所觀察到的學(xué)生測(cè)試表現(xiàn)背后所反映的不可觀測(cè)的潛在特質(zhì)或能力。
由于反映學(xué)生美術(shù)素養(yǎng)的測(cè)試表現(xiàn)難以用正確與錯(cuò)誤這種客觀題型進(jìn)行評(píng)判,而應(yīng)使用多級(jí)計(jì)分形式進(jìn)行評(píng)判,而等級(jí)反應(yīng)模型(Graded Response Model, GRM)適用于主觀題的多級(jí)評(píng)分形式(康春花,孫小堅(jiān), 曾平飛, 2016, 2017),即每道題的測(cè)評(píng)結(jié)果具有三個(gè)及以上等級(jí)的試題,是多級(jí)記分模型中應(yīng)用最廣的模型之一,因而可以用于對(duì)美術(shù)素養(yǎng)進(jìn)行測(cè)評(píng)。GRM 假設(shè)每道題有一個(gè)區(qū)分度和多個(gè)難度等級(jí),且每道題各個(gè)等級(jí)上的難度值單調(diào)遞增。
GRM 假設(shè),學(xué)生在第i題上得k及以上等級(jí)分?jǐn)?shù)的概率為:
學(xué)生得分屬于第k個(gè)等級(jí)的概率為:
其中,K為題目等級(jí)數(shù),D為常數(shù),通常為1.702,ai為 題目i的區(qū)分度,bik為題目i在第k等級(jí)的難度,θ表示學(xué)生的潛特質(zhì)水平,Pk(θ)表 示潛特質(zhì)水平為 θ的學(xué)生在題目i上達(dá)到得分等級(jí)k及以上的概率,P*k(θ)表 示潛特質(zhì)水平為 θ的學(xué)生在題目i上剛好得分等級(jí)為k的概率,學(xué)生得0 分及以上的概率為1(即P(x1≥0|θ)=1),而得K+1 及以上等級(jí)的概率為0(即P(xi≥K+1|θ)=0)。
一般而言,同一試卷中部分試題測(cè)量的是某一主要潛質(zhì),另一部分試題測(cè)量另一主要潛質(zhì),即一個(gè)試卷可以分解成若干個(gè)單維量表(雷新勇, 2007)。本研究根據(jù)確定的小學(xué)生美術(shù)素養(yǎng)測(cè)評(píng)指標(biāo)體系進(jìn)行試題研發(fā),在分析美國(guó)“國(guó)家藝術(shù)核心標(biāo)準(zhǔn)”(National Arts Standards)、“國(guó)家教育進(jìn)步評(píng)價(jià)”(National Assessment of Educational Progress)與澳大利亞昆士蘭學(xué)習(xí)管理局(Queensland Studies Authority)的試題,并篩選出與本研究合適的題目,進(jìn)行翻譯、校對(duì),同時(shí)根據(jù)測(cè)評(píng)指標(biāo)體系組織一線教師、教研員出題。本階段共搜集到45 道試題,經(jīng)過多輪的討論、反饋、修改,最終確定了包含30 道測(cè)試題的《小學(xué)生美術(shù)素養(yǎng)測(cè)評(píng)工具》,對(duì)象是針對(duì)五年級(jí)學(xué)生。測(cè)評(píng)工具采用閉卷作答、彩色印刷,測(cè)試時(shí)間為40 分鐘。
經(jīng)過兩輪試測(cè)與試題修訂后,最終保留25 道試題,形成了《小學(xué)生美術(shù)素養(yǎng)測(cè)評(píng)工具》。測(cè)評(píng)工具測(cè)試學(xué)生在感知識(shí)別、美術(shù)表達(dá)、創(chuàng)意聯(lián)結(jié)、審美鑒賞四個(gè)維度上的潛在特質(zhì),每個(gè)維度所對(duì)應(yīng)的題號(hào)具體情況如表2。
表2 小學(xué)生美術(shù)素養(yǎng)測(cè)評(píng)工具結(jié)構(gòu)表
為了檢驗(yàn)所編制的測(cè)評(píng)工具的科學(xué)性,本研究在廣東省深圳市、重慶市、河南省南陽市各隨機(jī)選擇7 所小學(xué)共410 名學(xué)生進(jìn)行預(yù)試,對(duì)美術(shù)素養(yǎng)測(cè)評(píng)工具的質(zhì)量進(jìn)行初步驗(yàn)證,其中,城市學(xué)校11 所,鄉(xiāng)村學(xué)校10 所。
研究得到測(cè)驗(yàn)的克隆巴赫α 系數(shù)為0.753,表明了測(cè)驗(yàn)內(nèi)各題目一致性程度較高;此外,四個(gè)子維度的克隆巴赫α 系數(shù)分別為0.79、0.73、0.74 和0.76。由此可知,測(cè)驗(yàn)中的試題在整個(gè)測(cè)驗(yàn)和各子維度上均具有較高的信度。效標(biāo)效度是指試卷的得分與某外部效標(biāo)之間的一致性。選擇教師對(duì)學(xué)生美術(shù)素養(yǎng)的等級(jí)評(píng)價(jià)(優(yōu)、良、中、差)作為效標(biāo)進(jìn)行效標(biāo)效度檢驗(yàn),結(jié)果發(fā)現(xiàn)教師評(píng)價(jià)等級(jí)與試卷評(píng)價(jià)等級(jí)兩者之間的相關(guān)系數(shù)為0.504,并且通過了顯著性檢驗(yàn),以此得到試卷的效標(biāo)效度較好。
IRT 參數(shù)方面,研究將使用R 軟件中的mirt 包進(jìn)行模型參數(shù)的估計(jì),其中,學(xué)生能力水平使用期望后驗(yàn)(expected a-posteriori)進(jìn)行估計(jì),而題目參數(shù)則使用期望-最大化算法進(jìn)行估計(jì)。學(xué)生參數(shù)的估計(jì)結(jié)果顯示,感知識(shí)別、美術(shù)表達(dá)、創(chuàng)意聯(lián)結(jié)、審美鑒賞維度上男生能力均值分別為-0.076、-0.141、-0.108、-0.087,女生能力均值為0.080、0.151、0.107、0.084,顯然,在四個(gè)維度上女生的表現(xiàn)均比男生好,且經(jīng)過獨(dú)立性T 檢驗(yàn)后證明男女生表現(xiàn)差異顯著;感知識(shí)別、美術(shù)表達(dá)、創(chuàng)意聯(lián)結(jié)、審美鑒賞維度上城市學(xué)生能力均值分別為0.181、0.148、0.126、0.141,鄉(xiāng)村學(xué)生能力均值為-0.107、-0.086、-0.077、-0.093,顯然,在四個(gè)維度上城市學(xué)生的表現(xiàn)均比農(nóng)村學(xué)生好,且經(jīng)過獨(dú)立性T 檢驗(yàn)后證明城鄉(xiāng)學(xué)生表現(xiàn)差異顯著。因此,測(cè)驗(yàn)?zāi)軌蚝芎玫貦z驗(yàn)出不同群體中的異質(zhì)性。
預(yù)測(cè)試中的題目參數(shù)將用于估計(jì)題目和測(cè)驗(yàn)信息量,IRT 使用題目信息量來反映試題信度,而使用測(cè)驗(yàn)(維度)信息量來反映整個(gè)測(cè)驗(yàn)或維度的信度。信息量是指測(cè)驗(yàn)題目在評(píng)價(jià)學(xué)生特質(zhì)水平狀態(tài)時(shí)所提供的信息的確定性水平,信息量越大代表測(cè)驗(yàn)提供的關(guān)于學(xué)生潛在特質(zhì)水平的相關(guān)信息越多,測(cè)驗(yàn)的信度也就越高。圖1 呈現(xiàn)了預(yù)測(cè)試中四個(gè)一級(jí)維度的信息量(該維度下所有題目信息量的加總),由圖可知,感知識(shí)別維度上各題目對(duì)于感知水平在-3.9 到1.2 之間的學(xué)生可以提供2.38 及以上的信息量,此時(shí),學(xué)生素養(yǎng)水平的估計(jì)準(zhǔn)確性能夠達(dá)到中等及以上水平(Baker & Kim, 2017),說明當(dāng)學(xué)生對(duì)美術(shù)的感知識(shí)別水平在-3.9 到1.2 時(shí),這些題目可以為學(xué)生提供較為準(zhǔn)確的能力估計(jì)值;美術(shù)表達(dá)維度上的題目對(duì)于美術(shù)表達(dá)水平在-4 到4 之間學(xué)生可以提供比較多的信息量(2.38 以上),因而這些題目適合測(cè)量美術(shù)表達(dá)水平在-4 到4 的學(xué)生,并且在-1.9 到2.6 之間的所提供的信息量達(dá)到4 以上,可見當(dāng)學(xué)生的美術(shù)表達(dá)水平在-1.9 到2.6 之間時(shí),所估計(jì)的學(xué)生美術(shù)表達(dá)水平的標(biāo)準(zhǔn)誤在0.5 以下(為信息量,θ 為素養(yǎng)水平);而創(chuàng)意聯(lián)結(jié)維度上的題目對(duì)于美術(shù)創(chuàng)意水平在-3.3 到1.2 之間學(xué)生提供了比較多的信息量,因而適合測(cè)量美術(shù)創(chuàng)新水平在-3.3 到1.2 的學(xué)生;最后,審美鑒賞維度上的題目對(duì)于美術(shù)審美水平在-1.9 到3.5 之間學(xué)生提供了比較多的信息量,故這些題目適合測(cè)量美術(shù)審美水平在-1.9 到3.5 的學(xué)生。綜合各維度的總體信息可知,對(duì)各個(gè)美術(shù)素養(yǎng)水平的學(xué)生來說,該美術(shù)素養(yǎng)測(cè)評(píng)工具中有合適的試題為其提供較多的信息量,故測(cè)驗(yàn)在估計(jì)學(xué)生各維度的素養(yǎng)水平時(shí)可以提供較高的信度。
圖1 四個(gè)一級(jí)維度的測(cè)驗(yàn)信息量
本研究在全國(guó)進(jìn)行了美術(shù)素養(yǎng)測(cè)評(píng)工具的大范圍應(yīng)用。研究在重慶市、廣東省深圳市、四川省成都市、河南省南陽市、貴州省遵義市各選擇3 個(gè)區(qū)(縣),每個(gè)區(qū)(縣)抽取8 個(gè)學(xué)校進(jìn)行施測(cè),共抽取120 所小學(xué)的3 770 名五年級(jí)學(xué)生參加測(cè)試。剔除空白卷及作答異常卷后,有效學(xué)生為3 695 人,有效率為98%。
本研究使用GRM 分析數(shù)據(jù),采用R 軟件中自帶的mirt 包實(shí)現(xiàn)模型參數(shù)估計(jì),其題目參數(shù)和學(xué)生參數(shù)的估計(jì)方法與預(yù)測(cè)試時(shí)的方法相同,最終可以得到各道題的難度參數(shù)和區(qū)分度參數(shù)以及學(xué)生的潛在美術(shù)素養(yǎng)水平。
模型和數(shù)據(jù)之間是否擬合關(guān)系到后續(xù)估計(jì)結(jié)果的有效性問題,故在具體分析題目和學(xué)生參數(shù)之前,先對(duì)模型和數(shù)據(jù)間的擬合情況進(jìn)行分析,由于研究具有比較大的樣本量,傳統(tǒng)的基于卡方分布的統(tǒng)計(jì)量在大樣本情況下很容易出現(xiàn)顯著情況,故研究使用RMSEA、SRMSR、CFI 和TLI 四個(gè)絕對(duì)擬合指標(biāo)來刻畫模型和數(shù)據(jù)間的擬合情況,其中RMSEA 值在0.08 以下、SRMSR 值在0.05 以下,CFI 和TLI 值在0.9 以上時(shí),說明模型和數(shù)據(jù)之間的擬合度較好,四個(gè)維度的整體擬合結(jié)果如表3 所示。四個(gè)維度下的RMSEA 均在0.08 以下,而SRMSR 均在0.05 以下;此外,感知識(shí)別和審美鑒賞兩個(gè)維度在TLI 和CFI 兩個(gè)指標(biāo)上的表現(xiàn)相對(duì)較差,二者在CFI 上的表現(xiàn)較為接近臨界值(0.9),但在TLI 上的表現(xiàn)則離臨界值較遠(yuǎn);美術(shù)表達(dá)和創(chuàng)意聯(lián)結(jié)兩個(gè)維度則在TLI 和CFI 上的表現(xiàn)比較好??傮w而言,四個(gè)維度的模型擬合情況比較理想(RMSEA、SRMSR 和CFI 值較好),說明研究所用的模型可以較好地?cái)M合數(shù)據(jù)。
表3 各維度下模型-數(shù)據(jù)擬合情況
各題目的擬合情況將使用RMSEA 進(jìn)行表征,其結(jié)果如表4 所示。有5 個(gè)題目的RMSEA 值在0.05 以上,但所有題目的RMSEA 均未超過0.08,說明這些題目的擬合情況均比較好,題目可以較好地?cái)M合研究中所采集到的三千多名學(xué)生的作答反應(yīng)情況。
表4 25 個(gè)試題的區(qū)分度值及各個(gè)難度等級(jí)的難度值
此外,在IRT 中,題目難度參數(shù)b 表示能力連續(xù)體(如從-3 到+3)在各測(cè)驗(yàn)題目上呈S 型的正確作答概率曲線在拐點(diǎn)處所對(duì)應(yīng)的能力值。難度的取值范圍大體在[-3, 3]之間,難度值越大,則題目的作答難度也越大。本研究中,難度值1 表示學(xué)生得且僅得1 分的難度值,難度值2 表示學(xué)生得且僅得2 分的難度值,以此類推,難度值5 表示學(xué)生得且僅得5 分的難度值。所有25 道題目中,五個(gè)分?jǐn)?shù)對(duì)應(yīng)的難度值最大分別為0.067、1.665、3.617、4.583、5.887,最小分別為-5.027、-4.063、-2.650、-1.800、-1.630。難度值1 中共有10 個(gè)題目的難度低于-3,難度值2 中共有3 個(gè)題目的難度低于-3,難度值3 中共有4 個(gè)題目的難度高于3,難度值4 中共有3 個(gè)題目的難度高于3,難度值5 中共有6 個(gè)題目的難度高于3。25 個(gè)題目的難度值3 大小范圍為[-2.650,3.617]。綜上,試題難度分布范圍較廣,可對(duì)水平很高和很低的學(xué)生進(jìn)行測(cè)試,使得整套試題能夠較為全面反映學(xué)生的能力狀況。
測(cè)驗(yàn)總分平均為55.013 分,標(biāo)準(zhǔn)差為11.903。測(cè)驗(yàn)得分集中于50 分到68 分,測(cè)驗(yàn)分?jǐn)?shù)分布如圖2所示,其偏度為-0.63,峰度為0.54,正態(tài)分布檢驗(yàn)(Shapiro-Wilk 正態(tài)性檢驗(yàn))結(jié)果顯示,該測(cè)驗(yàn)得分為負(fù)偏態(tài)分布,得高分的人數(shù)相對(duì)較為集中。
圖2 學(xué)生美術(shù)素養(yǎng)測(cè)驗(yàn)總分分布情況
研究計(jì)算了學(xué)生作答與題目之間的擬合情況(即學(xué)生擬合情況),學(xué)生擬合將同時(shí)使用infit 和outfit 擬合進(jìn)行評(píng)估,當(dāng)兩個(gè)指標(biāo)的值在0.7 到1.3 之間時(shí),說明學(xué)生擬合良好,否則學(xué)生擬合較差。研究結(jié)果表明在感知識(shí)別維度上,有3 622 名學(xué)生的擬合情況良好,在美術(shù)表達(dá)維度上,有3 598 名學(xué)生的作答擬合良好,在創(chuàng)意聯(lián)結(jié)和審美鑒賞兩個(gè)維度上,分別有3 576 和3 512 名學(xué)生的擬合情況良好。由此可見,整體而言,絕大多數(shù)學(xué)生在測(cè)驗(yàn)題目上的作答能夠較好地體現(xiàn)其潛在美術(shù)素養(yǎng)水平。
IRT 框架中,為保證模型可被識(shí)別,通常假定學(xué)生的潛特質(zhì)分布服從標(biāo)準(zhǔn)正態(tài)分布,此時(shí)其均值為0,方差為1,此處的潛特質(zhì)即為學(xué)生美術(shù)素養(yǎng)水平。但經(jīng)過實(shí)際數(shù)據(jù)的不斷校正,樣本中學(xué)生能力估計(jì)值的均值和標(biāo)準(zhǔn)差跟假定的值將有所出入。基于實(shí)證數(shù)據(jù)得到的學(xué)生在感知識(shí)別、美術(shù)表達(dá)、創(chuàng)意聯(lián)結(jié)、審美鑒賞四個(gè)維度上的素養(yǎng)情況如表5 所示。就平均值而言,學(xué)生在四個(gè)維度上的平均素養(yǎng)水平差異不大,在-0.001 到0.005 之間,均在0 附近,可見,學(xué)生在四個(gè)維度上的素養(yǎng)處于平均水平;就標(biāo)準(zhǔn)差而言,學(xué)生在四個(gè)維度上的素養(yǎng)水平標(biāo)準(zhǔn)差在0.675 到0.762 之間,說明學(xué)生在美術(shù)素養(yǎng)各個(gè)維度上水平差異度不大。獲得學(xué)生在四個(gè)一級(jí)維度上的素養(yǎng)水平后,通過公式Y(jié)=0.288*X1 + 0.278*X2 + 0.255*X3 +0.179*X4 可得到學(xué)生的總體美術(shù)素養(yǎng)水平,其中Y 表示學(xué)生總體美術(shù)素養(yǎng)水平,X1-X4 分別表示四個(gè)一級(jí)指標(biāo)的IRT 能力估計(jì)值。結(jié)果顯示,學(xué)生總體美術(shù)素養(yǎng)水平的均值為0.004,標(biāo)準(zhǔn)差為0.55,中位數(shù)為0.07,偏度和峰度分別為-0.54 和0.51;正態(tài)性檢驗(yàn)的結(jié)果表明學(xué)生總體美術(shù)素養(yǎng)水平不符合正態(tài)分布,與原始總分分布相同,亦為負(fù)偏態(tài)分布。圖3 呈現(xiàn)了不同素養(yǎng)水平區(qū)間上的學(xué)生分布情況,由圖可知,約有1 400 名學(xué)生的總體美術(shù)素養(yǎng)水平在0 到0.5 之間,有1 000 多名學(xué)生的總體美術(shù)素養(yǎng)水平在-0.5 和0.0 之間,素養(yǎng)水平在-1.0 以下和在1.0 以上的人數(shù)比較少??梢?,絕大多數(shù)學(xué)生的總體美術(shù)素養(yǎng)屬于中間水平[-1, 1),美術(shù)素養(yǎng)水平突出和不足的學(xué)生比較少。
圖3 IRT 框架下學(xué)生總體美術(shù)素養(yǎng)水平分布情況
表5 小學(xué)五年級(jí)學(xué)生美術(shù)素養(yǎng)水平在各個(gè)維度的基本情況
自從2015 年教育部頒布《中小學(xué)生藝術(shù)素質(zhì)測(cè)評(píng)指標(biāo)體系 (試行)》以來,各級(jí)教學(xué)與研究機(jī)構(gòu)都對(duì)學(xué)校藝術(shù)素質(zhì)測(cè)評(píng)進(jìn)行了研究,但由于缺乏從可觀察、可測(cè)量視角出發(fā)的學(xué)生美術(shù)素養(yǎng)內(nèi)涵把握,測(cè)驗(yàn)編制過程中對(duì)測(cè)量學(xué)問題的思考不足,對(duì)相關(guān)測(cè)量學(xué)技術(shù)的應(yīng)用程度不夠(易曉明, 2018),導(dǎo)致當(dāng)下學(xué)生美術(shù)素養(yǎng)測(cè)評(píng)工作陷入了困境,測(cè)評(píng)結(jié)果出現(xiàn)偏差?;陧?xiàng)目反應(yīng)理論的工具開發(fā)就成了扭轉(zhuǎn)這種現(xiàn)象的重要手段。
當(dāng)下大多數(shù)的美術(shù)素養(yǎng)測(cè)評(píng)工具都是由學(xué)科專家研發(fā)。學(xué)科專家大多數(shù)缺乏教育測(cè)量學(xué)的知識(shí),也缺乏對(duì)試卷的質(zhì)量進(jìn)行驗(yàn)證的研究方法,很難保證命題工作的科學(xué)化、規(guī)范化,經(jīng)常出現(xiàn)出題人覺得題目簡(jiǎn)單但是很多學(xué)生卻作答錯(cuò)誤的現(xiàn)象(張兆遠(yuǎn), 陶劍, 2018)。測(cè)評(píng)工具作為檢驗(yàn)學(xué)生學(xué)習(xí)水平的重要載體,是評(píng)價(jià)工作開展的基礎(chǔ),憑主觀經(jīng)驗(yàn)建構(gòu)的試題,有相當(dāng)大的隨意性和不可控性,雖然也能夠?qū)W(xué)生的美術(shù)素養(yǎng)水平進(jìn)行一定的判斷,但是很準(zhǔn)確描述學(xué)生美術(shù)素養(yǎng)發(fā)展水平。本研究使用的《小學(xué)生美術(shù)素養(yǎng)測(cè)驗(yàn)題》通過項(xiàng)目特征曲線來綜合展示各項(xiàng)目分析的結(jié)果,直觀地對(duì)題目的難度、區(qū)分度和學(xué)生能力水平等進(jìn)行科學(xué)把控。采用項(xiàng)目反應(yīng)理論建構(gòu)了測(cè)驗(yàn)試題,對(duì)學(xué)生美術(shù)素養(yǎng)試題的反應(yīng)與其潛在特質(zhì)之間的關(guān)系進(jìn)行了測(cè)量,用項(xiàng)目反應(yīng)理論函數(shù)對(duì)測(cè)試者的多個(gè)特質(zhì)進(jìn)行分別的推斷,得到每個(gè)應(yīng)答等級(jí)的難易程度,以及哪些題目上哪些群體的學(xué)生更容易出錯(cuò),進(jìn)而得到不同學(xué)生在不同維度上的掌握情況,較為全面地對(duì)學(xué)生的美術(shù)素養(yǎng)水平進(jìn)行了監(jiān)測(cè),了解了不同類型學(xué)生的美術(shù)素養(yǎng)水平差異。
為了保證學(xué)生美術(shù)素養(yǎng)監(jiān)測(cè)的科學(xué)性、公正性,學(xué)生美術(shù)素養(yǎng)測(cè)評(píng)逐步進(jìn)入了人們的視野,適用于不同目的的考試也逐漸增多,對(duì)試題質(zhì)量的要求也逐漸增強(qiáng),題庫的建立迫在眉睫。題庫是指按照一定的教育測(cè)量理論在計(jì)算機(jī)系統(tǒng)中實(shí)現(xiàn)某個(gè)學(xué)科試題的集合,是嚴(yán)格遵循教育測(cè)量理論,在精確的數(shù)學(xué)模型基礎(chǔ)上建立起來的教育測(cè)量工具(余勝泉, 何克抗, 2000)。經(jīng)典測(cè)量也可以提供項(xiàng)目的難度與區(qū)分度,但是只適合于特定的群體(余嘉元, 1992),使用項(xiàng)目反應(yīng)理論可以更客觀地得到試題的區(qū)分度、難度,以及學(xué)生的能力參數(shù),即便在不同的群體中使用的時(shí)候數(shù)據(jù)也具有可比性,可以以此作為試題命制的標(biāo)準(zhǔn),為建立適用于大規(guī)模測(cè)評(píng)的試題庫打下基礎(chǔ)。
當(dāng)下對(duì)測(cè)評(píng)工具質(zhì)量的把握存在兩張皮的現(xiàn)象,關(guān)注與測(cè)評(píng)理論研究的人員往往在高校,缺乏一線教學(xué)經(jīng)驗(yàn),而進(jìn)行學(xué)科試卷開發(fā)的人員多是教研員,前者缺乏學(xué)科領(lǐng)域的知識(shí),后者缺乏測(cè)評(píng)理論素養(yǎng)。就測(cè)評(píng)技術(shù)來說,雖然項(xiàng)目反應(yīng)理論所采用的試題參數(shù)不受樣本的影響,并能為學(xué)生提供不同的能力估值,但是由于其需要有要較為深厚的統(tǒng)計(jì)學(xué)功底,同時(shí)還要運(yùn)用多個(gè)軟件來進(jìn)行輔助研究,一線教研員和教師都缺乏相關(guān)的數(shù)據(jù)處理能力,故而很難在一線大規(guī)模運(yùn)用。要改變當(dāng)下美術(shù)素養(yǎng)測(cè)評(píng)的現(xiàn)狀,需要建立由學(xué)科專家、測(cè)量專家共同參與的研究團(tuán)隊(duì)來對(duì)測(cè)評(píng)工具的科學(xué)性指標(biāo)進(jìn)行不斷修正,從而保證測(cè)評(píng)工具的有效性、公正性和全面性。本研究基于項(xiàng)目反應(yīng)理論對(duì)小學(xué)生美術(shù)素養(yǎng)的測(cè)評(píng)工具的研究還很膚淺,但是期望能作為引玉之磚,期盼更多的美術(shù)教育工作者和教育統(tǒng)計(jì)學(xué)同仁推動(dòng)美術(shù)素養(yǎng)測(cè)評(píng)的研究“淡化形式,注重實(shí)質(zhì)”(宋乃慶, 陳重穆, 1996),避免測(cè)評(píng)工作流于形式。
(李健工作郵箱:541206550@qq.com)
華東師范大學(xué)學(xué)報(bào)(教育科學(xué)版)2023年6期