張雅琪 張軍朋
(華南師范大學(xué)物理與電信工程學(xué)院,廣東 廣州 510006)
如何評價學(xué)生的科學(xué)探究能力始終是科學(xué)教育者和科學(xué)教育機構(gòu)關(guān)注的問題.支持復(fù)雜的科學(xué)探究的學(xué)習(xí),其主要障礙是缺乏高質(zhì)量的、有深度的評價標(biāo)準(zhǔn)和方法.一方面,現(xiàn)有的評價標(biāo)準(zhǔn)和方法有的并不能反映科學(xué)探究方面的內(nèi)容,有的則缺乏實踐性或過于復(fù)雜而難以操作.另一方面,以技術(shù)為基礎(chǔ)的評價標(biāo)準(zhǔn)和方法缺乏指導(dǎo)性的理論框架,難以為科學(xué)探究評價提供有效的操作和實踐.因此,研究和開發(fā)具有實踐導(dǎo)向性的科學(xué)探究的評價標(biāo)準(zhǔn)和方法就成為各國在實施科學(xué)探究教學(xué)中的關(guān)鍵問題,這個問題在我國變得更為突出.[1]
美國國家教育進(jìn)展評價(NAEP)是美國目前唯一的也是最權(quán)威的全國學(xué)生學(xué)業(yè)成就評價體系,其2009年的科學(xué)評價框架中提出,科學(xué)探究是在識別科學(xué)原理與應(yīng)用科學(xué)原理的基礎(chǔ)上進(jìn)行的,評價目的在于讓學(xué)生知道如何應(yīng)用科學(xué)知識和科學(xué)思維去提高對自然界的認(rèn)識,考察學(xué)生對于科學(xué)知識的應(yīng)用,即“做科學(xué)”的能力.
NAEP科學(xué)探究評價的形式包括紙筆測驗、操作表現(xiàn)性任務(wù)和計算機交互任務(wù).操作表現(xiàn)性任務(wù)和計算機交互任務(wù)并不是評價科學(xué)探究能力的最好以及唯一的方法,為了全面考核設(shè)計及評價科學(xué)探究的能力,紙筆測驗也是必要的.
NAEP科學(xué)試題的首要原則就是面向全體學(xué)生,使不同背景的學(xué)生都能夠展示他們的科學(xué)探究能力.因此,NAEP科學(xué)探究試題的編寫盡可能的考察所有學(xué)生的科學(xué)探究能力,而不是特定地域特定群體.
科學(xué)探究比簡單的觀察事物、總結(jié)規(guī)律及解釋現(xiàn)象要復(fù)雜得多,也比通常認(rèn)為的按照固定的邏輯順序開展科學(xué)研究要靈活的多.科學(xué)探究遠(yuǎn)不止“程序化的科學(xué)”那么簡單,而是包括了對于自然界的理解和其他科學(xué)家所做出的科學(xué)探究、理論模型和解釋說明進(jìn)行的評價,并嘗試對同一觀察結(jié)果提出不止一個解釋.因此,NAEP科學(xué)探究評價主要從設(shè)計科學(xué)探究與評價科學(xué)探究兩方面進(jìn)行.
設(shè)計科學(xué)探究方面的試題,可以向?qū)W生呈現(xiàn)一些有關(guān)數(shù)據(jù)的表格,讓其由表格中數(shù)據(jù)總結(jié)結(jié)論.如下面這道12年級的試題:
朱莉有4個瓶子,她想知道哪個瓶子可以裝最多的水.朱莉測量了每個空瓶子的質(zhì)量,然后測量了每個瓶子裝滿水后的質(zhì)量.她制作了如表1所示.
表1
問:哪個瓶子可以裝最多的水?
在評價科學(xué)探究方面,可以讓學(xué)生指出一個不完善的探究過程中的漏洞,或改進(jìn)這個探究過程以得到更準(zhǔn)確的數(shù)據(jù).如下面這道8年級試題:
梅格設(shè)計了一個實驗來比較3種運動鞋底的摩擦力大小,以下是她使用的儀器:
(1)運動鞋1. (2)運動鞋2.
(3)運動鞋3. (4)彈簧測力計.
她采取如圖1所示的步驟,并將彈簧測力計放在運動鞋的左側(cè).
圖1
梅格在體育館的地面上測量了一只運動鞋底部的摩擦力,在草地上測量了第二只,在水泥人行道上測量了第三只.教師對梅格設(shè)計的實驗不是很滿意.請指出梅格實驗的不足之處.
說明梅格應(yīng)當(dāng)如何改進(jìn)實驗來比較三種運動鞋底的摩擦力大小.
NAEP試題多采用組合題的形式,包括試題串、預(yù)測——觀察——解釋(POE)任務(wù)、操作表現(xiàn)性任務(wù)和計算機交互任務(wù).組合試題可能全部是選擇題,也可能全部是建構(gòu)反應(yīng)題,或二者兼有.如下面列出的12年級的試題:
密度可以用來識別金屬的特性之一.如果確定了一種金屬的密度,就可以確定是哪種金屬,如表2所示.
表2
問題1.假設(shè)給你一只戒指,希望你能夠確定它是否由純金制成.設(shè)計一個實驗來測量這只戒指的密度.說明你的測量步驟,包括需要使用的儀器,以及你準(zhǔn)備如何使用這些儀器測量戒指的密度.
問題2.假設(shè)你測得這只戒指的密度為15.3g/cm3,如果戒指是由表2中所列出的幾種金屬混合而成的,你如何由計算密度確定戒指由哪些金屬組成?解釋你的答案.
好題目的關(guān)鍵就是要明確測量的目標(biāo).通過題目,學(xué)生知道被問的是什么,以及怎樣的回答是正確的.
NAEP試題的編寫者明確地說明了每道題的出題目的,如上面所舉的問題1的目的為“測量戒指的密度”,問題2為“確定戒指的成分”.這不僅有助于根據(jù)評價標(biāo)準(zhǔn)將題目分類(屬于內(nèi)容領(lǐng)域還是實踐和認(rèn)知要求),并有助于開發(fā)評分標(biāo)準(zhǔn)與工具,減少評價中的分歧,為評價框架與說明提供依據(jù).
NAEP科學(xué)試題編寫者還認(rèn)為,一道題目的答案不應(yīng)當(dāng)作為另一題解答的依據(jù).如上面所舉的問題2中明確給出了戒指的密度值,而沒有要求學(xué)生先在問題1中計算密度,再由計算的結(jié)果確定戒指的成分.兩道題目之間是相互關(guān)聯(lián)的,但答案之間是相互獨立的,因為NAEP評價的是學(xué)生“做科學(xué)”的能力,而非化簡公式、計算數(shù)值等數(shù)學(xué)水平.
明確評價目標(biāo)不是將題目引向另一個極端—將題目模式化.太多的條條框框可能會變成讓學(xué)生按照既定的步驟進(jìn)行回答,而非考察學(xué)生的科學(xué)能力.在NAEP科學(xué)評價中,學(xué)生應(yīng)用科學(xué)探究的過程其實就是他們描繪自己對自然世界的理解過程,在描繪的過程中,學(xué)生應(yīng)當(dāng)具備科學(xué)的認(rèn)知和態(tài)度,如變量控制、大樣本的選擇、以及承認(rèn)結(jié)論的不完善性等.
題目的語言應(yīng)當(dāng)在不改變其測量功能的前提下盡量的清晰簡明,以幫助學(xué)生理解,減少學(xué)生的困惑.NAEP科學(xué)探究試題的首要原則是測量學(xué)生應(yīng)用科學(xué)知識和科學(xué)思維認(rèn)知對自然界的能力,而非閱讀、數(shù)學(xué)或其他能力,因此對題目閱讀水平和數(shù)學(xué)水平都稍低于學(xué)生的科學(xué)水平.NAEP試題的題目極少使用大段的描述,并通過使用相似的語言結(jié)構(gòu),減少解釋說明,避免雙重否定和多義詞語等方式使語言盡量的簡單明了.同時,NAEP科學(xué)試題大量使用現(xiàn)代生動的語句,并避免口語化和方言.必要時,也使用著重號、邊框或下劃線等版式使題目更加清晰明確.
插圖、曲線圖和表格等圖表能夠形象的反應(yīng)題目的信息,有效提高題目的考察效率.但是如果圖表使用不當(dāng),也會增加題目的迷惑性,使學(xué)生弄不清題目究竟要考察什么.NAEP科學(xué)探究試題使用圖表的首要原則是與題目內(nèi)容一致或相似,盡量避免在圖表中出現(xiàn)與題目無關(guān)的信息.所使用的圖表應(yīng)當(dāng)包含題目中所有重要的信息.從上面問題1的表格(表2)中,即可讀出“不同金屬具有不同密度值”、“金的密度是19.3g/cm3”、“各金屬具體密度值”等重要信息,而避免出現(xiàn)與考察內(nèi)容無關(guān)的信息.
情境信息包括問題情境、解釋說明、細(xì)節(jié)描述及背景知識等.適當(dāng)?shù)氖褂们榫承畔⒖梢詫⒖茖W(xué)概念置于全面的真實的環(huán)境中.科學(xué)探究能力的考查,需要在學(xué)生沒有遇到的新的物理問題情境下進(jìn)行.這就要求科學(xué)探究試題需要與學(xué)生的日常生活聯(lián)系緊密,如戒指是學(xué)生生活中常見的物體,而測量其密度以確定其成分則具備了一定的新穎性.
情境信息的語言應(yīng)當(dāng)簡單清晰、生動形象.設(shè)置的情境應(yīng)當(dāng)適合被測年級的科學(xué)水平,必要時可以向?qū)W生提供他們所不具備的背景知識,如各種金屬的密度值等.
NAEP科學(xué)探究試題的評分原則采用SOLO分類法,將學(xué)生的答案由高到低分為3個層次,分別給予滿分、部分分和零分.這3個層次的基本評分標(biāo)準(zhǔn)如下:
滿分:回答問題時能夠聯(lián)系多個事件,并進(jìn)行抽象概括.
部分分:回答問題時,只能從單一事件出發(fā)得出結(jié)論或聯(lián)系多個孤立事件,但未形成相關(guān)知識網(wǎng)絡(luò).
零分:沒有形成對問題的理解.
如上面問題1的評分標(biāo)準(zhǔn)是這樣設(shè)置的.
滿分:學(xué)生通過設(shè)計一個與下面過程類似的實驗展示了其測量金屬的密度來確定金屬成分的能力.
第1步,用天平稱量戒指,記錄其質(zhì)量m或“測量戒指的質(zhì)量”
第2步,將戒指放入盛有水的量杯中,并記錄放入戒指前后水的體積V.放入戒指后水的體積減去放入戒指前水的體積即為戒指的體積.
必要內(nèi)容:學(xué)生回答了上面步驟中的兩個或兩個以上.
部分分:學(xué)生回答了上面步驟中的一個.
零分:學(xué)生沒有提到上面步驟中的任何一個或?qū)W生混淆了質(zhì)量或體積與密度的關(guān)系.
在NAEP科學(xué)探究試題中,有些題目可能不止一個標(biāo)準(zhǔn)答案,只要學(xué)生的回答符合科學(xué)原理,能夠解釋提出的問題,就應(yīng)當(dāng)給予正確.評分原則的制定也充分考慮了多種答案的可能性.如有這樣一道12年級的題目,要求學(xué)生只使用水和量筒或量杯測量固體的體積.評分原則給出了兩種可能的方法.
方法1:在量筒中倒入一些水,記錄水的體積.然后將固體放入量筒中,再次記錄水的體積.兩次記錄的水的體積差就是固體的體積.
方法2:用溢液法.在杯中加滿水,放入固體,用量杯接住溢出的水,測量溢出水的體積等于該固體的體積.
在我國的科學(xué)課程標(biāo)準(zhǔn)中,近年來科學(xué)探究逐漸占有越來越重要的地位,科學(xué)探究已成為中小學(xué)科學(xué)課堂中的重要內(nèi)容.隨著科學(xué)探究在我國日益得到重視,科學(xué)探究評價所存在的問題也日益突出.如紙筆測驗是否能夠準(zhǔn)確的反映學(xué)生真實的科學(xué)探究能力,操作考核往往過于復(fù)雜且難以操作等等.
我國科學(xué)探究評價的目標(biāo)與實施的可操作性之間仍存在一定的距離.目前我國科學(xué)探究評價存在以下問題.
(1)答案相關(guān)與題目模式化.
探究試題中常設(shè)置多個問題,問題之間有著緊密的聯(lián)系——第一題的答案往往成為第二題的條件.如果學(xué)生因為計算或其他失誤而答錯了某題,可能會將后面的作答引入歧途,數(shù)學(xué)水平成為了影響學(xué)生科學(xué)能力評價的因素之一.
如這樣一道全國物理高考題,要求探究物體在斜面上運動時摩擦力與斜面傾角的關(guān)系.設(shè)計實驗通過用光電計時器記錄滑塊通過光電門時擋光的時間來進(jìn)行探究.題目首先列舉了實驗的具體步驟,然后要求學(xué)生用測量的物理量來完成下列各式:
① 斜面傾角的余弦cosα;
② 滑塊通過光電門時的速度v;
③ 滑塊運動時的加速度a;
④ 滑塊運動時所受到的摩擦阻力f.
計算斜面傾角和摩擦阻力并探究二者之間關(guān)系是本題的評價目的,然而摩擦阻力的求解需要借助第②、③問的結(jié)果,這不僅為學(xué)生求解本題提供了固定的方式,而且容易造成學(xué)生“一錯而再錯”.
該試題的另一個特點是給定了固定的器材和實驗步驟.除此之外,很多探究題也要求學(xué)生敘述經(jīng)典實驗的方法和步驟,失去了探究實驗應(yīng)具有的發(fā)散思維的精髓.這類探究題考察的仍然是學(xué)生對前人經(jīng)驗的積累程度,而非對于科學(xué)研究方法的體驗水平.科學(xué)探究應(yīng)重點考察學(xué)生理解自然界的方法與過程,而非讓學(xué)生按照固定步驟的“科學(xué)方法”重復(fù)前人的科學(xué)研究.
(2)題目描述過多.
探究試題應(yīng)當(dāng)設(shè)置真實的情境中,這往往造成了題目中大段的描述與解釋.學(xué)生在接觸題目時易產(chǎn)生抵觸與浮躁情緒,過多的文字也容易造成學(xué)生漏掉重要的信息,從而對題目產(chǎn)生迷惑.科學(xué)探究題目的考察目的應(yīng)為了解學(xué)生科學(xué)探究的能力,而不應(yīng)成為考察學(xué)生的閱讀水平或做文字游戲.
(3)圖表中過多無關(guān)信息.
在題目中插入圖表以使題目更加生活化逐漸成為一種趨勢,但應(yīng)注意避免無關(guān)信息給學(xué)生帶來解題的障礙.
如有一道中考題中給出了一張如圖2所示的出租車車票,要求學(xué)生計算出租車行駛的時間和平均速度.所示車票中的車號、單價、等候時間、金額等信息就容易引起學(xué)生的困惑或者忽略主要信息.
(4)情境設(shè)置不夠新穎與生活化.
為了使題目的設(shè)置貼近學(xué)生的現(xiàn)實生活,近年來的探究試題越來越多的加入了人們生活情境的元素.但是有些生活情境的設(shè)置過于陳舊,大多數(shù)素材來源于教材或教學(xué)內(nèi)容,如課本上已經(jīng)詳細(xì)說明的儀器或?qū)嶒?,缺乏介紹科技前沿的情境.而一些技術(shù)生產(chǎn)類的情境又與學(xué)生的生活相距過于遙遠(yuǎn),學(xué)生難以直觀地想象其具體的場景.另外,多數(shù)探究題目的情境設(shè)置在實驗室中進(jìn)行,給定了標(biāo)準(zhǔn)的實驗器材,缺乏學(xué)生生活中常見的現(xiàn)象或物體,不利于培養(yǎng)學(xué)生從身邊事物發(fā)現(xiàn)科學(xué)問題的能力.
(5)應(yīng)鼓勵學(xué)生多方式回答問題.
學(xué)生對于所呈現(xiàn)的情境材料有著不同的理解,解答問題的思路與方法也應(yīng)不盡相同.探究試題應(yīng)當(dāng)鼓勵學(xué)生通過不同的途徑處理與回答問題.如學(xué)生可以通過圖示、表格或方程式等方式來解答問題.探究試題應(yīng)當(dāng)能夠評價學(xué)生科學(xué)知識與能力方面的水平與學(xué)業(yè)成就.
美國NAEP在評價學(xué)生科學(xué)探究能力方面所做的工作,對我國科學(xué)探究評價無疑具有一定的借鑒與參考價值.我們應(yīng)當(dāng)在充分研究的基礎(chǔ)上,將NAEP科學(xué)探究評價中的精華部分與我國的國情相結(jié)合,以促進(jìn)我國中小學(xué)教學(xué)中科學(xué)探究評價的進(jìn)一步發(fā)展.
1 張軍朋,許桂清.中學(xué)物理科學(xué)探究學(xué)習(xí)評價與案例.北京:北京大學(xué)出版社,2010.
2 U.S.Department of Education,NCES.NAEP Sample Questions[DB/OL].http://nces.ed.gov/nationsreportcard/itmrls
3 NAGB&U.S.Department of Education.Science Framework for the 2011National Assessment of Educational Progress[DB/OL].http://www.nagb.org