国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

學(xué)習(xí)進(jìn)階測(cè)評(píng)工具研發(fā):以小學(xué)生統(tǒng)計(jì)思維為例 *

2020-04-21 09:18:46李化俠宋乃慶
關(guān)鍵詞:進(jìn)階測(cè)驗(yàn)工具

李化俠 宋乃慶 楊 濤 辛 濤

(1. 人民教育出版社課程教材研究所,中小學(xué)道德與法治國家教材建設(shè)重點(diǎn)研究基地,北京 100081;2. 西南大學(xué)中國基礎(chǔ)教育質(zhì)量監(jiān)測(cè)協(xié)同創(chuàng)新中心西南大學(xué)分中心,重慶 400715;3. 北京師范大學(xué)中國基礎(chǔ)教育質(zhì)量監(jiān)測(cè)協(xié)同創(chuàng)新中心,北京 100875)

一、問題提出

(一)學(xué)習(xí)進(jìn)階理論優(yōu)點(diǎn)突出但應(yīng)用受限

學(xué)習(xí)進(jìn)階(learning progressions,LPs)這一術(shù)語是美國國家研究理事會(huì)(National Research Council,NRC,2007)在2005年K-12年級(jí)科學(xué)成就測(cè)驗(yàn)政府工作報(bào)告中提出的。報(bào)告將學(xué)習(xí)進(jìn)階界定為“對(duì)學(xué)生在一定時(shí)間跨度內(nèi)學(xué)習(xí)和探究某一主題時(shí)依次進(jìn)階、逐級(jí)深化的思維方式的描述”。雖然學(xué)習(xí)進(jìn)階的提出已有十余年,但其定義仍無定論。有研究者指出,學(xué)習(xí)進(jìn)階不同定義的共同之處是都關(guān)注學(xué)生思維的發(fā)展歷程、聚焦于某一學(xué)科概念,描述學(xué)生在某一時(shí)間內(nèi)的思維發(fā)展?fàn)顩r(高一珠,陳孚,辛濤等,2017)。學(xué)習(xí)進(jìn)階的研究及應(yīng)用受到了不少學(xué)者的青睞。有研究(Kane & Bejar,2014)認(rèn)為,學(xué)習(xí)進(jìn)階是一種使測(cè)評(píng)結(jié)果更有意義、對(duì)教師更有幫助的方式,可以將學(xué)生掌握某一領(lǐng)域或?qū)W科復(fù)雜水平的學(xué)習(xí)過程模型化,反應(yīng)學(xué)生理解某一知識(shí)、概念所經(jīng)歷的多個(gè)中間水平以及學(xué)生在各水平上的學(xué)習(xí)表現(xiàn),體現(xiàn)學(xué)生對(duì)某一學(xué)科核心知識(shí)、技能逐步掌握的過程。學(xué)習(xí)進(jìn)階在實(shí)踐中顯示了價(jià)值,在核心概念進(jìn)階設(shè)計(jì)、課程標(biāo)準(zhǔn)研制與修訂、教育測(cè)量與評(píng)價(jià)、學(xué)校教學(xué)實(shí)踐等方面已嶄露頭角(韋斯林,賈遠(yuǎn)娥,2010)。

雖然國內(nèi)外學(xué)者從多方面開展了學(xué)習(xí)進(jìn)階的研究,但學(xué)習(xí)進(jìn)階測(cè)評(píng)工具的開發(fā)涉及到諸多環(huán)節(jié),特別是涉及到了較為復(fù)雜的心理測(cè)量學(xué)模型,國內(nèi)的相關(guān)研究顯得薄弱。然而測(cè)評(píng)工具研發(fā)是開展學(xué)習(xí)進(jìn)階理論和實(shí)踐研究的重要一環(huán),是驗(yàn)證學(xué)習(xí)進(jìn)階理論假設(shè)、獲得學(xué)生學(xué)習(xí)軌跡的一個(gè)關(guān)鍵步驟,如果學(xué)習(xí)進(jìn)階測(cè)評(píng)工具這一關(guān)鍵環(huán)節(jié)得不到很好的解決,那么學(xué)習(xí)進(jìn)階理論便不能在課標(biāo)校準(zhǔn)、教育評(píng)價(jià)、教學(xué)設(shè)計(jì)中真正發(fā)揮作用。

(二)統(tǒng)計(jì)思維是大數(shù)據(jù)時(shí)代公民的基本素養(yǎng)但研究不足

19世紀(jì)英國科幻作家威爾斯曾預(yù)言:“統(tǒng)計(jì)的思維方法,就像讀和寫的能力一樣,將成為效率公民必備的能力?!贝髷?shù)據(jù)時(shí)代,這種預(yù)言已成為現(xiàn)實(shí)。由于統(tǒng)計(jì)在社會(huì)經(jīng)濟(jì)發(fā)展及人們?nèi)粘I钪凶饔萌找骘@著,聯(lián)合國將2010年10月20日定為第一個(gè)世界統(tǒng)計(jì)日,以后每5年慶祝一次。20世紀(jì)80年代起,各國紛紛將統(tǒng)計(jì)與概率的內(nèi)容納入義務(wù)教育課程標(biāo)準(zhǔn)中,2001年我國也將其列入。然而由于統(tǒng)計(jì)與概率的內(nèi)容進(jìn)入義務(wù)教育課程的時(shí)間不長,其教育教學(xué)還處于摸索期,存在教師教學(xué)經(jīng)驗(yàn)不足、學(xué)生學(xué)習(xí)疑惑不解、課程標(biāo)準(zhǔn)有待完善等問題。

(三)研究目的

小學(xué)是當(dāng)前我國義務(wù)教育的起點(diǎn),在大數(shù)據(jù)時(shí)代探討小學(xué)生的統(tǒng)計(jì)學(xué)習(xí)狀況和思維發(fā)展規(guī)律,對(duì)進(jìn)一步完善義務(wù)教育“統(tǒng)計(jì)與概率”部分的課程標(biāo)準(zhǔn)、教材內(nèi)容安排、課程活動(dòng)設(shè)計(jì)具有重要意義。學(xué)習(xí)進(jìn)階是理論研究者、考試命題者、課程編制者、教育決策者對(duì)話的重要渠道,是溝通學(xué)習(xí)研究和學(xué)校課堂實(shí)踐的橋梁,是聯(lián)結(jié)課程標(biāo)準(zhǔn)、教學(xué)與評(píng)價(jià),促進(jìn)一致性的最具潛力的工具(Duncan & Hmelo-Silver,2009)。鑒于學(xué)習(xí)進(jìn)階的優(yōu)良性能和大數(shù)據(jù)時(shí)代小學(xué)生統(tǒng)計(jì)思維價(jià)值顯著但研究不足的狀況,本研究嘗試使用學(xué)習(xí)進(jìn)階的方法開發(fā)小學(xué)生統(tǒng)計(jì)思維的學(xué)習(xí)進(jìn)階測(cè)評(píng)工具,并側(cè)重呈現(xiàn)測(cè)評(píng)工具開發(fā)的步驟、方法,以期為我國學(xué)習(xí)進(jìn)階實(shí)證研究提供方法參考和工具支撐。

二、學(xué)習(xí)進(jìn)階構(gòu)建測(cè)評(píng)工具文獻(xiàn)綜述

因?qū)W習(xí)進(jìn)階可以有效地改進(jìn)課程標(biāo)準(zhǔn)、課堂教學(xué)、教學(xué)評(píng)價(jià),促進(jìn)三者相互聯(lián)結(jié)(韋斯林,賈遠(yuǎn)娥,2010),學(xué)習(xí)進(jìn)階的測(cè)量一直是學(xué)習(xí)進(jìn)階研究的重要內(nèi)容,國內(nèi)外研究者對(duì)學(xué)習(xí)進(jìn)階測(cè)評(píng)工具開發(fā)的原理、步驟、方法、流程、試題形式、測(cè)量模型方面開展了一些研究。

(一)學(xué)習(xí)進(jìn)階的要素及建立過程

Corcoran et al.(2009)提出,一個(gè)完整的學(xué)習(xí)進(jìn)階包括五個(gè)組成要素。第一個(gè)要素是學(xué)習(xí)目標(biāo)(learning goals),即學(xué)生達(dá)到一個(gè)階段進(jìn)階終點(diǎn)時(shí)的表現(xiàn)。學(xué)習(xí)目標(biāo)的確定往往需要綜合考慮社會(huì)對(duì)未來公民的期望以及學(xué)生接受下一階段教育的起始要求。第二個(gè)核心要素是進(jìn)階變量(progress variable),它可以是學(xué)生對(duì)核心概念的理解、應(yīng)用和練習(xí)。研究者可以通過追蹤一個(gè)或多個(gè)發(fā)展變量來測(cè)量學(xué)習(xí)進(jìn)階。第三個(gè)要素是成就水平(levels of achievements),指學(xué)習(xí)進(jìn)階發(fā)展路徑中的多個(gè)中間層級(jí),這些層級(jí)可以反映學(xué)生不同階段的能力發(fā)展過程,是實(shí)現(xiàn)終極目標(biāo)的跳板。第四個(gè)要素是學(xué)習(xí)表現(xiàn)(learning performance),指處于不同發(fā)展層級(jí)的學(xué)生完成相應(yīng)任務(wù)時(shí)的表現(xiàn)。第五個(gè)要素是測(cè)量工具(assessment),指一套基于假設(shè)模型的測(cè)量學(xué)生發(fā)展的工具。

學(xué)習(xí)進(jìn)階的建立一般包括三個(gè)步驟:首先,建立假設(shè)性學(xué)習(xí)進(jìn)階,包括驗(yàn)證性和演進(jìn)性兩種方法,驗(yàn)證性方法是從課程或考試標(biāo)準(zhǔn)出發(fā),自上而下地基于學(xué)科專家所預(yù)期的學(xué)生概念發(fā)展情況來制定學(xué)習(xí)進(jìn)階的具體內(nèi)容;演進(jìn)性方法是從學(xué)生對(duì)概念的理解出發(fā),自下而上地基于學(xué)生對(duì)概念的理解來制定學(xué)習(xí)進(jìn)階(Duschl,Maeng,& Sezen,2011)。其次,根據(jù)建立的假設(shè)性學(xué)習(xí)進(jìn)階編制試題,組成信效度良好的測(cè)驗(yàn)。最后,采用所編制的測(cè)驗(yàn)施測(cè)于目標(biāo)樣本,用心理測(cè)量學(xué)模型分析數(shù)據(jù),一方面對(duì)學(xué)生的概念掌握情況進(jìn)行診斷,另一方面對(duì)建立的學(xué)習(xí)進(jìn)階進(jìn)行驗(yàn)證或修正(Plummer,2012)。

(二)適用于學(xué)習(xí)進(jìn)階的試題形式

學(xué)習(xí)進(jìn)階測(cè)評(píng)工具的試題形式廣泛,一般而言,能夠適用于項(xiàng)目反應(yīng)理論的試題形式都可以應(yīng)用于學(xué)習(xí)進(jìn)階測(cè)評(píng)工具開發(fā),建構(gòu)反應(yīng)題(constructed response,CR)、順序多項(xiàng)選擇題(ordered multiplechoice,OMC)、填空題(a short answer)、多項(xiàng)選擇題(multiple choice,MC)、判斷對(duì)錯(cuò)題(multiple true or false,MIF)均可應(yīng)用于學(xué)習(xí)進(jìn)階的測(cè)量(Chen,2012;Javid,2014)。這些類型的試題各有特點(diǎn),如多選項(xiàng)選擇題使用方便,但存在猜測(cè)效應(yīng),不能呈現(xiàn)學(xué)生本來的想法,可能不能用來測(cè)量高級(jí)思維,且在低能力段上測(cè)驗(yàn)信度不高;主觀建構(gòu)題更適合于測(cè)量學(xué)生組織、整合、綜合知識(shí)的能力和解決新問題的能力,可以呈現(xiàn)學(xué)生初始的想法和推理的過程,缺點(diǎn)是難于管理、賦分,評(píng)分者之間易出現(xiàn)不一致性,也不能總是很好地呈現(xiàn)學(xué)生思考的過程(Lane,2010)。綜合兩類題目的特點(diǎn),Briggs et al.(2006)等人開發(fā)了順序多項(xiàng)選擇題,這類題型比傳統(tǒng)的建構(gòu)反應(yīng)題和多項(xiàng)選擇題能更有效、更精細(xì)地診斷學(xué)生的學(xué)習(xí)進(jìn)階水平。

(三)適用于學(xué)習(xí)進(jìn)階的測(cè)量模型

有研究者較為系統(tǒng)地闡述了學(xué)習(xí)進(jìn)階的心理測(cè)量學(xué)模型,歸納了學(xué)習(xí)進(jìn)階的多個(gè)單維和多維測(cè)量模型(高一珠,陳孚,辛濤 等,2017)。但在實(shí)際應(yīng)用中,眾多研究者都選用了Rasch模型(李亞,2016;王祖浩 ,楊玉琴,2012;張燕華, 鄭國民, 關(guān)惠文,2014)。研究者認(rèn)為,Rasch模型是一種理論導(dǎo)向的測(cè)量模式,當(dāng)測(cè)量數(shù)據(jù)與Rasch 模型擬合時(shí),該測(cè)量會(huì)具備獨(dú)特的優(yōu)良性質(zhì),建立被試和題目的懷特圖,解釋被試和題目之間、不同題目、不同被試之間的差距(Wilson,2004)。

(四)使用學(xué)習(xí)進(jìn)階開發(fā)測(cè)評(píng)工具的流程

Wei,Liu,& Jia(2014)以Rasch模型為基礎(chǔ)討論過學(xué)習(xí)進(jìn)階測(cè)量工具設(shè)計(jì)的一般方法,其步驟包括:①明確測(cè)量的目的,即分?jǐn)?shù)的用途;②界定所要測(cè)量的結(jié)構(gòu)變量、心理特質(zhì);③鑒別體現(xiàn)結(jié)構(gòu)的行為表現(xiàn);④建立測(cè)試細(xì)目表;⑤設(shè)計(jì)系列測(cè)試題;⑥評(píng)審測(cè)試題;⑦試測(cè),實(shí)地測(cè)試;⑧進(jìn)行建模;⑨信度、效度研究;⑩設(shè)計(jì)測(cè)試實(shí)施、評(píng)分、分?jǐn)?shù)解釋指南。Alonzo(2009)等人將使用Rasch模型開發(fā)測(cè)評(píng)工具的步驟描述為:①基于某學(xué)科領(lǐng)域?qū)<覍?duì)學(xué)生學(xué)習(xí)的認(rèn)識(shí)或已有的關(guān)于學(xué)生迷思、概念掌握的文獻(xiàn),建立該學(xué)科重要概念的學(xué)習(xí)進(jìn)階;②根據(jù)最初建立的學(xué)習(xí)進(jìn)階編制題目,組成測(cè)驗(yàn);③在代表性樣本中試測(cè),為測(cè)驗(yàn)、題目、選項(xiàng)提供信、效度證據(jù);④將測(cè)驗(yàn)施測(cè)于目標(biāo)樣本,根據(jù)題目類型選擇合適的測(cè)量學(xué)模型進(jìn)行數(shù)據(jù)分析,獲得測(cè)驗(yàn)的心理測(cè)量學(xué)性能,并驗(yàn)證學(xué)習(xí)進(jìn)階的理論假設(shè)。

綜上,研究者在學(xué)習(xí)進(jìn)階測(cè)評(píng)工具的開發(fā)上已有了一些研究,本研究主要借鑒他們的研究成果,開發(fā)小學(xué)生統(tǒng)計(jì)思維的學(xué)習(xí)進(jìn)階測(cè)評(píng)工具。

三、基于學(xué)習(xí)進(jìn)階的小學(xué)生統(tǒng)計(jì)思維測(cè)評(píng)工具研發(fā)

(一)小學(xué)生統(tǒng)計(jì)思維學(xué)習(xí)進(jìn)階的理論假設(shè)

小學(xué)生統(tǒng)計(jì)思維學(xué)習(xí)目標(biāo)和學(xué)習(xí)起點(diǎn)參考了《義務(wù)教育數(shù)學(xué)課程標(biāo)準(zhǔn)(2011年版)》及其解讀?!读x務(wù)教育數(shù)學(xué)課程標(biāo)準(zhǔn)(2011年版)》提出,統(tǒng)計(jì)與概率的學(xué)習(xí)目標(biāo)是培養(yǎng)學(xué)生的“數(shù)據(jù)分析觀念”。在整理、描述和分析數(shù)據(jù)的過程中,首先要對(duì)數(shù)據(jù)進(jìn)行分類,分類是描述和整理數(shù)據(jù)的開始,接著是排序,進(jìn)行必要的歸納和整理,最后把整理的數(shù)據(jù)運(yùn)用統(tǒng)計(jì)圖表直觀地表示出來,并進(jìn)行適當(dāng)?shù)姆治?,為人們作出決策和推斷提供依據(jù)(史寧中,張丹,趙迪,2008)。根據(jù)這些論述,我們把“數(shù)、數(shù)量、基本運(yùn)算、分類、比較”界定為小學(xué)生統(tǒng)計(jì)思維的學(xué)習(xí)起點(diǎn)。

小學(xué)生統(tǒng)計(jì)思維的進(jìn)階變量是通過專家訪談與問卷調(diào)查確立的。具體而言,訪談了第二屆華人數(shù)學(xué)家代表大會(huì)的6名主席團(tuán)成員,調(diào)查了與會(huì)的55名代表,進(jìn)而初步確定出進(jìn)階變量,又通過246名小學(xué)數(shù)學(xué)教師、小學(xué)數(shù)學(xué)教研員調(diào)查的驗(yàn)證而確立。調(diào)查問卷的克隆巴赫α系數(shù)為0.908。

小學(xué)生統(tǒng)計(jì)思維發(fā)展水平的理論假設(shè)是參照他人的研究成果確立的。具體而言,依照了SOLO分類體系的前結(jié)構(gòu)、單點(diǎn)結(jié)構(gòu)、多點(diǎn)結(jié)構(gòu)、關(guān)聯(lián)結(jié)構(gòu)、抽象擴(kuò)展結(jié)構(gòu)水平劃分模式(彼格斯, 科利斯, 等,2010),參考了小學(xué)生統(tǒng)計(jì)思維的研究結(jié)果(Jones,Thornton,Mooney,Perry,& Putt,2000),并結(jié)合小學(xué)生所處的年齡階段,把小學(xué)生統(tǒng)計(jì)思維的進(jìn)階水平劃分為特征、過渡、數(shù)量化、分析四個(gè)水平。小學(xué)生統(tǒng)計(jì)思維的進(jìn)階變量及假定的進(jìn)階水平可見表1。

(二)小學(xué)生統(tǒng)計(jì)思維測(cè)評(píng)題目

小學(xué)生統(tǒng)計(jì)思維測(cè)評(píng)工具的開發(fā)目的是了解和診斷學(xué)生統(tǒng)計(jì)思維的發(fā)展規(guī)律和發(fā)展水平,測(cè)驗(yàn)?zāi)康亩ㄎ挥谛纬尚栽u(píng)價(jià),而非高利害的總結(jié)性評(píng)價(jià)。因此,測(cè)評(píng)工具組建主要是圍繞小學(xué)生統(tǒng)計(jì)思維的學(xué)習(xí)進(jìn)階,測(cè)量小學(xué)生在各個(gè)方面的發(fā)展情況。測(cè)評(píng)工具組建時(shí)主要考慮了試題形式、測(cè)驗(yàn)題目、評(píng)分標(biāo)準(zhǔn)三個(gè)方面。

表1 小學(xué)生統(tǒng)計(jì)思維的學(xué)習(xí)進(jìn)階理論假設(shè)

1. 測(cè)試題目的來源與類型

測(cè)試題目主要來源于兩個(gè)方面:一是與小學(xué)生統(tǒng)計(jì)思維測(cè)評(píng)有關(guān)的測(cè)評(píng)工具,二是小學(xué)數(shù)學(xué)教材的課后練習(xí)題。具體來說,從TIMSS、PISA、統(tǒng)計(jì)推理測(cè)驗(yàn)(Statistical Reasoning Assessment,SRA)、統(tǒng)計(jì)素養(yǎng)測(cè)試(Watson & Callingham,2003)題目中篩選合適的題目翻譯、改編,使之符合中國小學(xué)生實(shí)際狀況;從國內(nèi)某些版本的小學(xué)數(shù)學(xué)教材課后練習(xí)題中篩選部分題目進(jìn)行改造。聘請(qǐng)了1位數(shù)學(xué)教育、2名心理與教育測(cè)量學(xué)研究生,使用李克特5點(diǎn)量表評(píng)估試題與測(cè)評(píng)指標(biāo)的對(duì)應(yīng)程度,刪除了平均等級(jí)小于3.5的題目,以保證題目的內(nèi)容效度。聘請(qǐng)9名有經(jīng)驗(yàn)的小學(xué)數(shù)學(xué)教師對(duì)試題難度進(jìn)行評(píng)定和預(yù)估,難度預(yù)估采用1—10的計(jì)分方式,刪除平均得分小于2(過于容易)和大于9(過于困難)的題目。考慮到學(xué)生的作答時(shí)間,測(cè)驗(yàn)預(yù)設(shè)了35道題,題目類型包括順序多項(xiàng)選擇題、主觀建構(gòu)題、多項(xiàng)選擇題、填空題、對(duì)錯(cuò)題。

2. 測(cè)試題目與進(jìn)階變量、進(jìn)階水平的對(duì)應(yīng)

依據(jù)學(xué)習(xí)進(jìn)階理論開發(fā)測(cè)評(píng)工具也需要制定雙向細(xì)目表,考慮各內(nèi)容的考察水平、所占比重。更重要的是,使用學(xué)習(xí)進(jìn)階開發(fā)測(cè)評(píng)工具時(shí),學(xué)生的每一種作答反應(yīng)模式都可以劃到題目對(duì)應(yīng)的進(jìn)階水平上,每一種作答反應(yīng)均有測(cè)評(píng)意義。因此,依據(jù)學(xué)習(xí)進(jìn)階開發(fā)測(cè)評(píng)工具時(shí),提供題目作答模式所對(duì)應(yīng)的進(jìn)階水平顯得十分重要。為了標(biāo)定小學(xué)生統(tǒng)計(jì)思維測(cè)試題目所測(cè)查的進(jìn)階水平,本研究借鑒了Tatsuoka et al.(2004)使用TIMSS測(cè)驗(yàn)進(jìn)行認(rèn)知診斷研究時(shí)題目翻新的方式,邀請(qǐng)了小學(xué)數(shù)學(xué)教材編寫專家、具有教學(xué)實(shí)踐經(jīng)驗(yàn)的小學(xué)數(shù)學(xué)教師、數(shù)學(xué)教研員、統(tǒng)計(jì)學(xué)及教育測(cè)量學(xué)博士生5人組成測(cè)試題目水平標(biāo)定小組,根據(jù)水平描述的內(nèi)容標(biāo)定題目的測(cè)量水平。對(duì)標(biāo)定不一致的題目開展討論,3人及以上統(tǒng)一了標(biāo)定的水平后可結(jié)束該題目的討論。表2呈現(xiàn)了小學(xué)生統(tǒng)計(jì)思維學(xué)習(xí)進(jìn)階測(cè)評(píng)工具雙向細(xì)目表。

表2 小學(xué)生統(tǒng)計(jì)思維測(cè)試題目維度、測(cè)試水平雙向細(xì)目表

3. 測(cè)試題目的賦分標(biāo)準(zhǔn)

基于學(xué)習(xí)進(jìn)階的測(cè)驗(yàn)賦分標(biāo)準(zhǔn),取決于題目的形式。填空題和傳統(tǒng)的多項(xiàng)選擇題,使用0、1計(jì)分,順序多項(xiàng)選擇題依據(jù)相關(guān)文獻(xiàn),采用多步計(jì)分,計(jì)為0、1、2、3,分別代表學(xué)習(xí)進(jìn)階的四個(gè)水平;主觀建構(gòu)題采用分步計(jì)分,首先對(duì)學(xué)生作答反應(yīng)進(jìn)行編碼,依據(jù)編碼進(jìn)行賦分。主觀題編碼規(guī)則及賦分標(biāo)準(zhǔn)主要是依據(jù)制定的小學(xué)生統(tǒng)計(jì)思維的學(xué)習(xí)進(jìn)階理論假設(shè),將學(xué)生的作答反應(yīng)劃分到對(duì)應(yīng)的四個(gè)進(jìn)階水平上,從低到高依次計(jì)為 0、1、2、3。如其中有一道主觀題題目為:有個(gè)新生坐私家車來上學(xué),Ta是男生還是女生?你怎么知道?對(duì)該題目的編碼方式為3、2、1、0、9,其中9代表空白,其他編碼的含義及部分樣例如下:

Code 3 有“可能”“概率”等表述方式,并用數(shù)字呈現(xiàn)。如:

Ta是女生,因?yàn)槌俗郊臆嚨挠形迦?,其中女生是男生的四倍,所以我覺的Ta可能是女生。

Code 2 采用局部比較、多數(shù)的答題樣例,考慮到私家車一行的大多數(shù)情況,或考慮到了組間的男女平衡,但缺少“可能性”的表達(dá)。如:

答:Ta是女生。因?yàn)榇蟛糠值呐甲郊臆嚒?/p>

答:Ta是女生。因?yàn)樽郊臆嚨拇蠖鄶?shù)是女生。

答:我認(rèn)為是男生。因?yàn)槟猩?3個(gè),女生有14個(gè),為了人數(shù)相等,所以是男生。

Code1 采用圖形的順序或規(guī)律進(jìn)行判斷。如:

答:Ta是男孩,因?yàn)樽嚨囊?guī)律是:女、男、女、女,正好空出一個(gè)男孩,然后接著循環(huán)。

Code 0與題目信息無關(guān),如分析了學(xué)生的性別特點(diǎn),理解題目錯(cuò)誤等。如:

答:Ta是女生,因?yàn)榕⒆颖容^安靜,不喜歡騎車,喜歡坐車,所以,我推測(cè),Ta是女生。

答:Ta是男生,因?yàn)槟猩懘?,如果不是因?yàn)椴皇煜ぢ?,他是不?huì)坐私家車的,也正是因?yàn)樗切律郧笆瞧渌麑W(xué)校的,他才會(huì)不熟悉路,如果他不是新生,一條走了五年的路,他不會(huì)坐車。

(三)學(xué)習(xí)進(jìn)階的理論假設(shè)與測(cè)試題目的交疊驗(yàn)證

基于學(xué)習(xí)進(jìn)階的小學(xué)生統(tǒng)計(jì)思維測(cè)評(píng)工具的開發(fā),與普通的測(cè)驗(yàn)工具開發(fā)流程基本類似,需要通過預(yù)測(cè)完善題目及測(cè)驗(yàn)質(zhì)量。本研究開展了兩輪預(yù)測(cè)。第一輪預(yù)測(cè)的主要目的是進(jìn)一步完善試題。第二輪預(yù)測(cè)的主要目的是進(jìn)一步驗(yàn)證修改后的試題,驗(yàn)證學(xué)習(xí)進(jìn)階的理論假設(shè)與學(xué)生實(shí)際發(fā)展?fàn)顩r的相符程度。

第一次預(yù)測(cè)選擇了4—6年級(jí)536名學(xué)生進(jìn)行預(yù)測(cè)。這種取樣方式主要考慮到1—3年級(jí)的學(xué)生接觸到的統(tǒng)計(jì)內(nèi)容較少,4—6年級(jí)作為一個(gè)獨(dú)立的學(xué)段,接觸到的統(tǒng)計(jì)知識(shí)相對(duì)較多,又是初中、高中統(tǒng)計(jì)學(xué)習(xí)不可跨越的階段。使用ConQuest(Wu,Admas &Wilson,1998)軟件,采用Rasch模型的item+item*step的計(jì)算方法,進(jìn)行題目難度估計(jì)及擬合指標(biāo)檢驗(yàn),采用國際上常用的懷特圖、加權(quán)的MNSQ(大于1.3)、未加權(quán)的MNSQ(T值大于2)、加權(quán)的MNSQ(T值大于2)等信息,刪減和修改題目(Keeves & Alagumalai,1999;Wu,Admas &Wilson,1998)。

通過分析發(fā)現(xiàn),有些題目的分步計(jì)分的難度閾限值并未呈現(xiàn)出增高趨勢(shì),需要完善評(píng)分標(biāo)準(zhǔn)。如旅游決策的題目,很少有學(xué)生能夠結(jié)合兩條線索并結(jié)合現(xiàn)實(shí)背景進(jìn)行信息解釋,而且能得3分的學(xué)生與整個(gè)測(cè)驗(yàn)的能力值相關(guān)度不高。將賦分標(biāo)準(zhǔn)從0、1、2、3調(diào)整為0、1、2,0表示不得分,1表示根據(jù)1條線索解釋,2表示根據(jù)2條線索解釋。

另外,圖形閱讀題難度較小,使得懷特圖上學(xué)生的能力值偏高,測(cè)驗(yàn)的難度需要微調(diào)。具體方法是減少了條形統(tǒng)計(jì)圖、折線統(tǒng)計(jì)圖相關(guān)題目,增加了一道餅形圖閱讀及解釋題,設(shè)置了一道能考察學(xué)生統(tǒng)計(jì)批判性思維的題目。調(diào)整后,題目包含28道題目,50個(gè)分步。

第二輪預(yù)測(cè)依然選擇4—6年級(jí)學(xué)生,樣本容量為846,主要目的是驗(yàn)證修改后的試題及整個(gè)測(cè)驗(yàn)與小學(xué)生統(tǒng)計(jì)思維學(xué)習(xí)進(jìn)階的匹配性。數(shù)據(jù)處理方法與第一輪預(yù)試后相同。題目的難度、估計(jì)誤差,未加權(quán)的擬合指標(biāo)、加權(quán)的擬合指標(biāo)如表3所示。

28道題目的加權(quán)的MNSQ、未加權(quán)的MNSQ取值均在0.7—1.3之間,但部分題目|T|大于2,對(duì)學(xué)生的能力估計(jì)不夠穩(wěn)定。盡管如此,這些題目多數(shù)都是小學(xué)生統(tǒng)計(jì)思維需測(cè)查的必要內(nèi)容,結(jié)合本測(cè)驗(yàn)的診斷性目的,保留了這幾道試題。進(jìn)一步檢驗(yàn)題目的項(xiàng)目功能差異(different item function,DIF),不存在性別、城鄉(xiāng)差異。

測(cè)試題目的難度與學(xué)生的能力分布基本呈現(xiàn)正態(tài)分布。從28道題單維(圖1a)、50個(gè)分步單維(圖1b)的懷特圖可以看到,調(diào)整后的正式測(cè)評(píng)試卷試題難度分布較為合理,對(duì)4—6年級(jí)學(xué)生的統(tǒng)計(jì)思維能力具有一定的測(cè)評(píng)廣度,且接近正態(tài)分布。水平1、水平2、水平3、水平4題目的難度均值依次為-1.26、0.23、0.5、1.35,四個(gè)難度水平逐漸上升,與學(xué)習(xí)進(jìn)階的理論假設(shè)一致。

(四)基于學(xué)習(xí)進(jìn)階的小學(xué)生統(tǒng)計(jì)思維測(cè)評(píng)工具的質(zhì)量分析

小學(xué)生統(tǒng)計(jì)思維的測(cè)評(píng)工具具有較好的內(nèi)容效度。科學(xué)地劃分測(cè)評(píng)的維度和指標(biāo)、組卷前測(cè)試題目與測(cè)評(píng)指標(biāo)的對(duì)應(yīng)性評(píng)估,一定程度上保證了測(cè)評(píng)工具的內(nèi)容效度。測(cè)試過程中,與小學(xué)數(shù)學(xué)教師的深入訪談也表明了該測(cè)試工具具有較好的內(nèi)容效度。有教師提到“問卷涉及了讀圖、作圖、計(jì)算平均數(shù)等教學(xué)中常見的統(tǒng)計(jì)與概率的題目類型,也結(jié)合具體情境給出了適合學(xué)生高級(jí)統(tǒng)計(jì)思維過程的題目”,“試卷有讀數(shù)據(jù),描述數(shù)據(jù),解釋數(shù)據(jù)含義,通過數(shù)據(jù)進(jìn)行預(yù)測(cè)和判斷,還體現(xiàn)了統(tǒng)計(jì)不確定性的特點(diǎn)”,“有些題目學(xué)生看上去是沒有學(xué)習(xí)訓(xùn)練過,但學(xué)生結(jié)合學(xué)過的知識(shí),仔細(xì)觀察、認(rèn)真思考后能夠作答,能更深刻地反應(yīng)學(xué)生的統(tǒng)計(jì)思維發(fā)展水平”。

表3 小學(xué)生統(tǒng)計(jì)思維測(cè)試題目難度及擬合指標(biāo)

數(shù)據(jù)分析發(fā)現(xiàn),小學(xué)生統(tǒng)計(jì)思維測(cè)評(píng)工具具有較好的結(jié)構(gòu)效度(李化俠,辛濤,宋乃慶,楊濤,2018)。探索驗(yàn)證性因素分析發(fā)現(xiàn),當(dāng)使用三因素模型時(shí),數(shù)據(jù)擬合狀況良好,RMSEA<0.08、SRMR<0.05、CFI>0.90、TLI>0.90。

小學(xué)生統(tǒng)計(jì)思維的測(cè)試題目具有一定的實(shí)證效度。訪談中教師提到學(xué)生閱讀統(tǒng)計(jì)圖比較容易,解釋統(tǒng)計(jì)圖困難,能夠計(jì)算平均數(shù),但理解平均數(shù)困難。與此同時(shí),測(cè)試題分析結(jié)果表明:小學(xué)四年級(jí)以上學(xué)生基本能夠較好讀取直觀的統(tǒng)計(jì)圖表,圖表的最大值、最小值不論是以條形圖、折線圖還是餅形圖形式出現(xiàn),學(xué)生均可正確讀取。但是,學(xué)生理解統(tǒng)計(jì)圖存在一定困難,比如條形圖內(nèi)部不使用純色填充而使用豎條圖紋填充時(shí),4、5年級(jí)的部分學(xué)生會(huì)忽略坐標(biāo)軸的標(biāo)度而對(duì)填充圖中豎條的數(shù)量進(jìn)行計(jì)數(shù),做出錯(cuò)誤判斷;測(cè)試題中與平均數(shù)有關(guān)的內(nèi)容,學(xué)生的作答反應(yīng)較為分散,選擇題也存在較多猜測(cè)成分。教師訪談結(jié)果與實(shí)際測(cè)試題目難度的一致性,說明小學(xué)生統(tǒng)計(jì)思維測(cè)試題目在內(nèi)容設(shè)置、內(nèi)容水平上具有一定的效標(biāo)關(guān)聯(lián)效度。

圖1 a.28道題懷特圖 b.50個(gè)分步懷特圖

小學(xué)生統(tǒng)計(jì)思維的信度及穩(wěn)定性良好。Rasch模型分析顯示測(cè)驗(yàn)的內(nèi)部一致性信度為0.82,測(cè)試卷的總體EAP/PV 信度為0.92,數(shù)據(jù)的基本認(rèn)識(shí)、數(shù)據(jù)描述與表征、數(shù)據(jù)分析三個(gè)維度的EAP信度分別是0.809、0.834、0.808。同時(shí),本研究使用密歇根州立大學(xué)Frank(2000)開發(fā)的程序KonFound-it!?,將統(tǒng)計(jì)分析得到的回歸系數(shù)、標(biāo)準(zhǔn)誤差、樣本容量輸入程序,結(jié)果顯示需要更換掉91%以上的調(diào)查對(duì)象才能推翻本研究的結(jié)論,進(jìn)一步表明了小學(xué)生統(tǒng)計(jì)思維測(cè)評(píng)工具的穩(wěn)定性。

四、討論與結(jié)論

(一)小學(xué)生統(tǒng)計(jì)思維學(xué)習(xí)進(jìn)階理論與學(xué)生發(fā)展實(shí)際基本一致

通過試題分析,可見小學(xué)生統(tǒng)計(jì)思維的學(xué)習(xí)進(jìn)階理論與學(xué)生的實(shí)際發(fā)展?fàn)顩r基本相符。學(xué)生統(tǒng)計(jì)思維的發(fā)展規(guī)律從自身的個(gè)性化特征向生活經(jīng)驗(yàn),再向數(shù)量化、分析化水平發(fā)展,關(guān)注的要素從單線索到多線索、多結(jié)構(gòu)發(fā)展。這種發(fā)展規(guī)律與SOLO分類體系、Jones等人(2000)發(fā)現(xiàn)的小學(xué)生統(tǒng)計(jì)思維的發(fā)展規(guī)律基本一致。在個(gè)性化水平階段,小學(xué)生傾向拋開給定的數(shù)據(jù)、基于自身的經(jīng)驗(yàn)開展思維,如“女孩子比較安靜,不喜歡騎車”“我又不是小明,我怎么知道”這類作答反應(yīng),與題目給定的數(shù)據(jù)基本無關(guān)。在過渡水平階段,小學(xué)生已能關(guān)注到數(shù)據(jù)的某個(gè)方面,能根據(jù)基本的標(biāo)準(zhǔn)對(duì)數(shù)據(jù)分組、排序,認(rèn)識(shí)到數(shù)據(jù)之間存在差異,但這一水平的學(xué)生往往只能關(guān)注到單一線索,如“圖形排列有順序”“男女生坐車的數(shù)據(jù)存在規(guī)律”這類作答反應(yīng),學(xué)生使用了不同的符號(hào)將男女生分組、排序,但僅憑圖形排列規(guī)律、忽略了人數(shù)的線索做出的判斷是不夠準(zhǔn)確的。在數(shù)量化水平上,小學(xué)生能注意到多條線索,或能對(duì)數(shù)據(jù)說明的問題做出多種反應(yīng),但存在反應(yīng)不準(zhǔn)確、與問題背景關(guān)聯(lián)不緊密等問題,如“大部分的女生都坐私家車”這類作答反應(yīng),注意到了私家車與性別的關(guān)系但計(jì)算過程錯(cuò)誤,再如“男生有13個(gè),女生有14個(gè),為了人數(shù)相等,所以是男生”這類作答反應(yīng),考慮到了班級(jí)學(xué)生的性別平衡但與具體問題的關(guān)聯(lián)度不高。在分析水平上,小學(xué)生能夠使用局部數(shù)據(jù)或整體數(shù)據(jù)進(jìn)行比較,并結(jié)合背景知識(shí)進(jìn)行有效推斷,表達(dá)統(tǒng)計(jì)“可能性”的特點(diǎn),如學(xué)生通過數(shù)據(jù)計(jì)算和比較,做出“女孩概率較高”這類作答反應(yīng),較好地體現(xiàn)了小學(xué)生統(tǒng)計(jì)思維的第四個(gè)進(jìn)階水平。

(二)理論與實(shí)踐的交叉驗(yàn)證為改進(jìn)教學(xué)提供了更多參考信息

雖然小學(xué)生統(tǒng)計(jì)思維的學(xué)習(xí)進(jìn)階理論假設(shè)與學(xué)生的發(fā)展?fàn)顩r基本一致,但是基于學(xué)習(xí)進(jìn)階的小學(xué)生統(tǒng)計(jì)思維測(cè)評(píng)工具的開發(fā)過程中也體現(xiàn)了部分學(xué)生統(tǒng)計(jì)思維的發(fā)展呈現(xiàn)出“全”或“無”的特點(diǎn),這與學(xué)習(xí)進(jìn)階的逐漸增長、循序漸進(jìn)的理論假設(shè)并不完全一致。如“這張統(tǒng)計(jì)圖是否每天都一樣?”這道題,學(xué)生的作答反應(yīng)基本都來自生活經(jīng)驗(yàn),他們的回答有“不一定,有可能誰的自行車壞了,就得選擇其他交通工具”、“爸媽不出差就不坐私家車”、“不會(huì),因?yàn)橛锌赡芄财囂珨D了,就有人步行走到學(xué)校,所以不一樣”、“不一樣,因?yàn)橹徊榱诵瞧谝坏?,以后說不定會(huì)有變化”等。旅游決策問題,許多學(xué)生并不知道需要依據(jù)圖表提供的信息進(jìn)行決策,而是基于“夏天吃雪糕”“秋天水果成熟”等與題目無關(guān)的信息作答。這說明小學(xué)階段學(xué)生對(duì)統(tǒng)計(jì)問題的回答,很多都依賴于自身的主觀經(jīng)驗(yàn),并不具備數(shù)據(jù)意識(shí),更不知道從數(shù)據(jù)中得到結(jié)論。學(xué)習(xí)進(jìn)階的理論所期望的較高水平的答案較少出現(xiàn)在學(xué)生的作答反應(yīng)中,說明學(xué)生的實(shí)際發(fā)展水平可能低于預(yù)期。這種狀況可能與教師教學(xué)有一定關(guān)系。已有研究(Watson & Kelly,2002)顯示,變異的內(nèi)容的掌握與學(xué)生的年齡并無直接關(guān)系,通過恰當(dāng)?shù)膬?nèi)容安排,小學(xué)三年級(jí)兒童可以較好地掌握變異,而沒有學(xué)習(xí)過變異知識(shí)的學(xué)生,九年級(jí)也不能很好地理解變異的知識(shí)(巴桑卓瑪,2006)?;谶@樣的證據(jù),如果認(rèn)為學(xué)生統(tǒng)計(jì)思維的學(xué)習(xí)進(jìn)階理論假設(shè)是成立的,那么對(duì)學(xué)生在制作統(tǒng)計(jì)圖、理解數(shù)據(jù)變化、基于數(shù)據(jù)做出決策等問題的影響因素上應(yīng)做更多反思,在教學(xué)中給學(xué)生提供更多的學(xué)習(xí)機(jī)會(huì)。

(三)學(xué)習(xí)進(jìn)階測(cè)試題目能更精細(xì)地反映出學(xué)生的水平

學(xué)習(xí)進(jìn)階的測(cè)試題目有多種形式可供靈活選擇,由于測(cè)試題目的每一種作答反應(yīng)都對(duì)應(yīng)著不同的進(jìn)階水平,因而使用學(xué)習(xí)進(jìn)階的題目可以了解到學(xué)生思維發(fā)展的更多信息。如對(duì)平均數(shù)理解的一道題:

科學(xué)課上,9個(gè)同學(xué)對(duì)同一物體分別測(cè)量重量(單位克),記錄如下:

6.2 6.0 6.0 15.3 6.1 6.3 6.2 6.15 6.2

為了盡可能準(zhǔn)確地估計(jì)這個(gè)物體的重量,你推薦使用哪個(gè)數(shù)值或方法?( )(單選)

A. 使用出現(xiàn)次數(shù)最多的數(shù),6.2

B. 用 6.15,它最精確

C. 把9個(gè)數(shù)加起來再除以9

D. 去掉15.3,把其他8個(gè)數(shù)加起來,再除以 8

選項(xiàng)A是眾數(shù),選項(xiàng)C是平均數(shù)的計(jì)算方式,選項(xiàng)D是對(duì)平均數(shù)更深層次的理解,排除掉極端值之后計(jì)算穩(wěn)定的平均數(shù)。依據(jù)這種分析,A、B選項(xiàng)計(jì)分為0,C選項(xiàng)計(jì)分為1,D選項(xiàng)計(jì)分為2。這種順序多項(xiàng)選擇題的每一個(gè)選項(xiàng)都可以了解學(xué)生對(duì)平均數(shù)的理解水平,進(jìn)而可以為診斷學(xué)生的學(xué)習(xí)狀況提供更多信息。

(四)學(xué)習(xí)進(jìn)階的測(cè)評(píng)結(jié)果能為發(fā)現(xiàn)學(xué)生學(xué)習(xí)規(guī)律提供新視角

基于學(xué)習(xí)進(jìn)階開發(fā)的測(cè)驗(yàn),除了具備正常測(cè)驗(yàn)具備的功能,如了解學(xué)生發(fā)展?fàn)顩r及水平,提供診斷信息之外,還能為發(fā)現(xiàn)學(xué)生學(xué)習(xí)中存在的問題提供新的視角。如文獻(xiàn)綜述所提到的,學(xué)習(xí)進(jìn)階能夠反應(yīng)學(xué)生思維發(fā)展的軌跡,學(xué)習(xí)進(jìn)階的測(cè)試工具基本上遵照學(xué)生思維發(fā)展的規(guī)律而設(shè),如果測(cè)評(píng)結(jié)果與理論假設(shè)一致,那么可以證實(shí)學(xué)生思維發(fā)展的規(guī)律;如果測(cè)評(píng)結(jié)果與理論假設(shè)不一致,學(xué)習(xí)進(jìn)階的測(cè)評(píng)結(jié)果則可能為發(fā)現(xiàn)新的狀況提供參考。比如,學(xué)生在作圖題上的反應(yīng),可能由于學(xué)生都接觸過了統(tǒng)計(jì)圖,極少有學(xué)生使用自創(chuàng)的、有個(gè)人特質(zhì)的圖形,這與假定的學(xué)習(xí)進(jìn)階并不完全一致。小學(xué)階段制作條形圖、折線圖時(shí),高水平的學(xué)生與低水平的學(xué)生在作圖題上的反應(yīng)不在于是否知道用圖形表示、用哪種圖形表示,而在于對(duì)數(shù)軸上數(shù)的把握是否準(zhǔn)確,得分較高的學(xué)生對(duì)數(shù)軸上的數(shù)量有著比較恰當(dāng)?shù)墓烙?jì)。這種不一致的情況,為我們了解學(xué)生統(tǒng)計(jì)圖制作提供了更精細(xì)的診斷。

五、小結(jié)

本研究基于學(xué)習(xí)進(jìn)階理論構(gòu)建了小學(xué)生統(tǒng)計(jì)思維的測(cè)試題目,描述了應(yīng)用學(xué)習(xí)進(jìn)階理論開發(fā)小學(xué)生統(tǒng)計(jì)思維測(cè)評(píng)工具的過程和方法,并開發(fā)出了具有較好信度、效度的小學(xué)生統(tǒng)計(jì)思維測(cè)評(píng)工具。這對(duì)于推廣學(xué)習(xí)進(jìn)階的實(shí)證研究、推動(dòng)學(xué)習(xí)進(jìn)階理論在教育中的應(yīng)用、提高教育的實(shí)證研究水平具有積極意義。

(辛濤為本文通訊作者,xintao@bnu.edu.cn)

猜你喜歡
進(jìn)階測(cè)驗(yàn)工具
波比的工具
波比的工具
傳祺GM6:家用MPV新進(jìn)階
汽車觀察(2019年2期)2019-03-15 06:01:02
領(lǐng)克進(jìn)階
汽車觀察(2018年12期)2018-12-26 01:05:32
2018車企進(jìn)階十字訣
汽車觀察(2018年12期)2018-12-26 01:05:24
進(jìn)階中的北汽新能源
能源(2018年8期)2018-09-21 07:57:30
《新年大測(cè)驗(yàn)》大揭榜
趣味(語文)(2018年7期)2018-06-26 08:13:48
“巧用”工具
讀者(2017年18期)2017-08-29 21:22:03
兩個(gè)處理t測(cè)驗(yàn)與F測(cè)驗(yàn)的數(shù)學(xué)關(guān)系
考試周刊(2016年88期)2016-11-24 13:30:50
你知道嗎?
密云县| 湖口县| 久治县| 临漳县| 满城县| 昭觉县| 云龙县| 庆云县| 石家庄市| 平塘县| 铁岭县| 红河县| 南投市| 历史| 盐城市| 德庆县| 伊宁县| 河北省| 新闻| 栾城县| 达日县| 班戈县| 广南县| 信阳市| 洛阳市| 邢台县| 邛崃市| 溧水县| 淮滨县| 运城市| 黄石市| 乌鲁木齐市| 木兰县| 乃东县| 吕梁市| 蕉岭县| 灵台县| 牙克石市| 阳东县| 丹棱县| 怀化市|