郭習佩 薛亮 古麗茹?吐爾遜馮玨
摘要: 運用Rasch模型對高中學生的化學推理能力水平進行研究,開發(fā)了測驗工具,同時進行了推理能力測驗、數(shù)據(jù)統(tǒng)計及數(shù)據(jù)分析。研究結(jié)果顯示,高二比高一學生進行化學推理時的思維復(fù)雜程度更高,即隨著年齡增長,學生的推理能力也提高。
關(guān)鍵詞: 化學推理; Rasch模型; 測驗編制; 能力分析
文章編號: 10056629(2019)4001807中圖分類號: G633.8文獻標識碼: B
目前世界各國在科學教育方面都在強調(diào)學生需要積極地投入到科學實踐中去,例如使用模型建立解釋和基于證據(jù)進行論證[1]?;瘜W學科核心素養(yǎng)共包括五個方面,其中一點就是模型認知與證據(jù)推理。推理指的是由一個或幾個已知判斷推出新判斷的思維形式[2]。推理能力是影響推理活動效果,在推理活動中形成、體現(xiàn)和發(fā)展,相對穩(wěn)定的個性心理特征的綜合[3]?;瘜W推理能力是學生在學習化學知識,解決化學問題時的一種高級思維形式。學生在進行復(fù)雜的化學推理時,需要運用物質(zhì)性質(zhì)、概念、原理等核心知識,經(jīng)過多角度分析、多步系統(tǒng)推理解決情境陌生、綜合度高的復(fù)雜問題,分析復(fù)雜的遠變式活動程序的合理性及其原理[4]。
為了解高中生化學推理能力的發(fā)展現(xiàn)狀,不同年級的高中學生在化學推理類型上的差異,本研究在Hannah Sevian對學生的化學推理模式的水平劃分的基礎(chǔ)上,對高一高二學生所能達到的推理能力的水平進行了研究。
1 Rasch模型簡介
根據(jù)Rasch模型原理,特定的個體對特定的題目做出特定反應(yīng)的概率可以用個體能力與該題目難度的一個簡單函數(shù)來表示。個體回答某一題目正確與否完全取決于個體能力和題目難度之間的比較。通過個體在題目上的表現(xiàn)(通常表示為原始分數(shù))來測量不可直接觀察的、潛在的變量[5]。根據(jù)測量的數(shù)據(jù)類型,可以把Rasch模型劃分為二分模型、部分給分模型和等級量表模型;根據(jù)維度的多少,可以劃分為單維模型和多維模型;根據(jù)參數(shù)估計數(shù)目不同,可以劃分為兩面模型和多面模型[6]。針對不同的測量量表和測量心理結(jié)構(gòu)需要選擇相對應(yīng)的測量模型。
根據(jù)Rasch模型的測量原理,Wilson(2008)提出了四個構(gòu)建模塊作為用于開發(fā)測量的工具。第一個模塊為結(jié)構(gòu)圖,結(jié)構(gòu)圖是從發(fā)展的視角來對要測量的心理結(jié)構(gòu)由低到高發(fā)展的一種描述。第二個模塊為項目設(shè)計,項目是學生心理結(jié)構(gòu)的外在表達,它指的是用系統(tǒng)的任務(wù)設(shè)計來引出一個或多個結(jié)構(gòu)圖所描述的學生的知識水平的特定類型的證據(jù)。第三個模塊為結(jié)果空間,學生對項目的反應(yīng)被映射到結(jié)果空間,通過對各項目反應(yīng)的結(jié)果進行評分分類使其與結(jié)構(gòu)圖中的各水平層次聯(lián)系起來。即在對個體反應(yīng)現(xiàn)象分析的基礎(chǔ)上,記錄和評判個體在各個項目上是如何反應(yīng)的。第四個模塊為結(jié)果空間,用以解釋和評估學生在測驗中獲得的分數(shù),從而將結(jié)果空間與心理結(jié)構(gòu)聯(lián)系起來[7]。
2 研究過程
2.1 學生“推理能力”的水平構(gòu)建
Hannah Sevian通過對8~16年級的學生進行研究,根據(jù)學生推理思維復(fù)雜性的不同,提出了一套全新的關(guān)于學生化學推理思維的學習進階模型。
2.2 “推理能力”測驗工具的開發(fā)
根據(jù)所建構(gòu)的“推理能力”的四個水平及具體的行為表現(xiàn),編制了“推理能力”試測工具。同時綜合考慮高一、高二學生不同的知識進程,編制了高一和高二兩套試題,通過“錨題”將兩套試題連接起來。對于初測試題,在試題編制完成之后請化學教育專家及高中一線化學教師對試題進行分析,提出建議,并依據(jù)建議對試題進行了調(diào)整和修改。初測試題調(diào)整完成之后,進行了初測,根據(jù)試測結(jié)果對試題進行了刪減和修改,之后進行了二次測試,確定了最終的測試量表,具體如表2所示。
2.3 研究對象
本次測驗共進行了三次測驗。第一次測試旨在測試量表的質(zhì)量,選取了高一、高二各52名學生,合計共104名,根據(jù)Rasch測量結(jié)果對量表進行修改和調(diào)整之后進行第二次試測,二測選取高一年級60名、高二年級55名學生,試測結(jié)果顯示調(diào)整之后的量表質(zhì)量較好。之后進行了第三次大樣本測試,在西安的兩個學校分別選取高一高二各50多位學生,組成了第三次大測試樣本。大樣本測試的樣本具體組成如表3所示。
3 研究結(jié)果
本研究運用Winsteps對測試結(jié)果進行數(shù)據(jù)統(tǒng)計分析及建模分析,檢驗測試結(jié)果的信度和效度。
3.1 總體統(tǒng)計
由總體統(tǒng)計結(jié)果可知,高一測試的項目難度估計誤差為0.27,被試的估計誤差為0.67,均在許可的誤差范圍內(nèi)。高二測試的項目難度估計誤差為0.24,被試的估計誤差為0.59,均在許可的誤差范圍內(nèi)。高一測試卷和高二測試卷的項目擬合指數(shù)MNSQ均在標準值1左右,ZSTD均在標準值0左右,說明了兩份試卷的測驗數(shù)據(jù)與理想模型的一致性良好。高一測試卷的被試分離度為1.36,項目的分離度較高,達到了6,被試的信度為0.65,項目的信度相對較高為0.97;高二測試卷的被試分離度為1.36,項目的分離度較高達到了3.85,被試的信度為0.65,項目的信度為0.94。這說明學生的能力選取還是相對集中,能力分布水平不夠廣,但從總體情況來看,測驗工具的性能還是相對較好的。
3.2 單維性
從圖1可以看出,對于高一測試卷而言,有三個項目的標準殘差系數(shù)超出了范圍,有一個項目在邊界處,表明這幾個項目可能受其他因素干擾還測有其他的結(jié)構(gòu)或能力,但大多數(shù)項目分布區(qū)間在-0.4~0.4之間,所以說明高一測試卷測量的主要是學生的推理能力,具有單維性。由圖2可以看出,對于高二測試卷而言,有三個項目超出了范圍,有兩個項目在邊界處,但大多數(shù)項目分布區(qū)間-0.4~0.4之間,故而可以說高二測試項目從總體來看是在測量學生的一種能力,具有單維性。
3.3 項目—被試對應(yīng)
Rasch分析用懷特圖將項目、被試按其難度、能力高低放置在同一Logit區(qū)間尺度上,以此來反映項目難度與個體能力之間的關(guān)系,檢測學生成績的有效性。高一懷特圖如圖3所示,從項目整體分布上來看,18個項目分布比較廣泛,覆蓋的范圍比較大,基本上涵蓋了學生的能力,且分散基本均勻。學生的分布情況也比較好,能力分布顯示出中間多兩邊少,大部分學生能力都集中在0左右,是較為理想的狀況,說明參加測試的高一學生代表性好,能力分布比較均勻。圖4為高二測試懷特圖,從總體來看,高二學生能力分布比較理想,中間部分人數(shù)居多,兩邊較少且具有一定的跨度,呈正態(tài),19個項目分布比較均勻。大部分考生水平在0以上,表明高二測試項目對于高二樣本來說比較簡單。對于高一和高二測試而言,都存在一些難度較小的項目幾乎沒有可以與之匹配對應(yīng)的學生能力。
3.4 項目擬合、誤差
通過對高一和高二年級測試各個項目的擬合情況及誤差進行統(tǒng)計分析,我們可以看出,對于高一測試項目而言,項目難度值在-3.54~3.17之間,除了項目1的項目難度估計的誤差相較其他項目偏大外,其他項目難度估計的誤差均較小,除了項目9、 14、 16的ZSTD稍微超出范圍之外,大部分項目擬合指數(shù)都在可允許范圍之內(nèi)。除項目1的點—測量相關(guān)較低之外,其余項目的點—測量相關(guān)都較高,表明項目具有較好的鑒別能力。對于高二測試項目而言,項目難度值在-2.56~1.75之間,項目難度估計的誤差均較小,除了項目7的擬合指數(shù)超出范圍之外,其余項目擬合指數(shù)都在可允許范圍之內(nèi)。項目的點—測量相關(guān)都較高,表明高二測試項目都具有較好的鑒別能力。
3.5 化學推理能力測評分析
3.5.1 總體分析
采取單因素方差分析對兩個年級學生的能力差異進行檢驗。結(jié)果顯示,方差檢驗F值為8.94, P值為0.003,小于顯著性水平0.005,故兩個年級學生的能力存在明顯差異。
3.5.2 在各級水平層次上的比較
由于高一高二測試題并不完全相同,且高一高二學生能力不同,故高一、高二年級的水平劃分并不是絕對相同的,而是存在一定的差異。高一年級的各級水平的難度平均值如表5所示。高一年級測試卷的水平1包含5個題目,難度范圍為-3.54~-1.36,難度平均值為-1.986;水平2包含5個題目,難度范圍為-0.97~-0.04,難度平均值為-0.564;水平3包含5個題目,難度范圍為0.56~1.4,難度平均值為0.928;水平4包含3個題目,難度范圍為2.02~3.17,難度平均值為2.7。即當學生的能力值低于-1.986時說明學生的推理能力沒有達到水平1;當學生的能力值在-1.986~-0.564之間時,表明學生的推理能力達到了水平1;當學生的能力值在-0.564~0.928之間時,表明學生的推理能力達到了水平2;當學生的能力值在0.928~2.7之間時,表明學生的推理能力達到了水平3;當學生的能力值高于2.8時,說明學生的推理能力達到了水平4。通過表4我們可以看到,高一年級學生的平均能力值為0.27,即高一學生的推理能力整體上處于水平2。
高二年級的各級水平的難度平均值如表6所示。高二年級測試卷的水平1包含五個題目,難度范圍為-2.56~-0.56,難度平均值為-1.268;水平2包含4個題目,難度范圍為-0.32~-0.02,難度平均值為-0.145;水平3包含7個題目,難度范圍為0.08~0.72,難度平均值為0.357;水平4包含3個題目,難度范圍為1.17~1.75,難度平均值為1.48。即當學生的能力值低于-1.268時,認為學生的推理能力未達到水平1;當學生的能力值在-1.268~-0.145之間時,認為學生的推理能力達到了水平1;當學生的能力值在-0.145~0.357之間時,認為學生的推理能力達到了水平2;當學生的能力值在0.357~1.48之間時,認為學生的推理能力達到了水平3;當學生的能力值大于1.48時,認為學生的推理能力達到了水平4。通過表4我們可以看到,高二年級學生的平均能力值為0.72,即高二學生的推理能力整體上處于水平3。
從以上分析可以知道,高一年級學生整體的推理能力達到了水平2,即大部分學生可以根據(jù)日常生活經(jīng)驗來推斷某物質(zhì)的物理性質(zhì)或化學性質(zhì),可以根據(jù)物質(zhì)體現(xiàn)出來的某個化學性質(zhì)或物理性質(zhì)來推斷物質(zhì)可能存在的某個結(jié)構(gòu),也可以依據(jù)已知物質(zhì)的性質(zhì)來對未知物質(zhì)的性質(zhì)做出自己的假設(shè)和判斷,他們可以通過簡單的線性分析來進行推理,但進行連續(xù)性的或綜合性的復(fù)雜分析對高一年級學生而言難度較高。這可能是由于高一年級學生學習的大部分內(nèi)容都是從宏觀層面來了解物質(zhì)的物理性質(zhì)和化學性質(zhì),雖然會有部分內(nèi)容涉及到物質(zhì)發(fā)生變化的微觀層面分析,但由于剛開始接觸物質(zhì)變化的微觀分析,所以學生對這一部分內(nèi)容了解得不夠透徹。包括必修2的很多內(nèi)容,例如化學反應(yīng)速率、化學能與電能、有機化合物等內(nèi)容,高一年級的學生都只是做一個初步了解,所以對高一學生而言一方面可能是知識儲備不夠,從而限制了高一年級在某些方面做深度的分析和推理,他們只能局限于變化發(fā)生的表層來進行推理,進一步局限了高一學生的思維的復(fù)雜程度,且學生的思維復(fù)雜程度是隨著年齡增長而增強的,對于高一學生而言,可能由于年齡影響,導(dǎo)致其對問題的思考不全面,從而限制了其思維模式。
高二年級學生整體的推理能力達到了水平3,即高二年級的學生在遇到需要解決的問題時,能夠?qū)⑺鶎W的物質(zhì)的若干個性質(zhì)或物質(zhì)的物理變化或化學變化聯(lián)系起來思考,形成一個線性的思維網(wǎng)絡(luò),能夠由已知條件,通過連續(xù)不斷地利用物質(zhì)之間的轉(zhuǎn)化關(guān)系或結(jié)合物質(zhì)在量方面的轉(zhuǎn)化來簡化自己的推理,得到最終的推理結(jié)果。這可能是因為高二年級的學生已經(jīng)開始深入地從微觀變化來分析化學能與電能、熱能之間的轉(zhuǎn)化,也開始深入地了解物質(zhì)的微觀結(jié)構(gòu)以及微觀結(jié)構(gòu)對物質(zhì)性質(zhì)所帶來的影響,也開始從多個角度來進一步分析影響化學平衡和化學反應(yīng)速率的因素,所以高二學生在學習的過程中已經(jīng)潛移默化地形成了更為復(fù)雜的思維習慣,他們已經(jīng)可以從宏觀和微觀等多個方面來看待物質(zhì)變化,也能夠?qū)⒆约核鶎W習的知識聯(lián)系起來思考問題,因此他們也就能夠?qū)⒍鄠€變量之間的關(guān)系梳理清楚,進一步進行更為復(fù)雜的線性推理。但對于高二大部分學生而言,在涉及由多方面影響因素或作用產(chǎn)生某現(xiàn)象的分析推理方面存在一定的難度,存在思考問題不全面,不能夠?qū)⒍嘀匾蛩刂g的相互作用聯(lián)系起來進行綜合思考和推理。這可能是由于高二學生還沒有經(jīng)過系統(tǒng)化的知識梳理,沒有能夠形成完整的知識網(wǎng)絡(luò),故對于同時考慮多種復(fù)雜因素的動態(tài)推理還存在一定的不足。
4 結(jié)論與啟示
本文的測量工具具有一定的測量信度和預(yù)測效度。它可以用來測量學生所能達到的推理能力的復(fù)雜程度。當使用測量工具對高一高二年級進行測試時發(fā)現(xiàn),高二年級學生的推理能力要高于高一年級學生,高二年級學生的推理能力大多集中在水平3,高一年級學生的推理能力大多集中在水平2,雖然兩個年級都有未達到水平1的學生,但只是極少數(shù)的個別學生。兩個年級在四個水平上都有不同比例的學生,且集中的水平層次差別很明顯。這說明隨著年齡增長和所學知識難度和復(fù)雜性的增加,學生的推理能力會有明顯的提升。這說明學生的推理能力一定程度上是受學生所學知識的難度和年齡增長影響的。
對于一線教師而言,可以在鍛煉學生可達到的思維水平的基礎(chǔ)上,通過擴展學生的知識面和視野,讓學生在學習過程中來自主地進行探究和發(fā)現(xiàn)知識,從而合理地發(fā)展學生更復(fù)雜的推理思維,提高學生的推理能力。同時要注意培養(yǎng)學生形成知識網(wǎng)絡(luò),以使學生能夠在進行推理時意識到不同物質(zhì)結(jié)構(gòu)與性質(zhì)、變化之間的多重關(guān)系,從而可以在已有知識的基礎(chǔ)上進行復(fù)雜推理。
參考文獻:
[1]M. L. Weinrich & V. Talanquer. Mapping students modes of reasoning when thinking about chemical reactions used to make a desired product [J]. The Royal Society of Chemistry, 2016, (17): 394~406.
[2]陸海燕. 高中學生的物理推理能力調(diào)查研究[D]. 南京: 南京師范大學碩士學位論文, 2015.
[3]吳宏. 推理能力表現(xiàn): 要素、 水平與評價指標[J]. 教育研究與實驗, 2014, (1): 47~51.
[4]王磊, 支瑤. 化學學科能力及其表現(xiàn)研究[J]. 教育學報, 2016, (4): 46~56.
[5]晏子. 心理學領(lǐng)域內(nèi)的客觀測量——Rasch模型之特點及發(fā)展趨勢[J]. 心理科學進展, 2010, (8): 1298~1305.
[6]何鵬. 理科教師課堂教學表現(xiàn)的測量與評價研究[D]. 哈爾濱: 東北師范大學碩士學位論文, 2016.
[7]Linda Morell. A Construct — Modeling Approach to Develop a Learning Progression of How Students Understand the Structure of Matter [J]. Journal of Research in Science Teaching, 2017, (8): 1024~1048.
[8]Hannah Sevian & Vicente Talanquer. Rethinking chemistry: a learning progression on chemical thinking [J]. The Royal Society of Chemistry, 2014, (15): 10~23.