劉曉坤 胡象嶺
(曲阜師范大學物理學系,山東 曲阜 273165)
近年來,論證在科學教育研究領域引發(fā)廣泛關注.《普通高中物理課程標準(2017年版)》將“科學論證”列為科學思維的基本要素,科學論證能力幫助學生更好地理解概念、促進推理能力以及批判性思維能力的發(fā)展.[1,2]論證能力的培養(yǎng)對物理核心素養(yǎng)的形成有著至關重要的作用.在教學中,了解學生科學論證能力所處的水平,是有針對性地培養(yǎng)學生科學論證能力的基礎.為此,有國內研究者在科學情景下廣泛開展學生的科學論證能力測評研究.例如,鄧陽基于化學學科背景,設計書面和口語科學論證任務,評價被試在“主張”、“證據”、“理由”和“反證”4個要素上的表現(xiàn).[3]韓葵葵基于Toulmin論證模式,設計了“鐵釘生銹”、“化學,我該不該愛你”、“黃金糧食”、“動物趨性”、“溫室效應”、“萬能的抗生素”6個論證任務對被試科學論證能力展開測評.[4]在物理學科背景下,鄭穎依據SOLO理論劃分了物理科學論證能力的認知表現(xiàn)層次.[5]陳穎評價被試在“觀點”、“事實證據”、“理論依據”、“推理過程”和“反駁”5個要素上的表現(xiàn).[6]以上研究設計了18個論證項目,部分項目所涉及的物理知識對初入高中的學生尚有難度.能力測試應盡量避免未知知識對結果造成的影響,同時降低項目難度才能更好地對處于高中各階段的學生展開測量.本研究關注被試論證時物理概念的運用情況以及使用證據的特征和進行推理的能力,過多的項目不利于學生對問題情境展開充分論述,應對問題情境的數(shù)量加以控制.因此,本文在已有研究的基礎上,構建評價框架、設計評價工具,對高中生的科學論證能力展開測量與評價.
科學教育領域分析論證時常?;趫D爾明論證模式(Toulmin Argument Pattern,簡稱TAP).圖爾明認為數(shù)據(Data)、主張(Claim)、正當理由(Warrant)、支持(Backing)、限制條件(Qualifiers)和反駁(Rebuttal)6個要素組成論證,出現(xiàn)更多的結構要素意味著具有更高水平的科學論證能力.[7]這種評價方式僅關注結構要素的多少,不關注各要素如何連接在一起,也不關注內容是否表述準確,可以擺脫情境依賴,具有廣泛適用性.然而,僅憑借單一指標并不能夠全面地評價論證質量,還應從結構(Structure)、正當性(Justification)和內容(Content)對論證進行評估和描述.[8]
基于此,N. Brown設計了如圖1所示的“證據使用框架(Using Evidence Framework)”.[9]與圖爾明論證模式不同,“證據使用框架”中包含“要素”和“流程”兩類信息.其中,“要素”共有5個:主張(Claim)和數(shù)據(Data)這兩個要素與圖爾明論證模式中含義相同;前提(Premise)、規(guī)則(Rule)、證據(Evidence)分別對應于圖爾明論證模式中的限制條件(Qualifiers)、正當理由(Warrant)和支持(Backing).“流程”體現(xiàn)的是論證過程中的推理過程,共有3個:應用(Application)是規(guī)則(Rule)在前提(Premise)所描述的特定情況下發(fā)揮作用的過程;解釋(Interpretation)是比較和整合多個證據(Evidence)的過程;分析(Analysis)是對多個數(shù)據(Data)進行比較、整合的過程.[10]該框架強調使用證據進行推理在論證過程中的重要性,推理過程是否合乎邏輯,是衡量論證是否有效的重要標準.[11]
圖1 證據使用框架
應用“證據使用框架”在物理學科背景下進行論證時,物理“概念”是基礎;可靠的“證據”是得到主張的前提,精確的“規(guī)則”是證據與主張連接的橋梁;有效的“推理”是論證的關鍵.因此,本研究將科學論證能力解構為“概念復雜性”、“規(guī)則精確性”、“證據可靠性”、“推理有效性”4個維度.其中,“概念復雜性”評價的是被試在特定的問題情境中調用相關知識進行論證的能力.在這一維度,依據郭玉英等設計的概念復雜度模型,劃分為“關聯(lián)”、“系統(tǒng)”、“整合”3個水平;[12]“規(guī)則精確性”維度依據規(guī)則表述的精確程度,劃分為“模糊”、“不準確”和“精確”3個水平;“證據可靠性”旨在評價被試在科學論證中引用證據的能力.在這一維度,依據證據的數(shù)量與相關充分性劃分了從“沒有證據或是無效的證據”到“一個以上有效的證據”3個水平;“推理有效性”檢驗將規(guī)則與主張聯(lián)系起來的推理的質量.在這一維度,依據推理的復雜程度劃分為從“在證據和觀點之間建立直接聯(lián)系”到“在證據和觀點之間建立科學的邏輯關系鏈”3個水平.
在評價框架的基礎上設計科學論證能力測試題.為了避免因未知知識對論證能力造成的影響,題目情境涉及到的知識應是被試學過的、熟悉的物理學科核心概念和重要內容.因此,依據《義務教育物理課程標準》和《普通高中物理課程標準(2017年版)》的學業(yè)要求,確定了以力與運動、磁現(xiàn)象、物態(tài)變化等作為問題情境的知識載體,設計了5個書面論證任務.由于篇幅限制,僅列舉情境1具體的題目設計.
情境1:跳傘者從500 m高的飛機上跳下,下落125 m時將傘打開.表1為跳傘過程中距地高度與速度對照表:(重力加速度,g=10 m/s2)
表1 距地高度與速度對照表
小趙和小錢看到上述資料后,各自對跳傘的過程提出了自己的看法:
小趙說:跳傘的過程中,所受到合力的方向一直是向下的.
小錢說:跳傘者開傘后,一直有受到重力的影響.
1a. 依據上述資料,你認為小趙和小錢誰的說法是合理的?說明你同意他的觀點的理由.并通過表格提供的數(shù)據詳細分析跳傘者的運動情況,說明你將如何反駁你不同意的觀點.
1b. 小孫說:“跳傘者是因為受到了力的作用才得以運動,如果沒有力就不動了”.因此,小孫以此為證據,得出“力是維持物體運動的原因,即有力有運動,沒力沒運動”.你同意小孫的觀點嗎?若同意請說明理由,若不同意請通過列舉實例詳細說明你將如何反駁小孫.
隨后,依據科學論證能力評價框架,設計了針對每道題目的評分標準.對于情境1-4的每個問題均分別從“概念復雜性”、“規(guī)則精確性”、“證據可靠性”和“推理有效性”4個維度進行評價.情境5以“CO2排放量與地球溫度的關系”這一熱點話題作為問題情境,由于社會科學議題更關注問題背后蘊含的倫理道德問題.因此,不對情境5中的問題進行“概念復雜性”維度評分.具體評分標準以題目1a為例進行說明,如表2所示.
表2 題目1a評分標準設計
續(xù)表
為檢驗擬定評價工具的有效性,進行了兩輪實測.第1輪實測,從山東省Z中學高一年級隨機抽取一個班的學生作為測試對象,實測50人,收回有效問卷44份;第2輪實測263人,回收有效問卷250份,兩輪實測樣本信息如表3所示.Z中學生源豐富,學生群體之間存在著一定的差異,而且被試已學完測試題中所涉及的全部知識,可以作為本次測試的研究對象.
表3 兩輪實測樣本信息
在潛在特質理論基礎之上建立的項目反應理論,克服經典測量理論中測試工具依賴和樣本依賴,具有“參數(shù)分離”、“參數(shù)恒定”的特點.[13,14]個體能力值和題目難度值經Rasch模型共同轉化為logit scale單位,這樣就可以在同一單維度尺上進行比較.[13]在這種情況下,個體能力值和題目難度值的取值范圍為負無窮到正無窮,有效避免經典分數(shù)極值是0或100的問題,能夠更好地區(qū)分高、低水平被試之間表現(xiàn)的差異.考慮到Rasch模型具有上述優(yōu)勢,選擇其作為本研究的數(shù)據分析模型,使用Winsteps軟件檢驗數(shù)據.針對第1輪實測數(shù)據指標,對評價工具進行有針對性地修改,修改后再進行實測,直到各個指標均達理想值.本研究共進行兩輪實測,數(shù)據結果如表4所示.
表4 科學論證能力兩輪實測數(shù)據結果
可見,經過修改后的評價工具各個指標體現(xiàn)良好特征.意味著設計的科學論證能力評價工具可以用來測量、評價被試的科學論證能力.
使用SPSS軟件分析全體被試科學論證能力測試logit分,表5是被試得分描述性統(tǒng)計數(shù)據,圖2是科學論證能力測試得分頻率分布直方圖.
表5 科學論證能力測試得分描述性統(tǒng)計
圖2 科學論證能力測試logit分數(shù)分布直方圖
由表5可知,被試的科學論證能力測試得分全距為9.33,標準差為1.29,被試科學論證能力水平分布廣,差異顯著;得分均值為1.08,均值標準誤為0.08,測量數(shù)據具有較高的可信度.圖2顯示被試科學論證能力測試得分大致呈正態(tài)分布,說明大多數(shù)被試的科學論證能力處于中等水平.
為了解被試在科學論證能力不同維度上的表現(xiàn),統(tǒng)計被試在各維度得分率情況,結果如表6所示.
表6 科學論證能力不同維度得分率描述性統(tǒng)計
不難發(fā)現(xiàn),全體被試在“規(guī)則精確性”和“推理有效性”維度得分率相當,且高于“概念復雜性”和“證據可靠性”維度,“概念復雜性”維度得分率最低.意味著在科學論證能力測試中,被試對規(guī)則表述精確,且能夠基于證據進行合理、有效的推理得到結論,但是并不能很好地聯(lián)系多個概念,解決特定的物理問題.
為了探討不同性別被試科學論證能力的差異,對不同性別被試科學論證能力進行獨立樣本T檢驗,結果如表7所示.
表7 科學論證能力總分及各維度得分率的性別差異
表7可以看出,男生被試在科學論證能力4個維度的得分率均略高于女生.其中,“概念復雜性”和“規(guī)則精確性”這兩個維度得分率的性別差異最為明顯,“推理有效性”維度得分率的性別差異最小.對于科學論證能力測試得分,男生均值為1.0929,女生均值為1.0405.可見,男生比女生的科學論證能力稍高,但是差異微小.經檢驗,不同性別被試科學論證能力不存在顯著性差異.
為了探討科學論證能力及不同維度得分率與物理學業(yè)成就之間的關系,對數(shù)據進行二元變量相關性分析,具體結果如表8所示.其中,物理成績數(shù)據采用的是被試在高一下學期期中考試的物理成績,處于該階段的被試已學完本研究所設計測試工具包含的所有知識.而且,期中考試是一次較大規(guī)模的規(guī)范性考試,具有一定代表性.
表8 科學論證能力及其各維度得分率與物理學業(yè)成就的相關性
從表8可以看出:全體、男生、女生被試在科學論證能力各維度與物理學業(yè)成就之間均呈現(xiàn)顯著相關性.不同維度與物理學業(yè)成就的相關性,全體被試在“概念復雜性”維度相關性最高(r=0.598,p<0.01),“證據可靠性”維度相關性最低(r=0.537,p<0.01);男生被試在“概念復雜性”維度相關性最高(r=0.599,p<0.01),“規(guī)則精確性”維度相關性最低(r=0.425,p<0.01);女生被試在“推理有效性”維度相關性最高(r=0.618,p<0.01),在“證據可靠性”維度相關性最低(r=0.555,p<0.01).
可見,科學論證能力4個維度均與物理學業(yè)成就顯著相關,對于物理學業(yè)成就的影響,男生被試“概念復雜性”維度影響最大,女生被試“推理有效性”維度影響最大.總的來看,科學論證能力與物理學業(yè)成就呈現(xiàn)顯著正相關(r=0.595,p<0.01),被試科學論證能力越高,越可能獲得更高的物理學業(yè)成就.女生被試科學論證能力與物理學業(yè)成就的相關性大于男生被試,說明科學論證能力對物理學業(yè)成就的影響因性別不同而不同.
為進一步考察科學論證能力對物理學業(yè)成就的預測情況,對數(shù)據進行一元線性回歸分析,其中,將科學論證能力作為自變量,學業(yè)成就作為因變量.經分析得到一元回歸系數(shù)為7.072(t=7.409,p<0.01),測定系數(shù)為0.348.說明科學論證能力對物理學業(yè)成就具有顯著的預測性,可以解釋物理成績變異的34.8%.
以往針對初、高中生以及大學生開展科學論證能力的測評研究的相關文獻指出:我國學生的科學論證能力普遍較弱.[3]本研究發(fā)現(xiàn),科學論證能力處于中等水平的被試占到全體被試的大多數(shù).其中,被試在“規(guī)則精確性”和“推理有效性”這兩個維度表現(xiàn)較好,“概念復雜性”這一維度表現(xiàn)較差.說明被試在本次測試中,能夠精確地表述將“證據”與“觀點”聯(lián)結的“規(guī)則”,“推理”嚴謹且有邏輯.但是,不能深入地挖掘題目情境背后蘊含的知識,致使在作答中不能很好地整合多個物理“概念”.這啟發(fā)我們,在教學中,學生學習了某個新知識后,應及時地幫助其梳理相關知識之間的聯(lián)系,辨析相近概念和相似概念,幫助學生形成完整的物理知識網絡,從而加強在科學論證能力“概念復雜性”這一維度的表現(xiàn).
關于性別對科學論證能力的影響,有研究者在物理學科背景下研究科學論證能力時發(fā)現(xiàn)初中生的科學論證能力與性別之間不存在相關性.[15]也有基于化學學科的科學論證能力實證研究發(fā)現(xiàn)中學生的科學論證能力存在著顯著的性別差異,其中初中階段女生的科學論證能力明顯高于男生;高中階段男生的科學論證能力明顯高于女生.[4]本研究發(fā)現(xiàn),高中階段男生相較于女生,在科學論證能力各維度表現(xiàn)較好,在測試中得分也略高,但是不同性別被試科學論證能力并不存在統(tǒng)計學上的差異(t=0.312,p>0.05).造成研究結果差異的原因可能與選取的學科背景有關,也可能與選取的樣本有關,科學論證能力是否與性別有關值得進一步探究.
大量研究證明科學論證能力與學業(yè)成就二者有顯著的相關性.本研究發(fā)現(xiàn):科學論證能力與物理學業(yè)成就之間存在著顯著相關性(r=0.595,p<0.01),女生被試科學論證能力與物理學業(yè)成就的相關性大于男生被試.科學論證能力各維度與物理學業(yè)成就均呈現(xiàn)顯著相關性,其中“概念復雜性”維度與物理學業(yè)成就相關性最高,“證據可靠性”維度與物理學業(yè)成就相關性最低.這意味著如果學生在論證時能夠調用復雜的物理知識,那么他在物理測試中同樣會有較好的表現(xiàn).同時,研究發(fā)現(xiàn),科學論證能力能解釋物理成績變異的34.8%.雖然影響物理成績的原因眾多,科學論證能力對物理學業(yè)成就具有顯著的預測性.總的來看,培養(yǎng)學生的科學論證能力可以有效提高物理成績.對于科學論證能力的培養(yǎng),可以在日常的教學中顯化科學論證的結構要素.可以進行論證式教學,也可以通過向學生展示“圖爾明論證框架”和“證據使用框架”,說明框架中每個結構要素的含義,介紹應用框架進行論證的方法和基于證據進行論證的重要性.在此基礎上,學生才能更好地應用教師在教學中所使用的論證方式,有意識地培養(yǎng)科學論證能力.
本研究結果顯示:設計的科學論證能力評價工具信度、效度和區(qū)分度良好;實測結果和模型擬合良好,試題具有單維性特征,均考察的是科學論證能力;評分分檔設置也較為合理,能夠較好地區(qū)分被試在各試題上表現(xiàn)的差異.因此,本研究所設計的科學論證能力評價工具科學、有效.通過分析對高中生科學論證能力實證研究的結果,得到如下結論: (1) 大多高中生的科學論證能力處于中等水平,被試在“規(guī)則精確性”和“推理有效性”這兩個維度表現(xiàn)較好,“概念復雜性”這一維度表現(xiàn)較差. (2) 不同性別被試科學論證能力不存在顯著性差異(t=0.312,p>0.05).(3) 科學論證能力與物理學業(yè)成就之間存在著顯著相關性 (r=0.595,p<0.01).不同性別被試的科學論證能力對學業(yè)成就的影響不同.科學論證能力能解釋物理成績變異的34.8%.