劉娟 魯瑋峰 黎天揚
基金項目:2020年重慶市高等教育教學(xué)改革研究項目“高校課程考核創(chuàng)新機(jī)制研究”(項目編號:203279)。
作者簡介:劉娟(1976—),女,西南政法大學(xué)新聞傳播學(xué)院副教授,研究方向為科學(xué)傳播、高等教育;魯瑋峰(1999—),男,西南政法大學(xué)新聞傳播學(xué)院碩士研究生,研究方向為科學(xué)傳播、高等教育;黎天揚(1995—),男,牛津大學(xué)數(shù)學(xué)研究所碩士研究生,研究方向為統(tǒng)計分析和高維數(shù)據(jù)處理。
摘? 要:考試制度改革是近年來我國高等教育改革的重要環(huán)節(jié)。當(dāng)前,國內(nèi)高校存在課程考試形式單一、缺乏科學(xué)的成績評定標(biāo)準(zhǔn)和評價方法,不符合終身學(xué)習(xí)的教育理念等問題。本研究采取實驗研究法,在西南某部市共建高校課程期中考試中,將北美廣泛采用的“二級考試法”結(jié)合中國國情實施在地化探索。通過描述性分析、配對t檢驗及線性模型方程等統(tǒng)計方法分析實驗數(shù)據(jù),結(jié)合學(xué)生反饋,研究發(fā)現(xiàn)二級考試法適用于中國國情,有助于優(yōu)化課程考核機(jī)制,激發(fā)學(xué)生學(xué)習(xí)熱情。
關(guān)鍵詞:大學(xué)課程考核;二級考試法;比較研究;量化研究
中圖分類號:G416? ? 文獻(xiàn)標(biāo)識碼:A? ? 文章編號:1673-7164(2023)33-0126-04
習(xí)近平總書記強(qiáng)調(diào)要改革教育評價體制,“健全立德樹人落實機(jī)制,扭轉(zhuǎn)不科學(xué)的教育評價導(dǎo)向”“構(gòu)建符合中國實際、具有世界水平的評價體系”?,F(xiàn)有國內(nèi)高校課程考核大部分還停留在傳統(tǒng)考試模式,形式較為單一、缺乏科學(xué)的成績評定標(biāo)準(zhǔn)和評價方法。
一、文獻(xiàn)梳理
(一)高??荚嚫母?/p>
我國高??荚囍贫雀母锍尸F(xiàn)出宏觀政策引領(lǐng)、微觀實踐探索的格局。宏觀研究主要響應(yīng)政策調(diào)整,關(guān)注高??荚囍贫雀母?、討論我國教育評價文化范式等議題。微觀上則從實踐與操作的層面,倡導(dǎo)以更科學(xué)的教育理念指導(dǎo)考核與考評,強(qiáng)調(diào)過程性考核[1]與混合成績評定[2],嘗試更適應(yīng)學(xué)科特色的考評方案[3]。有學(xué)者針對現(xiàn)有考評機(jī)制,如課程考試成績正態(tài)分布是否合理等議題,提出了質(zhì)疑與批評[4]。大量海外訪學(xué)歸來的學(xué)者開展了不同學(xué)科國內(nèi)外考試實踐的比較研究[5]。宏觀層面多采用政策討論、文化研究等質(zhì)性研究方法,微觀層面則通過問卷分析、評價指標(biāo)設(shè)定等計量手段開展研究??傮w而言,現(xiàn)有研究大多圍繞考試本身展開,缺乏實驗性設(shè)計和學(xué)生反饋,中外對比研究則缺乏本土化實踐探索。
(二)二級考試法
二級考試法(two-stage exam)是一種課程測試方式,因其劃分為個人測試(individual test)和小組測試(group test)兩個階段而得名。二級考試法的核心理念在于“考試也是學(xué)習(xí)過程”。在二級考試中,學(xué)生需要將同一套試題(或者近似的試題)完成兩次。第一次個人獨立完成,第二次以3—5人的小組形式集體討論、達(dá)成共識完成。二級考試適用于較多客觀題的測試,同時第二階段因為加入集體討論,所以相同時間內(nèi)題量相對第一階段有所減少。學(xué)生最終成績以兩個測試階段的不同比例合成。
現(xiàn)有二級考試相關(guān)研究支撐考試場景下集體學(xué)習(xí)的重要性[6]和及時反饋的顯著效果[7]。文獻(xiàn)主要集中在三個問題的討論上:學(xué)生表現(xiàn)、知識喚起和學(xué)生焦慮。學(xué)生在兩次測試中的群體性討論,可以幫助他們實現(xiàn)同伴學(xué)習(xí)。現(xiàn)有文獻(xiàn)同時討論了學(xué)生是否愿意在考試中合作,以及這樣的合作是否能讓個體表現(xiàn)優(yōu)異和個體表現(xiàn)落后的學(xué)生同時受益等問題[8]。
二、研究方法
(一)實驗設(shè)計
項目組進(jìn)行了二級考試法的在地化實驗設(shè)計。考試分兩部分共三輪,第一部分分個人測試1和小組測試,考察二級考試法在中國高校課堂的適用性及效果。第一輪為個人閉卷測試,即個人測試1。分實驗組(A班)和對照組(B班)進(jìn)行。題量為單選題20個,多選題10個,考試時間40分鐘;第二輪為小組測試,將考生分成小組、每組4人,小組成員通過組內(nèi)討論共同完成測試,共享成績。題量縮減為單選題15個、多選題8個,考試時間40分鐘。仍分為AB班。第一二輪測試在同一天兩個相連自然課時完成,中間休息5分鐘;第三輪測試為個人測試2,題量縮減到單選題10個、多選題5個,考試時間調(diào)整為10分鐘。A班在第一二輪測試后第七天進(jìn)行,B班在第一二輪測試后第二天進(jìn)行,以此考察不同的記憶周期對學(xué)生學(xué)習(xí)效果的影響。研究顯示,大部分中國學(xué)生在課堂學(xué)習(xí)行為上有沉默、安靜、不愿發(fā)言的保守傾向,缺乏批判性思維[9]。結(jié)合中國學(xué)生的文化特點,小組在北美二級考試法的基礎(chǔ)上增加了第二輪考試,即個人測試2,并在AB班設(shè)置了第一輪考試(個人測試1)結(jié)束后公布正確答案和不公布正確答案兩種做法,考察小組學(xué)習(xí)及自主學(xué)習(xí)對學(xué)生的影響。
(二)試點時間、課程及班級
項目組在2021—2022學(xué)年秋季學(xué)期大一年級開設(shè)的“傳播學(xué)概論”課程班級期中考試實施了考試試點。第一輪個人測試1和第二輪小組測試的完成時間為A班2021年11月15日,B班2021年11月18日;按正常教學(xué)安排,A班的第三輪測試在第一二輪測試后第七天(2021年11月22日)進(jìn)行,B班在第一二輪測試后第二天(2020年11月19日)進(jìn)行。
三、實驗數(shù)據(jù)分析
(一)考試整體情況
第一輪個人測試的題目單選和多選兩部分,題目中識記層級占50%、理解層級占35%、應(yīng)用層級占15%。A班個人測試1平均成績67.6分,B班個人測試1平均成績58.5分。A班最高分90.0分,最低分37.5分;B班最高分82.5分、最低分37.0分(表1)。在考試內(nèi)容識記層級占50%的情況下,學(xué)生分?jǐn)?shù)偏低,說明基礎(chǔ)知識掌握情況不理想。
個人測試1結(jié)束后,AB班大部分同學(xué)自評答題效果不好。經(jīng)學(xué)生同意,第二節(jié)課開始時,要求學(xué)生按平時課堂作業(yè)的形式分組圍坐,又發(fā)了第二份試卷。告知學(xué)生小組集體作答,如果有不同意見必須達(dá)成共識,小組成員共享同一分?jǐn)?shù)。
(二)小組討論對成績的影響分析
實驗設(shè)計中加入了個人測試2環(huán)節(jié),并結(jié)合實際設(shè)置了與現(xiàn)有文獻(xiàn)不同的兩個變量,一是在實驗組第一輪測試結(jié)束后公布了正確答案,要求學(xué)生交換試卷輔助老師完成試卷評閱,在對照組則沒有公布正確答案,以此檢驗“公布正確答案”這一行為是否會加深學(xué)生記憶。二是實驗組第二輪考試的時間為第二周同一時間(間隔七天),對照組則是第一輪考試后第二天(間隔一天),以此檢驗遺忘曲線在學(xué)生掌握知識中的作用。表2顯示,實驗組有4題(題號2、5、13、14)的統(tǒng)計數(shù)據(jù)出現(xiàn)了顯著差異,對照組有2題(題號5、13)。此外實驗組有1題(題號7)、對照組有7題(題號1-4、7-8、12)出現(xiàn)了“標(biāo)準(zhǔn)差為0,無法計算t”的情況。說明相較于第一次個人測試,A班學(xué)生的答題正確率提升更明顯。按照艾賓浩斯遺忘曲線,人類第二周的記憶要弱于第二天,但由于實驗班公布了正確答案且有“判卷”這一自主行為代入,加深了學(xué)生的印象。所以個人測試2的答題情況A班仍然好于B班。
(三)單題得分配對檢驗
將個人測試1與個人測試2的答題表單進(jìn)行了數(shù)據(jù)清理,在個人測試1的表單中剔除了個人測試2刪減的題目,將A、B班答卷按“個人測試1vs.個人測試2”的配對方式進(jìn)行了配對t檢驗(表3)。題目設(shè)置上,根據(jù)個人測試1的答題情況,剔除了部分識記層級的題目,提高了多選題應(yīng)用層級的占比,使得個人測試2的整體難度較個人測試1有所提升。數(shù)據(jù)分析結(jié)果表明A班(實驗班)與B班(對照班)學(xué)生在個人測試1與個人測試2的答題情況,有9題(占總題量2/3)綜合均值均存在顯著統(tǒng)計差異(見表3)??梢越忉尀椋〗M討論共同學(xué)習(xí)這一考試形式,有利于學(xué)生對知識的理解與掌握、從而提升了答題正確率。
(四)教學(xué)方法對成績的影響分析
通過小組測試與個人測試1的成績比對,討論不同的教學(xué)方法(A班與B班)是否會影響學(xué)生對知識的掌握。根據(jù)題目難度設(shè)計,將識記層級(占50%,記為A類)、理解層級(占35%,記為B類)、應(yīng)用層級(占15%,記為C類)進(jìn)行難度分類。利用線性模型對總成績、A類題目成績、B類題目成績與C類題目成績進(jìn)行不同教學(xué)方法的比對,檢驗不同教學(xué)方法與成績之間是否存在差異。建立簡單的線性模型:y=βx+C+ε。其中y是第一次個人成績;x是班級分類,若學(xué)生來自實驗組班級,則x=1,若學(xué)生來自對照組班級,則x=0;β是班級變量對應(yīng)的系數(shù);C是模型常數(shù);ε是不可觀測誤差。在擬合線性模型前,先利用柯爾莫哥洛夫—斯米爾諾夫檢驗對第一次個人成績的分布進(jìn)行正態(tài)性檢驗。如果第一次個人成績分布具有正態(tài)性,則擬合的線性模型可以提供穩(wěn)健可靠的解釋,反之不然。利用數(shù)據(jù)對模型進(jìn)行擬合,以檢驗現(xiàn)有問題。分析結(jié)果見表4。
由上表可知,實驗組班級比對照組班級的總成績要好。教學(xué)方法對于學(xué)生的成績有著至關(guān)重要的影響,不僅體現(xiàn)在總成績上,在識記與應(yīng)用層面也有極大影響。
四、結(jié)論與討論
(一)考試效果
回應(yīng)課題實驗?zāi)繕?biāo)一,從考試結(jié)果來看(表1),小組測試的平均分較第一輪個人測試有明顯提升,A班從67.6分提升至90.2分,B班從58.5分提升至84.5分;答題正確率A班從72.1%提升至88.3%,B班從62.4%提升至88.8%。本文第二部分?jǐn)?shù)據(jù)分析中,不管是單題比對統(tǒng)計、還是實驗組與對照組兩個教學(xué)平行班的比對分析,都驗證了現(xiàn)有文獻(xiàn)對“二級考試法”的描述,即這一考試方法有助于提升學(xué)生學(xué)習(xí)效果。
(二)二級考試法在中國的適用性
課題實驗?zāi)繕?biāo)二為“測試二級考試法在中國課堂和中國學(xué)生中的適用性”。通過“個人測試1vs.小組測試”和“個人測試1vs.個人測試2”的兩組答題狀況配對t檢驗分析,統(tǒng)計數(shù)據(jù)顯示整體答題效果提升顯著。主要反饋分三方面。一是評價考試形式。認(rèn)為小組測試“可以集思廣益,得到更精確的答案,知識得到更清晰的解釋”。二是評價團(tuán)隊合作。第三種反饋認(rèn)為“二級考試法”是一種新的學(xué)習(xí)方式。統(tǒng)計數(shù)據(jù)和學(xué)生反饋均顯示“二級考試法”在中國課堂的適用性。
(三)教學(xué)手段對學(xué)習(xí)效果的正向影響
本次考試實驗數(shù)據(jù)顯示,進(jìn)行教學(xué)改革的A班,比實施傳統(tǒng)教學(xué)模式的B班,在二級考試法中得分更高。在個人測試2中,A、B、C三類題目的成績比對A班都好于B班。在C類題目的成績比對中,小組之間還產(chǎn)生了一定的差異,說明在應(yīng)用層面小組與小組之間可能會產(chǎn)生不一樣的看法,導(dǎo)致第二次個人成績受其影響,產(chǎn)生差別。以上數(shù)據(jù)分析結(jié)果說明,不只是教學(xué)方法,討論方法(分組方法)也對學(xué)生的成績有著至關(guān)重要的影響,不僅體現(xiàn)在總成績上,對于識記、理解與應(yīng)用層面的知識掌握也有較大影響。教師應(yīng)當(dāng)讓學(xué)生真正地參與到課堂之中,在互動中提升總體成績水平。
參考文獻(xiàn):
[1] 周建新,郝靜怡. 過程性考核下的“英語詩歌選讀”課程教學(xué)與創(chuàng)新思維訓(xùn)練——基于華南理工大學(xué)2014-2015年第1學(xué)期的課程教學(xué)試驗分析[J]. 教育與教學(xué)研究,2016,30(03):93-101.
[2] 李華,李寒梅,孫福財. 基于“雨課堂”的高校課程混合式學(xué)習(xí)成績評定研究[J]. 湖北體育科技, 2022,41(04):373-376.
[3] 冒小瓂,程寶榮,張振琴,等. 高校本科教學(xué)評估背景下醫(yī)用化學(xué)考試體系改革與實踐[J]. 基礎(chǔ)醫(yī)學(xué)教育,2019,21(01):26-28.
[4] 李廉,張萬紅. 高校課程考試成績正態(tài)分布辨析[J]. 中國考試,2021(04):86-93.
[5] 趙振宇,姚昱晨. 美中兩國大學(xué)先修課程物理考試力學(xué)部分的比較研究[J]. 物理與工程, 2020,30(05):107-112.
[6] Herrmann J K. The impact of cooperative learning on student engagement: Results from an intervention[J]. Active Learning in Higher Education,2013,14(3):175-187.
[7] Bransford J,Brown A,Cocking R. How people learn: brain,mind,experience, and school[J]. Washington,DC: National Academies Press, 2004.
[8] Dan L, Theodore S, Mae K. Two-stage examinations: Can examinations be more formative experiences?[J]. Active Learning in Higher Education,2018,24(2):146978741880166-146978741880166.
[9] 呂林海,張紅霞,李婉芹. 中國學(xué)生的保守課堂學(xué)習(xí)行為及其與中庸思維、批判性思維等的關(guān)系[J]. 遠(yuǎn)程教育雜志, 2015(05):54-63.
(責(zé)任編輯:陳華康)