張金虎 何亞萍 朱敏佳 聶莉 岳利民
(四川大學華西基礎醫(yī)學與法醫(yī)學院生理學教研室,四川 成都 610041)
生理學是醫(yī)藥專業(yè)的公共基礎課,課程教學質(zhì)量直接關系到相關專業(yè)學生的培養(yǎng),必須重視其試題質(zhì)量,做好題庫建設。人民衛(wèi)生出版社組織編寫了一個面向全國的醫(yī)學教育題庫[1],為檢測其生理學試題質(zhì)量,題庫方指定了60道生理學A型選擇題用于四川大學2017秋季期末考試(客觀題部分)。
試卷質(zhì)量指標包括信度和效度,試題分析則有難度和區(qū)分度指標。A型選擇題在題庫中所占比例很大,其試題質(zhì)量要求也高,并且有專門的選項分析,即通過統(tǒng)計備選答案實際頻數(shù),篩查出存在選項異常的試題。如某干擾選項頻數(shù)接近0時,說明此選項迷惑性差;某干擾選項頻數(shù)接近或高于參考答案時,提示題干描述不清晰導致可以雙選、或者是相應知識點講授存在問題。這些需進一步查看原題,分析具體原因[2]。
為此,就上述試題考試結(jié)果進行分析,為今后題庫的建設、維護,以及課堂教學的改進提供參考。
考試對象為2016級基礎醫(yī)學、臨床醫(yī)學(五年制)和口腔醫(yī)學專業(yè)的學生,共計474人。五選一的A型選擇題,每題1分。機讀答題卡并人工校對,輸出個人總分和每個小題實際選項的Excel表。
采用Excel2010,將機讀結(jié)果用邏輯函數(shù)自動轉(zhuǎn)換為0/1計分。采用KR21公式計算庫-李信度[2]。用分類計數(shù)函數(shù)統(tǒng)計各題備選答案的頻數(shù)及高分組和低分組分布,對于備選答案頻數(shù)異常的試題,查看原題后再作相應處理。
套用函數(shù)“=IF(ISERROR(FIND(“Y”,Z)),0,1)”,在Excel中可將答案自動轉(zhuǎn)換為相應得分。其中Y為某題正確答案序號,Z為考生所在單元格代碼。
Excel中求出總成績及各小題平均分、標準差,發(fā)現(xiàn)3名學生總分與機讀后人工核對的成績相差±1分,經(jīng)查看答題卡確認更改,由此完成了分數(shù)核查。
由于均為0/1計分題,其平均分實為通過率(即難度)0.828,高于題庫方預估難度0.600,本套A型選擇題對于這部分學生來說難度不大。
這3個專業(yè)2013~2016年度四選一的A型選擇題平均難度0.788。由于選項數(shù)不相同,需要預先作難度校正后再比較[2]。經(jīng)校正,本次試題難度為0.785,前4年平均難度校正值為0.718。
Excel中可直接將總成績的平均分和標準差代入KR21公式,計算出庫-李信度值為0.863,與SPSS得出的Cronbach′s α值0.860非常接近。各小題得分一致性好,測驗的信度較高,考試結(jié)果可靠。
用COUNTIF函數(shù)、并使用通配符“*”可便捷地統(tǒng)計出各題備選答案頻數(shù)。結(jié)果有8道題選項設計合理(各干擾項比例為2%~22%,正確選項比例50%~70%),試題制作質(zhì)量優(yōu)良。另有9道題僅某一干擾選項頻率在1%~2%,試題質(zhì)量較好。
第19、21、28、40題等共計12道題存在某些干擾選項頻數(shù)為0的情況,其中第40題全部干擾項均不足1%。第58題比較特殊,除干擾選項E頻數(shù)為0外,參考答案A和干擾項D的頻數(shù)比為221:211,在高分組相差稍大(75:44)。這12道題需查看原題,再給出參考意見。
經(jīng)查看原題,第28題考察閾刺激知識,備選項中僅正確答案出現(xiàn)關鍵字“閾”;第21題與之類似。這類題可適當增大干擾選項的迷惑性。第19題正確選項的描述超過20字,而各干擾項用詞均不足10個字,不排除對作答者產(chǎn)生了一定的暗示,需要降低兩者句式的差異程度。
第58題題干為“平原地區(qū)的正常人到高原后呼吸運動增強的原因”,正確答案A為“低氧血癥”,干擾選項D為“低氧血癥合并高碳酸血癥”。此試題題干和選項均無問題,而不少學生未能選擇正確答案,暴露其相關知識點掌握不好的問題,今后在相關章節(jié)的教學中應著重講解。
第40題等其余9道題是因為相關知識點屬大綱重點要求內(nèi)容,學生普遍掌握較好致正確率偏高。這類題不能輕易刪減,但也不宜大量出現(xiàn)在同一套試題中,否則對試卷難度和區(qū)分度影響較大[3]。
選項分析要比較高分組與低分組差異,實際上就分析了區(qū)分度。區(qū)分度為0.273,區(qū)分能力一般。
本科課程考試屬于標準參照考試,應具備較高的內(nèi)容效度(對教學大綱的覆蓋程度)和信度;主要考察學生是否達到教學大綱的要求,對難度和區(qū)分度要求不高,難度0.5~0.8,區(qū)分度>0.2即可[4]。
題庫方在選擇試題時已按掌握、熟悉和了解3檔要求對各章節(jié)全面覆蓋以確保內(nèi)容效度。信度反映測驗的可靠程度,全國性題庫通常要求信度>0.8;由于客觀題可猜測答案致信度變小,其信度要求會適當降低[2]。本次信度為0.860,試題整體可靠性好。
通過選項分析篩查,并進一步對照試題題干描述和選項設置,絕大部分試題都符合要求,僅有3道題在備選答案設計上待改進,這樣也可提升難度和區(qū)分度??傮w上,該套A型選擇題制作質(zhì)量較高。
本次考試反映出這部分學生的生理學知識普遍掌握較好,課堂教學質(zhì)量較高;分析結(jié)果也有望為今后該題庫在維護和組題時提供參考[5]。另外,通過選項分析也發(fā)現(xiàn)學生在個別知識點存在普遍的錯誤認識,今后應重點強化。當然,根據(jù)以往的教學經(jīng)驗,這3個專業(yè)的學生成績整體上要好于其它專業(yè),若此套A型選擇題用于檢測其它專業(yè)學生,試題質(zhì)量指標(尤其是難度和區(qū)分度)會有一定變化。
SPSS在試卷分析使用較廣泛,如連續(xù)計分題的α信度分析等[6]。而以全或無方式計分的客觀題采用KR21公式計算信度,僅需總分的平均值和標準差,計算非常便捷。本例中讀卡輸出的選項結(jié)果超過2.8萬個,SPSS無法自動將選項轉(zhuǎn)換為試題得分,不支持庫-李公式,也不能使用通配符處理單元格字符前后存在的空格,例如機讀輸出的“C”和“C”(表示空格)將被SPSS當成兩種情況來計數(shù),實用性不好。采用Excel對A型選擇題機讀結(jié)果進行得分轉(zhuǎn)換并作選項分析,方法簡便、實用。