張籍
摘 要: 對于教育評價,我國教育目前大多是以診斷性測試作為教育評價的主要依據。它能夠比較準確地反映學生一階段內的學習情況,并以分數的形式呈現。但大數據時代下的試卷挖掘,能賦予試卷新的內涵。
關鍵詞: 大數據 試卷挖掘 命題要求
一張不起眼的試卷,最多不過100道題。同樣的成績能代表同樣的學業(yè)水平嗎?除了知識點的掌握外,我們還能從中發(fā)現什么?一樣丟掉10分,有的學生可能是基礎性分數一分不丟,失分在綜合題上,有的學生則可能從頭到尾,全部失分在審題疏忽或者迷惑性選擇題上。這就帶來兩種完全不同的診斷結果。前者是對多知識綜合運用水平不足,后者是對精細閱讀缺乏辨別。這就要求老師跳出分數乃至題目所考核的知識點的束縛,對試卷進行深度挖掘。
一
試卷挖掘是在挖掘什么?
首先,從縱向上分析。從學生自身單次單科來看,一次考試除了成績外,我們還能讀出什么?除了知識點的掌握外,學生理解、記憶、運用的水平,以及分析、評價、創(chuàng)造的能力才是分數之外的重點。對學生的能力關注,正是素質教育倡導的核心。我們暫且將這些能力作一個數值,以示區(qū)別。然后,從學生自身單科一段時間的考試來分析,靜止的各能力水平數值會成為一組變化曲線。這條曲線除了表示能力的波動(或提高,或受影響)以外,還能和學生學習行為及日常行為結合,從而對學生學習的主要特征、學習行為特點、學習行為的影響因素及其所帶來的學業(yè)結果進行分析。根據所分析的結果,掌握學習者的學習規(guī)律,優(yōu)化學習過程,強化學習效果,提高教育質量。
深入一些,從學生的綜合學習水平,也就是學生所學的全部科目來看,我們得到的不是一條曲線,而是一張同時間軸下的多曲線變化圖。我們能從一系列的各科能力和興趣點,判斷考生興趣、能力屬性,研究確定考生適合學習的專業(yè)和適合報考的學校,并對考生將來確定就業(yè)方向提出建議。這不正是以學生為中心的新課改理念嗎?
其次,進行學生間橫向的分析。一個知識點,全班多少人掌握,是否需要重新鞏固。某項能力,比如審題閱讀,是全班性的能力薄弱,還是個別同學的疏忽,這些來源于全班數據的匯總。如果只是照本宣科地將重點一講再講,那么學生能力不但沒有提高,還浪費了學生本應補足“短板”的時間,教學質量未必得到提高。不是面上的問題,就需要對個別學生進行個性化指導。學生的能力或注意力發(fā)生了集體性變化的原因是什么?是該摒棄還是引導?再在班級數據的基礎上,形成校、區(qū)、市等大范圍對比,很容易找到差距。這樣的數據就會形成一個面。每個學生都會成為面上的一個點,這個點又是一個變量集合。這就形成了關于本班學習的多維數據模型。
二
試卷挖掘的幾個層次為:成績分數—知識點掌握—能力數據—能力曲線—多曲線變化圖—多維數據模型。
歐美一些國家和組織較早地認識到了考試數據挖掘在教育評價中的作用,并已將它作為新一代評價項目設計的依據。如,國際教育評價協(xié)會、國際經濟合作組織分別在其組織的大型國際測試項目中充分利用其組織的測試與調查問卷的數據進行深度挖掘,分析影響各國教育的主要因素;英國還在其評價項目中引入了檔案袋管理,結合計算機技術建立了形成性評價;美國教育考試服務中心在其組織的考試項目的每個環(huán)節(jié)都對數據進行了有效應用,使它能從容地應對每年面向全球及國內的200多種、數千次的考試,并對考生進行相對科學合理的評價。我國起步較晚,究其原因不外乎兩個方面:第一,試卷挖掘產生的數據極其龐大,加上我國本身的學生數量較多,由此帶來的巨量數據處理讓教師和教育機構不能承受。第二,要進行常規(guī)和高效的數據挖掘,就要從試卷設計、數據產生、分析直到匯總都建立標準化的體系。這就要求參與人員有較高水平。而我國教育從業(yè)人員相對素質不高,面對系列性設計往往力不從心,從而制約發(fā)展。
值得欣慰的是,隨著科技的發(fā)展和信息化應用水平的提高。以往要靠單機甚至人力進行分析的工作,現在可通過大型數據處理中心或數據云的方式完成,教育評價由此可以步入大數據時代。
三
能夠完成大規(guī)模試卷數據挖掘的物質層面有了,那么對命題和分析有什么樣的要求呢?首先,從階段性測驗的出題上,不是圍繞知識點進行,它應該明確每一道題目的測試目標,而這一目標是以能力考核為核心的。第二,試卷考核的知識點應該互相印證,區(qū)別相同知識下的不同能力。簡單舉例,題目一考核了知識點A,是以極度迷惑性選項B的方式出現的。那學生出錯,可能是對A的完全遺忘,也可能是不能區(qū)別AB,甚至可能是對題干的閱讀障礙。應在題目二中對知識點A進行另外一種形式的考核。有條件的應對相同知識點進行不同能力方向和程度的測試,辨別學生的真實差別。當然,這不一定在同一試卷內完成。第三,主觀題應進行細致分析,而不僅僅只是估算分。細致分析的結果應和客觀題數據累加。但應控制在一定比例,以便將教師主觀性成分降低。第四,測試應小巧,不能加重學業(yè)負擔。但要保證一定頻率以便給出及時結果,便于教師調整。第五,測試不一定以考試的方式出現,更好的方式是以課堂小測和作業(yè)的方式呈現。第六,試卷考察的能力應有對應量表。
綜上所述,大數據下的試卷挖掘,對于提高教學質量,貫徹新課改方針,真正進行素質教育都有極大的推動作用。但是,對于教育從業(yè)人員也提出了更高要求。我們在開展教育活動時,更要以科學嚴謹的方式進行設計。相信,大數據時代的來臨必將帶來教育的又一次革新。endprint