曲霄紅
山西大同大學教育科學與技術學院 山西 037009
作為著名的開源科學計算軟件之一,科學計算自由軟件SCILAB具有運行穩(wěn)定,占用計算機資源少,運行速度快等優(yōu)點,已經(jīng)被廣泛地引進到教育研究、教學及產(chǎn)品開發(fā)中。而目前教育研究中一般采用價格昂貴的SPSS或MATLAB。
教育考試研究中,相關關系研究是經(jīng)常要研究的內(nèi)容之一,教育考試及相關調(diào)查中,一般都可以獲得兩個或多個變量的信息,考試研究常常需要探索這些變量之間的關系。本文在研究試題相關關系,利用SCILAB強大的數(shù)值計算功能,研究試題相關關系。
在教育研究中和實際工作中,當以一個變量作為研究對象時,只需要通過集中量和差異量來描述一組數(shù)據(jù)內(nèi)部的集中趨勢和差異程度。但是如果研究兩個變量,那么就可能不僅要關系每個變量各自的集中趨勢和差異程度,還需要關系變量之間的關系。變量之間的關系要通過相關系數(shù)來描述。
教育統(tǒng)計學上有多個不同類型的相關系數(shù)。如積差相關系數(shù)、點二列相關系數(shù)、等級相關系數(shù)等。在相關分析中,要根據(jù)變量以及搜集的數(shù)據(jù)的具體情況來選用合適的相關系數(shù),這里選擇教育研究中常用的積差相關系數(shù)。
積差相關系數(shù)也稱為 Pearson系數(shù),是英國著名統(tǒng)計學家K Pearson于20世紀提出的一種計算相關關系的方法,它是兩個連續(xù)變量相關關系的一種參數(shù)測度。積差相關系數(shù)的基本公式是:
試題相關關系分析研究是希望通過剖析不同試題的相關關系,判斷各個試題對整個試卷測量結(jié)果貢獻方面的作用。
行為變量是指考試測量的某一行為目標,將該考試中所有測量這一目標的試題得分相加,得到這一行為變量的取值。換言之,行為變量指某一科目根據(jù)不同的知識點或者測量的目標,把試卷中所有考察該知識點或者測量目標的分數(shù)相加,得到分數(shù)之和就是該行為變量的取值。
考試的不同行為變量的相關關系研究中,一般考慮以下三個關系:
(1) 不同行為變量之間的聯(lián)系;
(2) 不同行為變量與考試總分之間的相關關系;
(3) 不同行為變量與考試總分減去相應變量分數(shù)后的相關關系。
不同行為變量的相關關系的思想:考試的每一個行為變量測量的是同一測量目標的不同方面,它們既有聯(lián)系,又有區(qū)別,它們對測量考生的學科知識與技能、方法與能力都可以做出貢獻。
以 2009年貴州省貴陽市中考物理為例,根據(jù)試卷中考查的6個不同的知識點,把各個知識點得分相加,得到的總分就是6個不同的行為變量的取值。通過編寫試題間相關關系分析算法得到的行為變量與總分及總分減變量自身之間的相關系數(shù)表。
表1的數(shù)據(jù)是在SCILAB平臺上,通過編寫試題間相關關系分析算法得到的行為變量與總分及總分減變量自身之間的相關系數(shù)表。
基于不同行為變量的相關關系的基本思想,一般認為考試不同行為變量的相關關系不應太高,也不應太低,一般應該在0.3到0.6或0.7。如果兩個部分的相關系數(shù)相當高,如0.85或0.9,就可以懷疑這兩部分是否真的在測量不同的行為目標,可能它們實際上測量了相同的行為目標。如果是后一種情況,可能需要刪掉某一部分,或者將兩者部分歸并。
從表1中數(shù)據(jù)得出,行為變量之間的相關關系都在0.30到0.70之間,各行為變量間的相關系數(shù)較為適中,說明各行為變量間沒有明顯的重疊,不需要考慮刪除任何一個行為變量。這些數(shù)據(jù)也表明,這六個行為目標對于測量大綱規(guī)定的物理學科能力都起到較明顯的作用,但它們各自又不明顯重疊。
按照經(jīng)典測量理論,某一行為變量與總分間的相關關系應該比較高,一般應在0.7以上。這是因為總分應該是考試的測量目標的更加一般的測度,每一行為變量都應該對測量目標做出較大的貢獻,否則,就有理由懷疑這一行為變量是否真的與考試的測量目標一致。顯然,由于總分中包含了考試測量的所有行為目標的貢獻,某一行為變量與總分的相關關系實際上也受到了該行為變量自相關的影響,獲得的相關系數(shù)可能偏大。
考慮到這個因素,通常的做法就是:計算某一行為變量與總分的相關系數(shù)時,從總分中減去該行為變量的分數(shù),從表1得知,變量1、變量2、變量3和變量4與總分的相關系數(shù)均超過0.80,表明這四個變量對考試的貢獻較大。
教育考試中通常用試題與總分的相關系數(shù)作為試題的區(qū)分度。從表1得出的各行為目標的區(qū)分度分別是0.89、0.80、0.86、0.82、0.77,0.75。根據(jù)試題區(qū)分度的評價標準(Eebei R.L),這 6個試題的區(qū)分度都大于 0.40,表明試題具有良好的鑒別能力。
根據(jù)信度計算公式克朗巴赫公式,由表1中這6個行為變量計算得到的信度系數(shù)為0.90,這已經(jīng)滿足了大規(guī)模教育考試對考試信度系數(shù)的基本要求。
表1 行為變量相關系數(shù)矩陣表
考試的目的是為了對考生進行教育決策提供依據(jù),通過對試題相關關系分析可以為教育決策提供科學的信息。本實例分析表明,不同的知識點對于測量大綱規(guī)定的物理學科能力都起到較明顯的作用。而且整套試題滿足了大規(guī)模教育考試對考試信度系數(shù)的要求,另外試題間相關關系分析研究同樣適合于試題層面的研究。
[1]李實.科學計算開放源代碼軟件SCILAB研究、開發(fā)與應用[M].北京:清華大學出版社.2006.
[2]劉颋.開源軟件在教育中的應用[J].信息技術教育.2007.
[3]劉美宏.試卷質(zhì)量分析與評估技術的研究與實現(xiàn)[D].沈陽:沈陽工業(yè)大學.2009.
[4]胡寶鋼等.科學計算自由軟件:SCILAB 教程[M].北京:清華大學出版社.2003.
[5]雷新勇.考試數(shù)據(jù)的統(tǒng)計分析和解釋[M].上海:華東師范大學出版社.2007.