何琳 張良軍
摘要文章運(yùn)用SPSS軟件對(duì)高職學(xué)生學(xué)業(yè)成績(jī)進(jìn)行分析研究,探索了題型結(jié)構(gòu)、效度、信度、難度、區(qū)分度方面的問(wèn)題,分析了班級(jí)、文理科、民族、性別等成績(jī)的差異性,提出了適當(dāng)?shù)脑u(píng)價(jià)反饋和改進(jìn)教學(xué)的建議,以促進(jìn)教學(xué)質(zhì)量的提高。
關(guān)鍵詞SPSS軟件學(xué)業(yè)成績(jī)高職學(xué)生
隨著我國(guó)高等職業(yè)教育的發(fā)展,為了保證高等職業(yè)教育的質(zhì)量,有必要對(duì)高等職業(yè)院校的教學(xué)工作進(jìn)行全面評(píng)估。其中,學(xué)生學(xué)業(yè)成績(jī)的評(píng)價(jià)是教學(xué)質(zhì)量評(píng)價(jià)的一項(xiàng)主要內(nèi)容。本文結(jié)合高職學(xué)生學(xué)業(yè)成績(jī)的評(píng)估工作,應(yīng)用SPSS軟件進(jìn)行分析,得出學(xué)生學(xué)業(yè)成績(jī)總體情況,得到試題的難度、區(qū)分度、信度等,還有學(xué)業(yè)成績(jī)的差異性與相關(guān)性,使教師、高職學(xué)生得到學(xué)生學(xué)業(yè)成績(jī)的評(píng)價(jià)反饋,在某種程度上促進(jìn)教學(xué)質(zhì)量的提高。
1 研究對(duì)象與方法
隨機(jī)選取某高職院校學(xué)生100名,其中,男生73名,女生27名。試卷來(lái)源GXGZY高職學(xué)生電工應(yīng)用技術(shù)考試。數(shù)據(jù)管理與分析采用SPSS軟件。通過(guò)軟件測(cè)量得出學(xué)業(yè)成績(jī)的一般信息,進(jìn)一步對(duì)試題的效度、信度、難度、區(qū)分度等進(jìn)行分析,對(duì)不同班級(jí)、性別、民族等的考生成績(jī)進(jìn)行差異性檢驗(yàn)。
2 研究結(jié)果
2.1 考試題目的題型結(jié)構(gòu)及分值分布
試題共四大題。第一大題為判斷題,共10小題,共20分。第二大題為填空題,共6小題,共30分。第三大題是選擇題,共四小題,共12分。第四大題是計(jì)算題,共3小題,共38分。
2.2 學(xué)業(yè)成績(jī)描述統(tǒng)計(jì)
學(xué)業(yè)成績(jī)的基本描述統(tǒng)計(jì)量包括極小值、極大值、均值、標(biāo)準(zhǔn)差、偏度和峰度等。均值代表數(shù)據(jù)的集中趨勢(shì)。數(shù)據(jù)的離散程度可用標(biāo)準(zhǔn)差描述,標(biāo)準(zhǔn)差越大說(shuō)明數(shù)據(jù)間的差異越大。偏度和峰度用來(lái)描述數(shù)據(jù)分布是否對(duì)稱,偏斜程度如何,分布陡緩程度等。①
在SPSS中可以進(jìn)行以下操作:分析→描述統(tǒng)計(jì)→描述→總體考試成績(jī)→選擇到變量框中→單擊選項(xiàng)→選擇描述統(tǒng)計(jì)量→確定。統(tǒng)計(jì)結(jié)果輸出,統(tǒng)計(jì)量100,極小值19,極大值97,均值59.98,標(biāo)準(zhǔn)差18.419,偏度-0.005,峰度-0.880。同時(shí)可以輸出頻數(shù)分布圖,看看成績(jī)分布情況。操作步驟:分析→描述統(tǒng)計(jì)→頻率→成績(jī)→選擇到變量框中→單擊圖表→選擇直方圖,帶正態(tài)曲線→繼續(xù)→確定。從偏度、峰度以及頻數(shù)分布圖可得,總體成績(jī)基本符合正態(tài)分布,說(shuō)明這份試卷達(dá)到了檢測(cè)學(xué)生學(xué)習(xí)水平的目的。
2.3 考題的難度
難度是指全體被測(cè)對(duì)象對(duì)該題目的失分率。計(jì)算公式:難度系數(shù)P=1-(考生在該題目所得分?jǐn)?shù)的平均值/該題目滿分值)。樣本總體平均值59.98,各大題難度系數(shù)分別為:0.24、0.42、0.37、0.48;標(biāo)準(zhǔn)差分別為:2.953、7.319、2.677、10.854。一般認(rèn)為難度范圍應(yīng)在0.3-0.8之間比較恰當(dāng),僅有第一題難度小于0.3,為判斷題,題目都比較簡(jiǎn)單,只要學(xué)生掌握基本知識(shí),仔細(xì)判斷就可以得高分。計(jì)算題最難,排在最后合適。選擇題難度排第二,應(yīng)該排第二,讓試卷題目的難度成遞增趨勢(shì)較好。從試卷總體來(lái)看,總分難度系數(shù)為0.4,難度略偏容易。
2.4 考題的區(qū)分度
區(qū)分度是指考題對(duì)考生實(shí)際水平的鑒別能力,是把考生區(qū)別開(kāi)來(lái)的統(tǒng)計(jì)量。在SPSS中可以進(jìn)行以下操作:分析→相關(guān)→雙變量→把學(xué)生某題成績(jī)與總分選擇入變量框中→選擇相關(guān)系數(shù)→Pearson→確定。得到各大題的區(qū)分度分別為:0.468、0.811、0.543、0.889。一般來(lái)說(shuō),難度大的題目,區(qū)分度較高;難度低的題目,很多學(xué)生做對(duì),區(qū)分度必然低。從以上可以看出。
每大題與總分的相關(guān)系數(shù)較高,在0.01的顯著性水平上相關(guān)。從上述數(shù)據(jù)分析可見(jiàn),試題的區(qū)分度比較理想,且主觀題的區(qū)分度優(yōu)于客觀題,這與主觀題靈活的評(píng)分方式有關(guān)。
3 研究討論與發(fā)現(xiàn)
3.1 考試的效度
效度是指考試的有效程度。把學(xué)生的平時(shí)成績(jī)作為效度分析的效標(biāo),利用積差相關(guān)法求效標(biāo)效度(Pearson法)。在SPSS中可以進(jìn)行以下操作:分析→相關(guān)→雙變量→把學(xué)生平時(shí)成績(jī)與考試總分選擇入變量框中→選擇相關(guān)系數(shù)→Pearson→確定。得到本次考試總分與平時(shí)成績(jī)的相關(guān)系數(shù)為0.966。說(shuō)明平時(shí)成績(jī)好的學(xué)生這次考試也好,平時(shí)成績(jī)差的學(xué)生這次考試成績(jī)也差,因此本次考試反映了學(xué)生的真實(shí)能力,符合要求。這與考題的區(qū)分度較高的測(cè)量結(jié)果一致,表明試題的質(zhì)量較好。
3.2 考試的信度
信度是衡量一次考試的可靠性、穩(wěn)定性的統(tǒng)計(jì)指標(biāo)。在SPSS中可以進(jìn)行以下操作:分析→度量→可靠性分析→把分析量選入框中→統(tǒng)計(jì)量→選擇→同類相關(guān)系數(shù)→確定。結(jié)果本次考試的信度為:0.765。一般來(lái)說(shuō),學(xué)校教師自編試卷的信度要求0.6以上,則本次考試卷子符合要求。這與考題的區(qū)分度較高的測(cè)量結(jié)果一致,表明試題的質(zhì)量較高。但是信度沒(méi)有達(dá)到0.8,影響信度的因素可能和評(píng)分、題量等有關(guān)。
從試卷的題型和分值比例可見(jiàn),客觀題分值不到主觀題的一半,可能影響試卷的信度。從以上統(tǒng)計(jì)結(jié)果表明,主觀題的區(qū)分度比客觀題的高,證明高職電工應(yīng)用技術(shù)考試中主觀題的命題效果較好。另外,這次題目量較少,不少考生提前交卷,這也是影響信度的原因。再有,題目的知識(shí)覆蓋面不夠?qū)?,這也是影響信度的原因。
3.3 班級(jí)差異性
在不很了解兩個(gè)樣本總體分布的情況下,一般用兩個(gè)獨(dú)立樣本非參數(shù)檢驗(yàn),樣本數(shù)大于30為大樣本,用Kolmogorov-Smirnov 檢驗(yàn)。用SPSS進(jìn)行1班、2班學(xué)業(yè)成績(jī)間均值的差異性檢驗(yàn)?;静襟E:分析→非參數(shù)檢驗(yàn)→兩獨(dú)立樣本→總分→選擇到檢驗(yàn)變量列表中→班級(jí)→選擇到分組變量框中→定義組→輸入1與2→繼續(xù)→選擇檢驗(yàn)類型→確定。分析結(jié)果,1班46人,2班54人;K-S Z值為2.022,相伴概率為0.001<%Z=0.05,可以認(rèn)為應(yīng)該拒絕零假設(shè)H0,認(rèn)為1班與2班學(xué)生的學(xué)業(yè)成績(jī)均值存在顯著差異。另外,在描述統(tǒng)計(jì)表明,1班的均值明顯比2班高,差異顯著,有高度的統(tǒng)計(jì)價(jià)值。
3.4 文理科學(xué)生成績(jī)差異性
用以上方法可得到,高考文科考生與理科考生的差異性。分析結(jié)果:理科63人,文科37人;K-S Z值為1.914,相伴概率為0.001<%Z=0.05,認(rèn)為高考理科與文科學(xué)生的學(xué)業(yè)成績(jī)均值存在顯著差異。另外,在描述統(tǒng)計(jì)表明,理科的均值明顯比文科的高,差異顯著,有較高的統(tǒng)計(jì)價(jià)值。
3.5 漢族與少數(shù)民族學(xué)生成績(jī)差異性
用Kolmogorov-Smirnov 檢驗(yàn),基本步驟同上。分析結(jié)果:漢族60人,少數(shù)民族40人;最大絕對(duì)值差為0.100,最大正差為0.100,最大負(fù)差為-0.092,得到的K-S Z值為0.490,相伴概率為0.970>%Z=0.05,則不能拒絕零假設(shè)H0,認(rèn)為漢族與少數(shù)民族學(xué)生的學(xué)業(yè)成績(jī)均值無(wú)顯著差異。
3.6 男女差異性檢驗(yàn)
樣本數(shù)小于30為小樣本,用Mann-Whitney 檢驗(yàn)。②分析結(jié)果:男生73人,女生27人;Z值為-0.074,相伴概率為0.941>%Z=0.05,則不能拒絕零假設(shè)H0,認(rèn)為男女學(xué)生的學(xué)業(yè)成績(jī)總體分布無(wú)顯著差異。
4 結(jié)束語(yǔ)
4.1 試題方面
試卷的區(qū)分度、效度、信度較高,成績(jī)頻數(shù)基本趨于正態(tài)分布。題型多樣,客觀題與主觀題比例基本合理;題量還可以加大一些,特別是加大主觀題的量;知識(shí)覆蓋面還可以加寬一些;今后按照題目的難度逐漸遞增排列,以增加試卷的科學(xué)性;大多數(shù)學(xué)生兩個(gè)小時(shí)完成為合適,重點(diǎn)考核學(xué)生基礎(chǔ)知識(shí)、分析問(wèn)題和解決問(wèn)題的能力。
4.2 差異性檢驗(yàn)
由班級(jí)差異性檢驗(yàn),推論1班、2班成績(jī)存在顯著性差異。產(chǎn)生原因可能與學(xué)習(xí)風(fēng)氣、試題難易等有關(guān),還有待進(jìn)一步研究。由高考文理科學(xué)生成績(jī)差異性檢驗(yàn),推論文科生與理科生成績(jī)存在顯著性差異,產(chǎn)生原因可能與學(xué)生的數(shù)理基礎(chǔ)有關(guān)。由不同民族學(xué)生成績(jī)差異性檢驗(yàn)無(wú)差異性,說(shuō)明考試成績(jī)與民族無(wú)關(guān)。由男女學(xué)生差異性檢驗(yàn)無(wú)差異性,說(shuō)明學(xué)生考試成績(jī)與性別無(wú)關(guān)。
4.3 相關(guān)性分析
通過(guò)效度分析發(fā)現(xiàn),學(xué)生學(xué)業(yè)成績(jī)與平時(shí)成績(jī)正相關(guān)。說(shuō)明平時(shí)成績(jī)的好壞直接影響學(xué)生的學(xué)業(yè)成績(jī)。可能學(xué)生的學(xué)業(yè)成績(jī)還與其它因素有關(guān),如學(xué)習(xí)策略、生源地、家庭情況等,還有待進(jìn)一步研究。
學(xué)生的學(xué)業(yè)成績(jī)?cè)u(píng)價(jià)與平時(shí)成績(jī)、實(shí)驗(yàn)操作成績(jī),以及期末考試成績(jī)相關(guān)聯(lián)。而平時(shí)成績(jī)與考勤、作業(yè)、實(shí)驗(yàn)報(bào)告相關(guān)。教師向?qū)W生提供學(xué)業(yè)成績(jī)的評(píng)價(jià)反饋,能促進(jìn)高職學(xué)生主動(dòng)去學(xué)習(xí)。
今后的教學(xué)重點(diǎn)改進(jìn)教學(xué)方法,注重提高學(xué)生能力。根據(jù)高職生的特點(diǎn),教學(xué)團(tuán)隊(duì)制訂課程標(biāo)準(zhǔn)和課程改革設(shè)計(jì)方案;任課教師要制定每次課的教學(xué)目標(biāo),含能力目標(biāo)、知識(shí)目標(biāo)和素質(zhì)目標(biāo);逐步采用教學(xué)做一體化教學(xué),讓學(xué)生在做中學(xué),學(xué)中做。采用項(xiàng)目式教學(xué),利用了視屏、PPT、投影等多媒體,同時(shí)使用講授、啟發(fā)和小組討論合作實(shí)驗(yàn)等教學(xué)方法;在教學(xué)活動(dòng)中,確立學(xué)生的主體地位,教師作為引導(dǎo),注重“教”與“學(xué)”的互動(dòng),使學(xué)生在項(xiàng)目活動(dòng)中掌握相關(guān)的知識(shí)和技能,提高教學(xué)質(zhì)量,培養(yǎng)高端技能型專門人才。