田許匣
摘 要: 科學(xué)正確的試卷分析能夠?yàn)榻虒W(xué)及學(xué)習(xí)提供有意義的反饋,并能在很大程度上提高教學(xué)質(zhì)量。本文綜合介紹了外語(yǔ)試卷信度、效度、難度、區(qū)分度四個(gè)維度的分析過(guò)程及學(xué)生考試成績(jī)的分析方法,以期對(duì)英語(yǔ)教師的教學(xué)及測(cè)試工作起到指導(dǎo)作用。
關(guān)鍵詞: 外語(yǔ)試卷 四維度分析過(guò)程 成績(jī)分析方法
引言
語(yǔ)言教學(xué)是第一性的,測(cè)試為教學(xué)服務(wù),在我國(guó),語(yǔ)言教學(xué)已引起足夠的重視,但對(duì)于語(yǔ)言測(cè)試分析,一些教師并沒(méi)有給予足夠的重視,試卷分析僅停留在表層、單一層面,不深刻不科學(xué)。本文主要從語(yǔ)言測(cè)試?yán)碚摰陌l(fā)展,外語(yǔ)測(cè)試四維度分析過(guò)程及方法,以及學(xué)生成績(jī)分析方法等方面,具體闡述了外語(yǔ)測(cè)試全方位分析方法。
1.語(yǔ)言測(cè)試?yán)碚摪l(fā)展
著名語(yǔ)言學(xué)家戴維斯(1968)曾說(shuō)“好的測(cè)試就如同一個(gè)忠實(shí)的仆人”,這個(gè)比喻形象地說(shuō)明了測(cè)試是為教學(xué)服務(wù)的,所以不同歷史時(shí)期,會(huì)產(chǎn)生不同的語(yǔ)言觀語(yǔ)言理論,相應(yīng)的也會(huì)產(chǎn)生不同的語(yǔ)言測(cè)試。世界語(yǔ)言測(cè)試經(jīng)歷了四個(gè)階段(薛榮,2008):(1)前科學(xué)語(yǔ)言測(cè)試,教學(xué)法是語(yǔ)法翻譯法,語(yǔ)言是包括語(yǔ)法知識(shí)、詞法知識(shí)、語(yǔ)音知識(shí)的知識(shí)體系。結(jié)果主要由教師主觀判斷,主觀性極強(qiáng),信度不高。題型:短文寫作、翻譯、語(yǔ)法分析。(2)心理測(cè)量-結(jié)構(gòu)主義語(yǔ)言測(cè)試,語(yǔ)言是一套形式結(jié)構(gòu),可分成不同元素,語(yǔ)言學(xué)習(xí)就是刺激反應(yīng)式,養(yǎng)成習(xí)慣,其教學(xué)法是聽說(shuō)法,主要采用分離式測(cè)試,每題只考一個(gè)語(yǔ)言點(diǎn),主要題型有詞匯填空、改錯(cuò)、判斷。重標(biāo)準(zhǔn)化、客觀性和結(jié)果,有一定信度,考查結(jié)構(gòu)。(3)心理語(yǔ)言學(xué)-社會(huì)語(yǔ)言學(xué)語(yǔ)言測(cè)試,Chomsky區(qū)分語(yǔ)言能力和語(yǔ)言行為,Hymes提出交際能力的概念,認(rèn)為使用語(yǔ)言不但要按照語(yǔ)法規(guī)則產(chǎn)出形式合格的句子,而且要具有在不同的語(yǔ)境中合理使用這些句子的能力,即語(yǔ)言使用涉及社會(huì)文化因素。Canale和Swain提出“四能力”說(shuō):語(yǔ)言能力、社會(huì)語(yǔ)言能力、交際策略能力、語(yǔ)篇能力。這一階段測(cè)試主要是綜合式測(cè)試,主要題型是完形和聽寫,要求被試綜合掌握各種知識(shí)。(4)交際語(yǔ)言測(cè)試時(shí)期,對(duì)應(yīng)現(xiàn)階段英語(yǔ)教學(xué)方法——任務(wù)教學(xué)法,強(qiáng)調(diào)聽說(shuō),加強(qiáng)口語(yǔ)測(cè)試,主要測(cè)試被試交際能力、解決問(wèn)題能力。
2.外語(yǔ)測(cè)試四維度分析
隨著語(yǔ)言測(cè)試?yán)碚摰陌l(fā)展,評(píng)判語(yǔ)言測(cè)試的標(biāo)準(zhǔn)在不斷完善。對(duì)于語(yǔ)言測(cè)試的分析,主要看測(cè)試本身和結(jié)果,通常從信度、效度、難度和區(qū)分度分析。
(1)信度
信度是指測(cè)試結(jié)果的穩(wěn)定性或一致性,包括測(cè)試信度和評(píng)分人信度。信度通常用一對(duì)相關(guān)系數(shù)表示,相關(guān)系數(shù)越大,信度越高,通常對(duì)標(biāo)準(zhǔn)化測(cè)試的信度系數(shù)要求為0.9,課堂測(cè)試一般在0.7-0.8,當(dāng)系數(shù)為1.00時(shí),信度最高,0.00時(shí)信度最低,但這兩個(gè)極端一般都不會(huì)達(dá)到,只在中間,我們通常用的計(jì)算公式是庫(kù)德-查理遜21公式:
KR 21= r =k /(k=1)X {1 -[μ(k - μ)/k(s ■)]}
Coefficient alpha=α=k/(k-1)X[1-(∑si■/s■)]
K=題目數(shù) p=某一題作對(duì)人的比例 q=1-p s■=整體試卷方差
μ=測(cè)試平均分 si■=每一題得分方差
影響信度的因素:
A.與測(cè)試本身相關(guān)的因素:
題目數(shù),測(cè)試內(nèi)容,題目特點(diǎn),分?jǐn)?shù)多樣性。
B.與被試相關(guān)的因素:
異質(zhì)性,考生應(yīng)試能力,考生動(dòng)機(jī)。
C.與施考相關(guān)的因素:
時(shí)間限制,作弊機(jī)會(huì)。
(2)效度
效度是指測(cè)試測(cè)量了它聲稱測(cè)量東西的適應(yīng)性,也就是說(shuō),是否考查了該考的東西,包括內(nèi)容效度,準(zhǔn)則相關(guān)性效度,結(jié)構(gòu)效度,高考英語(yǔ)所測(cè)試的內(nèi)容是否覆蓋考試大綱或規(guī)定的所有內(nèi)容?效度越高,就越能準(zhǔn)確測(cè)量要測(cè)的內(nèi)容。計(jì)算公式仍體現(xiàn)為相關(guān)系數(shù),受信度影響rxy≤√rx√ry,rx為x的測(cè)試信度,ry為y的測(cè)試信度。
效度與信度關(guān)系為充分不必要條件,有高效度一定有高信度,但有高信度不一定有高效度。
(3)難度
難度是衡量試卷質(zhì)量的一個(gè)重要指標(biāo),難度用D表示,D越大,題越簡(jiǎn)單,公式為:D=答對(duì)該題人數(shù)/總?cè)藬?shù),試題難度指數(shù)一般在0.3-0.7最合適。
(4)區(qū)分度
區(qū)分度指不同的題把不同水平的考生真正地區(qū)分開來(lái),區(qū)分度越高,不同水平的考生區(qū)別越大,試卷價(jià)值就越高,用區(qū)分度指數(shù)表示DI,區(qū)分度指數(shù)最高位1,最低位-1,DI>0.40區(qū)分度最好,在0.30-0.39之間此題較好,在0.20-0.29之間,試題需要修改DI<0.19,區(qū)分度不好,不能采用該試題,計(jì)算公式為點(diǎn)雙列相關(guān):
r(point biserial)=[(μ+-μx)/δx]√p/q
μ+=答對(duì)題目的平均分,μx=整組平均分,σx=整組標(biāo)準(zhǔn)差,p=題目難度q=1-p,題目難度過(guò)高或過(guò)低都不能很好地區(qū)分學(xué)生水平,難度適中區(qū)分度最好。
3.學(xué)生成績(jī)分析
英語(yǔ)教師只有對(duì)學(xué)生成績(jī)進(jìn)行正確科學(xué)的分析,才能對(duì)學(xué)生水平作出更好的評(píng)價(jià),才能為日后教學(xué)提供依據(jù),從而進(jìn)一步提升教學(xué)水平。學(xué)生成績(jī)分析包括成績(jī)描述和參數(shù)檢驗(yàn)。
(1)成績(jī)描述
成績(jī)描述主要涉及的項(xiàng)目有:集中趨勢(shì)(眾數(shù),中數(shù),平均數(shù)),離散趨勢(shì)(全距,方差,標(biāo)準(zhǔn)差),數(shù)據(jù)分布狀態(tài)。
集中趨勢(shì)是反映數(shù)據(jù)分布中數(shù)據(jù)趨向中心位置的統(tǒng)計(jì)量。眾數(shù)指出現(xiàn)頻率最多的數(shù)。中數(shù)指處于中間位置的數(shù)。離散趨勢(shì)與集中趨勢(shì)相反,指數(shù)據(jù)的離散變異情況。全距指一組數(shù)據(jù)中最大數(shù)與最小數(shù)之差。標(biāo)準(zhǔn)差、方差對(duì)數(shù)據(jù)離散程度描述更客觀科學(xué)。
數(shù)據(jù)分布狀態(tài):在語(yǔ)言測(cè)試中,學(xué)生外語(yǔ)成績(jī)是否呈正態(tài)分布,需要一個(gè)檢驗(yàn)過(guò)程,正態(tài)分布呈鐘形,兩邊對(duì)稱在正態(tài)分布中眾數(shù)、中數(shù)、平均數(shù)重合于一點(diǎn),其圖形為:
(2)參數(shù)檢驗(yàn)
在我國(guó)英語(yǔ)教學(xué)中,一位英語(yǔ)老師經(jīng)常會(huì)帶幾個(gè)平行班,這幾個(gè)班學(xué)生學(xué)習(xí)成績(jī)到底怎么樣,只靠成績(jī)描述數(shù)據(jù)是不夠的,還需要考慮多方面因素,這就需要參數(shù)檢查,主要有獨(dú)立樣本z檢查、t檢查和方差分析。
Z檢查主要用于樣本容量大于30的正態(tài)分布,可以比較樣本平均分和總體平均分,或比較樣本平均分。T檢查的樣本容量通常小于30的正態(tài)分布中,這兩種檢驗(yàn)可以用來(lái)檢驗(yàn)兩個(gè)班級(jí)成績(jī)是否具有統(tǒng)計(jì)意義上的明顯區(qū)別,方差分析可以用于三個(gè)或三個(gè)以上班級(jí)比較,也可以用于多因素分析中,SPSS計(jì)算軟件可以幫助我們?cè)谳^短的時(shí)間內(nèi)完成大量的計(jì)算任務(wù)。
結(jié)語(yǔ)
作為出色的英語(yǔ)教師,備課上課不是我們唯一的任務(wù),還應(yīng)該特別注意學(xué)生的考試成績(jī)及試卷分析,在這方面,教師往往會(huì)忽視或輕視,認(rèn)為試卷分析就是純粹地看看學(xué)生成績(jī)高低,強(qiáng)調(diào)學(xué)生易犯錯(cuò)誤的地方就行,即使作了分析,也是分析指標(biāo)單一,分析過(guò)程粗糙,這樣就不能深入了解學(xué)生學(xué)情。希望通過(guò)本文能夠引起教師及測(cè)試員對(duì)試卷分析的重視,注意試卷的科學(xué)性、理?yè)?jù)性,提高成績(jī)測(cè)試質(zhì)量,更好地體現(xiàn)公平公正原則,從而更好地促進(jìn)外語(yǔ)教學(xué)及習(xí)得。
參考文獻(xiàn):
[1]劉潤(rùn)清,韓寶成.語(yǔ)言測(cè)試和它的方法.北京:外語(yǔ)教學(xué)與研究出版社,2004.
[2]李筱菊.語(yǔ)言測(cè)試科學(xué)與藝術(shù).長(zhǎng)沙:湖南教育出版社,1997.
[3]薛榮.當(dāng)代語(yǔ)言測(cè)試:理論發(fā)展與未來(lái)趨勢(shì),外語(yǔ)與外語(yǔ)教學(xué),2008(10):44-47.endprint
摘 要: 科學(xué)正確的試卷分析能夠?yàn)榻虒W(xué)及學(xué)習(xí)提供有意義的反饋,并能在很大程度上提高教學(xué)質(zhì)量。本文綜合介紹了外語(yǔ)試卷信度、效度、難度、區(qū)分度四個(gè)維度的分析過(guò)程及學(xué)生考試成績(jī)的分析方法,以期對(duì)英語(yǔ)教師的教學(xué)及測(cè)試工作起到指導(dǎo)作用。
關(guān)鍵詞: 外語(yǔ)試卷 四維度分析過(guò)程 成績(jī)分析方法
引言
語(yǔ)言教學(xué)是第一性的,測(cè)試為教學(xué)服務(wù),在我國(guó),語(yǔ)言教學(xué)已引起足夠的重視,但對(duì)于語(yǔ)言測(cè)試分析,一些教師并沒(méi)有給予足夠的重視,試卷分析僅停留在表層、單一層面,不深刻不科學(xué)。本文主要從語(yǔ)言測(cè)試?yán)碚摰陌l(fā)展,外語(yǔ)測(cè)試四維度分析過(guò)程及方法,以及學(xué)生成績(jī)分析方法等方面,具體闡述了外語(yǔ)測(cè)試全方位分析方法。
1.語(yǔ)言測(cè)試?yán)碚摪l(fā)展
著名語(yǔ)言學(xué)家戴維斯(1968)曾說(shuō)“好的測(cè)試就如同一個(gè)忠實(shí)的仆人”,這個(gè)比喻形象地說(shuō)明了測(cè)試是為教學(xué)服務(wù)的,所以不同歷史時(shí)期,會(huì)產(chǎn)生不同的語(yǔ)言觀語(yǔ)言理論,相應(yīng)的也會(huì)產(chǎn)生不同的語(yǔ)言測(cè)試。世界語(yǔ)言測(cè)試經(jīng)歷了四個(gè)階段(薛榮,2008):(1)前科學(xué)語(yǔ)言測(cè)試,教學(xué)法是語(yǔ)法翻譯法,語(yǔ)言是包括語(yǔ)法知識(shí)、詞法知識(shí)、語(yǔ)音知識(shí)的知識(shí)體系。結(jié)果主要由教師主觀判斷,主觀性極強(qiáng),信度不高。題型:短文寫作、翻譯、語(yǔ)法分析。(2)心理測(cè)量-結(jié)構(gòu)主義語(yǔ)言測(cè)試,語(yǔ)言是一套形式結(jié)構(gòu),可分成不同元素,語(yǔ)言學(xué)習(xí)就是刺激反應(yīng)式,養(yǎng)成習(xí)慣,其教學(xué)法是聽說(shuō)法,主要采用分離式測(cè)試,每題只考一個(gè)語(yǔ)言點(diǎn),主要題型有詞匯填空、改錯(cuò)、判斷。重標(biāo)準(zhǔn)化、客觀性和結(jié)果,有一定信度,考查結(jié)構(gòu)。(3)心理語(yǔ)言學(xué)-社會(huì)語(yǔ)言學(xué)語(yǔ)言測(cè)試,Chomsky區(qū)分語(yǔ)言能力和語(yǔ)言行為,Hymes提出交際能力的概念,認(rèn)為使用語(yǔ)言不但要按照語(yǔ)法規(guī)則產(chǎn)出形式合格的句子,而且要具有在不同的語(yǔ)境中合理使用這些句子的能力,即語(yǔ)言使用涉及社會(huì)文化因素。Canale和Swain提出“四能力”說(shuō):語(yǔ)言能力、社會(huì)語(yǔ)言能力、交際策略能力、語(yǔ)篇能力。這一階段測(cè)試主要是綜合式測(cè)試,主要題型是完形和聽寫,要求被試綜合掌握各種知識(shí)。(4)交際語(yǔ)言測(cè)試時(shí)期,對(duì)應(yīng)現(xiàn)階段英語(yǔ)教學(xué)方法——任務(wù)教學(xué)法,強(qiáng)調(diào)聽說(shuō),加強(qiáng)口語(yǔ)測(cè)試,主要測(cè)試被試交際能力、解決問(wèn)題能力。
2.外語(yǔ)測(cè)試四維度分析
隨著語(yǔ)言測(cè)試?yán)碚摰陌l(fā)展,評(píng)判語(yǔ)言測(cè)試的標(biāo)準(zhǔn)在不斷完善。對(duì)于語(yǔ)言測(cè)試的分析,主要看測(cè)試本身和結(jié)果,通常從信度、效度、難度和區(qū)分度分析。
(1)信度
信度是指測(cè)試結(jié)果的穩(wěn)定性或一致性,包括測(cè)試信度和評(píng)分人信度。信度通常用一對(duì)相關(guān)系數(shù)表示,相關(guān)系數(shù)越大,信度越高,通常對(duì)標(biāo)準(zhǔn)化測(cè)試的信度系數(shù)要求為0.9,課堂測(cè)試一般在0.7-0.8,當(dāng)系數(shù)為1.00時(shí),信度最高,0.00時(shí)信度最低,但這兩個(gè)極端一般都不會(huì)達(dá)到,只在中間,我們通常用的計(jì)算公式是庫(kù)德-查理遜21公式:
KR 21= r =k /(k=1)X {1 -[μ(k - μ)/k(s ■)]}
Coefficient alpha=α=k/(k-1)X[1-(∑si■/s■)]
K=題目數(shù) p=某一題作對(duì)人的比例 q=1-p s■=整體試卷方差
μ=測(cè)試平均分 si■=每一題得分方差
影響信度的因素:
A.與測(cè)試本身相關(guān)的因素:
題目數(shù),測(cè)試內(nèi)容,題目特點(diǎn),分?jǐn)?shù)多樣性。
B.與被試相關(guān)的因素:
異質(zhì)性,考生應(yīng)試能力,考生動(dòng)機(jī)。
C.與施考相關(guān)的因素:
時(shí)間限制,作弊機(jī)會(huì)。
(2)效度
效度是指測(cè)試測(cè)量了它聲稱測(cè)量東西的適應(yīng)性,也就是說(shuō),是否考查了該考的東西,包括內(nèi)容效度,準(zhǔn)則相關(guān)性效度,結(jié)構(gòu)效度,高考英語(yǔ)所測(cè)試的內(nèi)容是否覆蓋考試大綱或規(guī)定的所有內(nèi)容?效度越高,就越能準(zhǔn)確測(cè)量要測(cè)的內(nèi)容。計(jì)算公式仍體現(xiàn)為相關(guān)系數(shù),受信度影響rxy≤√rx√ry,rx為x的測(cè)試信度,ry為y的測(cè)試信度。
效度與信度關(guān)系為充分不必要條件,有高效度一定有高信度,但有高信度不一定有高效度。
(3)難度
難度是衡量試卷質(zhì)量的一個(gè)重要指標(biāo),難度用D表示,D越大,題越簡(jiǎn)單,公式為:D=答對(duì)該題人數(shù)/總?cè)藬?shù),試題難度指數(shù)一般在0.3-0.7最合適。
(4)區(qū)分度
區(qū)分度指不同的題把不同水平的考生真正地區(qū)分開來(lái),區(qū)分度越高,不同水平的考生區(qū)別越大,試卷價(jià)值就越高,用區(qū)分度指數(shù)表示DI,區(qū)分度指數(shù)最高位1,最低位-1,DI>0.40區(qū)分度最好,在0.30-0.39之間此題較好,在0.20-0.29之間,試題需要修改DI<0.19,區(qū)分度不好,不能采用該試題,計(jì)算公式為點(diǎn)雙列相關(guān):
r(point biserial)=[(μ+-μx)/δx]√p/q
μ+=答對(duì)題目的平均分,μx=整組平均分,σx=整組標(biāo)準(zhǔn)差,p=題目難度q=1-p,題目難度過(guò)高或過(guò)低都不能很好地區(qū)分學(xué)生水平,難度適中區(qū)分度最好。
3.學(xué)生成績(jī)分析
英語(yǔ)教師只有對(duì)學(xué)生成績(jī)進(jìn)行正確科學(xué)的分析,才能對(duì)學(xué)生水平作出更好的評(píng)價(jià),才能為日后教學(xué)提供依據(jù),從而進(jìn)一步提升教學(xué)水平。學(xué)生成績(jī)分析包括成績(jī)描述和參數(shù)檢驗(yàn)。
(1)成績(jī)描述
成績(jī)描述主要涉及的項(xiàng)目有:集中趨勢(shì)(眾數(shù),中數(shù),平均數(shù)),離散趨勢(shì)(全距,方差,標(biāo)準(zhǔn)差),數(shù)據(jù)分布狀態(tài)。
集中趨勢(shì)是反映數(shù)據(jù)分布中數(shù)據(jù)趨向中心位置的統(tǒng)計(jì)量。眾數(shù)指出現(xiàn)頻率最多的數(shù)。中數(shù)指處于中間位置的數(shù)。離散趨勢(shì)與集中趨勢(shì)相反,指數(shù)據(jù)的離散變異情況。全距指一組數(shù)據(jù)中最大數(shù)與最小數(shù)之差。標(biāo)準(zhǔn)差、方差對(duì)數(shù)據(jù)離散程度描述更客觀科學(xué)。
數(shù)據(jù)分布狀態(tài):在語(yǔ)言測(cè)試中,學(xué)生外語(yǔ)成績(jī)是否呈正態(tài)分布,需要一個(gè)檢驗(yàn)過(guò)程,正態(tài)分布呈鐘形,兩邊對(duì)稱在正態(tài)分布中眾數(shù)、中數(shù)、平均數(shù)重合于一點(diǎn),其圖形為:
(2)參數(shù)檢驗(yàn)
在我國(guó)英語(yǔ)教學(xué)中,一位英語(yǔ)老師經(jīng)常會(huì)帶幾個(gè)平行班,這幾個(gè)班學(xué)生學(xué)習(xí)成績(jī)到底怎么樣,只靠成績(jī)描述數(shù)據(jù)是不夠的,還需要考慮多方面因素,這就需要參數(shù)檢查,主要有獨(dú)立樣本z檢查、t檢查和方差分析。
Z檢查主要用于樣本容量大于30的正態(tài)分布,可以比較樣本平均分和總體平均分,或比較樣本平均分。T檢查的樣本容量通常小于30的正態(tài)分布中,這兩種檢驗(yàn)可以用來(lái)檢驗(yàn)兩個(gè)班級(jí)成績(jī)是否具有統(tǒng)計(jì)意義上的明顯區(qū)別,方差分析可以用于三個(gè)或三個(gè)以上班級(jí)比較,也可以用于多因素分析中,SPSS計(jì)算軟件可以幫助我們?cè)谳^短的時(shí)間內(nèi)完成大量的計(jì)算任務(wù)。
結(jié)語(yǔ)
作為出色的英語(yǔ)教師,備課上課不是我們唯一的任務(wù),還應(yīng)該特別注意學(xué)生的考試成績(jī)及試卷分析,在這方面,教師往往會(huì)忽視或輕視,認(rèn)為試卷分析就是純粹地看看學(xué)生成績(jī)高低,強(qiáng)調(diào)學(xué)生易犯錯(cuò)誤的地方就行,即使作了分析,也是分析指標(biāo)單一,分析過(guò)程粗糙,這樣就不能深入了解學(xué)生學(xué)情。希望通過(guò)本文能夠引起教師及測(cè)試員對(duì)試卷分析的重視,注意試卷的科學(xué)性、理?yè)?jù)性,提高成績(jī)測(cè)試質(zhì)量,更好地體現(xiàn)公平公正原則,從而更好地促進(jìn)外語(yǔ)教學(xué)及習(xí)得。
參考文獻(xiàn):
[1]劉潤(rùn)清,韓寶成.語(yǔ)言測(cè)試和它的方法.北京:外語(yǔ)教學(xué)與研究出版社,2004.
[2]李筱菊.語(yǔ)言測(cè)試科學(xué)與藝術(shù).長(zhǎng)沙:湖南教育出版社,1997.
[3]薛榮.當(dāng)代語(yǔ)言測(cè)試:理論發(fā)展與未來(lái)趨勢(shì),外語(yǔ)與外語(yǔ)教學(xué),2008(10):44-47.endprint
摘 要: 科學(xué)正確的試卷分析能夠?yàn)榻虒W(xué)及學(xué)習(xí)提供有意義的反饋,并能在很大程度上提高教學(xué)質(zhì)量。本文綜合介紹了外語(yǔ)試卷信度、效度、難度、區(qū)分度四個(gè)維度的分析過(guò)程及學(xué)生考試成績(jī)的分析方法,以期對(duì)英語(yǔ)教師的教學(xué)及測(cè)試工作起到指導(dǎo)作用。
關(guān)鍵詞: 外語(yǔ)試卷 四維度分析過(guò)程 成績(jī)分析方法
引言
語(yǔ)言教學(xué)是第一性的,測(cè)試為教學(xué)服務(wù),在我國(guó),語(yǔ)言教學(xué)已引起足夠的重視,但對(duì)于語(yǔ)言測(cè)試分析,一些教師并沒(méi)有給予足夠的重視,試卷分析僅停留在表層、單一層面,不深刻不科學(xué)。本文主要從語(yǔ)言測(cè)試?yán)碚摰陌l(fā)展,外語(yǔ)測(cè)試四維度分析過(guò)程及方法,以及學(xué)生成績(jī)分析方法等方面,具體闡述了外語(yǔ)測(cè)試全方位分析方法。
1.語(yǔ)言測(cè)試?yán)碚摪l(fā)展
著名語(yǔ)言學(xué)家戴維斯(1968)曾說(shuō)“好的測(cè)試就如同一個(gè)忠實(shí)的仆人”,這個(gè)比喻形象地說(shuō)明了測(cè)試是為教學(xué)服務(wù)的,所以不同歷史時(shí)期,會(huì)產(chǎn)生不同的語(yǔ)言觀語(yǔ)言理論,相應(yīng)的也會(huì)產(chǎn)生不同的語(yǔ)言測(cè)試。世界語(yǔ)言測(cè)試經(jīng)歷了四個(gè)階段(薛榮,2008):(1)前科學(xué)語(yǔ)言測(cè)試,教學(xué)法是語(yǔ)法翻譯法,語(yǔ)言是包括語(yǔ)法知識(shí)、詞法知識(shí)、語(yǔ)音知識(shí)的知識(shí)體系。結(jié)果主要由教師主觀判斷,主觀性極強(qiáng),信度不高。題型:短文寫作、翻譯、語(yǔ)法分析。(2)心理測(cè)量-結(jié)構(gòu)主義語(yǔ)言測(cè)試,語(yǔ)言是一套形式結(jié)構(gòu),可分成不同元素,語(yǔ)言學(xué)習(xí)就是刺激反應(yīng)式,養(yǎng)成習(xí)慣,其教學(xué)法是聽說(shuō)法,主要采用分離式測(cè)試,每題只考一個(gè)語(yǔ)言點(diǎn),主要題型有詞匯填空、改錯(cuò)、判斷。重標(biāo)準(zhǔn)化、客觀性和結(jié)果,有一定信度,考查結(jié)構(gòu)。(3)心理語(yǔ)言學(xué)-社會(huì)語(yǔ)言學(xué)語(yǔ)言測(cè)試,Chomsky區(qū)分語(yǔ)言能力和語(yǔ)言行為,Hymes提出交際能力的概念,認(rèn)為使用語(yǔ)言不但要按照語(yǔ)法規(guī)則產(chǎn)出形式合格的句子,而且要具有在不同的語(yǔ)境中合理使用這些句子的能力,即語(yǔ)言使用涉及社會(huì)文化因素。Canale和Swain提出“四能力”說(shuō):語(yǔ)言能力、社會(huì)語(yǔ)言能力、交際策略能力、語(yǔ)篇能力。這一階段測(cè)試主要是綜合式測(cè)試,主要題型是完形和聽寫,要求被試綜合掌握各種知識(shí)。(4)交際語(yǔ)言測(cè)試時(shí)期,對(duì)應(yīng)現(xiàn)階段英語(yǔ)教學(xué)方法——任務(wù)教學(xué)法,強(qiáng)調(diào)聽說(shuō),加強(qiáng)口語(yǔ)測(cè)試,主要測(cè)試被試交際能力、解決問(wèn)題能力。
2.外語(yǔ)測(cè)試四維度分析
隨著語(yǔ)言測(cè)試?yán)碚摰陌l(fā)展,評(píng)判語(yǔ)言測(cè)試的標(biāo)準(zhǔn)在不斷完善。對(duì)于語(yǔ)言測(cè)試的分析,主要看測(cè)試本身和結(jié)果,通常從信度、效度、難度和區(qū)分度分析。
(1)信度
信度是指測(cè)試結(jié)果的穩(wěn)定性或一致性,包括測(cè)試信度和評(píng)分人信度。信度通常用一對(duì)相關(guān)系數(shù)表示,相關(guān)系數(shù)越大,信度越高,通常對(duì)標(biāo)準(zhǔn)化測(cè)試的信度系數(shù)要求為0.9,課堂測(cè)試一般在0.7-0.8,當(dāng)系數(shù)為1.00時(shí),信度最高,0.00時(shí)信度最低,但這兩個(gè)極端一般都不會(huì)達(dá)到,只在中間,我們通常用的計(jì)算公式是庫(kù)德-查理遜21公式:
KR 21= r =k /(k=1)X {1 -[μ(k - μ)/k(s ■)]}
Coefficient alpha=α=k/(k-1)X[1-(∑si■/s■)]
K=題目數(shù) p=某一題作對(duì)人的比例 q=1-p s■=整體試卷方差
μ=測(cè)試平均分 si■=每一題得分方差
影響信度的因素:
A.與測(cè)試本身相關(guān)的因素:
題目數(shù),測(cè)試內(nèi)容,題目特點(diǎn),分?jǐn)?shù)多樣性。
B.與被試相關(guān)的因素:
異質(zhì)性,考生應(yīng)試能力,考生動(dòng)機(jī)。
C.與施考相關(guān)的因素:
時(shí)間限制,作弊機(jī)會(huì)。
(2)效度
效度是指測(cè)試測(cè)量了它聲稱測(cè)量東西的適應(yīng)性,也就是說(shuō),是否考查了該考的東西,包括內(nèi)容效度,準(zhǔn)則相關(guān)性效度,結(jié)構(gòu)效度,高考英語(yǔ)所測(cè)試的內(nèi)容是否覆蓋考試大綱或規(guī)定的所有內(nèi)容?效度越高,就越能準(zhǔn)確測(cè)量要測(cè)的內(nèi)容。計(jì)算公式仍體現(xiàn)為相關(guān)系數(shù),受信度影響rxy≤√rx√ry,rx為x的測(cè)試信度,ry為y的測(cè)試信度。
效度與信度關(guān)系為充分不必要條件,有高效度一定有高信度,但有高信度不一定有高效度。
(3)難度
難度是衡量試卷質(zhì)量的一個(gè)重要指標(biāo),難度用D表示,D越大,題越簡(jiǎn)單,公式為:D=答對(duì)該題人數(shù)/總?cè)藬?shù),試題難度指數(shù)一般在0.3-0.7最合適。
(4)區(qū)分度
區(qū)分度指不同的題把不同水平的考生真正地區(qū)分開來(lái),區(qū)分度越高,不同水平的考生區(qū)別越大,試卷價(jià)值就越高,用區(qū)分度指數(shù)表示DI,區(qū)分度指數(shù)最高位1,最低位-1,DI>0.40區(qū)分度最好,在0.30-0.39之間此題較好,在0.20-0.29之間,試題需要修改DI<0.19,區(qū)分度不好,不能采用該試題,計(jì)算公式為點(diǎn)雙列相關(guān):
r(point biserial)=[(μ+-μx)/δx]√p/q
μ+=答對(duì)題目的平均分,μx=整組平均分,σx=整組標(biāo)準(zhǔn)差,p=題目難度q=1-p,題目難度過(guò)高或過(guò)低都不能很好地區(qū)分學(xué)生水平,難度適中區(qū)分度最好。
3.學(xué)生成績(jī)分析
英語(yǔ)教師只有對(duì)學(xué)生成績(jī)進(jìn)行正確科學(xué)的分析,才能對(duì)學(xué)生水平作出更好的評(píng)價(jià),才能為日后教學(xué)提供依據(jù),從而進(jìn)一步提升教學(xué)水平。學(xué)生成績(jī)分析包括成績(jī)描述和參數(shù)檢驗(yàn)。
(1)成績(jī)描述
成績(jī)描述主要涉及的項(xiàng)目有:集中趨勢(shì)(眾數(shù),中數(shù),平均數(shù)),離散趨勢(shì)(全距,方差,標(biāo)準(zhǔn)差),數(shù)據(jù)分布狀態(tài)。
集中趨勢(shì)是反映數(shù)據(jù)分布中數(shù)據(jù)趨向中心位置的統(tǒng)計(jì)量。眾數(shù)指出現(xiàn)頻率最多的數(shù)。中數(shù)指處于中間位置的數(shù)。離散趨勢(shì)與集中趨勢(shì)相反,指數(shù)據(jù)的離散變異情況。全距指一組數(shù)據(jù)中最大數(shù)與最小數(shù)之差。標(biāo)準(zhǔn)差、方差對(duì)數(shù)據(jù)離散程度描述更客觀科學(xué)。
數(shù)據(jù)分布狀態(tài):在語(yǔ)言測(cè)試中,學(xué)生外語(yǔ)成績(jī)是否呈正態(tài)分布,需要一個(gè)檢驗(yàn)過(guò)程,正態(tài)分布呈鐘形,兩邊對(duì)稱在正態(tài)分布中眾數(shù)、中數(shù)、平均數(shù)重合于一點(diǎn),其圖形為:
(2)參數(shù)檢驗(yàn)
在我國(guó)英語(yǔ)教學(xué)中,一位英語(yǔ)老師經(jīng)常會(huì)帶幾個(gè)平行班,這幾個(gè)班學(xué)生學(xué)習(xí)成績(jī)到底怎么樣,只靠成績(jī)描述數(shù)據(jù)是不夠的,還需要考慮多方面因素,這就需要參數(shù)檢查,主要有獨(dú)立樣本z檢查、t檢查和方差分析。
Z檢查主要用于樣本容量大于30的正態(tài)分布,可以比較樣本平均分和總體平均分,或比較樣本平均分。T檢查的樣本容量通常小于30的正態(tài)分布中,這兩種檢驗(yàn)可以用來(lái)檢驗(yàn)兩個(gè)班級(jí)成績(jī)是否具有統(tǒng)計(jì)意義上的明顯區(qū)別,方差分析可以用于三個(gè)或三個(gè)以上班級(jí)比較,也可以用于多因素分析中,SPSS計(jì)算軟件可以幫助我們?cè)谳^短的時(shí)間內(nèi)完成大量的計(jì)算任務(wù)。
結(jié)語(yǔ)
作為出色的英語(yǔ)教師,備課上課不是我們唯一的任務(wù),還應(yīng)該特別注意學(xué)生的考試成績(jī)及試卷分析,在這方面,教師往往會(huì)忽視或輕視,認(rèn)為試卷分析就是純粹地看看學(xué)生成績(jī)高低,強(qiáng)調(diào)學(xué)生易犯錯(cuò)誤的地方就行,即使作了分析,也是分析指標(biāo)單一,分析過(guò)程粗糙,這樣就不能深入了解學(xué)生學(xué)情。希望通過(guò)本文能夠引起教師及測(cè)試員對(duì)試卷分析的重視,注意試卷的科學(xué)性、理?yè)?jù)性,提高成績(jī)測(cè)試質(zhì)量,更好地體現(xiàn)公平公正原則,從而更好地促進(jìn)外語(yǔ)教學(xué)及習(xí)得。
參考文獻(xiàn):
[1]劉潤(rùn)清,韓寶成.語(yǔ)言測(cè)試和它的方法.北京:外語(yǔ)教學(xué)與研究出版社,2004.
[2]李筱菊.語(yǔ)言測(cè)試科學(xué)與藝術(shù).長(zhǎng)沙:湖南教育出版社,1997.
[3]薛榮.當(dāng)代語(yǔ)言測(cè)試:理論發(fā)展與未來(lái)趨勢(shì),外語(yǔ)與外語(yǔ)教學(xué),2008(10):44-47.endprint