国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

大學(xué)英語(yǔ)測(cè)試中信度和效度的個(gè)案研究——以呂梁學(xué)院為例

2014-10-26 12:09:22樊紅紅
關(guān)鍵詞:效度信度命題

樊紅紅

(呂梁學(xué)院 外語(yǔ)系,山西 呂梁 033000)

目前,對(duì)大學(xué)英語(yǔ)教學(xué)成果的評(píng)價(jià)主要還是通過(guò)一系列的測(cè)試。無(wú)論是全國(guó)性的大學(xué)英語(yǔ)四六級(jí)考試,還是大學(xué)每個(gè)學(xué)期的期終考試,都是通過(guò)測(cè)試來(lái)評(píng)價(jià)大學(xué)生的英語(yǔ)學(xué)習(xí)成績(jī)。2014年,呂梁學(xué)院大學(xué)英語(yǔ)測(cè)試進(jìn)行了改革,改過(guò)去的終結(jié)性評(píng)價(jià)為形成性評(píng)價(jià)+終結(jié)性評(píng)價(jià),即平時(shí)考核加上期末的測(cè)試。平時(shí)的考核主要是對(duì)學(xué)生寫(xiě)作和翻譯這兩類(lèi)主觀題的測(cè)試。通過(guò)這兩類(lèi)題型來(lái)測(cè)試學(xué)生的英語(yǔ)語(yǔ)言運(yùn)用能力和英語(yǔ)綜合技能運(yùn)用能力,這樣可以提高英語(yǔ)測(cè)試的效度。期末考試則模擬四級(jí)考試的聽(tīng)力,閱讀等客觀試題類(lèi)型來(lái)對(duì)學(xué)生進(jìn)行測(cè)評(píng),不同級(jí)別的題分別由兩位不同的老師負(fù)責(zé)出A、B兩種試卷。出題要求與大學(xué)英語(yǔ)四級(jí)卷相似。這兩類(lèi)題可以衡量學(xué)生對(duì)英語(yǔ)基本能力的掌握。這類(lèi)題通常題量較大,相對(duì)而言,基本能保證評(píng)分的客觀準(zhǔn)確,從而有效地提高測(cè)試的信度。盡管如此,在實(shí)際的考核中也存在一些問(wèn)題,命題時(shí),不同的老師負(fù)責(zé)命不同題型,命題的難度系數(shù)就會(huì)存在有差異;不同的命題老師對(duì)語(yǔ)言點(diǎn)測(cè)試的側(cè)重點(diǎn)不盡相同,有的是大相徑庭,且對(duì)主、客觀試題的評(píng)分標(biāo)準(zhǔn)的確定也會(huì)有偏差;所命的題目是否能較好地反映學(xué)生的學(xué)習(xí)效果、是否對(duì)教師的教師的教學(xué)具有反駁作用;命題是否遵循了教學(xué)大綱總體目標(biāo);教師的專(zhuān)業(yè)素養(yǎng)是否也會(huì)對(duì)命題信度和效度產(chǎn)生負(fù)面影響等。這一切均都對(duì)測(cè)試的信度和效度產(chǎn)生不同程度的影響。

一、信度和效度

(一)信度

信度就是語(yǔ)言測(cè)試的可靠性。它體現(xiàn)了測(cè)試結(jié)果與試題,試題與被測(cè)試者之間的關(guān)系[1]。信度主要受被測(cè)試者的水平,試題的質(zhì)量、數(shù)量,考試結(jié)果的評(píng)價(jià),測(cè)試的組織和實(shí)施等因素的影響。如果所有被測(cè)者的水平接近,試卷的可靠性較低,如果被測(cè)試者的水平間隔性較大,可靠性就較高。試題題量少,可靠性就低;題量大,可靠性就越高。同時(shí),考試的結(jié)果要有一定的離散度,要呈正態(tài)分布,也就是說(shuō)試題的區(qū)分度要高,即可以把不同層次的被測(cè)者區(qū)分開(kāi)來(lái),并且試題的難度要適中,這樣才能區(qū)分被測(cè)者的水平,測(cè)試的內(nèi)容應(yīng)與被測(cè)者相適應(yīng),應(yīng)屬于被測(cè)者的能力水平之內(nèi)。如果測(cè)試問(wèn)題太難或太容易,或測(cè)試分?jǐn)?shù)發(fā)現(xiàn)在一個(gè)點(diǎn)和一個(gè)地區(qū),那么測(cè)試也會(huì)失去可靠性[2]。在組織和實(shí)施測(cè)試方面,測(cè)試環(huán)境和條件應(yīng)有利于考試。另外,無(wú)論測(cè)試環(huán)境和條件是否一致,所有的被測(cè)者也會(huì)影響測(cè)試的信度。

(二)效度

效度就是語(yǔ)言測(cè)試的有效性。即測(cè)試所考的內(nèi)容是否符合命題者想要考的內(nèi)容[1]。也就是說(shuō)測(cè)試是否達(dá)到了考核的目的。效度顯示了測(cè)試和測(cè)試目標(biāo)之間的關(guān)系,也就是說(shuō),效度檢驗(yàn)我們的測(cè)試是否達(dá)到了預(yù)期目的。效度在測(cè)試中是很重要的。如果一次測(cè)試的信度很高,但所考的內(nèi)容并不是想考的或應(yīng)考的,那么該測(cè)試的效度就不高。相應(yīng)地,這樣的測(cè)試就毫無(wú)意義。在我國(guó),衡量和區(qū)分人與人之間的差異主要是通過(guò)各種各樣的考試,但幾乎所有的考試都是關(guān)注考試結(jié)果,即只注重測(cè)試結(jié)果的可靠性。人們很少對(duì)測(cè)試結(jié)果進(jìn)行分析[3]。這樣久而久之,命題者還是按照慣例去命題,測(cè)試的效度就很難提高。因此,我們應(yīng)加強(qiáng)對(duì)測(cè)試的效度的研究,因?yàn)?,在測(cè)試中效度與信度一樣重要,任何一方面的忽略都不能保證測(cè)試題的質(zhì)量。

二、大學(xué)英語(yǔ)測(cè)試中信度與效度的現(xiàn)狀

呂梁學(xué)院平時(shí)考核主要是寫(xiě)作和翻譯,即主觀題的考核。期末則以聽(tīng)力、閱讀等客觀題的形式來(lái)命題。在教師評(píng)分的過(guò)程中,主觀題需要閱卷者根據(jù)自己所讀到的內(nèi)容進(jìn)行主觀判斷,這種判斷的結(jié)果決定學(xué)生的考試成績(jī)。主觀題越多,效度就越高。主觀測(cè)試旨在衡量學(xué)生的英語(yǔ)語(yǔ)言運(yùn)用能力。因此,平時(shí)對(duì)大學(xué)生的測(cè)試側(cè)重的是考試的效度,而忽視的是測(cè)試的信度,盡管這類(lèi)的測(cè)試不是沒(méi)有信度。與之相反,每個(gè)學(xué)期的期終測(cè)試題型主要是聽(tīng)力理解題和閱讀理解題,測(cè)試的形式多半是選擇題、判斷題等客觀題型。這種題目的答案具有唯一性或固定性,這種題型主要有機(jī)器來(lái)閱,無(wú)需閱卷人的主觀判斷。它測(cè)試的主要是大學(xué)生對(duì)大學(xué)英語(yǔ)基礎(chǔ)知識(shí)掌握,主要考查大學(xué)生的語(yǔ)言三要素中的其中兩項(xiàng),即考查的是他們的語(yǔ)法知識(shí)運(yùn)用和詞匯知識(shí)運(yùn)用。這種題型的優(yōu)點(diǎn)是評(píng)分客觀準(zhǔn)確,不受閱卷人主觀情緒的影響;這種題考查的目的比較單一,答題比較簡(jiǎn)單,因此,覆蓋面很廣,有利于學(xué)生雙基能力,即基礎(chǔ)知識(shí)和基本技能的全面考查;這種題目有助于考查學(xué)生的答題速度;這種題型還可以用機(jī)器閱卷,這樣可以大幅度的提高閱卷效率、節(jié)省大量的人力和物力;這種題的評(píng)分標(biāo)準(zhǔn)比較客觀,對(duì)被測(cè)者也能提供比較準(zhǔn)確的評(píng)價(jià),進(jìn)而提高了測(cè)試的信度。因此,這種測(cè)試的信度較高。這種題目的不利因素主要是考生會(huì)投機(jī)取巧,不會(huì)的題目,他們會(huì)采取投硬幣或是瞎猜去解題,這樣就會(huì)降低其評(píng)價(jià)的效度。

呂梁學(xué)院大學(xué)英語(yǔ)測(cè)試目前尚無(wú)口語(yǔ)測(cè)評(píng)??谡Z(yǔ)測(cè)試是一種比較傳統(tǒng)的題型,其優(yōu)點(diǎn)是能夠考查大學(xué)生的語(yǔ)音語(yǔ)調(diào)、詞匯量的大小、語(yǔ)法知識(shí)豐富與否等,最重要是考查了學(xué)生綜合運(yùn)用語(yǔ)言的能力??谡Z(yǔ)測(cè)試的不利因素主要體現(xiàn)在考生與測(cè)試?yán)蠋熋鎸?duì)面,必定會(huì)差生心理壓力,影響考查的效度;另外,測(cè)試需要的考官比較多,而且耗時(shí)比較長(zhǎng),有時(shí)還需要電話設(shè)備等測(cè)試輔助手段等。其評(píng)分標(biāo)準(zhǔn)的尺度把握會(huì)因考官的不同而不盡相同,客觀上造成測(cè)試的區(qū)分度低,進(jìn)而影響了測(cè)試的整體信度。由于期末考試幾乎都是客觀題,難免有學(xué)生抄襲舞弊,影響對(duì)學(xué)生真實(shí)水平的把握??傊?,通過(guò)一個(gè)學(xué)期的形成性考核試點(diǎn),結(jié)果幾乎所有的學(xué)生都能過(guò)關(guān)。由于這種測(cè)試不能完全反映學(xué)生的真實(shí)水平,這樣學(xué)生的實(shí)際水平與考試結(jié)果出現(xiàn)了差異,也就出現(xiàn)了高分低能的現(xiàn)象。因此,大學(xué)英語(yǔ)教學(xué)的形成性考核方案還需逐步完善,盡可能地做到信度與效度的兼顧統(tǒng)一。

三、英語(yǔ)測(cè)試信度與效度及其分析

我們大學(xué)英語(yǔ)教研室針對(duì)大學(xué)英語(yǔ)的信度、效度的測(cè)試,設(shè)計(jì)了大學(xué)英語(yǔ)診斷性(Diagnose)試題。2014年4月8日,我們從2012級(jí)抽取物理系的物理教育專(zhuān)業(yè)兩個(gè)班共83人,教育系的學(xué)前教育專(zhuān)業(yè)兩個(gè)班67人,數(shù)學(xué)系的數(shù)學(xué)教育兩個(gè)班81人,中文系的語(yǔ)文教育專(zhuān)業(yè)兩個(gè)班75人以及化學(xué)化工系的化學(xué)教育專(zhuān)業(yè)兩個(gè)班87人等五個(gè)專(zhuān)業(yè)393人參加測(cè)試。我們從2013級(jí)抽取經(jīng)濟(jì)管理系的財(cái)務(wù)管理專(zhuān)業(yè)兩個(gè)班82人,計(jì)算機(jī)系的信息管理專(zhuān)業(yè)兩個(gè)班76人,礦業(yè)工程系的礦井通風(fēng)與安全專(zhuān)業(yè)兩個(gè)班68人,生命科學(xué)系的食品生物技術(shù)專(zhuān)業(yè)兩個(gè)班72人,以及化學(xué)化工系的應(yīng)用化工專(zhuān)業(yè)兩個(gè)班88人,總計(jì)386人。對(duì)779名同學(xué)共10個(gè)專(zhuān)業(yè)的學(xué)生進(jìn)行了測(cè)試,其中因病、因事請(qǐng)假的18人,最終有效問(wèn)卷674份。為了對(duì)該試題進(jìn)行有效地分析,讓被試在測(cè)試卷的最后寫(xiě)上自己CET-4通過(guò)的分?jǐn)?shù)。下面是對(duì)被試答卷統(tǒng)計(jì)分析,被試的成績(jī)頻數(shù)分布曲線如下:

圖1 大學(xué)非英語(yǔ)專(zhuān)業(yè)測(cè)試成績(jī)分布曲線圖

從曲線圖上可以看出,被試的總分分布情況基本上呈正態(tài)分布。如圖所示,本次大學(xué)非英語(yǔ)專(zhuān)業(yè)測(cè)試的總分基本上是呈正態(tài)分布。依據(jù)測(cè)試結(jié)果,我們采用了比較實(shí)用的信度計(jì)算方法,沒(méi)打算采用再測(cè)信度和等值測(cè)試信度。本測(cè)試采用的是α系數(shù)公式(Cronbach,1951)。公式如下[4]:

其中,α為信度系數(shù);

K為題目數(shù);

表1 2013級(jí)非英語(yǔ)專(zhuān)業(yè)學(xué)生測(cè)試信度與效度分析

由表1可知:(1)從學(xué)生本次考試與國(guó)家四級(jí)成績(jī)來(lái)比較,財(cái)務(wù)管理 r=0.385**,P<0.05;(2)信息管理r=0.459****,P<0.001,表明本次考試有效,即有很大的信度和效度。(3)礦井通風(fēng)與安全專(zhuān)業(yè)與期末考試成績(jī)相比較,r=0.458****,P<0.001相關(guān)度很高;(4)食品生物技術(shù) r=0.388**,P<0.05,說(shuō)明本次考試也是有效的,有很大的信度和效度。(5)應(yīng)用化工r=0.387**,P<0.001??偟膩?lái)說(shuō),相關(guān)度還是很高的。

表2 2012級(jí)非英語(yǔ)專(zhuān)業(yè)學(xué)生測(cè)試信度與效度分析

由表2可以看出:(1)從本次測(cè)試來(lái)看,總體相關(guān)性還是很大的,r=0.589*****,P<0.001。測(cè)試結(jié)果表明本次考試有著很大的信度與效度。(2)從表中五個(gè)專(zhuān)業(yè)的測(cè)試與這次考試的相關(guān)性來(lái)看,除了學(xué)前專(zhuān)業(yè)以外,其它專(zhuān)業(yè)的聽(tīng)力與本次考試的相關(guān)度都比較高。語(yǔ)文教育專(zhuān)業(yè)的四級(jí)成績(jī)與本次考試也剛好相關(guān),r=0.433*,P<0.05,調(diào)研顯示,該班來(lái)自農(nóng)村的比較多,聽(tīng)力基礎(chǔ)薄弱,主要是語(yǔ)音不夠好,因此,其聽(tīng)力考試與本次考試不甚相關(guān),不過(guò)這次考試的難度值也是最大的。(3)總體來(lái)說(shuō),專(zhuān)業(yè)好的學(xué)生,無(wú)論是四級(jí)成績(jī),還是單項(xiàng)成績(jī)與本次考試的相關(guān)性都很大。

四、結(jié)語(yǔ)

語(yǔ)言測(cè)試的基本要求就是保證其信度和效度。大學(xué)英語(yǔ)教師要命題時(shí)要充分考慮到信度設(shè)計(jì)測(cè)試結(jié)果的穩(wěn)定性和可靠性,即該項(xiàng)測(cè)試是否真正度量了學(xué)生的語(yǔ)言水平。命題過(guò)程中語(yǔ)言教師也應(yīng)該同時(shí)考慮測(cè)試是否達(dá)到了命題人想要考的目的,即考查效度。在我校大學(xué)英語(yǔ)測(cè)試實(shí)踐中,所試點(diǎn)的部分形成性考核方式,從測(cè)試的信度和效度兩個(gè)方面進(jìn)行設(shè)計(jì),但是測(cè)試結(jié)果表明這兩方面的效果都不夠理想。因此,今后的大學(xué)英語(yǔ)測(cè)試,大學(xué)英語(yǔ)教師要多重視語(yǔ)言測(cè)試?yán)碚摰难芯?,?zhǔn)確語(yǔ)言測(cè)試的命題原則;命題前做好預(yù)測(cè),命題后做好調(diào)研。盡量采取集體命題的形式,命題時(shí)要把握好測(cè)試信度和效度兩個(gè)方面的平衡關(guān)系,不斷優(yōu)化測(cè)試的質(zhì)量,并引導(dǎo)學(xué)生不僅要注重雙基訓(xùn)練,還要把學(xué)習(xí)的重心逐步地轉(zhuǎn)移到學(xué)習(xí)策略和運(yùn)用語(yǔ)言的能力的培養(yǎng)上,從而更有效地推動(dòng)我校大學(xué)英語(yǔ)教學(xué)的發(fā)展。

[1]孫成崗.現(xiàn)代語(yǔ)言測(cè)試與試卷分析[J].解放軍外國(guó)語(yǔ)學(xué)院學(xué)報(bào),2000(4):82-83.

[3]桂詩(shī)春.語(yǔ)言測(cè)試:新技術(shù)與新理論[J].外語(yǔ)教學(xué)與研究,1989(3):2-10.

[2]李筱菊.英語(yǔ)測(cè)試的科學(xué)與藝術(shù)[M].長(zhǎng)沙:湖南教育出版社,1995:7.

[4]黃萍.大學(xué)專(zhuān)業(yè)英語(yǔ)的測(cè)試信度與效度研究[J].外語(yǔ)與外語(yǔ)教學(xué),2001(11):16-18.

猜你喜歡
效度信度命題
《廣東地區(qū)兒童中醫(yī)體質(zhì)辨識(shí)量表》的信度和效度研究
慈善募捐規(guī)制中的國(guó)家與社會(huì):兼論《慈善法》的效度和限度
下一站命題
科技成果評(píng)價(jià)的信度分析及模型優(yōu)化
體育社會(huì)調(diào)查問(wèn)卷信度檢驗(yàn)的方法學(xué)探索——基于中文核心體育期刊163篇文章分析
被看重感指數(shù)在中國(guó)大學(xué)生中的構(gòu)念效度
外語(yǔ)形成性評(píng)估的效度驗(yàn)證框架
中文版腦性癱瘓兒童生活質(zhì)量問(wèn)卷的信度
復(fù)雜圖形測(cè)驗(yàn)對(duì)區(qū)分阿爾茨海默病與非癡呆的診斷效度
2012年“春季擂臺(tái)”命題
老河口市| 罗田县| 大渡口区| 临城县| 吴江市| 军事| 沾化县| 民乐县| 龙南县| 商洛市| 黑山县| 绥阳县| 尖扎县| 公主岭市| 定陶县| 壤塘县| 长阳| 高陵县| 永川市| 万载县| 桦甸市| 芷江| 金阳县| 嘉兴市| 图片| 镇远县| 宜丰县| 镇安县| 呼伦贝尔市| 花莲县| 宝丰县| 噶尔县| 霍邱县| 于都县| 仁寿县| 凉城县| 巧家县| 延寿县| 大安市| 双江| 东方市|