賀雪霏 宋春陽
摘 要:利用SPSS軟件對(duì)留學(xué)生初級(jí)漢語聽力試卷進(jìn)行統(tǒng)計(jì)分析,檢測(cè)其難度、區(qū)分度及內(nèi)在信度,分析該試卷存在的不足,并針對(duì)試卷編寫提出改進(jìn)建議。
關(guān)鍵詞:初級(jí)漢語 聽力測(cè)試 難度 信度
一、引言
聽力是第二語言教學(xué)雙方都十分重視的一項(xiàng)語言技能,也是衡量一個(gè)人綜合語言能力的一項(xiàng)重要指標(biāo)。聽力測(cè)試是語言測(cè)試中一個(gè)非常重要的部分,一份高質(zhì)量的試卷可以在最大程度上測(cè)試出學(xué)生的實(shí)際能力。本文對(duì)上海交通大學(xué)國(guó)際教育學(xué)院的留學(xué)生初級(jí)漢語聽力測(cè)試期末試卷進(jìn)行分析,主要對(duì)試卷的難度和內(nèi)在信度兩個(gè)方面進(jìn)行檢驗(yàn),分析學(xué)生聽力的薄弱點(diǎn),希望對(duì)試卷編寫和聽力教學(xué)提供一定幫助。
二、測(cè)試概況
(一)研究對(duì)象
本研究選取了上海交通大學(xué)國(guó)際教育學(xué)院2014年1月,初三漢語聽力測(cè)試期末試卷作為研究對(duì)象,被試是初等三級(jí)的漢語學(xué)習(xí)者,共有148人,實(shí)際參加考試的人數(shù)共為105人,有效試卷為105份。
(二)研究方法
本文通過統(tǒng)計(jì)出每道題的答對(duì)率,運(yùn)用SPSS軟件,分析試卷的難度、區(qū)分度,采用a信度系數(shù)法和分半信度法檢測(cè)試卷的內(nèi)在信度。
三、試卷分析
(一)試卷結(jié)構(gòu)
該套試卷由50道單項(xiàng)選擇題構(gòu)成,每小題答對(duì)得2分,共計(jì)100分。試題分為三個(gè)部分:第一部分是兩個(gè)人的一問一答第三個(gè)人就對(duì)話提一個(gè)問題,共15道題;第二部分是兩個(gè)人的簡(jiǎn)短對(duì)話,第三個(gè)人根據(jù)對(duì)話提一個(gè)問題,共20道題;第三部分是幾段簡(jiǎn)短的對(duì)話或講話,每段話后,被試將聽到若干個(gè)問題,共15道題。所有聽力材料都會(huì)念兩遍。
(二)測(cè)試成績(jī)分析
圖1:
表1:描述統(tǒng)計(jì)量
N 極小值 極大值 均值 標(biāo)準(zhǔn)差 方差
聽力成績(jī) 105 22.00 86.00 58.9905 15.50217 240.317
有效的N(列表狀態(tài)) 105
表2:各分?jǐn)?shù)段比重
分?jǐn)?shù)段 >=80 79~70 69~60 59~50 49~40 39~30 29~20
人數(shù) 13 17 28 14 20 9 4
百分比 12.38% 16.19% 26.67% 13.33% 19.05% 8.57% 3.80%
圖1為根據(jù)此次聽力成績(jī)繪制的直方圖,由該圖可以看出,此次聽力測(cè)試的整體成績(jī)基本呈正態(tài)曲線分布,分?jǐn)?shù)主要集中在40~70之間。表1、2顯示,該測(cè)試最高分為86,最低分為22,高分與低分差距懸殊,且低分很低。從以上數(shù)據(jù)還可以看出,及格率較低,為55.2%,且平均分很低,為58.99<60。通??荚嚨臉?biāo)準(zhǔn)差應(yīng)控制在9~15之間比較恰當(dāng)。如果標(biāo)準(zhǔn)差小于8,說明成績(jī)分布較為集中,試卷區(qū)分度太小,中等難度的題目偏多;標(biāo)準(zhǔn)差如果大于16,則說明成績(jī)過于分散。該測(cè)試學(xué)生成績(jī)標(biāo)準(zhǔn)差為15.50217>15,說明成績(jī)有一定分化,具有較高區(qū)分度。
(三)難度分析
難度是衡量試題難易程度的指數(shù),本文采用考生對(duì)試題的答對(duì)率作為難度系數(shù),即答對(duì)的分?jǐn)?shù)除以總分,難度一般用字母“P”表示,難度系數(shù)越小,題目難度越大。一般來說,當(dāng)P>0.7時(shí),試題太易;當(dāng)P<0.4時(shí),試題太難;當(dāng)0.4
0.7的簡(jiǎn)單題目有15道,占全部試題的30%;P<0.4的較難題目有9道,占18%;0.4<=P<=0.7的中等難度題目有26道,占52%,試題易、中、難比例接近于3:5:2,結(jié)構(gòu)較為合理。試卷的整體難度為0.59,說明試卷難易程度適中。
(四)信度分析
信度也叫測(cè)試的可靠性,指的是測(cè)試結(jié)果是否穩(wěn)定可靠。試卷信度可用信度系數(shù)來表示,系數(shù)越大,信度越高,試卷可信程度也就越高。信度系數(shù)為1,表明研究工具(如試卷)完全可靠;相關(guān)系數(shù)為0,表明該研究工具完全不可靠。一般認(rèn)為,小于0.6的試卷,內(nèi)部一致性低,信度較低;介于0.6和0.8之間的試卷,信度較高;大于0.8的試卷,內(nèi)部一致性高,信度非常高。
本文首先采用克朗巴赫a系數(shù)評(píng)價(jià)試卷信度,從該套試卷的三個(gè)題型之間的相關(guān)程度來檢測(cè)其內(nèi)在一致性。
表3:可靠性統(tǒng)計(jì)量
Cronbach's Alpha 基于標(biāo)準(zhǔn)化項(xiàng)的 Cronbachs Alpha 項(xiàng)數(shù)
0.837 0.840 3
表3中,本套試卷的Cronbach's a值達(dá)到0.837,大于0.8,一致性信度很好,測(cè)試的可靠性比較高。
表4:項(xiàng)間相關(guān)性矩陣
題型一 題型二 題型三
題型一 1.000 0.641 0.555
題型二 0.641 1.000 0.713
題型三 0.555 0.713 1.000
表5:摘要項(xiàng)統(tǒng)計(jì)量
均值 極小值 極大值 范圍 極大值/極小值 方差 項(xiàng)數(shù)
項(xiàng)之間的相關(guān)性 0.636 0.555 0.713 0.158 1.285 0.005 3
表4、表5為項(xiàng)間相關(guān)性系數(shù),即三個(gè)體型的內(nèi)在相關(guān)一致性。表4中,題型一和題型二之間的相關(guān)系數(shù)是0.641,與題型三之間的相關(guān)系數(shù)為0.555,題型二與題型三之間的相關(guān)系數(shù)是0.713。通過數(shù)據(jù)可以看出,題型一與題型三之間內(nèi)部一致性低,題型一與題型二、題型二與題型三之間內(nèi)部一致性較高,考查內(nèi)容較為相近,且后者一致性明顯高于前兩組。表5給出了各項(xiàng)間相關(guān)系數(shù)的平均值,為0.636,在0.6~0.8的區(qū)間內(nèi),說明三道大題間整體一致性保持良好,信度可靠。
四、學(xué)生答題反饋的問題
該套試卷中,部分題目學(xué)生答對(duì)率很低,答對(duì)人數(shù)僅占30%左右,甚至更低。本文將選取其中一些出錯(cuò)率高的試題,分析學(xué)生出錯(cuò)的原因,提出試題的改進(jìn)建議。
(一)干擾信息過多,未能突出關(guān)鍵信息
(26)A:我剛下樓去取了賬單,水費(fèi)56,電費(fèi)160,話費(fèi)單300……
B:這個(gè)月的話費(fèi)又這么多。
A:電話費(fèi)是不是錯(cuò)了?咱們家這個(gè)月沒打很多長(zhǎng)途啊,怎么這么多錢?
B:長(zhǎng)途是沒打幾個(gè),可你一拿起電話就不停地說,電話費(fèi)還能不往上漲?
問:這個(gè)月電話費(fèi)為什么很多?
A.錯(cuò)了 B.打了長(zhǎng)途 C.打得次數(shù)太多 D.聊得很久
(43)……我想,坐地鐵肯定來不及,因?yàn)樽叩降罔F站還要15分鐘,在地鐵上差不多也要10分鐘,下了地鐵還要走5分鐘。我想,干脆打個(gè)車吧。等了5分鐘左右,來了一輛。我告訴師傅地址,還告訴他開快點(diǎn)兒。他說“好嘞!”還好路上沒等很多紅綠燈。我10分鐘以后就到了教學(xué)樓……
問:從他家到教學(xué)樓坐地鐵要多長(zhǎng)時(shí)間?
A.15分鐘 B.20分鐘 C.25分鐘 D.30分鐘
以上兩題學(xué)生答對(duì)率都僅為10.48%。第26題中,出現(xiàn)多個(gè)在現(xiàn)實(shí)生活中可能引起電話費(fèi)貴的因素,如“出錯(cuò)、打長(zhǎng)途次數(shù)多、通話時(shí)間長(zhǎng)”,且選項(xiàng)中的答案客觀上似乎合乎常理,學(xué)生只能通過對(duì)所聽語料進(jìn)行仔細(xì)甄別,排除干擾信息,提取正確信息。但這里的干擾信息過多,而且關(guān)鍵信息的詞匯等級(jí)也較高,如“不停地”“聊”,所以造成答對(duì)率過低。而在第43題中,在這個(gè)語段中出現(xiàn)了多個(gè)時(shí)間點(diǎn),學(xué)生易產(chǎn)生混淆,并且此題還涉及數(shù)字運(yùn)算,選擇正確的信息進(jìn)行相加,進(jìn)一步增加試題的難度。
(二)詞匯或句式過難,超出了學(xué)生的理解能力
(40)……
B:好的,租金怎么付?
A:付三押一。一個(gè)月租金是5000。
……
問:要租這套房子,第一次應(yīng)該付多少錢?
A.5000 B.1000 C.15000 D.20000
(4)A:我父母都希望這次比賽我能得冠軍,看來要讓他們失望了。
B:你最近都沒怎么訓(xùn)練,不過只要從現(xiàn)在起努力,得冠軍也不是不可能的。
問:第二個(gè)人認(rèn)為能得冠軍嗎?
A.能 B.不能 C.可能 D.不可能
以上兩題,學(xué)生答對(duì)率分別為21.9%和33.33%。第40題中,關(guān)鍵詞是“付三押一”,該詞難度大,意思是“付三個(gè)月房租和另付一個(gè)月作為押金”,“付”不難理解,但“押”學(xué)生不容易理解,且這種省略緊縮形式,即使學(xué)生聽對(duì)讀音,也不清楚詞的意思。第4題中,學(xué)生出錯(cuò)的原因是沒有掌握“雙重否定”這一表達(dá)“肯定”的語法結(jié)構(gòu),“不是不可能”意思是“有可能”,但絕大多數(shù)學(xué)生將其理解為“不可能”,造成錯(cuò)誤。
五、結(jié)語
通過分析,整套試卷質(zhì)量較好,區(qū)分度高,將不同水平的學(xué)生能力測(cè)試了出來。在題目的難易程度安排上,結(jié)構(gòu)合理,內(nèi)部一致性高,信度很好,測(cè)試結(jié)果具有穩(wěn)定性,但各題型之間的內(nèi)在一致性仍需提高。該試卷設(shè)計(jì)比較理想,但其中有些詞匯超出學(xué)生現(xiàn)階段接受能力,對(duì)聽力材料的選擇可以更加完善。這次考試反映出學(xué)生能力差異過大,教師應(yīng)當(dāng)平衡學(xué)生整體素質(zhì),以免差距繼續(xù)拉大。對(duì)能力差的同學(xué)應(yīng)采取有效的補(bǔ)救措施,因材施教,針對(duì)弱點(diǎn),教授聽力技巧,幫助其提高聽力。此外,通過學(xué)生答題情況分析,學(xué)生排除干擾、跳躍障礙的能力較弱,對(duì)關(guān)鍵信息的處理能力有待提高。聽力雖然屬于一項(xiàng)語言技巧,但需要系統(tǒng)扎實(shí)的語言知識(shí)作為支撐。掌握詞義和語法知識(shí)對(duì)聽力有著重要意義,因此教師不可忽視對(duì)語言知識(shí)的講解。
參考文獻(xiàn):
[1]柴省三.漢語水平考試(HSK)聽力測(cè)驗(yàn)構(gòu)想效度研究[J].語言文字應(yīng)用,2011,(1).
[2]谷陵.論漢語聽力測(cè)試中應(yīng)考查的六種聽力技能[J].云南師范大學(xué)學(xué)報(bào)(對(duì)外漢語教學(xué)與研究版),2003,(6).
[3]金琰如,王佶旻.初級(jí)階段留學(xué)生漢語聽力能力結(jié)構(gòu)探究[J].語言教學(xué)與研究,2012,(3).
[4]李慧.漢語作為第二語言的測(cè)試研究[M].北京:北京語言大學(xué)出版社,2011.
[5]楊瑞和.語言研究應(yīng)用SPSS軟件實(shí)例大全[M].北京:中國(guó)社會(huì)科學(xué)出版社,2004.
[6]趙金銘.語言測(cè)試?yán)碚摷皾h語測(cè)試研究[M].北京:商務(wù)印書館,2006.
[7]朱正才,范開泰.語言聽力理解能力的認(rèn)知結(jié)構(gòu)與測(cè)試[J].語言教學(xué)與研究,2001,(3).
(賀雪霏 宋春陽 上海交通大學(xué)國(guó)際教育學(xué)院 200030)