□陳蓓琴 史玉鳳 韓艷
近年來,普通話測(cè)試的人群不斷擴(kuò)大,其中包括聾人這一特殊群體。本文采用全國(guó)首期特教學(xué)校聽障從教人員普通話水平替代性測(cè)試為分析對(duì)象,使用經(jīng)典測(cè)量理論重點(diǎn)分析了聽障人員普通話水平測(cè)試的難度、區(qū)分度、信度、效度,發(fā)現(xiàn)各指標(biāo)均在合理的范圍內(nèi),可為當(dāng)前聽障人員普通話水平測(cè)試提供統(tǒng)計(jì)和測(cè)量理論的數(shù)據(jù)支持。
目前,越來越多的職位已經(jīng)實(shí)行普通話持證上崗制度,普通話登記證書成為獲得職業(yè)的必要條件。近年來,參加普通話測(cè)試的人群不斷擴(kuò)大,其中包括聾人這一特殊群體。長(zhǎng)期以來,由于聽障原因,絕大多數(shù)聽障人員(俗稱聾人)很難通過現(xiàn)行普通話水平測(cè)試。所以,聾人一直強(qiáng)烈希望和呼吁能夠有一種適合聾人的替代性的普通話水平測(cè)試方式來真實(shí)反映他們的普通話水平(吳月芹,2015)。2015年4月17日,在南京特殊教育師范學(xué)院首次舉行全國(guó)首期特教學(xué)校聽障從教人員普通話水平專場(chǎng)測(cè)試。聽障人員普通話水平測(cè)試作為國(guó)家對(duì)特殊人群實(shí)施漢語語言能力的測(cè)試,要求測(cè)試必須科學(xué)、客觀、準(zhǔn)確、公正的反映聽障人員掌握和運(yùn)用普通話的真實(shí)水平。當(dāng)前,聽障人員普通話水平替代性測(cè)試,在測(cè)試的手段形式、測(cè)試內(nèi)容、題型構(gòu)成、量化評(píng)定上需要統(tǒng)計(jì)和測(cè)量相關(guān)理論數(shù)據(jù)的支撐。
本文基于經(jīng)典測(cè)量理論,采用統(tǒng)計(jì)學(xué)方法對(duì)聽障人員普通話水平替代性測(cè)試中的信度和效度分別進(jìn)行量化分析。林海燕和趙寰宇(2009)指出,題型的選擇、試題的難易程度、主觀試題評(píng)分都會(huì)影響語言測(cè)試的信度和效度。重點(diǎn)分析聽障人員普通話水平測(cè)試的難度、區(qū)分度、信度、效度,為當(dāng)前聽障人員普通話水平測(cè)試提供統(tǒng)計(jì)和測(cè)量理論的數(shù)據(jù)支持。
本研究所涉及的對(duì)象為江蘇省特殊教育學(xué)校聽障從業(yè)人員,以2017年江蘇省南京市特殊教育師范學(xué)院為考點(diǎn)的67名聽障應(yīng)試者測(cè)試得分為樣本。
聽障人員普通話水平替代性測(cè)試試卷由四部分構(gòu)成:讀單音節(jié)字詞(10分)、讀多音節(jié)詞語(20分)、朗讀短文(30分)、命題說話(40分),滿分為100分。對(duì)每道題的得分進(jìn)行詳細(xì)登記,各題目得分描述性統(tǒng)計(jì)如表1所示。
表1 各題目得分描述性統(tǒng)計(jì)
全部聽障教師普通話水平達(dá)到“三甲”以上,其中,達(dá)到“三甲”(70-80分)共有6人,占比8.96%;達(dá)到“二乙”(80-87分)共47人,占比70.15%;達(dá)到“二甲”(87-92分)共14人,占比20.90%;達(dá)到“一乙”以上水平,共0人。普通話測(cè)試平均分為83.11分,標(biāo)準(zhǔn)差為4.02,最低分為70.30,最高分為89.70,偏度為-1.01,峰度為1.69,說明分?jǐn)?shù)的分布呈現(xiàn)負(fù)偏態(tài),分布大多集中在中等分?jǐn)?shù)階段。
難度是衡量試題與試卷難易程度的指標(biāo),試卷的難度系數(shù)是測(cè)驗(yàn)總分的平均得分率;試題的難度系數(shù)是試題的平均得分率。難度系數(shù)越大,試題越容易。
在教育測(cè)量中,難度常采用如下公式:
試卷難度公式:
具體測(cè)算結(jié)果如表2所示,聽障人員普通話水平替代性測(cè)試第一題“讀單音節(jié)字詞”的難度為0.89;第二題“讀多音節(jié)詞語”的難度為0.85;第三題“朗讀短文”的難度為0.84;第四題“命題說話”的難度為0.80;試卷整體難度為0.83。難度系數(shù)越大,說明題目越容易。根據(jù)考試難度的判定標(biāo)準(zhǔn):難度大于0.9,考試過容易;難度在0.75~0.9之間,考試較容易;難度在0.55~0.75之間,考試難度中等;難度在0.4~0.55之間,考試較有難度;難度小于0.40,考試較難。
試卷難度應(yīng)取決于測(cè)試目的和試題的形式而定。聽障人員普通話水平替代性測(cè)試,考慮聽障人員的特殊性以及測(cè)試目的,該試卷難度為0.83,測(cè)試較容易,發(fā)揮測(cè)試評(píng)價(jià)激勵(lì)功能。趙立新等(2004)提出,試題的難度應(yīng)該為“0.3~0.7”之間,結(jié)合聽障人員自身特點(diǎn)和考試目的,“讀單音節(jié)字詞”、“讀多音節(jié)詞語”、“朗讀短文”、“命題說話”這四類題目難度均為0.8以上,相對(duì)容易??紤]到普通話水平測(cè)試不是測(cè)驗(yàn)應(yīng)試者掌握普通話系統(tǒng)知識(shí)的程度,也不是考察應(yīng)試者的文化水平,更不是對(duì)應(yīng)試者口才的評(píng)估(林海燕和趙寰宇,2009),考試內(nèi)容為日常生活中經(jīng)常使用的字詞,聽障人員普通話測(cè)試主要考察聽障應(yīng)試者使用手法、詞匯、語法表述的規(guī)范程度和自然流暢程度,是聽障應(yīng)試者的漢語標(biāo)準(zhǔn)語測(cè)試,雖然普通話水平測(cè)試有提高國(guó)語語言文字的任務(wù),但提高文化素養(yǎng)不是它的主要目標(biāo),因此題目設(shè)定應(yīng)相對(duì)容易。“命題說話”的難度與其他三題相比較,難度稍微大一些,主要是由于該題答題采用“書面語+手語”形式,考核學(xué)生的書寫能力和手語表達(dá)能力。
區(qū)分度是利用試題或者試卷對(duì)應(yīng)試者加以區(qū)分,是試題或者試卷是否有效的“指示器”,試卷中的每一道試題都應(yīng)該具有這一功能。語言測(cè)試區(qū)分度的高低意味著測(cè)試對(duì)于應(yīng)試者語言能力的強(qiáng)弱是否能很好地鑒別。試題區(qū)分度常采用極端分組法,對(duì)應(yīng)試者試卷依總分由高到低排序,將全部試卷的27%,作為高分組;從低到高排序,將全部試卷的27%,作為低分組(趙立新等,2004)。
主觀試題的區(qū)分度:
試卷區(qū)分度:
根據(jù)1965年美國(guó)測(cè)驗(yàn)專家艾貝提出用區(qū)分度指數(shù)評(píng)價(jià)題目性能的標(biāo)準(zhǔn),D≥0.40,評(píng)價(jià)優(yōu)良;0.30≤D<0.40,合 格;0.20≤D<0.30,尚可,需修改;D<0.20,應(yīng)淘汰。表3結(jié)果顯示,第一題“讀單音節(jié)字詞”、第二題“讀多音節(jié)詞語”、第四題“命題說話”的區(qū)分度分別為0.33、0.34和0.31,達(dá)到合格的要求;第三題“朗讀短文”的區(qū)分度為0.4,區(qū)分效果優(yōu)良,可以有效區(qū)分不同水平的考生;第四題“命題說話”難度值0.80,相對(duì)其他試題難度稍微高些,該題屬于主觀性很強(qiáng)的試題,83.58%的考生得分集中在30-34分,區(qū)分度較小。試卷整體區(qū)分度為0.35,區(qū)分效果合格,基本達(dá)到了考試要求。2000年9月發(fā)布的《教師資格條例》實(shí)施辦法中規(guī)定:“申請(qǐng)認(rèn)定教師資格者的教育教學(xué)能力應(yīng)當(dāng)符合下列要求:普通話水平達(dá)到國(guó)家語言文字工作委員會(huì)頒布的《普通話水平測(cè)試等級(jí)標(biāo)準(zhǔn)》二級(jí)乙等以上標(biāo)準(zhǔn),其中語文教師、對(duì)外漢語教師不低于二級(jí)甲等,語音教師不低于一級(jí)乙等”,符合試卷測(cè)試目的。聽障人員普通話水平測(cè)試群體主要是特殊教育學(xué)校的聽障從業(yè)人員,主要目的是通過普通話測(cè)評(píng)而獲得教師資格證,具體區(qū)別“一、二、三級(jí)”水平不做嚴(yán)格要求。
表2 試卷各題及試卷整體的難度
信度是對(duì)整個(gè)測(cè)量進(jìn)行優(yōu)劣的評(píng)價(jià)指標(biāo)。語言測(cè)試的信度高說明應(yīng)試者分?jǐn)?shù)不易受偶然因素產(chǎn)生的誤差的影響,能夠反應(yīng)試者真實(shí)的語言行為。本文信度采用常用的內(nèi)在信度系數(shù)--克朗巴哈系數(shù),
通過測(cè)算發(fā)現(xiàn),聽障人員普通話替代性測(cè)試的信度系數(shù)為0.55。在我國(guó)一般大規(guī)模標(biāo)準(zhǔn)化考試要求信度系數(shù)在0.9以上,一般高校課程結(jié)業(yè)考試信度系數(shù)要求在0.4~0.7之間。由于殘障人員普通話測(cè)試處于剛開始階段,參加考試人員較少,用于計(jì)算信度的樣本量?jī)H有67個(gè),若按照高校課程結(jié)業(yè)考試信度要求,本次測(cè)試的信度處于合理區(qū)間。隨著聽障應(yīng)試者范圍進(jìn)一步擴(kuò)大,聽障應(yīng)試者越來越多,用于計(jì)算信度的樣本進(jìn)一步擴(kuò)大,預(yù)計(jì)信度會(huì)進(jìn)一步提升。
效度是衡量測(cè)試結(jié)果對(duì)考試目標(biāo)實(shí)現(xiàn)程度的指標(biāo),語言測(cè)試的效度表示了一種關(guān)聯(lián)性,即測(cè)試與測(cè)試目標(biāo)的關(guān)聯(lián)程度,也就是反映測(cè)試的有效程度、測(cè)試的內(nèi)容及形式是否符合測(cè)試目的(鄒申,2005)。本文采用求平均區(qū)分度的方法來代替:
一般認(rèn)為,效度在0.3以上的試卷即為良好。此次聽障人員普通話水平替代性測(cè)試的效度系數(shù)為0.35,雖符合試卷合格標(biāo)準(zhǔn),但不具有較高的效度。本次測(cè)試的信度為0.550,處于合格區(qū)間,由于信度不高的測(cè)試不可能有較高的效度,符合其規(guī)律。隨著聽障應(yīng)試者范圍進(jìn)一步擴(kuò)大,聽障應(yīng)試者越來越多,用于計(jì)算信度的樣本進(jìn)一步擴(kuò)大,預(yù)計(jì)信度和效度都會(huì)進(jìn)一步提升。
通過對(duì)67名聽障人員普通話水平的統(tǒng)計(jì)分析,可以發(fā)現(xiàn)試卷的難度、區(qū)分度、信度和效度均在合理的范圍內(nèi),從數(shù)據(jù)上回答了聽障人員普通話替代性測(cè)試“為什么這樣考”或者“這樣考是有依據(jù)的”。
表3 試卷各題及試卷整體的區(qū)分度