国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于計算機的語言測試及其效度驗證

2016-07-15 12:17余錦璇
大科技 2016年9期
關鍵詞:效度計算機測試

余錦璇

(北京理工大學珠海學院 519000)

基于計算機的語言測試及其效度驗證

余錦璇

(北京理工大學珠海學院 519000)

近幾年,由于計算機技術不斷發(fā)展,使其與認知科學、語言學以及測量學等方面結合在一起,對成績報道與分析、試題設計編寫、評分、任務呈現、評估與語言測試管理等產生了異常重要的影響。具備高真實性的測試題型以及計算機自動評分系統和測試技術的應用,使測試結果的可靠性和測試概念的代表性得到了提升。所以,管理者和語言測試開發(fā)人員也越來越青睞建立在計算機基礎之上的語言。本文就基于計算機的語言測試進行了大致闡述,并對其效度進行了驗證,希望能為我國語言測試的進步提供參考。

計算機;語言測試;效度驗證

引言

隨著語言學、認知科學和測量學等相關學科的不斷發(fā)展,計算機技術讀語言測試與評估也產生了巨大影響?,F代語言測試的語言學基礎經歷了數次改革,測量學理論由經典測試理論發(fā)展到概化理論和項目反映理論,計算機技術的發(fā)展促使語言測試的介質發(fā)生變化,傳統基于紙筆的語言測試正向基于計算機的語言測試邁進,由機助語言測試發(fā)展到計算機適應性語言測試,并且向基于網絡的個性化適應性語言測試。

1 基于計算機語言測試發(fā)展狀況

計算機技術在語言評估和測試方面所引起的轉變主要體現在如下兩點:測量準確度和管理實施效率。建立在計算機基礎之上的語言測試的發(fā)展狀況大致可以歸為如下幾點:

(1)計算機化的語言測試的初期階段。在計算機技術限制作用下,語言測試初期主要是將傳統筆試試題搬至計算機上。它的特點只是轉變了測試方式,而在測試概念和任務方面與筆試并無實質性的差別。

(2)計算機語言測試的適應性階段。測量學以及計算機技術的進步使得新一代的語言測試技術開始出現。它能起到反饋的作用,在測試中加強了人性化和個性化,同時也提升了安全性。測試圍之可以使測試者提升興趣,使他們發(fā)揮最佳水平發(fā)揮,從而使受試者語言能力的測量更加準確。

(3)自動評分系統階段。自動評分系統所應用的范圍主要是寫作部分,這樣的評分系統受到學者和專家的質疑,但是在學生自我評估以及高風險考試中卻得到了廣泛的應用。由于自動評分系統可以節(jié)省時間、人力和物力等相關資源,并且相較于人工評分其客觀性和準確性還要更高一些。

2 基于計算機語言測試效度驗證

2.1 語言測試效度在理論方面的發(fā)展狀況

效度驗證是語言評估與測試的主要研究的對象,效度理論演變過程大致可以分為如下幾個階段:

(1)單一效度觀時期(20世紀50年代以前)。20世紀初,人們只是在收集效標關聯的效度證據,因為當時還沒有明確的效度概念。30年代出現了明確的效度概念,一項測試是否真正測量了它所要測量的東西。隨后進一步明確了效度操作化定義:一項測試分數在多大程度上估計了測試分數。效度僅僅被看作一種相關系數,因而可稱之為“單一效度觀”。

(2)分類效度觀時期(20世紀50年代~80年代中期)。隨著對效度認識的深入,人們意識到效度遠非一個相關系數那么簡單。對效度的多角度研究產生了各種效度。這些效度概念一方面說明效度的復雜性,另一方面也說明人們對效度的認識雖有深化但并未達成共識。

(3)效度整體觀時期(80年代中期至今)。一些學者認識到,人們在選擇效度證據時存在嚴重的隨意性。效度三分法是零散、不全面的,因為沒有考慮分數意義的價值含義的證據,也沒有考慮分數使用的社會后果的證據。

2.2 建立在計算機基礎之上的語言測試效度驗證

CBLT與別的語言測試相同,它也必須通過效度驗證,在充足的試驗和理論證據的支撐下才能證明其具備準確性和有效性。

(1)CBLT能使效度得到提升。①新題型可以使后果效度和測試準確性得到提升;②計算機適應性的測試技術能對被試者進行恰當測量,從而使測量準確性得到提升;③建立在認知理論基礎之上的CBLT設計能使效度得到提升;④自動評分系統相較于人工評分系統顯得更加的客觀和準確。

(2)CBLT也可能是效度降低。①測試概念的代表性降低。在對適應性題目進行選擇之時,需確保計算機程序在測量準確度、題目呈現形式、內容覆蓋面等方面保持平衡;②引入無關概念的因素,進而對測量準確性產生影響。受試者計算機技能差異以及計算機配置差異等無關概念的因素都會對受試者的測試結果產生影響;③產生一些不好的后果。使被試者的測試費用增高,使測試任務數得到極大程度的縮減;④自動評分系統還有待完善。雖然作文評分系統會按照人工評分方式來對評分程序加以設計,進而使評分客觀性和效率得到提升,但由于人們在語言工作機制認識的不足,再加上計算機自身技術的局限性,使得某些評分人員可以掌握的語言能力計算機還不能達到。

(3)建立在計算機基礎之上的語言測試效度驗證的策略。語言測試的效度理論認為,整個測試的開發(fā)以及實施與使用中都會貫穿有效度驗證。所以,在實施測試以前,需有制備一項完善的效驗計劃,并在計劃中表明每個階段所需提供的實驗和理論證據。

3 結語

綜上所述,盡管CBLT取得了一定的成就,但其所面對的挑戰(zhàn)仍舊是巨大的。除開實施技術水平和測試開發(fā)方面需要提升,最為迫切的任務便是效度驗證。最近幾年,國內外很多學者都開始關注計算機式的語言測試。同時,語言測試在計算機的適應性方賣弄也取得了一定的成就。

[1]石進芳.網絡化語言測試對成人語言學習反撥效應辨析[J].成人教育,2011(10).

[2]洪云.從紙筆測試到基于計算機的語言測試——評述大學英語四六級考試改革[J].貴州大學學報(社會科學版),2010(05).

[3]洪 云.計算機化語言測試的發(fā)展及其面臨的問題[J].中國成人教育,2010(15).

[4]車麗娟,王建偉.紙筆語言測試與計算機化語言測試的等效研究[J].東北財經大學學報,2010(03).

H319

A

1004-7344(2016)09-0282-01

2016-3-10

猜你喜歡
效度計算機測試
計算機操作系統
幽默大測試
基于計算機自然語言處理的機器翻譯技術應用與簡介
慈善募捐規(guī)制中的國家與社會:兼論《慈善法》的效度和限度
“攝問”測試
“攝問”測試
“攝問”測試
信息系統審計中計算機審計的應用
被看重感指數在中國大學生中的構念效度
外語形成性評估的效度驗證框架