中國(guó)英語能力自我評(píng)估工具的研制與開發(fā)
——基于《中國(guó)英語能力等級(jí)量表》的分析

2022-12-20 07:20:16李敏子曾用強(qiáng)

社會(huì)科學(xué)家 2022年9期

李敏子，曾用強(qiáng)

（1.廣東外語外貿(mào)大學(xué)，廣東廣州 510420；2.廣東省外語藝術(shù)職業(yè)學(xué)院，廣東廣州 510641）

《中國(guó)英語能力等級(jí)量表》（以下簡(jiǎn)稱《量表》）為我國(guó)首個(gè)統(tǒng)一的英語能力測(cè)評(píng)國(guó)家標(biāo)準(zhǔn)。作為我國(guó)英語能力測(cè)評(píng)體系的綱領(lǐng)性文件，《量表》描述語言能力發(fā)展的不同階段，是英語教學(xué)與評(píng)價(jià)目標(biāo)的參照或依據(jù)。其正式發(fā)布于2018年6月并在全國(guó)范圍實(shí)施，當(dāng)前亟待開發(fā)應(yīng)用型測(cè)評(píng)產(chǎn)品（自我評(píng)估工具）以橋接我國(guó)英語統(tǒng)一度量“標(biāo)尺”與其在實(shí)際教、學(xué)與測(cè)評(píng)中的實(shí)踐。然而，基于《量表》開發(fā)自我評(píng)估工具是一項(xiàng)較為繁雜的工作，研究者需從多方面進(jìn)行考量，包括自評(píng)工具的研發(fā)目的、測(cè)評(píng)標(biāo)準(zhǔn)的類別與表征、評(píng)估特征參數(shù)指標(biāo)、工具外在表征、評(píng)分模型等。故文章擬對(duì)基于《量表》的自我評(píng)估工具的研發(fā)路徑及步驟提出一些建議。

一、自我評(píng)估在英語教育中的重要性

外語學(xué)習(xí)、教學(xué)與應(yīng)用領(lǐng)域，和有關(guān)學(xué)習(xí)者語言能力的測(cè)評(píng)一直以來都是學(xué)者關(guān)注的核心。在外語水平能力測(cè)評(píng)方面，教育領(lǐng)域普遍使用傳統(tǒng)模式“外部測(cè)評(píng)”，即通過考試或教師評(píng)價(jià)收集學(xué)習(xí)者能力表現(xiàn)用以檢測(cè)既定目標(biāo)或任務(wù)表現(xiàn)是否達(dá)成，以此作為判定語言水平能力的[1]依據(jù)。隨著以“學(xué)習(xí)者為中心”的教學(xué)理論被廣泛接受，及對(duì)自主學(xué)習(xí)的呼吁日趨高漲，自我評(píng)估即以學(xué)習(xí)者自身為評(píng)估代理人進(jìn)行內(nèi)部自我檢驗(yàn)的方式[1]受到廣泛的關(guān)注。這種方式即通過自我導(dǎo)向，使語言學(xué)習(xí)者主動(dòng)參與、自主評(píng)價(jià)、反思其在學(xué)習(xí)過程中的進(jìn)步、判定預(yù)期目標(biāo)是否達(dá)成[2]。

目前有關(guān)自我評(píng)估在語言教、學(xué)與測(cè)評(píng)領(lǐng)域已有較多探索，現(xiàn)有研究大多集中于對(duì)自我評(píng)估有效性與效用的探討。在自我評(píng)估中，有效性具體表現(xiàn)為對(duì)學(xué)習(xí)者語言水平表現(xiàn)提供準(zhǔn)確、可靠、真實(shí)的評(píng)價(jià)。現(xiàn)有研究對(duì)自我評(píng)估作為衡量語言能力的有效測(cè)評(píng)方式給予了廣泛積極的肯定[3]。此外，自我評(píng)估在其效用層面也被深入挖掘。與傳統(tǒng)外部測(cè)評(píng)比較，自我評(píng)估具有多方面的優(yōu)勢(shì)。學(xué)習(xí)者在自評(píng)實(shí)踐中逐步提高自我評(píng)價(jià)意識(shí)，增強(qiáng)參與度，提升學(xué)習(xí)責(zé)任感，強(qiáng)化學(xué)習(xí)動(dòng)機(jī)，培養(yǎng)自主學(xué)習(xí)機(jī)制。過程中為學(xué)習(xí)者提供了全面審視自身能力的機(jī)會(huì)。學(xué)習(xí)者基于評(píng)估結(jié)果可在未來學(xué)習(xí)中做出調(diào)整與修正，從而達(dá)到促學(xué)的效用。同時(shí)，自我評(píng)估能較好規(guī)避由高風(fēng)險(xiǎn)測(cè)試引發(fā)學(xué)習(xí)者的備考或臨考焦慮、恐慌等負(fù)面情緒[4]。自我評(píng)估要求學(xué)習(xí)者在實(shí)踐中主動(dòng)參與，承擔(dān)測(cè)評(píng)主導(dǎo)地位，極大程度上節(jié)省了用于考試管理、人員配置等資源。同時(shí)，這類測(cè)評(píng)方式幫助分擔(dān)了由傳統(tǒng)外部測(cè)評(píng)帶來的較為繁瑣的工作任務(wù)（例如：檢查學(xué)生的習(xí)題作業(yè)等多項(xiàng)任務(wù)），促進(jìn)了以教師為中心至以學(xué)習(xí)者為中心教學(xué)范式的轉(zhuǎn)變，教師可依據(jù)學(xué)生自評(píng)結(jié)果調(diào)整教學(xué)進(jìn)度和課程設(shè)置，或開展針對(duì)性的補(bǔ)救性措施[5]。

二、語言能力量表

語言能力量表是語言能力標(biāo)準(zhǔn)的具體尺度。由于在不同教育背景下對(duì)語言水平能力測(cè)量統(tǒng)一度量標(biāo)準(zhǔn)的迫切呼吁，語言能力量表應(yīng)運(yùn)而生，并在語言教育領(lǐng)域獲得了廣泛的關(guān)注與肯定。其在實(shí)踐中從測(cè)評(píng)能力構(gòu)念的多維視角出發(fā)，通過具體描述代表學(xué)習(xí)者不同水平的能力表現(xiàn)特征，為外語教、學(xué)與測(cè)評(píng)等利益相關(guān)者提供了全面、透明化的統(tǒng)一參照體系。

在國(guó)家外語評(píng)估系統(tǒng)啟動(dòng)與《量表》實(shí)施之前，中國(guó)未有統(tǒng)一的外語能力評(píng)估的國(guó)家標(biāo)準(zhǔn)。盡管影響規(guī)模最大的《歐洲語言共同參考框架》（以下簡(jiǎn)稱《歐框》）[6]被廣泛引進(jìn)并應(yīng)用于中國(guó)教育背景下的語言學(xué)習(xí)，由于服務(wù)群體、語言教學(xué)環(huán)境和教育體制的差異，其在中國(guó)本土教育體系的教學(xué)與測(cè)評(píng)實(shí)踐中出現(xiàn)了不少“水土不服”的情況。故迫切需要構(gòu)建一個(gè)著眼于我國(guó)英語教育長(zhǎng)期發(fā)展和需求的、本土化的統(tǒng)一度量標(biāo)準(zhǔn)[7]。為積極響應(yīng)《國(guó)務(wù)院關(guān)于深化考試招生制度改革的實(shí)施意見》中關(guān)于“加強(qiáng)外語能力測(cè)評(píng)體系建設(shè)”的教育目標(biāo)與國(guó)內(nèi)英語教育發(fā)展實(shí)踐的迫切需求，我國(guó)于2014年10月啟動(dòng)了《中國(guó)英語能力等級(jí)量表》研制項(xiàng)目，匯集國(guó)內(nèi)外專家力量開展大規(guī)模調(diào)研[8]，構(gòu)建了適合我國(guó)英語學(xué)習(xí)者的量表框架、指標(biāo)體系、描述語庫(kù)、分級(jí)原則等。

《量表》的研制主要分為三個(gè)階段：描述語收集、分類及分級(jí)。在收集階段，采用文獻(xiàn)法，以國(guó)內(nèi)外語言能力標(biāo)準(zhǔn)、現(xiàn)有課程標(biāo)準(zhǔn)、考綱、教材等為文獻(xiàn)基礎(chǔ)對(duì)描述語進(jìn)行收集，并對(duì)于初步收集的描述語進(jìn)行拆分、整理、篩選、改寫與審核；對(duì)于構(gòu)念中缺失部分，通過采樣法進(jìn)行補(bǔ)充，構(gòu)建描述語預(yù)備庫(kù)。在分類階段，開展多次組內(nèi)審核與跨技能組交叉審核，同時(shí)組織專家與各地一線教師對(duì)描述語初步分類，并通過問卷調(diào)查進(jìn)一步驗(yàn)證。分級(jí)階段，通過大規(guī)模問卷讓專家、教師、學(xué)生進(jìn)行判斷。編制的問卷間實(shí)施橫向與縱向等值。采用Rasch模型等統(tǒng)計(jì)工具對(duì)問卷數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析、等值處理、借助臨界點(diǎn)錨定各等級(jí)，驗(yàn)證分級(jí)結(jié)果，確定各等級(jí)標(biāo)準(zhǔn)?！读勘怼芬越浑H語言能力模型為基礎(chǔ)，以語言運(yùn)用為導(dǎo)向[9]，將語言能力定義為使用者運(yùn)用所掌握的知識(shí)（語言知識(shí)與非語言知識(shí)）與策略，參與特定情境下某話題的語言活動(dòng)時(shí)所表現(xiàn)出的語言理解和表達(dá)的能力?！读勘怼犯叨汝P(guān)注聽、說、讀、寫、譯等多項(xiàng)語言技能的協(xié)調(diào)統(tǒng)一，將學(xué)習(xí)者的英語能力從低到高劃分為九個(gè)級(jí)別，全面、系統(tǒng)界定并描述了語言能力發(fā)展不同階段的特征，明確學(xué)習(xí)者應(yīng)具備的英語知識(shí)與能力[10]。

《量表》作為我國(guó)語言能力測(cè)評(píng)體系的綱領(lǐng)性文件，為我國(guó)英語教學(xué)與評(píng)價(jià)目標(biāo)提供了參照與依據(jù)。自正式發(fā)布并在全國(guó)范圍實(shí)施以來，其被廣泛應(yīng)用于具體的英語教學(xué)與測(cè)評(píng)實(shí)踐中，特別是自我評(píng)估。學(xué)習(xí)者可依據(jù)《量表》的各分項(xiàng)技能描述語對(duì)自己的語言能力進(jìn)行自我評(píng)估，找出自己的優(yōu)勢(shì)與不足，從而調(diào)整學(xué)習(xí)目標(biāo)。教師在課程設(shè)計(jì)與教學(xué)中可根據(jù)課程特色從《量表》中摘選與其內(nèi)容相匹配的描述語，開展相應(yīng)的課程活動(dòng)。過程中可以讓學(xué)習(xí)者在學(xué)前、過程中與課后分別進(jìn)行周期性自我評(píng)價(jià)、反思學(xué)習(xí)過程中的困難與取得的進(jìn)步。然而，在具體的自我評(píng)估實(shí)踐中，可以發(fā)現(xiàn)使用者大多將“能做”描述語（Can-do Statements）作為評(píng)價(jià)標(biāo)準(zhǔn)直接應(yīng)用于真實(shí)的教育環(huán)境中，自評(píng)實(shí)踐中對(duì)標(biāo)準(zhǔn)解讀容易出現(xiàn)自由度高、主觀性強(qiáng)及對(duì)先驗(yàn)知識(shí)有過強(qiáng)依賴等情況，應(yīng)用結(jié)果在效用層面有偏差。因此，開發(fā)實(shí)踐中效用性強(qiáng)的自評(píng)工具以橋接我國(guó)英語統(tǒng)一度量標(biāo)準(zhǔn)與其在教、學(xué)與測(cè)評(píng)中的應(yīng)用尤為必要。

三、基于《量表》研發(fā)自我評(píng)估工具的建議

（一）明確自我評(píng)估工具開發(fā)的目的

自我評(píng)估由于服務(wù)于不同研究目的和領(lǐng)域，各理論機(jī)制考量偏重不同，各研究背景下對(duì)其構(gòu)念的闡釋具有多樣性，故在實(shí)踐結(jié)果層面具有差異。目前有關(guān)自我評(píng)估的運(yùn)行機(jī)制主要為五類：第一類理論框架主要強(qiáng)調(diào)學(xué)習(xí)者在自我評(píng)估標(biāo)準(zhǔn)構(gòu)建中的參與[11]；第二類則偏重自我評(píng)估實(shí)踐中教師的參與程度[12]；第三類關(guān)注測(cè)評(píng)過程中教師與學(xué)生間決策權(quán)力的差異[13]；第四類理論框架則立足于自我評(píng)估標(biāo)準(zhǔn)的表征形式，對(duì)自我評(píng)估標(biāo)準(zhǔn)在實(shí)踐中的使用及效用予以詳細(xì)說明，實(shí)用性和可操作性較強(qiáng)[14]；第五類從通用視角出發(fā)，基于自我評(píng)估的實(shí)踐操作構(gòu)建理論體系，實(shí)操性較強(qiáng)[15]。以研究目的為出發(fā)點(diǎn)，自我評(píng)估主要分為兩類：第一類多從形成性視角對(duì)自我評(píng)估進(jìn)行概念化，強(qiáng)調(diào)從情感機(jī)制與心理層面對(duì)學(xué)習(xí)過程進(jìn)行評(píng)價(jià)，自我評(píng)估被廣泛定義為一種能力或?qū)W習(xí)過程，這類定義將自我評(píng)估與自我效能、自主學(xué)習(xí)、反饋與事后修正緊密關(guān)聯(lián)[16]；第二類則關(guān)注自我評(píng)估的測(cè)量結(jié)果（對(duì)能力表現(xiàn)的具體方面作出準(zhǔn)確評(píng)級(jí)或評(píng)分），探討其作為測(cè)評(píng)方式提供準(zhǔn)確的能力水平判定的價(jià)值[17]。

確定自我評(píng)估的構(gòu)念定義為基于《量表》研制自評(píng)工具的首要前提。故在工具研發(fā)前，研究者需結(jié)合研究的具體目標(biāo)與擬應(yīng)用實(shí)踐環(huán)境，明確自我評(píng)估工具開發(fā)的目的，確定采用的自我評(píng)估構(gòu)念、核心要素及其運(yùn)行機(jī)制等，以便在后續(xù)研究中對(duì)自我評(píng)估工具構(gòu)建所需實(shí)現(xiàn)的目標(biāo)提供清晰的指導(dǎo)。

（二）確定自評(píng)工具測(cè)評(píng)標(biāo)準(zhǔn)的類別與表征形式

1.自我評(píng)估工具標(biāo)準(zhǔn)類別

自我評(píng)估結(jié)果的有效性被證實(shí)與自我評(píng)估標(biāo)準(zhǔn)的具體程度緊密相關(guān)。自我評(píng)估對(duì)任務(wù)的設(shè)定或標(biāo)準(zhǔn)的描述越具體，學(xué)習(xí)者對(duì)自評(píng)工具標(biāo)準(zhǔn)的理解內(nèi)化程度越高，評(píng)判越準(zhǔn)確。以“具體化程度”為衡量標(biāo)準(zhǔn)，自我評(píng)估標(biāo)準(zhǔn)可分為“普通類”與“具化類”，“具化類”可進(jìn)一步分為“具化現(xiàn)實(shí)生活類”標(biāo)準(zhǔn)（Specific Real-life Criteria）與“具化任務(wù)類”標(biāo)準(zhǔn)（Specific-study Criteria）[18]。這三類自我評(píng)估標(biāo)準(zhǔn)在具體化程度上具有明顯差異。普通類自我評(píng)估標(biāo)準(zhǔn)常應(yīng)用于大規(guī)模研究以作節(jié)省資源考量。這類測(cè)評(píng)標(biāo)準(zhǔn)常通過單一測(cè)評(píng)問題進(jìn)行呈現(xiàn)（One Single-item Measure），基于此構(gòu)建的自評(píng)工具對(duì)學(xué)習(xí)者自評(píng)有效信息挖掘較為薄弱。相比之下，“具體現(xiàn)實(shí)生活類”自我評(píng)估標(biāo)準(zhǔn)具體化程度較高。由于其將概述的測(cè)評(píng)標(biāo)準(zhǔn)解構(gòu)為具體語言任務(wù)，極大程度上保證了學(xué)習(xí)者對(duì)測(cè)評(píng)標(biāo)準(zhǔn)中各具體維度的理解，故自我評(píng)估結(jié)果普遍具有較好的效度?！熬唧w任務(wù)類”標(biāo)準(zhǔn)對(duì)外部測(cè)評(píng)方式依賴性強(qiáng)，部分研究甚至將預(yù)測(cè)個(gè)體學(xué)習(xí)者在外部測(cè)評(píng)中正確答題數(shù)作為測(cè)評(píng)標(biāo)準(zhǔn)。這類標(biāo)準(zhǔn)與語言能力關(guān)聯(lián)弱，難以界定學(xué)習(xí)者是否據(jù)實(shí)評(píng)判自身語言能力，故在工具開發(fā)實(shí)踐中需謹(jǐn)慎使用。

2.自我評(píng)估工具標(biāo)準(zhǔn)的表征形式

自我評(píng)估工具標(biāo)準(zhǔn)的表征形式選擇對(duì)基于《量表》的自評(píng)工具建設(shè)至關(guān)重要。標(biāo)準(zhǔn)的表征形式可分為“一般類”與“參照類”：“一般類”對(duì)自我評(píng)估標(biāo)準(zhǔn)表征形式無明確要求，標(biāo)準(zhǔn)呈現(xiàn)上具有較強(qiáng)的概述性和抽象性，使用者對(duì)此類標(biāo)準(zhǔn)的解讀自由度略高，自我評(píng)估結(jié)果具有差異性；“參照類”[19]則強(qiáng)調(diào)三個(gè)方面：（1）提供明確表述的具體自評(píng)標(biāo)準(zhǔn)，將對(duì)語言能力的抽象、概括性描述拆解為多層級(jí)、多維度的典型性能力要素組件予以呈現(xiàn)，以供學(xué)習(xí)者參照和校準(zhǔn)；（2）對(duì)測(cè)評(píng)標(biāo)準(zhǔn)中核心術(shù)語提供可操作化定義，自我評(píng)估實(shí)踐中學(xué)習(xí)者需將測(cè)評(píng)標(biāo)準(zhǔn)與現(xiàn)實(shí)語言能力表現(xiàn)進(jìn)行匹配從而做出判定，提供核心術(shù)語的可操作定義將極大程度上校準(zhǔn)學(xué)習(xí)者對(duì)給定測(cè)評(píng)標(biāo)準(zhǔn)的理解；（3）提供測(cè)評(píng)標(biāo)準(zhǔn)的典型示例，示例本身需兼具典型性與普適性，避免學(xué)習(xí)者對(duì)自我評(píng)估標(biāo)準(zhǔn)產(chǎn)生認(rèn)知偏差或錯(cuò)誤解讀。

綜上，基于《量表》研發(fā)的自評(píng)工具不建議將描述語直接采納為自評(píng)標(biāo)準(zhǔn)。《量表》綜合運(yùn)用了描述交際語言能力的 RL（Real-life Approach）方法和 IA（Interactional Ability Approach）方法，對(duì)能力發(fā)展的不同學(xué)段的語言特征、語言活動(dòng)情境、語言任務(wù)的完成情況等進(jìn)行描述[20]，采用“能做描述”表征了語言能力的測(cè)評(píng)標(biāo)準(zhǔn)。受量表表征特性影響，描述語一定程度上具備概述性與抽象性。若將其直接運(yùn)用于工具標(biāo)準(zhǔn)的構(gòu)建，那么自評(píng)實(shí)踐中使用者對(duì)描述性評(píng)估標(biāo)準(zhǔn)的解讀易出現(xiàn)自由度較高與主觀性略強(qiáng)的情況，無法保證其對(duì)自身能力的準(zhǔn)確判定。因此建議研究者在對(duì)自我評(píng)估標(biāo)準(zhǔn)進(jìn)行描述時(shí)最大程度地實(shí)現(xiàn)具體化，測(cè)評(píng)任務(wù)的設(shè)定確保典型性，最大程度保障學(xué)習(xí)者對(duì)標(biāo)準(zhǔn)的熟悉和理解。具體實(shí)踐操作中，研究者可基于量表將描述性評(píng)估標(biāo)準(zhǔn)（描述語）解構(gòu)為最能反映測(cè)評(píng)語言能力構(gòu)念的系統(tǒng)化、典型性能力要素組件，形成具有層級(jí)的多維區(qū)分性測(cè)評(píng)指標(biāo)特征體系；并提供具體化“典型模型”（Model Demonstration）作為基準(zhǔn)以供學(xué)習(xí)者進(jìn)行參照與校準(zhǔn)，實(shí)踐過程中學(xué)習(xí)者據(jù)此關(guān)注自身能力的發(fā)展并在未來學(xué)習(xí)中進(jìn)行修正，可實(shí)現(xiàn)促學(xué)效用；同時(shí)結(jié)合核心特征參數(shù)的可操作化定義（Operational Definition），最大程度確保使用者對(duì)測(cè)評(píng)標(biāo)準(zhǔn)進(jìn)行正確、有效的解讀，避免由于錯(cuò)誤理解而導(dǎo)致的自我評(píng)估結(jié)果與實(shí)際能力不匹配或出現(xiàn)巨大偏差的風(fēng)險(xiǎn)。

（三）提取有效評(píng)估特征參數(shù)指標(biāo)

基于《量表》研發(fā)的自我評(píng)估工具中，提取有效評(píng)估特征參數(shù)指標(biāo)是工具構(gòu)建至關(guān)重要的一步。

在特征提?。‵eature Extraction）方法上，建議采用定性與定量結(jié)合的混合研究方法。在質(zhì)性研究中，擬通過多名相關(guān)領(lǐng)域?qū)＜一凇读勘怼返臉?gòu)念框架，采用參數(shù)分析法拆解描述語，通過迭代內(nèi)容分析與多層級(jí)主題編碼對(duì)描述語進(jìn)行分析與審核，精化和完善參數(shù)指標(biāo)體系，參數(shù)框架最大化體現(xiàn)并反映語言能力構(gòu)念的各核心要素；此外，還需制定特征提取的統(tǒng)一準(zhǔn)則以確定不同層級(jí)多維區(qū)別性特征參數(shù)（自上而下）。量化研究方面，可在基于專家意見提取區(qū)別性特征基礎(chǔ)上構(gòu)建問卷，采集大規(guī)模使用者數(shù)據(jù)，即通過不同能力水平的學(xué)習(xí)者在多維參數(shù)指標(biāo)下對(duì)自身學(xué)習(xí)情況作出的真實(shí)描述而獲取其語言能力的表現(xiàn)?；诖笠?guī)模量化數(shù)據(jù)，研究者可進(jìn)一步篩選區(qū)別性參數(shù)特征（自下而上）。

為使特征參數(shù)指標(biāo)能反映語言能力構(gòu)念在九個(gè)級(jí)別上的核心要素，特征參數(shù)指標(biāo)需具備明確性、典型性與區(qū)分度、獨(dú)立性及可操作性：

1.特征參數(shù)指標(biāo)明確性：各項(xiàng)測(cè)評(píng)參數(shù)指標(biāo)需目標(biāo)明確、表達(dá)清晰、措辭嚴(yán)謹(jǐn)，能反映該語言技能能力的評(píng)價(jià)目標(biāo)。即提供使用者“明確標(biāo)準(zhǔn)”（Clear Criteria）以提高使用者對(duì)標(biāo)準(zhǔn)的熟悉度，進(jìn)而引導(dǎo)學(xué)習(xí)者對(duì)標(biāo)準(zhǔn)多維度下各參數(shù)指標(biāo)進(jìn)行正確的解讀。此外，特征提取過程中需排除抽象或模糊的表達(dá)的特征，避免使用者因?qū)y(cè)評(píng)標(biāo)準(zhǔn)解讀的差異導(dǎo)致測(cè)評(píng)結(jié)果的偏差。

2.特征參數(shù)指標(biāo)兼具典型性與區(qū)分度：各項(xiàng)測(cè)評(píng)參數(shù)指標(biāo)需反映該語言測(cè)評(píng)能力的構(gòu)念，使指標(biāo)參數(shù)體系系統(tǒng)化，各指標(biāo)兼具典型性與區(qū)分度。具體實(shí)踐中，需注意以下幾個(gè)方面：（1）特征參數(shù)覆蓋與包含的能力層級(jí)數(shù)越多，該特征參數(shù)在不同層級(jí)的區(qū)分度越弱、對(duì)某特定級(jí)別的典型性與代表性相對(duì)弱化。（2）特征參數(shù)首次出現(xiàn)的級(jí)別被視為該特征參數(shù)在某級(jí)別對(duì)相鄰較低級(jí)別具有高區(qū)分度與典型性。（3）與量表構(gòu)建理論保持一致性，特征參數(shù)提取時(shí)高水平語言學(xué)習(xí)者能掌握低級(jí)別出現(xiàn)的特征參數(shù)。（4）難度值過高或過低的特征參數(shù)因其在級(jí)別間不具備較強(qiáng)區(qū)分力度需排除。

3.特征參數(shù)指標(biāo)獨(dú)立性：獨(dú)立性指提取的特征參數(shù)與其他特征在縱向級(jí)別上與橫向維度上都具有獨(dú)立邊界。具體實(shí)踐時(shí)需注意：（1）提取特征參數(shù)時(shí)，需連續(xù)多次比較縱向與橫向的參數(shù)及子參數(shù)，并對(duì)特征參數(shù)的重要程度（Feature Importance）進(jìn)行排序，確保參數(shù)的獨(dú)立性。（2）當(dāng)相鄰級(jí)別或多級(jí)別特征參數(shù)出現(xiàn)從屬、重疊或邊界不清晰等情況時(shí)，需謹(jǐn)慎對(duì)待。建議保留首要特征參數(shù)，刪除冗余特征。特征提取過程中如出現(xiàn)意見不一致時(shí)，需標(biāo)記并詳細(xì)記錄，后續(xù)通過專家小組多輪討論審核（Expert Review）以確定。

4.特征參數(shù)指標(biāo)可操作性：考慮到提取區(qū)別性特征參數(shù)將作為自我評(píng)估工具的評(píng)價(jià)題項(xiàng)，工具實(shí)用性需納入考量：（1）特征參數(shù)提取時(shí)需考量使用者感受（User-oriented），尤其是特征參數(shù)的易理解性、在真實(shí)語言環(huán)境中的可操作性。（2）關(guān)注特征指標(biāo)作為測(cè)評(píng)題項(xiàng)的數(shù)量。研究者在工具研發(fā)時(shí)需確保所提取的區(qū)別性特征題項(xiàng)的數(shù)量不會(huì)影響工具測(cè)評(píng)的效用與使用感。即確保題項(xiàng)數(shù)量不會(huì)過多或過少。自我評(píng)估工具包含過多的題項(xiàng)在實(shí)踐中對(duì)使用者認(rèn)知處理能力（Cognitive Processing）具有較高要求；而題項(xiàng)過少將難以衡量學(xué)習(xí)者的語言水平能力（即題項(xiàng)需足夠數(shù)量覆蓋并體現(xiàn)測(cè)評(píng)能力構(gòu)念的各核心參數(shù)）。

（四）自我評(píng)估工具的外部表征

自我評(píng)估工具的外部表征需謹(jǐn)慎選擇與設(shè)計(jì)，工具在外部表征上的差異會(huì)導(dǎo)致差異化的自我評(píng)估結(jié)果[21]。目前，常見的自我評(píng)估工具表征形式可分為四類。（1）表現(xiàn)記錄卡常用于形成性評(píng)估，工具開發(fā)過程中對(duì)自評(píng)任務(wù)的設(shè)計(jì)要求高，自評(píng)任務(wù)需具備連續(xù)性，任務(wù)難度需具備梯度。（2）自評(píng)日志多用于過程性評(píng)估。與表現(xiàn)記錄卡相比，系統(tǒng)性更強(qiáng)。在具體實(shí)踐中，這一外在表征對(duì)受試具有較高的要求。評(píng)估過程中使用者需借助一定的外部指導(dǎo)。（3）檢查表這類表征形式的使用頻率較少。自我評(píng)估檢查表的表征多為二分選項(xiàng)的設(shè)定，學(xué)習(xí)者判定較為絕對(duì)，無法多維全面挖掘?qū)W習(xí)者語言能力。基于這類表征的自我評(píng)估在結(jié)果方面較為粗糙、與實(shí)際語言能力存在一定差異。（4）計(jì)算機(jī)輔助自適應(yīng)表征是通過互聯(lián)網(wǎng)等技術(shù)對(duì)語言能力的自評(píng)實(shí)踐，在實(shí)踐層面操作性強(qiáng)。這類工具表征在建立時(shí)需對(duì)每項(xiàng)自我評(píng)估任務(wù)設(shè)定難度系數(shù)和確定難度級(jí)別，并據(jù)此將具體測(cè)評(píng)任務(wù)置于具有語言能力難度排序的系統(tǒng)中，故此類工具表征可為學(xué)習(xí)者提供較為系統(tǒng)化的評(píng)估數(shù)據(jù)。這類表征在實(shí)際操作中要求受試對(duì)平臺(tái)有一定的熟悉度，研究人員需對(duì)自我評(píng)估網(wǎng)絡(luò)系統(tǒng)的設(shè)計(jì)與搭建有嚴(yán)格把控。（5）多維李克特量表這類工具外部表征多適用于終結(jié)性評(píng)估。這類自我評(píng)估工具表征能收集大規(guī)模標(biāo)準(zhǔn)化數(shù)據(jù)，并將數(shù)據(jù)最大程度簡(jiǎn)化用于后期統(tǒng)計(jì)分析。此外，多維李克特量表的表征形式為研究者基于《量表》設(shè)定分層多維的測(cè)評(píng)標(biāo)準(zhǔn)提供了空間，幫助個(gè)體學(xué)習(xí)者挖掘語言能力各方面的診斷信息，在后續(xù)的學(xué)習(xí)過程中開展補(bǔ)救性措施與修正，真正發(fā)揮自我評(píng)估工具“以評(píng)促學(xué)”與“為學(xué)習(xí)服務(wù)”的功效。

（五）結(jié)合數(shù)統(tǒng)模型確定自評(píng)工具的評(píng)分模型

結(jié)合數(shù)統(tǒng)模型確定自評(píng)工具的評(píng)分模型是基于量表構(gòu)建有效自評(píng)工具的核心步驟。在工具評(píng)分層面，服務(wù)于形成性評(píng)估目的表征類目偏重學(xué)習(xí)過程。與服務(wù)于終結(jié)性評(píng)估為目的的表征相比，這幾類表征對(duì)自我評(píng)估結(jié)果的精度關(guān)注不足，大部分研究者并未在研究中匯報(bào)具體的評(píng)分方式?，F(xiàn)有研究中部分自評(píng)工具采用了二分項(xiàng)評(píng)分模型。這類基于“是或否”的二維能力判別評(píng)分方式在自評(píng)實(shí)踐中無法系統(tǒng)化挖掘?qū)W習(xí)者能力的具體信息、學(xué)習(xí)者在自評(píng)實(shí)踐中對(duì)測(cè)評(píng)標(biāo)準(zhǔn)的理解校準(zhǔn)弱。學(xué)習(xí)者據(jù)此評(píng)分方式無法從多元視角關(guān)注到自身能力的發(fā)展，自評(píng)的結(jié)果較為粗糙，對(duì)語言學(xué)習(xí)的積極反撥和促學(xué)效用弱。此外，部分研究對(duì)自評(píng)題項(xiàng)直接采用等值計(jì)分，少部分研究基于研究者理念對(duì)不同自評(píng)題項(xiàng)進(jìn)行權(quán)重賦值，或設(shè)立閾值，但遺憾的是權(quán)重賦值或閾值設(shè)定主觀性強(qiáng)，未能予以清晰的闡明。

基于《量表》的評(píng)分模型在選擇上需兼具考量數(shù)據(jù)結(jié)構(gòu)、超參數(shù)、模型預(yù)測(cè)精度及測(cè)評(píng)標(biāo)準(zhǔn)的表征。故推薦使用監(jiān)督性學(xué)習(xí)多元分類模型進(jìn)行建模。這類模型多用于解決多類別、多層級(jí)參數(shù)指標(biāo)的運(yùn)算，能有效簡(jiǎn)化系統(tǒng)結(jié)構(gòu)，探討系統(tǒng)內(nèi)核。同時(shí)模型對(duì)收集的大規(guī)模特征數(shù)據(jù)進(jìn)行分類，構(gòu)造預(yù)測(cè)模型。這類模型較好地契合了基于《量表》研發(fā)自評(píng)工具中構(gòu)建評(píng)分系統(tǒng)的需求，模型數(shù)據(jù)結(jié)構(gòu)上滿足了特征參數(shù)分層多維的表征形式。此外，對(duì)核心參數(shù)組合進(jìn)行建模，通過創(chuàng)建多個(gè)預(yù)測(cè)變量組合，探索各核心參數(shù)下多項(xiàng)區(qū)別性特征參數(shù)與不同語言能力層級(jí)的關(guān)系，預(yù)測(cè)英語學(xué)習(xí)者的水平能力，評(píng)估各區(qū)別性特征參數(shù)對(duì)不同水平力學(xué)習(xí)者的區(qū)分強(qiáng)度與難度。基于此，學(xué)習(xí)者可從多維視角挖掘自身語言能力各方面的診斷信息，在后續(xù)的學(xué)習(xí)中進(jìn)行修正，真正發(fā)揮自我評(píng)估工具“以評(píng)促學(xué)”的效用。需注意的是，部分模型在建模過程中，會(huì)把數(shù)據(jù)分為建模實(shí)驗(yàn)數(shù)據(jù)集及與驗(yàn)證集。在建模方法選定的時(shí)候，模型只有在試驗(yàn)集與驗(yàn)證機(jī)模型擬合度都較好的情況才能被判定為最優(yōu)模型。

四、結(jié)語

文章在回顧現(xiàn)有自我評(píng)估工具和語言能力等級(jí)量表文獻(xiàn)的基礎(chǔ)上，對(duì)基于《中國(guó)英語能力等級(jí)量表》的自我評(píng)估工具的研發(fā)路徑及步驟提出一些建議（如圖1所示）?；凇读勘怼费邪l(fā)自我評(píng)估工具，研究者首先需明確工具開發(fā)在真實(shí)語言環(huán)境應(yīng)用的目的。在工具測(cè)評(píng)標(biāo)準(zhǔn)的類別與表征方面，建議研究者以量表為框架，將描述性評(píng)估標(biāo)準(zhǔn)拆解為最能反映測(cè)評(píng)語言能力構(gòu)念的多維、典型性能力要素組件，形成具有層級(jí)的多維區(qū)分性測(cè)評(píng)指標(biāo)體系，有效規(guī)避由于使用者對(duì)測(cè)評(píng)標(biāo)準(zhǔn)理解偏差而導(dǎo)致的測(cè)評(píng)結(jié)果誤差。構(gòu)建自我評(píng)估評(píng)價(jià)項(xiàng)目時(shí)，需著重關(guān)注特征參數(shù)的明確性、典型性、區(qū)分強(qiáng)度、獨(dú)立性及可操作性。此外，工具的外部表征選擇與評(píng)分模型構(gòu)建時(shí)需綜合考量數(shù)據(jù)結(jié)構(gòu)、超參數(shù)問題、模型預(yù)測(cè)精度及測(cè)評(píng)標(biāo)準(zhǔn)的表征。

圖1 基于《量表》的自我評(píng)估工具研制步驟

目前，基于《量表》研發(fā)自我評(píng)估工具還處于初始階段，未來期望有更多的研究基于《量表》研發(fā)實(shí)踐中效用性強(qiáng)的自我評(píng)估工具以橋接我國(guó)英語統(tǒng)一度量標(biāo)準(zhǔn)與其在實(shí)際教育環(huán)境中的實(shí)踐。工具的研發(fā)期望能為使用者提供有價(jià)值的能力反饋信息，幫助其清晰定位、認(rèn)知不同學(xué)段對(duì)語言技能的要求，結(jié)合在不同情境中的具體實(shí)踐進(jìn)行反思，有助于全面審視自身語言能力的發(fā)展。在教學(xué)與課程設(shè)計(jì)方面，教師可將基于《量表》研發(fā)的自我評(píng)估工具中具體特征參數(shù)指標(biāo)與課程中語言運(yùn)用的實(shí)際需求進(jìn)行有機(jī)結(jié)合，有針對(duì)性設(shè)置與規(guī)劃教學(xué)要點(diǎn)與內(nèi)容。同時(shí)，教師可以進(jìn)一步將其融入情境化教學(xué)中，設(shè)計(jì)更加貼近語言能力運(yùn)用的真實(shí)場(chǎng)景的活動(dòng)任務(wù)。測(cè)評(píng)方面，基于《量表》研發(fā)的自我評(píng)估工具可促進(jìn)教學(xué)中形成性評(píng)價(jià)的有效開展，制定學(xué)習(xí)者個(gè)性化的課程形成性評(píng)估檔案袋。自評(píng)實(shí)踐中，學(xué)習(xí)者處于測(cè)評(píng)主導(dǎo)地位，逐漸提升學(xué)習(xí)責(zé)任感，培養(yǎng)了自主學(xué)習(xí)的機(jī)制，提高學(xué)習(xí)動(dòng)機(jī)，從而達(dá)到以評(píng)促學(xué)的效用。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

中國(guó)英語能力自我評(píng)估工具的研制與開發(fā)——基于《中國(guó)英語能力等級(jí)量表》的分析

一、自我評(píng)估在英語教育中的重要性

二、語言能力量表

三、基于《量表》研發(fā)自我評(píng)估工具的建議