国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

中國(guó)英語能力自我評(píng)估工具的研制與開發(fā)
——基于《中國(guó)英語能力等級(jí)量表》的分析

2022-12-20 07:20:16李敏子曾用強(qiáng)
社會(huì)科學(xué)家 2022年9期
關(guān)鍵詞:特征參數(shù)工具學(xué)習(xí)者

李敏子,曾用強(qiáng)

(1.廣東外語外貿(mào)大學(xué),廣東 廣州 510420;2.廣東省外語藝術(shù)職業(yè)學(xué)院,廣東 廣州 510641)

《中國(guó)英語能力等級(jí)量表》(以下簡(jiǎn)稱《量表》)為我國(guó)首個(gè)統(tǒng)一的英語能力測(cè)評(píng)國(guó)家標(biāo)準(zhǔn)。作為我國(guó)英語能力測(cè)評(píng)體系的綱領(lǐng)性文件,《量表》描述語言能力發(fā)展的不同階段,是英語教學(xué)與評(píng)價(jià)目標(biāo)的參照或依據(jù)。其正式發(fā)布于2018年6月并在全國(guó)范圍實(shí)施,當(dāng)前亟待開發(fā)應(yīng)用型測(cè)評(píng)產(chǎn)品(自我評(píng)估工具)以橋接我國(guó)英語統(tǒng)一度量“標(biāo)尺”與其在實(shí)際教、學(xué)與測(cè)評(píng)中的實(shí)踐。然而,基于《量表》開發(fā)自我評(píng)估工具是一項(xiàng)較為繁雜的工作,研究者需從多方面進(jìn)行考量,包括自評(píng)工具的研發(fā)目的、測(cè)評(píng)標(biāo)準(zhǔn)的類別與表征、評(píng)估特征參數(shù)指標(biāo)、工具外在表征、評(píng)分模型等。故文章擬對(duì)基于《量表》的自我評(píng)估工具的研發(fā)路徑及步驟提出一些建議。

一、自我評(píng)估在英語教育中的重要性

外語學(xué)習(xí)、教學(xué)與應(yīng)用領(lǐng)域,和有關(guān)學(xué)習(xí)者語言能力的測(cè)評(píng)一直以來都是學(xué)者關(guān)注的核心。在外語水平能力測(cè)評(píng)方面,教育領(lǐng)域普遍使用傳統(tǒng)模式“外部測(cè)評(píng)”,即通過考試或教師評(píng)價(jià)收集學(xué)習(xí)者能力表現(xiàn)用以檢測(cè)既定目標(biāo)或任務(wù)表現(xiàn)是否達(dá)成,以此作為判定語言水平能力的[1]依據(jù)。隨著以“學(xué)習(xí)者為中心”的教學(xué)理論被廣泛接受,及對(duì)自主學(xué)習(xí)的呼吁日趨高漲,自我評(píng)估即以學(xué)習(xí)者自身為評(píng)估代理人進(jìn)行內(nèi)部自我檢驗(yàn)的方式[1]受到廣泛的關(guān)注。這種方式即通過自我導(dǎo)向,使語言學(xué)習(xí)者主動(dòng)參與、自主評(píng)價(jià)、反思其在學(xué)習(xí)過程中的進(jìn)步、判定預(yù)期目標(biāo)是否達(dá)成[2]。

目前有關(guān)自我評(píng)估在語言教、學(xué)與測(cè)評(píng)領(lǐng)域已有較多探索,現(xiàn)有研究大多集中于對(duì)自我評(píng)估有效性與效用的探討。在自我評(píng)估中,有效性具體表現(xiàn)為對(duì)學(xué)習(xí)者語言水平表現(xiàn)提供準(zhǔn)確、可靠、真實(shí)的評(píng)價(jià)。現(xiàn)有研究對(duì)自我評(píng)估作為衡量語言能力的有效測(cè)評(píng)方式給予了廣泛積極的肯定[3]。此外,自我評(píng)估在其效用層面也被深入挖掘。與傳統(tǒng)外部測(cè)評(píng)比較,自我評(píng)估具有多方面的優(yōu)勢(shì)。學(xué)習(xí)者在自評(píng)實(shí)踐中逐步提高自我評(píng)價(jià)意識(shí),增強(qiáng)參與度,提升學(xué)習(xí)責(zé)任感,強(qiáng)化學(xué)習(xí)動(dòng)機(jī),培養(yǎng)自主學(xué)習(xí)機(jī)制。過程中為學(xué)習(xí)者提供了全面審視自身能力的機(jī)會(huì)。學(xué)習(xí)者基于評(píng)估結(jié)果可在未來學(xué)習(xí)中做出調(diào)整與修正,從而達(dá)到促學(xué)的效用。同時(shí),自我評(píng)估能較好規(guī)避由高風(fēng)險(xiǎn)測(cè)試引發(fā)學(xué)習(xí)者的備考或臨考焦慮、恐慌等負(fù)面情緒[4]。自我評(píng)估要求學(xué)習(xí)者在實(shí)踐中主動(dòng)參與,承擔(dān)測(cè)評(píng)主導(dǎo)地位,極大程度上節(jié)省了用于考試管理、人員配置等資源。同時(shí),這類測(cè)評(píng)方式幫助分擔(dān)了由傳統(tǒng)外部測(cè)評(píng)帶來的較為繁瑣的工作任務(wù)(例如:檢查學(xué)生的習(xí)題作業(yè)等多項(xiàng)任務(wù)),促進(jìn)了以教師為中心至以學(xué)習(xí)者為中心教學(xué)范式的轉(zhuǎn)變,教師可依據(jù)學(xué)生自評(píng)結(jié)果調(diào)整教學(xué)進(jìn)度和課程設(shè)置,或開展針對(duì)性的補(bǔ)救性措施[5]。

二、語言能力量表

語言能力量表是語言能力標(biāo)準(zhǔn)的具體尺度。由于在不同教育背景下對(duì)語言水平能力測(cè)量統(tǒng)一度量標(biāo)準(zhǔn)的迫切呼吁,語言能力量表應(yīng)運(yùn)而生,并在語言教育領(lǐng)域獲得了廣泛的關(guān)注與肯定。其在實(shí)踐中從測(cè)評(píng)能力構(gòu)念的多維視角出發(fā),通過具體描述代表學(xué)習(xí)者不同水平的能力表現(xiàn)特征,為外語教、學(xué)與測(cè)評(píng)等利益相關(guān)者提供了全面、透明化的統(tǒng)一參照體系。

在國(guó)家外語評(píng)估系統(tǒng)啟動(dòng)與《量表》實(shí)施之前,中國(guó)未有統(tǒng)一的外語能力評(píng)估的國(guó)家標(biāo)準(zhǔn)。盡管影響規(guī)模最大的《歐洲語言共同參考框架》(以下簡(jiǎn)稱《歐框》)[6]被廣泛引進(jìn)并應(yīng)用于中國(guó)教育背景下的語言學(xué)習(xí),由于服務(wù)群體、語言教學(xué)環(huán)境和教育體制的差異,其在中國(guó)本土教育體系的教學(xué)與測(cè)評(píng)實(shí)踐中出現(xiàn)了不少“水土不服”的情況。故迫切需要構(gòu)建一個(gè)著眼于我國(guó)英語教育長(zhǎng)期發(fā)展和需求的、本土化的統(tǒng)一度量標(biāo)準(zhǔn)[7]。為積極響應(yīng)《國(guó)務(wù)院關(guān)于深化考試招生制度改革的實(shí)施意見》中關(guān)于“加強(qiáng)外語能力測(cè)評(píng)體系建設(shè)”的教育目標(biāo)與國(guó)內(nèi)英語教育發(fā)展實(shí)踐的迫切需求,我國(guó)于2014年10月啟動(dòng)了《中國(guó)英語能力等級(jí)量表》研制項(xiàng)目,匯集國(guó)內(nèi)外專家力量開展大規(guī)模調(diào)研[8],構(gòu)建了適合我國(guó)英語學(xué)習(xí)者的量表框架、指標(biāo)體系、描述語庫(kù)、分級(jí)原則等。

《量表》的研制主要分為三個(gè)階段:描述語收集、分類及分級(jí)。在收集階段,采用文獻(xiàn)法,以國(guó)內(nèi)外語言能力標(biāo)準(zhǔn)、現(xiàn)有課程標(biāo)準(zhǔn)、考綱、教材等為文獻(xiàn)基礎(chǔ)對(duì)描述語進(jìn)行收集,并對(duì)于初步收集的描述語進(jìn)行拆分、整理、篩選、改寫與審核;對(duì)于構(gòu)念中缺失部分,通過采樣法進(jìn)行補(bǔ)充,構(gòu)建描述語預(yù)備庫(kù)。在分類階段,開展多次組內(nèi)審核與跨技能組交叉審核,同時(shí)組織專家與各地一線教師對(duì)描述語初步分類,并通過問卷調(diào)查進(jìn)一步驗(yàn)證。分級(jí)階段,通過大規(guī)模問卷讓專家、教師、學(xué)生進(jìn)行判斷。編制的問卷間實(shí)施橫向與縱向等值。采用Rasch模型等統(tǒng)計(jì)工具對(duì)問卷數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析、等值處理、借助臨界點(diǎn)錨定各等級(jí),驗(yàn)證分級(jí)結(jié)果,確定各等級(jí)標(biāo)準(zhǔn)?!读勘怼芬越浑H語言能力模型為基礎(chǔ),以語言運(yùn)用為導(dǎo)向[9],將語言能力定義為使用者運(yùn)用所掌握的知識(shí)(語言知識(shí)與非語言知識(shí))與策略,參與特定情境下某話題的語言活動(dòng)時(shí)所表現(xiàn)出的語言理解和表達(dá)的能力?!读勘怼犯叨汝P(guān)注聽、說、讀、寫、譯等多項(xiàng)語言技能的協(xié)調(diào)統(tǒng)一,將學(xué)習(xí)者的英語能力從低到高劃分為九個(gè)級(jí)別,全面、系統(tǒng)界定并描述了語言能力發(fā)展不同階段的特征,明確學(xué)習(xí)者應(yīng)具備的英語知識(shí)與能力[10]。

《量表》作為我國(guó)語言能力測(cè)評(píng)體系的綱領(lǐng)性文件,為我國(guó)英語教學(xué)與評(píng)價(jià)目標(biāo)提供了參照與依據(jù)。自正式發(fā)布并在全國(guó)范圍實(shí)施以來,其被廣泛應(yīng)用于具體的英語教學(xué)與測(cè)評(píng)實(shí)踐中,特別是自我評(píng)估。學(xué)習(xí)者可依據(jù)《量表》的各分項(xiàng)技能描述語對(duì)自己的語言能力進(jìn)行自我評(píng)估,找出自己的優(yōu)勢(shì)與不足,從而調(diào)整學(xué)習(xí)目標(biāo)。教師在課程設(shè)計(jì)與教學(xué)中可根據(jù)課程特色從《量表》中摘選與其內(nèi)容相匹配的描述語,開展相應(yīng)的課程活動(dòng)。過程中可以讓學(xué)習(xí)者在學(xué)前、過程中與課后分別進(jìn)行周期性自我評(píng)價(jià)、反思學(xué)習(xí)過程中的困難與取得的進(jìn)步。然而,在具體的自我評(píng)估實(shí)踐中,可以發(fā)現(xiàn)使用者大多將“能做”描述語(Can-do Statements)作為評(píng)價(jià)標(biāo)準(zhǔn)直接應(yīng)用于真實(shí)的教育環(huán)境中,自評(píng)實(shí)踐中對(duì)標(biāo)準(zhǔn)解讀容易出現(xiàn)自由度高、主觀性強(qiáng)及對(duì)先驗(yàn)知識(shí)有過強(qiáng)依賴等情況,應(yīng)用結(jié)果在效用層面有偏差。因此,開發(fā)實(shí)踐中效用性強(qiáng)的自評(píng)工具以橋接我國(guó)英語統(tǒng)一度量標(biāo)準(zhǔn)與其在教、學(xué)與測(cè)評(píng)中的應(yīng)用尤為必要。

三、基于《量表》研發(fā)自我評(píng)估工具的建議

(一)明確自我評(píng)估工具開發(fā)的目的

自我評(píng)估由于服務(wù)于不同研究目的和領(lǐng)域,各理論機(jī)制考量偏重不同,各研究背景下對(duì)其構(gòu)念的闡釋具有多樣性,故在實(shí)踐結(jié)果層面具有差異。目前有關(guān)自我評(píng)估的運(yùn)行機(jī)制主要為五類:第一類理論框架主要強(qiáng)調(diào)學(xué)習(xí)者在自我評(píng)估標(biāo)準(zhǔn)構(gòu)建中的參與[11];第二類則偏重自我評(píng)估實(shí)踐中教師的參與程度[12];第三類關(guān)注測(cè)評(píng)過程中教師與學(xué)生間決策權(quán)力的差異[13];第四類理論框架則立足于自我評(píng)估標(biāo)準(zhǔn)的表征形式,對(duì)自我評(píng)估標(biāo)準(zhǔn)在實(shí)踐中的使用及效用予以詳細(xì)說明,實(shí)用性和可操作性較強(qiáng)[14];第五類從通用視角出發(fā),基于自我評(píng)估的實(shí)踐操作構(gòu)建理論體系,實(shí)操性較強(qiáng)[15]。以研究目的為出發(fā)點(diǎn),自我評(píng)估主要分為兩類:第一類多從形成性視角對(duì)自我評(píng)估進(jìn)行概念化,強(qiáng)調(diào)從情感機(jī)制與心理層面對(duì)學(xué)習(xí)過程進(jìn)行評(píng)價(jià),自我評(píng)估被廣泛定義為一種能力或?qū)W習(xí)過程,這類定義將自我評(píng)估與自我效能、自主學(xué)習(xí)、反饋與事后修正緊密關(guān)聯(lián)[16];第二類則關(guān)注自我評(píng)估的測(cè)量結(jié)果(對(duì)能力表現(xiàn)的具體方面作出準(zhǔn)確評(píng)級(jí)或評(píng)分),探討其作為測(cè)評(píng)方式提供準(zhǔn)確的能力水平判定的價(jià)值[17]。

確定自我評(píng)估的構(gòu)念定義為基于《量表》研制自評(píng)工具的首要前提。故在工具研發(fā)前,研究者需結(jié)合研究的具體目標(biāo)與擬應(yīng)用實(shí)踐環(huán)境,明確自我評(píng)估工具開發(fā)的目的,確定采用的自我評(píng)估構(gòu)念、核心要素及其運(yùn)行機(jī)制等,以便在后續(xù)研究中對(duì)自我評(píng)估工具構(gòu)建所需實(shí)現(xiàn)的目標(biāo)提供清晰的指導(dǎo)。

(二)確定自評(píng)工具測(cè)評(píng)標(biāo)準(zhǔn)的類別與表征形式

1.自我評(píng)估工具標(biāo)準(zhǔn)類別

自我評(píng)估結(jié)果的有效性被證實(shí)與自我評(píng)估標(biāo)準(zhǔn)的具體程度緊密相關(guān)。自我評(píng)估對(duì)任務(wù)的設(shè)定或標(biāo)準(zhǔn)的描述越具體,學(xué)習(xí)者對(duì)自評(píng)工具標(biāo)準(zhǔn)的理解內(nèi)化程度越高,評(píng)判越準(zhǔn)確。以“具體化程度”為衡量標(biāo)準(zhǔn),自我評(píng)估標(biāo)準(zhǔn)可分為“普通類”與“具化類”,“具化類”可進(jìn)一步分為“具化現(xiàn)實(shí)生活類”標(biāo)準(zhǔn)(Specific Real-life Criteria)與“具化任務(wù)類”標(biāo)準(zhǔn)(Specific-study Criteria)[18]。這三類自我評(píng)估標(biāo)準(zhǔn)在具體化程度上具有明顯差異。普通類自我評(píng)估標(biāo)準(zhǔn)常應(yīng)用于大規(guī)模研究以作節(jié)省資源考量。這類測(cè)評(píng)標(biāo)準(zhǔn)常通過單一測(cè)評(píng)問題進(jìn)行呈現(xiàn)(One Single-item Measure),基于此構(gòu)建的自評(píng)工具對(duì)學(xué)習(xí)者自評(píng)有效信息挖掘較為薄弱。相比之下,“具體現(xiàn)實(shí)生活類”自我評(píng)估標(biāo)準(zhǔn)具體化程度較高。由于其將概述的測(cè)評(píng)標(biāo)準(zhǔn)解構(gòu)為具體語言任務(wù),極大程度上保證了學(xué)習(xí)者對(duì)測(cè)評(píng)標(biāo)準(zhǔn)中各具體維度的理解,故自我評(píng)估結(jié)果普遍具有較好的效度?!熬唧w任務(wù)類”標(biāo)準(zhǔn)對(duì)外部測(cè)評(píng)方式依賴性強(qiáng),部分研究甚至將預(yù)測(cè)個(gè)體學(xué)習(xí)者在外部測(cè)評(píng)中正確答題數(shù)作為測(cè)評(píng)標(biāo)準(zhǔn)。這類標(biāo)準(zhǔn)與語言能力關(guān)聯(lián)弱,難以界定學(xué)習(xí)者是否據(jù)實(shí)評(píng)判自身語言能力,故在工具開發(fā)實(shí)踐中需謹(jǐn)慎使用。

2.自我評(píng)估工具標(biāo)準(zhǔn)的表征形式

自我評(píng)估工具標(biāo)準(zhǔn)的表征形式選擇對(duì)基于《量表》的自評(píng)工具建設(shè)至關(guān)重要。標(biāo)準(zhǔn)的表征形式可分為“一般類”與“參照類”:“一般類”對(duì)自我評(píng)估標(biāo)準(zhǔn)表征形式無明確要求,標(biāo)準(zhǔn)呈現(xiàn)上具有較強(qiáng)的概述性和抽象性,使用者對(duì)此類標(biāo)準(zhǔn)的解讀自由度略高,自我評(píng)估結(jié)果具有差異性;“參照類”[19]則強(qiáng)調(diào)三個(gè)方面:(1)提供明確表述的具體自評(píng)標(biāo)準(zhǔn),將對(duì)語言能力的抽象、概括性描述拆解為多層級(jí)、多維度的典型性能力要素組件予以呈現(xiàn),以供學(xué)習(xí)者參照和校準(zhǔn);(2)對(duì)測(cè)評(píng)標(biāo)準(zhǔn)中核心術(shù)語提供可操作化定義,自我評(píng)估實(shí)踐中學(xué)習(xí)者需將測(cè)評(píng)標(biāo)準(zhǔn)與現(xiàn)實(shí)語言能力表現(xiàn)進(jìn)行匹配從而做出判定,提供核心術(shù)語的可操作定義將極大程度上校準(zhǔn)學(xué)習(xí)者對(duì)給定測(cè)評(píng)標(biāo)準(zhǔn)的理解;(3)提供測(cè)評(píng)標(biāo)準(zhǔn)的典型示例,示例本身需兼具典型性與普適性,避免學(xué)習(xí)者對(duì)自我評(píng)估標(biāo)準(zhǔn)產(chǎn)生認(rèn)知偏差或錯(cuò)誤解讀。

綜上,基于《量表》研發(fā)的自評(píng)工具不建議將描述語直接采納為自評(píng)標(biāo)準(zhǔn)。《量表》綜合運(yùn)用了描述交際語言能力的 RL(Real-life Approach)方法和 IA(Interactional Ability Approach)方法,對(duì)能力發(fā)展的不同學(xué)段的語言特征、語言活動(dòng)情境、語言任務(wù)的完成情況等進(jìn)行描述[20],采用“能做描述”表征了語言能力的測(cè)評(píng)標(biāo)準(zhǔn)。受量表表征特性影響,描述語一定程度上具備概述性與抽象性。若將其直接運(yùn)用于工具標(biāo)準(zhǔn)的構(gòu)建,那么自評(píng)實(shí)踐中使用者對(duì)描述性評(píng)估標(biāo)準(zhǔn)的解讀易出現(xiàn)自由度較高與主觀性略強(qiáng)的情況,無法保證其對(duì)自身能力的準(zhǔn)確判定。因此建議研究者在對(duì)自我評(píng)估標(biāo)準(zhǔn)進(jìn)行描述時(shí)最大程度地實(shí)現(xiàn)具體化,測(cè)評(píng)任務(wù)的設(shè)定確保典型性,最大程度保障學(xué)習(xí)者對(duì)標(biāo)準(zhǔn)的熟悉和理解。具體實(shí)踐操作中,研究者可基于量表將描述性評(píng)估標(biāo)準(zhǔn)(描述語)解構(gòu)為最能反映測(cè)評(píng)語言能力構(gòu)念的系統(tǒng)化、典型性能力要素組件,形成具有層級(jí)的多維區(qū)分性測(cè)評(píng)指標(biāo)特征體系;并提供具體化“典型模型”(Model Demonstration)作為基準(zhǔn)以供學(xué)習(xí)者進(jìn)行參照與校準(zhǔn),實(shí)踐過程中學(xué)習(xí)者據(jù)此關(guān)注自身能力的發(fā)展并在未來學(xué)習(xí)中進(jìn)行修正,可實(shí)現(xiàn)促學(xué)效用;同時(shí)結(jié)合核心特征參數(shù)的可操作化定義(Operational Definition),最大程度確保使用者對(duì)測(cè)評(píng)標(biāo)準(zhǔn)進(jìn)行正確、有效的解讀,避免由于錯(cuò)誤理解而導(dǎo)致的自我評(píng)估結(jié)果與實(shí)際能力不匹配或出現(xiàn)巨大偏差的風(fēng)險(xiǎn)。

(三)提取有效評(píng)估特征參數(shù)指標(biāo)

基于《量表》研發(fā)的自我評(píng)估工具中,提取有效評(píng)估特征參數(shù)指標(biāo)是工具構(gòu)建至關(guān)重要的一步。

在特征提?。‵eature Extraction)方法上,建議采用定性與定量結(jié)合的混合研究方法。在質(zhì)性研究中,擬通過多名相關(guān)領(lǐng)域?qū)<一凇读勘怼返臉?gòu)念框架,采用參數(shù)分析法拆解描述語,通過迭代內(nèi)容分析與多層級(jí)主題編碼對(duì)描述語進(jìn)行分析與審核,精化和完善參數(shù)指標(biāo)體系,參數(shù)框架最大化體現(xiàn)并反映語言能力構(gòu)念的各核心要素;此外,還需制定特征提取的統(tǒng)一準(zhǔn)則以確定不同層級(jí)多維區(qū)別性特征參數(shù)(自上而下)。量化研究方面,可在基于專家意見提取區(qū)別性特征基礎(chǔ)上構(gòu)建問卷,采集大規(guī)模使用者數(shù)據(jù),即通過不同能力水平的學(xué)習(xí)者在多維參數(shù)指標(biāo)下對(duì)自身學(xué)習(xí)情況作出的真實(shí)描述而獲取其語言能力的表現(xiàn)?;诖笠?guī)模量化數(shù)據(jù),研究者可進(jìn)一步篩選區(qū)別性參數(shù)特征(自下而上)。

為使特征參數(shù)指標(biāo)能反映語言能力構(gòu)念在九個(gè)級(jí)別上的核心要素,特征參數(shù)指標(biāo)需具備明確性、典型性與區(qū)分度、獨(dú)立性及可操作性:

1.特征參數(shù)指標(biāo)明確性:各項(xiàng)測(cè)評(píng)參數(shù)指標(biāo)需目標(biāo)明確、表達(dá)清晰、措辭嚴(yán)謹(jǐn),能反映該語言技能能力的評(píng)價(jià)目標(biāo)。即提供使用者“明確標(biāo)準(zhǔn)”(Clear Criteria)以提高使用者對(duì)標(biāo)準(zhǔn)的熟悉度,進(jìn)而引導(dǎo)學(xué)習(xí)者對(duì)標(biāo)準(zhǔn)多維度下各參數(shù)指標(biāo)進(jìn)行正確的解讀。此外,特征提取過程中需排除抽象或模糊的表達(dá)的特征,避免使用者因?qū)y(cè)評(píng)標(biāo)準(zhǔn)解讀的差異導(dǎo)致測(cè)評(píng)結(jié)果的偏差。

2.特征參數(shù)指標(biāo)兼具典型性與區(qū)分度:各項(xiàng)測(cè)評(píng)參數(shù)指標(biāo)需反映該語言測(cè)評(píng)能力的構(gòu)念,使指標(biāo)參數(shù)體系系統(tǒng)化,各指標(biāo)兼具典型性與區(qū)分度。具體實(shí)踐中,需注意以下幾個(gè)方面:(1)特征參數(shù)覆蓋與包含的能力層級(jí)數(shù)越多,該特征參數(shù)在不同層級(jí)的區(qū)分度越弱、對(duì)某特定級(jí)別的典型性與代表性相對(duì)弱化。(2)特征參數(shù)首次出現(xiàn)的級(jí)別被視為該特征參數(shù)在某級(jí)別對(duì)相鄰較低級(jí)別具有高區(qū)分度與典型性。(3)與量表構(gòu)建理論保持一致性,特征參數(shù)提取時(shí)高水平語言學(xué)習(xí)者能掌握低級(jí)別出現(xiàn)的特征參數(shù)。(4)難度值過高或過低的特征參數(shù)因其在級(jí)別間不具備較強(qiáng)區(qū)分力度需排除。

3.特征參數(shù)指標(biāo)獨(dú)立性:獨(dú)立性指提取的特征參數(shù)與其他特征在縱向級(jí)別上與橫向維度上都具有獨(dú)立邊界。具體實(shí)踐時(shí)需注意:(1)提取特征參數(shù)時(shí),需連續(xù)多次比較縱向與橫向的參數(shù)及子參數(shù),并對(duì)特征參數(shù)的重要程度(Feature Importance)進(jìn)行排序,確保參數(shù)的獨(dú)立性。(2)當(dāng)相鄰級(jí)別或多級(jí)別特征參數(shù)出現(xiàn)從屬、重疊或邊界不清晰等情況時(shí),需謹(jǐn)慎對(duì)待。建議保留首要特征參數(shù),刪除冗余特征。特征提取過程中如出現(xiàn)意見不一致時(shí),需標(biāo)記并詳細(xì)記錄,后續(xù)通過專家小組多輪討論審核(Expert Review)以確定。

4.特征參數(shù)指標(biāo)可操作性:考慮到提取區(qū)別性特征參數(shù)將作為自我評(píng)估工具的評(píng)價(jià)題項(xiàng),工具實(shí)用性需納入考量:(1)特征參數(shù)提取時(shí)需考量使用者感受(User-oriented),尤其是特征參數(shù)的易理解性、在真實(shí)語言環(huán)境中的可操作性。(2)關(guān)注特征指標(biāo)作為測(cè)評(píng)題項(xiàng)的數(shù)量。研究者在工具研發(fā)時(shí)需確保所提取的區(qū)別性特征題項(xiàng)的數(shù)量不會(huì)影響工具測(cè)評(píng)的效用與使用感。即確保題項(xiàng)數(shù)量不會(huì)過多或過少。自我評(píng)估工具包含過多的題項(xiàng)在實(shí)踐中對(duì)使用者認(rèn)知處理能力(Cognitive Processing)具有較高要求;而題項(xiàng)過少將難以衡量學(xué)習(xí)者的語言水平能力(即題項(xiàng)需足夠數(shù)量覆蓋并體現(xiàn)測(cè)評(píng)能力構(gòu)念的各核心參數(shù))。

(四)自我評(píng)估工具的外部表征

自我評(píng)估工具的外部表征需謹(jǐn)慎選擇與設(shè)計(jì),工具在外部表征上的差異會(huì)導(dǎo)致差異化的自我評(píng)估結(jié)果[21]。目前,常見的自我評(píng)估工具表征形式可分為四類。(1)表現(xiàn)記錄卡常用于形成性評(píng)估,工具開發(fā)過程中對(duì)自評(píng)任務(wù)的設(shè)計(jì)要求高,自評(píng)任務(wù)需具備連續(xù)性,任務(wù)難度需具備梯度。(2)自評(píng)日志多用于過程性評(píng)估。與表現(xiàn)記錄卡相比,系統(tǒng)性更強(qiáng)。在具體實(shí)踐中,這一外在表征對(duì)受試具有較高的要求。評(píng)估過程中使用者需借助一定的外部指導(dǎo)。(3)檢查表這類表征形式的使用頻率較少。自我評(píng)估檢查表的表征多為二分選項(xiàng)的設(shè)定,學(xué)習(xí)者判定較為絕對(duì),無法多維全面挖掘?qū)W習(xí)者語言能力。基于這類表征的自我評(píng)估在結(jié)果方面較為粗糙、與實(shí)際語言能力存在一定差異。(4)計(jì)算機(jī)輔助自適應(yīng)表征是通過互聯(lián)網(wǎng)等技術(shù)對(duì)語言能力的自評(píng)實(shí)踐,在實(shí)踐層面操作性強(qiáng)。這類工具表征在建立時(shí)需對(duì)每項(xiàng)自我評(píng)估任務(wù)設(shè)定難度系數(shù)和確定難度級(jí)別,并據(jù)此將具體測(cè)評(píng)任務(wù)置于具有語言能力難度排序的系統(tǒng)中,故此類工具表征可為學(xué)習(xí)者提供較為系統(tǒng)化的評(píng)估數(shù)據(jù)。這類表征在實(shí)際操作中要求受試對(duì)平臺(tái)有一定的熟悉度,研究人員需對(duì)自我評(píng)估網(wǎng)絡(luò)系統(tǒng)的設(shè)計(jì)與搭建有嚴(yán)格把控。(5)多維李克特量表這類工具外部表征多適用于終結(jié)性評(píng)估。這類自我評(píng)估工具表征能收集大規(guī)模標(biāo)準(zhǔn)化數(shù)據(jù),并將數(shù)據(jù)最大程度簡(jiǎn)化用于后期統(tǒng)計(jì)分析。此外,多維李克特量表的表征形式為研究者基于《量表》設(shè)定分層多維的測(cè)評(píng)標(biāo)準(zhǔn)提供了空間,幫助個(gè)體學(xué)習(xí)者挖掘語言能力各方面的診斷信息,在后續(xù)的學(xué)習(xí)過程中開展補(bǔ)救性措施與修正,真正發(fā)揮自我評(píng)估工具“以評(píng)促學(xué)”與“為學(xué)習(xí)服務(wù)”的功效。

(五)結(jié)合數(shù)統(tǒng)模型確定自評(píng)工具的評(píng)分模型

結(jié)合數(shù)統(tǒng)模型確定自評(píng)工具的評(píng)分模型是基于量表構(gòu)建有效自評(píng)工具的核心步驟。在工具評(píng)分層面,服務(wù)于形成性評(píng)估目的表征類目偏重學(xué)習(xí)過程。與服務(wù)于終結(jié)性評(píng)估為目的的表征相比,這幾類表征對(duì)自我評(píng)估結(jié)果的精度關(guān)注不足,大部分研究者并未在研究中匯報(bào)具體的評(píng)分方式?,F(xiàn)有研究中部分自評(píng)工具采用了二分項(xiàng)評(píng)分模型。這類基于“是或否”的二維能力判別評(píng)分方式在自評(píng)實(shí)踐中無法系統(tǒng)化挖掘?qū)W習(xí)者能力的具體信息、學(xué)習(xí)者在自評(píng)實(shí)踐中對(duì)測(cè)評(píng)標(biāo)準(zhǔn)的理解校準(zhǔn)弱。學(xué)習(xí)者據(jù)此評(píng)分方式無法從多元視角關(guān)注到自身能力的發(fā)展,自評(píng)的結(jié)果較為粗糙,對(duì)語言學(xué)習(xí)的積極反撥和促學(xué)效用弱。此外,部分研究對(duì)自評(píng)題項(xiàng)直接采用等值計(jì)分,少部分研究基于研究者理念對(duì)不同自評(píng)題項(xiàng)進(jìn)行權(quán)重賦值,或設(shè)立閾值,但遺憾的是權(quán)重賦值或閾值設(shè)定主觀性強(qiáng),未能予以清晰的闡明。

基于《量表》的評(píng)分模型在選擇上需兼具考量數(shù)據(jù)結(jié)構(gòu)、超參數(shù)、模型預(yù)測(cè)精度及測(cè)評(píng)標(biāo)準(zhǔn)的表征。故推薦使用監(jiān)督性學(xué)習(xí)多元分類模型進(jìn)行建模。這類模型多用于解決多類別、多層級(jí)參數(shù)指標(biāo)的運(yùn)算,能有效簡(jiǎn)化系統(tǒng)結(jié)構(gòu),探討系統(tǒng)內(nèi)核。同時(shí)模型對(duì)收集的大規(guī)模特征數(shù)據(jù)進(jìn)行分類,構(gòu)造預(yù)測(cè)模型。這類模型較好地契合了基于《量表》研發(fā)自評(píng)工具中構(gòu)建評(píng)分系統(tǒng)的需求,模型數(shù)據(jù)結(jié)構(gòu)上滿足了特征參數(shù)分層多維的表征形式。此外,對(duì)核心參數(shù)組合進(jìn)行建模,通過創(chuàng)建多個(gè)預(yù)測(cè)變量組合,探索各核心參數(shù)下多項(xiàng)區(qū)別性特征參數(shù)與不同語言能力層級(jí)的關(guān)系,預(yù)測(cè)英語學(xué)習(xí)者的水平能力,評(píng)估各區(qū)別性特征參數(shù)對(duì)不同水平力學(xué)習(xí)者的區(qū)分強(qiáng)度與難度。基于此,學(xué)習(xí)者可從多維視角挖掘自身語言能力各方面的診斷信息,在后續(xù)的學(xué)習(xí)中進(jìn)行修正,真正發(fā)揮自我評(píng)估工具“以評(píng)促學(xué)”的效用。需注意的是,部分模型在建模過程中,會(huì)把數(shù)據(jù)分為建模實(shí)驗(yàn)數(shù)據(jù)集及與驗(yàn)證集。在建模方法選定的時(shí)候,模型只有在試驗(yàn)集與驗(yàn)證機(jī)模型擬合度都較好的情況才能被判定為最優(yōu)模型。

四、結(jié)語

文章在回顧現(xiàn)有自我評(píng)估工具和語言能力等級(jí)量表文獻(xiàn)的基礎(chǔ)上,對(duì)基于《中國(guó)英語能力等級(jí)量表》的自我評(píng)估工具的研發(fā)路徑及步驟提出一些建議(如圖1所示)?;凇读勘怼费邪l(fā)自我評(píng)估工具,研究者首先需明確工具開發(fā)在真實(shí)語言環(huán)境應(yīng)用的目的。在工具測(cè)評(píng)標(biāo)準(zhǔn)的類別與表征方面,建議研究者以量表為框架,將描述性評(píng)估標(biāo)準(zhǔn)拆解為最能反映測(cè)評(píng)語言能力構(gòu)念的多維、典型性能力要素組件,形成具有層級(jí)的多維區(qū)分性測(cè)評(píng)指標(biāo)體系,有效規(guī)避由于使用者對(duì)測(cè)評(píng)標(biāo)準(zhǔn)理解偏差而導(dǎo)致的測(cè)評(píng)結(jié)果誤差。構(gòu)建自我評(píng)估評(píng)價(jià)項(xiàng)目時(shí),需著重關(guān)注特征參數(shù)的明確性、典型性、區(qū)分強(qiáng)度、獨(dú)立性及可操作性。此外,工具的外部表征選擇與評(píng)分模型構(gòu)建時(shí)需綜合考量數(shù)據(jù)結(jié)構(gòu)、超參數(shù)問題、模型預(yù)測(cè)精度及測(cè)評(píng)標(biāo)準(zhǔn)的表征。

圖1 基于《量表》的自我評(píng)估工具研制步驟

目前,基于《量表》研發(fā)自我評(píng)估工具還處于初始階段,未來期望有更多的研究基于《量表》研發(fā)實(shí)踐中效用性強(qiáng)的自我評(píng)估工具以橋接我國(guó)英語統(tǒng)一度量標(biāo)準(zhǔn)與其在實(shí)際教育環(huán)境中的實(shí)踐。工具的研發(fā)期望能為使用者提供有價(jià)值的能力反饋信息,幫助其清晰定位、認(rèn)知不同學(xué)段對(duì)語言技能的要求,結(jié)合在不同情境中的具體實(shí)踐進(jìn)行反思,有助于全面審視自身語言能力的發(fā)展。在教學(xué)與課程設(shè)計(jì)方面,教師可將基于《量表》研發(fā)的自我評(píng)估工具中具體特征參數(shù)指標(biāo)與課程中語言運(yùn)用的實(shí)際需求進(jìn)行有機(jī)結(jié)合,有針對(duì)性設(shè)置與規(guī)劃教學(xué)要點(diǎn)與內(nèi)容。同時(shí),教師可以進(jìn)一步將其融入情境化教學(xué)中,設(shè)計(jì)更加貼近語言能力運(yùn)用的真實(shí)場(chǎng)景的活動(dòng)任務(wù)。測(cè)評(píng)方面,基于《量表》研發(fā)的自我評(píng)估工具可促進(jìn)教學(xué)中形成性評(píng)價(jià)的有效開展,制定學(xué)習(xí)者個(gè)性化的課程形成性評(píng)估檔案袋。自評(píng)實(shí)踐中,學(xué)習(xí)者處于測(cè)評(píng)主導(dǎo)地位,逐漸提升學(xué)習(xí)責(zé)任感,培養(yǎng)了自主學(xué)習(xí)的機(jī)制,提高學(xué)習(xí)動(dòng)機(jī),從而達(dá)到以評(píng)促學(xué)的效用。

猜你喜歡
特征參數(shù)工具學(xué)習(xí)者
故障診斷中信號(hào)特征參數(shù)擇取方法
基于特征參數(shù)化的木工CAD/CAM系統(tǒng)
波比的工具
波比的工具
你是哪種類型的學(xué)習(xí)者
十二星座是什么類型的學(xué)習(xí)者
基于PSO-VMD的齒輪特征參數(shù)提取方法研究
“巧用”工具
讀者(2017年18期)2017-08-29 21:22:03
漢語學(xué)習(xí)自主學(xué)習(xí)者特征初探
統(tǒng)計(jì)特征參數(shù)及多分類SVM的局部放電類型識(shí)別
开封市| 河津市| 乌鲁木齐县| 临海市| 凤山市| 米林县| 上犹县| 花莲市| 道孚县| 镇赉县| 靖西县| 元阳县| 三穗县| 且末县| 莱西市| 大余县| 泗阳县| 通化县| 洪泽县| 奈曼旗| 三江| 平顺县| 承德县| 桓仁| 治县。| 松原市| 上林县| 阿拉善盟| 湾仔区| 闽侯县| 潞西市| 台安县| 大冶市| 新闻| 辉县市| 永胜县| 志丹县| 满城县| 浑源县| 沁源县| 那曲县|