国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

發(fā)展分層評分標準 助力命題改革

2023-11-29 18:59:07葉麗新
語文建設·上 2023年10期
關鍵詞:題型

【摘要】題型改革是命題改革的一個重要抓手。當前不少新題型有一個共性特點,即試題開放度加大。要提升各類開放性試題的考查價值,須著力推進分層評分標準的開發(fā)與運用。擬制分層評分標準需要先根據(jù)測評目標觀察學生表現(xiàn)的主要角度及要點,再整合考慮試題分值、學生的可能表現(xiàn)層次,據(jù)此確定評分等級數(shù),進而緊扣觀察角度描述各層級的關鍵表現(xiàn)并附各層級典型表現(xiàn)樣例。分層評分標準的有效運用需要專門的閱卷者培訓,以保障充足的閱卷時間;從長遠來看,需要在日常教學中適當調(diào)整評價的思維方式,善于發(fā)現(xiàn)、提煉學生外在和內(nèi)隱的學習表現(xiàn)特點,善于捕捉不同學生表現(xiàn)的關鍵差異。

【關鍵詞】題型;開放性試題;主觀性試題;分層評分標準

題型及其評分方法是測量與評價理論、實踐中的基本話題。當前的課程改革與評價改革對此提出了新的要求,研究與實踐需要作出更加積極的探索。

一、課程改革與評價改革背景下的題型改革要求

近幾年,課程改革與評價改革的系列文件對于命題提出了一些有針對性的、細致的要求,譬如對于試題形式,《普通高中語文課程標準(2017 年版2020 年修訂)》提出“多設置主觀性、開放性的題目,展現(xiàn)學生智慧,鼓勵學生發(fā)揮和創(chuàng)造”;《國務院辦公廳關于新時代推進普通高中育人方式改革的指導意見》(2019)提出“創(chuàng)新試題形式,加強情境設計,注重聯(lián)系社會生活實際,增加綜合性、開放性、應用性、探究性試題”;《教育部關于加強初中學業(yè)水平考試命題工作的意見》(2019)提出“減少機械記憶試題和客觀性試題比例,提高探究性、開放性、綜合性試題比例”;《義務教育語文課程標準(2022 年版)》(以下簡稱“義教新課標”)提出,“試題形式力求創(chuàng)新,鼓勵增加開放性試題比例,以避免導向新的應試模式”。以上文件提及多個題型概念,有的是測量與評價一般理論中的既有概念,有的則是我國課程改革與評價改革背景下誕生的特定表達。各種概念與表達側重于從特定角度強調(diào)試題的考查指向與功能,比如:側重從認知能力角度表述的題型概念有“記憶性試題”“應用性試題”“探究性試題”,當前的要求是控制“記憶性試題”,尤其要避免“機械記憶試題”,根據(jù)學情酌情增加高層次能力試題(試題考查的能力層級與試題難度是兩個概念)。側重從知識技能方面或問題解決路徑角度表述的題型概念有“綜合性試題”,當前的取向是鼓勵命制整合“閱讀與鑒賞”“表達與交流”“梳理與探究”三個方面實踐活動的綜合性題目,鼓勵學生“綜合運用多門課程知識和思想方法解決實際問題”[1]。側重從答案屬性角度表述的題型概念有“客觀性試題”“主觀性試題”“開放性試題”,當前的取向是發(fā)展主觀性、開放性試題,鼓勵學生個性化理解和表達。

當然,不同分類視角下的題型并不互相排斥,譬如,應用性試題、探究性試題、綜合性試題均以主觀性、開放性試題為主。當前試題創(chuàng)新的難點不僅在于開發(fā)試題本身,還在于原本就存在的難點——主觀性、開放性試題評分不理想的問題并未得到充分解決。題型改革實際存在兩重壓力。當前,試卷題型結構成了考查一份試卷質量的重要指標之一,試卷題型比例因此也有一些較為明顯的變化,主觀性、開放性試題增多。在此背景下,試題評分問題更須著力研究,否則可能陷入新的誤區(qū)。以下探討答案傾向于開放性的各類試題的評分標準設計與運用問題,以期借此助力試題創(chuàng)新。

二、立足試題屬性與考查價值明確評分角度與要點

主觀性、開放性試題評分的實質是區(qū)分學生的表現(xiàn)水平層次,而評分的第一步是要明確從哪些角度觀察學生的表現(xiàn)。對此,可從理論和具體試題兩個層面進行研究。

1.測量與評價理論建議的評分角度與要點

既有的研究對于開放性試題或相近類型試題的表征、獨特考查價值、運用要點等的論述,蘊含了對學生表現(xiàn)的期待,從中可以提煉出對學生反應的觀察角度與要點,也即評分角度與要點。

a.開放題的三維判斷標準:結論開放性,即結論不唯一或通向結論的途徑具有開放性;結構復雜性,即認知過程包含復雜認知行為(高級學習);情境真實性,即問題情境是真實情境或虛擬(模擬)情境。[2]

b.在評估學生的思維組織能力、邏輯表達能力、維護立場(defend position)、觀點整合能力方面,開放式問題比選擇式問題更加合適。開放式問題要求進行全面的、整體性的學習。[3]

c.論述題的一大好處是其可以測量受試者組織、整合知識的能力,應用信息解決新問題的能力,并且可以讓受試者展示自己的原創(chuàng)綜合思維。編寫論述題的人必須充分考慮各種答案所代表的思維能力。[4]

d.要求學生對于爭議性問題進行論述,應該對提供的證據(jù)進行評估,而不是學生的觀點?!瓕τ谶@些有爭議的問題,要求學生接受某種觀點或解決方案是不合理的。然而,對于某種觀點和結論,可以檢測他們收集和應用證據(jù)的能力。[5]

以上論述中可以提煉出兩個基本觀察點:一是結論或觀點,二是得出結論或觀點的認知過程、證據(jù)。a和d較為明顯地區(qū)分了這二者,b和c側重描述后者,d甚至強調(diào)后者比前者更重要。

再進一步分析,上述兩個觀察角度各有一些微觀的評價角度或要點。關于結論或觀點,可能需要考慮兩個方面:一是針對性,是否能針對問題情境、既有觀點等有的放矢地作出回應;二是深刻性、原創(chuàng)性或創(chuàng)造性方面的差異,在具體試題中要具體考慮區(qū)分學生表現(xiàn)水平差異的關鍵點是什么,是角度創(chuàng)新還是在常規(guī)角度下有不一樣的認識。

關于得出觀點的過程、證據(jù),也有一些更細微的觀察角度:一是思維方法及其品質,是否能靈活運用分析、比較、綜合等思維方法;二是證據(jù)運用,是否能調(diào)動、整合運用各類可靠的證據(jù),作出完整、充分、有力的回應。隨著試題不斷創(chuàng)新,上述觀察和評分角度與要點可以不斷完善。

2.特定試題具體的評分角度與要點

上述評分角度與要點為具體試題的評分提供了基本支架。當然,不同的試題有不同的測量目標和評價側重點,可能有不同的評分角度;相同的觀察角度在不同試題中可能有不同的觀察要點。譬如以下在當前命題改革背景中較具代表性的幾類試題,它們各有具體的評價側重點。

(1)個性化閱讀過程與結果表達類試題

【例1】“學者先要會疑?!眻D圖讀書時常常質疑,下面是他提的一個問題及提問原因。你也從初中語文教科書重點推薦的十二部名著中選擇一部,分享了你的質疑。(8分)

圖圖讀的名著:《朝花夕拾》

他提出的問題:魯迅先生對兒時所受的教育究竟持什么態(tài)度呢?

提問的原因:我發(fā)現(xiàn),一方面小魯迅頗不自由,他在特別想看五猖會時,被父親勒令背書,很痛苦;另一方面他又蠻自由,可以在三味書屋趁老師不備偷跑進后園游樂,很開心。

你閱讀的名著:《▲ 》

你提出的問題: ①▲

提問的原因: ②▲

以上試題要求學生從十二部名著中選擇一部來表達閱讀中發(fā)現(xiàn)的問題并說明原因。十二部名著選任何一部都可以,提哪方面的問題也沒有限制。這類試題在整本書閱讀或名著閱讀教學成效尚不夠理想、尚須強調(diào)自主閱讀的階段有著獨特的意義:引導學生在讀名著時能真正讀進去,在閱讀中有自己的發(fā)現(xiàn)、思考。

試題①②兩個空格已經(jīng)在形式上區(qū)分了對學生表現(xiàn)的兩個觀察角度,“提出的問題”和“提問的原因”大致對應前面所說的“觀點”和“得出觀點的過程、證據(jù)”這兩個方面。在這類試題中,這兩個觀察角度各有具體的觀察要點。試題①提問的角度可能有新意方面的差別,問題的價值、深度等可能有層次差異。試題②主要源自書本內(nèi)容,觀察要點包括:表述這些信息時是否能尊重文本內(nèi)容,不歪曲、不斷章取義;是否能敏銳地發(fā)現(xiàn)值得探討的信息、細節(jié)等;“文本信息、內(nèi)容”與“問題”之間的關系是否緊密,從特定的文本信息和內(nèi)容中是否能合邏輯地提煉出特定的問題。

(2)讀寫結合類試題

【例2】學校文學社公眾號的“……”(注:略)欄目將刊發(fā)本作品,并配發(fā)一段推薦語。作為該欄目編輯,請你寫一段100字左右的推薦語。

例2 要求學生在閱讀特定作品之后完成指定的表達任務。這類試題通常在文學作品閱讀或名著閱讀考查中出現(xiàn),屬于讀寫結合類考查任務,在運用層面綜合考查閱讀與表達能力。

這類試題有兩個基本的觀察點。其一,對閱讀對象的理解、鑒賞情況,譬如對文本局部或整體內(nèi)容的理解是否符合文意,是否較為深入。其二,表達是否符合情境的潛在要求或任務明確表達的要求。如例2,部分表達要求隱含在情境要素中:“欄目”名稱指向了表達方向,如聚焦“最受感動”之處、“成長”角度切入等,推薦語內(nèi)容必須切題;“推薦語”這一形式對表達內(nèi)容和語言風格也有潛在要求,推薦語的目的是吸引大家注意,激發(fā)大家的閱讀興趣,因此撰寫推薦語時最好有一些專門的設計,譬如語言表達有創(chuàng)意、緊扣作品特點、適當設置懸念等;“學校文學社公眾號”這一設定也是潛在要求學生考慮閱讀對象、媒介的特點。

以上觀察角度中,推薦的角度、推薦語整體的表達效果,大致對應前文所說的“觀點”這一評分角度;對原文內(nèi)容或特點的歸納、提煉等大致對應“得出觀點的過程、證據(jù)”這一評分角度。從學生答題角度來說,這兩個角度需要有機融合;從評分角度和教學指導來說,這兩個方面可以適當剝離分析。

(3)立場選擇類試題

【例3】如果把下面這段話作為本文第⑥段的論據(jù),你覺得可以嗎?請簡述理由。(4分)

【例4】如果給本文擬一個標題,你會選“……”(略)還是“……”(略)?為什么?(6分)

【例5】以第12~15 段為例,評析本文語言運用上的特點。

以上三題是讓學生在兩個方向之間選擇,例3是在“可以、不可以”這樣相反的二者之間選擇,其他類似試題可能是讓學生在“恰當、不恰當”“贊同、不贊同”之間選擇;例4是在兩個標題之間選擇;例5的題干本身并沒有明顯的提示,但參考答案引導的答題思路是,在分析文本語言運用特點的基礎上,對語言運用效果可以作出相反的判斷,或者認為語言運用上的特點增強了作品的感染力,或者認為文章在遣詞造句中情感注入過多過濃,未加沉淀節(jié)制,給人泛濫甚至虛假的感覺,減弱了作品的感染力。[6]這類試題的開放性表現(xiàn)在答案不僅不唯一還可能相對或相反。

對這類試題,答題方向的選擇可以算是基本“觀點”,理由闡述傾向于“得出觀點的過程、證據(jù)”。這類試題有兩個特點:其一,評分時需要仔細辨析“可以、不可以”這兩個答題方向之間是同樣成立,還是兩者之間有更合理與次合理的區(qū)別;其二,這類試題符合前文關于開放性試題的論述,“得出觀點的過程、證據(jù)”更重要,尤其是當“可以、不可以”同樣成立時,觀點方向可以不賦分,即回答“可以、不可以”不賦分。

以上,通過理論和具體試題兩個層面的分析,嘗試勾勒答案開放性試題大致的觀察角度、要點,其間已可管窺開放性試題的評分復雜度:既要考慮橫向的角度問題,又要考慮縱向的水平層次差異。原有“采點給分”的評分方式已捉襟見肘。

三、分層評分標準的擬制與使用

義教新課標提出,“要健全主觀性、開放性試題的評分標準,根據(jù)學生的認知發(fā)展水平,對簡單結構作答和復雜結構作答實行分級賦分”[7]。為了糾正原來“采點給分”的問題,義教新課標強調(diào)了“分級賦分”。在測量與評價理論中,開放性試題的評分標準本就是分級或分層描述的:評分規(guī)則(scoring rubric)是一組評鑒表現(xiàn)的準則,通常以等級量表的形式呈現(xiàn),每個等級皆有一組行為表現(xiàn)的描述語,對不同的行為特質或層面予以操作性定義。[8]在這一界定中,蘊含了分層評分標準的兩個基本要素:一是等級;二是每個等級的表現(xiàn)描述,應有效區(qū)分不同等級的不同行為特質。

1.分值的橫向與縱向分配

部分國外測評項目,如PISA(國際學生評估項目),閱卷與計分是兩個環(huán)節(jié),閱卷環(huán)節(jié)只根據(jù)各個試題的評分標準標注學生表現(xiàn)的等級代碼,后期才統(tǒng)一核算分數(shù)。我們國內(nèi)是命題階段為每個試題賦分,試題分值決定了評分標準的等級數(shù)。這樣,試題分值與可以劃分的評分標準等級數(shù)之間可能需要協(xié)調(diào)。

(1)縱向:等級劃分或分數(shù)分層

評分標準的縱向等級劃分,理論上說,應該取決于問題復雜度、學生可能的表現(xiàn)層次。從國際測評項目經(jīng)驗和測量與評價理論來看,試卷中的問答題,評分標準一般設3~6個等級[9],轉換到我們的體系中來就是單個試題最高賦分5 分(0~5 可區(qū)分為6 個等級)。但在我們目前已有的試卷中,寫作試題之外的單個試題賦分可能超過5分,如8分。這時可以像作文評分一樣設計分數(shù)段。譬如2分為一個分數(shù)段,評分標準設4個等級,同一等級內(nèi)部再根據(jù)表述質量等酌情給滿2分或扣1分。浙江省溫州市等地區(qū)的語文中考評分標準已經(jīng)采用這樣的辦法。未來,命題階段給試題賦分時,不僅要考慮整套試卷總分的協(xié)調(diào)使用,還要盡量保證每道試題賦分的合理性。需要進一步仔細推敲每道試題的測評目標、預想學生的答題表現(xiàn),從而給各個試題合理賦分,讓預設分值在評分標準中得到合理的層級分配。盡量避免出現(xiàn)“答對1點給1分,答對2點給3分”的情況。

(2)橫向:整體評分還是分項評分

前文梳理的評分角度包括“觀點或結論”和“得出觀點的過程、證據(jù)”兩個方面,以及它們各自可能有的觀察角度。在實際評分時,可能需要考慮這些角度是整合評分還是分開評分,以及如果分開評分該如何分配分值。例2~例5 基本采用了整體評分的方式,因為系列觀察角度需要整合考慮、描述。例1在實際評分時采用了分項評分的方式??偡? 分,“提出的問題”賦3分,“提問的原因”賦5分,學生這一題的最后得分由兩部分得分相加形成。當然,兩個子問題之間有著密切關聯(lián),在實際打分時要觀察兩個回答之間的關聯(lián)性,所以試卷上并未將兩個子問題的分值分開標定。

這類問題兩個或多個評分角度之間的分數(shù)分配并不固定,取決于測評目標和教學理念。譬如“提問的原因”賦分高于“提出的問題”,并不僅僅因為“提問的原因”需要更多文字闡述,更重要的是以此強調(diào)學生提出的問題應該真正源于他們?nèi)粘i喿x中的發(fā)現(xiàn),這對于日常教與學能產(chǎn)生積極作用。

如果是分項評分,各項的評分等級數(shù)須根據(jù)各項分值和學生可能的答題反應分別進行劃分。譬如例1“提出的問題”的評分標準設3 個等級,“提問的原因”評分標準設5個等級。

2.表現(xiàn)描述與樣例呈現(xiàn)

在整體評分和分項評分之間作出選擇并基本確定好等級之后,就需要為每個等級描述學生的相應答題表現(xiàn)。

(1)描述關鍵表現(xiàn),兼顧多個評分角度

前文區(qū)分的觀察角度與要點,可以成為基本的描述抓手,以揭示學生表現(xiàn)中的關鍵性、實質性差異。在描述每個等級的學生表現(xiàn)時,需要兼顧各個評分角度?!叭绻粋€題目測量了一個以上的技能或概念,那么在評分標準描述語中需要兼顧、描述清楚學生在這幾個技能或概念上的掌握情況”[10]。如果是分項評分,需要分別描述學生的表現(xiàn),如例1;如果是整體評分,就需要兼顧各個角度綜合描述學生的表現(xiàn)。

(2)區(qū)分不同水平的表現(xiàn)差異

各等級表現(xiàn)描述,需要兼顧預設和學生實際表現(xiàn)而擬定。前者緊扣測評目標預估學生可能的表現(xiàn)差異,后者是在正式批改前預批部分試卷提煉學生實際的表現(xiàn)差異。

在撰寫評分標準描述語時,需要精心推敲措辭,體現(xiàn)層級差異。前文提供的評分角度,都可能衍生出一把把微觀的尺子,譬如至少可以分出一些基本等級(見表1)。在具體試題中,描述角度可以酌情選擇、組合,層級表現(xiàn)可以根據(jù)學生實際表現(xiàn)酌情細化。

(3)盡可能為每個層級提供多個表達樣例

為與描述語配套,須提供充足的各等級表現(xiàn)典型樣例,以便讓評分者更好地領會評分標準描述語的指向。理性認識與感性認識結合,在實際閱卷時能更加快速、準確地判斷學生的作答水平進而合理評分。

3.評分標準各要素間的協(xié)調(diào)統(tǒng)一

以上從分值分配、各層級表現(xiàn)描述與樣例提供三個角度勾勒了評分標準的擬制思路,在實際擬制分層評分標準時,三者應形成一個有機統(tǒng)一體。例如2021 年江蘇省南京市語文中考試題(本文例1)的評分標準及其補充說明(見表2,呈現(xiàn)形式和局部表述略作調(diào)整,因篇幅所限僅呈現(xiàn)部分示例)。

4.分層評分標準的使用與發(fā)展

幾乎所有關于評分標準的闡述和國際測評項目經(jīng)驗,都強調(diào)要進行評分標準的使用培訓。評分者需要在多輪試批中理解評分標準,減少評分誤差。在實際操作時,閱卷人員、閱卷時間各個方面都要給予充分保障。主觀題、開放性試題的評分成本目前尚無特別有效的控制辦法。

分層評分標準的發(fā)展,除了需要在每一次閱卷中打磨,更重要的是在日常教學、評價中形成相應的思維方式。摒棄套路化作答、采點給分的思維方式,真正關注學生每一次作答中的具體表現(xiàn),善于發(fā)現(xiàn)、提煉學生外在和內(nèi)隱的學習表現(xiàn)特點,善于捕捉學生不同表現(xiàn)中的關鍵差異,這是教師評價專業(yè)素養(yǎng)的重要體現(xiàn)。在日常教學中養(yǎng)成這樣的觀察和評價思維,能在閱卷中提升評分效率,更深層地實現(xiàn)“教學評”一致性。

最后有必要補充和強調(diào)兩點。第一,本文側重講評分問題,但評分標準的觀察角度和要點取決于測量目標、問題指向,因此討論評分標準的前提是問題設計有價值,指向清晰。第二,在課程改革與評價改革背景下,當前正著力開發(fā)主觀性、開放性試題,但這并不意味著客觀性試題就不具有考查價值。理想的狀態(tài)是高質量的客觀性試題與高質量的主觀性、開放性試題互補,合力考查學生核心素養(yǎng)發(fā)展,盡量保證測試效果。

參考文獻

[1][7]中華人民共和國教育部.義務教育語文課程標準(2022 年版)[S].北京:北京師范大學出版社,2022:50,51.

[2]張雨強.開放題編制的理論與技術研究[M].上海:華東師范大學出版社,2009:109.

[3]阿來薩.課堂評估:理論與實踐[M]. 徐士強,譯. 上海:華東師范大學出版社,2008:183.

[4][5]特雷西·桑代克-克萊斯特,羅伯特·M.桑代克.教育評價:教育和心理學中的測量與評估(第八版)[M].方群、吳瑞芬、陳志新,譯. 北京:商務印書館,2018:331~332,333~334.

[6]葉麗新“. 答案兩可”類開放性試題探析[J].語文學習,2019(9).

[8]李坤崇.教學評估:多種評價工具的設計及應用[M]. 上海:華東師范大學出版社,2011:141.

[9]Judith Arter,Jay Mc Tighe.課堂教學評分規(guī)則:用表現(xiàn)性評價準則提高學生成績[M]. 國家基礎教育課程改革“促進教師發(fā)展與學生成長的評價研究”項目組譯. 北京:中國輕工業(yè)出版社,2005:31.

[10]National Assessment Governing Board. Reading Assessment and Item Specifications for the 2009 National Assessment of Educational Progress[EB/ OL].https://www. nagb.gov/content/nagb/assets/documents/publications/frameworks/reading/2009-reading-specification.pdf.

猜你喜歡
題型
離散型隨機變量??碱}型及解法
圓錐曲線中的存在性問題的常見題型及其解法
立體幾何新題型例析
常見數(shù)列創(chuàng)新題型歸納
集合新題型例析
巧妙構造函數(shù) 破解三類題型
數(shù)列中的最值題型例講
2020年高考不等式四大熱點題型
直擊數(shù)列不等式證明的三種新題型
一次函數(shù)中的常見題型
庆安县| 高要市| 博兴县| 利津县| 平阳县| 吉木乃县| 始兴县| 平湖市| 江津市| 尖扎县| 大田县| 汤阴县| 屏山县| 太原市| 宝清县| 绥滨县| 安庆市| 舟山市| 许昌市| 高要市| 漠河县| 镇坪县| 潍坊市| 西青区| 余庆县| 婺源县| 玛纳斯县| 罗源县| 阿合奇县| 阳春市| 郧西县| 改则县| 巴马| 建瓯市| 万盛区| 台北县| 元氏县| 瓦房店市| 日照市| 公安县| 满洲里市|