国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

幼兒園教師能力自我評價準確嗎?

2024-10-29 00:00郭力平曾蓓朱晉曦
學前教育研究 2024年10期

[摘 要] 教師自我評價是診斷專業(yè)能力、落實按需培訓的重要依據(jù),更是自主學習、終身學習的內在要求。準確性是影響教師自我評價成效的關鍵因素,然而,有關幼兒園教師自我評價的準確性如何、不同教師群體自評的準確性是否存在差異等關鍵問題尚缺乏系統(tǒng)研究。本研究以資歷及客觀評價為參考,探討了幼兒園教師能力自我評價的準確性,分別調查了2 288名教師的自我評價與資歷信息,以及6 523名教師的自我評價與客觀評價結果。研究結果發(fā)現(xiàn):(1)教師自評水平與其資歷缺乏一致性,高估型教師占比大;(2)教師自評呈負偏態(tài)分布,與客觀評價呈弱相關,絕對準確性與偏差指數(shù)表明教師自評明顯偏離其在客觀評價中所表現(xiàn)的專業(yè)能力;(3)處于不同發(fā)展階段的教師對能力的自我評價存在差異,呈現(xiàn)“新手的高估與熟手的低估”和“低水平者的高估與高水平者的低估”兩種明顯傾向。為此,應當促進幼兒園教師自我評價和專業(yè)發(fā)展有機整合,實現(xiàn)“專業(yè)能力提升—自評準確性提高”的良性循環(huán);構建有利于幼兒園教師自評的支持性生態(tài),為實踐環(huán)境中的自評提質增效;利用技術賦能主客觀評價融合,推動幼兒園教師自評方式向更準確高效的方向革新。

[關鍵詞] 幼兒園教師;自我評價;客觀評價;資歷

*基金項目:中國基礎教育質量監(jiān)測協(xié)同創(chuàng)新中心國家監(jiān)測專項課題“學前教育教師保教質量監(jiān)測指標體系與工具研制”(編號:2021-02-008-BZPK01)

**通信作者:郭力平,華東師范大學教育學部教授、博士生導師

一、問題提出

教師自我評價是教師按照一定評價標準,對自身職業(yè)實踐進行價值判斷的活動。作為教師個人成長的內在動力機制及推動教師可持續(xù)專業(yè)發(fā)展的重要途徑,自我評價能夠增進教師對良好實踐的理解,[1]幫助教師識別自身專業(yè)能力的優(yōu)勢和劣勢,[2]激發(fā)教師的自我監(jiān)控意識,促進教師的自我調節(jié)學習并為教師的終身學習做好準備。[3]因而,以專業(yè)發(fā)展為導向的教師自我評價成為新的教師評價過程的重要組成部分,亦是近年來我國教育政策的價值取向與關注重點?!痘A教育課程改革綱要》指出要建立促進教師不斷提高的評價體系,建立以教師自評為主的評價制度;《幼兒園教育指導綱要》明確提出幼兒園教育工作評價實行以教師自評為主的制度;《幼兒園保育教育質量評估指南》指出要強化自我評估,促進教師主動參與,反思自身教育行為。同時,當下大范圍、大規(guī)模的教師培訓亦催生了對自我評價的現(xiàn)實需求,作為一種靈活易操作且效率高的評價方式,教師自評是專業(yè)能力診斷及落實按需培訓的重要依據(jù)和必要手段。實踐中對于教師自評價值充分發(fā)揮的期望,轉為對教師自評盡可能準確的要求。然而,當前對幼兒園教師自我評價的準確性知之甚少。因此,無論是響應政策層面的既定要求,還是回應當下迫切的現(xiàn)實需要,幼兒園教師自我評價是否準確是一個亟須回答并解決的基礎性問題。

自我評價具有重要價值,而其功效發(fā)揮有賴于準確性,偏差則會引發(fā)諸多不利影響。鄧寧(Dunning)等人系統(tǒng)回顧了健康、教育和工作領域中不準確自我評價所帶來的現(xiàn)實后果,突顯了自我評價研究領域持續(xù)關注準確性的意義。[4]迄今為止,不同學科領域的數(shù)千項研究提供了數(shù)十萬參與者自我評價準確性的混合證據(jù)。澤爾(Zell)和克里贊(Krizan)對不同學科有關自我評價準確性的22項元分析進行了元綜合,觀察到自我認知和實際表現(xiàn)之間存在大范圍的相關性,平均后相關性r為0.29。[5]這一綜合證據(jù)表明人們對自身能力往往只有適度的洞察力,但遠沒有達到理想的程度。一些涉及即時且客觀反饋的領域(如運動能力),相關性通常更高;而涉及復雜技能的實踐領域,相關性可能很低。[6]教育領域多項關于學生自我評價準確性的元分析,[7][8]其結果均顯示能力的自我評價與實際表現(xiàn)之間的相關性不高,并且學生傾向于高估自身表現(xiàn)。鄧寧-克魯格效應(Dunning?Kruger effect)便揭示了這一現(xiàn)象,它是自我評價研究中最突出的效應之一,指個體對自身能力評價產生偏差的現(xiàn)象,即低能力者傾向于高估自身能力,高能力者傾向于低估自身能力。[9]實現(xiàn)準確自我認知的確是一項艱巨的任務,在教育領域常常作為他評者的教師,其自評表現(xiàn)如何卻鮮有研究。國外有研究以標準化測試為參照,發(fā)現(xiàn)職前教師自我評價的準確性不足;[10]有涉及中國幼兒園教師課堂質量、觀察能力現(xiàn)狀的調查研究發(fā)現(xiàn)教師自評與他評存在偏差,但評價準確性并非其研究重點。[11][12]總體而言,目前關于幼兒園教師自我評價準確性的研究不足,確切證據(jù)尚缺。

在自我評價研究領域,準確性一般通過自我評價與更客觀的標準之間的相關性來確定,外部評價(通常是專家評價)是最常使用的衡量標準。[13]這些研究基于一個共同假設:專家評價是一種“黃金標準”,提供了能力的“真實評價”,有效的自我評價結果應當與之高度相關。然而,“黃金標準”的可靠性和有效性存疑。僅有少數(shù)研究報告了專家評價的可靠性,有證據(jù)顯示使用縱向評價的研究設計特別容易出現(xiàn)專家評價的不一致,專家評價標準及維度的有效性往往也缺乏驗證。[14]此外,使用相關系數(shù)作為準確性的唯一度量,其價值有限?;谌后w相關性得出的準確性結論并不完整,甚至可能帶來誤導,因為這些研究是基于另一個假設的,即群體中每個個體的自我評價能力相等,由此得出的結論掩蓋了個體差異。總之,“黃金標準”的可靠性、單一相關分析的局限性限制了研究對于自評有效性結論的支持力。[15]面對傳統(tǒng)研究范式的方法論挑戰(zhàn),應當尋找比專家評價更可靠的替代方案,并探索多樣化的準確性度量指標。[16]此外,也有研究者對自我評價工具的可靠性表示擔憂,過于模糊的項目表述和對個人知識或技能具體陳述的缺失可能會限制自評的準確性。[17]例如,“我能夠在課堂上有效地使用數(shù)字媒體”,此種表述使教師更傾向于將自身定位置于高質量教學的理論慣例而非實際能力上,從而指向評價自我教學的態(tài)度、信念和價值觀,導致原本的評價內容發(fā)生錯位,專業(yè)能力判斷被信心評級所取代。[18]因此,要盡量避免自評工具對準確性的干擾,制定具體的、特定任務的和等級分明的評價標準,這不僅有益于評價者進行準確自評,還能幫助其更敏感地察覺技能的細微變化,從而恰當?shù)卣{整學習策略。[19][20]

綜上所述,盡管先前的研究提供了關于自我評價準確性的廣泛證據(jù),但缺乏對幼兒園教師群體的關注。在教師自我評價呼聲越來越高的當下,國內研究仍停留在對自評有效性的質疑上,對指標體系設置的合理性以及影響自評有效性的內外部因素進行觀點討論,缺乏實證研究,多流于一般結論性的描述、囿于思辨性的推斷和經驗式的總結。因此,本研究將依托大范圍、多來源的調研數(shù)據(jù),對幼兒園教師能力自評的準確性問題展開研究。此外,為避免傳統(tǒng)自我評價研究范式的方法論問題,本研究將采用更可靠的衡量標準和多種分析方法,以及科學的自評工具,以期做出具有說服力的評判,助益教師自評價值的充分發(fā)揮。

二、研究方法

本研究中,自評工具和樣本數(shù)據(jù)源于教育部與聯(lián)合國兒童基金會幼兒園教師培訓項目①,研究團隊開展了涉及15省市幼兒園教師的能力測評與調研,獲取了教師自評、資歷及客觀評價等多種來源類型的教師能力水平信息,形成了兩個不同比較視角的子研究:教師自評與其資歷等級的比較(子研究一);教師自評與客觀評價的比較(子研究二)。資歷(如榮譽、學歷和職稱等)反映了外部評價結果,是實踐中常用的衡量教師能力水平的重要標準??陀^評價是對專業(yè)能力的標準化測試,在本研究中通過情境判斷測驗對教師專業(yè)能力進行測評。兩種衡量標準兼具實用性與客觀性,且能夠涵蓋當前教師評價的主要方式。

(一)研究工具

1. 子研6577a4be5a761eaf24420ab696d716f4dbb9b29c6ea9177d0b9fc804f50385b3究一。

子研究一使用兩個工具。一是《幼兒園教師資歷調查問卷》,獲取了教師榮譽、學歷、職稱、編制和教師資格等信息。二是《幼兒園教師“保育與教育”能力自評問卷》,包含溝通與合作、教育活動的計劃與實施、一日生活的組織與保育、游戲活動的支持與引導、環(huán)境的創(chuàng)設與利用5個維度共61個題項。每個題目設置4個選項,請幼兒園教師根據(jù)自身情況選擇“最符合實際情況”或“最經常出現(xiàn)的行為”的選項。選項的表述是對某一能力表現(xiàn)的具體描述,4個選項代表教師能力發(fā)展的4種水平,由低到高按1~4分計分。選項的4種水平來源于幼兒教育專家結合標準、理論與實踐經驗所構建的幼兒園教師能力發(fā)展水平。通過組織專家及幼兒園優(yōu)秀教師訪談等,確保4種能力水平特點的表述符合我國幼兒園教師的現(xiàn)狀特點及教師實際工作中的能力需求,水平之間有層次差異,并與幼兒園教師保育與教育能力培訓課程指導標準的水平層次相適宜,從而確保了其內容效度良好。驗證性因素分析表明,模型擬合程度良好(χ2/df=1.62,p<0.001,CFI=0.99,TLI=0.99,RMSEA=0.02,SRMR=0.03),自評問卷具有良好的結構效度。問卷各維度的內部一致性信度在0.74~0.87之間,總量表的內部一致性信度為0.92,表明該問卷信度良好。

2. 子研究二。

子研究二使用兩個工具。一是《“游戲活動的支持與引導”能力自評問卷》,包含16個題項。該自評問卷的研制過程、題目形式和計分方式均與子研究一自評問卷一致,問卷內容效度和信度良好(Cronbach’s α=0.84)。二是客觀評價工具《“游戲活動的支持與引導”能力情境判斷測驗》,抽取自《幼兒園教師“保育與教育”能力情境判斷測驗》,其信效度已得到證實。[21]《“游戲活動的支持與引導”能力情境判斷測驗》包含10個題項,采用“描述實踐工作典型情境的題干+描述作答要求的指導語+反應選項”的典型客觀性情境判斷測驗形式,作答方式為排序式,每題計分0~4分。

(二)研究樣本

1. 子研究一。

為確保測查樣本的總體代表性,子研究一采用等比例分層抽樣法?;趯處熌芰蜕鐣J可度,以及我國幼兒園教師隊伍結構的綜合考量,將榮譽等級結合教師資格及專業(yè)背景作為分層抽樣的遴選標準,確定4種教師資歷水平:具有省級或地市級榮譽(水平4);具有區(qū)縣級榮譽(水平3);具有園級榮譽或無榮譽,有教師資格證或學前專業(yè)背景(水平2);無榮譽,無教師資格證且無學前教育專業(yè)背景(水平1)。面向全國8省市24縣(市)幼兒園教師展開調查,覆蓋幼兒園604所,其中公辦園315所,民辦園289所,實際抽樣2 389名教師。在各樣本區(qū)縣組織集體測評,由1名主試負責發(fā)放和回收問卷。測評完成后,對數(shù)據(jù)進行錄入、編碼和篩選。剔除1份無效數(shù)據(jù)后(答題均為多選),對100份缺失數(shù)據(jù)(個別題項有所缺失則計為缺失數(shù)據(jù))進行Little’ s MCAR檢驗,結果表明數(shù)據(jù)為完全隨機缺失(p>0.05),故對此部分樣本進行刪除,[22]最終得到有效數(shù)據(jù)2 288份(有效率95.77%)。4種資歷水平的有效教師樣本信息見表1。

2. 子研究二。

子研究二面向全國11省市24區(qū)縣(市)的教師展開調查,以園所為單位進行整群抽樣。測評使用國家開放大學考試系統(tǒng),由各省市負責人組織在線測評。21 179名教師完成《“游戲活動的支持與引導”能力自評問卷》,全部自評問卷填寫有效;12 125名教師參與《“游戲活動的支持與引導”能力情境判斷測驗》,對答題不全及填寫錯誤的1 092份缺失數(shù)據(jù)進行分析,Little’s MCAR檢驗表明數(shù)據(jù)符合隨機缺失的特征(p>0.05),故進行刪除。基于使用該測驗的先行研究,[23]將作答時長少于10分鐘的數(shù)據(jù)視為無效并剔除。此外,若教師重復參與測驗則取最高分一次。按上述標準共剔除1 358份缺失及無效數(shù)據(jù)。最后,將自評問卷與情境判斷測驗的有效數(shù)據(jù)進行匹配,參與兩次測評且數(shù)據(jù)均有效的6 523名教師作為子研究二的樣本。樣本信息見表2。

(三)共同方法偏差檢驗

數(shù)據(jù)分析前,考慮到自我報告數(shù)據(jù)可能導致共同方法偏差,故采用Harman單因子分析法對兩個子研究分別進行共同方法偏差檢驗。[24]子研究一結果顯示,有6個特征值大于1的因子,且第一個因子解釋的變異量為25.16%,小于40%的臨界值。子研究二結果顯示,有2個特征值大于1的因子,且第一個因子解釋的變異量為38.80%,亦小于40%的臨界值。結果表明,研究不存在嚴重的共同方法偏差,確保了后續(xù)數(shù)據(jù)分析的統(tǒng)計學意義。

三、研究結果

(一)子研究一:教師自我評價與其資歷的比較研究

1. 幼兒園教師能力自我評價的準確性。

在保教能力自評問卷的61個題項中,教師整體得分偏高(M=3.00,SD=0.36)。具體來看,49個題項(占比80.33%)中,超過60%的教師選擇了水平3或水平4的選項。其余12題中,有7題的水平3或水平4選項被選率超過50%??ǚ綑z驗顯示,教師自評水平與資歷水平之間存在顯著差異(χ2=327.48,df=9,p<0.001),水平3和水平4選項的被選比例普遍偏高,選擇高水平選項的教師比例,遠高于抽樣中資歷水平較高的教師比例。

問卷的四個選項分別對應1~4分的四種水平,因此總分范圍為61~244分,等距劃分為4個水平段:61~106分(水平1)、107~152分(水平2)、153~198分(水平3)、199~244分(水平4)。各水平段教師的比例分別為0.26%、8.70%、65.34%和25.70%,與抽樣中教師資歷的4個水平分布有較大差異。根據(jù)自評與資歷水平的一致性,可以形成16種教師水平匹配關系與3種教師自我認知類型。如圖1所示,每塊區(qū)域中的數(shù)字表示匹配成功的人數(shù),白色區(qū)域代表自評與資歷一致的教師(占比24.21%),左上灰色區(qū)域為低估型教師(資歷水平高于自評,占比7.43%),右下灰色區(qū)域為高估型教師(自評水平高于資歷,占比68.36%)。顯然,大多數(shù)教師傾向于高估自身水平,尤其是資歷較低的教師。在資歷水平1的教師中,78.11%認為自己處于水平3或水平4;資歷水平2的教師中,89.52%認為自己處于水平3或4。而在資歷水平3和4的教師中,超過一半屬于一致型。

進一步以教師資歷水平、學歷等級、職稱等級為衡量標準,采用肯德爾相關系數(shù)(Kendall’s tau?b)檢驗教師自我評價與其資歷的一致性,各變量的相關系數(shù)(τ)如表3所示。依據(jù)相關性強弱判斷標準,[25]教師自評水平與資歷水平、學歷等級和職稱等級呈弱到中度相關(τ=0.25~0.34),而3種資歷等級水平之間存在中等至強相關關系(τ=0.49~0.67)。

2. 不同特征教師的自我評價特點。

對三種教師自我認知類型的特征進行描述性統(tǒng)計分析(見表4),發(fā)現(xiàn)幾個趨勢:(1)教齡短(≤5年)的教師在從高到低三種類型中占比逐漸降低,而教齡長(>20年)的教師占比逐漸增加;(2)學歷低(中專及以下)的教師在從高到低三種類型中占比逐漸降低,學歷高(本科及以上)的教師占比逐漸增加;(3)職稱高(高級或一級)的教師在從高到低三種類型中占比逐漸增加,而職稱低(三級或未評級)的教師占比逐漸降低;(4)無教師資格證和無編制的教師占比在從高到低三種類型中逐漸降低;(5)一致型和低估型教師中超過80%來自公辦AaBh8UK6hDvI43qcsnbpMk/Yi3zEYKAgmCZIH85v5VI=幼兒園,而高估型教師所屬幼兒園類型相對平均;(6)高估型教師中來自普通幼兒園的占比較大,而低估型教師中來自省級示范幼兒園的占比較大。通過卡方檢驗初步確認教齡、學歷等7個特征變量對教師自我認知類型有顯著影響。

采用有序Logistic回歸分析評估上述7種特征對教師能力自我認知類型的影響,其適用于因變量為有序多分類變量的情況。由于有無編制和幼兒園類型變量間存在高度相關(r=0.74),為降低共線性影響,只保留了有無編制這一變量。共線性檢驗結果顯示各變量的方差膨脹因子(VIF)最大為2.606,均小于5,表明模型無多重共線性問題?;貧w分兩步進行,模型1包含6個解釋變量(教齡、學歷、職稱、有無教師資格證、有無編制、幼兒園等級),模型2加入“教齡×幼兒園等級”和“學歷×職稱”兩個交互項,因變量均為教師自我認知類型?;貧w分析前,對模型進行了平行性檢驗和似然比檢驗。平行性檢驗原假設為模型滿足平行性,若p值大于0.05則說明模型接受原假設,符合平行性檢驗。本研究中,模型1(χ2=21.13,df=6,p=0.11)和模型2(χ2=26.35,df=8,p=0.16)均通過平行性檢驗。模型似然比檢驗用于分析模型整體有效性,其原假設是模型的回歸系數(shù)均為0,若p值小于0.05則說明拒絕原假設,模型有效。本研究中,模型1(χ2=454.98,df=6,p<0.001)和模型2(χ2=470.36,df=8,p<0.001)均有效。

有序Logistic回歸模型結果如表5所示,模型1中,教齡(β=-0.280,p<0.001)和職稱(β=-0.346,p<0.001)對教師自我認知類型具有顯著的負向影響,表明教齡越長或職稱越高的教師,較不可能高估自身能力。相反,有無教師資格證(β=0.671,p<0.01)和有無編制(β=0.584,p<0.001)對教師自我認知類型具有顯著的正向影響,表明無教師資格證或無編制的教師更容易高估自身能力水平。學歷(β=-0.150,p=0.137)和幼兒園等級(β=0.071,p=0.074)的影響未達到統(tǒng)計顯著性,表明其可能無法獨立影響教師的自我認知類型。模型2加入教齡與幼兒園等級、學歷與職稱的交互項,發(fā)現(xiàn)這些交互項在統(tǒng)計上顯著:教齡和幼兒園等級的交互項(β=-0.101,p<0.001),學歷和職稱的交互項(β=-0.155,p<0.01)。這說明學歷的增高可以增強職稱對降低高估概率的作用,幼兒園等級的增高也可以增強教齡對降低高估概率的作用。圖2展示了不同交互項水平上因變量的預測概率,橫坐標代表教齡和幼兒園等級的不同組合水平,第一個數(shù)字表示教齡從低到高的4種水平,第二個數(shù)字表示幼兒園等級從低到高的4種水平,例如,“4.4”表示教齡大于20年和省級示范幼兒園的組合,縱坐標表示教師自我認知類型的預測概率。數(shù)據(jù)點表示在特定交互組合下,教師屬于某一自我認知類型的概率;誤差棒表示預測概率的標準誤。由此可見,隨著教齡和幼兒園等級的增長,教師自我認知類型為高估型的概率明顯下降,而為一致型和低估型的概率明顯上升。

(二)子研究二:自我評價與客觀評價結果的比較研究

1. 幼兒園教師能力自我評價的準確性。

自我評價和客觀評價分數(shù)標準化后的頻數(shù)分布如圖3所示。使用偏度系數(shù)(SK)來反映數(shù)據(jù)分布的偏斜程度,偏度系數(shù)為0說明數(shù)據(jù)呈正態(tài)分布。相較于客觀評價(SK=0.07),教師能力自評呈明顯的負偏態(tài)分布(SK=-0.40),說明自評分數(shù)虛高。主要變量的Pearson相關系數(shù)或Spearman相關系數(shù)如表6所示,各變量間的相關性具有統(tǒng)計學意義,但自我評價和客觀評價之間的一致性很低(r=0.124)。此外,自我評價與教師學歷、職稱之間的相關性明顯低于客觀評價與教師學歷、職稱之間的相關性。

參照先前的研究,自我評價與客觀評價之間的弱相關表明自評的準確性不足,但這一結論僅限于群體層面。相關性低,表明該教師群體作為一個整體不能有效地進行自我評估,但群體內教師的異質性被掩蓋,可能導致結論失真。[26]為克服此問題,本研究引入絕對準確性、偏差指數(shù)和相對準確性三項指標,以在個體層面深入分析自評的準確性。[27]根據(jù)恩斯特(Ernst)等人的研究,絕對準確性是自我評價與客觀評價分數(shù)的絕對差,偏差指數(shù)為二者的符號差,相對準確性則通過Goodman?Kruskal gamma系數(shù)計算自我評價和客觀評價分數(shù)的排名相關性。[28]為比較不同測評工具的分數(shù),進行了z標準化處理。

教師自評的絕對準確性和偏差指數(shù)如表7所示。根據(jù)定義,若絕對準確性和偏差指數(shù)為0,表示評價完全準確。通過單樣本t檢驗比較絕對準確性與0的差異,結果顯示,效應值較大,絕對準確性明顯偏離0[t(6522)=108.58,p<0.001,d=1.34],說明教師自評并不準確。偏差指數(shù)反映教師高估或低估自身能力的程度,本研究中偏差指數(shù)為0.00,單樣本t檢驗未發(fā)現(xiàn)明顯高估或低估趨勢[t(6522)=-0.00,p=1.00]。然而,對這一結果需謹慎解釋,因為高估和低估可能相互抵消,導致平均偏差指數(shù)無法提供有意義的信息。[29]研究中發(fā)現(xiàn)偏差指數(shù)的范圍為-4.52~3.78,表明個體間存在較大偏差。進一步將客觀評價分數(shù)從低到高排列,按四分位數(shù)分組,發(fā)現(xiàn)第一四分位數(shù)的教師偏差指數(shù)為1.09,說明在客觀評價中得分較低的教師明顯高估了自身能力;而第四四分位數(shù)的教師偏差指數(shù)為-0.99,說明在客觀評價中得分較高的教師明顯低估了自身能力。并且,處于第一四分位數(shù)的教師的高估現(xiàn)象比處于第四四分位數(shù)的教師的低估現(xiàn)象更為嚴重。因此,盡管平均偏差指數(shù)表明結果無偏差,但實際上大多數(shù)教師存在明顯的高3sNs8YzYPpggVJuqMSs6qgzOlJYcQL6P9udY7Uj61hs=估或低估現(xiàn)象,只是這些個體差異在樣本總體中相互抵消而出現(xiàn)平衡。此外,相對準確性方面,Goodman?Kruskal’s gamma檢驗顯示,自評與客觀評價之間的相關性較弱(γ= 0.085,p<0.001)。綜合三項指標,教師自我評價明顯偏離了其在客觀評價中所表現(xiàn)的專業(yè)能力。

2. 不同特征教師的自我評價特點。

為探索教師特征與自評準確性的關聯(lián),本研究以絕對準確性和偏差指數(shù)為因變量進行了多元回歸分析。初步檢查顯示,模型中解釋變量的方差膨脹因子(VIF)最大值為2.461,遠低于5,且變量間的相關系數(shù)最大不超過0.6,確認了共線性和自相關均在可接受范圍內。為避免自相關和異方差對結果的影響,模型采用懷特穩(wěn)健估計,回歸結果如表8所示。學歷與絕對準確性呈顯著負相關(β=-0.070,p<0.001),表明教師學歷越高,自評的準確性越高,而其他4項特征與絕對準確性無顯著關聯(lián)。同時,5個特征變量與偏差指數(shù)存在顯著關聯(lián)。具體而言,教齡(β=-0.009,p<0.001)、學歷(β=-0.239,p<0.001)和職稱(β=-0.082,p<0.001)與偏差指數(shù)呈顯著負相關,表明更高的教齡、學歷和職稱降低了高估的概率;有無教師資格證(β=0.315,p<0.001)、有無編制(β=0.291,p<0.001)與偏差指數(shù)呈顯著正相關,即無教師資格證、無編制增加了高估的可能性。

四、結論與討論

盡管教師自我評價的重要性已經在理論上得到廣泛認可,然而關于其準確性的研究結論卻喜憂參半。本研究對幼兒園教師能力自評的準確性進行了探究,這是一個目前鮮有研究且缺乏實證數(shù)據(jù)支撐的領域。鑒于自評準確性研究往往面臨“教育評價中沒有真正黃金標準”的挑戰(zhàn),以及普遍使用的單一相關性方法的局限,本研究參考多種反饋來源(資歷及客觀評價),使用相關分析與準確性指標,以衡量幼兒園教師能力自評的準確性。既從更全面的視角考察了幼兒園教師自評的準確性,又為教師自評準確性的研究貢獻了更豐富的實證依據(jù)。

(一)幼兒園教師能力自評與其資歷及客觀評價缺乏一致性,準確性不足

為衡量幼兒園教師自我評價的準確性,本研究以資歷和客觀評價為參考,提供了幼兒園教師自評準確性不足的實證證據(jù)。首先,基于自評水平與資歷水平的一致性,區(qū)分出三種教師自我認知類型。其中,高估型教師占比68.36%,遠高于一致型和低估型,這種高估傾向在自我評價研究領域被稱為“優(yōu)于平均效應”。先前研究對“優(yōu)于平均效應”的普遍性存疑,其確切的文化和地理范圍有待進一步探索,[30]本研究的發(fā)現(xiàn)為該效應提供了來自中國文化背景的證據(jù)。盡管國外研究者認為東亞文化可能有利于抑制這一效應,但本研究發(fā)現(xiàn)高估自身能力的傾向在幼兒園教師群體中仍然具有普遍性。未來研究可以增加跨文化、跨階段比較的視角,關注不同文化價值觀、社會期望和教育體系等因素如何塑造教師的自我認知和評價行為。其次,相關分析顯示教師自評水平與其資歷水平的相關性為0.33,而與基于情境判斷測驗的客觀評價結果的相關性更低,僅為0.12。數(shù)十年來,來自不同學科領域和文化背景的實證證據(jù)揭示了自我評價準確性研究中參差不齊的結果以及整體有效性不足的現(xiàn)象。例如,法爾基科夫(Falchikov)和布德(Boud)關于高等教育中定量自我評價研究的元分析顯示自我評價和外部評價之間的相關性范圍為-0.05~0.82,平均相關性為0.39;[31]澤爾(Zell)和克里贊(Krizan)發(fā)現(xiàn)自我評價和標準測試、專家評價之間的平均相關性為0.29,范圍為0.09~0.39;[32]布圖利·哈蒂干(Blanch?Hartigan)得出的平均相關性為0.21,范圍為-0.18~0.74。[33]鄧寧(Dunning)等人指出:這種程度的相關性不能說毫無意義,但的確遠非完美。[34]而與上述同樣使用外部績效和標準化測試作為參考的研究相比,本研究的相關性結果處于均值以下水平,表明幼兒園教師能力自評與其資歷及客觀評價缺乏一致性。此外,本研究采納沃德(Ward)等人的建議檢驗了教師在個體層面上對自身專業(yè)能力評價的準確性,[35]結果顯示,絕對準確性遠偏離0,偏差指數(shù)的范圍(-4.52~3.78)高度可變,相對準確性γ系數(shù)僅為0.085,三項指標均表明教師自評明顯偏離其在客觀評價中所表現(xiàn)的專業(yè)能力。

綜上所述,本研究從實證角度并基于更可靠的方法對當前教師自評有效性的質疑給出了具有統(tǒng)計學意義的回應,是對教師自評有效性困境的揭示,但隨之而來的是對教師專業(yè)成長的擔憂。不準確的自我評價意味著教師可能無法辨別自己專業(yè)能力的優(yōu)勢和劣勢,進而無法做出有效的學習決策;普遍的高估傾向也有可能影響其在專業(yè)發(fā)展活動中的自主性和積極性。因此,更重要的是捅破窗戶紙后,繼續(xù)追問教師自我評價何以有效。

(二)處于不同發(fā)展階段的教師對能力的評價存在差異,再現(xiàn)鄧寧-克魯格效應

教師自評與其資歷、客觀評價的比較結果印證了自我評價研究中著名的鄧寧-克魯格效應,呈現(xiàn)“新手的高估與熟手的低估”“低水平者的高估與高水平者的低估”兩種明顯傾向。鄧寧-克魯格效應背后的心理機制多樣,其中信息不足和信息忽視得到廣泛討論,即人們往往缺乏或忽視準確自我評價所需的關鍵信息。在社會和知識領域中,識別能力所需的技能與產生勝任反應所需的技能趨同,因而準確自我評價的關鍵信息取決于專業(yè)知識和能力,這是人們在自我評價時面臨的一個既定問題,對于低能力者來說尤為明顯。[36]由于元認知能力缺陷,低水平教師在自我評價時,面臨著雙重困境,即在專業(yè)知識或能力得到發(fā)展之前,他們既不能呈現(xiàn)高水平的績效表現(xiàn),也無法正確認識到自己能力低下的問題,反而會高估自己的能力,甚至超過平均水平。[37]在幼兒園教師評價體系中,學歷和職稱是衡量教師能力水平的重要尺度,有無編制、教師資格證也與綜合素質密切相關。在本研究中,具有低學歷、未評級、無編制或無教師資格證等代表低水平群體特征的教師,受限于理論知識和實踐經驗的雙重不足,易陷入一種“元無知”的混沌狀態(tài),導致低水平教師在能力自我評價時“不知其然,亦不知其所以然”,從而面臨“無能力且不知情”的困境。此外,不具備職業(yè)資格、職稱或穩(wěn)定編制可能導致教師產生職業(yè)身份和安全感危機,觸發(fā)心理補償機制。為維持自我價值感和效能感,即便證據(jù)不足,教師的自我評價也傾向于符合自己的期望結果。這種“愿望思維”是低水平教師應對職業(yè)不確定性的自然心理策略,但可能會阻礙對其職業(yè)現(xiàn)實的準確評價。[38]

除“低水平者的高估”外,還呈現(xiàn)“新手的高估”這一傾向。新手型教師指教齡在5年以下的教師,其具有更新的專業(yè)知識基礎,但對理論知識的掌握尚處于淺表層且實踐性知識嚴重缺乏,[39]理論知識的自信和實踐經驗的淺薄使其存在一些積極錯覺,表現(xiàn)為過高的自我評價、夸大的掌控感以及不切實際的樂觀,而這些表現(xiàn)可能是處于“生存適應”階段的一種積極的心理適應。[40]然而,教齡和幼兒園等級的交互效應表明幼兒園等級能夠影響新手型教師自評的準確性,即相較于來自高等級幼兒園的新手型教師,等級較低幼兒園的新手型教師更傾向于高估自身能力水平。幼兒園等級折射出外部環(huán)境的支持程度與教師自我評價參照標準的差異,省、市級示范性幼兒園中,高能力水平的教師更多,而等級低的幼兒園則更少。有研究發(fā)現(xiàn),社會比較會影響自我評價的準確性,個人在確定自己能力水平時會將對他人能力的認知作為線索。費斯汀格(Festinger)的社會比較理論指出,當個體面臨上行比較時,會降低自我評價水平,而面臨下行比較時則會提高自我評價水平。[41]因此,來自高等級幼兒園的新手型教師,其比較的錨更多是高水平教師,更易發(fā)現(xiàn)自身能力不足,不會做出過高評價。而來自等級較低幼兒園的新手型教師,面對的是整體素質較低的教師隊伍,因此更容易沉浸在自我營造的應有向度中,做出過高估計。

相反,隨著專業(yè)知識或熟練程度的提高,大量研究表明自我評價往往變得不那么樂觀,本研究也發(fā)現(xiàn)了“高水平者的低估”和“熟手的低估”兩種占比不大但仍然明顯的傾向。對此可用虛假一致性效應(false?consensus effect)來解釋,即人們常常會高估或夸大自己的信念、判斷及行為的普遍性,能力高的人錯誤地估計他人也具有同等能力,而對自己能力突出的這一特征并不敏感。[42]此外,更多的專業(yè)知識可能會使人更能意識到還有更多需要學習的內容,或者他人的表現(xiàn)更出色,從而抑制自我評價的準確性。[43]總之,處于不同發(fā)展階段的教師對能力的評價存在兩種截然不同的傾向?;谶@一結果,提高自我評價準確性的關鍵因素是對所評價的技能或知識具有更高的能力和更多的經驗,盡管與提高自評準確性相關的因素很多,但培養(yǎng)專業(yè)知識和能力應當成為優(yōu)先事項。[44]

五、啟示與展望

(一)融合之徑:自我評價與專業(yè)發(fā)展的有機整合

當下實踐中出于對分層培訓效率的考量,教師自評應當作為一種高效率的評價方式以滿足大規(guī)模培訓的現(xiàn)實需求,因而我們必須關切并回應培訓實施者對于自評準確性的現(xiàn)實擔憂。本研究顯示,幼兒園教師自我評價的準確性不足,應當審慎對待教師自評的結果,其尚不能獨立作為科學診斷、能力分層及按需培訓的依據(jù),仍需結合多種外部反饋來綜合診斷教師能力水平。然而,這并非要否定自我評價在教師培訓中的效用,面對自評不準確這一既定事實,當下更重要的是,將自評從一種診斷性活動轉向教師專業(yè)發(fā)展的過程性活動,發(fā)揮其自我調節(jié)的功能。從本質上講,自我評價是一個學習過程,而非一種評價方法。[45]這意味著即便是不準確的自評結果,也能夠對教師的學習提供啟示,成為教師專業(yè)發(fā)展的機會窗口。教師在特定時間點對自己能力的判斷總是片面的、不完整的,給予教師關于其預期與實際表現(xiàn)之間差異的反饋,可以讓其意識到自我感知中的盲點進而消除偏差。在這一過程中,應幫助教師發(fā)展元認知和自我調節(jié)能力,以監(jiān)測和改進自己的學習,系統(tǒng)地提升專業(yè)能力并改進教育實踐。而專業(yè)知識、能力和經驗又正是影響教師自我評價準確性的關鍵因素,因此,專業(yè)發(fā)展的效益又會增溢到教師的自我評價活動中,從而形成“專業(yè)能力提升—自評準確性提高”的良性循環(huán)。這對于改善“低水平者的高估”和“新手的高估”極為有益。

為此,當下教師專業(yè)發(fā)展活動要將自我評價實施與自我調節(jié)學習過程有機整合,避免被結果導向的評價思維所裹挾,使評價和學習成為兩條交織并行的發(fā)展線。借鑒齊莫曼(Zimmerman)等人提出的自我調節(jié)學習的社會認知模型,[46]以及晏(Yan)和布朗(Brown)提出的循環(huán)的自我評價過程模型,[47]可以從以下方向實現(xiàn)評價和學習的有機融合。其一,培訓目標的設置應有發(fā)展性、層次性,在培訓前要確保教師理解目標,并能夠結合自身經驗內化為自己的目標和動機,作為評價自我學習進程和調節(jié)學習的依據(jù)。其二,利用多種反饋來源獲得的評價信息應及時反饋給教師,注意反饋內容應該指向具體的學習目標,而非對優(yōu)劣的評判,以幫助教師形成準確的自我定位并明確發(fā)展方向。其三,創(chuàng)造自我反思和改進的空間,確保教師有足夠的時間利用獲得的內部外反饋對實踐進行反思和修正。確定績效標準、反饋尋求和自我改進這三個活動在培訓過程中應是有序循環(huán)的,將自我評價內在于自我調節(jié)學習過程,可促進教師自我評價趨于準確和真實。

為促進教師自我評價和專業(yè)發(fā)展的有效整合,未來研究亦應在關注準確性的基礎上,增加自我評價研究的過程性視角,進一步探索教師自我評價的準確性與其隨后在培訓中的學習行為和專業(yè)成長間的關系、隨培訓活動推進的變化情況等。自我評價的過程機制被稱為“下一個黑盒”,[48]當前我們只知道一些輸入(例如教師、工具、標準和目的)被投進黑盒中,而一些輸出(例如評價和自我調節(jié)學習的效果)將隨之產生。然而,自我評價的過程機制、輸入與輸出的效益轉化基本上是未知的。采用過程視角,展開系列相互關聯(lián)的實證研究,形成教師自我評價研究“鏈”,是實現(xiàn)自我評價與專業(yè)發(fā)展有效整合的基礎。

(二)生態(tài)構建:創(chuàng)設支持教師自評的實踐環(huán)境

除培訓的現(xiàn)實需求外,當前教師評價體系呈現(xiàn)出從他評向自評轉變的趨勢,反映了更廣泛的實踐層面對于教師自評價值充分發(fā)揮的期望,并進而歸為對自評準確性的要求。研究表明幼兒園教師的自我評價普遍存在偏差,需要自上而下構建有利于教師自評的生態(tài),以全面提升其準確性和有效性。

首先,各相關主體應當形成正確的自我評價觀,回歸自我評價的內在本質追求,即為了促進教師有效學習和專業(yè)成長,而非作為一次總結性的評價,一次性貼標簽、下定論的活動。盡管教育政策中的自我評價都明確指向教師專業(yè)發(fā)展,然而當前實踐中對自我評價本質的認識尚未實現(xiàn)從總結性向形成性的轉變,致使一部分評價主體出于對準確性的擔憂而模糊自我評價的價值,也使得被評價的教師出于對評價結果的顧慮而產生主觀不準確的傾向,從而形成背離自我評價本質的惡性循環(huán)。對此,要構建教師自我評價的支持性生態(tài)。具體而言,評價主體及幼兒園層面,應尊重教師作為自我發(fā)展的主體,將自我評價以反思實踐的形式融入日常教學活動,如鼓勵教師撰寫教育日志或反思日記,使其成為教師自我專業(yè)成長的同行伴侶和園本教研的資源。此外,加強學習共同體文化建設,為教師自我評價提供多元參照和反饋來源,以解決小范圍社會比較所造成的信息孤島。如組建各級教研室、開展研討會,為教師提供可持續(xù)的交流協(xié)作和反思學習的平臺。過程中可引入標桿管理和同行評估,使來自不同等級幼兒園、具有不同經驗水平的教師相互之間進行對標練習,這不僅有助于低水平和新手型教師全面了解自身專業(yè)能力的實然與應然,還能使高水平和成熟型教師提升對自身優(yōu)勢的敏感度,從而改善“高水平者的低估”和“熟手的低估”的狀況。最后,需制定科學的教師自我評價指標體系和具體操作方案,使教師自評有據(jù)可依。自評指標體系的構建,在理念上可結合最近發(fā)展區(qū)和學習路徑理論,以達到發(fā)展性、漸進性和激勵性目的;在內容上要具有全面性、具體性和可轉化性,既要能夠反映幼兒園教師保教專業(yè)能力的綜合性,也要避免籠統(tǒng)抽象難于操作,致力于將指標變目標,使自評的關注點從優(yōu)劣等結果性要素轉移到過程性要素(如教師保教實踐的行為控制等)上;在形式上要注重教師參與,教師是自評的實施者,只有將其對專業(yè)能力的理解、教育工作的經驗以及對自評操作的需求融入到評價指標體系中,才能提升教師在自我評價中的主體意識和內生動力。

(三)方式革新:技術賦能主客觀評價融合

為提升自評準確性,研究者們已從評價機制、組織和環(huán)境等層面提出了豐富的策略。然而,構建外部生態(tài)需要時間、資源以及系統(tǒng)的變革,實踐中的實施可能并不理想。隨著準確性不足的證據(jù)持續(xù)涌現(xiàn),客觀評價的呼聲日益高漲,亟需推動自評方式進步以驅動實踐應用。[49]有研究者提出,基于情境的自我評價方式能夠更加接近客觀評價結果,[50][51]反映了自我評價的未來走向,即通過與客觀性評價的融合來提升其準確性。自我評價因其主觀性強而遭到詬病,客觀性評價則難于操作實施,二者融合能夠彌補各自的局限,并有效發(fā)揮自評服務對于教師自我學習和發(fā)展的功能。

突破主客觀評價的壁壘是自我評價發(fā)展的未來方向。過程性理論為此提供了理論基礎,而技術的進步則帶來了機遇。根據(jù)過程性理論,自我評價是一個整合高質量的內外部信息和數(shù)據(jù)以評估當前表現(xiàn)并促進未來學習的過程,包括尋求各種反饋進行持續(xù)校準。[52]專家評價、同行評價、客觀性評價等均可為教師提供反饋,其中,相較于專家、同行等他人評價,客觀性評價具有準確可靠的優(yōu)勢,且避免了社交情感方面的壓力,對教師更為友好。[53]但傳統(tǒng)的客觀性評價難于實施,通常由外部發(fā)起并主導,不適合教師自主使用。因此,在缺乏外部引導和約束的情況下,需要為教師提供適宜的支架,幫助他們高效地進行自我評價和自我管理。

隨著技術的發(fā)展,利用技術增強的學習和評價環(huán)境構建使上述構想成為可能。具有代表性的是以“為了學習和發(fā)展的評價”作為價值導向的計算機自適應測驗,將能力測評與能力發(fā)展相結合。根據(jù)被試作答表現(xiàn)進行智能化出題,不僅能精準評估被試的能力水平,還能有效促進其自我反思、自我學習、自我成長以及自我意識的形成。此外,基于深度學習算法的大語言模型(LLM)的發(fā)展,掀起了人工智能技術浪潮。將人工智能深入應用到教育教學和管理全過程、全環(huán)節(jié)已成為時代主題,[54]教育評價研究領域已開始關注其有效性、適應性,并嘗試利用人工智能實現(xiàn)自動化評價和反饋過程,為教師自我評價和自主學習帶來無限可能。[55][56]計算機自適應和人工智能能夠為教師提供高效、個性化和智能化的評價體驗,以及精準的評價結果,進而有效服務于自我評價和自我調節(jié)學習,幫助教師成為自主學習者和終身學習者??傊?,利用技術賦能主客觀評價融合,推動自評方式的根本革新,不僅是突破準確性瓶頸的關鍵,更是回歸評價本質、服務于教師終身學習發(fā)展的時代趨勢,值得我們深入探討其實現(xiàn)方式。

注釋:

①自評依據(jù)及數(shù)據(jù)得到馮曉霞教授領銜負責的中小學幼兒園教師培訓課程標準“保育與教育”研制項目的支持。

參考文獻:

[1]SAMUELS M, BETTS J. Crossing the threshold from description to deconstruction and reconstruction: using self?assessment to deepen reflection[J]. Reflective Practice,2007,8(2):269-283.

[2]EVA K W, REGEHR G. Self?assessment in the health professions: a reformulation and research agenda[J]. Academic Medicine,2005,80(10):S46-54.

[3]DAVIS A, MCDONALD D. Teachers’ reflections of instructional effectiveness: self?assessment through a standards?based appraisal process[J]. Reflective Practice,2019,20(1):125-141.

[4][6][30][34][36]DUNNING D, HEATH C, SULS J M. Flawed self?assessment: implications for health, education, and the workplace[J]. Psychological Science in the Public Interest,2004,5(3):69-106.

[5][13][32]ZELL E, KRIZAN Z. Do people have insight into their abilities? A metasynthesis[J]. Perspectives on Psychological Science,2014,9(2):111-125.

[7][20]LEóN S P, PANADERO E, GARCí?MARTíNEZ I. How accurate are our students? A meta?analytic systematic review on self?assessment scoring accuracy[J]. Educational Psychology Review,2023,35(4):106.

[8][31]FALCHIKOV N, BOUD D. Student self?assessment in higher education: a meta?analysis[J]. Review of Educational Research,1989,59(4):395-430.

[9]KRUGER J, DUNNING D. Unskilled and unaware of it: how difficulties in recognizing one’s own incompetence lead to inflated self?assessments[Z]. US: American Psychological Association,1999:77, 1121-1134.

[10][51]KASTORFF T, SAILER M, VEJVODA J, et al. Context?specificity to reduce bias in self?assessments: comparing teachers’ scenario?based self?assessment and objective assessment of technological knowledge[J]. Journal of Research on Technology in Education,2023,55(6):917-930.

[11]HU B Y, ZHOU Y, LI K. Pinpointing Chinese early childhood teachers’ professional development needs through self?evaluation and external observation of classroom quality[J]. Journal of Early Childhood Teacher Education,2014,35(1):54-78.

[12]高宏鈺,許文潔,劉昊,等.自評與他評雙視角下幼兒園教師觀察能力的現(xiàn)狀與提升策略[J].幼兒教育,2023(27):30-35.

[14]HARRINGTON J P, MURNAGHAN J J, REGEHR G. Applying a relative ranking model to the self?assessment of extended performances[J]. Advances in Health Sciences Education,1997(02):17-25.

[15][26][35]WARD M, GRUPPEN L, REGEHR G. Measuring self?assessment: current state of the art[J]. Advances in Health Sciences Education,2002,7(1):63-80.

[16]DUNNING D, HELZER E G. Beyond the correlation coefficient in studies of self?assessment accuracy: commentary on Zell & Krizan(2014)[J]. Perspectives on Psychological Science,2014,9(2):126-130.

[17][50]SCHEITER K. Lernen und lehren mit digitalen medien: eine standortbestimmung[J]. Zeitschrift für Erziehungswissenschaft,2021,24(5):1039-1060.

[18]TAIT?MCCUTCHEON S, KNEWSTUBB B. Evaluating the alignment of self, peer and lecture assessment in an Aotearoa New Zealand pre?service teacher education course[J]. Assessment & Evaluation in Higher Education,2018,43(5):772-785.

[19][48]ANDRADE H L. A critical review of research on student self?assessment[J]. Frontiers in Education,2019(04):87.

[21][23]郭力平,孫佳玥,李麗.幼兒園教師保育與教育能力情境判斷測驗——基于2 304名教師的實證研究[J].學前教育研究,2021(11):46-57.

[22]鄧建新,單路寶,賀德強,等.缺失數(shù)據(jù)的處理方法及其發(fā)展趨勢[J].統(tǒng)計與決策,2019,35(23):28-34.

[24]周浩,龍立榮.共同方法偏差的統(tǒng)計檢驗與控制方法[J].心理科學進展,2004(06):942-950.

[25]RUMSEY D J. Statistics for dummies[M]. New York: John Wiley & Sons,2016:284.

[27]SCHRAW G. A conceptual analysis of five measures of metacognitive monitoring[J]. Metacognition and Learning,2009,4(1):33-45.

[28]ERNST H M, WITTWER J, VOSS T. Do they know what they know? Accuracy in teacher candidates’ self?assessments and its influencing factors[J]. British Educational Research Journal,2023,49(4):649-673.

[29]PRINZ A, GOLKE S, WITTWER J. Refutation texts compensate for detrimental effects of misconceptions on comprehension and metacomprehension accuracy and support transfer[Z]. US: American Psychological Association,2019:111,957-981.

[33]BLANCH?HARTIGAN D. Medical students’ self?assessment of performance: results from three meta?analyses[J]. Patient Education and Counseling,2011,84(1):3-9.

[37]陳彥君,石偉,應虎.能力的自我評價偏差:鄧寧—克魯格效應[J].心理科學進展,2013,21(12):2204-2213.

[38]BéNABOU R, TIROLE J. Self?confidence and personal motivation[J]. The Quarterly Journal of Economic,2002,117(3):871-915.

[39]范奭琛,汪甜甜,周鈞.新任研究生學歷幼兒園教師的身份沖突與應對[J].學前教育研究,2023(01):72-82.

[40]BUTLER R. Are positive illusions about academic competence always adaptive, under all circumstances: new results and future directions[J]. International Journal of Educational Research,2011,50(4):251-256.

[41][42]MUSSWEILER T, RüTER K, EPSTUDE K. The ups and downs of social comparison: mechanisms of assimilation and contrast[Z]. US: American Psychological Association,2004:87,832-844.

[43]ROSS L, GREENE D, HOUSE P. The “false consensus effect”: an egocentric bias in social perception and attribution processes[J]. Journal of Experimental Social Psychology,1977,13(3):279-301.

[44]PANADERO E, BROWN G T L, STRIJBOS J. The future of student self?assessment: a review of known unknowns and potential directions[J]. Educational Psychology Review,2016,28(4):803-830.

[45]YAN Z. Student self?assessment as a process for learning[M]. Qxfordshire: Taylor & Francis,2022:4.

[46]ZIMMERMAN B J. Chapter 2?Attaining self?regulation: a social cognitive perspective[M]//Boekaerts M, Pintrich P R, Zeidner M. Handbook of Self?Regulation. San Diego: Academic Press,2000:13-39.

[47]YAN Z, BROWN G T L. A cyclical self?assessment process: towards a model of how students engage in self?assessment[J]. Assessment & Evaluation in Higher Education,2017,42(8):1247-1262.

[49]LSCHNER A, BACKFISCH I, STURMER K. A test?based approach of modeling and measuring technological pedagogical knowledge[J]. Computers & Education,2019(142):103645.

[52]EPSTEIN R M, SIEGEL D J, SILBERMAN J. Self?monitoring in clinical practice: a challenge for medical educators[J]. Journal of Continuing Education in the Health Professions,2008,28(1):5-13.

[53]MACDONALD H A, SULSKY L M, SPENCE J R, et al. Cultural differences in the motivation to seek performance feedback: a comparative policy?capturing study[J]. Human Performance,2013,26(3):211-235.

[54]孫杰遠.教育強國背景下的基礎教育變革:可為、應為與何為[J].學前教育研究,2024(01):1-11.

[55]吳砥,郭慶,吳龍凱,等.智能技術賦能教育評價改革[J].開放教育研究,2023,29(4):4-10.

[56]李克建,陸浩.學前教育質量評價工具的演進路徑與未來趨勢[J].學前教育研究,2023(02):1-11.

Accuracy in Preschool Teachers’ Self?Assessment

—Comparing with Qualification and Objective Assessment

GUO Liping1,2, ZENG Bei1,2, ZHU Jinxi1,2

(1Faculty of Education, East China Normal University, Shanghai 200062 China; 2East China Normal University Branch, Collaborative Innovation Center of Assessment for Basic Education Quality, Shanghai 200062 China)

Abstract: Teachers’ self?assessment serves as a crucial foundation for diagnosing professional abilities and implementing targeted training. Moreover, it fulfills an inherent requirement for autonomous and lifelong learning. The accuracy of self?assessment plays a pivotal role in determining its effectiveness. However, there is a dearth of systematic research examining the accuracy of self?assessment among preschool teachers and whether variations in accuracy exist among teachers with different backgrounds. The current study aims to examine the accuracy of preschool teachers’ self?assessment of abilities by considering their qualifications and objective assessment as reference points. Sub?study 1 analyzed self?assessment scores and qualification information of 2 288 teachers, while sub?study 2 compared the self?assessment of 6 523 teachers with objective assessment scores. The findings are as follows:(1)There was a lack of consistency between teachers’ self?assessment scores and their qualification levels, with a significant prevalence of overestimation; (2)The skewness coefficient, correlation coefficient, absolute accuracy, and bias index collectively indicated a lack of consistency between teachers’ self?assessment and objective assessment scores; (3)Teachers with different teaching years displayed variations in their self?assessment of abilities, representing the “Dunning?Kruger effect.” Therefore, it is necessary to facilitate the integration of self?assessment and professional development and establish a virtuous cycle between heightened levels of professional ability and more precise self?assessment. Further research should focus on establishing a supportive ecosystem conducive to teachers’ self?assessment and enhancing the quality and efficiency of self?assessment in practical settings. Increased efforts to integrate subjective and objective assessments could drive innovation in self?assessment methods, leading to greater accuracy and efficiency.

Key words: preschool teachers; self?assessment; objective assessment; qualification

(責任編輯:熊燦燦)