馬朝珉 李偉凱 袁曉東 孟軍 吳秋峰
摘? 要:該文以某高校思政類必修課程的學(xué)生評教結(jié)果為研究樣本,從評教分?jǐn)?shù)(封閉式問題)和意見建議(開放式問題)兩部分出發(fā),分析課程成績與評教結(jié)果的關(guān)系,識別評教結(jié)果的有效性,探索高校學(xué)生評教結(jié)果應(yīng)用路徑。研究發(fā)現(xiàn),學(xué)生課程成績與評教分?jǐn)?shù)整體數(shù)據(jù)呈現(xiàn)不相關(guān),個別課程出現(xiàn)負(fù)相關(guān);在大多數(shù)情況下,課程成績?yōu)椤爸小保?0分≤中<80分)的學(xué)生評教分?jǐn)?shù)有效性最高;大一年級課程成績中等以上(≥70分)的學(xué)生評教分?jǐn)?shù)有效性高于其他年級。運(yùn)用K-means聚類算法對評教數(shù)據(jù)進(jìn)行聚類分析,將學(xué)生評教樣本分為高滿意高收獲型、高滿意低收獲型、低滿意高收獲型和低滿意低收獲型四個類別。在課程成績分析基礎(chǔ)上,提出高校學(xué)生評教結(jié)果合理應(yīng)用的建議。
關(guān)鍵詞:高校學(xué)生評教;課程成績;評教結(jié)果識別與應(yīng)用;思政類必修課程;K-means聚類算法
中圖分類號:G642? ? ? ? 文獻(xiàn)標(biāo)志碼:A? ? ? ? ? 文章編號:2096-000X(2023)28-0014-06
Abstract: Using the students' teaching evaluation results of ideological and political compulsory courses in a university as a research sample, the article analyzes the relationship between course scores and evaluation results, identifies the effectiveness of evaluation results, and explores its application path from two parts-closed question and open questions. The study found that the overall data of student course scores and evaluation scores are not correlated, and individual courses are negatively correlated; in most cases, students whose course scores are "medium"(70 points≤medium<80 points) have the highest effectiveness in evaluation scores; the effectiveness of evaluation scores for students with average grades(≥70 points) in the freshman year is higher than other grades. The article uses K-means clustering algorithm to cluster the teaching evaluation data, and the students' evaluation samples are divided into four categories: high satisfaction-high yield, high satisfaction-low yield, low satisfaction-high yield, and low satisfaction-low yield. Finally, the article puts forward some suggestions on the reasonable application of university students' teaching evaluation results.
Keywords: university students' teaching evaluation; course score; identification and application of teaching evaluation results; compulsory ideological and political courses; K-means clustering algorithm
學(xué)生評教是教學(xué)評價的常規(guī)方式,也是教學(xué)質(zhì)量監(jiān)控和反饋的重要手段。除教學(xué)因素外,其他非教學(xué)因素不同程度地影響學(xué)生評教結(jié)果。學(xué)術(shù)界對此展開深入研究,探尋評教過程及結(jié)果的優(yōu)化路徑。李盼道等[1]分析高校學(xué)生評教結(jié)果失效的影響因素,包括學(xué)生因素、教師因素、學(xué)校因素及課程因素,提出評教容易導(dǎo)致逆向選擇并闡述了改善路徑;盛艷燕等[2]認(rèn)為教師職稱、教師年齡、教師學(xué)歷、學(xué)生年級和班級人數(shù)對評教分?jǐn)?shù)有微弱影響,學(xué)生年級和教師職稱對評教分?jǐn)?shù)的影響相對較大,應(yīng)挖掘非教學(xué)因素影響學(xué)生評教分?jǐn)?shù)的調(diào)節(jié)變量。潘云華等[3]研究發(fā)現(xiàn),性別、年級、學(xué)習(xí)成績、對評教必要性的認(rèn)知、對評教潛在作用的認(rèn)知及評教態(tài)度是影響高校學(xué)生評教有效性的學(xué)生個體因素,且學(xué)生主觀因素對評教有效性的影響大于客觀因素。本課題組前期研究發(fā)現(xiàn),教師的職稱、性別、學(xué)歷和年齡段,課程的學(xué)分、班額、屬性及年級均對學(xué)生評教分?jǐn)?shù)具有獨(dú)立或交互作用,應(yīng)完善教學(xué)安排、合理利用評教數(shù)據(jù)、改變職稱評定導(dǎo)向。
在非教學(xué)影響因素中,教師背景、課程背景、學(xué)生背景可測量但難以改變;對評教意義的認(rèn)知可通過宣傳引導(dǎo)等措施改善,但較為抽象,難以實時測量;課程成績可測量可篩選,與評教成績幾乎同時獲得(同類研究中有“學(xué)習(xí)成績、學(xué)習(xí)成果、考試成績、考試分?jǐn)?shù)”等描述,本文研究對象為課程最終的總成績,包含平時成績、考試成績、作業(yè)等,以下統(tǒng)稱為“課程成績”)。因此一些研究者和高校教學(xué)管理人員重點關(guān)注學(xué)生課程成績,試圖通過課程成績分析評定評教數(shù)據(jù)的有效性。有研究者認(rèn)為應(yīng)刪除課程成績差的學(xué)生的評教數(shù)據(jù),原因有三:第一,對教師心存不滿,故評教打分低,不夠客觀;第二,沒有聽懂課程內(nèi)容,無法評論教師教課水平;第三,出勤率較低,未參加教學(xué)活動則不具備評價資格。也有研究者認(rèn)為,無論課程成績好壞,學(xué)生都有表達(dá)學(xué)習(xí)感受的能力和意見建議的權(quán)利,且若因教師教學(xué)安排和水平原因,學(xué)生未聽懂而導(dǎo)致考試成績差,這部分學(xué)生的心聲更應(yīng)關(guān)注,并有針對性地改進(jìn)教學(xué)?;谝陨嫌懻摚疚脑谡n程成績分析基礎(chǔ)上研究課程成績與評教結(jié)果的關(guān)系,分析判斷學(xué)生評教結(jié)果的有效性,并基于課程成績因素提出評教結(jié)果的應(yīng)用建議。
一? 研究設(shè)計
(一)? 數(shù)據(jù)來源
本研究的案例數(shù)據(jù)是某高校連續(xù)三個學(xué)期全校思政類必修課程的學(xué)生課程成績與學(xué)生評教結(jié)果,課程包括思想道德修養(yǎng)與法律基礎(chǔ)、毛澤東思想和中國特色社會主義理論體系概論(1)(2)、馬克思主義基本原理概論和中國近現(xiàn)代史綱要。思政課在全校范圍內(nèi)開設(shè)且內(nèi)容一致,不存在不同專業(yè)難度不同(如英語課)、不同專業(yè)內(nèi)容不同(如數(shù)學(xué)課)等情況,便于共性分析。共回收評教問卷25 593份,其中有效問卷25 548份。
(二)? 研究思路
本研究應(yīng)用SPSS23.0和Excel統(tǒng)計軟件,通過分析學(xué)生課程成績與學(xué)生評教結(jié)果的關(guān)系,提出合理應(yīng)用學(xué)生評教結(jié)果的建議。學(xué)生評教結(jié)果包含封閉式問題(closed question)和開放式問題(open question)。封閉式問題從教學(xué)效果、教學(xué)態(tài)度、教學(xué)內(nèi)容、教學(xué)方法和教學(xué)表達(dá)五個方面考查學(xué)生對教師、課程的滿意度,根據(jù)權(quán)重、選項自動生成評教分?jǐn)?shù);開放式問題需填寫對教師、課程的意見建議。通過評教分?jǐn)?shù)的應(yīng)用分析,探索“課程成績”與“評教分?jǐn)?shù)”的相關(guān)性及“課程成績”與“評教分?jǐn)?shù)有效性”的關(guān)系,提出合理應(yīng)用各分?jǐn)?shù)段評教分?jǐn)?shù)的建議;通過評教“意見建議”的應(yīng)用分析,運(yùn)用K-means聚類算法,根據(jù)課程成績與評教分?jǐn)?shù)兩個變量對樣本聚類分析,提出分類使用意見建議的路徑。
二? 評教分?jǐn)?shù)(封閉式問題)分析
(一)? 課程成績與評教分?jǐn)?shù)的相關(guān)性
Spooren P[4]運(yùn)用交叉分類多層次分析發(fā)現(xiàn),學(xué)生成績對學(xué)生評教結(jié)果的影響并不大,Zabaleta F[5]研究發(fā)現(xiàn),學(xué)生課程成績與評教結(jié)果之間的關(guān)系比較模糊。朗本等學(xué)者研究發(fā)現(xiàn),學(xué)生成績和學(xué)生評教分?jǐn)?shù)兩者存在正相關(guān)關(guān)系[6]。對于這種正相關(guān)關(guān)系,有的學(xué)者認(rèn)為是分?jǐn)?shù)互惠、寬容評分導(dǎo)致,是一種潛在偏差來源。如趙穎[7]、孫鰲[8]、黃桂[9]等學(xué)者認(rèn)為學(xué)生成績和學(xué)生評教分?jǐn)?shù)之間存在“分?jǐn)?shù)膨脹”,在“教師利益與學(xué)生評教分?jǐn)?shù)捆綁”背景下,教師存在“討好”“寬松給分”現(xiàn)象。而有的學(xué)者認(rèn)為,評教分?jǐn)?shù)高的教師教學(xué)效果好,有利于學(xué)生獲得知識、獲取好成績,認(rèn)可度高,二者相互促進(jìn),教學(xué)相長,這種正相關(guān)關(guān)系恰好驗證了學(xué)生評教的效度,符合“預(yù)期分?jǐn)?shù)的內(nèi)生性”。如森特拉等研究發(fā)現(xiàn),學(xué)習(xí)成果對學(xué)生評教結(jié)果產(chǎn)生很大的積極影響[6]。簡單而言,兩種觀點的分歧在于,學(xué)生評教分?jǐn)?shù)高是源于教學(xué)收獲多還是與教師“分?jǐn)?shù)互惠”。基于此,本研究詳細(xì)分析課程成績與評教分?jǐn)?shù)的相關(guān)關(guān)系,首先觀察平均分的走勢,然后在SPSS中分析全體樣本的相關(guān)性,最后細(xì)化到一名教師教授的一門課程(以下簡稱為“一門次”),研究兩者的相關(guān)性。
本文研究發(fā)現(xiàn),在研究樣本中依次刪除課程成績不及格、低于70分、低于80分的學(xué)生的評教結(jié)果,評教分?jǐn)?shù)由92.47分依次升至92.48、92.51、92.62分,呈上升趨勢,但幅度很小,可見“課程成績差的學(xué)生普遍給教師評價分?jǐn)?shù)低”這一觀點不成立。同時,以教學(xué)班為單位,評教平均成績并沒有隨著考試平均成績下降而呈下降趨勢。在統(tǒng)計的45門次課程中,課程成績平均分在80分以下的有19門次(表1),其對應(yīng)的評教分?jǐn)?shù)排名在前10名中占據(jù)6位,基本可以判斷不存在“普遍學(xué)生因教師給分低而在評教中故意打出低分”現(xiàn)象。
在SPSS中進(jìn)行相關(guān)性分析,全部學(xué)生評教分?jǐn)?shù)與全部課程成績的皮爾遜相關(guān)系數(shù)為0.033,在P=0.01的水平上顯著相關(guān),但由于相關(guān)系數(shù)在0.3以下,接近于0,表示兩者無相關(guān)性。
為進(jìn)一步驗證結(jié)果,排除教師教學(xué)因素影響,以門次為單位,分析課程成績與學(xué)生評教分?jǐn)?shù)之間的相關(guān)性。共分析45門次課程,其中2門次課程的皮爾遜相關(guān)系數(shù)絕對值大于0.3,為弱相關(guān),其他均為不相關(guān)(表2列出的是絕對值大于0.1的課程)。2門次弱相關(guān)的課程皮爾遜相關(guān)系數(shù)分別為-0.43和-0.37,為負(fù)相關(guān),即因變量值隨自變量值的增大(減?。┒鴾p?。ㄔ龃螅_M(jìn)一步說明,學(xué)生評教分?jǐn)?shù)不會隨課程成績相應(yīng)變化,甚至?xí)霈F(xiàn)相反情況。
(二)? 課程成績與評教分?jǐn)?shù)有效性的關(guān)系
前文分析了課程成績與評教分?jǐn)?shù)的相關(guān)性,結(jié)果是整體不相關(guān),個別存在弱相關(guān),即課程成績對評教分?jǐn)?shù)基本不產(chǎn)生影響。以下通過確認(rèn)評教結(jié)果有效性較差的數(shù)據(jù)在各課程成績段(優(yōu)≥90分,80分≤良<90分,70分≤中<80分,60分≤及格<70分,不及格<60分)的分布,分析課程成績與評教分?jǐn)?shù)有效性的關(guān)系。
1? 確定教學(xué)質(zhì)量較差的教師集
本文從兩個方面獲取教學(xué)質(zhì)量較差的教師信息:一是課程成績優(yōu)秀的學(xué)生(成績≥90分)中評教分?jǐn)?shù)小于80分的數(shù)據(jù)。該部分學(xué)生成績優(yōu)異,知識獲得量較高,基本不存在“因沒學(xué)會而無法客觀評價”或“因成績不好打出報復(fù)性分?jǐn)?shù)”的現(xiàn)象,該群體打出低分?jǐn)?shù)主要與教學(xué)質(zhì)量、教學(xué)感受有關(guān),有效性較高。二是認(rèn)真填寫意見建議的學(xué)生中評教分?jǐn)?shù)低于80分的數(shù)據(jù)。認(rèn)真填寫意見建議,在一定程度上排除了“一鍵評教”“應(yīng)付性評教(隨意快速勾選)”的可能性,有效度較高。低于80分評價信息的原因是,評教題目選項為四級量表“優(yōu)、良、中、差”,若全部勾選為良,得分為80分,低于80分的所有評價中均有“中”評價,即認(rèn)為該項指標(biāo)感覺一般。由此獲得較為準(zhǔn)確的學(xué)生群體評價出的教學(xué)質(zhì)量存在問題的教師集,再與督導(dǎo)評價出的低于90分的教師集(約為后30%)取交集,從而獲取督導(dǎo)、學(xué)生一致認(rèn)為教學(xué)質(zhì)量較差的教師集。
在25 548份樣本中,課程成績大于等于90分的樣本有5 609條,其中評教分?jǐn)?shù)低于80分的541條;意見建議有5 906條,去掉標(biāo)點符號、亂碼、數(shù)字等無意義的評價,剩余有價值的意見建議5 869條,其中評教分?jǐn)?shù)低于80分的362條。兩者合計903條,去除重復(fù)項,剩余791條,統(tǒng)計得出以學(xué)期、教師編號、課程名稱為觀測點的76條數(shù)據(jù)。與督導(dǎo)評價信息比對,得出學(xué)期、教師編號、課程名稱完全一致的12條數(shù)據(jù);學(xué)期不一致,教師編號、課程名稱一致的16條數(shù)據(jù);涉及教師15人,編號分別為1010、1011、1014、1022、1024、1026、1029、1030、1032、1033、1034、1053、1054、1056、1058。
2? 確定評教分?jǐn)?shù)有效性較差的評價
確定教學(xué)質(zhì)量較差的教師集后,可將該教師群體的滿分評價視為有效性較差的評價,計算滿分的占比,即可分析有效性差的評價在各成績段的分布情況。
以課程為單位,詳細(xì)數(shù)據(jù)見表3,整體走勢基本相同。因開設(shè)學(xué)期不同,有效性差的評價在各成績段的占比情況為,課程成績中等以上(成績≥70分)的學(xué)生,大一年級有效性差的評價明顯占比較低,有效性高。
按照出現(xiàn)頻次排序,前5名為1030講授的毛澤東思想和中國特色社會主義理論體系概論(1)、1029講授的思想道德修養(yǎng)與法律基礎(chǔ)、1026講授的毛澤東思想和中國特色社會主義理論體系概論(2)、1022講授的毛澤東思想和中國特色社會主義理論體系概論(2)、1010講授的馬克思主義基本原理概論,五名教師各成績段有效性差的評價占比情況見表4。
由整體數(shù)據(jù)分析發(fā)現(xiàn),有效性較差的評價在各成績段均有分布,從“優(yōu)”至“中”均呈下降趨勢,之后到“不及格”呈上升趨勢,“中”為最低點。一名教師講授的一門課程分析中,大多和整體分析的趨勢一致??梢?,有效性較差的評價未隨課程成績下降而呈上升趨勢,即“課程成績差的學(xué)生評教分?jǐn)?shù)有效性差”的觀點不成立。在大多數(shù)情況下,課程成績?yōu)椤爸小保?0分≤中<80分)的學(xué)生有效性差的評價最少,評價有效性最高。
三? 意見建議(開放式問題)分析
(一)? 以課程成績與評價分?jǐn)?shù)為變量的聚類分析
在SPSS中利用“課程成績”和“評教分?jǐn)?shù)”兩個變量信息對學(xué)生樣本進(jìn)行K-means聚類,即K-均值聚類。因聚類分析是一種數(shù)據(jù)描述性方法,而非統(tǒng)計檢驗分析方法,沒有統(tǒng)計假設(shè)檢驗理論支持,無法判斷其結(jié)果是否正確,只能檢驗聚類效果。第一,通過聚類質(zhì)量圖判斷,本次聚類凝聚與分離的輪廓測量值大于0.5,聚類質(zhì)量良好;第二,聚類分析后得到的每個類別均可有效命名,每個類別的特征符合現(xiàn)實意義,說明聚類效果良好。聚類根據(jù)各類別課程成績和評教分?jǐn)?shù)的平均分命名,得到“高滿意高收獲型”“高滿意低收獲型”“低滿意高收獲型”“低滿意低收獲型”四種類型,依次簡稱為A、B、C、D類。
(二)? 各類別特征分析
本次共統(tǒng)計25 548份學(xué)生樣本,其課程成績總平均分為82.97分,其評教分?jǐn)?shù)總平均分為92.17分。
其中A類學(xué)生有11 164名,占比43.7%,評教分?jǐn)?shù)平均分98.17分,課程成績平均分87.97分,兩者均高于總平均分,為“高滿意高收獲型”。這類學(xué)生成績好,對教學(xué)效果很滿意。此類學(xué)生的“意見建議”均以贊揚(yáng)和感謝為主。如“老師除了講解課本上的知識外,還在鍛煉我們思考問題的方式方法,謝謝老師!”
其中B類學(xué)生有7 281名,占比28.5%,評教分?jǐn)?shù)平均分98.14分,課程成績平均分75.58分,課程成績平均分低于總平均分7.39分,但評教分?jǐn)?shù)平均分高出平均分5.97分,為“高滿意低收獲型”。這類學(xué)生課程成績一般,但對課程教學(xué)很滿意。存在兩種情況:一是學(xué)生學(xué)習(xí)收獲較多但考試失利,二是學(xué)生學(xué)習(xí)收獲較少但并不歸因于教師教學(xué)行為。此類學(xué)生的“意見建議”均以贊揚(yáng)為主。如“上課認(rèn)真,知識點講解充分,善于擴(kuò)展知識面”“本課程令我受益匪淺”。
其中C類學(xué)生有4 496名,占比17.6%,評教分?jǐn)?shù)平均分81.30分,課程成績平均分86.44分,課程成績平均分高于總平均分3.47分,但評教分?jǐn)?shù)平均分低于總平均分10.87分,為“低滿意高收獲型”。這類學(xué)生成績好,但對課程教學(xué)滿意度一般,認(rèn)為仍存在提升空間。這類學(xué)生的“意見建議”中除贊揚(yáng)外,有一些實質(zhì)性的建議,對教學(xué)效果提升具有參考價值。如“課堂氣氛過于沉悶”“希望更加有趣味”“希望能豐富課堂形式”“老師應(yīng)該將一些當(dāng)下的社會現(xiàn)象與所學(xué)科目聯(lián)系起來,而不是總是用一些古代的我們已經(jīng)聽過的例子”“希望引用一些案例或新聞對理論進(jìn)行說明”。
其中D類學(xué)生有2 607名,占比10.2%,評教分?jǐn)?shù)平均分68.51分,課程成績平均分76.16分,兩者均低于總平均分,課程成績平均分低于總平均分6.91分,評教分?jǐn)?shù)平均分低于總平均分23.66分,為“低滿意低收獲型”。這類學(xué)生課程成績一般,對課程教學(xué)意見很大,將學(xué)習(xí)收獲小歸因于教學(xué)問題,或因不喜歡課程或教師而產(chǎn)生厭學(xué)心理。這類學(xué)生的“意見建議”包含以下方面:一是贊揚(yáng)和肯定;二是意見建議,如“講課思路再清晰一些比較好”等;三是困惑“不怎么懂”“課堂沉悶,難懂”等;四是牢騷性評價,如“我一個理科生對這個興趣不大”“為什么上課不能上廁所”等;五是發(fā)泄性評價,有的未顯示具體意見建議,僅表示“必須差評”;六是與課程評價無關(guān)的內(nèi)容。
B、D類學(xué)生成績一般,“70分以下的”均為B、D兩類學(xué)生,B類學(xué)生占72.13%,D類學(xué)生占27.87%;“80分以下的”B類學(xué)生占72.59%,D類學(xué)生占22.48%,C類學(xué)生占4.93%。如果計算評教分?jǐn)?shù)時刪除課程成績差的學(xué)生評教數(shù)據(jù),會將評教分?jǐn)?shù)很高的B類學(xué)生和評教分?jǐn)?shù)較低的D類學(xué)生、評教分?jǐn)?shù)很低的C類學(xué)生同時刪除,導(dǎo)致前文所述的“刪除課程成績差的學(xué)生評教數(shù)據(jù)后評教分?jǐn)?shù)未出現(xiàn)明顯提升”情況。
四? 結(jié)束語
基于以上課程成績分析,對學(xué)生評教結(jié)果應(yīng)用提出以下建議。
(一)? 嚴(yán)格執(zhí)行考勤制度,設(shè)置必要評教權(quán)限
一些學(xué)?!侗究茖W(xué)生成績管理細(xì)則》中對缺課行為的處理作出明確規(guī)定,如“學(xué)生必須參加每門課程的各項教學(xué)活動。缺課累計超過該課程教學(xué)時數(shù)的三分之一者,不得參加本課程的考核,成績以零分計”。嚴(yán)重缺課的學(xué)生,一方面說明學(xué)習(xí)態(tài)度有問題,缺乏積極主動性;另一方面,未參與教學(xué)全過程,無法全面準(zhǔn)確作出判斷與評價,學(xué)習(xí)感受也不夠完整。這部分評價數(shù)據(jù)參考價值有限。教師應(yīng)及時將缺課學(xué)生名單錄入教務(wù)系統(tǒng),達(dá)到學(xué)校規(guī)定嚴(yán)重缺課次數(shù)后,評價結(jié)果統(tǒng)計時將自動剔除該部分學(xué)生的評教分?jǐn)?shù),學(xué)??筛鶕?jù)實際情況保留其評教數(shù)據(jù)中的意見建議。
(二)? 合理使用評教數(shù)據(jù),避免刪除有效數(shù)據(jù)
課程成績差的學(xué)生不一定評教打分低,也不一定評教有效性差。若將成績差學(xué)生的評教數(shù)據(jù)刪除,評教分?jǐn)?shù)變化不大,有效性未提升,反而剝奪了學(xué)生對學(xué)習(xí)感受評價的權(quán)利,失去一些有價值的評價內(nèi)容,學(xué)生學(xué)不會聽不懂,在一定意義上也說明教師教學(xué)方法或進(jìn)度需要調(diào)整或改進(jìn)。因此,對于按時出勤、認(rèn)真聽講但考試未及格的學(xué)生,應(yīng)當(dāng)保留其評教數(shù)據(jù)。本研究表明,在大多數(shù)情況下,課程成績?yōu)椤爸小保?0分≤中<80分)的學(xué)生評教分?jǐn)?shù)有效性最高,大一年級課程成績中等以上(≥70分)的學(xué)生評教分?jǐn)?shù)有效性高于其他年級,應(yīng)重點關(guān)注此類有效性較高的數(shù)據(jù),另外應(yīng)關(guān)注認(rèn)真填寫意見建議的評教數(shù)據(jù)。還可通過查看評教頁面停留時間、對所有課程評分的差異性等信息,據(jù)此判斷學(xué)生是否認(rèn)真答題,篩選有效性較高的評教數(shù)據(jù)。
(三)? 科學(xué)分析評教結(jié)果,分類使用“意見建議”
對評教數(shù)據(jù)聚類分析,分類使用各類數(shù)據(jù)中的意見建議,有助于學(xué)生提高學(xué)習(xí)成效。重點考慮C類學(xué)生的意見建議,對教學(xué)進(jìn)行改進(jìn)完善;關(guān)注D類學(xué)生的困惑和真實想法,了解學(xué)生的學(xué)習(xí)困難,不斷調(diào)整教學(xué)方法或進(jìn)度。聚類分析評教數(shù)據(jù)的優(yōu)勢是,一方面能快速處理評教數(shù)據(jù),高校每學(xué)期獲得幾十萬條學(xué)生評教數(shù)據(jù),其中意見建議有幾萬條。評教分?jǐn)?shù)可篩選、排序處理,而意見建議只能人工逐條查看,且干擾信息較多,從中挑選對教學(xué)質(zhì)量提高有建設(shè)性的意見建議,效率低且時效性差。運(yùn)用聚類分析可快速篩選教學(xué)管理者所需的C類和D類數(shù)據(jù)(以本文研究樣本為例,從25 548條數(shù)據(jù)中篩選出4 496條C類和2 607條D類數(shù)據(jù)),工作量大大減少,實效性提高。另一方面,聚類分析根據(jù)輸入變量自動分類,以獲取組內(nèi)距離最小化、組間距離最大化,屬于無監(jiān)督學(xué)習(xí)的一種,非人為主觀分類,更為客觀。
(四)? 轉(zhuǎn)變教學(xué)評價觀念,促進(jìn)教學(xué)良性循環(huán)
以改進(jìn)教學(xué)為目的,弱化評教分?jǐn)?shù)的獎懲作用,強(qiáng)化“意見建議”的有效應(yīng)用。目前多數(shù)學(xué)校重點關(guān)注評教分?jǐn)?shù),將其與職稱評定、評獎評優(yōu)、津貼分配等掛鉤。評教的主要作用應(yīng)是了解學(xué)生學(xué)習(xí)效果及感受,不斷改進(jìn)教學(xué)方法,提高教學(xué)質(zhì)量。因此應(yīng)重視評教的診斷與改進(jìn)功能,強(qiáng)化過程性評價:一是由教學(xué)管理者發(fā)起,方便教學(xué)單位對教學(xué)過程實行實時、針對性管理,學(xué)校管理部門也可運(yùn)用ROST-CM等文本內(nèi)容挖掘軟件對學(xué)生反饋的意見建議進(jìn)行快速分詞與詞頻統(tǒng)計[10],了解學(xué)生的普遍關(guān)注點,從而確定教學(xué)質(zhì)量提升點;二是由授課教師發(fā)起,根據(jù)課堂教學(xué)實際設(shè)置問卷,與學(xué)生匿名互動,即時掌握學(xué)生的學(xué)習(xí)狀態(tài)與感受,及時發(fā)現(xiàn)教與學(xué)的問題,改進(jìn)教學(xué)方法。通過教學(xué)過程中不斷反饋與互動,形成教與學(xué)的良性循環(huán),從而保障并提高教學(xué)質(zhì)量,提升學(xué)生學(xué)習(xí)效果。
參考文獻(xiàn):
[1] 李盼道,孟慶瑞.高校學(xué)生評教結(jié)果緣何失效——影響因素、逆向選擇機(jī)制及其治理路徑研究[J].教育學(xué)報,2020(16):85-96.
[2] 盛艷燕,喻秋山,孫一平.非教學(xué)因素影響大學(xué)生的評教分?jǐn)?shù)嗎?——來自元分析的證據(jù)[J].教育理論與實踐,2020(40):48-52.
[3] 潘云華,張意燕.高校學(xué)生評教有效性影響因素的實證研究——學(xué)生視角[J].教育學(xué)術(shù)月刊,2016(7):51-56.
[4] SPOOREN P. On the credibility of the judge: a cross- classified multilevel analysis on students' evaluation of teaching[J]. Studies in Educational Evaluation,2010,36(4):121-131.
[5] ZABALETA F. The use and misuse of student evaluations of teaching[J]. Teaching in Higher Education,2007,12(1):55-76.
[6] 韓映雄,周林芝.學(xué)生評教的信度、效度、影響因素及應(yīng)用風(fēng)險[J].復(fù)旦教育論壇,2018(16):74-81.
[7] 趙穎.學(xué)生評教制度下分?jǐn)?shù)膨脹的內(nèi)在邏輯:博弈模型的建立[J].中國高教研究,2019(4):20-26.
[8] 孫鰲.分?jǐn)?shù)膨脹的博弈分析[J].現(xiàn)代大學(xué)教育,2016(5):23-27.
[9] 黃桂.分?jǐn)?shù)膨脹與等級膨脹:評教系統(tǒng)雙重失效原因探析——基于某部屬重點高校大學(xué)生評教的視角[J].高教探索,2011(6):95-103.
[10] 陳玉嬋,劉威.基于情感分析的學(xué)生評教文本觀點抽取與聚類[J].計算機(jī)應(yīng)用,2020(1):113-117.
基金項目:全國教育科學(xué)“十四五”規(guī)劃2022年度課題“學(xué)術(shù)型研究生學(xué)術(shù)志趣:測量工具、影響因素與提升路徑研究”(BIA220099);教育部新農(nóng)科研究與改革實踐項目“高等農(nóng)林院校教學(xué)質(zhì)量監(jiān)控體系改革與實踐”(教高廳函〔2020〕20號);黑龍江省教育科學(xué)“十四五”規(guī)劃2021年度重點課題“大數(shù)據(jù)背景下高校學(xué)生評教數(shù)據(jù)自動聚類研究”(GJB1421223)
第一作者簡介:馬朝珉(1989-),女,漢族,山東臨清人,碩士,講師。研究方向為教學(xué)質(zhì)量評價。
*通信作者:李偉凱(1965-),男,漢族,黑龍江大慶人,博士,教授,博士研究生導(dǎo)師,副校長。研究方向為教育管理。