王力綱 何漢武
摘要:本文介紹了學生評教在教學質量保障中重要意義,以及學生評教在我國發(fā)展的簡要歷程。首先詳細介紹了當前學生評教模型中的運行機制及存在的問題?;诖?,筆者構建了一套基于區(qū)分度及可信度的學生評教模型,并詳細闡述此模型的整體架構、運行機制,同時利用新舊評教模型對同一被評教對象和參評對象進行評教后的不同評教結果進行了分析對比,最后對新評教模型的特點進行了總結分析。
關鍵詞:教學質量;學生評教;區(qū)分度;可信度;動態(tài)指標庫;動態(tài)指標體系表
教學質量作為人才培養(yǎng)質量保障體系非常重要的一環(huán),受到全社會及各個高校的高度重視。為保障教學質量得到有效監(jiān)測和及時反饋,很多高校通過“教育消費者”密切度最相關的活動即“學生評教”這一舉措來實施監(jiān)測并反饋教學質量情況,從而促進教學質量的提高。教學管理部門將學生評教作為監(jiān)控及提高教學質量水平的重要手段,學生評教結果作為教師職稱晉升、年度評優(yōu)的重要考核指標,有些甚至作為教師個人教學檔案永久記錄。隨著信息化技術的發(fā)展,學生評教已經由最初的發(fā)放紙質評教材料實現(xiàn)學生評教,到利用現(xiàn)代互聯(lián)網技術實現(xiàn)學生網上評教,到利用信息技術甄別出有效評教數(shù)據(jù)而實現(xiàn)更加科學、有效的評教模型來滿足評教的目標等。
本文通過深入調查、分析研究當前各個高校學生評教的現(xiàn)狀,對目前高校普遍使用的學生評教模型進行分析,剖析現(xiàn)有學生評教模型存在的主要問題。從實際存在的問題出發(fā)來構建基于區(qū)分度及可信度學生評教模型,力求解決當前高校學生評教中存在的各種問題。
一、學生評教的意義與現(xiàn)有學生評教模型分析
(一)學生評教的重要意義
從經濟學角度看,學生評教是教育消費者(學生)對其產品效果及質量進行直接客觀的評價,這種由終端消費群體直接為產品質量及產品效果給出評價意見,是保護消費者自身權益也是幫助教育產品提供商(高校)提升產品質量最好的辦法。作為教學管理部門,學生評教是其及時收集、有效了解教師課堂教學情況與教學效果的重要手段之一;同時也是尊重學生權益,保障和提高高校教學質量水平的重要舉措,因此學生評教被當前國內外各個高校廣泛采用。
(二)學生評教在我國高校的發(fā)展歷程
從陳玉琨、李如海[1]和商弘、章飛軍[2]的文中了解到:我國的高校學生評教活動是從上世紀80年代開始在各個高校陸續(xù)實施,經過了近30多年的發(fā)展,經歷了從萌芽、試點實踐到蓬勃發(fā)展,從自覺行為、初步研究、學習國外到系統(tǒng)研究的不同歷史階段,無論是在學生評教的理論研究還是在實踐研究上都取得了巨大的進步。從個別高校的試點,發(fā)展到如今幾乎得到所有高校的踐行。在學生評教的手段上經歷了從當初的使用紙質評教材料評教發(fā)展到當今利用互聯(lián)網技術進行網上學生評教活動。經過30多年的發(fā)展,基于學生評教的理論研究及實踐研究已取得了豐富的成果,教學管理部門及教師的認可度、重視度越來越高。
(三)對當前高校學生評教模型研究分析
當前,學生評教在各個高校都已作為重要的教學質量及效果監(jiān)測與反饋手段在運行,其構建的學生評教系統(tǒng)模型基本結構如下。
1.根據(jù)不同類型課程性質構建學生評教指標
筆者調查了廣東省及浙江省多所高等院校的學生評教指標體系結構發(fā)現(xiàn):學生評教的指標庫體系基本可分為理論課類、實驗類、課程設計類、實習類、體育類指標體系等,而且每類指標的構建都會經過非常嚴謹?shù)某绦騺碛懻撛O定。在擬定評教指標時,各個高校均由擁有多年教學經驗的專家、教授、承擔課程授課的教師以及直接參與評教的學生代表來共同研究討論擬定。筆者通過查閱相關文獻發(fā)現(xiàn),目前在評教指標體系方面,國內院校普遍都是采用二級結構進行指標設計,將教學態(tài)度、教學方法、教學內容、教學效果設計成一級指標,然后根據(jù)不同的課程性質(如理論課、實驗課、課程設計、實習等)來研究設計不同的二級指標。當前在評教指標體系的研究設計上評教考核內容相當完善。
2.評教體系表的指標組成結構
在評教體系表的指標組成上,理論課評教體系表由理論課類型的評教指標體系組成,實驗類體系表由實驗類指標體系組成,以此類推。從國內高校學生評教指標體系的結構組成上看,大致分為兩種:一是單層結構,典型的高校有《北京師范大學教師教學質量評價表》,包括兩部分內容,第一部分有20項評價指標,第二部分分為4項評價指標[3][4];二是具有二級結構,第一級基本分為教學態(tài)度、教學內容、教學方法、教學效果四個觀測點指標,第二級指標內容各具特色,根據(jù)不同課程性質進行設置。典型代表為北京外國語學院的《綜合外語課程教學質量評估體系表》,第一級分為教學態(tài)度、教學水平、教學方法、教學效果四個部分,第二級分為15項評價內容;這兩種結構的評價代表著國內目前的主流結構,也都能較科學、真實地評價課堂教學質量。但在實際運用中,采用二級結構組成評教模板的高校明顯多于采用單層結構模板的高校。
筆者查閱相關文獻發(fā)現(xiàn):各個高校設置的每種類型的評教體系表中,二級評價指標均保持在20項之內,大部分高校將評教指標個數(shù)控制在15以內。在評價體系表分數(shù)的設定上,每套評教體系表總分設為100分,每項二級評教指標分數(shù)均占有一定的分值,其分值依據(jù)其在此套模板中的重要程度來設定,大多運用專家打分法或層次分析法等方法對其權重進行科學的計算。每條評價指標設定4-5個答案供參評對象(學生)進行選擇,每個評價指標答案對應著不同等級的評定分數(shù)。學生登錄評教系統(tǒng)后,選擇評價的某門課程及任課老師,針對每一個評價指標進行評價,每選擇一個答案就會自動記錄對應的指標分值。以下表1為某高校的理論課評教指標體系表。
3.學生評教的組織實施
筆者調查廣東省相關高校及浙江省幾所高校的學生評教組織實施情況發(fā)現(xiàn),學生評教的組織實施流程大致為:學校的教學管理部門先針對每種不同類型的課程構建評教指標體系表,科學合理地設定好表中每條指標的對應分值;然后組織學生評教的管理人員將每學期需要進行評教的課程按評教類型進行分類,將其應用到需要評教的體系表類型上;最后在校園網發(fā)布相關學生評教的通知信息,通知各個學院組織學生在限定時間內參與學生評教。為提高參評率以及提高學生評教的可信度,學校對學生評教任務的實施機制進行了優(yōu)化。任課教師提交完成績后,設定自動開放這門課的學生評教,學生需要查看成績時,必須先進行學生評教后才能查看該門課程成績,使學生評教不受該門課程成績影響從而提高學生評教的可信度。開放時間一般為學期中下旬,一直持續(xù)到第二學期開學初才關閉評教系統(tǒng)。此種模式在提高學生的參評率上確實達到了很好的效果。
4.學生評教結果的統(tǒng)計分析及利用
評教結果的處理非常重要,也是學生評教模型中最重要的一個環(huán)節(jié)。一個優(yōu)秀的學生評教模型應該是能夠識別出評教樣本數(shù)據(jù)中的“無效數(shù)據(jù)”。在作者的調研過程中發(fā)現(xiàn),很多高校對“無效評教數(shù)據(jù)”的處理比較“簡單隨意”。通常評教后,針對某門課程的評教樣本數(shù)據(jù),根據(jù)教學班學生人數(shù)剔除評教分數(shù)最高和最低的前后百分多少的數(shù)據(jù)作為無效數(shù)據(jù),依據(jù)上面方式剔除完樣本中的所謂無效數(shù)據(jù)后,再對剩余數(shù)據(jù)進行統(tǒng)計分析。我們假設某門課程教學班參與評教的學生人數(shù)為n,對應評教指標體系的指標項目為20,該門課對應的指標記錄項為Z1,Z2, …Zm,每位學生對應的評教匯總分值為:P1,P2…Pn,,則每位學生的評分計算方法為:
P1= Z1*X1+Z2*X2+…Zn*Xm,其中Xm指該學生第m項指標對該課程評分值,m∈(1,20),
按以上方式去除所謂的“無效評教數(shù)據(jù)”(最高或最低分數(shù))后,留下有效評教數(shù)據(jù)進行匯總P= P1+P2+…Py,(y≤n)其中y為教學班去除無效數(shù)據(jù)后的樣本數(shù)量,最后求算術平均值,即為該教師這門課程的最后評教得分值:T=P/y 按此步驟計算出每位老師每門課的評教分值,以上統(tǒng)計方式為當前各個高校評教普遍采用的統(tǒng)計方式。
二、當前評教模型問題分析
根據(jù)對當前各個高校評教情況的深入了解和分析,發(fā)現(xiàn)目前高校中普遍存在以下問題。
(一)對被評教對象簡單按課程性質進行分類,缺乏科學性和可比性。
綜觀現(xiàn)在的學生評教模型,可見在指標體系的設置上,基本都是按照課程性質進行分類來組建學生評教的模板類型。我們通過調研咨詢部分授課教師后發(fā)現(xiàn),真正在教學時,即使課程性質相同,不同學科的課程授課難度、所需的教學要求及所需教學方法均會不同。譬如一個是授課難度較大且偏于理論的理工科類課程和一個基礎性的文科類課程,使用同樣的一套學生評教體系表讓學生進行評教,其評教的差異性明顯很大,因為課程難易決定了教師授課的要求不同,缺乏可比性。因此,在對被評對象選擇評教體系表時,不能籠統(tǒng)的將相同課程性質的課程歸為一個評教體系表,而必須要考慮其學科性質、專業(yè)性質等因素,這樣才能保證學生評教指標體系構建的科學性,使學生評教結果更加科學和可信,從而得到被評教的教師的認可,吸引學生認真評教。
(二)評教指標分值的固定設置,導致各評價分值結果趨向集中,區(qū)分度失真。
在現(xiàn)有的評教模型中,參評對象對被評對象進行評價時,往往是通過回答問題的形式選擇指標中的某個值進行評價,而選定值所對應的分值即為該指標的評分。然而指標項對應可選的答案選項一般是在5個以內,也就是將評分的分值人為限定在幾個可選分值之內,因此導致不同評價對象打出的分值區(qū)分度往往非常集中,表現(xiàn)出沒有區(qū)分度。為此,我們對筆者單位的被評價對象近幾年的結果數(shù)據(jù)進行分析發(fā)現(xiàn),某二級學院的70多位被評教教師在同一個學期,排第一的評教分值與排最末尾的評教分值之間的差距非常小,最低者獲得分數(shù)在85分以上,最高分在91分左右,中間相差不到7分,每一位教師之間的分值差別不到1分。這種評教結果達不到學生評教的真正目的,無法獲得被評對象的有效認可,不能有效地區(qū)分教師的授課水平,教學效果也達不到教學管理部門評價教師教學效果的目標。
(三)指標體系表指標項太多,導致學生不認真評教。
教學管理部門在構建評教指標體系表時太過理想化,希望通過學生評教指標觀測到每一個被評價對象的各個方面,這樣結果就是導致每一套評教體系模板的指標體系較多,導致學生在進行評教時不認真對待,應付、隨意地完成學生評教,這樣的學生評教模型結果可信度不足。
(四)在結果處理時未對原始評教數(shù)據(jù)進行有效度識別,導致評教結果可信度不高。
部分高校的教學管理部門在收集評教原始數(shù)據(jù)時,未對參評對象—學生進行可信度分析識別,籠統(tǒng)簡單地以教學班學生評教人數(shù)為基礎,將整個教學班中分值最高或最低的幾個百分點去除,以對原始評教進行有效數(shù)據(jù)篩選,這種簡單的處理數(shù)據(jù)實際上非常不科學。因此,我們在構建新的評教模型時,必須在每套體系表中能夠運用相關的手段識別到參評對象的原始評價數(shù)據(jù)是否有效。最后再對原始評價分值統(tǒng)計分析前,將評判出無效的原始的評價分值進行剔除,僅留下真正有效的學生評價分值進行統(tǒng)計,這樣才能保證評教結果的可信度。
三、基于可信度及區(qū)分度的學生評教模型的構建
筆者對當前各高校學生評教模型存在的問題進行深入分析后,計劃構建一套操作性強,能對原始評教數(shù)據(jù)進行有效識別,同時使評教結果具備一定區(qū)分度的評教模型。新評教模型必須堅持利益相關者:教師、學生、教學管理部門共同受益。能讓學生能自愿認真地參與學生評教,獲得更好的課堂教學質量;能讓教師獲得高度認可,通過學生評教發(fā)現(xiàn)自己的不足之處并積極改進教學效果;讓教學管理部門能夠通過學生評教模型真正有效地達到監(jiān)測和及時反饋教學情況的目的,達到評價教師教學效果的目標,從而達到通過學生評教促進教學質量水平的提高。
(一)評價體系表由“整體評價分”及“指標評價分”部分組成,以增加評價結果的區(qū)分度及可靠信。
筆者構建的評價模型中,評價體系表由“整體評價”及“指標評價”兩部分組成,“整體評價”是指參評對象對該門課的教師從宏觀整體上給予授課情況的一個整體效果分值,該部分在整個評價結構分值中占50%,“指標評價分”是參評對象針對評價對象針對每個指標項進行評價所獲得的分值,該部分也占50%?!爸笜嗽u教” 部分即以下介紹的由“通用型指標”及“專業(yè)型指標”組成。經過測試發(fā)現(xiàn),評教模型通過設置“整體評價”加“指標評價”能夠達到對評教結果進行有效區(qū)分,同時通過“評價指標”部分可以增加評教結果的可靠性。學生評價模型表2如下所示:
(二)構建動態(tài)、閉環(huán)可持續(xù)修正的分類學生評教指標庫。
學生評教指標庫是指將不同類型的指標放置到一個表中,每個類型的評價指標數(shù)均有多條,以供后續(xù)組成評教體系表時動態(tài)抽取調用。動態(tài)指標庫是指該指標庫里面的評教指標可以不斷修改完善,開放評教系統(tǒng)后,學生參加完學生評教后可以由學生自愿參與對學生評教指標的調查問卷,通過大量收集學生對學生評教指標的問卷回答,可以對指標庫中指標的科學性、有效性進行分析,以便教學管理人員及時修正指標,不斷提高評教指標的科學性、可靠性及可信度。(如圖1)動態(tài)指標的指標類型分為通用型、專業(yè)型。專業(yè)型由四個方面來組成,如教學態(tài)度、教學方法、教學內容及教學效果,同時專業(yè)型指標可由不同學科性質分成幾類,如可分為理工類、經管文類、藝術類等。動態(tài)指標庫構建極其重要,影響到學生評教結果的真實性、有效性。
(三)動態(tài)抽取通用型指標及專業(yè)型指標構成不同類型學生評教指標體系表。
在構建評價體系表時,既要考慮課程性質、又要考慮課程所屬學科性質。在指標評價部分,筆者構建的評教模型由“通用型指標”和“專業(yè)型指標”分別從指標庫中動態(tài)抽取相應類別指標組成。一套評價體系表組建的評價指標項由3-5條標項組成為宜,這樣能確保參評對象認真評教,同時通過從指標庫中動態(tài)按指標分類抽取指標組成評價體系表,這樣比靜態(tài)評價體系表能增加考核的觀測點數(shù)量,即可從不同觀測點測評到該教師的授課情況。(如圖2)另外,每套體系表組成的指標體系不同,還可以減少參評人員的視覺疲勞,增加評教的有效性。通過設置“通用型指標”及“專業(yè)型指標”組成評價體系表能夠增加學生評教結果的可信度,保證評教結果的真實度。表3為動態(tài)配置的理論課“理工類”的評價指標體系表。
(四)分析評價對象 “整體評價”與“指標評價”得分,分離每份評價分數(shù)的有效度。
基于當前眾多高校在設置的評教模型中沒有對評教結果分數(shù)進行有效度分析,在筆者咨詢調查過程中發(fā)現(xiàn),眾多高校均以每個教學班參評對象的上下5%左右將參評對象的最高分及最低分去除后進行結果統(tǒng)計,這種統(tǒng)計方法在剔除一些無效數(shù)據(jù)的同時,也會剔除一些有效數(shù)據(jù)。筆者在此模型中設計的有效度檢驗方法為:將參評對象提交的每一份的“整體評價”分值和其“指標評價”分值進行比較,通過計算兩者偏差,將偏差度較大的數(shù)據(jù)視為無效數(shù)據(jù),同時對同一學生提交的不同任課教師打分完全一致的數(shù)據(jù)進行甄別剔除,標記為無效數(shù)據(jù)。例如,如果某位參評對對象對某位教師授課情況進行整體評分,其整體評分如果獲得是高分,那么相應的其對應的“指標評價”部分獲得的分數(shù)應該是正相應,即兩者數(shù)據(jù)必然相吻合,不會出現(xiàn)整體印象給教師分值很高而指標評價分值確很低,或者出現(xiàn)指標分值非常高而整體印象分值較低的狀況,否則可以判斷該同學提交的評價數(shù)據(jù)為無效數(shù)據(jù)。
(五)分析統(tǒng)計結果,其區(qū)分度明顯擴大,有效性表現(xiàn)明顯。
筆者在按上面步驟方法對無效評分數(shù)據(jù)進行剔除后,以模型中“整體評價分”與指標分部分各占50%進行了統(tǒng)計測試分析,發(fā)現(xiàn)該模型評價結果有效的拉開了教師評價結果的區(qū)分度,與之前模型相比,高分與低分的寬度明顯拉開。當抽查部分教師的學生評教結果與督導評教結果時,其評價結果表現(xiàn)出一致性,說明該模型有效的將教師教學情況真實客觀的反饋出來,達到了預期的目標。筆者利用兩套評價模型對本校某學院108位教師進行了評價,在對“無效數(shù)據(jù)”剔除后進行了結果統(tǒng)計,如下圖4所示。從評教結果圖中,可以明顯地看出,新模型能將學生認為教學效果好與教學效果差的教師進行有效分離,新評價模型的評價結果分布在96.75至73.12之間,原模型中108位教師評價結果分布在96.86至84.24分之間,分差明顯擴大。
四、總結
隨著全社會對教育事業(yè)的高度重視及關注,高等學校及人才需求市場對人才培養(yǎng)質量的提出更高的要求,高校對教學質量的重視越來越高,學生評教作為當前各個高校主抓教學質量的重要利器,受到各個高校及參評對象的重視。因此,構建一套能夠符合高校人才培養(yǎng)發(fā)展需求、讓高校被參評對象信服、可信度及區(qū)分度好的評教模型非常重要。筆者通過構建及實施該評價模型收獲了以下效果。
(一)提高學生參與評教活動的積極性,評教反饋的數(shù)據(jù)真實度高,也有助于及時收集課堂教學情況。
在本模型中,拚棄了以往只能通過指標項評價的手段,增加了整體印象的評分,使學生參與評價的積極性提高,同時因為評價指標的動態(tài)抽取,讓學生在進行指標打分時不會出現(xiàn)反感情緒,提高了學生真實評價的意愿。
(二)更真實地辨別出課堂教學效果非常好與教學效果差的教師。
本模型利用整體印象分與指標分兩項分值的對比判斷,有效剔除了無效分值,同時通過整體印象分部分的直觀打分,將被參評對象的分值擴大,經測試該模型可有效擴大不同測評對象之間的差距,經監(jiān)測發(fā)現(xiàn)當同一個參評學生評價不同被評對象時,其利用整體印象分給出的分值差距有明顯不同,即該學生自己心中的“尺”真實地測量被評價對象。這樣,通過大量參與者利用自己心中的“尺”去測量被評對象后,即可有效識別哪些教師課堂教學效果好和哪些教師課堂教學效果差,對整體提高學校教學質量提供了有效的監(jiān)測手段。
(三)評教模式能夠動態(tài)修正指標,具備持續(xù)完善、更新的功能。
在本評教模型中,評價指標庫中的指標一直開放給參評對象(學生)進行在線調查,讓參評對象自愿參與對該指標理解情況、認識情況的問卷調查,教學管理部門通過采集參評對象對指標本身的一個動態(tài)調查數(shù)據(jù)分析,可以統(tǒng)計分析出哪些評價指標本身存在缺陷,以此促使指標庫中指標持續(xù)完善、更新的目的,進一步提高“指標體系”的有效性。
(四)提高了評價的可信度及真實度,為教學質量的提高起到良好的推動作用。
在本評教模型中,利用該評教模型計算出的評價結果其區(qū)分度及有效度明顯的提高,達到了通過學生評教對課堂教學情況實施監(jiān)控及反饋的效果,達到了評價教師教學效果的目標,推動了教學質量的提高。本校試用此評教模型后,學生參與度提高,教師普通認可目前評價模型所出的結果。
鑒于本評教模型的評價指標體系屬于動態(tài)修正模型,筆者在今后的工作中會不斷完善評價指標以提高有效度。同時筆者今后將繼續(xù)對評價原始數(shù)據(jù)進行更加準確的分離,將無效數(shù)據(jù)真正進有效剔除,在對結果分析時還將繼續(xù)通過模擬“整體評價分”與“指標評價分”的權重比值,讓評教模型真正科學有效。
參考文獻:
[1]陳玉琨,李如海.我國教育評價發(fā)展的世紀回顧與未來展望[J].華東師范大學學報(教育科學版),2000(1):1-12.
[2]商弘,章飛軍.我國學生評教現(xiàn)狀及存在問題研究[J].甘肅科技,2009(1):149-152.
[3]王力綱.高校學生評教問題分析與措施探究[J].四川教育學院學報,2011(7):16-20.
[4]許廣鑫.我國普通高校學生評教指標體系問題的調查與研究[D].中央民族大學,2005.
(責任編輯賴佳)