孟慶祥 王帆 馮苑君 申力 盧冰 杜娟
摘? 要:高校教學(xué)質(zhì)量評估活動開展為廣大教師及時調(diào)整教學(xué)策略提供針對性建議,有助于提高教學(xué)質(zhì)量。但現(xiàn)行評估方法多為簡單加權(quán)平均,人為給定指標(biāo)權(quán)重,常存在主觀性和片面性局限。針對上述現(xiàn)象,該文綜合學(xué)生、同行教師、督導(dǎo)員三方評價將教學(xué)質(zhì)量分為優(yōu)秀、良好、一般和較差4個等級,并采用神經(jīng)網(wǎng)絡(luò)算法,建立基于卷積神經(jīng)網(wǎng)絡(luò)的教學(xué)質(zhì)量評估模型。該文首先研究現(xiàn)行教學(xué)質(zhì)量評估體系優(yōu)缺點,判斷模型構(gòu)建可行性,提出基于深度學(xué)習(xí)的教學(xué)質(zhì)量評估模型構(gòu)建方法,然后代入現(xiàn)有教學(xué)評估數(shù)據(jù),比較所得結(jié)果與已知事實驗證模型準(zhǔn)確性。結(jié)果證明,評估模型準(zhǔn)確性較高。該研究將有助于建立一個更加科學(xué)可靠的教學(xué)質(zhì)量評估標(biāo)準(zhǔn)體系。
關(guān)鍵詞:教學(xué)質(zhì)量;深度學(xué)習(xí);評估方法;CNN網(wǎng)絡(luò);評價體系
中圖分類號:G642? ? ? ? ?文獻(xiàn)標(biāo)志碼:A? ? ? ? ? 文章編號:2096-000X(2023)S1-0014-04
Abstract: The development of teaching quality assessment activities in colleges and universities can provide more targeted information for teachers to adjust teaching strategies in a timely manner and do college lecturers a favor to improve teaching quality. Nevertheless, the majority of the current evaluation methods are weighted average algorithms. The weights of each indicator are artificially given empirical values, which often have limitations of subjectivity and one-sidedness. In view of the above phenomenon, this paper not only comprehensively considers the course evaluations of students, peer teachers and supervisors to divide the teaching quality into four grades: excellent, good, average and inferior, but also uses neural network algorithms to establish a teaching quality evaluation model structure based on Convolutional Neural Networks (CNN).This paper studies the pros and cons of the current teaching quality evaluation system, judges the feasibility of building a CNN model, and proposes a construction method for the model of teaching quality evaluation based on deep learning. Subsequently, the data of existing teaching evaluation is substituted into the model for calculation and the obtained results are compared with known facts to verify the accuracy of the model. According to the result, the accuracy of the CNN evaluation model is high, which will help to establish a more scientific and reliable teaching quality evaluation standard system.
Keywords: teaching quality; deep learning; assessment method; CNN network; evaluation system
基金項目:湖北省科技廳省級基金項目“基于全天空成像儀和輻射傳輸模型的太陽能短時預(yù)測方法研究”(2019CFB732);武漢大學(xué)遙感信息工程學(xué)院“三全育人”教改項目“疫情期間遙感大類卓越工程師人才培養(yǎng)改革”(YGJY202210);武漢大學(xué)遙感信息工程學(xué)院“三全育人”教改項目“探索‘教與學(xué)革命’背景下教師教學(xué)能力提升優(yōu)化及制度設(shè)計”(YGJY202214);武漢大學(xué)遙感信息工程學(xué)院“三全育人”教改項目“價值引領(lǐng)式的大學(xué)生競賽科研創(chuàng)新育人模式改革路徑探索”(YGJY202114);武漢大學(xué)教改項目“學(xué)科競賽與大創(chuàng)科研驅(qū)動的遙感類綜合創(chuàng)新育人模式研究”(00030791)
第一作者簡介:孟慶祥(1977-),男,漢族,內(nèi)蒙古烏蘭察布人,博士,講師。研究方向為遙感科學(xué)與技術(shù)、深度學(xué)習(xí)、教學(xué)研究等。
目前,我國大多高校已建成由督導(dǎo)員、同行教師和教學(xué)學(xué)生評價共同組成的教學(xué)質(zhì)量評估體系,該體系主要由督導(dǎo)員評價指標(biāo)調(diào)查表、同行教師評價指標(biāo)調(diào)查表和學(xué)生評價指標(biāo)調(diào)查表構(gòu)成。相較于單方面由學(xué)生或督導(dǎo)員評價的手段,該體系更客觀,但其最終等級評估結(jié)果依賴于加權(quán)平均計算,且各權(quán)重乃人為給定經(jīng)驗值,在可靠性上仍有欠缺[1]。此外,受多種不定量因素影響,現(xiàn)行評估方法還存在評分結(jié)果與測評結(jié)果聯(lián)系松散的問題,難以直觀體現(xiàn)最終教學(xué)評價分?jǐn)?shù)代表的實際意義,對課程教學(xué)改進(jìn)的指導(dǎo)意義不強(qiáng)[2]。
傳統(tǒng)反向傳播(Back Propagation ,BP) 神經(jīng)網(wǎng)絡(luò)常常需要大量樣本進(jìn)行訓(xùn)練,計算量大,不利于推廣應(yīng)用[3]。而卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks, CNN)作為一種特殊的深度前饋神經(jīng)網(wǎng)絡(luò)模型,與生物神經(jīng)網(wǎng)絡(luò)具有高度相似性。卷積網(wǎng)絡(luò)由大量獨(dú)立神經(jīng)元構(gòu)成二維平面,多個二維平面構(gòu)成單層神經(jīng)網(wǎng)絡(luò),單層神經(jīng)網(wǎng)絡(luò)相互連結(jié)構(gòu)成[4]。其特殊性主要體現(xiàn)在以下兩點:一是神經(jīng)元之間采用非全連接,有效降低模型復(fù)雜度;二是相同層級中特殊神經(jīng)元的連接權(quán)重相同,減少權(quán)值數(shù)量[5]。同時,CNN具備準(zhǔn)確度高、學(xué)習(xí)能力強(qiáng)、對噪聲神經(jīng)有較強(qiáng)的魯棒性和容錯能力等特點[6]。最后,CNN模型還有一個獨(dú)具的優(yōu)點,即廣泛適用性。搭建CNN模型的知識來源不是固定的歷史模型參數(shù),而是對有參考價值的評估樣本的學(xué)習(xí)結(jié)果,并基于習(xí)得模型分類規(guī)則進(jìn)行實例分析[7]。這樣的特點使得模型具有很強(qiáng)的時效性,只要收集到最新的評估樣本訓(xùn)練集,就能通過深度學(xué)習(xí)得到最新的、最適合的評估系統(tǒng),適用于當(dāng)前社會背景。
根據(jù)武漢大學(xué)2016年教學(xué)評估工作數(shù)據(jù),本研究基于CNN構(gòu)造教學(xué)質(zhì)量評估模型,通過學(xué)習(xí)樣本中學(xué)生、教師及督導(dǎo)員課程評價和綜合教學(xué)質(zhì)量的對應(yīng)關(guān)系,得到區(qū)分不同教學(xué)質(zhì)量的規(guī)則,直觀反映課程教學(xué)質(zhì)量,進(jìn)而形成一個科學(xué)可靠的教學(xué)質(zhì)量評估標(biāo)準(zhǔn)體系。
一? 基于CNN的教學(xué)質(zhì)量評估模型
(一)? 指標(biāo)體系的建立
指標(biāo)體系是進(jìn)行課堂教學(xué)評估的前提。為從不同角度評估某課程教學(xué)質(zhì)量,本研究評估指標(biāo)體系的構(gòu)建由學(xué)生、同行教師及督導(dǎo)員展開。其中,學(xué)生是課堂內(nèi)容的第一接收者,故而學(xué)生評價是課程教學(xué)質(zhì)量評估必不可少的部分,但其評價側(cè)重于課堂信息的傳遞和課下溝通方式,難以覆蓋教學(xué)策略等專業(yè)方面;同行教師經(jīng)驗豐富,對于課程體系和課程目標(biāo)本身有較透徹的理解,能夠?qū)虒W(xué)過程中老師使用了何種教學(xué)策略、該策略對學(xué)生理解課堂知識具有多大影響等方面作出專業(yè)評價;督導(dǎo)員更專注于評價課堂教學(xué)控制,一般從一些硬性指標(biāo),如課堂的紀(jì)律、出勤率、課程成績等方面出發(fā)完成評價。
綜上,我們將教學(xué)質(zhì)量評估指標(biāo)細(xì)分為三級。
1)一級指標(biāo)為教學(xué)質(zhì)量綜合評估等級,分為4級:分別為1級(優(yōu)秀),2級(良好),3級(一般),4級(較差)。
2)二級指標(biāo)為學(xué)生、同行教師及督導(dǎo)員對課堂教學(xué)質(zhì)量的評估結(jié)果,分為4級:分別為1級(優(yōu)秀),2級(良好),3級(一般),4級(較差)。
3)三級指標(biāo)為學(xué)生、同行教師及督導(dǎo)員評價表上的細(xì)分項,分為3級:分別為1級(優(yōu)秀),2級(一般),3級(較差)。
具體指標(biāo)體系見表1,同級指標(biāo)間相互獨(dú)立沒有聯(lián)系。而且,本研究制定該指標(biāo)體系時注重傳統(tǒng)評價數(shù)據(jù)的輸入便捷性,三級指標(biāo)與往常進(jìn)行課程教學(xué)質(zhì)量評價時數(shù)據(jù)收集的方式一致,便于我們通過CNN模型劃分教學(xué)質(zhì)量等級。
(二)? CNN分類器
綜合評價模型使用三類人物的評價指標(biāo)作為分類器的分類特征項,建立CNN分類器以搭建教學(xué)質(zhì)量評估系統(tǒng)如圖1所示。首先由下層分類器確定二級指標(biāo)X、Y、Z值,然后再基于上層分類器得到一級指標(biāo)值。其中二級指標(biāo)能夠幫助課程教師快速鎖定自己在哪個教學(xué)環(huán)節(jié)存在不足,更高效地進(jìn)行教學(xué)計劃調(diào)整:如果學(xué)生評價對應(yīng)的二級指標(biāo)X值較低,則主要需要調(diào)整課堂上的信息傳遞方式或課下與學(xué)生的溝通方法;如果同行教師的評價等級Y較低,則應(yīng)考慮授課時教學(xué)策略運(yùn)用是否存在不完善問題,提高備課能力;如果督導(dǎo)員評價等級Z較低,則應(yīng)關(guān)注課堂紀(jì)律管理、給分是否合理等方面。
(三)? 訓(xùn)練樣本的建立
基于CNN分類器的教學(xué)質(zhì)量評估模型的建立需要考慮兩個問題:一是確定網(wǎng)絡(luò)結(jié)構(gòu);二是學(xué)習(xí)屬性變量的條件概率分布及確定類的先驗概率。因設(shè)計教學(xué)質(zhì)量評估指標(biāo)時已考慮屬性變量間的獨(dú)立性,故不再進(jìn)行結(jié)構(gòu)學(xué)習(xí),只需對屬性類條件概率進(jìn)行估計。
本文中選取的學(xué)生評價表、同行教師評價表和督導(dǎo)員評價表,以及教學(xué)質(zhì)量評估等級數(shù)據(jù)均來自武漢大學(xué)2016年教學(xué)評估工作。
使用CNN分類器進(jìn)行等級分類的前提是利用部分已有分類結(jié)果的樣本進(jìn)行先驗概率統(tǒng)計,CNN分類器的準(zhǔn)確度和樣本空間大小有關(guān),樣本空間越大其準(zhǔn)確性越強(qiáng)。因此,本研究從已有學(xué)生、同行教師及督導(dǎo)員的打分結(jié)果中隨機(jī)選出500份作為樣本,樣本的一級指標(biāo)和二級指標(biāo)已知。使用CNN模型進(jìn)行機(jī)器學(xué)習(xí),從已有的樣本中總結(jié)得出教學(xué)質(zhì)量等級劃分規(guī)則,利用計算機(jī)習(xí)得的分類規(guī)則對實例進(jìn)行教學(xué)質(zhì)量評估。這里需要注意的是,隨機(jī)選中的500個樣本不需要全部作為訓(xùn)練樣本集輸入到CNN分類器中,我們在實驗中隨機(jī)取出400個樣本作為訓(xùn)練集用于擬合模型、調(diào)整參數(shù),剩余100個樣本作為驗證分類器正確性的驗證樣本集,以保證所得CNN分類器準(zhǔn)確性在應(yīng)用前已被檢驗。
二? 實例分析
使用武漢大學(xué)2016年教學(xué)評估工作中提取出的樣本生成CNN分類器,進(jìn)行神經(jīng)網(wǎng)絡(luò)樣本計算機(jī)學(xué)習(xí)后,進(jìn)行實例處理,取得結(jié)果見表2。
隨后,對未有綜合評價結(jié)果的10 000個課程進(jìn)行教學(xué)質(zhì)量評估。通過問卷調(diào)查和網(wǎng)上評價系統(tǒng)等渠道,我們收集了上述課程的三級指標(biāo)。使用CNN分類器確定二級指標(biāo),并將二級指標(biāo)作為新的屬性特征值輸入得到一級指標(biāo),即綜合教學(xué)質(zhì)量等級。結(jié)果如圖2所示,其中1級課程占總課程數(shù)的5.32%,2級課程占總課程數(shù)的27.42%,3級課程占總課程數(shù)的60.77%,4級課程占總課程數(shù)的6.49%。
將評價結(jié)果與現(xiàn)實情況進(jìn)行對比,可以發(fā)現(xiàn):1級課程多為學(xué)生評選出的“最受學(xué)生喜愛課程”或被評為“武漢大學(xué)精品課程”;4級課程多為新開課程,任教老師的教學(xué)策略等有待改善。這一結(jié)果與現(xiàn)實的相互印證,代表本研究通過學(xué)習(xí)樣本得到的基于CNN的教學(xué)質(zhì)量評估模型能有效地、高可用地協(xié)助劃分課程等級,進(jìn)而幫助課程教師針對性地調(diào)整教學(xué)方法。
而且,通過多次實驗并總結(jié)分析所得結(jié)果,團(tuán)隊證明:CNN的分類準(zhǔn)確性與提供的特征屬性數(shù)成反比,若跳過二級指標(biāo)的生成環(huán)節(jié),將一級指標(biāo)及三級指標(biāo)作為分類的特征屬性集合作為樣本輸入,所得模型教學(xué)質(zhì)量等級劃分誤差明顯增大。因此,本研究采用了二級指標(biāo),更好地規(guī)避了因特征類別數(shù)過多而造成誤差呈指數(shù)增長的問題,為教學(xué)質(zhì)量評估活動帶來了更高的準(zhǔn)確性和實用性。
最后,通過選取特定三級指標(biāo)項并組合,本模型能夠研究不同課程的附加價值。但應(yīng)注意樣本價值的確定需要研究人員對于課程內(nèi)容進(jìn)行深入研究,而樣本集中的級別定義亦必須相對準(zhǔn)確,如此才能保證最后得到的分類器進(jìn)行等級劃分所得結(jié)果是可解釋的、有研究價值的。以課程對于高校教育的科研意義為例。從表1中抽出與課程科研價值密切相關(guān)的X14,X18,Y6,Y12,Z2,Z3六個指標(biāo),從課內(nèi)學(xué)生論文發(fā)表數(shù)、參與項目數(shù)、老師在該領(lǐng)域的科研成果情況等多個方面入手,評估該課程的科研價值等級,共分為3級:1級(優(yōu)秀),2級(良好),3級(普通)。使用樣本訓(xùn)練分類器并進(jìn)行實例分析,評估所選10門課程的科研價值,統(tǒng)計得到,1級科研價值課程占總數(shù)的6.72%,2級科研價值課程占總數(shù)的60.39%,3級科研價值課程占總數(shù)的32.89%。而在本科人才培養(yǎng)方案中,肩負(fù)科研培養(yǎng)重任的專業(yè)教育課程占53.57%。兩相對比發(fā)現(xiàn),目前高校具有很高科研價值的課程占比很少,大部分課程與科研有一般聯(lián)系或基本無聯(lián)系,具有較高科研價值的課程數(shù)目達(dá)不到預(yù)設(shè)目標(biāo),從而向?qū)W校、教師等提示教學(xué)現(xiàn)狀的紕漏之處,以促進(jìn)新的教學(xué)策略的制定,進(jìn)而推動高??蒲邪l(fā)展。
三? 結(jié)束語
利用本模型進(jìn)行課程教學(xué)質(zhì)量評估,對比實際與所得的綜合教學(xué)質(zhì)量等級和二級指標(biāo)值,發(fā)現(xiàn)模型能夠較準(zhǔn)確地反映課程真實情況,并能夠?qū)φn程的附加價值進(jìn)行評價。CNN不但有嚴(yán)格的數(shù)學(xué)基礎(chǔ),還具有完備的語義表達(dá)能力,充分利用專家知識和數(shù)據(jù)信息,具有很強(qiáng)的學(xué)習(xí)、推理能力,能夠比較好地利用先驗知識。但由于CNN模型本身的原理性缺陷,當(dāng)前文章涉及的分類器存在一定的預(yù)測和分類誤差。CNN模型的訓(xùn)練樣本集的確定也需要研究小組花費(fèi)較多精力收集樣本課程相關(guān)消息,權(quán)衡多方面因素,盡可能得到一個有學(xué)習(xí)價值的訓(xùn)練樣本集。未來,決策樹方法、層次分析方法等其他分類模型均將被列入考慮范疇中,以設(shè)計更優(yōu)的綜合教學(xué)質(zhì)量評估模型。
參考文獻(xiàn):
[1] 劉海燕,孫悅,關(guān)曉輝,等.基于ICA和CNN算法在教學(xué)質(zhì)量評價中應(yīng)用的探析[J].科技視界,2013(10):92.
[2] 祝智庭,彭紅超.深度學(xué)習(xí):智慧教育的核心支柱[J].中國教育學(xué)刊,2017(5):36-45.
[3] 徐欣,徐立鴻.教學(xué)質(zhì)量評價與預(yù)測的人工神經(jīng)網(wǎng)絡(luò)方法[J].統(tǒng)計與決策,2009(20):159-160.
[4] 周飛燕,金林鵬,董軍.卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J].計算機(jī)學(xué)報,2017,40(6):1229-1251.
[5] 曹玉東,劉海燕,賈旭,等.基于深度學(xué)習(xí)的圖像質(zhì)量評價方法綜述[J].計算機(jī)工程與應(yīng)用,2021,57(23):27-36.
[6] 趙德安,吳任迪,劉曉洋,等.基于YOLO深度卷積神經(jīng)網(wǎng)絡(luò)的復(fù)雜背景下機(jī)器人采摘蘋果定位[J].農(nóng)業(yè)工程學(xué)報,2019,35(3):164-173.
[7] 王良玉,張明林,祝洪濤,等.人工神經(jīng)網(wǎng)絡(luò)及其在地學(xué)中的應(yīng)用綜述[J].世界核地質(zhì)科學(xué),2021,38(1):15-26.