馬守明 鄭武 程晨 周祎
摘? 要:對(duì)高校學(xué)生學(xué)習(xí)過(guò)程進(jìn)行準(zhǔn)確的評(píng)價(jià),是提升學(xué)生學(xué)習(xí)效率、改進(jìn)教師教學(xué)方法、完善學(xué)校教學(xué)管理的重要環(huán)節(jié)。目前已經(jīng)提出了多種數(shù)學(xué)模型來(lái)解決該問(wèn)題,但這些方法均需要一定的先驗(yàn)知識(shí)且難以實(shí)現(xiàn)自學(xué)習(xí)。本文利用SOM模型能在無(wú)監(jiān)督、無(wú)先驗(yàn)知識(shí)的狀態(tài)下對(duì)樣本進(jìn)行自組織的特性進(jìn)行學(xué)習(xí)過(guò)程的評(píng)價(jià),同時(shí)通過(guò)主成分分析,提高了網(wǎng)絡(luò)收斂速度和聚類準(zhǔn)確性。實(shí)例分析表明:改進(jìn)SOM模型能有效地進(jìn)行學(xué)生學(xué)習(xí)過(guò)程的評(píng)價(jià)。
關(guān)鍵詞:SOM模型;學(xué)習(xí)評(píng)價(jià);聚類分析;主成分分析
中圖分類號(hào):TP183? ? ?文獻(xiàn)標(biāo)識(shí)碼:A
Abstract: The accurate evaluation of the learning process of college students is an important link in the improvement of students' learning efficiency, teachers' teaching methods and school teaching management. The existing evaluation methods of learning process mostly rely on accurate mathematical models, which cannot realize self-learning. In this paper, the SOM (Self Organizing Maps) model was used to evaluate the learning process of samples in an unsupervised state without prior knowledge. Meanwhile, through PCA (principal component analysis) algorithm, the convergence speed and clustering accuracy of the network can be improved. The case analysis shows that the improved SOM model can effectively evaluate students' learning process.
Keywords: SOM model; learning evaluation; cluster analysis; principal component analysis
1? ?引言(Introduction)
高校是培養(yǎng)專業(yè)人才的教育機(jī)構(gòu),學(xué)生的“學(xué)”和教師的“教”構(gòu)成了高校教學(xué)工作的核心環(huán)節(jié),這也是高校實(shí)現(xiàn)可持續(xù)、健康發(fā)展的根基。學(xué)生的學(xué)習(xí)具有過(guò)程復(fù)雜、個(gè)體迥異、發(fā)展動(dòng)態(tài)的特點(diǎn),并伴隨著教學(xué)活動(dòng)的開展而不斷動(dòng)態(tài)進(jìn)化[1]。探索如何對(duì)其進(jìn)行科學(xué)有效地系統(tǒng)評(píng)價(jià),并利用評(píng)價(jià)結(jié)果反作用于教師授課和教學(xué)管理,對(duì)高校教學(xué)質(zhì)量的整體提升具有重要的現(xiàn)實(shí)意義[2,3]。
目前,越來(lái)越多的模擬人類智能行為或進(jìn)化過(guò)程而發(fā)展起來(lái)的計(jì)算智能技術(shù)應(yīng)用在學(xué)生學(xué)習(xí)過(guò)程的評(píng)價(jià)之中。文獻(xiàn)[4]依據(jù)評(píng)價(jià)指標(biāo)體系原則建立了網(wǎng)絡(luò)學(xué)習(xí)評(píng)價(jià)指標(biāo)體系,并運(yùn)用模糊綜合評(píng)判原理構(gòu)建了一個(gè)實(shí)用的網(wǎng)絡(luò)學(xué)習(xí)評(píng)價(jià)數(shù)學(xué)模型。文獻(xiàn)[5]提出一種采用改進(jìn)LMBP算法設(shè)計(jì)的在線評(píng)價(jià)模型,并將改進(jìn)LMBP算法運(yùn)用到實(shí)際在線學(xué)習(xí)的評(píng)價(jià)之中。文獻(xiàn)[6]構(gòu)建了基于BP神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)學(xué)習(xí)評(píng)價(jià)模型,并設(shè)計(jì)了基于Hadoop的BP神經(jīng)網(wǎng)絡(luò)并行算法來(lái)解決網(wǎng)絡(luò)學(xué)習(xí)評(píng)價(jià)中的大數(shù)據(jù)集分析和處理問(wèn)題。文獻(xiàn)[7]將云模型與ANFIS結(jié)合,利用云模型代替模糊神經(jīng)網(wǎng)絡(luò)的隸屬度函數(shù),構(gòu)建了ANFIS云推理網(wǎng)絡(luò)以實(shí)現(xiàn)學(xué)習(xí)效果的評(píng)價(jià)。與這些方法不同的是,SOM(Self Organizing Maps)模型雖然也是一種神經(jīng)網(wǎng)絡(luò)模型,但是它是基于無(wú)監(jiān)督學(xué)習(xí)的,就這使得它能夠在缺乏先驗(yàn)知識(shí)的情況下,也能夠?qū)崿F(xiàn)對(duì)未知環(huán)境和樣本空間的有效學(xué)習(xí),從而進(jìn)一步實(shí)現(xiàn)多指標(biāo)復(fù)雜情景下的學(xué)生學(xué)習(xí)過(guò)程的分類和評(píng)價(jià)。
2? ?SOM模型理論(SOM model theory)
人類大腦的一百多億神經(jīng)細(xì)胞存在著廣泛地自組織連接和功能分區(qū),不同分區(qū)的神經(jīng)細(xì)胞在遺傳和進(jìn)化的基礎(chǔ)上,對(duì)特定的輸入信號(hào)具有敏感性,從而能夠?qū)Σ煌母兄斎胄纬刹煌恼J(rèn)知結(jié)果。SOM模型就是據(jù)此提出的一種自組織特征映射神經(jīng)網(wǎng)絡(luò)模型,它本質(zhì)上是競(jìng)爭(zhēng)學(xué)習(xí)型的無(wú)監(jiān)督神經(jīng)網(wǎng)絡(luò),也是應(yīng)用最為廣泛的自組織神經(jīng)網(wǎng)絡(luò)方法。
SOM模型的基本思想是認(rèn)為處于空間中不同位置的人工神經(jīng)元具有不同的功能分工,當(dāng)接收到外界復(fù)雜的輸入模式時(shí),在輸出層將會(huì)形成不同的反應(yīng)區(qū)域。類似人腦,各區(qū)域?qū)斎肽J接胁煌捻憫?yīng)特性。因此,SOM模型能將高維輸入數(shù)據(jù)映射到低維空間,同時(shí)還能保持輸入數(shù)據(jù)在高維空間的拓?fù)浣Y(jié)構(gòu),即將高維空間中相似的樣本點(diǎn)映射到網(wǎng)絡(luò)輸出層中的鄰近神經(jīng)元[8]。輸出層的神經(jīng)元可以有一維、二維或更高維的組織形式,圖1所示為最常用的二維組織形式。
在該二維SOM模型中,輸出層神經(jīng)元的排列形式是矩陣結(jié)構(gòu),初始化時(shí)該層每個(gè)神經(jīng)元均被賦予一個(gè)隨機(jī)的權(quán)值向量。當(dāng)有新樣本向量輸入該模型時(shí),通過(guò)模擬人腦神經(jīng)元的側(cè)抑制機(jī)制,每個(gè)輸出層的神經(jīng)元都參與競(jìng)爭(zhēng)。例如,可以通過(guò)計(jì)算歐拉距離產(chǎn)生一個(gè)輸入樣本和權(quán)值向量之間距離最小的神經(jīng)元作為獲勝神經(jīng)元,并同時(shí)調(diào)整其周圍一定范圍內(nèi)鄰居神經(jīng)元的權(quán)值向量,該范圍之外的神經(jīng)元的權(quán)值向量則不進(jìn)行更新。這種隨著鄰域距離的增加,輸出層神經(jīng)元之間從強(qiáng)化到抑制的關(guān)系轉(zhuǎn)變?nèi)鐖D2墨西哥草帽函數(shù)所示。
獲勝神經(jīng)元的權(quán)值調(diào)整幅度最大,距離它越遠(yuǎn)的鄰域神經(jīng)元調(diào)整幅度越小,當(dāng)距離再遠(yuǎn)一些時(shí),權(quán)值調(diào)整幅度為負(fù),更遠(yuǎn)則又回到零。經(jīng)過(guò)這樣不斷地訓(xùn)練與調(diào)整,最終輸出層的每個(gè)神經(jīng)元都能夠獲得維持拓?fù)浣Y(jié)構(gòu)的權(quán)值向量。
3? 基于改進(jìn)SOM模型的學(xué)習(xí)評(píng)價(jià)方法(Learning evaluation method based on improved SOM model)
3.1? ?SOM模型改進(jìn)
在實(shí)際應(yīng)用中,人們?yōu)榱烁娴胤治鲆粋€(gè)對(duì)象,往往會(huì)選擇較多的評(píng)價(jià)指標(biāo)對(duì)其進(jìn)行綜合描述。但由于指標(biāo)的數(shù)量增多,這些指標(biāo)之間難以避免地存在一定相關(guān)性,從而導(dǎo)致觀測(cè)樣本數(shù)據(jù)反映的真實(shí)信息產(chǎn)生重疊,甚至?xí)绊懛治鼋Y(jié)果的正確性。因此,需要用少量的不相關(guān)綜合指標(biāo)代替原來(lái)的大量原始指標(biāo)來(lái)更有效地反映分析對(duì)象的真實(shí)情況。
SOM模型的主要優(yōu)點(diǎn)在于其圖形表示結(jié)果直觀且易于理解和解釋,在技術(shù)上也易于實(shí)現(xiàn)。但是傳統(tǒng)SOM模型的計(jì)算復(fù)雜度較高,尤其在對(duì)數(shù)量較大、特征較多的學(xué)習(xí)數(shù)據(jù)集進(jìn)行分析和挖掘時(shí),將需要大量的計(jì)算資源和耗時(shí),不適于時(shí)效要求較高的應(yīng)用場(chǎng)景。為了既保持原始數(shù)據(jù)的本質(zhì)特征,又能有效降低其規(guī)模,可以采用數(shù)據(jù)降維的方法。
假設(shè)原始數(shù)據(jù)元組或向量由n個(gè)屬性或維度描述,在n取值較大時(shí),如果將這些指標(biāo)直接進(jìn)行多元統(tǒng)計(jì)分析,不僅會(huì)使模型變得復(fù)雜不穩(wěn)定,還有可能因?yàn)樽兞恐g存在多重共線性引起較大的結(jié)果誤差。利用主成分分析(Principal Components Analysis,PCA)搜索k()個(gè)最能代表這些原始數(shù)據(jù)的n維正交向量可以將原始數(shù)據(jù)投影到一個(gè)小的數(shù)據(jù)空間。與屬性子集選擇通過(guò)保留原屬性集的一個(gè)子集來(lái)減少屬性集大小的思路不同,PCA通過(guò)創(chuàng)建綜合屬性指標(biāo)來(lái)將原始高維數(shù)據(jù)投影到低維空間。
3.2? ?評(píng)價(jià)指標(biāo)篩選
評(píng)價(jià)指標(biāo)是對(duì)學(xué)生學(xué)習(xí)過(guò)程進(jìn)行評(píng)價(jià)的依據(jù),不同的評(píng)價(jià)指標(biāo)會(huì)導(dǎo)致對(duì)同一評(píng)價(jià)對(duì)象的評(píng)價(jià)結(jié)果不同。在實(shí)際評(píng)價(jià)工作中,高校學(xué)生學(xué)習(xí)過(guò)程評(píng)價(jià)是一個(gè)多層次、多目標(biāo)的復(fù)雜問(wèn)題,必須根據(jù)評(píng)價(jià)目的對(duì)評(píng)價(jià)指標(biāo)進(jìn)行認(rèn)真篩選。根據(jù)學(xué)習(xí)過(guò)程的構(gòu)成,本文從學(xué)習(xí)態(tài)度、學(xué)習(xí)方法和學(xué)習(xí)效果三個(gè)方面構(gòu)建包含12個(gè)指標(biāo)項(xiàng)的評(píng)價(jià)指標(biāo)體系,如圖3所示。
3.3? ?評(píng)價(jià)方法設(shè)計(jì)
根據(jù)改進(jìn)的SOM模型,本文提出的學(xué)習(xí)過(guò)程評(píng)價(jià)方法包含以下步驟:
第一階段,進(jìn)行數(shù)據(jù)預(yù)處理,基本過(guò)程如下:
(1)規(guī)范化輸入的原始樣本數(shù)據(jù),避免不同屬性量綱差異的影響。
(2)通過(guò)計(jì)算,求得k個(gè)標(biāo)準(zhǔn)正交向量,即為規(guī)范化輸入數(shù)據(jù)的基。
(3)對(duì)主成分按重要性或強(qiáng)度降序排列。
(4)根據(jù)降序排列,去掉較弱的成分來(lái)歸約數(shù)據(jù)。
第二階段,建立改進(jìn)SOM模型,包括以下步驟:
(1)模型初始化,主要包括權(quán)值初值和學(xué)習(xí)率初值。
(2)輸入訓(xùn)練樣本。將第一階段生成的主成分向量輸入模型。
(3)尋找競(jìng)爭(zhēng)層獲勝神經(jīng)元?;維OM模型在計(jì)算最佳匹配神經(jīng)元時(shí)采用簡(jiǎn)單歐拉距離計(jì)算兩個(gè)n維向量和之間的距離,數(shù)據(jù)各維分量的分布不一樣。這里采用標(biāo)準(zhǔn)化歐拉距離尋找獲勝神經(jīng)元:
(4)進(jìn)行網(wǎng)絡(luò)權(quán)值的學(xué)習(xí)。調(diào)整獲勝神經(jīng)元和其鄰接神經(jīng)元的權(quán)值:
式中,Nc是獲勝神經(jīng)元的鄰域,是學(xué)習(xí)因子。
(5)繼續(xù)輸入新的訓(xùn)練樣本,直到學(xué)習(xí)因子逐漸下降到0或達(dá)到預(yù)定的訓(xùn)練輪數(shù)。
第三階段,將待測(cè)樣本輸入訓(xùn)練好的改進(jìn)SOM模型中進(jìn)行可視化評(píng)價(jià)。如果該樣本在競(jìng)爭(zhēng)層的位置與某標(biāo)準(zhǔn)評(píng)價(jià)等級(jí)樣本在相同位置,則可以判定它屬于該評(píng)價(jià)等級(jí)。
4? ?實(shí)例分析(Case study)
作為基于改進(jìn)SOM模型的學(xué)習(xí)過(guò)程評(píng)價(jià)方法的示例,依據(jù)12個(gè)學(xué)習(xí)過(guò)程評(píng)價(jià)指標(biāo),對(duì)85個(gè)學(xué)生樣本進(jìn)行百分制打分。對(duì)這些樣本進(jìn)行主成分分析,由樣本協(xié)方差矩陣的特征向量計(jì)算可知前兩個(gè)主成分的累積貢獻(xiàn)率已經(jīng)達(dá)到91.04%,故降維過(guò)程取前兩個(gè)主成分,即可保證原變量信息丟失最小,且主成分個(gè)數(shù)最少以便于后續(xù)聚類分析。
選定的兩個(gè)主成分的表達(dá)式如下:
這兩個(gè)主成分作為改進(jìn)SOM模型的輸入,利用MATLAB 7.11進(jìn)行仿真,將它們映射到二維神經(jīng)元層。主要參數(shù)設(shè)置如下:結(jié)構(gòu)函數(shù)為六角結(jié)構(gòu)函數(shù),輸出層為4×4結(jié)構(gòu),排序階段學(xué)習(xí)速率為0.9,學(xué)習(xí)步長(zhǎng)為1000,收斂階段學(xué)習(xí)速率為0.02,鄰域距離為1。
根據(jù)具體應(yīng)用場(chǎng)景,如果SOM模型達(dá)到訓(xùn)練要求就可以輸出保存。當(dāng)有新的樣本數(shù)據(jù)輸入時(shí),SOM模型就會(huì)通過(guò)特定神經(jīng)元將其進(jìn)行自動(dòng)分類。如果輸入的樣本數(shù)據(jù)不符合任何類別,則依據(jù)就近原則進(jìn)行分類,這也體現(xiàn)了SOM模型強(qiáng)大的適應(yīng)性。
選取五個(gè)樣本數(shù)據(jù)對(duì)訓(xùn)練好的網(wǎng)絡(luò)進(jìn)行測(cè)試,其中,由主成分重建觀測(cè)樣本,可知這五個(gè)樣本分類和標(biāo)準(zhǔn)分類結(jié)果是一致的,這也說(shuō)明改進(jìn)SOM網(wǎng)絡(luò)模型評(píng)價(jià)具有準(zhǔn)確性的優(yōu)點(diǎn),且泛化性能良好。
5? ?結(jié)論(Conclusion)
利用改進(jìn)的SOM模型進(jìn)行高校學(xué)生學(xué)習(xí)過(guò)程的聚類評(píng)價(jià),有效減少了評(píng)價(jià)指標(biāo)繁多且指標(biāo)之間具有一定相關(guān)性的影響,訓(xùn)練過(guò)程具有無(wú)監(jiān)督自學(xué)習(xí)的優(yōu)點(diǎn),訓(xùn)練結(jié)果簡(jiǎn)單直觀,而且模型具有較強(qiáng)的泛化能力和穩(wěn)定性。實(shí)例分析表明,本文方法可以為高校學(xué)生學(xué)習(xí)過(guò)程的客觀、科學(xué)評(píng)價(jià)提供有力依據(jù),從而促進(jìn)高校教學(xué)工作水平的持續(xù)提升。
參考文獻(xiàn)(References)
[1] Guri Skedsmo,Stephan Gerhard Huber.Measuring teaching quality:some key issues[J].Educational Assessment Evaluation and Accountability,2019,31(2):1-3.
[2] Sara Mortaz Hejri,Azim Mirzazadeh,Mohammad Jalili.Peer observation of teaching for formative evaluation of faculty members[J].Medical Education,2018,52(5):567-568.
[3] Matthew G Fete,Robert C Haight,Peter Clapp,et al.Peer Evaluation Instrument Development, Administration,and Assessment in a Team-based Learning Curriculum[J].American Journal of Pharmaceutical Education,2017,81(4):68.
[4] 栗濤,王清心,丁家滿.一種基于模糊理論的網(wǎng)絡(luò)學(xué)習(xí)評(píng)價(jià)模型[J].山西電子技術(shù),2009(6):48-50.
[5] 盧宇,陳錦瑩,謝靜,等.基于LMBP算法的在線學(xué)習(xí)評(píng)價(jià)模式研究[J].中國(guó)遠(yuǎn)程教育,2016(3):28-32.
[6] 陳志華.基于Hadoop的神經(jīng)網(wǎng)絡(luò)算法在網(wǎng)絡(luò)學(xué)習(xí)評(píng)價(jià)中的應(yīng)用研究[J].計(jì)算機(jī)與數(shù)字工程,2016(2):248-251.
[7] 唐肝翌,盧桂馥,周鳴爭(zhēng),等.基于ANFIS云推理的網(wǎng)絡(luò)學(xué)習(xí)評(píng)價(jià)[J].西南師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2014(1):137-141.
[8] Fangqing Gu,Yiu-Ming Cheung.Self-Organizing Map-Based Weight Design for Decomposition-Based Many-Objective Evolutionary Algorithm[J].IEEE Transactions on Evolutionary Computation,2018,22(2):211-225.