于海洋,李秀文
(1.大連民族大學(xué)機電工程學(xué)院,遼寧大連 116600;2.大連民族大學(xué)理學(xué)院,遼寧大連 116600)
隨著科技的進步,智能化閱卷也隨之快速發(fā)展起來,為具體掌握考生的學(xué)習(xí)情況,需要通過一種科學(xué)規(guī)范的方法對試卷各個部分的得分進行系統(tǒng)分析。通過對考生試卷數(shù)據(jù)進行模糊聚類分析[1],最終可得出一個相對合理的分類[2]。
模糊聚類分析是一種研究分類問題的數(shù)據(jù)分析方法[3],是解決實際問題經(jīng)常使用的數(shù)學(xué)工具之一。目前,模糊聚類分析方法已滲透到社會生活的方方面面,廣泛地應(yīng)用于商業(yè)、地質(zhì)、農(nóng)業(yè)、林業(yè)等多個領(lǐng)域,所以研究模糊聚類分析是非常重要的。本文主要選取了自動化專業(yè)五位學(xué)生的專業(yè)課期末考試成績,以試卷中填空、選擇、簡答、綜合運用的成績等四項數(shù)據(jù)作為統(tǒng)計指標(biāo),利用模糊聚類分析對試卷得分點進行研究,找出通過考試反映出的普遍問題,讓考試成績數(shù)據(jù)“告訴”我們更多有價值的事實,對于調(diào)整和改進教學(xué)活動有著積極的參考意義。
對現(xiàn)實世界中的事物進行研究時,通常需要將事物按照其固有的屬性或事物間的相似程度來進行分類,從中可以發(fā)現(xiàn)事物間的規(guī)律,這是我們認(rèn)識世界、改造世界的一種重要方法。在數(shù)學(xué)中將各類事物按照一定的標(biāo)準(zhǔn)對其進行分類的方法稱為聚類分析[4],聚類分析是多元分析中的一種方法,它與回歸分析、判別分析統(tǒng)稱為多元分析的三大方法,聚類分析也是非監(jiān)督模式識別的一個重要分支,它把沒有類別標(biāo)記的事物根據(jù)其相似性的準(zhǔn)則對其進行適當(dāng)?shù)膭澐郑瑥亩丫哂型N屬性的事物區(qū)分開并加以分類。在對事物進行聚類的過程中,應(yīng)使相似程度較大的事物盡可能歸為一類,并且盡可能讓類內(nèi)事物的同質(zhì)性最大化,而不相似的事物盡可能劃分到不同的類中,并且盡可能讓類與類間的異質(zhì)性最大化,從而保證得到的同類事物類內(nèi)事物間的相似程度最高。
聚類分析起源于分類學(xué),它隨著人類社會的產(chǎn)生和發(fā)展而不斷深化,在古老的分類學(xué)中,人們主要靠經(jīng)驗和專業(yè)知識對事物進行劃分,以便研究事物之間的特性以及它們的相似關(guān)系,很少利用統(tǒng)計學(xué)的方法,但隨著生產(chǎn)技術(shù)和科學(xué)的發(fā)展,分類越來越細(xì)致,人們發(fā)現(xiàn)這種分類方法帶有較強的人的主觀性和任意性,并不能很好地揭示客觀事物間內(nèi)在的本質(zhì)差別和聯(lián)系,特別是當(dāng)處理帶有模糊性的分類問題時,一般而言模糊事物之間的界限并不是很清晰,常伴有模糊性。比如天氣:陰天、晴天、下雨天之間就沒有明確的界限,有時還會遇到“東邊日出西邊雨,道是無情卻有情”這樣的問題,且傳統(tǒng)的聚類分析是一種硬劃分,對類別劃分的界限非常嚴(yán)格,面對此類帶有模糊性的問題,傳統(tǒng)的聚類分析方法根本沒法實現(xiàn),需運用模糊聚類分析方法[5]。
模糊聚類分析方法是用數(shù)學(xué)方法定量地確定樣本的親疏關(guān)系,從而客觀地對現(xiàn)實生活中的事物進行分類,而且能夠處理邊界模糊的事物之間的分類問題[6],在分類過程中,模糊聚類分析方法可以清楚地知道各個事物所屬類別的模糊程度,從而能夠建立起樣本對于類別的不確定性描述,能更合理地反映現(xiàn)實世界。本文根據(jù)學(xué)生試卷的每個題型得分情況,運用模糊聚類分析對學(xué)生的成績進行研究,對學(xué)生成績的優(yōu)劣做一個模糊歸類。
本文選取五位學(xué)生考試成績?yōu)榛緮?shù)據(jù),試卷總分共100分,其中各題型所占分值分別為:填空20分,選擇20分,簡答20分,綜合運用40分。將5名學(xué)生考試成績組成一個集合X={x1,x2,x3,x4,x5}(也稱為論域X),分別標(biāo)記為1號,2號,3號,4號,5號,則論域X={x1,x2,x3,x4,x5}為被分類的對象。每個學(xué)生都以試卷填空、選擇、簡答、綜合運用的成績作為四項統(tǒng)計指標(biāo),即有:xij={xi1,xi2,xi3,xi4},這里xij表示第i名學(xué)生第j項指標(biāo),則各學(xué)生成績的原始數(shù)據(jù)矩陣為:
在實際問題中,如果數(shù)據(jù)不同,那么它們的量綱也會有所差別,為了比較不同量綱的數(shù)據(jù),要將數(shù)據(jù)壓縮在[0,1]區(qū)間上,這就需要對原始數(shù)據(jù)矩陣進行標(biāo)準(zhǔn)化。
通常有以下幾種變換[7]:平移·標(biāo)準(zhǔn)差變換,平移·極差變換,對數(shù)變換。本文采用平移·極差變換進行數(shù)據(jù)標(biāo)準(zhǔn)化。
平移·極差變換
論域X={x1,x2,…,xn},xi={xi1,xi2,…,xim},依照傳統(tǒng)聚類方法確定相似系數(shù),建立模糊相似矩陣,xi與xj的相似程度rij=R(xi, xj)。確定Rij=R(xi,xj)的方法主要借用傳統(tǒng)聚類的相似系數(shù)法、距離法以及其他方法[8]。具體用什么方法,可根據(jù)問題的性質(zhì)選取。本文選取最大最小法建立模糊相似矩陣。
最大最小法的計算公式為:
聚類主要方法有基于模糊相似矩陣的直接聚類法(最大樹法和編網(wǎng)法)和基于模糊等價關(guān)系矩陣的傳遞閉包法等。
模糊相似矩陣R滿足自反性和對稱性,但是并不滿足傳遞性,那么要求等價矩陣,就要對矩陣R進行改造,就是求模糊相似矩陣R的傳遞閉包,我們只需要對R求平方即可,直到R22(n-1)=R22n。其中每作一次平方,我們就要對所得到的矩陣R22k作一次模糊相似矩陣,其目的是把rij壓縮到[0,1]上,其方法和用最大最小法建立模糊相似矩陣一樣。因為R2≠R,所以要再求R4,計算得到R4=R2,從而確定=R2為模糊等價矩陣。
利用模糊等價關(guān)系矩陣對5名學(xué)生進行聚類分析,截距水平λ從1降至0,按λ截矩陣進行動態(tài)聚類。
取λ=1時,則有:
由上面的矩陣可得,X被分為5類:{x1},{x2},{x3},{x4},{x5},即:{1號},{2號},{3號},{4號},{5號}。
降截距水平λ,對不同的λ做同樣的分析,得到
當(dāng)λ=0.6066時,則有:
由上面的矩陣可得,X被分為4類:{x1},{x2,x3},{x4},{x5},即{1號},{2號,3號},{4號},{5號}。
當(dāng)λ=0.5395時,則有:
由上面的矩陣可得,X被分為3類:{x1}{x2,x3,x5}{x4},即{1號},{2號,3號,5號},{4號}。
當(dāng)λ=0.5313時,則有:
由上面的矩陣可得,X被分為2類:{x1},{x2,x3,x4,x5},即{1號},{2號,3號,4號,5號}。
當(dāng)λ=0.1190時,則有:
由上面的矩陣可得,X被分為1類:{x1,x2,x3,x4,x5},即:{1號,2號,3號,4號,5號}。
對于不同的截距水平λ對5名學(xué)生進行模糊聚類分析,得到不同的分類結(jié)果,聚類圖見圖1。
圖1 聚類圖
在分類過程中,可以看出若截距水平λ取值過高時,各學(xué)生試卷會各自分為一類;若截距水平λ取值過低時,又會使學(xué)生試卷聚為一類,為了更好地進行聚類分析,同時又能客觀合理地反映學(xué)生之間的差別,按不同的截距水平λ對學(xué)生試卷進行研究。當(dāng)0.6066≤λ≤1時,對5名學(xué)生進行分類,因為過于看重5名學(xué)生的各項基礎(chǔ)指標(biāo),而忽略了各個指標(biāo)之間關(guān)系相互影響的深淺程度,從而沒有真正起到分類的作用,所以0.6066≤λ≤1的分類結(jié)果不理想。當(dāng)0.5313≤λ≤0.6066時,分類結(jié)果能較好地體現(xiàn)出學(xué)生之間的差異,所以0.5313≤λ≤6066時的分類是科學(xué)可取的,說明分為一類的學(xué)生的學(xué)習(xí)成績相似程度較為接近。
通過對上述模型進行分析,序號為2,3的學(xué)生學(xué)習(xí)成績優(yōu)異,填空、選擇、簡答、綜合運用四個方面都掌握得比較好,較突出;序號為5的學(xué)生填空、選擇、簡答、綜合運用四方面的成績較為良好,沒有明顯的弱項,全面發(fā)展,每個知識點都學(xué)習(xí)得很扎實,有很強的綜合性。序號為1,4的學(xué)生學(xué)習(xí)成績一般,填空、簡答和綜合運用的成績較低,尤其是選擇題失分太多,知識點掌握不好,需要全面提高。
本文利用模糊聚類分析法對學(xué)生試卷成績進行分析,并不是直接按照整體考試成績的高低分類,而是將試卷細(xì)化為各項指標(biāo)進行對比,比傳統(tǒng)的分類方法更加科學(xué)、合理。通過模糊聚類分析,找出試卷中反映出的普遍問題,使教師在今后的教學(xué)中更具有針對性,實現(xiàn)系統(tǒng)教學(xué),有助于教師及時發(fā)現(xiàn)學(xué)生問題,高效提高學(xué)生成績。
創(chuàng)新創(chuàng)業(yè)理論研究與實踐2022年8期