顧海燕,于芊竹,藍(lán)飛宏
(東北林業(yè)大學(xué) 理學(xué)院,哈爾濱 150040)
《概率論與數(shù)理統(tǒng)計(jì)》是各大高校普遍設(shè)置的一門公共基礎(chǔ)課程,對培養(yǎng)學(xué)生的或然性思維的過程中占有重要作用,同時(shí)也是統(tǒng)計(jì)分析的一門基礎(chǔ)課程,在數(shù)學(xué)、大數(shù)據(jù)、自動(dòng)化等方面的研究作用顯著,《概率論與數(shù)理統(tǒng)計(jì)》課程的開設(shè)旨在培養(yǎng)學(xué)生的應(yīng)用數(shù)據(jù)分析的方法解決實(shí)際問題的能力,對培養(yǎng)學(xué)生數(shù)據(jù)分析具有核心作用,而該課程由于其自身的抽象性特點(diǎn)以及與確定性量化分析方法具有本質(zhì)的區(qū)別,所以導(dǎo)致學(xué)生們往往在學(xué)習(xí)過程中產(chǎn)生較多的困難,使得最后的考試成績參差不齊,難盡人意.從成績的角度倒推學(xué)生們學(xué)習(xí)該門課程的影響因素,并在實(shí)際教學(xué)中加以適當(dāng)處理,對于改善目前該門課程的教與學(xué)的活動(dòng)無疑會(huì)有重要意義.
因子分析方法在對于成績的分析過程中應(yīng)用及其普遍,付政慶,郭蘭蘭,趙文才等人在職業(yè)教育培養(yǎng)中利用因子分析方法完成了各科成績的評價(jià)并得到相關(guān)聯(lián)的專業(yè)課程成績彼此間的影響強(qiáng)弱[1];俞群俊,楊慶婷,李雅琳借助因子分析法研究了昆明醫(yī)科大學(xué)2017級勞動(dòng)與社會(huì)保障專業(yè)53名同學(xué)的18門課程期末考試成績[2];廖羽祥,王海洋,王帥等采用因子分析對體育課平時(shí)成績評價(jià)指標(biāo)進(jìn)行分層,確定了5個(gè)公共因子并對其命名釋義,最終建立評價(jià)指標(biāo)體系[3];黃嘉文,陳丹婷,溫永仙利用因子分析對學(xué)生綜合素質(zhì)與能力進(jìn)行客觀評價(jià)的綜合分析方法對具有相同學(xué)習(xí)特征的學(xué)生進(jìn)行分組和聚類,得出本科學(xué)生存在各科類課程不均衡發(fā)展,缺乏創(chuàng)新實(shí)踐能力等問題的結(jié)論[4];王小麗,曹雅妮,簡太敏利用因子分析方法提取出五個(gè)影響學(xué)生成績的潛在因子,并構(gòu)建學(xué)生綜合成績的數(shù)學(xué)模型,在此基礎(chǔ)上利用系統(tǒng)聚類分析法對學(xué)生成績進(jìn)行分類,客觀地評價(jià)了各類學(xué)生的課程成績,進(jìn)而提出該校GIS專業(yè)建設(shè)的具體措施[5]; 雷玲,劉昭君結(jié)合疫情期間線上教學(xué)質(zhì)量現(xiàn)存問題,以某高等院校為例,從四個(gè)層面設(shè)計(jì)了多個(gè)影響因素變量以及線上教學(xué)質(zhì)量滿意度變量,并利用障礙度診斷分析模型,實(shí)證分析了新冠肺炎疫情期間線上教學(xué)質(zhì)量影響因素與障礙因子[6]; 目的分析預(yù)防醫(yī)學(xué)專業(yè)學(xué)生課程成績,綜合評價(jià)不同學(xué)生的能力差異.許小琴,陳禮彬采用因子分析法和聚類分析法對福建醫(yī)科大學(xué)2015級預(yù)防醫(yī)學(xué)專業(yè)175名學(xué)生的47門課程成績進(jìn)行研究[7]; 武秋月在因子分析模型的基礎(chǔ)上,提出了計(jì)算自驅(qū)力指數(shù)α的因子分析改進(jìn)模型[8]; 錢芳斌,丁海洋提出了多維度、多階段的在線開放課程效能評價(jià)指標(biāo)和影響因素,并嘗試構(gòu)建了在線開放課程的效能評價(jià)體系模型,以保障在線開放課程的可持續(xù)性健康發(fā)展[9].由此可見,在高校課程成績分析及教學(xué)質(zhì)量的提升中,因子分析方法是一有力工具.
因子分析最早由英國心理學(xué)家C·E·斯皮爾曼提出,本質(zhì)上是一種降維過程,而降維得到的公共因子稱為“潛變量”,通常用于心理學(xué)、社會(huì)學(xué)和行為科學(xué)等領(lǐng)域的研究[10-12].用少數(shù)幾個(gè)公共因子去描述許多指標(biāo)或因素之間的聯(lián)系,就可以相對運(yùn)用較少的因子反應(yīng)大部分的原數(shù)據(jù)所包含的信息.運(yùn)用該項(xiàng)技術(shù)可以幫助我們應(yīng)用于生活中的實(shí)際問題的分析.
假設(shè)可觀測隨機(jī)向量y=[Y1,Y2,…,Yp]′的均值為μ,假定y線性依賴于m個(gè)不可觀測的公共因子f=[F1…Fm]′和p個(gè)不可觀測的特殊因子ε=[ε1…εp]′,通常m
其中:ljk為第j個(gè)變量在第k個(gè)因子上的載荷,體現(xiàn)了公共因子對此變量的解釋能力[13].ljk表示公共因子對原始變量的解釋能力,當(dāng)因子載荷矩陣各列上的元素的絕對值越分散,說明該公共因子更易于解釋.
因子分析的目的不僅是得到公共因子,更重要的是知道各個(gè)公共因子的實(shí)際意義,即突出各個(gè)公共因子的典型代表原始變量,為此可以對因子載荷矩陣施行正交旋轉(zhuǎn)變換,使得因子載荷矩陣各列元素的平方兩極分化,要么接近0,要么接近1,該方法稱為最大方差正交旋轉(zhuǎn).
設(shè)T是一個(gè)正交矩陣,延用上面的因子載荷矩陣Lp×m,則最大方差正交旋轉(zhuǎn)的因子載荷矩陣為[14]
B=Lp×m×T.
有時(shí)需要把公共因子表示成原始變量的線性組合,或?qū)γ總€(gè)樣品計(jì)算公共因子的估計(jì)值,即因子得分.因子得分用于模型診斷,或進(jìn)一步分析原始數(shù)據(jù),比如排序、分類等.可表示為
Fi=si1y1+si2y2+…+sipyp,i=1,2,…,m
可以利用不同方法估計(jì)出sij的值,最后計(jì)算出Fi的值,稱之為公共因子Fi的得分[15].
本次分析數(shù)據(jù)來源某高?!陡怕收撆c數(shù)理統(tǒng)計(jì)》階段一二和期末成績.數(shù)據(jù)經(jīng)過了簡單處理,剔除了缺考學(xué)生成績,包括階段一4道主觀題分?jǐn)?shù)、階段二4道主觀題分?jǐn)?shù)和期末5道主觀題分?jǐn)?shù),去掉了選擇題和填空題分?jǐn)?shù),公選用13道題的分?jǐn)?shù)作為原始變量,樣本容量為3 206人.
如表1所示,利用處理過的所有數(shù)據(jù)采用主成分分析法得到的KMO檢驗(yàn)值為0.942,較大,巴特球度檢驗(yàn)顯著性水平小于0.001,結(jié)果說明這組數(shù)據(jù)適合進(jìn)行因子分析.
表1 KMO檢驗(yàn)和巴特利特球度檢驗(yàn)結(jié)果
采用處理過的3 206個(gè)數(shù)據(jù)進(jìn)行因子分析,選取了前4個(gè)公共因子,因?yàn)檫@4個(gè)公共因子有鮮明的實(shí)際意義,且反映原始變量的信息已占總信息的67%以上,雖然所占總信息的百分比不是那么高,但前4個(gè)公共因子已充分反映了學(xué)生答題的情況,對教師的后續(xù)教學(xué)已起到啟示作用.見表2.
表2 公共因子貢獻(xiàn)率及累積貢獻(xiàn)率
由于利用主成分法得到的公共因子不利于解釋,因此對因子載荷矩陣進(jìn)行了最大方差因子旋轉(zhuǎn).見表3,第一個(gè)公共因子對t9~t13的載荷較大,t9~t13是期末試題的所有主觀題,主要考察的知識點(diǎn)為:假設(shè)檢驗(yàn)、區(qū)間估計(jì)、點(diǎn)估計(jì)、連續(xù)型二維隨機(jī)變量等.第二個(gè)公共因子對t5~t8的載荷較大,t5~t8是階段二試題的所有主觀題,主要考察的知識點(diǎn)為:離散型二維隨機(jī)變量、連續(xù)型二維隨機(jī)變量、中心極限定理等.第三個(gè)公共因子對t2~t4的載荷較大,t2~t4是階段一試題的除了第一道主觀題的所有主觀題,主要考察的知識為一維隨機(jī)變量.第四個(gè)公共因子對t1的載荷要遠(yuǎn)遠(yuǎn)高于其他的原始變量,這道題考察全概率公式和貝葉斯公式.
表3 最大方差正交旋轉(zhuǎn)后的因子載荷矩陣
將13道題利用四個(gè)因子的概括,實(shí)現(xiàn)了降維的效果,使其可以在低維度上對考試成績進(jìn)行研究,分析學(xué)生的知識掌握情況、邏輯思維能力、記憶能力等方面的信息.教師可以利用這些信息針對學(xué)生欠缺部分進(jìn)行專門的訓(xùn)練,來達(dá)到提高教學(xué)質(zhì)量的效果.
把處理過的數(shù)據(jù)按學(xué)院(分別為理學(xué)院、林學(xué)院、土木工程學(xué)院、經(jīng)濟(jì)管理學(xué)院、交通學(xué)院、工程技術(shù)學(xué)院、信息與計(jì)算機(jī)科學(xué)學(xué)院、機(jī)電工程學(xué)院)分成8組數(shù)據(jù),對這8組數(shù)據(jù)分別建立因子模型.
圖1~8為8個(gè)學(xué)院的可視化因子載荷圖,這8個(gè)學(xué)院的因子模型均選取前4個(gè)公共因子,橫坐標(biāo)表示題目標(biāo)號,表示公共因子對各道題的因子載荷.
從圖1~8可以看出,各個(gè)學(xué)院的因子模型的第一個(gè)公共因子都是對期末試題的載荷較大,其中t9、t10的因子載荷明顯比其他的變量要大,不分學(xué)院的因子模型的第一個(gè)公共因子反映的信息是一致的.工程技術(shù)學(xué)院、經(jīng)濟(jì)管理學(xué)院、林學(xué)院、信息與計(jì)算機(jī)科學(xué)學(xué)院的因子模型的第二個(gè)公共因子對t5~t8的載荷較大,與不分學(xué)院的因子模型的第二個(gè)公共因子反映的信息是一致的,但是其他學(xué)院的因子模型的第二個(gè)公共因子沒有反映此信息,如對于機(jī)電工程學(xué)院和土木工程學(xué)院,第二個(gè)公共因子主要解釋原始變量t2和t3,由此可見不同學(xué)院的學(xué)生對本課程的掌握具有明顯的差異性,因此教師應(yīng)該結(jié)合學(xué)院專業(yè)不同調(diào)整上課進(jìn)度、方式、著重哪些的知識點(diǎn)講解等.第三個(gè)公共因子只對交通學(xué)院的試題t7和t9分?jǐn)?shù)有負(fù)向的影響,說明第三個(gè)公共因子得分越低學(xué)生成績越高.8個(gè)學(xué)院的因子模型的第四個(gè)公共因子出現(xiàn)了負(fù)數(shù)的載荷,且多數(shù)學(xué)院的因子模型的第四個(gè)公共因子對t1的因子載荷很大,這與部分學(xué)院的因子模型一致.
工程技術(shù)學(xué)院、機(jī)電工程學(xué)院和信息與計(jì)算機(jī)科學(xué)學(xué)院的因子模型的前四個(gè)公共因子對原始變量的解釋較為相似,可見這三個(gè)學(xué)院對本課程的學(xué)習(xí)有一定的共通性,這3個(gè)學(xué)院都是工科學(xué)院,因此學(xué)生邏輯思維能力較強(qiáng),體現(xiàn)了工科學(xué)生的特點(diǎn).
圖1 可視化因子載荷(工程技術(shù)學(xué)院)
圖2 可視化因子載荷(機(jī)電工程學(xué)院)
圖3 可視化因子載荷(交通學(xué)院)
圖4 可視化因子載荷(經(jīng)濟(jì)管理學(xué)院)
圖5 可視化因子載荷(理學(xué)院)
圖6 可視化因子載荷(林學(xué)院)
圖7 可視化因子載荷(土木工程學(xué)院)
圖8 可視化因子載荷(信息與計(jì)算及工程學(xué)院)
針對全校本課程的各道主觀題分值建立的因子模型,用前4個(gè)公共因子反映出學(xué)生學(xué)習(xí)本課程的各方面能力,以此調(diào)整教學(xué)方法.
針對8個(gè)學(xué)院學(xué)生的本課程的各道主觀題分值建立的8個(gè)因子模型,也選取前4個(gè)公共因子,不同學(xué)院表現(xiàn)出不同的結(jié)果,因此提示教師在教學(xué)中應(yīng)該結(jié)合專業(yè)進(jìn)行講解.