陶毅涵
摘 要:學風推動是學生工作的重要內(nèi)容,也是提升高校人才培養(yǎng)質(zhì)量的重要抓手。及早地發(fā)現(xiàn)學業(yè)困難學生,有利于提前開展有針對性的教育和幫扶工作,提高學風推動工作效果。隨著移動互聯(lián)網(wǎng)技術(shù)的迅猛發(fā)展,數(shù)據(jù)挖掘技術(shù)為識別學業(yè)困難學生提供了新方法。本文采用費希爾線性判別法,將飛行器動力工程2016屆畢業(yè)生的基本數(shù)據(jù)和行為數(shù)據(jù)作為訓練集,建立該專業(yè)學業(yè)困難學生預警模型。經(jīng)驗證,該模型具有較高類間離散度,模型基本能夠識別學業(yè)困難學生。通過學生基本數(shù)據(jù)和日常行為數(shù)據(jù),提前識別學業(yè)困難學生是可行的。
關(guān)鍵詞:學生工作;學業(yè)困難;數(shù)據(jù)挖掘;費希爾線性判別法
一、引言
(一)研究目的
隨著高等教育向大眾化發(fā)展,高等教育招生規(guī)模逐年擴大,進入高校的“門檻”也隨之降低,如何提升高校的人才培養(yǎng)質(zhì)量面臨著新的挑戰(zhàn)。大力加強學風推動工作,幫助學業(yè)困難學生完成學業(yè),是提升高校人才培養(yǎng)質(zhì)量的有效手段,也是學生工作的重中之重。在龐大的學生群體中,提早識別學業(yè)困難風險學生,有利于及時對學生進行幫扶和引導,降低學業(yè)困難學生出現(xiàn)的概率,預防產(chǎn)生困難科目的累積,避免進入課業(yè)負擔愈發(fā)加重的惡性循環(huán),同時也能夠提升學風推動工作的成效。
(二)研究現(xiàn)狀
自1963年Krik首次提出學習困難這一概念以來[1],學習困難研究的范圍和程度不斷擴大和深入,但是對于這方面的研究仍然存在很多爭論。1965年 Bateman 首次提出了“能力與成績之間的差異”,提出“能力—成績差異”模型[2],該模型雖已被廣泛應用,但仍受到來自多方的質(zhì)疑:不能及時診斷,即存在“等待失敗”;錯誤鑒定,尤其是低智力水平學生;標準不統(tǒng)一,結(jié)論不能進一步量化?!案深A—反應模型”[3]彌補了“能力—成績差異模型”的不足,具有進行早期鑒定、減少錯誤診斷人數(shù)以及為教育干預提供幫助等優(yōu)點,但存在評估內(nèi)容過于狹隘、實證研究局限于低年級段和閱讀領域等缺陷。
組織行為學研究中提出:能夠通過研究組織中人的心理和行為表現(xiàn)及其客觀規(guī)律,提高管理人員預測、引導和控制人的行為的能力,以實現(xiàn)組織既定目標[4]。這便提出了一個新的研究思路:通過研究學生的行為表現(xiàn)及客觀情況,預測學生的學習狀態(tài),辨別其是否存在學業(yè)困難的風險。隨著移動互聯(lián)網(wǎng)技術(shù)的發(fā)展,學生的行為數(shù)據(jù)更容易獲得,這種研究思路能夠得以實踐。
(三)研究內(nèi)容
本文基于天津市輔導員精品項目——移動智能學生工作平臺的建立。從平臺中獲取大量的學生行為信息。以2016屆飛行器動力工程專業(yè)學生的行為數(shù)據(jù)為訓練集,采用費希爾線性判別法(Fishers Linear discriminant)[5,6]進行建模,得出該專業(yè)學業(yè)困難學生預警模型。并對該模型進行驗證和應用分析。
二、建模方法
(一)費希爾判別函數(shù)
費希爾判別的思路是將多元觀測值x變換成一元觀測值y,使得由總體π1和π2導出的y盡可能地分離開。用x的線性組合來建立y,使它們是x的非常簡單的函數(shù),易于計算和掌握,同時也解決了在應用統(tǒng)計方法解決模式識別問題時,經(jīng)常會遇到所謂的“維數(shù)災難”的問題。
假定x的一個固定線性組合對來自第一個總體的觀測值來說其取值為y11,y12,…,對來自第二個總體的觀測值來說其取值為y21,y22,…。這兩組單變量數(shù)據(jù)之間的分離度用以標準差為單位的與之間的差別來表示,即:
分離度,其中(2-1)
為方差的聯(lián)合估計量。目標是選擇適當?shù)膞的線性組合,使得樣本均值與之間的分離度達到最大。經(jīng)驗證,當線性組合
(2-2)
對所有可能的線性系數(shù)使得分離度最大。
費希爾對分離問題的解法也可以用于對新的觀測值作分類,其法則為:
若:
(2-3)
或
將x0分到π1。若:
或
將x0分到π2。
(二)訓練樣本的獲取
建立預警模型的關(guān)鍵是根據(jù)訓練樣本,得出準確的。本文的訓練樣本選取2016屆飛行器動力工程277名學生的基本數(shù)據(jù)和行為數(shù)據(jù)兩部分,進行全樣本的數(shù)據(jù)挖掘?;緮?shù)據(jù)包括:性別、年齡、民族、政治面貌、高考分數(shù)、生源地、家庭經(jīng)濟情況、家庭關(guān)系情況、人際交往情況。行為數(shù)據(jù)包括:晚查寢情況、晚簽到時間、早操出勤情況、內(nèi)務檢查情況、日常請假次數(shù)、上課缺勤次數(shù)、參加集體活動次數(shù)、宿舍門禁數(shù)據(jù)、與輔導員談話次數(shù)。
以上18個變量全部轉(zhuǎn)換為十進制變量,即為費希爾判別函數(shù)中的x,要計算式(2-1)中的分離度,還需要確定合理的線性系數(shù),即。線性系數(shù)的獲取采用學生工作專家及部分優(yōu)秀學生進行打分的方法,以學生畢業(yè)時學業(yè)情況作為打分的依據(jù)。
三、預警模型
將x(277行)與(18列)帶入式(2-2)中可以得出每名學生的學業(yè)評價值,即和Sp無偏估計,進而可以求出最佳投影向量和計算閾值。訓練結(jié)果圖形表示如圖3.1所示。
圖3.1 費希爾方法對學業(yè)困難學生判別的圖形表示
模型中各個參數(shù)值如表3.1所示
表3.1 學業(yè)困難預警模型參數(shù)表
30.09 6.11
0.062 7.18×10-3
2.32×104 ? ? ? ? ? ? -6.11×102
-6.11×102 ? ? ? ? ? ? 3.09×104 3.44×10-2
四、模型應用
預警模型的應用可基于前期搭建的移動智能學生工作平臺。該平臺包括基于微信的手機端前臺,基于web服務器技術(shù)的管理后臺。前臺用于實現(xiàn)功能和應用,獲取用戶信息;后臺將獲取的信息進行分析和統(tǒng)計,顯示結(jié)果并向前臺發(fā)送指令和消息。平臺結(jié)合互聯(lián)網(wǎng)云存儲技術(shù),采集并保存學生海量的日常行為數(shù)據(jù)。平臺能夠階段性的分析其他模塊采集到的學生行為信息,周期性的對全體學生進行觀測值的進行計算。若學生觀測值發(fā)生變化,被分為學業(yè)困難風險群體,及時送到輔導員的微信端進行預警。數(shù)據(jù)挖掘流程如圖4-1所示。
五、結(jié)論
本文以2016屆飛行器動力工程學生的全樣本數(shù)據(jù)作為訓練樣本,利用費希爾線性判別法(FLD),建立了學業(yè)困難預警模型。模型具有一定的分離度和判斷精度。使面臨學業(yè)困難危機的學生群體能夠在龐大的學生群體中及時被發(fā)現(xiàn),并受到關(guān)注和幫扶。
圖4-1數(shù)據(jù)挖掘流程圖
本文的創(chuàng)新點在于:將大數(shù)據(jù)分析、數(shù)據(jù)挖掘技術(shù)——費希爾線性判別法(FLD)應用于學生工作領域,提升高校學風推動的工作成效;本項目成果模型將結(jié)合移動互聯(lián)網(wǎng)和云存儲技術(shù),將結(jié)論模型應用于移動智能學生工作平臺中,實現(xiàn)資源的整合和優(yōu)化,完成了學業(yè)預警工作的閉環(huán)。
本文的不足之處在于:學生的行為數(shù)據(jù)類別仍然有待擴充,由于客觀原因無法加入學生消費數(shù)據(jù)和網(wǎng)絡訪問記錄。為提高模型精度,后期有待擴充,進行深入研究。
參考文獻:
[1] Kirk,S.A.,Bateman,B.D.Diagnosisandremediation of learning disabilities. [J].Exceptional Children1962(2).
[2] Dombrowski S. C, Kamphaus R. W, Reynolds C R. After the demise of the discrepancy: proposed learning disabilities diagnostic criteria.Professional Psychology:Research and Practice, 2004, 35( 4): 364 -372.
[3] Douglas Fuchs,Devery Mock, Pual L. Morgan, Caresa L. Young. Responsiveness-to Intervention:Definitions, Evidence, and Implications for the Learning Disabilities Construct[J]. Learning Disabilities Research & Practice. 2003(3).
[4] (美)安妮·瑪麗·弗朗西斯科(AnneMarieFrancesco),(美)巴里·艾倫·戈爾德(BarryAllenGold)著,顧寶炎等譯.國際組織行為學[M]. 中國人民大學出版社, 2003.
[5] Fisher, R. A. “The Use of Multiple Measurements in Taxonomic Problems.”[J] Annals of Eugenics, 7(1936):179-188.
[6] Fisher, R. A. “The Statistical Utilization of Multiple Measurements.”[J] Annals of Eugenics, 8(1938):376-386.