目前,飛行學生(以下簡稱“學生”)培養(yǎng),以中國民用航空飛行學院為例,分為理論學習和分院實訓兩個階段。通過執(zhí)照考試才能進入下一階段訓練,成績高低決定學生下分院排名,目前成績預測,缺乏科學的方法。該文在學生成績預測中引入BP(Back Propagation)神經(jīng)網(wǎng)絡(luò),結(jié)合學生現(xiàn)實表現(xiàn)、部分文化課成績以及高考成績,建立神經(jīng)網(wǎng)絡(luò)評價模型,對學生成績進行預測分析。仿真顯示,該方法能夠得到較為理想的預測結(jié)果,可為學生管理提供可靠的決策指導。
飛行學生 ?成績分析??BP神經(jīng)網(wǎng)絡(luò) ?學生管理
??文獻標識碼:A???文章編號:1672-3791(2022)02(b)-0000-00
LUO Zhongyun
(Civil Aviation Flight University of China,?Guanghan, Sichuan Province,618307?China)
At present, the training of flying students (hereinafter referred to as “students”) takes the Civil Aviation Flight University of China as an example, and is divided into two stages: theoretical study and branch training.Only after passing the license exam can you enter the next stage of training.At present, there is a lack of scientific methods for performance prediction.In this paper, BP neural network is introduced in the prediction of student performance, combined with students' actual performance, some cultural class performance and college entrance examination results, a neural network evaluation model is established to predict and analyze student performance. Experimental results show that this method has high prediction accuracy and provides reliable decision-making guidance for student management.
:Flying student;Score analysis;BP neural network;Student management
隨著移動終端和傳感設(shè)備的全面普及,以及移動互聯(lián)技術(shù)的廣泛應用。各種類型的數(shù)據(jù)充斥著學生的生活和學習。近年來,智慧校園建設(shè)全面推進,學生的生活和學習數(shù)據(jù)都被記錄。這些數(shù)據(jù)與學生成績存在著內(nèi)在聯(lián)系,影響學生的學習成績。因此,眾多教育工作者開始運用數(shù)據(jù)挖掘技術(shù)進行學生教育和管理。
學生管理數(shù)據(jù)挖掘,指運用數(shù)據(jù)挖掘技術(shù),從大量行為數(shù)據(jù)、教學數(shù)據(jù)中提取有效數(shù)據(jù)信息,挖掘數(shù)據(jù)間的內(nèi)在聯(lián)系,并對未知數(shù)據(jù)預測分析的過程。以此,為學生管理者提供科學的管理策略和實踐指導。執(zhí)照成績預測是學生成才管理的重要內(nèi)容之一。
目前,成績分析常用的數(shù)學方法有支持向量機(Support Vector Machine)、BP神經(jīng)網(wǎng)絡(luò)等。支持向量機可利用分類原理將執(zhí)照成績分為通過與不通過兩類。通過模型訓練,得到分類結(jié)果。在實際應用中,學生成績預測相比于分類更具參考價值。該文通過BP神經(jīng)網(wǎng)絡(luò),將學生操行表現(xiàn)、主要科目成績、掛科門次重修門次以及平均績點等主要數(shù)據(jù)作為神經(jīng)網(wǎng)絡(luò)的輸入單元,以學生執(zhí)照考試三科總成績?yōu)槟繕酥?。利用MATLAB自帶的BP神經(jīng)網(wǎng)絡(luò)工具箱,對模型進行訓練,最后得出預測成績,并做誤差分析。
BP神經(jīng)網(wǎng)絡(luò)能夠模仿人腦神經(jīng)元對外部刺激信號的反應過程,基于多層感知器,結(jié)合正向傳播的信號和反向傳播的誤差,能有效建立用于處理非線性信息的智能化網(wǎng)絡(luò)預測。
此種模型的神經(jīng)網(wǎng)絡(luò)得到廣泛應用,在函數(shù)逼近、模型識別分類、數(shù)據(jù)壓縮和時間序列預測等領(lǐng)域應用較為成熟。其包括輸入單元、隱藏單元和輸出單元,其中隱藏單元的層數(shù)可以根據(jù)需求隨意設(shè)計,隱藏單元可以進行信息傳遞和互換,負責信息處置。
S型函數(shù)作為BP神經(jīng)網(wǎng)絡(luò)傳遞函數(shù),通過反向傳遞函數(shù),其中為期望輸出;為網(wǎng)絡(luò)的計算輸出,通過網(wǎng)絡(luò)權(quán)值和閾值的迭代調(diào)節(jié),不斷減小差函數(shù)E值。使網(wǎng)絡(luò)計算輸出無限逼近期望輸出,三層BP網(wǎng)絡(luò)如圖1所示。
首先,數(shù)據(jù)進入輸入單元再經(jīng)過各級隱藏單元,根據(jù)神經(jīng)元間的權(quán)值計算輸出,最終達到輸出單元,通過比較輸出結(jié)果與期望輸出結(jié)果,得到網(wǎng)格誤差,此為正向傳播;其次,根據(jù)網(wǎng)絡(luò)誤差,從輸出單元開始,到隱藏單元和輸入單元,逐級按照梯度下降方法調(diào)整權(quán)值,這個過程稱為權(quán)值反向傳播。通過誤差正向傳播和權(quán)值反向傳播,使誤差和最大學習次數(shù)達到預設(shè)值,輸出結(jié)果。
以三層神經(jīng)網(wǎng)絡(luò)為例,輸入單元、隱藏單元和輸出單元的神經(jīng)元個數(shù)分別為、、,則隱藏單元第個神經(jīng)元輸出如下:
式(1)中,為隱藏單元激活函數(shù);為隱藏單元第個神經(jīng)元門限;為第個輸入單元的輸入;為隱藏單元第個神經(jīng)元與輸入單元第個神經(jīng)元的權(quán)值。輸出單元第個神經(jīng)元可表示為:
式(2)中,為輸出單元激活函數(shù);為輸出單元第個神經(jīng)元的門限;為隱藏單元第個神經(jīng)元與輸入單元第個神經(jīng)元的權(quán)值。反向傳播過程第個神經(jīng)元與期望輸出之間的誤差可表示為:
式(3)中,為輸出層第個神經(jīng)元期望輸出值。
該文數(shù)據(jù)集是來自飛行技術(shù)專業(yè)某學生中隊,2017級學生部分學習成績數(shù)據(jù)及操行表現(xiàn)數(shù)據(jù)??紤]到執(zhí)照考試知識點與主要課程的關(guān)聯(lián)程度,該研究選取飛行原理、飛行性能以及飛機電子電氣系統(tǒng)等主要課程作為神經(jīng)元輸入,剔除一些對執(zhí)照考試影響較小的課程數(shù)據(jù)。飛行學生在整個養(yǎng)成階段,操行分數(shù)間接反映學生學習生活方面的態(tài)度,平均績點則反應學生整個過程的綜合水平。因此,以上兩類數(shù)據(jù)也作為神經(jīng)元輸入數(shù)據(jù)。而飛行學生私照、商照及儀表三門執(zhí)照考試總成績作為模型的期望輸出。輸入數(shù)據(jù)如表1所示。
此外,學生個體差異大,自由度高,影響飛行學生執(zhí)照成績因素很多。例如晚上就寢時間、圖書館自習時間等。這些數(shù)據(jù)中,某些對執(zhí)照成績影響較小,如果都考慮作為輸入,必然會影響模型執(zhí)行效率。
模型構(gòu)建主要包括以下3個階段:輸入、處理和輸出。處理包括歸一化處理,確定輸入、輸出、隱藏單元,設(shè)置訓練參數(shù),創(chuàng)建BP網(wǎng)絡(luò)模型,調(diào)用函數(shù)等。輸出包括訓練樣本和測試樣本的輸出,如果測試樣本的輸出符合訓練樣本的預期則學習結(jié)束,如果不符合訓練樣本的預期,則再次學習,調(diào)整閾值,直到符合預期為止。模型構(gòu)建流程如圖2所示。
實驗環(huán)境采用MATLAB,是一種集數(shù)值分析、數(shù)據(jù)可視化、矩陣計算以及非線性動態(tài)建模的高級技術(shù)計算語言和交互式環(huán)境。預測仿真實驗使用R2017a版本MATLAB自帶的BP神經(jīng)網(wǎng)絡(luò)工具箱實驗測試。該工具箱包括了很多種神經(jīng)網(wǎng)絡(luò)的初始化和訓練。BP神經(jīng)網(wǎng)絡(luò)的實現(xiàn)過程包括:輸入樣本至神經(jīng)元產(chǎn)生輸出值、計算輸出誤差將誤差反向傳遞、得到閾值和權(quán)重值、循環(huán)迭代誤直到差達標訓練終止。
預測模型的具體實現(xiàn)步驟如下。
(1)將樣本數(shù)據(jù)輸入網(wǎng)絡(luò),設(shè)定網(wǎng)絡(luò)參數(shù),隱藏單元神經(jīng)元數(shù)初設(shè)為10,網(wǎng)絡(luò)迭代次數(shù)為1?000次,?期望誤差為0.000 000 01,?學習速率為0.01。
(2)實驗數(shù)據(jù)來源于某高校飛行學生332組學生的成績數(shù)據(jù),其中299組作為訓練樣本,33組作為測試樣本。
(3)訓練樣本按照0.7、0.15、0.15比例隨機設(shè)置訓練集、驗證集和測試集對網(wǎng)絡(luò)進行訓練。
期望輸出值和預測輸出值的相關(guān)度如圖3所示。
根據(jù)圖3數(shù)據(jù)可知,橫坐標為樣本期望輸出值,縱坐標為模型預測輸出值。相關(guān)度系數(shù)用表示,若越接近1,則表示線性化程度越高,預測效果越好。網(wǎng)絡(luò)訓練結(jié)果得出訓練集訓練數(shù)據(jù)、驗證數(shù)據(jù)、測試數(shù)據(jù)的相關(guān)系數(shù)分別為0.95、0.92、0.84,整體相關(guān)系數(shù)為0.93,具有較高的線性化程度。
神經(jīng)網(wǎng)絡(luò)工具箱,運行代碼后,可以在工作區(qū)得到訓練出的網(wǎng)絡(luò)net,輸入代碼,利用訓練好的神經(jīng)網(wǎng)絡(luò)進行數(shù)據(jù)預測。網(wǎng)絡(luò)訓練主要代碼如下。
x = data1';t = data2';
trainFcn = 'trainlm'; ?hiddenLayerSize = 10;
net = fitnet(hiddenLayerSize,trainFcn);
net.divideParam.trainRatio = 70/100;
net.divideParam.valRatio = 15/100;
net.divideParam.testRatio = 15/100;
[net,tr] = train(net,x,t);
y = net(x);e = gsubtract(t,y);
performance = perform(net,t,y)
view(net)
利用訓練好的網(wǎng)絡(luò),對測試集33組飛行學生成績進行預測,目標值與預測值相關(guān)系數(shù)=0.97,具有較高的線性化程度,能夠達到理想的預測結(jié)果。測試集目標值和預測值的相關(guān)度如圖4所示。
目標值與預測值誤差直方圖如圖5所示。
從圖5所示誤差可以得出如下結(jié)論:絕大部分測試集樣本誤差集中在-5.5~+5.5分之間,極少數(shù)樣本誤差達到-8、+8區(qū)間以外。對于總分300分的執(zhí)照考試成績而言,整體預測效果較為理想,能夠達到預測指導目的。
該文在構(gòu)建模型時,利用學生管理經(jīng)驗,剔除噪聲數(shù)據(jù),這種數(shù)據(jù)處理方式存在較大的人為因素。其次在模型構(gòu)建時,未對數(shù)據(jù)進行PCA降維預處理,因此,模型的訓練及預測效率較低。在后期的研究中,首先對數(shù)據(jù)進行關(guān)聯(lián)分析,得到有效輸入數(shù)據(jù)。其次需擴大輸入樣本范圍,該文在構(gòu)建飛行學生成績預測模型的過程中,僅采用單一年級小樣本數(shù)據(jù),不具備一般性,在后期的數(shù)據(jù)搜集過程中,要盡量對飛行學生進行全覆蓋。同時,在特征數(shù)據(jù)上盡量加入對執(zhí)照成績有較大影響的數(shù)據(jù),例如:學生的自習時長,作息規(guī)律性等量化數(shù)據(jù)。該文執(zhí)照成績預測得到較為理想的預測結(jié)果,為學管工作者日常管理科學的決策指導。綜上,在學生日常管理過程中,不僅要對學生做好思想政治教育,還要善于搜集學生日常數(shù)據(jù),挖掘數(shù)據(jù)內(nèi)在規(guī)律,助力學生科學管理。
[1] 馬高,劉康.基于BP神經(jīng)網(wǎng)絡(luò)CFRP約束混凝土抗壓強度預測[J].湖南大學學報:自然科學版,2021,48(9):88-97.
[2] 王偉,代紅,趙斯祺.基于特征優(yōu)化和BP神經(jīng)網(wǎng)絡(luò)的入侵檢測方法[J].計算機工程與設(shè)計,2021,42(10):2755-2761.
[3] 張彥榮.基于改進灰色神經(jīng)網(wǎng)絡(luò)的學生體育成績預測[J].電子測量技術(shù),2019,42(22):86-90.
[4]?鄭秀月.基于BP神經(jīng)網(wǎng)絡(luò)的校園網(wǎng)絡(luò)輿情危機預警研究[J].齊齊哈爾大學學報:自然科學版,2021,37(6):14-16,20.
[5] 溫正. MATLAB科學計算[M].北京:清華大學出版社, 2017.
[6] 趙夢娜. 基于SVM和BP神經(jīng)網(wǎng)絡(luò)的量化策略研究[D].大連:大連理工大學,2021.
:中國民用航空飛行學院青年基金《大數(shù)據(jù)背景下飛行學生管理方法研究》(項目編號:XJ2021016101)。
羅忠運(1988—),男,碩士,研究實習員,研究方向為高校學生思政教育及學生管理。