婁顏超
摘要:鑒于目前高校貧困生認(rèn)定工作的重要性,針對資助過程中存在的認(rèn)定困難等問題,在梳理影響高校貧困生認(rèn)定工作的基礎(chǔ)上,提出采用 LVQ 神經(jīng)網(wǎng)絡(luò)建立高校貧困生認(rèn)定模型。通過訓(xùn)練、測試,驗證了 LVQ 神經(jīng)網(wǎng)絡(luò)能夠有效應(yīng)用于高校貧困生認(rèn)定,以期為基于神經(jīng)網(wǎng)絡(luò)與貧困生認(rèn)定的實踐與研究提供借鑒,將精準(zhǔn)資助落到實處,為形成更加完善、可靠的學(xué)生資助工作體系提供技術(shù)支持。
關(guān)鍵詞:高校貧困生認(rèn)定;LVQ神經(jīng)網(wǎng)絡(luò);精準(zhǔn)資助
中圖分類號:G647 ????文獻(xiàn)標(biāo)識碼:A
黨和國家始終堅持教育事業(yè)優(yōu)先發(fā)展,高校也逐步不斷建立健全資助體系,學(xué)生資助推動了我國教育事業(yè)快速發(fā)展,而且在人力資源開發(fā)、扶貧脫貧等方面發(fā)揮了重要作用,取得了顯著成效。
精準(zhǔn)資助的本質(zhì)是要明確地劃分資助的等級,并對不同等級給予不同的資助,通過更加科學(xué)的程序,從而有效達(dá)到精準(zhǔn)資助的目的。因此,有必要建立準(zhǔn)確高效的貧困認(rèn)定系統(tǒng),確定家庭經(jīng)濟困難學(xué)生的認(rèn)定標(biāo)準(zhǔn)和資助檔次。
1高校資助困境
高校在推進學(xué)生資助工作取得成效的同時,依然存在分配不均、實施力度不強等現(xiàn)象。
(1)高校資助模式有待改進。由于資助摸排范圍受限、資助力度有限、資助形式單一、材料的真實性等諸多因素所帶來的局限性,都給高校貧困生認(rèn)定增加了困難,導(dǎo)致無法真實反映家庭經(jīng)濟困難學(xué)生的實際訴求。
(2)由于高校貧困資助采用生源地—輔導(dǎo)員—班級為主線的主觀評定程序,缺乏客觀量化標(biāo)準(zhǔn),導(dǎo)致認(rèn)定結(jié)果不準(zhǔn)確。因此,如何依托現(xiàn)代信息技術(shù)構(gòu)建認(rèn)定管理系統(tǒng)十分重要。
(3)貧困生數(shù)據(jù)更新不及時,缺乏對數(shù)據(jù)資源的實時性和動態(tài)性管理。認(rèn)定工作的預(yù)判要依賴數(shù)據(jù)更新、分析以及反饋所形成的完整資助過程,以便保持與資助工作的前置性相契合。
2建立高校貧困生認(rèn)定評價指標(biāo)
精準(zhǔn)認(rèn)定家庭經(jīng)濟困難學(xué)生是資助工作的首要環(huán)節(jié)。按照高校家庭經(jīng)濟困難學(xué)生認(rèn)定標(biāo)準(zhǔn),參照生源地、家庭情況、學(xué)生個人量化以及民主測評4項指標(biāo),所包含若干不同認(rèn)定參考內(nèi)容,將貧困生分為五個等級:特困學(xué)生、困難學(xué)生、一般困難學(xué)生、特殊困難學(xué)生以及非貧困學(xué)生。可以通過學(xué)生登錄系統(tǒng),提交個人相關(guān)信息,建立貧困資源數(shù)據(jù)庫,該數(shù)據(jù)庫中包含的大量知識規(guī)則用于通過神經(jīng)網(wǎng)絡(luò)對樣本信息進行訓(xùn)練,最后根據(jù)各個因素的影響程度來決定貧困生等級評定。
3基于 LVQ神經(jīng)網(wǎng)絡(luò)的貧困生認(rèn)定模型
人工神經(jīng)網(wǎng)絡(luò)是采用電子器件實現(xiàn)或通過軟件在計算機上模擬,可以具備生物神經(jīng)系統(tǒng)的某種特殊功能。同時,人工神經(jīng)網(wǎng)絡(luò)是由大量處理單元并行連接而構(gòu)成的信息處理系統(tǒng),具有自組織、自學(xué)習(xí)以及泛化推廣能力。鑒于高校貧困生認(rèn)定方法存在局限性,本文以神經(jīng)網(wǎng)絡(luò)為技術(shù)依托,建立簡單、高預(yù)測率的高校貧困生認(rèn)定模型。
3.1學(xué)習(xí)向量量化神經(jīng)網(wǎng)絡(luò)
學(xué)習(xí)向量量化(Learning Vector ?Quantization,LVQ)神經(jīng)網(wǎng)絡(luò)屬于前向有監(jiān)督神經(jīng)網(wǎng)絡(luò)類型,是一種基于統(tǒng)計分布的自適應(yīng)數(shù)據(jù)分類思想,可以通過競爭性的競爭層(隱含層)實現(xiàn)函數(shù)傳遞,廣泛應(yīng)用于模式識別和故障診斷等領(lǐng)域。
LVQ神經(jīng)網(wǎng)絡(luò)由輸入層、競爭層與線性輸出層三個神經(jīng)元構(gòu)成,其網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。其中,輸入層和競爭層之間為完全連接,每個輸出層神經(jīng)元與競爭層神經(jīng)元的不同組相連接。競爭層神經(jīng)元個數(shù)總是大于線性輸出層神經(jīng)元個數(shù),競爭層與輸出層神經(jīng)元之間的連接權(quán)值固定為1。但是每個線性輸出層神經(jīng)元能夠與多個競爭層神經(jīng)元相連接。注意:競爭層神經(jīng)元和線性輸出層神經(jīng)元的值只能為1或0。在網(wǎng)絡(luò)訓(xùn)練過程中,輸入層和競爭層神經(jīng)元間的權(quán)值將被修改,即當(dāng)某個輸入模式被送至網(wǎng)絡(luò)時,與輸入模式距離最近的競爭層神經(jīng)元被激活而贏得競爭,其狀態(tài)變?yōu)椤?”,但其它競爭層神經(jīng)元的狀態(tài)均為“0”。因此,與被激活神經(jīng)元相連接的輸出神經(jīng)元也發(fā)出“1”,而其它線性輸出層神經(jīng)元狀態(tài)均為“0”。
其中,p為輸入層神經(jīng)元個數(shù),s1為競爭層神經(jīng)元數(shù),和分別為競爭層神經(jīng)元的輸入與輸出。和分別為線性輸出層神經(jīng)元的輸入與輸出。為輸入層與競爭層間的連接權(quán)系數(shù)矩陣,為競爭層與線性輸出層間的連接權(quán)系數(shù)矩陣。
3.2 LVQ2算法
LVQ2算法通常被用來劃分相似類別的混疊邊界,使得不同類別的判斷趨近于Bayes判決。該算法的具體步驟為:
步驟1:對輸入層和競爭層之間的權(quán)值以及學(xué)習(xí)率進行初始化。
步驟2:將訓(xùn)練樣本作為輸入向量送入輸入層,計算競爭層與輸入向量之間的距離:
其中,為輸入層到競爭層之間的權(quán)值。
步驟3:選擇與輸入向量距離最小的兩個競爭層神經(jīng)元。
步驟4:如果神經(jīng)元 ,滿足以下兩個條件:
(1)神經(jīng)元和的標(biāo)簽類別分別記為和;
(2)神經(jīng)元和與當(dāng)前輸入向量的距離和滿足:
其中,為輸入向量可能落進的接近于兩個向量中段平面的窗口寬度,通常取2/3左右。則有
(1)如果神經(jīng)元i對應(yīng)的類別與輸入向量對應(yīng)的類別相同,即,則神經(jīng)元i和j的權(quán)值采用下面方法進行調(diào)整:
(2)如果神經(jīng)元對應(yīng)的類別與輸入向量對應(yīng)的類別相同,即,則神經(jīng)元和的權(quán)值采用下面方法進行調(diào)整:
步驟5:如果神經(jīng)元和神經(jīng)元 不滿足步驟4中所提到的條件,則只需采用下列公式更新距離輸入向量最近的神經(jīng)元權(quán)值:
3.3建立基于 LVQ神經(jīng)網(wǎng)絡(luò)的貧困生認(rèn)定模型
3.3.1認(rèn)定模型設(shè)計思路
將采集到的300名貧困學(xué)生數(shù)據(jù)集分為訓(xùn)練集和測試集。其中,隨機選取數(shù)據(jù)集中的280名學(xué)生數(shù)據(jù)作為訓(xùn)練集數(shù)據(jù),剩余的20名學(xué)生數(shù)據(jù)作為測試集數(shù)據(jù)。將訓(xùn)練集作為LVQ神經(jīng)網(wǎng)絡(luò)的輸入,貧困等級作為網(wǎng)絡(luò)的輸出。利用訓(xùn)練集數(shù)據(jù)對設(shè)計的LVQ神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練,通過測試集對訓(xùn)練模型進行驗證,最后對測試結(jié)果進行分析,說明訓(xùn)練模型的有效性。