勝獻(xiàn)利
(河南大學(xué) 濮陽工學(xué)院, 河南 濮陽 457000)
高校學(xué)生資助具有公益性、選擇性、幫扶性,因此選拔資助對象時(shí)需要保證公平、公正和公開。在現(xiàn)實(shí)工作實(shí)踐中,由于人的認(rèn)知能力有限,高校學(xué)生資助工作運(yùn)行得并非一帆風(fēng)順,時(shí)常遇到各類型因素影響和阻礙學(xué)生資助工作,在學(xué)生家庭情況調(diào)研、貧困生等級認(rèn)定和過程性評價(jià)時(shí)均存在一定問題[1]。由于學(xué)生家庭調(diào)研成本較高,因此尚無高校采用家庭訪談形式開展貧困學(xué)生實(shí)際情況調(diào)查工作,籠統(tǒng)地要求貧困生填寫家庭情況調(diào)查表,由生源地的鄉(xiāng)村街道辦事處或民政局加蓋公章。但以此種方式認(rèn)定的貧困生真實(shí)情況得不到確認(rèn)。即便有些學(xué)生通過抽樣調(diào)查方式,由于成本高、覆蓋面窄等情況也無法起到應(yīng)有的效果。隨著家庭調(diào)研方式的改革,一些學(xué)校認(rèn)定貧困生時(shí)開始綜合考慮日常因素,比如學(xué)生的一卡通消費(fèi)、日常的穿著打扮、手機(jī)電腦品牌價(jià)格等,但是由于這些數(shù)據(jù)斷斷續(xù)續(xù),所以收效甚微。部分學(xué)校別出心裁地采取一些方法,比如讓學(xué)生自己拍攝家庭生活視頻照片資料、提供死亡證明、低保證、殘疾證等,公開實(shí)施“比慘大賽”,既影響了學(xué)生的心理健康,又讓本是扶危救困的學(xué)生資助政策在大學(xué)生中產(chǎn)生不良影響。學(xué)生困難等級認(rèn)定也較為困難,由于學(xué)生家庭數(shù)據(jù)采集不準(zhǔn)確,生活水平不能準(zhǔn)確判定,因此無法準(zhǔn)確地認(rèn)定學(xué)生困難等級,學(xué)生資助無法準(zhǔn)確實(shí)施[2]。學(xué)生生活狀況評定完成之后就固定不變,影響資助政策的有效實(shí)施。學(xué)生資助過程性管理弱,許多學(xué)校采用年度審核制度,每年的評價(jià)方式都一成不變,因此學(xué)生資助評價(jià)固化滯后,無法反映多變的貧困生活狀況,影響學(xué)生受資助的情況。大學(xué)生學(xué)習(xí)和成長過程中,學(xué)生資助是一個(gè)剛性支出,需要給予足夠的關(guān)注,但是這些剛性支出已經(jīng)成為學(xué)生評價(jià)的生活瓶頸,如果不使用動態(tài)的評估過程就無法適應(yīng)學(xué)生資助模式[3]。
目前,隨著人工智能、深度學(xué)習(xí)、云計(jì)算、互聯(lián)網(wǎng)等技術(shù)的發(fā)展,公安、民政、銀行、高校等機(jī)構(gòu)已經(jīng)開發(fā)了自動化軟件,積累了大量的數(shù)據(jù)資源,覆蓋了每一個(gè)家庭,因此可以利用深度學(xué)習(xí)構(gòu)建一個(gè)關(guān)聯(lián)分析模式,將多個(gè)部門的數(shù)據(jù)整合在一起,分析學(xué)生家庭經(jīng)濟(jì)生活狀態(tài),從而準(zhǔn)確判定大學(xué)生資助情況,動態(tài)管理大學(xué)生資助過程。
深度學(xué)習(xí)算法是一種先進(jìn)的前饋型人工神經(jīng)網(wǎng)絡(luò),其包括兩個(gè)卷積層,分別是特征提取層和特征映射層[4]。特征提取層的輸入神經(jīng)元與前一層局部連接,可以提取局部特征,確定特征與特征位置關(guān)系。特征映射層將特征映射到一個(gè)平面上,每一個(gè)平面上的神經(jīng)元擁有相同的權(quán)值[5]。卷積神經(jīng)網(wǎng)絡(luò)利用Sigmoid函數(shù)作為激活函數(shù),使得特征及其映射具有位移不變性,從而大幅度減少設(shè)置的自有參數(shù)數(shù)量[6]。深度學(xué)習(xí)概念源于人工神經(jīng)網(wǎng)絡(luò),是一種包含多個(gè)隱藏層的深度學(xué)習(xí)結(jié)構(gòu),能夠通過組合底層特征形成更加抽象的高層類別或特征,以便發(fā)現(xiàn)數(shù)據(jù)的分布式特征表示[7]。深度指的是神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)得到的函數(shù)中非線性運(yùn)算組合水平的數(shù)量,當(dāng)前神經(jīng)網(wǎng)絡(luò)多是較低水平的網(wǎng)絡(luò)結(jié)構(gòu),比如1個(gè)輸入層、1個(gè)隱藏層和1個(gè)輸出層。深度學(xué)習(xí)則是非線性運(yùn)算組合水平較高的神經(jīng)網(wǎng)絡(luò),比如1個(gè)輸入層、3個(gè)隱藏層和1個(gè)輸出層[8]。深度學(xué)習(xí)可以表示高階抽象概念的復(fù)雜函數(shù),解決目標(biāo)識別、語音感知和語言理解等人工智能相關(guān)的任務(wù)。研發(fā)發(fā)現(xiàn):可以使用多種方式描述深度學(xué)習(xí)的觀測值,比如特征向量、輪廓區(qū)域等,更容易從海量數(shù)據(jù)中進(jìn)行實(shí)例學(xué)習(xí),生成一個(gè)準(zhǔn)確的網(wǎng)絡(luò)結(jié)構(gòu),提高機(jī)器學(xué)習(xí)的準(zhǔn)確度[9-10]。
深度學(xué)習(xí)經(jīng)過多年研究,已經(jīng)得到了極大的改進(jìn),引入了形狀建模[11]、模糊數(shù)學(xué)、因子分析、信息論等技術(shù),準(zhǔn)確度和魯棒性均有提升。深度學(xué)習(xí)利用形狀建模技術(shù),可以提高圖像識別、特征檢測的準(zhǔn)確度,進(jìn)一步提高圖像處理和識別的有效性。深度學(xué)習(xí)可以利用模糊數(shù)學(xué)和因子分析技術(shù),強(qiáng)化卷積神經(jīng)網(wǎng)絡(luò)求解空間的啟發(fā)式規(guī)則,提高深度學(xué)習(xí)的處理速度和效率。利用信息論等技術(shù),深度學(xué)習(xí)可提高數(shù)據(jù)度量的有效性,進(jìn)一步提高數(shù)據(jù)相似性度量準(zhǔn)確度。目前,深度學(xué)習(xí)已經(jīng)在很多領(lǐng)域取得了顯著的應(yīng)用成效,比如置信神經(jīng)網(wǎng)絡(luò)等,同時(shí)也廣泛應(yīng)用于圖像識別[12]、語音識別[13]、基因識別、視覺導(dǎo)航等領(lǐng)域,并吸引了谷歌、百度、騰訊、微軟、阿里巴巴、英特爾等公司的關(guān)注,獲得了越來越多的研究成果[14]。
大學(xué)生資助管理利用深度學(xué)習(xí)可以實(shí)現(xiàn)精準(zhǔn)化、動態(tài)化、實(shí)時(shí)化、共享化和智能化管理模式,以適應(yīng)高等教育改革的發(fā)展需要,促進(jìn)各地區(qū)發(fā)展,滿足大學(xué)生成長成才的需求。深度學(xué)習(xí)在大學(xué)生資助管理模式中的應(yīng)用架構(gòu)如圖1所示。
大學(xué)生資助管理模式采集的數(shù)據(jù)來源于公安、民政、銀行和高校。利用先進(jìn)的企業(yè)服務(wù)總線技術(shù),可從多個(gè)源頭獲取數(shù)據(jù)信息,這些數(shù)據(jù)包括家庭生活數(shù)據(jù)、民政生活數(shù)據(jù)、高校生活數(shù)據(jù)、銀行存貸數(shù)據(jù)等。利用先進(jìn)的深度學(xué)習(xí)技術(shù),針對抓取的數(shù)據(jù)進(jìn)行模式分析,實(shí)現(xiàn)學(xué)生家庭經(jīng)濟(jì)標(biāo)準(zhǔn)評估、學(xué)生貸款使用跟蹤、學(xué)生信用追蹤評估,這樣就可以動態(tài)、靈活地增強(qiáng)大學(xué)生資助管理能力?;谏疃葘W(xué)習(xí)的大學(xué)生資助管理模式業(yè)務(wù)處理流程如下:
圖1 大學(xué)生資助管理模式
1) 數(shù)據(jù)采集。從公安、民政、銀行和高校等機(jī)構(gòu)的分布式管理系統(tǒng)采集數(shù)據(jù),這些數(shù)據(jù)覆蓋了學(xué)生家庭的經(jīng)濟(jì)收入、工作職業(yè)、存貸信用、資助記錄、學(xué)習(xí)成績等。然后針對這些數(shù)據(jù)進(jìn)行處理,實(shí)現(xiàn)數(shù)據(jù)的連接、融合,將其存儲到大學(xué)生資助管理數(shù)據(jù)庫中。
2) 信息數(shù)據(jù)整合。使用歸一化工具處理采集到的所有數(shù)據(jù),刪除稀疏數(shù)據(jù)和噪聲數(shù)據(jù),然后生成一個(gè)數(shù)據(jù)集。該數(shù)據(jù)集中包含600萬條大學(xué)生數(shù)據(jù),數(shù)據(jù)的屬性包括個(gè)人信息、學(xué)習(xí)成績、家庭信息、金融銀行存貸信息等,然后形成一個(gè)數(shù)據(jù)矩陣。
3) 深度學(xué)習(xí)算法挖掘分析。在大學(xué)生資助管理模式構(gòu)建和分析時(shí),本文使用ReLU激活函數(shù)加快深度學(xué)習(xí)算法的收斂速度,減少卷積神經(jīng)網(wǎng)絡(luò)設(shè)置參數(shù)。卷積層Conv1由20個(gè)4×4的卷積核與輸入數(shù)據(jù)進(jìn)行卷積,卷積步長為2,得到20個(gè)13×13的特征數(shù)據(jù);卷積層Conv2的卷積核大小為3×3,卷積步長為2,卷積后得到50個(gè)6×6的特征數(shù)據(jù);卷積層Conv3的卷積核大小為3×3,卷積步長為1,卷積后生成60個(gè)4×4的特征數(shù)據(jù);池化層步長為2,采樣后可以獲取80個(gè)2×2的特征數(shù)據(jù);全連接層1神經(jīng)元個(gè)數(shù)為100;全連接層2的神經(jīng)元個(gè)數(shù)為10。Conv1、Conv2、Conv3、池化層1、全連接層1的激活函數(shù)均為ReLU函數(shù),全連接層2的激活函數(shù)為sigmoid激活函數(shù)。
大學(xué)生資助管理模式采用深度學(xué)習(xí)作為數(shù)據(jù)挖掘算法,這樣就可以利用大數(shù)據(jù)分析技術(shù),提高大學(xué)生經(jīng)濟(jì)生活狀況的評估準(zhǔn)確度。本文為了能夠更好地分析深度學(xué)習(xí)的應(yīng)用效果,對其進(jìn)行了實(shí)驗(yàn)驗(yàn)證。實(shí)驗(yàn)環(huán)境:實(shí)驗(yàn)平臺的軟件操作系統(tǒng)為Windows7,編譯軟件采用Matlab10.1軟件,編程使用的語音為Matlab語言,硬件采用Intel 第8代 酷睿 i5-8300H 2.3 GHz,內(nèi)存為4G。
采集了600萬條大學(xué)生資助數(shù)據(jù),數(shù)據(jù)的類別包括重點(diǎn)貧困、中度貧困和一般貧困,每一個(gè)類別包括200萬條數(shù)據(jù)。類別是指具有相同貧困程度的學(xué)生信息集合,具有類似的結(jié)構(gòu)。數(shù)據(jù)集合中單個(gè)對象之間的相似性非常高,但是類別之間的非相似性很高。本文將這些數(shù)據(jù)混合在一起,構(gòu)建了低維度數(shù)據(jù)集和高維度數(shù)據(jù)集。
1) 低維度數(shù)據(jù)集。低維度數(shù)據(jù)集經(jīng)過預(yù)處理后,保護(hù)20個(gè)關(guān)鍵屬性,利用這些屬性的共享對數(shù)據(jù)進(jìn)行排序和篩選,分成3個(gè)子數(shù)據(jù)集?;谶@些數(shù)據(jù)集進(jìn)行實(shí)驗(yàn),低維度數(shù)據(jù)集類別如表1所示。
表1 低維度數(shù)據(jù)集類別
2) 高維度數(shù)據(jù)集。高維度數(shù)據(jù)集經(jīng)過預(yù)處理后,包含100個(gè)關(guān)鍵屬性,利用這些屬性的共享對數(shù)據(jù)進(jìn)行排序和篩選,分成3個(gè)子數(shù)據(jù)集。基于這些數(shù)據(jù)集進(jìn)行實(shí)驗(yàn),高維度數(shù)據(jù)集類別如表2所示。
表2 高維度數(shù)據(jù)集類別
為了驗(yàn)證深度學(xué)習(xí)算法的有效性,同時(shí)引入了關(guān)聯(lián)規(guī)則算法、K-means算法,在同樣的實(shí)驗(yàn)環(huán)境進(jìn)行操作和分析。本文指定每一個(gè)數(shù)據(jù)集的真實(shí)歸類,以便更好地驗(yàn)證算法運(yùn)行的準(zhǔn)確度[11]。算法實(shí)驗(yàn)過程中,本文針對算法實(shí)驗(yàn)效果進(jìn)行準(zhǔn)確評估,使用準(zhǔn)確度評估每一個(gè)算法執(zhí)行結(jié)果的可靠度。正確率標(biāo)準(zhǔn)規(guī)定第i個(gè)簇的類標(biāo)是由該簇中最多數(shù)對象的類標(biāo)決定,并統(tǒng)計(jì)這些對象的個(gè)數(shù)為n,共有k個(gè)簇。算法準(zhǔn)確度計(jì)算公式如式(1)所示。
(1)
其中:T描述劃分好的數(shù)據(jù)簇;C表示數(shù)據(jù)集中的真實(shí)的類標(biāo)號;A1(c,T)表示屬于真實(shí)類別C的數(shù)據(jù)準(zhǔn)確地劃分到簇T中的數(shù)量;A2(c,T)表示屬于真實(shí)類別C但是錯(cuò)誤地劃分到簇T中的數(shù)據(jù)對象數(shù)量。聚類結(jié)果的正確率越高,代表聚類質(zhì)量越佳。
1)低維度數(shù)據(jù)實(shí)驗(yàn)結(jié)果。關(guān)聯(lián)規(guī)則算法、K-means算法和深度學(xué)習(xí)算法的實(shí)驗(yàn)環(huán)境完全相同。在同樣的實(shí)驗(yàn)環(huán)境下進(jìn)行實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果顯示深度學(xué)習(xí)算法的準(zhǔn)確度較高,能夠分析不同學(xué)生貧困的類型,準(zhǔn)確定位這些學(xué)生的資助檔次。將深度學(xué)習(xí)算法接入大學(xué)生資助管理系統(tǒng)中,可準(zhǔn)確地根據(jù)學(xué)生的實(shí)際貧困需求進(jìn)行分析,準(zhǔn)確度達(dá)到了98.51%,提高了大學(xué)生資助管理的有效性。低維度數(shù)據(jù)實(shí)驗(yàn)結(jié)果準(zhǔn)確度對比如表3所示。
表3 低維度數(shù)據(jù)實(shí)驗(yàn)結(jié)果準(zhǔn)確度對比 %
在上述6個(gè)數(shù)據(jù)集上,當(dāng)數(shù)據(jù)集的類別較少時(shí),低維數(shù)據(jù)實(shí)驗(yàn)結(jié)果的準(zhǔn)確度達(dá)到了98.51%,遠(yuǎn)高于傳統(tǒng)的關(guān)聯(lián)規(guī)則算法和K-Means推薦算法。因此可以獲知,如果高校的某個(gè)貧困類別的學(xué)生較少時(shí),可以更加精準(zhǔn)地判定學(xué)生的資助檔次,提高低維數(shù)據(jù)分析準(zhǔn)確度,具有重要的作用和意義。
2) 高維數(shù)據(jù)實(shí)驗(yàn)結(jié)果。本文提出的基于深度學(xué)習(xí)算法在分析高維學(xué)生資助數(shù)據(jù)時(shí)也具有很大的優(yōu)勢。在高維數(shù)據(jù)集上進(jìn)行同樣的實(shí)驗(yàn),分析3種算法的實(shí)驗(yàn)結(jié)果,如表4所示。
表4 高維數(shù)據(jù)實(shí)驗(yàn)結(jié)果準(zhǔn)確度對比 %
在高維大學(xué)生資助數(shù)據(jù)分析中,深度學(xué)習(xí)算法準(zhǔn)確度雖然有所降低,但是與關(guān)聯(lián)規(guī)則算法和K-means算法相比,深度學(xué)習(xí)算法依然保持較高的準(zhǔn)確度,說明利用深度學(xué)習(xí)算法可以更好地預(yù)估高維度貧困學(xué)生數(shù)據(jù)資源的內(nèi)部結(jié)構(gòu)。但是由于每一次數(shù)據(jù)簇心的選擇也是隨機(jī)的,因此難免存在一些問題,導(dǎo)致算法的準(zhǔn)確度不穩(wěn)定或降低。比如算法的簇心越多,算法執(zhí)行的準(zhǔn)確度越低。對于兩類數(shù)據(jù)集來講,深度學(xué)習(xí)算法的執(zhí)行準(zhǔn)確度為92.64%,但是在三類數(shù)據(jù)集上算法執(zhí)行準(zhǔn)確度卻下降。這說明深度學(xué)習(xí)算法面對較多的類別時(shí)無法取得最優(yōu)化效果。
與人工判定模式進(jìn)行比較,可突出深度學(xué)習(xí)算法的自動化、高性能、高效率、高準(zhǔn)確度。實(shí)驗(yàn)結(jié)果顯示:大學(xué)生資助管理模式采用深度學(xué)習(xí)的準(zhǔn)確度較高,能夠分析不同學(xué)生家庭經(jīng)濟(jì)生活的類型,準(zhǔn)確地定位這些學(xué)生的貧困程度。將應(yīng)用效果進(jìn)行量化分析,大學(xué)生資助管理模式應(yīng)用準(zhǔn)確度對比如表5所示。
表5 大學(xué)生資助管理模式應(yīng)用準(zhǔn)確度對比 %
家庭經(jīng)濟(jì)標(biāo)準(zhǔn)評估準(zhǔn)確度采用人工管理模式時(shí)為69.17%,利用深度學(xué)習(xí)管理模式時(shí)則達(dá)到了98.14%,提高了28.97%;學(xué)生貸款使用跟蹤準(zhǔn)確度采用人工管理模式時(shí)為63.48%,利用深度學(xué)習(xí)管理模式時(shí)則達(dá)到了97.29%,提高了33.81%;學(xué)生信用追蹤評估準(zhǔn)確度采用人工管理模式時(shí)為64.56%,利用深度學(xué)習(xí)管理模式時(shí)則達(dá)到了98.51%,提高了33.95%。分析效率方面,人工分析1年1次,比較固定,而利用深度學(xué)習(xí)的結(jié)果則是實(shí)時(shí)的,可以根據(jù)需求隨時(shí)獲取大學(xué)生的資助數(shù)據(jù)。
深度學(xué)習(xí)是一種先進(jìn)的大數(shù)據(jù)分析算法,利用深度學(xué)習(xí)建立大學(xué)生資助管理平臺,可從多個(gè)部門獲取大學(xué)生家庭狀況的數(shù)據(jù),并基于“互聯(lián)網(wǎng)+”創(chuàng)新大學(xué)生資助管理模式整合現(xiàn)有資源提高數(shù)據(jù)利用率,從而進(jìn)一步改進(jìn)大學(xué)生資助成效。