摘? 要: 由于高校畢業(yè)生就業(yè)率與多種因素相關(guān),具有復(fù)雜的變化規(guī)律,當(dāng)前高校畢業(yè)生就業(yè)率預(yù)測模型存在一定的不足,如與實際值間的偏差大,建模時間長等,為了減少高校畢業(yè)生就業(yè)率預(yù)測誤差,設(shè)計了一種基于混沌分析算法的高校畢業(yè)生就業(yè)率預(yù)測模型。首先,收集高校畢業(yè)生就業(yè)率的歷史數(shù)據(jù),結(jié)合歷史數(shù)據(jù)的隨機(jī)性、混沌性變化特點(diǎn),采用混沌分析算法對歷史數(shù)據(jù)的隨機(jī)性、混沌性變化特點(diǎn)進(jìn)行分析,重構(gòu)高校畢業(yè)生就業(yè)率的歷史數(shù)據(jù);然后,引入當(dāng)前最流行的數(shù)據(jù)挖掘技術(shù)——最小二乘支持向量機(jī)構(gòu)建高校畢業(yè)生就業(yè)率的歷史數(shù)據(jù)模型;最后,在相同平臺上與當(dāng)前經(jīng)典高校畢業(yè)生就業(yè)率預(yù)測模型進(jìn)行對比測試。結(jié)果表明,混沌分析算法的高校畢業(yè)生就業(yè)率預(yù)測值與實際值之間的偏差相當(dāng)小,高校畢業(yè)生就業(yè)率預(yù)測精度超過94%,而經(jīng)典模型的高校畢業(yè)生就業(yè)率預(yù)測精度處于90%左右,同時混沌分析算法減少了高校畢業(yè)生就業(yè)率預(yù)測的建模時間,可以滿足現(xiàn)代高校畢業(yè)生就業(yè)率數(shù)據(jù)向大規(guī)模發(fā)展方向的要求。
關(guān)鍵詞: 畢業(yè)生就業(yè)率; 預(yù)測精度; 數(shù)據(jù)挖掘技術(shù); 經(jīng)典模型; 隨機(jī)性變化特點(diǎn); 混沌分析算法
中圖分類號: TN911.1?34; TP391? ? ? ? ? ? ? ? ? 文獻(xiàn)標(biāo)識碼: A? ? ? ? ? ? ? ? ? ? ?文章編號: 1004?373X(2020)21?0101?05
College graduate employment rate prediction model based on chaos analysis algorithm
ZHANG Yingnan
(Jilin Agricultural University, Changchun 130000, China)
Abstract: For the college graduate employment rate is related with several factors and has complex changing rules, the current prediction model of the college graduate employment rate has some deficiencies, like large deviation from the actual values, long modeling duration, etc. In view of the above, a college graduate employment rate prediction model based on chaos analysis algorithm is designed to reduce the prediction error of the college graduate employment rate. The historical data of the college graduate employment rate are collected. The chaos analysis algorithm is used to analyze the characteristics of randomness and chaos of the historical data for the data reconstruction. And then, the most popular data mining technology named least square support vector machine is introduced for the model of the historical data of college graduate employment rate. Finally, comparative tests are performed on the same platform to compare the proposed model with the current classic employment rate prediction model. The results show that the deviation between the predicted value and the actual value of the college graduate employment rate by the chaos analysis algorithm is quite small, and the prediction accuracy of the college graduate employment rate exceeds 94%, while the prediction accuracy of the classic model is about 90%. At the same time, the chaos analysis algorithm can reduce the modeling duration of the prediction model, which meets the requirements of large?scale development of modern college graduate employment rate data.
Keywords: graduate employment rate; prediction accuracy; data mining technology; classic model; random change characteristics; chaos analysis algorithm
[f(x)=ωTφ(x)+b] (10)
式中[ω]和[b]分別為權(quán)值和偏置量。
基于最小二乘支持向量機(jī)的建模原理,引入松弛變量[ek]弱化高校畢業(yè)生就業(yè)率預(yù)測誤差,這樣可以得到一個如式(11)等價的形式,具體如下:
[minω,b,eJp(ω,e)=12ω2+12γi=1ne2is.t.? ? yi=ωTφ(xi)+b+ei,? i=1,2,…,t]? ? ?(11)
式中[γ]表示正則化參數(shù)。
引入[αi]為拉格朗日乘子,加快高校畢業(yè)生就業(yè)率預(yù)測建模效率,得到的拉格朗日函數(shù)為:
[L(ω,b,e,α)=J(ω,e)-i=1nαi(ωTφ(xi)-b+ei-yi)]? (12)
消去[ω]和[e]后,構(gòu)建矩陣形式,具體為:
[0ITtItΩ+1γItbα=0y]? ? ? ? ?(13)
采用核函數(shù)替代內(nèi)積操作,即[K(xi,xj)=φT(xi)φ(xj)],最小二乘支持向量機(jī)的高校畢業(yè)生就業(yè)率預(yù)測函數(shù)為:
[f(x)=i=1NαiK(x,xi)+b] (14)
1.3? 混沌分析算法的高校畢業(yè)生就業(yè)率預(yù)測步驟
Step1:對具體高校畢業(yè)生就業(yè)率的歷史數(shù)據(jù)進(jìn)行收集,并通過一些專家對數(shù)據(jù)進(jìn)行分析,去掉一些錯誤數(shù)據(jù),并對錯誤數(shù)據(jù)采用平均化方法進(jìn)行補(bǔ)齊。
Step2:采用混沌分析算法中的關(guān)聯(lián)積分確定高校畢業(yè)生就業(yè)率數(shù)據(jù)的嵌入維和時間延遲。
Step3:采用嵌入維和時間延遲對原始高校畢業(yè)生就業(yè)率數(shù)據(jù)進(jìn)行重構(gòu),得到一個多維的高校畢業(yè)生就業(yè)率數(shù)據(jù)。
Step4:根據(jù)一定的比例將多維高校畢業(yè)生就業(yè)率數(shù)據(jù)劃分為訓(xùn)練集和驗證集。
Step5:最小二乘支持向量機(jī)對高校畢業(yè)生就業(yè)率數(shù)據(jù)的訓(xùn)練集進(jìn)行學(xué)習(xí),并通過留一法確定最小二乘支持向量機(jī)的參數(shù),從而建立高校畢業(yè)生就業(yè)率預(yù)測模型。
Step6:采用驗證集對高校畢業(yè)生就業(yè)率預(yù)測模型的性能進(jìn)行分析,如果預(yù)測滿足實際應(yīng)用要求,就可以對未來幾年的高校畢業(yè)生就業(yè)率進(jìn)行預(yù)測,并將預(yù)測結(jié)果提供給高校的相關(guān)部門,為他們決策提供有價值的參考意見。
2? 實例分析
2.1? 高校畢業(yè)生就業(yè)率預(yù)測的分析平臺
為了檢測混沌分析算法的高校畢業(yè)生就業(yè)率預(yù)測效果,需要設(shè)計預(yù)測實驗,本文選擇的測試平臺如表1所示。在相同測試平臺下,選擇當(dāng)前經(jīng)典高校畢業(yè)生就業(yè)率預(yù)測模型進(jìn)行對照測試,它們分別為最小二乘支持向量機(jī)的高校畢業(yè)生就業(yè)率預(yù)測模型(LSSVM)和BP神經(jīng)網(wǎng)絡(luò)高校畢業(yè)生就業(yè)率預(yù)測模型(BPNN),LSSVM的建模數(shù)據(jù)沒有經(jīng)過混沌處理,采用原始高校畢業(yè)生就業(yè)率數(shù)據(jù)直接建模;BPNN對原始高校畢業(yè)生就業(yè)率數(shù)據(jù)進(jìn)行混沌分析,然后采用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行建模。
2.2? 高校畢業(yè)生就業(yè)率歷史數(shù)據(jù)
為了體現(xiàn)高校畢業(yè)生就業(yè)率預(yù)測結(jié)果的公平性,選擇5所類型不同的高校畢業(yè)生就業(yè)率歷史數(shù)據(jù)作為測試對象,具體如表2所示。
2.3? 高校畢業(yè)生就業(yè)率歷史數(shù)據(jù)的混沌分析
采用上述混沌分析算法對表2的5所類型不同的高校畢業(yè)生就業(yè)率歷史數(shù)據(jù)進(jìn)行分析,計算嵌入維和時間延遲,具體如表3所示。從表3可以看出,5所高校畢業(yè)生就業(yè)率歷史數(shù)據(jù)的嵌入維和時間延遲各不相同,這表明5所高校畢業(yè)生就業(yè)率變化特點(diǎn)不完全相同,但是均具有混沌性和隨機(jī)性,根據(jù)表3的嵌入維和時間延遲重構(gòu)5所高校畢業(yè)生就業(yè)率歷史數(shù)據(jù),重構(gòu)高校畢業(yè)生就業(yè)率預(yù)測學(xué)習(xí)樣本。從重構(gòu)的高校畢業(yè)生就業(yè)率預(yù)測學(xué)習(xí)樣本選擇500個樣本作為驗證樣本,其他作為測試樣本。
2.4? 高校畢業(yè)生就業(yè)率預(yù)測結(jié)果分析
由于高校畢業(yè)生就業(yè)率建模主要是為了描述將來高校畢業(yè)生就業(yè)率變化情況,因為只采用一步預(yù)測沒有太多的實際價值,因此本文進(jìn)行一步和多步的高校畢業(yè)生就業(yè)率預(yù)測,統(tǒng)計的一步和多步的高校畢業(yè)生就業(yè)率預(yù)測精度結(jié)果分別如圖2和圖3所示。
對圖2和圖3的一步和多步的高校畢業(yè)生就業(yè)率預(yù)測精度進(jìn)行分析可以發(fā)現(xiàn):
1) 相對于一步高校畢業(yè)生就業(yè)率預(yù)測精度,多步的高校畢業(yè)生就業(yè)率預(yù)測精度有所降低,這是因為多步預(yù)測有誤差累計效果,使得高校畢業(yè)生就業(yè)率預(yù)測誤差不斷增加。
2) 最小二乘支持向量機(jī)的高校畢業(yè)生就業(yè)率預(yù)測精度不高于90%,這是因為其沒有引入混沌分析算法,最小二乘支持向量機(jī)采用原始高校畢業(yè)生就業(yè)率數(shù)據(jù)直接建模,無法準(zhǔn)確描述高校畢業(yè)生就業(yè)率的變化特點(diǎn),使得最小二乘支持向量機(jī)的高校畢業(yè)生就業(yè)率預(yù)測錯誤比較大。
3) BP神經(jīng)網(wǎng)絡(luò)的高校畢業(yè)生就業(yè)率預(yù)測精度也處于90%左右,這是因為雖然引入了混沌分析算法對原始高校畢業(yè)生就業(yè)率數(shù)據(jù)進(jìn)行重構(gòu),但是BP神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)能力有限,經(jīng)常得到局部最優(yōu),使得高校畢業(yè)生就業(yè)率預(yù)測錯誤結(jié)果不穩(wěn)定,出現(xiàn)多個錯誤比較大的點(diǎn),使得高校畢業(yè)生就業(yè)率整體預(yù)測精度不高。
4) 在所有模型中,本文模型的高校畢業(yè)生就業(yè)率預(yù)測精度最高,單步預(yù)測精度超過95%,多步預(yù)測精度超過92%,高校畢業(yè)生就業(yè)率預(yù)測誤差小于當(dāng)前的經(jīng)典模型。這是因為本文模型不僅引入了混沌分析算法對原始高校畢業(yè)生就業(yè)率數(shù)據(jù)進(jìn)行重構(gòu),同時采用學(xué)習(xí)能力更強(qiáng)的最小二乘支持向量機(jī)對高校畢業(yè)生就業(yè)率數(shù)據(jù)進(jìn)行學(xué)習(xí),可以更好地描述高校畢業(yè)生就業(yè)率變化特點(diǎn),提高了高校畢業(yè)生就業(yè)率整體預(yù)測精度,實驗結(jié)果驗證了本文高校畢業(yè)生就業(yè)率預(yù)測模型的優(yōu)越性。
2.5? 高校畢業(yè)生就業(yè)率建模時間對比
統(tǒng)計3種模型對5所高校畢業(yè)生就業(yè)率建模時間,分別統(tǒng)計一步和多步高校畢業(yè)生就業(yè)率建模時間,結(jié)果分別如圖4和圖5所示。
對圖4和圖5的一步和多步高校畢業(yè)生就業(yè)率建模時間進(jìn)行對比和分析可以發(fā)現(xiàn),無論是一步和多步預(yù)測,本文模型的高校畢業(yè)生就業(yè)率建模時間均要少于經(jīng)典模型,提升了高校畢業(yè)生就業(yè)率建模速度,可以滿足大規(guī)模高校畢業(yè)生就業(yè)率數(shù)據(jù)的建模與分析,具有更加廣泛的實際應(yīng)用范圍。
3? 結(jié)? 語
高校畢業(yè)生就業(yè)率預(yù)測有利于幫助高校畢業(yè)生管理者制定相應(yīng)的計劃,受到了當(dāng)前多所高校的高度關(guān)注。但是高校畢業(yè)生就業(yè)率與多種因素密切相關(guān),各種因素之間又相互聯(lián)系,變化規(guī)律十分復(fù)雜,使得當(dāng)前高校畢業(yè)生就業(yè)率預(yù)測模型無法全面、準(zhǔn)確地描述該變化特點(diǎn)。為了減少高校畢業(yè)生就業(yè)率預(yù)測誤差,提升高校畢業(yè)生就業(yè)率預(yù)測速度,本文設(shè)計了一種基于混沌分析算法的高校畢業(yè)生就業(yè)率預(yù)測模型,并通過對比實驗分析該高校畢業(yè)生就業(yè)率預(yù)測模型的有效性和優(yōu)越性,同時為其他相似問題提供了一種有效的建模思路。
參考文獻(xiàn)
[1] 武毅英.我國高校畢業(yè)生就業(yè)率預(yù)警線之探討[J].江蘇高教,2007(6):61?64.
[2] 金大偉,張明健.改進(jìn)高校畢業(yè)生就業(yè)率統(tǒng)計方法初探[J].遼寧教育研究,2007(4):99?101.
[3] 胡宇辰.試論建立我國高校畢業(yè)生就業(yè)率統(tǒng)計的監(jiān)督機(jī)制[J].社會科學(xué)研究,2005(2):189?191.
[4] 楊學(xué)坤,吳樹勤.高校畢業(yè)生就業(yè)率統(tǒng)計的科學(xué)方法研究:從區(qū)別“就業(yè)率統(tǒng)計”和“就業(yè)狀況估計”兩個不同概念出發(fā)[J].甘肅社會科學(xué),2004(6):133?135.
[5] 張學(xué)敏,柴曉旭.我國高校畢業(yè)生就業(yè)率與高校教育質(zhì)量評價研究[J].東北師大學(xué)報(哲學(xué)社會科學(xué)版),2019(3):131?141.
[6] 張穩(wěn),恰汗·合孜爾.畢業(yè)生就業(yè)率預(yù)測及質(zhì)量評估研究[J].計算機(jī)工程與科學(xué),2009,31(5):141?143.
[7] 鄒治,陳萬明.高校畢業(yè)生就業(yè)率的解讀與就業(yè)預(yù)警線的重構(gòu):以江蘇省高校相關(guān)數(shù)據(jù)為證[J].現(xiàn)代教育科學(xué),2009(2):1?5.
[8] 曲娜,化存才.高校畢業(yè)生就業(yè)率的一個微分方程定量模型[J].云南大學(xué)學(xué)報(自然科學(xué)版),2007(z1):24?26.
[9] 亓紅強(qiáng),張福堃,高大鯤,等.基于灰色系統(tǒng)的大學(xué)生就業(yè)率預(yù)測[J].現(xiàn)代電子技術(shù),2019,42(11):174?177.
[10] 王先述.基于Cramer法則和ARMA模型的我國高校畢業(yè)生就業(yè)預(yù)測[J].統(tǒng)計與決策,2010(22):97?99.
[11] 程昌品,陳強(qiáng).基于信息增益比的決策樹用于畢業(yè)生就業(yè)預(yù)測[J].計算機(jī)仿真,2010,27(2):299?302.
[12] 蘇變萍,王婧,王一平.改進(jìn)BP神經(jīng)網(wǎng)絡(luò)及其在陜西就業(yè)預(yù)測中的應(yīng)用[J].數(shù)學(xué)的實踐與認(rèn)識,2006,36(9):271?275.
[13] 鐘儀華,林旭旭,劉雨鑫.基于多元混沌時間序列的油田產(chǎn)量預(yù)測模型[J].數(shù)學(xué)的實踐與認(rèn)識,2016,46(6):99?105.
[14] 雷苗,彭宇,彭喜元.面向混沌時間序列預(yù)測的隱式特征提取算法[J].儀器儀表學(xué)報,2014,35(1):1?7.
[15] 董春嬌,邵春福,李娟,等.基于混沌分析的道路網(wǎng)交通流短時預(yù)測[J].系統(tǒng)工程學(xué)報,2011,26(3):340?345.
作者簡介:張英楠(1989—),男,吉林松原人,碩士,助教,研究方向為思想政治教育。