魏玉曦
摘 ?要: 針對高校就業(yè)質(zhì)量評價錯誤大,可靠性低等不足,為了獲得理想的高校就業(yè)質(zhì)量評價效果,設(shè)計了基于大數(shù)據(jù)挖掘技術(shù)的高校就業(yè)質(zhì)量評價模型。首先,研究當(dāng)前高校就業(yè)質(zhì)量評價相關(guān)文獻(xiàn),選擇一些影響因素構(gòu)建高校就業(yè)質(zhì)量評價指標(biāo)體系,并通過專家確定高校就業(yè)質(zhì)量等級;然后,引入大數(shù)據(jù)挖掘技術(shù)擬合高校就業(yè)質(zhì)量變化特點,建立高校就業(yè)質(zhì)量評價模型;最后,采用具體數(shù)據(jù)對高校就業(yè)質(zhì)量評價模型性能進(jìn)行分析。文中所提模型較好地解決了當(dāng)前高校就業(yè)質(zhì)量評價模型的弊端,評價結(jié)果更加科學(xué),高校就業(yè)質(zhì)量評價偏差小于當(dāng)前典型模型,具有廣泛的實際應(yīng)用價值。
關(guān)鍵詞: 高校就業(yè); 質(zhì)量評價; 大數(shù)據(jù)挖掘技術(shù); 仿真實驗; 評價指標(biāo); 模型建立
中圖分類號: TN911.1?34; TP181 ? ? ? ? ? ? ? ? ? 文獻(xiàn)標(biāo)識碼: A ? ? ? ? ? ? ? ? ? ?文章編號: 1004?373X(2020)07?0103?04
University employment quality evaluation based on big data mining technology
WEI Yuxi
(Hetao College, Bayannur 015000, China)
Abstract: In view of big errors and low reliability of the employment quality evaluation of universities, an employment quality evaluation model based on big data mining technology is designed to obtain an ideal evaluation effect. The related literatures on the current employment quality evaluation of universities are studied. Some influencing factors are selected to construct an index system for employment quality evaluation of universities, and the employment quality stages of universities are determined by experts. The big data mining technology is introduced to fit the changing characteristics of employment quality evaluation and establish the evaluation model. Finally, the specific data is used to analyze the performance of the evaluation model. It shows that the proposed model can eliminate the drawbacks existing in the current evaluation models, and the evaluation results are more scientific. The evaluation deviation of the proposed model is smaller than that of the current typical models. Therefore, the proposed model has a wide range of application.
Keywords: university employment; quality evaluation; big data mining technology; simulation experiment; evaluation index; model building
0 ?引 ?言
高校就業(yè)質(zhì)量是衡量高校辦學(xué)水平高低的一個重要指標(biāo),而高校就業(yè)受到大學(xué)生自身素質(zhì)、社會因素、家庭因素、學(xué)校因素、政府因素等多種因素的影響和制約,因此,制定一套科學(xué)、準(zhǔn)確的高校就業(yè)質(zhì)量評價體系十分重要,對就業(yè)質(zhì)量進(jìn)行科學(xué)的評價已經(jīng)受到高校的廣泛重視[1?3]。
針對高校就業(yè)質(zhì)量問題,20世紀(jì)90年代就有學(xué)者開始投身于高校就業(yè)質(zhì)量的研究中,隨著時間的推移,目前已取得了一些研究成果[4?6]。最初采用人工方式進(jìn)行高校就業(yè)質(zhì)量評價,通過一些校外或者校內(nèi)的專家對過去一段時間的大學(xué)就業(yè)質(zhì)量數(shù)據(jù)進(jìn)行分析,得到高校就業(yè)質(zhì)量結(jié)果,這種方式的高校就業(yè)質(zhì)量評價結(jié)果可信度比較低,因為具有一定的主觀意識,同時,高校就業(yè)質(zhì)量建模過程耗時比較長,無法滿足現(xiàn)代高校發(fā)展的要求[7?9]。由于信息技術(shù)、自動控制技術(shù)的不斷發(fā)展,出現(xiàn)了高校就業(yè)質(zhì)量自動、智能評價模型,主要有:基于層次分析法的高校就業(yè)質(zhì)量評價模型、基于模糊數(shù)學(xué)理論的高校就業(yè)質(zhì)量評價模型、基于主成分分析法的高校就業(yè)質(zhì)量評價模型以及BP神經(jīng)網(wǎng)絡(luò)的高校就業(yè)質(zhì)量評價模型。其中,層次分析法和模糊數(shù)學(xué)理論屬于線性的高校就業(yè)質(zhì)量評價方法,假設(shè)高校就業(yè)質(zhì)量等級與高校就業(yè)質(zhì)量評價指標(biāo)影響因子之間呈現(xiàn)一種線性變化關(guān)系,而高校就業(yè)質(zhì)量與多種指標(biāo)有關(guān),變化比較復(fù)雜,不是一種非線性變化關(guān)系,因此,層次分析法和模糊數(shù)學(xué)理論的高校就業(yè)質(zhì)量評價結(jié)果缺陷十分明顯[10?12]。主成分分析法和BP神經(jīng)網(wǎng)絡(luò)屬于非線性的高校就業(yè)質(zhì)量評價技術(shù),高校就業(yè)質(zhì)量評價正確率要明顯優(yōu)于層次分析法和模糊數(shù)學(xué)理論,但是它們主要針對小規(guī)模的高校就業(yè)質(zhì)量評價問題,沒有考慮高校就業(yè)質(zhì)量評價數(shù)據(jù)的大規(guī)模特性,高校就業(yè)質(zhì)量評價結(jié)果有待進(jìn)一步改善[13?15]。
針對高校就業(yè)質(zhì)量評價錯誤率高,評價結(jié)果可靠性低等難題,以改善高校就業(yè)質(zhì)量評價效果為目標(biāo),提出了基于大數(shù)據(jù)挖掘技術(shù)的高校就業(yè)質(zhì)量評價模型,并通過具體數(shù)據(jù)對高校就業(yè)質(zhì)量評價進(jìn)行仿真測試。結(jié)果表明,本文模型能夠避免當(dāng)前高校就業(yè)質(zhì)量評價模型存在的問題,提高高校就業(yè)質(zhì)量評價的正確率,評價結(jié)果更加科學(xué),可信度高,能夠獲得比其他模型更優(yōu)的高校就業(yè)質(zhì)量評價結(jié)果,驗證了本文模型的優(yōu)越性。
1 ?大數(shù)據(jù)挖掘技術(shù)的高校就業(yè)質(zhì)量評價模型
1.1 ?高校就業(yè)質(zhì)量評價體系
當(dāng)前高校就業(yè)質(zhì)量評價指標(biāo)復(fù)雜多樣,指標(biāo)類型和數(shù)量很多,但是不可能將全部指標(biāo)選作高校就業(yè)質(zhì)量評價建模。本文高校就業(yè)質(zhì)量評價建模采取的原則為:針對性原則、主客觀結(jié)合原則、可操作性原則以及相對獨立性原則。其中,針對性原則主要指具體的角度和對象;主客觀結(jié)合原則同時反映就業(yè)客觀性和就業(yè)者主觀性感受;可操作性原則主要表示評價指標(biāo)體系的可行性和實用性;相對獨立性原則表示同一級評價指標(biāo)不存在交叉影響,構(gòu)建的高校就業(yè)質(zhì)量評價指標(biāo)體系如圖1所示。
1.2 ?大數(shù)據(jù)挖掘技術(shù)
隨著高校就業(yè)質(zhì)量評價研究的不斷深入,一些傳統(tǒng)技術(shù)無法對高校就業(yè)質(zhì)量進(jìn)行準(zhǔn)確、科學(xué)評價,為此本文引入大數(shù)據(jù)挖掘技術(shù)中的布谷鳥搜索算法和BP神經(jīng)網(wǎng)絡(luò)對高校就業(yè)質(zhì)量評價進(jìn)行建模與分析,以獲得理想的高校就業(yè)質(zhì)量評價結(jié)果。
1.2.1 ?布谷鳥搜索算法
布谷鳥搜索算法是大數(shù)據(jù)挖掘技術(shù)的一個重要分支,其模擬布谷鳥繁殖行為和萊維飛行,本文將其引入到BP神經(jīng)網(wǎng)絡(luò)參數(shù)的優(yōu)化過程中。為了便于對BP神經(jīng)網(wǎng)絡(luò)參數(shù)優(yōu)化問題進(jìn)行求解,布谷鳥搜索算法作如下假設(shè):
1) 一只布谷鳥只能下一個蛋,該蛋存放的鳥巢位置是隨機(jī)的,沒有一定的規(guī)律可循。
2) 質(zhì)量優(yōu)的鳥巢位置中的蛋會保留到下一代。
3) 鳥巢位置以及數(shù)量是事先確定的,不能改變,蛋被宿主發(fā)現(xiàn)的概率為[Pa]。
在第[t+1]代搜索過程中,鳥巢位置的更新方式為:
[Xi(t+1)=Xi(t)+α⊕Levy(λ)] ? ? (1)
式中:[α]為步長;[λ]為帶有重尾的概率分布函數(shù);[⊕]為點積運(yùn)算;[Levy(λ)]為萊維飛行行為:
[Levy: μ=t-λ, ? ?1<λ<3] ? ? ? ?(2)
1.2.2 ?BP神經(jīng)網(wǎng)絡(luò)
設(shè)第[k]個高校就業(yè)質(zhì)量評價樣本的期望輸出結(jié)果和BP神經(jīng)網(wǎng)絡(luò)的實際輸出結(jié)果分別為[dk]和[Ok],那么訓(xùn)練樣本的輸出誤差計算公式為:
[E=12k=1h(dk-Ok)2] (3)
式中[h]表示訓(xùn)練樣本的數(shù)量。
隱含層與輸出層間、輸入層與隱含層的權(quán)重分別為[Wij]和[Wjk],其中,[j],[i],[k]分別表示隱含層節(jié)點、輸出層節(jié)點、輸入層節(jié)點的編號,權(quán)重值的更新方式為:
[Wij(t+1)=Wij(t)+ΔWij, ? ?ΔWij=-η?E?Wij] ?(4)
[Wjk(t+1)=Wjk(t)+ΔWjk, ? ?ΔWjk=-η?E?Wjk] ?(5)
式中[η]表示學(xué)習(xí)速度。
BP神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)過程實際就是權(quán)值更新的過程,當(dāng)前權(quán)值更新規(guī)則為梯度下降法,但是權(quán)重的初始值直接影響B(tài)P神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)性能,當(dāng)前主要憑經(jīng)驗方式確定,這樣會對高校就業(yè)質(zhì)量評價結(jié)果產(chǎn)生不利影響,因此,本文采用布谷鳥搜索算法確定BP神經(jīng)網(wǎng)絡(luò)權(quán)重的初始值。
1.3 ?大數(shù)據(jù)挖掘技術(shù)的高校就業(yè)質(zhì)量評價步驟
大數(shù)據(jù)挖掘技術(shù)的高校就業(yè)質(zhì)量評價步驟如下:
1) 根據(jù)圖1的高校就業(yè)質(zhì)量評價指標(biāo)體系,采集一些歷史數(shù)據(jù),并得到相應(yīng)的高校就業(yè)質(zhì)量評分值,組成高校就業(yè)質(zhì)量評價的樣本集合。
2) 對高校就業(yè)質(zhì)量評價指標(biāo)進(jìn)行標(biāo)準(zhǔn)化處理,作為BP神經(jīng)網(wǎng)絡(luò)的輸入向量,高校就業(yè)質(zhì)量評分值作為期望輸出,確定BP神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)。
3) 確定BP神經(jīng)網(wǎng)絡(luò)的[Wij]和[Wjk]的取值范圍,隨機(jī)確定[Wij]和[Wjk]的初始值,將它們進(jìn)行編碼作為鳥巢位置。
4) 初始化布谷鳥搜索算法的相關(guān)參數(shù)值,并將高校就業(yè)質(zhì)量評價誤差作為布谷鳥搜索算法的適應(yīng)度函數(shù)值。
5) 根據(jù)式(1)產(chǎn)生一組新的鳥巢位置,并與上一代的鳥巢位置進(jìn)行對比,采用較優(yōu)的新鳥巢位置代替較差的舊鳥巢位置。
6) 根據(jù)[Pa]丟棄適應(yīng)度函數(shù)值差的鳥巢位置。
7) 通過步驟5)和步驟6)得到最優(yōu)的鳥巢位置,并對最優(yōu)鳥巢位置進(jìn)行反編碼,得到最優(yōu)的[Wij]和[Wjk]的初始值。
8) 根據(jù)最優(yōu)的[Wij]和[Wjk]的初始值,進(jìn)行高校就業(yè)質(zhì)量評價的BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練,并采用高校就業(yè)質(zhì)量評價訓(xùn)練數(shù)據(jù)對訓(xùn)練好的BP神經(jīng)網(wǎng)絡(luò)進(jìn)行測試,輸出高校就業(yè)質(zhì)量評價結(jié)果。
大數(shù)據(jù)挖掘技術(shù)的高校就業(yè)質(zhì)量評價流程如圖2所示。
2 ?仿真測試
2.1 ?測試環(huán)境
為了測試大數(shù)據(jù)挖掘技術(shù)的高校就業(yè)質(zhì)量評價效果,采用Visual Studio 2013作為開發(fā)工具編程實現(xiàn)高校就業(yè)質(zhì)量評價程序。硬件為:CPU 6核 2.7 GHz,32 GB內(nèi)存,高校就業(yè)質(zhì)量評價結(jié)果采用100分制進(jìn)行描述,大于90分為優(yōu),80~90分為良,70~80分為中,60~70分為合格,低于60分為不合格,共采集到10 000個高校就業(yè)質(zhì)量評價數(shù)據(jù),部分高校就業(yè)質(zhì)量評價數(shù)據(jù)如表1所示。
2.2 ?測試結(jié)果與分析
采用層次分析法、主成分分析法的高校就業(yè)質(zhì)量評價模型進(jìn)行對比實驗,進(jìn)行5次高校就業(yè)質(zhì)量評價實驗,每一次首先從表1中隨機(jī)抽取8 000個樣本作為高校就業(yè)質(zhì)量評價的訓(xùn)練樣本,然后采用剩余2 000個數(shù)據(jù)作為測試樣本,統(tǒng)計高校就業(yè)質(zhì)量評價精度,具體如圖3所示。
從圖3可以看出:層次分析法的高校就業(yè)質(zhì)量評價精度最低,高校就業(yè)質(zhì)量評價誤差最大;其次為主成分分析法;大數(shù)據(jù)挖掘技術(shù)的高校就業(yè)質(zhì)量評價精度最高,大幅度減少了高校就業(yè)質(zhì)量評價誤差,解決了當(dāng)前高校就業(yè)質(zhì)量評價過程中存在的不足,高校就業(yè)質(zhì)量評價結(jié)果更加可信。
采用層次分析法、主成分分析法、大數(shù)據(jù)挖掘技術(shù)的高校就業(yè)質(zhì)量評價的時間進(jìn)行各評價模型的性能分析,結(jié)果如表2所示。從表2可以發(fā)現(xiàn),大數(shù)據(jù)挖掘技術(shù)的高校就業(yè)質(zhì)量評價的時間少于層次分析法、主成分分析法,這是因為本文方法融合了布谷鳥搜索算法和BP神經(jīng)網(wǎng)絡(luò)的優(yōu)勢,提高了高校就業(yè)質(zhì)量的評價效率。
3 ?結(jié) ?語
為了改善高校就業(yè)質(zhì)量評價效果,本文設(shè)計了基于大數(shù)據(jù)挖掘技術(shù)的高校就業(yè)質(zhì)量評價模型,采用布谷鳥搜索算法和BP神經(jīng)網(wǎng)絡(luò)對高校就業(yè)質(zhì)量評價進(jìn)行建模,結(jié)果表明,本文模型的高校就業(yè)質(zhì)量評價結(jié)果科學(xué)、可信,具有較高的實際應(yīng)用價值。
參考文獻(xiàn)
[1] 鮑金勇.從源頭提高大學(xué)生就業(yè)滿意度和就業(yè)質(zhì)量的思考[J].中國成人教育,2014,22(11):30?32.
[2] 陳歡,劉春風(fēng).高校畢業(yè)生就業(yè)質(zhì)量評價體系構(gòu)建[J].現(xiàn)代教育管理,2012,24(12):57?60.
[3] 陳韶,徐向東,符志剛.高校畢業(yè)生就業(yè)質(zhì)量評價體系研究[J].工業(yè)工程,2010,13(5):112?116.
[4] 柯羽.高校畢業(yè)生就業(yè)質(zhì)量評價指標(biāo)體系的構(gòu)建[J].中國高教研究,2007,22(7):82?84.
[5] 李淑娥.基于模糊隸屬度的高職畢業(yè)生就業(yè)質(zhì)量評價體系研究[J].黑龍江高教研究,2016,15(7):98?102.
[6] 駱雄輝.基于主成份分析法的高校就業(yè)質(zhì)量評價模型研究[J].韶關(guān)學(xué)院學(xué)報,2012,33(11):151?154.
[7] 譚璐,陳志波.地方高校本科畢業(yè)生就業(yè)質(zhì)量評價方法研究與實踐[J].繼續(xù)教育研究,2009,12(7):119?121.
[8] 譚衛(wèi)偉.以國家建設(shè)需要為導(dǎo)向的大學(xué)生就業(yè)質(zhì)量評價體系[J].教育與職業(yè),2011,9(5):32?33.
[9] 衛(wèi)鐵林.基于AHP的高校畢業(yè)生就業(yè)質(zhì)量評價模型構(gòu)建[J].教育與經(jīng)濟(jì),2013,41(2):43?47.
[10] 吳新中,董仕奇.高校畢業(yè)生就業(yè)質(zhì)量評價要素及體系建構(gòu)[J].科技進(jìn)步與對策,2017,34(4):140?144.
[11] 武毅英,王志軍.教育部直屬高校畢業(yè)生就業(yè)質(zhì)量評價體系探析:基于教育部直屬高校2013年就業(yè)質(zhì)量年度報告的數(shù)據(jù)[J].江蘇高教,2015,22(1):100?104.
[12] 楊昱梅,李繼娜.基于AHP和BP神經(jīng)網(wǎng)絡(luò)的高校畢業(yè)生就業(yè)質(zhì)量評價研究[J].中國教育學(xué)刊,2015,23(z1):148?149.
[13] 尹曉菲,楊昱梅.以“就業(yè)質(zhì)量提升”為導(dǎo)向的高校就業(yè)質(zhì)量評價體系優(yōu)化研究[J].中國職業(yè)技術(shù)教育,2019,22(10):82?87.
[14] 張瑤祥.基于三方滿意度的高校畢業(yè)生就業(yè)質(zhì)量評價研究[J].中國高教研究,2013,9(5):82?86.
[15] 朱鈞陶.大學(xué)生就業(yè)質(zhì)量評價體系的實證研究:以華南農(nóng)業(yè)大學(xué)為例[J].高教探索,2015,12(5):109?112.