国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

高職院校就業(yè)信息平臺(tái)中決策樹(shù)應(yīng)用研究

2016-12-07 06:57:16黃榮喜
廣西教育·C版 2016年10期
關(guān)鍵詞:決策樹(shù)高職院校

【摘 要】本文利用C4.5決策樹(shù)算法構(gòu)造就業(yè)決策樹(shù),對(duì)已畢業(yè)學(xué)生按計(jì)算機(jī)能力、英語(yǔ)等級(jí)、綜合成績(jī)、政治面貌、性格取向等決策屬性進(jìn)行相應(yīng)分類(lèi),并分析其對(duì)畢業(yè)生的就業(yè)類(lèi)別和方向的影響,從而在提高就業(yè)率、就業(yè)層次、改進(jìn)現(xiàn)行培養(yǎng)機(jī)制等方面為管理人員提供決策支持。

【關(guān)鍵詞】高職院校 就業(yè)信息平臺(tái) 決策樹(shù) 就業(yè)方向 就業(yè)決策

【中圖分類(lèi)號(hào)】G 【文獻(xiàn)標(biāo)識(shí)碼】A

【文章編號(hào)】0450-9889(2016)10C-0179-03

隨著高職院校畢業(yè)生人數(shù)的增多,就業(yè)工作及就業(yè)方向指導(dǎo)越發(fā)沉重,研究開(kāi)發(fā)就業(yè)信息管理平臺(tái)非常必要。在平臺(tái)開(kāi)發(fā)中引入決策樹(shù)這一方法來(lái)分析研究,有利于明晰高職院校畢業(yè)生的就業(yè)方向、增強(qiáng)高職院校畢業(yè)生的就業(yè)水平。

決策樹(shù)主要就是將大量的數(shù)據(jù)進(jìn)行相應(yīng)的分類(lèi)。這些分類(lèi)中的數(shù)據(jù)將是研究中給定的數(shù)據(jù),通過(guò)數(shù)據(jù)的研究跟預(yù)測(cè)中的數(shù)據(jù)對(duì)比分析,找出其存在的規(guī)律屬性,并從中找到潛在的、有價(jià)值的信息,并利用這些數(shù)據(jù)對(duì)工作上的問(wèn)題做出指導(dǎo)。決策樹(shù)方法主要應(yīng)用的是(CLS)方法,經(jīng)過(guò)研究摸索后來(lái)演化為ID3方法,最后經(jīng)過(guò)多方的研究、努力,演化成了總所周知的C4.5算法,該算法也是本文中應(yīng)用的一種算法。決策樹(shù)技術(shù)主要是把相關(guān)的問(wèn)題分解化,把復(fù)雜的問(wèn)題簡(jiǎn)單化,從一些雜亂的數(shù)據(jù)中找出一些有規(guī)律的數(shù)據(jù),并進(jìn)行對(duì)比分類(lèi),產(chǎn)生出研究中所需要的結(jié)果,并根據(jù)相應(yīng)的結(jié)果分析,指導(dǎo)現(xiàn)實(shí)中的工作,提高工作效率,強(qiáng)化學(xué)習(xí)能力。在數(shù)據(jù)的分析中,得出一些與就業(yè)相關(guān)的一些基本屬性,如畢業(yè)生的綜合成績(jī)、英語(yǔ)等級(jí)、計(jì)算機(jī)能力以及高考成績(jī)等,并通過(guò)對(duì)這些屬性的分析來(lái)判斷、預(yù)測(cè)其畢業(yè)后的就業(yè)方向與發(fā)展趨勢(shì)。因此,本文設(shè)計(jì)決策樹(shù)模型,通過(guò)對(duì)已工作的畢業(yè)生進(jìn)行相應(yīng)的分析,得出其實(shí)際有效的數(shù)據(jù),并結(jié)合廣西農(nóng)業(yè)職業(yè)技術(shù)學(xué)院學(xué)生就業(yè)的實(shí)際情況進(jìn)行決策樹(shù)分析研究,最終指導(dǎo)畢業(yè)生的就業(yè)方向及就業(yè)層次。

一、就業(yè)信息轉(zhuǎn)換與預(yù)處理

學(xué)生就業(yè)統(tǒng)計(jì)管理信息表主要包括的字段有:學(xué)號(hào),姓名,性別,性格取向、院系,專(zhuān)業(yè),綜合排名,生源地,計(jì)算機(jī)能力,英語(yǔ)水平,政治面貌,工作單位,工作單位區(qū)域,本文采用的挖掘?qū)傩跃褪菑脑摫碇蝎@取。挖掘出給定數(shù)據(jù)的單位性質(zhì),獲取一些找到好工作、好單位的畢業(yè)生與其哪些屬性相關(guān),主要通過(guò)學(xué)生就業(yè)信息表中的數(shù)據(jù)來(lái)進(jìn)行挖掘?qū)Ρ?,由于挖掘的信息量比較大,在數(shù)據(jù)的挖掘中,首先要進(jìn)行相應(yīng)的數(shù)據(jù)篩選,找出與學(xué)生關(guān)聯(lián)度比較大的相關(guān)維度屬性。如實(shí)踐能力、綜合排名、英語(yǔ)水平、計(jì)算機(jī)能力、性格取向、高考成績(jī)、工作單位等作為決策屬性。在統(tǒng)計(jì)的工作單位中,對(duì)它們進(jìn)行符號(hào)化,分成不同的層次,具體如下:國(guó)企(符號(hào)化G),其主要是一些大、中、小型的一些國(guó)有企業(yè),一些事業(yè)單位、科研單位、政府單位等;外企(符號(hào)化W),其主要是一些在中國(guó)發(fā)展的外資企業(yè);私企(符號(hào)化S),私企主要是一些私人企業(yè),一些民企。在這三類(lèi)單位中,又進(jìn)行相關(guān)層次的分類(lèi)即優(yōu)秀(Y)與差(C),以便進(jìn)行更好區(qū)分,把數(shù)據(jù)進(jìn)行細(xì)化分析。在這些數(shù)據(jù)的細(xì)化后,現(xiàn)在可以把相應(yīng)的工作單位分成以下幾大類(lèi),即優(yōu)秀國(guó)企(GY)、差國(guó)企(GC)、優(yōu)秀外企(WY)、差外企(WC)、優(yōu)秀私企(SY)、差私企(SC),在這些數(shù)據(jù)確定后,并把所有的數(shù)據(jù)都進(jìn)行符號(hào)化,然后進(jìn)行統(tǒng)計(jì)分析。

二、模型分析與設(shè)計(jì)

(一)模型分析描述

高職院校畢業(yè)生人數(shù)在逐年增加,就業(yè)問(wèn)題也逐年突出。以廣西農(nóng)業(yè)職業(yè)技術(shù)學(xué)院為例,雖然加大了投入,千方百計(jì)提高就業(yè)率及就業(yè)水平,也取得了一定的成效,但離理想中的要求還有一定的差距,如何縮短這些差距,是作為學(xué)院的決策者必須思考的問(wèn)題。因此,建立一個(gè)學(xué)院學(xué)生就業(yè)信息管理平臺(tái),解決就業(yè)問(wèn)題非常有實(shí)際意義。在這些大量的數(shù)據(jù)中找出所需要的數(shù)據(jù),給學(xué)院的決策者來(lái)做出決策支持。在通過(guò)對(duì)比分析后,數(shù)據(jù)挖掘能很好地解決相關(guān)的問(wèn)題,它能從大量的數(shù)據(jù)中挖掘出所需要的相關(guān)數(shù)據(jù),根據(jù)此特點(diǎn)選擇決策樹(shù)C4.5算法建立決策分類(lèi)樹(shù),通過(guò)已給定的條件來(lái)找出學(xué)生屬性的影響情況。并由相關(guān)規(guī)則找出就業(yè)單位的類(lèi)別進(jìn)行排列選取,通過(guò)這些屬性的挖掘以及數(shù)據(jù)的整理分析,得到有價(jià)值的信息,為決策者進(jìn)行決策支持。

(二)模型設(shè)計(jì)

決策樹(shù)其實(shí)就是生成一棵倒立的樹(shù),其主要目的就是實(shí)現(xiàn)分枝歸類(lèi),把具有相同屬性的值,盡快與相應(yīng)的分支對(duì)應(yīng)屬性,每片葉子代表的是類(lèi)別的最終屬性。通過(guò)以上的結(jié)構(gòu)分析,決策樹(shù)的構(gòu)建在數(shù)據(jù)的分析上有很大的優(yōu)勢(shì),很容易從葉子節(jié)點(diǎn)上分析得出所需要的數(shù)據(jù)。

通過(guò)C4.5進(jìn)行對(duì)數(shù)據(jù)歸類(lèi)劃分,并進(jìn)行相應(yīng)的最優(yōu)屬性值的評(píng)估,盡快在最短的分枝路線(xiàn)上進(jìn)行分類(lèi)選擇,并能有效處理連續(xù)值的屬性。因此,通過(guò)C4.5算法利用數(shù)據(jù)挖掘,分析出樣本中所有的數(shù)據(jù),并對(duì)所需要的數(shù)據(jù),如綜合成績(jī)、計(jì)算機(jī)能力、英語(yǔ)水平、實(shí)踐能力進(jìn)行處理分析,并得出畢業(yè)生就業(yè)好的一些基本因數(shù)。這些因數(shù)主要通過(guò)算法遞歸分配到每一個(gè)節(jié)點(diǎn)上,通過(guò)數(shù)據(jù)的處理就可以看出學(xué)生的就業(yè)跟哪些屬性關(guān)聯(lián)性比較大,這樣在學(xué)生的就業(yè)中,就可以做出正確的有方向性的指導(dǎo)。

C4.5算法主要產(chǎn)生所需要的增益率,其計(jì)算方法以及相應(yīng)的計(jì)算公式步驟如下:

第一,在已選取的數(shù)據(jù)中,并把該數(shù)據(jù)集合表示是S,其中的項(xiàng)目數(shù)為s,并通過(guò)取不同的屬性值,把它設(shè)為n,其對(duì)應(yīng)的屬性值也為n。另外,在就業(yè)信息數(shù)據(jù)挖掘系統(tǒng)中應(yīng)用為Qi,(i=1,2,…,n)。假設(shè)Bi為類(lèi)別Qi中的樣本數(shù)據(jù)個(gè)數(shù),為每個(gè)數(shù)據(jù)的屬性信息計(jì)算增益率,并計(jì)算機(jī)出給定樣本分類(lèi)所需要的信息熵,其計(jì)算公式如下:

第二,在分類(lèi)劃分中,屬性的值是非常多的,如何取出所有屬性的值,并把它歸類(lèi)到每一個(gè)節(jié)點(diǎn)中,這樣就需要取W個(gè)不同的值,即{w1,w2,…,wn}。并通過(guò)類(lèi)別屬性W值的不同,來(lái)獲取劃分其中的其他節(jié)點(diǎn)的分枝值為S,并記為:{ S1,S2,…,Sz }。通過(guò)這些子集對(duì)應(yīng)所包含的集合S,并由S的節(jié)點(diǎn)產(chǎn)生出來(lái)所需要的分枝,通過(guò)屬性劃分的方式,把當(dāng)前樣本集合B,劃分成子集的信息熵或信息期望,通過(guò)下列公式進(jìn)行劃分:

對(duì)于給定的子集S,通過(guò)類(lèi)別屬性的分枝節(jié)點(diǎn)來(lái)計(jì)算出每一個(gè)測(cè)試屬性的信息增益量:如Gainration(綜合成績(jī))、Gainration(英語(yǔ)水平)、Gainration(計(jì)算機(jī)能力)、Gainration(實(shí)踐能力),相應(yīng)的計(jì)算機(jī)公式如下:

第三,利用公式(1)-(4)測(cè)試計(jì)算每個(gè)屬性即Gainration(綜合成績(jī))、Gainration(英語(yǔ)水平)、Gainration(計(jì)算機(jī)能力)、Gainration(實(shí)踐能力)的信息增益量,同樣也計(jì)算出它們的增益率。通過(guò)增益率的測(cè)試計(jì)算,完成各個(gè)分枝的劃分,最終確立決策樹(shù)模型的建立,并得出各個(gè)分枝的支持情況,通過(guò)屬性數(shù)據(jù)的分析來(lái)達(dá)到預(yù)測(cè)的效果。

三、用C4.5算法構(gòu)造決策樹(shù)

C4.5算法構(gòu)造決策樹(shù)主要有以下幾個(gè)步驟:

(一)選取信息樣本數(shù)據(jù)集

如表1所示,工作單位作為工作好壞性質(zhì)類(lèi)別,即三類(lèi)工作分類(lèi)中的類(lèi)別。屬性綜合成績(jī)、英語(yǔ)水平、計(jì)算機(jī)能力、實(shí)踐能力、畢業(yè)去向?yàn)闆Q策屬性集。

(二)抽取信息樣本

在信息樣本數(shù)據(jù)集S中,一共有20條記錄,其中GY、GC、WY、WC、SY、SC類(lèi)所對(duì)應(yīng)的子集中元組個(gè)數(shù)分別為:t1=6、t2=6、t3=5、t4=1、t5=2、t6=0。由于需要計(jì)算S分類(lèi)集合決策屬性的增益信息量,計(jì)算公式如下:

Z(綜合成績(jī))=(S11,S21,S31,S41,S51,S61)+ (S21,S22,S23,S24,S25,S26)+(S31,S32,S33,S34,S35,S36)=1.86 (5)

因此,通過(guò)公式(5)可以計(jì)算出綜合成績(jī)屬性的信息增益量為:

Gainration(綜合成績(jī))=I(t1,t2,t3,t4,t5,t6)-E(綜合成績(jī))=0.582

并依此測(cè)試計(jì)算得到英語(yǔ)水平、計(jì)算機(jī)能力、實(shí)踐能力屬性的信息增益:Gainration(英語(yǔ)水平)=0.256,Gainration (計(jì)算機(jī)能力)=0.245,Gainration(實(shí)踐能力)=0.135。根據(jù)測(cè)試結(jié)果,比較各個(gè)測(cè)試屬性值的大小,值大的作為根部節(jié)點(diǎn)[56]。重復(fù)上述相關(guān)步驟,完成各個(gè)分枝的劃分,最終構(gòu)造建立決策樹(shù)。根據(jù)廣西農(nóng)業(yè)職業(yè)技術(shù)學(xué)院畢業(yè)生情況,由于該院的畢業(yè)生人數(shù)一年只有3000多人,因此,可以從中抽取出1500名畢業(yè)生的就業(yè)數(shù)據(jù)進(jìn)行相關(guān)的決策樹(shù)分析,并獲得如圖1所示的決策樹(shù)。

圖1 C4.5算法構(gòu)造就業(yè)決策樹(shù)圖

四、生成分類(lèi)規(guī)則描述

通過(guò)以上的決策樹(shù)構(gòu)成,可以分析得出各個(gè)單位的分類(lèi)規(guī)則以及判斷它們的屬性關(guān)聯(lián)性,分類(lèi)關(guān)聯(lián)情況如表2所示:

通過(guò)以上相關(guān)的規(guī)則以及分類(lèi)的情況可以看出,綜合成績(jī)優(yōu)良、外語(yǔ)水平較高、實(shí)踐能力以及計(jì)算機(jī)能力比較好的學(xué)生,其就業(yè)單位普遍在比較優(yōu)秀的企業(yè);綜合成績(jī)不怎么好,但實(shí)踐能力比較強(qiáng)的同學(xué),在優(yōu)秀私企工作的情況比較普遍,其他則基本是在一般的企業(yè)工作。

綜合各方面的分析來(lái)看,在這三類(lèi)單位中,要想提高優(yōu)秀企業(yè)的就業(yè)層次,就必須提高學(xué)生的綜合成績(jī)及其計(jì)算機(jī)能力與外語(yǔ)水平,要想提高優(yōu)秀私企的就業(yè)情況,也可以進(jìn)行實(shí)踐能力的培養(yǎng),提高他們的實(shí)踐能力??傊?,在以上分析結(jié)果中,能很清楚地給定決策者的培養(yǎng)目標(biāo),當(dāng)然也不能排除例外情況的發(fā)生,只要能把握大的發(fā)展趨勢(shì),就能為決策者提高決策支持。

五、小結(jié)

本文主要通過(guò)相應(yīng)的數(shù)據(jù)屬性,并通過(guò)決策樹(shù)方法,對(duì)已畢業(yè)學(xué)生的就業(yè)工作情況,通過(guò)分類(lèi)歸納,最終得出學(xué)生的哪些屬性對(duì)畢業(yè)生的就業(yè)情況有比較大的影響。因此,對(duì)于高職院校,特別是在目前就業(yè)壓力較大的情況下,如何調(diào)整就業(yè)方向,在激烈的就業(yè)競(jìng)爭(zhēng)中,指導(dǎo)學(xué)生的就業(yè)方向,提高學(xué)生的就業(yè)層次及就業(yè)水平是決策者必須重視的。通過(guò)本文的分析,可以預(yù)測(cè)與就業(yè)相關(guān)的學(xué)生屬性的關(guān)聯(lián)情況,并對(duì)今后畢業(yè)找工作起到一定的指導(dǎo)作用。

【參考文獻(xiàn)】

[1]鄧自洋.改進(jìn)決策樹(shù)算法在高校就業(yè)管理中的應(yīng)用研究[D].上海:華東理工大學(xué),2013

[2]韓曉穎.基于決策樹(shù)的數(shù)據(jù)挖掘技術(shù)在學(xué)生就業(yè)指導(dǎo)中的應(yīng)用[J].科協(xié)論壇(下半月),2011(12)

[3]丁苗.決策樹(shù)技術(shù)在畢業(yè)生就業(yè)數(shù)據(jù)中的應(yīng)用研究[D].吉林:遼寧工程技術(shù)大學(xué),2012

[4]楊斷利,張銳,王文顯.基于模糊決策樹(shù)的高校就業(yè)數(shù)據(jù)挖掘研究[J].河北農(nóng)業(yè)大學(xué)學(xué)報(bào),2012(2)

【基金項(xiàng)目】基于WEB的高職院校就業(yè)信息管理系統(tǒng)的研發(fā)與應(yīng)用(桂教科研[2016]3號(hào))

【作者簡(jiǎn)介】黃榮喜(1979— ),男,廣西桂林人,廣西大學(xué)碩士,廣西農(nóng)業(yè)職業(yè)技術(shù)學(xué)院講師,研究方向:軟件開(kāi)發(fā)及應(yīng)用。

(責(zé)編 劉健華)

猜你喜歡
決策樹(shù)高職院校
一種針對(duì)不均衡數(shù)據(jù)集的SVM決策樹(shù)算法
決策樹(shù)和隨機(jī)森林方法在管理決策中的應(yīng)用
電子制作(2018年16期)2018-09-26 03:27:06
基于改進(jìn)決策樹(shù)的故障診斷方法研究
“一帶一路”戰(zhàn)略與鹽城高職院校學(xué)生職業(yè)生涯規(guī)劃的思考
考試周刊(2016年77期)2016-10-09 12:05:08
淺析紅色文化與高職院校思想政治教育工作
考試周刊(2016年77期)2016-10-09 11:59:13
高職院校創(chuàng)新創(chuàng)業(yè)教育初探
科技視界(2016年20期)2016-09-29 12:58:21
全球化背景下高職院校韓語(yǔ)專(zhuān)業(yè)畢業(yè)生就業(yè)現(xiàn)狀分析
科技視界(2016年20期)2016-09-29 12:56:14
多元智能理論視角下高職院校體育課程評(píng)價(jià)體系的研究
科技視界(2016年20期)2016-09-29 11:31:29
淺談財(cái)務(wù)管理存在的問(wèn)題及完善措施
基于決策樹(shù)的出租車(chē)乘客出行目的識(shí)別
河津市| 台州市| 岚皋县| 石台县| 西林县| 民丰县| 郎溪县| 东阳市| 涞水县| 安龙县| 杭锦后旗| 弥勒县| 太谷县| 永春县| 龙州县| 藁城市| 理塘县| 丰都县| 冀州市| 云和县| 本溪市| 固安县| 舟曲县| 宁远县| 常熟市| 苏尼特右旗| 惠安县| 台南县| 四会市| 汉寿县| 桦川县| 信丰县| 洛南县| 靖安县| 平罗县| 南乐县| 英德市| 凉山| 大同市| 额尔古纳市| 阿巴嘎旗|