徐勤亞 劉文睿 張石敏
摘? 要:隨著21世紀(jì)知識(shí)經(jīng)濟(jì)的日益發(fā)展,人力資源成為企業(yè)發(fā)展的核心競(jìng)爭(zhēng)力之一,對(duì)企業(yè)的興衰成敗起決定性作用,因此解決員工離職率這一難題對(duì)企業(yè)發(fā)展至關(guān)重要。本文使用SPSS Clementine數(shù)據(jù)挖掘軟件對(duì)員工離職數(shù)據(jù)進(jìn)行處理,探究員工離職主要因素及原因。通過主要特征選擇模型、主成份分析模型和關(guān)聯(lián)規(guī)則Apriori算法,并結(jié)合散點(diǎn)圖、直方圖等對(duì)字段進(jìn)行多維度分析,得出工資收入、是否加班、升職間隔時(shí)間、職業(yè)級(jí)別等是影響員工離職的主要影響因素,最后針對(duì)分析結(jié)果向有關(guān)部門提出合理性建議。
關(guān)鍵詞:數(shù)據(jù)挖掘;SPSS Clementine;員工離職
一、引言
隨著21世紀(jì)的發(fā)展,知識(shí)經(jīng)濟(jì)占主導(dǎo)地位,人才資源成為企業(yè)的核心競(jìng)爭(zhēng)力之一,決定企業(yè)的興衰成敗。但是,員工的離職率一直是困擾企業(yè)的一個(gè)難題。鑒于此,結(jié)合數(shù)據(jù)挖掘軟件SPSS Clementine,對(duì)該問題的成因進(jìn)行歸納分析,探究員工離職的主要影響因素及原因,從而提出可行的對(duì)策。
二、實(shí)驗(yàn)數(shù)據(jù)來源及參數(shù)分析
(一)數(shù)據(jù)來源
本文的數(shù)據(jù)取自于開源平臺(tái)阿里云大數(shù)據(jù)眾智平臺(tái)——阿里云天池,共計(jì)27個(gè)字段,1100條記錄。
(二)參數(shù)分析
通過數(shù)據(jù)的缺失值和異常值等審核無誤后,對(duì)實(shí)驗(yàn)數(shù)據(jù)中的主要字段作如下解析:
1、年齡:?jiǎn)T工年齡;2、是否離職:?jiǎn)T工是否已經(jīng)離職,0表示未離職,1表示已經(jīng)離職;3、商務(wù)差旅頻率:Non-Travel表示不出差,Travel_Rarely表示不經(jīng)常出差,Travel_Frequently表示經(jīng)常出差;4、所在部門:Sales表示銷售部,Research & Development表示研發(fā)部,Human Resources表示人力資源部;5、公司跟家庭住址的距離:從1到29,1表示最近,29表示最遠(yuǎn);6、員工的教育程度:從1到5,5表示教育程度最高;7、專業(yè)領(lǐng)域:Life Sciences表示生命科學(xué),Medical表示醫(yī)療,Marketing表示市場(chǎng)營(yíng)銷,Technical Degree表示技術(shù)學(xué)位,Human Resources表示人力資源,Other表示其他;8、工作環(huán)境滿意度:從1到4,1的滿意程度最低,4的滿意程度最高;9、性別:Male表示男性,F(xiàn)emale表示女性;10、工作投入度:從1到4,1為投入度最低,4為投入度最高;11、職業(yè)級(jí)別:從1到5,1為最低級(jí)別,5為最高級(jí)別;12、工作角色:Sales Executive是銷售主管,Research Scientist是科學(xué)研究員,Laboratory Technician實(shí)驗(yàn)室技術(shù)員,Manufacturing Director是制造總監(jiān),Healthcare Representative是醫(yī)療代表,Manager是經(jīng)理,Sales Representative是銷售代表,Research Director是研究總監(jiān),Human Resources是人力資源;13、工作滿意度:從1到4,1代表滿意程度最低,4代表滿意程度最高;14、婚姻狀況:Single代表單身,Married代表已婚,Divorced代表離婚;15、月收入:范圍在1009到19999之間;16、曾經(jīng)工作公司數(shù):?jiǎn)T工曾經(jīng)工作過的公司數(shù);17、是否加班:Yes表示加班,No表示不加班;18、工資提高百分比:工資提高的百分比;19、績(jī)效評(píng)估:?jiǎn)T工工作績(jī)效評(píng)估;20 關(guān)系滿意度:從1到4,1表示滿意度最低,4表示滿意度最高;21、總工齡:總共參加工作時(shí)間;22、培訓(xùn)時(shí)長(zhǎng):上一年的培訓(xùn)時(shí)長(zhǎng),從0到6,0表示沒有培訓(xùn),6表示培訓(xùn)時(shí)間最長(zhǎng);23、工作生活平衡度:從1到4,1表示平衡程度最低,4表示平衡程度最高;24、在目前公司年數(shù):在目前公司工作年數(shù);25、在目前工作職責(zé)年數(shù):在目前工作職責(zé)的工作年數(shù);26、距離上次升職時(shí)長(zhǎng):距離上次工作升職的時(shí)間;27、跟管理者共事年數(shù):跟目前的管理者共同工作年數(shù)。
三、具體分析及結(jié)果
由于所分析數(shù)據(jù)字段較多,因此對(duì)數(shù)據(jù)進(jìn)行重要因素分析,根據(jù)模型判斷,將27個(gè)字段分為重要、一般重要和不重要三個(gè)等級(jí),重要字段分別為:是否加班、總工齡、工作角色、婚姻狀況、年齡、職業(yè)級(jí)別、在目前工作職責(zé)年數(shù)、跟管理者共事年數(shù)、工作滿意度、工作投入度、工作環(huán)境滿意度、公司跟家庭住址距離、商務(wù)差旅頻率、距離上次升職時(shí)長(zhǎng)、專業(yè)領(lǐng)域、所在部門、關(guān)系滿意度和工作生活平衡度,共計(jì)18個(gè)字段,接下來將主要從這些字段進(jìn)行剖析。
結(jié)合主要特征選擇模型分析的結(jié)果,對(duì)重要字段構(gòu)建主成份分析模型,總結(jié)出員工離職的關(guān)鍵指標(biāo)。根據(jù)特征值大于1的原則,最終提取出5個(gè)主因子用于歸納員工離職因素,累積方差貢獻(xiàn)率為92.211%,可以較好的解釋整體情況。下面,結(jié)合主成份分析結(jié)果進(jìn)行具體分析。
首先,對(duì)部門離職進(jìn)行簡(jiǎn)單分析,采用計(jì)數(shù)對(duì)每個(gè)部門的離職情況進(jìn)行統(tǒng)計(jì),可以發(fā)現(xiàn),公司內(nèi)人力資源部門較穩(wěn)定,離職人數(shù)少,研發(fā)部門離職人數(shù)最多,人員流動(dòng)大,銷售部門的人員流失情況也較嚴(yán)重。
其次,探究工資收入、員工工作滿意度與離職的關(guān)系,將工作滿意度作為移動(dòng)軸參數(shù),制作三者的散點(diǎn)圖,通過調(diào)節(jié)移動(dòng)軸,可以發(fā)現(xiàn),離職的員工主要為工資<=5000元的群體,同時(shí)對(duì)于工資收入較低的員工多數(shù)工作滿意度也較低,最終導(dǎo)致離職,可見工資收入是影響離職的關(guān)鍵因素。
接著,探究距離上一次升職時(shí)長(zhǎng)、工作投入度個(gè)和離職的關(guān)系,結(jié)合3D散點(diǎn)圖1,可以發(fā)現(xiàn),在距離上次升職時(shí)長(zhǎng)2-8年容易導(dǎo)致員工離職,未離職人員也出現(xiàn)明顯的工作投入度下降問題,因此,若員工長(zhǎng)時(shí)間得不到發(fā)展空間,容易導(dǎo)致離職。
探究職業(yè)級(jí)別、是否加班、生活工作平衡度和離職的綜合關(guān)系,以顏色區(qū)分職業(yè)級(jí)別,移動(dòng)坐標(biāo)軸代表是否加班構(gòu)建直方圖2和圖3,圖2代表不加班,圖3代表加班,通過對(duì)比,可以發(fā)現(xiàn)不論加班不加班,多數(shù)人可以將工作生活平衡度維持在3,處于較好狀態(tài),但加班時(shí),離職人數(shù)將增加,明顯表現(xiàn)在職業(yè)級(jí)別為1的員工,可見對(duì)于基層工作人員來說,加班是影響其離職的關(guān)鍵因素之一。
最后,探究不同年齡層的離職情況,源數(shù)據(jù)中年齡從18歲跨度到60歲,因此,對(duì)年齡進(jìn)行分箱和重新分類,將其分為三個(gè)年齡層:青年、中年和中老年。
通過年齡層與離職分布圖可以看出,年紀(jì)較大的員工傾向于穩(wěn)定,離職情況少,青年人和中年人離職較多,分析原因,可能是青年人剛參加工作,希望尋求更多機(jī)會(huì),需要發(fā)展空間,中年人對(duì)于收入和工作滿意度更有需求,同時(shí)具有一定的工作經(jīng)驗(yàn),如果需求得不到滿足,就有較大概率離職。
結(jié)合關(guān)聯(lián)規(guī)則Apriori算法對(duì)年齡層和離職做進(jìn)一步分析,設(shè)置離職情況為后項(xiàng),年齡層為前項(xiàng),結(jié)果中置信度均超過73%以上,對(duì)于結(jié)果能夠較好地解釋,可得出結(jié)論,中年人和青年人更加容易離職,中年人是最容易離職的群體。
四、結(jié)論:
通過以上分析,可以發(fā)現(xiàn)各年齡層中,中年和青年員工較容易離職,其中,研發(fā)與銷售部門更容易人員流失,工資收入、是否加班、升職間隔時(shí)間、工作時(shí)間、工作環(huán)境、職業(yè)級(jí)別等因素會(huì)較大幅度影響員工的工作滿意度和工作參與度,進(jìn)而導(dǎo)致離職,因此綜合分析結(jié)果,對(duì)企業(yè)提出如下建議:
(一)重視工作滿意度
工作滿意度是員工在工作中,對(duì)工作本身及工作環(huán)境、工作狀態(tài)、工作方式等有積極感受的心理狀態(tài)。企業(yè)應(yīng)當(dāng)針對(duì)不同類型的員工提供不同的方案,重視員工的需求,包括薪資、學(xué)習(xí)晉升等方面。
(二)建立合理的激勵(lì)機(jī)制
當(dāng)員工工作績(jī)效較好時(shí),企業(yè)應(yīng)適當(dāng)給予激勵(lì),才能激發(fā)員工積極性,否則會(huì)降低員工的工作熱情,增加離職的可能性。物質(zhì)激勵(lì)只能滿足物質(zhì)需求,而精神激勵(lì)可以體現(xiàn)企業(yè)對(duì)員工的關(guān)愛與尊重,目前,很多企業(yè)的激勵(lì)方式已經(jīng)開始采用“以人為本”的方式,諸如員工生日聚會(huì)、員工旅游獎(jiǎng)勵(lì)等。
(三)關(guān)注高離職率人群
對(duì)于新入職或入職不超過3-5年的員工,特別是受教育程度較高的新員工,應(yīng)當(dāng)重點(diǎn)關(guān)注其滿意度是否正常、薪水是否合理、工作時(shí)長(zhǎng)是否過長(zhǎng),以減少人員流失,同時(shí)對(duì)于研發(fā)部門和銷售部門等人員流失量大的部門,要重點(diǎn)關(guān)注。
參考文獻(xiàn):
[1]許青.利用Clementine對(duì)高校機(jī)房管理系統(tǒng)進(jìn)行數(shù)據(jù)挖掘[J].赤峰學(xué)院學(xué)報(bào)(自然科學(xué)版),2018,34(07):50-52.
[2]程代娣.Clementine數(shù)據(jù)挖掘工具在計(jì)算機(jī)等級(jí)考試成績(jī)中的應(yīng)用[J].齊魯工業(yè)大學(xué)學(xué)報(bào),2017,31(06):52-56.
[3]王芙蓉.基于數(shù)據(jù)挖掘的CET-4成績(jī)分析與研究[D].寧夏大學(xué),2016.
[4]劉麗敏,張學(xué)鋒.數(shù)據(jù)挖掘中的聚類算法在郵政快遞CRM中的應(yīng)用[J].網(wǎng)絡(luò)安全技術(shù)與應(yīng)用,2014(08):8-9.
[5]郭宇紅,王路寧,毛玉琪.SPSS Clementine決策樹建模在圖書館中的應(yīng)用[J].計(jì)算機(jī)時(shí)代,2014(04):30-33.
[6]季聰華,曹毅,張穎,劉姍,王偉.基于SPSS Clementine軟件的關(guān)聯(lián)規(guī)則算法的應(yīng)用[J].中醫(yī)藥管理雜志,2014,22(01):31-33.
[7]張帆.基于Clementine的廣告客戶數(shù)據(jù)挖掘模型設(shè)計(jì)與實(shí)現(xiàn)[D].北京郵電大學(xué),2010.
[8]劉利俊.利用Clementine進(jìn)行試卷質(zhì)量分析[J].現(xiàn)代計(jì)算機(jī)(專業(yè)版),2008(05):115-117.
作者簡(jiǎn)介:
徐勤亞(1998-),女,安徽省合肥市,本科,研究方向:信息管理與信息系統(tǒng)。
劉文睿(1999.10-),男,漢,安徽省合肥市,學(xué)生,學(xué)士;研究方向:人力資源管理。