趙力衡 李麗華
摘要:隨著機(jī)器學(xué)習(xí)技術(shù)的迅速發(fā)展,機(jī)器學(xué)習(xí)的分析方法也逐漸深入到社會(huì)各個(gè)領(lǐng)域中,成為行業(yè)分析的最重要手段之一。在學(xué)生就業(yè)前,使用機(jī)器學(xué)習(xí)方法分析學(xué)生已掌握的就業(yè)技能,能幫助學(xué)生明確自己的就業(yè)方向和職位,能顯著提高學(xué)生的就業(yè)機(jī)會(huì)。鑒于此,提出使用機(jī)器學(xué)習(xí)中FP關(guān)聯(lián)規(guī)則模型來(lái)分析學(xué)生掌握的技能與不同職位的匹配度,就可以分析出學(xué)生適合的職位。實(shí)驗(yàn)結(jié)果表明,所提方法能較準(zhǔn)確地分析出不同學(xué)生所適合的職位,可作為學(xué)生就業(yè)分析的有效依據(jù)。
關(guān)鍵詞:大數(shù)據(jù);機(jī)器學(xué)習(xí);就業(yè);tf-idf;畫(huà)像
中圖分類(lèi)號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009- 3044(2019)34-0190-02
當(dāng)前很多學(xué)生在就業(yè)時(shí)都存在著迷茫,不知道什么工作適合自己,不知道自己能勝任什么樣的工作;在招聘網(wǎng)站上尋找工作時(shí),看到眾多眼花繚亂的技能要求,卻很多都不甚了解,不知道自己能勝任哪些工作職位。這些都源自學(xué)生對(duì)自身所學(xué)技能和工作所需技能不了解所造成的。
本文從分析學(xué)生自身所掌握的技能與不同工作崗位所要求的技能出發(fā),通過(guò)機(jī)器學(xué)習(xí)方式尋找同一行業(yè)方向的相似工作崗位所需的技能,使學(xué)生了解到當(dāng)前行業(yè)所需的技能到底是怎樣的,有什么樣的趨勢(shì),然后通過(guò)分析學(xué)生個(gè)人自身掌握的技能向?qū)W生推薦其工作領(lǐng)域。從而幫助學(xué)生提升自己能力,并提高找到適合工作的機(jī)會(huì),為學(xué)生未來(lái)的發(fā)展提供一個(gè)參考。
1 模型分析
1.1 職位通用技能組
實(shí)際工作中總會(huì)遇到各種不同的項(xiàng)目和問(wèn)題,這就要求應(yīng)聘者必須具備處理復(fù)雜問(wèn)題的多種技能。因此,通常一個(gè)職位對(duì)技能的要求并不是單一的,而是一系列的相關(guān)技能的組合,以大數(shù)據(jù)開(kāi)發(fā)工程師為例,該職位通常會(huì)要求應(yīng)聘者具備Spark,Hadoop,Kafka等一系列分布式數(shù)據(jù)處理的相關(guān)技能,如下表所示:
由表1可知,不同招聘信息中同一職位中要求的職業(yè)技能通常是一組相關(guān)的技能,這些技能有的在多個(gè)招聘信息中多次出現(xiàn),如表中的Spark和Hadoop等,另一些技能則僅在某個(gè)或少數(shù)招聘信息中出現(xiàn),如Perl、MySql。后者所需的職位不多,應(yīng)聘者即便掌握也不易在應(yīng)聘中遇到;而前者則具有普遍性,掌握后能符合多數(shù)招聘信息需求,這部分技能才是文中進(jìn)行職位匹配所關(guān)注的。因此,通過(guò)FP關(guān)聯(lián)模型將同一職位中常用的相關(guān)技能提取出來(lái)形成該職位的通用技能組,如下圖所示:
1.2 個(gè)人就業(yè)技能畫(huà)像
要實(shí)現(xiàn)對(duì)精確到個(gè)人的職位推薦,還需要了解每個(gè)應(yīng)聘者所掌握的就業(yè)技能。對(duì)于學(xué)生,這些技能通常來(lái)自于課程學(xué)習(xí),或者從課外項(xiàng)目或假期實(shí)踐中學(xué)到。因此,個(gè)人就業(yè)技能畫(huà)像數(shù)據(jù)就來(lái)自以下兩個(gè)方面:
1)與學(xué)校教務(wù)處的課程學(xué)習(xí)數(shù)據(jù)庫(kù)連接,按專業(yè)獲取每個(gè)學(xué)生所學(xué)課程,從中提取出相關(guān)課程所教授的技能;
2)當(dāng)學(xué)生登錄系統(tǒng)時(shí),在個(gè)人賬號(hào)中補(bǔ)充自己在課程之外所掌握的技能。
系統(tǒng)中,學(xué)生在課外掌握的技能即使以課程內(nèi)技能補(bǔ)充的形式記錄,也可能因?yàn)檩斎胝邔?duì)技能的理解不一致等原因?qū)е峦患寄鼙灰圆煌拿Q等形式重復(fù)輸入。因此,兩處數(shù)據(jù)源中的數(shù)據(jù)可能存在重復(fù)或同一技能不同名稱等問(wèn)題,所以還需對(duì)數(shù)據(jù)整合并通過(guò)TF-IDF詞頻分析和ALS模型進(jìn)行數(shù)據(jù)清洗,清洗后就得到了個(gè)人就業(yè)技能的畫(huà)像,如下圖所示:
1.3 職位推薦
職位推薦不但需要向該學(xué)生推薦匹配度最高的職位,還需要為該學(xué)生分析出對(duì)指定職位仍欠缺的技能。
當(dāng)向?qū)W生推薦匹配度最高的職位時(shí),使用學(xué)生所掌握的技能和每個(gè)職位的通用就業(yè)技能組進(jìn)行匹配。由于是與職位的通用技能匹配,因此不再考慮技能的支持度與置信度。比較學(xué)生掌握的技能與FP模型中每個(gè)職業(yè)的通用技能組中的技能,以技能匹配個(gè)數(shù)為標(biāo)準(zhǔn),匹配個(gè)數(shù)最多的一個(gè)或多個(gè)職位就是與該學(xué)生最吻合的職位,如圖3所示:
上圖中左側(cè)是推薦的職位,右側(cè)是學(xué)生所掌握的該職位中的通用就業(yè)技能。從圖2中可以看出,與圖2中學(xué)生所掌握的技能最匹配的是大數(shù)據(jù)開(kāi)發(fā)工程師、大數(shù)據(jù)開(kāi)發(fā)負(fù)責(zé)人、大數(shù)據(jù)存儲(chǔ)工程師三個(gè)職位,每個(gè)職位的通用技能組中都有五個(gè)技能是該學(xué)生所掌握的。這也是該學(xué)生掌握的技能中與職位通用技能匹配最多的個(gè)數(shù),因此認(rèn)為這三個(gè)職位最合適該學(xué)生。
當(dāng)學(xué)生表露出對(duì)某一職位感興趣時(shí),還需要分析該職位的通用就業(yè)技能組中的哪些技能是該學(xué)生沒(méi)有掌握的,以此提高學(xué)生對(duì)自己需要掌握的技能樹(shù)的認(rèn)識(shí)。將學(xué)生感興趣的職位的通用技能從FP模型中提取出后,再與學(xué)生所掌握的技能進(jìn)行對(duì)比,就可以知道該學(xué)生為應(yīng)聘該職位所需要的努力方向了。重新選擇另一個(gè)只學(xué)習(xí)了較少大數(shù)據(jù)知識(shí)的學(xué)生應(yīng)聘算法工程師、Web開(kāi)發(fā)工程師和大數(shù)據(jù)工程師進(jìn)行技能分析,分析結(jié)果如下圖所示:
從圖4中可以看到系統(tǒng)分析出了該學(xué)生應(yīng)聘這三個(gè)職位還需要掌握的技能。
通過(guò)系統(tǒng)分析,就能很清楚地看到學(xué)生所適合的職位,以及應(yīng)聘某個(gè)職位時(shí)還需要掌握的技能。這就為學(xué)生進(jìn)入職場(chǎng)時(shí)對(duì)自身的認(rèn)識(shí)和就業(yè)方向提供了一個(gè)可靠的參考。
2 結(jié)束語(yǔ)
實(shí)驗(yàn)結(jié)果表明,所提方法能較準(zhǔn)確地通過(guò)學(xué)生自身掌握的技能和招聘信息中不同職位的通用技能組的匹配來(lái)分析出每個(gè)學(xué)生所適合的職位,以及應(yīng)聘某個(gè)職位時(shí)應(yīng)聘者所具有的優(yōu)勢(shì)和欠缺的技能,從而為不同的學(xué)生提供一個(gè)精確到個(gè)人的就業(yè)參考。
參考文獻(xiàn):
[1]孫怡帆,潘昆峰,孫正陽(yáng),等.大學(xué)生畢業(yè)去向預(yù)測(cè)的思路與方法——基于機(jī)器學(xué)習(xí)算法的嘗試[J].教育學(xué)術(shù)月刊,2019(5).
[2]李佐軍,大數(shù)據(jù)時(shí)代下關(guān)聯(lián)規(guī)則興趣度挖掘在就業(yè)分析中的應(yīng)用[J].軟件工程,2018(9).
[3]趙力衡,陳虹君.基于機(jī)器學(xué)習(xí)的招聘信息中就業(yè)技能提取的應(yīng)用分析[J].電腦知識(shí)與技術(shù),2019(13).
[4]姜紹俊,大數(shù)據(jù)支撐下的機(jī)器學(xué)習(xí)算法[J].電腦知識(shí)與技術(shù),2018(2).
[5]王芳,申貴成.機(jī)器學(xué)習(xí)算法在用戶行為中的應(yīng)用[J].電腦知識(shí)與技術(shù),2017(9).
【通聯(lián)編輯:唐一東】
收稿日期:2019-08-16
基金項(xiàng)目:基于機(jī)器學(xué)習(xí)的學(xué)生就業(yè)技能研究(2018JCKY0019)
作者簡(jiǎn)介:趙力衡(1976-),男,四川成都人,高級(jí)工程師,碩士,主要研究方向?yàn)榇髷?shù)據(jù)、物聯(lián)網(wǎng);李麗華(1985-),女,重慶人,副教授,碩士,主要研究方向?yàn)槲锫?lián)網(wǎng)。