金暉 譚文斌
摘? ?要:為解決準大學生和在校大學生職業(yè)定位不清晰的問題,文章提出了一種基于關聯(lián)規(guī)則的職業(yè)定位推理算法。通過對大學生個人性格特征、興趣愛好、特長及知識結構的職業(yè)定位推理計算,推理出準大學生和在校大學生可能的職業(yè)方向,有效實現(xiàn)了對用戶職業(yè)定位的推理,有助于準大學生和在校大學生及時找到自己的職業(yè)定位,明確發(fā)展方向。
關鍵詞:職業(yè)定位;關聯(lián)規(guī)則;性格特征;數(shù)據(jù)挖掘
當前,隨著大學生人數(shù)的逐年增加,大學生的就業(yè)形勢也變得日趨嚴峻,每年的應屆大學畢業(yè)生人數(shù)超過700萬。本文對此作了大量的調查和研究[1-5],調查結果顯示,超過20%的大學生沒有自己的職業(yè)規(guī)劃,16%的大學生不清楚自己適合做什么工作、將來能做什么工作,7%的大學生在虛度光陰,對就業(yè)前景感到迷茫。對此,本文依托大數(shù)據(jù)分析技術,提出了基于關聯(lián)規(guī)則的職業(yè)定位推理算法,構建了推理模型,擬通過對大學生個人性格特征、興趣愛好、特長以及知識結構等數(shù)據(jù)的分析,推理出適合該大學生的職業(yè)發(fā)展方向。
近年來,在基于關聯(lián)規(guī)則的數(shù)據(jù)挖掘方面,部分學者對此作了研究。王玲[6]提出了基于多維時態(tài)的關聯(lián)規(guī)則推理算法,實現(xiàn)了對時間序列的定量預測。亓文娟[7]提出了基于Apriori算法的航空設備故障關聯(lián)分析方法,以助于航空設備故障分析。劉莉萍[8]對增量式關聯(lián)規(guī)則挖掘算法進行了研究,提出了提取頻繁項集的方法。陳秀秀[9]對基于Spark的并行關聯(lián)規(guī)則挖掘算法進行了分類和綜述,對并行關聯(lián)規(guī)則等算法的優(yōu)缺點和適用范圍進行了總結,以上研究為本文的研究工作提供了參考。
1? ? 職業(yè)定位推理算法的相關定義
基于上述分析,本文將重新構建評論語句的相似度計算模型,為便于描述,本文對相關概念作如下定義。
定義1:個人性格特征和興趣集合Charac={CN,N=1,2,3,…},CN表示集合C中第N個特征。
定義2:職業(yè)集合Prof={PM,M=1,2,3,…},PM表示集合P中第M個職業(yè)。
定義3:設定集合X和集合Y,x屬于X中的元素,y屬于Y中的元素,X集合是由CN及其推理出來的結果集組成,Y集合是由PM及其推理出來的結果集組成。
定義4:規(guī)則集合R={RK,K=1,2,3,…},RK表示集合R中第K個規(guī)則,用表達式表示為XKYK。
定義5:最小支持度為S,表示集合X中的x和集合Y中的y同時存在的記錄數(shù)Count(x∪y)占記錄總數(shù)N的比例。通過該參數(shù)來反映所推理規(guī)則的有用性,其計算公式如式(1)所示:
S=Support(x→y)=Count(x∪y)/N? ? ?(1)
定義6:置信度Conf,表示集合X中的x和集合Y中的y同時存在的記錄數(shù)Count(x∪y)與集合X的總數(shù)Count(X)之比,其計算公式為:
Conf=Confidence(x→y)=Count(x∪y)/Count(X)? ? (2)
定義7:固定推理路徑集合I={IM,M=1,2,3,…},IM表示集合I中第M個固定規(guī)則,該規(guī)則集合中的元素滿足任意一個規(guī)則都具備滿足最小支持度S和最小置信度Conf,該規(guī)則為人工添加,通過查閱資料和統(tǒng)計數(shù)據(jù)獲得。
基于上述定義,對用戶輸入的特征及興趣集合C,將進行職業(yè)定位算法運算,以得到職業(yè)PM。
2? ? 算法描述
職業(yè)定位推理算法首先根據(jù)用戶輸入的性格和興趣特征描述,將其與規(guī)則庫里面的規(guī)則進行匹配,推理出可能的職業(yè)定位方向,現(xiàn)將職業(yè)定位推理算法描述如下。
(1)讀取用戶個人性格特征和興趣數(shù)據(jù)集,得到集合C。
(2)根據(jù)步驟(1)中得到的數(shù)據(jù)集合,與集合R和I中的關聯(lián)規(guī)則進行匹配和推理,得出用戶可能的職業(yè)方向,以供用戶選擇。
(3)根據(jù)步驟(2)中得到的可能職業(yè)方向,梳理出為實現(xiàn)該目標所需要的知識和技能,以告知用戶實現(xiàn)各目標的有效路徑。
基于以上描述,算法流程如下:
算法:職業(yè)定位算法
Input:個人性格特征和興趣集合Charac
Output:可能的職業(yè)方向
DEFINE? ?MID_SET
SCANF? Charac={CN,N=1,2,3,…}? ? //用戶輸入特征描述
FOR CN OR Characsubset? IN? Charac:
FOR? i? IN? R∪I:? ?//其中R={RK,K=1,2,3,…},I={IM,M=1,2,3,…}
IF? ?i? ?Matched? CN:
MID_SET? ?ADD? ?i
ENDIF
ENDFOR
ENDFOR
FOR? m? in? ?MID_SET:
EXTRACT END of m INTO? RESULT_SET
ENDFOR
Output? ?RESULT_SET
END
通過對用戶性格特征和興趣數(shù)據(jù)集的推理,實現(xiàn)對用戶職業(yè)方向的定位。
3? ? 算法實例
當用戶輸入{待遇好、時間自由、喜歡編程、工作強度較大、數(shù)學較好}信息后,根據(jù)用戶輸入進行推理,得到的結果如圖1所示,得出用戶可能的職業(yè)是技術工程師中的軟件開發(fā)工作。
4? ? 結語
本文對關聯(lián)規(guī)則算法進行了改進,通過查閱資料和統(tǒng)計數(shù)據(jù)獲得部分固定規(guī)則,共同組成了關聯(lián)規(guī)則集合,在此基礎上,構建了職業(yè)定位算法。通過對用戶輸入的數(shù)據(jù)進行推理,查找出用戶可能的職業(yè)方向,有效實現(xiàn)了對用戶職業(yè)定位的推理,有助于準大學生和在校大學生及時找到自己的職業(yè)定位,明確發(fā)展方向。
[參考文獻]
[1]劉芷含.大學生就業(yè)壓力與主觀幸福感:雙向中介效應[EB/OL].(2019-04-16)[2019-06-25].https://doi.org/10.16128/j.cnki.1005-3611.2019.02.034.
[2]張樹峰.當前大學生就業(yè)問題:外部環(huán)境變化與就業(yè)選擇理性[J].科教文匯,2019(4):7-8.
[3]李斯.新形勢下高校大學生創(chuàng)業(yè)孵化基地服務體系研究[J].河北軟件職業(yè)技術學院學報,2019(1):30-32.
[4]賀娜.供給側改革視角下大學生就業(yè)競爭力提升對策研究[J].黑河學刊,2019(2):12-14.
[5]吳長城.“95后”高校畢業(yè)生就業(yè)壓力研究[J].信陽農(nóng)林學院學報,2019(1):145-148.
[6]王玲,孟建瑤,李俊飛,等.基于多維時態(tài)關聯(lián)規(guī)則的演化模糊推理預測算法[J].自動化學報,2018(8):1446-1459.
[7]亓文娟.增量式關聯(lián)規(guī)則挖掘算法的研究[J].安陽工學院學報,2018(6):47-49.
[8]劉莉萍,章新友,牛曉錄,等.基于Spark的并行關聯(lián)規(guī)則挖掘算法研究綜述[EB/OL].(2019-04-16)[2019-06-25].http://kns.cnki.net/kcms/detail/11.2127.TP.20190128.1804.009.html.
[9]陳秀秀,劉凱,馬雙濤,等.基于Apriori算法的航空設備故障關聯(lián)分析[J].山東師范大學學報(自然科學版),2019(1):48-53.
Research on reasoning algorithms of professional location based on association rules
Jin Hui, Tan Wenbin*
(Tongren University, Tongren 554300, China)
Abstract:In order to solve the problem of unclear career orientation of prospective and college students, a reasoning algorithm for career orientation based on association rules is proposed in this paper. By reasoning and calculating the career orientation of college students personality characteristics, hobbies, specialties and knowledge structure, the possible career orientation of prospective college students and college students can be inferred, and the reasoning of users career orientation can be effectively realized. It is helpful for prospective college students and college students to find their own career orientation in time and make clear the direction of development.
Key words:career orientation; association rules; personality characteristics; data mining