陳永康 章美仁
摘要:針對目前在線教育與網(wǎng)絡招聘的發(fā)展情況,通過對現(xiàn)有平臺運營模式的分析研究,提出構建基于大數(shù)據(jù)的在線就業(yè)課程推薦系統(tǒng)。本文詳細闡述了在大數(shù)據(jù)時代通過數(shù)據(jù)分析將在線教育與網(wǎng)絡招聘融合發(fā)展的前景及必要性,最后通過實驗,運用Apriori算法和協(xié)同過濾算法對真實的在線學習數(shù)據(jù),網(wǎng)絡招聘數(shù)據(jù)以及個人信息進行關聯(lián)規(guī)則挖掘,提供個性化課程崗位推薦,得出在大數(shù)據(jù)背景下在線教育與網(wǎng)絡招聘融合發(fā)展是未來準確方向的結論。
關鍵詞:大數(shù)據(jù);在線教育;網(wǎng)絡招聘;推薦系統(tǒng);融合發(fā)展
引言
隨著互聯(lián)網(wǎng)的快速發(fā)展,在線教育與網(wǎng)絡招聘隨之崛起,人們的學習模式和求職招聘方式得到了深刻的改變。
在線教育的出現(xiàn)使“教”與“學”得以在不同的時空進行,打破了時間和空間的阻隔,大大便捷了教學的進行。網(wǎng)絡資源的可共享性使得眾多稀缺、珍貴、高質量的教學資源得以廣泛廉價地傳播,有效緩解了不同地區(qū)教育資源不公平的情況,促進了教育的公平性。同時,在教與學的過程中,用戶的在線學習,經(jīng)過線上學習規(guī)劃,名師視頻學習,線上習題測試,學習論壇討論等在線學習行為,產(chǎn)生了海量的學習數(shù)據(jù)。這些數(shù)據(jù)對線上教學的進一步優(yōu)化有十分重要的意義。
網(wǎng)絡招聘從興起到發(fā)展的十幾年中憑借其速度快、成本低、招聘范圍廣、無地域限制、高效便捷等優(yōu)勢快速占領傳統(tǒng)招聘市場。傳統(tǒng)的求職就業(yè)模式在互聯(lián)網(wǎng)發(fā)展的沖擊下被迫轉型甚至逐漸消亡。據(jù)艾瑞咨詢統(tǒng)計顯示:從2014Q1到2015Q4,企業(yè)通過城市公共就業(yè)服務機構進行招聘的崗位越來越少,2015Q1同比減少14.9%,全年總人數(shù)減少9.7%;通過公共就業(yè)服務機構進行求職的求職者人數(shù)也在不斷下降,2015Q1同比減少144%,全年總人數(shù)減少7.6%。艾瑞分析認為,在互聯(lián)網(wǎng)大環(huán)境下,傳統(tǒng)招聘模式覆蓋率低、效率差、成本高的弊端逐漸顯現(xiàn),同時隨著互聯(lián)網(wǎng)對各個行業(yè)的滲透,傳統(tǒng)行業(yè)也傾向采用互聯(lián)網(wǎng)招聘的方式。傳統(tǒng)招聘規(guī)模下降顯而易見。
然而隨著大數(shù)據(jù)時代的到來,持續(xù)增長的課程資源和職位信息卻為用戶的選擇帶了困擾。用戶面對海量的職位信息與在線課程資源時往往難以抉擇,不知道所學或所擁有的技能對應哪些熱門就業(yè)崗位,不知道什么崗位適合自己,不知道相關崗位需要掌握哪些課程知識,不知道哪些課程是優(yōu)質資源。
針對這一現(xiàn)象,我們清楚地認識到,線上的學習就業(yè)與線下的學習就業(yè)一樣,具有密切的聯(lián)系,是難以分割,互為因果的整體。而在他們之間存在一個亟需解決的問題——如何解決課程自主學習與職業(yè)選擇之間的關聯(lián)決策。以大數(shù)據(jù)為技術背景,通過對現(xiàn)有模式研究,提出只有以用戶個人能力為鏈接點,將在線教育與網(wǎng)絡招聘融合發(fā)展,為用戶提供個性化的從學習到就業(yè)一條龍的生態(tài)服務才是大數(shù)據(jù)時代規(guī)避數(shù)據(jù)風險,利用數(shù)據(jù)價值的最好方式。
1、大數(shù)據(jù)驅動下在線學習就業(yè)融合發(fā)展
分析當下在線教育與網(wǎng)絡招聘割裂發(fā)展的現(xiàn)狀,提出“在線教育+數(shù)據(jù)分析+網(wǎng)絡招聘”的新發(fā)展模式。
以數(shù)據(jù)分析、關聯(lián)匹配等大數(shù)據(jù)技術作支持,用戶能力培養(yǎng)為紐帶,將“用戶”、“學習資源”、“崗位信息”串聯(lián)貫通,實現(xiàn)為每一位用戶提供個性化的學習就業(yè)規(guī)劃以及相匹配的學習資源和崗位信息。
通過在線學習就業(yè)的融合發(fā)展,針對“在校大學生”、“應屆畢業(yè)生”、
“在職人員”三類用戶群體個人能力培養(yǎng)的不同訴求設計了五條用戶數(shù)據(jù)分析和資源提供的流程。
1)專業(yè)——能力——在線課程
2)在線課程——能力——崗位
3)崗位——能力——在線課程
4)崗位——公司——能力培養(yǎng)
5)能力——崗位——在線課程
五條推薦模式是網(wǎng)絡招聘與在線學習在大數(shù)據(jù)迅猛發(fā)展的背景下,共享并挖掘彼此的用戶數(shù)據(jù),通過相關數(shù)據(jù)挖掘、推薦算法所產(chǎn)生的新的服務模式,也是在線教育與網(wǎng)絡招聘利用大數(shù)據(jù)這一技術在融合發(fā)展之后新的前景。
可以看到,五條新流程都出現(xiàn)了“能力”一詞。能力作為用戶最初與核心訴求,是在線學習的最終目的,是網(wǎng)絡求職的首要條件,自始至終貫穿在學習到就業(yè)這一流程之中。將其作為新模式下的核心鏈接點,在分析用戶能力訴求和工作能力的基礎上為用戶推薦課程及崗位,在了解用戶求職取向的基礎上對用戶進行能力培養(yǎng)等等緊密相連的服務模式都可以實現(xiàn)。而實現(xiàn)這些新模式的首要條件是在線學習與網(wǎng)絡招聘的融合發(fā)展,充分利用各自的服務獲取用戶學習就業(yè)數(shù)據(jù)并在數(shù)據(jù)分析的基礎上進行關聯(lián)匹配,為彼此的個性化推薦服務提供重要依據(jù)。
2、構建基于大數(shù)據(jù)的在線就業(yè)課程推薦系統(tǒng)
2.1個性化推薦技術
個性化推薦是推薦系統(tǒng)根據(jù)用戶的個性化特征,如興趣、愛好、職業(yè)或專業(yè)特點等,主動地向用戶推送適合其學習需要或可能感興趣的信息資源的一種推薦技術。隨著用戶的數(shù)據(jù)種類與數(shù)據(jù)量迅速增加,當餐飲、娛樂、學習、健身等平臺的數(shù)據(jù)匯集到一起時,針對單一用戶可提供的個性化推薦服務將不單單是割裂的餐飲、學習、購物等推薦。如阿里巴巴在云棲大會上提及的:早年的阿里巴巴,淘寶,支付寶,1688,口碑,天貓等每一個業(yè)務板塊都有自己搭建的數(shù)據(jù)平臺,數(shù)據(jù)共享變得十分困難。一個統(tǒng)一全部異構的技術平臺是未來的方向。在這樣的模式下,用戶將會獲得更全面,更精確,更有效率和價值的個性化推薦。而這也是在線教育與網(wǎng)絡招聘的發(fā)展方向。
此外,通過個性化推薦技術,用戶在工作、學習、出游等生活活動上的經(jīng)驗也會被推薦給有需求的用戶。通過對所有用戶數(shù)據(jù)的分析獲得用戶畫像,找到并推薦與目標用戶具有相似興趣偏好的用戶或相關的信息資源。以此來滿足用戶對于信息資源的個性化需求。
2.2Apriori算法
Apriori算法的經(jīng)典實例便是“尿布與啤酒”。通過對商品購買情況的記錄和分析,幫助商家對用戶的購買習慣有一個更深入的了解,從而制定出更優(yōu)的銷售策略。
Apriori算法的基本原理是先從數(shù)據(jù)集中獲得頻繁項集,即將常常共同出現(xiàn)的物品集合作為一個項集,并獲得該項集對應記錄出現(xiàn)的次數(shù)。將該值除以數(shù)據(jù)記錄的總和以求得項集支持度,進一步通過與項集中元素的支持度作比獲得可信度或置信度。支持度與可信度是將某一項集的關聯(lián)分析量化,為判斷分析成功與否提供了重要的判斷依據(jù)。
2.3協(xié)同過濾算法
個性化推薦技術能克服傳統(tǒng)資源檢索方式的缺陷,其中,協(xié)同過濾推薦技術是一種應用最為廣泛的個性化推薦技術。協(xié)同過濾算法通過對用戶視頻學習、線上作答、社區(qū)討論、求職簡歷、工作履歷、課程選擇等數(shù)據(jù)集的挖掘分析后為每一位用戶形成一個用戶畫像,在此基礎上將不同用戶畫像進行對比分析,進一步為目標用戶尋找到與其興趣愛好、學習情況等最為相近的用戶集,將他們所關注的項推薦給目標用戶。
協(xié)同過濾算法實現(xiàn)主要分為數(shù)據(jù)的表示、最近鄰居集的匹配以及top-N數(shù)據(jù)集的推薦。其基本原理首先對一個歷史數(shù)據(jù)集進行數(shù)據(jù)分析,通過一張i*j的表格呈現(xiàn)歷史數(shù)據(jù),i和i分別代表用戶和與用戶相關的興趣項。例如:在獲取的海量的用戶學習到就業(yè)的一系列數(shù)據(jù)中,用戶的視頻學習、測驗成績、工作經(jīng)歷都會被量化作為i中的數(shù)據(jù)項。當一個新的數(shù)據(jù)集出現(xiàn)的時候,就可以通過協(xié)同過濾算法進行鄰居匹配,為當前數(shù)據(jù)集找到“最近鄰居”集。并通過余弦相似性和相關相似性度量鄰居集與目標用戶的相似程度,最后根據(jù)鄰居集的數(shù)據(jù)特稱對當前數(shù)據(jù)集進行課程或崗位等其它興趣項推薦。
2.4算法及個性化推薦的實現(xiàn)
在“在線學習+數(shù)據(jù)分析+網(wǎng)絡招聘”的新模式中,系統(tǒng)采用python語言制作爬蟲,抓取用戶信息,在線課程信息與招聘網(wǎng)職位信息以及與之相關的評論內容。通過Apriori關聯(lián)算法分析課程與職位之間的關聯(lián)規(guī)則以及基于就業(yè)技能的課程頻繁項集,使用協(xié)同過濾算法對就業(yè)崗位與在線課程進行推薦與決策支持。實現(xiàn)了根據(jù)用戶自身愛好和特長,幫助用戶選擇符合自身特點的熱門崗位,并對該崗位所需的在線課程進行推薦。
通過Apriori算法,以“能力需求”為鏈接點,對“在線課程”“線上崗位”“用戶信息”進行頻繁項集分析,獲取“課程一能力”“能力一崗位”“能力一用戶”之間的關聯(lián),從而獲得“課程一崗位一用戶”之間關聯(lián)的頻繁項集。通過測試集數(shù)據(jù)庫對獲得的頻繁項集的檢驗,不斷調整最小支持度獲得最合適的支持度設定值,并進一步計算出符合要求的項集的可信度。在此基礎上,當目標用戶選擇某一課程或某一崗位時就會在系統(tǒng)中出現(xiàn)“尿布與啤酒”的效果。一方面用戶的課程學習與崗位選擇聯(lián)系在了一起,另一方面則有益于在線教育與網(wǎng)絡招聘的發(fā)展。
協(xié)同過濾算法的實現(xiàn)則主要集中在對用戶數(shù)據(jù)集的分析,通過協(xié)同過濾算法挖掘分析所有和某一用戶相關的學習、就業(yè)、興趣愛好等數(shù)據(jù),為所有用戶形成唯一的用戶畫像,并以時間軸的方式呈現(xiàn)用戶的學習就業(yè)歷程。當目標用戶在系統(tǒng)中輸入自己的相關特征時,系統(tǒng)通過收集該用戶的相關信息進行協(xié)同過濾算法分析,為其獲得最優(yōu)鄰居的相關數(shù)據(jù)并進一步根據(jù)這個結果進行崗位和學習資源的推薦。
3、結束語
當下,用戶面對的不再單單是資源匱乏的問題,更迫切的需求是幫助他們在海量的資源中做出選擇。
在線教育與網(wǎng)絡招聘平臺都已經(jīng)發(fā)展到了一個至關重要的環(huán)節(jié)。在這個環(huán)節(jié),曾經(jīng)匱乏的在線課程和職位或是求職信息都不再是問題的關鍵,如何在海量的信息資源中高效地篩選出高質量、高精度、個性化的信息資源推薦給用戶成為各平臺無法逃避的問題。
然而,想要解決這一問題單將目光局限在各自平臺上的數(shù)據(jù)是難以實現(xiàn)的。用戶的學習和就業(yè)是緊密相連、互為因果的過程。只有在線教育明確了用戶的求職目標、工作歷程才能更好地提供課程推薦服務,也只有網(wǎng)絡招聘在清楚了用戶的學習過程、學習能力才能提供更合適的崗位。