梁亞玲,高 銘
(江漢大學(xué) 商學(xué)院,武漢 430056)
信息技術(shù)的發(fā)展帶來了數(shù)據(jù)量爆發(fā)式的增長,“互聯(lián)網(wǎng)+”模式逐漸成為主流,如今大數(shù)據(jù)應(yīng)用已經(jīng)滲透到各個行業(yè)的各種業(yè)務(wù)模式之中。中國互聯(lián)網(wǎng)絡(luò)信息中心(CNNIC)發(fā)布的《中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計報告》顯示,截至2020年12月,我國網(wǎng)民規(guī)模達9.89億,較2020 年3 月增長8540 萬,互聯(lián)網(wǎng)普及率達70.4%。
新冠疫情進入常態(tài)化以來,大數(shù)據(jù)技術(shù)幾乎應(yīng)用于全球范圍內(nèi)各個領(lǐng)域與各個行業(yè)中,進一步擴大了市場對于數(shù)字化人才的需求。根據(jù)領(lǐng)英人才報告庫發(fā)布的《全球數(shù)字人才發(fā)展年度報告(2020)》顯示,歐洲有將近一半的數(shù)字化人才流向亞太地區(qū),這也間接表明了亞太地區(qū)數(shù)字經(jīng)濟的發(fā)展活力。在“第十四個五年規(guī)劃”提出之后,政府也陸續(xù)出臺了相關(guān)政策推進大數(shù)據(jù)行業(yè)的發(fā)展與傳統(tǒng)行業(yè)的數(shù)字化轉(zhuǎn)型,導(dǎo)致不同領(lǐng)域?qū)?shù)字化人才需求的側(cè)重點與要求出現(xiàn)了非常大的差異。
中國信通院《2021 年中國數(shù)字經(jīng)濟就業(yè)發(fā)展研究報告》指出:產(chǎn)業(yè)數(shù)字化領(lǐng)域招聘人數(shù)占總招聘人數(shù)的75.8%。數(shù)據(jù)經(jīng)濟大力發(fā)展的同時,進一步擴大了數(shù)字化人才的需求缺口,目前國內(nèi)大數(shù)據(jù)產(chǎn)業(yè)主要集中在東部沿海地區(qū),與之相比中西部地區(qū)的數(shù)字化經(jīng)濟發(fā)展則相對落后。數(shù)字經(jīng)濟發(fā)展的不平衡也說明了整個大數(shù)據(jù)行業(yè)缺乏明確的發(fā)展方向與規(guī)劃,而根本原因是已有人才在數(shù)量與質(zhì)量上都不能滿足數(shù)字化發(fā)展的需求,制約了數(shù)字經(jīng)濟的發(fā)展。
一般認(rèn)為掌握ICT(信息與通信技術(shù))相關(guān)技能并能夠運用的人就是數(shù)字化人才,但這樣的定義是不充分、不全面的。本文認(rèn)為,2019 年怡安翰威特咨詢公司提出的“數(shù)字化人才”概念對數(shù)字化人才的定義是比較符合企業(yè)需求的。該公司認(rèn)為,僅有優(yōu)秀ICT技能的技術(shù)人員并不足以滿足企業(yè)的數(shù)字化變革需求,在企業(yè)中一般要求員工具有真正匹配數(shù)字化時代的勝任力——由于職能的不同,未必需要其掌握數(shù)字化的技術(shù),但必須具有數(shù)字化的思維與特質(zhì)。怡安翰威特咨詢公司發(fā)布的數(shù)字化勝任力模型指出:數(shù)字化人才有三大勝任力,即學(xué)習(xí)能力、靈活性與好奇心,以及八大輔助勝任力即成功的意愿、數(shù)據(jù)處理能力,解決問題的策略、商業(yè)敏銳度、遠程協(xié)作、數(shù)字化溝通、毅力以及樂于助人的品質(zhì),這些,都是數(shù)字化人才的“軟實力”。
數(shù)字化人才不僅需要懂得相關(guān)的技能,同時還要掌握統(tǒng)計學(xué)、管理學(xué)等方面的知識。數(shù)字化人才培養(yǎng)過程漫長,同時又會涉及多個學(xué)科交叉的過程,而企業(yè)的培養(yǎng)模式通常都不夠成熟和系統(tǒng)。不少企業(yè)員工都是邊工作邊學(xué)習(xí)相關(guān)的培訓(xùn)課程,而且企業(yè)培訓(xùn)的進度安排較為緊湊,沒有考慮到員工能否掌握。同時,大數(shù)據(jù)相關(guān)的知識體系非常復(fù)雜,對員工開展在職培訓(xùn)也很難收到實質(zhì)性的效果。
目前大多數(shù)高校大數(shù)據(jù)專業(yè)是新設(shè)立的,對于使用的教材與教師講授的內(nèi)容沒有明確的規(guī)劃。同時在講授過程中也不夠注重實踐,課堂上缺乏項目來引導(dǎo)學(xué)生的興趣,學(xué)生往往在結(jié)課時才能有系統(tǒng)的實驗課程來練手,導(dǎo)致許多大數(shù)據(jù)專業(yè)的學(xué)生往往對于相關(guān)理論概念有印象,但是對于企業(yè)中真正的大數(shù)據(jù)處理與分析的具體流程與相關(guān)技能要求一知半解。事實上,學(xué)生在缺少實際應(yīng)用場景的學(xué)習(xí)模式下,通過書本去學(xué)習(xí)大數(shù)據(jù)本身就是一個問題,從而導(dǎo)致高校培養(yǎng)的畢業(yè)生往往不能滿足企業(yè)的用人需求,企業(yè)需要進行漫長的二次培養(yǎng)。
本文綜合考慮招聘網(wǎng)站的權(quán)威性、抓取難度后,以“大數(shù)據(jù)”為檢索關(guān)鍵字從51job 上搜索招聘信息。本文的研究方案主要從以下五個方面進行:第一,對獲得的數(shù)據(jù)進行清洗,去除無效、非結(jié)構(gòu)化數(shù)據(jù);第二,再對招聘信息的崗位描述進行文本整合,通過python 進行分詞處理,提取出頻率最高的關(guān)鍵詞;第三,運用數(shù)據(jù)挖掘技術(shù)對相應(yīng)關(guān)鍵詞進行詞頻統(tǒng)計并以K-means算法對關(guān)鍵詞進行聚類分析;第四,運用FineBI 數(shù)據(jù)可視化工具進行數(shù)據(jù)可視化;第五,對上述結(jié)果進行相應(yīng)分析。
本文為保證數(shù)據(jù)量的可靠性,通過自己編寫程序抓取了51job 上59 222 條原始數(shù)據(jù),通過Excel 對所得信息進行清洗,保留按“月”顯示的工資信息;工作地點為具體城市;工作經(jīng)驗為:年、無須經(jīng)驗、在校生/應(yīng)屆生;學(xué)歷要求為:博士、碩士、本科、大專、高中、初中及以下的數(shù)據(jù),最后對重復(fù)值進行刪除,保留清洗后的44 663 條數(shù)據(jù)。
對清洗后數(shù)據(jù)“崗位描述”字段進行文本整合,將整合好的文本內(nèi)容進行預(yù)處理,包括更新詞表、分詞、詞頻統(tǒng)計等過程,保留詞頻大于100 的關(guān)鍵詞81 個。
采用K-means 聚類算法進行聚類分析,在使用該算法進行分析之前需要將文本進行向量化處理,所以本文使用TF-IDF(逆文檔頻率)算法來實現(xiàn)文本信息的向量化,例如,tf 代表詞頻,對于某一關(guān)鍵詞t來說,它的詞頻計算公式如下:
逆向文本頻率idf 如果包含詞條t 的文檔越少,idf 越大,說明詞條具有很好的類別區(qū)分能力。其中|D|代表劃分的文件總數(shù),|D|代表包含關(guān)鍵詞ti 的文件數(shù)目,公式如下:
最后計算出t的權(quán)重,公式如下:
對于K-means 算法,其中K 的值代表聚類的數(shù)量,本文設(shè)置為4,分別為:業(yè)務(wù)能力、技能要求、專業(yè)及學(xué)歷要求、個人素質(zhì)相關(guān)要求。
目前來說,大數(shù)據(jù)的主要應(yīng)用領(lǐng)域依舊為計算機軟件行業(yè),占比大致為27.16%,但是對比以前,占比已經(jīng)大幅度下降。電子商務(wù)、房地產(chǎn)、網(wǎng)絡(luò)通信、金融類、教育、零售業(yè)等行業(yè)對于數(shù)字化人才的需求大幅度增加,其中金融類行業(yè)占比達到2.37%,對高校商學(xué)院畢業(yè)生來說也是一個新的就業(yè)方向,如圖1 所示。
圖1 招聘行業(yè)分布圖
同時,在疫情的影響下,教育、醫(yī)療、電子商務(wù)、金融等行業(yè)對于數(shù)字化人才的需求增加。疫情期間,線上辦公、學(xué)習(xí)使得線上作業(yè)成為一種常態(tài);疫情后像京東等大型企業(yè)也開始進軍“互聯(lián)網(wǎng)+”醫(yī)療領(lǐng)域;而電子商務(wù)在這次疫情中充分發(fā)揮了自身優(yōu)勢,許多新用戶開始網(wǎng)上購物,用戶數(shù)量的激增加速了電子商務(wù)數(shù)字化的發(fā)展;對金融行業(yè)來說,由于疫情原因,90%以上的業(yè)務(wù)都需要通過線上的渠道完成,進一步推動了行業(yè)的數(shù)字化轉(zhuǎn)型。
數(shù)字化崗位在全國的分布不是非常廣泛,全國大數(shù)據(jù)發(fā)展中心集中在長三角、珠三角地區(qū),其中人才需求數(shù)量最多的8 個城市為:上海、深圳、廣州、北京、南京、成都、武漢、杭州。由于國家對受疫情影響企業(yè)的扶持以及“十四五”規(guī)劃的實施,在2020 年,武漢借助國家與湖北省的支持,大力發(fā)展新興行業(yè),提供了大量的數(shù)字化就業(yè)崗位,同時通過降低畢業(yè)生的生活成本與創(chuàng)業(yè)成本,使得更多武漢畢業(yè)生愿意留漢工作創(chuàng)業(yè)。
本文繪制在不同工作經(jīng)驗區(qū)間的薪資分布圖來分析大數(shù)據(jù)崗位招聘對于工作經(jīng)驗的偏好,如圖2、圖3 所示。數(shù)字化相關(guān)崗位對于應(yīng)聘者無經(jīng)驗數(shù)量占比為31.4%,薪資主要分布在6 000~ 15 000 元/月,良好的薪資待遇一定程度上說明了疫情之后全國范圍對于數(shù)字化崗位需求的迫切程度。而對于需要經(jīng)驗的崗位,需求主要集中在3~ 4 年工作經(jīng)驗,同時薪資10 000~ 20 000 元/月之間的人數(shù)占比超過一半,從用人成本上來說,3~ 4年經(jīng)驗人才也更容易令企業(yè)接受。工作經(jīng)驗在5~ 7 年的需求人數(shù)大幅度減少,但是相應(yīng)的薪資也是遠遠高于其他工作經(jīng)驗區(qū)間,其中最高能達到40 000 元/月。總結(jié)來說,數(shù)字化人才的需求缺口非常之大,導(dǎo)致對于工作經(jīng)驗的要求不是很看重的同時薪資福利非常可觀。
圖2 數(shù)字化人才工作經(jīng)驗與薪資分布圖
圖3 數(shù)字化相關(guān)崗位經(jīng)驗分布圖
在學(xué)歷方面,大專和本科的需求數(shù)量占據(jù)了整個需求的93.9%,其中對大專學(xué)歷的需求達到32.94%,對互聯(lián)網(wǎng)行業(yè)來說是罕見的,說明企業(yè)往往難以招聘到足夠的人才。但其對于人才也具有一定的技能性要求和學(xué)習(xí)能力的偏好;而碩士與博士僅占3.31%,主要集中在涉及算法的崗位,其對于專業(yè)技能的掌握程度有更嚴(yán)格的要求。如圖4 所示。
圖4 數(shù)字化相關(guān)崗位學(xué)歷要求占比
總結(jié)來說,數(shù)字化人才的缺口導(dǎo)致企業(yè)對招聘學(xué)歷的要求不像以前一樣嚴(yán)格,企業(yè)更加看重人才的綜合能力。
3.5.1 數(shù)字化人才整體技能要求
本文通過自定義分詞的方式對招聘描述文本信息進行分詞處理,選取了英文詞頻數(shù)前28 個與中文詞頻數(shù)前53個關(guān)鍵詞通過FineBI生成詞云圖,如圖5所示。數(shù)字化崗位更加看重人才是否具備經(jīng)驗,包含學(xué)習(xí)、工作經(jīng)驗,以及生活中的人際交往與團隊協(xié)作等方面的經(jīng)驗。同時,對于“開發(fā)”能力也有一定要求??偟膩碚f,數(shù)字化相關(guān)的崗位不僅僅只看專業(yè)技能,也注重個人綜合素質(zhì)。
圖5 數(shù)字化相關(guān)崗位整體能力要求
3.5.2 數(shù)字化崗位高頻率的技能需求分析
使用技能分類關(guān)鍵詞生成詞云,如圖6 所示。其中數(shù)據(jù)庫出現(xiàn)的次數(shù)最多,說明對于數(shù)據(jù)處理、分析方面的要求比較高,除了SQL 相關(guān)基礎(chǔ)技能外,對于hadoop、python、spark、redis 等大數(shù)據(jù)處理工具也要求掌握。在編程語言方面,對人才的編程能力要求不高,工作中大多使用java 與python,但是對于算法方面會有一定的要求??偨Y(jié)來說,數(shù)字化行業(yè)進入門檻不高。
圖6 數(shù)字化相關(guān)崗位高頻技能
3.5.3 數(shù)字化崗位綜合素質(zhì)需求分析
通過對綜合能力類的關(guān)鍵詞生成詞云,如圖7 所示。大多數(shù)企業(yè)更加喜歡招聘具有相關(guān)經(jīng)驗的人才來減少企業(yè)的用人成本;同時要求應(yīng)聘者能夠通過團隊合作溝通來快速完成崗位工作;硬性要求具備相應(yīng)的分析能力,需要對公司的業(yè)務(wù)與客戶的需求能深度理解,能夠通過分析、處理、團隊協(xié)作來解決相應(yīng)的問題。
圖7 數(shù)字化崗位綜合素質(zhì)要求
大多數(shù)企業(yè)對數(shù)字化人才的專業(yè)技能掌握程度要求不高,更多聚焦在綜合素質(zhì)方面。在2016 年中國首次設(shè)立大數(shù)據(jù)專業(yè)時,僅僅只有3 所高校設(shè)立該專業(yè),到目前全國大部分高校都相繼設(shè)立了大數(shù)據(jù)專業(yè),足以看出大數(shù)據(jù)未來的發(fā)展趨勢。但目前企業(yè)招聘的數(shù)字化人才中大部分都是計算機類專業(yè)的學(xué)生,讓他們通過短期的崗前培訓(xùn)來填補數(shù)字化崗位的缺口。高校培養(yǎng)的人才數(shù)量、質(zhì)量遠遠達不到預(yù)期。
本文研究發(fā)現(xiàn):企業(yè)對人才招聘的注重點更偏向于招收具有相關(guān)經(jīng)驗的人才,用以減少企業(yè)的培養(yǎng)成本;相較于傳統(tǒng)互聯(lián)網(wǎng)行業(yè)來說,企業(yè)對于專業(yè)技能掌握程度的要求并不是很高,更注重人才的綜合素質(zhì)以及工作中的分析、處理問題能力。但目前高校培養(yǎng)人才過于注重理論學(xué)習(xí),導(dǎo)致畢業(yè)生沒有相應(yīng)的項目經(jīng)驗,而且許多高校的大數(shù)據(jù)專業(yè)往往都是在原有信息管理或計算機相關(guān)專業(yè)的基礎(chǔ)上設(shè)立,相關(guān)課程的設(shè)置不夠合理、科學(xué)。
高校應(yīng)當(dāng)是數(shù)字化人才的培養(yǎng)基地,培養(yǎng)的畢業(yè)生除了具有基礎(chǔ)知識,還要具有一定的實踐能力。如果剛畢業(yè)就能滿足企業(yè)中低崗位的從業(yè)要求,即有一定的實際應(yīng)用能力,那么就會具有相當(dāng)?shù)母偁幜?。這種實際應(yīng)用能力可以通過參與具體的大數(shù)據(jù)開發(fā)項目獲得。因此本文提出以下建議。
(1)高校需要時刻關(guān)注新技術(shù)的發(fā)展與應(yīng)用,及時關(guān)注企業(yè)的需求,適時調(diào)整人才培養(yǎng)計劃,并同步進行新學(xué)科、新專業(yè)建設(shè)。
(2)在不放松理論基礎(chǔ)知識教育的同時,增加應(yīng)用能力培養(yǎng)。理論基礎(chǔ)知識對于人才的綜合素養(yǎng)與發(fā)展?jié)摿τ兄匾饬x,不能削弱,但如果不具備實際應(yīng)用能力,進入企業(yè)還需要再培訓(xùn),則畢業(yè)生的競爭力有限。應(yīng)用能力培養(yǎng)可以通過具體的項目實施完成,這樣不僅能提高學(xué)生對于課程的興趣,更能提升對專業(yè)技能的認(rèn)識。
(3)大數(shù)據(jù)的應(yīng)用十分廣泛,在專業(yè)建設(shè)時可設(shè)置多個發(fā)展方向,教學(xué)方面則對應(yīng)不同的側(cè)重點,例如,數(shù)據(jù)的采集與可視化方向、數(shù)據(jù)的分析與挖掘方向、機器學(xué)習(xí)與深度算法方向。
(4)高校可加強與企業(yè)之間的深度合作,使得地方企業(yè)成為高校人才的實踐基地,培養(yǎng)學(xué)生的實踐能力與項目經(jīng)驗。
(5)高校應(yīng)重視學(xué)生職業(yè)規(guī)劃教育,引導(dǎo)學(xué)生在實踐的過程中積累工作、生活經(jīng)驗,提升自身綜合能力,完善職業(yè)生涯規(guī)劃。