臧 芳,劉 躍
(湖南電子科技職業(yè)學(xué)院機(jī)械與電子信息工程分院,長(zhǎng)沙 410205)
基于大數(shù)據(jù)的長(zhǎng)沙高職畢業(yè)生就業(yè)分析系統(tǒng)建設(shè)研究
臧 芳,劉 躍
(湖南電子科技職業(yè)學(xué)院機(jī)械與電子信息工程分院,長(zhǎng)沙 410205)
本文通過(guò)對(duì)大數(shù)據(jù)分析的預(yù)測(cè)性應(yīng)用原理進(jìn)行分析,提出了基于大數(shù)據(jù)分析的長(zhǎng)沙高職學(xué)生就業(yè)分析系統(tǒng)的建設(shè)及大數(shù)據(jù)在應(yīng)用分析中的注意事項(xiàng)。
大數(shù)據(jù);長(zhǎng)沙高職畢業(yè)生;就業(yè)分析;系統(tǒng)建設(shè)
近年來(lái),許多企業(yè)急需動(dòng)手能力強(qiáng)、工作在生產(chǎn)一線的優(yōu)秀人才,而主要培養(yǎng)這類(lèi)技能型人才的高職院校畢業(yè)生的就業(yè)情況卻并不樂(lè)觀。造成此情況的重要原因之一——就業(yè)工作與市場(chǎng)需求的信息隔斷。實(shí)際數(shù)據(jù)顯示:全國(guó)高職院校從3年前的1 113所增加到1 297所,畢業(yè)生從198萬(wàn)人上升為238萬(wàn)人,但實(shí)際就業(yè)率不到50%且專(zhuān)業(yè)對(duì)口就業(yè)率更低。另外,現(xiàn)階段中小企業(yè)受?chē)?guó)際金融危機(jī)的影響正面臨大洗牌,勢(shì)必會(huì)影響到高職院校畢業(yè)生的就業(yè)。長(zhǎng)沙市范圍內(nèi)的高職院校就業(yè)情況亦是如此。
大數(shù)據(jù)分析是指對(duì)規(guī)模巨大、更新速度快、類(lèi)型多、有價(jià)值的數(shù)據(jù)進(jìn)行分析。而高職學(xué)生的就業(yè)與所選擇的工作單位情況、職業(yè)崗位、月收入、工種、學(xué)生所學(xué)專(zhuān)業(yè)、課程等數(shù)據(jù)息息相關(guān),這些均具備大數(shù)據(jù)的特征。如果能基于這些海量與就業(yè)相關(guān)數(shù)據(jù)(以長(zhǎng)沙范圍內(nèi)的幾所高職院校的就業(yè)相關(guān)數(shù)據(jù)為例)對(duì)高職畢業(yè)生就業(yè)模式進(jìn)行深入探究,必將對(duì)提高長(zhǎng)沙市范圍內(nèi)的高職院校就業(yè)工作起到一定的指導(dǎo)或參考作用。
基于云計(jì)算的信息采集與存儲(chǔ)、數(shù)據(jù)清洗、維護(hù)和挖掘手段,能高效地將幾十PB的海量數(shù)據(jù)存儲(chǔ)下來(lái),利用Hadoop HDFS、Hadoop MapReduce等工具進(jìn)行分析與計(jì)算。大數(shù)據(jù)存儲(chǔ)舍棄過(guò)度數(shù)據(jù)精準(zhǔn)問(wèn)題和數(shù)據(jù)間前因后果的關(guān)系,重點(diǎn)探索它們的相關(guān)關(guān)系,這就是大數(shù)據(jù)的應(yīng)用原理。大數(shù)據(jù)分析在高職畢業(yè)生就業(yè)中的應(yīng)用即通過(guò)分析就業(yè)有關(guān)的數(shù)據(jù),如:選擇工作單位情況、職業(yè)崗位、月收入、工種、學(xué)生所學(xué)專(zhuān)業(yè)等數(shù)據(jù),發(fā)現(xiàn)未來(lái)就業(yè)趨勢(shì)及如何利用大數(shù)據(jù)分析的結(jié)果來(lái)更好指導(dǎo)高職畢業(yè)生的就業(yè)。本文所提到的大數(shù)據(jù)分析預(yù)測(cè)范圍主要有:專(zhuān)業(yè)對(duì)口情況、自主創(chuàng)業(yè)情況、薪資情況、對(duì)工作滿意度情況、工作地分布情況等。
第一,不能依賴(lài)少量數(shù)據(jù)樣本。少量的數(shù)據(jù)樣本是采集長(zhǎng)沙市某個(gè)職院就業(yè)情況的數(shù)據(jù)或某些專(zhuān)業(yè)的就業(yè)情況,通過(guò)整理分析來(lái)推測(cè)整個(gè)長(zhǎng)沙市所有高職院校的就業(yè)情況,屬于以點(diǎn)概全的方法。此種分析方法一般在特殊領(lǐng)域內(nèi)有效,但通常情況下,特別是在學(xué)生就業(yè)問(wèn)題上容易造成誤差。以長(zhǎng)沙市范圍內(nèi)的高職院校學(xué)生就業(yè)分析為例,對(duì)于已發(fā)生的就業(yè)行業(yè)分布的數(shù)據(jù)較容易做到精確,但在此基礎(chǔ)上建立分析模型卻較困難。假設(shè)湖南電子科技職院的“航海運(yùn)輸”專(zhuān)業(yè)是長(zhǎng)沙所有高職院校中的獨(dú)特專(zhuān)業(yè),則該專(zhuān)業(yè)學(xué)生的就業(yè)因素維度較容易確定。但對(duì)于“計(jì)算機(jī)應(yīng)用技術(shù)”這一類(lèi)幾乎所有高職院校都開(kāi)設(shè)的專(zhuān)業(yè),就難以搜集到既有分布提取分析因子以及建立相關(guān)分析模型。但如果將長(zhǎng)沙市范圍內(nèi)所有高職院校的一切與就業(yè)相關(guān)的大數(shù)據(jù),包括整體經(jīng)濟(jì)趨勢(shì)、就業(yè)行業(yè)情況及區(qū)域分布、相關(guān)行業(yè)的人才需求情況、畢業(yè)學(xué)校的該專(zhuān)業(yè)師資力量與教學(xué)情況、學(xué)生素養(yǎng)以及家庭狀況等,從以上數(shù)據(jù)中提取維度,經(jīng)由交叉分析對(duì)比,可得出某段時(shí)期內(nèi)影響長(zhǎng)沙市高職畢業(yè)生就業(yè)的一些主要因素。第二,切忌一味地追求數(shù)據(jù)的精確性。本文涉及的數(shù)據(jù)包括社會(huì)、行業(yè)、學(xué)校、高職畢業(yè)生個(gè)人信息等海量數(shù)據(jù),它們之間關(guān)系復(fù)雜,每類(lèi)數(shù)據(jù)都采集精確的可能性不大。但采集的數(shù)據(jù)越多,這些海量數(shù)據(jù)可以抵消掉個(gè)別問(wèn)題數(shù)據(jù)。如果單純?yōu)榱双@得畢業(yè)生就業(yè)薪資的精確數(shù)據(jù)而犧牲更廣泛數(shù)據(jù)的采集,忽視了其他應(yīng)深入采集的數(shù)據(jù)。如:忽略性格傾向、思想獨(dú)立性等因素對(duì)就業(yè)的影響,就無(wú)法對(duì)學(xué)生的心理健康采取更有效的對(duì)策。這將直接影響學(xué)生的就業(yè)。第三,注重某些在就業(yè)關(guān)系中起重要作用的因素。如:不要過(guò)度重視2011年—2015年這5年間“服裝設(shè)計(jì)”專(zhuān)業(yè)學(xué)生就業(yè)率具體是多少,不要過(guò)度追究某因素對(duì)畢業(yè)生就業(yè)的影響,而是要預(yù)測(cè)好未來(lái)幾年中該專(zhuān)業(yè)的高職畢業(yè)生就業(yè)率是上浮還是下降,以及上浮和下降的幅度。
就建設(shè)形式和出資方而言,可將該系統(tǒng)的建設(shè)形式分成自行構(gòu)建和聯(lián)合構(gòu)建兩種。自行構(gòu)建指以長(zhǎng)沙市為中心建立一個(gè)數(shù)據(jù)樞紐,再將這個(gè)數(shù)據(jù)樞紐連接到長(zhǎng)沙市范圍內(nèi)各高職院校就業(yè)指導(dǎo)中心,結(jié)構(gòu)如圖1所示。每個(gè)院校的就業(yè)指導(dǎo)中心主要負(fù)責(zé)采集本校的就業(yè)數(shù)據(jù),條件成熟的也可以適當(dāng)負(fù)責(zé)數(shù)據(jù)分析。數(shù)據(jù)樞紐則負(fù)責(zé)全市范圍內(nèi)的各個(gè)高職院校畢業(yè)生的就業(yè)數(shù)據(jù)分析,負(fù)責(zé)Hadoop兩個(gè)關(guān)鍵功能模塊HDFS、Map Reduce的監(jiān)督。NameNode和JobTracker通過(guò)調(diào)用管理員配置模塊中的APIresolve來(lái)獲取集群里每個(gè)slave的機(jī)架ID。此種構(gòu)建形式的特點(diǎn):數(shù)據(jù)來(lái)源有指向性,有利于建立分析模型,對(duì)于趨勢(shì)的分析周期較短。但建設(shè)周期長(zhǎng),成本高。
圖1 就業(yè)大數(shù)據(jù)應(yīng)用系統(tǒng)的建設(shè)形式之一自行構(gòu)建Fig.1 One of the construction forms of big data application systems
聯(lián)合構(gòu)建是指長(zhǎng)沙市范圍內(nèi)各高職院校與具備大數(shù)據(jù)分析能力的公司協(xié)作,由該公司提供云計(jì)算服務(wù)來(lái)采集與就業(yè)相關(guān)的數(shù)據(jù),這些采集的數(shù)據(jù)經(jīng)過(guò)清洗過(guò)濾后進(jìn)入全市就業(yè)指導(dǎo)中心數(shù)據(jù)樞紐數(shù)據(jù)庫(kù),該數(shù)據(jù)庫(kù)由具有海量結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)功能的分布式列存儲(chǔ)系統(tǒng)—HBase,用其超大無(wú)模式面向列的HBase表以key-value對(duì)的形式存儲(chǔ)這些就業(yè)相關(guān)數(shù)據(jù),為后期做就業(yè)趨勢(shì)分析或后期研究使用。該形式的特點(diǎn):數(shù)據(jù)來(lái)源廣泛,分析模型建立復(fù)雜,分析周期長(zhǎng)。建設(shè)周期短,成本低??偟貋?lái)說(shuō),聯(lián)合構(gòu)建相對(duì)于自行構(gòu)建更經(jīng)濟(jì)一些。
圖2 就業(yè)大數(shù)據(jù)應(yīng)用系統(tǒng)的建設(shè)形式之二聯(lián)合構(gòu)建Fig.2 The second joint construction of big data application system construction form
A.因?yàn)榇髷?shù)據(jù)分析是通過(guò)云計(jì)算的手段將處理結(jié)果進(jìn)行分析與預(yù)測(cè),所以有關(guān)影響高職畢業(yè)生就業(yè)的數(shù)據(jù)分析維度不必深入探究,重點(diǎn)在于盡可能搜集與就業(yè)相關(guān)的海量數(shù)據(jù)。B.就業(yè)數(shù)據(jù)采集過(guò)程中遇到涉及敏感隱私數(shù)據(jù),應(yīng)通過(guò)合法的法律途徑獲取,如:畢業(yè)生的家庭關(guān)系、家庭收入等數(shù)據(jù)。C.大數(shù)據(jù)采集的海量信息的匯集構(gòu)成了社會(huì)現(xiàn)實(shí),所以不僅在高職畢業(yè)生就業(yè)研究方面,其他應(yīng)用領(lǐng)域的大數(shù)據(jù)采集與分析也得到了發(fā)展與應(yīng)用,體現(xiàn)了數(shù)據(jù)的價(jià)值。
對(duì)長(zhǎng)沙市范圍內(nèi)的高職學(xué)生就業(yè)情況進(jìn)行分析屬于社會(huì)學(xué)與教育學(xué)交叉領(lǐng)域,其研究意義在于,為高職學(xué)生就業(yè)趨勢(shì)的預(yù)測(cè)提供了一種高準(zhǔn)確性的分析模式,政府和教育界對(duì)長(zhǎng)沙市范圍內(nèi)高職院校學(xué)生就業(yè)工作的管理起到更好的指導(dǎo)作用。本文提出的兩種大數(shù)據(jù)分析系統(tǒng)建設(shè)形式,從經(jīng)濟(jì)效益上來(lái)考慮,選擇與企業(yè)聯(lián)合構(gòu)建的形式可以節(jié)省開(kāi)支,也可以克服技術(shù)上的一些難題。
[1] 胡逸.運(yùn)用大數(shù)據(jù)技術(shù)促進(jìn)大學(xué)生就業(yè)[N].中國(guó)組織人事報(bào),2013-09-04.
[2] 桑慶兵.大數(shù)據(jù)在高校的應(yīng)用與思考[J].南通紡織職業(yè)技術(shù)學(xué)院學(xué)報(bào),2013,(02):45-46.
[3] 王左利.大數(shù)據(jù):大數(shù)據(jù)時(shí)代[J].中國(guó)教育網(wǎng)絡(luò),2013,(01):67-68.
Research on employment analysis system of Changsha higher vocational college graduates based on big data
ZANG Fang, LIU Yue
(Department of Mechanical and Electronic Information Engineering,Hunan Electronic Science and Technology Vocational College, Changsha 410205, China)
Based on the analysis of the application principle of big data, this paper puts forward the construction of employment analysis system of Changsha higher vocational graduates and the precautions of big data in application analysis.
Big data; Changsha vocational college graduates; Employment analysis; System construction
2017-04-27
臧芳(1980-),女,碩士研究生,講師; 劉躍(1985-),男,經(jīng)濟(jì)學(xué)學(xué)士,講師。
TP311.52
A
1674-8646(2017)13-0027-02