蔣鵬
(廣東技術(shù)師范學(xué)院,廣東廣州510665)
基于云計(jì)算的高校就業(yè)信息化平臺(tái)模型研究*
蔣鵬
(廣東技術(shù)師范學(xué)院,廣東廣州510665)
針對(duì)高校就業(yè)信息化面臨的諸多問(wèn)題,借助云計(jì)算和大數(shù)據(jù)技術(shù),提出了一種基于云計(jì)算的高校就業(yè)信息化平臺(tái)模型,并對(duì)模型的整體架構(gòu)和功能設(shè)計(jì)進(jìn)行了深入探討。本模型整合各高校和網(wǎng)上的就業(yè)信息資源,避免重復(fù)建設(shè),為高校提供個(gè)性化、智能化、可共享的就業(yè)信息服務(wù)。
云計(jì)算;大數(shù)據(jù)技術(shù);就業(yè)信息化;SaaS;智能分析
伴隨著我國(guó)高校就業(yè)工作向服務(wù)型、社會(huì)化和網(wǎng)絡(luò)化的發(fā)展,基于互聯(lián)網(wǎng)的高校就業(yè)信息化平臺(tái)成為一種日趨常見(jiàn)和普遍的模式。[1]目前高校就業(yè)信息化建設(shè)過(guò)程中也普遍存在以下幾個(gè)方面問(wèn)題:就業(yè)信息化技術(shù)人才缺乏;重應(yīng)用輕理論,缺乏系統(tǒng)性和個(gè)性化的研究;缺乏統(tǒng)一規(guī)劃,信息孤島現(xiàn)象嚴(yán)重,無(wú)法共享;系統(tǒng)的管理維護(hù)困難,不便于整合和再開(kāi)發(fā)。[2]這些局限與不足限制了高校就業(yè)信息化的發(fā)展與深入。
云計(jì)算作為一種基于Internet以服務(wù)方式提供的新型計(jì)算模式,正在深刻改變著傳統(tǒng)的用信息技術(shù)解決管理問(wèn)題的方法。[3]基于云技術(shù)的高校就業(yè)信息化平臺(tái)模型具有以下特點(diǎn):
(1)實(shí)現(xiàn)了就業(yè)信息系統(tǒng)開(kāi)發(fā)和應(yīng)用的分離,各高校只需關(guān)注業(yè)務(wù)創(chuàng)新與系統(tǒng)應(yīng)用;
(2)實(shí)現(xiàn)了統(tǒng)一規(guī)劃,可以實(shí)現(xiàn)區(qū)域高校與高校、高校內(nèi)部、高校與社會(huì)的數(shù)據(jù)共享;
(3)支持系統(tǒng)的持續(xù)整合與改進(jìn)。
基于云技術(shù)的可定制的就業(yè)信息系統(tǒng),還具有開(kāi)發(fā)成本低、使用維護(hù)簡(jiǎn)單、軟件項(xiàng)目部署周期短、風(fēng)險(xiǎn)低等優(yōu)點(diǎn),為進(jìn)一步提升我國(guó)高校就業(yè)服務(wù)水平提供了直接和有效的方法與技術(shù)。
建立一個(gè)基于云技術(shù)的就業(yè)信息化平臺(tái)。首先需要通過(guò)云計(jì)算平臺(tái)搭建一個(gè)開(kāi)放的、基于網(wǎng)絡(luò)的基礎(chǔ)設(shè)施環(huán)境,然后提供一整套包括分布式數(shù)據(jù)存儲(chǔ)、大數(shù)據(jù)處理、就業(yè)信息檢索、就業(yè)信息推薦、個(gè)性化咨詢、信息反饋的基礎(chǔ)服務(wù)平臺(tái)。以滿足用戶彈性訪問(wèn)的需求,還要提供與高校和企業(yè)進(jìn)行數(shù)據(jù)交互的系統(tǒng)接口服務(wù)、供內(nèi)部開(kāi)發(fā)運(yùn)維人員使用的開(kāi)發(fā)管理運(yùn)維服務(wù)。最后高校和企業(yè)以租用的方式申請(qǐng)這些服務(wù),管理自己的就業(yè)服務(wù),從而節(jié)省了開(kāi)發(fā)運(yùn)維、基礎(chǔ)設(shè)施等方面的成本。其整體架構(gòu)模型如圖1所示。共分為三層,從下到上依次為云基礎(chǔ)設(shè)施層、基礎(chǔ)服務(wù)層、自定義展示層。云基礎(chǔ)設(shè)施層是平臺(tái)的基礎(chǔ),提供硬件支持;基礎(chǔ)服務(wù)層是平臺(tái)的核心,負(fù)責(zé)數(shù)據(jù)的存儲(chǔ)和處理;自定義展示層是平臺(tái)的前端和入口,用戶定制自己的個(gè)性化服務(wù)。
圖1 高校就業(yè)信息化平臺(tái)整體架構(gòu)模型
1.云基礎(chǔ)設(shè)施層
為滿足多個(gè)高校與企業(yè)租賃高校就業(yè)信息化服務(wù),平臺(tái)需要承擔(dān)海量的數(shù)據(jù)、文件、數(shù)據(jù)庫(kù)里數(shù)據(jù)的存儲(chǔ)和計(jì)算等。這就必然需要可擴(kuò)展的、廉價(jià)的、可靠的和高性能的硬盤,高速的內(nèi)存Cache系統(tǒng),具有彈性計(jì)算能力的CPU等硬件資源,以減少業(yè)務(wù)系統(tǒng)的響應(yīng)時(shí)間,云計(jì)算平臺(tái)就可以解決這些問(wèn)題。亞馬遜的EC2(Amazon Elastic Compute Cloud)、阿里巴巴的ECS(Elastic Compute Service)是國(guó)內(nèi)外兩個(gè)最常用的商用云計(jì)算平臺(tái),用戶根據(jù)自己的需求租賃云服務(wù)器。[4]云服務(wù)器是一種處理能力可彈性伸縮的計(jì)算服務(wù),其管理方式比物理服務(wù)器更簡(jiǎn)單高效。用戶只需專注于構(gòu)建應(yīng)用,而將運(yùn)維工作交給這些專業(yè)的廠商。除了商用的云計(jì)算平臺(tái),也可以選擇開(kāi)源的云計(jì)算技術(shù)搭建私有云計(jì)算平臺(tái),加州大學(xué)研發(fā)的Euclyptus、NASA研發(fā)的OpenStack均屬于這類技術(shù)。[5]
2.基礎(chǔ)服務(wù)層
基礎(chǔ)服務(wù)層是就業(yè)信息化平臺(tái)的核心,它的三大功能包括分布式數(shù)據(jù)存儲(chǔ)、大數(shù)據(jù)處理與就業(yè)信息檢索、就業(yè)信息智能分析。就業(yè)信息主要分為聘用單位信息、招聘信息、畢業(yè)生信息、學(xué)校信息四類。將這四類信息有關(guān)數(shù)據(jù)存儲(chǔ)在分布式的存儲(chǔ)系統(tǒng)中,便于整個(gè)平臺(tái)的橫向擴(kuò)展。就業(yè)的數(shù)據(jù)量很大,傳統(tǒng)的串行處理方式就會(huì)成為系統(tǒng)的瓶頸,需要用到以MapReduce為代表的并行大數(shù)據(jù)處理技術(shù)。一個(gè)平臺(tái)的就業(yè)信息難免不全面,通過(guò)就業(yè)信息檢索來(lái)獲取其他平臺(tái)的就業(yè)數(shù)據(jù),為學(xué)生提供更多的就業(yè)信息。傳統(tǒng)的就業(yè)信息系統(tǒng)將最近的就業(yè)信息全部展示,作為數(shù)據(jù)量很大的就業(yè)信息化平臺(tái),使用智能分析模型,結(jié)合學(xué)生的專業(yè)、興趣和企業(yè)的崗位要求為學(xué)生推薦最適合的就業(yè)信息。
3.自定義展示層
引入基于SaaS的多租戶技術(shù),實(shí)現(xiàn)高校就業(yè)信息化平臺(tái)能夠做到“一套網(wǎng)站代碼,多個(gè)網(wǎng)站實(shí)例”的共享程度,而且這個(gè)共享不能以犧牲租戶的個(gè)性需求為代價(jià)。[6]根據(jù)租戶的這些個(gè)性差異化需求,多租戶網(wǎng)站自定義技術(shù)解決頁(yè)面組織、頁(yè)面風(fēng)格、業(yè)務(wù)字段、業(yè)務(wù)種類重組、工作流程可配置定義。[7]
如圖2所示,基于這個(gè)平臺(tái),有專門的運(yùn)營(yíng)商負(fù)責(zé)技術(shù)、運(yùn)維,而將就業(yè)信息化作為一種服務(wù)提供給各個(gè)高校和企業(yè)。各個(gè)高校只能訪問(wèn)自己專有和共享的服務(wù),按照自己的需求配置個(gè)性化的Web界面。
1.云計(jì)算平臺(tái)
隨著云計(jì)算成為十二五規(guī)劃的重要部分,將云計(jì)算應(yīng)用到高校就業(yè)信息服務(wù)平臺(tái)很有必要。每年的9-11月份和3-6月份是用人單位集中招聘期,同時(shí)畢業(yè)生也集中在這幾個(gè)月份求職。畢業(yè)生,用人單位都是集中在某一個(gè)時(shí)間段去訪問(wèn)高校就業(yè)服務(wù)平臺(tái),這就會(huì)給系統(tǒng)帶來(lái)很大的壓力,系統(tǒng)經(jīng)常會(huì)崩潰。如果按照系統(tǒng)的最大訪問(wèn)量去配置硬件資源,在招聘的淡季就會(huì)浪費(fèi)很多的資源,同時(shí)也需要人員去維護(hù)這些硬件。而云計(jì)算技術(shù)就是為了解決這些問(wèn)題應(yīng)運(yùn)而生的,將高校就業(yè)服務(wù)平臺(tái)部署到云計(jì)算平臺(tái)里,云計(jì)算平臺(tái)就會(huì)根據(jù)系統(tǒng)的訪問(wèn)量去動(dòng)態(tài)地增加或者減少硬件資源,這樣既可以保證系統(tǒng)的穩(wěn)定性也避免了資源的浪費(fèi)。
圖2 高校就業(yè)信息化平臺(tái)訪問(wèn)模型
2.分布式存儲(chǔ)系統(tǒng)
目前高校的就業(yè)信息系統(tǒng)都以集中存儲(chǔ)的方式組織數(shù)據(jù)。集中式存儲(chǔ)雖然便于管理但是讀取和寫入數(shù)據(jù)只有一個(gè)入口,因?yàn)槊恳环N數(shù)據(jù)庫(kù)的可用連接數(shù)都是固定的,隨著訪問(wèn)量的增大這種模式也會(huì)成為系統(tǒng)的瓶頸。越來(lái)越多的數(shù)據(jù)需要存入系統(tǒng),按照集中式存儲(chǔ),當(dāng)存儲(chǔ)資源不足時(shí)只能增加內(nèi)存和硬盤資源。如果將畢業(yè)生信息、學(xué)校信息、企業(yè)信息、招聘信息等分布式地存儲(chǔ)起來(lái),當(dāng)存儲(chǔ)資源不足時(shí)只需線性地增加存儲(chǔ)器。當(dāng)前流行的解決方案就是Hadoop的HDFS分布式存儲(chǔ)系統(tǒng)。
3.大數(shù)據(jù)處理服務(wù)
數(shù)據(jù)量急增是傳統(tǒng)的IT系統(tǒng)處理時(shí)就會(huì)遇到三個(gè)瓶頸:一是數(shù)據(jù)展現(xiàn)非常慢;二是數(shù)據(jù)運(yùn)算速度難以忍受;三是采用傳統(tǒng)的ETL(數(shù)據(jù)抽取、轉(zhuǎn)換、裝載),數(shù)據(jù)更新慢。當(dāng)前常用的MapReduce大數(shù)據(jù)計(jì)算框架(見(jiàn)圖3)就可解決這三大問(wèn)題。MapReduce處理大數(shù)據(jù)時(shí),不是將數(shù)據(jù)移動(dòng)到計(jì)算節(jié)點(diǎn),而是將計(jì)算推向數(shù)據(jù)節(jié)點(diǎn)。MapReduce的原理就是計(jì)算數(shù)據(jù)時(shí),主機(jī)會(huì)啟動(dòng)一個(gè)任務(wù),先會(huì)對(duì)這些數(shù)據(jù)進(jìn)行分割,再將大任務(wù)切分成多個(gè)小任務(wù)。再將這些小任務(wù)分配到集群上,每一個(gè)任務(wù)處理其所在節(jié)點(diǎn)上數(shù)據(jù),最后將數(shù)據(jù)匯總到一個(gè)節(jié)點(diǎn)最后輸出。
4.就業(yè)信息檢索服務(wù)
任何一個(gè)就業(yè)平臺(tái)都無(wú)法收納所有的就業(yè)信息。國(guó)內(nèi)三個(gè)大型的招聘網(wǎng)站——智聯(lián)招聘、51Job、大街網(wǎng),每一個(gè)網(wǎng)站都有其他網(wǎng)站不具備的招聘信息。對(duì)于高校就業(yè)信息化平臺(tái),僅依靠企業(yè)和高校發(fā)布招聘信息的方式,信息量難以滿足數(shù)量龐大的畢業(yè)生。所以新的高校就業(yè)信息化平臺(tái)必須要有一個(gè)就業(yè)信息檢索服務(wù),能夠檢索互聯(lián)網(wǎng)上重要的就業(yè)信息。
圖3 大數(shù)據(jù)并行處理架構(gòu)圖
5.智能分析模型
傳統(tǒng)的高校就業(yè)信息化平臺(tái)以高校和企業(yè)發(fā)布信息為主,學(xué)生從海量的招聘信息中去查看自己感興趣的招聘信息。這種方式需要學(xué)生投入很大的精力去逐條查看招聘信息,同時(shí)也有可能漏掉一些重要的信息。新的高校就業(yè)信息化平臺(tái)需要有一個(gè)智能分析模型,這個(gè)模型包括就業(yè)信息推薦、個(gè)性化咨詢服務(wù)、就業(yè)信息反饋。在就業(yè)信息推薦服務(wù)中,根據(jù)學(xué)生的技能和感興趣的工作結(jié)合企業(yè)的招聘信息,為學(xué)生做個(gè)性化的就業(yè)信息推薦。為了能夠及時(shí)地提高推薦的準(zhǔn)確度,也需要學(xué)生反饋推薦的就業(yè)信息是否準(zhǔn)確,以及是否適合該學(xué)生。
就業(yè)信息的數(shù)量很多,作為高校就業(yè)信息化平臺(tái)的主要用戶學(xué)生,只需要和自己專業(yè)、技能、興趣有關(guān)的就業(yè)信息。這就需要為每一個(gè)學(xué)生個(gè)性化地推薦就業(yè)信息。本系統(tǒng)針對(duì)學(xué)生進(jìn)行就業(yè)推薦,為此在學(xué)生注冊(cè)的時(shí)候,系統(tǒng)要求學(xué)生填寫其掌握的專業(yè)技能、興趣等信息,同時(shí)在企業(yè)發(fā)布招聘信息時(shí),系統(tǒng)同樣要求企業(yè)填寫相應(yīng)崗位的技能要求。根據(jù)這兩組數(shù)據(jù),就可以從中抽象出學(xué)生和招聘信息的特征向量。舉例來(lái)說(shuō),特征向量為(java,c,c++,htm l),某學(xué)生具備java和htm l技能,則該學(xué)生可抽象為A=(1,0,0,1),某企業(yè)招聘崗位要求掌握java,c++,則該招聘信息可以抽象為B=(1,0,1,0)。顯然,特征向量為(0,1)離散的的向量,因此根據(jù)此特點(diǎn)選用余弦相似系數(shù)來(lái)計(jì)算相似度。其計(jì)算公式為:
作為一個(gè)基于云計(jì)算的高校就業(yè)信息化平臺(tái),必須要提供就業(yè)信息服務(wù)自定義的功能。高??梢愿鶕?jù)自己的需要定制不同的功能,也可以自定義自己網(wǎng)站的主題、樣式等。國(guó)外的ERP巨頭Salesforce的ERP產(chǎn)品就允許用戶自定義,用戶付費(fèi)購(gòu)買功能服務(wù),也可根據(jù)自己的個(gè)性化需求定制服務(wù)。就業(yè)信息化平臺(tái)需要外部的數(shù)據(jù),例如畢業(yè)生的信息、企業(yè)招聘信息等。依靠人工的錄入是很費(fèi)時(shí)間的,所以就業(yè)信息化平臺(tái)需要將數(shù)據(jù)的導(dǎo)入、個(gè)性化的咨詢作為接口提供給高校。
本文針對(duì)我國(guó)高校就業(yè)信息化所存在的問(wèn)題,基于云計(jì)算和大數(shù)據(jù)技術(shù),提出了一種基于云計(jì)算的高校就業(yè)信息化平臺(tái)模型。并對(duì)模型的整體架構(gòu)和功能設(shè)計(jì)進(jìn)行了深入探討。本模型整合各高校和網(wǎng)上的就業(yè)信息資源,避免重復(fù)建設(shè),為高校提供個(gè)性化的、智能化的、可共享的就業(yè)信息服務(wù)。在未來(lái)工作中,應(yīng)該對(duì)文中所提的架構(gòu)進(jìn)行驗(yàn)證并且上升到就業(yè)信息服務(wù)平臺(tái)層次,以求更好地指導(dǎo)以后類似平臺(tái)的開(kāi)發(fā),最終達(dá)到大幅提升我國(guó)高校就業(yè)信息化水平的目的。
[1]方偉.大學(xué)生就業(yè)工作信息化新探索[J].中國(guó)大學(xué)生就業(yè),2013(4):45-46.
[2]蔣鵬.高校就業(yè)信息化建設(shè)研究[J].廣東技術(shù)師范學(xué)院學(xué)報(bào),2015(8):55-57.
[3]劉鵬.云計(jì)算[M].北京:電子工業(yè)出版社,2011.
[4]陳康,鄭緯民.云計(jì)算:系統(tǒng)實(shí)例與研究現(xiàn)狀[J].軟件學(xué)報(bào),2009(5):1337-1348.
[5]陳全,鄧倩妮.云計(jì)算及其關(guān)鍵技術(shù)[J].計(jì)算機(jī)應(yīng)用,2009(9):2562-2564.
[6]劉士軍,張勇,楊成偉.基于SaaS服務(wù)的中小企業(yè)業(yè)務(wù)協(xié)同系統(tǒng)[J].東南大學(xué)學(xué)報(bào)(自然科學(xué)版),2011(3): 458-462.
[7]王卓昊,趙卓峰,房俊,王希誠(chéng).一種SaaS模式下的服務(wù)社區(qū)模型及其在全國(guó)科技信息服務(wù)網(wǎng)中的應(yīng)用[J].計(jì)算機(jī)學(xué)報(bào),2010(11).
(編輯:王天鵬)
G473.8
A
1673-8454(2017)09-0091-03
廣東省教育廳重點(diǎn)資助課題(2011ZZ018)。