国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于大數(shù)據(jù)集成技術(shù)的畢業(yè)生就業(yè)去向跟蹤系統(tǒng)研究

2021-08-20 10:29:00李一楊
電子設(shè)計工程 2021年16期
關(guān)鍵詞:聚類畢業(yè)生問卷

李一楊

(西安醫(yī)學(xué)院,陜西 西安 710021)

高校人才培養(yǎng)質(zhì)量可通過畢業(yè)生就業(yè)率和就業(yè)質(zhì)量體現(xiàn),畢業(yè)生就業(yè)去向跟蹤是高校就業(yè)部門的重要工作[1]。學(xué)生畢業(yè)后崗位變動頻繁,高校與畢業(yè)生漸漸失去聯(lián)系,加大了畢業(yè)生就業(yè)去向跟蹤的難度。大數(shù)據(jù)技術(shù)是目前信息時代中應(yīng)用廣泛的重要技術(shù),人類生活、生產(chǎn)等各項活動趨于智能化,業(yè)務(wù)活動數(shù)據(jù)不斷提升[2],使大數(shù)據(jù)技術(shù)成為研究學(xué)者們的主要研究方向。大數(shù)據(jù)技術(shù)不斷發(fā)展,造成大量的數(shù)據(jù)孤島現(xiàn)象[3],數(shù)據(jù)集成技術(shù)是解決數(shù)據(jù)孤島現(xiàn)象的重要技術(shù)。

數(shù)據(jù)集成技術(shù)指將眾多具有不同格式、不同來源、不同性質(zhì)的數(shù)據(jù)在物理層面或邏輯層面有機結(jié)合于統(tǒng)一數(shù)據(jù)集的技術(shù)[4]。目前,已有眾多成熟理論應(yīng)用于大數(shù)據(jù)集成技術(shù)中,大數(shù)據(jù)集成技術(shù)可為數(shù)據(jù)共享提供技術(shù)支持。文獻[5]基于機器學(xué)習(xí)算法進行了大學(xué)生畢業(yè)去向預(yù)測;文獻[6]研究大數(shù)據(jù)背景下研究生就業(yè)精準(zhǔn)服務(wù)體系的探索與實踐,以上兩種方法均針對畢業(yè)生就業(yè)去向進行研究,并取得一定成效。

將大數(shù)據(jù)集成技術(shù)應(yīng)用于畢業(yè)生就業(yè)去向跟蹤中,提升畢業(yè)生就業(yè)去向跟蹤效率[7]。文中設(shè)計了大數(shù)據(jù)集成技術(shù)的畢業(yè)生就業(yè)去向跟蹤系統(tǒng),利用大數(shù)據(jù)集成技術(shù)將所采集的不同來源、不同格式的畢業(yè)生就業(yè)去向數(shù)據(jù)高效集成,提升數(shù)據(jù)處理性能。畢業(yè)生可隨時登錄系統(tǒng),在就業(yè)信息存在變化時實時更改信息,高校就業(yè)部門教師利用系統(tǒng)查詢學(xué)生就業(yè)信息,系統(tǒng)設(shè)定固定時間提醒學(xué)生更新就業(yè)去向狀態(tài),使高校畢業(yè)生畢業(yè)后仍與學(xué)校保持良好聯(lián)系,為畢業(yè)生信息跟蹤與分析提供平臺。

1 畢業(yè)生就業(yè)去向跟蹤系統(tǒng)設(shè)計

1.1 系統(tǒng)總體結(jié)構(gòu)

畢業(yè)生就業(yè)去向跟蹤系統(tǒng)具有信息數(shù)據(jù)量大、對客戶端與服務(wù)器端訪問速度要求高以及交互頻繁的特點,選取ASP.net AJAX 引擎的B/S 架構(gòu)分層設(shè)計畢業(yè)生就業(yè)去向跟蹤系統(tǒng),采用該架構(gòu)設(shè)計系統(tǒng)業(yè)務(wù)邏輯層與用戶界面為分離狀態(tài)[8],使系統(tǒng)各程序耦合度有所降低。充分考慮高校對畢業(yè)生就業(yè)去向跟蹤需求,設(shè)計大數(shù)據(jù)集成技術(shù)的畢業(yè)生就業(yè)去向跟蹤系統(tǒng)總體結(jié)構(gòu)圖,如圖1 所示。

圖1 系統(tǒng)總體結(jié)構(gòu)圖

由系統(tǒng)總體結(jié)構(gòu)圖可知,所設(shè)計系統(tǒng)包括數(shù)據(jù)層、邏輯層以及界面層三部分。

數(shù)據(jù)層包括應(yīng)用服務(wù)器、數(shù)據(jù)服務(wù)器以及SQL數(shù)據(jù)庫,為系統(tǒng)提供數(shù)據(jù)支持。系統(tǒng)的數(shù)據(jù)層采用大數(shù)據(jù)集成技術(shù),提升系統(tǒng)的數(shù)據(jù)處理性能。

邏輯層采用模糊C 均值算法對完成集成的數(shù)據(jù)實施聚類等挖掘算法,通過聚類結(jié)果統(tǒng)計畢業(yè)生就業(yè)去向[9]。邏輯層完成畢業(yè)生就業(yè)去向跟蹤處理后,將處理結(jié)果發(fā)送至界面層。

界面層具有在線服務(wù)、問題反饋、用戶管理以及系統(tǒng)管理等功能,高校就業(yè)部門教師以及高校畢業(yè)生等用戶通過界面層登錄系統(tǒng),登錄后運行系統(tǒng)各項應(yīng)用實現(xiàn)人機交互。

1.2 系統(tǒng)功能結(jié)構(gòu)

所設(shè)計的畢業(yè)生就業(yè)去向跟蹤系統(tǒng)采用大數(shù)據(jù)集成技術(shù),可針對海量大數(shù)據(jù)高效集成[10],使所設(shè)計系統(tǒng)具有較高的畢業(yè)生就業(yè)去向跟蹤性能。系統(tǒng)功能結(jié)構(gòu)圖如圖2 所示。由圖2 可以看出,系統(tǒng)主要用戶為高校畢業(yè)生、系統(tǒng)管理員以及高校就業(yè)部門教師。高校畢業(yè)生登錄系統(tǒng)后可更新個人以及就業(yè)相關(guān)信息,參與畢業(yè)生就業(yè)去向跟蹤問卷調(diào)查并查看問卷。系統(tǒng)管理員登錄系統(tǒng)后可管理高校畢業(yè)生信息,并為系統(tǒng)用戶賦予權(quán)限;系統(tǒng)管理員可對問卷調(diào)查相關(guān)內(nèi)容實施數(shù)據(jù)導(dǎo)入、數(shù)據(jù)導(dǎo)出以及數(shù)據(jù)備份等調(diào)查統(tǒng)計功能[11];系統(tǒng)管理員具有設(shè)計調(diào)查問卷、更新調(diào)查問卷、修改調(diào)查問卷內(nèi)容并管理問卷調(diào)查完成情況,針對不同用戶分配不同調(diào)查問卷等功能。高校就業(yè)部門教師登錄系統(tǒng)后可管理本校畢業(yè)生就業(yè)信息、查看畢業(yè)生調(diào)查問卷等權(quán)限,通過畢業(yè)生相關(guān)信息及調(diào)查問卷結(jié)果明確畢業(yè)生就業(yè)去向。

圖2 系統(tǒng)功能結(jié)構(gòu)圖

1.3 大數(shù)據(jù)集成技術(shù)

大數(shù)據(jù)集成技術(shù)需時刻運行集成任務(wù),系統(tǒng)用戶可觀測大數(shù)據(jù)集成過程中的運行任務(wù),用戶可暫?;蚋娜蝿?wù)優(yōu)先級。大數(shù)據(jù)集成技術(shù)集成運行過程如圖3 所示。

圖3 大數(shù)據(jù)集成技術(shù)運行過程

大數(shù)據(jù)集成技術(shù)的集成運行過程主要包括數(shù)據(jù)抽取、數(shù)據(jù)轉(zhuǎn)換以及數(shù)據(jù)加載三部分,完成大數(shù)據(jù)集成處理的數(shù)據(jù)存儲于系統(tǒng)SQL 數(shù)據(jù)庫內(nèi),便于系統(tǒng)跟蹤畢業(yè)生就業(yè)去向。

1)數(shù)據(jù)抽取。將數(shù)據(jù)源內(nèi)存在變更行為的數(shù)據(jù)進行抽取,為數(shù)據(jù)集成做準(zhǔn)備的過程稱為變更數(shù)據(jù)實時抽取,簡稱數(shù)據(jù)抽取[12]。畢業(yè)生就業(yè)去向跟蹤系統(tǒng)內(nèi)變更數(shù)據(jù)抽取的實時性決定了數(shù)據(jù)的實時轉(zhuǎn)換以及加載性能,數(shù)據(jù)抽取為系統(tǒng)內(nèi)大數(shù)據(jù)實時集成提供數(shù)據(jù)支持。

2)數(shù)據(jù)加載。將已完成抽取的集成數(shù)據(jù)發(fā)送至數(shù)據(jù)倉庫內(nèi),以滿足畢業(yè)生就業(yè)去向跟蹤系統(tǒng)決策查詢和實時數(shù)據(jù)檢索需求。數(shù)據(jù)加載過程需要依據(jù)固定順序執(zhí)行SQL 語句分析系統(tǒng)所分配的任務(wù),更新實時數(shù)據(jù)過程容易造成分析結(jié)果不一致問題[13]。解決數(shù)據(jù)倉庫數(shù)據(jù)實時更新和系統(tǒng)應(yīng)用層聯(lián)機分析查詢之間的沖突是數(shù)據(jù)集成需要重點考慮的問題[14]。選取歷史數(shù)據(jù)與高實時性數(shù)據(jù)、一般實時性數(shù)據(jù)分開存儲的方式實現(xiàn)集成數(shù)據(jù)實時加載,提升數(shù)據(jù)實時加載性能。將實時性較高的數(shù)據(jù)發(fā)送于實時數(shù)據(jù)緩存區(qū)域,將歷史數(shù)據(jù)和實時性一般的數(shù)據(jù)發(fā)送至數(shù)據(jù)倉庫內(nèi)。由于僅存在少量更新的實時數(shù)據(jù)于實時數(shù)據(jù)緩存區(qū)域內(nèi),因此數(shù)據(jù)實時更新與實時加載于實時數(shù)據(jù)緩存區(qū)域內(nèi)極為方便,可提升數(shù)據(jù)實時處理和自動分析效率;對不具有實時性的歷史數(shù)據(jù)依據(jù)設(shè)置規(guī)則批量發(fā)送至數(shù)據(jù)倉庫,避免數(shù)據(jù)倉庫內(nèi)物理設(shè)計由于頻繁更新而出現(xiàn)故障。

3)數(shù)據(jù)轉(zhuǎn)換。大數(shù)據(jù)集成技術(shù)中并發(fā)轉(zhuǎn)換任務(wù)調(diào)度區(qū)別于以往人為設(shè)置的直接執(zhí)行、定時執(zhí)行以及周期性執(zhí)行等執(zhí)行方式[15]。大數(shù)據(jù)集成技術(shù)依據(jù)數(shù)據(jù)源內(nèi)的數(shù)據(jù)變化執(zhí)行數(shù)據(jù)集成任務(wù),可使多個轉(zhuǎn)換任務(wù)同時觸發(fā),需高效的任務(wù)調(diào)度策略,利用并發(fā)執(zhí)行任務(wù)提升大數(shù)據(jù)集成技術(shù)內(nèi)服務(wù)器的運行性能,提升系統(tǒng)數(shù)據(jù)集成效率。

1.4 模糊C均值算法

將完成大數(shù)據(jù)集成處理的數(shù)據(jù)庫內(nèi)數(shù)據(jù)利用模糊C 均值算法實現(xiàn)畢業(yè)生就業(yè)去向跟蹤系統(tǒng)的數(shù)據(jù)挖掘與統(tǒng)計,模糊C 均值算法是通過目標(biāo)函數(shù)實施聚類分析的高效算法。該算法利用存在約束條件的優(yōu)化問題代替聚類轉(zhuǎn)化問題,通過優(yōu)化問題求解獲取模糊聚類結(jié)果。設(shè)向量集合為xi=(i=1,2,…,n),n表示向量數(shù)量,采用聚類算法將向量劃分為c個模糊組,將各組之間的非相似性指標(biāo)作為目標(biāo)函數(shù),使各模糊組與聚類中心之間的距離最小。利用模糊劃分思想使特定數(shù)據(jù)對象隸屬于不同組,且隸屬程度通過(0,1)區(qū)間的值體現(xiàn),采用全部數(shù)據(jù)對象隸屬于各組的值構(gòu)建隸屬度矩陣U,對于隨機數(shù)據(jù),隸屬度之和為1,那么可得:

通過以上步驟可知,模糊C 均值聚類算法為逐步迭代求解過程,其具體流程為:

1)將隸屬度矩陣依據(jù)隨機數(shù)方法初始化,完成初始化的隸屬度矩陣需符合式(1)要求;

2)利用式(4)獲取聚類中心數(shù)量c;

3)利用式(2)判斷目標(biāo)函數(shù)與上次目標(biāo)函數(shù)改變范圍是否小于指定閾值以及算法是否超過所設(shè)置循環(huán)次數(shù),通過以上兩部分判斷算法是否收斂,算法收斂表明算法結(jié)束;算法未收斂需進行下一步;

4)通過式(5)獲取新隸屬度矩陣U,并返回步驟2),直至算法完全收斂為止。

由以上步驟可以看出,模糊C 均值算法的初始聚類中心決定了算法聚類效果。

算法的聚類數(shù)量c以及加權(quán)指數(shù)m兩個輸入?yún)?shù)同樣決定算法收斂效果,算法聚類數(shù)量應(yīng)大于1且明顯低于數(shù)據(jù)樣本總數(shù)量。

算法加權(quán)指數(shù)是決定聚類結(jié)構(gòu)模糊程度控制算法的權(quán)重指數(shù),算法加權(quán)指數(shù)過大與過小都將造成算法聚類效果差。算法加權(quán)指數(shù)宜選取[1.5,2.5]范圍內(nèi)的數(shù),文中選取算法加權(quán)指數(shù)為2。

模糊C 均值算法的輸出結(jié)果是隸屬度矩陣以及聚類中心,各數(shù)據(jù)樣本點針對不同類別的隸屬程度可通過隸屬度矩陣體現(xiàn)[16],不同對象所屬的類可依據(jù)最大隸屬原則以及隸屬度矩陣獲取。針對符合正態(tài)分布的數(shù)據(jù),模糊C 均值算法具有較好的聚類效果,符合畢業(yè)生就業(yè)去向跟蹤系統(tǒng)需求。

2 系統(tǒng)測試

為檢測所設(shè)計系統(tǒng)跟蹤畢業(yè)生就業(yè)去向的有效性,選取某地某高校畢業(yè)生作為實驗對象。利用所設(shè)計系統(tǒng)統(tǒng)計該校于2018 年畢業(yè)的本科、碩士、博士畢業(yè)生就業(yè)去向,該校于2018 屆畢業(yè)的畢業(yè)生包括15 個學(xué)院(65 個專業(yè))共7 590 名。采用所設(shè)計系統(tǒng)統(tǒng)計該校2018 年畢業(yè)生就業(yè)分布城市、就業(yè)去向、不同就業(yè)方式、就業(yè)行業(yè)分布情況、就業(yè)單位分布情況如圖4~8 所示。

圖4 畢業(yè)生就業(yè)分布城市

圖5 畢業(yè)生畢業(yè)后去向

圖6 不同就業(yè)方式所占比例

圖7 畢業(yè)生行業(yè)分布情況

圖8 畢業(yè)生就業(yè)單位統(tǒng)計

由圖4~8 可以看出:

1)該校2018 年畢業(yè)生主要分布于北京、上海、深圳、廣州等地,其中分布于北京的畢業(yè)生占該校2018年畢業(yè)生的13%;分布于上海的畢業(yè)生占12%。跟蹤結(jié)果說明北京與上海為該校畢業(yè)生去向首選;

2)該校2018 年畢業(yè)生本科、碩士、博士就業(yè)率分別為96.25%、97.25%、98.46%,未就業(yè)率分別為1.79%、1.42%、0.80%,統(tǒng)計結(jié)果說明該校具有較高的就業(yè)率;

3)該校就業(yè)的畢業(yè)生中,本科、碩士、博士簽約就業(yè)的畢業(yè)生分別占全部畢業(yè)生的97.85%、98.23%以及98.58%,畢業(yè)生就業(yè)去向跟蹤系統(tǒng)說明簽約就業(yè)仍為高校畢業(yè)就業(yè)的主要就業(yè)方式;

該校就業(yè)的畢業(yè)生主要分布于金融業(yè)、建筑業(yè)、教育業(yè)以及交通運輸業(yè),驗證了文中系統(tǒng)跟蹤畢業(yè)生就業(yè)去向行業(yè)分布具有較高的有效性。

該校畢業(yè)生分布于中國建筑有限公司以及美的集團的就業(yè)人數(shù)均高達200 人,是該校畢業(yè)生分布人數(shù)較多的單位。統(tǒng)計結(jié)果再次驗證文中系統(tǒng)具有較高的畢業(yè)生就業(yè)單位跟蹤有效性。

采用文中系統(tǒng)針對畢業(yè)生設(shè)計調(diào)查問卷,從工資滿意度、適應(yīng)能力等方面統(tǒng)計畢業(yè)生對就業(yè)的滿意程度,統(tǒng)計結(jié)果如圖9 所示。從問卷統(tǒng)計結(jié)果可以看出,文中系統(tǒng)可有效統(tǒng)計調(diào)查問卷,根據(jù)調(diào)查問卷統(tǒng)計結(jié)果有助于高校進一步明確畢業(yè)生就業(yè)去向以及畢業(yè)生對就業(yè)的滿意程度。

圖9 畢業(yè)生滿意度指標(biāo)

選取100 名畢業(yè)生用戶,通過問卷調(diào)查的方式選取系統(tǒng)兼容性、界面友好性、用戶并發(fā)連接響應(yīng)速度等指標(biāo)測試所設(shè)計系統(tǒng)性能,統(tǒng)計結(jié)果如圖10 所示。從系統(tǒng)測試結(jié)果可以看出,文中系統(tǒng)可基本滿足系統(tǒng)性能要求,各項評分均在8 分以上,說明所設(shè)計系統(tǒng)性能可符合就業(yè)去向跟蹤需求,文中系統(tǒng)可滿足系統(tǒng)使用條件。系統(tǒng)設(shè)有反饋功能,用戶使用過程中可針對系統(tǒng)缺陷提出改進措施,利于系統(tǒng)優(yōu)化等后續(xù)工作,提升系統(tǒng)易用性。

圖10 系統(tǒng)測試結(jié)果

3 結(jié)束語

數(shù)據(jù)庫作業(yè)中數(shù)據(jù)集成技術(shù)的數(shù)據(jù)抽取、轉(zhuǎn)換以及加載占據(jù)數(shù)據(jù)庫作業(yè)的大量工作量,批量作業(yè)方式可提升集成任務(wù)的數(shù)據(jù)抽取、處理以及加載的運行效率。將大數(shù)據(jù)集成技術(shù)應(yīng)用于畢業(yè)生就業(yè)去向跟蹤系統(tǒng)中,提升了系統(tǒng)應(yīng)用需求的實時性。所設(shè)計畢業(yè)生就業(yè)去向跟蹤系統(tǒng)便于高校實時了解畢業(yè)生的就業(yè)去向,降低高校就業(yè)部門管理人員的工作量,提升高校畢業(yè)生就業(yè)管理的效率。

猜你喜歡
聚類畢業(yè)生問卷
9歲的高中畢業(yè)生
你根本不知道,這屆畢業(yè)生有多難
意林(2020年15期)2020-08-28 11:10:24
一個沒什么才能的北大畢業(yè)生
基于DBSACN聚類算法的XML文檔聚類
電子測試(2017年15期)2017-12-18 07:19:27
問卷網(wǎng)
基于改進的遺傳算法的模糊聚類算法
問卷大調(diào)查
一種層次初始的聚類個數(shù)自適應(yīng)的聚類方法研究
最“叛逆”的畢業(yè)生
問卷你做主
中方县| 阜平县| 靖安县| 开阳县| 保山市| 德安县| 格尔木市| 罗山县| 广宗县| 镇原县| 天门市| 河曲县| 邹城市| 达孜县| 涿鹿县| 乐山市| 黄陵县| 连南| 盐山县| 安泽县| 黑河市| 东丰县| 泰州市| 讷河市| 五家渠市| 康乐县| 汤阴县| 晋中市| 民丰县| 郑州市| 塔河县| 环江| 龙南县| 建水县| 黑山县| 丰都县| 灵丘县| 无锡市| 芜湖县| 淮北市| 台安县|