魏 威,李福勝 ,高文天
(鄭州鐵路職業(yè)技術(shù)學(xué)院,河南 鄭州 450052)
基于Data Mining技術(shù)的高職院校人才培養(yǎng)工作狀態(tài)數(shù)據(jù)平臺(tái)建設(shè)的思考
魏 威,李福勝 ,高文天
(鄭州鐵路職業(yè)技術(shù)學(xué)院,河南 鄭州 450052)
高等職業(yè)院校人才培養(yǎng)工作狀態(tài)數(shù)據(jù)采集與管理平臺(tái),是教育部推出的一個(gè)讓各級(jí)教育管理者了解院校發(fā)展的信息窗口,在高職院校教育管理工作中發(fā)揮著越來越重要的作用?;贒ata Mining技術(shù),就分析、使用好平臺(tái)數(shù)據(jù)提出了相應(yīng)方法和實(shí)施路徑,同時(shí)也列舉了應(yīng)用實(shí)例。
數(shù)據(jù)挖掘; 高職院校; 數(shù)據(jù)平臺(tái);建設(shè)
近年來,隨著互聯(lián)網(wǎng)、云計(jì)算等技術(shù)的迅猛發(fā)展,“互聯(lián)網(wǎng)+”行動(dòng)計(jì)劃已應(yīng)用在大數(shù)據(jù)時(shí)代的多個(gè)領(lǐng)域。數(shù)據(jù)挖掘(Data Mining,簡稱“DM”)是一個(gè)多學(xué)科交叉融合的新興計(jì)算機(jī)技術(shù),在互聯(lián)網(wǎng)方面使用廣泛。為貫徹《國務(wù)院關(guān)于加快發(fā)展現(xiàn)代職業(yè)教育的決定》,建立常態(tài)化的職業(yè)院校自主保證人才培養(yǎng)質(zhì)量的機(jī)制,教育部印發(fā)了《關(guān)于建立職業(yè)院校教學(xué)工作診斷與改進(jìn)制度的通知》,強(qiáng)調(diào)職業(yè)院校要充分利用信息技術(shù),建立校本人才培養(yǎng)工作狀態(tài)數(shù)據(jù)管理系統(tǒng),及時(shí)掌握和分析人才培養(yǎng)工作狀況,依法依規(guī)發(fā)布社會(huì)關(guān)注的人才培養(yǎng)核心數(shù)據(jù)。因此,高職院校要積極推進(jìn)“高等職業(yè)院校人才培養(yǎng)工作狀態(tài)數(shù)據(jù)采集與管理平臺(tái)”(簡稱“狀態(tài)數(shù)據(jù)平臺(tái)”)的建設(shè)和運(yùn)用,應(yīng)用DM技術(shù),發(fā)揮其在宏觀管理、行政決策、院校治理、教學(xué)改革、年度報(bào)告中的基礎(chǔ)性作用,為學(xué)校管理決策服務(wù),實(shí)現(xiàn)教學(xué)管理的制度化、規(guī)范化和標(biāo)準(zhǔn)化,不斷提升人才培養(yǎng)質(zhì)量。
(一)平臺(tái)功能
狀態(tài)數(shù)據(jù)平臺(tái)是教育部推出的一個(gè)能全面了解各院校狀態(tài)的重要信息窗口,從2008年開始實(shí)施,其數(shù)據(jù)覆蓋了學(xué)校人才培養(yǎng)的各個(gè)方面,具有獨(dú)立、原始、真實(shí)、公開的特點(diǎn),反映了學(xué)校的辦學(xué)狀態(tài)。經(jīng)過8年的填報(bào)、反饋、改進(jìn)和完善,主要包含有院?;拘畔?,院校領(lǐng)導(dǎo),基本辦學(xué)條件,實(shí)踐教學(xué)條件,辦學(xué)經(jīng)費(fèi),師資隊(duì)伍,專業(yè),教學(xué)管理與教學(xué)研究,社會(huì)評(píng)價(jià),學(xué)生信息(擴(kuò)展),補(bǔ)充數(shù)據(jù),補(bǔ)充和案例分析共13個(gè)模塊,每個(gè)模塊又包含若干子功能。
通過“高職數(shù)據(jù)中心”入口進(jìn)入到學(xué)校的數(shù)據(jù)庫中,可以了解本?,F(xiàn)狀與省內(nèi)、全國中位數(shù)相對(duì)比的情況(如表1所示)。通過表1可以看到該校12項(xiàng)核心指標(biāo)數(shù)據(jù),以及全國示范,國家骨干及省示范,省與全國中位數(shù)和評(píng)估標(biāo)準(zhǔn),這些數(shù)據(jù)對(duì)高職院校分析現(xiàn)狀,調(diào)整管理策略具有重要意義。
表1 基本辦學(xué)條件
(二)存在問題
隨著信息技術(shù)的發(fā)展,以及高職院校數(shù)字化校園的建設(shè),教育部越來越重視數(shù)據(jù)平臺(tái)的填報(bào)和使用,已在全國各高職院校推進(jìn)網(wǎng)絡(luò)版數(shù)據(jù)采集與管理平臺(tái)的使用。目前,狀態(tài)數(shù)據(jù)平臺(tái)已被教育部納入“金教工程”,作為項(xiàng)目評(píng)審、人才培養(yǎng)狀態(tài)監(jiān)測等日常管理工作中的數(shù)據(jù)支撐。狀態(tài)數(shù)據(jù)平臺(tái)的數(shù)據(jù)資料是寶貴資源,是決策的基礎(chǔ),將其加以收集、分析后的相關(guān)信息,可支持決策的形成。但從教育部反饋的數(shù)據(jù)采集情況來看,部分高職院校的狀態(tài)數(shù)據(jù)采集出現(xiàn)格式不規(guī)范、單位被忽略、關(guān)聯(lián)不一致等問題,為決策管理提供了失真的參考信息,不利于全面掌握院校辦學(xué)水平。
狀態(tài)數(shù)據(jù)平臺(tái)不只是為了反映教學(xué)運(yùn)行現(xiàn)狀而進(jìn)行統(tǒng)計(jì)匯總數(shù)據(jù),更重要的是要通過數(shù)據(jù)分析,把有價(jià)值的數(shù)據(jù)轉(zhuǎn)化成對(duì)院校管理監(jiān)控有用的信息,進(jìn)一步完善高職院校內(nèi)部質(zhì)量保證體系,促進(jìn)院校規(guī)范化管理。但目前狀態(tài)數(shù)據(jù)平臺(tái)是一個(gè)由海量數(shù)據(jù)構(gòu)成的數(shù)據(jù)倉庫,每個(gè)院校的數(shù)據(jù)量可達(dá)到數(shù)十萬條,而且大多是絕對(duì)數(shù)據(jù),即為自然數(shù)據(jù)。高職院校要對(duì)自然數(shù)據(jù)進(jìn)行分析,聚合和關(guān)聯(lián)數(shù)據(jù)倉庫中的各類絕對(duì)數(shù)據(jù),生成有用的相對(duì)數(shù)據(jù)。由于數(shù)據(jù)采集字段的逐年增加,數(shù)據(jù)間的關(guān)聯(lián)度越來越復(fù)雜,因此需要借助DM技術(shù)對(duì)狀態(tài)數(shù)據(jù)平臺(tái)進(jìn)行數(shù)據(jù)分析。
(一) DM技術(shù)的概念
DM技術(shù)是計(jì)算機(jī)學(xué)習(xí)技術(shù)的一種,它可從數(shù)據(jù)庫大量的數(shù)據(jù)中分析、挖掘并提取隱含在其中對(duì)用戶有用的信息和知識(shí)。即它是一個(gè)從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中,提取人們事先不知道的信息,并進(jìn)行整理、歸納與分析的過程,把這些較為隱蔽的有意義、有價(jià)值的信息,以人們?nèi)菀捉邮艿哪J剑瑸楣芾砣藛T提供參考依據(jù)。
(二) DM技術(shù)的實(shí)施步驟
目前,有影響力的DM過程標(biāo)準(zhǔn)是CRISP-DM(cross-industry standard process for data mining),它已得到如IBM、SPSS、SGI、NCR等多家公司和企業(yè)的認(rèn)可。CRISP-DM把數(shù)據(jù)挖掘分成6個(gè)步驟,這6個(gè)步驟順序不是一定的,經(jīng)常要根據(jù)實(shí)際情況進(jìn)行調(diào)整:
1.業(yè)務(wù)理解(Busingess Understanding)。理解項(xiàng)目目標(biāo)和業(yè)務(wù)需求,提出數(shù)據(jù)挖掘問題,對(duì)目標(biāo)有明確的定義并建立項(xiàng)目計(jì)劃。
2.數(shù)據(jù)理解(Data Understanding)。收集原始數(shù)據(jù),熟悉數(shù)據(jù),檢查和確認(rèn)數(shù)據(jù)的質(zhì)量,發(fā)現(xiàn)數(shù)據(jù)的內(nèi)部屬性。
3.數(shù)據(jù)準(zhǔn)備(Data Preparation)。對(duì)數(shù)據(jù)進(jìn)行初步的整理,剔除不完全數(shù)據(jù),把未處理的數(shù)據(jù)集轉(zhuǎn)化為模型算法可以處理的規(guī)范數(shù)據(jù)集,建立數(shù)據(jù)挖掘庫。
4.建模(Modeling)。選擇建模算法,產(chǎn)生測試模型,建立模型和評(píng)估模型。
5.評(píng)估(Evaluation)。檢查并評(píng)估已經(jīng)建立好的數(shù)據(jù)挖掘模型,驗(yàn)證數(shù)據(jù)挖掘結(jié)果,監(jiān)視數(shù)據(jù)挖掘過程并確定下一步工作。
6.布署(Deployment)。制定數(shù)據(jù)挖掘?qū)嵤┯?jì)劃,制定監(jiān)控該計(jì)劃實(shí)施的方法,完成評(píng)價(jià)報(bào)告。
以上步驟不是一次全部完成,在實(shí)施過程中個(gè)別步驟或所有步驟要反復(fù)進(jìn)行。
(一)利用數(shù)據(jù)關(guān)聯(lián)規(guī)則
關(guān)聯(lián)分為簡單關(guān)聯(lián)、時(shí)序關(guān)聯(lián)、因果關(guān)聯(lián),關(guān)聯(lián)分析的目的是找出數(shù)據(jù)庫中隱藏的關(guān)聯(lián)網(wǎng)。狀態(tài)數(shù)據(jù)平臺(tái)中的數(shù)據(jù)以一種結(jié)構(gòu)化數(shù)據(jù)組織形式存在,利用其依附的數(shù)據(jù)模型可刻畫數(shù)據(jù)間的關(guān)聯(lián)。但數(shù)據(jù)之間的關(guān)聯(lián)是復(fù)雜的,除了依附在數(shù)據(jù)模型中的關(guān)聯(lián),絕大部分是隱藏的。對(duì)于高職院校而言,使用數(shù)據(jù)關(guān)聯(lián)規(guī)則關(guān)鍵在于能否在數(shù)據(jù)平臺(tái)確定核心要素,根據(jù)核心要素所反映的人才培養(yǎng)工作狀態(tài),分析其存在的問題,圍繞核心要素到數(shù)據(jù)平臺(tái)挖掘與其關(guān)聯(lián)的數(shù)據(jù)進(jìn)行分析。如:把核心要素確定為生師比,將某校的狀態(tài)數(shù)據(jù)平臺(tái)中“6.1.1校內(nèi)專任教師基本情況”“6.1.2校內(nèi)專任教師授課及教學(xué)工作量情況”“6.2.2校內(nèi)兼課老師授課及教學(xué)工作量情況”“6.3.2校外兼職教師授課及教學(xué)工作量情況”與“7.2課程設(shè)置”一起進(jìn)行數(shù)據(jù)挖掘,把分散于多個(gè)數(shù)據(jù)表中的關(guān)聯(lián)數(shù)據(jù)集中起來進(jìn)行分析,可以解析出該校各專業(yè)的折合教師數(shù)。再與“7.1.1開設(shè)專業(yè)”相關(guān)聯(lián)(如表2所示),可分析出該校各專業(yè)的生師比情況。
表2 各專業(yè)的生師比情況
該校的整體生師比是16.35,滿足辦學(xué)基本條件。但通過表1可以看出:護(hù)理專業(yè)生師比明顯偏高,師資嚴(yán)重不足;物流管理專業(yè)生師比偏小,師資過剩。該分析可為學(xué)校師資隊(duì)伍建設(shè)決策提供參考依據(jù)。
(二)利用聚類理論分析
聚類分析是將集中的數(shù)據(jù)進(jìn)行分組,使得每一組內(nèi)的數(shù)據(jù)盡可能相似而不同組間的數(shù)據(jù)盡可能不同。在狀態(tài)數(shù)據(jù)平臺(tái)中,可將當(dāng)年填報(bào)的狀態(tài)數(shù)據(jù)與歷年來的狀態(tài)數(shù)據(jù)進(jìn)行聚類分析,從中得到學(xué)校的發(fā)展趨勢。如通過“生均實(shí)踐場所面積”這個(gè)項(xiàng)目進(jìn)行聚類分析,可以反映出高職院校實(shí)訓(xùn)條件的發(fā)展?fàn)顟B(tài)。表3為某校2011年至2015年的生均實(shí)踐場所面積。
表3 2011年至2015年生均實(shí)踐場所面積
從表3可以看出,該校在2014年之前實(shí)訓(xùn)條件建設(shè)力度不足,在2014年加大了實(shí)訓(xùn)條件建設(shè),生均實(shí)踐場所面積有較大增加。
(三) 利用可視化方法
可視化方法是最為簡單實(shí)用的分析方法,通過圖表等直觀形式,可以就一個(gè)或多個(gè)項(xiàng)目進(jìn)行數(shù)據(jù)分析。在狀態(tài)數(shù)據(jù)平臺(tái)中,可以廣泛使用此方法,為決策提供數(shù)據(jù)參考。表4和圖1采用了列表和餅形圖的形式表示了某校的專業(yè)建設(shè)與課程開設(shè)情況。
表4 專業(yè)建設(shè)情況
圖1 課程開設(shè)情況
從表4可以看出:該校共設(shè)置了61個(gè)專業(yè),全國示范是47,國家骨干及省示范是36,同類院校是30,全省是30,全國是28,說明該校專業(yè)設(shè)置較多,可以作為專業(yè)結(jié)構(gòu)調(diào)整的數(shù)據(jù)參考。從圖1可以看出,該校純理論(A類)課程占26%,理論+實(shí)踐(B類)課程占53%,純實(shí)踐(C類)課程占21%,說明實(shí)踐教學(xué)還有待進(jìn)一步加強(qiáng)。
實(shí)踐表明,科學(xué)利用DM技術(shù),充分挖掘狀態(tài)數(shù)據(jù)平臺(tái)中的各類數(shù)據(jù),并轉(zhuǎn)化成有用信息,能更好地為高職院校的人才培養(yǎng)工作服務(wù),實(shí)現(xiàn)“讓平臺(tái)數(shù)據(jù)為我所用,讓平臺(tái)數(shù)據(jù)為管理決策所用,讓平臺(tái)數(shù)據(jù)為學(xué)校的發(fā)展建設(shè)所用”。隨著狀態(tài)數(shù)據(jù)平臺(tái)建設(shè)的不斷深入,積累的數(shù)據(jù)越來越多,進(jìn)一步基于DM技術(shù)分析好平臺(tái)數(shù)據(jù),可適時(shí)調(diào)整學(xué)校發(fā)展路徑,為深化人才培養(yǎng)模式改革,完善教學(xué)質(zhì)量保證體系,提高人才培養(yǎng)質(zhì)量提供可靠保證。
[1]卞昭玲,張艷欣.大數(shù)據(jù)時(shí)代檔案信息服務(wù)課程建設(shè)初探——以河北大學(xué)檔案學(xué)專業(yè)教學(xué)為例[J].檔案學(xué)通訊, 2015(1): 78-81.
[2]汪剛,朱琳.網(wǎng)絡(luò)教學(xué)平臺(tái)下的數(shù)據(jù)挖掘技術(shù)探討[J].電子測試,2016(7): 57-58.
[3]江蘇省教育廳.高等職業(yè)院校人才培養(yǎng)工作評(píng)估實(shí)務(wù)與點(diǎn)評(píng)[M].北京:高等教育出版社,2011.
[責(zé)任編輯:趙 偉]
Consideration on the Data Platform Construction of Talents Training Work Status in Higher Vocational Colleges Based on Data Mining Technlogy
WEI Wei,LI Fusheng,GAO Wentian
(ZhengZhou Railway Vocation and Technical College, ZhengZhou 450052, China)
The data acquisition and management platform of personnel training work status in higher vocational colleges, is an information resource which was introduced by the ministry of education to all levels of educational administrators to understand the development of colleges and universities. It plays an increasingly important role in higher vocational education management. Based on the data mining technology, this paper puts forward the analysis method and the implementation path for analyzing and using the data of the platform, and also enumerates the application examples.
data mining; higher vocational college; data platform; construction
2016 - 04 - 23
鄭州鐵路職業(yè)技術(shù)學(xué)院教科研課題(2016JKY008)
魏威(1960—),女,河南鄭州人,鄭州鐵路職業(yè)技術(shù)學(xué)院高級(jí)實(shí)驗(yàn)師,研究方向?yàn)橛?jì)算機(jī)技術(shù)。
TP317
A
1008-6811(2016)-04-0043-04
鄭州鐵路職業(yè)技術(shù)學(xué)院學(xué)報(bào)2016年4期