莊海燕
(鄭州警察學(xué)院,河南 鄭州 450053)
專業(yè)綜合實(shí)訓(xùn)是指學(xué)生在完成專業(yè)基礎(chǔ)課和專業(yè)主干課的基礎(chǔ)上,依照專業(yè)人才培養(yǎng)目標(biāo),結(jié)合專業(yè)特點(diǎn)進(jìn)行的綜合性、實(shí)踐性教學(xué)活動(dòng),該項(xiàng)教學(xué)活動(dòng)對(duì)于新工科專業(yè)建設(shè)和發(fā)展具有重要意義。首先,專業(yè)綜合實(shí)訓(xùn)可以提供真實(shí)或模擬的業(yè)務(wù)環(huán)境,讓學(xué)生運(yùn)用所學(xué)的理論知識(shí)和技能,參與項(xiàng)目的設(shè)計(jì)、實(shí)施、評(píng)估和優(yōu)化,鍛煉學(xué)生分析問題、解決問題、創(chuàng)新思維和團(tuán)隊(duì)協(xié)作的能力,滿足新工科專業(yè)要求學(xué)生“具備解決復(fù)雜工程問題的能力”。[1]其次,專業(yè)綜合實(shí)訓(xùn)可以提供多元化、開放性的實(shí)踐內(nèi)容,讓學(xué)生接觸不同的交叉專業(yè)領(lǐng)域,拓展知識(shí)視野,掌握新技術(shù)和新方法,提升專業(yè)技能和綜合素質(zhì),促進(jìn)形成新工科專業(yè)要求學(xué)生具備的跨學(xué)科、跨領(lǐng)域的知識(shí)結(jié)構(gòu)和技能水平[2]。第三,專業(yè)綜合實(shí)訓(xùn)可以提供與社會(huì)需求和工程實(shí)際相結(jié)合的實(shí)踐場(chǎng)景,讓學(xué)生了解工程的社會(huì)影響和價(jià)值,培養(yǎng)學(xué)生的工程倫理意識(shí)和社會(huì)責(zé)任感,有助于培養(yǎng)新工科專業(yè)要求學(xué)生具備的“以造福人類和可持續(xù)發(fā)展為理念的現(xiàn)代工程師的精神”[3]。
一直以來,高等院校與各級(jí)教育機(jī)構(gòu)都在不斷研究如何提高學(xué)生績效管理和教學(xué)質(zhì)量,以確保提供高質(zhì)量的教育教學(xué)。而專業(yè)綜合實(shí)訓(xùn)成績是評(píng)估學(xué)生績效的關(guān)鍵指標(biāo)之一,有效地分析和理解這些成績?yōu)榻逃虒W(xué)提供決策支持是現(xiàn)代高等教育專業(yè)教學(xué)的一個(gè)極大挑戰(zhàn)。傳統(tǒng)的專業(yè)綜合實(shí)訓(xùn)評(píng)估方法受限于數(shù)據(jù)量大、復(fù)雜性高和多變性,難以有效評(píng)估其效果。應(yīng)用機(jī)器學(xué)習(xí)算法,通過分析大量學(xué)生專業(yè)綜合實(shí)訓(xùn)相關(guān)數(shù)據(jù),深入挖掘?qū)嵱?xùn)成績背后的潛在模式和規(guī)律,揭示不同學(xué)科之間的關(guān)聯(lián)和學(xué)生群體的共同特征,可以為個(gè)性化學(xué)習(xí)提供科學(xué)依據(jù),進(jìn)而優(yōu)化教學(xué)過程、提高學(xué)生學(xué)習(xí)效果,同時(shí)模式識(shí)別結(jié)果可以幫助授課教師做出更精準(zhǔn)的決策,實(shí)現(xiàn)數(shù)據(jù)驅(qū)動(dòng)的教學(xué)管理。
機(jī)器學(xué)習(xí)算法被廣泛用于分類和模式識(shí)別。其中,任務(wù)決策樹是一種基于樹結(jié)構(gòu)的分類器,隨機(jī)森林是一種集成式學(xué)習(xí)方法,支持向量機(jī)通過結(jié)構(gòu)風(fēng)險(xiǎn)最小化來解決學(xué)習(xí)問題,是一種用于分類和回歸的強(qiáng)大算法,主要用于學(xué)習(xí)數(shù)據(jù)中的模式和規(guī)律發(fā)現(xiàn)[4]。本文通過對(duì)各種算法的功能和適用性分析,測(cè)試各種算法在數(shù)據(jù)集上訓(xùn)練的優(yōu)缺點(diǎn),比較多種機(jī)器學(xué)習(xí)算法在同一數(shù)據(jù)集上的性能。綜合考慮,選擇決策樹、隨機(jī)森林和支持向量機(jī)3種機(jī)器學(xué)習(xí)算法來分析綜合實(shí)訓(xùn)成績,根據(jù)運(yùn)行結(jié)果提供全面的數(shù)據(jù)分析和性能評(píng)估。
本文收集了網(wǎng)絡(luò)安全與執(zhí)法專業(yè)近3年的專業(yè)綜合實(shí)訓(xùn)成績,包括輿情分析、現(xiàn)場(chǎng)勘查、電子數(shù)據(jù)分析、網(wǎng)安檢查和過程性成績等數(shù)據(jù)。數(shù)據(jù)采集通過專業(yè)綜合實(shí)訓(xùn)過程和教學(xué)信息管理系統(tǒng)進(jìn)行,數(shù)據(jù)中除了各模塊的成績,還包含學(xué)生學(xué)號(hào)等信息。
經(jīng)過對(duì)專業(yè)綜合實(shí)訓(xùn)成績數(shù)據(jù)預(yù)處理和初步統(tǒng)計(jì)分析,得到如圖1所示的專業(yè)綜合實(shí)訓(xùn)成績數(shù)據(jù)的基本情況。數(shù)據(jù)的描述性統(tǒng)計(jì)分析及結(jié)構(gòu)可視化顯示了每列成績的中心趨勢(shì)、離散度和分布的基本情況,以及各列之間的關(guān)系。圖1顯示了每門課程的成績平均水平、波動(dòng)程度以及分?jǐn)?shù)分布情況,各列缺失值數(shù)量為0,所有學(xué)生所有模塊均有成績,無缺失;各模塊成績的標(biāo)準(zhǔn)差數(shù)值分別為2.86、3.99、3.26、5.40、8.14,說明各模塊成績相對(duì)穩(wěn)定,沒有較大波動(dòng);圖1(c)顯示兩兩特征之間相關(guān)性,可以看出現(xiàn)場(chǎng)勘查成績、網(wǎng)絡(luò)檢查成績和過程性成績之間可能具有一定線性相關(guān)性,后面需借助主成分分析法降維處理后進(jìn)一步分析。
圖1 專業(yè)綜合實(shí)訓(xùn)成績數(shù)據(jù)基本情況
2.2.1 數(shù)據(jù)清洗
數(shù)據(jù)清洗包括檢查數(shù)據(jù)集中是否有缺失值或異常值。在數(shù)據(jù)收集過程中,缺失值通常是由數(shù)據(jù)輸入錯(cuò)誤或系統(tǒng)問題引起的,異常值則可能是由測(cè)量誤差或數(shù)據(jù)錄入錯(cuò)誤引起的。缺失值處理可以刪除、插補(bǔ)或者不處理;使用統(tǒng)計(jì)方法[5]來檢測(cè)異常值,并采取適當(dāng)?shù)奶幚泶胧?包括截?cái)唷⑻娲蛣h除,以確保異常值不會(huì)對(duì)模型性能產(chǎn)生負(fù)面影響。本文對(duì)數(shù)據(jù)進(jìn)行了基本的缺失值處理、異常值處理和規(guī)約處理。經(jīng)過對(duì)數(shù)據(jù)集的分析,缺失值和異常值都是反映實(shí)際情況的正確數(shù)據(jù),不做處理,之后將各模塊成績規(guī)約到[0,100]。
2.2.2 數(shù)據(jù)劃分
預(yù)處理的目標(biāo)是確保數(shù)據(jù)的質(zhì)量和一致性,為后續(xù)的分析和建模進(jìn)行數(shù)據(jù)準(zhǔn)備。本文通過數(shù)據(jù)清洗、處理缺失值和異常值,以及正確的數(shù)據(jù)劃分和特征選擇,為機(jī)器學(xué)習(xí)模型提供高質(zhì)量的數(shù)據(jù),以更好地理解和分析專業(yè)綜合實(shí)訓(xùn)成績。本文在訓(xùn)練和評(píng)估機(jī)器學(xué)習(xí)模型時(shí)將數(shù)據(jù)集劃分為訓(xùn)練集和測(cè)試集,初始比例為80%的數(shù)據(jù)用于訓(xùn)練,20%的數(shù)據(jù)用于測(cè)試。研究過程中對(duì)這些參數(shù)進(jìn)行了調(diào)整以提高模型的泛化性能,避免過擬合。
2.2.3 特征選擇
本文中,由于學(xué)號(hào)等作為標(biāo)識(shí)符和附屬信息并不對(duì)模型的性能產(chǎn)生影響,故選擇輿情分析成績、現(xiàn)場(chǎng)勘查成績、電子數(shù)據(jù)分析成績、網(wǎng)安檢查成績作為模型的特征。
聚類分析是一種無監(jiān)督學(xué)習(xí)方法,可將數(shù)據(jù)中的對(duì)象分成不同的組或簇,這些組內(nèi)的對(duì)象在某種方面相似,而不同組之間的對(duì)象有明顯的差異。本文對(duì)學(xué)生的專業(yè)綜合實(shí)訓(xùn)成績數(shù)據(jù)進(jìn)行聚類分析,將學(xué)生分為不同的簇,可揭示學(xué)生潛在的模式或關(guān)系。
本文采用k均值聚類法,使用“肘部法則”選擇聚類簇?cái)?shù),研究結(jié)果如圖2所示。在圖2右上部,“肘部”處的簇?cái)?shù)為3,聚為3類,三維散點(diǎn)圖中每個(gè)點(diǎn)代表一個(gè)學(xué)生,不同形狀表示其所屬簇,每個(gè)簇的特征如圖3所示。圖3表明,簇0平均綜合成績(過程性成績)相對(duì)較高,約為54.89,表示這個(gè)簇的學(xué)生在綜合成績上相對(duì)較好;簇1平均綜合成績(過程性成績)較低,約為36.73,表示這個(gè)簇的學(xué)生在綜合成績上相對(duì)較差,尤其在輿情分析和電子數(shù)據(jù)分析方面;簇2平均綜合成績(過程性成績)較高,約為43.65,表示這個(gè)簇的學(xué)生在綜合成績上相對(duì)較好,尤其在現(xiàn)場(chǎng)勘查、電子數(shù)據(jù)分析和網(wǎng)安檢查方面。3個(gè)簇各自包含學(xué)生數(shù)目分別為了61、50和30名,簇0的學(xué)生數(shù)量最多,共61名,表示在該簇中有較多的學(xué)生表現(xiàn)較好(可能是高成績學(xué)生),或者這個(gè)簇的學(xué)生相對(duì)較多;簇1包含了50名學(xué)生,學(xué)生數(shù)量略少于簇0,可能代表中等成績的學(xué)生群體,這些學(xué)生的成績?cè)诟鱾€(gè)模塊上可能相對(duì)平均;簇2包含了30名學(xué)生,這是最小的簇,這些學(xué)生在某些模塊上表現(xiàn)很好,尤其是現(xiàn)場(chǎng)勘查和電子數(shù)據(jù)分析。
圖2 專業(yè)綜合實(shí)訓(xùn)成績聚類分析
圖3 算法在測(cè)試集運(yùn)行結(jié)果
圖2專業(yè)綜合實(shí)訓(xùn)成績聚類分析通過分簇,對(duì)每個(gè)簇的規(guī)模、成績情況分析,將這些分析結(jié)果作為依據(jù),制定更靈活的教育策略和教學(xué)方法,例如根據(jù)每個(gè)簇的特點(diǎn)提供特定的資源、培訓(xùn)或教育干預(yù),從而滿足不同學(xué)生群體的需求。
3.2.1 模型訓(xùn)練與性能評(píng)估
本文訓(xùn)練了決策樹、隨機(jī)森林和支持向量機(jī)3種機(jī)器學(xué)習(xí)模型,并在測(cè)試集上進(jìn)行了性能評(píng)估。為評(píng)估模型的性能,評(píng)估過程中采用了準(zhǔn)確度(Accuracy)、精確度(Precision)、召回率(Recall)和F1分?jǐn)?shù)(F1-Score)等指標(biāo)。這些指標(biāo)用于衡量模型的分類準(zhǔn)確度、識(shí)別出的正類別樣本與真實(shí)正類別樣本的比例、所有真實(shí)正類別樣本中成功識(shí)別出的比例以及精確度與召回率的調(diào)和平均值。通過這些指標(biāo),可以全面評(píng)估模型的性能。
3.2.2 結(jié)果分析與討論
本文對(duì)上述3種算法的識(shí)別結(jié)果(見圖3)進(jìn)行討論和分析,得出以下結(jié)論。
(1)決策樹算法。
決策樹算法在模式識(shí)別任務(wù)中表現(xiàn)良好,但仍存在一定的分類誤差。準(zhǔn)確度、精確度、召回率和F1分?jǐn)?shù)均為0.75,表明該模型在對(duì)數(shù)據(jù)進(jìn)行分類時(shí)具有一定準(zhǔn)確性。決策樹算法在模式識(shí)別任務(wù)中獲得了不錯(cuò)的性能,但仍然有改進(jìn)空間,因?yàn)镕1分?jǐn)?shù)沒有達(dá)到1.0,表明可能存在一些分類誤差。
(2)隨機(jī)森林算法。
隨機(jī)森林算法的性能與決策樹相似,準(zhǔn)確度、精確度、召回率和F1分?jǐn)?shù)均為0.75。這意味著隨機(jī)森林能夠?qū)?shù)據(jù)進(jìn)行分類,但也存在一些分類誤差。
(3)支持向量機(jī)算法。
支持向量機(jī)算法在這個(gè)模式識(shí)別任務(wù)中表現(xiàn)出色,準(zhǔn)確度、精確度、召回率和F1分?jǐn)?shù)均為1.00,這意味著該模型能夠完美地對(duì)數(shù)據(jù)進(jìn)行分類,沒有分類誤差。支持向量機(jī)通常適用于復(fù)雜的決策邊界和高維數(shù)據(jù)集,這一結(jié)果顯示出其強(qiáng)大的分類性能。
實(shí)驗(yàn)結(jié)果表明,支持向量機(jī)在這個(gè)模式識(shí)別任務(wù)中表現(xiàn)最為出色。決策樹和隨機(jī)森林也表現(xiàn)良好,但存在一些分類誤差。通過模型訓(xùn)練和評(píng)估結(jié)果,認(rèn)為支持向量機(jī)算法更適合本任務(wù)需求,進(jìn)一步研究可以嘗試?yán)^續(xù)調(diào)優(yōu)模型以提高性能。
本文基于機(jī)器學(xué)習(xí)的方法對(duì)學(xué)生綜合實(shí)訓(xùn)成績進(jìn)行了分析和模式識(shí)別探討。通過收集大量學(xué)生的實(shí)訓(xùn)成績數(shù)據(jù),利用機(jī)器學(xué)習(xí)算法進(jìn)行深入挖掘和分析,揭示了學(xué)生在實(shí)訓(xùn)環(huán)境中的表現(xiàn)模式;采用決策樹、支持向量機(jī)和神經(jīng)網(wǎng)絡(luò)在內(nèi)的多種機(jī)器學(xué)習(xí)模型識(shí)別和預(yù)測(cè)影響學(xué)生綜合實(shí)訓(xùn)表現(xiàn)的關(guān)鍵因素,本文通過對(duì)模型的訓(xùn)練和驗(yàn)證,成功地識(shí)別了影響學(xué)生成績的關(guān)鍵特征,為教育者提供了有針對(duì)性的干預(yù)措施。研究結(jié)果表明,機(jī)器學(xué)習(xí)方法在學(xué)生綜合實(shí)訓(xùn)成績分析中具有顯著的預(yù)測(cè)能力,利用模型的解釋性深入挖掘?qū)W生在實(shí)訓(xùn)過程中的學(xué)習(xí)軌跡,能夠?yàn)閭€(gè)性化教育和輔導(dǎo)提供理論支持。
本文研究為學(xué)生綜合實(shí)訓(xùn)成績的有效評(píng)估提供了新方法,也為教育決策和干預(yù)提供了實(shí)證支持。未來可進(jìn)一步探討模型的遷移性和可擴(kuò)展性,以適應(yīng)不同學(xué)科和教育背景的需求。