陳方兵 湯湘林
摘 要:技工院校學(xué)生普遍在學(xué)習(xí)自信心和執(zhí)行力方面存在不足,很容易導(dǎo)致學(xué)習(xí)興趣下降、成績不理想。本文通過收集技工院校學(xué)生在校行為數(shù)據(jù),通過人工智能算法對學(xué)生行為數(shù)據(jù)進(jìn)行實時分析,建立了學(xué)生學(xué)習(xí)危機(jī)預(yù)警模型,一旦監(jiān)測到學(xué)生有學(xué)習(xí)危機(jī),系統(tǒng)會自動預(yù)警,引起輔導(dǎo)員和老師對學(xué)生的注意。這樣一方面可及早發(fā)現(xiàn)與預(yù)警,另一方面后續(xù)通過輔導(dǎo)員和老師有針對性地對學(xué)生進(jìn)行思想工作,最終可幫助學(xué)生扭轉(zhuǎn)學(xué)習(xí)困難的局面。
關(guān)鍵詞:人工智能? ? 技工院校? ? 學(xué)習(xí)困難? ? 學(xué)習(xí)危機(jī)預(yù)警
當(dāng)今社會要求技工院校學(xué)生不僅要有良好的思想道德素質(zhì)、文化素質(zhì)、專業(yè)素質(zhì)和身體素質(zhì),還要具備良好的學(xué)習(xí)能力。
“十三五”以來,技工院校堅持就業(yè)導(dǎo)向,聚焦技工、技師急需緊缺問題,技能人才培養(yǎng)工作取得積極成效。截至2019年年底,全國共有技工院校2 392所,在校生360.3萬人;2019年度全國技工院校共招生143.0萬人,畢業(yè)生98.4萬人,就業(yè)率為97.5%。很多技工院校從學(xué)生學(xué)習(xí)態(tài)度矯正到學(xué)習(xí)能力培養(yǎng)等各個環(huán)節(jié)都開展了很多工作,并取得了一定的成果。但大部分院校都是對所有學(xué)生無差別地開展工作,由于每位學(xué)生情況不一樣,導(dǎo)致學(xué)校不能針對有問題的學(xué)生重點做好工作,基本上都是事后救火,不能防患于未然。
針對上述情況,筆者積極探索學(xué)生學(xué)習(xí)危機(jī)預(yù)警解決方案,加強在學(xué)生學(xué)習(xí)危機(jī)到來之前的預(yù)警工作,并提出引入人工智能等新興預(yù)警方法。
一、人工智能學(xué)習(xí)危機(jī)預(yù)警模型的研究
從行為心理學(xué)理論出發(fā),個體的行為變化可以反映其心理狀態(tài)變化,反之,個體的心理狀態(tài)變化也會表現(xiàn)在行為上。個體自身行為的變化,一定是由于個體某些情緒的變化或者外在刺激導(dǎo)致的,進(jìn)而影響有機(jī)體的其他行為狀態(tài),也就是說有機(jī)體的眾多行為之間存在關(guān)聯(lián)關(guān)系。于是筆者試圖尋找影響個體學(xué)習(xí)行為的相關(guān)因素,如果能找到個體學(xué)習(xí)行為與哪些其他行為相關(guān),那么通過對外顯行為的監(jiān)測,最終內(nèi)隱行為就變得可預(yù)測,這樣學(xué)習(xí)危機(jī)預(yù)警就變得可以實現(xiàn)。
個體行為包括很多方面,例如飲食、作息、社交、運動、工作等。其中需要解決兩個關(guān)鍵問題。首先,需要接入個體的行為數(shù)據(jù),只有接入了個體行為數(shù)據(jù)才有可能對個體行為數(shù)據(jù)進(jìn)行分析,找出關(guān)聯(lián)、關(guān)系;其次,需要在行為大數(shù)據(jù)中找出與學(xué)習(xí)危機(jī)有關(guān)聯(lián)的指標(biāo)進(jìn)行學(xué)習(xí)危機(jī)預(yù)警。尋找與學(xué)習(xí)相關(guān)聯(lián)的指標(biāo)非常重要,需要明確哪些指標(biāo)與學(xué)習(xí)的關(guān)聯(lián)性較強、哪些指標(biāo)與學(xué)習(xí)的關(guān)聯(lián)性較弱,而確定關(guān)聯(lián)性指標(biāo)的強弱是非常困難的,需要對大量的數(shù)據(jù)進(jìn)行分析才能得到。
近年來技工院校信息化建設(shè)飛速發(fā)展,技工院校學(xué)生在學(xué)校里大部分行為都可能留下行為記錄,這樣一來就為解決第一個關(guān)鍵問題提供了可能。有大量行為數(shù)據(jù)作為基礎(chǔ),利用人工智能、大數(shù)據(jù)等技術(shù)手段,依靠行為學(xué)的理論基礎(chǔ),就有可能找出行為與學(xué)習(xí)危機(jī)之間的關(guān)系。目前已經(jīng)能夠發(fā)現(xiàn)的學(xué)生行為數(shù)據(jù)包括但不限于個人信息、消費記錄、網(wǎng)絡(luò)系統(tǒng)使用情況、打卡記錄、成績記錄、選課記錄、考勤記錄、就業(yè)數(shù)據(jù)、獎懲助學(xué)貸記錄等。
初步獲得的學(xué)生行為數(shù)據(jù)是臟數(shù)據(jù)(指源系統(tǒng)中的數(shù)據(jù)不在給定的范圍內(nèi)或?qū)τ趯嶋H業(yè)務(wù)毫無意義,或是數(shù)據(jù)格式非法,以及在源系統(tǒng)中存在不規(guī)范的編碼和含糊的業(yè)務(wù)邏輯),很多數(shù)據(jù)并不能直接使用,需要對數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗、脫敏和指標(biāo)化幾個步驟,才能形成完整可用的數(shù)據(jù)集。數(shù)據(jù)清洗主要是對數(shù)據(jù)進(jìn)行重新審查和校驗,目的在于刪除重復(fù)信息、糾正存在的錯誤,并提供數(shù)據(jù)一致性。數(shù)據(jù)脫敏主要是將數(shù)據(jù)中的敏感信息進(jìn)行隱藏和加密,目的在于不暴露個人隱私,脫敏不僅是對某些關(guān)鍵字段脫敏,還需要對多個字段交叉驗證,保證將各字段組合起來也不能顯示個人真實信息。
人工智能學(xué)習(xí)危機(jī)預(yù)警模型的建立主要有兩個方面的問題需要解決:第一,收集與問題相關(guān)的訓(xùn)練數(shù)據(jù)進(jìn)行模型訓(xùn)練,收集訓(xùn)練數(shù)據(jù)組成訓(xùn)練集,利用訓(xùn)練集對模型進(jìn)行訓(xùn)練,使模型對特定問題具有預(yù)測能力;第二,將新的行為數(shù)據(jù)輸入模型,新的行為數(shù)據(jù)組成了測試集,用測試集數(shù)據(jù)來驗證模型的預(yù)測能力,進(jìn)行預(yù)測并檢驗,測試模型的預(yù)測準(zhǔn)確度。
訓(xùn)練數(shù)據(jù)主要是指學(xué)校已經(jīng)掌握的有學(xué)習(xí)危機(jī)的學(xué)生數(shù)據(jù),有學(xué)習(xí)危機(jī)的學(xué)生的數(shù)據(jù)將作為訓(xùn)練樣本進(jìn)行模型訓(xùn)練,在征得學(xué)生本人的同意后,以這部分學(xué)生的行為數(shù)據(jù)作為訓(xùn)練樣本,采用合適的算法,對量化模型進(jìn)行訓(xùn)練。訓(xùn)練完成后,量化模型就會有一定的預(yù)測能力,模型這種預(yù)測能力主要體現(xiàn)在對有學(xué)習(xí)危機(jī)行為的識別和預(yù)警上。
預(yù)測數(shù)據(jù)是指隨機(jī)抽取一部分學(xué)生的行為數(shù)據(jù),在不知道這批學(xué)生是否有學(xué)習(xí)危機(jī)情況的前提下,征得學(xué)生本人同意后,將這批學(xué)生的行為數(shù)據(jù)輸入量化模型。量化模型對新輸入的學(xué)生數(shù)據(jù)進(jìn)行預(yù)測,預(yù)測完成后會對預(yù)測結(jié)果進(jìn)行準(zhǔn)確度對比,將預(yù)測有學(xué)習(xí)危機(jī)的學(xué)生名單與實際情況進(jìn)行比較,得出模型預(yù)測的準(zhǔn)確度和識別錯誤率。
模型對新數(shù)據(jù)進(jìn)行預(yù)測后,需要有輸出結(jié)果,模型將輸出結(jié)果進(jìn)行打分,按照分值的高低進(jìn)行排序,分?jǐn)?shù)越高表示學(xué)生有學(xué)習(xí)危機(jī)的可能性越大,分?jǐn)?shù)越低表示學(xué)生有學(xué)習(xí)危機(jī)的可能性越小,最后模型需要設(shè)置一個閾值,在閾值之上的學(xué)生建議重點關(guān)注。除此以外,模型還將學(xué)生的行為數(shù)據(jù)指標(biāo)化,形成個人用戶畫像系統(tǒng),用戶畫像全方位展示學(xué)生各個方面的表現(xiàn),揭示各個指標(biāo)是如何影響學(xué)生學(xué)習(xí),進(jìn)而造成學(xué)習(xí)危機(jī)的。
二、人工智能學(xué)習(xí)危機(jī)預(yù)警模型的應(yīng)用
人工智能學(xué)習(xí)危機(jī)預(yù)警模型的應(yīng)用需要注意如下三個問題。
(一)數(shù)據(jù)類型
數(shù)據(jù)類型即需要用到哪些類型的學(xué)生行為數(shù)據(jù)。不同類型的數(shù)據(jù)對結(jié)果影響很大,所以需要不斷嘗試不同類型數(shù)據(jù)的組合,找出影響因素較大的數(shù)據(jù)類型。
根據(jù)對影響學(xué)習(xí)因素的理論的深入研究,結(jié)合實際情況,筆者選取的數(shù)據(jù)類型主要有上網(wǎng)時間、上網(wǎng)時長、進(jìn)宿舍時間、出宿舍時間、運動頻率、運動時間、選課科目、攝像頭視頻數(shù)據(jù)、個人信息等。這些數(shù)據(jù)類型是比較普通的數(shù)據(jù),在各個學(xué)校中應(yīng)用比較普遍,具有較強的普適性。同時這些數(shù)據(jù)類型相對來說較容易獲得,且數(shù)據(jù)質(zhì)量較高,與研究標(biāo)的的關(guān)聯(lián)性較強。
(二)算法對比
算法對比即采用不同的算法進(jìn)行建模訓(xùn)練,而后評估預(yù)測效果。不同的算法對模型預(yù)測準(zhǔn)確度影響較大,選擇合適的算法,可以大大提高模型的預(yù)測精度。
筆者選取了監(jiān)督學(xué)習(xí)算法和非監(jiān)督學(xué)習(xí)算法兩類,原因是這樣可以比較不同類型的算法在處理研究問題時的優(yōu)劣,最后找到合適的算法來訓(xùn)練模型。
監(jiān)督學(xué)習(xí)是指利用一組已知類別的樣本調(diào)整分類器的參數(shù),使其達(dá)到所要求的性能,也稱為監(jiān)督訓(xùn)練或有教師學(xué)習(xí)。監(jiān)督學(xué)習(xí)算法具體采用了時間序列分析、邏輯回歸算法以及改進(jìn)的支持向量機(jī)算法。
非監(jiān)督學(xué)習(xí)是指缺乏足夠的先驗知識,因此難以人工標(biāo)注類別或進(jìn)行人工標(biāo)注類別的成本太高。希望計算機(jī)能代人們完成這些工作,或至少提供一些幫助。根據(jù)類別未知(沒有被標(biāo)記)的訓(xùn)練樣本解決模式識別中的各種問題。非監(jiān)督學(xué)習(xí)算法主要采用聚類算法。
通過比較監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí)兩類算法的效果,可以達(dá)到兩個目的:第一,對比哪一類算法對學(xué)習(xí)危機(jī)預(yù)警模型更有效果;第二,找出預(yù)測準(zhǔn)確度較高的算法,應(yīng)用于實際預(yù)測。
(三)指標(biāo)有效性驗證
指標(biāo)有效性驗證即選取不同的指標(biāo)后,評估不同指標(biāo)與預(yù)測結(jié)果關(guān)聯(lián)度大小。
筆者共選取了8個指標(biāo),并對這些指標(biāo)做了有效性驗證。這8個指標(biāo)分別是單親家庭、運動情況、飲食情況、睡眠情況、同性社交、異性社交、網(wǎng)絡(luò)社交、新生適應(yīng)壓力。
對這8個指標(biāo)進(jìn)行關(guān)聯(lián)度分析可以得到不同指標(biāo)的關(guān)聯(lián)度大小,單親家庭的關(guān)聯(lián)度為0.08,運動情況的關(guān)聯(lián)度為0.18,飲食情況的關(guān)聯(lián)度為0.33,睡眠情況的關(guān)聯(lián)度為0.28,同性社交的關(guān)聯(lián)度為0.59,異性社交的關(guān)聯(lián)度為0.67,網(wǎng)絡(luò)社交的關(guān)聯(lián)度為0.49,新生適應(yīng)性壓力關(guān)聯(lián)度為0.56。
由此可見,選取的這8個指標(biāo)中,社交情況與學(xué)習(xí)危機(jī)的關(guān)聯(lián)度最大,新生適應(yīng)性壓力與學(xué)習(xí)危機(jī)的關(guān)聯(lián)度也很大,相對來說,家庭情況和運動情況與學(xué)習(xí)危機(jī)的關(guān)聯(lián)度較小。
三、意義
(一)學(xué)習(xí)危機(jī)預(yù)警,實現(xiàn)精準(zhǔn)“扶貧”
系統(tǒng)根據(jù)學(xué)生數(shù)據(jù)進(jìn)行自動化預(yù)警,學(xué)校能夠有效幫助學(xué)習(xí)困難學(xué)生,及時讓學(xué)習(xí)困難學(xué)生走出人生低谷,實現(xiàn)學(xué)習(xí)方面的精準(zhǔn)“扶貧”。這樣不僅可以及時幫助學(xué)生走出學(xué)習(xí)的困境,也能夠讓學(xué)生獲得一個更好的未來。
(二)學(xué)生無感知,不會刻意隱藏
學(xué)校在用傳統(tǒng)的方法識別學(xué)生是否有學(xué)習(xí)危機(jī)時,學(xué)生由于存在抗拒心理,總會在老師和輔導(dǎo)員面前刻意隱藏自己的某些行為,讓老師產(chǎn)生錯誤的判斷。人工智能學(xué)習(xí)危機(jī)預(yù)警模型可以在學(xué)生無感知的情況下,對學(xué)生學(xué)習(xí)情況進(jìn)行分析和預(yù)警,相對來講人工智能學(xué)習(xí)危機(jī)預(yù)警模型的結(jié)果更真實。
(三)不做事后救火工作,防患于未然
之前,學(xué)校在解決學(xué)生學(xué)習(xí)危機(jī)問題時,總是等到學(xué)生在學(xué)習(xí)方面已經(jīng)出現(xiàn)了嚴(yán)重的問題時才能發(fā)現(xiàn)并采取措施,這實際上是一種事后救火,不利于及時發(fā)現(xiàn)和解決問題,甚至可能造成難以挽回的后果。學(xué)習(xí)危機(jī)預(yù)警模型可以在學(xué)生剛剛出現(xiàn)苗頭時就能發(fā)現(xiàn)問題并及時預(yù)警,加上及時干預(yù),可以有效縮短發(fā)現(xiàn)問題的時間,極大提高了解決問題的效率和速度。
參考文獻(xiàn):
[1]鄒潔,朱國勝,曹揚晨.基于監(jiān)督學(xué)習(xí)算法的網(wǎng)絡(luò)流量應(yīng)用類型分類研究[J].長江信息通信,2021(1).
[2]孔欣然.機(jī)器學(xué)習(xí)綜述[J].電子制作,2019(24).
(作者單位:陳方兵,深圳阿塔基科技有限公司;
湯湘林,深圳技師學(xué)院)