(浙江工業(yè)大學(xué) 教育科學(xué)與技術(shù)學(xué)院,浙江 杭州 310023)
隨著人工智能技術(shù)的飛速發(fā)展,在線學(xué)習(xí)進(jìn)入領(lǐng)域垂直細(xì)分、方式豐富多樣、資源開放共享以及內(nèi)容供給智能的全新時代。個性化的在線學(xué)習(xí)關(guān)注學(xué)生的認(rèn)知水平、學(xué)習(xí)表現(xiàn)等特征,旨在搭建智能化、個性化的教育平臺,科學(xué)有效地對學(xué)生的知識掌握狀態(tài)進(jìn)行追蹤,挖掘?qū)W生知識薄弱點(diǎn),為學(xué)生制定個性化學(xué)習(xí)的路徑。在知識掌握狀態(tài)不斷更新的過程中,知識追蹤(Knowledge tracing,KT)根據(jù)學(xué)習(xí)者學(xué)習(xí)表現(xiàn)、認(rèn)知風(fēng)格等進(jìn)行建模[1]。隨著在線教育的發(fā)展,運(yùn)用智能技術(shù)處理大規(guī)模數(shù)據(jù)成為必然趨勢,優(yōu)化算法預(yù)測學(xué)習(xí)偏好,借助深度學(xué)習(xí)跟蹤動態(tài)人臉,獲取用戶表現(xiàn)等成為近年來熱點(diǎn)研究問題[2-4]?;谏窠?jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)是可以有效提升知識追蹤預(yù)測精度的重要工具?;谏疃葘W(xué)習(xí)的知識追蹤能夠處理學(xué)習(xí)過程中動態(tài)和靜態(tài)的學(xué)習(xí)者多維度特征,借助記錄當(dāng)前學(xué)習(xí)者狀態(tài)和知識點(diǎn)關(guān)系形成記憶網(wǎng)絡(luò)?;谏疃葘W(xué)習(xí)的知識追蹤模型與記憶矩陣模擬學(xué)習(xí)者的整個學(xué)習(xí)過程,學(xué)習(xí)者可以沉浸于實(shí)時監(jiān)督的學(xué)習(xí)訓(xùn)練中,因此深度學(xué)習(xí)成為個性化在線學(xué)習(xí)中知識追蹤的重要工具。筆者利用在線學(xué)習(xí)過程中的多維特征,基于學(xué)習(xí)過程答題交互進(jìn)行建模,結(jié)合人工智能技術(shù)以優(yōu)化深度知識追蹤方法,探索和解決在線學(xué)習(xí)領(lǐng)域知識追蹤技術(shù)難題,以期提升在線學(xué)習(xí)者學(xué)習(xí)效率。
知識追蹤技術(shù)是根據(jù)學(xué)習(xí)者歷史的答題情況對學(xué)習(xí)者的知識掌握情況進(jìn)行建模,從而得到學(xué)習(xí)者當(dāng)前的知識狀態(tài)。Ai等[5]首先提出此概念,并將知識追蹤描述成一個時序建模問題,以預(yù)測學(xué)習(xí)者未來的學(xué)習(xí)表現(xiàn)[6]。知識追蹤形式化描述:根據(jù)學(xué)習(xí)者在學(xué)習(xí)活動中的答題歷史記錄Xt={x1,x2,…,xt},預(yù)測該學(xué)習(xí)者在下一次答題xt+1的表現(xiàn),其中xt={qt,at},表示學(xué)習(xí)者在t時刻回答問題qt的結(jié)果為at。為了實(shí)現(xiàn)對學(xué)習(xí)者知識狀態(tài)的精確分析,許多技術(shù)正被廣泛應(yīng)用于知識追蹤研究領(lǐng)域,主要分為基于概率圖的知識追蹤方法和基于深度學(xué)習(xí)的知識追蹤方法。
基于概率圖的知識追蹤方法需要手工標(biāo)注學(xué)習(xí)過程中的各項(xiàng)參數(shù)再進(jìn)行模型訓(xùn)練,典型的應(yīng)用方法有:貝葉斯知識追蹤(Bayesian knowledge tracing,BKT)、基于Rasch模型擴(kuò)展的性能因素分析(Performance factors analysis,PFA)以及學(xué)習(xí)因素分析(Learning factors analysis,LFA)等。BKT模型將學(xué)習(xí)者知識狀態(tài)建模為一組二元變量,變量一為學(xué)習(xí)狀態(tài)是潛變量,變量二為答題結(jié)果是觀察變量[7]。
BKT模型沒有考慮學(xué)習(xí)者遺忘因素、知識之間的關(guān)系等問題,因此預(yù)測精度不高。為提升BKT模型的預(yù)測性能,有學(xué)者將知識層級關(guān)系、學(xué)習(xí)者先驗(yàn)知識估計(jì)以及題目難度估計(jì)等多維特征因素融入到BKT模型中[8],如李曉光等[9]融合學(xué)習(xí)過程中的眾多特征優(yōu)化了BKT模型;葉艷偉等[10]探究了學(xué)生遺忘因素和數(shù)據(jù)量對BKT模型預(yù)測的影響;Kaser等[11]利用動態(tài)貝葉斯網(wǎng)絡(luò)將知識點(diǎn)進(jìn)行關(guān)聯(lián)提高了預(yù)測精度。而PFA和LFA方法利用動態(tài)概率模型并根據(jù)學(xué)習(xí)者的題目作答情況進(jìn)行知識追蹤,不斷更新學(xué)習(xí)者對每個知識概念的掌握程度[12]。PFA和LFA都是評估多知識點(diǎn)的模型,能較好地解決多知識點(diǎn)追蹤問題,但未考慮學(xué)習(xí)者知識狀態(tài)是動態(tài)變化的,因此預(yù)測精度也較低。整體上,基于概率圖的知識追蹤方法都需要手動標(biāo)注知識點(diǎn),預(yù)測精度依賴教學(xué)者的先驗(yàn)教學(xué)經(jīng)驗(yàn),精準(zhǔn)獲取學(xué)習(xí)者知識狀態(tài)的自動化程度較低。為了提高知識追蹤性能,研究者通過結(jié)合概率圖和認(rèn)知診斷技術(shù)的方法提升預(yù)測精度[13]。其中項(xiàng)目反應(yīng)理論(Item response theory,IRT)是最常見的練習(xí)測驗(yàn)認(rèn)知診斷技術(shù),該理論基于學(xué)生的能力水平θ和項(xiàng)目的難度水平βj,輸出學(xué)生正確回答問題j的概率P(a),概率由一個項(xiàng)目反應(yīng)函數(shù)來定義,通過習(xí)題難度來評估學(xué)習(xí)者對知識點(diǎn)的掌握能力。
基于深度學(xué)習(xí)的知識追蹤(Deep knowledge tracing,DKT)不需要豐富的先驗(yàn)教學(xué)經(jīng)驗(yàn)和大量手工標(biāo)記,便可以對學(xué)習(xí)者知識狀態(tài)進(jìn)行建模,其對學(xué)習(xí)者的知識追蹤效果已被證明優(yōu)于傳統(tǒng)知識追蹤方法,因此已成為主流的知識追蹤方法[14]。
DKT使用獨(dú)熱編碼方式將學(xué)習(xí)者的答題交互歷史(qt,at)轉(zhuǎn)換成固定長度的輸入向量xt,轉(zhuǎn)換后將xt傳遞到隱藏層,并使用長短期記憶(Long short-term memory,LSTM)單元計(jì)算隱藏狀態(tài)ht,隱藏層包含了學(xué)習(xí)者學(xué)習(xí)過程中所有答題信息,因此隱藏層可以理解為學(xué)習(xí)者的知識狀態(tài)層。進(jìn)而,這個知識狀態(tài)被傳遞到輸出層以計(jì)算輸出向量yt,yt表示正確回答下一道題目的概率,由于DKT得到的所有知識狀態(tài)信息都儲存在隱藏層中,所以教學(xué)者難以獲得學(xué)習(xí)者的知識狀態(tài)具體信息。Zhang等[15]提出了利用動態(tài)鍵值存儲網(wǎng)絡(luò)(Dynamic key-value memory networks,DKVMN)來解決上述兩個問題,并取得了較好的效果,DKVMN利用記憶增強(qiáng)神經(jīng)網(wǎng)絡(luò)中的注意機(jī)制,將知識點(diǎn)(靜態(tài)鍵記憶)與知識狀態(tài)(動態(tài)鍵記憶)相關(guān)聯(lián),進(jìn)而通過計(jì)算題目的知識點(diǎn)構(gòu)成和知識狀態(tài)向量來計(jì)算知識狀態(tài),其中動態(tài)鍵記憶矩陣隨著學(xué)習(xí)者答題交互不斷更新;Ai等[5]指出DKVMN模型不僅可以避免過度擬合,而且能精確地發(fā)現(xiàn)輸入題目的知識構(gòu)成。也有學(xué)者通過將DKT技術(shù)與其他技術(shù)相結(jié)合來提高知識追蹤的性能,如馬驍睿等[16]通過結(jié)合協(xié)同過濾算法重復(fù)利用學(xué)習(xí)者之間的特征信息,提出DKT-CF方法提高知識追蹤預(yù)測精度;Wang等[17]利用題目之間的特征關(guān)系和知識點(diǎn)的聯(lián)通關(guān)系設(shè)計(jì)了DKTS方法,有效地提升了知識追蹤方法的服務(wù)性能。
由于在線學(xué)習(xí)過程通常是學(xué)習(xí)者經(jīng)過系列學(xué)習(xí)操作再進(jìn)行答題,而當(dāng)前知識追蹤研究忽略學(xué)習(xí)過程,僅對答題交互進(jìn)行建模,缺乏對知識追蹤模型訓(xùn)練要素的深入研究,預(yù)測精度和可解釋性仍有進(jìn)一步提升的空間。筆者嘗試使用特征選擇算法確定知識追蹤模型最佳特征集,在深度知識追蹤模型中融合學(xué)習(xí)過程動態(tài)和靜態(tài)的多維特征,來兼顧知識追蹤模型優(yōu)化的預(yù)測精度和可解釋性,提出融合學(xué)習(xí)過程多維特征的知識追蹤優(yōu)化方法。
知識追蹤是根據(jù)學(xué)習(xí)者的歷史學(xué)習(xí)軌跡自動追蹤知識狀態(tài)的變化,預(yù)測學(xué)習(xí)者在未來學(xué)習(xí)過程中知識點(diǎn)掌握情況。筆者的知識追蹤模型將學(xué)習(xí)者一次答題交互描述為Ri={si,qi,ri,bi},其中bi為學(xué)習(xí)行為序列,且提出的模型考慮學(xué)習(xí)者靜態(tài)特征和題目特征對學(xué)習(xí)者答題的影響。由于考慮的特征維度較多,需要知識追蹤方法能夠挖掘?qū)W習(xí)平臺收集的歷史學(xué)習(xí)數(shù)據(jù),并進(jìn)行有效地分析和處理,具體如圖1所示。圖1中,輸入層作為知識追蹤的基礎(chǔ),包括學(xué)習(xí)者的學(xué)習(xí)行為序列、題目特征以及學(xué)習(xí)者靜態(tài)特征信息,在該層中對學(xué)習(xí)過程描述是否準(zhǔn)確直接影響預(yù)測精度;隱藏層則是知識追蹤模型訓(xùn)練的過程,即學(xué)習(xí)者知識狀態(tài)更新過程,其通常難以被讀取,因此該層構(gòu)造的合理與否決定了知識狀態(tài)能否被實(shí)時輸出并應(yīng)用到實(shí)際教學(xué)活動中;輸出層是計(jì)算出學(xué)習(xí)者答題正確的概率即知識狀態(tài),輸出的結(jié)果與學(xué)習(xí)者實(shí)際答題結(jié)果一致性越高,則說明知識追蹤服務(wù)性能越好。
圖1 知識追蹤問題描述Fig.1 Knowledge tracking problem description
融合學(xué)習(xí)過程多維特征的知識追蹤方法包括數(shù)據(jù)組成、知識追蹤優(yōu)化方法論和知識追蹤模型3部分,如圖2所示。數(shù)據(jù)可簡單理解為由答題歷史和其他數(shù)據(jù)兩部分組成;知識追蹤優(yōu)化方法論包含了數(shù)據(jù)挖掘方法和對深度知識追蹤模型的改進(jìn)方法,從挖掘多維特征和特征融合兩方面進(jìn)行模型優(yōu)化,提高模型的可解釋性和預(yù)測精度;知識追蹤模型,主要是在動態(tài)鍵值對網(wǎng)絡(luò)模型的基礎(chǔ)上進(jìn)行優(yōu)化,來保證所提方法的服務(wù)性能、可讀性以及可解釋性。
圖2 融合學(xué)習(xí)過程特征的知識追蹤框架Fig.2 Knowledge tracking framework incorporating learning process features
深度知識追蹤與其他機(jī)器學(xué)習(xí)模型均存在可解性弱的問題,Lu等[18]指出可解釋性可以分為Ante-hoc和Post-hoc兩種視角。由于學(xué)習(xí)過程的復(fù)雜性,大多采用Post-hoc的角度進(jìn)行可解釋性分析。該方法基于已有研究和在線學(xué)習(xí)平臺多元化數(shù)據(jù)屬性的特征,以Post-hoc全局解釋為視角,從學(xué)習(xí)過程眾多特征中探尋影響學(xué)習(xí)結(jié)果的多維特征[19],并利用特征選擇模型去除冗余特征以完成模型的輸入組成,為知識狀態(tài)解釋提供數(shù)據(jù)分析支撐,簡稱BORUTA特征選擇方法。
為了從數(shù)據(jù)集中挖掘出相關(guān)性強(qiáng)的特征和數(shù)據(jù),通過BORUTA特征選擇方法來實(shí)現(xiàn)此目標(biāo),BORUTA特征選擇方法過程如圖3所示[20]。在BORUTA特征選擇方法中,為保證特征篩選的可靠性,首先將原始特征順序打亂以增加隨機(jī)性,打亂后的特征集(陰影特征)作為新特征添加到數(shù)據(jù)集中;然后使用隨機(jī)森林評估每一個特征的重要性,在算法每次迭代時都會計(jì)算真實(shí)特征是否比陰影特征具有更高的重要性,以剔除無關(guān)特征;最后當(dāng)所有特征得到標(biāo)記重要或不重要,或算法達(dá)到隨機(jī)森林運(yùn)行的規(guī)定閾值,算法終止。設(shè)計(jì)Post-hoc視角下BORUTA特征選擇方法挖掘出與學(xué)習(xí)結(jié)果相關(guān)度大的候選特征不僅可以減少深度學(xué)習(xí)訓(xùn)練的工作量,而且為模型的可解釋性提供了有效保障。在線學(xué)習(xí)數(shù)據(jù)中既包含了學(xué)習(xí)者靜態(tài)特征數(shù)據(jù),也涵蓋了資源數(shù)據(jù)和其它學(xué)習(xí)過程歷史數(shù)據(jù),因此數(shù)據(jù)集中會存在許多無關(guān)特征。所以在實(shí)際數(shù)據(jù)處理的過程中還需要對數(shù)據(jù)進(jìn)行清洗,使模型的預(yù)測效果更加準(zhǔn)確和高效。
圖3 BORUTA特征選擇方法Fig.3 BORUTA feature selection method
由于DKVMN有良好的拓展性,核心研究工作是在DKVMN模型基礎(chǔ)上進(jìn)行優(yōu)化設(shè)計(jì)。將處理過的數(shù)據(jù)作為模型的輸入和輸出,在模型的輸出位置構(gòu)建學(xué)習(xí)行為序列特征網(wǎng)絡(luò)、學(xué)習(xí)者靜態(tài)特征網(wǎng)絡(luò)以及題目特征網(wǎng)絡(luò),將優(yōu)化方法融入DKVMN框架中,提出了深度知識追蹤優(yōu)化方法DKVMN-BORUTA,具體如圖4所示。
圖4 融合多維特征的深度知識追蹤模型Fig.4 A deep knowledge tracking model incorporating multi-dimensional features
3.2.1 計(jì)算知識概念權(quán)重
題目的獨(dú)熱編碼通過構(gòu)建題目的Embedding矩陣,獲得其Embedding的向量表示,計(jì)算式為
(1)
按照式(1)計(jì)算題目的知識概念權(quán)重,首先將t時刻學(xué)習(xí)者遇到的問題q與一個已經(jīng)訓(xùn)練好的Embedding矩陣A相乘,得到向量kt;然后將kt通過Softmax計(jì)算,得到注意力向量wt。
3.2.2 多維特征融合
DKVMN易拓展的優(yōu)點(diǎn)為學(xué)習(xí)過程多維特征的融入提供條件。首先利用每個概念的知識狀態(tài)來計(jì)算學(xué)習(xí)者的能力。具體來說,當(dāng)DKVMN模型接收到一條學(xué)習(xí)記錄時,將對學(xué)習(xí)者特征向量ft產(chǎn)生影響,因?yàn)閒t是讀向量rt和嵌入向量kt融合得到的結(jié)果,所以它既包含學(xué)習(xí)者對題目qt的知識狀態(tài)信息,也包含qt的嵌入信息。通過神經(jīng)網(wǎng)絡(luò)處理傅立葉變換,可以用來推斷學(xué)習(xí)者在題目qt上的能力。同樣,題目qt的難度水平也可以通過將題目的嵌入向量kt傳遞給神經(jīng)網(wǎng)絡(luò)來獲得。
基于注意力權(quán)重wt,DKVMN模型可以通過以下過程預(yù)測學(xué)習(xí)者正確回答題目qt的概率pt:
(2)
2) 將BORUTA特征通過Embedding矩陣處理得到向量表示,并與題目內(nèi)容特征向量vt進(jìn)行Embedding矩陣拼接。對學(xué)習(xí)者靜態(tài)特征lt和題目特征向量mt進(jìn)行拼接,將學(xué)習(xí)行為序列特征作為調(diào)節(jié)因子bit,計(jì)算式為
(3)
式中:?為Sigmoid激活函數(shù);bit=Sigmoid|bt|。bt的具體計(jì)算方法:挖掘出的有效學(xué)習(xí)行為是看學(xué)習(xí)視頻和討論區(qū)討論,則學(xué)習(xí)行為序列特征向量為(學(xué)習(xí)視頻,討論),若學(xué)習(xí)者先看學(xué)習(xí)視頻再打開討論區(qū)討論,然后又看了學(xué)習(xí)視頻再進(jìn)行答題,則這個學(xué)習(xí)者學(xué)習(xí)行為序列為bt=(2,1)。總體向量融合了學(xué)習(xí)者當(dāng)前知識狀態(tài)、當(dāng)前題目內(nèi)容特征和BORUTA的特征集。
3.2.3 知識狀態(tài)矩陣更新
et=Singmoid(Wev+t)
(4)
at=tanh(Wavt+t)
(5)
式中:We為擦除權(quán)重;Wa為添加權(quán)重;t為學(xué)習(xí)者做題時間離散化值。最終經(jīng)過先“擦除”后更新的過程,學(xué)習(xí)者的知識狀態(tài)動態(tài)更新過程表達(dá)式為
(6)
模型優(yōu)化目標(biāo)是模型對學(xué)習(xí)者答題的預(yù)測結(jié)果pt與答題的真實(shí)值at之間的差異最小化,二者的交叉損失函數(shù)值要最小。模型采用動量梯度下降法來進(jìn)行優(yōu)化,實(shí)現(xiàn)對模型高效訓(xùn)練,計(jì)算式為
L=-∑t[atlogpt+(1+at)log(1-pt)]
(7)
通過在公共數(shù)據(jù)集和實(shí)際教學(xué)中開展實(shí)驗(yàn),驗(yàn)證融合學(xué)習(xí)過程多維特征的知識追蹤方法有效性、可解釋性和實(shí)際應(yīng)用效果。
各方法在各數(shù)據(jù)集上的AUC值如表1所示。對于公共數(shù)據(jù)集,使用了Zhang等[15]提供的經(jīng)過處理的數(shù)據(jù),表1描述了這些數(shù)據(jù)集的相關(guān)信息。在知識追蹤領(lǐng)域研究工作中均使用AUC(Area under curve)作為評價指標(biāo),且AUC作為性能度量在機(jī)器學(xué)習(xí)領(lǐng)域憑借其優(yōu)越的性質(zhì)受到廣泛的關(guān)注,因此通過AUC值來評價知識追蹤方法性能的優(yōu)劣[21]。在模型實(shí)現(xiàn)過程中,使用Adam優(yōu)化器進(jìn)行訓(xùn)練,所有數(shù)據(jù)集均按照7∶3進(jìn)行訓(xùn)練集與測試集的切分,所有模型均訓(xùn)練10次。實(shí)驗(yàn)是在NVIDIA1080 Ti GPU的環(huán)境中基于tensorflow和keras實(shí)現(xiàn)表中的知識追蹤方法。
表1 4個數(shù)據(jù)集及AUC值Table 1 Four data sets and AUC values
由表1可知:筆者提出DKVMN-BORUTA模型的AUC值在4個公共數(shù)據(jù)集上遠(yuǎn)優(yōu)于貝葉斯知識追蹤模型,也優(yōu)于其他兩種深度知識追蹤模型,說明設(shè)計(jì)的DKVMN-BORUTA有更好的性能。一方面,DKVMN-BORUTA融入的多維特征彌補(bǔ)了傳統(tǒng)知識追蹤模型對學(xué)習(xí)過程簡單的數(shù)理邏輯建模問題,能夠更好地模擬學(xué)習(xí)者的真實(shí)狀態(tài);另一方面,學(xué)習(xí)過程中的多維特征融入DKVMN模型后能夠更好地評估學(xué)習(xí)者的知識狀態(tài)。由于公共數(shù)據(jù)集難以驗(yàn)證融合學(xué)習(xí)過程多維特征知識追蹤模型的可解釋性和支撐實(shí)際教學(xué)中的作用,因此選擇實(shí)證研究進(jìn)一步驗(yàn)證分析。
收集了浙江某高校2020年3—6月C語言moodle平臺課程數(shù)據(jù),共9 000次答題記錄。數(shù)據(jù)集包含了學(xué)生詳細(xì)的學(xué)習(xí)記錄、學(xué)生信息和學(xué)習(xí)資源信息,具體數(shù)據(jù)信息如表2所示。
表2 浙江某高校2020年3—6月C語言在線課程數(shù)據(jù)Table 2 Data of C language online courses in a university in Zhejiang from March to June 2020
利用收集的數(shù)據(jù)集對DKVMN-BORUTA進(jìn)行訓(xùn)練。該課程的練習(xí)題目均由擁有多年教學(xué)經(jīng)驗(yàn)的老師編寫,題目包括判斷、單選和多選3種題型。題目設(shè)置充分參照項(xiàng)目反應(yīng)模型,具備較好的區(qū)分度,不存在題目過于簡單或者過難的現(xiàn)象,該題目集下知識點(diǎn)掌握率低于0.4被認(rèn)為是未掌握該知識點(diǎn)。研究者和授課教師在6月課程結(jié)束時向部分學(xué)習(xí)者提供該課程中各知識點(diǎn)掌握情況,向部分學(xué)習(xí)者提供知識狀態(tài)的同時還提供學(xué)習(xí)支持服務(wù)建議。實(shí)證研究結(jié)果如表3所示。
表3 實(shí)證研究結(jié)果Table 3 Results of empirical study
由表3可知:在數(shù)據(jù)總量較少的情況下,筆者設(shè)計(jì)的深度知識追蹤優(yōu)化方法在預(yù)測性能上有較大優(yōu)勢,在AUC值、ACC值和MSE值上均領(lǐng)先于其他知識追蹤方法,這說明設(shè)計(jì)的知識追蹤方法能充分利用學(xué)習(xí)過程多維特征更好的模擬學(xué)習(xí)者答題狀態(tài)。
為了驗(yàn)證所提出的知識追蹤方法有良好的可讀性,隨機(jī)抽選一名學(xué)習(xí)者A并輸出其回答涵蓋知識點(diǎn)題目的具體掌握情況,該學(xué)習(xí)者學(xué)習(xí)過程中的知識狀態(tài)變化過程如圖5所示。圖5中,橫坐標(biāo)為答題序號;縱坐標(biāo)為掌握程度,數(shù)值越大,掌握程度越強(qiáng)。
圖5 學(xué)習(xí)者A的知識狀態(tài)變化過程Fig.5 The process of knowledge state change of learner A
同時,為了驗(yàn)證該方法能否有效幫助學(xué)習(xí)者找出薄弱知識點(diǎn)并達(dá)成個性化學(xué)習(xí)目標(biāo),對學(xué)習(xí)者開展了對照組實(shí)驗(yàn)。將學(xué)習(xí)者劃分為3組,對照組A為不給學(xué)習(xí)者提供知識狀態(tài)信息,不為其提供精準(zhǔn)教學(xué)支持服務(wù);對照組B為學(xué)習(xí)者提供知識狀態(tài)信息,不為其提供精準(zhǔn)教學(xué)支持服務(wù);實(shí)驗(yàn)組C為既提供知識狀態(tài)信息,也提供精準(zhǔn)教學(xué)支持服務(wù)。實(shí)證研究中精準(zhǔn)教學(xué)支持利用利用改進(jìn)粒子群算法,針對學(xué)習(xí)者的薄弱知識點(diǎn)向?qū)W習(xí)者進(jìn)行學(xué)習(xí)資源推薦,針對性的給予學(xué)習(xí)支持[22]。精準(zhǔn)教學(xué)支持持續(xù)2周,過程中持續(xù)收集學(xué)習(xí)者的學(xué)習(xí)數(shù)據(jù),2周結(jié)束后對3個實(shí)驗(yàn)組進(jìn)行課程綜合測驗(yàn),測驗(yàn)結(jié)果如表4所示。
表4 實(shí)證研究對照實(shí)驗(yàn)結(jié)果Table 4 Empirical research results of controlled experiments
由表4可知:對照組B和實(shí)驗(yàn)組C的測驗(yàn)成績明顯高于對照組A,且對照組B和實(shí)驗(yàn)組C的復(fù)習(xí)時間明顯少于對照組A。這說明筆者提出的知識追蹤方法是有效的,可以及時準(zhǔn)確地發(fā)現(xiàn)學(xué)習(xí)者的薄弱知識點(diǎn),學(xué)習(xí)者可以基于此進(jìn)行有針對性的高效復(fù)習(xí),避免知識迷航。由圖5和表4可知:實(shí)驗(yàn)組C的平均成績略高于對照組B,且平均復(fù)習(xí)時間也少于對照組B,這說明提出的知識追蹤方法有良好的可解釋性,能夠運(yùn)用學(xué)習(xí)者的多維特征和知識狀態(tài)進(jìn)行精準(zhǔn)教學(xué),有效幫助學(xué)習(xí)者提高學(xué)習(xí)效率。
融合學(xué)習(xí)過程多維特征的知識追蹤優(yōu)化方法可以準(zhǔn)確及時地掌握學(xué)習(xí)者的知識狀態(tài)。教學(xué)者根據(jù)實(shí)際題目和知識點(diǎn)情況確定知識狀態(tài)閾值,并根據(jù)學(xué)習(xí)者知識狀態(tài)和特征給予針對性的學(xué)習(xí)支持。由此也說明融合學(xué)習(xí)過程多維特征的知識追蹤方法不僅增強(qiáng)了知識狀態(tài)的可解釋性,而且可以更好地服務(wù)精準(zhǔn)教學(xué)。
借助BORUTA特征選擇模型,挖掘?qū)W習(xí)過程中的多維特征,在DKVMN模型基礎(chǔ)上構(gòu)造學(xué)習(xí)行為序列特征網(wǎng)絡(luò)、學(xué)習(xí)者靜態(tài)特征網(wǎng)絡(luò)和題目特征網(wǎng)絡(luò),設(shè)計(jì)融合學(xué)習(xí)過程多維特征的深度知識追蹤優(yōu)化方法DKVMN-BORUTA,并通過公共數(shù)據(jù)集和教學(xué)實(shí)證研究驗(yàn)證該方法服務(wù)性能上的優(yōu)勢和實(shí)際教學(xué)應(yīng)用的有效性。未來,研究者將著力構(gòu)建更具可解釋性的知識追蹤優(yōu)化方法和精準(zhǔn)教學(xué)應(yīng)用模式,提升學(xué)習(xí)者在線學(xué)習(xí)效果。