章 蕊 田菊艷 田詩揚(yáng) 盧政旭
(重慶工程學(xué)院 重慶 400056)
在線學(xué)習(xí)系統(tǒng)的歷史可以追溯到20世紀(jì)80年代,近年來隨著計(jì)算機(jī)輔助技術(shù)和人工智能的發(fā)展,在線學(xué)習(xí)系統(tǒng)也得到了廣泛的發(fā)展,如大規(guī)模在線開放課程(MOOC)平臺(tái)和在線法官(OJ)系統(tǒng)。一般來說,這些平臺(tái)為學(xué)生提供了豐富的學(xué)習(xí)資源(如課程、練習(xí)、講座),為學(xué)生提供了一個(gè)開放的環(huán)境,讓他們能夠獨(dú)立學(xué)習(xí)和實(shí)踐知識(shí)。雖然自主性和便捷性的優(yōu)勢(shì)確實(shí)吸引了大量的學(xué)生,但研究人員仍然發(fā)現(xiàn),學(xué)生在實(shí)踐中容易失去學(xué)習(xí)興趣,存在較高的輟學(xué)率問題。針對(duì)這一問題,有效的解決方案是在在線學(xué)習(xí)系統(tǒng)中提供個(gè)性化服務(wù),以改善學(xué)生的學(xué)習(xí)體驗(yàn)。幸運(yùn)的是,隨著如今深度學(xué)習(xí)的發(fā)展,研究人員在這個(gè)教育問題上有了更多面向數(shù)據(jù)的解決方案。
其中,關(guān)鍵任務(wù)之一是知識(shí)熟練度診斷,目的是發(fā)現(xiàn)學(xué)生對(duì)每個(gè)知識(shí)概念的潛在掌握程度。知識(shí)水平診斷的任務(wù)是:通過學(xué)生的歷史練習(xí)記錄,分析他們對(duì)每個(gè)概念(即函數(shù)和不等式)的掌握程度。事實(shí)上,由于這些診斷結(jié)果有益于許多應(yīng)用,如有針對(duì)性的知識(shí)培訓(xùn)和個(gè)性化的鍛煉推薦,教育心理學(xué)和數(shù)據(jù)挖掘領(lǐng)域都在致力于這個(gè)問題:在教育心理學(xué)中,認(rèn)知診斷模型通常用潛在特征值或二元技能掌握向量來表征每個(gè)學(xué)生的知識(shí)熟練程度。相比之下,矩陣分解技術(shù)將診斷任務(wù)視為分?jǐn)?shù)預(yù)測(cè)的數(shù)據(jù)挖掘問題,在學(xué)生的潛在空間中投射出其隱含的知識(shí)狀態(tài)??傊?,這兩種類型的研究直接利用學(xué)生的鍛煉記錄進(jìn)行診斷。然而,大多數(shù)學(xué)生在學(xué)習(xí)過程中忽略了一些重要的因素。
一般來說,假設(shè)在一個(gè)學(xué)習(xí)系統(tǒng)中有學(xué)生、練習(xí)題和知識(shí)的概念,學(xué)生在不同的時(shí)間做練習(xí),記錄為練習(xí)日志。具體來說,我們可以將練習(xí)日志表示為一個(gè)分?jǐn)?shù)張量。如果學(xué)生在某個(gè)時(shí)間做了練習(xí),則該張量表示學(xué)生在練習(xí)上的成績(jī)。此外,我們還得到教育專家標(biāo)注后的知識(shí)點(diǎn)數(shù)據(jù),它可以表示為一個(gè)知識(shí)張量。如果練習(xí)題與知識(shí)概念相關(guān),那么在我們的場(chǎng)景中,分?jǐn)?shù)張量和知識(shí)張量就會(huì)產(chǎn)生練習(xí)。這里需要說明,在不同的時(shí)間,大多數(shù)學(xué)生只做一次相同的練習(xí),因?yàn)橐话闱闆r下,他們通常會(huì)選擇不同的練習(xí)來學(xué)習(xí)特定的知識(shí)概念。例如,假設(shè)一個(gè)學(xué)生試圖學(xué)習(xí)概念Function,他將首先練習(xí)相關(guān)的習(xí)題,并檢查自己是否正確。如果他發(fā)現(xiàn)答案是錯(cuò)的,他會(huì)繼續(xù)練習(xí),但他就不會(huì)做同樣的習(xí)題了,因?yàn)樗呀?jīng)知道答案了。因此,很自然地,他會(huì)用同樣知識(shí)點(diǎn)的練習(xí)題去繼續(xù)練習(xí)和學(xué)習(xí)?;谶@個(gè)原因,我們可以猜測(cè)學(xué)生通過在不同的時(shí)間做不同的練習(xí)來學(xué)習(xí)概念。
在給定分?jǐn)?shù)張量和知識(shí)張量的情況下,我們的目標(biāo)為:(1)跟蹤每個(gè)學(xué)生的知識(shí)熟練程度的變化,并診斷從第1次到第T次的知識(shí)點(diǎn)的掌握程度。(2)預(yù)測(cè)在T+1次考試中的知識(shí)點(diǎn)掌握水平和具體的練習(xí)成績(jī)。
具體來說,我們首先基于學(xué)生的練習(xí)記錄和對(duì)應(yīng)知識(shí)點(diǎn),提出了一個(gè)基本的知識(shí)熟練度追蹤模型。該模型首先利用知識(shí)張量先驗(yàn)將每個(gè)學(xué)生的熟練度向量投射到一個(gè)知識(shí)空間中,然后結(jié)合學(xué)習(xí)曲線理論和遺忘曲線理論來跟蹤學(xué)生的知識(shí)熟練度。此外,我們提出了一個(gè)改進(jìn)的練習(xí)相關(guān)知識(shí)熟練度追蹤模型,并將練習(xí)的連通性納入其中。提高預(yù)測(cè)性能。然后,我們可以得到不同時(shí)間的學(xué)生熟練度向量U和練習(xí)知識(shí)向量V。其公式如下。
現(xiàn)在,我們指定如何模擬學(xué)生潛在熟練度的演化。在每個(gè)學(xué)生的動(dòng)態(tài)學(xué)習(xí)過程中,有兩種被廣泛接受的教育心理學(xué)理論可以指導(dǎo)我們?cè)诮_^程中使用。(1)學(xué)習(xí)曲線[2]描述了學(xué)生所學(xué)的知識(shí)可以通過幾個(gè)練習(xí)軌跡來增強(qiáng);(2)遺忘曲線[3]假設(shè)學(xué)生對(duì)所學(xué)知識(shí)的記憶會(huì)越來越少,他們對(duì)知識(shí)概念的熟練程度會(huì)隨著時(shí)間的推移而逐漸下降。結(jié)合這兩種理論作為先驗(yàn),我們假設(shè)某一學(xué)生目前的知識(shí)熟練程度主要受兩個(gè)潛在原因的影響:學(xué)生做的練習(xí)越多,對(duì)相關(guān)知識(shí)的熟練程度越高;時(shí)間流逝得越久,他忘記的知識(shí)就越多。在形式上,我們模擬了每個(gè)學(xué)生在不同時(shí)間里的知識(shí)熟練程度的兩種效應(yīng),如圖1所示。
圖1:模型圖
在上述模型中,我們已經(jīng)結(jié)合了教育學(xué)習(xí)理論(即學(xué)習(xí)曲線和遺忘曲線)來跟蹤每個(gè)學(xué)生的知識(shí)熟練程度。將學(xué)生呈現(xiàn)為顯式熟練度向量,其中每個(gè)元素反映了學(xué)生對(duì)相關(guān)知識(shí)概念(如函數(shù))的了解程度,保證了診斷結(jié)果的可解釋性。然而,在現(xiàn)實(shí)世界中,與巨大的練習(xí)空間相比,學(xué)生練習(xí)的練習(xí)可能很少。因此,如果某一學(xué)生每次只進(jìn)行少量的練習(xí),模型很難跟蹤其知識(shí)熟練程度,并預(yù)測(cè)其表現(xiàn)得分。因此,為了緩解這一問題并提高我們的模型的預(yù)測(cè)性能,我們進(jìn)一步考慮了練習(xí)之間的連通性關(guān)系。如圖1所示,每個(gè)練習(xí)的張量都與一些基礎(chǔ)的知識(shí)點(diǎn)張量相練習(xí),學(xué)生在這些以知識(shí)為基礎(chǔ)的練習(xí)上可能得到一致的分?jǐn)?shù)。我們擴(kuò)展了當(dāng)前的模型,并通過將這種連通性屬性納入我們的概率模型,提出了一個(gè)新穎的與練習(xí)相關(guān)的知識(shí)熟練度模型。