【摘要】
學習分析技術(shù)是一種通過對學習者在學習中的實際參與、表現(xiàn)和進展以及自身屬性等各種相關(guān)數(shù)據(jù)的分析對其學習結(jié)果進行預(yù)測的技術(shù)。通過模型分析可以為學習者提供預(yù)測結(jié)果,并實時向教學管理者、課程設(shè)計者和任課教師等提供相應(yīng)的干預(yù)策略,以避免學習者可能最終學習失敗的結(jié)果。隨著大規(guī)模在線課程的迅猛發(fā)展,需要針對性的預(yù)測模型來支持學習者的在線學習過程。本文提出了一種以學習者與平臺教學資源間的交互行為為基礎(chǔ)構(gòu)建適應(yīng)大規(guī)模在線學習預(yù)測模型的新方法。與傳統(tǒng)學習分析方法不同,該模型不需要對學習者前期學習情況有過多了解,也無須教學設(shè)計者或領(lǐng)域?qū)<业倪^多參與,在通用環(huán)境的課程結(jié)構(gòu)以及隨時間變化的前提下具有良好的預(yù)測準確性。
【關(guān)鍵詞】 ?學習分析技術(shù);機器學習模型;數(shù)據(jù)挖掘;時間序列;預(yù)測分析;決策樹;交互行為;學習環(huán)境
【中圖分類號】 ? TP391 ? ? ? ? 【文獻標識碼】 ?B ? ? ? 【文章編號】 ?1009-458x(2021)5-0062-06
一、引言
隨著學習分析技術(shù)的研究日益發(fā)展,基于該技術(shù)建立的各類對學習者學習狀態(tài)及結(jié)果的分析、預(yù)測、預(yù)警、干預(yù)系統(tǒng)已經(jīng)廣泛應(yīng)用在各種學習平臺之中,并有效地增強了學習者的學習成功率(Arnold, et al., 2012; Lauría, et al., 2013)。構(gòu)建預(yù)測模型通常需要設(shè)計者對所面對的教育領(lǐng)域、學習目標以及教學所處的教學環(huán)境有深入的了解。本文的研究目的在于能夠提供一種較為通用的方法,打通存在于數(shù)據(jù)挖掘?qū)<液徒逃虒W專家之間交叉的“中間空間”(Adlin, et al., 2010),以學習者的個人屬性特征和基于互動行為的時間序列數(shù)據(jù),驅(qū)動構(gòu)建一個在同一平臺環(huán)境中,能夠跨越不同課程和教學過程,并且隨時間變化仍具有良好解釋性和準確性的學習者預(yù)測模型和干預(yù)系統(tǒng)。這一構(gòu)建過程,不會給使用模型的教師或教育專家?guī)眍~外的工作負擔,他們可以更容易地通過數(shù)據(jù)驅(qū)動的預(yù)測模型來深入了解課程中發(fā)生的活動,同時通過模型提供的預(yù)測結(jié)果實施選擇性干預(yù)(Barber, et al., 2012)。
二、相關(guān)研究進展
在學習分析技術(shù)興起之前,技術(shù)強化學習(Technology-enhanced Learning,TEL)領(lǐng)域就受到教育界非常廣泛的關(guān)注。這一領(lǐng)域的研究方向是理解學習者從認知角度進行學習的過程,并以泛在的技術(shù)手段加以增強和輔助。其中,安德森(Anderson, 1993)的ACT-R技能知識理論被用作許多智能學習輔助系統(tǒng)的基礎(chǔ)。該理論認為,學習者可以由重復(fù)正確規(guī)則展示認知能力和水平,相對地,如果這種趨勢不足則表明需要教育干預(yù)機制加以改進。歐爾森(Ohlsson, 1994)基于“錯誤表現(xiàn)”的學習理論為該領(lǐng)域提供了另一種解釋,他認為學習者需要通過錯誤并糾正來證明學習過程正在發(fā)生,提交正確的答案存在著巧合的可能,而出錯并糾正才是對知識更深層次的認知。馬?。∕artin, 1999)以此理論為依據(jù),建立了基于約束的智能輔助模型。這些對學習者學習認知過程的評判和干預(yù)理論,為學習分析技術(shù)奠定了教育理論基礎(chǔ)。
隨著互聯(lián)網(wǎng)生態(tài)的蓬勃發(fā)展,網(wǎng)絡(luò)教育形式方興未艾。相關(guān)領(lǐng)域研究,從單純的學習者與學習內(nèi)容之間的互動延伸到了學習者之間的學習交流過程(Gergen, 1985)。布爾等(Bull, et al., 2001)通過人工智能技術(shù)對學習者之間的交流和討論,建立了學習同伴的匹配模型;格拉瑟等(Graesser, et al., 2005)則基于此建立了人機對話的智能教學輔助系統(tǒng)。
隨著大規(guī)模公開在線課程(MOOC)嶄露頭角,學習分析技術(shù)的發(fā)展得到了空前的大數(shù)據(jù)研究基礎(chǔ)和應(yīng)用前景。加曼(Garman, 2010)采用Logistic回歸分析的方法,基于學生部分學習對象的評估結(jié)果對學生的課程進行有效預(yù)測;摩爾(Moore, 2007)把學生當前課程與之前課程的參與程度作為分析對象,研究表明學生課程的參與程度與其課程成績呈高度相關(guān),而學生的前置學歷排名、入學考試成績等則沒有在學習結(jié)果上呈現(xiàn)顯著差異;馬杰等(2014)利用多元回歸分析建立模型,對教育技術(shù)初級能力培訓(xùn)課程產(chǎn)生的相關(guān)數(shù)據(jù)進行分析,驗證了該模型的可行性和有效性;孫力等(2015)采用數(shù)據(jù)分類決策樹方法,實現(xiàn)了對英語統(tǒng)考成績的良好預(yù)測;陳子健等(2017)提出采用集成學習的方法構(gòu)建集成式學業(yè)成績分類預(yù)測模型,并比較多種算法構(gòu)建的單一分類模型和集成分類模型的性能;肖巍等(2018)對基于數(shù)據(jù)挖掘的學習預(yù)警研究進行文獻綜述;王改花等(2019)采用數(shù)據(jù)挖掘技術(shù)對網(wǎng)絡(luò)學習者的學習行為與成績進行了預(yù)測,構(gòu)建了適應(yīng)性學習系統(tǒng)學習干預(yù)模型。
對預(yù)測模型的研究存在一個共識,即學習者前序?qū)W習成績是對其后序階段學習結(jié)果的重要預(yù)測指標。如賈亞普拉卡什等人(Jayaprakash, et al., 2014)提供了邏輯回歸模型描述,學習者課程成績累積平均值是最終成績的最強預(yù)測因子。筆者所在的網(wǎng)絡(luò)教育學院以及其他大規(guī)模在線教育平臺都存在此類情況,即難以準確獲得學習者在使用當前教學平臺之前的學習記錄數(shù)據(jù)。此外,現(xiàn)有的大部分預(yù)測模型都是階段性、靜態(tài)的,缺乏利用時間序列行為特征分析預(yù)測學習者實時學習結(jié)果的能力。因此,本文探索一種以學習者與學習平臺的資源互動行為數(shù)據(jù)建模的方法,引入時間序列的衡量概念,構(gòu)建一個較準確、易解釋的在不同課程中具備較好通用性并可實時動態(tài)預(yù)測學習者的學習結(jié)果預(yù)警模型。
三、數(shù)據(jù)準備
(一)特征變量的選擇
在學習分析領(lǐng)域,對學習者特征變量(或稱“屬性”)的劃分,存在著一個普遍共識的方式。一類是帶有學習者人口統(tǒng)計學特點的“傾向特征變量”,另一類是學生在學習過程中所呈現(xiàn)的“行為特征變量”。傾向特征變量一般包括學習者的年齡、性別、家庭狀況、收入水平、生活地區(qū)以及前置學習成績等屬性內(nèi)容。這一系列的特征變量都具有靜態(tài)、客觀的特點,是學習者個人情況的反映,基本不會頻繁變化。對大多數(shù)在線學習平臺來說,此類特征變量都較容易獲得。之前的研究發(fā)現(xiàn),學習者的“性別、年齡、婚姻狀況、生活地區(qū)”是對回歸分析預(yù)測模型影響較高的特征變量(王亮, 2015)。因此,雖然本文的研究重點不在此類傾向特征變量上,但從實際應(yīng)用出發(fā),為提高模型的準確度和解釋性,繼續(xù)在模型中選用這四個特征變量。
行為特征變量包含學習者在學習平臺上的各類學習活動,包括學習者與平臺各類學習資源、其他學習者、教學者之間的互動和結(jié)果?;趯W習過程中最核心流程的共識,本文選取了三種資源交互形式作為預(yù)測模型的考察變量:課程講座視頻、學習者線上作業(yè)完成進度以及學習論壇的討論參與??紤]到模型的復(fù)雜性,對以上三種資源交互的考察僅限于粗粒度水平,忽略了對單獨資源再進行細粒度交互的分析。
(二)通過學習者行為數(shù)據(jù)創(chuàng)建時間序列特征變量
大多數(shù)學習分析技術(shù)構(gòu)建預(yù)測模型的研究,一般都會關(guān)注對學習者與平臺資源交互數(shù)據(jù)的分析和選取。隨著學習平臺對學習痕跡記錄的完善,這些數(shù)據(jù)可以方便地從平臺運行日志中獲得(如某人某時間訪問了某課程講座視頻資源等)。然而,如何把此類日志數(shù)據(jù)離散轉(zhuǎn)化為可以表達學習者與資源互動行為特征的描述,并利用數(shù)據(jù)挖掘進行分類是本研究的重點問題。
本文在數(shù)據(jù)準備過程中,根據(jù)學習者訪問資源的時間范圍來整合其交互行為特征。從學習周期開始的時間相對偏移,使用了三種不同的度量:以日為跨度、以周為跨度和以月為跨度的交互行為進行觀測。這樣基于時間序列的數(shù)據(jù)特征分類可以全面地了解學習者與資源交互的節(jié)奏和周期。
在選定行為數(shù)據(jù)表達方式后,需要再選擇適合用于預(yù)測模型的時間序列特征變量對象。以交互日志數(shù)據(jù)為基礎(chǔ),確定得到學習者在某一具體時間范圍的全部互動行為特征(如在第15個學習日或第6個學習周是否觀看了課程講座的視頻等),并將所有這些特征變量納入到數(shù)據(jù)集中。但這勢必會造成模型中特征變量的數(shù)量過大,進而帶來機器學習模型的過擬合現(xiàn)象,結(jié)果不僅影響模型在不同課程中的通用性,又會嚴重降低模型的解釋性。因此,本文忽略具體到某一時間范圍的時間序列特征變量,而將觀測集中到交互行為的時間序列前后關(guān)聯(lián)性上來,如考察學習者在學習周期中連續(xù)三周每周都至少觀看一次課程講座視頻,這樣的行為特征是否對其課程通過有影響。學習是一個連續(xù)性過程,本文假設(shè)以交互行為的時間序列前后關(guān)聯(lián)情況作為特征變量,更有利于機器學習模型的訓(xùn)練和預(yù)測性能。
在表達時間序列前后關(guān)聯(lián)的方法上,本文采用N-Gram語言模型技術(shù)對數(shù)據(jù)進行標準化處理(Brooks, et al., 2015)。Gram是一種統(tǒng)計語言模型,用來根據(jù)前(n-1)個Item來預(yù)測第n個Item。本文采用3-gram的時間序列特征來表達學習者與資源交互的時間關(guān)聯(lián)狀態(tài)。仍以觀看課程講座視頻為例,如學習者在整個學習周期內(nèi)以連續(xù)三周為一個時間序列,出現(xiàn)了2次,第一周和第三周觀看了視頻,而第二周沒有的情況,本文即用“周”標簽的3-gram(真,假,真)特征變量的值為2來表達這一狀態(tài)。以此類推,本文將設(shè)定一組3-gram的時間序列特征變量,覆蓋從(假,假,假)到(真,真,真)的所有排列可能。
(三)數(shù)據(jù)的實際采集和整理
本文從筆者所在的網(wǎng)絡(luò)教育學院學習者中抽選了某一學籍批次的工商管理專業(yè)學生,并從教學平臺中抽取了該批次學習者在管理學課程學習過程中所進行的“課程講座視頻觀看、線上作業(yè)完成進度以及學習論壇的討論參與”三種資源交互的行為記錄。該課程總教學計劃時間為3.5個月,因此之前選擇的3-gram尺度是較為適宜的。本文設(shè)定coursewareD/coursewareW/coursewareM分別表示以日、周、月時間跨度記錄學習者觀看課程視頻的特征變量。類似地,以homework表示線上作業(yè)完成進度,以forums表示學習論壇的討論參與等對應(yīng)特征變量,并在3-gram的排列基礎(chǔ)上展開,總共生成了24個時間序列特征變量(如表1所示)。
本文設(shè)計了對平臺日志記錄數(shù)據(jù)離散的標準化算法,將縱向的學習者交互記錄數(shù)據(jù)批量離散轉(zhuǎn)化為對應(yīng)的時間序列特征變量值。這一數(shù)據(jù)準備過程相對煩瑣復(fù)雜,特別是在模型驗證階段的不同時間節(jié)點觀測,需要反復(fù)運算并整合,這是平臺缺乏相關(guān)功能造成的缺陷。未來可以在平臺設(shè)計改進中加入此算法,以高效、直接地獲得所需特征變量值。
四、機器學習預(yù)測模型的建立和驗證
在建立本研究的機器學習和預(yù)測模型時,首先確定模型需達成的兩個目標:第一,在保證模型高準確度的前提下,在準確性和解釋性之間達成一個平衡,盡可能兼顧解釋性;第二,體現(xiàn)交互行為時間序列編排的價值,在實現(xiàn)課程實時推進的同時保持模型相對良好的準確性。特別是在學習周期初期缺乏前置學習結(jié)果的條件下,如早期模型能具備良好的準確度,那么對提供早期預(yù)警干預(yù)將具有現(xiàn)實意義。
(一)模型建立的技術(shù)路線
由于機器學習算法偏向大多數(shù)類,所以在訓(xùn)練數(shù)據(jù)不均衡時,準確度評價指標的參考意義就會顯著下降?;趯λ诰W(wǎng)絡(luò)教育學院的課程進行觀察可以發(fā)現(xiàn),一般課程考核通過率在70%~75%之間,如果不對數(shù)據(jù)樣本進行平衡調(diào)整,那么訓(xùn)練出的模型分類效果會難以接受。在樣本平衡模式上,本文選擇了欠采樣方法,對大類(考試通過的學習者)的數(shù)據(jù)樣本進行欠采樣來減少大類的數(shù)據(jù)樣本個數(shù),使得樣本中通過與未通過的學習者數(shù)量比例接近1∶1?,F(xiàn)有研究證明,平衡數(shù)據(jù)的訓(xùn)練可以有效提高機器學習模型的預(yù)測準確性。
本研究選擇決策樹機器學習技術(shù)來建立預(yù)測模型。線性回歸、邏輯回歸等簡單技術(shù),過程清晰明確,但不適用于分析復(fù)雜的問題和數(shù)據(jù);相比貝葉斯模型或支持向量機等其他機器學習技術(shù),決策樹最大的優(yōu)點就是其易用性和較為清晰的解釋性,這對于教學設(shè)計者或教師具有更高的價值。本文的數(shù)據(jù)處理使用Weka工具包下的J48決策樹分類器(C4.5算法)來完成,參數(shù)選擇置信水平為0.25,最小葉節(jié)點大小為100。為了保證生成模型的準確性而不至于出現(xiàn)過擬合的現(xiàn)象,研究采用10折交叉驗證(10-fold cross validation)來評估模型。
(二)模型準確度和解釋性評價
根據(jù)第3節(jié)進行的數(shù)據(jù)準備,本文利用決策樹進行機器學習分類,所生成的預(yù)測模型的準確度結(jié)果如表2所示。
表2列出了模型對數(shù)據(jù)集正確、不正確分類的數(shù)量,以及kappa值觀察數(shù)據(jù)與預(yù)測數(shù)據(jù)之間一致性的度量。kappa 值的范圍為-1到+1,值越高,一致性就越強。當Kappa為1時表明完全一致,為0時一致性與偶然預(yù)期相同,小于0的情況很少發(fā)生。有研究認為kappa 值至少為0.75表示一致性強,0.8以上表示一致性很強。本文模型的一致性為0.89,結(jié)合94.65%的分類正確率,可以確定此機器學習預(yù)測模型的準確度是令人滿意的。
圖1給出了本研究模型管理學課程結(jié)果決策樹示例。從樹的結(jié)構(gòu)可以直觀看出,J48決策樹修剪掉了數(shù)據(jù)集中絕大多數(shù)特征變量,只保留了機器學習算法所認為最能體現(xiàn)分類效率和準確性的變量屬性。統(tǒng)計模型是一種自上而下的數(shù)據(jù)科學方法,可解釋性是關(guān)鍵,因為相關(guān)性往往不等于因果關(guān)系,而機器學習模型的準確度又與其復(fù)雜程度是相關(guān)的,這就決定了模型的準確性和解釋性很難兼得,需要研究者取得一個適當?shù)钠胶?。從圖1的樹結(jié)構(gòu)呈現(xiàn)中可以較容易地理解其分類意義,即學習者如果連續(xù)三個月以上能按時觀看課程講座視頻,并且連續(xù)三個月以上保持規(guī)律提交作業(yè),考試通過的概率是相當高的,這也符合學習過程連貫性的一般規(guī)律。同時,缺乏規(guī)律學習和作業(yè)提交的學習者無法通過課程的概率較大,而這其中單身學習者的通過率更差一些,已婚學習者中男性比女性通過率又弱一點。這或許與我們主觀認知規(guī)律相悖,但實際上可能與家庭責任與個人自律性等社會現(xiàn)象有關(guān),具體原因不在本文研究范圍內(nèi)。
根據(jù)以上結(jié)果評價,本研究所構(gòu)建的預(yù)測模型在對某一門課程的學習結(jié)果準確性和解釋性上初步獲得令人滿意的效果。
(三)預(yù)測模型隨時間變化的驗證
基于學習者交互行為時間序列來建立預(yù)測模型,一個重要的目的就是希望此模型可以在學習周期的任何階段都能實時預(yù)測學習者的學習結(jié)果,供教學人員實施及時干預(yù)。為驗證模型隨時間變化的準確度,本文從所在學院篩選出與之前實驗數(shù)據(jù)中不同批次修讀管理學課程的學習者,沿用第3節(jié)的數(shù)據(jù)準備方式,對學習者進行以周為單位的交互行為數(shù)據(jù)采集和整合,并將得到的特征變量作為測試數(shù)據(jù)。將這些數(shù)據(jù)按照時間節(jié)點分別引入前文所生成的預(yù)測模型中進行驗證,得到的準確度表達如圖2所示。
圖2給出了在本輪驗證過程中訓(xùn)練集和測試集學習者考試結(jié)果預(yù)測準確度隨時間變化的趨勢。在教學周開始的第4周左右,對兩個數(shù)據(jù)集的預(yù)測準確度均較快提升到較高水平,證明本文預(yù)測模型隨時間積累,較快地具備早期預(yù)警的能力,在教學周期的絕大部分時間的預(yù)測準確度表現(xiàn)均較為良好。
為更好地理解時間變化給預(yù)測準確度帶來的影響,本文繪制了測試集結(jié)果的混淆矩陣的變化趨勢(如圖3所示)?;煜仃囉伤膫€值組成:真陽性、假陽性、真陰性和假陰性。與本文所做分析研究對應(yīng),我們關(guān)注以下幾個數(shù)據(jù)對象:預(yù)測課程通過且確實通過的學習者(真陽性)、預(yù)測通過但未通過的學習者(假陽性)、預(yù)測未通過且確實未通過的學習者(真陰性)。對預(yù)測未通過但實際通過的(假陰性)學習者,由于對其實際課程通過與否沒有產(chǎn)生負面影響,因而忽略。
從圖3可以觀察到,在教學周期的第四周之后,矩陣各分類數(shù)值趨向于各自穩(wěn)定水平,這與預(yù)測模型對測試集的準確度驗證規(guī)律相吻合。同時,假陽性數(shù)值,也就是預(yù)測學習者通過而實際未通過的人數(shù),很快下降到一個較低的水平,證明了本文模型對需要預(yù)警的學習者疏漏的概率不高,且對時間變化較敏感,表明本文模型隨時間積累的性能提升較好。
(四)本文預(yù)測模型與其他預(yù)測模型的比較
本文預(yù)測模型的分析對象是基于時間序列的平臺交互行為,探討的是學習者在時間跨度中學習行為隨時間序列前后關(guān)聯(lián)帶來的結(jié)果影響。這種動態(tài)的對學習交互行為時間關(guān)聯(lián)性的研究,是區(qū)別于其他學習分析預(yù)測模型的主要特點。在此前的相關(guān)研究中,使用邏輯回歸算法建立過預(yù)測模型,其優(yōu)點是簡單、直觀且便于解釋,但不擅長處理大量特征變量的復(fù)雜數(shù)據(jù)挖掘問題。因此,本文研究中眾多的時間序列特征變量并不適宜使用線性、邏輯回歸算法來處理。為比較兩種算法的效果差異,本文將延續(xù)此前研究中使用過的邏輯回歸預(yù)測模型,并在回歸模型中使用簡化的學習交互行為特征變量,使用同一測試集數(shù)據(jù)來比較兩種算法模型的差異性。
本文為用于比較的邏輯回歸算法預(yù)測模型,選擇了與時間序列交互行為決策樹算法預(yù)測模型同樣的傾向特征變量,在行為特征變量方面也選取了同樣的特征對象,但簡化了特征對象的變量容量以達成回歸算法的適應(yīng)性,同時盡可能模擬與本文決策樹算法類似的分析效果。具體變量的選擇如表3所示。
為確保模型比較的準確性,在用于對比的邏輯回歸預(yù)測模型中本文使用前文同樣批次的學習者數(shù)據(jù)集,并繼續(xù)以每個教學周作為周期采集測試集數(shù)據(jù),繼而使用驗證集進行預(yù)測結(jié)果檢驗。兩種模型的預(yù)測準確度隨時間變化的比較如圖4所示。
從圖4可以看出,此前研究中所采用的邏輯回歸預(yù)測模型,在只采集階段性交互行為數(shù)據(jù)的特征變量情況下早期的預(yù)測準確度并不十分理想,隨著教學時間的推移,學習者交互行為數(shù)據(jù)積累增多之后,其預(yù)測準確性會得到提高,在教學周期接近結(jié)束時也能達到較高的預(yù)測準確度,這與此前的研究結(jié)果是相符的。相比之下,本文基于時間序列的行為交互預(yù)測模型在教學周期的早期就能達到較好的準確度,從而具備早期預(yù)警的能力,這對于大規(guī)模在線教學平臺來說具有較強的實際應(yīng)用價值。
五、結(jié)語
目前,利用機器學習建立預(yù)測模型的研究和應(yīng)用已經(jīng)較為普遍,但基于時間序列考查學生交互行為相互關(guān)聯(lián)的預(yù)測模型研究仍較少,跨越平臺和教學環(huán)境的數(shù)據(jù)驅(qū)動預(yù)測建模仍然大有潛力。本文的研究正是在對學習者與平臺資源交互行為的基礎(chǔ)上,創(chuàng)建時間序列前后關(guān)系的特征變量,建立機器學習預(yù)測模型,并驗證隨時間推移的模型準確性和應(yīng)用價值。通過數(shù)據(jù)驗證和與一般的回歸預(yù)測模型比較可以得到,該模型具有較好的準確度(分類準確率94%以上,kappa一致性0.8以上),并且具有相對良好的解釋性。在進一步對模型隨時間變化的性能檢測中,本決策樹模型在教學周期的早期就能形成較高準確度,真陽性和假陽性分類較快地穩(wěn)定到對應(yīng)的高和低水平,與此前研究的預(yù)測模型相比有一定早期和動態(tài)預(yù)測優(yōu)勢,達成了本研究對模型設(shè)計的目標。
本研究尚有許多值得改進的方面。首先,由于機器學習的算法性質(zhì),對于決策樹分類器對數(shù)據(jù)集特征變量的選擇沒有進行干預(yù),因此可能只選擇了與預(yù)測結(jié)果強烈相關(guān)的特征變量形成模型,而忽略了不同變量對預(yù)測能力影響的比較。此外,該模型的通用性在同一教學環(huán)境中有較好表現(xiàn),但如果課程的教學模式和資源組成有較大變化,就會對模型穩(wěn)定性形成挑戰(zhàn)。這需要后續(xù)研究對不同課程進行分類和概括,形成若干穩(wěn)定的預(yù)測模型模式,以應(yīng)對不同特征的課程結(jié)構(gòu)。同時,該機器學習模型對于傳統(tǒng)教學領(lǐng)域小規(guī)模線下課程的適用性及其性能效果也是未來需要探討的內(nèi)容。
[參考文獻]
陳子健,朱曉亮. 2017. 基于教育數(shù)據(jù)挖掘的在線學習者學業(yè)成績預(yù)測建模研究[J]. 中國電化教育(12):75-81,89.
馬杰,趙蔚,張潔. 2014. 基于學習分析技術(shù)的預(yù)測模型構(gòu)建與實證研究[J]. 現(xiàn)代教育技術(shù)(11):32-40.
孫力,程玉霞. 2015. 大數(shù)據(jù)時代網(wǎng)絡(luò)教育學習成績預(yù)測的研究與實現(xiàn)——以本科公共課程統(tǒng)考英語為例[J]. 開放教育研究(3):74-80.
王改花,傅鋼善. 2019. 網(wǎng)絡(luò)學習行為與成績的預(yù)測及學習干預(yù)模型的設(shè)計[J]. 中國遠程教育(2):39-48.
王亮. 2015. 學習分析技術(shù)建立學習預(yù)測模型[J]. 實驗室研究與探索 (1):215-218,246.
肖巍,倪傳斌,李銳. 2018. 國外基于數(shù)據(jù)挖掘的學習預(yù)警研究:回顧與展望[J]. 中國遠程教育(2):70-78.
Adlin, T., & Pruitt, J. (2010). The Essential Persona Lifecycle: Your Guide to Building and Using Personas. Morgan Kaufmann Publishers, Burlington, MA, USA.
Anderson, J. R. (1993). Rules of the mind. Cognitive Processes, 320.
Arnold, K. E., & Pistilli, M. D. (2012). Course signals at Purdue: using learning analytics to increase student success (pp.267-270). Learning Analytics and Knowledge Conference, Vancouver, British Columbia, ACM.
Barber, R., & Sharkey, M. (2012). Course correction: using analytics to predict course success. Learning Analytics and Knowledge Conference, Vancouver, British Columbia, ACM.
Brooks, C., Thompson, C., & Teasley, S. (2015). A time series interaction analysis method for building predictive models of learners using log data. [ACM Press the Fifth International Conference - Poughkeepsie, New York] Proceedings of the Fifth International Conference on Learning Analytics And Knowledge - LAK, 126-135.
Bull, S., Greer, J., McCalla, G., Kettel, L., & Bowes, J. (2001). User modelling in i-help: What, why, when and how. In User Modeling (pp.117-126). Springer.
Garman, G. (2010). A Logistic Approach to Predicting Student Success in Online Database Courses. American Journal of Business Education, 3(12), 1-5.
Gergen, K. J. (1985). The social constructionist movement in modern psychology. American psychologist, 40(3), 266.
Graesser, A. C., Chipman, P., Haynes, B. C., & Olney, A. (2005). Autotutor: An intelligent tutoring system with mixed-initiative dialogue. Education, IEEE Transactions on, 48(4), 612-618.
Jayaprakash, S. M., Moody, E. W., Lauría, E. J., Regan, J. R., & Baron, J. D.(2014). Early alert of academically at-risk students: An open source analytics initiative. Journal of Learning Analytics, 1(1), 6-47.
Lauría, E. J. M., Moody, E. W., Jayaprakash, S. M., Jonnalagadda, N., & Baron, J. D. (2013). Open academic analytics initiative: initial research findings (pp.150-154). Learning Analytics and Knowledge Conference, Leuven, Belgium, ACM.
Martin, B. (1999). Constraint-based modelling: Representing student knowledge. New Zealand Journal of Computing, 7(2), 30-38.
Moore, R. (2007). Do Students Performances and Behaviors in Supporting Courses Predict Their Performances and Behaviors in Primary Courses? Research and Teaching in Developmental Education, 23(2), 38-48.
Ohlsson, S. (1996). Learning from performance errors. Psychological Review, 103(2), 241-262.
收稿日期:2020-03-09
定稿日期:2020-06-03
作者簡介:王亮,碩士,實驗師,南開大學現(xiàn)代遠程教育學院(300071)。
責任編輯 韓世梅