摘要:大數(shù)據(jù)時代的到來,對數(shù)據(jù)挖掘技術(shù)的應(yīng)用提出了更高要求。首屆“學(xué)習(xí)分析技術(shù)與知識國際會議”的召開,將數(shù)據(jù)挖掘方法與學(xué)習(xí)管理系統(tǒng)建立關(guān)聯(lián),并從分析學(xué)習(xí)者的行為中來改善和提升物理教育效率。本文將從數(shù)據(jù)挖掘的方法、內(nèi)容、方向、結(jié)果呈現(xiàn)等方面,就其在學(xué)習(xí)分析中的應(yīng)用展開探討,并從優(yōu)化數(shù)據(jù)挖掘方法上來改善學(xué)習(xí)分析技術(shù)的有效應(yīng)用。
關(guān)鍵詞:數(shù)據(jù)挖掘 學(xué)習(xí)分析 關(guān)鍵技術(shù) 應(yīng)用探討
基金項目:本文系河南省軟科學(xué)研究計劃項目(項目編號:142400410263,142400410267,142400410671)”的階段性研究成果。
大數(shù)據(jù)時代下信息指數(shù)型增長已經(jīng)成為趨勢,對于海量數(shù)據(jù)的分析及呈現(xiàn),迫切需要從數(shù)據(jù)挖掘技術(shù)的應(yīng)用中來獲取有效信息。現(xiàn)代教育領(lǐng)域中對信息化技術(shù)的應(yīng)用較為廣泛,各類虛擬學(xué)習(xí)環(huán)境的構(gòu)建需要符合學(xué)生的學(xué)習(xí)特性,這些數(shù)據(jù)即多又雜,更需要專門的軟件工具來進行改善和處理。可以說,學(xué)習(xí)分析技術(shù)是數(shù)據(jù)分析及數(shù)據(jù)挖掘技術(shù)基礎(chǔ)上發(fā)展而來的應(yīng)用,因此,從學(xué)習(xí)分析定義及數(shù)據(jù)模型的構(gòu)建上來增強對學(xué)生學(xué)習(xí)行為的研究,有助于科學(xué)的評估和預(yù)測學(xué)生的表現(xiàn),改善學(xué)生的學(xué)習(xí)方式。虛擬技術(shù)中的學(xué)習(xí)環(huán)境的營造,可以通過數(shù)據(jù)挖掘技術(shù)來實現(xiàn),特別是對于海量教育數(shù)據(jù)的有效提取,以幫助教育者進行分析和改進教學(xué)決策。
1 學(xué)習(xí)分析中的關(guān)鍵技術(shù)
1.1聚類技術(shù)
對于數(shù)據(jù)挖掘中的聚類,主要從抽象對象的集合分組中來進行歸類,聚類是對具有相似特性的多個類或簇進行分組的過程,并利用顯性或隱性方式進行描述。在聚類分析中,不同算法下對相關(guān)數(shù)據(jù)的分類集合也是不同的,因此需要結(jié)合數(shù)據(jù)特征來進行有效的聚類操作。在虛擬學(xué)習(xí)環(huán)境中,對于每門課程知識的建構(gòu),可以從學(xué)生的不同表現(xiàn)上來進行分組聚類。如對于學(xué)習(xí)積極性高的團體,可以從增強知識拓展及關(guān)聯(lián)度上來滿足學(xué)生學(xué)習(xí)要求;對于成績較低、參與度不高的學(xué)生,可以從激勵措施的組建上來增強學(xué)生的學(xué)習(xí)積極性??梢?,對于聚類技術(shù)的運用,關(guān)鍵是要從學(xué)生學(xué)情的分組上,融入不同的虛擬分組策略,以激發(fā)學(xué)生能夠更好的參與學(xué)校,增進小組間學(xué)習(xí)的交流和協(xié)作。
1.2關(guān)聯(lián)規(guī)則的挖掘
從大數(shù)據(jù)環(huán)境中對相關(guān)聯(lián)數(shù)據(jù)的挖掘,主要是通過數(shù)據(jù)庫中各項集的可信度、支持度的取值來進行。對于某數(shù)據(jù)庫來說,利用形式化語言進行描述時,每一個事務(wù)都是集合,而每個集合都是M項,X、Y是其中的兩項,其關(guān)聯(lián)規(guī)則表示為X[?]Y的蘊含式。對于數(shù)據(jù)庫中的各個事務(wù)規(guī)則來說,其所占的總事務(wù)百分比就是該規(guī)則的可信度??梢?,對于關(guān)聯(lián)規(guī)則的挖掘主要是通過對數(shù)據(jù)庫的事務(wù)間的關(guān)系進行關(guān)聯(lián)。在虛擬網(wǎng)絡(luò)環(huán)境下,對于各類關(guān)聯(lián)規(guī)則的挖掘,有助于我們從學(xué)生的學(xué)習(xí)行為中來挖掘關(guān)聯(lián)關(guān)系,對于這些關(guān)聯(lián)關(guān)系進行關(guān)注,從中來轉(zhuǎn)變和調(diào)整教學(xué)策略,增強學(xué)生對知識的學(xué)習(xí)融合度,更好的提升教學(xué)效率。為此,可以通過對課程資源進行關(guān)聯(lián)規(guī)則挖掘,通過學(xué)生訪問量,以及學(xué)生的學(xué)習(xí)成績進行對比,從中發(fā)現(xiàn)成績與那些資源的訪問有關(guān)系,并從學(xué)習(xí)資源的重組中來增強學(xué)生的訪問量。如對于某些訪問量不高的資源,在與學(xué)生的成績關(guān)聯(lián)上作用不大,可以進行有選擇性的刪除,避免占用學(xué)生的學(xué)習(xí)時間,也提升了資源整合的效率。
1.3分類算法
對于數(shù)據(jù)挖掘中的數(shù)據(jù)分類是基于某一共同特性而建立的數(shù)據(jù)分組,其分類方法可以是基于學(xué)生的某類學(xué)習(xí)行為,也可以是針對某一個體或群體。以決策樹為例,對于分類方法的運用主要從分類規(guī)則的設(shè)定中,以判斷各決策樹的結(jié)構(gòu)是否健壯,對于分類對象的屬性定義是否準(zhǔn)確,能否加快決策樹的訪問速度。對于學(xué)習(xí)行為進行分析時,分類算法可以預(yù)測學(xué)生的學(xué)習(xí)成績,并從中來關(guān)聯(lián)學(xué)習(xí)動機。如針對學(xué)習(xí)積極性較低的學(xué)生,可以從補救措施的激勵上來增進參與度。對于決策樹在構(gòu)建分層教學(xué)模型中,依據(jù)決策樹的層次關(guān)系來優(yōu)化教學(xué)內(nèi)容,能夠更好的促進分層教學(xué)效率。同時,對于決策樹的D3算法分類,可以從學(xué)生數(shù)據(jù)庫進行學(xué)習(xí)能力分類,便于教師采取相應(yīng)對策來改善學(xué)生的學(xué)習(xí)態(tài)度。
1.4時間序列分析
對于學(xué)習(xí)環(huán)境中的學(xué)生學(xué)習(xí)狀態(tài)的分析是實時的,其產(chǎn)生的數(shù)據(jù)量也是按照時間序列進行排列的。因此,在進行學(xué)習(xí)行為分析時,可以從時間序列來動態(tài)的收集學(xué)生信息,及時發(fā)現(xiàn)學(xué)習(xí)行為中的問題,并靈活調(diào)整教學(xué)資源來優(yōu)化虛擬教學(xué)。時間序列是數(shù)據(jù)挖掘中的重要技術(shù),如在學(xué)生課程資源的挖掘中,能夠結(jié)合訪問時間、教育資源的關(guān)鍵詞進行檢索,以分析學(xué)習(xí)者的學(xué)習(xí)行為及趨勢,通過反饋來重新編排和優(yōu)化教學(xué)內(nèi)容,提升教學(xué)資源的利用率。如在時間序列分析中可以完成練習(xí)作業(yè)的布置,結(jié)合學(xué)習(xí)者對相關(guān)課程的跟蹤數(shù)據(jù),從而明確練習(xí)的重點。在Moodle平臺上,借助于對學(xué)習(xí)者行為數(shù)據(jù)的挖掘與分析,可以預(yù)測學(xué)生對某類知識的掌握程度,從而有針對性的開展作業(yè)輔導(dǎo)。另外,在對系統(tǒng)進行檢測時,可以利用前饋神經(jīng)網(wǎng)絡(luò)(FFNN)、支持向量機技術(shù)(SVM)、概率集合SFAM分類器來進行準(zhǔn)確分類,提升時間序列的分析優(yōu)勢。
2 基于用戶的學(xué)習(xí)分析技術(shù)實踐
基于學(xué)習(xí)管理的各類分析工具的應(yīng)用,對于提升高等教育,尤其是遠(yuǎn)程教育改革中發(fā)揮了重要作用。以某院校網(wǎng)絡(luò)教學(xué)為例,通過對各指標(biāo)數(shù)據(jù)的分類挖掘,如“上網(wǎng)人數(shù)”、“登陸次數(shù)”、“在線時長”、“瀏覽資源次數(shù)”、“論壇發(fā)帖總數(shù)”等有關(guān)學(xué)習(xí)行為的匯總,來反映學(xué)生網(wǎng)絡(luò)學(xué)習(xí)的頻度、進度、以及均衡性,并從組織、引導(dǎo)和改進上來優(yōu)化網(wǎng)絡(luò)資源結(jié)構(gòu),跟蹤學(xué)生的學(xué)習(xí)行為。通過數(shù)據(jù)挖掘技術(shù)在學(xué)習(xí)分析中的應(yīng)用,能夠從教學(xué)上獲取各類活動的總量及平均情況,以監(jiān)測網(wǎng)絡(luò)學(xué)習(xí)工作現(xiàn)狀,為教學(xué)評估和網(wǎng)絡(luò)教學(xué)實施提供參考。
2.1 課程資源瀏覽情況分析
結(jié)合《開放教育學(xué)習(xí)指南》要求,對于網(wǎng)絡(luò)課程模塊的監(jiān)測與分析結(jié)果中,能夠清晰的反映各類資源瀏覽的頁面?zhèn)€數(shù)、各學(xué)習(xí)者對各模塊及內(nèi)容的關(guān)注程度;如對于瀏覽頻次較高的資源頁面,表明受到學(xué)習(xí)者的關(guān)注。在課程章節(jié)設(shè)計、體驗區(qū),問題庫、以及資料庫等模塊使用分析中,學(xué)生的學(xué)習(xí)習(xí)慣能夠從其參與度、個人人均瀏覽頻次等參數(shù)中來獲得。如對于各章節(jié)內(nèi)的資源訪問量較高,說明學(xué)生從課程的學(xué)習(xí)及體驗需求較高,學(xué)習(xí)者在模擬的體驗區(qū)能夠參與到網(wǎng)絡(luò)互動,激發(fā)學(xué)習(xí)興趣;對于問題庫的訪問量也較大,說明學(xué)生能夠從常見問題的解答中來釋疑解惑,便于學(xué)習(xí)者盡快掌握網(wǎng)絡(luò)學(xué)習(xí)方法。endprint
2.2 自主學(xué)習(xí)路徑分析
對于學(xué)習(xí)過程靜態(tài)信息的獲取,可以幫助我們從中來梳理學(xué)生的“自主學(xué)習(xí)路徑”。以聚類算法為例,通過對網(wǎng)絡(luò)資源模塊的訪問跳轉(zhuǎn)進行分析,以“瀏覽時間+學(xué)號”作為鍵值,以“瀏覽順序”為序列,以“瀏覽模塊”為預(yù)測值來建構(gòu)挖掘結(jié)構(gòu),從中來獲得各模塊信息的轉(zhuǎn)換情況,從中來獲得學(xué)習(xí)者的自主學(xué)習(xí)路徑。如在“課程章節(jié)”與“體驗區(qū)”模塊的對比分析中,學(xué)習(xí)者的跳轉(zhuǎn)訪問概率較低,而在“資料庫”與“問題庫”等輔助模塊中,學(xué)習(xí)者的跳轉(zhuǎn)概率較大,說明學(xué)生對學(xué)習(xí)方法的了解較為側(cè)重,也為我們進一步優(yōu)化課程鏈接,拓寬學(xué)習(xí)資源提出了要求。
3 結(jié)語
隨著對數(shù)據(jù)挖掘領(lǐng)域的研究深入,對于計算機技術(shù)與心理學(xué)、教育學(xué)的知識的融合更加緊密,因此從數(shù)據(jù)挖掘的專業(yè)化上,依據(jù)現(xiàn)代專門教育理論,從學(xué)習(xí)分析的心理認(rèn)知、行為認(rèn)知中進行闡釋將會成為主流。同時,對于現(xiàn)有數(shù)據(jù)挖掘交互信息的分類,一方面從課程資源的訪問上來探索學(xué)習(xí)規(guī)律,另一方面從學(xué)生認(rèn)知、社會層面來對學(xué)生的學(xué)習(xí)行為進行跟蹤和提取,加深對其剖析,揭示隱藏的知識信息以改善教育決策。另外,在數(shù)據(jù)挖掘個性化上,對于傳統(tǒng)的依據(jù)學(xué)生行為的分析,難以從總體情況上來提升教學(xué)決策參考,而Siemens教授從構(gòu)建學(xué)習(xí)者模型視角,分析學(xué)習(xí)者的學(xué)習(xí)過程,從中來獲取某一類學(xué)生的特征值,以提供個性化的教學(xué)服務(wù)。對于學(xué)習(xí)分析技術(shù)中的數(shù)據(jù)挖掘運用,重在從數(shù)據(jù)誤解方法上來提升教育資源的針對性、可操作性和靈活性,滿足各類學(xué)生的不同需求。
參考文獻:
[1] 魏順平.學(xué)習(xí)分析技術(shù):挖掘大數(shù)據(jù)時代下教育數(shù)據(jù)的價值[J]. 現(xiàn)代教育技術(shù). 2013(02).
[2] 魏雪峰,宋靈青.學(xué)習(xí)分析:更好地理解學(xué)生個性化學(xué)習(xí)過程——訪談學(xué)習(xí)分析研究專家George Siemens教授[J]. 中國電化教育. 2013(09).
[3] 孫洪濤. 學(xué)習(xí)分析視角下的遠(yuǎn)程教學(xué)交互分析案例研究[J]. 中國電化教育. 2012(11).
[4] 吳青,羅儒國.學(xué)習(xí)分析:從源起到實踐與研究[J]. 開放教育研究. 2015(01).
[5] 胡藝齡,顧小清,趙春.在線學(xué)習(xí)行為分析建模及挖掘[J]. 開放教育研究. 2014(02).
作者簡介:楊鳳霞,女,河南開封人,1979年3月生,講師,碩士研究生,研究方向:計算機應(yīng)用,云計算。endprint