楊蘊(yùn)昊
摘要:本文對(duì)學(xué)習(xí)網(wǎng)絡(luò)課程的行為進(jìn)行分類,并分別就學(xué)習(xí)行為數(shù)據(jù)采集及挖掘分析方法現(xiàn)狀進(jìn)行了梳理與總結(jié),為完善網(wǎng)絡(luò)課程學(xué)習(xí)行為數(shù)據(jù)采集模型提供理論依據(jù)。
關(guān)鍵詞:網(wǎng)絡(luò)課程學(xué)習(xí);行為數(shù)據(jù)采集分析
中圖分類號(hào):G642.41 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1674-9324(2019)06-0237-02
近年來,隨著信息技術(shù)的飛速發(fā)展和互聯(lián)網(wǎng)技術(shù)的全面普及,大量用戶行為數(shù)據(jù)隨之產(chǎn)生,由此,大數(shù)據(jù)概念應(yīng)運(yùn)而生。結(jié)合互聯(lián)網(wǎng)技術(shù)教學(xué)的網(wǎng)絡(luò)教育和大數(shù)據(jù),驅(qū)動(dòng)教育向個(gè)性化、智能化方向發(fā)展已成為必然趨勢。如何針對(duì)網(wǎng)絡(luò)課程學(xué)習(xí)構(gòu)建有效的行為數(shù)據(jù)采集模型,以此追蹤和收集的行為信息,更準(zhǔn)確地分析學(xué)習(xí)者學(xué)習(xí)風(fēng)格和學(xué)習(xí)偏好,優(yōu)化教學(xué)資源配置,支撐各類學(xué)習(xí)者更好地學(xué)習(xí)網(wǎng)絡(luò)課程,成為了網(wǎng)絡(luò)學(xué)習(xí)領(lǐng)域中非常有價(jià)值的研究課題。
一、網(wǎng)絡(luò)課程學(xué)習(xí)行為
網(wǎng)絡(luò)學(xué)習(xí)行為數(shù)據(jù)的采集模型主要關(guān)注兩方面:實(shí)際操作行為和知識(shí)內(nèi)化的過程。實(shí)際操作行為主要體現(xiàn)為學(xué)習(xí)網(wǎng)絡(luò)課程時(shí)的顯性操作,是其進(jìn)行學(xué)習(xí)時(shí)的外部直接表現(xiàn)。根據(jù)目前我院網(wǎng)絡(luò)課程中學(xué)習(xí)者的實(shí)際操作進(jìn)行歸類,大概可分為:媒體操作、記錄操作和共享操作。通過記錄這些學(xué)習(xí)時(shí)的簡單操作,可以了解學(xué)習(xí)者在何時(shí)何地發(fā)生了什么樣的學(xué)習(xí)行為,為評(píng)價(jià)學(xué)習(xí)效果奠定基礎(chǔ)。知識(shí)內(nèi)化的過程主要指進(jìn)行知識(shí)加工理解的過程。目前我們的網(wǎng)絡(luò)課程中,可以通過留言反饋、學(xué)習(xí)評(píng)價(jià)等行為進(jìn)行此方面數(shù)據(jù)的采集與分析,挖掘?qū)W習(xí)者的個(gè)性特征,了解學(xué)習(xí)效果。目前,我們需要的網(wǎng)絡(luò)課程學(xué)習(xí)行為數(shù)據(jù)采集與學(xué)習(xí)平臺(tái)數(shù)據(jù)采集略有差異,需要有針對(duì)性地進(jìn)行追蹤并分析。
媒體操作:網(wǎng)絡(luò)課程中核心的多媒體資源就是教學(xué)視頻,記錄分析視頻學(xué)習(xí)動(dòng)作的行為數(shù)據(jù)就顯得尤為重要。這些操作,又可以大概歸為視頻快進(jìn)、快退、拖動(dòng)、暫停、靜音等動(dòng)作以及視頻觀看時(shí)長這兩種類型。記錄視頻中的學(xué)習(xí)動(dòng)作發(fā)生的位置與頻率,可以幫助教師了解視頻中哪些內(nèi)容是學(xué)生需要多學(xué)、難學(xué)的。針對(duì)觀看時(shí)長的數(shù)據(jù)進(jìn)行分析,則可以了解到學(xué)生看視頻注意力集中的規(guī)律,進(jìn)而能更有效地對(duì)教學(xué)視頻進(jìn)行碎片化,適應(yīng)學(xué)習(xí)偏好。
記錄操作:在網(wǎng)絡(luò)課程的學(xué)習(xí)過程中會(huì)產(chǎn)生大量文本性質(zhì)的瀏覽記錄,瀏覽的頁面、點(diǎn)擊的次數(shù)、訪問持續(xù)時(shí)間、學(xué)習(xí)動(dòng)作順序等,記錄下這些學(xué)習(xí)動(dòng)作,有助于了解學(xué)生的學(xué)習(xí)風(fēng)格習(xí)慣,優(yōu)化教學(xué)設(shè)計(jì)。
共享操作:目前主要指記錄離線下載資源,以及將某個(gè)學(xué)習(xí)頁面收藏到收藏夾中的內(nèi)容與次數(shù)。
留言反饋:目前我們的網(wǎng)絡(luò)課程可針對(duì)單個(gè)知識(shí)點(diǎn)或整門課程進(jìn)行留言反饋,在這兩個(gè)模塊收集到的評(píng)論、討論、提問、解答、總結(jié)等文本信息是了解學(xué)習(xí)偏好的重要基礎(chǔ)數(shù)據(jù)。我們需要將這些數(shù)據(jù)整合分析,進(jìn)而做到更好地進(jìn)行個(gè)性化服務(wù)。
學(xué)習(xí)評(píng)價(jià):在網(wǎng)絡(luò)課程設(shè)計(jì)中,增加了視頻節(jié)點(diǎn)測試、知識(shí)點(diǎn)練習(xí)等,記錄這些節(jié)點(diǎn)測試的正確率和錯(cuò)誤率、完成測試的時(shí)間、通過測試的次數(shù)等數(shù)據(jù),并進(jìn)行深入分析,得到學(xué)習(xí)者的學(xué)習(xí)模式,也可以結(jié)合學(xué)習(xí)者的操作記錄為過程性評(píng)價(jià)提供有力的數(shù)據(jù)支持。
二、網(wǎng)絡(luò)數(shù)據(jù)采集分析方法
在采集媒體操作數(shù)據(jù)方面,東北大學(xué)的李帥為了能夠分析出觀看視頻時(shí)的暫停信息,采用K-means的聚類算法,對(duì)學(xué)生在觀看視頻時(shí)選擇暫停的位置進(jìn)行了聚類。通過暫停的位置分析了暫停的原因,進(jìn)而獲得了需要設(shè)置不同視頻清晰度和學(xué)生學(xué)習(xí)難點(diǎn)位置的學(xué)習(xí)行為需求信息。目前對(duì)于記錄操作的采集模型有很多。如較早的有胡運(yùn)安基于SCORM規(guī)范設(shè)計(jì)的學(xué)習(xí)行為采集模型,利用后臺(tái)數(shù)據(jù)庫儲(chǔ)存,使用SOAP消息處理、XML數(shù)據(jù)封裝技術(shù)完成數(shù)據(jù)傳輸。但是他的系統(tǒng)設(shè)計(jì)僅跟蹤了學(xué)習(xí)行為,對(duì)體現(xiàn)學(xué)習(xí)者個(gè)性的學(xué)習(xí)行為分析未作更深入的研究。王巧玲在Web服務(wù)的環(huán)境下,初步設(shè)計(jì)實(shí)現(xiàn)了網(wǎng)絡(luò)學(xué)習(xí)行為采集和集成(EBCI),采集的對(duì)象包括:訪問的頁面、訪問開始時(shí)間、訪問持續(xù)時(shí)間、IP地址、訪問次數(shù)、訪問頁面的引用頁等。EBCI以服務(wù)器端的Web日志中采集Cookie記錄的學(xué)習(xí)行為作為數(shù)據(jù)源,不依賴平臺(tái)與廠商,利用XML語言作為基礎(chǔ)實(shí)現(xiàn)了數(shù)據(jù)共享,但該技術(shù)主要是針對(duì)跨平臺(tái)數(shù)據(jù)的收集共享。黃克斌分四個(gè)模塊提出了網(wǎng)絡(luò)學(xué)習(xí)行為模型,并設(shè)計(jì)了一個(gè)智能化網(wǎng)絡(luò)學(xué)習(xí)行為分析系統(tǒng)結(jié)構(gòu)。具體到其中之一的數(shù)據(jù)采集模塊中時(shí),他使用了異步和同步兩種采集方式,來分別進(jìn)行靜態(tài)和動(dòng)態(tài)數(shù)據(jù)的采集,但只是針對(duì)學(xué)習(xí)行為進(jìn)行了智能化地分析,沒有提出完善有效的模型系統(tǒng)。張玉芳針對(duì)在多用戶、多Web站點(diǎn)的網(wǎng)絡(luò)訪問環(huán)境下,提出了超文本傳送協(xié)議(HTTP)請(qǐng)求與數(shù)據(jù)清理過濾的采集方法,引入網(wǎng)絡(luò)嗅探的方式采集數(shù)據(jù),并過濾了大量傳統(tǒng)方法無法過濾的請(qǐng)求記錄,有效地抽取出反映用戶顯式點(diǎn)擊的頁面請(qǐng)求,為下一步的數(shù)據(jù)挖掘提供了更加準(zhǔn)確的數(shù)據(jù)源。李帥等以本校資源共享課平臺(tái)為實(shí)例,基于Web日志的數(shù)據(jù)挖掘,獲得有用的信息。但是服務(wù)器日志中儲(chǔ)存的數(shù)據(jù)大而龐雜,難以針對(duì)某項(xiàng)學(xué)習(xí)行為獲得完整的數(shù)據(jù)文件,因此作者采用客戶端采集行為數(shù)據(jù)的方式,將腳本語言嵌套在服務(wù)器端,采集學(xué)習(xí)行為數(shù)據(jù)對(duì)MOOC教學(xué)起到了較大的幫助。在留言反饋的采集模型方面,夏天以論壇中的公共網(wǎng)絡(luò)輿情數(shù)據(jù)采集為例,利用聚焦網(wǎng)絡(luò)爬蟲技術(shù),通過限定爬行方向,引入頁面繼承,實(shí)現(xiàn)互聯(lián)網(wǎng)數(shù)據(jù)的深度定向采集。采集到的數(shù)據(jù)包括用戶發(fā)布的話題、評(píng)論以及涉及的圖片等隱性行為。但是研究采用的爬蟲技術(shù)只適用于評(píng)論類行為,不能采集到總結(jié)反思等隱性行為。收集學(xué)習(xí)評(píng)價(jià)的學(xué)習(xí)行為數(shù)據(jù)時(shí),魏德生通過對(duì)網(wǎng)絡(luò)學(xué)習(xí)行為的分析,依據(jù)檔案袋評(píng)價(jià)的啟示,以安全性和穩(wěn)定性都較好的Tomcat作為服務(wù)器,以SqlServer2000為后臺(tái)數(shù)據(jù)庫,設(shè)計(jì)了學(xué)習(xí)行為數(shù)據(jù)自動(dòng)記錄和結(jié)果統(tǒng)計(jì)展示的監(jiān)控系統(tǒng)。該系統(tǒng)可以自動(dòng)記錄測試情況,并進(jìn)行深入地?cái)?shù)據(jù)挖掘。馬瀟同樣采取了Web日志挖掘的技術(shù)收集數(shù)據(jù),引入層次分析法,對(duì)學(xué)習(xí)態(tài)度、學(xué)習(xí)方法、學(xué)習(xí)過程三個(gè)一級(jí)指標(biāo)設(shè)置權(quán)重,從而對(duì)網(wǎng)絡(luò)學(xué)習(xí)者進(jìn)行綜合評(píng)價(jià)。但是他只給出了評(píng)價(jià)信息自動(dòng)采集的設(shè)計(jì)思路,沒有具體實(shí)現(xiàn)。元帥將在線學(xué)習(xí)行為分析評(píng)價(jià)模型分為采集、統(tǒng)計(jì)、分析三個(gè)模塊,采用基于Web服務(wù)和Web日志,使用不同的數(shù)據(jù)庫支撐的方法進(jìn)行采集和統(tǒng)計(jì)。同時(shí),通過設(shè)置評(píng)價(jià)指標(biāo)的權(quán)重和加權(quán)平均法分析學(xué)習(xí)結(jié)果、采用非量化評(píng)價(jià)和分類數(shù)據(jù)挖掘進(jìn)行學(xué)習(xí)方式評(píng)價(jià)。此外,還有一些研究對(duì)知識(shí)內(nèi)化過程的采集和挖掘進(jìn)行了綜合設(shè)計(jì)。我們在建設(shè)網(wǎng)絡(luò)課程學(xué)習(xí)行為數(shù)據(jù)模型時(shí)也做部分參考。劉均等較早地提出了一種面向個(gè)性化網(wǎng)絡(luò)學(xué)習(xí)的學(xué)習(xí)者個(gè)性挖掘方法,通過分析樣本學(xué)習(xí)者個(gè)性特征與學(xué)習(xí)行為模式,挖掘出關(guān)聯(lián)規(guī)則,進(jìn)而推理之后的行為模式,動(dòng)態(tài)地獲取其個(gè)性特征。這個(gè)方法已經(jīng)基于CMI示范系統(tǒng)進(jìn)行了驗(yàn)證,實(shí)現(xiàn)了學(xué)習(xí)個(gè)性的自動(dòng)獲取。王志梅等文章中提到了E-learner檔案模型的建立,該模型使用Agent監(jiān)控學(xué)習(xí)行為數(shù)據(jù),通過不同特征的學(xué)習(xí)行為來評(píng)估學(xué)習(xí)特征,構(gòu)建電子檔案袋系統(tǒng)供定制分享。呂莉也提出使用Web服務(wù)技術(shù)及移動(dòng)Agent技術(shù)采集網(wǎng)絡(luò)學(xué)習(xí)行為。廖競等結(jié)合基于Web服務(wù)和Web日志挖掘的數(shù)據(jù)采集與分析方法,在服務(wù)器或網(wǎng)關(guān)上使用netmate進(jìn)行數(shù)據(jù)流捕獲,處理并輸出為文本,然后使用文本挖掘的成熟算法進(jìn)行處理,得到網(wǎng)絡(luò)學(xué)習(xí)者學(xué)習(xí)的特點(diǎn)、偏好等學(xué)習(xí)規(guī)律,幫助教育者進(jìn)行教育學(xué)分析,從而有效指導(dǎo)網(wǎng)絡(luò)學(xué)習(xí)和教學(xué)的建設(shè)。這個(gè)基于數(shù)據(jù)流獲取的網(wǎng)絡(luò)學(xué)習(xí)行為數(shù)據(jù)采集與分析的方案系統(tǒng)具有較強(qiáng)的靈活性和實(shí)用性。陳紅珍在網(wǎng)絡(luò)學(xué)習(xí)行為相關(guān)研究的論文中設(shè)計(jì)了一種采集方法:采用點(diǎn)擊流數(shù)據(jù)倉庫技術(shù)對(duì)學(xué)習(xí)行為進(jìn)行采集挖掘,來更好地了解學(xué)習(xí)者的個(gè)性和狀態(tài)。點(diǎn)擊流數(shù)據(jù)倉庫是指把日志里記錄的大量點(diǎn)擊行為的數(shù)據(jù)再加工,形成面向分析的、體系化的、綜合的數(shù)據(jù)倉庫(DW)。DW可以在描繪學(xué)習(xí)者行為視圖和存儲(chǔ)大量歷史數(shù)據(jù)的基礎(chǔ)上,進(jìn)行學(xué)習(xí)行為分析。
三、總結(jié)
網(wǎng)絡(luò)課程在面向全社會(huì)學(xué)習(xí)者的同時(shí)也產(chǎn)生了海量的數(shù)據(jù),建議在采集、提煉這些龐雜的教育數(shù)據(jù)時(shí),針對(duì)不同種類的數(shù)據(jù)使用不同的采集方法。對(duì)于媒體操作,可以使用K-means聚類算法對(duì)數(shù)據(jù)庫中的對(duì)象集合分割,再挖掘數(shù)據(jù)中的信息;針對(duì)操作記錄主流的采集技術(shù)有Web服務(wù)、Web日志挖掘、Agent等;留言反饋的數(shù)據(jù)采集可以使用聚焦網(wǎng)絡(luò)爬蟲技術(shù);收集學(xué)習(xí)評(píng)價(jià)的學(xué)習(xí)行為數(shù)據(jù)時(shí),可以使用網(wǎng)絡(luò)學(xué)習(xí)行為自動(dòng)監(jiān)控系統(tǒng)中的技術(shù)統(tǒng)計(jì)挖掘數(shù)據(jù)。綜合多種手段,以期能更好地追蹤和收集學(xué)習(xí)者行為信息,更準(zhǔn)確地分析學(xué)習(xí)者學(xué)習(xí)風(fēng)格和學(xué)習(xí)偏好,從而優(yōu)化資源配置,適應(yīng)混合式教學(xué)需要,配合建立多元化學(xué)習(xí)評(píng)價(jià),提供個(gè)性化服務(wù),最終提高教學(xué)質(zhì)量,滿足各類學(xué)習(xí)行為的需要。
參考文獻(xiàn):
[1]王巧玲.基于Web服務(wù)的網(wǎng)絡(luò)學(xué)習(xí)行為采集與集成初步設(shè)計(jì)與實(shí)現(xiàn)[D].華中師范大學(xué)碩士學(xué)位論文,2007.
[2]魏德生,楊雪.網(wǎng)絡(luò)學(xué)習(xí)行為自動(dòng)監(jiān)控系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn),教育信息化,2006,(1).
[3]廖競,張暉.一種靈活的網(wǎng)絡(luò)學(xué)習(xí)行為數(shù)據(jù)采集與分析系統(tǒng),信息與電腦,2011,(1).