寧建飛
摘 要: 提出了一種面向個性化網(wǎng)絡(luò)學(xué)習(xí)的學(xué)習(xí)者個性挖掘(Personality mining)及自適應(yīng)學(xué)習(xí)策略生成的解決思路,即:通過對樣本學(xué)習(xí)者的個性調(diào)查和學(xué)習(xí)行為模式的分析,挖掘出“行為模式-個性-學(xué)習(xí)策略”三者之間的關(guān)聯(lián)關(guān)系,并據(jù)此實現(xiàn)學(xué)習(xí)者個性的自動獲取與自適應(yīng)學(xué)習(xí)策略的生成,為學(xué)習(xí)者提供網(wǎng)絡(luò)學(xué)習(xí)的策略推薦。
關(guān)鍵詞: 網(wǎng)絡(luò)學(xué)習(xí); 個性挖掘; 行為模式; 策略推薦
中圖分類號:TP3 文獻(xiàn)標(biāo)志碼:A 文章編號:1006-8228(2015)03-30-03
Abstract: This paper propose a personalized network learning learners oriented personality mining method and idea of adaptive learning strategy generation. that is, through the analysis of the samples of the learner's personality investigation and learning behavior, to dig out the incidence relationship between "behavior patterns-personality-learning strategies" of the three, and then to realize the learners' personality automatic acquisition and adaptive learning strategy generation, and to provide recommendations of network learning strategy for the learners.
Key words: online learning; personality mining; behavior pattern; policy recommendation
0 引言
目前,網(wǎng)絡(luò)學(xué)習(xí)技術(shù)和應(yīng)用還主要集中在如何運用多媒體網(wǎng)絡(luò)技術(shù)突破傳統(tǒng)教學(xué)的時空限制這一基本問題上,而在如何滿足學(xué)習(xí)者個性化自適應(yīng)學(xué)習(xí)需求方面還很欠缺。能否根據(jù)學(xué)習(xí)者的個性特征設(shè)計自適應(yīng)的學(xué)習(xí)策略并提供合適的學(xué)習(xí)內(nèi)容是決定學(xué)習(xí)效率的關(guān)鍵。因此,人們逐漸開始探究網(wǎng)絡(luò)學(xué)習(xí)的個性化機理,以及個性特征與學(xué)習(xí)策略、學(xué)習(xí)內(nèi)容之間的關(guān)系等一系列問題。
個性化網(wǎng)絡(luò)學(xué)習(xí)逐漸成為研究的熱點,研究主要集中在學(xué)習(xí)內(nèi)容的個性化導(dǎo)航和學(xué)習(xí)策略的個性化設(shè)計兩個方面。前者是指網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)針對學(xué)習(xí)者的學(xué)習(xí)目標(biāo)、認(rèn)知水平等因素提供相應(yīng)學(xué)習(xí)內(nèi)容;后者則是指網(wǎng)絡(luò)學(xué)習(xí)系統(tǒng)根據(jù)學(xué)習(xí)者性格、動機、偏好、風(fēng)格等非智力因素確定學(xué)習(xí)環(huán)節(jié)的組織、傳遞和管理方法。
1 學(xué)習(xí)者模型和數(shù)據(jù)收集
學(xué)習(xí)者模型是個性化網(wǎng)絡(luò)學(xué)習(xí)的前提與基礎(chǔ),是對某個或某類學(xué)習(xí)者的抽象。學(xué)習(xí)者個性挖掘過程也就是學(xué)習(xí)者模型建立與完善的過程。目前,典型的學(xué)習(xí)者模型為IEEE 1484.13 PAPI(public and private information)[1],它從個人資料、學(xué)業(yè)、管理、關(guān)系、安全、偏好、績效和作品集八個方面描述學(xué)習(xí)者。但由于該模型還缺少對學(xué)習(xí)者非智力因素(如性格、動機、風(fēng)格等)的描述,因而還不足以作為個性化學(xué)習(xí)策略的制定依據(jù)。以現(xiàn)代教育理論為指導(dǎo),在IEEE l484.13模型的基礎(chǔ)上進(jìn)一步引入卡特爾16種性格特征、動機模式、學(xué)習(xí)風(fēng)格等對學(xué)習(xí)者非智力因素的描述,建立更加完善的、能夠綜合反映學(xué)習(xí)者個性與行為特征的學(xué)習(xí)者模型,從而為個性挖掘以及自適應(yīng)學(xué)習(xí)策略的生成提供了基礎(chǔ)。
2 學(xué)習(xí)者個性挖掘機理
與其他領(lǐng)域的數(shù)據(jù)挖掘相比,網(wǎng)絡(luò)學(xué)習(xí)環(huán)境下學(xué)習(xí)者的個性挖掘更具有復(fù)雜性、動態(tài)性、分散性等特點。復(fù)雜性體現(xiàn)在學(xué)習(xí)者學(xué)習(xí)行為模式異構(gòu)多樣,個性模式維數(shù)較多且屬性值多為數(shù)值型等;動態(tài)性體現(xiàn)在學(xué)習(xí)日志數(shù)據(jù)的內(nèi)容不斷更新;分散性則體現(xiàn)為數(shù)據(jù)來源廣泛,不僅包括各種個性測量表,還包括系統(tǒng)記錄的學(xué)習(xí)日志和網(wǎng)頁內(nèi)嵌機制采集的學(xué)習(xí)行為數(shù)據(jù)。簡單地采用常規(guī)數(shù)據(jù)挖掘算法,會導(dǎo)致挖掘過程復(fù)雜度高,效率與精度低下。針對上述問題,提出個性挖掘工作機理,如圖2所示。
首先,通過對樣本學(xué)習(xí)者進(jìn)行個性調(diào)查和日志收集,獲得個性數(shù)據(jù)、行為數(shù)據(jù)以及學(xué)習(xí)策略數(shù)據(jù),通過數(shù)據(jù)預(yù)處理對垃圾數(shù)據(jù)進(jìn)行清型、整合、歸約。基于粗糙集理論的個性屬性歸約可實現(xiàn)個性數(shù)據(jù)的降維,獲取對學(xué)習(xí)策略影響重要程度高的個性特征屬性。它依據(jù)學(xué)習(xí)者的個性屬性間存在的關(guān)聯(lián)關(guān)系,并鑒于各自對學(xué)習(xí)策略的影響程度有顯著差別,因此約簡掉那些能夠被其他屬性導(dǎo)出的屬性,保留那些對學(xué)習(xí)策略影響最大的屬性,如此就能達(dá)到降低個性挖掘與個性化學(xué)習(xí)策略生成復(fù)雜度的目的。數(shù)據(jù)預(yù)處理還包括日志分析中的會話識別、路徑補全、噪聲消除等工作。
其次,通過對網(wǎng)絡(luò)學(xué)習(xí)行為日志進(jìn)行統(tǒng)計和序列模式分析,獲得學(xué)習(xí)行為模式;同時,對個性特征與學(xué)習(xí)策略進(jìn)行粗糙集分析,挖掘出行為-策略的關(guān)聯(lián)規(guī)則,此部分工作還可發(fā)現(xiàn)與學(xué)習(xí)緊密相關(guān)的關(guān)鍵個性屬性,實現(xiàn)第二次個性屬性歸約,達(dá)到個性模型的進(jìn)一步簡化。出于個性化服務(wù)是針對具有共同個性特征的學(xué)習(xí)者群體開展的,因此還對學(xué)習(xí)者的群組劃分進(jìn)行了研究,采用聚類算法根據(jù)學(xué)習(xí)者個性特征的相似性計算,將學(xué)習(xí)者分為若干群組。
再次,以用戶分組為目標(biāo),結(jié)合學(xué)習(xí)策略和行為模式,采用關(guān)聯(lián)規(guī)則挖掘方法,挖掘個性與策略、個性與行為的關(guān)聯(lián)關(guān)系,建立個性-策略關(guān)系庫和個性-行為關(guān)系庫。
最后,依據(jù)上述步驟建立規(guī)則庫,對當(dāng)前學(xué)習(xí)者的行為模式進(jìn)行推理,從而自動獲得學(xué)習(xí)者個性特征,為個性化學(xué)習(xí)策略推送服務(wù)提供基礎(chǔ)。
上述過程中,個性聚類、個性模式與行為模式的關(guān)聯(lián)規(guī)則分析是通過樣本數(shù)據(jù)獲得規(guī)則的過程,而個性特征獲取則是利用行為模式與所獲規(guī)則得到當(dāng)前學(xué)習(xí)者個性特征的過程。需要強調(diào)的是,個性挖掘是一個反復(fù)迭代、逐步逼近的過程,隨著該過程的推進(jìn),學(xué)習(xí)者個性特征(包括屬件值與權(quán)重)將逐步逼近真實值。
3 個性挖掘?qū)嵗?/p>
前面已經(jīng)介紹了完整的個性挖掘流程。下面以我校的大學(xué)生職業(yè)生涯規(guī)劃與就業(yè)指導(dǎo)網(wǎng)絡(luò)學(xué)習(xí)平臺為學(xué)習(xí)環(huán)境,以三個學(xué)習(xí)者的真實網(wǎng)絡(luò)學(xué)習(xí)日志和相關(guān)數(shù)據(jù)為實例,演示“新學(xué)習(xí)者”到來時如何僅通過他們的學(xué)習(xí)行為推斷其個性特征,又如何進(jìn)—步為他“指點”有效的學(xué)習(xí)策略,這兩個過程稱之為“個性推理”和“策略推薦”。
三個學(xué)習(xí)者的UserID是14304040114、14305020202和14306300227,都是我校2014級學(xué)生,從同一批采集的數(shù)百名學(xué)習(xí)者中隨機選出。他們被選中的條件很簡單,首先行為日志量不能太少,其次學(xué)習(xí)者的職業(yè)生涯規(guī)劃與就業(yè)指導(dǎo)課的成績屬于優(yōu)良,這時認(rèn)為學(xué)習(xí)者現(xiàn)行使用的學(xué)習(xí)策略至少是有效的(雖然對于其個性而言未必是最有效的),這樣,通過對比分析能夠了解我們推薦的策略是否“中肯”。出于對隱私的尊重,這里不能列出他們具體卡特爾16pf得分,他們的真實個性類別和學(xué)習(xí)策略使用情況如表1。在個性推理之初,新學(xué)習(xí)者的個性和學(xué)習(xí)策略都是未知的,也就是說,表l的內(nèi)容是用來與個性推理所得結(jié)論進(jìn)行對比的。
Step1 日志數(shù)據(jù)清理
從我校的大學(xué)生職業(yè)生涯規(guī)劃與就業(yè)指導(dǎo)網(wǎng)絡(luò)學(xué)習(xí)平臺網(wǎng)站W(wǎng)eb日志中按照UserID以時序整理出包含這三個用戶在某一時段的多條動作,完成UserID的填寫、動作編碼、時間提取、內(nèi)存編碼等數(shù)據(jù)清理工作。內(nèi)容編碼是按照網(wǎng)站拓?fù)渲饘泳幪栃纬傻摹?/p>
Step2 會話識別
由于網(wǎng)站面向注冊用戶,無須用戶識別,幫直接進(jìn)人會話識別階段。我們規(guī)定動作時間間隔小于30分鐘為同一會話,得到了這三個學(xué)習(xí)者的日志經(jīng)識別后形成的會話表。
Step3 行為模式識別
該序列模式體現(xiàn)了“課件瀏覽、查詢、自檢、交互、評注和協(xié)同”中的行為。根據(jù)會話,匹配檢查出現(xiàn)了哪些活動層行為序列模式和其頻度,最后累加到六種行為上去。由于他們各自會話個數(shù)不同,所以最后的結(jié)果還要除以每個學(xué)習(xí)者自己的會話數(shù)。
Step4 個性推理
根據(jù)行為-個性規(guī)則“課件瀏覽=中,交互=中,有恒性=中”和“交互=少,評注=中,恃強性=低”,推理出他們?nèi)说膫€性特征都符合“有恒性=中”,且14305020202還符合“恃強性=低”;進(jìn)一步,參照五種個性特征,簇A和B的有恒性G都介于(3,8),所以14304040114與14306300227的個性類型為B;但是簇A、B和D的恃強性E都為“中”,只不過簇A的恃強性取值為4,最接近“低”,因此嚴(yán)格地說對于14305020202尚不能夠區(qū)分他到底應(yīng)該屬于簇A還是B。根據(jù)這三個學(xué)習(xí)者真實的個性類別,這個個性推理結(jié)論是完全可以接受的。
Step5 學(xué)習(xí)策略推薦
依據(jù)獲得的個性-學(xué)習(xí)策略規(guī)則:對簇A有“侍強性E=中,世故性N=中,語言形式策略=少”和“世故性=中,憂慮性=中,緊張性=中,管理策略=多”;對簇B有“樂群性A=中,幻想性M=中語言形式策略=少”和“NOT(懷疑性L=中) 情感策略=少”。所以,對于14304040114與14306300227兩位學(xué)習(xí)者,既然已推斷他們?yōu)锽類學(xué)習(xí)者,則不能推薦他們使用語言形式策略和情感策略,否則他們需要付出很多的努力來克服自己“容易煩惱憂慮、容易激動和受環(huán)境支配而心神動搖”的天性,使得學(xué)習(xí)的過程事倍功半;應(yīng)該推薦給他們另外三種學(xué)習(xí)策略:{管理策略、語言功能策略和交際策略}。
對于學(xué)習(xí)者14305020202,策略推薦要求為:語言形式策略=少,管理策略=多,情感策略=少,即給他的策略推薦集合為{管理策略,語言功能策略,交際策略}。
4 結(jié)束語
通過由學(xué)習(xí)行為到個性類別的“個性推理”階段和依據(jù)個性特征提供學(xué)習(xí)策略建議的“策略推薦”階段的演示,從隨機選出的三名學(xué)習(xí)者例子可以看出,在這兩個階段都能獲取較理想的結(jié)果,在一定程度上說明了個性挖掘機理和三個關(guān)鍵步驟的有效性。只要有一定量的學(xué)習(xí)行為日志就能夠向?qū)W習(xí)者提供較佳的個性化推薦服務(wù)。
參考文獻(xiàn):
[1] 劉均,李人厚,鄭慶華.網(wǎng)絡(luò)學(xué)習(xí)中學(xué)習(xí)者個性挖掘方法的研究[J].西
安交通大學(xué)學(xué)報,2004.38(6):576-579
[2] 錢曉東.數(shù)據(jù)挖掘中分類方法綜述[J].圖書情報工作,2007.51(3):
68-71
[3] 史忠植.知識發(fā)現(xiàn)[M].清華大學(xué)出版社,2002.
[4] 粟湘,焦微玲,吳沛.Web挖掘應(yīng)用研究[J].信息系統(tǒng),2005.28(6):
651-655
[5] 黃永光.基于網(wǎng)頁挖掘的搜索引擎若干技術(shù)的研究[D].哈爾濱工業(yè)大
學(xué)工學(xué)碩士學(xué)位論文,2006.