年晴
摘要:為了實現(xiàn)漢語言在線學習用戶學習行為聚類分析,針對FCM聚類結果易受其初始聚類中心選擇的影響,提出一種基于IHSFCM的漢語言學習用戶學習行為聚類分析。選擇參與維度、專注維度、規(guī)律維度、交互維度和學習成績等作為學習行為的分析指標,學習者層次分為5個等級,分別為優(yōu)秀、良好、中、合格和差。與HSFCM、SVM和決策樹對比發(fā)現(xiàn),文中算法IHSFCM具有更高的聚類準確率和更快的收斂速度以及更低的適應度,為學習者層次劃分和優(yōu)化課程學習提供了新的方法。
關鍵詞:在線學習;漢語言;學習行為;模糊均值聚類;和聲搜索算法
中圖分類號:TP391
文獻標志碼:A
StudyontheLearningBehaviorModelofChineseLanguage
LearnersBasedonImprovedFuzzyCmeansClustering
NIANQing
(
SchoolofHumanitiesManagement,ShanxiUniversityofTraditionalChineseMedicine,Xian712046,China
)
Abstract:InordertoanalyzethelearningbehaviorofChineselanguageonlinelearners,duetoFCMclusteringresultsareeasilyaffectedbytheinitialclustercenterselection,thispaperpresentsaclusteringanalysisofChineselanguagelearningbehaviorbasedonIHSFCM.Participationdimension,attentiondimension,regularitydimension,interactiondimensionandlearningachievementareselectedastheanalysisindexesoflearningbehavior.Thelearners'levelisdividedinto5grades,i.e.,excellent,good,medium,qualifiedandpoor.ComparedwithHSFCM,SVManddecisiontree,theIHSFCMhashigherclusteringaccuracy,fasterconvergencespeedandlowerfitness.Itprovidesanewmethodforlearnerstodivideandoptimizecourselearning.
Keywords:onlinelearning;Chineselanguage;learningbehavior;fuzzyCmeansclustering;harmonysearchalgorithm
0引言
隨著我國經濟的快速發(fā)展和綜合國力的不斷上升,對外交流和對外貿易的深度和規(guī)模不斷加深和擴大以及網絡教學和在線課程的飛速發(fā)展,漢語言學習的人數(shù)和規(guī)模不斷增加和擴大,積累了大量的學習數(shù)據(jù),如何利用這些學習數(shù)據(jù)挖掘出學習數(shù)據(jù)的內在價值更好地服務于漢語言的教與學,引起了廣泛關注和研究[12]。因此研究漢語言學習用戶的學習行為對優(yōu)化課程教學和完善課程評估具有重要意義。
模糊C均值(FuzzyCmean,F(xiàn)CM)聚類[3]是運用隸屬度確定每個數(shù)據(jù)樣本類別的方法,具有效率高、計算量小的優(yōu)點,然而FCM聚類結果易受其初始聚類中心選擇的影響,本文將和聲搜索算法(HarmonySearch,HS)應用于FCM初始聚類中心的選擇,提出一種基于IHSFCM的漢語言學習用戶學習行為聚類分析。研究結果表明,IHSFCM具有更快的收斂速度和更低的適應度,效果較HSFCM更優(yōu),為漢語言課程學習優(yōu)化提供科學決策的依據(jù)。
1改進的HS算法
(1)隨機位置更新
若HS算法中最差和最好和聲分別為xworst以及xbest,將xworst視為基向量,則較優(yōu)和聲通過學習xbest調節(jié)出來,本文提出一種基于隨機位置更新的方法如式(1)—式(2)。
xnewi=xri+rand×(xd-xri)
(1)
xd=F×xbesti-xri,r∈(1,2,…,HMS)
(2)
若xr
(2)反向學習
為擴大HS算法的搜索空間,將反向學習[45]引入HS算法,反向學習策略如式(3)。
xnewi=
xUi+xLi-xri,rand≤0.5
xri,其他
(3)
(3)小概率變異
HS算法中的小概率變異操作如式(4)。
xnewi=xLi+rand×(xUi-xLi)
(4)
如果rand≤Pm,則進行小概率變異,取Pm=0.005。
(4)修正音調微調概率
音調微調概率PAR可設計如式(5)。
PARt+1=PARmax-PARminT·t+PARmin
(5)
式(5)中,PARmax、PARmin為音調微調概率的最大值和最小值;PARt+1為第t+1次的音調微調概率。
改進HS算法流程,如圖1所示。
2基于IHSFCM聚類
2.1學習行為分析指標
為實現(xiàn)漢語言學習用戶學習行為的分析,在參考文獻[68]基礎上,選擇參與維度、專注維度、規(guī)律維度、交互維度和學習成績等作為評價指標,詳細評價指標,如表1所示。
2.2FCM聚類
假設樣本數(shù)據(jù)x={x1,x2,…,xn},樣本數(shù)據(jù)為n個,每個元素包含d個屬性。FCM聚類數(shù)目為C(2≤C≤n),聚類中心W={w1,w2,…,wC}。由于FCM模糊聚類的每個元素類別不能被嚴格劃分到具體的某一類別之中,所以令μik為第k個元素屬于第i類的隸屬度,其中
∑Ci=1μik=1,μik∈[0,1]。
FCM模糊均值聚類的目標函數(shù)定義為:
minJm(U,W)=∑nk=1
∑Ci=1μbikd2ik
(6)
式中,b為指數(shù)權重,文中取b=2;U為隸屬度矩陣;dik=||xk-wi||表示元素xk與類中心wi二者之間的歐式距離。FCM模糊均值聚類的中心思想就是不斷調整(U,W)使得目標函數(shù)Jm(U,W)最小。FCM模糊均值聚類的迭代步驟為:
Step1:設定聚類數(shù)目C(2≤C≤n)和指數(shù)權重b,并隨機初始化聚類中心矩陣W(0),令迭代次數(shù)l=0;
Step2:計算隸屬度矩陣U;
u(l)ik=
1/∑Cj=1(dik/djk)2b-1,dik>0
1,dik=0
(7)
Step3:修正聚類中心W;
w(l+1)i=∑nk=1(μ(l)ik)bxk∑nk=1(μ(l)ik)b
(8)
Step4:對于給定閾值ε>0,若J(l)m-J(l-1)m≤ε,則FCM算法結束,此時對應的最優(yōu)聚類中心W(l)=w(l)1,w(l)2,…,w(l)C;反之,l=l+1,返回Step2。
2.3IHSFCM聚類
IHSFCM聚類思想:先隨機產生幾組聚類中心點,運用IHS算法的思想變化區(qū)域中心點計算適應度,淘汰適應度低的中心點和產生新的中心點,重新迭代計算,如此反復,直到滿足結束條件為止,算法流程圖,如圖2所示。
基于IHSFCM的漢語言在線學習用戶學習行為聚類分析算法可以具體詳細地描述為:
Step1:讀取漢語言在線學習用戶學習行為分析指標數(shù)據(jù);
Step2:初始化HS算法參數(shù):創(chuàng)作的次數(shù)T、聲記憶庫的個數(shù)HMS、音調微調的概率PAR、音調微調的帶寬bw以及和聲記憶庫保留的概率HMCR;
Step3:初始化和聲記憶庫;
Step4:生成新和聲;
Step4:更新和聲記憶庫:根據(jù)適應度函數(shù)(6)評價Step3中的新解,若比HM中的函數(shù)值最差的一個好,則更新至HM中;
Step5:重復Step3和Step4,直到滿足終止條件,輸出FCM最優(yōu)聚類中心,并將FCM最優(yōu)聚類中心帶入FCM模型進行漢語言在線學習用戶學習行為聚類。
3實證分析
3.1數(shù)據(jù)來源
為了驗證本文算法的有效性,選擇網易公開課《漢語言文字學類課程導論》在線課程學習數(shù)據(jù)為研究對象[1213],將學習者層次分為5個等級,分別為優(yōu)秀、良好、中、合格和差,不同學習者類型數(shù)據(jù)分布,如表2所示。
3.2評價指標
為了說明漢語言在線學習用戶學習行為聚類分析的效果,評價指標選擇聚類
準確率T和誤判率F。
(1)準確率T:如果學習者類型被正確聚類的數(shù)量為A,而學習者類型的實際數(shù)量為B,則學習者類型聚類的準確率如式(9)。
T=AB×100%
(9)
(2)誤判率F:如果學習者類型是第i類的實際數(shù)量為H,而將第i類學習者類型誤判為第j類學習者類型的數(shù)量為G,則學習者類型判斷的誤判率如式(10)。
Fij=GH×100%
(10)
3.3實驗結果
為了驗證漢語言在線學習用戶學習行為聚類算法的效果,將本文算法IHSFCM和HSFCM[14]、SVM[15]和決策樹[1617]進行對比,如表3和圖3圖7所示。
IHS算法參數(shù)設置為:種群規(guī)模為10,最大迭代次數(shù)為100,聚類結果如表3所示。IHSFCM和HSFCM收斂曲線
對比如圖7所示,由圖7可知,IHSFCM具有更快的收斂速度和更低的適應度,效果較HSFCM更優(yōu)。
圖3圖7中,“*”表示學習者層次的預測類別,“○”表示學習者層次的實際類別,通過對比展示可以直觀地顯示學習者層次聚類結果和實際學習者層次類別,其中1、2、3、4、5分別表示學習者層次為優(yōu)秀、良好、中、合格和差。當“*”和“○”重合時,學習者層次的預測類別和實際類別一致,說明聚類正確;當“*”和“○”不重合時,學習者層次的預測類別和實際類別不一致,此時學習者層次聚類錯誤。由表3和圖3圖6可知,IHSFCM的聚類準確率和誤判率分別為99.42%和0.58%,優(yōu)于HSFCM的96.27%和3.73%,SVM的96.40%和3.55%和決策樹的92.30%和2.70%。與HSFCM、SVM和決策樹對比發(fā)現(xiàn),本文算法IHSFCM具有更高的聚類準確率,為學習者層次劃分和優(yōu)化課程學習提供了新的方法。
4總結
為了實現(xiàn)漢語言在線學習用戶學習行為聚類分析,針對FCM聚類結果易受其初始聚類中心選擇的影響,提出一種基于IHSFCM的漢語言學習用戶學習行為聚類分析。研究結果表明,IHSFCM具有更快的收斂速度和更低的適應度,效果較HSFCM更優(yōu),為漢語言課程學習優(yōu)化提供科學決策的依據(jù)。然而,由于本文學習行為分析指標可能考慮不夠全面,導致聚類效果存在適應性較差的缺點,后續(xù)將考慮更多因素的在線學習行為聚類分析,從而提高學習行為分析模型的準確性和適用性。
參考文獻
[1]
胡藝齡,顧小清,趙春.在線學習行為分析建模及挖掘[J].開放教育研究,2014,20(2):102110.
[2]范潔,楊岳湘,溫璞.C4.5算法在在線學習行為評估系統(tǒng)中的應用[J].計算機工程與設計,2016(6):946948.
[3]王法玉,姜妍.基于自組織神經網絡和模糊聚類的校園無線網用戶學習興趣度行為分析[J].計算機應用研究,2018,35(1):1115.
[4]劉思遠.一種新的多目標改進和聲搜索優(yōu)化算法[J].計算機工程與應用,2010,46(34):2730.
[5]陳春,汪沨,劉蓓,等.基于基本環(huán)矩陣與改進和聲搜索算法的配電網重構[J].電力系統(tǒng)自動化,2014,38(6):5560.
[6]李爽,王增賢,喻忱,等.在線學習行為投入分析框架與測量指標研究——基于LMS數(shù)據(jù)的學習分析[J].開放教育研究,2016,22(2):7990.
[7]曹建芳,郝耀軍.基于并行AdaboostBP網絡的大規(guī)模在線學習行為評價[J].計算機應用與軟件,2017,34(7):267272.
[8]陳志雄.基于藍墨云班課的語文在線學習行為數(shù)據(jù)分析——中職語文混合式學習在線學習行為的數(shù)據(jù)挖掘與學習分析[J].現(xiàn)代職業(yè)教育,2018(11):2426.
[9]李小娟,梁中鋒,趙楠.在線學習行為對混合學習績效的影響研究[J].現(xiàn)代教育技術,2017(2):8086.
[10]吳林靜,勞傳媛,劉清堂,等.網絡學習空間中的在線學習行為分析模型及應用研究[J].現(xiàn)代教育技術,2018,28(6):4754.
[11]劉冰,李彥敏.SPOC學習者在線學習行為特征分析——基于互動視角[J].集美大學學報(教育科學版),2019,20(1):3338.
[12]陳鵬宇,馮曉英,孫洪濤,等.在線學習環(huán)境中學習行為對知識建構的影響[J].中國電化教育,2015(8):5963.
[13]宗陽,陳麗,鄭勤華,等.基于在線學習行為數(shù)據(jù)的遠程學習者學業(yè)情緒分析研究——以Moodle平臺為例[J].開放學習研究,2017(6):1120.
[14]宗陽,鄭勤華,陳麗.中國MOOCs學習者價值研究——基于RFM模型的在線學習行為分析[J].現(xiàn)代遠距離教育,2016(2):2128.
[15]孔麗麗,馬志強,易玉何,等.在線學習行為影響因素模型研究——基于行為科學理論的評述[J].開放學習研究,2017,22(5):4653.
[16]王士霞.基于決策樹的在線學習行為分析[J].河南科技學院學報(自然科學版),2015,43(5):6770.
[17]顧倩頤.基于在線學習行為的個性化學習需求智能挖掘技術研究[J].軟件導刊,2015,14(12):1214.
(收稿日期:2020.03.24)