国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于認知狀態(tài)的互補均衡聚類分組模型研究

2024-03-01 08:39:32王彬彬
通化師范學院學報 2024年2期
關鍵詞:組內分組組間

王彬彬,李 強

人工智能和數(shù)據(jù)挖掘技術在教育領域的應用已取得階段性成果[1].教育領域已采集并存儲了海量的數(shù)據(jù),針對數(shù)據(jù)的分析,人們也提出了大量的算法與模型[2?7].數(shù)據(jù)驅動的協(xié)作學習已成為重要的研究方向[2],在教育數(shù)據(jù)挖掘領域得到了廣泛關注.

目前基于聚類的分組方法使用樣本間的距離進行相似度分析[5?6],在應用中主要有三方面的挑戰(zhàn):一是聚類方法容易導致不均衡的劃分;二是聚類方法產生的是同質分組,相似的學生被劃分在一起,不利于實現(xiàn)能力互補的協(xié)作學習;三是現(xiàn)有的分組方法對學生的學習能力進行評估時,主要通過問卷或者人工標注的方式,量化不充分.

為了解決目前分組中存在的不足,設計了一種基于知識互補的學生分組模型,通過認知診斷對學生知識狀態(tài)進行量化之后,使用一種改進的均衡聚類算法對學生進行分組.對比實驗驗證了該算法能夠有效提升分組的知識互補與均衡.

1 認知狀態(tài)特征表示

互補均衡分組方法的執(zhí)行過程如圖1 所示.首先需要依據(jù)認知診斷模型,估計出學生的認知狀態(tài),量化學生的知識點掌握情況.然后使用改進后的均衡聚類算法,依據(jù)學生的認知狀態(tài)進行聚類,將認知相似的學生聚到相同的簇中.最后依據(jù)組內知識互補、組間知識均衡的分組目標,將聚簇中的學生分配到每個小組中,獲得最終的分組方案.

圖1 分組流程示意圖

認知狀態(tài)是學生知識水平和認知結構的量化體現(xiàn),應用于眾多教育數(shù)據(jù)挖掘領域.在廣泛使用的DINA、rRUM 等認知診斷模型中,認知狀態(tài)通常使用二分向量αi=[αi,1,αi,2,…,αi,t,…,αi,T]進行表示.其中,模型共包括T個知識點,αi表示第i個學生的認知狀態(tài),αi,t表示學生i對第t個知識點的掌握狀態(tài).αi,t=1,表示學生i掌握了第t個知識點,反之,αi,t=0,則表示學生i未掌握第t個知識點.表1 給出了兩個學生認知狀態(tài)示例,學生1 的認知狀態(tài)可以表示為α1=[ 1,0,1,1,0 ],學生2 的認知狀態(tài)可以表示為α2=[ 1,1,0,0,1] .

表1 學生認知狀態(tài)示例

通過認知診斷模型,可以精確地獲得學生的量化認知狀態(tài)特征,之后便可以基于學生的認知狀態(tài)進行協(xié)作學習分組,達到組內學生知識更為互補、組間總體知識更為均衡的效果,進而提升協(xié)作學習的效率.

2 互補均衡聚類分組模型

2.1 分組目標定義

知識互補是指學生之間通過相互學習,從對方身上學到自身未掌握知識的過程.顯然學生之間掌握的知識差異越大,能從對方身上學習到的知識越多,學生之間的知識互補程度越高,因此可以通過學生之間掌握的知識差異程度來衡量學生之間的知識互補程度.學生p和學生q之間的知識互補率d(p,q)可以定義為:

知識點總數(shù)為T,當學生p和學生q都掌握或都未掌握知識點t時此時學生p和學生q無法在知識點t上進行互補.而如果則表示學生p和學生q中有一名學生掌握了知識點t,另外一名學生可以通過知識互補學習到知識點t.顯然d(p,q)的值越大,表示學生p和學生q的知識互補程度越高.

對于包含多名學生的小組來說,小組的知識互補率u(gj)可以用兩兩學生的知識互補率均值表示:

其中:gj={gj,1,gj,2,…}表示小組j中包含的學生集合,zj表示第j組中學生的數(shù)量,表示兩兩學生組合的個數(shù).顯然,u(gj)的值越大,表示小組的整體知識互補程度越高,即兩兩學生相互學習的幫助越大.

對于包含多個分組的分組方案,分組方案的整體知識互補率U,可以用分組方案中所有小組(分組數(shù)量M)的知識互補率均值表示.

U越大,代表分組方案中,各小組的知識互補程度越高,越有助于小組成員間的相互學習.然而在進行分組時,除了要考慮組內的知識互補度,還要考慮組間的知識均衡度.組間知識水平差異過大,會造成不同小組成員成績分化嚴重.在小組間無法提供公平的競爭,從而打擊部分學生學習的積極性.理想情況下,小組在各個知識點上的平均掌握程度相等時,小組之間的知識水平最為均衡.

令st表示所有學生(學生數(shù)量N)在知識點t上掌握程度的均值.

令sj,t表示小組j中各學生在知識點t上掌握程度的均值.

其中:zj表示小組gj中的學生數(shù)量.顯然當所有小組在知識點t上掌握程度的均值sj,t等于知識點k的整體掌握矩陣st時,所有小組在知識點t上的知識水平最為均衡.因此對于所有小組(分組數(shù)量M)在知識點t上的均衡率可以表示為:

v(t)的值越接近1,所有小組在知識點t上的知識水平越均衡.同理擴展到其他知識點,則分組方案的整體知識均衡率可以表示為:

在進行分組時,既要考慮分組方案的整體知識互補率U,又要考慮分組方案的整體知識均衡率V,因此分組的目標函數(shù)可以定義為:

其中:w1為知識互補率的權重系數(shù),w2為知識均衡度的權重系數(shù).w1和w2的值可以依據(jù)場景需要進行設置.在分組時,需要最大化F的值來提高分組方案的整體知識互補度和整體知識均衡度.

2.2 分組方法

首先使用K?means 聚類算法,將認知狀態(tài)相似的學生分到同一簇中,然后將簇中的學生逐個分到各個小組中,從而達到組內成員知識互補的效果.但經典K?means 算法在進行聚類時,無法保證聚類后,每個聚簇中的樣本數(shù)量均衡,若簇中的學生數(shù)量大于小組數(shù)量,依據(jù)鴿巢原理可知,必然會造成同一個簇中的多個學生分到同一小組的情況,降低了小組成員的知識互補度.因此本文基于均衡聚類算法對學生進行聚類,該算法可以限定聚簇中樣本的數(shù)量,從而達到聚簇規(guī)模相近的目的.

使用K?means 算法進行聚類時,K值的選擇尤為重要.因為聚類后,要將聚簇中的學生逐一分配到各個分組中,為保證簇的大小盡量均衡,各個簇內的學生數(shù)量,應接近分組數(shù)量M.若各個簇內的學生數(shù)量相近(數(shù)量差值不超過1),則聚簇的數(shù)量K可以通過如下方式進行計算,

即聚簇數(shù)量K等于學生數(shù)量N除以分組數(shù)量M的整數(shù)部分.此時再進行均衡聚類時,便可以確保簇內的學生數(shù)量接近于分組數(shù)量M,且聚簇規(guī)模相近.

完成學生聚類后,下一步,需要將簇中的學生逐一分配到各個分組中.聚簇后,簇內的學生具有相似的認知狀態(tài),簇間的學生認知狀態(tài)存在較大差異,可以達到知識互補的效果.

傳統(tǒng)分配方案是將簇中的學生隨機分配到各個聚簇中,這種分配方案雖然能在一定程度上達到組內知識互補、組間知識均衡的效果.但是分配結果不夠穩(wěn)定,可能會造成組內成員互補性較差(將不同簇中認知狀態(tài)最相似的學生分到同一組中)或組間均衡度較差(將認知狀態(tài)較好或較差的學生分配到同一組中)的現(xiàn)象.

為了解決這一問題,在組員分配時,定義的組內知識互補率和組間知識均衡率作為分組依據(jù),分組時需確保目標函數(shù)最大化.具體分組過程如算法1 所示.

算法第1 步是初始化學生分組groups,記錄每個學生所屬的分組編號,長度為N.算法的第2 步用于記錄將聚簇中學生分配到各個分組后剩余的學生(聚簇中的學生數(shù)量可能大于分組數(shù)量).

算法的第3 步到第10 步,依據(jù)目標函數(shù),遍歷每個聚簇,將聚簇中的樣本分配到各個分組中,并記錄下尚未分組的學生.

算法的第11 步到第14 步是將未分配的學生分配到各個分組中.分組時除了要確保目標函數(shù)最大外,還需保證分組中的學生人數(shù)不能超過設定的最大值.

3 實驗分析

3.1 實驗數(shù)據(jù)

實驗從學生規(guī)模、小組規(guī)模和知識規(guī)模三個維度,構建了9 個仿真數(shù)據(jù)集,驗證算法在不同維度下的分組效果.其中學生規(guī)模表示參與分組的學生總數(shù),小組規(guī)模表示小組內成員的數(shù)量,知識規(guī)模表示認知狀態(tài)中包含的知識點數(shù)量.仿真數(shù)據(jù)集的相關配置如表2 所示.其中前3 個數(shù)據(jù)集用于考查學生規(guī)模對分組效果的影響,中間3 個用于考查小組規(guī)模對分組效果的影響,最后3 個用于考查知識規(guī)模對分組效果的影響.

表2 數(shù)據(jù)集配置

3.2 對比算法

在實驗中對比了本文提出的互補均衡分組方法(CBKM)、隨機分組方法(RAND)、K?means 兩階段分組方法(KM)和約束K?means兩階段分組方法(BKM),分析了4 種模型在組內知識互補率和組間知識均衡率兩項指標上的性能表現(xiàn).

為了確保實驗結果穩(wěn)定可靠,實驗中,每個算法在每個數(shù)據(jù)集上均進行了10 次隨機實驗,并用10 次隨機實驗的均值作為最終的實驗結果.

3.3 結果分析

實驗從3 個維度對分組效果進行分析.

學生規(guī)模維度.圖2 從學生規(guī)模維度給出了不同算法生成分組方案在組內知識互補率和組間知識均衡率兩項指標上的對比結果.圖2 顯示本文提出的知識互補均衡分組方法(CBKM),明顯優(yōu)于現(xiàn)有的分組方法,可以達到更高的組內知識互補和組間知識均衡的效果,有助于提升組內學生相互學習、互相幫助,組間相互競爭、共同提高的協(xié)作學習效果.

圖2 不同學生規(guī)模下互補率與均衡率對比

小組規(guī)模維度.對于小組規(guī)模維度,對比了小組成員為3 人、5 人、7 人情況下,不同算法生成的分組方案效果,如圖3 所示.無論在組內知識互補率和組間知識均衡率上,本文提出的知識互補均衡分組方法(CBKM)均取得了最佳效果.需要指出的是,從圖3 可以看出,隨著小組人數(shù)的增加,組內兩兩成員的平均知識互補率均值呈現(xiàn)下降趨勢,這是因為隨著小組成員的增加,在知識點總量不變的情況下,兩兩成員的知識差異性均值在減小,造成了平均互補率的下降.因此在實際分組過程中,并不是成員數(shù)越多,越有助于組內成員溝通和協(xié)作.

圖3 不同小組規(guī)模下互補率與均衡率對比

知識規(guī)模維度.知識規(guī)模維度越大,考慮的特征數(shù)量越多,人工分組的難度越大.因此在多特征場景下,常使用基于規(guī)則的自動化分組方法.實驗分別仿真模擬了10 個知識點、30 個知識點、50 個知識點三種知識規(guī)模,并考察了不同算法的分組效果.從圖4 中可以看出,無論知識規(guī)模是10 個、20 個還是30 個,本文提出的知識互補均衡分組方法均優(yōu)于其他方法,取得了最佳的平均互補率和知識均衡率.需要注意的是,隨著知識規(guī)模的增大,組內兩兩成員的平均知識互補率和組間知識均衡率呈現(xiàn)下降趨勢,這是因為隨著知識總量的增加,雖然互補的知識數(shù)量在增加,但是互補的知識點數(shù)占總知識點數(shù)的比例在減少,造成組內兩兩成員的平均互補率隨著知識規(guī)模的增加呈現(xiàn)下降趨勢,同理,小組各個知識點掌握的均值與總體均值的偏差也會增大,組間知識均衡率隨著知識規(guī)模的增加呈現(xiàn)下降趨勢.

圖4 不同知識規(guī)模下互補率與均衡率對比

4 結語

學生分組是協(xié)作學習的核心問題之一,學生分組主要面對兩方面挑戰(zhàn).其一是學生特征難以獲得,標注的方式繁瑣且難以標準化;其二是分組后小組人數(shù)和學習能力不易均衡.本文的主要貢獻是提出了一種基于認知狀態(tài)的互補均衡分組模型,使用認知診斷的相關技術獲取學生的認知特征,定義了學生分組的目標函數(shù),并提出了一種組內互補、組間均衡的分組方法.在實驗中對該模型和現(xiàn)有的三種分組方法進行對比,設置了多種數(shù)據(jù)集的配置,分別在不同的學生規(guī)模、不同的小組規(guī)模和不同的知識點規(guī)模下,驗證了該模型的有效性.

猜你喜歡
組內分組組間
用心說題 提高效率 培養(yǎng)能力
數(shù)據(jù)組間平均數(shù)、方差關系的探究
分組搭配
怎么分組
更 正
Geological characteristics, metallogenic regularities and the exploration of graphite deposits in China
China Geology(2018年3期)2018-01-13 03:07:16
分組
合作學習組內交流討論時間的遵循原則
合作學習“組內交流討論時間”注意問題
合作學習組內交流討論時間探究
正定县| 北流市| 榆林市| 拉萨市| 儋州市| 太仓市| 武鸣县| 怀集县| 土默特左旗| 江永县| 晴隆县| 平潭县| 敦煌市| 乐平市| 韶山市| 宜州市| 巴马| 静海县| 屏东市| 青神县| 华安县| 呼伦贝尔市| 石柱| 淮阳县| 沧源| 通城县| 巴彦县| 昌图县| 大竹县| 平凉市| 保靖县| 河东区| 崇义县| 黄冈市| 马龙县| 两当县| 子长县| 拉孜县| 彭州市| 永嘉县| 新宾|