国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于聚類算法的協(xié)作學(xué)習(xí)分組策略研究

2021-01-25 07:59:28聶志成蔣志輝
湖南科技學(xué)院學(xué)報 2020年5期
關(guān)鍵詞:協(xié)作分組聚類

聶志成 蔣志輝

(1.湖南科技學(xué)院 教學(xué)質(zhì)量管理處,湖南永州 425199;2.長沙師范學(xué)院 信息科學(xué)與工程學(xué)院,湖南長沙 410100)

隨著信息技術(shù)與教育的深度融合的持續(xù)推進與迅速發(fā)展,層出不窮的教育教學(xué)理論和技術(shù)被運用到教學(xué)過程的指導(dǎo)中來。建構(gòu)主義學(xué)習(xí)理論指出新的教學(xué)模式應(yīng)該以學(xué)生為中心,學(xué)生不能僅僅作為外部刺激的接受者和知識的灌輸對象,學(xué)生應(yīng)該有能力主動加工信息,成為知識意義的建構(gòu)者[1]。為了使學(xué)生的成為課堂的真正“主人”,教學(xué)者就需要改變傳統(tǒng)的講授式、灌輸式的教學(xué)方式。作為混合學(xué)習(xí)中被運用的最多的教學(xué)模式之一,協(xié)作學(xué)習(xí)越來越多地被廣泛地應(yīng)用到E-learning 和傳統(tǒng)課堂教學(xué)中。協(xié)作學(xué)習(xí)是以現(xiàn)代社會心理學(xué)、教育社會學(xué)、認(rèn)知心理學(xué)等為基礎(chǔ),以協(xié)調(diào)與調(diào)適教學(xué)中的人際關(guān)系為基點,以目標(biāo)設(shè)計為先導(dǎo),以師生、師師、生生合作為動力,以小組為基本活動方式,以團體成績?yōu)樵u價標(biāo)準(zhǔn),以標(biāo)準(zhǔn)參照評價為基本手段,旨在提高學(xué)習(xí)成績、改善班級氣氛、形成良好的心理品質(zhì)和社會技能,極富創(chuàng)意與實效的教學(xué)理論與策略體系[2]。作為一種教學(xué)理論和策略體系,學(xué)習(xí)者參與協(xié)作學(xué)習(xí)的學(xué)習(xí)成效已經(jīng)被眾多研究證明要超越于傳統(tǒng)的、個人的學(xué)習(xí)方式[3]。

在協(xié)作學(xué)習(xí)開展的過程中,教學(xué)者會給學(xué)習(xí)小組提出一個問題或者一項任務(wù)由學(xué)習(xí)小組依靠團隊的力量來完成。相較于傳統(tǒng)的個人學(xué)習(xí)模式,協(xié)作學(xué)習(xí)要求小組成員在學(xué)習(xí)中扮演不同的角色,在其交流、協(xié)作、對話中通過貢獻自己的“觀點”、陳述自己的思想、共同完成最終學(xué)習(xí)任務(wù)[4-5]。因此,對于協(xié)作學(xué)習(xí),小組成員之間的合作對于最后學(xué)習(xí)的成效將起著決定性的影響。為了提升小組成員之間的合作效率以及小組協(xié)作學(xué)習(xí)最終成效。國內(nèi)外眾多研究者展開了對于協(xié)作學(xué)習(xí)分組策略的實驗研究。相關(guān)研究成果對于改善E-learning 中協(xié)作學(xué)習(xí)的分組策略提供了非常重要的參考價值。但是現(xiàn)存有關(guān)協(xié)作學(xué)習(xí)分組策略的研究大多數(shù)是針對E-learning 開展的,網(wǎng)絡(luò)課程與課堂教學(xué)在收集學(xué)習(xí)者的數(shù)據(jù)時有所不同,前者可以利用網(wǎng)絡(luò)學(xué)習(xí)平臺收集學(xué)習(xí)者的“事實型”數(shù)據(jù),例如性別、年齡、興趣愛好等等,以及“行為型”數(shù)據(jù),例如學(xué)習(xí)日期、學(xué)習(xí)內(nèi)容、學(xué)習(xí)持續(xù)時間等等。而在課堂教學(xué)中,教師缺少相應(yīng)的條件來收集學(xué)習(xí)者的數(shù)據(jù)信息。因此,教師如何在協(xié)作學(xué)習(xí)理論和學(xué)習(xí)風(fēng)格理論雙重指導(dǎo)下,科學(xué)獲取并分析學(xué)習(xí)者的學(xué)習(xí)風(fēng)格數(shù)據(jù)便成為了問題解決的關(guān)鍵所在。本文針對上述問題從數(shù)據(jù)挖掘的視角出發(fā),根據(jù)Dunn 學(xué)習(xí)風(fēng)格理論設(shè)計學(xué)習(xí)者學(xué)習(xí)風(fēng)格調(diào)查問卷來收集所需數(shù)據(jù)[6],并應(yīng)用k-means 聚類算法和層次聚類算法相結(jié)合的方式對學(xué)習(xí)者學(xué)習(xí)風(fēng)格數(shù)據(jù)進行分析,最后得出學(xué)習(xí)者分類結(jié)果。為了驗證該分類策略的有效性,本文將H 師范大學(xué)教育技術(shù)學(xué)專業(yè)2016 級的46 名本科生作為研究對象來開展協(xié)作學(xué)習(xí)分組策略研究。

1 相關(guān)工作

1.1 協(xié)作學(xué)習(xí)分組

協(xié)作學(xué)習(xí)作為一種重要的教學(xué)策略,不僅對于改變課堂教學(xué)中的師生關(guān)系、生生關(guān)系有著十分重要的意義,更對提升學(xué)習(xí)績效有著積極影響。但是與此同時,每一個學(xué)生個體都有不一樣的學(xué)習(xí)風(fēng)格,將不同風(fēng)格的學(xué)習(xí)者組織在一起開展協(xié)作學(xué)習(xí)必定會產(chǎn)生不一樣的學(xué)習(xí)結(jié)果。因此,教學(xué)者在選擇開展協(xié)作學(xué)習(xí)時,需要對不同學(xué)習(xí)者的不同學(xué)習(xí)風(fēng)格展開分析與研究,選擇或設(shè)計合適的協(xié)作學(xué)習(xí)分組策略以保證最佳的學(xué)習(xí)效果。

作為協(xié)作學(xué)習(xí)教學(xué)模式開展的首要環(huán)節(jié),協(xié)作學(xué)習(xí)小組的分組策略近些年受到眾多研究者的重視。Yi-Chun Chan 等人提出一種由改善的k-NN 算法和GA 算法相結(jié)合的機制,來對學(xué)習(xí)者的學(xué)習(xí)風(fēng)格進行識別與分類[7]。唐杰等的研究在分析伙伴模型研究的基礎(chǔ)上,綜合學(xué)習(xí)者個性特征和 mCSCL中的學(xué)習(xí)的特殊性構(gòu)建了mCSCL 環(huán)境下協(xié)作分組的伙伴模型[8]。李浩君等提出了一種基于 KNN 的mCSCL 學(xué)習(xí)伙伴分組理論,為移動端在線學(xué)習(xí)者動態(tài)推薦最佳學(xué)習(xí)伙伴[9]。胡慧等提出基于學(xué)習(xí)能力、興趣愛好和理解水平的,基于改進蟻群算法的協(xié)作學(xué)習(xí)分組算法[10]。馬艷云等根據(jù)網(wǎng)絡(luò)協(xié)作學(xué)習(xí)者的個性化特征和協(xié)作特征在引入團隊協(xié)作學(xué)習(xí)量表解決學(xué)生協(xié)作能力判斷的前提下,提出基于學(xué)習(xí)者特征聚類和協(xié)作特征選擇的GSDBK-means 分組算法對學(xué)習(xí)者進行分組,以期達(dá)到提高網(wǎng)絡(luò)協(xié)作學(xué)習(xí)效果的目的[11]。

1.2 聚類分析

聚類分析簡稱聚類,是一個把數(shù)據(jù)對象劃分成子集的過程,而每個子集是一個簇,并且同一個簇中的對象彼此相似,但與其他簇中的對象不相似[12]。聚類分析已經(jīng)廣泛地應(yīng)用于許多領(lǐng)域:在商務(wù)智能應(yīng)用中,聚類可以用來把大量客戶分組,其中組內(nèi)的客戶具有非常類似的特征;在圖像識別應(yīng)用中,聚類可以在手寫字符識別系統(tǒng)中發(fā)現(xiàn)簇或“子類”;在Web 搜索應(yīng)用中,聚類可以將搜索結(jié)果分組,乃至把 Web 文檔聚類成一個文檔主題;在E-learning 應(yīng)用中,聚類通??梢杂脕硗诰蜻h(yuǎn)程學(xué)習(xí)者的群體特點,進而基于此為課程資源建設(shè)及教學(xué)過程的改進提供思考與幫助。

同時,聚類算法也有很多,通常很難通過一個簡潔的分類去區(qū)別其運用到方法與策略,這是因為這些類別在分析中可能開成重疊,進而在表述過程中的一種方法往往具有多類另的特征的涵蓋。一般而言,主要的基本聚類方法可以歸納為劃分方法、層次方法、基于密度的方法和基于網(wǎng)格的方法等四大類,其各自的特點如表1 所示。

表1 聚類方法一般特點描述

2 運用聚類算法分析學(xué)習(xí)者的學(xué)習(xí)風(fēng)格

在數(shù)據(jù)挖掘過程中,網(wǎng)絡(luò)課程與傳統(tǒng)課堂教學(xué)在收集學(xué)習(xí)者的學(xué)習(xí)風(fēng)格數(shù)據(jù)時有所不同,前者可以利用網(wǎng)絡(luò)學(xué)習(xí)平臺收集學(xué)習(xí)者的“事實型”數(shù)據(jù);后者由于傳統(tǒng)課堂教學(xué)實施過程受其環(huán)境的影響,常常很難借助網(wǎng)絡(luò)平臺來收集學(xué)習(xí)者的一些行為數(shù)據(jù)信息。為保證研究的所有本文采集調(diào)查問卷的方式收集學(xué)習(xí)者的數(shù)據(jù)信息,其好處有兩點:一是該方式簡單、便捷、效率高、可操作性強,二是該方式收集的數(shù)據(jù)比較完整,臟數(shù)據(jù)和噪聲數(shù)據(jù)很少,這為接下來的數(shù)據(jù)預(yù)處理打開了方便之門。而對于數(shù)據(jù)預(yù)處理過程,本文主要對收集到的原始數(shù)據(jù)進行數(shù)據(jù)變換。最后,本文利用k-means 聚類算法和基于層次的聚類算法分別對預(yù)處理后的數(shù)據(jù)進行聚類分析,這將為教學(xué)者提供精準(zhǔn)教學(xué)策略,制定學(xué)習(xí)者的個性化、差異化學(xué)習(xí)策略,尤其是為教學(xué)過程中實施小組合作學(xué)習(xí)進行分組(分層)策略提供了重要的參考依據(jù)與實踐借鑒。

2.1 數(shù)據(jù)收集

數(shù)據(jù)挖掘的成功與否,數(shù)據(jù)準(zhǔn)備情況起到了至關(guān)重要的作用與影響。數(shù)據(jù)準(zhǔn)備受多方面影響:一是所需處數(shù)據(jù)來源于不同數(shù)據(jù)源,如何確保不同數(shù)據(jù)源中數(shù)據(jù)的綜合性、質(zhì)量、時效性、及易用性,其處理方式可能就要牽涉到數(shù)據(jù)倉庫的相關(guān)技術(shù)與思想;另一方面就是受限于數(shù)據(jù)挖掘者對工具的使用及數(shù)據(jù)的分析經(jīng)驗。譬如如何從紛繁復(fù)雜的數(shù)據(jù)中厘清數(shù)據(jù)間的關(guān)系,并從這些關(guān)系中聚合、衍生出對研究有意義的指標(biāo)[12]。Dunn 學(xué)習(xí)風(fēng)格理論認(rèn)為學(xué)習(xí)風(fēng)格的形成受多層面多種因素的影響(具體如表 2 所示)。故而本研究設(shè)計的調(diào)查問卷共有30 個問題,其中每一個要素成分對應(yīng)一或兩個問題,并且每一個問題有 A、B、C 三個選項(如表3所示)。

表2 學(xué)習(xí)風(fēng)格構(gòu)成要素

表3 學(xué)習(xí)風(fēng)格調(diào)查問卷

本研究的調(diào)查對象是H 師范大學(xué)教育技術(shù)學(xué)專業(yè)2016 年級在校本科生,共發(fā)放46 份調(diào)查問卷,回收問卷43 份,回收率為93.5%,其中有效問卷43 份,有效率為100%。

2.2 數(shù)據(jù)預(yù)處理

低質(zhì)量的數(shù)據(jù)將導(dǎo)致低質(zhì)量的挖掘結(jié)果,而現(xiàn)實中數(shù)據(jù)極易受到噪聲、缺失值和不一致數(shù)據(jù)的侵?jǐn)_,因此數(shù)據(jù)預(yù)處理是數(shù)據(jù)挖掘必不可少的一個階段,其能提高數(shù)據(jù)質(zhì)量,從而提高挖掘的準(zhǔn)確率和效率。數(shù)據(jù)預(yù)處理主要有數(shù)據(jù)清理、數(shù)據(jù)集成、數(shù)據(jù)歸約和數(shù)據(jù)變換四個步驟。數(shù)據(jù)預(yù)處理的每個步驟都有各自不同任務(wù),本文結(jié)合了收集到的原始數(shù)據(jù)特點,對原始數(shù)據(jù)進行數(shù)據(jù)變換以及主成分分析。

(1)數(shù)據(jù)變換

表4 原始數(shù)據(jù)表

表5 數(shù)據(jù)變換后的數(shù)據(jù)表

從表 4 可知,每一個數(shù)據(jù)元組S 有30 個屬性,分別為 A1、A2、A3、……、A10、A29、A30,屬性 A取 值 的 集 合 為 {a,b,c} , 即 是 Si=(A1,A2,A3,……,A10,A29,A30),其中 i={1,2,3,4, ……,43}。換句話說,每一個調(diào)查問卷的問題A 有a、b、c 三個選項。由于聚類算法需要用到屬性 A 的值進行計算,但是a、b、c 為不是具體的值,無法滿足計算的要求,因此本文把集合{a,b,c}賦予具體的等差數(shù)列集合{1,2,3},最后把原始數(shù)據(jù)表中數(shù)據(jù)值a、b、c 一一對應(yīng)變換成1、2、3,具體如表5 所示。

(2)主成分分析

主成分分析(PCA)就是試圖在力保數(shù)據(jù)信息丟失最少的原則下,對這種多變量的數(shù)據(jù)表進行最佳綜合簡化,也就是說,對高維變量空間進行降維處理,其基本過程是:①為了消除不同變量在數(shù)量級和量綱上的差異,將原始數(shù)據(jù)進行標(biāo)準(zhǔn)化處理;②求標(biāo)準(zhǔn)化數(shù)據(jù)矩陣的相關(guān)矩陣;③求相關(guān)矩陣的特征值和特征向量;④根據(jù)特征值計算方差貢獻率與累計方差貢獻率,根據(jù)前幾個主成分累計方差貢獻率大于 80%的原則,確定主成分 C1、C2……Cm;⑤構(gòu)建綜合評價函數(shù);⑥根據(jù)綜合評價函數(shù)計算總得分,然后排序并評價。從圖1 可以看得,前10 個主成分的累積方差貢獻率所占的比重比較大,同時結(jié)合計算分析每個成分的特征值(如圖2 所示),發(fā)現(xiàn)前14 個成分累計方差貢獻率81%,因此原始數(shù)據(jù)可以進行維歸約為前 14 個主要成分,即 Si=(A1,A2,A3,……,

圖1 主成分分析碎石圖

A12,A13,A14)。這也進一步表明學(xué)習(xí)者得學(xué)習(xí)風(fēng)格主要受到環(huán)境、情感、社會這三個刺激層面的影響。

圖2 成分特征值

2.3 聚類結(jié)果分析

(1)用k-means聚類分析查看數(shù)據(jù)對象的區(qū)域分布

k 均值(k-means)聚類又稱為動態(tài)聚類,其計算的原理與方法都較為簡單。因為無需進行距離矩陣輸入。即首先根據(jù)分析進行聚類的分類個數(shù)(N)的指定,然后就可以隨機選擇N 個樣本作為初始中心,通過計算、分析各樣本與其類中心間的距離來進行歸類,將所有的樣本都按此方法進行計算分析歸類。最后再將此過程進行重復(fù),直到類中心不同發(fā)生變化,趨于相對穩(wěn)定。由此觀之,k-means 聚類一個關(guān)鍵點是是確定聚類的分類個數(shù)N。

圖3 樣本熱圖

圖4 k-means 聚類效果圖

在本研究中,我們首先從數(shù)據(jù)中提取 10 個變量的樣本數(shù)值,進行其歐氏距離矩陣的要相關(guān)計算,然后根據(jù)其計算機結(jié)果可以對其進行矩陣熱圖的繪制(如圖3 所示),從圖3 中可以看到顏色越深表示樣本間距離越近,大致上可以區(qū)分出四到五個區(qū)塊,即 N={4,5}。由于輪廓系數(shù)(silhouette coefficient)方法結(jié)合了凝聚度和分離度,因此可以以此來判斷聚類的優(yōu)良性,其值在-1 到+1 之間取值,值越大表示聚類效果越好。依據(jù)這個原理,本文用四個簇參量和五個簇參變量,反復(fù)計算在每個簇個數(shù)條件下的輪廓系數(shù),當(dāng)輪廓系數(shù)取最大時,其相應(yīng)的簇個數(shù)是最好的。

表6 學(xué)習(xí)風(fēng)格調(diào)查問卷

經(jīng)過輪廓系數(shù)的計算,如表 6 所示,本文取N=4,也就是說把數(shù)據(jù)集分為四個子簇,為了進一步顯示聚類的效果,結(jié)合研究過程中的多維標(biāo)度和聚類的結(jié)果,先將數(shù)據(jù)用 MDS 進行降維,然后采用不同的形狀對原本的分類進行標(biāo)注,對聚類的結(jié)果也用不同的顏色來予以區(qū)分顯示(如圖 4 所示)。從圖4 可知,聚類結(jié)果很清晰,但是也可發(fā)現(xiàn)在簇1、3、4 上的有交集,這充分表明交集上的點所代表的學(xué)習(xí)者學(xué)習(xí)風(fēng)格具有多變性,也進一步說明這部分學(xué)習(xí)者的學(xué)習(xí)風(fēng)格更容易受到各種內(nèi)外因素影響。

(2)使用層次聚類對數(shù)據(jù)對象進行分組

層次聚類可以將數(shù)據(jù)對象組成層次結(jié)構(gòu)或簇的“樹”使得數(shù)據(jù)對象的隱藏部分特征顯化,如數(shù)據(jù)對象是小簇(該簇中所有數(shù)據(jù)對象可以視為離群點)。本研究利用層次聚類對數(shù)據(jù)對象進行分組,這對為一些學(xué)習(xí)者制定個性化的學(xué)習(xí)策略,以及優(yōu)化教師的教學(xué)策略,特別是課堂教學(xué)中小組合作學(xué)習(xí)的分組策略,有著重要的指導(dǎo)性意義。在課堂中開展小組合作學(xué)習(xí)時,教師往往需要根據(jù)不同的學(xué)習(xí)任務(wù)采取同質(zhì)分組策略和異質(zhì)分組策略進行分組[13]。同質(zhì)分組是異質(zhì)分組的基礎(chǔ),而層次聚類能為同質(zhì)分組提供參考,故而在本文中,層次聚類把數(shù)據(jù)對象分成4 個簇,如圖5 所示,每個簇即是一個同質(zhì)的分組。但是,每個簇的大小不一致,所以我們又可以對大的簇(簇2、簇3、簇4)進行拆分小簇。質(zhì)言之,也就是可以將學(xué)習(xí)者較多的同質(zhì)學(xué)分組進行拆分。

圖5 層次聚類樹狀圖

Kolb 根據(jù)學(xué)習(xí)者對學(xué)習(xí)環(huán)節(jié)的偏愛程度認(rèn)為有四種主導(dǎo)的學(xué)習(xí)風(fēng)格類型,它們分別是:以抽象概括和主動實驗為主的聚合思維型,以具體經(jīng)驗和反思性觀察為主的發(fā)散思維型,以反思性觀察和抽象的概括為主的同化型和以主動的實驗和具體經(jīng)驗為主的順應(yīng)型[14]。因此,依據(jù)Kolb 學(xué)習(xí)風(fēng)格理論[14],上述的 k-means 聚類和層次聚類把學(xué)習(xí)風(fēng)格數(shù)據(jù)對象分成四個簇,即分成四種類型的學(xué)習(xí)風(fēng)格小組,是合理的、科學(xué)的。

小 結(jié)

學(xué)習(xí)者的學(xué)習(xí)風(fēng)格受眾多因素的影響,而且各因素對其影響程度也存在明顯迥異,從而到使在選擇學(xué)習(xí)風(fēng)格分析量表時,存在很大程度的主觀性和隨意性?;诖耍狙芯吭谙惹把芯康幕A(chǔ)之上,結(jié)合數(shù)據(jù)挖掘中的聚類分析來展開對學(xué)習(xí)者學(xué)習(xí)風(fēng)格的分析與探討,并確定了影響學(xué)習(xí)者學(xué)習(xí)風(fēng)格的主要刺激層面因素,也間接地解決了當(dāng)下課堂教學(xué)中開展小組合作(協(xié)作)學(xué)習(xí)的分組隨意性等客觀現(xiàn)實問題。這不僅是對具體教育情境的直面回應(yīng),更是展現(xiàn)大數(shù)據(jù)時代背景下信息技術(shù)與課堂教學(xué)有機融合的典型應(yīng)用。誠然,研究中還存在一些問題值得商榷,如數(shù)據(jù)來源單一、數(shù)據(jù)量較少以及聚類效率較低等研究問題,致使研究結(jié)果的普適性與成果推廣還需展開更深層次的思考。因此,在后續(xù)的研究中將會拓寬數(shù)據(jù)收集的渠道,并在數(shù)據(jù)分析手段上將采用高維度聚類算法提高聚類的質(zhì)量與水平。為實現(xiàn)更為有效地協(xié)作學(xué)習(xí)分組提供完善的數(shù)據(jù)支撐,進而為提升學(xué)習(xí)者協(xié)作學(xué)習(xí)體檢與感知奠定基礎(chǔ),滿足學(xué)習(xí)者和教師的個性化需求,為打造優(yōu)質(zhì)協(xié)作學(xué)習(xí)分組策略提供支持。

猜你喜歡
協(xié)作分組聚類
團結(jié)協(xié)作成功易
分組搭配
怎么分組
基于DBSACN聚類算法的XML文檔聚類
電子測試(2017年15期)2017-12-18 07:19:27
協(xié)作
讀者(2017年14期)2017-06-27 12:27:06
分組
協(xié)作
讀寫算(下)(2016年9期)2016-02-27 08:46:31
基于改進的遺傳算法的模糊聚類算法
可與您并肩協(xié)作的UR3
一種層次初始的聚類個數(shù)自適應(yīng)的聚類方法研究
平安县| 旌德县| 久治县| 九龙城区| 吉木萨尔县| 淮安市| 嘉义县| 金堂县| 尉氏县| 兰溪市| 错那县| 江西省| 玉屏| 广水市| 司法| 湘阴县| 江达县| 桃园县| 宁都县| 清远市| 波密县| 元氏县| 高青县| 含山县| 平潭县| 绥滨县| 东港市| 偏关县| 满城县| 江城| 老河口市| 临海市| 渭源县| 武穴市| 石景山区| 洛隆县| 五河县| 类乌齐县| 张家口市| 永春县| 枣庄市|