国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

我國(guó)教育數(shù)據(jù)挖掘研究熱點(diǎn)與趨勢(shì)分析*

2019-05-17 01:51聶文苗彭紹東
中小學(xué)電教 2019年4期
關(guān)鍵詞:數(shù)據(jù)挖掘聚類(lèi)算法

聶文苗 彭紹東

(湖南師范大學(xué) 教育科學(xué)學(xué)院,湖南 長(zhǎng)沙410081)

一、引言

中共“十九大”報(bào)告指出在發(fā)展的重要戰(zhàn)略機(jī)遇期必須深化教育改革,加快教育現(xiàn)代化,把建設(shè)教育強(qiáng)國(guó)作為中華民族偉大復(fù)興的基礎(chǔ)工程。為把握發(fā)展機(jī)遇,面對(duì)大數(shù)據(jù)對(duì)教育領(lǐng)域產(chǎn)生的重要影響,充分利用前沿引領(lǐng)技術(shù)來(lái)提取或挖掘教育數(shù)據(jù)的價(jià)值顯得尤為重要。2018年4月教育部印發(fā)了《教育信息化2.0 行動(dòng)計(jì)劃》,該計(jì)劃聚焦以能力為先的人才培養(yǎng)需求,提出實(shí)施數(shù)字資源服務(wù)普及、網(wǎng)絡(luò)學(xué)習(xí)空間覆蓋、教育治理能力優(yōu)化等重點(diǎn)開(kāi)展的八大行動(dòng)[1]。這些行動(dòng)實(shí)施過(guò)程的特征是以“數(shù)據(jù)”為*基礎(chǔ),這表明我們?cè)谕七M(jìn)信息技術(shù)與教育教學(xué)深度融合的條件下,需要利用數(shù)據(jù)挖掘技術(shù)發(fā)現(xiàn)教育產(chǎn)生的海量數(shù)據(jù)所隱藏的規(guī)律和深層聯(lián)系,從而使教育數(shù)據(jù)為各級(jí)各類(lèi)教育的發(fā)展提供支持服務(wù),真正實(shí)現(xiàn)教育數(shù)據(jù)挖掘的意義。

教育數(shù)據(jù)挖掘是順應(yīng)智能環(huán)境下教育發(fā)展的必然選擇,已成為眾多學(xué)者研究的重點(diǎn),但是整體上分析該領(lǐng)域研究現(xiàn)狀與熱點(diǎn)的文獻(xiàn)少而分散。本研究主要通過(guò)BICOMB2.0、Ucinet6.0、SPSS20.0 對(duì)檢索的相關(guān)文獻(xiàn)分別進(jìn)行時(shí)間分布分析、詞頻分析、共詞聚類(lèi)分析以及戰(zhàn)略坐標(biāo)分析,并結(jié)合文獻(xiàn)研讀展開(kāi)探討,從而把握我國(guó)教育數(shù)據(jù)挖掘領(lǐng)域的研究熱點(diǎn)及其發(fā)展趨勢(shì),旨在為同類(lèi)研究提供參考。

二、研究的對(duì)象、方法與過(guò)程

1.研究對(duì)象

本研究數(shù)據(jù)來(lái)源于中國(guó)學(xué)術(shù)期刊網(wǎng)絡(luò)出版總庫(kù)CNKI,以“主題”為檢索項(xiàng),“教育數(shù)據(jù)挖掘”“教育+數(shù)據(jù)挖掘”為檢索詞進(jìn)行高級(jí)檢索,檢索時(shí)間限定為2017年12月31日之前,并對(duì)初次檢索結(jié)果中會(huì)議通知、論文集、開(kāi)欄語(yǔ)以及無(wú)關(guān)的文獻(xiàn)進(jìn)行排除,最終選取624 篇有效樣本作為研究對(duì)象。本研究將這624 篇文獻(xiàn)的題錄信息以NoteFirst 格式導(dǎo)出并保存,以便利用相關(guān)研究工具進(jìn)行系統(tǒng)梳理和分析。

2.研究方法與研究工具

本研究主要使用文獻(xiàn)年代分布分析、詞頻分析、共詞聚類(lèi)分析和戰(zhàn)略坐標(biāo)分析法。文獻(xiàn)的時(shí)間分布情況能夠反映教育數(shù)據(jù)挖掘領(lǐng)域關(guān)注度的變化。詞頻分析法是對(duì)表現(xiàn)文獻(xiàn)主體的關(guān)鍵詞的頻次進(jìn)行統(tǒng)計(jì),利于快速掌握研究重點(diǎn)。共詞聚類(lèi)分析是利用聚類(lèi)算法統(tǒng)計(jì)共詞出現(xiàn)的頻率,把眾多分析對(duì)象之間復(fù)雜的共詞網(wǎng)狀關(guān)系簡(jiǎn)化為數(shù)目相對(duì)較少的若干類(lèi)群之間的關(guān)系,以進(jìn)一步探究主題詞之間的關(guān)聯(lián)[2]。戰(zhàn)略坐標(biāo)分析法是通過(guò)計(jì)算向心度和密度來(lái)探究聚類(lèi)后所形成各亞領(lǐng)域內(nèi)部以及彼此之間關(guān)系緊密程度的方法。

本研究使用的工具包括BICOMB2.0、Excel、SPSS20.0以及Ucinet6.0,使用目的是探尋科學(xué)文獻(xiàn)中的可視化模式和發(fā)展趨勢(shì),分析該研究領(lǐng)域演進(jìn)的關(guān)鍵路徑和潛在動(dòng)力機(jī)制。其中,書(shū)目共現(xiàn)分析系統(tǒng)(BICOMB)是在文本數(shù)據(jù)集中正規(guī)地抽取關(guān)鍵字段,發(fā)現(xiàn)潛在、有效、新穎的信息,并用可理解的視覺(jué)方式呈現(xiàn)的工具。其在本研究中主要步驟為:(1)新建項(xiàng)目來(lái)管理NoteFirst 格式類(lèi)型的主題數(shù)據(jù);(2)將一批待處理xml 格式文件解析,提取關(guān)鍵字段并修改(同義詞合并),調(diào)整顯示結(jié)果的順序;(3)根據(jù)g 指數(shù)原理設(shè)置高頻詞閾值,對(duì)提取字段內(nèi)容進(jìn)行詞頻統(tǒng)計(jì);(4)生成共現(xiàn)矩陣,利于后續(xù)SPSS20.0 進(jìn)行聚類(lèi)分析以得到戰(zhàn)略坐標(biāo)圖。

3.研究過(guò)程

具體研究過(guò)程如圖1所示。

圖1 研究過(guò)程圖

三、研究結(jié)果

1.文獻(xiàn)年代分布

對(duì)2002-2017年間國(guó)內(nèi)教育數(shù)據(jù)挖掘相關(guān)文獻(xiàn)進(jìn)行時(shí)間分布統(tǒng)計(jì),具體如圖2、3 所示。從中我們發(fā)現(xiàn),關(guān)于教育數(shù)據(jù)挖掘的研究數(shù)量整體呈上升趨勢(shì)。文獻(xiàn)數(shù)量變化曲線可以劃分為三個(gè)階段,2002-2004年期間,教育數(shù)據(jù)挖掘研究文獻(xiàn)相對(duì)較少;在2005-2012年期間,相關(guān)研究文獻(xiàn)逐步增加且個(gè)別年份小幅減少,所占比例達(dá)到24%;在2013-2017年期間,發(fā)表數(shù)量顯著增加,所占比例已達(dá)到74%,2017年文獻(xiàn)數(shù)量達(dá)到了178 篇的最高值,這受到了網(wǎng)絡(luò)教育逐漸普及,教學(xué)行為與教育要素?cái)?shù)據(jù)化的影響。由此說(shuō)明,國(guó)內(nèi)教育數(shù)據(jù)挖掘研究的關(guān)注度越來(lái)越高,各領(lǐng)域?qū)W者結(jié)合專(zhuān)業(yè)背景,挖掘教育數(shù)據(jù)潛在價(jià)值來(lái)解決實(shí)際問(wèn)題,研究成果逐漸豐富。

圖2 時(shí)間分布圖

圖3 雷達(dá)圖

2.詞頻統(tǒng)計(jì)

利用BICOMB2.0 對(duì)有效文獻(xiàn)中關(guān)鍵詞進(jìn)行詞頻統(tǒng)計(jì),然后刪除無(wú)關(guān)、同義詞合并整理,最后,結(jié)合詞頻g 指數(shù)計(jì)算公式[3]:M>=g2&N<(g+1),提取了37 個(gè)高頻關(guān)鍵詞,按照頻次降序排列的具體情況如表1所示。為了更直觀地進(jìn)行可視化表達(dá),而將重要關(guān)鍵詞渲染輸出為詞云,如圖4所示。由結(jié)果可見(jiàn),與教育數(shù)據(jù)挖掘聯(lián)系最為密切的詞分別是數(shù)據(jù)挖掘和大數(shù)據(jù),它們是該領(lǐng)域重要研究?jī)?nèi)容。

表1 高頻關(guān)鍵詞(前20)

圖4 高頻關(guān)鍵詞標(biāo)簽云

3.構(gòu)建共詞矩陣與相異矩陣

利用BICOMB2.0 進(jìn)行詞頻統(tǒng)計(jì)后,還可生成高頻詞共現(xiàn)矩陣以便進(jìn)一步研究?jī)?nèi)部關(guān)系特征,部分如表2所示。利用Ucinet6.0 對(duì)數(shù)據(jù)進(jìn)行可視化,可形成圖5所示的高頻關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)。從圖表中可以看出,出現(xiàn)在同一篇文獻(xiàn)次數(shù)較多的高頻詞組有“數(shù)據(jù)挖掘”—“關(guān)聯(lián)規(guī)則”“教育數(shù)據(jù)挖掘”—“學(xué)習(xí)分析”“數(shù)據(jù)挖掘”—“遠(yuǎn)程教育”等,表明這些個(gè)體之間存在較密切的關(guān)系。為深入挖掘隱性信息,將共現(xiàn)矩陣轉(zhuǎn)換為相似矩陣,結(jié)果如表3所示。其數(shù)值大小表明關(guān)鍵詞間的相異程度,值越大,相似度越小,距離越遠(yuǎn)[4]。兩個(gè)矩陣是我們后續(xù)進(jìn)行聚類(lèi)和戰(zhàn)略坐標(biāo)分析的重要基礎(chǔ)。

表2 共詞矩陣(部分)

表3 相異矩陣(部分)

圖5 高頻關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)

4.高頻關(guān)鍵詞聚類(lèi)樹(shù)狀圖與戰(zhàn)略坐標(biāo)圖

聚類(lèi)分析的目的是按照個(gè)體特征分類(lèi),使同類(lèi)別內(nèi)的個(gè)體之間具有較高的相似度,不同類(lèi)別之間具有較大的差異性。共詞聚類(lèi)分析是把復(fù)雜的共詞網(wǎng)狀關(guān)系簡(jiǎn)化為若干類(lèi)群之間的關(guān)系,便于有的放矢地進(jìn)行策略分析。為此,將相異矩陣導(dǎo)入SPSS,并進(jìn)行參數(shù)設(shè)置。包括聚類(lèi)方法是組間聯(lián)接,測(cè)量方法選擇平方歐式距離,使用Z 得分標(biāo)準(zhǔn)化轉(zhuǎn)換值,最終生成可以直觀表現(xiàn)聚類(lèi)過(guò)程的聚類(lèi)樹(shù)狀圖,如圖6所示。結(jié)合粘合力的計(jì)算(N(A i )=S/(n-1),n 為某類(lèi)團(tuán)內(nèi)主題詞數(shù)量,S 為與其它詞共現(xiàn)頻次之和)衡量聚類(lèi)后形成的類(lèi)團(tuán)內(nèi)各主題詞對(duì)所屬類(lèi)團(tuán)的貢獻(xiàn)程度,以中心詞為主確定類(lèi)團(tuán)的名稱(chēng)與性質(zhì)[5]。經(jīng)計(jì)算比較與分析后,將高頻關(guān)鍵詞聚合成的6 個(gè)類(lèi)團(tuán)的研究主題(A-F)分別總結(jié)為:數(shù)據(jù)挖掘與算法在教育數(shù)據(jù)挖掘中的應(yīng)用研究、大數(shù)據(jù)視域下學(xué)習(xí)分析的應(yīng)用與思考、面向智慧學(xué)習(xí)的教育數(shù)據(jù)挖掘作用研究、基于教育數(shù)據(jù)挖掘的遠(yuǎn)程教育發(fā)展探究、教育數(shù)據(jù)挖掘關(guān)鍵技術(shù)研究、基于學(xué)習(xí)活動(dòng)過(guò)程數(shù)據(jù)的學(xué)習(xí)預(yù)測(cè)與學(xué)業(yè)預(yù)警研究。

圖6 高頻關(guān)鍵詞聚類(lèi)樹(shù)狀圖

戰(zhàn)略坐標(biāo)圖是通過(guò)計(jì)算外(內(nèi))部連接平均數(shù)以及相應(yīng)總平均數(shù)得到各個(gè)類(lèi)團(tuán)研究主題向心度(密度)后繪制而成的,用于描述研究亞領(lǐng)域內(nèi)部聯(lián)系狀態(tài)和亞領(lǐng)域間的相互影響[6]。根據(jù)表4計(jì)算結(jié)果,以向心度為橫坐標(biāo),密度為縱坐標(biāo),把每一個(gè)研究熱點(diǎn)放置到坐標(biāo)的四象限中,如圖7所示。從核心/周邊地位、發(fā)展成熟/不成熟角度出發(fā),觀察并描述各主題的研究發(fā)展情況,有利于輔助我們進(jìn)行教育數(shù)據(jù)挖掘領(lǐng)域發(fā)展趨勢(shì)的探討。在A—F 表示的6 個(gè)研究熱點(diǎn)中,B、D 在第一象限,即學(xué)習(xí)分析應(yīng)用與遠(yuǎn)程教育發(fā)展是教育數(shù)據(jù)挖掘領(lǐng)域研究的重點(diǎn)內(nèi)容,發(fā)展較為成熟;A 在第二象限,且密度最高,說(shuō)明分類(lèi)的各主題詞聯(lián)系最緊密,表示數(shù)據(jù)挖掘算法在教育數(shù)據(jù)挖掘領(lǐng)域中已初步成熟,而向心度低表示目前的研究處于非核心狀態(tài);E、F 在第三象限,二者向心度、密度都最低,說(shuō)明這兩項(xiàng)研究主題內(nèi)部結(jié)構(gòu)松散且發(fā)展不成熟,處于研究的周邊地位;C 在第四象限且向心度最高,說(shuō)明該研究主題與其他主題間聯(lián)系廣泛,如教育數(shù)據(jù)挖掘、在線學(xué)習(xí)、機(jī)器學(xué)習(xí)與其他主題中關(guān)鍵詞共現(xiàn)次數(shù)高,表示其同樣是研究重點(diǎn)與核心,但研究有待于成熟。

表4 研究主題的向心度和密度

圖7 戰(zhàn)略坐標(biāo)圖

四、研究熱點(diǎn)分析

1.數(shù)據(jù)挖掘與算法在教育數(shù)據(jù)挖掘中的應(yīng)用研究

教育數(shù)據(jù)挖掘符合教育信息化建設(shè)的價(jià)值取向,主要應(yīng)用數(shù)據(jù)挖掘技術(shù)幫助揭示潛在的意義關(guān)系,科學(xué)解釋教育現(xiàn)象,發(fā)現(xiàn)相關(guān)教育動(dòng)態(tài)和規(guī)律。因此,教育數(shù)據(jù)挖掘領(lǐng)域伴隨數(shù)據(jù)挖掘技術(shù)(如數(shù)據(jù)挖掘算法)的進(jìn)化而逐步發(fā)展。從管理與評(píng)價(jià)的服務(wù)角度出發(fā),李橋等[7]提出應(yīng)用關(guān)聯(lián)規(guī)則與Apriori 算法在樣本分析中發(fā)現(xiàn)有價(jià)值的數(shù)據(jù)模式,為科學(xué)地評(píng)價(jià)教學(xué)活動(dòng)及教學(xué)改進(jìn)提供依據(jù)。還有運(yùn)用決策樹(shù)算法、聚類(lèi)算法設(shè)計(jì)信息系統(tǒng)、開(kāi)發(fā)教育決策支持系統(tǒng)[8],為高校發(fā)展規(guī)劃提供幫助,實(shí)現(xiàn)管理的智能化。除此之外,李彥奇[9]、王琴[10]等通過(guò)比較常見(jiàn)算法后選擇合適算法進(jìn)行優(yōu)化,建立模型應(yīng)用于就業(yè)系統(tǒng),實(shí)現(xiàn)對(duì)高校就業(yè)的指導(dǎo)。綜上,研究者主要探討了各種算法在教學(xué)管理、教學(xué)評(píng)價(jià)、就業(yè)、成績(jī)等方面的應(yīng)用以及如何互相結(jié)合使用提高算法效率,但如何在保證信度效度前提下能夠平行移植算法,使模型或系統(tǒng)應(yīng)用在更大的領(lǐng)域中。如何能夠挖掘出更有質(zhì)量、體現(xiàn)教育教學(xué)本質(zhì)的規(guī)則,目前這些研究有待于深入。

2.大數(shù)據(jù)視域下學(xué)習(xí)分析的應(yīng)用與思考

教育數(shù)據(jù)挖掘和學(xué)習(xí)分析這兩個(gè)研究領(lǐng)域聯(lián)系緊密且多有交叉,是目前促進(jìn)教與學(xué)的熱門(mén)領(lǐng)域。二者雖然起源、側(cè)重點(diǎn)具有差異性,但是具有很多共同的目標(biāo)和關(guān)注點(diǎn)。舒忠梅、徐曉東等對(duì)于跨領(lǐng)域研究有深度探討,如基于教育數(shù)據(jù)挖掘視角獲取影響大學(xué)生滿(mǎn)意度的因素,從學(xué)習(xí)分析視角探討意義再建構(gòu)[11],從學(xué)生個(gè)體和學(xué)校兩層面構(gòu)建學(xué)習(xí)成果評(píng)價(jià)模型[12]、采用相關(guān)分析和數(shù)據(jù)挖掘方法相結(jié)合識(shí)別以學(xué)生投入模型為基礎(chǔ)的相關(guān)因素,并對(duì)學(xué)生學(xué)習(xí)行為進(jìn)行分類(lèi)研究[13]。這些探討,充分發(fā)揮了教育數(shù)據(jù)挖掘方法建模與發(fā)現(xiàn)結(jié)構(gòu)的優(yōu)勢(shì),促進(jìn)了學(xué)習(xí)分析中的意義建構(gòu)。同時(shí)也利用學(xué)習(xí)分析收集學(xué)習(xí)痕跡促進(jìn)教育數(shù)據(jù)挖掘算法的發(fā)現(xiàn)演進(jìn)路徑與計(jì)算指標(biāo)。劉清堂等[14]界定了學(xué)習(xí)分析和教育數(shù)據(jù)挖掘的概念與區(qū)別,提出教育數(shù)據(jù)挖掘可以幫助解決學(xué)習(xí)分析中的數(shù)據(jù)不足等問(wèn)題,學(xué)習(xí)分析應(yīng)用策略等可為教育數(shù)據(jù)挖掘提供借鑒。因此,協(xié)同研究、跨領(lǐng)域合作對(duì)于彼此的發(fā)展大有裨益,關(guān)鍵是處理好人為與自動(dòng)的關(guān)系,做出合適的搭配與解釋論證。

3.面向智慧學(xué)習(xí)的教育數(shù)據(jù)挖掘作用研究

教育數(shù)據(jù)挖掘旨在通過(guò)對(duì)持續(xù)積累的數(shù)據(jù)資源進(jìn)行智能挖掘,發(fā)現(xiàn)教學(xué)活動(dòng)過(guò)程中各變量的價(jià)值關(guān)系,重點(diǎn)解決“為什么”“是什么”的問(wèn)題,然后作為促進(jìn)教育結(jié)構(gòu)性變革的重要實(shí)踐途徑,為“如何用”探討方向。文益民等提出在人才培養(yǎng)方案設(shè)計(jì)、招生、在校學(xué)習(xí)與生活、學(xué)生就業(yè)以及校友跟蹤調(diào)查五個(gè)階段實(shí)施數(shù)據(jù)挖掘[15],推動(dòng)應(yīng)用模式的改革,創(chuàng)新高校人才培養(yǎng)機(jī)制。呂海燕等針對(duì)教育數(shù)據(jù)挖掘的作用,以學(xué)生在線學(xué)習(xí)行為分析為例,形成教育數(shù)據(jù)挖掘模式的構(gòu)成要素及流程[16],強(qiáng)調(diào)了調(diào)整優(yōu)化教學(xué)策略與完善課程內(nèi)容的重要性。此外,研究者需要深入探討在數(shù)據(jù)機(jī)制中,如何利用機(jī)器學(xué)習(xí)使供給方式適應(yīng)智慧學(xué)習(xí)的需要,以滿(mǎn)足教與學(xué)利益相關(guān)者需求。這些研究將參與教育供給側(cè)改革,助力教育服務(wù)供給模式升級(jí)。

4.基于教育數(shù)據(jù)挖掘的遠(yuǎn)程教育發(fā)展探究

教育數(shù)據(jù)挖掘中,提取可用信息、構(gòu)建學(xué)習(xí)者模型等是促進(jìn)遠(yuǎn)程教育研究關(guān)鍵問(wèn)題解決的助推器。其中,個(gè)性化學(xué)習(xí)支持服務(wù)與教學(xué)交互是遠(yuǎn)程教育的核心內(nèi)容之一,也是研究者關(guān)注的熱點(diǎn)。姜強(qiáng)等強(qiáng)調(diào)了個(gè)性化自適應(yīng)學(xué)習(xí)成為大數(shù)據(jù)時(shí)代數(shù)字化學(xué)習(xí)新常態(tài)的必要性,并提煉了個(gè)性化自適應(yīng)學(xué)習(xí)的元認(rèn)知與開(kāi)放學(xué)習(xí)者模型、自主學(xué)習(xí)方式、信息可視化處理等內(nèi)容[17],為解決網(wǎng)絡(luò)個(gè)性化學(xué)習(xí)問(wèn)題、提高學(xué)習(xí)者學(xué)習(xí)效果、改善學(xué)習(xí)體驗(yàn)提供了應(yīng)用參考。馮桂爾[18]側(cè)重于從數(shù)據(jù)挖掘在遠(yuǎn)程教育中的作用出發(fā),運(yùn)用關(guān)聯(lián)規(guī)則、聚類(lèi)分析等方法處理在線課程數(shù)據(jù),尊重個(gè)體差異,反饋結(jié)果以?xún)?yōu)化教學(xué)。張婷[19]基于現(xiàn)代遠(yuǎn)程教育發(fā)展與個(gè)性化學(xué)習(xí)理論,運(yùn)用數(shù)據(jù)挖掘技術(shù)挖掘?qū)W習(xí)者相關(guān)信息,設(shè)計(jì)出以學(xué)習(xí)者模型為核心的個(gè)性化學(xué)習(xí)系統(tǒng),進(jìn)而為后續(xù)的智能應(yīng)用及動(dòng)態(tài)更新研究提供借鑒意義。因此,教育數(shù)據(jù)挖掘拓寬了遠(yuǎn)程教育發(fā)展的實(shí)現(xiàn)路徑,對(duì)于支持個(gè)性化服務(wù)、輔助學(xué)習(xí)者資源取舍、學(xué)習(xí)診斷與反饋等方面有較大的促進(jìn)作用。

5.教育數(shù)據(jù)挖掘關(guān)鍵技術(shù)研究

在“互聯(lián)網(wǎng)+教育”的背景下,教育數(shù)據(jù)挖掘技術(shù)是一種手段,能夠?qū)①Y源匯聚并流動(dòng)傳播。它更是一種創(chuàng)造力,體現(xiàn)在適應(yīng)各種教育場(chǎng)景的變化,動(dòng)態(tài)挖掘隱藏的知識(shí)信息,形成新的認(rèn)識(shí)與研究。教育數(shù)據(jù)挖掘技術(shù)其實(shí)是在教育領(lǐng)域中采用的數(shù)據(jù)挖掘技術(shù)。馮桂爾[20]對(duì)于在線課程學(xué)習(xí)的大量數(shù)據(jù),運(yùn)用各種數(shù)據(jù)挖掘技術(shù)進(jìn)行挖掘,如從路徑分析訪問(wèn)次數(shù)、聚類(lèi)分析共同特征、關(guān)聯(lián)規(guī)則統(tǒng)計(jì)興趣比率、序列模式預(yù)測(cè)學(xué)習(xí)行為,使改善后的在線平臺(tái)訪問(wèn)與交流頻次增多、滿(mǎn)意度與成績(jī)有了提高。彭亞等[21]將教育數(shù)據(jù)挖掘技術(shù)方法的分布進(jìn)行了梳理,結(jié)果顯示常用的技術(shù)分別為預(yù)測(cè)、關(guān)系挖掘、聚類(lèi)、統(tǒng)計(jì)分析與可視化,其它應(yīng)用較少的是協(xié)同過(guò)濾,研究的重點(diǎn)是隨著數(shù)據(jù)更豐富,技術(shù)的復(fù)雜度更高,需要注意挖掘任務(wù)目標(biāo)與挖掘技術(shù)的適應(yīng)性,避免走彎路。研究者更多傾向于數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)教育、平臺(tái)架構(gòu)、學(xué)習(xí)行為分析等方面的應(yīng)用,而技術(shù)的標(biāo)準(zhǔn)化與易用性的研究還不成熟,當(dāng)前的數(shù)據(jù)“孤島”與技術(shù)“鴻溝”問(wèn)題依然有待解決。

6.基于學(xué)習(xí)活動(dòng)過(guò)程數(shù)據(jù)的學(xué)習(xí)預(yù)測(cè)與學(xué)業(yè)預(yù)警研究

在教與學(xué)的動(dòng)態(tài)交互過(guò)程中,各種類(lèi)型數(shù)據(jù)出現(xiàn),如學(xué)習(xí)參與度數(shù)據(jù)、課程表現(xiàn)數(shù)據(jù)等,這些可作為教育數(shù)據(jù)挖掘的輸入,然后被事先制定的規(guī)則程序自動(dòng)分析進(jìn)而得到輸出結(jié)果,最后將結(jié)果結(jié)合教育教學(xué)的熱點(diǎn)問(wèn)題進(jìn)行分析與應(yīng)用。學(xué)習(xí)成績(jī)預(yù)測(cè)與學(xué)業(yè)預(yù)警研究作為不斷深化教學(xué)實(shí)踐探索的重要抓手,與教育數(shù)據(jù)挖掘中的學(xué)習(xí)活動(dòng)過(guò)程數(shù)據(jù)聯(lián)系緊密。陳益均等[22]基于數(shù)據(jù)挖掘中的聚類(lèi)算法對(duì)不同網(wǎng)絡(luò)行為群體的成績(jī)特征進(jìn)行分析,從而探討學(xué)生成績(jī)影響模型,制定有效策略。陳子健等[23]采用數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)方法,通過(guò)相關(guān)系數(shù)和信息增益率共同確定成績(jī)影響因素,構(gòu)建分類(lèi)預(yù)測(cè)模型并評(píng)估性能,推進(jìn)在線學(xué)習(xí)學(xué)業(yè)預(yù)警及學(xué)習(xí)預(yù)測(cè)實(shí)踐。大多數(shù)研究的一般流程,是運(yùn)用數(shù)據(jù)挖掘技術(shù)對(duì)各種學(xué)習(xí)記錄與行為信息進(jìn)行提取、分析,構(gòu)建學(xué)習(xí)者模型,從而判定學(xué)習(xí)者行為屬性,并預(yù)測(cè)其學(xué)習(xí)表現(xiàn),對(duì)具有警告的行為提供指向性?xún)?nèi)容和針對(duì)性干預(yù),以達(dá)到教育教學(xué)的精準(zhǔn)支持,規(guī)避風(fēng)險(xiǎn),促進(jìn)學(xué)生全面發(fā)展。

五、研究趨勢(shì)討論

1.決策支持系統(tǒng)、自適應(yīng)學(xué)習(xí)系統(tǒng)的設(shè)計(jì)與應(yīng)用

教育數(shù)據(jù)挖掘的算法、方法與技術(shù)對(duì)決策支持系統(tǒng)、自適應(yīng)學(xué)習(xí)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)起著重要的作用,未來(lái)將促進(jìn)各種服務(wù)系統(tǒng)的研制與應(yīng)用。決策支持系統(tǒng)包括數(shù)據(jù)倉(cāng)庫(kù)、知識(shí)庫(kù)、方法庫(kù)以及人機(jī)接口五個(gè)重要組成部分,技術(shù)改進(jìn)將有利于發(fā)揮各部分協(xié)同效應(yīng),完善系統(tǒng)功能,為學(xué)校管理與決策提供強(qiáng)有力的支撐。自適應(yīng)學(xué)習(xí)系統(tǒng)是支持個(gè)性化學(xué)習(xí)、實(shí)現(xiàn)差異化教學(xué)的有效途徑,它能夠?qū)Χ嗑S數(shù)據(jù)進(jìn)行轉(zhuǎn)化分析,從社會(huì)性、情感性和元認(rèn)知等方面建立模型,以使學(xué)習(xí)者掌握自己的學(xué)習(xí)狀態(tài),主動(dòng)投入深度學(xué)習(xí)。但是目前記錄、跟蹤、分析、預(yù)測(cè)、評(píng)估等階段的自適應(yīng)調(diào)節(jié)還不精準(zhǔn),離目標(biāo)還有距離,還需要研究者開(kāi)展深入探討。此外,這些系統(tǒng)的設(shè)計(jì)與應(yīng)用需應(yīng)用更多教育理論,旨在為內(nèi)容配置、學(xué)習(xí)行為評(píng)估等方面提供指導(dǎo),共同促進(jìn)教育數(shù)據(jù)挖掘意義的實(shí)現(xiàn),避免實(shí)踐脫離教育需求的尷尬局面。

2.安全標(biāo)準(zhǔn)、法規(guī)的制定與隱私保護(hù)算法的創(chuàng)新應(yīng)用

隨著虛擬現(xiàn)實(shí)、人工智能技術(shù)的發(fā)展,教育數(shù)據(jù)挖掘創(chuàng)新應(yīng)用面臨著機(jī)遇與挑戰(zhàn)。縱觀研究熱點(diǎn)中各類(lèi)應(yīng)用實(shí)踐,可知教育數(shù)據(jù)挖掘發(fā)展的著力點(diǎn)越來(lái)越豐富,但伴隨著多類(lèi)型大規(guī)模的數(shù)據(jù)共享,其安全與隱私問(wèn)題越發(fā)凸顯。如何在保障師生隱私的前提下進(jìn)行數(shù)據(jù)的采集與分析,已成為當(dāng)前及今后所面臨的挑戰(zhàn)之一。未來(lái)研究中,對(duì)于該問(wèn)題解決主要有兩大切入點(diǎn):一是制度保證,即制定相關(guān)安全標(biāo)準(zhǔn)和特定的非營(yíng)利性規(guī)則,加強(qiáng)對(duì)運(yùn)營(yíng)產(chǎn)業(yè)的監(jiān)管,以此來(lái)規(guī)范教育機(jī)構(gòu)或企業(yè)獲取教育大數(shù)據(jù)的行為,嚴(yán)格保密所持有數(shù)據(jù)資源,保證師生等資源提供方的合法權(quán)益;二是教育數(shù)據(jù)挖掘隱私保護(hù)算法,如k 匿名算法、關(guān)聯(lián)規(guī)則隱藏算法等,可在一定程度上防止隱私泄露,但是需要平衡數(shù)據(jù)挖掘的準(zhǔn)確性與隱私保護(hù)強(qiáng)度。因而,數(shù)據(jù)挖掘隱私保護(hù)算法的組合創(chuàng)新及精細(xì)化應(yīng)用將是未來(lái)重要發(fā)展方向。

六、總結(jié)

基于教育數(shù)據(jù)挖掘領(lǐng)域的文獻(xiàn)進(jìn)行了年代分布分析、詞頻分析、共詞聚類(lèi)分析和戰(zhàn)略坐標(biāo)分析,根據(jù)以上分析得到的研究結(jié)果確定了六大研究熱點(diǎn),并重點(diǎn)闡述了眾多研究者的核心思想以及各主題所處研究狀態(tài)、存在的問(wèn)題。最后結(jié)合文獻(xiàn)研讀,指出決策支持系統(tǒng)與自適應(yīng)學(xué)習(xí)系統(tǒng)的設(shè)計(jì)及應(yīng)用、制度保證與隱私保護(hù)算法的創(chuàng)新應(yīng)用等是未來(lái)研究的重要發(fā)展動(dòng)向。這些都表明在教育行為和教育要素?cái)?shù)據(jù)化的時(shí)代,教育數(shù)據(jù)挖掘以其顯著特征促進(jìn)“聯(lián)接”與“智能”落地,同時(shí)為各級(jí)各類(lèi)學(xué)校的教學(xué)改革帶來(lái)了新的機(jī)遇。

猜你喜歡
數(shù)據(jù)挖掘聚類(lèi)算法
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
數(shù)據(jù)挖掘技術(shù)在打擊倒賣(mài)OBU逃費(fèi)中的應(yīng)用淺析
基于K-means聚類(lèi)的車(chē)-地?zé)o線通信場(chǎng)強(qiáng)研究
Travellng thg World Full—time for Rree
進(jìn)位加法的兩種算法
基于高斯混合聚類(lèi)的陣列干涉SAR三維成像
一種改進(jìn)的整周模糊度去相關(guān)算法
基于Spark平臺(tái)的K-means聚類(lèi)算法改進(jìn)及并行化實(shí)現(xiàn)
一種基于L-M算法的RANSAC圖像拼接算法
高級(jí)數(shù)據(jù)挖掘與應(yīng)用國(guó)際學(xué)術(shù)會(huì)議