馮秀強(qiáng)
摘 ? 要:信息化、智能化信息處理技術(shù)的興起,特別是數(shù)據(jù)挖掘技術(shù)的應(yīng)用,為個(gè)性化學(xué)習(xí)的發(fā)展開辟了新的方向。文章借助CiteSpace V軟件,對(duì)個(gè)性化學(xué)習(xí)中數(shù)據(jù)挖掘技術(shù)的已有研究進(jìn)行可視化分析,發(fā)現(xiàn)相關(guān)文獻(xiàn)中技術(shù)方法研究較多,能充分發(fā)揮技術(shù)優(yōu)勢,但研究成果數(shù)量較少、研究力量分散、技術(shù)應(yīng)用范圍狹窄且風(fēng)險(xiǎn)意識(shí)淡薄。為促進(jìn)該領(lǐng)域的研究,應(yīng)加強(qiáng)溝通交流,促進(jìn)合作研究;拓展研究視野,轉(zhuǎn)換研究視角;增強(qiáng)安全意識(shí),防范潛在風(fēng)險(xiǎn)。
關(guān)鍵詞:個(gè)性化學(xué)習(xí);數(shù)據(jù)挖掘;可視化分析
中圖分類號(hào):G40-057 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1673-8454(2019)21-0019-7
關(guān)于個(gè)性化學(xué)習(xí)的討論由來已久。早在兩千五百年前,孔子就提出因材施教的教育思想,關(guān)注不同學(xué)生的個(gè)性區(qū)別及能力差異,實(shí)施不同的教學(xué)內(nèi)容和教學(xué)方法。個(gè)性化學(xué)習(xí)的實(shí)現(xiàn)要能夠了解學(xué)習(xí)者的不同需求,為學(xué)習(xí)者提供針對(duì)性的學(xué)習(xí)支持。然而,無論是精英教育向大眾教育的過渡,還是班級(jí)授課制的廣泛應(yīng)用,都在一定程度上限制了教育的個(gè)性化,使得學(xué)習(xí)者的個(gè)性特點(diǎn)、經(jīng)驗(yàn)背景以及需求偏好等信息難以準(zhǔn)確把握。信息化、智能化信息處理技術(shù)的興起,特別是數(shù)據(jù)挖掘技術(shù)的應(yīng)用,為個(gè)性化學(xué)習(xí)的發(fā)展開辟了新的方向。數(shù)據(jù)挖掘技術(shù)能在大量不完全或模糊的數(shù)據(jù)中提取潛在的有用信息或知識(shí)[1]。本文借助CiteSpace V軟件,對(duì)個(gè)性化學(xué)習(xí)中數(shù)據(jù)挖掘技術(shù)的已有研究進(jìn)行可視化分析,從而展示和分析個(gè)性化學(xué)習(xí)中數(shù)據(jù)挖掘技術(shù)應(yīng)用的研究現(xiàn)狀、熱點(diǎn)問題以及發(fā)展趨勢。
一、研究方法
1.研究工具
CiteSpace是需要在Java環(huán)境下運(yùn)行的一款信息可視化軟件,它的開發(fā)和使用以共引分析理論和尋徑網(wǎng)絡(luò)算法為主要基礎(chǔ)。該軟件能夠?qū)δ愁I(lǐng)域的樣本文獻(xiàn)進(jìn)行計(jì)算,分析該學(xué)科研究內(nèi)容演化的主要路徑和知識(shí)的轉(zhuǎn)換節(jié)點(diǎn),并且通過分析所生成的可視化圖譜可以發(fā)現(xiàn)該學(xué)科演化的內(nèi)在動(dòng)力及其發(fā)展的前沿內(nèi)容[2]。本研究利用CiteSpace V.5.3.R4繪制可視化知識(shí)圖譜。將檢索到的樣本研究文獻(xiàn)的題錄以“Refworks”的格式導(dǎo)出,并按該軟件的格式要求命名為“download_data mining.txt”。因?yàn)镃iteSpace讀取數(shù)據(jù)的標(biāo)準(zhǔn)是Web of Science數(shù)據(jù)庫所對(duì)應(yīng)的數(shù)據(jù)格式,所以在處理數(shù)據(jù)之前使用CiteSpace的內(nèi)置轉(zhuǎn)換工具對(duì)導(dǎo)出的文獻(xiàn)題錄數(shù)據(jù)進(jìn)行格式轉(zhuǎn)換。
2.數(shù)據(jù)來源
本文以CNKI(中國期刊全文數(shù)據(jù)庫)為樣本來源,以“個(gè)性化學(xué)習(xí)”和“數(shù)據(jù)挖掘”為“主題”,以“精確”為匹配模式,對(duì)截至2019年6月28日的文獻(xiàn)進(jìn)行檢索。共搜索到文獻(xiàn)316篇,篩選并剔除無效文獻(xiàn)4篇,共得到有效文獻(xiàn)312篇。其中包括183篇期刊論文、117篇碩士論文、7篇博士論文和5篇會(huì)議論文。
二、可視化分析
1.載文量分析
通過文獻(xiàn)檢索發(fā)現(xiàn),若單獨(dú)以“個(gè)性化學(xué)習(xí)”或“數(shù)據(jù)挖掘”為主題進(jìn)行檢索,可分別得到6150篇、80643篇文獻(xiàn),發(fā)文量均較多。而將兩個(gè)主題詞組合搜索,則得到如圖1所示的發(fā)文量時(shí)間分布圖。由圖可見,首篇文章發(fā)表于2001年,隨后有所增長。進(jìn)入21世紀(jì)以后,數(shù)據(jù)挖掘技術(shù)的研究相對(duì)成熟,并逐漸應(yīng)用于教育領(lǐng)域,為個(gè)性化學(xué)習(xí)的發(fā)展提供了新的方向。經(jīng)過幾年相對(duì)穩(wěn)定的發(fā)展之后,2016年的發(fā)文量達(dá)到峰值47篇。其原因可能與2015年8月31日國務(wù)院發(fā)布的《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》有關(guān)。數(shù)據(jù)挖掘是大數(shù)據(jù)技術(shù)的重要組成部分,二者具有密切的聯(lián)系。大數(shù)據(jù)的發(fā)展也為個(gè)性化學(xué)習(xí)注入了新的活力。通過搜索發(fā)現(xiàn),僅2016年以來,以“個(gè)性化學(xué)習(xí)”和“大數(shù)據(jù)”為主題的文獻(xiàn)就有363篇。隨著個(gè)性化學(xué)習(xí)中以大數(shù)據(jù)為主題研究的迅速增長,數(shù)據(jù)挖掘逐漸內(nèi)含于大數(shù)據(jù)之中并被取代,進(jìn)而導(dǎo)致以個(gè)性化學(xué)習(xí)和數(shù)據(jù)挖掘?yàn)橹黝}的相關(guān)文獻(xiàn)數(shù)量減少,甚至2019年上半年僅有三篇文獻(xiàn)發(fā)表。
從發(fā)文情況來看,關(guān)于個(gè)性化學(xué)習(xí)中數(shù)據(jù)挖掘技術(shù)的研究相對(duì)薄弱。由于個(gè)性化學(xué)習(xí)和數(shù)據(jù)挖掘分別屬于兩個(gè)截然不同的學(xué)科門類,關(guān)于二者相結(jié)合的研究,可能存在一定的困難。從載文期刊的學(xué)科分布(如圖2所示)也可以看出,關(guān)于個(gè)性化學(xué)習(xí)中數(shù)據(jù)挖掘的研究,有47%的文獻(xiàn)發(fā)表于計(jì)算機(jī)學(xué)科類別中,43%的文獻(xiàn)發(fā)表于教育學(xué)科類別中,其他學(xué)科類別中的文獻(xiàn)僅占10%。計(jì)算機(jī)學(xué)科和教育學(xué)科期刊是相關(guān)文獻(xiàn)發(fā)表的主要載體,均占有近乎一半的比重。數(shù)據(jù)挖掘和個(gè)性化學(xué)習(xí)分別與計(jì)算機(jī)和教育類別相對(duì)應(yīng),二者相互滲透,在研究中各有側(cè)重。此外,在檢索得到的183篇期刊文獻(xiàn)中,核心期刊共有49篇。其中教育學(xué)科期刊35篇,計(jì)算機(jī)學(xué)科期刊8篇,其他類別期刊6篇。雖然教育學(xué)科期刊發(fā)文總量(43%)不如計(jì)算機(jī)學(xué)科(47%),但文獻(xiàn)質(zhì)量相對(duì)較高,約占核心期刊和CSSCI總量的71%,具有更高的參考價(jià)值。
2.研究作者及機(jī)構(gòu)
對(duì)作者或機(jī)構(gòu)的合作網(wǎng)絡(luò)分析,可以了解研究者或機(jī)構(gòu)之間的合作關(guān)系以及影響力比較突出的研究者或團(tuán)隊(duì)。在CiteSpace中導(dǎo)入轉(zhuǎn)換格式后的文獻(xiàn)數(shù)據(jù),根據(jù)已有文獻(xiàn)發(fā)表時(shí)間選擇時(shí)間區(qū)間為2001-2019年,在“Node Types”面板中分別選擇“Author”和“Institution”,分別生成作者和機(jī)構(gòu)合作網(wǎng)絡(luò)圖譜(如圖3、圖4所示)。其中,節(jié)點(diǎn)大小反映的是作者或機(jī)構(gòu)發(fā)文數(shù)量,作者或機(jī)構(gòu)之間的連線反映的是其合作關(guān)系。
通過圖譜可以看出,作者和機(jī)構(gòu)合作較少,研究力量均相對(duì)分散,并沒有形成一定規(guī)模的合作群體,且發(fā)文量較少。在作者合作網(wǎng)絡(luò)中,兩人及以上的合作團(tuán)體只有七個(gè),并且合作次數(shù)最多的也只有兩次。此外,多數(shù)合作團(tuán)體中的成員來自同一院校,如余明華、馮翔、祝智庭均來自華東師范大學(xué),徐鵬、王以寧、張海均來自東北師范大學(xué)。研究者之間不僅合作較少,更缺少學(xué)校之間的合作。同時(shí),在機(jī)構(gòu)合作網(wǎng)絡(luò)中出現(xiàn)的合作關(guān)系也基本存在于校內(nèi)不同部門之間,缺乏校際合作,如華東師范大學(xué)教育信息技術(shù)學(xué)系、華東師范大學(xué)開放教育學(xué)院、華東師范大學(xué)上海數(shù)字化教育裝備工程技術(shù)研究中心之間的合作。進(jìn)一步分析發(fā)現(xiàn),在該領(lǐng)域發(fā)文量超過兩篇的研究者只有何克抗和余延冬兩人,其中何克抗是以獨(dú)立作者發(fā)表文章,其研究領(lǐng)域主要為教育技術(shù)理論與應(yīng)用,文章涉及促進(jìn)個(gè)性化學(xué)習(xí)的理論和關(guān)鍵技術(shù)方法的系統(tǒng)介紹。而余延冬有兩篇文章是在與趙蔚和張賽男合作下完成的,其研究致力于解決在線學(xué)習(xí)中個(gè)性化系統(tǒng)存在的問題和挑戰(zhàn),主要涉及Web數(shù)據(jù)挖掘技術(shù)的應(yīng)用。雖然所得圖譜并沒有顯示出明顯的合作關(guān)系和影響力較大的研究者,但是以上兩人的研究內(nèi)容也反映了該領(lǐng)域研究的主要內(nèi)容。而反觀四人的學(xué)科背景均同時(shí)包含教育和計(jì)算機(jī)兩個(gè)方向,其他研究者的學(xué)科背景以計(jì)算機(jī)方向?yàn)橹?。說明一定的計(jì)算機(jī)基礎(chǔ)是進(jìn)行該方面研究的前提,學(xué)科的交叉可能在一定程度上限制了研究的發(fā)展。
3.研究熱點(diǎn)分析
文獻(xiàn)中的關(guān)鍵詞是對(duì)全文內(nèi)容主題的濃縮表達(dá)。通過CiteSpace軟件對(duì)關(guān)鍵詞進(jìn)行共現(xiàn)分析,有助于把握個(gè)性化學(xué)習(xí)中數(shù)據(jù)挖掘技術(shù)的研究熱點(diǎn)。將CiteSpace的時(shí)間跨度設(shè)置為2001-2019 年,單個(gè)時(shí)間分區(qū)設(shè)置為1年,在“Node Types”面板中選擇“Keyword”,同時(shí)將閾值設(shè)置為“Top50”,即在每個(gè)時(shí)間分段中選擇出現(xiàn)次數(shù)排名前50的關(guān)鍵詞,生成關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)圖譜。由于不同學(xué)者對(duì)同一類型問題的表達(dá)可能會(huì)選擇不同的關(guān)鍵詞,并且部分關(guān)鍵詞之間具有明顯的包含關(guān)系,筆者將此類關(guān)鍵詞進(jìn)行了合并處理。例如在“Web挖掘”關(guān)鍵詞中,合并后包括“Web數(shù)據(jù)挖掘”、“Web日志”、“Web日志挖掘”、“Web使用挖掘”和“Web挖掘技術(shù)”等關(guān)鍵詞。為了使結(jié)果顯示更加簡潔,圖譜中已去掉了頻次低于10且中心性小于0.1的關(guān)鍵詞。最后對(duì)節(jié)點(diǎn)、標(biāo)簽和連線的大小和顏色進(jìn)行調(diào)整,從而使最終生成的圖譜更加清晰。在如圖5所示的圖譜中,節(jié)點(diǎn)大小表示關(guān)鍵詞共現(xiàn)的次數(shù),節(jié)點(diǎn)越大說明其所對(duì)應(yīng)的關(guān)鍵詞出現(xiàn)的次數(shù)越多。具有深色外圈圍繞的節(jié)點(diǎn)表示該節(jié)點(diǎn)在圖譜中具有關(guān)鍵性的決定作用,即中心性較高,它反映的是該節(jié)點(diǎn)在網(wǎng)絡(luò)中的“媒介”能力。各節(jié)點(diǎn)之間的連線表示關(guān)鍵詞之間的共現(xiàn)關(guān)系。其粗細(xì)表示共現(xiàn)的強(qiáng)度,連線越粗說明相關(guān)關(guān)系越密切。顏色則對(duì)應(yīng)年份,即首次共現(xiàn)出現(xiàn)的時(shí)間,從冷色調(diào)到暖色調(diào)的變化代表早期到近期的變化。
通過圖譜可以發(fā)現(xiàn),各節(jié)點(diǎn)所代表的關(guān)鍵詞以個(gè)性化學(xué)習(xí)和數(shù)據(jù)挖掘?yàn)楹诵木o密相連,充分表明圖譜所顯示的關(guān)鍵詞之間具有密切聯(lián)系且相互交叉。個(gè)性化服務(wù)雖然出現(xiàn)頻次不多,但卻具有較高的中心性,說明個(gè)性化服務(wù)在相關(guān)研究中具有關(guān)鍵性“媒介”作用。此外,遠(yuǎn)程教育和Web挖掘節(jié)點(diǎn)較大且顏色較深,是研究之初的熱點(diǎn)問題。關(guān)聯(lián)規(guī)則和聚類分析也受到了一定的關(guān)注,而學(xué)習(xí)分析和大數(shù)據(jù)則是近年來關(guān)注的焦點(diǎn)。以上關(guān)鍵詞反映了2001年以來個(gè)性化學(xué)習(xí)中數(shù)據(jù)挖掘技術(shù)的研究熱點(diǎn)。由于個(gè)性化學(xué)習(xí)和數(shù)據(jù)挖掘是檢索文獻(xiàn)的兩個(gè)主題詞,并且在引言中已經(jīng)介紹,因此不再作為熱點(diǎn)關(guān)鍵詞進(jìn)行分析。圖譜中的熱點(diǎn)關(guān)鍵詞按照研究傾向可分為三個(gè)維度:聚焦技術(shù)的研究、聚焦應(yīng)用環(huán)境的研究和聚焦學(xué)習(xí)者的研究。聚焦技術(shù)的研究傾向于從技術(shù)特點(diǎn)出發(fā)研究其應(yīng)用的價(jià)值和功能,包括關(guān)聯(lián)規(guī)則、聚類分析、大數(shù)據(jù)和學(xué)習(xí)分析等關(guān)鍵詞;聚焦應(yīng)用環(huán)境的研究傾向于從學(xué)習(xí)的具體情境出發(fā)探尋技術(shù)實(shí)施的可行性,包括遠(yuǎn)程教育和Web挖掘兩個(gè)關(guān)鍵詞;聚焦學(xué)習(xí)者的研究傾向于從學(xué)習(xí)者的角度出發(fā)滿足不同學(xué)習(xí)者的個(gè)性化需求,包含的關(guān)鍵詞為個(gè)性化服務(wù)。
(1)聚焦技術(shù)的研究
第一,關(guān)聯(lián)規(guī)則。關(guān)聯(lián)規(guī)則是數(shù)據(jù)挖掘中相對(duì)成熟且重要的研究方法之一,其目的是為了發(fā)掘數(shù)據(jù)之間的某種關(guān)系,最初是用于分析消費(fèi)者的購買習(xí)慣[3]。將關(guān)聯(lián)規(guī)則應(yīng)用于個(gè)性化學(xué)習(xí)中,能夠有效地挖掘出學(xué)習(xí)者的學(xué)習(xí)關(guān)聯(lián),掌握學(xué)生的學(xué)習(xí)動(dòng)態(tài),進(jìn)而更深入地了解學(xué)生的學(xué)習(xí)規(guī)律與特點(diǎn)[4]。例如,劉愛民將關(guān)聯(lián)規(guī)則應(yīng)用于成績分析系統(tǒng)中,分析影響學(xué)生學(xué)習(xí)結(jié)果的各種因素,從而為學(xué)生提供針對(duì)性指導(dǎo)[3];文堂柳、李雯應(yīng)用關(guān)聯(lián)規(guī)則算法對(duì)學(xué)生個(gè)人信息、行為信息和評(píng)價(jià)信息等遠(yuǎn)程教學(xué)反饋信息進(jìn)行數(shù)據(jù)挖掘,幫助教師制定個(gè)性化的教學(xué)策略[5]。
第二,聚類分析。聚類分析是按照相似程度把數(shù)據(jù)劃分為不同的組,每個(gè)聚類(或組)均由具有相似特征的對(duì)象構(gòu)成。在教育領(lǐng)域中,可使用聚類分析輔助進(jìn)行分組教學(xué),為分組提供科學(xué)的數(shù)據(jù)支持,進(jìn)而有利于合作學(xué)習(xí)的開展,提高團(tuán)隊(duì)學(xué)習(xí)的質(zhì)量[6]。例如,首先按照學(xué)習(xí)進(jìn)程和知識(shí)掌握程度的差別將學(xué)習(xí)者分為不同的組群,然后根據(jù)制定好的教學(xué)策略為學(xué)習(xí)者提供個(gè)性化的學(xué)習(xí)資料和指導(dǎo),并且隨著學(xué)習(xí)過程的變化及時(shí)調(diào)整分組情況,能夠使學(xué)習(xí)者長期保持良好的學(xué)習(xí)狀態(tài)[7]。
第三,大數(shù)據(jù)。大數(shù)據(jù)的概念還沒有確切的定義,很多人將大數(shù)據(jù)視為各種各樣的海量數(shù)據(jù),也就是傳統(tǒng)工具不能有效處理的數(shù)據(jù);也有一些人將大數(shù)據(jù)視為一種技術(shù)方法,即收集、挖掘和分析大量復(fù)雜的數(shù)據(jù),從而得出趨勢預(yù)測的方法[8]。2012年10月,美國教育部發(fā)布的題為《通過教育數(shù)據(jù)挖掘和學(xué)習(xí)分析技術(shù)來提高教與學(xué):問題簡述》(Enhancing Teaching and Learning Through Educational Data Mining and Learning Analytics: An Issue Brief)的報(bào)告中提出,大數(shù)據(jù)應(yīng)用于教育主要體現(xiàn)在教育數(shù)據(jù)挖掘和學(xué)習(xí)分析兩大技術(shù)領(lǐng)域,主張利用大數(shù)據(jù)技術(shù)對(duì)自適應(yīng)學(xué)習(xí)系統(tǒng)進(jìn)行改進(jìn),促進(jìn)個(gè)性化學(xué)習(xí)的發(fā)展[9]。在探討了科學(xué)范式、大數(shù)據(jù)在教育技術(shù)領(lǐng)域的應(yīng)用以及不同的教育技術(shù)范式后,祝智庭、沈德梅認(rèn)為個(gè)性化自適應(yīng)學(xué)習(xí)系統(tǒng)能夠更好地貫徹“以學(xué)習(xí)者為中心”的教育理念,將成為以大數(shù)據(jù)為基礎(chǔ)的新的教育技術(shù)范式[10]。應(yīng)用大數(shù)據(jù)技術(shù)實(shí)現(xiàn)精準(zhǔn)的個(gè)性化學(xué)習(xí)是未來教育的發(fā)展方向,使得每個(gè)學(xué)習(xí)者的學(xué)習(xí)活動(dòng)都能夠建立在對(duì)以往各類數(shù)據(jù)分析的前提下[11]。
第四,學(xué)習(xí)分析。2011年,由美國多位國際知名學(xué)者組織的跨學(xué)科團(tuán)體——學(xué)習(xí)分析研究協(xié)會(huì)(The Society for Learning Analytics Research,簡稱SoLAR)成立,標(biāo)志著學(xué)習(xí)分析作為一個(gè)新興領(lǐng)域從數(shù)據(jù)挖掘中獨(dú)立出來。學(xué)習(xí)分析是對(duì)學(xué)習(xí)者和學(xué)習(xí)環(huán)境中的相關(guān)數(shù)據(jù)進(jìn)行測量、收集、分析和報(bào)告的過程,從而有助于剖析和完善學(xué)習(xí)及其發(fā)生環(huán)境。隨著大數(shù)據(jù)在教育領(lǐng)域的滲透,學(xué)習(xí)分析已經(jīng)成為國內(nèi)外教育工作者關(guān)注的熱點(diǎn)[12]。例如,鄭曉薇利用學(xué)習(xí)分析技術(shù)構(gòu)建了面向?qū)ο蟮膶W(xué)習(xí)分析模型。通過實(shí)驗(yàn)證明,該模型能夠在教學(xué)過程中進(jìn)行個(gè)性化的干預(yù),有效提升教學(xué)效果,促進(jìn)個(gè)性化教學(xué)[13]。除此之外,唐麗以學(xué)習(xí)分析技術(shù)為基礎(chǔ),探討了學(xué)習(xí)分析系統(tǒng)中的干預(yù)措施。個(gè)性化的干預(yù)流程首先要挖掘?qū)W習(xí)者的個(gè)性信息、行為信息、社會(huì)網(wǎng)絡(luò)關(guān)系等隱含信息,并將當(dāng)前成績與目標(biāo)成績進(jìn)行比較,然后根據(jù)系統(tǒng)結(jié)果分別利用基于內(nèi)容的過濾技術(shù)和基于協(xié)作的過濾技術(shù)對(duì)學(xué)習(xí)者做出干預(yù),從而促進(jìn)個(gè)性化學(xué)習(xí)的實(shí)現(xiàn)[14]。
(2)聚焦應(yīng)用環(huán)境的研究
第一,遠(yuǎn)程教育。遠(yuǎn)程教育又稱網(wǎng)絡(luò)教育,是利用網(wǎng)絡(luò)和多媒體等技術(shù)手段進(jìn)行教學(xué)的一種模式。相對(duì)于傳統(tǒng)教育,遠(yuǎn)程教育中師生分離,以學(xué)生自學(xué)為主。遠(yuǎn)程教育對(duì)象在年齡、學(xué)習(xí)基礎(chǔ)和學(xué)習(xí)方式等多方面具有較大差異性。然而,無論是學(xué)習(xí)內(nèi)容還是學(xué)習(xí)反饋等方面,現(xiàn)有的遠(yuǎn)程教育均不能很好地適應(yīng)個(gè)性化學(xué)習(xí)存在的問題[15]。數(shù)據(jù)挖掘技術(shù)的應(yīng)用可以有效促進(jìn)遠(yuǎn)程教育的個(gè)性化發(fā)展。因此遠(yuǎn)程教育成為個(gè)性化學(xué)習(xí)中數(shù)據(jù)挖掘技術(shù)應(yīng)用的熱點(diǎn)研究方向之一。例如,宋永生針對(duì)網(wǎng)絡(luò)學(xué)習(xí)在學(xué)習(xí)氛圍、學(xué)習(xí)管理和因材施教等方面存在的問題,利用數(shù)據(jù)挖掘技術(shù)設(shè)計(jì)了個(gè)性化的網(wǎng)絡(luò)學(xué)習(xí)平臺(tái),從而實(shí)現(xiàn)個(gè)性化教學(xué)[16]。鄧暉則認(rèn)為,個(gè)體的學(xué)習(xí)特征會(huì)影響在遠(yuǎn)程教育中的學(xué)習(xí)行為,通過構(gòu)建學(xué)生特征分析系統(tǒng),對(duì)包含知識(shí)結(jié)構(gòu)、信息加工方式、社會(huì)特征和情感、意動(dòng)類型等因素的學(xué)習(xí)特征進(jìn)行挖掘和分析,可以促進(jìn)在網(wǎng)絡(luò)教育中實(shí)現(xiàn)個(gè)性化學(xué)習(xí)[17]。
第二,Web挖掘。Web挖掘是指利用數(shù)據(jù)挖掘技術(shù)從Web文檔和訪問數(shù)據(jù)中發(fā)現(xiàn)和抽取知識(shí)。因其具有相應(yīng)的處理步驟和對(duì)象,也可視作一種數(shù)據(jù)挖掘的方法[18]。實(shí)現(xiàn)個(gè)性化的遠(yuǎn)程教育需要從以網(wǎng)站為中心向以學(xué)生為中心轉(zhuǎn)變。將Web挖掘應(yīng)用于遠(yuǎn)程教育,能夠在海量的Web數(shù)據(jù)中發(fā)現(xiàn)學(xué)習(xí)者的學(xué)習(xí)規(guī)律、學(xué)習(xí)興趣和學(xué)習(xí)取向,進(jìn)而為學(xué)習(xí)者提供個(gè)性化的定制網(wǎng)站、推薦個(gè)性化的學(xué)習(xí)內(nèi)容,同時(shí)教師也可以根據(jù)個(gè)性化的反饋及時(shí)做出相適應(yīng)的策略調(diào)整[19]。例如,趙蔚利用Web挖掘處理了E-learning解決方案推薦系統(tǒng)存在的學(xué)習(xí)者兼容性、資源充足性、智能挖掘性、推薦整合性等四大問題,促進(jìn)了數(shù)字學(xué)習(xí)服務(wù)的個(gè)性化[20]。
(3)聚焦學(xué)習(xí)者的研究
個(gè)性化服務(wù)關(guān)注用戶的個(gè)性化需求,致力于為用戶提供針對(duì)性的信息,在收集、整理和分析各類資源的基礎(chǔ)上,盡可能滿足用戶的需求[21]。數(shù)據(jù)挖掘應(yīng)用于個(gè)性化學(xué)習(xí)的主要目的,就是為了進(jìn)行個(gè)性化的數(shù)據(jù)分析,從而推薦個(gè)性化的學(xué)習(xí)內(nèi)容、選擇適合的學(xué)習(xí)方法、做出針對(duì)性的學(xué)習(xí)評(píng)價(jià)和規(guī)劃等,也就是提供個(gè)性化服務(wù)。例如,個(gè)性化服務(wù)在個(gè)性化的遠(yuǎn)程教育中主要體現(xiàn)在以下幾個(gè)方面:向?qū)W習(xí)者推薦感興趣或與其能力相適應(yīng)的學(xué)習(xí)內(nèi)容;通過學(xué)習(xí)者的提問或考核情況發(fā)現(xiàn)薄弱知識(shí)點(diǎn)并提供補(bǔ)習(xí)內(nèi)容和學(xué)習(xí)建議;輔助教師全面把握學(xué)習(xí)者的個(gè)性、學(xué)習(xí)習(xí)慣和評(píng)價(jià)反饋,為學(xué)生制定個(gè)性化的教學(xué)策略[22]。
4.研究趨勢分析
在運(yùn)行軟件得到關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)圖譜的基礎(chǔ)上,選擇時(shí)間線視圖(Timeline View),并選擇關(guān)鍵詞(Keyword)進(jìn)行聚類,得到如圖6所示的時(shí)間線圖譜。時(shí)間線視圖(Timeline)主要用于展現(xiàn)聚類之間的關(guān)系以及各聚類中對(duì)應(yīng)文獻(xiàn)的時(shí)間跨度。為了說明聚類后的結(jié)構(gòu)及其清晰度,證明圖譜呈現(xiàn)效果的有效性,CiteSpace提供了可供參考的兩個(gè)指標(biāo)Q值(模塊值)和S值(平均輪廓值)。一般情況下,當(dāng)Q值大于0.3時(shí),表明所劃分出的網(wǎng)絡(luò)結(jié)構(gòu)是顯著的,當(dāng)S值大于0.5時(shí),表明聚類的結(jié)果是有效的[2]。從圖中聚類結(jié)果可以看出:Q= 0.3714、S=0.6021,說明所得圖譜相對(duì)有效。圖中共形成四個(gè)反映該領(lǐng)域研究熱點(diǎn)的聚類中心,分別是:#0個(gè)性化學(xué)習(xí)、#1數(shù)據(jù)挖掘、#2個(gè)性化推薦、#3學(xué)習(xí)分析。
“#0個(gè)性化學(xué)習(xí)”聚類包括自適應(yīng)學(xué)習(xí)系統(tǒng)、學(xué)習(xí)者特征、學(xué)習(xí)者模型、智慧教育、人工智能等關(guān)鍵詞。此類關(guān)鍵詞反映了通過數(shù)據(jù)挖掘技術(shù)實(shí)現(xiàn)個(gè)性化學(xué)習(xí)的主要方式,即通過構(gòu)建各種學(xué)習(xí)系統(tǒng)或?qū)W習(xí)者模型,利用數(shù)據(jù)挖掘技術(shù)發(fā)現(xiàn)學(xué)習(xí)者特征等個(gè)性化信息。數(shù)據(jù)挖掘技術(shù)的應(yīng)用往往與信息化、智能化等技術(shù)手段結(jié)合以促進(jìn)個(gè)性化學(xué)習(xí),也是智慧教育的體現(xiàn)。
“#1數(shù)據(jù)挖掘”聚類包括決策樹、agent、E-learning等關(guān)鍵詞。決策樹和agent是數(shù)據(jù)挖掘技術(shù)的兩種算法,E-learning則體現(xiàn)出數(shù)據(jù)挖掘技術(shù)應(yīng)用的主要載體。
“#2個(gè)性化推薦”聚類包括遠(yuǎn)程教育、Web挖掘、關(guān)聯(lián)規(guī)則、個(gè)性化服務(wù)、聚類分析、移動(dòng)學(xué)習(xí)、協(xié)同過濾等關(guān)鍵詞。個(gè)性化推薦是為學(xué)習(xí)者提供個(gè)性化服務(wù)的主要方式,相關(guān)研究主要聚焦于遠(yuǎn)程教育和移動(dòng)學(xué)習(xí)領(lǐng)域,Web挖掘、關(guān)聯(lián)規(guī)則、聚類分析和協(xié)同過濾是進(jìn)行數(shù)據(jù)挖掘的主要方法。
“#3學(xué)習(xí)分析”聚類包括學(xué)習(xí)分析、社會(huì)網(wǎng)絡(luò)分析、大數(shù)據(jù)等關(guān)鍵詞。學(xué)習(xí)分析和教育數(shù)據(jù)挖掘是大數(shù)據(jù)在教育領(lǐng)域的兩個(gè)主要技術(shù),而結(jié)合社會(huì)網(wǎng)絡(luò)分析則可以獲得更豐富、更準(zhǔn)確的信息。
通過圖譜可以看出,“#0個(gè)性化學(xué)習(xí)”和“#2個(gè)性化推薦”聚類中所包含的相關(guān)研究主題,從該領(lǐng)域研究初始至今,除中期相對(duì)停滯外,始終受到一定的關(guān)注?!?1數(shù)據(jù)挖掘”聚類中的相關(guān)主題,雖然在前期具有較高的中心性,但在2008年后終斷。而“#3學(xué)習(xí)分析”聚類中的相關(guān)內(nèi)容凸現(xiàn)為近幾年的研究熱點(diǎn)。研究發(fā)現(xiàn),雖然個(gè)性化學(xué)習(xí)中數(shù)據(jù)挖掘的研究在早期受到了一定的關(guān)注,但研究者和發(fā)文量仍相對(duì)匱乏。并且隨著數(shù)據(jù)量的增多,單純的數(shù)據(jù)挖掘技術(shù)已無法滿足技術(shù)需求,因此經(jīng)過幾年發(fā)展后便陷入瓶頸。隨著技術(shù)的發(fā)展以及學(xué)科之間的交叉越來越多,為研究帶來了新的活力。而數(shù)據(jù)挖掘技術(shù)在不斷發(fā)展中逐漸內(nèi)含于學(xué)習(xí)分析、大數(shù)據(jù)、人工智能等相關(guān)技術(shù)中,成為各類技術(shù)中必不可少的關(guān)鍵技術(shù)。個(gè)性化學(xué)習(xí)隨著技術(shù)的進(jìn)步和更迭逐漸發(fā)展。
三、結(jié)論與展望
1.結(jié)論
本研究對(duì)近20年來CNKI數(shù)據(jù)庫關(guān)于個(gè)性化學(xué)習(xí)中數(shù)據(jù)挖掘技術(shù)研究的相關(guān)文獻(xiàn)進(jìn)行梳理,并通過CiteSpace V對(duì)作者、機(jī)構(gòu)、關(guān)鍵詞等進(jìn)行可視化分析,得出以下結(jié)論:
第一,研究成果數(shù)量較少,且研究力量分散。相關(guān)研究成果的年發(fā)文量均比較穩(wěn)定,但是300多篇的文獻(xiàn)總數(shù)仍顯不足。數(shù)據(jù)挖掘技術(shù)在教育領(lǐng)域的應(yīng)用促進(jìn)了學(xué)習(xí)的個(gè)性化,為個(gè)性化學(xué)習(xí)的研究開拓了新的思路,并在應(yīng)用研究的過程中使得技術(shù)自身逐漸發(fā)展和完善。但學(xué)科的交叉也為相關(guān)研究增加了一定的難度??鐚W(xué)科人才短缺使得具有不同專業(yè)背景的研究者之間的合作顯得尤為重要。然而研究發(fā)現(xiàn),作者和機(jī)構(gòu)合作較少,并沒有形成一定規(guī)模的合作群體。并且,研究者和研究機(jī)構(gòu)之間的合作關(guān)系大多為校內(nèi)合作,缺乏校際合作。具有不同學(xué)科背景的研究者和研究機(jī)構(gòu)各自為營,使得研究力量和資源分散。
第二,技術(shù)方法研究較多,但應(yīng)用領(lǐng)域有限。雖然關(guān)聯(lián)規(guī)則和聚類分析是數(shù)據(jù)挖掘中比較常用的兩種方法,但也有研究涉及決策樹、Agent和協(xié)同過濾等方法。同時(shí),學(xué)習(xí)分析、大數(shù)據(jù)、人工智能等新興技術(shù)領(lǐng)域也逐漸脫離單純的數(shù)據(jù)挖掘技術(shù),成為近幾年研究的熱點(diǎn)話題。個(gè)性化學(xué)習(xí)中關(guān)于數(shù)據(jù)挖掘技術(shù)的方法研究越來越豐富。由于在遠(yuǎn)程教育過程中會(huì)產(chǎn)生較多便于挖掘的數(shù)據(jù),數(shù)據(jù)挖掘技術(shù)的應(yīng)用研究多集中在遠(yuǎn)程教育領(lǐng)域。相關(guān)研究涉及學(xué)習(xí)策略、學(xué)習(xí)內(nèi)容、學(xué)習(xí)評(píng)價(jià)與反饋等方方面面的內(nèi)容,但是對(duì)于遠(yuǎn)程教育之外存在的海量數(shù)據(jù)信息關(guān)注度較低。個(gè)性化學(xué)習(xí)中數(shù)據(jù)挖掘技術(shù)的應(yīng)用范圍仍顯狹窄。
第三,技術(shù)優(yōu)勢發(fā)揮充分,但風(fēng)險(xiǎn)意識(shí)淡薄。無論是應(yīng)用關(guān)聯(lián)規(guī)則發(fā)現(xiàn)學(xué)習(xí)者的學(xué)習(xí)關(guān)聯(lián),還是利用聚類分析進(jìn)行分組教學(xué),研究者均能充分認(rèn)識(shí)技術(shù)的特點(diǎn),發(fā)揮技術(shù)優(yōu)勢。各種數(shù)據(jù)挖掘方法及其相關(guān)技術(shù)的應(yīng)用,多角度、全方位地促進(jìn)了個(gè)性化學(xué)習(xí)的發(fā)展。然而,相關(guān)研究在感嘆技術(shù)發(fā)展為個(gè)性化學(xué)習(xí)帶來巨大收益的同時(shí),卻忽視了技術(shù)應(yīng)用過程中可能存在的數(shù)據(jù)安全和隱私風(fēng)險(xiǎn)等潛在問題。少部分研究者雖在文獻(xiàn)結(jié)尾論及此類問題,但也只是停留在表面,缺乏系統(tǒng)的研究。該領(lǐng)域并沒有得到應(yīng)有的關(guān)注,研究者對(duì)技術(shù)應(yīng)用的風(fēng)險(xiǎn)意識(shí)相對(duì)淡薄。
2.展望
基于對(duì)已有研究的分析和總結(jié),筆者認(rèn)為,促進(jìn)個(gè)性化學(xué)習(xí)中數(shù)據(jù)挖掘技術(shù)的研究應(yīng)注意以下幾個(gè)方面:
第一,加強(qiáng)溝通交流,促進(jìn)合作研究。信息化、智能化的社會(huì)背景下,原有技術(shù)方法更新迅速,各種新興技術(shù)蓬勃興起。個(gè)性化學(xué)習(xí)的發(fā)展也應(yīng)與時(shí)俱進(jìn),及時(shí)吸納新技術(shù)并靈活運(yùn)用于教育中來。由于數(shù)據(jù)挖掘、學(xué)習(xí)分析和大數(shù)據(jù)等技術(shù)均比較復(fù)雜,其在個(gè)性化學(xué)習(xí)中的應(yīng)用研究需要具有一定專業(yè)知識(shí)的人來實(shí)現(xiàn),而這些人往往不具備相應(yīng)的教育理論知識(shí)。這就直接決定了具有單一學(xué)科背景的研究者難以進(jìn)行該領(lǐng)域的研究或者研究質(zhì)量不高。因此,不同學(xué)科領(lǐng)域的研究者和研究機(jī)構(gòu)之間應(yīng)該加強(qiáng)溝通和交流,促進(jìn)合作研究,實(shí)現(xiàn)優(yōu)勢互補(bǔ)。
第二,拓展研究視野,轉(zhuǎn)換研究視角。《教育信息化十年發(fā)展規(guī)劃(2011-2020年)》提出,要“努力為每一名學(xué)生和學(xué)習(xí)者提供個(gè)性化學(xué)習(xí)的信息化環(huán)境和服務(wù)”?!吨袊逃F(xiàn)代化2035》也提出,要“利用現(xiàn)代技術(shù)加快推動(dòng)人才培養(yǎng)模式改革,實(shí)現(xiàn)規(guī)?;逃c個(gè)性化培養(yǎng)的有機(jī)結(jié)合”。應(yīng)用現(xiàn)代技術(shù)促進(jìn)個(gè)性化學(xué)習(xí)應(yīng)面向所有學(xué)習(xí)者并適用于各種學(xué)習(xí)環(huán)境,使每個(gè)學(xué)習(xí)者都能隨時(shí)隨地享受到個(gè)性化的學(xué)習(xí)服務(wù)。因此,在應(yīng)用數(shù)據(jù)挖掘、學(xué)習(xí)分析和大數(shù)據(jù)等現(xiàn)代技術(shù)時(shí),不能僅聚焦在遠(yuǎn)程教育領(lǐng)域。研究者應(yīng)該將視野放寬,全方位關(guān)注各種教育領(lǐng)域和教育形式中的學(xué)習(xí),努力挖掘更加全面、有效的信息。此外,要積極轉(zhuǎn)換研究視角,從以技術(shù)為中心逐漸向以學(xué)習(xí)者為中心轉(zhuǎn)變。研究者要站在學(xué)習(xí)者的立場,從學(xué)習(xí)者的個(gè)性化需求出發(fā),尋找解決問題的方法。
第三,增強(qiáng)安全意識(shí),防范潛在風(fēng)險(xiǎn)。事物的發(fā)展都有其兩面性。數(shù)據(jù)挖掘等現(xiàn)代技術(shù)的廣泛應(yīng)用在為學(xué)習(xí)者帶來極大便利的同時(shí),也可能存在一些潛在的危險(xiǎn)。如何保障海量的數(shù)據(jù)信息不被非法利用、數(shù)據(jù)的收集和分析是否需要征得用戶同意、分析所得結(jié)果會(huì)不會(huì)給當(dāng)事人帶來不平等待遇、技術(shù)的發(fā)展和應(yīng)用究竟是促進(jìn)了教育公平還是拉大了教育不平衡的差距等等,諸如此類問題必須得到足夠重視。個(gè)性化學(xué)習(xí)的實(shí)現(xiàn)不能以損害學(xué)習(xí)者利益為代價(jià),更不能影響教育和社會(huì)的長期穩(wěn)定發(fā)展。因此,研究者應(yīng)提高警惕,認(rèn)真反思數(shù)據(jù)挖掘及其相關(guān)技術(shù)在應(yīng)用過程中可能存在的諸多挑戰(zhàn)。
參考文獻(xiàn):
[1]吳修霆.SAS數(shù)據(jù)挖掘技術(shù)的實(shí)現(xiàn)[J].微電腦世界,2000(14):44-45.
[2]陳悅,陳超美,劉則淵,胡志剛,王賢文.CiteSpace知識(shí)圖譜的方法論功能[J].科學(xué)學(xué)研究,2015,33(2):242-253.
[3]劉愛民.基于關(guān)聯(lián)規(guī)則的學(xué)生成績分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D].長春:吉林大學(xué),2014.
[4]繆廣寒.關(guān)聯(lián)規(guī)則Apriori算法在個(gè)性化學(xué)習(xí)系統(tǒng)中的應(yīng)用研究[J].硅谷,2014,7(5):47-48.
[5]文堂柳,李雯.關(guān)聯(lián)規(guī)則在遠(yuǎn)程教育教學(xué)反饋中的應(yīng)用[J].計(jì)算機(jī)與信息技術(shù),2009(9):17-18,22.
[6]李汪麗,蔣玲.數(shù)據(jù)挖掘在中國教育領(lǐng)域的應(yīng)用研究綜述[J].湖北第二師范學(xué)院學(xué)報(bào),2010,27(2):55-58.
[7]趙立江.聚類分析在個(gè)性化學(xué)習(xí)中的研究與應(yīng)用[J].福建電腦,2006(12):13,2.
[8]張杰夫.大數(shù)據(jù),大視野,大教育[J].中小學(xué)信息技術(shù)教育,2013(10):12-14.
[9]U.S. Department of Education, Office of Educational Technology. Enhancing Teaching and Learning Through Educational Data Mining and Learning Analytics: An Issue Brief [DB/OL]. Washington, D. C.: M. Bienkowski, M. Y. Feng, and B. Means, 2012,https://tech.ed.gov/wp-content/uploads/2014/03/edm-la-brief.pdf
[10]祝智庭,沈德梅.基于大數(shù)據(jù)的教育技術(shù)研究新范式[J].電化教育研究,2013,34(10):5-13.
[11]胡水星.大數(shù)據(jù)及其關(guān)鍵技術(shù)的教育應(yīng)用實(shí)證分析[J].遠(yuǎn)程教育雜志,2015,33(5):46-53.
[12]吳青,羅儒國.學(xué)習(xí)分析:從源起到實(shí)踐與研究[J].開放教育研究,2015,21(1):71-79.
[13]鄭曉薇,劉靜,高悅.面向?qū)ο蟮膶W(xué)習(xí)分析模型的構(gòu)建與實(shí)現(xiàn)[J].中國電化教育,2016(10):116-122.
[14]唐麗,王運(yùn)武,陳琳.智慧學(xué)習(xí)環(huán)境下基于學(xué)習(xí)分析的干預(yù)機(jī)制研究[J].電化教育研究,2016,37(2):62-67.
[15]徐輝增,孫學(xué)農(nóng).數(shù)據(jù)挖掘在現(xiàn)代遠(yuǎn)程教育中的應(yīng)用[J].電腦知識(shí)與技術(shù)(學(xué)術(shù)交流),2007(10):1179-1180.
[16]宋永生.基于數(shù)據(jù)挖掘的個(gè)性化學(xué)習(xí)平臺(tái)研究[J].電腦知識(shí)與技術(shù),2018,14(36):198-200.
[17]鄧暉.網(wǎng)絡(luò)個(gè)性化學(xué)習(xí)學(xué)生特征分析系統(tǒng)的分析與設(shè)計(jì)[J].遠(yuǎn)程教育雜志,2003(1):11-13.
[18]李汪麗,蔣玲.數(shù)據(jù)挖掘在中國教育領(lǐng)域的應(yīng)用研究綜述[J].湖北第二師范學(xué)院學(xué)報(bào),2010,27(2):55-58.
[19]羅興文,閆友彪,蔡海濱.基于Web挖掘的個(gè)性化遠(yuǎn)程教育系統(tǒng)研究[J].計(jì)算機(jī)工程與設(shè)計(jì),2007(12):3016-3019,3022.
[20]趙蔚,余延冬,張賽男.基于Web數(shù)據(jù)挖掘的個(gè)性化E-learning解決方案推薦系統(tǒng)研究[J].現(xiàn)代遠(yuǎn)距離教育,2011(4):60-63.
[21]魏丹丹,邱樂興.基于Web3.0的網(wǎng)絡(luò)教學(xué)個(gè)性化服務(wù)平臺(tái)構(gòu)建[J].江西師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2013,37(6):584-588.
[22]李華,何茜,吳中福.基于Web的個(gè)性化學(xué)習(xí)系統(tǒng)研究[J].計(jì)算機(jī)工程與應(yīng)用,2002(13):239-242.
(編輯:王曉明)