張琳 李小平等
摘要:教學(xué)大數(shù)據(jù)是在多源異構(gòu)、不連續(xù)、易干擾環(huán)境下形成的經(jīng)典數(shù)據(jù)與非經(jīng)典數(shù)據(jù)的復(fù)雜集合。該文從教學(xué)大數(shù)據(jù)挖掘的觀點(diǎn)出發(fā),增加Web數(shù)據(jù)和圖像數(shù)據(jù),對傳統(tǒng)的挖掘數(shù)據(jù)源進(jìn)行擴(kuò)展;提出教學(xué)視點(diǎn)和數(shù)據(jù)視點(diǎn)的概念,并基于此構(gòu)建了教學(xué)數(shù)據(jù)挖掘框架;以遠(yuǎn)程教學(xué)過程為例,從教師、學(xué)習(xí)者、管理者、資源設(shè)計(jì)、教學(xué)事件處理等不同的視點(diǎn)提出了數(shù)據(jù)挖掘的相關(guān)因素。通過多種數(shù)據(jù)源的挖掘處理方法的研究完成相應(yīng)視點(diǎn)下事件的因果關(guān)系及相關(guān)關(guān)系的分析,為教學(xué)數(shù)據(jù)挖掘提出了新的思路和策略,為教學(xué)質(zhì)量提升提出了一種可行的方法。
關(guān)鍵詞:教學(xué)視點(diǎn);數(shù)據(jù)挖掘;挖掘模式;多源異構(gòu)數(shù)據(jù);數(shù)據(jù)視點(diǎn);遠(yuǎn)程教學(xué)
中圖分類號:G434 文獻(xiàn)標(biāo)識碼:A
隨著大數(shù)據(jù)的普及和大數(shù)據(jù)時(shí)代的到來,數(shù)據(jù)的存儲結(jié)構(gòu)發(fā)生了很大的變化,半結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)成為了大數(shù)據(jù)的主體。但與此同時(shí),大量數(shù)據(jù)的價(jià)值密度也逐漸降低,如何從海量的數(shù)據(jù)中挖掘出有價(jià)值的數(shù)據(jù)成為了研究者關(guān)注的主要問題。
在教育領(lǐng)域,大量的研究者基于教學(xué)大數(shù)據(jù)開展了挖掘工作,進(jìn)行了學(xué)習(xí)行為分析、學(xué)習(xí)效果評價(jià)以及教育決策分析等應(yīng)用研究,通過對經(jīng)典數(shù)據(jù)庫存儲的結(jié)構(gòu)化教育數(shù)據(jù)的處理,找出學(xué)習(xí)者在學(xué)習(xí)中的行為規(guī)律,為相關(guān)的分析決策提供有效的依據(jù)。Divna等人采用聚類算法對Moodle平臺中的學(xué)習(xí)數(shù)據(jù)進(jìn)行分析,驗(yàn)證了數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)學(xué)習(xí)分析中的可行性。Huseyin等人采用決策樹算法預(yù)測影響學(xué)生學(xué)業(yè)成功的影響因素,利用多種模型視圖構(gòu)建了教育數(shù)據(jù)挖掘系統(tǒng)。陳子健等人挖掘教育大數(shù)據(jù)中影響在線學(xué)習(xí)者學(xué)業(yè)成績的因素,并通過機(jī)器學(xué)習(xí)建立分類預(yù)測模型。聶瑞華等人提出基于數(shù)據(jù)融合的個(gè)性化學(xué)習(xí)支持方案。李彤彤等人以干預(yù)引擎為中心建立了基于教育大數(shù)據(jù)的學(xué)習(xí)干預(yù)模型。吳南中建立了基于教學(xué)大數(shù)據(jù)混合學(xué)習(xí)視域下的教學(xué)設(shè)計(jì)邏輯框架。
然而,隨著網(wǎng)絡(luò)學(xué)習(xí)環(huán)境、方式、技術(shù)和功能的擴(kuò)展,教育數(shù)據(jù)的概念也得到了很大的延伸,除了傳統(tǒng)的經(jīng)典數(shù)據(jù)之外,還包括大量的半結(jié)構(gòu)化和非結(jié)構(gòu)化的視頻、音頻、網(wǎng)頁、文字等Web數(shù)據(jù)和圖像數(shù)據(jù),這些數(shù)據(jù)蘊(yùn)含著更豐富更有價(jià)值的信息,它們將會成為教育大數(shù)據(jù)挖掘的重要數(shù)據(jù)來源,發(fā)揮著比經(jīng)典數(shù)據(jù)更重要和直觀的作用。Web教育大數(shù)據(jù)和圖像教育數(shù)據(jù)有許多不同于經(jīng)典數(shù)據(jù)的特點(diǎn),包括多源異構(gòu)、交互性、實(shí)效性、社會性、突發(fā)性和高噪聲等,不但非結(jié)構(gòu)化數(shù)據(jù)多,而且數(shù)據(jù)的實(shí)時(shí)性強(qiáng),比經(jīng)典數(shù)據(jù)挖掘和分析更困難。
目前對于教育大數(shù)據(jù)的認(rèn)識和使用還存在一定的誤區(qū),大量的挖掘者認(rèn)為教育大數(shù)據(jù)是萬能的,大數(shù)據(jù)的挖掘技術(shù)是萬能的,只要有了大數(shù)據(jù),就一定能挖掘到自己需要的信息,挖掘到的信息一定有助于教學(xué)問題的解決。事實(shí)上,目前的大數(shù)據(jù)挖掘還存在一定的局限性,如挖掘目標(biāo)的盲目性、挖掘過程中存在著無法識別的盲區(qū)、挖掘的數(shù)據(jù)相關(guān)性不強(qiáng)、對多源異構(gòu)數(shù)據(jù)的處理能力差、挖掘的數(shù)據(jù)不完整、歷史延續(xù)性不足等。數(shù)據(jù)挖掘僅僅是一種為人所用的工具,必須在智能的設(shè)計(jì)框架下它才有生命力,才能發(fā)揮出作用,因此,需要有智慧的、能夠辨識挖掘方向的人根據(jù)自身的需求,站在一定的視點(diǎn)來看待海量數(shù)據(jù)中的挖掘問題,首先需要對要解決的問題進(jìn)行分類,明確哪些問題可以挖掘,哪些問題不能挖掘,哪些問題不必挖掘,同時(shí)還要明確挖掘哪些數(shù)據(jù),挖掘的方向是什么,誰來挖掘數(shù)據(jù),挖掘數(shù)據(jù)的目的是什么,如何挖掘數(shù)據(jù),如何去掉挖掘的盲點(diǎn),如何避免挖掘的盲目性,哪些因素與挖掘相關(guān),到哪里挖掘數(shù)據(jù),挖掘數(shù)據(jù)的范圍有多長多寬,挖掘出來的數(shù)據(jù)是否全部有用,挖掘的數(shù)據(jù)為誰服務(wù)等等一系列問題。數(shù)據(jù)挖掘應(yīng)該是帶有很明確的方向性、區(qū)域性、代表性、特征性和目標(biāo)性。尤其對于國內(nèi)遠(yuǎn)程教學(xué)而言,教學(xué)中心分布廣泛、數(shù)據(jù)量大、數(shù)據(jù)有效度強(qiáng)、可靠性差、圖像數(shù)據(jù)和后期分析數(shù)據(jù)相對完備,其數(shù)據(jù)本身具有指向性、區(qū)域性、特征性、事件性、傳播性、政策連帶性、疊加性等特點(diǎn),挖掘者站在什么樣的視點(diǎn)、如何針對遠(yuǎn)程教學(xué)解決以上數(shù)據(jù)挖掘問題是本論文研究的主要內(nèi)容。
研究的態(tài)度和研究視點(diǎn)決定了觀察問題的角度和對問題的剖析度。教學(xué)數(shù)據(jù)挖掘是一個(gè)將來自各種教育系統(tǒng)的原始數(shù)據(jù)轉(zhuǎn)換為有用信息的過程,這些有用信息可為教師、學(xué)生、教育研究人員以及教育軟件系統(tǒng)開發(fā)人員所利用。教學(xué)大數(shù)據(jù)挖掘應(yīng)該站在教學(xué)的視點(diǎn),從教學(xué)中不同的角色出發(fā),從教學(xué)角色所關(guān)心的問題出發(fā),通過對教學(xué)事件的影響因素及數(shù)據(jù)的分類研究,借助于不同的挖掘手段和挖掘方法,針對擴(kuò)展的多源異構(gòu)數(shù)據(jù)源,挖掘出事件與教學(xué)質(zhì)量的關(guān)系規(guī)律,從而實(shí)現(xiàn)教學(xué)質(zhì)量的控制。
教學(xué)大數(shù)據(jù)挖掘只是一種手段,不是最終的目標(biāo),數(shù)據(jù)挖掘最終的目標(biāo)是要找到教學(xué)所發(fā)生事件的真正規(guī)律和內(nèi)涵,為教學(xué)質(zhì)量控制做準(zhǔn)備。站在教學(xué)的視點(diǎn)通過對教學(xué)不同角色的分類,利用大數(shù)據(jù)挖掘方法對多源異構(gòu)數(shù)據(jù)進(jìn)行挖掘和基于數(shù)據(jù)視點(diǎn)的綜合分析,通過尋找引起事件發(fā)生的相關(guān)因素,形成教學(xué)控制自變量x,分析自變量x可能引起現(xiàn)象,構(gòu)成控制函數(shù)y=f(x),最終完成對因變量y的控制,達(dá)到教學(xué)質(zhì)量控制的目標(biāo),使質(zhì)量曲線向優(yōu)秀的目標(biāo)曲線逼近。圖1所示為教學(xué)數(shù)據(jù)挖掘框架。
(一)教學(xué)大數(shù)據(jù)類型
本研究針對遠(yuǎn)程教學(xué)展開,遠(yuǎn)程教學(xué)大數(shù)據(jù)包含內(nèi)涵數(shù)據(jù)和外延數(shù)據(jù)兩部分。理清究竟哪些屬于內(nèi)涵數(shù)據(jù)、哪些屬于外延數(shù)據(jù)以及內(nèi)涵數(shù)據(jù)與外延數(shù)據(jù)之間的分界是進(jìn)行教學(xué)大數(shù)據(jù)研究的前提。
1.內(nèi)涵大數(shù)據(jù):是指與教學(xué)本身相關(guān)的而且?guī)в泻軓?qiáng)傳統(tǒng)概念的數(shù)據(jù),其中主要包括教學(xué)運(yùn)行和教學(xué)活動的相關(guān)數(shù)據(jù)。這些數(shù)據(jù)中絕大部分被稱為內(nèi)涵數(shù)據(jù),而這些核心數(shù)據(jù)主要用于教學(xué)內(nèi)部管理和教學(xué)檔案管理,無法驅(qū)動對教學(xué)質(zhì)量的評測,帶有一定的片面性。
2.外延大數(shù)據(jù):是指在廣域范圍內(nèi)的,與教學(xué)不直接相關(guān)的數(shù)據(jù)。這些數(shù)據(jù)可以是官方統(tǒng)計(jì)的相關(guān)數(shù)據(jù),也可以是在網(wǎng)站或其他網(wǎng)絡(luò)平臺等出現(xiàn)的非官方數(shù)據(jù),這些數(shù)據(jù)涉及的范圍廣泛,包括主觀數(shù)據(jù)和客觀數(shù)據(jù)。
(二)教學(xué)大數(shù)據(jù)特性
教學(xué)大數(shù)據(jù)與其他行業(yè)大數(shù)據(jù)的特征明顯不同,主要體現(xiàn)在如下幾個(gè)方面。
1.多源異構(gòu)性
教學(xué)大數(shù)據(jù)的主要來源是經(jīng)典的數(shù)據(jù)庫中存儲的與教學(xué)、管理相關(guān)的數(shù)據(jù),但由于系統(tǒng)功能和存儲介質(zhì)容量的限制,能被存儲的數(shù)據(jù)多數(shù)都是客觀信息的表達(dá),這些數(shù)據(jù)構(gòu)成了目前數(shù)據(jù)挖掘的主要數(shù)據(jù)源。然而隨著信息處理技術(shù)的發(fā)展,圖像數(shù)據(jù)、網(wǎng)絡(luò)數(shù)據(jù)等成為了記載學(xué)習(xí)者學(xué)習(xí)過程的主要來源,這些圖像行為和語義行為的數(shù)據(jù)以半結(jié)構(gòu)化或非結(jié)構(gòu)化的形式存儲,對它們的分析和挖掘可以為學(xué)習(xí)者、教師和管理者提供更加直觀的結(jié)論,因此將會成為未來大數(shù)據(jù)挖掘的主要數(shù)據(jù)來源。
2.無規(guī)律性
教學(xué)數(shù)據(jù)本身的記載帶有片面性,傳統(tǒng)的教育是根據(jù)經(jīng)驗(yàn)去摸索數(shù)據(jù)的規(guī)律,如果要完善教育大數(shù)據(jù),需要對其進(jìn)行大量統(tǒng)計(jì)分析工作,目前非常難以實(shí)施。除此之外,由于還存在著大量的缺陷數(shù)據(jù),導(dǎo)致教學(xué)大數(shù)據(jù)不僅經(jīng)常受到強(qiáng)烈的干擾,還很難尋找到規(guī)律。因此,就必須通過人工智能的技術(shù)將教學(xué)管理工作者常年形成的經(jīng)驗(yàn)和目前的數(shù)據(jù)進(jìn)行擬合,通過經(jīng)驗(yàn)的補(bǔ)充來形成數(shù)據(jù)的補(bǔ)充,從而逐步完善教學(xué)大數(shù)據(jù)。
3.不延展性
延展性是指事件受到干擾以后仍然能夠延續(xù)下去的特性。隨著IT技術(shù)的發(fā)展和各種教學(xué)思潮的不斷涌現(xiàn),很多教學(xué)思想或教學(xué)舉措都很難保持這種延續(xù)性。主要表現(xiàn)在以下幾個(gè)方面:(1)政策的頻繁出臺帶來了教學(xué)宏觀問題的延展性不足;(2)由于教學(xué)方法自身影響力和傳播力的原因?qū)е碌难诱剐圆蛔?;?)由于人員的變動或機(jī)構(gòu)的調(diào)整造成的延展性不足;(4)IT教育的移植造成的延展性不足。
4.不完整性
不完整性主要體現(xiàn)在大數(shù)據(jù)本身構(gòu)造不完整、數(shù)據(jù)的關(guān)聯(lián)不完整、數(shù)據(jù)的組合過程不完整、很多缺陷問題引起的數(shù)據(jù)不完整、事件整體不完整、政策不能延續(xù)貫徹導(dǎo)致的結(jié)論不完整等。
5.突發(fā)性
突發(fā)性分為正常突發(fā)和異常突發(fā)??深A(yù)測的突發(fā)稱為正常突發(fā),而數(shù)據(jù)的紊亂和突變都屬于異常突發(fā)。對數(shù)據(jù)的變化主要觀察突發(fā)事件的性質(zhì)、突發(fā)事件的原因以及突發(fā)事件發(fā)生的時(shí)間。事件的突發(fā)并不代表沒有規(guī)律,突發(fā)事件不能代表整個(gè)數(shù)據(jù)全部的特性,它僅僅是局部數(shù)據(jù)的異常。
6.政策干擾性
我國遠(yuǎn)程教學(xué)大數(shù)據(jù)受大環(huán)境影響性較大,先前政策的中斷或與現(xiàn)有政策產(chǎn)生疊加造成了達(dá)不到預(yù)期目標(biāo)、得不到相關(guān)數(shù)據(jù)、實(shí)現(xiàn)不了相應(yīng)效果的局面,由此引發(fā)了數(shù)據(jù)干擾問題。
7.結(jié)果的傳播性和影響性
經(jīng)過大數(shù)據(jù)挖掘得到的數(shù)據(jù)結(jié)果自身有一定權(quán)威性和認(rèn)可度,不管結(jié)論是全面還是片面,或是有誤差的,它在公眾中都具有一定的傳播力和影響力。如學(xué)校排名、學(xué)科排名決定了學(xué)生報(bào)考的趨勢。
8.疊加性
數(shù)據(jù)的疊加包括在主流事件上疊加小的事件以及大事件與大事件的多層疊加兩種。疊加所帶來的統(tǒng)計(jì)數(shù)據(jù)是不準(zhǔn)確的或帶有相當(dāng)?shù)钠ば院透蓴_性,可以先對這一階段的干擾問題進(jìn)行排除,通過研究整個(gè)過程的慣性數(shù)據(jù)來看其長期呈現(xiàn)的規(guī)律。但如果兩個(gè)事件都同樣具備長期的影響力,就要通過教學(xué)視點(diǎn)找出相應(yīng)的因素進(jìn)行干擾的排除,之后通過人為的經(jīng)驗(yàn)進(jìn)行判定。
9.數(shù)據(jù)之間的干擾性
由于多源數(shù)據(jù)中數(shù)據(jù)之間存在著同步性和由于時(shí)間的延展造成的錯(cuò)位性問題,使得這些數(shù)據(jù)無法達(dá)到真正的統(tǒng)一,一個(gè)數(shù)據(jù)的出現(xiàn)將會對另一個(gè)數(shù)據(jù)的判定產(chǎn)生參考或干擾作用。數(shù)據(jù)干擾的強(qiáng)弱取決于通過數(shù)據(jù)視點(diǎn)所觀察到的數(shù)據(jù)之間的關(guān)系,這種關(guān)系的強(qiáng)弱決定了干擾的強(qiáng)弱。數(shù)據(jù)之間的干擾不一定產(chǎn)生的都是負(fù)面作用,要擅長干擾性分析,有時(shí)干擾還會成為輔助數(shù)據(jù)判斷的因素。
內(nèi)涵數(shù)據(jù)、外延數(shù)據(jù)以及沒有被統(tǒng)計(jì)到的缺陷數(shù)據(jù)共同構(gòu)成了教學(xué)的整體數(shù)據(jù),它可以是一個(gè)校園內(nèi)的全部教學(xué)及相關(guān)數(shù)據(jù)。但僅僅研究這個(gè)教學(xué)整體數(shù)據(jù)還不足以發(fā)現(xiàn)教學(xué)問題,必須通過將一個(gè)廣域區(qū)域的內(nèi)涵數(shù)據(jù)、相關(guān)外延數(shù)據(jù)、政策部門數(shù)據(jù)等全部疊加,形成大數(shù)據(jù)的整體,在大數(shù)據(jù)整體的基礎(chǔ)上進(jìn)行挖掘分析才能找到真正的教學(xué)規(guī)律。
(三)教學(xué)數(shù)據(jù)監(jiān)控點(diǎn)與作用點(diǎn)
教學(xué)大數(shù)據(jù)挖掘的最終目標(biāo)是通過對不同視點(diǎn)下教學(xué)參與者關(guān)注的教學(xué)現(xiàn)象的監(jiān)測,完成向最優(yōu)教學(xué)效果逼近的過程。因此,可以為不同教學(xué)事件設(shè)置不同的數(shù)據(jù)監(jiān)控點(diǎn)和作用點(diǎn)。
監(jiān)控點(diǎn)是指教學(xué)中為了對某些過程、現(xiàn)象或?qū)ο筮M(jìn)行監(jiān)視而沒置的控制點(diǎn)。通過對監(jiān)控點(diǎn)的監(jiān)控,可以找出存在的問題,從而及時(shí)采取措施實(shí)現(xiàn)對相應(yīng)教學(xué)問題的調(diào)整。監(jiān)控點(diǎn)主要包括教學(xué)監(jiān)控點(diǎn)和技術(shù)監(jiān)控點(diǎn)。
1.教學(xué)監(jiān)控點(diǎn)
教學(xué)監(jiān)控點(diǎn)主要監(jiān)測整個(gè)教學(xué)過程的運(yùn)行狀況、教學(xué)過程是否符合教學(xué)進(jìn)度及要求、學(xué)習(xí)者對課程的反應(yīng)和滿意度、教師對學(xué)生的反應(yīng)和滿意度、教學(xué)進(jìn)度問題、教學(xué)過程問題、教學(xué)執(zhí)行過程中人的問題、教學(xué)執(zhí)行過程中環(huán)境問題、教學(xué)執(zhí)行過程中學(xué)生對教學(xué)服務(wù)的滿意度、學(xué)習(xí)支持是否到位、學(xué)生的訴求能否得到及時(shí)回應(yīng)、教學(xué)問題是否能夠得到及時(shí)解決、教學(xué)實(shí)施過程是否有序進(jìn)行、實(shí)踐環(huán)節(jié)監(jiān)控是否到位、實(shí)踐環(huán)節(jié)教師指導(dǎo)是否到位等系列問題。如果在某個(gè)觀測點(diǎn)上沒有符合預(yù)期目標(biāo),要同時(shí)在這些點(diǎn)上給予相關(guān)調(diào)整。
2.技術(shù)監(jiān)控點(diǎn)
技術(shù)監(jiān)控點(diǎn)分為兩部分:硬件技術(shù)支持和軟件流程服務(wù)。硬件技術(shù)支持主要監(jiān)測帶寬、服務(wù)器均衡、線路擁塞、網(wǎng)絡(luò)等技術(shù)問題,檢驗(yàn)的是技術(shù)支持服務(wù)能否到位,能否為網(wǎng)絡(luò)教學(xué)提供可靠安全的運(yùn)行環(huán)境。軟件流程服務(wù)主要監(jiān)測教學(xué)系統(tǒng)流程設(shè)計(jì)是否符合常規(guī)操作流程,功能是否完備、運(yùn)行是否正常、是否能夠滿足正常教學(xué)活動需求等。
作用點(diǎn)是對監(jiān)控的問題進(jìn)行應(yīng)力的施加點(diǎn),它位于監(jiān)控點(diǎn)之后。系統(tǒng)根據(jù)不同的教學(xué)監(jiān)控點(diǎn)獲得相關(guān)信息,對于呈現(xiàn)的與標(biāo)準(zhǔn)不一致的問題進(jìn)行相應(yīng)調(diào)整,調(diào)整的程度決定了系統(tǒng)中反饋的作用力的大小。作用點(diǎn)作用在何處因問題而異,它與動作行為的滯前滯后有很大關(guān)系,即與延遲行為、組織行為、反饋速度、觀測點(diǎn)產(chǎn)生的影響有關(guān)系。多數(shù)教學(xué)的作用點(diǎn)應(yīng)該是對原來執(zhí)行教學(xué)過程反饋后回到起始點(diǎn)開始進(jìn)行修正。作用點(diǎn)上施加的應(yīng)力或采取的策略叫做作用力,監(jiān)控點(diǎn)、作用點(diǎn)與作用力的關(guān)系示意圖可以借鑒工業(yè)控制模型表達(dá)為如圖2所示的形式。
教學(xué)視點(diǎn)是觀察教學(xué)問題的角度和視野,教學(xué)視點(diǎn)決定了解決教學(xué)問題的態(tài)度和措施,因此教學(xué)視點(diǎn)的方向和廣域度將直接決定教學(xué)自身的態(tài)度。教學(xué)視點(diǎn)分為廣域視點(diǎn)和局域視點(diǎn)。廣域視點(diǎn)是站在管理者的角度實(shí)現(xiàn)的教學(xué)過程調(diào)控、教學(xué)質(zhì)量提升、教學(xué)能力提高、課程資源優(yōu)化、教學(xué)效果推動等,而局域視點(diǎn)則更加著眼于具體的教學(xué)過程的控制,如考試環(huán)節(jié)、授課環(huán)節(jié)、實(shí)踐環(huán)節(jié)、畢設(shè)環(huán)節(jié)等。遠(yuǎn)程教學(xué)視點(diǎn)是一種多源多方向的教育視點(diǎn),從提升教學(xué)質(zhì)量出發(fā),站在教學(xué)系統(tǒng)不同角色的角度,對教學(xué)數(shù)據(jù)挖掘的方向和挖掘的區(qū)域的進(jìn)行了界定,為數(shù)據(jù)挖掘的開展提供了明確的目標(biāo)。
沒有教學(xué)視點(diǎn)的數(shù)據(jù)是一個(gè)沒有意義的數(shù)據(jù)。但數(shù)據(jù)本身到底是有沒有意義,要根據(jù)研究視點(diǎn)的時(shí)間軸、類型、方向以及廣域度來考慮。某些數(shù)據(jù)看起來好像與事件無關(guān),但是如果研究出這些數(shù)據(jù)與其他數(shù)據(jù)之間的關(guān)系,這些數(shù)據(jù)就很可能具有利用價(jià)值。教育大數(shù)據(jù)的真正的特點(diǎn),是讓這些原來認(rèn)為無價(jià)值的數(shù)據(jù)、甚至好像無關(guān)聯(lián)的數(shù)據(jù)成為有價(jià)值、有關(guān)聯(lián)的數(shù)據(jù),把隱含的數(shù)據(jù)變成顯含的數(shù)據(jù)。數(shù)據(jù)關(guān)系的研究價(jià)值遠(yuǎn)遠(yuǎn)大于數(shù)據(jù)源本身的研究。
(一)教學(xué)大數(shù)據(jù)挖掘方向
數(shù)據(jù)本身是一種標(biāo)志,大數(shù)據(jù)挖掘的目標(biāo)是按照標(biāo)定的內(nèi)容去尋找事件的標(biāo)志,要挖掘現(xiàn)有數(shù)據(jù)的規(guī)律和思想。常規(guī)的數(shù)據(jù)挖掘都是對經(jīng)典數(shù)據(jù)進(jìn)行的,而經(jīng)典數(shù)據(jù)的存在實(shí)質(zhì)是大數(shù)據(jù)挖掘區(qū)域中很窄的一部分,是人們帶有一定偏向性的理解和帶有傳統(tǒng)性的教學(xué)數(shù)據(jù)的移植,構(gòu)不成大數(shù)據(jù)挖掘的前提條件,因此只能在這個(gè)小區(qū)域內(nèi)討論歷史數(shù)據(jù)的特性,對于整體教學(xué)質(zhì)量的提高和真正教育內(nèi)涵數(shù)據(jù)的處理無法構(gòu)成完整的系統(tǒng)和數(shù)據(jù)體系。在這種缺憾條件下,通過視點(diǎn)研究把所要討論和挖掘的目標(biāo)按照數(shù)據(jù)背景和教育視點(diǎn)進(jìn)行分類,在不同的分類下挖掘不同的數(shù)據(jù),才能有效地避免教育大數(shù)據(jù)的不相融。
大數(shù)據(jù)本身不是萬能的,不是有了大數(shù)據(jù)就能解決一切問題,大數(shù)據(jù)要站在可行的、落地的角度,要承認(rèn)目前歷史數(shù)據(jù)的不完整性,承認(rèn)目前管理思路的不連續(xù)性,承認(rèn)現(xiàn)在政策干預(yù)導(dǎo)致的數(shù)據(jù)的不純潔性,只有在這些條件下才能有效地析取出挖掘的方向和目標(biāo)。因此,本研究關(guān)注的教學(xué)大數(shù)據(jù)挖掘的方向,研究的是教學(xué)大數(shù)據(jù)挖掘的構(gòu)造、數(shù)據(jù)之間的關(guān)系、數(shù)據(jù)挖掘的目標(biāo)以及影響數(shù)據(jù)挖掘目標(biāo)的綜合因素。
大數(shù)據(jù)挖掘是個(gè)龐大的工程,除了現(xiàn)有經(jīng)典數(shù)據(jù)之外,還要擴(kuò)展其他的數(shù)據(jù)來源,可以是能夠被直觀辨識的,也可以是不能被直觀辨識的,例如語音、圖像、Web網(wǎng)站的議論等,這些現(xiàn)象比給經(jīng)典數(shù)據(jù)表達(dá)的含義更加明晰。雖然這些多源數(shù)據(jù)形式不同,但可以通過先進(jìn)的數(shù)據(jù)處理技術(shù)完成對它們的抽取和語義分析,實(shí)現(xiàn)數(shù)據(jù)規(guī)律的挖掘。除此之外,還要能夠根據(jù)歷史數(shù)據(jù)構(gòu)造和延展它的未來數(shù)據(jù)以及一些不可能獲取到或不可能成為現(xiàn)實(shí)的數(shù)據(jù),以此豐富教育大數(shù)據(jù)的內(nèi)涵。
(二)教學(xué)大數(shù)據(jù)挖掘分類
借助教學(xué)大數(shù)據(jù)挖掘的手段確定不同教學(xué)事件相關(guān)因素的規(guī)律,首先要對教學(xué)事件有一定的視點(diǎn)描述和視點(diǎn)規(guī)劃,不能是盲目的挖掘,要分析事件數(shù)據(jù)的特征,要從發(fā)展的視點(diǎn)去看待事件,找出事件的類型,確定事件是否值得挖掘、是否需要從歷史數(shù)據(jù)開始挖掘、是否需要從各個(gè)教學(xué)中心的數(shù)據(jù)開始挖掘,只有這樣才能找出教學(xué)控制中的控制因素和控制本質(zhì)。因此,對教學(xué)數(shù)據(jù)的挖掘應(yīng)首先對事件進(jìn)行分類,根據(jù)不同的分類決定如何進(jìn)行數(shù)據(jù)挖掘。對于有規(guī)律可循的事件可以通過數(shù)據(jù)挖掘找出相應(yīng)的規(guī)律,對于沒有規(guī)律的事件則不對其實(shí)施挖掘。有的事件本身的規(guī)律性非常明顯,可以直接進(jìn)行判定,則不需要對其進(jìn)行數(shù)據(jù)挖掘,還有一些事件是由若干個(gè)單一事件組合形成的,單一事件的規(guī)律對于組合事件具有一定的影響力,可以通過推理尋找到組合事件的規(guī)律。具體遵從的分類及處理原則范式如下:
1.IF事件∷this.可挖掘is TRUE THEN數(shù)據(jù)挖掘
2.IF事件∷this.可挖掘is FALSE THEN無法挖掘
3.IF事件∷this.標(biāo)志is TRUE THEN不必進(jìn)行數(shù)據(jù)挖掘
4.IF事件∷this.組合事件is TRUE THEN根據(jù)其他事件和數(shù)據(jù)的組合推斷規(guī)律
(三)教學(xué)大數(shù)據(jù)挖掘區(qū)域
教學(xué)事件的發(fā)生具有一定的時(shí)域性,直觀體現(xiàn)在時(shí)間軸的某個(gè)區(qū)域內(nèi),同時(shí)還會通過波形的變化表現(xiàn)出事件的特性。因此,教學(xué)大數(shù)據(jù)挖掘還可以從時(shí)間軸的角度來研究事件發(fā)生的區(qū)域,通過找出時(shí)間軸相關(guān)區(qū)域內(nèi)波形與波形之間的規(guī)律可以找到事件與事件之間的規(guī)律。同時(shí)還可以通過波形的分析找到各教學(xué)中心之間的同步規(guī)律、某個(gè)主站發(fā)生的問題到分站后波及、影響和衰減的規(guī)律,為主站與教學(xué)中心以及教學(xué)中心間相互借鑒事件發(fā)生規(guī)律和事件處理經(jīng)驗(yàn)提供一定的依據(jù)。
依據(jù)時(shí)間軸事件數(shù)據(jù)的圖形特性可以確定教育大數(shù)據(jù)挖掘的區(qū)域,通過對圖形規(guī)律的分析可以判斷相應(yīng)的事件及事件發(fā)生的特征。1.陡變型圖形:可以判斷圖形的上升沿對應(yīng)哪些事件的發(fā)生,尤其是進(jìn)行Web主動式搜索時(shí),圖形的波形越陡,說明事件的嚴(yán)重程度越高。2.持續(xù)型圖形:由于受到大環(huán)境、政策和思潮的影響出現(xiàn)連續(xù)的大事件,形成有一定規(guī)律特征的持續(xù)圖形。3.疊加型圖形:表示的是多個(gè)事件的組合,需要對不同的事件進(jìn)行分類,可以引用連續(xù)小波方法進(jìn)行縮放位移比對,找出各事件的類型和性質(zhì)。4.分布型圖形:當(dāng)數(shù)據(jù)在廣域多個(gè)網(wǎng)站和平臺同時(shí)出現(xiàn),或者短時(shí)間內(nèi)相繼出現(xiàn),或者滯后發(fā)現(xiàn)相似規(guī)律的圖形,就需要對各個(gè)教學(xué)中心進(jìn)行圖形分析,找到事件的共性。5.偶發(fā)型圖形:對于在時(shí)間軸上發(fā)生的重復(fù)性偶發(fā)事件,可以通過找出歷史時(shí)期所發(fā)生的事件與當(dāng)今事件的關(guān)系來判斷相應(yīng)的事件特性。6.組合型圖形:組合型圖形誘發(fā)了事件的關(guān)系組合,由某些小事件可誘發(fā)另一個(gè)大事件的組合,可通過對小事件的特征分析,推斷大事件的事件特性。
以上圖形的數(shù)據(jù)形成可以是經(jīng)典數(shù)據(jù)現(xiàn)象、Web數(shù)據(jù)現(xiàn)象或圖像語義分析數(shù)據(jù)現(xiàn)象,也可以是三者數(shù)據(jù)的組合現(xiàn)象。
(四)教學(xué)大數(shù)據(jù)挖掘方法
基于教學(xué)視點(diǎn)確定了數(shù)據(jù)挖掘方向和挖掘區(qū)域之后,本團(tuán)隊(duì)展開了針對多源異構(gòu)教育數(shù)據(jù)的挖掘方法研究,圖3所示為多源異構(gòu)數(shù)據(jù)挖掘的邏輯示意圖。挖掘過程共分為三層,底層的數(shù)據(jù)層是多來源多形態(tài)的數(shù)據(jù)集合,可以是結(jié)構(gòu)化、半結(jié)構(gòu)化或非結(jié)構(gòu)化的數(shù)據(jù),這些數(shù)據(jù)經(jīng)過語義層的分析,進(jìn)行不同的歸類,為進(jìn)一步的挖掘做好準(zhǔn)備。結(jié)果層針對不同的數(shù)據(jù)類型采用相應(yīng)的方法實(shí)現(xiàn)數(shù)據(jù)結(jié)果的判定。
經(jīng)典數(shù)據(jù)的挖掘是在教育視點(diǎn)的前提下對相關(guān)數(shù)據(jù)以及相關(guān)聯(lián)數(shù)據(jù)進(jìn)行挖掘的過程,通過挖掘找出數(shù)據(jù)的因果關(guān)系和相關(guān)關(guān)系,找出相應(yīng)的事件關(guān)系和規(guī)律。采用改進(jìn)的K-MEANS聚類等算法實(shí)現(xiàn)了經(jīng)典數(shù)據(jù)挖掘。
圖像數(shù)據(jù)的挖掘是在教育視點(diǎn)給定的有限方向和區(qū)域內(nèi)進(jìn)行挖掘。通過圖像數(shù)據(jù)語義的分析,找到相應(yīng)圖像的判定結(jié)果,給出更加直觀的數(shù)據(jù)現(xiàn)象,如本團(tuán)隊(duì)開發(fā)的考場監(jiān)控系統(tǒng)實(shí)現(xiàn)了教學(xué)監(jiān)控大數(shù)據(jù)挖掘。圖像數(shù)據(jù)挖掘在某種程度上更加直觀和易于理解,它的判定結(jié)果對經(jīng)典數(shù)據(jù)挖掘結(jié)果是—種有效的匹配和驗(yàn)證。采用基于骨架特征提取的行為分析數(shù)據(jù)挖掘方法實(shí)現(xiàn)了圖像數(shù)據(jù)的挖掘。
通過在Web網(wǎng)絡(luò)中搜索網(wǎng)站的點(diǎn)擊率、網(wǎng)站的議論以及手機(jī)相關(guān)信息并對其進(jìn)行分析,站在教育視點(diǎn)廣域的角度上完成有限的網(wǎng)站和相關(guān)的手機(jī)群的數(shù)據(jù)語義挖掘。通過語義分析找出學(xué)習(xí)者對教育問題的訴求,找到他們在教學(xué)視點(diǎn)問題上對資源的評價(jià)和對教學(xué)評價(jià)等信息,利用基于關(guān)鍵字抽取的文本聚類算法實(shí)現(xiàn)了Web數(shù)據(jù)挖掘。
以上幾種數(shù)據(jù)挖掘的現(xiàn)象和結(jié)果是相輔相成的,它們對于事件的分析形成了統(tǒng)一的認(rèn)識。這種挖掘的綜合結(jié)果更加客觀、直觀,為教學(xué)數(shù)據(jù)挖掘提出了一種更廣闊的思路。
教學(xué)數(shù)據(jù)視點(diǎn)研究的是看待數(shù)據(jù)的立場、目標(biāo)和態(tài)度,它是一個(gè)綜合視點(diǎn)。人們在觀察事物的時(shí)候通常帶有一定的態(tài)度,因此觀察數(shù)據(jù)時(shí)也會具有一定的觀點(diǎn)。數(shù)據(jù)視點(diǎn)本身含有一種主觀性,是將獲取的客觀數(shù)據(jù)根據(jù)主觀的態(tài)度進(jìn)行分析,將多種數(shù)據(jù)和事件的判定進(jìn)行綜合,找出教學(xué)的綜合觀點(diǎn)。由于分析者本身帶有視點(diǎn)的感情和情緒,所以分析的立場各不相同,分析數(shù)據(jù)的關(guān)注度也各不相同。教學(xué)數(shù)據(jù)視點(diǎn)是基于教學(xué)數(shù)據(jù)基礎(chǔ)上,結(jié)合觀測者本人的視點(diǎn)以及他所研究的視點(diǎn)需求的基礎(chǔ)上,提出自己對數(shù)據(jù)處理的概念。教學(xué)數(shù)據(jù)視點(diǎn)的觀測應(yīng)具備正確性、前瞻l(fā)生、延續(xù)性和科學(xué)性,研究視點(diǎn)的目標(biāo)是通過獲取數(shù)據(jù)和提取數(shù)據(jù)的手段和方法凝練出數(shù)據(jù)事實(shí),尋找到事件的影響因素和發(fā)展趨勢,同時(shí)還能根據(jù)處理的問題延伸出相應(yīng)的教學(xué)策略和搜索策略。
從不同的觀察角度來看待數(shù)據(jù)視點(diǎn)會產(chǎn)生不同的視點(diǎn)分類:1.主客觀角度。從主客觀角度來分,數(shù)據(jù)視點(diǎn)分為主觀數(shù)據(jù)視點(diǎn)和客觀數(shù)據(jù)視點(diǎn)。2.經(jīng)驗(yàn)角度。從經(jīng)驗(yàn)角度來分,數(shù)據(jù)視點(diǎn)分為經(jīng)驗(yàn)數(shù)據(jù)視點(diǎn)和非經(jīng)驗(yàn)數(shù)據(jù)視點(diǎn)。3.技術(shù)角度。從技術(shù)角度來分,數(shù)據(jù)視點(diǎn)分為經(jīng)典數(shù)據(jù)視點(diǎn)、Web數(shù)據(jù)視點(diǎn)、圖像數(shù)據(jù)視點(diǎn)、VR/AR數(shù)據(jù)視點(diǎn)。4.數(shù)據(jù)關(guān)系角度。從數(shù)據(jù)關(guān)系角度來分,數(shù)據(jù)視點(diǎn)分為相關(guān)關(guān)系數(shù)據(jù)視點(diǎn)和因果關(guān)系數(shù)據(jù)視點(diǎn)。
教學(xué)數(shù)據(jù)視點(diǎn)是從科學(xué)的角度提出的,它描述了教育研究者或者需要研究某個(gè)方向和目標(biāo)的工作人員所要完成的任務(wù),它根據(jù)需求給出了不同角度、不同位置、不同任務(wù)和不同級別的事件因素的觀測點(diǎn)和數(shù)據(jù)的獲取點(diǎn)。
從教學(xué)的視點(diǎn)研究教學(xué)質(zhì)量的提高,必須要先明確教學(xué)的組成部分及各部分的組成要素,本研究從遠(yuǎn)程教育中教師、學(xué)習(xí)者、管理者等不同角度描述了與其自身相關(guān)的教學(xué)問題、教學(xué)元素和教學(xué)功能,明確了每個(gè)問題的相關(guān)因素,通過對這些因素的調(diào)整和控制,可以實(shí)現(xiàn)系統(tǒng)整體教學(xué)質(zhì)量的最優(yōu)控制。同時(shí)它也是教學(xué)數(shù)據(jù)挖掘參考模型和設(shè)計(jì)框架,是一種數(shù)據(jù)挖掘的因果關(guān)系和線索圖,為教育數(shù)據(jù)挖掘和管理設(shè)計(jì)提供了相應(yīng)的思路和路線,也為相關(guān)人員解決教學(xué)問題提供了方案。
(一)學(xué)習(xí)過程教師視點(diǎn)
表1所示為遠(yuǎn)程學(xué)習(xí)過程中教師視點(diǎn)示意表,該表呈現(xiàn)了教師在教學(xué)中關(guān)心的教學(xué)范圍,包括備課資源、評價(jià)獲取、課程基礎(chǔ)、學(xué)生層次、大綱進(jìn)度、輔導(dǎo)團(tuán)隊(duì)課件制作團(tuán)隊(duì)能力、資源平臺、資源環(huán)境、作業(yè)/考核平臺功能、實(shí)踐環(huán)節(jié)平臺功能、支持服務(wù)平臺功能、反饋功能以及與這些內(nèi)容相關(guān)的一些子因素,當(dāng)教師在教學(xué)中遇到相關(guān)問題時(shí),可以通過數(shù)據(jù)挖掘獲取該問題的子因素并對其進(jìn)行分析獲得解決思路,也可以明確通過哪些子因素的改善可以達(dá)到問題的最優(yōu),同時(shí)還可以借助大數(shù)據(jù)挖掘的手段獲取相關(guān)的數(shù)據(jù)信息和規(guī)律,為問題的解決提供有效的依據(jù)。
(二)學(xué)習(xí)過程學(xué)習(xí)者視點(diǎn)
表2所示為遠(yuǎn)程學(xué)習(xí)過程中學(xué)習(xí)者視點(diǎn)示意表。從學(xué)習(xí)者的角度看待教學(xué),他們所關(guān)心的問題包括資源質(zhì)量、教師質(zhì)量、作業(yè)/考核、教學(xué)環(huán)境、資源評價(jià)、實(shí)踐環(huán)境和學(xué)習(xí)支持。根據(jù)這些模塊中所涉及的信息特征,系統(tǒng)可以分別去挖掘相關(guān)的數(shù)據(jù)為學(xué)習(xí)者的學(xué)習(xí)提供有效的支持。
(三)學(xué)習(xí)過程管理者視點(diǎn)
遠(yuǎn)程教學(xué)系統(tǒng)的管理者視點(diǎn)是站在系統(tǒng)宏觀管理的角度來看待教學(xué)中的相關(guān)事件,他所關(guān)心的是學(xué)習(xí)者的學(xué)習(xí)行為、教師的教學(xué)行為、學(xué)習(xí)者和教師之間的關(guān)系、學(xué)習(xí)者和教學(xué)進(jìn)度的關(guān)系、教學(xué)支持服務(wù)、教學(xué)環(huán)境以及教學(xué)突發(fā)事件的處理。管理者的關(guān)注點(diǎn)與教師和學(xué)生不同,關(guān)注的事件延展性更強(qiáng)、涉及的時(shí)間軸跨度更大、教學(xué)數(shù)據(jù)的獲取范圍更廣,更加側(cè)重于教學(xué)系統(tǒng)整體與目標(biāo)的接近度。表3所示為學(xué)習(xí)過程管理者視點(diǎn)示意表,表中呈現(xiàn)了不同的教學(xué)事件及其相關(guān)因素,為數(shù)據(jù)挖掘提供了[長1[寬]兩種不同的思維角度,其中[長]是從時(shí)間軸的角度對數(shù)據(jù)進(jìn)行歷史性分析,代表了對歷史數(shù)據(jù)的挖掘,[寬]是從教學(xué)覆蓋范圍的角度對數(shù)據(jù)進(jìn)行分析,主要指對各教學(xué)中心數(shù)據(jù)的挖掘。通過相關(guān)的事件的分析和挖掘,可以為教學(xué)質(zhì)量的評價(jià)提供可靠的依據(jù)。
(四)學(xué)習(xí)過程資源設(shè)計(jì)視點(diǎn)
教學(xué)資源是教學(xué)質(zhì)量的重要組成部分,資源設(shè)計(jì)的質(zhì)量直接決定了學(xué)生的學(xué)習(xí)興趣度、學(xué)習(xí)深入度和學(xué)習(xí)效果。下頁表4所示為學(xué)習(xí)過程資源設(shè)計(jì)視點(diǎn)示意表,呈現(xiàn)了資源設(shè)計(jì)中相關(guān)的事件及影響因素。優(yōu)秀的學(xué)習(xí)資源應(yīng)該具備良好的開發(fā)團(tuán)隊(duì),不僅要從內(nèi)容上與教學(xué)大綱知識點(diǎn)相吻合,更需要注重資源效果的展示。遠(yuǎn)程的網(wǎng)絡(luò)教學(xué)中,教學(xué)資源是教學(xué)的命脈,除了教師要具備良好的教學(xué)素質(zhì)之外,資源是否能夠吸引學(xué)生是提高他們對課程關(guān)注和學(xué)習(xí)的重要環(huán)節(jié),因此,課程的編導(dǎo)比傳統(tǒng)教學(xué)方式顯得更為重要。要將教師對知識和學(xué)科的理解融入教學(xué)資源設(shè)計(jì)中,加入影視資源設(shè)計(jì)的理念,針對不同層次的學(xué)習(xí)者設(shè)計(jì)不同風(fēng)格和類型的資源,要能對資源進(jìn)行碎片化管理,使學(xué)生可以根據(jù)個(gè)人的關(guān)注度對資源進(jìn)行自由裁剪,要擴(kuò)展資源的獲取手段和方式,利用先進(jìn)的技術(shù)從網(wǎng)絡(luò)中不斷獲取最新的教學(xué)資源。資源使用效果的評價(jià)是資源設(shè)計(jì)的重要反饋環(huán)節(jié),通過學(xué)習(xí)者對資源不同渠道、多種方式的反饋,可以實(shí)現(xiàn)對資源的不斷修正,從而達(dá)到資源質(zhì)量的最優(yōu)控制。
(五)教學(xué)事件處理視點(diǎn)
遠(yuǎn)程教學(xué)由于其本身的特殊性,呈現(xiàn)出了傳統(tǒng)教學(xué)所不具備的特性,如教學(xué)環(huán)境復(fù)雜、學(xué)生分布廣、學(xué)生水平層次不同、師生交互受限等。在這種7*24小時(shí)不間斷的教學(xué)環(huán)境中,對教學(xué)事件的及時(shí)有效處理成為了保障教學(xué)秩序的非常重要的環(huán)節(jié),尤其是對于突發(fā)事件,要能夠做到及時(shí)檢測、分析和處理。通常情況下,教學(xué)事件的產(chǎn)生具有一定的前兆性、關(guān)聯(lián)性和預(yù)測性,要想處理好當(dāng)前發(fā)生的事件,必須要了解和挖掘與之相關(guān)的現(xiàn)象和信息,從這些數(shù)據(jù)中推斷出事件的起因、涉及的因素等信息,從而為決策提供有效的依據(jù)。除此之外,利用數(shù)據(jù)挖掘的手段,通過對歷史數(shù)據(jù)的波形分析,找到事件發(fā)生的規(guī)律,實(shí)現(xiàn)教學(xué)事件的預(yù)測,對于遠(yuǎn)程教學(xué)具有非常重要的意義。表5為教學(xué)事件處理視點(diǎn)示意表。
(六)教學(xué)實(shí)例
基于以上大數(shù)據(jù)挖掘模式和教學(xué)管理視點(diǎn),本團(tuán)隊(duì)實(shí)現(xiàn)了北京理工大學(xué)遠(yuǎn)程教學(xué)平臺的教學(xué)作弊行為監(jiān)控子系統(tǒng)。系統(tǒng)站在教學(xué)管理者對教學(xué)事件處理的視點(diǎn)上,利用了多源異構(gòu)數(shù)據(jù)源的理念,從經(jīng)典數(shù)據(jù)、Web網(wǎng)絡(luò)數(shù)據(jù)和視頻監(jiān)控?cái)?shù)據(jù)的角度,獲取了考試成績、考試結(jié)束后學(xué)生在Web討論群中對于考試的議論信息以及考試過程中的視頻監(jiān)控?cái)?shù)據(jù)三類數(shù)據(jù)源。對于經(jīng)典數(shù)據(jù)的處理,系統(tǒng)主要完成的是考試成績與考場座位之間的關(guān)聯(lián)的分析。對于Web數(shù)據(jù)的采集,系統(tǒng)主要獲取的是遠(yuǎn)程教學(xué)網(wǎng)站交互系統(tǒng)討論群中的數(shù)據(jù),采用基于關(guān)鍵字抽取的文本聚類算法完成了關(guān)鍵字抽取、情感分析。對于視頻圖像監(jiān)控?cái)?shù)據(jù),利用基于骨架特征提取的行為分析數(shù)據(jù)挖掘方法通過對考生頭部、上身的運(yùn)動方向和運(yùn)動軌跡數(shù)據(jù)的提取和分析,實(shí)現(xiàn)了考生考場行為的監(jiān)控和判斷。
教學(xué)作弊行為監(jiān)控子系統(tǒng)工作流程如圖4所示。作弊行為的判斷所采用的三種數(shù)據(jù)源之間相互輔佐,相互支撐,為最終作弊行為的判定起到了相互印證的作用。系統(tǒng)最終的判定取決于三種數(shù)據(jù)源分析結(jié)果的綜合。系統(tǒng)中維護(hù)了判定策略庫、關(guān)鍵字庫、異常行為模板庫、關(guān)聯(lián)關(guān)系庫等多個(gè)相關(guān)數(shù)據(jù)庫,分別支撐不同的數(shù)據(jù)源的挖掘判定。最終系統(tǒng)根據(jù)三種數(shù)據(jù)源的分析結(jié)果進(jìn)行綜合,利用策略庫中提供的策略方案實(shí)現(xiàn)作弊行為的判定輸出。
傳統(tǒng)大數(shù)據(jù)挖掘的數(shù)據(jù)來源非常有限,挖掘結(jié)果的有效性和針對性不強(qiáng)。通過對其進(jìn)行擴(kuò)充,增加Web數(shù)據(jù)和圖像數(shù)據(jù)作為新的數(shù)據(jù)源,可以有效提高數(shù)據(jù)挖掘的準(zhǔn)確性。教學(xué)數(shù)據(jù)的挖掘應(yīng)該具有明確的挖掘區(qū)域和方向,挖掘的目標(biāo)不僅要尋找教學(xué)事件的因果關(guān)系,還要挖掘出事件之間的相關(guān)性和內(nèi)涵性。數(shù)據(jù)挖掘的準(zhǔn)確度以及挖掘的強(qiáng)度取決于看待教學(xué)的角度,論文據(jù)此提出了教學(xué)視點(diǎn)和數(shù)據(jù)視點(diǎn)的概念,通過遠(yuǎn)程教學(xué)實(shí)例研究,明確了教學(xué)視點(diǎn)下教學(xué)人員應(yīng)具備的素質(zhì)和對數(shù)據(jù)的態(tài)度。通過對數(shù)據(jù)挖掘方法的研究找出教學(xué)質(zhì)量控制內(nèi)涵及控制自變量屬性,從而實(shí)現(xiàn)教學(xué)質(zhì)量控制目標(biāo)。