国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

教育大數(shù)據(jù)背景下智能測評研究的現(xiàn)實(shí)審視與發(fā)展趨向

2018-08-07 10:45牟智佳俞顯
中國遠(yuǎn)程教育 2018年5期
關(guān)鍵詞:教育大數(shù)據(jù)學(xué)習(xí)分析個性化學(xué)習(xí)

牟智佳 俞顯

【摘 要】 人工智能、學(xué)習(xí)分析與教育大數(shù)據(jù)之間的相互融合使得學(xué)習(xí)評價由數(shù)字化的學(xué)習(xí)測評走向數(shù)據(jù)化的智能測評。從智能測評技術(shù)發(fā)展視角對國內(nèi)外相關(guān)平臺進(jìn)行梳理和分析,發(fā)現(xiàn)智能測評平臺存在測評目的異化、測評數(shù)據(jù)采集單一、測評分析缺乏深度、測評結(jié)果可視化水平低和測評反饋智能化薄弱五方面問題。本文從智能測評研究視角對國內(nèi)外現(xiàn)狀進(jìn)行內(nèi)容分析,把握研究態(tài)勢與不足;在此基礎(chǔ)上對智能測評發(fā)展的理論與技術(shù)趨向、目標(biāo)導(dǎo)向進(jìn)行闡釋;最后提出智能測評服務(wù)模式,即以支持個性化學(xué)習(xí)為目標(biāo)導(dǎo)向,以基于學(xué)習(xí)能力的學(xué)習(xí)練習(xí)智能匹配、基于內(nèi)容掌握的個性化學(xué)習(xí)路徑規(guī)劃、基于活動參與的個性優(yōu)勢識別以及基于測評結(jié)果的知識地圖描繪為服務(wù)支持,為將來智能測評發(fā)展與研究提供有益的啟示。

【關(guān)鍵詞】 教育大數(shù)據(jù);智能測評;學(xué)習(xí)分析;機(jī)器學(xué)習(xí);個性化學(xué)習(xí)

【中圖分類號】 G642.0 【文獻(xiàn)標(biāo)識碼】 A 【文章編號】 1009-458x(2018)5-0055-8

一、學(xué)習(xí)測評發(fā)展的現(xiàn)實(shí)困境與突破口

當(dāng)前學(xué)校教育中對學(xué)習(xí)的測評側(cè)重學(xué)習(xí)結(jié)果的顯性表現(xiàn),如測評得分、題目正確率、成績排名等,對學(xué)習(xí)者的隱性行為關(guān)注較少,如對學(xué)習(xí)內(nèi)容的掌握程度、協(xié)作學(xué)習(xí)活動內(nèi)容的貢獻(xiàn)度、達(dá)到學(xué)習(xí)目標(biāo)的層級水平等。學(xué)習(xí)評價專家保羅和迪倫(Paul & Dylan, 1998)認(rèn)為如果一個評價僅僅用于評定分?jǐn)?shù),內(nèi)容上沒有提供進(jìn)一步的學(xué)習(xí)機(jī)會,評價就不是真正形成性的,只有評價揭示了學(xué)生思維的具體方面,借助這些方式才能進(jìn)一步開展有效教學(xué),并且運(yùn)用所揭示的診斷性信息為學(xué)習(xí)者提供額外的學(xué)習(xí)機(jī)會。數(shù)字化環(huán)境下的學(xué)習(xí)評價既注重學(xué)生的總結(jié)性評價,更關(guān)注學(xué)生的形成性評價(Tomas, Borg, & McNeil, 2015)。評價的形成性本質(zhì)不但存在于評價本身中,而且存在于評價與其課堂角色的交互中。如何對整個學(xué)習(xí)活動過程進(jìn)行有效評價并判別出學(xué)習(xí)者在知識、能力和思維方面的真實(shí)水平是當(dāng)前學(xué)習(xí)評價面臨的現(xiàn)實(shí)困境。

近年來,教育大數(shù)據(jù)、學(xué)習(xí)分析和智能網(wǎng)絡(luò)學(xué)習(xí)平臺的逐步發(fā)展使得學(xué)習(xí)軌跡不僅能夠得到記錄進(jìn)而形成全學(xué)習(xí)過程數(shù)據(jù)鏈,而且能夠?qū)W(xué)習(xí)過程和結(jié)果進(jìn)行個性化分析和評測。而以深度學(xué)習(xí)、機(jī)器學(xué)習(xí)、自然語言處理等為代表的人工智能技術(shù)興起,使得測評技術(shù)更加智能和精準(zhǔn),基于學(xué)習(xí)內(nèi)容和結(jié)果可以對學(xué)習(xí)者的知識和能力水平進(jìn)行智能化評測,以更好地服務(wù)于認(rèn)知診斷。因此,我們可以借助大數(shù)據(jù)和學(xué)習(xí)分析技術(shù)對學(xué)習(xí)過程中的階段性學(xué)習(xí)表現(xiàn)進(jìn)行評價和歸因分析,并結(jié)合學(xué)習(xí)者的個性特征定制基于內(nèi)容掌握的學(xué)習(xí)路徑,最終促進(jìn)其對知識的深度理解和概念的掌握。

二、基于教育大數(shù)據(jù)的智能測評平臺梳理分析

(一)智能測評平臺的功能比較分析

為了解當(dāng)前智能測評技術(shù)在實(shí)踐中的應(yīng)用和發(fā)展情況,本研究借助國內(nèi)外搜索引擎對國內(nèi)外有關(guān)文字書寫、語音分析、測評考試等不同智能測評平臺進(jìn)行整理分析。在選取智能測評平臺的過程中,以具備多元化、智能化、交互性、可視化等特征為依據(jù),確保分析的智能測評平臺符合本研究的需求。對平臺的分析從使用對象、數(shù)據(jù)采集來源、分析內(nèi)容、結(jié)果呈現(xiàn)形式、特色功能展現(xiàn)等方面進(jìn)行多維對比,結(jié)果見表1。

可以發(fā)現(xiàn),在分析對象上,平臺較為關(guān)注學(xué)生在群體中的表現(xiàn),其測評結(jié)果偏重于比較;在數(shù)據(jù)采集來源上,平臺采用多種方式收集,既使用傳統(tǒng)的試卷、問卷和量表,也使用動作捕獲感應(yīng)器、自然語音拾取等高科技手段;在分析內(nèi)容上,當(dāng)前國內(nèi)外智能測評平臺涉及的測評內(nèi)容除以學(xué)業(yè)成績、語言能力、實(shí)驗操作能力等為代表的學(xué)業(yè)水平測評外,也涉及心理測量、學(xué)習(xí)自適應(yīng)能力等非學(xué)業(yè)水平方面的測評;在數(shù)據(jù)類型上,結(jié)構(gòu)化數(shù)據(jù)是目前各測評平臺數(shù)據(jù)的主要類型,目的在于方便數(shù)據(jù)分析,并以可視化方式呈現(xiàn)最終結(jié)果。

(二)智能測評平臺存在的問題分析

通過對國內(nèi)外主流智能測評平臺進(jìn)行梳理分析發(fā)現(xiàn),當(dāng)前智能測試平臺存在以下五方面問題:

1. 測評目的異化

研究者在分析上述智能測評平臺的過程中發(fā)現(xiàn),無論從所面向的使用對象還是分析內(nèi)容的組成上看,均存在較為明顯的測評目的異化的情況(該現(xiàn)象在國內(nèi)實(shí)踐中尤為突出),即測評目的在于選拔和甄別,而忽視測評的診斷、反饋和促進(jìn)功能。如測評平臺關(guān)注區(qū)域教育質(zhì)量監(jiān)測及對比、學(xué)校辦學(xué)質(zhì)量分析、教師教學(xué)質(zhì)量分析、學(xué)生學(xué)業(yè)成就分析,而提供的診斷報告集中在基于常模參照測量下的排序和比較,具有較為明顯的“排位次”現(xiàn)象。測評需要為教師精準(zhǔn)教學(xué)和學(xué)生高效學(xué)習(xí)提供有效支持,如果盲目追求測評的選拔和甄別作用,缺少基于測評結(jié)果的教與學(xué)的優(yōu)化,則會造成測評活動舍本逐末無助于教與學(xué)改進(jìn)的困境。

2. 測評數(shù)據(jù)采集相對單一

數(shù)據(jù)采集的內(nèi)容和形式將直接決定后續(xù)分析的廣度和深度。從數(shù)據(jù)內(nèi)容上看,當(dāng)前智能測評平臺主要以學(xué)業(yè)成績數(shù)據(jù)為主,缺乏對學(xué)生日常學(xué)習(xí)行為數(shù)據(jù)、家庭背景信息等重要內(nèi)容的采集;從數(shù)據(jù)類型上看,已有分析數(shù)據(jù)以結(jié)構(gòu)化數(shù)據(jù)為主,如學(xué)生的試卷分?jǐn)?shù)、調(diào)查問卷結(jié)果、在線學(xué)習(xí)時間、點(diǎn)擊次數(shù)等,缺乏對更能體現(xiàn)學(xué)生情感、價值觀、學(xué)習(xí)品質(zhì)和學(xué)習(xí)思維等非結(jié)構(gòu)化信息內(nèi)容的采集;從數(shù)據(jù)收集時間跨度上看,以階段性、結(jié)果性數(shù)據(jù)為主,缺乏對日常關(guān)鍵事件和典型表現(xiàn)等行為數(shù)據(jù)的收集。當(dāng)前,無論是數(shù)據(jù)內(nèi)容和類型,還是數(shù)據(jù)收集的時間跨度,現(xiàn)有測評平臺尚未達(dá)到智能測評對數(shù)據(jù)采集的要求。

3. 測評分析缺乏深度

受限于測試數(shù)據(jù)采集較為單一,目前各測評平臺在分析內(nèi)容和分析方法上的設(shè)計也較為簡單。在分析內(nèi)容上,主要是對采用問卷、試卷等測量工具獲取的區(qū)域教育質(zhì)量、學(xué)生學(xué)業(yè)成就等方面信息進(jìn)行分析;從分析方法上看,以描述性的量化統(tǒng)計分析為主,缺乏質(zhì)性分析及縱向和橫向的對比分析,缺乏從多角度、多層次分析同一對象;從測量統(tǒng)計理論的應(yīng)用上看,主要以經(jīng)典測量理論作為理論依據(jù),缺乏對于更能反映學(xué)生認(rèn)知過程、數(shù)據(jù)處理精度更高的認(rèn)知診斷和項目反應(yīng)等理論的應(yīng)用。因此,分析結(jié)果往往較為片面,無法形成有效的證據(jù)鏈,可信度不高。

4. 測評結(jié)果可視化程度低

通過分析各類評測平臺可知,用圖表對分析結(jié)果進(jìn)行可視化輸出是當(dāng)前各智能測評平臺結(jié)果呈現(xiàn)的主要特征,這一形式符合信息可視化,有助于信息理解、采納和創(chuàng)新的研究結(jié)論(趙慧臣, 2014)。目前,測評平臺一般采用靜態(tài)和動態(tài)兩種類型的可視化結(jié)果。靜態(tài)的可視化結(jié)果是指以直方圖、雷達(dá)圖、數(shù)據(jù)儀表盤等圖表呈現(xiàn)的結(jié)果,一般不能更改;動態(tài)的可視化結(jié)果是指通過選擇和關(guān)聯(lián)不同時間、測評維度和統(tǒng)計分析指標(biāo)來呈現(xiàn)的測評結(jié)果,具有交互性功能。例如在分析學(xué)生口語表達(dá)能力時,學(xué)生可以按照自己的需求選擇語音、詞匯等分項內(nèi)容的診斷結(jié)果,也可以自定義分項成績來模擬當(dāng)前口語水平與目標(biāo)水平的差距等。整體而言,測評結(jié)果的可視化在數(shù)據(jù)更新、圖形化、交互性等方面還較弱。

5. 測評反饋智能化水平薄弱

智能測評平臺的關(guān)鍵特征是測試結(jié)果的智能化和個性化,平臺應(yīng)基于對區(qū)域、學(xué)校、學(xué)生作答數(shù)據(jù)的分析結(jié)果提供相應(yīng)的教育質(zhì)量預(yù)測和改進(jìn)建議。但從目前的調(diào)查來看,各測評平臺提供預(yù)測和建議的功能有待完善。部分提供教與學(xué)改進(jìn)建議的平臺并沒有做到個性化,給出的建議較為寬泛且缺乏個性化分析。所分析的測試平臺均未提供預(yù)測分析功能。由此可以看出,實(shí)踐中有較多測評平臺冠以智能之名,但未有智能之實(shí),這一現(xiàn)象也值得深思。

三、數(shù)據(jù)集驅(qū)動的智能測評研究現(xiàn)狀分析

為了解近年來國內(nèi)外智能測評研究的整體狀況,對國內(nèi)外相關(guān)文獻(xiàn)進(jìn)行梳理和內(nèi)容分析。其中,中文文獻(xiàn)的檢索選取中國期刊全文數(shù)據(jù)庫、中國博士和碩士學(xué)位論文全文數(shù)據(jù)庫和中國重要會議論文全文數(shù)據(jù)庫作為樣本來源,以下述檢索式進(jìn)行檢索:檢索項為“主題”;檢索詞為“智能測評”“智能反饋系統(tǒng)”“智能測試系統(tǒng)”“智能評價”;根據(jù)相關(guān)文獻(xiàn)出現(xiàn)的初始時間和研究進(jìn)度確定時間跨度為2002年1月至2016年12月;匹配方式為“模糊”。剔除會議通知、簡訊等無關(guān)內(nèi)容,篩選后共獲得樣本文獻(xiàn)19篇。外文文獻(xiàn)的檢索選取Elsevier ScienceDirect、Springer Link、Wiley Blackwell、Web of Science等國外知名數(shù)據(jù)庫為樣本文章來源,以下述檢索式進(jìn)行檢索;檢索項為“Theme”;檢索詞為“intelligent assessment”“intelligent evaluation”“artificial assessment”“artificial evaluation”;時間跨度與中文文獻(xiàn)一致,并輔之以Google學(xué)術(shù)搜索。剔除會議通知、workshop等非研究文獻(xiàn),共獲得有效文獻(xiàn)23篇。通過對所獲樣本的整合與分析,當(dāng)前國內(nèi)外智能測評研究主要集中在以下幾個方面:

(一)智能測評的理論與技術(shù)研究

該類研究主要集中在智能測評結(jié)構(gòu)觀的認(rèn)識和發(fā)展探討、智能測評量表設(shè)計與開發(fā)的理論依據(jù)、智能測評的算法和模型等方面。例如,邱江等(2004)在借鑒國外學(xué)者對智能結(jié)構(gòu)最新研究成果的基礎(chǔ)上,分析了未來智能測驗應(yīng)遵循的原則并進(jìn)行了智能測驗的試題編制。Yulan He等(2009)在文本語義挖掘研究中對潛在語義分析(Latent Semantic Analysis, LSA)、n-gram共生和BLEU等技術(shù)進(jìn)行深入分析,結(jié)果表明與現(xiàn)有技術(shù)相比,新技術(shù)支持的文本自動化評估能夠?qū)崿F(xiàn)文本分析高精度并且顯著提高分析性能。

(二)智能測評系統(tǒng)的設(shè)計與實(shí)現(xiàn)

這方面研究主要圍繞多元化、個性化智能測評系統(tǒng)的設(shè)計和實(shí)現(xiàn)來展開。例如,吳志剛等(2010)在研究學(xué)習(xí)者和學(xué)習(xí)內(nèi)容的基礎(chǔ)上,整合學(xué)習(xí)目標(biāo)、學(xué)習(xí)能力、評價方法等因素提出三維個性化評價模型,并從提升系統(tǒng)的效度和可用性出發(fā),構(gòu)建了個性化智能測評系統(tǒng)模型。Arturas Kaklauskas等(2015)采用生物特征識別、語音壓力分析和特殊算法開發(fā)了智能自我評估系統(tǒng),支持考生在正式考試前對自己的情緒和壓力進(jìn)行測評,為幫助學(xué)生緩解考前壓力和平復(fù)緊張情緒提供參考。Ifeyinwa Chika等(2008)利用增強(qiáng)現(xiàn)實(shí)技術(shù)構(gòu)建了一個集成智能測評功能的虛擬實(shí)驗室,該虛擬實(shí)驗室可以實(shí)時動態(tài)地采集學(xué)生在實(shí)驗過程中的操作過程數(shù)據(jù)并自動反饋實(shí)驗效果達(dá)成度等診斷信息。

(三)基于智能測評系統(tǒng)的教與學(xué)應(yīng)用研究

這類研究主要包含智能測評技術(shù)在語言學(xué)習(xí)中的應(yīng)用、智能測評在混合式教學(xué)和在線學(xué)習(xí)中的應(yīng)用、基于智能測評結(jié)果的教與學(xué)改進(jìn)策略和模式等。例如,李娟(2016)基于“注意假設(shè)”理論,通過兩個班級的口語教學(xué)實(shí)踐和語用能力調(diào)查以及對學(xué)生的訪談發(fā)現(xiàn)移動智能測評終端的應(yīng)用有助于提高教學(xué)效果。 Chia-I Chang(2002)針對網(wǎng)絡(luò)學(xué)習(xí)中如何評價學(xué)習(xí)者離線后課程學(xué)習(xí)表現(xiàn)的問題,提出了基于《學(xué)生問題課程量表》(Student Problem Course Scale)的在線智能測評系統(tǒng),該系統(tǒng)能夠依據(jù)學(xué)生的個性特征和需求組織課程材料并生成課程內(nèi)容,其自適應(yīng)和自組織特性能夠激發(fā)學(xué)生學(xué)習(xí)課程的興趣和參與度。Uday Kumar等(2011)利用智能測評的相關(guān)理論構(gòu)建了在線智能評估系統(tǒng),用以測量學(xué)習(xí)者在線學(xué)習(xí)表現(xiàn)以及為學(xué)習(xí)者推薦個性化學(xué)習(xí)資源,幫助學(xué)習(xí)者挖掘自身學(xué)習(xí)潛力并提高其學(xué)習(xí)表現(xiàn)。

通過對國內(nèi)外智能測評研究的分析可知,當(dāng)前多元智能理論是智能測評的主要理論依據(jù),新的“智能學(xué)說”正不斷受到研究者的關(guān)注;在測量趨向上,研究者開始使用新的算法和模型,并結(jié)合新的測量統(tǒng)計理論來不斷提高智能測評系統(tǒng)的測量精度。在設(shè)計趨向上,基于個性化測評結(jié)果的教與學(xué)改進(jìn)得到普遍認(rèn)同,這是智能測評的價值追求所在,也是智能測評服務(wù)模式的內(nèi)在要義。然而,目前有關(guān)智能測評的理論和技術(shù)走向尚不明晰,智能測評在學(xué)習(xí)過程中如何實(shí)時監(jiān)控和預(yù)警,在學(xué)習(xí)結(jié)果上如何促進(jìn)學(xué)生個性發(fā)展是測評走向智能化和個性化必須面對的重要議題。

四、智能測評發(fā)展的理論與技術(shù)趨向

學(xué)習(xí)測評的關(guān)鍵原理是必須提供反饋和回溯的機(jī)會,而且被評價的內(nèi)容必須和學(xué)生的學(xué)習(xí)目標(biāo)相一致(Briansford, Brown, & Cockin, 2013)。智能測評需要在學(xué)習(xí)內(nèi)容、學(xué)習(xí)過程和學(xué)習(xí)目標(biāo)等方面提供個性化學(xué)習(xí)評價結(jié)果,以此作為改進(jìn)教與學(xué)的反饋信息的來源。因此,智能測評發(fā)展需要以個性化學(xué)習(xí)為目標(biāo),以形成性評價為中心,以學(xué)習(xí)理論為指導(dǎo),以機(jī)器學(xué)習(xí)分析和自然語言處理為技術(shù)支撐,持續(xù)對學(xué)生的知識、思維和理解進(jìn)行評價和反饋,最終促進(jìn)學(xué)習(xí)者達(dá)成目標(biāo)。

(一)智能測評發(fā)展的理論趨向

1. 以內(nèi)容為導(dǎo)向的概念轉(zhuǎn)變學(xué)習(xí)理論

促進(jìn)學(xué)習(xí)者對所學(xué)知識點(diǎn)的概念理解是學(xué)習(xí)測評的一個重要目的。而在概念理解上,特別是理科知識概念,存在容易讓學(xué)習(xí)者困惑的相異概念、迷思概念、直覺概念等,因此需要通過智能測評發(fā)現(xiàn)并促使學(xué)習(xí)者完成概念轉(zhuǎn)變,其中包括通過題目和選項的分析挖掘出學(xué)習(xí)者存在的迷思概念和通過觀點(diǎn)分析并轉(zhuǎn)變先前概念背后的本體論和認(rèn)知論假定。此外,對學(xué)習(xí)者建模的評判可以了解其概念轉(zhuǎn)變過程,當(dāng)學(xué)習(xí)者建構(gòu)并轉(zhuǎn)變他們的模型時,他們就在通過改變正在學(xué)習(xí)的概念重新組織知識結(jié)構(gòu)(高文等, 2009)。

2. 以理解為導(dǎo)向的生成性學(xué)習(xí)理論

學(xué)習(xí)結(jié)果是學(xué)習(xí)者在完成知識內(nèi)容學(xué)習(xí)和參與學(xué)習(xí)活動之后在知識內(nèi)化上的集中體現(xiàn),對學(xué)習(xí)結(jié)果的評價離不開學(xué)習(xí)過程和活動,而對過程進(jìn)行持續(xù)跟蹤和評價有助于及時發(fā)現(xiàn)學(xué)習(xí)問題,并提供學(xué)習(xí)干預(yù)和補(bǔ)救。生成性理論強(qiáng)調(diào)在學(xué)習(xí)過程中學(xué)習(xí)者對知識的理解和意義建構(gòu)(Wittrock, 1974)。該理論的基本假設(shè)是學(xué)習(xí)者是學(xué)習(xí)過程的主動參與者,只有通過個體生成關(guān)系和理解,才能生成有意義的知識。智能測評在內(nèi)容上的設(shè)計應(yīng)將測評內(nèi)容和知識點(diǎn)與學(xué)習(xí)者所學(xué)內(nèi)容進(jìn)行關(guān)聯(lián),并著重理解性題目內(nèi)容的設(shè)計和評價,以促使學(xué)習(xí)者建立知識之間的聯(lián)系并生成自己的理解。

3. 以結(jié)果為導(dǎo)向的學(xué)習(xí)目標(biāo)分類理論

對學(xué)習(xí)結(jié)果的測評不僅要關(guān)注所取得的成績和知識掌握程度,也要了解學(xué)習(xí)者在學(xué)習(xí)目標(biāo)上所達(dá)到的層級,以進(jìn)一步合理規(guī)劃后面的學(xué)習(xí)內(nèi)容和學(xué)習(xí)活動。而在目標(biāo)分類理論上,注重通過外顯行為觀測目標(biāo)的布魯姆教學(xué)目標(biāo)分類理論能夠有效區(qū)分學(xué)習(xí)者的能力表現(xiàn)。布魯姆提出的教學(xué)目標(biāo)分類理論包含兩方面特征:①用學(xué)生的外顯行為來陳述目標(biāo);②目標(biāo)是有層次結(jié)構(gòu)的。該分類理論包括知道、領(lǐng)會、應(yīng)用、分析、評價和創(chuàng)造六個層級,能夠?qū)W(xué)生的行為由簡單到復(fù)雜按秩序排列,并具有連續(xù)性和累積性(Krathwohl, 2002)。研究者Rex Heer(2012)在該分類理論基礎(chǔ)上增加了知識層級維度,形成了以知識和認(rèn)知過程為組合的二維表,對學(xué)生的學(xué)習(xí)結(jié)果表現(xiàn)可以通過這兩個維度進(jìn)行坐標(biāo)定位,了解學(xué)生達(dá)到的能力層級。

(二)智能測評發(fā)展的技術(shù)趨向

1. 基于學(xué)習(xí)行為數(shù)據(jù)鏈的機(jī)器學(xué)習(xí)分析技術(shù)

大數(shù)據(jù)技術(shù)、數(shù)據(jù)科學(xué)和移動技術(shù)的日漸成熟和廣泛應(yīng)用使得學(xué)習(xí)者在任何情境下的數(shù)字化學(xué)習(xí)行為得到跟蹤和記錄。學(xué)習(xí)行為時間點(diǎn)包含學(xué)習(xí)者在線預(yù)習(xí)、活動參與、學(xué)習(xí)測評等整個學(xué)習(xí)流程。而學(xué)習(xí)行為數(shù)據(jù)類型則包含隱性學(xué)習(xí)行為和外顯學(xué)習(xí)行為。其中隱性學(xué)習(xí)行為是學(xué)習(xí)者在學(xué)習(xí)活動過程中所進(jìn)行的有意識的、無意識的、分散的、連續(xù)的、跳躍的等不確定特征的思考和行為過程,而外顯學(xué)習(xí)行為是學(xué)習(xí)者在參與學(xué)習(xí)活動過程中與學(xué)習(xí)資源、學(xué)習(xí)平臺交互所產(chǎn)生的行為路徑。學(xué)習(xí)行為時間點(diǎn)和數(shù)據(jù)類型構(gòu)成了整個學(xué)習(xí)數(shù)據(jù)鏈,為智能測評提供了大數(shù)據(jù)源。而基于這些學(xué)習(xí)大數(shù)據(jù)應(yīng)用機(jī)器學(xué)習(xí)技術(shù)進(jìn)行測評可以精準(zhǔn)識別出學(xué)習(xí)者在行為偏好、知識強(qiáng)弱、能力水平、學(xué)習(xí)路徑等方面的個性特征,從而為后面的學(xué)習(xí)任務(wù)智能匹配提供數(shù)據(jù)支持,最終使學(xué)生的學(xué)習(xí)更有效。

2. 基于生成文本數(shù)據(jù)鏈的自然語言處理技術(shù)

學(xué)習(xí)者在練習(xí)測評過程中的學(xué)習(xí)行為除了通過鼠標(biāo)輸入的客觀題作答數(shù)據(jù),還包括通過鍵盤輸入的以文本為交互內(nèi)容的主觀題作答數(shù)據(jù)。而對這些文本內(nèi)容進(jìn)行情境化分析則需要自然語言處理技術(shù),包括詞法分析、句法分析、語義分析、文本生成、語音識別等。在自然語言處理系統(tǒng)輸入層面上,要使系統(tǒng)能夠處理基于不同終端和多種輸入方式生成的真實(shí)文本數(shù)據(jù);在輸出層面上,使系統(tǒng)能夠?qū)ξ谋緝?nèi)容進(jìn)行深層理解,提取符合作答內(nèi)容的關(guān)鍵信息以及包含個人情感和觀點(diǎn)的個性信息。隨著混合式學(xué)習(xí)逐步成為常態(tài),學(xué)生的測評內(nèi)容既包括傳統(tǒng)紙質(zhì)文本數(shù)據(jù),還包括在線測評文本數(shù)據(jù)。因此,需要整合兩部分真實(shí)文本數(shù)據(jù)。由于測評內(nèi)容的分布性和真實(shí)情境性,未來應(yīng)當(dāng)進(jìn)一步加強(qiáng)不同情境真實(shí)語料庫的整合以及大規(guī)模、信息豐富的詞典編制工作,以提高測評文本的實(shí)時性和精準(zhǔn)性。

(三)智能測評發(fā)展的目標(biāo)導(dǎo)向

1. 以個性化學(xué)習(xí)為目標(biāo)

《國家教育事業(yè)發(fā)展“十三五”規(guī)劃》(2017)在主題主線部分中提出,積極促進(jìn)信息技術(shù)與教育的融合創(chuàng)新發(fā)展,努力構(gòu)建網(wǎng)絡(luò)化、數(shù)字化、個性化、終身化的教育體系。歷年新媒體聯(lián)盟《地平線報告》高等教育版和基礎(chǔ)教育版中多次將推進(jìn)個性化學(xué)習(xí)作為影響學(xué)校應(yīng)用教育技術(shù)的重要挑戰(zhàn)(Johnson, 2015, 2016)。從新媒體技術(shù)的發(fā)展軌跡來看,平板電腦、自適應(yīng)技術(shù)、人工智能等技術(shù)正逐步在教育中進(jìn)行深度應(yīng)用和融合,這為個性化學(xué)習(xí)提供了有力的技術(shù)支撐。因此,為學(xué)生提供個性化學(xué)習(xí)服務(wù)是教育信息化發(fā)展的題中應(yīng)有之義。而智能測評作為學(xué)習(xí)流程的最后環(huán)節(jié)應(yīng)當(dāng)基于個人學(xué)習(xí)目標(biāo)和內(nèi)容進(jìn)行智能評價和診斷,為學(xué)習(xí)者提供差異化學(xué)習(xí)報告和反饋,最終促進(jìn)個性化學(xué)習(xí)。

2. 以個性化學(xué)習(xí)過程為對象

要使智能測評能夠支持學(xué)習(xí)者的個性化學(xué)習(xí),需要對個性化學(xué)習(xí)過程特征進(jìn)行總結(jié)。為了解國內(nèi)外關(guān)于個性化學(xué)習(xí)過程特征的相關(guān)內(nèi)容,基于國內(nèi)外文獻(xiàn)數(shù)據(jù)庫進(jìn)行檢索,之后對文獻(xiàn)做二次整理分析,篩選出與個性化學(xué)習(xí)過程特征內(nèi)容直接相關(guān)的文獻(xiàn),通過對所篩選文獻(xiàn)進(jìn)行內(nèi)容分析整理出數(shù)字化學(xué)習(xí)環(huán)境下個性化學(xué)習(xí)過程特征的內(nèi)容,見表2。

由表2可知,在分析視角方面國外較為微觀聚焦,側(cè)重學(xué)習(xí)特征的內(nèi)容,而國內(nèi)分析側(cè)重整個學(xué)習(xí)過程。在個性化學(xué)習(xí)特征內(nèi)容分析方面,國外側(cè)重分析學(xué)習(xí)者、學(xué)習(xí)結(jié)果和學(xué)習(xí)心理,而國內(nèi)則注重分析學(xué)習(xí)環(huán)境和學(xué)習(xí)活動過程。受研究范式、文化和國情等影響,兩者之間體現(xiàn)出不同的研究取向??傮w而言,在分析視角方面主要集中在個性化學(xué)習(xí)環(huán)境、個性化學(xué)習(xí)特征和個性化學(xué)習(xí)過程。而在個性化學(xué)習(xí)特征內(nèi)容分析方面主要集中在個性特征、學(xué)習(xí)活動與內(nèi)容、學(xué)習(xí)目標(biāo)、學(xué)習(xí)結(jié)果與評價和學(xué)習(xí)心理等方面。在數(shù)字化學(xué)習(xí)環(huán)境下,為了使個性化學(xué)習(xí)更具可實(shí)施性和操作性,并使其與測評對象相關(guān)聯(lián),從學(xué)習(xí)內(nèi)容、學(xué)習(xí)活動和學(xué)習(xí)結(jié)果三個方面對個性化學(xué)習(xí)過程的特征進(jìn)行總結(jié)。在教育大數(shù)據(jù)和學(xué)習(xí)分析支撐下,智能測評在個性分析和差異評價上將凸顯出其技術(shù)優(yōu)勢,基于學(xué)生的個性化學(xué)習(xí)過程提供學(xué)習(xí)評價和反饋是未來實(shí)現(xiàn)測評智能化的主要路徑。

五、智能測評服務(wù)的實(shí)現(xiàn)路徑

在上述理論與技術(shù)的支撐下,智能測評服務(wù)應(yīng)當(dāng)以面向個性化學(xué)習(xí)為宗旨,在學(xué)習(xí)任務(wù)上以學(xué)習(xí)能力為評價起點(diǎn),基于能力水平智能匹配學(xué)習(xí)任務(wù)以實(shí)現(xiàn)有效學(xué)習(xí);在學(xué)習(xí)路徑上以內(nèi)容掌握為評價標(biāo)準(zhǔn),依據(jù)測評結(jié)果提供個性化學(xué)習(xí)路徑以實(shí)現(xiàn)高效學(xué)習(xí);在學(xué)習(xí)過程上以活動參與為評價對象,依據(jù)學(xué)習(xí)行為特征識別出個性優(yōu)勢以進(jìn)行個性化培育;在學(xué)習(xí)目標(biāo)上以學(xué)習(xí)表現(xiàn)為評價結(jié)果,依據(jù)知識掌握和能力水平描繪個人知識地圖以精準(zhǔn)定位學(xué)習(xí)狀態(tài)并據(jù)此合理設(shè)定目標(biāo)。

(一)基于學(xué)習(xí)能力的學(xué)習(xí)練習(xí)智能匹配

傳統(tǒng)練習(xí)環(huán)境下衍生出的題海戰(zhàn)術(shù)盡管在提高成績上有一定的效果,但花費(fèi)的時間成本較高,學(xué)習(xí)者往往需要遍歷每套試題中的所有題目才能找到真正薄弱點(diǎn)。在理科題目練習(xí)中,不同選項的答案反映出學(xué)習(xí)者頭腦中應(yīng)用不同推理邏輯計算得出的結(jié)果,這折射出學(xué)習(xí)者存在迷思概念和先前知識不足的可能性。當(dāng)前,數(shù)字化學(xué)習(xí)環(huán)境下的錯題練習(xí)較多是基于同類知識點(diǎn)題目進(jìn)行分析推送,缺少關(guān)注學(xué)習(xí)者已有知識及其思維方式。智能測評環(huán)境下的練習(xí)應(yīng)當(dāng)根據(jù)學(xué)習(xí)能力和學(xué)習(xí)思維,智能匹配與其水平和先驗知識相當(dāng)?shù)木毩?xí)測評任務(wù),讓其測評過程既有挑戰(zhàn)性又有成就感,同時能夠使其從知識理解層面完成從迷思概念到正確概念的轉(zhuǎn)變。

(二)基于內(nèi)容掌握的個性化學(xué)習(xí)路徑規(guī)劃

最近發(fā)展區(qū)理論對學(xué)生能力范圍的清晰界定和差異表現(xiàn)說明傳統(tǒng)測評在評價內(nèi)容和反饋步調(diào)上整齊劃一的特性無助于促成每個學(xué)習(xí)者達(dá)成目標(biāo)。個體學(xué)習(xí)風(fēng)格和能力的差異使得學(xué)習(xí)測評要以內(nèi)容掌握為常量,以掌握時間為變量,根據(jù)學(xué)習(xí)者的掌握程度和進(jìn)度動態(tài)規(guī)劃學(xué)習(xí)內(nèi)容和活動路徑。在設(shè)計和分析上應(yīng)當(dāng)對學(xué)科知識點(diǎn)進(jìn)行屬性標(biāo)記,包括難度、掌握程度、學(xué)習(xí)狀態(tài)等。其中,難度區(qū)分為簡單、中等和困難;掌握程度區(qū)分為未掌握和已掌握;學(xué)習(xí)狀態(tài)區(qū)分為待學(xué)習(xí)、進(jìn)行中和已完成?;跍y評內(nèi)容結(jié)果對知識學(xué)習(xí)狀態(tài)進(jìn)行評估,進(jìn)而動態(tài)優(yōu)化后面的學(xué)習(xí)路徑,使學(xué)習(xí)能夠循序漸進(jìn)并更加有效。

(三)基于活動參與的個性優(yōu)勢識別

學(xué)習(xí)結(jié)果是學(xué)習(xí)過程的精煉理解,通過對學(xué)習(xí)活動、過程和行為進(jìn)行分析和評價可以更為精準(zhǔn)地測評出學(xué)習(xí)者的知識水平和能力特征。學(xué)習(xí)活動行為既包括外在行為,如訪問學(xué)習(xí)資源、測評考試、互動交流等,也包括內(nèi)在行為,如學(xué)習(xí)偏好、思維特征、能力傾向等。相對于傳統(tǒng)學(xué)習(xí)環(huán)境在數(shù)據(jù)搜集上的乏力性,數(shù)字化學(xué)習(xí)環(huán)境下的學(xué)習(xí)行為數(shù)據(jù)可以通過學(xué)習(xí)平臺進(jìn)行記錄和搜集,由此我們可以對其進(jìn)行個性化分析,洞察學(xué)生的真實(shí)學(xué)習(xí)過程和能力,識別出其個性優(yōu)勢。依據(jù)加德納的多元智能理論對學(xué)習(xí)者在測評題目、觀點(diǎn)表達(dá)、行為路徑等方面進(jìn)行內(nèi)容和行為解析,獲取學(xué)習(xí)者在語言、數(shù)理邏輯、空間、人際等方面的個性特征,有助于創(chuàng)新型和個性化人才的培養(yǎng)。

(四)基于測評結(jié)果的知識地圖描繪

對學(xué)習(xí)結(jié)果的測評和反饋不僅僅是對題目內(nèi)容對錯的簡單評判,還要從學(xué)科知識內(nèi)容出發(fā),識別出學(xué)生知識薄弱點(diǎn),并根據(jù)知識點(diǎn)間的相互承接關(guān)系和掌握程度描繪出個人知識地圖。在知識地圖的構(gòu)建上,通過采集學(xué)習(xí)者結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化學(xué)習(xí)行為數(shù)據(jù)對其進(jìn)行結(jié)構(gòu)化處理,利用實(shí)體識別、語義推理、關(guān)系抽取與識別等技術(shù)進(jìn)行挖掘和構(gòu)建。知識地圖應(yīng)當(dāng)具備知識推理的邏輯結(jié)構(gòu)能力,并使知識內(nèi)容和關(guān)系更好地理解語義范圍域,根據(jù)測評結(jié)果實(shí)時更新地圖內(nèi)容。通過知識地圖中知識點(diǎn)邏輯關(guān)系、掌握度、強(qiáng)弱點(diǎn)、迷思概念等信息呈現(xiàn)促使學(xué)習(xí)者的自我概念系統(tǒng)向科學(xué)概念系統(tǒng)轉(zhuǎn)變。

[參考文獻(xiàn)]

丁念金. 2013. 基于個性化學(xué)習(xí)的課堂轉(zhuǎn)變[J]. 課程·教材·教法(8):42-46.

高文,等. 2009. 學(xué)習(xí)科學(xué)的關(guān)鍵詞[M]. 上海:華東師范大學(xué)出版社.

國務(wù)院關(guān)于印發(fā)國家教育事業(yè)發(fā)展“十三五”規(guī)劃的通知. 2017. http://www.gov.cn/zhengce/content/2017-01/19/content_5161341.htm

蔣志輝. 2013. 網(wǎng)絡(luò)環(huán)境下個性化學(xué)習(xí)的模式建構(gòu)與策略優(yōu)化[J]. 中國遠(yuǎn)程教育(2):48-51.

李廣,姜英杰. 2015. 個性化學(xué)習(xí)的理論建構(gòu)與特征分析[J]. 東北師范大學(xué)學(xué)報:哲學(xué)社會科學(xué)版(3):152-156.

李娟. 2016. 移動智能測評終端的應(yīng)用及評估:以語用能力調(diào)查問卷為例[J]. 南京理工大學(xué)學(xué)報:社會科學(xué)版(3):63-68.

邱江,張慶林. 2004. Shavinina的智能測評觀述評[J]. 心理科學(xué)進(jìn)展(3):416-422.

孫剛成,王瑩,楊眉. 2014. 泛在學(xué)習(xí)視域下的個性化學(xué)習(xí)取向[J]. 教學(xué)與管理(7):132-133.

吳志剛,張紅軍,蔡俊. 2010. 計算機(jī)與教育:理論、實(shí)踐與創(chuàng)新——全國計算機(jī)輔助教育學(xué)會第十四屆學(xué)術(shù)年會論文集:個性化智能評測系統(tǒng)模型[C]. 上海:中國人工智能學(xué)會計算機(jī)輔助教育專業(yè)委員會:528-532.

趙慧臣,王淑艷. 2014. 知識可視化應(yīng)用于學(xué)科教學(xué)的新觀點(diǎn):訪瑞士知識可視化研究開拓者馬丁·愛普教授[J]. 開放教育研究(2):4-10.

Briansford, J., Brown, A., & Cockin, R. (2013). How people learn: Brain, mind, experience, and scholl. Shanghai: East China Normal University Press.

Chang, C. I. (2002). Intelligent assessment of distance learning. Information Sciences, 140(1), 105-125.

Chika, I. E., Azzi, D., Azzi, D., Stocker, J., & Haynes, B. (2008). Genuine lab experiences for students in resource constrained environments: The realLab with integrated intelligent assessment. International Journal of Online Engineering, 4(3), 18-24.

Department for Education and Skills (DfES). (2004). A national conversation about personalized learning. Nottingham: DfES.

DiMartino, J., Clarke, J., & Wold, D. (2001). Personalized learning: Preparing high school students to create their futures. Lanham, MD: Scarecrow Press.

Giancarlo, B. (2006). Advanced personalized learning and training applications through mobile technologies and services. In Nejdl W., Tochtermann K. (Eds.), Innovative approaches for learning and knowledge sharing: Lecture notes in computer science (pp. 555-560). Berlin: Springer.

Hamideh, A., & Jafar, T. (2010). A high level architecture for personalized learning in collaborative networks. In Camarinha-Matos, L.M., Boucher, X., Afsarmanesh, H. (Eds.), Collaborative networks for a sustainable world IFIP advances in information and communication technology (pp. 601-608). Berlin: Springer.

He, Y., Hui, S. C., & Quan, T. T. (2009). Automatic summary assessment for intelligent tutoring systems. Computers & Education, 53(3),890-899.

Johnson, L., Adams, B., Cummins, M., Estrada, V., Freeman, A., & Hall, C. (2016). NMC horizon report: 2016 higher education edition. Austin, Texas: The New Media Consortium.

Johnson, L., Adams B., Estrada, V., & Freeman, A. (2015). NMC horizon report: 2015 K-12 edition. Austin, Texas: The New Media Consortium.

Kaklauskas, A. (2015). Biometric and intelligent self-assessment of student progress system. Computers & Education, 55(2), 821-833.

Keamy, R. L., Nicholas, H. R, & Mahar, S. (2007). Personalizing education: From research to policy and practice. Melbourne: Department of Education & Early Childhood Development.

Kim, C. M. (2012). The role of affective and motivational factors in designing personalized learning environments. Educational Technology Research and Development, 60(4), 563-584.

Krathwohl, D. R. (2002). A revision of Bloom's taxonomy: An overview. Theory into practice, 41(4), 212-218.

Michael, P. (2009). Personalization, personalized learning and the reform of social policy: The prospect of molecular governance in the digitized society. Policy Futures in Education, 7(6), 615-627.

Paul, B. & Dylan, W. (1998). Assessment and classroom learning. Assessment in Education Principles Policy & Practice, 5(1), 7-74.

Rex, H. (2012). A Model of Learning Objectives based on A Taxonomy for Learning, Teaching, and Assessing: A Revision of Bloom's Taxonomy of Educational Objectives. www.celt.iastate.edu/teaching/RevisedBlooms1.html

Stefanie, G., & Andreas, H. (2012). Systems for personalized learning: Personal learning environment vs. e-portfolio? In Cheung, S. K. S., Fong, J., Kwok, L. F., Li, K., Kwan, R. (Eds.), Lecture notes in computer science (pp. 294-305). Berlin: Springer.

Tomas, C., Borg, M., & McNeil, J. (2015). E-assessment: Institutional development strategies and the assessment life cycle. British Journal of Educational Technology, 46(3), 588-596.

Uday, M., Mamatha, J., Jain, S., & Jain, D. (2011). Intelligent online assessment methodology. In Abraham, A., Corchado, E., Han, S. C. (Eds.), International conference on next generation web services practices (pp. 215-220). Spain: IEEE.

Waldrip, B., Cox, P., Deed, C., Dorman, J., Edwards, D., & Farrelly, C., et al. (2014). Student perceptions of personalized learning: Development and validation of a questionnaire with regional secondary students. Learning Environments Research, 17(3), 355-370.

Wittrock, M. C. (1974). Learning as a generative process. Educational Psychologist, 45(2), 40-45.

作者簡介:牟智佳,博士,講師,本文通訊作者,江南大學(xué)人文學(xué)院(214122)。

俞顯,碩士,寧波市教育考試院(315000)。

責(zé)任編輯 單 玲

猜你喜歡
教育大數(shù)據(jù)學(xué)習(xí)分析個性化學(xué)習(xí)
“教育大數(shù)據(jù)”視角下的精準(zhǔn)教學(xué)的研究
教育大數(shù)據(jù)在教育管理中的運(yùn)用分析
大數(shù)據(jù)思維下教學(xué)過程數(shù)據(jù)分析及應(yīng)用研究
在線學(xué)習(xí)過程管理大數(shù)據(jù)的建設(shè)與應(yīng)用
教學(xué)資源支持下的Sakai個性化學(xué)習(xí)研究
信息化環(huán)境下基于“盒子魚”App的高中英語個性化學(xué)習(xí)的模式和策略
簡析小學(xué)勞動與技術(shù)教育的有效合作學(xué)習(xí)
教育大數(shù)據(jù)研究綜述
微視頻在初中英語聽力教學(xué)中的應(yīng)用探索
基于SOA的在線學(xué)習(xí)資源集成模式的研究
陆川县| 禹州市| 咸宁市| 申扎县| 镇平县| 托克托县| 姚安县| 集安市| 昌宁县| 中卫市| 锡林郭勒盟| 阳西县| 疏勒县| 临安市| 西林县| 桐梓县| 汽车| 焉耆| 新疆| 吉首市| 四会市| 广丰县| 南皮县| 措美县| 高淳县| 阜新| 凭祥市| 右玉县| 小金县| 塔河县| 郯城县| 探索| 利川市| 财经| 平潭县| 吐鲁番市| 北海市| 石河子市| 手游| 筠连县| 英山县|