摘要:該研究探討了生成式人工智能(AIGC)賦能的非線性學(xué)習(xí)智能體模型建構(gòu),分析了非線性學(xué)習(xí)的特點(diǎn),并預(yù)設(shè)了自學(xué)、混合和協(xié)作三種學(xué)習(xí)場境?;谶@些場境推導(dǎo)出智能體模型的功能需求,進(jìn)而抽象出模型的核心能力。該文界定了非線性學(xué)習(xí)智能體的含義、數(shù)學(xué)表達(dá)式及核心算法,并闡述智能體模型的核心是一個改進(jìn)的馬爾可夫決策過程,旨在能夠?yàn)閷W(xué)習(xí)者提供個性化、動態(tài)優(yōu)化的學(xué)習(xí)支持,有效提升非線性學(xué)習(xí)的效率,為AIGC在教育領(lǐng)域的應(yīng)用提供了新的模型構(gòu)建方法,對推動教育信息化和個性化學(xué)習(xí)具有重要意義。
關(guān)鍵詞:生成式人工智能;非線性學(xué)習(xí);智能體模型;個性化學(xué)習(xí);教育信息化
中圖分類號:G434 文獻(xiàn)標(biāo)識碼:A
* 本文系國家社會科學(xué)基金教育學(xué)國家重點(diǎn)項(xiàng)目“中國數(shù)字教育實(shí)踐的理論建構(gòu)研究”(項(xiàng)目批準(zhǔn)號:ACA240018)研究成果。
生成式人工智能(Generative Artificial Intelligence,簡稱AIGC)是人工智能領(lǐng)域的一個重要分支,它不僅能夠創(chuàng)造新的內(nèi)容,而且還能分析或處理現(xiàn)有數(shù)據(jù)[1]。AIGC可以生成文本、圖像、音頻等多種形式的內(nèi)容,其核心在于通過學(xué)習(xí)大量數(shù)據(jù)來理解和模仿人類的創(chuàng)造過程。隨著AIGC技術(shù)的迅速發(fā)展,教育行業(yè)正經(jīng)歷一場深刻的變革[2]。在此背景下,非線性學(xué)習(xí)理論逐漸受到關(guān)注。這一理論強(qiáng)調(diào)學(xué)習(xí)過程的自主性、碎片化和跳躍性,打破了傳統(tǒng)線性學(xué)習(xí)的局限,更符合現(xiàn)代學(xué)習(xí)者的需求[3]。AIGC技術(shù)的引入,使得非線性學(xué)習(xí)的實(shí)施變得更加可行和高效。然而,如何利用AIGC構(gòu)建支持非線性學(xué)習(xí)的智能體模型,仍然是一個亟待解決的問題。
盡管AIGC在教育中的潛力巨大,當(dāng)前的應(yīng)用仍存在許多挑戰(zhàn)和不足。特別是在非線性學(xué)習(xí)環(huán)境中,如何構(gòu)建一個支持個性化、互動性強(qiáng)的智能體模型仍是一個亟待解決的問題。本研究的目的在于填補(bǔ)這一空白,通過深入分析非線性學(xué)習(xí)理論,結(jié)合AIGC技術(shù),提出一種新型的智能體模型。研究意義在于,不僅能夠豐富非線性學(xué)習(xí)的理論應(yīng)用,還能為實(shí)際教學(xué)提供可行的創(chuàng)新模式,促進(jìn)教育現(xiàn)代化和個性化發(fā)展。
(一)非線性學(xué)習(xí)理論緣起與理論原理
非線性學(xué)習(xí)理論的提出源于對傳統(tǒng)線性教學(xué)模式的深刻反思。王繼新等人在2009年首次提出了非線性學(xué)習(xí)的概念,為這一領(lǐng)域的研究奠定了基礎(chǔ)[4]。他們定義非線性學(xué)習(xí)為一種打破傳統(tǒng)線性學(xué)習(xí)模式的新型學(xué)習(xí)方式,強(qiáng)調(diào)學(xué)習(xí)過程的動態(tài)性、靈活性和個體差異性。具體而言,非線性學(xué)習(xí)是以非線性科學(xué)的思想方法為指導(dǎo),以教育認(rèn)知與神經(jīng)科學(xué)為基石,以現(xiàn)代信息科學(xué)與技術(shù)為支撐,以復(fù)雜領(lǐng)域知識之習(xí)得為主要目標(biāo)的一種學(xué)習(xí)形態(tài)。這一定義強(qiáng)調(diào)了非線性學(xué)習(xí)的跨學(xué)科特性,體現(xiàn)了其在當(dāng)代學(xué)習(xí)研究中的重要地位。
非線性學(xué)習(xí)理論的發(fā)展汲取了多種既有教育理論的精華,并在此基礎(chǔ)上進(jìn)行了創(chuàng)新和發(fā)展。其中,皮亞杰的建構(gòu)主義理論[5]和戴維·科爾布的體驗(yàn)式學(xué)習(xí)理論[6]為非線性學(xué)習(xí)理論提供了重要的思想啟發(fā)和理論基礎(chǔ)。建構(gòu)主義理論強(qiáng)調(diào)學(xué)習(xí)者主動構(gòu)建知識的過程,這與非線性學(xué)習(xí)強(qiáng)調(diào)學(xué)習(xí)者自主選擇和主動參與的理念高度一致。皮亞杰認(rèn)為,學(xué)習(xí)不是簡單的知識傳遞,而是學(xué)習(xí)者基于已有經(jīng)驗(yàn)主動建構(gòu)新知識的過程。這一觀點(diǎn)為非線性學(xué)習(xí)中強(qiáng)調(diào)學(xué)習(xí)者主動性的特征提供了理論依據(jù)。
從理論基礎(chǔ)來看,非線性學(xué)習(xí)主要遵循三個基本原理:時空變換原理、混沌原理和自組織原理[7]。時空變換原理體現(xiàn)了非線性學(xué)習(xí)在時間和空間兩個維度上的同時展開,實(shí)現(xiàn)了從“因時而異”和“因事而異”到“因人而異”的跨越,達(dá)到真正意義上的個性化學(xué)習(xí)?;煦缭斫沂玖朔蔷€性學(xué)習(xí)系統(tǒng)對初始條件的高度敏感性,強(qiáng)調(diào)了學(xué)習(xí)過程中細(xì)微變化可能帶來的巨大影響。自組織原理則說明非線性學(xué)習(xí)系統(tǒng)是一個開放的、能與外界進(jìn)行物質(zhì)和能量交換的系統(tǒng),能夠通過自組織形成新的有序結(jié)構(gòu)。
(二)非線性學(xué)習(xí)的特點(diǎn)及相關(guān)研究
非線性學(xué)習(xí)具有幾個顯著特點(diǎn):(1)學(xué)習(xí)時間的碎片性:學(xué)習(xí)者可以在不同時間片段內(nèi)圍繞同一主題進(jìn)行學(xué)習(xí)。(2)學(xué)習(xí)空間的多樣性:包括實(shí)體空間、虛擬空間和交往空間。(3)學(xué)習(xí)內(nèi)容的非系統(tǒng)性:學(xué)習(xí)者可以從任意點(diǎn)切入知識體系。(4)拖拉式的信息傳遞:學(xué)習(xí)者主動獲取知識而非被動接受。(5)知識建構(gòu)的主動性:特別適合復(fù)雜領(lǐng)域和非結(jié)構(gòu)化知識的學(xué)習(xí)。
在研究方面,國內(nèi)外學(xué)者的關(guān)注點(diǎn)存在一定差異。國外研究多集中于理論構(gòu)建和實(shí)證研究,探討非線性學(xué)習(xí)的本質(zhì)特征和內(nèi)在機(jī)制。例如,一些研究者利用復(fù)雜系統(tǒng)理論來解釋非線性學(xué)習(xí)過程[8]。相比之下,國內(nèi)研究則更多關(guān)注非線性學(xué)習(xí)理論在實(shí)際教學(xué)中的應(yīng)用[9],尤其是在信息化教學(xué)環(huán)境下如何實(shí)施非線性學(xué)習(xí)。隨著深度學(xué)習(xí)和自適應(yīng)控制系統(tǒng)等技術(shù)的發(fā)展,非線性學(xué)習(xí)理論在解釋學(xué)習(xí)過程的復(fù)雜性和動態(tài)性方面展現(xiàn)出了新的潛力。這些技術(shù)為非線性學(xué)習(xí)提供了更加精確和個性化的支持,推動了理論的進(jìn)一步發(fā)展和應(yīng)用。
總的來說,非線性學(xué)習(xí)理論的研究仍在不斷深化和擴(kuò)展。未來的研究方向可能包括非線性學(xué)習(xí)的評價機(jī)制、在不同學(xué)科中的應(yīng)用策略、與新興技術(shù)的融合等方面。這些研究將進(jìn)一步推動非線性學(xué)習(xí)理論的發(fā)展,為教育實(shí)踐提供更有力的指導(dǎo)。
(三)生成式人工智能和智能體在教育中的應(yīng)用
生成式人工智能是一種能夠生成文本、圖像、音頻等內(nèi)容的技術(shù),近年來在教育中得到了廣泛應(yīng)用[10]。其應(yīng)用場境包括內(nèi)容生成(自動生成教學(xué)材料,如課件、練習(xí)題和參考答案)、個性化推薦(根據(jù)學(xué)生的學(xué)習(xí)行為和偏好,推薦個性化的學(xué)習(xí)資源)、實(shí)時反饋(在學(xué)習(xí)過程中,提供即時的反饋和指導(dǎo),幫助學(xué)生改進(jìn)學(xué)習(xí)效果)[11]。
智能體(Agent)是一種能夠感知環(huán)境、做出決策并執(zhí)行行動的自主實(shí)體[12]。智能體的概念最早出現(xiàn)在人工智能領(lǐng)域,廣泛應(yīng)用于機(jī)器人、虛擬助手和自動化系統(tǒng)中。智能體的發(fā)展經(jīng)歷了從簡單規(guī)則系統(tǒng)到復(fù)雜自主系統(tǒng)的演變。近年來,隨著深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)等技術(shù)的發(fā)展,智能體的能力得到了顯著提升。智能體在教育中的應(yīng)用包括智能輔導(dǎo)系統(tǒng)、虛擬實(shí)驗(yàn)室和自動評估系統(tǒng)等。在本文中,智能體指的是一種能夠支持非線性學(xué)習(xí)的生成式人工智能系統(tǒng),具有感知、決策和行動能力,能夠?yàn)閷W(xué)生提供個性化的學(xué)習(xí)路徑、實(shí)時反饋和協(xié)作支持。
在非線性學(xué)習(xí)環(huán)境下,構(gòu)建了三種主要的學(xué)習(xí)模式:自學(xué)模式、混合模式和協(xié)作模式。這三種模式既獨(dú)立又互補(bǔ),共同構(gòu)成了完整的非線性學(xué)習(xí)場境。為了更好地展示這些模式及其共性需求,圖1清晰地呈現(xiàn)了非線性學(xué)習(xí)場境的整體結(jié)構(gòu)。概念圖中心展示了非線性學(xué)習(xí)場境,三種學(xué)習(xí)模式(自學(xué)模式、混合模式、協(xié)作模式)從中心擴(kuò)展出來,每種模式都包含了其獨(dú)特的特點(diǎn)和應(yīng)用場境。同時,共性需求(智能評估、實(shí)時反饋、學(xué)習(xí)分析)位于圖的中心,與各個模式相連,展示了智能體模型需要滿足的共性功能。以下內(nèi)容將詳細(xì)介紹每種學(xué)習(xí)模式及其具體應(yīng)用場境,并預(yù)測智能體模型所需的功能。
(一)場境預(yù)設(shè)
1.自學(xué)模式:個性化學(xué)習(xí)路徑支持
自學(xué)模式是非線性學(xué)習(xí)的典型場境,其核心在于學(xué)習(xí)者的高度自主性。在這種模式下,學(xué)習(xí)者具有多樣化的需求和個性化的學(xué)習(xí)節(jié)奏,這就要求智能體模型能提供高度個性化的學(xué)習(xí)支持。下頁圖2展示了自學(xué)模式下個性化學(xué)習(xí)路徑支持的整體框架。
個性化學(xué)習(xí)路徑支持的關(guān)鍵在于動態(tài)路徑規(guī)劃和智能內(nèi)容推薦。動態(tài)路徑規(guī)劃能夠?qū)崟r調(diào)整學(xué)習(xí)序列,以適應(yīng)學(xué)習(xí)者的進(jìn)度和表現(xiàn),這符合學(xué)習(xí)者對自主性的客觀規(guī)律。生成式AI在這一過程中發(fā)揮關(guān)鍵作用,它能基于學(xué)習(xí)者模型和知識圖譜,生成符合個體需求的學(xué)習(xí)路徑,從而可以最大化學(xué)習(xí)效果。
智能內(nèi)容推薦則進(jìn)一步強(qiáng)化了個性化特征。傳統(tǒng)的內(nèi)容推薦往往局限于預(yù)設(shè)的學(xué)習(xí)資源,難以滿足高度個性化的需求。生成式AI的引入使得系統(tǒng)能夠動態(tài)創(chuàng)造和調(diào)整學(xué)習(xí)內(nèi)容,大大增強(qiáng)了推薦的靈活性和針對性。這不僅能提供更加個性化的學(xué)習(xí)材料,還能根據(jù)學(xué)習(xí)者的實(shí)時反饋進(jìn)行內(nèi)容調(diào)整,提供精準(zhǔn)的學(xué)習(xí)支持。
在技術(shù)實(shí)現(xiàn)層面,知識圖譜構(gòu)建和智能體是核心組件。知識圖譜為路徑規(guī)劃提供結(jié)構(gòu)化的知識表示,而智能體算法則能從海量學(xué)習(xí)數(shù)據(jù)中提取模式,不斷優(yōu)化推薦策略。這些技術(shù)共同支撐了整個個性化學(xué)習(xí)路徑支持系統(tǒng),確保系統(tǒng)能持續(xù)適應(yīng)學(xué)習(xí)者的變化,提供動態(tài)優(yōu)化的學(xué)習(xí)體驗(yàn)。
學(xué)習(xí)模式下個性化學(xué)習(xí)路徑的支持充分發(fā)揮了學(xué)習(xí)者的自主性,實(shí)現(xiàn)了高效、個性化的非線性學(xué)習(xí)過程。這種方法不僅提高了學(xué)習(xí)效率,還增強(qiáng)了學(xué)習(xí)者的學(xué)習(xí)動機(jī),為非線性學(xué)習(xí)提供了有力的技術(shù)支持。
2.混合模式:線上線下結(jié)合支持
混合模式將線上學(xué)習(xí)與傳統(tǒng)線下教學(xué)相結(jié)合,為非線性學(xué)習(xí)提供了更加靈活和全面的學(xué)習(xí)環(huán)境。如圖3所示,這種模式的核心在于實(shí)現(xiàn)線上線下學(xué)習(xí)的無縫銜接和互補(bǔ),創(chuàng)造一種連貫、整合的學(xué)習(xí)體驗(yàn)。
在混合模式中,智能體面臨的主要挑戰(zhàn)是跨場境學(xué)習(xí)追蹤和資源調(diào)配??鐖鼍硨W(xué)習(xí)追蹤的獨(dú)特性在于需要整合來自線上和線下的多源異構(gòu)數(shù)據(jù),構(gòu)建完整的學(xué)習(xí)軌跡。這要求系統(tǒng)具備強(qiáng)大的數(shù)據(jù)采集和分析能力,能夠處理從課堂參與到在線互動等各種形式的學(xué)習(xí)行為數(shù)據(jù),實(shí)現(xiàn)學(xué)習(xí)經(jīng)歷的全面記錄和分析。
資源調(diào)配在虛實(shí)結(jié)合環(huán)境中呈現(xiàn)出特殊性。智能體需要在動態(tài)變化的學(xué)習(xí)場境中,為學(xué)習(xí)者提供最適合的學(xué)習(xí)資源和活動。這涉及到根據(jù)學(xué)習(xí)場境和學(xué)習(xí)者狀態(tài),動態(tài)決策應(yīng)該不管是在線上還是線下進(jìn)行特定的學(xué)習(xí)活動,以及如何選擇和分配相應(yīng)的學(xué)習(xí)資源。生成式AI在這方面發(fā)揮了關(guān)鍵作用,能夠基于學(xué)習(xí)情境動態(tài)生成或調(diào)整學(xué)習(xí)內(nèi)容,實(shí)現(xiàn)個性化學(xué)習(xí)體驗(yàn)。
混合環(huán)境下的學(xué)習(xí)活動設(shè)計是支持流程中的關(guān)鍵環(huán)節(jié)。智能體需要根據(jù)學(xué)習(xí)目標(biāo)和場境特點(diǎn),靈活地安排線上和線下活動,并確保它們之間的有機(jī)銜接。這種設(shè)計不僅要考慮知識傳遞的效果,還要充分利用線上線下環(huán)境的優(yōu)勢,創(chuàng)造沉浸式和交互式的學(xué)習(xí)體驗(yàn)。
技術(shù)支撐方面,AR/VR技術(shù)和物聯(lián)網(wǎng)的應(yīng)用為混合學(xué)習(xí)環(huán)境提供了新的可能性。這些技術(shù)能夠創(chuàng)造沉浸式的學(xué)習(xí)體驗(yàn),有效彌補(bǔ)線上學(xué)習(xí)的局限性,同時實(shí)現(xiàn)線上線下數(shù)據(jù)的無縫采集,為全面的學(xué)習(xí)行為分析奠定基礎(chǔ)。
3.協(xié)作模式:智能協(xié)同學(xué)習(xí)支持
協(xié)作模式在非線性學(xué)習(xí)中扮演著越來越重要的角色,它強(qiáng)調(diào)多人協(xié)作、跨空間合作以及知識的共建與分享。如圖4所示,這種模式下的智能體學(xué)習(xí)支持框架旨在促進(jìn)高效的團(tuán)隊(duì)協(xié)作和知識構(gòu)建。
在協(xié)作學(xué)習(xí)中,多人協(xié)作和跨時空團(tuán)隊(duì)合作是兩個突出特點(diǎn)。學(xué)習(xí)者不再局限于傳統(tǒng)的面對面交流,而是可以跨越時間和空間的限制進(jìn)行合作。這種模式為學(xué)習(xí)者提供了更加靈活和多樣化的學(xué)習(xí)機(jī)會,同時也對智能體提出了更高的要求。
動態(tài)團(tuán)隊(duì)組建是協(xié)作學(xué)習(xí)中的一個關(guān)鍵環(huán)節(jié)。智能體需要基于學(xué)習(xí)者的知識背景、學(xué)習(xí)風(fēng)格和協(xié)作能力,形成最優(yōu)的團(tuán)隊(duì)組合。這個過程不僅需要對個體特征的深入理解,還需要考慮團(tuán)隊(duì)整體的協(xié)同效應(yīng)。生成式AI在此過程中可以通過模擬不同團(tuán)隊(duì)組合的協(xié)作場境,預(yù)測可能的協(xié)作成效,從而優(yōu)化團(tuán)隊(duì)構(gòu)成,為有效的團(tuán)隊(duì)協(xié)作奠定基礎(chǔ)。
集體知識圖譜的構(gòu)建是協(xié)作模式中一個獨(dú)特而重要的功能。在協(xié)作學(xué)習(xí)過程中,每個學(xué)習(xí)者都在不斷貢獻(xiàn)新的知識和見解。智能體需要實(shí)時整合這些分散的知識點(diǎn),構(gòu)建一個動態(tài)演化的知識網(wǎng)絡(luò)。這不僅能夠促進(jìn)知識的有效共享和傳播,還能幫助團(tuán)隊(duì)成員更好地理解復(fù)雜的知識結(jié)構(gòu)和關(guān)系。
在技術(shù)支撐方面,社交網(wǎng)絡(luò)分析和群體智能算法的應(yīng)用為協(xié)作學(xué)習(xí)提供了有力支持。這些技術(shù)能夠幫助識別團(tuán)隊(duì)中的互動模式和知識流動路徑,優(yōu)化集體決策過程,從而提高協(xié)作學(xué)習(xí)的質(zhì)量和效果。
(二)功能需求匯總
在設(shè)計非線性學(xué)習(xí)智能體的功能架構(gòu)時,面臨的核心挑戰(zhàn)不僅在于確定具體功能,更在于如何構(gòu)建一個有機(jī)統(tǒng)一、相互支持的功能生態(tài)系統(tǒng)。圖5展示了功能的基本分類,但功能之間的復(fù)雜交互和潛在的協(xié)同效應(yīng)才是本節(jié)需要深入探討的重點(diǎn)。
跨模式功能整合的挑戰(zhàn):盡管圖5將功能分為自學(xué)、混合、協(xié)作三種模式和共性功能,但在實(shí)際應(yīng)用中,這些功能并非截然分離。最大的挑戰(zhàn)在于如何實(shí)現(xiàn)這些功能的無縫整合,從軟件設(shè)計的角度要有一定的冗余度和耦合性。也使得學(xué)習(xí)者在不同模式下能有一致性和連貫性的體驗(yàn)感。
動態(tài)平衡與自適應(yīng)機(jī)制:另一個關(guān)鍵難點(diǎn)是在個性化和標(biāo)準(zhǔn)化之間尋求動態(tài)平衡。雖然個性化是非線性學(xué)習(xí)的核心特征,但過度個性化可能導(dǎo)致學(xué)習(xí)者偏離既定的教育目標(biāo)。智能體需要一個復(fù)雜的自適應(yīng)機(jī)制,不斷調(diào)整個性化的程度,以確保學(xué)習(xí)者在享受定制化學(xué)習(xí)體驗(yàn)的同時,仍能達(dá)成必要的學(xué)習(xí)標(biāo)準(zhǔn)。這種機(jī)制需要綜合考慮學(xué)習(xí)者的個人特征、學(xué)習(xí)進(jìn)展、課程要求等多方面因素,是一個多目標(biāo)優(yōu)化問題。
功能的可擴(kuò)展性設(shè)計:考慮到教育科技的快速發(fā)展,功能架構(gòu)的可擴(kuò)展性至關(guān)重要。我們需要設(shè)計一個開放的功能框架,能夠輕松集成新的技術(shù)和功能模塊。這要求智能體具有模塊化的結(jié)構(gòu)設(shè)計,以及標(biāo)準(zhǔn)化的數(shù)據(jù)接口。同時,如何確保新功能的加入不會破壞現(xiàn)有功能的穩(wěn)定性,也是一個需要深入研究的問題。
跨學(xué)科知識的整合:非線性學(xué)習(xí)常常涉及跨學(xué)科的知識整合。智能體需要具備復(fù)雜的知識圖譜和推理能力,能夠識別不同學(xué)科知識點(diǎn)之間的聯(lián)系,并據(jù)此為學(xué)習(xí)者提供多角度的學(xué)習(xí)建議。這種跨學(xué)科的知識整合能力,不僅需要強(qiáng)大的數(shù)據(jù)庫支持,還需要先進(jìn)的語義分析和知識推理算法。
數(shù)據(jù)驅(qū)動與隱私保護(hù)的矛盾:實(shí)現(xiàn)上述功能,尤其是高度個性化和精準(zhǔn)分析,需要收集和分析大量的學(xué)習(xí)數(shù)據(jù)。然而,這不可避免地引發(fā)了數(shù)據(jù)隱私和安全的問題。如何在充分利用數(shù)據(jù)以提升學(xué)習(xí)效果的同時,又能有效保護(hù)學(xué)習(xí)者的隱私,是一個需要慎重考慮的倫理和技術(shù)難題。這可能需要采用先進(jìn)的數(shù)據(jù)加密、匿名化技術(shù),以及制定嚴(yán)格的數(shù)據(jù)使用政策。
(一)模型架構(gòu)
非線性學(xué)習(xí)理論強(qiáng)調(diào)學(xué)習(xí)過程的復(fù)雜性、個體差異性和知識獲取的多樣性,這些特性與傳統(tǒng)線性學(xué)習(xí)模型形成鮮明對比。傳統(tǒng)模型往往假設(shè)學(xué)習(xí)是一個線性、均質(zhì)的過程,難以適應(yīng)現(xiàn)代教育中學(xué)習(xí)者的多元需求和學(xué)習(xí)環(huán)境的動態(tài)變化。為了更好地支持非線性學(xué)習(xí),我們提出了一個基于強(qiáng)化學(xué)習(xí)的智能體模型,其核心是將非線性學(xué)習(xí)過程形式化為馬爾可夫決策過程。如圖6所示,該模型架構(gòu)包含三個相互關(guān)聯(lián)的層次:基礎(chǔ)設(shè)施層、核心功能層和應(yīng)用層。
這種三層架構(gòu)的設(shè)計源于對非線性學(xué)習(xí)本質(zhì)的深入理解?;A(chǔ)設(shè)施層對應(yīng)于學(xué)習(xí)環(huán)境的構(gòu)建,為非線性學(xué)習(xí)提供了靈活多變的技術(shù)支持。它包括大數(shù)據(jù)處理、云計算和人工智能等組件,這些技術(shù)使得學(xué)習(xí)資源的動態(tài)調(diào)配和個性化推薦成為可能,從而支持了非線性學(xué)習(xí)中的資源多樣性和學(xué)習(xí)路徑的靈活性。核心功能層作為智能體的“大腦”,直接體現(xiàn)了非線性學(xué)習(xí)的核心特征。例如,學(xué)習(xí)路徑生成器通過動態(tài)規(guī)劃算法,根據(jù)學(xué)習(xí)者的實(shí)時表現(xiàn)和目標(biāo)調(diào)整學(xué)習(xí)路徑,體現(xiàn)了非線性學(xué)習(xí)的自適應(yīng)性。知識圖譜構(gòu)建模塊則通過復(fù)雜網(wǎng)絡(luò)的形式表征知識結(jié)構(gòu),支持了非線性學(xué)習(xí)中知識獲取的多樣性和關(guān)聯(lián)性。應(yīng)用層通過支持多種學(xué)習(xí)模式(如自主學(xué)習(xí)、協(xié)作學(xué)習(xí)等),體現(xiàn)了非線性學(xué)習(xí)的靈活性和互動性,使學(xué)習(xí)者能夠在不同的學(xué)習(xí)情境中自由切換。
生成式AI在這個架構(gòu)中扮演了關(guān)鍵角色,為每一層都帶來了創(chuàng)新性的解決方案。在基礎(chǔ)設(shè)施層,生成式AI通過智能資源分配算法,優(yōu)化了學(xué)習(xí)資源的使用效率。在核心功能層,AI驅(qū)動的內(nèi)容生成系統(tǒng)能夠根據(jù)學(xué)習(xí)者的需求實(shí)時創(chuàng)造個性化的學(xué)習(xí)材料,大大增強(qiáng)了學(xué)習(xí)路徑的多樣性和針對性。在應(yīng)用層,AI支持的智能對話系統(tǒng)和虛擬學(xué)習(xí)助手提供了更加自然和高效的人機(jī)交互體驗(yàn),使得非線性學(xué)習(xí)過程更加流暢和個性化。這種全方位的AI賦能,使得本模型能夠更好地適應(yīng)非線性學(xué)習(xí)的復(fù)雜性和動態(tài)性,為現(xiàn)代教育技術(shù)的發(fā)展提供了新的可能性。
(二)模型實(shí)現(xiàn)
1.模型構(gòu)建過程
非線性學(xué)習(xí)智能體模型的構(gòu)建是一個循環(huán)迭代的過程,如下頁圖7所示。這個過程包含四個關(guān)鍵步驟,每個步驟都融合了教育理論和先進(jìn)技術(shù),共同構(gòu)成了一個完整的學(xué)習(xí)支持系統(tǒng)。
理論基礎(chǔ)與問題形式化:本文意將非線性學(xué)習(xí)理論與馬爾可夫決策過程(MDP)相結(jié)合[13]。基于皮亞杰的認(rèn)知發(fā)展理論和維果茨基的最近發(fā)展區(qū)理論,將學(xué)習(xí)過程形式化為一個動態(tài)的狀態(tài)轉(zhuǎn)換問題[14]。這種形式化為后續(xù)的算法設(shè)計奠定了基礎(chǔ)。
個性化學(xué)習(xí)策略構(gòu)建:采用強(qiáng)化學(xué)習(xí)方法,特別是Q-learning算法,來構(gòu)建和優(yōu)化個性化學(xué)習(xí)策略[15]。這種方法能夠通過持續(xù)的交互和反饋,逐步改進(jìn)學(xué)習(xí)策略,體現(xiàn)了建構(gòu)主義學(xué)習(xí)理論的核心思想。
知識表征與學(xué)習(xí)路徑生成:使用動態(tài)知識圖譜來表征知識結(jié)構(gòu),這種方法能夠有效捕捉知識點(diǎn)之間的復(fù)雜關(guān)系?;谶@種表征,我們設(shè)計了動態(tài)學(xué)習(xí)路徑生成算法,為每個學(xué)習(xí)者創(chuàng)建個性化的學(xué)習(xí)路徑。
反饋機(jī)制與自適應(yīng)調(diào)節(jié):設(shè)計多層次的反饋系統(tǒng),結(jié)合生成式AI技術(shù),提供個性化和上下文相關(guān)的反饋。同時,通過持續(xù)監(jiān)測和動態(tài)參數(shù)調(diào)整,確保整個學(xué)習(xí)過程的自適應(yīng)性。
這四個步驟形成一個閉環(huán)系統(tǒng),通過不斷的迭代和優(yōu)化,使模型能夠持續(xù)適應(yīng)學(xué)習(xí)者的需求和環(huán)境的變化。這種設(shè)計不僅體現(xiàn)了非線性學(xué)習(xí)的核心特征,也為個性化教育和終身學(xué)習(xí)提供了新的技術(shù)支持。
2.關(guān)鍵技術(shù)
生成式人工智能賦能的非線性學(xué)習(xí)智能體模型在傳統(tǒng)智能體模型的基礎(chǔ)上,通過融入先進(jìn)的AI技術(shù),實(shí)現(xiàn)了更高程度的個性化和適應(yīng)性。如圖8所示,這個模型的核心是強(qiáng)化學(xué)習(xí)與生成式AI的深度融合,圍繞這個核心,我們構(gòu)建了四大關(guān)鍵技術(shù)和四個生成式AI應(yīng)用點(diǎn),共同支撐起整個智能體系統(tǒng)。
在傳統(tǒng)的非線性學(xué)習(xí)智能體模型中,強(qiáng)化學(xué)習(xí)、知識圖譜、自適應(yīng)算法和多模態(tài)交互已經(jīng)是不可或缺的組成部分。強(qiáng)化學(xué)習(xí)通過Q-learning等算法實(shí)現(xiàn)學(xué)習(xí)策略的持續(xù)優(yōu)化;動態(tài)知識圖譜為復(fù)雜知識結(jié)構(gòu)的表征和推理提供了基礎(chǔ);自適應(yīng)算法確保了模型能夠根據(jù)學(xué)習(xí)者的表現(xiàn)實(shí)時調(diào)整;而多模態(tài)交互技術(shù)則增強(qiáng)了學(xué)習(xí)體驗(yàn)的自然性和豐富性。
生成式AI的引入,為這些關(guān)鍵技術(shù)注入了新的活力。在內(nèi)容生成方面,生成式AI能夠根據(jù)學(xué)習(xí)者的需求和背景,動態(tài)創(chuàng)造個性化的學(xué)習(xí)資源,大大豐富了學(xué)習(xí)材料的多樣性和針對性。在學(xué)習(xí)路徑規(guī)劃中,生成式AI通過分析海量學(xué)習(xí)數(shù)據(jù),能夠預(yù)測學(xué)習(xí)者的潛在學(xué)習(xí)軌跡,從而生成更加精準(zhǔn)和靈活的動態(tài)學(xué)習(xí)路徑。
智能反饋系統(tǒng)是生成式AI賦能的另一個重要領(lǐng)域。傳統(tǒng)的反饋往往局限于預(yù)設(shè)的規(guī)則和模式,而生成式AI能夠提供更加個性化和上下文相關(guān)的學(xué)習(xí)指導(dǎo)。它不僅能夠解釋學(xué)習(xí)者的錯誤,還能根據(jù)學(xué)習(xí)者的特點(diǎn),生成針對性的改進(jìn)建議和練習(xí)。
在交互增強(qiáng)方面,生成式AI極大地提升了人機(jī)交互的自然性和智能性。通過先進(jìn)的自然語言處理技術(shù),智能體能夠理解和回應(yīng)學(xué)習(xí)者的復(fù)雜查詢,甚至能夠進(jìn)行有意義的對話,模擬真實(shí)教師的指導(dǎo)過程。
生成式AI的這些應(yīng)用點(diǎn)與傳統(tǒng)的關(guān)鍵技術(shù)并非簡單疊加,而是實(shí)現(xiàn)了深度融合。例如,在強(qiáng)化學(xué)習(xí)過程中,生成式AI可以創(chuàng)造更加豐富的模擬環(huán)境,提升學(xué)習(xí)策略的泛化能力。在知識圖譜構(gòu)建中,生成式AI能夠通過理解和生成文本內(nèi)容,自動擴(kuò)展和優(yōu)化知識結(jié)構(gòu)。
這種融合不僅提高了非線性學(xué)習(xí)智能體模型的性能,更重要的是拓展了其應(yīng)用邊界。例如,在處理開放性問題和創(chuàng)新性任務(wù)時,傳統(tǒng)模型往往力不從心,而融入生成式AI后的模型則展現(xiàn)出了更強(qiáng)的創(chuàng)造力和適應(yīng)性。這使得模型不僅能夠支持知識獲取,還能促進(jìn)高階思維能力的發(fā)展,更好地滿足現(xiàn)代教育對培養(yǎng)創(chuàng)新人才的需求。
3.核心算法描述
非線性學(xué)習(xí)智能體模型的核心是一個改進(jìn)的馬爾可夫決策過程(MDP) [16],它融入與集成了動態(tài)知識圖譜和強(qiáng)化學(xué)習(xí)的概念。我們將這個改進(jìn)的模型定義為:
這個算法的關(guān)鍵創(chuàng)新點(diǎn)包括:知識狀態(tài)的連續(xù)表示:使用連續(xù)值 k 表示每個知識點(diǎn)的掌握程度。動態(tài)知識圖譜集成:通過在狀態(tài)轉(zhuǎn)移函數(shù)中引入 G,實(shí)現(xiàn)了基于知識結(jié)構(gòu)的學(xué)習(xí)路徑生成。自適應(yīng)獎勵函數(shù):考慮知識增益、學(xué)習(xí)效率和參與度的綜合評估。知識關(guān)聯(lián)學(xué)習(xí):利用知識圖譜 G 來影響狀態(tài)轉(zhuǎn)移,促進(jìn)知識的關(guān)聯(lián)理解。
這個核心算法通過結(jié)合教育學(xué)理論(如建構(gòu)主義、最近發(fā)展區(qū))和先進(jìn)的機(jī)器學(xué)習(xí)技術(shù),為非線性學(xué)習(xí)提供了堅實(shí)的技術(shù)基礎(chǔ)。它能夠適應(yīng)學(xué)習(xí)的非線性特性,實(shí)現(xiàn)個性化學(xué)習(xí)路徑生成、動態(tài)難度調(diào)整、知識關(guān)聯(lián)學(xué)習(xí)等功能,從而支持深度學(xué)習(xí)和高階思維能力的發(fā)展。
本研究提出了一種生成式人工智能賦能的非線性學(xué)習(xí)智能體模型,其主要創(chuàng)新點(diǎn)在于將非線性學(xué)習(xí)理論與生成式AI技術(shù)有機(jī)結(jié)合,構(gòu)建了一個適應(yīng)性強(qiáng)、個性化程度高的學(xué)習(xí)支持系統(tǒng)。模型的核心是一個改進(jìn)的馬爾可夫決策過程,通過集成動態(tài)知識圖譜和強(qiáng)化學(xué)習(xí)算法,實(shí)現(xiàn)了個性化學(xué)習(xí)路徑生成和知識關(guān)聯(lián)學(xué)習(xí)。
未來研究可進(jìn)一步探索模型的可解釋性、小樣本學(xué)習(xí)能力,以及在不同學(xué)科和教育階段的適用性。同時,如何在保護(hù)學(xué)習(xí)者隱私的前提下優(yōu)化模型性能,也是值得深入研究的方向。我們期待這一模型能為推動教育的個性化和智能化發(fā)展做出積極貢獻(xiàn)。
參考文獻(xiàn):
[1] Jovanovi , M., & Campbell,M.Generative Artificial Intelligence:Trends and Prospects [J].Computer,2022,55(10):107-111.
[2] Chen,L.,Chen,P., & Lin,Z.Artificial Intelligence in Education:A Review [J]. IEEE Access,2020,8:75264-75278.
[3] 翟雪松,楚肖燕等.基于“生成式人工智能+元宇宙”的人機(jī)協(xié)同學(xué)習(xí)模式研究[J].開放教育研究, 2023,29(5):26-36.
[4] 王繼新,黃濤.論非線性學(xué)習(xí)的模式與方法[J].中國電化教育,2009,(4): 6-8.
[5] PIAGET J.The psychology of intelligence[M].London:Routledge,1950.
[6] Kolb,D.A.Experiential learning:Experience as the source of learning and development [M].Englewood Cliffs:Prentice-Hall,1984.
[7] 王繼新,鄭旭東.非線性學(xué)習(xí):數(shù)字化時代的學(xué)習(xí)創(chuàng)新[M].北京:高等教育出版社,2012.
[8] Chow,J.Nonlinear Learning Underpinning Pedagogy:Evidence,Challenges, and Implications [J].Quest,2013,65:469-484.
[9] 方琨.大數(shù)據(jù)背景下大學(xué)生非線性學(xué)習(xí)能力的解析與提升策略研究[J].中國教育信息化,2019,(13):37-40.
[10] 劉明,郭爍等.生成式人工智能重塑高等教育形態(tài):內(nèi)容、案例與路徑[J].電化教育研究,2024,45(6):57-65.
[11] Harshvardhan,G.,Gourisaria,M.K.,Pandey,M., & Rautaray,S.A comprehensive survey and analysis of generative models in machine learning [J].Comput.Sci.Rev,2020,38:100285.
[12] Ahmad,S.,Rahmat,M.K.,Mubarik,M.,Alam,M.M., & Hyder,S.Artificial Intelligence and Its Role in Education [J].Sustainability,2021,13:12902.
[13] Harland,T.Vygotsky’s zone of proximal development and problembased learning:Linking a theoretical concept with practice through action research [J].Teaching in Higher Education,2003,8(2):263-272.
[14] Geert,P.V.A dynamic systems model of basic developmental mechanisms:Piaget,Vygotsky,and beyond [J].Psychological Review,1998,105(4):634-677.
[15] Tan,C.,Han,R.,Ye,R., & Chen,K.Adaptive Learning Recommendation Strategy Based on Deep Q-learning [J].Applied Psychological Measurement, 2020,44(3):251-266.
[16] Korsunsky,P.,Belogolovsky,S.,Zahavy,T.,Tessler,C., & Mannor,S.Inverse Reinforcement Learning in Contextual MDPs [J].Machine Learning,2019, 110(10):2295-2334.
作者簡介:
黃紅濤:工程師,博士,研究方向?yàn)橹悄芙逃到y(tǒng)的開發(fā)與優(yōu)化、教育大數(shù)據(jù)的挖掘與應(yīng)用。
余琳:工程師,博士,研究方向?yàn)閿?shù)字化學(xué)習(xí)理論與實(shí)踐、數(shù)據(jù)統(tǒng)計與分析。
王繼新:教授,博士生導(dǎo)師,研究方向?yàn)閿?shù)字化學(xué)習(xí)理論與實(shí)踐。
Construction of a Nonlinear Learning Agent Model Empowered by Generative Artificial Intelligence
Huang Hongtao1, Yu Lin1,2, Wang Jixin1
1.Office of Informatization, Central China Normal University, Wuhan 430079, Hubei 2.School of Artificial Intelligence in Education, Central China Normal University, Wuhan 430079, Hubei
Abstract: This study explores the construction of a nonlinear learning agent model empowered by generative artificial intelligence (AIGC). The research first analyzes the characteristics of nonlinear learning and presets three learning scenarios: self-learning, hybrid learning, and collaborative learning. Based on these scenarios, the functional requirements of the agent model are derived, and the core capabilities of the model are abstracted. The paper defines the concept, mathematical expression, and core algorithms of the nonlinear learning agent, emphasizing that the core of the agent model is an improved Markov decision process. The study aims to provide personalized, dynamically optimized learning support to learners, effectively enhancing the efficiency of nonlinear learning. This research offers a novel approach to model construction for AIGC applications in education, holding significant implications for advancing educational informatization and personalized learning.
Keywords: Generative Artificial Intelligence; nonlinear learning; agent model; personalized learning; educational informatization
收稿日期:2024年8月20日
責(zé)任編輯:趙云建