【摘 要】生成式人工智能和大模型技術(shù)的快速發(fā)展,正在推動教育領(lǐng)域智能體的構(gòu)建和實(shí)用化,使其成為人工智能教育應(yīng)用和創(chuàng)新的重要途徑和載體。教育智能體能夠執(zhí)行教育任務(wù)的設(shè)定、規(guī)劃與實(shí)施,與教育用戶進(jìn)行有效交互,并具備自我進(jìn)化的能力。教育智能體在課堂教學(xué)、教育評價和教師教研等典型教育場景中,也逐步展現(xiàn)其重要價值和潛力。
【關(guān)鍵詞】教育智能體;大模型;生成式人工智能
【中圖分類號】G434 【文獻(xiàn)標(biāo)志碼】A
【論文編號】1671-7384(2024)010-005-03
人工智能與智能體
在人工智能領(lǐng)域,智能體又被稱為“自主智能體”(Autonomous Agent),是一種能夠完成目標(biāo)任務(wù)的自適應(yīng)系統(tǒng)[1]。自20世紀(jì)人工智能學(xué)科確立以來,設(shè)計(jì)與實(shí)現(xiàn)智能體就一直是人工智能領(lǐng)域研究者的主要核心目標(biāo)。智能體的關(guān)鍵特征是其自主性:智能體能夠在沒有人類直接干預(yù)的情況下,根據(jù)外部環(huán)境的變化和目標(biāo)任務(wù),自主控制自身行為和內(nèi)部狀態(tài),做出決策并執(zhí)行相應(yīng)動作,從而影響甚至改變外部環(huán)境。此外,智能體還需要能夠與人類開展有效交流和溝通,以達(dá)到更好地服務(wù)人類的目的。
1.基于傳統(tǒng)人工智能的智能體
人工智能領(lǐng)域的智能體,首先需要具備外部環(huán)境的感知能力,從而采集必要信息,以了解外部環(huán)境的基本情況及其動態(tài)變化。基于所采集的外部環(huán)境信息,智能體可通過確定性或非確定性邏輯推理等方式,求解目標(biāo)任務(wù)中的具體問題。同時,智能體也可以利用從外部環(huán)境采集到的數(shù)據(jù),通過機(jī)器學(xué)習(xí)等方式自動歸納出數(shù)據(jù)中的客觀規(guī)律,從而提高自身解決目標(biāo)任務(wù)的效果和效率。在此過程中,智能體可以建立記憶與檢索機(jī)制,支持存儲、讀取數(shù)據(jù)與過往經(jīng)驗(yàn),從而進(jìn)一步提升自身性能。在此基礎(chǔ)上,智能體通過特定數(shù)學(xué)模型和算法權(quán)衡利弊,針對目標(biāo)任務(wù)做出合理決策,并通過執(zhí)行機(jī)構(gòu)將決策轉(zhuǎn)化為對外部環(huán)境的實(shí)際作用和影響,從而最終完成目標(biāo)任務(wù)。
智能體的設(shè)計(jì)通常基于多種傳統(tǒng)人工智能技術(shù),包括但不限于語音識別、計(jì)算機(jī)視覺、知識表示與推理、機(jī)器學(xué)習(xí)、自然語言處理和機(jī)器人技術(shù)等。智能體的具體實(shí)現(xiàn)可以是軟件形態(tài),如手機(jī)個人助手、電商推薦系統(tǒng)、在線客服機(jī)器人等;也可以是硬件形態(tài),如自動駕駛汽車、工業(yè)機(jī)器人、服務(wù)機(jī)器人等。
2.基于多模態(tài)大模型的智能體
隨著生成式人工智能技術(shù)的快速發(fā)展,尤其是多模態(tài)大模型(以下簡稱“大模型”)的出現(xiàn),為智能體的設(shè)計(jì)和構(gòu)建帶來了新的機(jī)遇[2]。大模型指能夠處理并解析文本、圖像、音頻、視頻等多模態(tài)數(shù)據(jù)輸入的人工智能模型。以GPT-4為代表的大模型通常具有數(shù)以千億計(jì)的參數(shù),并在自然語言處理與視音頻分析等多任務(wù)上表現(xiàn)出卓越性能。近年來,研究者開始嘗試構(gòu)建將大模型作為核心基礎(chǔ)支撐的智能體。與傳統(tǒng)智能體相比,基于大模型的智能體具有顯著的優(yōu)勢和特點(diǎn),尤其是以下多項(xiàng)核心能力。
(1)多模態(tài)感知能力。大模型能夠感知圖像、語音、文本等多種模態(tài)數(shù)據(jù),實(shí)現(xiàn)單獨(dú)或綜合的感知功能。因此,基于大模型構(gòu)建的智能體展現(xiàn)出更智能化的多模態(tài)感知能力,使其能夠更全面地理解所處的外部環(huán)境。這些智能體不僅能夠進(jìn)行視覺和聽覺的感知,還能將不同模態(tài)的信息進(jìn)行整合,從而實(shí)現(xiàn)更接近人類水平的感知能力。
(2)推理與規(guī)劃能力。大模型具備較強(qiáng)的邏輯推理能力,設(shè)計(jì)者可以通過設(shè)定“提示信息”激發(fā)模型進(jìn)行深層次的思考,形成連貫的“思維鏈”或系統(tǒng)化的“思維樹”[3]。因此,基于大模型的智能體能夠?qū)?fù)雜的任務(wù)分解為一系列可操作的子任務(wù)。通過多步驟的邏輯推理,自主地規(guī)劃出一系列行為,以實(shí)現(xiàn)目標(biāo)任務(wù)的完成,進(jìn)而高效地探索并實(shí)施解決復(fù)雜問題的策略。
(3)學(xué)習(xí)與決策能力。大模型憑借其龐大的參數(shù)規(guī)模和復(fù)雜的人工神經(jīng)網(wǎng)絡(luò)架構(gòu),通過海量多模態(tài)數(shù)據(jù)的訓(xùn)練,積累了對客觀世界的全面了解,這為有效的決策提供了堅(jiān)實(shí)的知識基礎(chǔ)。此外,大模型利用“微調(diào)”和“檢索增強(qiáng)生成”等技術(shù),能夠針對特定領(lǐng)域或任務(wù)深入學(xué)習(xí),掌握關(guān)鍵特征和知識,并減少“幻覺”(即錯誤或不準(zhǔn)確信息)的發(fā)生。因此,基于大模型的智能體能夠提供更為全面和深入的信息,確保學(xué)習(xí)和決策過程的質(zhì)量和可靠性。
(4)多角色交互能力。大模型具備在多輪對話中理解和捕捉上下文信息的能力,能夠解析對話情境和用戶意圖,并據(jù)此生成邏輯連貫且恰當(dāng)?shù)幕貜?fù)。因此,基于大模型構(gòu)建的智能體能夠與人類用戶、外部環(huán)境以及其他智能體更有效地開展交互。在人機(jī)交互方面,智能體能夠與人類用戶協(xié)同工作,同時提供高質(zhì)量的用戶體驗(yàn)。在與其他智能體的交互中,不同的智能體能夠根據(jù)各自的角色和功能,進(jìn)行有效辯論和協(xié)作,共同推動復(fù)雜任務(wù)的高效完成。
(5)記憶與進(jìn)化能力。大模型能夠利用人工智能系統(tǒng)的外部記憶和檢索機(jī)制,有效地存儲和調(diào)用專業(yè)知識。因此,基于大模型的智能體通過對外部記憶和專業(yè)知識進(jìn)行反思和總結(jié),能夠?qū)崿F(xiàn)類似于人類的自主思考和自我改進(jìn)。這種自我進(jìn)化能力不僅增強(qiáng)了智能體的適應(yīng)性和靈活性,而且為其持續(xù)優(yōu)化提供了可能,并在不斷變化的外部環(huán)境和完成復(fù)雜任務(wù)的過程中保持其優(yōu)勢和效率。
面向教育領(lǐng)域的智能體
人工智能與教育的深度融合,催生了專為教育領(lǐng)域設(shè)計(jì)的智能體,即教育智能體。由于教育場景的多樣性以及服務(wù)對象的復(fù)雜性,教育智能體的構(gòu)建需滿足教育領(lǐng)域自身的特殊需求,并展現(xiàn)出與其他垂直領(lǐng)域智能體不同的專業(yè)化特征和功能[4]。
1.教育任務(wù)設(shè)定
教育智能體需要能夠針對目標(biāo)教育任務(wù)設(shè)定教育場景、教育需求與教育角色等關(guān)鍵信息。教育場景的設(shè)定為教育智能體提供教育任務(wù)的背景和環(huán)境信息,如以學(xué)生為主體的項(xiàng)目式學(xué)習(xí)場景或傳統(tǒng)課堂教學(xué)場景信息;教育需求的設(shè)定為教育智能體提供教育任務(wù)的具體目標(biāo)和描述信息,如為項(xiàng)目式學(xué)習(xí)提供驅(qū)動問題或開展教師課堂教學(xué)能力評價;教育角色設(shè)定為教育智能體賦予教育任務(wù)中需扮演的特定角色信息,如學(xué)生同伴或教研專家等角色。
2.教育任務(wù)規(guī)劃
在已設(shè)定的教育任務(wù)引導(dǎo)下,教育智能體需要實(shí)現(xiàn)任務(wù)自主規(guī)劃。首先,教育智能體可以充分利用大模型的推理與規(guī)劃能力,根據(jù)教育任務(wù)中設(shè)定的場景和需求信息,自主構(gòu)思并設(shè)計(jì)初步解決方案。在此基礎(chǔ)上,教育智能體針對所生成的整體方案,將其分解為多個可實(shí)現(xiàn)的子任務(wù)。教育智能體需要持續(xù)對各子任務(wù)的實(shí)際實(shí)施效果進(jìn)行監(jiān)控并接收教育用戶反饋。如果沒有達(dá)到目標(biāo)或預(yù)期效果,教育智能體需要對解決方案和子任務(wù)進(jìn)行動態(tài)調(diào)整,以確保教育任務(wù)的達(dá)成。
3.教育任務(wù)實(shí)施
針對所規(guī)劃的各個子任務(wù),教育智能體可以首先基于大模型自身的學(xué)習(xí)與決策能力進(jìn)行有效解決。對于超出智能體直接處理能力范圍的子任務(wù),教育智能體需要主動調(diào)用外部第三方工具或聯(lián)網(wǎng)查詢知識庫等進(jìn)行解決。例如,針對數(shù)學(xué)等需要精確計(jì)算的學(xué)科問題,教育智能體可以主動接入第三方計(jì)算工具,以確保計(jì)算的準(zhǔn)確性和效率。為了提供最新的教育資源和數(shù)據(jù),教育智能體還可以通過網(wǎng)絡(luò)訪問專業(yè)的教育資源公共服務(wù)平臺,獲取所需信息。
4.教育用戶交互與自我進(jìn)化
在完成目標(biāo)任務(wù)的過程中,教育智能體可以與人類用戶、其他智能體以及教育環(huán)境開展交互,并在此過程中不斷自我進(jìn)化。在與人的互動中,智能體能夠洞察不同教育用戶和角色的需求,提供個性化和多模態(tài)的人機(jī)交互體驗(yàn);在與其他智能體協(xié)作時,通過討論和辯論等多樣化方式,共同推進(jìn)教育任務(wù)的完成;在與教育環(huán)境互動時,教育智能體能夠感知并響應(yīng)環(huán)境變化,對教學(xué)設(shè)置進(jìn)行優(yōu)化。此外,教育智能體還能在各種互動后,借助其記憶與進(jìn)化機(jī)制,進(jìn)行自我反思和持續(xù)改進(jìn)。
5.教育知識庫構(gòu)建
教育任務(wù)的達(dá)成,通常需要高準(zhǔn)確度與可解釋性,從而提升教育用戶的信任度。因此,教育智能體在規(guī)劃和執(zhí)行教育任務(wù)時,經(jīng)常需要依賴專業(yè)的教育知識和數(shù)據(jù)。為了滿足這些要求,需要為教育智能體構(gòu)建本地專業(yè)教育知識庫,同時涵蓋用戶的個性化信息。教育智能體可以采用“檢索增強(qiáng)生成”等技術(shù),高效地利用本地教育知識庫中的信息資源,將其融入生成的答案或解決方案中,從而提高輸出教育信息的準(zhǔn)確性和可靠性。此外,通過不斷與本地知識庫的互動,教育智能體能夠持續(xù)學(xué)習(xí)和適應(yīng),擴(kuò)展其知識邊界,提升其處理各種教育任務(wù)的能力。這種持續(xù)的學(xué)習(xí)和適應(yīng)過程,有助于智能體更好地理解教育內(nèi)容,提供更加個性化和有針對性的教育服務(wù)。
教育智能體的應(yīng)用
教育智能體的研發(fā)尚處于起步階段,但其在課堂教學(xué)、教育評價和教師教研等典型教育場景中,已經(jīng)開始展現(xiàn)出巨大的應(yīng)用潛力和重要作用。
1.課堂教學(xué)
在課堂教學(xué)場景中,教師與智能體可以形成協(xié)作伙伴關(guān)系,共同推進(jìn)教學(xué)活動的實(shí)施。智能體在課堂中承擔(dān)多樣化角色和功能,為教師提供多維度支持。例如,在項(xiàng)目式學(xué)習(xí)教學(xué)模式下,學(xué)習(xí)者依賴于教師及同伴的持續(xù)性支持,以實(shí)現(xiàn)項(xiàng)目目標(biāo)。教育智能體在此過程中能夠擔(dān)任“助教”及“同伴”角色,與教師和學(xué)習(xí)者協(xié)作,全面參與項(xiàng)目式學(xué)習(xí)的各個階段。這包括個性化問題的提出、項(xiàng)目方案的協(xié)作設(shè)計(jì),以及項(xiàng)目成果的共同創(chuàng)造。此外,教育智能體能夠自動識別個體學(xué)生在協(xié)作過程中的情緒狀態(tài),并提供相應(yīng)的情感支持和交互反饋。教育智能體支持下的人機(jī)協(xié)同教學(xué),不僅可以提高教學(xué)效率,還可以促進(jìn)學(xué)生的主動探究和團(tuán)隊(duì)合作,對未來課堂教學(xué)發(fā)揮支撐作用。
2.教育評價
在教育評價中,教育智能體可以利用其多模態(tài)感知能力和記憶功能,促進(jìn)評價模式從經(jīng)驗(yàn)依賴的主觀性向數(shù)據(jù)驅(qū)動的客觀性轉(zhuǎn)變,從而提升教育評價的客觀性與公平性。如在項(xiàng)目式學(xué)習(xí)的作品評價與展示階段,教育智能體能夠利用其記憶模塊中存儲的小組協(xié)作過程性信息,對項(xiàng)目實(shí)施過程進(jìn)行細(xì)致的過程性評價。同時,教育智能體也可以從“教師”和“同伴”的不同視角,實(shí)施教師評價與同伴互評。教育智能體還可以根據(jù)個性化驅(qū)動問題與項(xiàng)目方案,預(yù)先生成相應(yīng)的過程性與結(jié)果性評價量規(guī)。
3.教師教研
在教育智能體的輔助下,教師能夠與教育智能體共同備課和開展教研活動。教育智能體首先可以為教師提供包括教學(xué)方案與多模態(tài)教學(xué)材料在內(nèi)的教學(xué)資源,并模擬和展示課堂情境,輔助教師利用外部工具和資源對備課材料進(jìn)行迭代優(yōu)化,以創(chuàng)建更符合學(xué)生實(shí)際需求的教學(xué)內(nèi)容。在教師利用這些教學(xué)資源完成教學(xué)活動后,教育智能體能夠依據(jù)其感知和記憶的課堂實(shí)施情況,對教師教學(xué)能力的客觀維度進(jìn)行量化分析,并提供詳盡的分析報告。在教研活動中,教育智能體還能扮演多種學(xué)科背景的專家角色,執(zhí)行聽課和評課任務(wù),對教學(xué)過程進(jìn)行多維度分析和Yz0bNqwJpiKr+im0O2gt6g==評價。教師可以與教育智能體進(jìn)行互動討論甚至辯論,以改進(jìn)自身的教學(xué)方法,并進(jìn)一步優(yōu)化教學(xué)過程。
結(jié)論與展望
構(gòu)建智能體一直是人工智能領(lǐng)域的長期追求目標(biāo)。教育智能體的開發(fā)需深入理解教育資源、學(xué)習(xí)者特征及教學(xué)過程,并得到教育理論及學(xué)習(xí)科學(xué)理論的堅(jiān)實(shí)支撐。教育智能體應(yīng)具備持續(xù)學(xué)習(xí)和自我完善的能力,通過與教育利益相關(guān)方的互動,實(shí)現(xiàn)自主進(jìn)化和多智能體間的有效交互。同時,教育智能體的設(shè)計(jì)和應(yīng)用需全面考慮其對教育的深遠(yuǎn)影響及潛在挑戰(zhàn)。設(shè)計(jì)者應(yīng)注重提升教育智能體的可靠性和可信度,確保其提供無偏見、公平的教育服務(wù),并深思其對學(xué)習(xí)者價值觀和倫理觀的塑造作用。
參考文獻(xiàn)
Franklin S, Graesser A. Is it an Agent, or just a Program?: A Taxonomy for Autonomous Agents[C]//International workshop on agent theories, architectures, and languages. Berlin, Heidelberg: Springer Berlin Heidelberg, 1996: 21-35.
盧宇,余京蕾,等. 多模態(tài)大模型的教育應(yīng)用研究與展望[J]. 電化教育研究,2023,44(6): 38-44.
Wei J,Wang X,et al.Chain-of-thought Prompting Elicits Reasoning in Large Language Models [J].Advances in Neural Information Processing Systems,2022,35:24824-24837.
盧宇,余京蕾,等. 基于大模型的教育智能體構(gòu)建與應(yīng)用研究[J]. 中國電化教育,2024(7): 99-108.
作者單位:北京師范大學(xué)教育學(xué)部教育技術(shù)學(xué)院