奚 駿 吳永和
教育數(shù)字人理論與實踐探研*
奚 駿1吳永和2
(1.上海市復(fù)興高級中學(xué),上海 200434;2.華東師范大學(xué) 教育信息技術(shù)學(xué)系,上海 200062)
在教育數(shù)字化轉(zhuǎn)型的背景下,作為新興信息技術(shù)代表的數(shù)字人應(yīng)如何融合創(chuàng)新基礎(chǔ)教育已成為研究者關(guān)注的焦點?;诖耍恼率紫葘?shù)字人的概念、特征、實現(xiàn)技術(shù)、應(yīng)用現(xiàn)狀進(jìn)行了概述,之后引入教育數(shù)字人概念,闡述了教育數(shù)字人的基本內(nèi)涵與六大特征;接著,文章提出了數(shù)字人信息模型,并在此基礎(chǔ)上構(gòu)建了教育數(shù)字人信息模型,闡釋了教育數(shù)字人的關(guān)鍵技術(shù);然后,文章分析了上海市復(fù)興高級中學(xué)在信息技術(shù)學(xué)科中四個教育數(shù)字人具體應(yīng)用場景的實踐案例;最后,文章就教育數(shù)字人的未來發(fā)展提出建議,以期為教育數(shù)字化轉(zhuǎn)型提供新技術(shù)和新場景。
數(shù)字人;教育數(shù)字人;信息技術(shù)學(xué)科;教育數(shù)字化轉(zhuǎn)型;應(yīng)用場景
目前,我國正處于教育數(shù)字化轉(zhuǎn)型的重要階段,《教育部2022年工作要點》提出“實施教育數(shù)字化戰(zhàn)略行動”,明確要求“指導(dǎo)推進(jìn)教育信息化新領(lǐng)域新模式試點示范,深化信息技術(shù)與教育教學(xué)融合創(chuàng)新”[1]。教育部等六部門印發(fā)《關(guān)于推進(jìn)教育新型基礎(chǔ)設(shè)施建設(shè)構(gòu)建高質(zhì)量教育支撐體系的指導(dǎo)意見》,指出要通過教育信息化新基建聚焦信息網(wǎng)絡(luò)、平臺體系、數(shù)字資源、智慧校園、創(chuàng)新應(yīng)用、可信安全六個重點方向,構(gòu)建六位一體的高質(zhì)量教育支撐體系[2]。作為全國首個數(shù)字化轉(zhuǎn)型示范區(qū),上海市教委在《上海市教育數(shù)字化轉(zhuǎn)型實施方案(2021-2023)》中提出要形成一批高質(zhì)量、可復(fù)制、可推廣的教育數(shù)字化轉(zhuǎn)型經(jīng)驗和示范場景,基于增強(qiáng)現(xiàn)實和虛擬現(xiàn)實等技術(shù)實施沉浸式、體驗式教學(xué)[3]。國家及地方相關(guān)政策的推出和實施加速了教育數(shù)字化轉(zhuǎn)型的進(jìn)程,同時也促進(jìn)了新型技術(shù)的發(fā)展,其中數(shù)字人技術(shù)受到廣泛關(guān)注。
數(shù)字人技術(shù)是教育的數(shù)字孿生,能夠?qū)崿F(xiàn)對教育的沉浸式模擬,通過對教育關(guān)系的精準(zhǔn)映射、師生間的虛實交互,實現(xiàn)智慧教育,從而提升教育質(zhì)量[4]。2001年,“中國數(shù)字人”項目開啟,創(chuàng)造了中國首個數(shù)字人數(shù)據(jù)集[5],自此,國內(nèi)逐步對數(shù)字人技術(shù)及其在教育領(lǐng)域的應(yīng)用開展了相關(guān)研究,但仍然存在一定的局限性?;诖?,本研究從理論與實踐兩個方面對教育數(shù)字人的概念、特征、模型、技術(shù)、案例及建議進(jìn)行探索研究,通過將數(shù)字人技術(shù)融合、創(chuàng)新基礎(chǔ)教育,以期為教育數(shù)字化轉(zhuǎn)型提供新技術(shù)和新場景。
數(shù)字人研究起源于1989年美國國立醫(yī)學(xué)圖書館建立的“可視人體計劃”(Visible Human Project),其原理是基于磁共振的數(shù)據(jù),通過計算機(jī)圖像技術(shù)建造虛擬人體[6],主要應(yīng)用于醫(yī)學(xué)、生物仿真、基因的研究[7]。數(shù)字人也被稱為“虛擬人”或“數(shù)字虛擬人”,通常是指具有擬人的形象且能通過語言進(jìn)行表達(dá)、互動的高度擬人化的虛擬人物。嚴(yán)格來說,“數(shù)字人”含有三種不同的定義,但它們在實際應(yīng)用中常被復(fù)合使用,本研究不做特別區(qū)分:①Digital Human,是真人的一種“數(shù)字孿生”,將真人與其生活進(jìn)行1:1的數(shù)字化再現(xiàn)[8];其典型應(yīng)用是作為真人在虛擬世界的“數(shù)字替身”“虛擬分身”(Avatar),此應(yīng)用與當(dāng)下熱門的“元宇宙”關(guān)系緊密,目標(biāo)是使人類通過虛擬分身在虛擬世界與真實世界開展無縫銜接的生活[9]。②Virtual Human,是通過虛擬形象較真實地顯示人體的生理狀態(tài)與變化,并不強(qiáng)調(diào)與真實世界的關(guān)聯(lián)。③Metahuman,是以AI為驅(qū)動,自動化完成與用戶的互動,通常承擔(dān)聊天、智能問答等工作[10]。
數(shù)字人具有“有形象、會表達(dá)、能互動”三大普遍特征[11],具體表現(xiàn)為:①數(shù)字人擁有擬人的外形,形象可以多元化,如二次元形象、3D卡通形象等,甚至可以是超寫實真人形象,故突破了感知真實性[12]。數(shù)字人的形象需要通過屏幕、AR/VR等設(shè)備觀看,不具有機(jī)器人的物理外形。②數(shù)字人具備語言、體態(tài)、情緒等方面的表達(dá)能力,說話時可以匹配口型、微表情、身體動作等,以實現(xiàn)高度擬人的“真情實感”。③數(shù)字人能夠通過真人扮演或AI驅(qū)動來實現(xiàn)與用戶的互動,以AI技術(shù)驅(qū)動的互動是目前研究的主要方向。
數(shù)字人是通過技術(shù)集群實現(xiàn)的,其呈現(xiàn)過程通常是:形象設(shè)計→建?!鷦幼鞑蹲健铣伞秩尽鷮崟r交互。在實時交互階段,數(shù)字人實現(xiàn)了與計算機(jī)動畫(Computer Graphics,CG)的形態(tài)分割。幫助數(shù)字人實現(xiàn)高度擬人的實時互動技術(shù)主要包括:以邊緣計算為代表的高算力技術(shù),滿足了實時視頻數(shù)據(jù)處理的需要[13];動態(tài)光場建模技術(shù),是通過攝像機(jī)列陣將結(jié)構(gòu)光、動態(tài)、重光照技術(shù)一次性集成,提升了建模的效率[14];以空間信息及光流信息分流為代表的計算機(jī)視覺技術(shù),實現(xiàn)了人體動作識別[15],降低了內(nèi)容制作成本;音頻驅(qū)動神經(jīng)輻射場技術(shù),實現(xiàn)了通過語音信號生成口唇、微表情合成,取代了需要人工參與的光學(xué)捕捉設(shè)備[16];以可微分渲染[17]、神經(jīng)渲染[18]為代表的實時渲染技術(shù),實現(xiàn)了高質(zhì)量、高速度、低延遲的圖像生成需求;多模態(tài)人機(jī)交互技術(shù),支持?jǐn)?shù)字人實現(xiàn)對師生與知識的精準(zhǔn)刻畫,具有自驅(qū)的“思考”與交流能力[19]。
目前,技術(shù)的飛躍實現(xiàn)了數(shù)字人外貌精度從仿真到超現(xiàn)實仿真、應(yīng)用難度從影像專業(yè)級到消費級、交互方式從人工到全自動的三方面演進(jìn)。數(shù)字人的應(yīng)用主要有四種類型:①“虛擬偶像型”,是具有明確人設(shè)的虛擬形象,相較于真人偶像更趨近于理想模型,是IP運營的個性化養(yǎng)成形態(tài)[20],如清華大學(xué)推出的能唱會彈的虛擬學(xué)生華智冰;②“服務(wù)助手型”,是指數(shù)字人代替真人向真實用戶提供服務(wù),一般通過高仿真的人物造型結(jié)合職能場景,實現(xiàn)個性化服務(wù)工作,如浦發(fā)銀行的虛擬客服小浦、多模態(tài)智能問答機(jī)器人、新華社的虛擬記者[21];③“創(chuàng)作載體型”,是指將數(shù)字人作為內(nèi)容進(jìn)行開發(fā),主要形式為社區(qū)創(chuàng)作與IP的結(jié)合,如關(guān)于早期虛擬歌手初音未來、洛天依的社區(qū)創(chuàng)作十分活躍[22];④“數(shù)字替身型”,是指為真人打造虛擬形象作為替身,呈現(xiàn)虛實疊化[23],目前主要應(yīng)用于社交、娛樂等領(lǐng)域,如冬奧備戰(zhàn)期間,谷愛凌通過數(shù)字分身參與了冬奧演播室的錄制活動。2021年,國家廣播電視總局印發(fā)《廣播電視和網(wǎng)絡(luò)視聽“十四五”科技發(fā)展規(guī)劃》[24],提出要加快推進(jìn)AI無障礙播報、虛擬主播等制播體系技術(shù)升級,表明“數(shù)字替身型”應(yīng)用將會得到快速發(fā)展。
數(shù)字人技術(shù)在商業(yè)領(lǐng)域涌現(xiàn)了大量的應(yīng)用案例,建立了成熟的商業(yè)模式,但是該技術(shù)在教育領(lǐng)域的應(yīng)用較為少見。究其原因,主要在于教育領(lǐng)域具有千差萬別的用戶需求,包括個性化教師、個性化學(xué)生、知識本體、學(xué)科特征、學(xué)段特征等,相較于商業(yè)場景只服務(wù)單一需求的用戶而言顯得尤為復(fù)雜且多樣[25]。
當(dāng)前,教育數(shù)字化改革的核心目標(biāo)是提升教學(xué)質(zhì)量,其實現(xiàn)的關(guān)鍵是對傳統(tǒng)的教學(xué)過程進(jìn)行高質(zhì)量提升,其中包含三個方面:①沉浸式交互,能提供知識的感性表達(dá)途徑,降低學(xué)生的理解難度,從而提升教學(xué)質(zhì)量;②去中心化生產(chǎn),能形成豐富的教學(xué)資源及形態(tài),幫助學(xué)生擴(kuò)展對知識的理解途徑,從而提升教學(xué)質(zhì)量;③個性化、智能化教學(xué),能通過因材施教的教學(xué)方法,為學(xué)生提供符合其發(fā)展目標(biāo)的、可以自主自由學(xué)習(xí)的服務(wù),從而提升教學(xué)質(zhì)量。
為此,本研究將對數(shù)字人技術(shù)進(jìn)行一定的適應(yīng)性改造,力求發(fā)揮其高度擬人化優(yōu)勢,并通過與教育數(shù)據(jù)、人工智能技術(shù)等的結(jié)合,構(gòu)建出教育數(shù)字人的應(yīng)用模型,服務(wù)于教學(xué)質(zhì)量提升的核心目標(biāo)。
在教育領(lǐng)域,數(shù)字人可以發(fā)揮擬人化的能力,實現(xiàn)對師生的模仿,從而創(chuàng)造新的師生交流形態(tài),推動教學(xué)與學(xué)習(xí)的形式變革。此外,數(shù)字人在參與教育教學(xué)的過程中,還可以打破傳統(tǒng)PPT板書、教具模型、平面網(wǎng)頁形態(tài)軟件的主要形式,對知識的教學(xué)形式、教學(xué)資源形式實現(xiàn)再造,為師生乃至管理者提供個性化、智能化服務(wù)工具,從而變身為教育專用的“教育數(shù)字人”。
綜上,本研究認(rèn)為教育數(shù)字人的基本內(nèi)涵是以虛擬形象作為師生的表象,同時以“代理人”的身份,為知識傳遞提供更有趣、更智能的途徑:①從形式上來看,教育數(shù)字人主要是對師生的形態(tài)、感知、工作方式進(jìn)行智能化模擬,從而承擔(dān)師生的數(shù)字替身、學(xué)科智能助教等多種形態(tài)的工作。相較于硬件機(jī)器人、平面的軟件界面而言,教育數(shù)字人無論是從感官上還是從感知上都具有高度的擬人特性。②從功能上來看,教育數(shù)字人主要是作為師生與知識之間信息傳達(dá)的代理人,為師生提供全新的交流互動形態(tài)、內(nèi)容資源形態(tài)、信息表現(xiàn)形態(tài)、情感流動形態(tài),在教育過程中滿足沉浸式教學(xué)方式、去中心化內(nèi)容生產(chǎn)、個性化教學(xué)服務(wù)、智能化教學(xué)服務(wù)等需求。
通用型數(shù)字人具有“有形象、會表達(dá)、能互動”三大特征,在商業(yè)領(lǐng)域通過模仿偶像、客服實現(xiàn)對用戶的服務(wù)。延伸至教育領(lǐng)域,教育數(shù)字人既以師生為模仿對象,又以師生為服務(wù)對象,扮演虛擬教師、虛擬學(xué)生、虛擬助教等多元角色,從而實現(xiàn)創(chuàng)新的知識傳遞形式。教育數(shù)字人是對數(shù)字人技術(shù)在教育應(yīng)用中的進(jìn)一步深化,本研究認(rèn)為其特征主要表現(xiàn)為師生交互、知識情境、技術(shù)實現(xiàn)三個方面。
(1)師生交互方面
①多元角色。吳永和等[26]指出,數(shù)字人技術(shù)對從教師到學(xué)生的傳統(tǒng)信息流轉(zhuǎn)關(guān)系進(jìn)行了全新解構(gòu),真實與虛擬的雙方承擔(dān)多元化職能,打破了傳統(tǒng)界限。例如,虛擬教師作為助教,配合真實教師實現(xiàn)雙師課堂、翻轉(zhuǎn)課堂——該虛擬教師既可以由教師扮演,也可以由學(xué)生扮演。當(dāng)學(xué)生扮演助教時,其本質(zhì)是“優(yōu)秀學(xué)生”通過使用符合學(xué)生習(xí)慣的用語,彌補(bǔ)教師用語的固化,從而提升課堂的教學(xué)質(zhì)量。
②虛實統(tǒng)一。數(shù)字人所扮演的虛擬師生與真實師生是統(tǒng)一體,虛實角色之間是平等的。虛擬教師或虛擬學(xué)生是真實師生的載體,可以為真實師生提供完整的情感投射。數(shù)字人的虛擬形態(tài)可以完善原有的情感流動機(jī)制,放大情感交流的效能,確保真實情感在代理過程中不發(fā)生損耗與偏差。
(2)知識情境方面
①開放生態(tài)。教育數(shù)字人為知識重構(gòu)、資源創(chuàng)新、數(shù)據(jù)供應(yīng)、情境再造提供了有效的支撐,讓師生都能成為教育資源的供給方,打破了自上而下的傳統(tǒng)專業(yè)內(nèi)生成的內(nèi)容(Professionally Generated Content,PGC)生態(tài),通過達(dá)成去中心化的用戶生成的內(nèi)容(User Generated Content,UGC)創(chuàng)作共識,快速提升教育資源的質(zhì)量與數(shù)量。
②感性沉浸。學(xué)生更容易理解具象化的知識,教育數(shù)字人可實現(xiàn)對真實世界的虛擬再現(xiàn),并通過虛實結(jié)合的知識傳達(dá)方式,幫助師生共同打造新型的虛擬教學(xué)場景,使師生雙方均獲得臨場感,實現(xiàn)與知識的共情。
(3)技術(shù)實現(xiàn)方面
①因材施教。教育數(shù)字人在視覺上是師生個性展示的新途徑,包括審美、喜好、文化背景等。教育數(shù)字人打破了真實面貌、行為習(xí)慣所產(chǎn)生的認(rèn)知偏差,可實現(xiàn)對師生個性的深度表達(dá)。在技術(shù)層面,教育數(shù)字人結(jié)合師生的學(xué)習(xí)數(shù)據(jù)、認(rèn)知數(shù)據(jù)、發(fā)展目標(biāo)等數(shù)據(jù),結(jié)合智能決策系統(tǒng),實現(xiàn)個性化的教學(xué)服務(wù),滿足學(xué)生因材施教的需求。
②自我進(jìn)化。在智能化方面,教育數(shù)字人可承擔(dān)智能助教、虛擬教師的職能,通過智能系統(tǒng)有效減輕教師負(fù)擔(dān)。教育數(shù)字人通過學(xué)習(xí)專家型知識、師生交互數(shù)據(jù)等實現(xiàn)自我進(jìn)化,令人機(jī)互動的結(jié)果更接近真實。同時,針對教育智能要素和服務(wù)對象的復(fù)雜性,教育數(shù)字人在自動化工作的過程中需實施及時警報的機(jī)制,在自動化與人工之間實現(xiàn)無縫協(xié)作,以避免因不夠成熟的自動化行為而對師生產(chǎn)生負(fù)面影響。
數(shù)字人是數(shù)字化的一種新技術(shù)形態(tài)。祝智庭等[27]認(rèn)為,數(shù)字化的本質(zhì)是將信息轉(zhuǎn)化為數(shù)據(jù)并實現(xiàn)處理,其過程包括信息的采集、輸入、加工、輸出、交互。而數(shù)字人進(jìn)行的是多模態(tài)交互,因此蔡蘇等[28]指出相對平面軟件數(shù)字人具有視覺、聽覺等綜合感知。
圖1 數(shù)字人信息模型
基于上述分析,本研究提出了數(shù)字人信息模型,如圖1所示。其中在采集、交互兩個階段,數(shù)字人的信息表達(dá)是多模態(tài)的,表達(dá)形式包括語言、文字、圖像、動作等;而在處理階段,主要是對采集的多模態(tài)數(shù)據(jù)進(jìn)行形象動態(tài)的合成,主要技術(shù)包括CG建模、邊緣計算、實時渲染、語音合成、動畫和成等。另外,交互階段將合成的形象動態(tài)與知識圖譜、智能決策系統(tǒng)等技術(shù)進(jìn)行結(jié)合,實現(xiàn)多模態(tài)交互,其交互形式分為人工、智能兩種。
以數(shù)字人信息模型為基礎(chǔ),為滿足服務(wù)教育的需求,本研究構(gòu)建了教育數(shù)字人信息模型,如圖2所示。教育數(shù)字人的主要服務(wù)對象是教師與學(xué)生,通過多模態(tài)的信息處理,服務(wù)于知識傳遞與情境創(chuàng)造兩個目標(biāo)。
圖2 教育數(shù)字人信息模型
從本質(zhì)上來說,教育數(shù)字人信息模型在整體信息處理方面與數(shù)字人信息模型別無二致,但由于教育領(lǐng)域具有強(qiáng)烈的教育化特質(zhì),因此教育數(shù)字人在信息處理過程中增加了大量的師生個性化數(shù)據(jù),這一點相較于商業(yè)應(yīng)用顯得復(fù)雜許多。
教育數(shù)字人信息模型首先通過計算機(jī)視覺、語義識別、動態(tài)捕捉等技術(shù)實現(xiàn)對師生語言、情緒、行為、身份等的多模態(tài)數(shù)據(jù)采集,使采集的數(shù)據(jù)與更多的師生個性化數(shù)據(jù)相結(jié)合,其中學(xué)生的個性化數(shù)據(jù)包括學(xué)習(xí)數(shù)據(jù)、發(fā)展目標(biāo)、認(rèn)知風(fēng)格等,教師的個性化數(shù)據(jù)包括教學(xué)經(jīng)驗、教學(xué)標(biāo)準(zhǔn)等。隨后,通過表情合成、邊緣計算、語音合成等技術(shù),在視覺層面實現(xiàn)形象處理,在數(shù)據(jù)挖掘?qū)用鎸崿F(xiàn)學(xué)習(xí)者風(fēng)格模型、教學(xué)推薦模型、學(xué)習(xí)成本模型等模型的構(gòu)建,為智能化交互做準(zhǔn)備。最后,通過知識圖譜、情感計算、聯(lián)邦學(xué)習(xí)等技術(shù),結(jié)合個性化模型、實時數(shù)據(jù)、視覺形象等,最終實現(xiàn)知識的多模態(tài)傳遞與沉浸式的教學(xué)情境創(chuàng)造,從而完成師生間的信息與數(shù)據(jù)轉(zhuǎn)化。
除信息模型層面外,還需要從技術(shù)層面解決教育數(shù)字人所面臨的教育可用性問題:①滿足沉浸式教學(xué)需求下的師生身份與信息安全;②滿足去中心化生產(chǎn)需求下的低成本與精度平衡;③滿足個性化與智能化教學(xué)需求下的數(shù)據(jù)融合,以建立師生的完整信息模型。為解決上述問題,教育數(shù)字人除了運用通用數(shù)字人技術(shù),還需要特別關(guān)注以下關(guān)鍵技術(shù):
(1)區(qū)塊鏈技術(shù)
在多模態(tài)數(shù)據(jù)采集階段,教育場景中的師生關(guān)系需要嚴(yán)密的身份認(rèn)證機(jī)制,以避免因虛假身份而造成的信息不安全問題。通過區(qū)塊鏈可追溯、不可篡改的智能合約機(jī)制,能夠確保在數(shù)字化的虛擬形象背后,師生的身份、信息流轉(zhuǎn)、信息存儲均處于與真實對應(yīng)、安全、穩(wěn)定、透明的狀態(tài)。由于區(qū)塊鏈技術(shù)本身存在交易吞吐率(Transaction Per Second,TPS)的問題,因此通過終端硬件設(shè)備來實現(xiàn)信息采集與認(rèn)證也可作為替代模式。
(2)計算機(jī)視覺的動作捕捉技術(shù)
在多模態(tài)數(shù)據(jù)采集階段,計算機(jī)視覺的動作捕捉技術(shù)能夠幫助教師個人實現(xiàn)低成本面部與體態(tài)的捕捉。雖然計算機(jī)視覺的動作捕捉技術(shù)與光學(xué)式、慣性式動作捕捉在精確度、穩(wěn)定性方面有一定的差距,但此技術(shù)切實降低了教育應(yīng)用的門檻,在性能與效能間達(dá)到了平衡,為去中心化的優(yōu)質(zhì)教育資源創(chuàng)造提供了支撐。
(3)基于AI的精細(xì)化表情合成技術(shù)
在形象處理階段,服務(wù)與教育數(shù)字人的“虛實統(tǒng)一”的特征、表情的精細(xì)化再現(xiàn),是虛擬師生能夠完成情感投射的重要因素。馬薩諸塞大學(xué)與Adobe研究院等機(jī)構(gòu)共同提出將發(fā)音方式與說話人身份進(jìn)行區(qū)別控制的方法,以緩解現(xiàn)有的口唇生硬配合的不自然問題[29]。該研究認(rèn)為音頻的發(fā)音方式與說話人身份無關(guān),不管誰說“啊”都需要將嘴張開,但說話人的身份決定了面部表情的細(xì)節(jié),不同身份的人說“啊”時嘴唇張開幅度、鼻眼與頭部的動態(tài)有顯著區(qū)別。該研究結(jié)果可提升數(shù)字人表情的自然性,并實現(xiàn)通過語音對表情進(jìn)行預(yù)測。在空中課堂直播中,當(dāng)高并發(fā)堵塞網(wǎng)絡(luò)造成畫面延遲時,該項技術(shù)可對師生面部表情實時自動修補(bǔ),以確保師生雙方的情緒與情感被完整表達(dá)出來。
(4)數(shù)據(jù)融合技術(shù)
在多模態(tài)交互階段,要做到個性化教學(xué)與多模態(tài)交互,需要對多模態(tài)的信息(即文字、視頻、圖像、語音、動作等)實現(xiàn)處理,并打破數(shù)據(jù)邊界,建立完整的師生數(shù)字模型。通過專家型學(xué)科知識庫與知識圖譜技術(shù)的配合,可以進(jìn)行知識關(guān)系的推理與問題理解,實現(xiàn)“自主教學(xué)”的能力[30];通過情感計算等技術(shù),可以讓師生的認(rèn)知、心理等情感數(shù)據(jù)進(jìn)入個性化建模的層面,從而保障教育智能的完整性;通過聯(lián)邦學(xué)習(xí)、數(shù)據(jù)挖掘技術(shù)的配合,可以實現(xiàn)跨系統(tǒng)數(shù)據(jù)、跨模型的聯(lián)合建模,避免數(shù)據(jù)孤島問題[31]。
在教育數(shù)字人六大特征的影響下,為實現(xiàn)教師、學(xué)生和知識情境三方聯(lián)動的優(yōu)化,從而實現(xiàn)教育質(zhì)量的提升,本研究總結(jié)了教育數(shù)字人的內(nèi)部關(guān)系與作用(如圖3所示):①在多元角色、虛實統(tǒng)一特征的影響下,師生間的交互出現(xiàn)新形態(tài),促進(jìn)了教學(xué)方式的深度挖掘,如開展雙師課堂、個性化智能助教、翻轉(zhuǎn)課堂等,這提供了差異化教學(xué)的途徑;②在開放生態(tài)、感性沉浸特征的影響下,讓師生參與沉浸式教學(xué)內(nèi)容的創(chuàng)作,可以快速創(chuàng)造出多樣且匹配度高的教育資源形態(tài);③在因材施教、自我進(jìn)化特征的影響下,將教學(xué)過程中的師生個性化數(shù)據(jù)充分融合,可以實現(xiàn)對師生行為、認(rèn)知、偏好等的動態(tài)理解,從而提供個性化學(xué)習(xí)路徑。
圖3 教育數(shù)字人的內(nèi)部關(guān)系與作用
結(jié)合教育數(shù)字人的內(nèi)部關(guān)系與作用,本研究以上海市復(fù)興高級中學(xué)的四個具體應(yīng)用場景實踐為切入點,對教育數(shù)字人在教育質(zhì)量提升方面的具體作用進(jìn)行了觀察。該校將教育數(shù)字人技術(shù)引入信息技術(shù)學(xué)科的教學(xué),承擔(dān)信息技術(shù)手段、學(xué)科教學(xué)內(nèi)容載體兩個方面的功能,從而實現(xiàn)該學(xué)科教學(xué)質(zhì)量與智能化程度的雙提升。
該校通過智能助教對學(xué)生進(jìn)行個性化指導(dǎo),是充分利用智能交互手段,為學(xué)生提供個性化學(xué)習(xí)途徑的典型案例。高中信息技術(shù)學(xué)科的知識組織具有邏輯順序清晰、偏直線式而非螺旋式、邊界相對明確的特點,可以在系統(tǒng)中構(gòu)建校本知識庫,利用知識圖譜、智能決策系統(tǒng)來實現(xiàn)智能問答交互,彌補(bǔ)實踐環(huán)節(jié)欠缺[32]。智能助教建立在云端的編程實驗環(huán)境之上,通過對學(xué)生編程過程的數(shù)據(jù)監(jiān)控,向?qū)W生推薦個性化學(xué)習(xí)內(nèi)容或在代碼過程中提供指導(dǎo),為學(xué)生完成信息學(xué)科的自主學(xué)習(xí)提供支持,同時降低教師個性化教學(xué)的難度;同時在數(shù)據(jù)的累積過程中,實現(xiàn)系統(tǒng)的迭代與進(jìn)化,提升系統(tǒng)的智能程度。
為快速積累教學(xué)資源,以服務(wù)上海市于2021年秋季啟用的新版信息技術(shù)學(xué)科教材,該校采用虛擬教師智能合成系統(tǒng),實現(xiàn)高效的微課資源制作,是教育資源形態(tài)優(yōu)化方面的典型案例。如圖4所示,在指定虛擬教師形象并為其設(shè)置腳本文本、授課素材后,系統(tǒng)將合成形象、語音、語調(diào)、口型、動作、講課內(nèi)容,實現(xiàn)以虛擬教師為主講人的授課視頻。由于無須教師本人出鏡、出聲,因此該系統(tǒng)提升了資源錄制、修改的便利性,降低了教師工作難度。
該校采用虛擬形象直播系統(tǒng),實現(xiàn)了師生在視頻流中以虛擬形象示人的功能,是差異化教學(xué)途徑的典型案例。具體來說,虛擬角色有三種應(yīng)用:①采用雙師授課的形式。如圖5所示,真實教師與虛擬教師共同實現(xiàn)雙師課堂,這樣通過多維的表達(dá)方式進(jìn)一步豐富了知識傳遞的視角。②在線上課程中師生以虛擬形象替換視頻流中的個人形象,增加了線上教學(xué)的趣味性,提升了師生的課堂參與度。③構(gòu)建虛擬會場,開展虛實融合的沉浸式講座。主講教師與學(xué)生均以虛擬形象進(jìn)入會場,并且授課資料、教室會場均融入在虛擬場景中,這樣學(xué)生可以在虛擬會場中自由行走、獲取資料并實現(xiàn)社交。虛擬會場與真實講座現(xiàn)場并行,兩者獲得的信息需求一致,共同創(chuàng)造有趣的知識情境。
圖4 虛擬教師合成后畫面
圖5 真實教師與虛擬教師共同實現(xiàn)雙師課堂
信息技術(shù)課程旨在全面提升學(xué)生的信息素養(yǎng)[33],而為了支撐信息素養(yǎng)的發(fā)展,該校將數(shù)字人技術(shù)作為知識充實到學(xué)科內(nèi)容之中,并挑選與學(xué)科密切相關(guān)的技術(shù)內(nèi)容進(jìn)行校本課程建設(shè),以提升學(xué)科教學(xué)質(zhì)量。例如,可以在信息技術(shù)學(xué)科中選取語音識別、文本挖掘等數(shù)字人相關(guān)技術(shù),以開展專題學(xué)習(xí);也可以將信息技術(shù)與多媒體、藝術(shù)欣賞等模塊相結(jié)合,通過“信息技術(shù)+”的學(xué)科融合教學(xué),將信息技術(shù)貫穿于更多學(xué)科的教學(xué)之中,以幫助全體師生在實踐與應(yīng)用的過程中實現(xiàn)信息技術(shù)素養(yǎng)的提升,如將合乎規(guī)范的數(shù)字人技術(shù)與藝術(shù)課程相結(jié)合,幫助學(xué)生實現(xiàn)虛擬人物的藝術(shù)創(chuàng)造。
目前,教育數(shù)字人仍然處于實驗階段。為促使教育數(shù)字人從“代理人”發(fā)展為“獨立的教育智慧體”,從而助力實現(xiàn)教育數(shù)字化轉(zhuǎn)型,本研究針對教育數(shù)字人的未來發(fā)展提出如下建議:
教育數(shù)字人實現(xiàn)了教學(xué)體驗的創(chuàng)變,特別是在多模態(tài)的人機(jī)交互這一環(huán)節(jié)中,但其在情感表達(dá)能力方面還需要進(jìn)一步提升,以擺脫“代理人”的局限,而成為獨立的教育智能體。本研究認(rèn)為,可以結(jié)合認(rèn)知科學(xué)、教育心理學(xué)、社會學(xué)等的相關(guān)理論開展進(jìn)一步研究,在情感反饋、情感互動機(jī)制等方面實現(xiàn)突破并獲得更廣泛的教育價值。例如,小初階段師生的年齡差距大,容易形成學(xué)生“怕”老師的局面,而通過教育數(shù)字人的恰當(dāng)應(yīng)用,可以縮小代際鴻溝;在校園心理干預(yù)的場景下,結(jié)合健康心理學(xué)的相關(guān)理論研究,可以實現(xiàn)高效的青少年心理干預(yù),消解其面對真人輔導(dǎo)時的抗拒心理。
教育數(shù)字人在視效方面已經(jīng)具備了良好的技術(shù)基礎(chǔ),但其在智能化交互方面仍然需要進(jìn)一步提升。本研究認(rèn)為,可以通過進(jìn)一步挖掘師生的個性化數(shù)據(jù),來實現(xiàn)精準(zhǔn)化的情感計算、認(rèn)知計算、學(xué)習(xí)成本計算,并建立相關(guān)模型,從而確保智能化交互的精準(zhǔn)度和個性化的匹配度。
“應(yīng)用為先”是教育數(shù)字化轉(zhuǎn)型的核心,應(yīng)該使技術(shù)適應(yīng)教育場景,而非教育場景遷就技術(shù)。本研究已驗證高中信息技術(shù)學(xué)科的成效,未來研究可以將經(jīng)驗拓展至其他學(xué)科和相關(guān)領(lǐng)域,如基礎(chǔ)教育階段的學(xué)科知識大多是螺旋上升式的,不僅要考量知識的繼承關(guān)系,還需考量不同年級的知識分層;文科科目知識關(guān)系相對模糊,應(yīng)關(guān)注如何建立能夠量化考察的知識結(jié)構(gòu);教育數(shù)字人作為獨立的教育智慧體,應(yīng)具備相關(guān)學(xué)科的某些強(qiáng)烈特征——正如現(xiàn)實中的數(shù)學(xué)老師與音樂老師的教學(xué)方式完全不同,這就需要避免“一刀切”的技術(shù)應(yīng)用方式。
從宏觀角度來說,教育數(shù)字人在教育領(lǐng)域的發(fā)展前景可觀,而作為教育數(shù)字化建設(shè)進(jìn)程中的一環(huán),其效能建立在教育資產(chǎn)整體數(shù)字化建設(shè)的基礎(chǔ)上。本研究認(rèn)為,可以通過全面推進(jìn)數(shù)字化轉(zhuǎn)型的戰(zhàn)略部署,使各層級的教育單位更加深入地認(rèn)識和理解教育資產(chǎn)的數(shù)字化,從而形成有效的工作分配機(jī)制與管理機(jī)制,確保數(shù)字化技術(shù)在教育領(lǐng)域的應(yīng)用。從上海建設(shè)備課、教學(xué)、作業(yè)輔導(dǎo)三大助手來看[34],教育數(shù)字人能夠?qū)崿F(xiàn)對這三大應(yīng)用場景的效能提升與體驗變革,是對具有宏觀性、前瞻性的政策面建設(shè)的有效落實與創(chuàng)新。
[1]教育部.教育部2022年工作要點[OL].
[2]教育部.教育部等六部門關(guān)于推進(jìn)教育新型基礎(chǔ)設(shè)施建設(shè)構(gòu)建高質(zhì)量教育支撐體系的指導(dǎo)意見[OL].
[3]上海市教委.上海市教育數(shù)字化轉(zhuǎn)型實施方案(2021-2023)[OL].
[4]李徳仁.基于數(shù)字孿生的智慧城市[J].互聯(lián)網(wǎng)天地,2021,(7):12.
[5]Zhang S X, Heng P A, Liu Z J, et al. The Chinese visible human (CVH) datasets incorporate technical and imaging advances on earlier digital humans[J]. Journal of Anatomy, 2004,(3):165-173.
[6]奇云.美國可視人體計劃[J].科學(xué)之友,2003,(4):13.
[7]朱勁松,史樹堂,牛小龍.數(shù)字化虛擬人體的研究現(xiàn)狀及其在醫(yī)學(xué)中的應(yīng)用前景[J].河北職工醫(yī)學(xué)院學(xué)報,2007,(3):59-60.
[8]中國電子技術(shù)標(biāo)準(zhǔn)化研究院,樹根互聯(lián)技術(shù)有限公司.數(shù)字孿生應(yīng)用白皮書(2020版)[OL].
[9]華子荀,黃慕雄.教育元宇宙的教學(xué)場域架構(gòu)、關(guān)鍵技術(shù)與實驗研究[J].現(xiàn)代遠(yuǎn)程教育研究,2021,(6):23-31.
[10]夏翠娟,鐵鐘,黃薇.元宇宙中的數(shù)字記憶:“虛擬數(shù)字人”的數(shù)字記憶概念模型及其應(yīng)用場景[OL].
[11]量子位.2021虛擬數(shù)字人深度產(chǎn)業(yè)報告[OL].
[12]謝周浦.跨越“恐怖谷”:電影中“數(shù)字視覺效果”真實性問題的再思考——以全CG電影《爵跡》《最終幻想:靈魂深處》和《最終幻想:王者之劍》為例[J].電影新作,2022,(1):87-93.
[13]楊錚,賀驍武,吳家行,等.面向?qū)崟r視頻流分析的邊緣計算技術(shù)[J].中國科學(xué):信息科學(xué),2022,(1):1-53.
[14]程龍,郭立,袁紅星,等.基于光場渲染的動態(tài)3D目標(biāo)重構(gòu)技術(shù)[J].中國科學(xué)院研究生院學(xué)報,2009,(6):781-788.
[15]Simonyan K, Zisserman A. Two-Stream convolutional networks for action recognition in videos[OL].
[16]Guo Y D, Chen K Y, Liang S, et al. AD-NeRF: Audio driven neural radiance fields for talking head synthesis[OL].
[17]Loper M, Black M J. OpenDR: An approximate differentiable renderer[OL].
[18]Kato H, Ushiku Y, Harada T. Neural 3D mesh renderer[OL].
[19]王一巖,鄭永和.多模態(tài)數(shù)據(jù)融合:破解智能教育關(guān)鍵問題的核心驅(qū)動力[J].現(xiàn)代遠(yuǎn)程教育研究,2022,(2):93-102.
[20]喻國明,耿曉夢.試論人工智能時代虛擬偶像的技術(shù)賦能與擬象解構(gòu)[J].上海交通大學(xué)學(xué)報(哲學(xué)社會科學(xué)版),2020,(1):23-30.
[21]新華社.新華社推出全球首位3D版人工智能合成主播[J].中國廣播,2020,(6):68.
[22]李鎵,陳飛揚(yáng).網(wǎng)絡(luò)虛擬偶像及其粉絲群體的網(wǎng)絡(luò)互動研究——以虛擬歌姬“洛天依”為個案[J].中國青年研究,2018,(6):20-25.
[23]何國威.從動作捕捉到虛擬偶像:計算機(jī)技術(shù)對演員及電影娛樂生態(tài)的發(fā)生與重構(gòu)[J].當(dāng)代電影,2022,(1):72-81.
[24]國家廣播電視總局.廣播電視和網(wǎng)絡(luò)視聽“十四五”科技發(fā)展規(guī)劃[OL].
[25][26]吳永和,劉博文,馬曉玲.構(gòu)筑“人工智能+教育”的生態(tài)系統(tǒng)[J].遠(yuǎn)程教育雜志,2017,(5):27-39.
[27]祝智庭,胡姣.教育數(shù)字化轉(zhuǎn)型的本質(zhì)探析與研究展望[J].中國電化教育,2022,(4):1-8、25.
[28]蔡蘇,焦新月,宋伯鈞.打開教育的另一扇門——教育元宇宙的應(yīng)用、挑戰(zhàn)與展望[J].現(xiàn)代教育技術(shù),2022,(1):16-26.
[29]Zhou Y, Li D Z Y, Han X T, et al. MakeItTalk: Speaker-Aware talking head animation[OL].
[30]鄭泳智,朱定局,吳惠粦,等.知識圖譜問答領(lǐng)域綜述[J].計算機(jī)系統(tǒng)應(yīng)用,2022,(4):1-13.
[31]王亞珅.面向數(shù)據(jù)共享交換的聯(lián)邦學(xué)習(xí)技術(shù)發(fā)展綜述[J].無人系統(tǒng)技術(shù),2019,(6):58-62.
[32]Carrillo C, Flores M A. COVID-19 and teacher education: A literature review of online teaching and learning practices[J]. European Journal of Teacher Education, 2020,(4):466-487.
[33]教育部.普通高中信息技術(shù)課程標(biāo)準(zhǔn)(2017年版2020年修訂)[OL].
[34]熊秋菊.“一座統(tǒng)管”構(gòu)建數(shù)字新生態(tài)實現(xiàn)教育高質(zhì)量發(fā)展[J].上海教育,2022,(7):10-11.
Research on the Theory and Practice of Educational Digital Humans
XI Jun1WU Yong-he2
Under the context of the digital transformation of education, how the digital human as a representative of emerging information technology integrates and innovates basic education has become the focus of researchers. Based on this, this paper firstly, outlined the connotation, characteristics, implementation technology and application status of the digital human, subsequently introduced the educational digital human concept and expounded on the basic connotation and six characteristics of educational digital human. In addition, this paper proposed the information model of the digital human, established the information model of the educational digital human on this basis, and elucidated the key technologies of the educational digital human. Then, this paper analyzed the practical cases of four specific application scenarios of the educational digital human in Shanghai Fuxing Senior High School in the subject of information technology. Finally, this paper put forward suggestions for the development of the educational digital human, expecting to provide new technologies and new scenarios for the digital transformation of education.
digital human; educational digital human; the subject of information technology; educational digitalization reform; application scenarios
G40-057
A
1009—8097(2022)08—0100—11
10.3969/j.issn.1009-8097.2022.08.012
本文為2021年度國家社會科學(xué)基金重大項目“面向未成年人的人工智能技術(shù)規(guī)范研究”(項目編號:21&ZD238)的階段性研究成果。
奚駿,中學(xué)特級教師,碩士,研究方向為教育信息化人工智能教育應(yīng)用、教育數(shù)字化轉(zhuǎn)型,郵箱為yzxijun@163.com。
2022年3月12日
編輯:小時