張 博 董瑞海
(1. 華東師范大學(xué)教育信息技術(shù)學(xué)系,上海 200062;2. 都柏林大學(xué)計(jì)算機(jī)學(xué)院,愛爾蘭,都柏林,D4)
自然語(yǔ)言處理(Natural Language Processing, NLP)于20世紀(jì)50年代末興起?!皥D靈測(cè)試”的出現(xiàn)被認(rèn)為是自然語(yǔ)言處理發(fā)展的開端。60年代,人工智能領(lǐng)域的第一次發(fā)展高潮出現(xiàn),孕育出自然語(yǔ)言處理和人機(jī)對(duì)話技術(shù)。70年代開始,基于統(tǒng)計(jì)的方法逐漸代替了基于規(guī)則的方法。90年代中期以來(lái),計(jì)算機(jī)的運(yùn)行速度和存儲(chǔ)量大幅度增加,為自然語(yǔ)言處理技術(shù)的飛速發(fā)展提供了硬件基礎(chǔ)。同時(shí),隨著互聯(lián)網(wǎng)商業(yè)化和網(wǎng)絡(luò)技術(shù)的發(fā)展,基于自然語(yǔ)言的信息檢索、提煉,以及語(yǔ)言翻譯和理解的需求日益增加,這些都促使語(yǔ)音和語(yǔ)言處理技術(shù)逐漸產(chǎn)品化并被廣泛應(yīng)用。到了21世紀(jì),自然語(yǔ)言處理技術(shù)的突破進(jìn)展,已經(jīng)使人工智能(Artificial Intelligence,AI)系統(tǒng)的語(yǔ)音能力、語(yǔ)言能力等得到前所未有的提高,并開始對(duì)全球發(fā)展產(chǎn)生重要的經(jīng)濟(jì)影響。
人工智能尤其是自然語(yǔ)言處理技術(shù)的快速發(fā)展給教育領(lǐng)域帶來(lái)了巨大的機(jī)遇(Alhawiti, 2014),并衍生出人工智能+教育。人工智能教育,又稱智能教育(Artificial Intelligence in Education, AIED),是人工智能技術(shù)對(duì)教育的賦能,具體是指通過(guò)人工智能技術(shù)在教育領(lǐng)域的運(yùn)用,來(lái)實(shí)現(xiàn)輔助、優(yōu)化教與學(xué)過(guò)程,甚至是替代教師完成一些機(jī)械性工作,以提升教育質(zhì)量,實(shí)現(xiàn)個(gè)性化學(xué)習(xí)等目標(biāo)(吳永和,劉博文,馬曉玲,2017)。作為人工智能最重要的一部分,自然語(yǔ)言處理的快速發(fā)展,對(duì)教育實(shí)現(xiàn)智能發(fā)展具有關(guān)鍵的促進(jìn)作用。鄭南寧指出自然語(yǔ)言處理技術(shù)有望幫助教師從簡(jiǎn)單重復(fù)的教學(xué)工作中解放出來(lái),比如,降低教師作業(yè)批改的工作量,使他們有更多時(shí)間專注學(xué)生全面長(zhǎng)遠(yuǎn)的發(fā)展(鄭南寧,2019)。其次,自然語(yǔ)言處理技術(shù)可以促進(jìn)傳統(tǒng)教學(xué)方法、教學(xué)環(huán)境的變革,比如提供更多元化的教學(xué)材料、更豐富的交互方式、更加個(gè)性化的教育模式等(清華大學(xué)人工智能研究院,2020)。未來(lái)教師將不僅僅是知識(shí)的傳授者,也將成為智能化滿足學(xué)生個(gè)性化學(xué)習(xí)需求的教學(xué)實(shí)踐者。本文旨在通過(guò)對(duì)國(guó)內(nèi)外AI科學(xué)家近幾年公開發(fā)表的訪談、演講、會(huì)議報(bào)告、論文等數(shù)據(jù)進(jìn)行分析,梳理自然語(yǔ)言處理關(guān)鍵技術(shù)的發(fā)展趨勢(shì),探討其賦能教育智能發(fā)展的現(xiàn)狀,以及在未來(lái)智能教育發(fā)展中的應(yīng)用趨勢(shì)與挑戰(zhàn)。
人工智能的持續(xù)發(fā)展離不開AI科學(xué)家的不斷探索和創(chuàng)新,他們是技術(shù)持續(xù)發(fā)展的推動(dòng)者,是技術(shù)應(yīng)用趨勢(shì)的預(yù)測(cè)者,他們會(huì)在各種重要場(chǎng)合(例如,訪談、演講、國(guó)際會(huì)議等)發(fā)表最新的研究,以及對(duì)人工智能未來(lái)發(fā)展趨勢(shì)的看法。AI科學(xué)家樂(lè)觀預(yù)測(cè)自然語(yǔ)言處理技術(shù)將進(jìn)一步發(fā)展成熟,并在未來(lái)被應(yīng)用到更多領(lǐng)域,尤其是教育領(lǐng)域。2019年,劉群在知乎專訪中提到自然語(yǔ)言處理讓機(jī)器變得善解人意(知乎,2019)。沈向洋在公開演講時(shí)表示,下一個(gè)十年人工智能的突破在自然語(yǔ)言的理解方面(清華大學(xué),2020)。2017年,吳達(dá)恩在斯坦福的人工智能年度報(bào)告中提出,隨著深度學(xué)習(xí)的快速發(fā)展及其在自然語(yǔ)言處理領(lǐng)域的廣泛應(yīng)用,自然語(yǔ)言處理技術(shù)正在經(jīng)歷關(guān)鍵的革命時(shí)刻,這將促進(jìn)新應(yīng)用程序的繁榮(例如,教育機(jī)器人),并為其他領(lǐng)域的發(fā)展帶來(lái)創(chuàng)新(Shoham, Perrault, Brynjolfsson, & Clark,2017)。2020年,Stuart Jonathan Russell在展望未來(lái)5—10年人工智能對(duì)人類社會(huì)的影響時(shí)強(qiáng)調(diào),如果AI智能系統(tǒng)能更精確地理解人類語(yǔ)言,其將在人類日常的學(xué)習(xí)與生活中扮演更重要的角色,并認(rèn)為未來(lái)十年將迎來(lái)語(yǔ)言理解的重大突破(Russell, 2020)。在2020年中國(guó)人工智能學(xué)會(huì)(Chinese Association for Artificial Intelligence,CAAI)的特約專欄中,宗成慶提出,自然語(yǔ)言處理最終要解決的是人類語(yǔ)言的理解問(wèn)題,是可以使智能系統(tǒng)實(shí)現(xiàn)更精準(zhǔn)的性能水平,是可以滿足個(gè)性化用戶需求,甚至讓機(jī)器做到像人一樣理解自然語(yǔ)言的問(wèn)題(宗成慶,2020)。因此,了解自然語(yǔ)言處理技術(shù)的發(fā)展歷程及其賦能教育智能發(fā)展的現(xiàn)狀,探究其對(duì)未來(lái)智能教育發(fā)展的影響,是本研究的重點(diǎn)。
本文以自然語(yǔ)言處理的技術(shù)發(fā)展及其在智能教育領(lǐng)域中的應(yīng)用與實(shí)踐為主題,收集了44位AI科學(xué)家發(fā)表的相關(guān)觀點(diǎn)與研究,旨在探討AI科學(xué)家視角下自然語(yǔ)言處理技術(shù)賦能教育智能發(fā)展的現(xiàn)狀。在收集到的數(shù)據(jù)中,國(guó)外AI科學(xué)家23名,主要來(lái)源于美國(guó)人工智能協(xié)會(huì)(the Association for the Advancement of Artificial Intelligence,AAAI);國(guó)內(nèi)AI科學(xué)家21名,主要來(lái)自中國(guó)人工智能學(xué)會(huì)(Chinese Congress on Artificial Intelligence,CAAI)。
數(shù)據(jù)顯示,本研究所涉及的AI科學(xué)家中,男性36人,占總樣本的82%;女性8人,占總樣本的18%,如圖1 (a)所示。其次,AI科學(xué)家的工作單位所在國(guó)家分布情況如圖1 (b)所示,中國(guó)科學(xué)家最多,占總樣本的48%,美國(guó)科學(xué)家占39%,其余科學(xué)家分布在英國(guó)、愛爾蘭、加拿大、智利、泰國(guó)和巴基斯坦。數(shù)據(jù)結(jié)果從側(cè)面印證,中國(guó)和美國(guó)是目前全球研究自然語(yǔ)言處理及其在教育領(lǐng)域應(yīng)用方面的兩個(gè)主要國(guó)家(戴靜 & 顧小清,2020)。
圖1 AI科學(xué)家分布情況
自然語(yǔ)言處理主要研究人與計(jì)算機(jī)之間用自然語(yǔ)言進(jìn)行有效交流的各種理論和方法。自然語(yǔ)言是指漢語(yǔ)、英語(yǔ)等人們?nèi)粘J褂玫恼Z(yǔ)言,而語(yǔ)言是人類學(xué)習(xí)的重要工具。自然語(yǔ)言處理技術(shù)可以廣泛應(yīng)用于師生教與學(xué)的活動(dòng)過(guò)程中,自然語(yǔ)言處理是教育智能發(fā)展的基礎(chǔ)。由于自然語(yǔ)言處理技術(shù)涉及多種不同的任務(wù),基于AI科學(xué)家的視角,我們可以從四個(gè)層次對(duì)自然語(yǔ)言處理的定義進(jìn)行理解:
一是對(duì)文本進(jìn)行處理,包括對(duì)自然語(yǔ)言進(jìn)行分句、分詞、詞性標(biāo)注(將文章中的每個(gè)詞標(biāo)注為名詞、動(dòng)詞、形容詞等)、命名實(shí)體識(shí)別 (識(shí)別出文本中的時(shí)間、地點(diǎn)、組織等)等。2019年,周明在全球人工智能與機(jī)器人峰會(huì)上提出,自然語(yǔ)言處理就是用計(jì)算機(jī)對(duì)人類語(yǔ)言進(jìn)行處理,包括對(duì)字、詞、句、篇章的輸入、輸出、識(shí)別、分析、理解、生成等,以使得計(jì)算機(jī)具備人類的聽、說(shuō)、讀、寫能力(微軟亞洲研究院, 2019)。
二是對(duì)自然語(yǔ)言的理解。在對(duì)文本進(jìn)行處理的基礎(chǔ)上,自然語(yǔ)言處理技術(shù)會(huì)理解文本包含的意義,比如表達(dá)意圖、情感、情緒等理解過(guò)程。劉群解釋,自然語(yǔ)言處理的研究對(duì)象是人類語(yǔ)言,如詞語(yǔ)、短語(yǔ)、句子、篇章等。通過(guò)對(duì)這些語(yǔ)言單位的分析,計(jì)算機(jī)不但可以理解語(yǔ)言所表達(dá)的字面含義,還可以理解人類語(yǔ)言所表達(dá)的情感以及語(yǔ)言所傳達(dá)的意圖(知乎,2019)。
三是交互,即人類通過(guò)自然語(yǔ)言與計(jì)算機(jī)進(jìn)行交流對(duì)話,例如,人機(jī)問(wèn)答-教育機(jī)器人、瀏覽器搜索、智能電子設(shè)備的信息溝通等。Dan Jurafsky認(rèn)為,自然語(yǔ)言處理是實(shí)現(xiàn)人與計(jì)算機(jī)之間用語(yǔ)言進(jìn)行有效通信的方法,是了解人類心理和態(tài)度的最佳途徑(Dan,2017)。Dragomir Radev認(rèn)為,自然語(yǔ)言處理可應(yīng)用于人機(jī)問(wèn)答、情感分析、機(jī)器翻譯、語(yǔ)義分析、拼寫糾錯(cuò)等教育活動(dòng),但是話語(yǔ)意圖分析、習(xí)慣性表達(dá)、語(yǔ)義相關(guān)等方面的語(yǔ)言理解使得自然語(yǔ)言處理發(fā)展遇到挑戰(zhàn)(Dragomir, 2017)。
四是創(chuàng)新,即計(jì)算機(jī)可以通過(guò)語(yǔ)言理解進(jìn)行智能創(chuàng)作,包括寫作輔助、圖文自動(dòng)生成等。例如,2021年,IIya Sutskever宣布,語(yǔ)言模型將開始了解視覺(jué)世界,通過(guò)自然語(yǔ)言的輸入,系統(tǒng)可以智能生成各種具有創(chuàng)造性的圖像(OpenAI, 2021)。
何曉東認(rèn)為,自然語(yǔ)言處理作為人工智能的核心技術(shù),主要用于連接人類和計(jì)算機(jī)世界的交流(何曉東,2019)。從自然語(yǔ)言處理定義的四個(gè)層次可以看出,基于自然語(yǔ)言處理技術(shù)可以開發(fā)出具有互動(dòng)性、創(chuàng)新性、個(gè)性化的智能工具來(lái)賦能教育的智能發(fā)展。AI科學(xué)家期望隨著自然語(yǔ)言處理技術(shù)的不斷優(yōu)化,相關(guān)智能工具的性能會(huì)被不斷提高,并為未來(lái)的智能教育帶來(lái)更好的體驗(yàn)。
隨著自然語(yǔ)言處理技術(shù)的快速發(fā)展,它在教育領(lǐng)域的應(yīng)用取得了突破性的進(jìn)展,越來(lái)越多的智能工具與系統(tǒng)逐漸被廣泛地應(yīng)用于教學(xué)活動(dòng)中。然而,這些突破性的進(jìn)展離不開一系列關(guān)鍵技術(shù)的涌現(xiàn)。為了更好地理解自然語(yǔ)言處理的一些技術(shù)原理,基于AI科學(xué)家的研究進(jìn)展,本節(jié)對(duì)自然語(yǔ)言處理發(fā)展過(guò)程中涌現(xiàn)的關(guān)鍵技術(shù)進(jìn)行詳細(xì)討論。例如,隨著新詞嵌入方法的出現(xiàn),計(jì)算機(jī)對(duì)自然語(yǔ)言的理解更加精準(zhǔn)與高效,隨著大規(guī)模語(yǔ)料庫(kù)預(yù)訓(xùn)練模型的不斷發(fā)展,多種自然語(yǔ)言處理任務(wù)的性能得到顯著提高。這些自然語(yǔ)言處理關(guān)鍵技術(shù)的進(jìn)步是智能教育不斷發(fā)展的重要基石。
依據(jù)上文的描述,計(jì)算機(jī)在基于自然語(yǔ)言處理學(xué)習(xí)讀懂自然語(yǔ)言的過(guò)程中,最先開始學(xué)習(xí)的是文本中詞匯的理解與表達(dá)。在深度學(xué)習(xí)出現(xiàn)之前,在自然語(yǔ)言處理問(wèn)題的機(jī)器學(xué)習(xí)方法中,我們一般采用一種高維但稀疏的向量來(lái)表達(dá)詞匯,比如 One-hot Encoding。然而這種方式不僅帶來(lái)計(jì)算空間的浪費(fèi),還會(huì)影響系統(tǒng)模型的性能,因?yàn)橄到y(tǒng)不能理解單詞之間的相關(guān)性。其次,早期的基于奇異值分解的LSI/LSA(Latent Semantic Indexing/Latent Semantic Analysis) (Hofmann, 1999)、基于概率分布的LDA(Latent Dirichlet Allocation)(Blei, Ng, & Jordan, 2003)等系統(tǒng)模型在對(duì)單詞的語(yǔ)義理解上取得較大進(jìn)步,但這類模型計(jì)算比較耗時(shí),并需要對(duì)不同語(yǔ)料庫(kù)的主題與數(shù)量進(jìn)行合理的選擇。2003 年Bengio等人提出神經(jīng)語(yǔ)言模型(NNLM),使深度學(xué)習(xí)開始應(yīng)用于自然語(yǔ)言處理(Bengio, Ducharme, Vincent, & Janvin,2003);2013 年,Mikolov 等人構(gòu)建CBOW和Skip-Gram模型,通過(guò)觀察共現(xiàn)詞匯并引入負(fù)采樣等可行性措施,實(shí)現(xiàn)了高密度詞向量的表達(dá)方式(Mikolov, Chen, Corrado, & Dean, 2013)。GloVe(Pennington,Socher, & Manning, 2014)也是生成詞向量的有效方法,它是一種基于詞統(tǒng)計(jì)的模型,可使詞向量擬合預(yù)先基于整個(gè)數(shù)據(jù)集計(jì)算得到的全局統(tǒng)計(jì)信息,從而能高效地學(xué)習(xí)詞的表征。
其次,隨著遷移學(xué)習(xí)技術(shù)的進(jìn)步(莊福振, 羅平, 何清, & 史忠植,2015),AI科學(xué)家嘗試構(gòu)建多語(yǔ)言統(tǒng)一的詞向量 (Multilingual Word Embedding, MWE) 方式(Ruder, Vulic, & S?gaard, 2019),也就是在統(tǒng)一詞向量空間中表示來(lái)自多種語(yǔ)言的詞匯。AI科學(xué)家嘗試采用無(wú)監(jiān)督的MWE方法來(lái)獲得統(tǒng)一的詞嵌入表達(dá),與傳統(tǒng)的監(jiān)督方法相比,這一方法可以利用近似無(wú)限的未標(biāo)注語(yǔ)料庫(kù),從而為低資源語(yǔ)言(應(yīng)用范圍比較小,缺乏標(biāo)注的數(shù)據(jù))開辟了許多新的可能性(Conneau, Lample, Ranzato, Denoyer, & Jégou,2017; Zhang, Liu, Luan, & Sun, 2017)。
隨著計(jì)算機(jī)對(duì)單詞表達(dá)能力的提升,如何提取文本(例如句子、篇章)中的高級(jí)語(yǔ)義信息,是實(shí)現(xiàn)自然語(yǔ)言處理任務(wù)的關(guān)鍵,例如,基于文本信息的情感分析、問(wèn)答系統(tǒng)、機(jī)器翻譯等任務(wù)。隨著文本提取技術(shù)的不斷創(chuàng)新發(fā)展,自然語(yǔ)言處理的任務(wù)性能得到顯著提高。早期的詞袋(Bag of Words)模型忽略了語(yǔ)句中詞語(yǔ)之間的依賴關(guān)系。比如,在詞袋模型中,“我喜歡蘋果,不喜歡鴨梨”和“我喜歡鴨梨,不喜歡蘋果”兩個(gè)句子是相同的表達(dá)。深度學(xué)習(xí)技術(shù)對(duì)語(yǔ)境和序列信息的捕獲能力為語(yǔ)義的理解帶來(lái)了變革。卷積神經(jīng)網(wǎng)絡(luò)(CNN)是早期被采用對(duì)自然語(yǔ)言詞匯序列進(jìn)行特征提取的模型,其擅長(zhǎng)捕獲局部語(yǔ)境信息,然而CNN無(wú)法滿足語(yǔ)言序列長(zhǎng)期記憶性的要求。因而,循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)被廣泛應(yīng)用。RNN的執(zhí)行思路是通過(guò)系統(tǒng)中共享的參數(shù)進(jìn)行序列信息的處理(Cho, et al, 2014)。原始的RNN模型容易出現(xiàn)梯度消失和爆炸的問(wèn)題。因而,經(jīng)過(guò)改良,LSTM和GRU模型(RNN的升級(jí)版)開始被廣泛應(yīng)用于各種自然語(yǔ)言處理任務(wù)中,它們通過(guò)門控制技術(shù)極大地提高了各種任務(wù)的性能。
此外,注意力機(jī)制(Attention)被提出并被應(yīng)用到機(jī)器翻譯的任務(wù)中,不僅改善了翻譯的性能,還增強(qiáng)了模型的可解釋性(Bahdanau, Cho, & Bengio, 2014)。2017年,Ashish Vaswani團(tuán)隊(duì)擴(kuò)展了注意力機(jī)制,首次提出Transformer模型結(jié)構(gòu)(Vaswani, et al, 2017)。Transformer模型完全去除了編碼中的循環(huán)和卷積,僅依賴多頭注意力機(jī)制和位置編碼來(lái)分析語(yǔ)義信息,使翻譯、解析等任務(wù)的訓(xùn)練時(shí)間大幅縮短。同時(shí),注意力機(jī)制的Transformer模型是基于大規(guī)模語(yǔ)料庫(kù)訓(xùn)練的預(yù)訓(xùn)練語(yǔ)言模型的重要基石之一,為自然語(yǔ)言處理技術(shù)的進(jìn)一步發(fā)展帶來(lái)重大突破。
隨著基于大規(guī)模語(yǔ)料庫(kù)的預(yù)訓(xùn)練語(yǔ)言模型的出現(xiàn)與不斷創(chuàng)新,自然語(yǔ)言處理獲得了跨越性發(fā)展,它可以實(shí)現(xiàn)的任務(wù)越來(lái)越多元化,并且任務(wù)性能更加精確與高效。Sebastian Ruder在2021年公開發(fā)表的報(bào)告中,對(duì)2018年到2020年自然語(yǔ)言處理預(yù)訓(xùn)練語(yǔ)言模型的發(fā)展進(jìn)行了總結(jié)(Sebastian, 2021),如圖2所示,預(yù)訓(xùn)練語(yǔ)言模型的發(fā)展越來(lái)越趨于大規(guī)?;?。2018年,Alec Radford團(tuán)隊(duì)發(fā)布了GPT(Generative Pre-training Transformer)語(yǔ)言模型,這是一套人工智能的生成網(wǎng)絡(luò)模型,可以通過(guò)文字、圖片、音樂(lè)、一段程序或者數(shù)據(jù)分析結(jié)果來(lái)智能化生成新的內(nèi)容。2018年,基于Transformer,Jacob Devlin團(tuán)隊(duì)發(fā)布了BERT (Bidirectional Encoder Representations from Transformers)預(yù)訓(xùn)練語(yǔ)言模型(Devlin, Chang,Lee, & Toutanova, 2018)。2019年,OpenAI發(fā)布GPT-2無(wú)監(jiān)督的轉(zhuǎn)化語(yǔ)言模型,它可以基于一個(gè)特定的線索,自動(dòng)編寫出文本內(nèi)容。2020年,Tom Brown團(tuán)隊(duì)提出GPT-3語(yǔ)言模型,可以將學(xué)習(xí)能力轉(zhuǎn)移到同一領(lǐng)域的多個(gè)相關(guān)任務(wù)中,既能做組詞造句,又能做閱讀理解(Brown, et al., 2020)。2021年,William Fedus團(tuán)隊(duì)首次提出一個(gè)1.6萬(wàn)億參數(shù)的自然語(yǔ)言處理模型——稀疏激活專家模型(Switch Transformer)(Fedus, Zoph, & Shazeer, 2021)。Switch Transformer 模型的突破在于,它可以在使用相同計(jì)算資源的情況下使預(yù)訓(xùn)練速度提高7倍以上,同時(shí)保證模型質(zhì)量得到30%的提升。
圖2 自然語(yǔ)言處理近期模型規(guī)模發(fā)展史
由此可知,隨著這些自然語(yǔ)言處理關(guān)鍵技術(shù)的不斷優(yōu)化,自然語(yǔ)言處理任務(wù)逐漸被簡(jiǎn)化,并實(shí)現(xiàn)應(yīng)用的通用化,這對(duì)各領(lǐng)域尤其是智能教育領(lǐng)域的發(fā)展產(chǎn)生了重要的影響。數(shù)據(jù)顯示,隨著BERT以及BERT衍生模型的快速發(fā)展,自然語(yǔ)言處理任務(wù)在閱讀理解、文本分析、語(yǔ)言翻譯、情感分析等應(yīng)用上都迎來(lái)了突破和創(chuàng)新(Matthew, 2020)。這些關(guān)鍵技術(shù)的優(yōu)化發(fā)展對(duì)開發(fā)可以應(yīng)用在教育領(lǐng)域的智能工具至關(guān)重要,因?yàn)橹悄芄ぞ呖梢詫?shí)現(xiàn)教育系統(tǒng)中各環(huán)節(jié)要素的自動(dòng)分析,實(shí)施精準(zhǔn)干預(yù),支持規(guī)?;虒W(xué)與個(gè)性化學(xué)習(xí)等機(jī)制(彭紹東,2021)。因此,自然語(yǔ)言處理技術(shù)的快速發(fā)展會(huì)促進(jìn)教育領(lǐng)域智能工具的開發(fā),而這些智能工具在學(xué)、教、管、評(píng)的教育活動(dòng)中不斷創(chuàng)新優(yōu)化與實(shí)踐的過(guò)程,就是自然語(yǔ)言處理賦能教育智能發(fā)展的過(guò)程。
在過(guò)去近40年,自然語(yǔ)言處理領(lǐng)域逐漸出現(xiàn)10個(gè)研究熱度較高的技術(shù)話題,包括情感分析、機(jī)器翻譯、問(wèn)答、語(yǔ)言模型、神經(jīng)網(wǎng)絡(luò)模型、語(yǔ)義表示、知識(shí)圖譜、詞對(duì)齊、條件隨機(jī)場(chǎng)和詞義消歧(清華大學(xué),2020),如圖3所示。其中,2003 年以后,情感分析的研究熱度迅速增長(zhǎng),其基于自然語(yǔ)言處理的數(shù)據(jù)挖掘技術(shù)被應(yīng)用于提取和分析用戶生成語(yǔ)言中的主觀信息,而機(jī)器翻譯、問(wèn)答系統(tǒng)等技術(shù)研究熱度也一直保持上升態(tài)勢(shì)。何曉東預(yù)測(cè),自然語(yǔ)言處理技術(shù)在未來(lái)可能會(huì)從文本分析、文本創(chuàng)作、情感智能、機(jī)器翻譯、智能對(duì)話(例如語(yǔ)音助手、聊天機(jī)器人)等方向取得重大突破;而這些技術(shù)方向的發(fā)展都與智能教育的未來(lái)發(fā)展密切相關(guān)(何曉東,2019)。具體來(lái)說(shuō),智能教育也是基于多元化的教育數(shù)據(jù)進(jìn)行分析,以了解師生教與學(xué)過(guò)程中的各種需求,然后提供評(píng)估反饋和智能化的解決方案,并應(yīng)用于“教、學(xué)、評(píng)、測(cè)、練”五大環(huán)節(jié)(前瞻產(chǎn)業(yè)研究院,2020)。結(jié)合上文中介紹的自然語(yǔ)言處理關(guān)鍵技術(shù)的原理知識(shí),本節(jié)將基于AI科學(xué)家的研究實(shí)例,深入探討五種在教育領(lǐng)域被廣泛應(yīng)用的自然語(yǔ)言處理技術(shù),以及這些技術(shù)賦能教育智能發(fā)展的實(shí)踐與創(chuàng)新。
圖3 自然語(yǔ)言處理領(lǐng)域技術(shù)研究發(fā)展趨勢(shì)
目前,基于自然語(yǔ)言處理的情感分析技術(shù)逐漸應(yīng)用于教育領(lǐng)域。情感分析(Sentiment Analysis)是指利用自然語(yǔ)言處理的文本挖掘技術(shù),對(duì)帶有情感色彩的文本進(jìn)行抽取、分析和處理,從而發(fā)現(xiàn)潛在的問(wèn)題以用于預(yù)測(cè)或改進(jìn)(Yang, Cunningham, Zhang, Smyth, & Dong, 2021)。鄭耀威在2020年的AAAI會(huì)議上,提出了新的分析方法,使用語(yǔ)法信息增強(qiáng)了語(yǔ)句多方面情感分類的效果(Zheng, Zhang,Mensah, & Mao, 2020)。情感分析在教育領(lǐng)域的應(yīng)用是,通過(guò)對(duì)學(xué)生的課程反饋、教師評(píng)價(jià)、課程論壇評(píng)論等文本信息進(jìn)行分析,智能化預(yù)測(cè)學(xué)生對(duì)學(xué)校教育教學(xué)現(xiàn)狀的態(tài)度,評(píng)估教師授課質(zhì)量,等等。例如,Heather Newman等人使用情感分析工具VADER分析學(xué)校教與學(xué)的評(píng)價(jià)信息,以研究學(xué)習(xí)環(huán)境對(duì)改善學(xué)生學(xué)習(xí)的體驗(yàn),以及對(duì)教師教學(xué)的體驗(yàn)(Newman & Joyner, 2018)。Quratulain Rajput等人基于情感分析指標(biāo),對(duì)某課程結(jié)束后學(xué)生提交的反饋報(bào)告進(jìn)行多種方法的文本分析,使教師教學(xué)評(píng)估更加高效(Rajput, Haider, & Ghani, 2016)。因此,分析學(xué)生對(duì)學(xué)校政策、教學(xué)活動(dòng)等事件的反饋與態(tài)度,可以使教育組織更加了解學(xué)生的需求,不斷提高教學(xué)質(zhì)量,提供更具個(gè)性化的教育環(huán)境。
而情緒分析(Emotioin Analysis)主要是分析用戶的狀態(tài)、情緒等(比如高興、沮喪、失落、抑郁等)(Koelstra, et al., 2011)。情緒分析在教育領(lǐng)域逐漸被應(yīng)用于學(xué)校輿情監(jiān)督、心理觀察等方面。例如,利用自然語(yǔ)言處理系統(tǒng)模型監(jiān)督學(xué)校論壇上的評(píng)論、留言等信息,可以實(shí)時(shí)分析學(xué)生情緒,在觀測(cè)到學(xué)生感到沮喪失落的時(shí)候,學(xué)??梢约皶r(shí)做出安撫和應(yīng)對(duì)措施。Angelina Tzacheva等人基于計(jì)算機(jī)科學(xué)課程學(xué)生反饋的評(píng)估數(shù)據(jù),通過(guò)為每個(gè)文本注釋創(chuàng)建多個(gè)標(biāo)簽,自動(dòng)檢測(cè)學(xué)生反饋中的情緒以了解學(xué)生對(duì)課堂教學(xué)模式的感受,從而幫助教師改善教學(xué)(Tzacheva, Ranganathan, & Jadi, 2019)。
文本分類是自然語(yǔ)言處理在教育領(lǐng)域應(yīng)用的另一個(gè)重要模塊,它旨在通過(guò)分配不同的標(biāo)簽對(duì)文本信息(例如句子、段落)進(jìn)行分類。文本信息可以有不同的來(lái)源,包括電子郵件、論壇留言、社交媒體、教學(xué)評(píng)價(jià)、教學(xué)材料等。自然語(yǔ)言處理的文本分類技術(shù)廣泛應(yīng)用于教育領(lǐng)域的不同任務(wù)中,包括問(wèn)題解答、個(gè)性化學(xué)習(xí)推薦、圖書館內(nèi)容管理、新聞分類、內(nèi)容審核等(Minaee,et al., 2021)。隨著技術(shù)的發(fā)展,文本分類技術(shù)的研究也在不斷進(jìn)步。2020年,阿里云推出的智能文本分類服務(wù),可以按照給定的類目體系對(duì)用戶提供的文本進(jìn)行自動(dòng)分類(阿里云,2020)。邱錫鵬團(tuán)隊(duì)提出的多尺度注意力的文本分類方法使語(yǔ)言的理解結(jié)果更優(yōu)化(Guo, Qiu, Liu, Xue, & Zhang, 2020)。隨著文本分類模型系統(tǒng)性能的提升,相關(guān)的智能工具性能也在不斷優(yōu)化,并被廣泛應(yīng)用于閱讀等級(jí)分類、作文自動(dòng)批改等方面。
閱讀等級(jí)分類是衡量閱讀難度的標(biāo)準(zhǔn)之一,文本可讀性對(duì)于閱讀教學(xué)材料、教材編排等有重要意義。自然語(yǔ)言處理在教育文本閱讀方向的一個(gè)重要應(yīng)用是閱讀分級(jí)。閱讀分級(jí)測(cè)評(píng)體系通過(guò)計(jì)算機(jī)對(duì)大量的文本、書籍進(jìn)行自動(dòng)處理并分析其難度,然后為不同水平的學(xué)習(xí)者提供不同難度的學(xué)習(xí)資料。例如,藍(lán)思(Lexile)閱讀測(cè)評(píng)體系(Ardoin,Williams, Christ, Klubnik, & Wellborn, 2010)基于書籍難度和讀者閱讀能力兩個(gè)指標(biāo)進(jìn)行分級(jí),使學(xué)習(xí)者可以輕松選擇適合自己的書籍。迷霧指數(shù)(The Gunning FOG Index)(Swieczkowski & Ku?acz, 2021)是一種針對(duì)英語(yǔ)文本的可讀性測(cè)試,該模型系統(tǒng)可從詞數(shù)、難度、完整思維的數(shù)量、平均句長(zhǎng)等方面考察一篇文章的閱讀難度,并評(píng)估出適合閱讀此文章的閱讀者的正規(guī)教育年限,比如,當(dāng)讀物的迷霧指數(shù)為12時(shí),閱讀者大概需要相當(dāng)于高中生的閱讀水平。2020年,唐玉玲等人提出結(jié)合語(yǔ)言難度特征的句子可讀性計(jì)算方法,構(gòu)建了規(guī)模更大的漢語(yǔ)句子可讀性語(yǔ)料庫(kù),提高了評(píng)估準(zhǔn)確率,優(yōu)化了漢語(yǔ)材料的可讀性應(yīng)用(Tang & Yu, 2020)。
作文的自動(dòng)批改評(píng)測(cè)是智能化對(duì)英語(yǔ)寫作進(jìn)行評(píng)分、糾錯(cuò)和指導(dǎo)的技術(shù),是自然語(yǔ)言處理與語(yǔ)言教學(xué)結(jié)合的一個(gè)成熟應(yīng)用。E-rater是一款成熟的智能英文寫作評(píng)分軟件,具有識(shí)別英文寫作能力的功能,其評(píng)分水平與人工評(píng)分水平非常接近。校寶在線的1Course是基于人工智能技術(shù)開發(fā)的語(yǔ)言教學(xué)輔助測(cè)評(píng)系統(tǒng),可以對(duì)寫作等語(yǔ)言材料自動(dòng)化批改、評(píng)測(cè),并且給出學(xué)習(xí)總結(jié)與建議。2017年,許悅婷團(tuán)隊(duì)對(duì)E-rater、1Course等智能評(píng)測(cè)系統(tǒng)的性能進(jìn)行對(duì)比時(shí)發(fā)現(xiàn),E-rater性能仍然處于較高水平(Xu et al., 2016)。科大訊飛研發(fā)的RealSkill是針對(duì)雅思托??荚嚨闹悄芘能浖?。測(cè)試數(shù)據(jù)顯示,Real-Skill的評(píng)分與考官評(píng)分一致率達(dá)96.91%,智能批改準(zhǔn)確率達(dá)到92.64%,手寫文字識(shí)別率達(dá)到95%(德勤,2020)。董瑞海團(tuán)隊(duì)提出了一種新型的、基于自然語(yǔ)言處理和深度學(xué)習(xí)技術(shù)的自動(dòng)作文評(píng)分系統(tǒng),并證明該系統(tǒng)在成績(jī)預(yù)測(cè)方面達(dá)到了最先進(jìn)的性能(Wang, Liu, & Dong,2018)??梢姡匀徽Z(yǔ)言處理的文本分類技術(shù)已經(jīng)為師生的教與學(xué)過(guò)程提供了成熟的智能評(píng)價(jià)、測(cè)試、糾正、練習(xí)等應(yīng)用。
隨著智能機(jī)器人逐漸被應(yīng)用于教育領(lǐng)域,問(wèn)答與對(duì)話系統(tǒng)的性能(例如,準(zhǔn)確度、智能化、個(gè)性化)優(yōu)化一直受到AI科學(xué)家的關(guān)注。問(wèn)答系統(tǒng)(Question Answering System,QA System)是用來(lái)回答用戶提出問(wèn)題的系統(tǒng),其設(shè)計(jì)思想是由計(jì)算機(jī)負(fù)責(zé)解析并理解由用戶提出的自然語(yǔ)言(問(wèn)題),并從當(dāng)前收集的所有問(wèn)答集中檢索出最適合的答案返回給用戶。目前,基于自然語(yǔ)言處理的問(wèn)答系統(tǒng)任務(wù)的準(zhǔn)確性已經(jīng)可以超越人類水平的基準(zhǔn)線,并逐漸達(dá)到專家水平。例如,基于斯坦福問(wèn)答數(shù)據(jù)集(Stanford Question Answering Dataset,SQuAD)的文本理解挑戰(zhàn)賽,就是檢驗(yàn)計(jì)算機(jī)閱讀理解水平的權(quán)威測(cè)試。2018年,Pranav Rajpurkar團(tuán)隊(duì)提出SQuAD 2.0,該數(shù)據(jù)集可以測(cè)試模型系統(tǒng)回答閱讀理解類問(wèn)題的準(zhǔn)確度(Rajpurkar,Jia, & Liang, 2018)。基于SQuAD2.0官網(wǎng)數(shù)據(jù),本文整理了從2018年到2021年,問(wèn)答系統(tǒng)模型執(zhí)行能力的變化趨勢(shì)。如圖4所示,隨著模型系統(tǒng)的不斷升級(jí),一些模型系統(tǒng)獲得的精確匹配度(Exact Match,EM)和準(zhǔn)確度(F1)分值不斷提高,逐漸超越人類水平的基準(zhǔn)線(EM 86.831,F(xiàn)1 89.452),并達(dá)到了前所未有的新高度(EM 90.871,F1 93.183)(SQuAD2.0, 2021)。劉知遠(yuǎn)團(tuán)隊(duì)提出,基于Babel-Net(一種多語(yǔ)言的百科全書詞典)為多種語(yǔ)言建立統(tǒng)一的義位知識(shí)庫(kù)(Qi, Chang, Sun, Ouyang, & Liu,2020),可優(yōu)化知識(shí)庫(kù)的構(gòu)建。2021年,嚴(yán)睿團(tuán)隊(duì)提出的檢查模型優(yōu)化了回答閱讀理解問(wèn)題的答案生成響應(yīng)效能(Chen,et al., 2020)。這說(shuō)明自然語(yǔ)言處理任務(wù)在智能化地執(zhí)行閱讀理解和問(wèn)答測(cè)試方面的技術(shù)越來(lái)越成熟,這些技術(shù)衍生的智能工具可以在教育系統(tǒng)中幫助師生提高教與學(xué)的效率。
圖4 基于SQuAD 2.0的測(cè)試結(jié)果
此外,對(duì)話系統(tǒng)屬于多輪次對(duì)話的問(wèn)答系統(tǒng)(例如,聊天機(jī)器人)。不同對(duì)話系統(tǒng)具有不同的復(fù)雜程度,有簡(jiǎn)單的單行響應(yīng)對(duì)話系統(tǒng)(基于人工模板的聊天機(jī)器人),也有復(fù)雜的多輪次對(duì)話系統(tǒng)(數(shù)字語(yǔ)音助手)?,F(xiàn)有的檢索式對(duì)話系統(tǒng)可能會(huì)出現(xiàn)忽略上下文相關(guān)性而只能回答簡(jiǎn)單問(wèn)題的情況,而嚴(yán)睿團(tuán)隊(duì)提出的基于預(yù)訓(xùn)練語(yǔ)言模型的文本-回復(fù)匹配模型,可以顯著改善這個(gè)問(wèn)題(Xu et al., 2020)。車萬(wàn)翔團(tuán)隊(duì)開發(fā)的目標(biāo)管理模型使開放式對(duì)話能夠獲得更連貫且更有趣的多輪對(duì)話(Xu, Wang, Niu, Wu, &Che, 2020)。在個(gè)性化對(duì)話系統(tǒng)的創(chuàng)新中,張亦馳提出的一種基于多動(dòng)作數(shù)據(jù)增強(qiáng)的學(xué)習(xí)框架,可以有效學(xué)習(xí)到多樣化的對(duì)話策略(Zhang, Ou, & Yu, 2020)。黃民烈團(tuán)隊(duì)提出的個(gè)性化對(duì)話生成模型,可以在對(duì)話生成的時(shí)候控制回復(fù)中所展現(xiàn)的個(gè)性化屬性(Zheng, Zhang, Huang, & Mao, 2020)。而隨著自然語(yǔ)言處理中對(duì)話系統(tǒng)的不斷創(chuàng)新與發(fā)展,AI科學(xué)家開始將智能對(duì)話系統(tǒng)實(shí)現(xiàn)在教育機(jī)器人領(lǐng)域。例如,麻省理工學(xué)院媒體實(shí)驗(yàn)室(MIT Media Lab)的Cynthia Breazeal團(tuán)隊(duì)設(shè)計(jì)的“社交機(jī)器人”,是可以與人合作的社交、情感智能機(jī)器,能滿足從孩子到老年人各年齡段新技能的學(xué)習(xí)和情感需求(Cynthia,2019)。余勝泉團(tuán)隊(duì)開發(fā)的一個(gè)新穎實(shí)用的對(duì)話系統(tǒng),專門幫助教師和家長(zhǎng)為學(xué)生解決德育方面的困擾,可以精確理解用戶的問(wèn)題并實(shí)時(shí)推薦適合的解決方案(Peng, et al., 2019)。2021年,陳鵬鶴團(tuán)隊(duì)設(shè)計(jì)并創(chuàng)建了一個(gè)名為PBAdvisor的智能助手,它可以幫助沒(méi)有心理學(xué)專業(yè)知識(shí)的老師和家長(zhǎng)輕松地就學(xué)生的問(wèn)題行為找到合適的解釋方案,并解釋問(wèn)題行為形成的原因(Chen, Lu, Liu, & Xu, 2021)。同年,盧宇團(tuán)隊(duì)開發(fā)了新型智能輔導(dǎo)系統(tǒng) RadarMath,以支持智能化的、個(gè)性化的數(shù)學(xué)學(xué)習(xí)教育。該智能輔導(dǎo)系統(tǒng)可以為學(xué)習(xí)者提供自動(dòng)評(píng)分、個(gè)性化學(xué)習(xí)指導(dǎo)等服務(wù)(Lu, Pian, Chen, Meng, & Cao, 2021)。這些智能對(duì)話系統(tǒng)可以在不同的教學(xué)環(huán)境中提供人性化的交互方式和個(gè)性化的智能輔導(dǎo)與教學(xué),可見,基于自然語(yǔ)言處理技術(shù)的教育機(jī)器人展示了其在未來(lái)智能教育發(fā)展中巨大的應(yīng)用前景。
機(jī)器翻譯是另一個(gè)廣泛應(yīng)用于教育領(lǐng)域的自然語(yǔ)言處理技術(shù)。機(jī)器翻譯(Machine Translation,MT)是利用計(jì)算機(jī)將一種自然語(yǔ)言(源語(yǔ)言)轉(zhuǎn)變成另一種自然語(yǔ)言(目標(biāo)語(yǔ)言)的自動(dòng)翻譯(Russell &Norvig, 2002)。隨著技術(shù)的不斷發(fā)展,神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯(Neural Machine Translation, NMT)于2013年被提出(Kalchbrenner & Blunsom, 2013)并迅速發(fā)展,它在文本翻譯、對(duì)話系統(tǒng)和文字概括方面的性能不斷得到優(yōu)化和提升。在機(jī)器翻譯任務(wù)中,雙語(yǔ)互譯質(zhì)量評(píng)估輔助工具(bilingual evaluation understudy,BLEU)是非常重要的指標(biāo)。2002年,Kishore Papineni首次提出BLEU指標(biāo),其設(shè)計(jì)思想是機(jī)器翻譯結(jié)果越接近專業(yè)人工翻譯的結(jié)果,模型系統(tǒng)的效果就越佳(Papineni, Roukos, Ward, & Zhu, 2002)。依據(jù)2018年斯坦福發(fā)布的人工智能年報(bào),如圖5所示,在2008年到2018年期間,模型系統(tǒng)在將新聞從英語(yǔ)翻譯成德語(yǔ)的BLEU分?jǐn)?shù)是2008年的3.5倍,而從德語(yǔ)翻譯成英語(yǔ)的BLEU分?jǐn)?shù)是2008年的2.5倍(Shoham, et al., 2018),這表明了機(jī)器翻譯性能在過(guò)去十年的快速發(fā)展。
圖5 新聞稿翻譯——WMT競(jìng)賽
在2020年的AAAI會(huì)議上,馮洋團(tuán)隊(duì)提出了增強(qiáng)機(jī)器翻譯的評(píng)估方法,對(duì)生成的譯文從流利度和忠實(shí)度兩個(gè)方面進(jìn)行評(píng)估,以鼓勵(lì)模型生成與譯文有關(guān)聯(lián)的單詞(Shao, Zhang, Feng, Meng, & Zhou,2020)。除此之外,劉知遠(yuǎn)團(tuán)隊(duì)提出一種多通道反向詞典模型,此模型在中英兩種語(yǔ)言的數(shù)據(jù)集上都實(shí)現(xiàn)了當(dāng)前最佳的性能,并首次實(shí)現(xiàn)了中文、英文跨語(yǔ)言反向查詞的功能(Zheng, et al., 2020)。劉宇宸團(tuán)隊(duì)則提出一種基于交互式學(xué)習(xí)的方法,該方法能夠在一個(gè)模型中實(shí)現(xiàn)同步語(yǔ)音識(shí)別和語(yǔ)音翻譯任務(wù),并且效果顯著(Liu, et al., 2020)。隨著這些機(jī)器翻譯模型系統(tǒng)的不斷進(jìn)步與創(chuàng)新,它們對(duì)智能教育的發(fā)展產(chǎn)生了新的影響,例如,翻譯狗、谷歌翻譯等工具被廣泛應(yīng)用于學(xué)生的英文寫作與語(yǔ)言學(xué)習(xí)中(Bin Dahmash, 2020; Tsai, 2020)。Marco Cancino表示,當(dāng)教師能夠意識(shí)到在線翻譯的局限性,并在學(xué)生使用它們時(shí)提供足夠的指導(dǎo),那么智能在線翻譯工具可以成為有效的教學(xué)工具(Cancino & Panes, 2021)。不僅如此,研究表明,使用谷歌翻譯進(jìn)行寫作的實(shí)驗(yàn)組其寫作質(zhì)量更高,例如,句法復(fù)雜性和準(zhǔn)確性得分更高(Cancino & Panes, 2021)。Angkana Patanasorn的研究也發(fā)現(xiàn),谷歌翻譯對(duì)高水平學(xué)術(shù)論文摘要翻譯的可理解性和可用性均處于中上等水平(Tongpoon-Patanasorn & Griffith, 2020)。
通過(guò)以上分析可以發(fā)現(xiàn),應(yīng)用于教育領(lǐng)域的自然語(yǔ)言處理技術(shù)仍在快速發(fā)展,并不斷賦能智能教育的發(fā)展與創(chuàng)新。隨著智能工具的普及與成熟,越來(lái)越多的學(xué)生開始自主選擇適合自己的智能學(xué)習(xí)工具,以滿足個(gè)性化的學(xué)習(xí)需求。學(xué)校教師也開始在教學(xué)中應(yīng)用智能批改、智能搜索、虛擬現(xiàn)實(shí)、智能學(xué)情分析等智能技術(shù)輔助備課、教學(xué)以及對(duì)學(xué)生的評(píng)估與管理,以增強(qiáng)課堂的趣味性、有效性和個(gè)性化。然而,自然語(yǔ)言處理技術(shù)賦能未來(lái)智能教育發(fā)展的過(guò)程中,機(jī)遇與挑戰(zhàn)是共存的。
基于上文的討論,自然語(yǔ)言處理儼然已經(jīng)成為智能教育未來(lái)發(fā)展過(guò)程中最重要的人工智能技術(shù)。同時(shí),自然語(yǔ)言處理正在結(jié)合其他人工智能技術(shù),給智能教育的未來(lái)發(fā)展帶來(lái)新的機(jī)遇,同時(shí)也給傳統(tǒng)的教育方法帶來(lái)了新的挑戰(zhàn)。
走向多模態(tài)智能化教學(xué) 自然語(yǔ)言處理技術(shù)正在與其他人工智能技術(shù)相結(jié)合來(lái)一起推動(dòng)未來(lái)智能課堂的建設(shè),實(shí)現(xiàn)實(shí)體互動(dòng)課堂、VR/AR課堂、全息課堂等(清華大學(xué),2020)。未來(lái)的課堂教學(xué)將在傳統(tǒng)課堂的基礎(chǔ)上,利用視頻系統(tǒng)、語(yǔ)音系統(tǒng)、智能終端等多模態(tài)智能技術(shù)更高效地進(jìn)行智能互動(dòng)。其次,由智能技術(shù)支撐的課堂將以學(xué)生為中心進(jìn)行互動(dòng)教學(xué),這能更好地激發(fā)學(xué)生興趣、提升教學(xué)質(zhì)量,以適應(yīng)新時(shí)代的教育目標(biāo)。未來(lái)的智能化教學(xué),將基于人臉識(shí)別、語(yǔ)音識(shí)別、動(dòng)作識(shí)別、情緒識(shí)別、眼球識(shí)別等多模態(tài)技術(shù)構(gòu)建智能課堂輔助系統(tǒng),并做到課程全覆蓋,既能對(duì)學(xué)生的考勤、課堂表現(xiàn)及專注度進(jìn)行監(jiān)測(cè)分析,也能對(duì)教師的教學(xué)質(zhì)量進(jìn)行智能評(píng)估,即時(shí)生成課堂評(píng)估報(bào)告并快速反饋,教師可及時(shí)調(diào)整授課內(nèi)容和方式,以保證高質(zhì)量的課堂體驗(yàn),從而形成課上有行為、行為有識(shí)別、識(shí)別有分析的完整監(jiān)課閉環(huán)(清華大學(xué),2020)?;谌斯ぶ悄芗夹g(shù),尤其是自然語(yǔ)言處理技術(shù),未來(lái)的學(xué)習(xí)材料將更多元化,文本、語(yǔ)音、圖像、視頻識(shí)別等多模態(tài)學(xué)習(xí)材料將替代單一的文字類產(chǎn)品。教師教學(xué)的輔助產(chǎn)品將不僅僅局限于文字類題庫(kù),不同媒介(例如音、視、VR、AI、AR等)的產(chǎn)品都可以輔助教學(xué),使智能測(cè)評(píng)提供不同題型,使教學(xué)風(fēng)格更多樣化,從而激發(fā)學(xué)生的學(xué)習(xí)興趣(德勤,2020)。
邁向大規(guī)模個(gè)性化教育 個(gè)性化教育是智能教育時(shí)代變革的必然趨勢(shì)。《教育信息化十年發(fā)展規(guī)劃(2011—2020年)》指出要為每一名學(xué)習(xí)者提供個(gè)性化學(xué)習(xí)的信息化環(huán)境和服務(wù)。通過(guò)本文的討論可以發(fā)現(xiàn),基于自然語(yǔ)言處理技術(shù)的智能工具可以為師生的教與學(xué)提供智能化、個(gè)性化的解決方案。未來(lái)的個(gè)性化教育,將主要建立在師生充分交互的大數(shù)據(jù)獲取基礎(chǔ)上。通過(guò)對(duì)這些教育數(shù)據(jù)的統(tǒng)計(jì)分析,可實(shí)現(xiàn)學(xué)生個(gè)性化評(píng)估反饋、以學(xué)定教、自動(dòng)化輔導(dǎo)與答疑,并智能化推薦適合學(xué)生的學(xué)習(xí)內(nèi)容,以提升學(xué)習(xí)效率與質(zhì)量,從而實(shí)現(xiàn)大規(guī)模因材施教。其次,基于自然語(yǔ)言處理技術(shù)的智能推薦系統(tǒng)將更精確地對(duì)師生的教與學(xué)活動(dòng)進(jìn)行賦能,將標(biāo)準(zhǔn)化、專業(yè)化的傳統(tǒng)教育逐漸轉(zhuǎn)型為個(gè)性化、多樣化的智能化教育。
教育智能化的戰(zhàn)略布局 2020年以來(lái),疫情的蔓延加速了線上線下融合教學(xué)模式的普及:以學(xué)生為中心,通過(guò)智能技術(shù)連接線上和線下、虛擬和現(xiàn)實(shí)的學(xué)習(xí)場(chǎng)景,形成智能化教育場(chǎng)景生態(tài),為實(shí)現(xiàn)個(gè)性化教學(xué)新樣態(tài)提供了基礎(chǔ)。在智能時(shí)代,教育組織、技術(shù)型企業(yè)機(jī)構(gòu)以及社會(huì)相關(guān)部門應(yīng)該密切溝通,相互合作,在分析人工智能最新技術(shù)范式和理念的基礎(chǔ)上,明確教育智能化的發(fā)展方向,系統(tǒng)審視其應(yīng)用場(chǎng)景,助力我國(guó)教育智能化建設(shè)?;趪?guó)家對(duì)智能時(shí)代教育發(fā)展的政策支持,結(jié)合我國(guó)國(guó)情,跨領(lǐng)域的合作應(yīng)該從實(shí)踐層面分析人工智能與教育系統(tǒng)各要素融合的路徑,闡釋智能教育理念下未來(lái)教育的體制機(jī)制、服務(wù)模式和治理體系,并形成有中國(guó)特色的人工智能教育發(fā)展戰(zhàn)略布局。
完善智能教育理論體系 與傳統(tǒng)教育不同,智能教育時(shí)代的教學(xué)方法、評(píng)價(jià)模式等都需要進(jìn)行改進(jìn),以建設(shè)與智能時(shí)代相適應(yīng)的教育觀念與理論。伍紅林曾表示,在智能技術(shù)支持下,教育學(xué)的學(xué)科形態(tài)和使命都將發(fā)生轉(zhuǎn)變,例如,一些新的跨學(xué)科分支將產(chǎn)生,并有可能成為研究主流(伍紅林,2020)。人工智能的快速發(fā)展正在逐步推動(dòng)教育學(xué)基本理論研究的新變化,而教育存在形態(tài)的變化可能引起教育學(xué)原有研究領(lǐng)域和理論內(nèi)涵的轉(zhuǎn)換與更新,這將迫使教育學(xué)主動(dòng)對(duì)其他學(xué)科進(jìn)行吸收與轉(zhuǎn)化。因此,隨著人工智能技術(shù)的快速發(fā)展,我們應(yīng)該對(duì)傳統(tǒng)教育學(xué)理論進(jìn)行完善,抓緊建構(gòu)適應(yīng)人工智能時(shí)代的教育學(xué)理論體系。
加強(qiáng)教育數(shù)據(jù)治理 隨著智能教育系統(tǒng)中自然語(yǔ)言處理技術(shù)的不斷應(yīng)用,教育數(shù)據(jù)的積累已經(jīng)在一定程度上實(shí)現(xiàn)了教與學(xué)的自動(dòng)化和智能化,然而,這其中也潛藏著風(fēng)險(xiǎn)。近年來(lái),智能技術(shù)倫理、教育數(shù)據(jù)安全方面的一些問(wèn)題受到很多關(guān)注,比如,個(gè)人數(shù)字信息的過(guò)分暴露可能會(huì)對(duì)教師與學(xué)生的隱私、安全等造成嚴(yán)重的負(fù)面影響(清華大學(xué),2020)。因此,加強(qiáng)智能教育時(shí)代的數(shù)據(jù)治理研究已經(jīng)刻不容緩。數(shù)據(jù)治理的能力決定著未來(lái)教育發(fā)展的水平和布局,所以教育組織應(yīng)該:(1)搭建智能化數(shù)據(jù)資產(chǎn)平臺(tái),建立數(shù)據(jù)收集、整合、治理、存儲(chǔ)的常態(tài)化監(jiān)控體系;(2)建立有效的數(shù)據(jù)共享、管理與保障體系,通過(guò)對(duì)師生行為數(shù)據(jù)進(jìn)行梳理,建立全局?jǐn)?shù)據(jù)字典,完成數(shù)據(jù)的標(biāo)準(zhǔn)化和治理化;(3)建設(shè)跨校區(qū)統(tǒng)一支撐平臺(tái),加強(qiáng)統(tǒng)一身份認(rèn)證、課程認(rèn)證、學(xué)分認(rèn)證、教師角色定位等問(wèn)題的治理,保障數(shù)據(jù)的隱私性。因此,搭建智能教育數(shù)據(jù)資源及管理平臺(tái),構(gòu)建智能教育大數(shù)據(jù)的治理體系,是人工智能時(shí)代未來(lái)智能教育建設(shè)的關(guān)鍵路徑。
進(jìn)一步優(yōu)化教育智能技術(shù) 沈向洋曾表示:“人工智能要真正達(dá)到人類思維水平,特別是在認(rèn)知方面,還有很長(zhǎng)的路要走?!保ㄉ蛳蜓?,2018)盡管人工智能依靠深度學(xué)習(xí)取得了快速的發(fā)展,卻仍需要依賴大規(guī)模標(biāo)注的數(shù)據(jù)進(jìn)行監(jiān)督訓(xùn)練,因此,要實(shí)現(xiàn)真正的人類智能,計(jì)算機(jī)還需要掌握大量的常識(shí)性知識(shí),以人的思維模式和知識(shí)結(jié)構(gòu)來(lái)進(jìn)行語(yǔ)言理解、視覺(jué)場(chǎng)景解析和決策分析。劉群曾指出,關(guān)于自然語(yǔ)言處理模型系統(tǒng)的學(xué)習(xí)問(wèn)題,盡管很多知識(shí)點(diǎn)的邏輯推理對(duì)人類來(lái)說(shuō)不是問(wèn)題,但是計(jì)算機(jī)理解起來(lái)卻有困難;同時(shí),自然語(yǔ)言處理還面臨著標(biāo)注數(shù)據(jù)資源貧乏的問(wèn)題,例如,小語(yǔ)種的機(jī)器翻譯、特定領(lǐng)域?qū)υ捪到y(tǒng)、多輪問(wèn)答系統(tǒng)等,都將使自然語(yǔ)言處理在教育領(lǐng)域的應(yīng)用面臨挑戰(zhàn)(知乎,2019)。在2021年麻省理工學(xué)院的人工智能會(huì)議上,Lex Fridman提出希望自然語(yǔ)言處理在未來(lái)智能教育的發(fā)展過(guò)程中可以使常識(shí)推理與語(yǔ)言模型相結(jié)合,通過(guò)上下文信息實(shí)現(xiàn)從有限的句子智能寫作到包含數(shù)千個(gè)詞語(yǔ)的段落篇章寫作(Lex, 2021)。關(guān)于其他新興智能技術(shù),例如,智能教學(xué)機(jī)器人、腦機(jī)接口改善學(xué)習(xí)能力等,則還需要進(jìn)一步成熟與優(yōu)化,并加快應(yīng)用于教育的智能發(fā)展。
華東師范大學(xué)學(xué)報(bào)(教育科學(xué)版)2022年9期