国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

智慧教育研究現(xiàn)狀與發(fā)展趨勢

2019-02-20 03:38:08鄭慶華錢步月魏筆凡張未展
計算機研究與發(fā)展 2019年1期
關鍵詞:圖譜個性化學習者

鄭慶華 董 博 錢步月 田 鋒 魏筆凡 張未展 劉 均

1(西安交通大學電子與信息工程學院 西安 710049)2(西安交通大學繼續(xù)教育學院 西安 710049)3(大數(shù)據(jù)算法與分析技術國家工程實驗室(西安交通大學) 西安 710049)

教育信息化是信息化時代構建學習型社會和終身學習體系的基本技術途徑,是《國家中長期科學和技術發(fā)展規(guī)劃綱要(2006—2020)》和《國家中長期教育改革和發(fā)展規(guī)劃綱要(2010—2020)》的戰(zhàn)略任務之一.回顧國內(nèi)外教育信息化的發(fā)展歷程,主要經(jīng)歷了數(shù)字化、網(wǎng)絡化、智能化3個階段的演進.

在20世紀70,80年代,隨著信息技術,特別是個人電腦(PC)的出現(xiàn),國內(nèi)外首先出現(xiàn)了以計算機教育為著眼點的教育信息化熱潮.鄧小平同志在1984年的講話“計算機的普及要從娃娃抓起”深入人心.隨著信息技術發(fā)展與PC的進一步普及,教育信息化進入了教育資源數(shù)字化、教育管理信息化的時代,各種電化教育手段與電化教育館、廣播電視大學的出現(xiàn),正式標志著教育信息化進入了數(shù)字化時代.

20世紀90年代到本世紀初,隨著互聯(lián)網(wǎng)的高速發(fā)展,教育信息化逐步進入了網(wǎng)絡化時代.遠程教育、在線教育等網(wǎng)絡化教育手段成為了緩解教育數(shù)字鴻溝和教育公平問題的重要途徑.1993年我國建成了中國教育與科研計算機網(wǎng)(Cernet);在國際上,Internet也在同一階段迅速成長壯大,為開展網(wǎng)絡化教育提供了重要的支撐平臺.進而,隨著智能終端與移動互聯(lián)網(wǎng)的迅猛發(fā)展,具有4A特性(Anywhere,Anytime,Anyone,Anydevice)的移動學習,成為了網(wǎng)絡化時代教育信息化的主要特征之一.

2010年以后,隨著移動互聯(lián)網(wǎng)、人工智能、云計算、大數(shù)據(jù)等技術的發(fā)展,教育信息化進入了一個全新的階段,呈現(xiàn)出智能化、泛在化、個性化、開放化、協(xié)同化的趨勢.2011年大規(guī)模開放在線課程(massive open online course, MOOC)在全球范圍內(nèi)推廣,隨之而來的是對教育信息化的智能需求與日俱增.人工智能與教育的深度融合已成為提升教育信息化發(fā)展水平和質(zhì)量的重要手段.2017年國務院印發(fā)的《新一代人工智能發(fā)展規(guī)劃》中,明確指出“利用智能技術加快推動人才培養(yǎng)模式、教學方法改革,構建包含智能學習、交互式學習的新型教育體系.開展智能校園建設,推動人工智能在教學、管理、資源建設等全流程應用”,這標志著教育信息化的智慧教育時代正式拉開序幕.

智慧教育是指融合現(xiàn)代教育理論與大數(shù)據(jù)分析、人工智能等信息技術的新的教育信息化范式.當前,國內(nèi)外對智慧教育尚未形成共識,但是從不同角度指出了智慧教育應具有的特點.例如國內(nèi)學者祝智庭等人分析了“智慧”的內(nèi)涵,指出智慧教育中的學習時空環(huán)境應具有感知、推理、輔助決策等智慧特性[1].楊現(xiàn)民則認為智慧教育是依托新一代信息技術的物聯(lián)化、智能化、感知化、泛在化的教育信息生態(tài)系統(tǒng)[2].新加坡在iN2015計劃中明確了智慧教育的3個特點,即泛在學習、交互式數(shù)字學習資源、適應不同學習風格的智能學習體驗[3].

本文中,我們將智慧教育定義為基于新一代信息技術的教育信息化新范式,旨在通過教學、管理、評估、決策等教育全過程涉及的資源、行為、情境、管理等教育大數(shù)據(jù)進行挖掘、分析、融合,建立具有智能導學、精準推薦、精細評價等特點的學習生態(tài)系統(tǒng).

本文的貢獻主要有2個方面:

1) 在對國內(nèi)外智慧教育研究與應用調(diào)研分析的基礎上,從3個層次建立了智慧教育的研究框架.最底層是教育大數(shù)據(jù)分析與挖掘,包括以教學行為等結(jié)構化數(shù)據(jù)為對象的教育大數(shù)據(jù)分析,以及以非結(jié)構化海量知識資源為對象的教育知識圖譜構建,這是構建智慧教育平臺的基礎.中間層是針對教學中導學、推薦、答疑、評價等環(huán)節(jié)的4項關鍵技術,包括學習路徑生成與導航、學習者畫像與個性化推薦、智能在線答疑以及精細化評測.最上層則是主流的國內(nèi)外智慧教育平臺.圍繞上述框架,對國內(nèi)外相關研究進行對比分析,總結(jié)了其特點與存在的問題.

2) 總結(jié)出當前智慧教育研究4個方面的局限性.①如何應對大規(guī)模學習者的在線輔導;②如何對學習者、教師、環(huán)境等要素進行精細化、全過程的評測;③如何應對有限認知帶寬問題導致的個體學習局限性;④如何通過分析教育大數(shù)據(jù)發(fā)現(xiàn)影響教學的潛在致因與規(guī)律.針對上述局限性,指出了智慧教育后續(xù)研究的4個方向,即在線智能學習助手技術、學習者智能評估指標與方法、網(wǎng)絡化群體認知模型以及教育大數(shù)據(jù)的因果關系發(fā)現(xiàn)方法.

1 教育大數(shù)據(jù)分析挖掘

1.1 結(jié)構化教育數(shù)據(jù)分析

結(jié)構化的教育數(shù)據(jù)主要包括學習行為(如鼠標點擊次數(shù)等)、學習效果(是否獲得證書等)以及學習者基本屬性(如年齡、性別等).近年來,國內(nèi)外學者對大規(guī)模在線學習平臺(如Coursera,edX,Udacity等)的海量結(jié)構化教育數(shù)據(jù)已開展了分析研究工作.這些研究有助于揭示人類更深層次的認知機理,挖掘有價值的學習規(guī)律與模式.當前對教育數(shù)據(jù)的分析主要是相關性分析.相關性用于衡量變量間具有線性關系的程度,主要包括假設檢驗、回歸分析等分析手段.

在假設檢驗方面,典型研究工作如:Kizilcec等人[4]采用Fisher精確檢驗對MOOC學習軌跡數(shù)據(jù)進行了分析,并采用非監(jiān)督學習方法將學習模式分為Completing,Auditing,Disengaging,Sampling Learner四種類型,為理解在線學習者的學習持續(xù)性提供了依據(jù).Coetzee等人[5]也采用Fisher精確檢驗分析了edX平臺上中“軟件工程”課程的行為數(shù)據(jù),發(fā)現(xiàn)學習者在論壇上的訪問次數(shù)與學習成績之間存在正相關性.Wilkowski等人[6]采用T檢驗分析了Google MOOC平臺上的行為數(shù)據(jù),發(fā)現(xiàn)了不同學習目標下學習行為與課程完成率之間的相關性.

在回歸分析方面,典型研究工作如:Firmin等人[7]對3門MOOC課程進行了邏輯回歸分析,發(fā)現(xiàn)學習者及格與否與個人努力程度相關.Coffrin等人[8]根據(jù)學習者的交互數(shù)據(jù),運用生存回歸方法對社交行為的中心度和課程學習的參與度進行了分析,揭示了能夠預測MOOC學習流失率的顯著性指標.Ramesh等人[9]基于隨機邏輯回歸分析出學習持續(xù)性相關的行為特征,用以預測MOOC學習的完成率.He等人[10]采用邏輯回歸方法預測學生是否能完成課程學習,并對邊界學生提供干預.國內(nèi)蔣卓軒等人[11]結(jié)合邏輯回歸方法與相關圖方法分析Coursera上6門課程的學習行為數(shù)據(jù),挖掘出學習行為與學習間的相關性.

上述研究得到的相關性大都是類似“學習效果好壞與個人努力程度相關”的結(jié)論,對構建當前急需的智能化導學、推薦、評價等機制,還缺乏可操作性.而支撐這類機制的核心是在教育數(shù)據(jù)中蘊含的因果關系.因果關系是指變量間的作用關系,一個變量的變化是由另一個變量觸發(fā).盡管相關性分析在因果關系挖掘中具有重要作用,但是相關性既非因果關系的必要條件,也非充分條件[12].與因果關系相比,相關性還很難作為決策的依據(jù).

1.2 教育知識圖譜構建

隨著Linking Open Data等項目的全面展開,語義Web數(shù)據(jù)源的數(shù)量激增,大量RDF數(shù)據(jù)被發(fā)布.互聯(lián)網(wǎng)正從僅包含網(wǎng)頁和網(wǎng)頁之間超鏈接的文檔萬維網(wǎng)(document Web)轉(zhuǎn)變成包含大量描述各種實體和實體之間豐富關系的數(shù)據(jù)萬維網(wǎng)(data Web).知識圖譜(knowledge graph)旨在描述真實世界中存在的各種實體或概念以及它們之間的關聯(lián)關系.和傳統(tǒng)的Web頁面網(wǎng)絡相比,知識圖譜中的節(jié)點從網(wǎng)頁變成了各種類型的實體,而圖中的邊也由連接網(wǎng)頁的超鏈接(hyperlink)變成豐富的各種語義關系.研究機構及商業(yè)公司以知識圖譜為基礎開展大規(guī)模知識庫構建,目前Google、百度和搜狗等公司均構建了自己的知識圖譜,分別為Google Knowledge Graph、知心和知立方.知識圖譜不僅可以改進搜索質(zhì)量,同時也可以直接回答問題.

知識圖譜在檢索領域獲得廣泛應用之后,逐步擴展到教育、醫(yī)療等其他領域.教育知識圖譜可將分散、無序、海量的教育信息聚合成結(jié)構化、優(yōu)質(zhì)的知識,并智能地推薦給用戶,使用戶從海量信息的人工篩選中解脫出來,快速進行認知升級.如百度研制的百度教育知識圖譜主要用于K12教育市場,將題目與知識點進行對應,聚合相關知識點的多態(tài)優(yōu)質(zhì)資源,能夠支持并完成高效的人機交互.

知識圖譜的構建過程是從原始數(shù)據(jù)出發(fā),采用一系列自動或半自動的數(shù)據(jù)挖掘技術,從原始數(shù)據(jù)中提取出知識主題等節(jié)點及節(jié)點間語義或認知關系.這是一個迭代更新的過程,每輪迭代包含2個基本階段:信息抽取和知識融合.教育知識圖譜的構建也遵循這2個階段,差別主要是節(jié)點及節(jié)點間關系類型不同.

信息抽取從各種類型的數(shù)據(jù)源抽取構建知識圖譜所需的各種候選實體(概念、知識主題)及節(jié)點間的關聯(lián)關系(包括語義關系、認知關系等),形成一個個孤立的抽取圖譜(extracted graphs).知識圖譜主要來源于百科類網(wǎng)站和各種垂直站點的結(jié)構化數(shù)據(jù),這類數(shù)據(jù)特點是質(zhì)量較高、更新較慢.比如Google的知識圖譜很大一部分來源于Freebase,Wikipedia和IMDB等網(wǎng)站.而另一方面,知識圖譜通過從各種半結(jié)構化數(shù)據(jù)(如HTML表格)抽取相關實體的“屬性-值”對來豐富實體的描述.通過信息抽取得到的知識數(shù)據(jù)更大,并能及時發(fā)現(xiàn)最新的實體或事實,但其質(zhì)量相對較差,存在一定的錯誤.Cafarella等人[13-14]開發(fā)了WebTables系統(tǒng),該系統(tǒng)使用分類技術從海量HTML頁面的150億表格中抽取了1.5億條的高質(zhì)量關系數(shù)據(jù).該系統(tǒng)后來被Google收購用于構建Google的知識圖譜.Venetis等人[15]開發(fā)了一個用于HTML中海量表格的語義標注系統(tǒng).該系統(tǒng)首先從Web上抽取得到含有噪音的類標簽及它們之間的關系形成一個數(shù)據(jù)庫,基于該數(shù)據(jù)庫及Web上觀察到的實例標注表格的每個列,從而獲得表格的語義.Mintz等人[16]提出一種Distant Supervision的方法從Web抽取各種關系,該方法假定,如果已知2個實體存在特定的語義關系,那么包含實體對的句子在某種程度上就存在表征二者語義關系的作用.這種方法充分利用了現(xiàn)有的知識庫,如Wikipedia、本體或者人工標注的小規(guī)模實體對,將這些高質(zhì)量關系實體對作為種子,從Web中挖掘包含已知實體對的大規(guī)模文本,作為自動標注的語料庫,然后使用監(jiān)督學習解決關系抽取問題.

為了形成一個完整的知識圖譜,還需要通過實體對齊(消歧)、模式層構建、可信性驗證等技術將這些信息孤島集成在一起.Bordes等人[17]基于深度學習技術將不同的符號框架嵌入(embed)到一個連續(xù)的向量空間中,從而可以方便地計算實體間語義相似度,進而完成預測及檢索任務.Google創(chuàng)建了名為 Knowledge Vault的知識圖譜[18],迄今已經(jīng)收集了16億件事實,其中,2.71億件是“可信的事實”.微軟創(chuàng)建的Probase[19],從多達16億網(wǎng)頁數(shù)據(jù)中抽取出270萬條核心概念、2000多萬條概念間關系,是目前概念空間最大的知識庫.

目前還沒有成熟的教育知識圖譜產(chǎn)品,研究機構及商業(yè)公司側(cè)重于擴展現(xiàn)有知識圖譜技術,并研究基于知識圖譜的個性化資源推薦、導航學習、知識發(fā)現(xiàn)等技術.

2 教學環(huán)節(jié)的智慧教育技術

在線學習中主要包括導學、推薦、答疑、評價等教學環(huán)節(jié),以下對各個環(huán)節(jié)中的學習路徑生成與導航、學習者畫像與個性化推薦、智能答疑、精細化評估等關鍵技術進行綜述.

2.1 學習路徑生成與導航

學習路徑推薦是根據(jù)學習者的先驗知識與學習目標,規(guī)劃一條由認知關系組成的路徑,其核心問題是如何自動生成高效的學習路徑.目前,針對學習路徑推薦的研究仍然處于探索階段,針對不同的需求和應用背景尚沒有公認的權威經(jīng)典方法解決這一問題.已有的代表性研究工作可以分為基于學習者特征、基于語義關系、基于認知關系的3類學習路徑生成方法.

基于學習者特征的學習路徑生成方法是通過分析學習者在學習過程中表現(xiàn)出來的學習行為特點來完成學習路徑推薦.典型的研究有:Salehi與 Kamalabadi[20]提出了一種基于序列模式挖掘和多維屬性的協(xié)同過濾的新型推薦系統(tǒng)框架;Lin等人[21]開發(fā)了基于決策樹的個性化創(chuàng)新學習系統(tǒng),為學習者提供個性化的學習路徑;Dwivedi等人[22]通過可變長度遺傳算法,綜合考慮學習者的學習風格和知識水平,為學習者提供有效的學習路徑;Basu等人[23]提出了一種基于用戶模型的系統(tǒng),該系統(tǒng)考慮了學習者的偏好、先前的表現(xiàn)、學分要求以及推薦學習路徑的時間等參數(shù).Bendahmane等人[24]提出了一種基于學習數(shù)據(jù)、學習者特征、期望和能力的方法CBA,通過對學習者進行聚類和跟蹤,最后給出合適的學習路徑.Salehi等人[25]引入了學習者偏好樹,將學習者所接觸材料的多維屬性、學習者評分、有序模式和順序模式組合到模型中.該模型使用混合、加權和級聯(lián)混合方法形成最終推薦的學習路徑.

以上6種方法都是從學習者的角度解決學習路徑推薦問題,大多采用集體智慧或表現(xiàn)優(yōu)秀學習者的學習行為特征來提高生成的學習路徑的精確度和有效性.但是,這種思路需要花費大量時間構造優(yōu)秀學習者的先驗知識庫,而且可能會面臨優(yōu)秀學習者的日志缺失問題;同時由于并未考慮學習者當前的先驗知識到學習目標的必要性,以及不同學習者在學習過程中所表現(xiàn)的不同學習行為特征,因此,所推薦的學習路徑會或多或少地偏離學習者的原本需求,無法為學習者提供有針對性的指導.

基于語義關系的學習路徑生成方法是利用知識元本身的語義信息指導學習路徑的推薦.典型的研究有:Chu等人[26]提出一種基于本體的學習路徑生成方法,該方法首先根據(jù)知識元之間的關系建立知識元本體庫,進而根據(jù)本體之間的關系指導學習路徑的推薦;Colace等人[27]提出了一種基于貝葉斯網(wǎng)絡生成學習路徑的方法,利用領域本體中的概念關系,將學習路徑推薦問題視為一種排序約束滿足問題;Tam等人[28]提出了明確的語義分析,然后通過概念聚類增強本體分析,并應用優(yōu)化器來尋找所涉及的概念或模塊的最佳學習路徑.Tseng等人[29]構建了自適應學習的概念圖,并為個體學生提供了知識點推薦.以上方法大多缺失目標知識元學習的必要條件,忽視了知識間認知序關系對認知的影響;此外,本體之間的聯(lián)系是多種多樣的,這種聯(lián)系不一定是認知角度的學習先后順序,用這些各種各樣的聯(lián)系去建立學習路徑并不太合適.

基于認知關系的學習路徑生成方法主要是通過知識圖譜解決大量的異質(zhì)學習資源導致學習者的知識迷失和認知負載問題.朱艷茹等人[30]在學生能力的引導下,構建了一個能夠自動診斷用戶學習能力的用戶模型,并為不同特征的學習者提供“最佳契合”的個性化學習路徑.趙琴等人[31]提出一種基于改進蟻群優(yōu)化算法的微學習路徑推薦方法,該方法主要用于檢測學習者的知識水平、知識領域和學習目標的學習遷移;Durand等人[32]提出一種基于圖論的學習路徑推薦系統(tǒng),用貪心算法求最短路徑的局部最優(yōu)解.這些學習路徑推薦方法不足之處在于:不能根據(jù)學習者的學習過程和學習能力提供多樣化的學習.

2.2 學習者畫像與個性化推薦

精準學習者畫像是現(xiàn)階段個性化教學的核心內(nèi)容,即如何有效地利用學習者的靜態(tài)和動態(tài)信息來建立學習者畫像,為個性化教學提供基礎.陳海建等人[33]結(jié)合學習者的基本信息、在線學習行為、課堂表現(xiàn)以及腦認知實驗,利用標簽化的形式進行個性歸納和畫像,從而有效地服務于個性化教學.何娟[34]利用用戶借用的圖書詞頻分析結(jié)合用戶靜態(tài)特征屬性,分別進行單個、群組的用戶畫像的構建,實現(xiàn)圖書的個性化推薦.黃文彬等人[35]采用頻繁模式挖掘、構建概率矩陣、計算熵等方法,從用戶日志中所包含的地理位置信息中構建移動用戶行為畫像,分析移動用戶群體行為及用戶間交互行為.楊捷[36]提出一種結(jié)合主題模型和用戶屬性的用戶畫像建模方法,并與因子分解機模型相結(jié)合,有效地解決了數(shù)據(jù)稀疏問題.費鵬[37]提出基于多粒度神經(jīng)網(wǎng)絡結(jié)合多種機器學習模型對文本特征進行特征萃取的多視角融合框架來構建用戶畫像.

在資源推薦方面,典型的推薦策略包括:基于內(nèi)容的推薦、協(xié)同過濾推薦、基于社交網(wǎng)絡的推薦、基于關聯(lián)規(guī)則的推薦、混合推薦等.

基于內(nèi)容的推薦方法是應用于資源推薦領域最主要的推薦策略,最早應用于信息獲取領域[38],主要思想是根據(jù)用戶的交互項目,選擇與用戶交互項目相似的項目作為推薦結(jié)果.梁婷婷等人[39]提出基于內(nèi)容過濾PageRank語義相似替換的Top-k學習資源推薦方法.該方法首先基于內(nèi)容的向量空間濾波建立學習資源過濾推薦模型,然后通過計算資源間匹配方式以取代語義相似性,從而避免多義詞或同義詞的漏檢問題.

協(xié)同過濾推薦技術在個性化推薦領域是最成功的策略,適用于存在大量用戶行為數(shù)據(jù)或者具有大量資源信息時的學習資源推薦.駱金維等人[40]結(jié)合課程教學資源數(shù)據(jù)間的相關性及學習者行為數(shù)據(jù)給學習者進行教學資源推薦,提高課程教學資源共享效應.

隨著在線教育的發(fā)展,基于社交網(wǎng)絡的推薦快速發(fā)展,Wan等人[41]在充分挖掘?qū)W習社群成員之間社會關系的基礎上,開發(fā)了QSIA(questions sharing and interactive assignments)系統(tǒng)用于提升推薦效果和協(xié)作水平.賀超波等人[42]設計了一種基于興趣社區(qū)的學習資源推薦模式,首先通過構建基于社交網(wǎng)絡的在線學習服務為學習用戶提供交流協(xié)作以及學習資源評價環(huán)境,然后利用興趣社區(qū)挖掘技術發(fā)現(xiàn)興趣高度相似的用戶群體,最后基于相似用戶群體對目標用戶進行學習資源推薦.

為實現(xiàn)精準的學習資源推薦,需要整體考慮數(shù)據(jù)之間的關聯(lián)關系,對學習者、資源等進行多維關聯(lián)分析,由此產(chǎn)生基于關聯(lián)規(guī)則的推薦.丁繼紅等人[43]引入張量理論構建“學習者-資源”融合張量,利用高階奇異值分解算法挖掘?qū)W習者和資源的關聯(lián)關系,實現(xiàn)學習者和資源之間的精準匹配.多維關聯(lián)分析方法有利于大數(shù)據(jù)環(huán)境中對個性化學習資源的推薦,提高在線教育和個性化學習的質(zhì)量.

以上推薦策略都有各自的優(yōu)缺點,而在實際應用中可以針對具體問題采用推薦策略的組合進行推薦.通過組合不同的推薦策略,主要的混合方式可以分成2種:1)對推薦結(jié)果進行組合[44];2)對推薦算法進行組合[45-46].混合推薦模型是對多維度特征推薦的一種有效方法,依賴于大數(shù)據(jù)的支持[47].

2.3 智能答疑

智能答疑系統(tǒng)是將機器視為一個認知主體的人機交互系統(tǒng),是人工智能領域的一個重要分支.隨著計算機硬件技術和移動互聯(lián)網(wǎng)的迅猛發(fā)展,能夠有效處理非精確信息交互的、符合人類自然交互習慣的認知型智能答疑系統(tǒng)受到了越來越多的關注,并在網(wǎng)絡自動答疑、在線學習平臺、智能教師(intelligent tutor)、個性化學習助手等方面得到了廣泛應用.目前,國內(nèi)外智能問答系統(tǒng)的研究主要涉及問題理解、對話管理、對話生成和對話評測4部分.

1) 問題理解.目前自然語言處理領域主流的對話理解研究多是對問句進行關鍵詞提取和擴充、語法分析、句法分析等,一般包括問題分類(如what,when,who,where,why,how)[48-50]、關鍵詞提取和關鍵詞擴展.通過確定問題的類型,制定關鍵詞和答案抽取的規(guī)則,提取出關鍵詞后,依據(jù)問題類型等因素對關鍵詞進行適當?shù)臄U展,然后將關鍵詞提交到信息檢索模塊來查找相關文檔[51].基于語法、句法分析的問題理解的方法也是一種重要的問題理解方式,這類方法主要是以語義角色標注為代表的基于語義表示模型的分析方法[52-53].國內(nèi)研究人員根據(jù)中文語言的獨有特點也提出了很多中文語義表示模型[54],例如漢語問句語義組塊[55]、融合事件信息的復雜問句分析方法[56]、基于句法分析樹的查詢語義圖語義理解方法[57]以及基于主題和焦點的問句分析方法[58-60].此外,隨著深度學習的發(fā)展,基于詞向量的語義理解也逐漸得到關注[61-63].

2) 對話管理.對話管理通常包括問答知識庫構建、對話策略管理、搜索引擎3個核心功能.建立問答知識庫并從中構建高質(zhì)量的問答模型是對話管理的核心問題,同時還是人機對話順利進行的必要保證.對知識庫進行建模就是利用已有的大量問題答案對、自由文本等語料構建問題答案之間的匹配模型.目前解決問答匹配的方式主要是問題建模、對答知識建模和答案建模,另一種技術路線則采用了Encoder-Decoder框架,通過構建端到端(end-to-end)的深度學習模型[64-65],從海量對話數(shù)據(jù)中自動學習提問和回答之間的語義關聯(lián),達到對于任何用戶提問都能夠自動生成回復的目的.在對話管理策略功能方面,目前應用的模型主要包括有限狀態(tài)機、填槽法、Markov決策過程(Markov decision process, MDP)、部分可觀察Markov決策過程(partially observable Markov decision processes,POMDP)、基于實例的、基于規(guī)劃的、貝葉斯網(wǎng)絡等近10種方法.而搜索引擎技術是問答系統(tǒng)的重要支撐之一,智能答疑系統(tǒng)中的搜索引擎就是根據(jù)從用戶已輸入的自然語言中提取有用信息,使用不同的搜索技術,在已有的數(shù)據(jù)庫、文本庫、模型庫或是網(wǎng)絡中搜索與用戶問題最為相關的信息,并交給對話生成模塊以構成對用戶問題的回答.

3) 對話生成.在使用智能答疑系統(tǒng)進行人機交互時,生成語句通順流暢的類人(human-like)對話是交互能不斷進行的前提.自然語言生成是根據(jù)對話管理部分產(chǎn)生的非語言信息,自動生成面向用戶的自然語言反饋[66].近年來,在智能答疑系統(tǒng)上的對話生成主要涉及檢索式和生成式[67-69]2類技術.檢索式對話生成代表技術是在已有的對話語料庫中通過排序?qū)W習技術和深度匹配技術找到適合當前輸入的最佳回復.這種方法的局限是僅能以固定的語言模式進行回復,無法實現(xiàn)詞語的多樣性組合.生成式對話生成代表技術則是從已有的對話中學習語言的組合模式,通過類似機器翻譯中常用的“編碼-解碼”過程去逐字逐詞地生成一個回復,這種回復有可能是從未在語料庫中出現(xiàn)的、自主“創(chuàng)造”的句子.

4) 對話評測.評測一個任務驅(qū)動的多輪對話系統(tǒng),主要涉及評測自然語言理解、對話狀態(tài)跟蹤[70-71]和對話策略[72-75]3個部分.自然語言理解是一個典型的分類問題,可以通過準確率、召回率和F-score等指標進行評測.對話狀態(tài)跟蹤,作為輔助對話策略的一個中間環(huán)節(jié),業(yè)界已總結(jié)出一系列的評測標準,詳情請參考歷屆DSTC[76]公開評測.而對話策略的質(zhì)量通常需要通過對話系統(tǒng)的整體效果來體現(xiàn),其主要評測指標是任務完成率和平均對話輪數(shù).

隨著計算機科學、自然語言處理以及人工智能技術的進步,智能答疑系統(tǒng)也取得了巨大的發(fā)展和突破.但是,就目前智能答疑系統(tǒng)的應用和發(fā)展來看,當前的智能問答系統(tǒng)仍存在諸多問題,并且大都以“一問一答”的單輪簡單對話形式呈現(xiàn),多采用基于規(guī)則的和數(shù)據(jù)的信息檢索方式實現(xiàn),都比較短視,并沒有考慮前后多輪對話之間的連貫性,缺乏有效的知識支撐,在專業(yè)領域自然語言理解也存在諸多困難,而交互式多輪對話管理機制缺乏多學科融合和新技術的推動.對此,可以從智能答疑問題的基本定義出發(fā),深入探索所研究問題的背后機理,據(jù)此建立其數(shù)據(jù)與基本算法支撐,聚焦到解決問題的核心算法與數(shù)學理論,構建出以知識推理為支撐、深度學習語義驅(qū)動的多輪對話系統(tǒng),以此解決目前智能答疑系統(tǒng)所面臨的挑戰(zhàn)和問題.

2.4 精細化評估

精細化評估指以學習者、教師、教學環(huán)境等要素為對象對教學過程進行精準、細粒度、全過程的評估,主要包括過程性評估和終結(jié)性評估2方面.以對學習者的評估為例,過程性評估關注學生學習過程中的學習方式,通過對學習方式持續(xù)的過程性評估,將學習方式由表層式或成就式引導到深層式的方向上來,從而形成“深層式學習方式—高層次學習結(jié)果—深層式學習方式”的良性互動[77].終結(jié)性評估關注學生學習的結(jié)果,對其最終學習效果作出結(jié)論和判斷.

精細化評估一直是教育領域的研究熱點,其應用場景既包括在線教育又包括近年來興起的MOOC.例如國際計算機學會(ACM)規(guī)?;瘜W習會議(Learning at Scale, 簡稱L@S)每年都設立專門的分組(Session)研討評估技術的進展.

在在線教育場景方面,典型研究工作如:Admiraal等人[78]提出了一種基于語義Web技術的在線教育評估框架,基于學習者動態(tài)的學習過程評估學習者的知識水平.劉力紅等人[79]提出一種基于矩陣的二級模糊綜合評估模型,量化評估學習者的學習狀況.Ozkan等人[80]提出一種面向在線教育的六角形評估模型,從內(nèi)容質(zhì)量、學習者觀點等六個維度對在線學習環(huán)境進行多元回歸分析.

在MOOC場景方面,典型研究工作如:Huisman等人[81]利用分層線性回歸的思想把學習者的終結(jié)性評估分為自我評估和同伴評估,并探討了學習者成績與其同伴自身能力水平的關聯(lián)性.Gamage等人[82]提出一種IPR(identified peer review)評價框架,通過設置激勵條件和隨機條件,識別出關聯(lián)性高的學習者進行同伴評估,對比盲目同伴評審有更好的反饋結(jié)果.Alcarria等人[83]設計了一種強化的同伴評分算法,通過檢測并剔除異常反饋來糾正同伴評價偏差,以此提高同伴評估的效果.

上述研究從學習者、教師、教學環(huán)境等不同角度進行評估,特別是在MOOC場景下關注同伴評估.但現(xiàn)有研究成果對構建智慧教育的精細化評估還缺乏可操作性.首先,教師與學習者在空間上是分離的,他們之間缺少情感交流和反饋,不利于為學生找到適合自己的教學方式[84],盡管目前個性化推薦系統(tǒng)豐富多樣,但并未以精細化評估學習者的興趣為基礎.其次,在線上授課系統(tǒng)中,學習者的積極性無法保證,具體體現(xiàn)在學習過程中學習者之間難以形成學習共同體,學習動力不足[85].對此,綜合考慮學習者、教師、教學環(huán)境3方面的因素,在考慮學習者隱私的情況下捕獲并分析其學習環(huán)境[86-88],建立學習者與教師間的反饋機制與情感溝通,進而實現(xiàn)精細化評估,是評估技術的一個重要發(fā)展方向.

2.5 小 結(jié)

對在線學習中的導學、推薦、答疑、評價4個教學環(huán)節(jié)涉及的關鍵技術進行總結(jié),如表1所示:

Table 1 Representative Methods and Their Characteristics in the Four Processes of Teaching表1 教學4個環(huán)節(jié)的代表性方法與特征

Continued (Table 1)

3 主流的智慧教育平臺及應用

近年來,隨著移動互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、大數(shù)據(jù)、云計算等技術的發(fā)展,更得益于人工智能的浪潮,新興的教育平臺不斷地朝著更加智慧的方向發(fā)展.智慧教育平臺相對于傳統(tǒng)的教育平臺,實現(xiàn)了人工智能技術與教育核心業(yè)務的深度融合,體現(xiàn)出智能化個性化學習服務、教育資源智能化組織管理、人機協(xié)同智能交互、教學過程與效果智能評測、智能化沉浸式學習環(huán)境等諸多鮮明特征.

基于學習者行為的智能分析,提供個性化的學習服務,是智慧教育平臺的基本特征,可顯著提升平臺用戶的學習效率.國際上三大MOOC平臺Coursera[89],edX[90]和Udacity[91],及國內(nèi)的主流MOOC平臺,如MOOC中國[92]、學堂在線[93]等,都已經(jīng)具備不同方式的個性化學習功能,包括通過收集數(shù)據(jù)分析學生的學習進度和理解情況,提供與個人學習水平相當?shù)淖鳂I(yè)、測試及分組任務.此外,主流的學習管理系統(tǒng)(LMS)、課程管理系統(tǒng)(CMS)等,也均提供個性化的學習管理服務.例如,世界上最知名的開源學習管理系統(tǒng)Moodle平臺[94]已支持個性化的學習環(huán)境.而著名的商用系統(tǒng)Blackboard[95]也能夠提供個性化、基于能力的掌握式學習(mastery study).此外,在混合式教學領域,Edgenuity[96],Fuel Education[97]等均為面向K12混合學習的個性化智慧教育平臺,使學生個性化地合理安排學習時間與內(nèi)容,顯著提升混合式學習的教學效果.

在教育資源的智能化組織管理領域,為了實現(xiàn)教育資源的有效組織,為個性化導航式學習及智能人機交互提供技術支持,知識圖譜技術已逐步地被采用.Yotta系統(tǒng)[98]側(cè)重于實現(xiàn)海量教育資源的有效組織與管理,基于碎片化資源聚合的“知識森林”,為學習者提供方便的學習導航服務.網(wǎng)易云課堂[99]在其最新版本中,實現(xiàn)了基于“學習圖譜”關聯(lián)碎片化知識的功能.好未來K12智慧教育產(chǎn)品[100]構建了跨年級的知識網(wǎng)絡,用于個性化學習推薦以及評測.乂學教育的松鼠AI智適應學習系統(tǒng)[101]同樣構建了以細粒度知識點為單位的知識圖譜,以助力自適應學習.在國外,MIT公開課[102]、Khan Academy[103]均構建了相應的知識圖譜.其中,MIT公開課進一步將面向本科教育的課程圖譜可視化.

在人機協(xié)同的智能交互領域,隨著自然語言處理等相關技術的發(fā)展,AI虛擬教學助手逐步得到應用,為學習者提供互動的教學輔助手段,以提高課程的關注度與完成率.2016年美國佐治亞理工學院Ashok Goel教授使用的智能虛擬助教Jill Waston,實現(xiàn)97%的回答準確率,該虛擬助教基于IBM Watson Assistant[104]平臺技術實現(xiàn),大幅度減輕教師教學壓力,同時幫助學習者進行在線智能答疑,提高學習效率.在國內(nèi),學堂在線也發(fā)布了個性化的學習伴侶“小木”,在減輕教師教學負擔的同時,幫助學習者提高學習的積極性.

在教學過程與效果的智能評測領域,一方面,眾多智慧教育平臺及應用具備了面向教學過程的自動化評測,包括智能題庫、閱卷、作業(yè)批改等,以減輕教師的教學壓力,并及時反饋評測學生的學習狀態(tài).例如,科大訊飛的智慧教育系列產(chǎn)品[105]實現(xiàn)了面向英語教學的智能評分,能夠完成智能化的英文寫作批改與英語口語評測.Khan Academy開發(fā)的練習記錄系統(tǒng),對學生的學習狀況進行評估測試,與同階段學生比較后進行教學班級的重編.另一方面,基于教育大數(shù)據(jù)的深度分析,眾多智慧教育平臺及應用同時也為教育管理者提供教學效果的精準分析.例如,Blackboard提供抄襲檢測、電子檔案袋、自動評分和重新分級、交互式評價和風險跟蹤等功能.好未來的智慧教育產(chǎn)品面向教育管理者,可預測學生的學習意愿,為培訓機構的管理運行提供參考.

在智能化沉浸式學習環(huán)境的構建領域,Agilix平臺[106]在混合與虛擬現(xiàn)實的沉浸式學習環(huán)境中,提供個性化服務.Web Courseworks[107]通過AR,VR等技術,基于3D視頻實現(xiàn)人機協(xié)同的智能交互.SkyClass[108]在提供基于Web的實時多媒體交互課堂的基礎上,引入了人臉檢測與增強現(xiàn)實的功能,既可以用于確認學生身份,也可以通過AR提升學習者的興趣與沉浸感.在國外,谷歌的VR,AR教育產(chǎn)品Google Expeditions[109]允許教師引導學生瀏覽360度場景和3D對象,并智能顯示學生的興趣點.

Table 2 Comparative Analysis of Mainstream Intelligence Education Platforms and Applications表2 主流智慧教育平臺及應用對比分析

人工智能與互聯(lián)網(wǎng)教育的結(jié)合使得智慧教育平臺高速發(fā)展,主流智慧教育平臺及應用對比分析如表2所示.然而,現(xiàn)有的智慧教育平臺依然存在諸多不足之處,如老師與學生、學生與學生之間的時空隔離,在線智能學習助手與虛擬導師還無法通過圖靈測試,網(wǎng)絡化群體學習環(huán)境下的協(xié)同認知機理有待挖掘與利用等.

4 智慧教育的研究展望

4.1 研究方向1:在線智能學習助手

近年來,在線智能學習已經(jīng)從計算機輔助教學、智能教學系統(tǒng)、智能教室逐漸演化為以學習者為中心,強調(diào)普適化、個性化的學習技術.隨著人工智能技術的發(fā)展,如何在學習過程中通過學生與在線學習系統(tǒng)的交互,實現(xiàn)個性化的教學和輔導受到研究者們越來越多的關注.

在利用智能學習助手進行學習的過程中,個體具有能力、背景、學習方式、學習目標等各種差異性,即使是個體本身,在學習過程中,知識狀態(tài)也在不斷的變化,所以針對每個個體實現(xiàn)個性化的自適應在線智能學習系統(tǒng)是必然發(fā)展趨勢.未來的教育必須是個性化的,學生必將從與在線智能學習的交互中受益,但是在線智能學習中的人機交互(human-computer interaction, HCI)不僅僅是簡單的界面交互,而是在學習的過程中學生與機器之間知識的連續(xù)傳授與更新[110].目前最新的認知計算技術(cognitive computing, CC)在在線智能學習領域的應用方面具有良好的前景,借助于其教育數(shù)據(jù)挖掘(educational data mining, EDM)、學習分析(learning analysis, LA)等相關的技術,可以通過分析學習者的學習活動中產(chǎn)生的數(shù)據(jù),為學生、教師和管理者提供實現(xiàn)其各自目標的參考,并動態(tài)追蹤學習者的學習活動,提供個性化的學習體驗,此類技術有望實現(xiàn)傳統(tǒng)以內(nèi)容為主的在線學習到以人為主的個性化學習的轉(zhuǎn)變.此外,在在線智能學習的過程中,如何評估學生的接受程度、學習狀態(tài)的變化以及如何更新知識,是個性化自適應在線智能學習實現(xiàn)智能化需要解決的重要問題.隨著深度學習和大規(guī)模人工神經(jīng)網(wǎng)絡的蓬勃發(fā)展,人工智能時代的到來使教育具有可追蹤性和可預見性,通過進行學生知識建模,如貝葉斯網(wǎng)絡的學生知識點追蹤模型(Bayesian knowledge tracing, BKT)[111]、基于神經(jīng)網(wǎng)絡的學生知識點追蹤模型(deep knowledge tracing, DKT)[112]、效果因素分析模型(performance factors analysis model, PFA)[113]等.通過相關的模型分析,可以對學生知識點的變化進行追蹤,實時了解學生知識點的掌握情況,并根據(jù)學生的實踐和知識生成相關的問題來評估每個學生的熟練程度,依照每個學生的知識結(jié)構、智力與熟練程度來設計個性化的教程.

目前,研究者們在已有研究中對在線智能學習系統(tǒng)的知識建模方法、認知計算技術和生物傳感技術的應用方面已經(jīng)做了較為深入的探討,但是以人機互適應學習、自主探索學習等核心技術為基礎,以人類智能與機器智能協(xié)同互適應學習為目標,個性化、高效的新型在線智能學習系統(tǒng)的構建方式仍需繼續(xù)探索.

4.2 研究方向2:學習者智能評估

當前,對于學習者的智能評估,傳統(tǒng)且普遍的方法是通過間接測量比如試卷檢測、問卷調(diào)查等來判定學習者的能力、智力發(fā)展水平[114-115],但這種方式模糊且不精確.利用無線傳感、人機交互、虛擬現(xiàn)實等技術,可實現(xiàn)實時監(jiān)測學習者學習狀態(tài),全方位多維度采集學習者第一、二課堂及生活數(shù)據(jù),以機器學習算法為支撐進行全面且高效的學習者能力評估.然而其中還面臨一系列的挑戰(zhàn):1)數(shù)據(jù)的來源廣、維度高、規(guī)模大[116],使得評估指標難提?。患夹g發(fā)展的不成熟使得數(shù)據(jù)采集存儲存在隱私泄露隱患[117].2)思維與能力具有復雜映射關系,且其各自本身具有不同層次,設計有效的測試方案是一大難題,同時,結(jié)果的評價存在不可證實性.

圍繞上述難題,需要開展的研究工作包括:1)采用數(shù)據(jù)降維去噪、多模態(tài)融合解決數(shù)據(jù)的規(guī)模大、維度高等問題,同時采用互聯(lián)網(wǎng)+云計算、訪問控制等方式進行隱私保護;2)針對不同背景的學習者,采用定量和定性結(jié)合、個體與整體結(jié)合的方式進行測試,從能力與思維的不同側(cè)面全面綜合進行評價方案的設計.

4.3 研究方向3:網(wǎng)絡化群體認知模型

人類個體存在有限認知帶寬問題,表現(xiàn)為獲取、處理、理解信息的能力受生理特點限制,例如:大腦同時處理最多4個概念,理解文本的速度低于60 bps,短期記憶(short-term memory, STM)僅能存儲7±2個信息塊.

網(wǎng)絡化群體智能(networked collective intelli-gence, NCI)是指網(wǎng)絡環(huán)境下個體通過以競爭和合作等協(xié)同方式在完成特定任務過程中涌現(xiàn)出來的超越個體的智能.利用NCI能夠?qū)崿F(xiàn)網(wǎng)絡化群體認知,是突破個體認知局限的重要途徑.其難點在于:如何對NCI進行建模與評測、如何發(fā)現(xiàn)影響NCI的關鍵因素.

需要開展的研究工作包括4個方面:1)面向群體認知的NCI協(xié)同學習模型(synergetics model);2)群體認知行為對NCI的影響機理與關鍵因素;3)網(wǎng)絡化群體智能的涌現(xiàn)特性分析;4)基于NCI的知識聚合機理.

4.4 研究方向4:教育大數(shù)據(jù)的因果關系發(fā)現(xiàn)

當前對于教育大數(shù)據(jù)的分析,主要側(cè)重于相關性分析,對于因果關系分析的研究還非常薄弱,而后者是構建智能化的導學、推薦、評價機制的重要依據(jù).然而,教育大數(shù)據(jù)的因果關系還面臨一系列技術難題:

1) 教育大數(shù)據(jù)包含了學習者、內(nèi)容、效果、行為等多個維度的變量.挖掘高維變量間的因果關系通常存在較高的復雜度.例如因果圖構建的復雜度與變量個數(shù)呈指數(shù)函數(shù)關系[118].

2) 從高維的教育數(shù)據(jù)中識別出混淆因子(con-founder variables)和偏倚(selection bias)等隱變量也是一個難題.隱變量是指未能觀察或無法度量的變量[119],通常是事件的隱性致因,對于簡化因果關系、提升其可解釋性具有重要作用.

圍繞上述難題,需要開展的研究工作主要包括2個方面:1)針對教育數(shù)據(jù)的海量、高維和稀疏等特性,研究高效的因果圖生成方法,解決圖學習與方向?qū)W習中時空開銷大的問題;2)研究教育數(shù)據(jù)的隱變量識別問題,并基于認知科學分析因變量的可解釋性.

5 結(jié) 論

當前,教育信息化經(jīng)歷了以解決教育資源及場景時空受限問題的計算機輔助教學、網(wǎng)絡教育、MOOC等階段,逐步過渡到大數(shù)據(jù)、人工智能驅(qū)動的智慧教育階段.由于具有智能導學、精準推薦、定制輔導、精細評價等特點,智慧教育成為國際上教育信息化發(fā)展的趨勢,也成為一個熱點研究方向.本文在對國內(nèi)外智慧教育研究與應用調(diào)研分析的基礎上,從教育大數(shù)據(jù)分析挖掘、主要教學環(huán)節(jié)的關鍵技術以及國內(nèi)外智慧教育平臺3個層次對國內(nèi)外相關研究進行對比分析,總結(jié)了其特點與存在的問題.本文進一步分析了當前智慧教育研究的局限性,總結(jié)了在線智能學習助手、學習者智能評估、網(wǎng)絡化群體認知以及教育大數(shù)據(jù)的因果關系發(fā)現(xiàn)4項研究問題,指出了智慧教育未來的研究趨勢.

猜你喜歡
圖譜個性化學習者
繪一張成長圖譜
你是哪種類型的學習者
學生天地(2020年15期)2020-08-25 09:22:02
堅持個性化的寫作
文苑(2020年4期)2020-05-30 12:35:12
十二星座是什么類型的學習者
新聞的個性化寫作
新聞傳播(2018年12期)2018-09-19 06:27:10
補腎強身片UPLC指紋圖譜
中成藥(2017年3期)2017-05-17 06:09:01
漢語學習自主學習者特征初探
上汽大通:C2B個性化定制未來
主動對接你思維的知識圖譜
滿足群眾的個性化需求
夏邑县| 徐水县| 麻城市| 广东省| 岳西县| 普安县| 余姚市| 白朗县| 嘉鱼县| 荔波县| 淮南市| 花垣县| 白沙| 乐平市| 定陶县| 清新县| 新郑市| 邵阳县| 安化县| 深圳市| 缙云县| 五常市| 鄂托克前旗| 上栗县| 凤城市| 凤山市| 石棉县| 沛县| 温州市| 贵州省| 卢湾区| 曲靖市| 阜康市| 集安市| 临清市| 牡丹江市| 云龙县| 张家口市| 正镶白旗| 汾西县| 金平|