王琛琛 張 睿 吳天剛
(同濟(jì)大學(xué)物理科學(xué)與工程學(xué)院,上海 200092)
隨著科技的發(fā)展和時(shí)代的進(jìn)步,技術(shù)變革對(duì)人們的生產(chǎn)和生活方式都帶來(lái)了極大的改變,新興技術(shù)與教育的深度整合推動(dòng)著教育信息化的進(jìn)程不斷向前,越來(lái)越成為當(dāng)前的研究熱點(diǎn)。課堂作為教師開(kāi)展教育活動(dòng)的主要場(chǎng)所,課堂互動(dòng)情況極大地影響著課程的教學(xué)質(zhì)量,在整個(gè)課堂教學(xué)過(guò)程中起著舉足輕重的作用。傳統(tǒng)課堂互動(dòng)存在著多方面的局限,師生互動(dòng)主要形式為師生問(wèn)答式,形式單一,學(xué)生參與度低,學(xué)生答題之后不能將答題情況實(shí)時(shí)的反饋給教師,不利于教師及時(shí)的調(diào)整教學(xué)進(jìn)度以及教學(xué)內(nèi)容[1];在學(xué)生人數(shù)不是很多時(shí)師生互動(dòng)的效果較好,隨著人數(shù)的增多,師生互動(dòng)的比率會(huì)急劇下降,教師無(wú)法了解到每一個(gè)學(xué)生的具體情況,從而使得教學(xué)效果大打折扣。
人工智能技術(shù)的發(fā)展為學(xué)習(xí)過(guò)程個(gè)性化起到了推動(dòng)作用,在智慧校園中,師生交互,生生交互過(guò)程形成了海量的學(xué)習(xí)數(shù)據(jù),如何有效地挖掘和使用教學(xué)數(shù)據(jù),是智慧教學(xué)成功與否的關(guān)鍵。課堂應(yīng)答系統(tǒng)可以在教學(xué)過(guò)程中對(duì)于學(xué)生的階段性學(xué)習(xí)結(jié)果數(shù)據(jù)進(jìn)行常態(tài)化的收集以及分析,從而不斷優(yōu)化和改進(jìn)教學(xué)[2]。通過(guò)人工智能技術(shù),教師可以及時(shí)了解學(xué)習(xí)者對(duì)具體知識(shí)點(diǎn)掌握的變化情況,幫助學(xué)習(xí)者及時(shí)調(diào)整學(xué)習(xí)步伐,從而不斷完善和優(yōu)化后續(xù)的教學(xué)設(shè)計(jì)以及教學(xué)過(guò)程;通過(guò)對(duì)每一個(gè)學(xué)習(xí)者學(xué)習(xí)過(guò)程中生成的測(cè)評(píng)數(shù)據(jù)進(jìn)行針對(duì)性分析,可以挖掘出更多的隱藏信息,幫助學(xué)習(xí)者構(gòu)建個(gè)性化學(xué)習(xí)路徑,為教師制定教學(xué)干預(yù)和決策提供參考[3]。
目前學(xué)習(xí)推薦算法多是基于學(xué)習(xí)者的個(gè)體行為,且推薦對(duì)象多是課程序列等粗粒度的內(nèi)容,難以真正滿(mǎn)足學(xué)習(xí)者的學(xué)習(xí)需求;另外,由于學(xué)習(xí)者的學(xué)習(xí)水平在學(xué)習(xí)過(guò)程中是動(dòng)態(tài)變化的,完整的學(xué)習(xí)路徑很難保證推薦的精準(zhǔn)度?;诖吮狙芯坎捎猛ㄟ^(guò)構(gòu)建大學(xué)物理的知識(shí)圖譜,結(jié)合對(duì)學(xué)習(xí)者測(cè)評(píng)數(shù)據(jù)的挖掘,動(dòng)態(tài)生成知識(shí)點(diǎn)推薦序列,以期為學(xué)生提供更加精準(zhǔn)、具體的推薦內(nèi)容。
知識(shí)圖譜可以看成是一個(gè)由概念連接起來(lái)的有向圖,每個(gè)概念相當(dāng)于一個(gè)圖中的節(jié)點(diǎn),節(jié)點(diǎn)和節(jié)點(diǎn)之間的有向邊表示概念之間的關(guān)聯(lián)[4]。這里有必要說(shuō)明知識(shí)圖譜和思維導(dǎo)圖之間的聯(lián)系,盡管它們都可以反映一門(mén)學(xué)科之中概念之間的聯(lián)系,知識(shí)圖譜中概念之間的聯(lián)系主要通過(guò)數(shù)據(jù)挖掘形成,而思維導(dǎo)圖往往是建立在個(gè)人對(duì)相關(guān)知識(shí)的理解上。思維導(dǎo)圖中概念之間的聯(lián)系主要是定性的、主觀(guān)的,而知識(shí)圖譜中概念與概念之間的關(guān)聯(lián)是量化的,這主要體現(xiàn)在數(shù)據(jù)挖掘方法在知識(shí)圖譜構(gòu)建中呈現(xiàn)的知識(shí)抽取過(guò)程(實(shí)體抽取過(guò)程,關(guān)系抽取過(guò)程和屬性抽取過(guò)程),都是通過(guò)特定算法來(lái)實(shí)現(xiàn)的。
在近年來(lái)的教學(xué)實(shí)踐中,思維導(dǎo)圖常常被用于了解學(xué)生對(duì)特定知識(shí)內(nèi)容的內(nèi)在結(jié)構(gòu)的理解,通過(guò)和專(zhuān)家的認(rèn)知結(jié)構(gòu)對(duì)比,發(fā)現(xiàn)學(xué)生學(xué)習(xí)過(guò)程中可能存在的問(wèn)題,以實(shí)現(xiàn)個(gè)性化的學(xué)習(xí)路徑規(guī)劃[5,6], 該過(guò)程的實(shí)現(xiàn)首先需要學(xué)生積極主動(dòng)配合教師的教學(xué)活動(dòng),然后由教師獨(dú)立完成后續(xù)的分析工作,工作量大且效率低下。如何收集并充分利用學(xué)生日常學(xué)習(xí)數(shù)據(jù),動(dòng)態(tài)了解學(xué)生知識(shí)結(jié)構(gòu)存在的缺陷和不足,是個(gè)性化教學(xué)亟待解決的問(wèn)題。
本研究致力于將大學(xué)物理的知識(shí)圖譜構(gòu)建與智慧型課堂應(yīng)答系統(tǒng)相結(jié)合,不僅是對(duì)原有課堂互動(dòng)系統(tǒng)的優(yōu)化升級(jí),而且在充分考慮課堂實(shí)際需求與當(dāng)前可用的技術(shù)手段支撐下進(jìn)行的全新突破和嘗試,成為連接教師與智慧教室之間的紐帶,真正做到物理教學(xué)的智能化、個(gè)性化。
大學(xué)物理知識(shí)圖譜的構(gòu)建主要包括三方面的工作:首先進(jìn)行實(shí)體抽取,確定哪些概念應(yīng)當(dāng)呈現(xiàn)于知識(shí)圖譜之中;之后基于概念進(jìn)行屬性抽取,明確這些概念在知識(shí)結(jié)構(gòu)中的重要性;最后是關(guān)系抽取,深入挖掘概念與概念之間的聯(lián)系。其中,本研究對(duì)于概念屬性的抽取是不依賴(lài)于思維導(dǎo)圖的框架,而是通過(guò)自然語(yǔ)言處理的方法從文本信息中挖掘得到的,這是本研究構(gòu)建大學(xué)物理知識(shí)圖譜的關(guān)鍵所在。下面將依次介紹大學(xué)物理知識(shí)圖譜構(gòu)建過(guò)程中知識(shí)抽取過(guò)程是如何實(shí)現(xiàn)的。
本研究以大學(xué)物理電磁學(xué)部分為例來(lái)探討大學(xué)物理知識(shí)圖譜的構(gòu)建,在構(gòu)建之初,教師專(zhuān)家先基于自身的專(zhuān)業(yè)知識(shí)和經(jīng)驗(yàn),繪制出該知識(shí)模塊和知識(shí)結(jié)構(gòu)有關(guān)的思維導(dǎo)圖,如圖1所示。在思維導(dǎo)圖繪制過(guò)程中以具體的知識(shí)點(diǎn)作為基本的知識(shí)元,細(xì)化知識(shí)顆粒結(jié)構(gòu),從而得到較為詳盡可以體現(xiàn)知識(shí)點(diǎn)間依賴(lài)關(guān)系的知識(shí)結(jié)構(gòu)思維導(dǎo)圖。
圖1 電磁學(xué)思維導(dǎo)圖
根據(jù)思維導(dǎo)圖中提供的物理概念生成檢索詞典,并通過(guò)檢索詞典通過(guò)自然語(yǔ)言抽取的方法實(shí)現(xiàn)實(shí)體抽取。教師在思維導(dǎo)圖出給出的知識(shí)點(diǎn)共63個(gè),通過(guò)文本挖掘?qū)嶓w抽取方法得到的知識(shí)點(diǎn)共150個(gè),將實(shí)體抽取得到的結(jié)果同思維導(dǎo)圖中的知識(shí)點(diǎn)概念進(jìn)行匹配核驗(yàn),其中二者重合的知識(shí)點(diǎn)數(shù)量為45個(gè),對(duì)于思維導(dǎo)圖中存在而實(shí)體抽取中未成功得到的知識(shí)點(diǎn)根據(jù)抽取結(jié)果調(diào)整該知識(shí)點(diǎn)概念的說(shuō)法,對(duì)思維導(dǎo)圖中18個(gè)知識(shí)點(diǎn)做出了調(diào)整與修正,最終實(shí)現(xiàn)思維導(dǎo)圖的結(jié)構(gòu)與自然語(yǔ)言抽取結(jié)果一致。
通過(guò)實(shí)體抽取確定知識(shí)圖譜中涵蓋的知識(shí)點(diǎn)概念后,我們將知識(shí)點(diǎn)對(duì)應(yīng)的重要程度作為它的屬性添加到知識(shí)圖譜中,在本研究中通過(guò)權(quán)重值來(lái)量化知識(shí)點(diǎn)的重要程度,以便于后續(xù)的計(jì)算和分析。
為使抽取出的屬性值更加切合實(shí)際,提高推薦結(jié)果的準(zhǔn)確率,本研究采用專(zhuān)家問(wèn)卷調(diào)查法和自然語(yǔ)言抽取兩種方法確定大學(xué)物理電磁學(xué)部分知識(shí)點(diǎn)的權(quán)重系數(shù),并將其確定的知識(shí)點(diǎn)屬性值分別應(yīng)用到推薦算法中,對(duì)二者分別得到的推薦結(jié)果進(jìn)行對(duì)比分析,最終將表現(xiàn)較好的方法用于后續(xù)的研究。
2.2.1 問(wèn)卷調(diào)查法
從大學(xué)物理教材電磁學(xué)部分中初步篩選得到62個(gè)知識(shí)點(diǎn),采用李克特五級(jí)量表制作“電磁學(xué)知識(shí)點(diǎn)重要程度”調(diào)查問(wèn)卷,調(diào)查問(wèn)卷面向的對(duì)象為同濟(jì)大學(xué)教授《大學(xué)物理》課程的教師們。共收集問(wèn)卷16 份,有效問(wèn)卷15 份,剔除無(wú)效問(wèn)卷1份,采用SPSS對(duì)收集上來(lái)的數(shù)據(jù)進(jìn)行分析。首先對(duì)問(wèn)卷進(jìn)行信效度分析,分析結(jié)果顯示該問(wèn)卷的Cronbach's Alpha值為0.953,如圖2所示,該問(wèn)卷可靠性較高可以進(jìn)行后續(xù)的分析。
圖2 調(diào)查問(wèn)卷信度分析
由于教師在實(shí)際教學(xué)過(guò)程中按照教學(xué)大綱的課程教學(xué)要求,主要將知識(shí)點(diǎn)的掌握程度分為“掌握”和“了解”兩類(lèi)。因此研究對(duì)問(wèn)卷數(shù)據(jù)進(jìn)行二聚類(lèi)分析,聚類(lèi)分析結(jié)果如圖3所示,將聚類(lèi)中心分別是5和3,即“非常重要”和“一般”,同教學(xué)要求中提到的“掌握”和“了解”相對(duì)應(yīng)。最后根據(jù)各知識(shí)點(diǎn)概念所屬的聚類(lèi)中心來(lái)確定各自的權(quán)重系數(shù)。
2.2.2 自然語(yǔ)言抽取法
圖3 聚類(lèi)分析結(jié)果
選取《大學(xué)物理》教材相關(guān)文本作為數(shù)據(jù)樣本,使用當(dāng)下使用較為廣泛的TFIDF、TEXTRANK 以及交叉信息熵三種方法進(jìn)行知識(shí)點(diǎn)關(guān)鍵詞抽取,其中TFIDF 和TEXTRANK 通過(guò)jieba分詞系統(tǒng)實(shí)現(xiàn),交叉信息熵方法通過(guò)NLPIR分詞系統(tǒng)實(shí)現(xiàn)。
首先對(duì)大學(xué)物理教材(電磁學(xué)部分)、電磁學(xué)部分教學(xué)大綱以及電磁學(xué)部分的教學(xué)設(shè)計(jì)這三類(lèi)數(shù)據(jù)文本分別進(jìn)行分詞以及關(guān)鍵詞抽取,其中教學(xué)設(shè)計(jì)文本選自《基于SPOC 的大學(xué)物理混合式教學(xué)設(shè)計(jì)[7]》一書(shū)中電磁學(xué)部分,教學(xué)大綱為教研室自主編寫(xiě)制定。根據(jù)抽取結(jié)果修改詞典及停用詞表,不斷優(yōu)化識(shí)別效果,提高識(shí)別率;通過(guò)對(duì)識(shí)別結(jié)果進(jìn)行對(duì)比發(fā)現(xiàn),從教材課本中得到的抽取結(jié)果更為準(zhǔn)確、有效,因此選取教材課本作為后續(xù)文本挖掘的數(shù)據(jù)源。
使用上文提到的三種方法從該數(shù)據(jù)文本中進(jìn)行關(guān)鍵詞及其權(quán)重系數(shù)挖掘,實(shí)驗(yàn)結(jié)果數(shù)據(jù)顯示TEXTRANK 抽取率較低,而TFIDF和交叉信息熵兩種方法的抽取效果較好,因此我們采用TFIDF和交叉信息熵兩種方法來(lái)確定知識(shí)點(diǎn)的權(quán)重系數(shù)并將其最終推薦數(shù)據(jù)與專(zhuān)家意見(jiàn)方法進(jìn)行對(duì)比,以期得到更好的推薦結(jié)果。
2.2.3 知識(shí)點(diǎn)權(quán)重系數(shù)確定
為驗(yàn)證三種知識(shí)點(diǎn)權(quán)重系數(shù)確定方法哪一種應(yīng)用于推薦系統(tǒng)中更為有效,我們選取同濟(jì)大學(xué)2019級(jí)某教學(xué)班級(jí)的127名學(xué)生作為實(shí)驗(yàn)對(duì)象,對(duì)學(xué)生日常學(xué)習(xí)過(guò)程中的測(cè)試數(shù)據(jù)進(jìn)行常態(tài)化收集,基于此設(shè)計(jì)推薦算法,將推薦算法中知識(shí)點(diǎn)的權(quán)重系數(shù)分別設(shè)置為T(mén)FIDF、交叉信息熵和專(zhuān)家意見(jiàn)方法確定的權(quán)重值,得到相對(duì)應(yīng)的推薦序列。然后對(duì)學(xué)生大學(xué)物理期末考試成績(jī)進(jìn)行統(tǒng)計(jì)分析,從試卷中選取出考察電磁學(xué)知識(shí)點(diǎn)的3道題目(1道選擇題、2道計(jì)算題),分別統(tǒng)計(jì)學(xué)生每道題目的得分情況,確定學(xué)生對(duì)于每道題目所涉及知識(shí)點(diǎn)的掌握情況,驗(yàn)證不同算法生成的知識(shí)點(diǎn)推薦序列的優(yōu)劣。
為減少學(xué)生猜對(duì)答案對(duì)數(shù)據(jù)分析產(chǎn)生的誤差,我們選擇19題、20題這兩道考察電磁學(xué)知識(shí)點(diǎn)的計(jì)算題來(lái)進(jìn)行統(tǒng)計(jì)分析,采用精準(zhǔn)率、召回率、F值[8]三個(gè)參數(shù)來(lái)對(duì)推薦效果進(jìn)行評(píng)估,參數(shù)計(jì)算公式為:
評(píng)估計(jì)算結(jié)果如表1所示。
表1 期末考試第19題、20題數(shù)據(jù)分析
其中,19 題考察的知識(shí)點(diǎn)是“庫(kù)侖定律”和“電場(chǎng)強(qiáng)度疊加”,20 題考察的知識(shí)點(diǎn)是“電磁學(xué)感應(yīng)定律”和“畢奧-薩伐爾定律”。使用項(xiàng)目反應(yīng)理論二參數(shù)邏輯斯蒂模型來(lái)計(jì)算兩道題目的區(qū)分度和難度系數(shù),如表2所示,從表中我們可以看出兩道題目的區(qū)分度差不多,但是20題難度系數(shù)較大,更為簡(jiǎn)單。
表2 兩道題目的區(qū)分度和難度系數(shù)
從數(shù)據(jù)分析結(jié)果,可以看出推薦結(jié)果的精準(zhǔn)率在70%以上,說(shuō)明該推薦算法可行;但是召回率以及F 值偏低,因此我們將推薦算法中的閾值逐漸增大,來(lái)分析F 值的變化。讓閾值以0.1的步長(zhǎng)從0增加到5,得到三種方法對(duì)應(yīng)的F值隨著閾值增加而變化的曲線(xiàn),如圖4示。
圖4 不同算法得到的F 值隨閾值變化圖
通過(guò)對(duì)比分析我們可以得到對(duì)于19題涉及的知識(shí)點(diǎn)交叉信息熵法在閾值為1.1時(shí)得到的推薦效果是最好的,但是在第20題的表現(xiàn)上三種方法是相同的,都是閾值在0.2時(shí)得到推薦效果最好,這說(shuō)明對(duì)于比較簡(jiǎn)單的題目,三種方法的表現(xiàn)近似相同,而對(duì)于難度較大的題目,交叉信息熵方法優(yōu)于專(zhuān)家調(diào)查法和TFIDF法,因此我們?cè)谠O(shè)計(jì)系統(tǒng)時(shí)采用交叉信息熵的方法來(lái)確定各個(gè)知識(shí)點(diǎn)的重要程度。
對(duì)智慧型應(yīng)答系統(tǒng)中學(xué)生的答題測(cè)試數(shù)據(jù)進(jìn)行挖掘、分析,從而實(shí)現(xiàn)對(duì)思維導(dǎo)圖中關(guān)系的核驗(yàn)。如果上游知識(shí)點(diǎn)的掌握與下游知識(shí)點(diǎn)的掌握存在關(guān)聯(lián)關(guān)系,則保留原有關(guān)系;如果二者之間不存在關(guān)聯(lián),則刪除兩知識(shí)元之間的關(guān)系,從而得到最終的知識(shí)圖譜。
結(jié)合大學(xué)物理知識(shí)圖譜,我們?cè)谠械恼n堂應(yīng)答系統(tǒng)的基礎(chǔ)上開(kāi)發(fā)出智慧型課堂應(yīng)答系統(tǒng),實(shí)現(xiàn)對(duì)學(xué)生學(xué)習(xí)情況的形成性評(píng)價(jià),并在此基礎(chǔ)上向?qū)W生提供預(yù)警信息與推送資源,實(shí)現(xiàn)學(xué)生學(xué)習(xí)過(guò)程的個(gè)性化,提高學(xué)生學(xué)習(xí)的效率。這里主要介紹智慧型課堂應(yīng)答系統(tǒng)的架構(gòu)以及個(gè)性化推送的具體實(shí)現(xiàn)過(guò)程。
智慧型課堂應(yīng)答系統(tǒng)采用模塊化的結(jié)構(gòu)設(shè)計(jì),采用B/S架構(gòu)體系實(shí)現(xiàn)數(shù)據(jù)訪(fǎng)問(wèn)、業(yè)務(wù)處理以及用戶(hù)界面的分離,該系統(tǒng)兩部分部署在網(wǎng)絡(luò)環(huán)境下,支持外網(wǎng)訪(fǎng)問(wèn),主要包括后臺(tái)管理系統(tǒng)(后端)與課堂互動(dòng)界面(前端)兩部分。
后臺(tái)管理系統(tǒng)有單位管理員、課程管理員和教師三種角色,主要包括系統(tǒng)登錄、用戶(hù)管理、課程管理、班級(jí)管理、題目管理、數(shù)據(jù)管理六大部分,管理員根據(jù)大學(xué)物理的知識(shí)圖譜,確定知識(shí)點(diǎn)的權(quán)重系數(shù)與關(guān)聯(lián)規(guī)則;教師端主要包括教師登錄、答題互動(dòng)及未答題學(xué)生統(tǒng)計(jì);學(xué)生端包括學(xué)生登錄、答題互動(dòng)、個(gè)人檔案、推送信息四部分。系統(tǒng)功能模塊圖如圖5所示。
教師在進(jìn)行本節(jié)課的教學(xué)設(shè)計(jì)時(shí)需將上課用到的題目提前添加到系統(tǒng)中,設(shè)置題目所考察的知識(shí)點(diǎn)(一道題目關(guān)聯(lián)一個(gè)主要考察的知識(shí)點(diǎn))。教師在課堂授課過(guò)程中將題目展示給學(xué)生后開(kāi)始答題,系統(tǒng)根據(jù)學(xué)生答題情況確定學(xué)生對(duì)該知識(shí)點(diǎn)的掌握程度,并根據(jù)關(guān)聯(lián)規(guī)則,動(dòng)態(tài)刷新學(xué)生對(duì)上游知識(shí)點(diǎn)的掌握情況。完成一個(gè)學(xué)習(xí)單元后,系統(tǒng)將學(xué)生對(duì)知識(shí)點(diǎn)的掌握程度與知識(shí)點(diǎn)權(quán)重系數(shù)相乘后進(jìn)行倒序排序,得到初步的推薦序列。在期末考試后,設(shè)定并調(diào)整推送閾值直到推送的F值達(dá)到最大,并將此閾值確定為下一輪推送的閾值。以此不斷迭代更新以提高推薦系統(tǒng)的精確性和針對(duì)性。
教師通過(guò)系統(tǒng)可以得到每位同學(xué)的知識(shí)點(diǎn)推薦序列,該序列主要是由一個(gè)或多個(gè)具體的知識(shí)點(diǎn)所組成。后續(xù)我們會(huì)將對(duì)推送的內(nèi)容進(jìn)行拓展和豐富,通過(guò)與當(dāng)前正在研究的電子書(shū)平臺(tái)相結(jié)合,為學(xué)生推送基于知識(shí)點(diǎn)的文本資料、視頻材料、自測(cè)題目以及相關(guān)探究實(shí)驗(yàn)等多種不同形式的推送內(nèi)容,幫助學(xué)生自主實(shí)現(xiàn)對(duì)知識(shí)的主動(dòng)建構(gòu)。
圖5 系統(tǒng)功能模塊圖
相對(duì)于傳統(tǒng)教學(xué)方式,在教學(xué)實(shí)踐中應(yīng)用課堂應(yīng)答系統(tǒng)可以加強(qiáng)師生之間的互動(dòng),它作為一種交互手段可以對(duì)混合式教學(xué)的教學(xué)效果產(chǎn)生有效幫助[8]?;诋?dāng)前教育信息化的時(shí)代背景,本研究將知識(shí)圖譜技術(shù)與智能型應(yīng)答系統(tǒng)結(jié)合起來(lái),幫助學(xué)生實(shí)現(xiàn)個(gè)性化學(xué)習(xí),為精準(zhǔn)化教學(xué)實(shí)現(xiàn)了技術(shù)上的保障。由于教學(xué)實(shí)踐有限,我們的數(shù)據(jù)和算法還需要在實(shí)踐中不斷完善和提高。相信在不久的將來(lái),隨著技術(shù)的發(fā)展和物理教育研究定量化分析的趨勢(shì),基于人工智能的物理教育將成為教育技術(shù)與教學(xué)實(shí)踐深度融合的重要領(lǐng)域。