李凌波,邢丹丹
(1.鄭州旅游職業(yè)學(xué)院 信息工程學(xué)院,河南 鄭州 450000;2.鄭州財(cái)經(jīng)學(xué)院 信息工程學(xué)院,河南 鄭州 450000)
隨著人工智能、云計(jì)算、物聯(lián)網(wǎng)、大數(shù)據(jù)等技術(shù)的飛速發(fā)展,教學(xué)資源網(wǎng)絡(luò)化也進(jìn)入了快車(chē)道,帶來(lái)了教育教學(xué)的創(chuàng)新發(fā)展。與此同時(shí),智慧教育被列為支撐教育信息化的基礎(chǔ),出現(xiàn)在我國(guó)《教育信息化2.0 行動(dòng)計(jì)劃》中。目前,雖然部分高校已經(jīng)建立了本校的“慕課”在線學(xué)習(xí)平臺(tái),但是這些平臺(tái)僅僅局限于為學(xué)生呈現(xiàn)單一的教學(xué)資源,不能就不同學(xué)生的自身情況有針對(duì)性地推薦學(xué)習(xí)內(nèi)容,無(wú)法對(duì)學(xué)情進(jìn)行準(zhǔn)確的分析。因此,如何判斷不同學(xué)習(xí)內(nèi)容之間的聯(lián)系,按照學(xué)習(xí)過(guò)程漸進(jìn)性地推薦學(xué)科知識(shí)成為智慧學(xué)習(xí)的研究熱點(diǎn)。
對(duì)高校而言,無(wú)論是采用OBE 教學(xué)模式還是混合模式,高校教師的授課重點(diǎn)都需要“以學(xué)生為中心”,如何有效分析學(xué)生的學(xué)習(xí)行為是智慧教學(xué)的關(guān)鍵一環(huán)。學(xué)生學(xué)習(xí)行為中所蘊(yùn)含的信息不僅僅表明其學(xué)習(xí)方向,更能通過(guò)這種變化趨勢(shì)找到學(xué)生的興趣點(diǎn)。而數(shù)據(jù)挖掘與推薦算法作為一種良好的表征計(jì)算方式,通過(guò)對(duì)數(shù)據(jù)的分析與挖掘,得出行為之間的關(guān)聯(lián)特性,并根據(jù)這種關(guān)聯(lián)特性進(jìn)行相應(yīng)的推薦。
在對(duì)學(xué)生學(xué)習(xí)習(xí)慣數(shù)據(jù)進(jìn)行挖掘與分析的基礎(chǔ)上,將智慧推薦功能應(yīng)用到高校在線學(xué)習(xí)平臺(tái)中勢(shì)必會(huì)提高對(duì)學(xué)生學(xué)情管理的科學(xué)性。這樣,不僅可以使學(xué)生主動(dòng)了解本專(zhuān)業(yè)的專(zhuān)業(yè)課程安排,同時(shí)也可以作為學(xué)生課前預(yù)習(xí)或課后復(fù)習(xí)的補(bǔ)充途徑,促使學(xué)生根據(jù)自己的學(xué)習(xí)狀況與老師的教學(xué)進(jìn)度合理調(diào)整學(xué)習(xí)計(jì)劃,真正做到“因材施教”。
本文提出的基于相關(guān)性與關(guān)聯(lián)規(guī)則的智慧教學(xué)推薦預(yù)測(cè)模型則是結(jié)合學(xué)生所學(xué)專(zhuān)業(yè),按照學(xué)生的學(xué)習(xí)意愿并根據(jù)課程之間的相似性為學(xué)生提供較好的課程銜接度。根據(jù)教育信息化要求,從學(xué)生實(shí)際需求出發(fā),建立基于相關(guān)性與關(guān)聯(lián)規(guī)則的在線學(xué)習(xí)課程推薦模型,根據(jù)學(xué)生的學(xué)習(xí)行為推薦個(gè)性化的學(xué)習(xí)課程,這樣會(huì)大大提升學(xué)生的學(xué)習(xí)效果,從而豐富智慧教學(xué)的發(fā)展模式,構(gòu)建新的教育教學(xué)生態(tài)。
在對(duì)學(xué)生的整體學(xué)習(xí)情況進(jìn)行預(yù)測(cè)前,需要提前建立數(shù)據(jù)框架。數(shù)據(jù)框架是保證后續(xù)預(yù)測(cè)與分析具有科學(xué)性和準(zhǔn)確性的重要基礎(chǔ)。通過(guò)對(duì)在線學(xué)習(xí)平臺(tái)中學(xué)生學(xué)習(xí)習(xí)慣的分析可知,學(xué)生的點(diǎn)擊記錄存在一定的關(guān)聯(lián)性,而這些關(guān)聯(lián)性就可以成為個(gè)性化推薦的基礎(chǔ)。例如,大學(xué)生在學(xué)習(xí)專(zhuān)業(yè)課程時(shí),一般習(xí)慣于按照所學(xué)課程的前序或后繼課程依次學(xué)習(xí),并會(huì)通過(guò)課程介紹找出自己的興趣點(diǎn),從而結(jié)合自身情況進(jìn)行有側(cè)重點(diǎn)的學(xué)習(xí)。本文在線學(xué)習(xí)推薦模型建立過(guò)程如圖1所示。
圖1 智慧教學(xué)推薦服務(wù)模型
在建立模型之前,首先需要根據(jù)學(xué)生的點(diǎn)擊記錄對(duì)服務(wù)器中存儲(chǔ)的用戶(hù)訪問(wèn)信息進(jìn)行記錄。本研究基于學(xué)科——課程頁(yè)面瀏覽記錄,通過(guò)對(duì)頁(yè)面瀏覽內(nèi)容、停留次數(shù)等進(jìn)行清洗、統(tǒng)計(jì),構(gòu)成基本數(shù)據(jù)稀疏矩陣,再利用相關(guān)性與關(guān)聯(lián)規(guī)則分析挖掘有價(jià)值的學(xué)科關(guān)系并自動(dòng)生成關(guān)聯(lián)課程鏈接,根據(jù)這些鏈接對(duì)學(xué)生進(jìn)行學(xué)習(xí)內(nèi)容的個(gè)性化推薦,提高學(xué)生的學(xué)習(xí)興趣。
Pearson 相關(guān)系數(shù)是最常用的線性相關(guān)系數(shù)之一,用于表示有相關(guān)關(guān)系的兩個(gè)或多個(gè)不同項(xiàng)目之間的關(guān)聯(lián)程度,取值通常介于(-1,1)之間,其絕對(duì)值越大說(shuō)明相關(guān)性越強(qiáng)。
假設(shè)存在、兩個(gè)不同且有關(guān)聯(lián)的項(xiàng)目,其Pearson相關(guān)系數(shù)為:
通過(guò)計(jì)算Pearson 相關(guān)系數(shù),找出系數(shù)較大的前項(xiàng),對(duì)有強(qiáng)關(guān)聯(lián)性的項(xiàng)目進(jìn)行推薦。
關(guān)聯(lián)規(guī)則作為推薦算法中經(jīng)典、成熟的算法之一,用于發(fā)現(xiàn)不同事務(wù)之間的內(nèi)在聯(lián)系,從而得到用戶(hù)感興趣的相關(guān)信息。
假設(shè)事務(wù)中包含個(gè)子項(xiàng)目,關(guān)聯(lián)性代表項(xiàng)目集在某一事務(wù)中出現(xiàn),會(huì)導(dǎo)致項(xiàng)目集也會(huì)存在一定的出現(xiàn)概率,并使用=>來(lái)表達(dá)項(xiàng)目集與項(xiàng)目集之間的關(guān)系。同時(shí),支持度(support)和置信度(confidence)是關(guān)聯(lián)規(guī)則中的重要參數(shù),支持度代表關(guān)聯(lián)規(guī)則中的“量”,即項(xiàng)目集和項(xiàng)目集同時(shí)發(fā)生的概率;而置信度則代表關(guān)聯(lián)規(guī)則中的“質(zhì)”,即在發(fā)生項(xiàng)目集A 的基礎(chǔ)上發(fā)生項(xiàng)目集B的概率。
相應(yīng)地,關(guān)聯(lián)規(guī)則=>的支持度support(=>)的計(jì)算公式為:
關(guān)聯(lián)規(guī)則=>的支持度confidence(=>)的計(jì)算公式為:
通過(guò)人為設(shè)置最小支持度和最小置信度,得到形如=>的關(guān)聯(lián)規(guī)則。挖掘關(guān)聯(lián)規(guī)則的目的就是找出強(qiáng)關(guān)聯(lián)信息作為推薦的基礎(chǔ),并在此基礎(chǔ)上對(duì)項(xiàng)目集進(jìn)行總結(jié),得到頻繁項(xiàng)進(jìn)行展示。
本研究以某高校軟件工程專(zhuān)業(yè)本科學(xué)生的課程學(xué)習(xí)行為數(shù)據(jù)作為采樣數(shù)據(jù),運(yùn)用R 語(yǔ)言(v4.1.1)對(duì)數(shù)據(jù)庫(kù)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析。以學(xué)生次序?yàn)樾校院诵恼n程為列,將處理后的訪問(wèn)賦值為1,將未訪問(wèn)賦值為0,建立稀疏矩陣數(shù)據(jù)庫(kù)。以20 門(mén)專(zhuān)業(yè)課程數(shù)據(jù)為依據(jù),抽取軟件工程專(zhuān)業(yè)2018 級(jí)694 名學(xué)生的訪問(wèn)記錄,構(gòu)成一個(gè)694×20 的高維矩陣單元。由于篇幅有限,本文僅展示前15 名學(xué)生的訪問(wèn)記錄,如表1所示。
表1 學(xué)生學(xué)習(xí)訪問(wèn)記錄矩陣
續(xù)表
根據(jù)輸入數(shù)據(jù),計(jì)算Pearson 相關(guān)系數(shù)并進(jìn)行可視化展示,結(jié)果如圖2所示。由相關(guān)性結(jié)果可知,正相關(guān)性前五的課程組合為:計(jì)算機(jī)網(wǎng)絡(luò)-操作系統(tǒng)原理、軟件工程-軟件項(xiàng)目管理、面向?qū)ο蟪绦蛟O(shè)計(jì)-高級(jí)JAVA 開(kāi)發(fā)技術(shù)、人工智能概論-機(jī)器學(xué)習(xí)、數(shù)據(jù)結(jié)構(gòu)與算法-人工智能概論。
圖2 核心專(zhuān)業(yè)課程Pearson 相關(guān)系數(shù)圖
使用Apriori 算法挖掘課程組合數(shù)據(jù),設(shè)置最小support為3%,最小confidence 為85%。對(duì)軟件工程專(zhuān)業(yè)核心課程進(jìn)行關(guān)聯(lián)性分析,最終得到69 個(gè)常用的高頻課程組合。其中2 種課程的組合1 個(gè),3 種課程的組合39 個(gè),4 種課程的組合24 個(gè),5 種課程的組合5 個(gè)。按照置信度由高至低的順序?qū)ζ溥M(jìn)行排序。對(duì)得到的關(guān)聯(lián)規(guī)則進(jìn)行可視化展示,如圖3所示的網(wǎng)狀圖能夠著重顯示軟件工程專(zhuān)業(yè)學(xué)生的學(xué)習(xí)課程頻繁項(xiàng)集,且所有關(guān)聯(lián)規(guī)則的lift >5,這表明所有的關(guān)聯(lián)規(guī)則均有效且具有極強(qiáng)的正相關(guān)性。由該網(wǎng)狀圖可知:軟件項(xiàng)目管理、軟件工程、軟件構(gòu)造、可視化建模與UML 這四門(mén)課程關(guān)系密切,同時(shí)出現(xiàn)的概率較高,可以將以上課程存儲(chǔ)到個(gè)性化推薦功能中,供學(xué)生進(jìn)行相關(guān)學(xué)習(xí);大數(shù)據(jù)概論、Python 程序設(shè)計(jì)、人工智能概論、機(jī)器學(xué)習(xí)、數(shù)據(jù)分析與可視化關(guān)系緊密且lift 較大,表明這五門(mén)課程有極強(qiáng)的正相關(guān)性,學(xué)生在學(xué)習(xí)的過(guò)程中傾向于學(xué)習(xí)這些相關(guān)內(nèi)容,可以在學(xué)生的學(xué)習(xí)過(guò)程中進(jìn)行推薦;同時(shí),對(duì)于數(shù)據(jù)結(jié)構(gòu)與算法這門(mén)課,由網(wǎng)狀圖可知其與以上課程關(guān)系較為密切,可以考慮推薦學(xué)生在學(xué)習(xí)以上課程之前先學(xué)習(xí)數(shù)據(jù)結(jié)構(gòu)與算法這門(mén)課。
圖3 專(zhuān)業(yè)課程組合推薦網(wǎng)狀圖
結(jié)合Pearson 相關(guān)系數(shù)與Apriori 算法,通過(guò)創(chuàng)建頁(yè)面超鏈接的方式對(duì)課程進(jìn)行組合,并在主頁(yè)面中對(duì)所推薦的相關(guān)課程進(jìn)行介紹,例如學(xué)生在訪問(wèn)面向?qū)ο蟪绦蛟O(shè)計(jì)這門(mén)課程時(shí),可以在頁(yè)面下方加入推薦學(xué)習(xí)高級(jí)Java 開(kāi)發(fā)技術(shù),并在此基礎(chǔ)上加入“進(jìn)階”頁(yè)面跳轉(zhuǎn)到更高層次的學(xué)習(xí),如軟件項(xiàng)目管理、軟件構(gòu)造等。這樣,不僅可以向?qū)W生推薦與學(xué)習(xí)內(nèi)容有關(guān)的專(zhuān)業(yè)知識(shí),而且還能在此基礎(chǔ)上進(jìn)一步了解其前序課程與后繼課程,完善學(xué)生的學(xué)習(xí)路徑,使知識(shí)能夠融會(huì)貫通、學(xué)以致用,提高學(xué)生的學(xué)習(xí)效率。
智慧教學(xué)以知識(shí)點(diǎn)和教學(xué)數(shù)據(jù)為數(shù)據(jù)庫(kù),針對(duì)學(xué)生學(xué)習(xí)過(guò)程動(dòng)態(tài)數(shù)據(jù)建立特征數(shù)據(jù)集,并在此基礎(chǔ)上使用相關(guān)性分析與關(guān)聯(lián)規(guī)則,實(shí)現(xiàn)智慧教學(xué)從理論層面到實(shí)踐應(yīng)用的過(guò)渡,探索智慧教學(xué)的生態(tài)構(gòu)建。同時(shí),對(duì)學(xué)生的在線學(xué)習(xí)行為進(jìn)行記錄,創(chuàng)建基本學(xué)生學(xué)習(xí)畫(huà)像,分析學(xué)生學(xué)習(xí)和活動(dòng)軌跡,優(yōu)化課堂學(xué)習(xí)路徑,設(shè)計(jì)個(gè)性化學(xué)習(xí)資源推薦服務(wù),對(duì)智慧教學(xué)過(guò)程中產(chǎn)生的教育大數(shù)據(jù)進(jìn)行深入分析,識(shí)別學(xué)生的學(xué)習(xí)偏好,提高學(xué)生的學(xué)習(xí)效率,為學(xué)有余力的學(xué)生提供拓展學(xué)習(xí)平臺(tái)。最后,高校在線學(xué)習(xí)平臺(tái)的建立是智慧課堂教學(xué)落地的重要保障,個(gè)性化推薦服務(wù)能夠豐富教學(xué)內(nèi)容,提升教師教學(xué)體驗(yàn)與學(xué)生學(xué)習(xí)體驗(yàn)。