国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于多尺度信息感知的線上答題預(yù)測模型

2024-05-21 00:00:00魏亞紅黃江濤王之涵
關(guān)鍵詞:在線學(xué)習(xí)

DOI:10.16601/j.cnki.issn2096-7330.2024.01.012"文章編號:2096-7330(2024)01-0088-04

摘"要:隨著信息技術(shù)的快速發(fā)展,在線教育越來越普及,其打破時空限制的本質(zhì)吸引了越來越多的在線學(xué)習(xí)者。在線學(xué)習(xí)者線上答題預(yù)測對了解在線學(xué)習(xí)者當(dāng)前學(xué)習(xí)狀態(tài)并開展個性化指導(dǎo)有十分積極的作用??紤]到在線學(xué)習(xí)者知識掌握情況與近期答題準(zhǔn)確率情況對在線學(xué)習(xí)者線上答題預(yù)測具有一定的相關(guān)性,提出了基于多尺度信息感知的線上答題預(yù)測模型。(1)對答題行為數(shù)據(jù)集進(jìn)行數(shù)據(jù)預(yù)處理,提取題目難度、答題消耗時間、答題準(zhǔn)確結(jié)果3個特征,構(gòu)建答題預(yù)測三元組數(shù)據(jù)集。(2)基于LSTM分別學(xué)習(xí)不同尺度信息,包括通過多尺度通道學(xué)習(xí)學(xué)生知識模塊程度編碼,從學(xué)生近期答題行為學(xué)習(xí)答題狀態(tài)編碼等。(3)通過基于MLP構(gòu)建的分類器實現(xiàn)答題預(yù)測并在EdNet公開數(shù)據(jù)集上進(jìn)行了實驗對比。結(jié)果表明,新的模型具更高的答題預(yù)測準(zhǔn)確性。

關(guān)鍵詞:答題預(yù)測;在線學(xué)習(xí);LSTM;多尺度信息

中圖分類號:TP399""文獻(xiàn)標(biāo)志碼:A

0引言

隨著人工智能技術(shù)的快速發(fā)展,它在教育領(lǐng)域中的應(yīng)用也越來越受到關(guān)注。其中,通過知識追蹤對學(xué)生表現(xiàn)進(jìn)行預(yù)測是一項重要的任務(wù),它可以為個性化教學(xué)和學(xué)生表現(xiàn)監(jiān)測提供有力的支持。知識追蹤是根據(jù)學(xué)生過去的答題情況對學(xué)生的知識掌握情況進(jìn)行建模,從而得到學(xué)生當(dāng)前知識狀態(tài)表示的一種技術(shù)。在學(xué)生表現(xiàn)預(yù)測任務(wù)中,需要考慮多個因素,例如學(xué)生的背景、學(xué)科知識、學(xué)習(xí)方式等,因此,建立一個有效的學(xué)生表現(xiàn)預(yù)測模型非常具有挑戰(zhàn)性。在線學(xué)習(xí)具備靈活性、便利性和個性化學(xué)習(xí)等優(yōu)勢,因此,在線學(xué)習(xí)平臺吸引了越來越多的在線學(xué)習(xí)者,海量的學(xué)生答題行為被記錄下來,這為研究在線學(xué)習(xí)者學(xué)習(xí)行為和預(yù)測學(xué)生學(xué)習(xí)表現(xiàn)等提供了機(jī)會。

近年來,深度學(xué)習(xí)技術(shù)在學(xué)生表現(xiàn)預(yù)測任務(wù)中得到成功應(yīng)用。傳統(tǒng)的循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural NetworkRNN)單元在面對長序列數(shù)據(jù)時,很容易便遭遇梯度彌散,使得RNN只具備短期記憶,即RNN面對長序列數(shù)據(jù),僅可獲取較近的序列的信息,而對較早期的序列不具備記憶功能,從而丟失信息。由于學(xué)生的歷史做題信息對預(yù)測當(dāng)前答題,特別是相似知識點的答題起著較為關(guān)鍵的作用,能更好處理長時間序列數(shù)據(jù)分析的長短期記憶網(wǎng)絡(luò)(Long Short-Term Memory,LSTM)被廣泛應(yīng)用于在線學(xué)習(xí)表現(xiàn)預(yù)測任務(wù)中。

答題準(zhǔn)確率預(yù)測在智慧教育領(lǐng)域具有重要意義。準(zhǔn)確預(yù)測學(xué)生答題的準(zhǔn)確率可以幫助教師及時了解學(xué)生的學(xué)習(xí)水平和理解程度[1],并實施有針對性的個性化輔導(dǎo)。傳統(tǒng)的學(xué)生評估方法,如考試和作業(yè),主要提供總分,反映總體評價。在線學(xué)習(xí)平臺的學(xué)生答題基于各項答題實時給予評價,提供了更詳細(xì)和準(zhǔn)確的學(xué)生評估信息[2-3],有利于分析在線學(xué)習(xí)者答題能力和答題表現(xiàn),并開展答題準(zhǔn)確率預(yù)測。

通過準(zhǔn)確地預(yù)測學(xué)生的答題準(zhǔn)確率,2教師可以根據(jù)學(xué)生的個體差異進(jìn)行因材施教,為每個學(xué)生提供量身定制的學(xué)習(xí)支持和指導(dǎo)[4]。這有助于提高在線學(xué)習(xí)質(zhì)量、促進(jìn)學(xué)生的個性化發(fā)展,并為教育決策者提供有針對性的教育資源分配建議。傳統(tǒng)評估方法難以提供具體問題的準(zhǔn)確率預(yù)測以及缺乏個性化的評估指導(dǎo)。本研究構(gòu)建了基于多尺度信息感知的線上答題預(yù)測模型(Online question answering prediction model based on multiscale information perception,QAP_MIP),捕捉不同尺度特征,學(xué)習(xí)在線學(xué)習(xí)者知識掌握程度潛在特征和近期答題狀態(tài)潛在特征,并嘗試解決在線學(xué)習(xí)者答題行為的長時間依賴性問題。

1相關(guān)工作

1.1基于傳統(tǒng)機(jī)器學(xué)習(xí)的學(xué)生答題準(zhǔn)確率預(yù)測模型

在傳統(tǒng)機(jī)器學(xué)習(xí)方法中,常用的學(xué)生答題準(zhǔn)確率預(yù)測模型包括決策樹、隨機(jī)森林、樸素貝葉斯、支持向量機(jī)等[5]。這些方法通常將學(xué)生的歷史答題情況、題目的難度等特征作為輸入,使用一定的算法對這些特征進(jìn)行處理,得到學(xué)生回答下一道題目的準(zhǔn)確率[6]。這些方法在學(xué)生答題準(zhǔn)確率預(yù)測任務(wù)上取得了一定的效果,但由于預(yù)測性能對提取特征的依賴性較強(qiáng),其預(yù)測性能容易受到一定限制。

1.2基于深度學(xué)習(xí)的學(xué)生答題準(zhǔn)確率預(yù)測模型

近年來,深度學(xué)習(xí)技術(shù)在學(xué)生答題準(zhǔn)確率預(yù)測任務(wù)中取得了顯著的進(jìn)展。研究人員通過構(gòu)建不同的深度學(xué)習(xí)模型學(xué)習(xí)學(xué)生歷史答題行為數(shù)據(jù)信息,預(yù)測學(xué)生回答下一道題目的準(zhǔn)確率[7]。這些模型包括多層感知器、卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)等,它們具有較強(qiáng)的非線性建模能力,能夠更好地學(xué)習(xí)到學(xué)生答題準(zhǔn)確率預(yù)測任務(wù)中的潛在特征。但是,這些模型也存在一些問題,例如容易出現(xiàn)過擬合的現(xiàn)象,需要使用一些正則化技術(shù)進(jìn)行優(yōu)化等。

LSTM模型作為一種特殊的循環(huán)神經(jīng)網(wǎng)絡(luò)模型,具有記憶能力和長時依賴性,能夠有效地處理長序列數(shù)據(jù)。其核心思想是引入了三個門控機(jī)制,分別是輸入門、遺忘門和輸出門,以及一個細(xì)胞狀態(tài),用于控制信息的輸入、輸出和保存。在每個時間步中,LSTM通過這些門控制信息的流動,從而實現(xiàn)長期依賴的處理。在學(xué)生答題準(zhǔn)確率預(yù)測任務(wù)中,學(xué)生答題行為存在較長時間跨度,LSTM模型非常適合用于學(xué)生答題準(zhǔn)確率預(yù)測任務(wù)。

2答題預(yù)測模型

2.1問題描述

假設(shè)在線學(xué)習(xí)平臺提供了一批試題,題目集合記為E,有n名學(xué)生組成的在線學(xué)習(xí)者集,記為S,S={s1,s2,…,si,…,sn}。對于每一位學(xué)生si,假定其進(jìn)行了m次答題互動,有答題序列,Xi=[x1i,x2i,…,xti,…,xm],其中時刻t的答題互動為xti=[pti,dti,ati],pti代表學(xué)生si時刻t所答題目的難度,dit代表學(xué)生si時刻t所答題目的消耗時長,ait代表學(xué)生si時刻t所答題目的答案評估結(jié)果。本研究構(gòu)建一個模型f(.,.|θ),通過學(xué)生答題歷史數(shù)據(jù)信息學(xué)習(xí)模型參數(shù),最終實現(xiàn)該名學(xué)生下一道題答題是否準(zhǔn)確的預(yù)測或接下來k道題答題準(zhǔn)確率的預(yù)測。

2.2QAP_MIP模型構(gòu)建

構(gòu)建基于多尺度信息感知的線上答題預(yù)測模型(QAP_MIP),結(jié)構(gòu)如圖1所示。

該模型構(gòu)建了不同分支,分別學(xué)習(xí)不同尺度的學(xué)生線上答題行為特征,模擬實現(xiàn)學(xué)生相關(guān)知識模塊掌握程度和近期答題狀態(tài)隱藏特征的學(xué)習(xí)。學(xué)生相關(guān)知識模塊掌握程度特征的學(xué)習(xí)從該學(xué)生所有歷史答題行為中通過不同答題序列長度的三元組[p,d,a]學(xué)習(xí)學(xué)生整體學(xué)習(xí)能力表現(xiàn),具體從兩種不同答題序列長度進(jìn)行學(xué)習(xí)。學(xué)生近期答題狀態(tài)特征的學(xué)習(xí)則從該學(xué)生近期的答題行為(如最近作答的20道題目)中以最細(xì)的粒度(每次編碼的答題序列長度為1)進(jìn)行學(xué)習(xí)。

2.3知識模塊掌握程度編碼

學(xué)生答題情況直接反映了學(xué)生對相關(guān)知識模塊的掌握程度,反之,學(xué)生知識模塊掌握程度對預(yù)測學(xué)生答題結(jié)果有關(guān)鍵性作用。QAP_MIP模型通過多層LSTM對學(xué)生知識模塊掌握程度進(jìn)行編碼,以圖進(jìn)一步提升學(xué)生答題預(yù)測性能。考慮到學(xué)生在相近時間內(nèi)的答題內(nèi)容較大可能地存在知識點相同或相似的問題,對一段時間內(nèi)的學(xué)生答題情況進(jìn)行歸類分析,能夠更有效地捕捉學(xué)生知識模塊掌握程度隱藏特征,同時也可以有效地排除答題誤差所帶來的干擾。QAP_MIP通過不同尺度通道分別學(xué)習(xí)學(xué)生知識模塊程度編碼。具體通過兩條不同尺度通道進(jìn)行學(xué)習(xí),分別取答題序列長度為5和20。

2.4近期答題狀態(tài)編碼

2學(xué)生答題正確與否不僅與學(xué)生對題目內(nèi)容所涉及的知識模塊掌握情況有關(guān),也與學(xué)生當(dāng)前答題狀態(tài)有關(guān)。為避免僅使用學(xué)生知識模塊掌握程度編碼而導(dǎo)致過擬合問題,本研究同時考慮了學(xué)生近期答題狀態(tài)編碼。與學(xué)生知識掌握程度編碼從歷史長時間周期答題數(shù)據(jù)分析不同,學(xué)生近期答題狀態(tài)編碼主要從學(xué)生最近一段時間內(nèi)的答題數(shù)據(jù)進(jìn)行分析,同時,學(xué)習(xí)的答題數(shù)據(jù)尺度統(tǒng)一為1,即逐道題目進(jìn)行學(xué)習(xí)。本研究的近期答題狀態(tài)編碼從學(xué)生近期20道題的答題行為進(jìn)行學(xué)習(xí),即數(shù)據(jù)輸入序列長度為60。也就是說,當(dāng)預(yù)測學(xué)生時刻t的答題結(jié)果時,近期答題狀態(tài)編碼模塊的輸入為:[xt-20,xt-19,…,xt-1]。

2.5答題預(yù)測

答題預(yù)測模塊一方面將學(xué)生知識模塊掌握程度編碼和近期答題狀態(tài)編碼進(jìn)行拼接,獲得學(xué)生答題能力融合編碼;另一方面,通過MLP對當(dāng)前答題內(nèi)容進(jìn)行編碼,再與學(xué)生答題能力融合編碼進(jìn)行拼接,經(jīng)由MLP構(gòu)建的分類器實現(xiàn)答題預(yù)測。

QAP_MIP模型使用交叉熵作為損失函數(shù)。

3實驗及結(jié)果分析

3.1數(shù)據(jù)集

使用的數(shù)據(jù)集是EdNet公開數(shù)據(jù)集[8],該數(shù)據(jù)集由Santa收集的學(xué)生交互記錄組成,包括學(xué)生線上答題時間、線上題目內(nèi)容、線上答題結(jié)果以及每道題的正確答案等。

在使用該數(shù)據(jù)集前需要對數(shù)據(jù)進(jìn)行了預(yù)處理。采用Python編程語言對數(shù)據(jù)進(jìn)行預(yù)處理,包括數(shù)據(jù)清洗、去重和格式轉(zhuǎn)換等操作。在數(shù)據(jù)清洗過程中,為確保數(shù)據(jù)的準(zhǔn)確性和完整性,刪除了存在缺失值的數(shù)據(jù)和重復(fù)的數(shù)據(jù),去除無用信息和填補(bǔ)缺失值。在數(shù)據(jù)格式轉(zhuǎn)換過程中,將數(shù)據(jù)轉(zhuǎn)換為適合進(jìn)行深度學(xué)習(xí)的格式。

開展的實驗采用數(shù)據(jù)集1024位學(xué)生的數(shù)據(jù)記錄,選取的學(xué)生均完成了600道題以上的答題任務(wù),通過數(shù)據(jù)預(yù)處理及題目難度計算構(gòu)建了學(xué)生答題情況三元組[p,d,a],并把同一學(xué)生的答題情況三元組按答題先后順序進(jìn)行拼接,即獲得1024行多列的張量,實驗統(tǒng)一截取了每行的前1800列,即截取每名學(xué)生的600道題答題三元組信息。

3.2實驗設(shè)置

實驗通過PyTorch包[9]實現(xiàn),使用LSTM、GRU、TCN等模型作為對比方法。評價指標(biāo)使用F1值(F1 score)、準(zhǔn)確率(Accuracy)、精確率(Precision)和召回率(Recall)指標(biāo)。

3.3實驗結(jié)果分析

本研究提出的QAP_MIP模型與其他模型的對比實驗結(jié)果,見表1。從表1可以看出,QAP_MIP模型在不同評價指標(biāo)上均能獲得較優(yōu)的答題預(yù)測性能,在F1值和準(zhǔn)確率上均獲得比其他三個模型更優(yōu)的性能,在精確率上也獲得比LSTM和TCN模型更優(yōu)的性能。其中,在F1值比較上,模型比LSTM模型提升0.027個百分點,比GRU模型提升0.034個百分點,比TCN模型提升0.032個百分點。

從QAP_MIP模型架構(gòu)來看,學(xué)生近期答題狀態(tài)編碼對答題預(yù)測性能存在較大的影響,因此,開展了近期答題狀態(tài)編碼輸入長度超參與學(xué)習(xí)率(learning rate)超參對答題預(yù)測性能影響情況的實驗,實驗結(jié)果見表2。

從表2可以看出,當(dāng)學(xué)習(xí)率均取相同值時,如取0.1,近期答題狀態(tài)編碼輸入長度的增長能進(jìn)一步提升預(yù)測性能,這與現(xiàn)實分析結(jié)果一致。當(dāng)近期答題狀態(tài)編碼輸入長度相同時,學(xué)習(xí)率的不同直接影響最終的答題預(yù)測性能,實驗結(jié)果發(fā)現(xiàn)在一定范圍內(nèi)較低的學(xué)習(xí)率能夠獲取更優(yōu)的答題預(yù)測性能。

4結(jié)語

綜合考慮學(xué)生知識模塊掌握程度和近期答題狀態(tài)對答題準(zhǔn)確率的影響,構(gòu)建了多尺度信息感知的線上答題預(yù)測模型QAP_MIP,從不同尺度更好地學(xué)習(xí)編碼學(xué)生知識模塊掌握程度,同時,學(xué)習(xí)編碼學(xué)生近期答題狀態(tài)。在公開數(shù)據(jù)集EdNet上的實驗結(jié)果表明,基于兩種學(xué)習(xí)編碼融合分析的答題預(yù)測模型QAP_MIP能夠獲得更好的預(yù)測性能,在F1值和準(zhǔn)確率上均有良好的表現(xiàn)。

本研究采用的數(shù)據(jù)集來自特定的學(xué)習(xí)環(huán)境和課程,因此模型的泛化能力還需要在其他智慧教育公開數(shù)據(jù)集中進(jìn)行進(jìn)一步的驗證。同時,需要進(jìn)一步探索優(yōu)化數(shù)據(jù)預(yù)處理和編碼方法,以更好地界定不同知識儲備、不同學(xué)習(xí)能力和不同學(xué)習(xí)習(xí)慣的學(xué)生在學(xué)習(xí)成效分析與預(yù)測上的差異。

研究可以進(jìn)一步優(yōu)化模型的結(jié)構(gòu),提高預(yù)測精度和泛化能力。同時,可以開展基于多模態(tài)數(shù)據(jù)融合的學(xué)習(xí)成效預(yù)測模型研究,結(jié)合學(xué)生在線學(xué)習(xí)采集到的語言、圖像和行為數(shù)據(jù),構(gòu)建多模態(tài)融合學(xué)習(xí)分析模型,進(jìn)一步提升預(yù)測模型的能力。此外,可以將預(yù)測模型應(yīng)用于在線學(xué)習(xí)平臺和個性化教育系統(tǒng)中,為教師及時開展有效的教學(xué)干預(yù)和輔助提供決策支持。

參考文獻(xiàn):

[1]""Baker R S J,Corbett A T,Aleven V. More accurate student modeling through contextual estimation of slip and guess probabilities in bayesian knowledge tracing[C].Intelligent Tutoring Systems,2008:406-415.

[2]"Romero C,López M I,Luna J M,et al. Predicting students’ final performance from participation in on-line discussion forums[J].Computers amp; Education,2013,68:458-472.

[3]"Piech C,Bassen J,Huang J,et al. Deep knowledge tracing[J].Advances in Neural Information Processing Systems,2015:505-513.

[4]"Myla M A. Design of machine learning based model to predict students academic performance[J].ECS transactions,2022,107(1):3207-3214.

[5]"Breiman L. Random forests[J].Machine learning,2001,45(1):5-32.

[6]"Duda R O,Hart P E,Stork D G. Pattern classification[M].Hoboken:Wiley,2000.

[7]"Shinichi O,Shunichi H. A student modeling method combining deep learning and forgetting models with knowledge tracing[J].Procedia Computer science,2023,225:1191-1200.

[8]"Youngduck C,Youngnam L,Dongmin S,et al. EdNet:A large-scale hierarchical dataset in education[C].in Proceedings of the 21th International Conference on Artificial Intelligence in Education,2020:69-73.

[9]"Paszke A,Gross S,Massa F,et al. Pytorch:An imperative style,high-performance deep learning library[C].in Proceedings of 32nd Conference on Neural Information Processing Systems,2019:7994-8005.

[責(zé)任編輯:黃天放]

收稿日期:2023-08-23

*基金項目: (國家自然科學(xué)基金項目“大規(guī)模在線學(xué)習(xí)行為表示學(xué)習(xí)與預(yù)測建模研究”(62067007);廣西重點研發(fā)計劃項目(桂科AB21076009)

@通信作者簡介: (黃江濤(1979—),男,廣西玉林人,博士,南寧師范大學(xué)教授,研究方向:機(jī)器學(xué)習(xí)、計算機(jī)視覺。

猜你喜歡
在線學(xué)習(xí)
銅仁供電局安規(guī)在線學(xué)習(xí)考試系統(tǒng)開發(fā)與研究
在線學(xué)習(xí)過程管理大數(shù)據(jù)的建設(shè)與應(yīng)用
開放大學(xué):過去充滿傳奇但前景依然未卜?
國際遠(yuǎn)程教育研究的可視化分析
基于學(xué)習(xí)行為數(shù)據(jù)的在線學(xué)習(xí)時間規(guī)律探析
信息化環(huán)境下高職英語教學(xué)現(xiàn)狀及應(yīng)用策略研究
基于MOOC的微課制作方法
基于混合式學(xué)習(xí)理念的大學(xué)生自主學(xué)習(xí)能力的培養(yǎng)研究
價值工程(2016年29期)2016-11-14 02:05:45
基于SOA的在線學(xué)習(xí)資源集成模式的研究
SPOC網(wǎng)絡(luò)課程建設(shè)與實施
科技視界(2016年23期)2016-11-04 22:42:11
栖霞市| 东乌珠穆沁旗| 华阴市| 延寿县| 大安市| 江都市| 锡林浩特市| 望都县| 万山特区| 田东县| 崇义县| 元阳县| 呼伦贝尔市| 寻甸| 赤城县| 修水县| 嘉峪关市| 舒兰市| 洪洞县| 静安区| 鹤山市| 旬阳县| 察隅县| 临夏县| 阜阳市| 吉安县| 张家港市| 利津县| 大庆市| 长治市| 筠连县| 平湖市| 通辽市| 府谷县| 东宁县| 沐川县| 卢龙县| 泉州市| 涡阳县| 烟台市| 凤凰县|