何皓怡 劉清堂 張 思 關(guān)雪敏 覃偉華
在線協(xié)同研討知識建構(gòu)行為的自動分析研究*
何皓怡1劉清堂2張 思2關(guān)雪敏1覃偉華3[通訊作者]
(1.廣西民族師范學(xué)院 數(shù)理與電子信息工程學(xué)院,廣西崇左 532200;2.華中師范大學(xué)教育信息技術(shù)學(xué)院,湖北武漢 430079;3.廣西大學(xué)公共管理學(xué)院,廣西南寧 530004)
為實(shí)現(xiàn)對在線協(xié)同研討知識建構(gòu)過程的動態(tài)跟蹤與分析,文章采用文本分類方法,設(shè)計(jì)了“在線協(xié)同研討知識建構(gòu)行為自動分析實(shí)施流程”。以此流程為指導(dǎo),文章以網(wǎng)絡(luò)研修社區(qū)中教師工作坊的協(xié)同研討活動為例開展實(shí)驗(yàn),主要內(nèi)容包括創(chuàng)建“教師工作坊知識建構(gòu)行為編碼表”、采集與整理交互文本數(shù)據(jù)、選擇和提取文本特征、對訓(xùn)練集數(shù)據(jù)進(jìn)行預(yù)處理、訓(xùn)練和評價(jià)分類模型、對分析結(jié)果的應(yīng)用情況進(jìn)行描述和解讀。實(shí)驗(yàn)結(jié)果表明,在線協(xié)同研討知識建構(gòu)行為自動分析方法可為利益相關(guān)者深入理解協(xié)同知識建構(gòu)過程并為此過程進(jìn)行實(shí)時(shí)干預(yù)和調(diào)節(jié)提供支持。
在線協(xié)同研討;知識建構(gòu);文本分類;學(xué)習(xí)分析
在線協(xié)同研討是一種重要的協(xié)作學(xué)習(xí)活動。在在線協(xié)同研討的過程中,學(xué)習(xí)者通過分享、提問、協(xié)商等交互活動共同建構(gòu)公共知識,同時(shí)實(shí)現(xiàn)個人知識的增長。當(dāng)前,對在線協(xié)同研討過程中的知識建構(gòu)行為進(jìn)行分析,?;谙鄳?yīng)的編碼系統(tǒng),采用內(nèi)容分析方法,以人工編碼的方式把學(xué)習(xí)活動過程中產(chǎn)生的交互文本數(shù)據(jù)映射為相應(yīng)的知識建構(gòu)行為類型再進(jìn)行分析研究。但人工編碼方法主觀性較強(qiáng)且費(fèi)時(shí)、費(fèi)力,分析結(jié)果反饋滯后,不利于進(jìn)行實(shí)時(shí)的教學(xué)監(jiān)測和干預(yù)。若能基于文本分類方法實(shí)現(xiàn)對文本數(shù)據(jù)的自動分析,將會極大地提高數(shù)據(jù)分析的效率,且在教學(xué)過程的實(shí)時(shí)監(jiān)控方面也將發(fā)揮極大的應(yīng)用潛力。
對協(xié)同研討過程中產(chǎn)生的交互文本進(jìn)行內(nèi)容分析,可推斷出文本中的潛在性內(nèi)容(如元認(rèn)知、認(rèn)知行為等[1]),這些內(nèi)容能為協(xié)同知識建構(gòu)過程提供更有意義的解釋。隨著文本分類技術(shù)的快速發(fā)展,研究者開始將此技術(shù)應(yīng)用于內(nèi)容分析研究,以提高分析的效率。例如,McKlin[2]采用人工神經(jīng)網(wǎng)絡(luò)的方法,基于描述協(xié)同知識建構(gòu)過程的認(rèn)知存在編碼方案,對學(xué)習(xí)社區(qū)中學(xué)生的討論文本進(jìn)行分類;L?ms?等[3]基于學(xué)生的協(xié)作交互文本,采用詞嵌入和具有注意力機(jī)制的深度學(xué)習(xí)方法構(gòu)建分類模型,自動編碼分析學(xué)生協(xié)作探究學(xué)習(xí)的過程;Neto等[4]基于學(xué)生在線討論文本,利用相關(guān)工具提取文本特征并結(jié)合部分與情境相關(guān)的自定義特征,采用隨機(jī)森林算法編碼分析協(xié)作交互文本的認(rèn)知存在階段,取得了較高的準(zhǔn)確率(Accuracy=67%),之后還基于實(shí)驗(yàn)結(jié)果解釋、探討了相關(guān)特征對認(rèn)知存在不同階段的預(yù)測作用。而在中文交互文本的自動編碼研究方面,甄園宜等[5]基于深度神經(jīng)網(wǎng)絡(luò)算法,構(gòu)建了面向在線協(xié)作學(xué)習(xí)交互文本的分類模型,取得了較高的準(zhǔn)確率(Accuracy=77.42%),但此實(shí)驗(yàn)采用的交互文本編碼方案還較難適用于協(xié)同知識建構(gòu)過程的分析。
綜上可知,現(xiàn)有研究多為對英文文本的自動編碼分析,而如何針對中文文本進(jìn)行知識建構(gòu)行為的自動編碼分析還有待進(jìn)一步研究。另外,當(dāng)前人工智能系統(tǒng)中存在的“黑箱”、數(shù)據(jù)偏見、算法偏見等問題,使得可解釋AI日益受到關(guān)注[6]。因此,將智能技術(shù)融入在線協(xié)同研討情境中,實(shí)現(xiàn)知識建構(gòu)行為的自動分析,還要綜合考慮教育領(lǐng)域的應(yīng)用需求、協(xié)同知識建構(gòu)的過程特征、可用的數(shù)據(jù)資源、AI算法的適用性等問題,在此基礎(chǔ)上設(shè)計(jì)適切的分析方法,構(gòu)建一個可解釋、可信任的教育AI系統(tǒng)。
綜合前人的相關(guān)研究成果和本研究團(tuán)隊(duì)的相關(guān)教學(xué)實(shí)踐,本研究設(shè)計(jì)了在線協(xié)同研討知識建構(gòu)行為自動分析實(shí)施流程,如圖1所示。
圖1 在線協(xié)同研討知識建構(gòu)行為自動分析實(shí)施流程
①編碼系統(tǒng)的選擇與構(gòu)建。編碼系統(tǒng)用于確定分析單元的歸屬類型,而實(shí)現(xiàn)自動編碼分析,需要綜合考慮分析目標(biāo)與實(shí)際的應(yīng)用需求,將人工智能技術(shù)與教育教學(xué)理論有機(jī)融合,創(chuàng)建一個適應(yīng)于具體教學(xué)情境的編碼方案,在有效反映分析目標(biāo)特征的同時(shí),又能為計(jì)算機(jī)實(shí)現(xiàn)自動分類提供更為友好的信息,從而達(dá)到較好的應(yīng)用效果。
②數(shù)據(jù)的采集和整理。本環(huán)節(jié)可采用網(wǎng)絡(luò)爬蟲方法采集網(wǎng)絡(luò)平臺上的文本數(shù)據(jù),并存入相應(yīng)的數(shù)據(jù)庫中;之后,可通過數(shù)據(jù)清洗對“臟數(shù)據(jù)”進(jìn)行有效的檢測和修復(fù),以提升數(shù)據(jù)質(zhì)量,為后續(xù)的數(shù)據(jù)處理和分析做好準(zhǔn)備。
③特征選擇和提取。本環(huán)節(jié)需著重考慮在線協(xié)同研討具有的多主題、跨學(xué)科特點(diǎn),以及協(xié)同知識建構(gòu)過程具有的階段性和交互性特點(diǎn)。因此,文本特征的選擇和提取可考慮從文本數(shù)據(jù)中獲取語義、語法特征與研討情境特征等——這些特征與研討內(nèi)容無關(guān),既具有較好的跨情境性,也能為文本分類提供較好的區(qū)分性信息。
④數(shù)據(jù)預(yù)處理。本環(huán)節(jié)需著重解決數(shù)據(jù)集的類別樣本不平衡問題。為避免因訓(xùn)練集樣本不平衡而產(chǎn)生分類誤差,需要對數(shù)據(jù)進(jìn)行相應(yīng)處理,以實(shí)現(xiàn)數(shù)據(jù)集中各類別樣本的平衡。
⑤分類模型選擇與評價(jià)。分類模型的選擇,應(yīng)考慮特定領(lǐng)域的風(fēng)險(xiǎn)和需求、可用的數(shù)據(jù)資源和現(xiàn)有的領(lǐng)域知識、機(jī)器學(xué)習(xí)模型的適用性是否滿足待處理計(jì)算任務(wù)的要求等因素。結(jié)合教育領(lǐng)域?qū)山忉孉I的需求[7],本環(huán)節(jié)應(yīng)優(yōu)先選擇標(biāo)準(zhǔn)的可解釋模型。分類模型的訓(xùn)練需要經(jīng)過反復(fù)調(diào)試與比較,以提升其計(jì)算性能和精度。分類模型的檢驗(yàn)與評價(jià),可從分類準(zhǔn)確率(Accuracy)、與人工分析的一致性和跨情境性等方面來進(jìn)行。
⑥結(jié)果的應(yīng)用及解釋。本環(huán)節(jié)重在應(yīng)用分析結(jié)果解釋特征變量與知識建構(gòu)行為類別的關(guān)系,增強(qiáng)使用者對模型的信任度并深化其對協(xié)同知識建構(gòu)過程的認(rèn)知,讓使用者能夠理解、信任和有效管理整個過程。另外,自動分析方法提升了分析的效率,可與相關(guān)工具軟件結(jié)合,及時(shí)、可視化地呈現(xiàn)教學(xué)的過程或狀態(tài)等,從而為協(xié)同知識建構(gòu)過程的干預(yù)和調(diào)節(jié)提供支持。
需說明的是,當(dāng)在線協(xié)同研討知識建構(gòu)行為自動分析進(jìn)行到第六個環(huán)節(jié)時(shí),應(yīng)根據(jù)具體的應(yīng)用效果,于必要時(shí)返回到之前的環(huán)節(jié)并對相關(guān)環(huán)節(jié)進(jìn)行優(yōu)化與調(diào)整,以滿足實(shí)際的應(yīng)用需求。
本研究按照在線協(xié)同研討知識建構(gòu)行為自動分析實(shí)施流程,以網(wǎng)絡(luò)研修社區(qū)中教師工作坊的協(xié)同研討活動為例開展實(shí)驗(yàn),旨在基于教師在線協(xié)同研討過程中產(chǎn)生的交互文本,來探討對知識建構(gòu)行為進(jìn)行自動分析的實(shí)現(xiàn)過程。
本研究在選擇與構(gòu)建編碼系統(tǒng)時(shí),著重考慮了以下三個方面的問題:
(1)網(wǎng)絡(luò)研修協(xié)同研討活動的相關(guān)特點(diǎn)
在網(wǎng)絡(luò)研修協(xié)同研討活動中,教師研討的話題多為其在教學(xué)實(shí)踐過程中關(guān)注的問題。教師通過在線協(xié)作,推動問題的解決;同時(shí),教師在吸納彼此思想的基礎(chǔ)上共同構(gòu)建一種新的理解,這種理解對教學(xué)實(shí)踐可能具有重要的參考價(jià)值。此外,教師在此過程中進(jìn)行自我反思,不斷發(fā)展其實(shí)踐性知識,進(jìn)一步提升了個人的專業(yè)知識和能力。因此,應(yīng)將教師的教學(xué)反思和共同體新知識的構(gòu)建作為網(wǎng)絡(luò)研修協(xié)同研討活動的關(guān)注重點(diǎn)。
(2)對IAM的認(rèn)識
交互分析模型(Interaction Analysis Model,IAM)是一個可靠而友好的模型[8],它將協(xié)同知識建構(gòu)的過程劃分為分享觀點(diǎn)、認(rèn)知沖突、意義協(xié)商、檢驗(yàn)修正、達(dá)成應(yīng)用等五個階段。在應(yīng)用過程中,IAM可通過分析低階、高階心智功能行為的出現(xiàn)頻率,來評價(jià)小組的交互能力和質(zhì)量。而要促進(jìn)協(xié)作過程中高階心智功能行為的出現(xiàn),階段1(分享觀點(diǎn))和階段2(認(rèn)知沖突)帖子的出現(xiàn)是關(guān)鍵。在階段1中,經(jīng)過分享、比較、澄清所達(dá)成的共同理解有利于協(xié)作意義的生成和學(xué)習(xí)[9]。在階段2中,參與者認(rèn)知的不協(xié)調(diào)、觀點(diǎn)間的不一致可以促進(jìn)交互的深度[10]。
表1 教師工作坊知識建構(gòu)行為編碼表
(3)人工智能技術(shù)的相關(guān)特征
目前,人工智能技術(shù)還屬于弱人工智能,其應(yīng)用僅適用于規(guī)則十分明確的、定義十分清晰的任務(wù)[11]。因此,在編碼方案中對類別的劃分和描述應(yīng)具有良好的區(qū)分性,如此才有利于機(jī)器算法提取各類別樣本的相關(guān)文本特征,從而提升文本分類模型的準(zhǔn)確率。另外,訓(xùn)練集類別樣本分布的平衡性也是影響文本分類模型準(zhǔn)確率的重要因素。
考慮到上述問題,結(jié)合分析目標(biāo)和實(shí)際的應(yīng)用需求,本研究邀請10名相關(guān)專家參與構(gòu)建“教師工作坊知識建構(gòu)行為編碼表”的訪談,并結(jié)合訪談反饋進(jìn)行綜合分析。參考IAM,指導(dǎo)者在協(xié)同研討過程中應(yīng)重點(diǎn)監(jiān)控階段1和階段2帖子的出現(xiàn)情況,以促進(jìn)學(xué)習(xí)者高階心智功能行為的出現(xiàn),并據(jù)此對交互過程及其質(zhì)量進(jìn)行分析、評價(jià),由此得到最終的編碼表,如表1所示。
本研究采集了網(wǎng)絡(luò)研修社區(qū)中A小學(xué)語文教師工作坊中的評論數(shù)據(jù)作為訓(xùn)練集。該教師工作坊中有1名坊主、2名輔導(dǎo)教師和92名學(xué)員,其網(wǎng)絡(luò)研修活動持續(xù)了3個多月。具體的活動分三個階段實(shí)施:①案例研習(xí)階段,教師通過觀摩教學(xué)案例,確定此次活動的研討主題為“學(xué)生參與作文批改,效果是不是更好些?”②實(shí)踐探究階段,教師在線下驗(yàn)證相關(guān)觀點(diǎn)和方法、在線上分享實(shí)踐的體會與疑惑,大家共同協(xié)商推動問題的解決。③總結(jié)反思階段,教師反思自己的教學(xué)實(shí)踐,分享研修心得。本研究采集了此次網(wǎng)絡(luò)研修活動中的過程數(shù)據(jù),得到1773條文本評論;同時(shí),還采集了D小學(xué)數(shù)學(xué)教師工作坊中的評論數(shù)據(jù)作為測試集,研討主題為“怎樣對待不完成作業(yè)的學(xué)生?”,得到651條文本評論。之后,按照“教師工作坊知識建構(gòu)行為編碼表”,以消息為分析單元,對上述訓(xùn)練集和測試集進(jìn)行編碼,得到數(shù)據(jù)分布情況,如表2所示。
表2 對訓(xùn)練集、測試集進(jìn)行編碼后的數(shù)據(jù)分布情況
教師工作坊中研討的主題多樣,這就對文本分類模型的泛化能力和情境遷移能力提出了要求。另外,還需考慮文本特征對目標(biāo)類型的可解釋性,以加深對知識建構(gòu)行為的認(rèn)識和理解?;诖?,本研究擬選擇和提取交互文本的語言探索與詞計(jì)數(shù)(Linguistic Inquiry and Word Count,LIWC)特征和研討情境特征作為分類算法的輸入變量。
(1)LIWC特征
LIWC特征是指使用LIWC工具來抽取的交互文本的語言心理特征。本研究通過“文心”(TextMind)中文心理分析系統(tǒng)[12],從上述訓(xùn)練集和測試集中獲取到102個中文語言心理特征。
(2)研討情境特征
研討情境特征可理解為一個帖子在整個討論線程情境中的位置特征,主要包含——
①帖子深度:取一個整數(shù)值,代表帖子在整個討論線程中的時(shí)間順序位置。
②回復(fù)帖類型:取一個布爾值,標(biāo)識該帖是對主題帖的回復(fù)還是對其他帖的回復(fù)。若是對主題帖的回復(fù),則取值為0;若是對其他帖的回復(fù),則取值為1。
③回復(fù)數(shù):取一個整數(shù)值,代表一個帖子所獲得的回復(fù)消息數(shù)。
④回復(fù)帖與主帖的相似度:是指回復(fù)帖內(nèi)容與所回復(fù)的主帖內(nèi)容經(jīng)計(jì)算取得的余弦相似度值。通過本特征可以判斷,回復(fù)帖在多大程度上建構(gòu)在主帖的信息之上。
⑤嚴(yán)格時(shí)間順序帖與上一帖的相似度:將每個帖子放置在一條時(shí)間線上,然后嚴(yán)格按照其創(chuàng)建時(shí)間進(jìn)行排序,而不考慮其引用及其與其他帖子的關(guān)系,如圖2所示。排序完成后,計(jì)算帖子與其上一帖的余弦相似度值。通過本特征可以判斷,帖子在多大程度上建構(gòu)在上一帖的信息之上。
圖2 按嚴(yán)格的時(shí)間順序進(jìn)行排序的帖子
圖3 按語義時(shí)間順序進(jìn)行排序的帖子
⑥語義時(shí)間順序帖與上一帖的相似度:語義時(shí)間順序跟蹤共享思想的討論,靠討論線程將相關(guān)帖子組織起來,再依據(jù)時(shí)間順序?qū)ο嗤瑢蛹壍奶舆M(jìn)行排序。如圖3所示,2、4、5號帖在同一討論線程內(nèi)處于同一回復(fù)層級(都是對1號帖的回復(fù)),在此可按創(chuàng)建時(shí)間對這三個帖子進(jìn)行排序。帖子的語義時(shí)間順序,反映了子話題隨著時(shí)間推移的發(fā)展情況。排序完成后,計(jì)算該序列內(nèi)帖子與其上一帖的余弦相似度值。
由于訓(xùn)練集中三種類型的樣本在數(shù)量上存在較大差異,為避免因訓(xùn)練集樣本不平衡而產(chǎn)生的分類誤差,需要對數(shù)據(jù)進(jìn)行預(yù)處理。本研究中的訓(xùn)練集帖子總數(shù)為1773條,平均分布在各行為類型中的帖子數(shù)量應(yīng)有591條。為此,本研究采用SMOTE算法[13],過采樣分別增加KC2、KC3的樣本數(shù)452條、203條;欠采樣則減少KC1的樣本數(shù)655條,以實(shí)現(xiàn)各行為類型最終帖子數(shù)量的平衡,如表3所示。
表3 訓(xùn)練集數(shù)據(jù)預(yù)處理
(1)模型選擇
建立分類模型時(shí),本研究選用隨機(jī)森林(Random Forest)算法,它是以決策樹為基本分類器的一種集成學(xué)習(xí)方法,在文本分類領(lǐng)域應(yīng)用廣泛。該算法是一種白盒算法,可度量特征的重要性[14];此算法中,平均精度下降(Mean Decrease Accuracy,MDA)利用置換袋外數(shù)據(jù)(Out-Of-Bag,OOB)計(jì)算變量的重要性,MDA值越大,說明變量越重要。實(shí)驗(yàn)中使用R語言的randomForest包來運(yùn)行隨機(jī)森林算法,并結(jié)合importance()函數(shù)來度量并輸出變量的重要性值。
(2)模型訓(xùn)練與評價(jià)
在應(yīng)用隨機(jī)森林算法構(gòu)建分類模型的過程中,有兩個待確定的重要參數(shù):決策樹數(shù)量ntree和隨機(jī)分割變量數(shù)mtry,它們都對模型的分類精準(zhǔn)度有一定的影響。參考Geurts等[15]的研究成果,本研究將ntree值設(shè)為1000。而對于mtry值,本研究通過逐一比較其不同取值,選取OOB誤差值最小時(shí)的mtry值作為最佳取值。據(jù)此,本研究選取了17個不同的mtry值(即1、3、5、7、9、11、13、15、21、32、43、54、65、76、87、95、108)用于實(shí)驗(yàn)計(jì)算,結(jié)果如圖4所示。圖4顯示,在訓(xùn)練集中最佳模型所獲得的準(zhǔn)確率是0.887、Kappa值為0.830,此時(shí)mtry值為9。一般認(rèn)為,如果Kappa值>0.75,則編碼結(jié)果間具有極好的一致性[16]。綜上可知,當(dāng)ntree參數(shù)取值1000、mtry參數(shù)取值為9時(shí),訓(xùn)練得出的隨機(jī)森林模型自動分類結(jié)果的信度較高。
圖4 隨機(jī)森林mtry值選擇的實(shí)驗(yàn)計(jì)算結(jié)果
此外,本研究還應(yīng)用跨情境的測試數(shù)據(jù)集來評估訓(xùn)練得出的分類模型的泛化能力。該模型在測試集上的分類準(zhǔn)確率為0.756、Kappa值為0.502。一般認(rèn)為,如果Kappa值處于0.40~0.75之間,則編碼結(jié)果間具有良好的一致性[17]。由此可以推斷,該模型能較好地適用于跨情境分類。
(1)特征重要性分析
依據(jù)隨機(jī)森林算法中MDA值的大小,本研究排列出影響知識建構(gòu)行為分類的重要特征變量,得到MDA值排在前3位的LIWC特征,如表4所示。
表4 MDA值排在前3位的LIWC特征
①帖子中所含詞數(shù)(WordCount)特征:與KC3(協(xié)商、應(yīng)用與重構(gòu))行為緊密相關(guān)。Joksimovic等[18]的研究表明,該特征體現(xiàn)出了帖子語言結(jié)構(gòu)的復(fù)雜性,可推斷出認(rèn)知探究和認(rèn)知加工的增長。②排他詞數(shù)(Exclusive)特征:與KC2(觀點(diǎn)沖突)行為緊密相關(guān)。通過在訓(xùn)練語料中查看相關(guān)帖子,可以發(fā)現(xiàn)排他詞的使用能反映說話者嘗試發(fā)表具有區(qū)分性的觀點(diǎn),或者表明說話者發(fā)表了不一致的觀點(diǎn)。③問號數(shù)(QMark)特征:與KC2(觀點(diǎn)沖突)行為緊密相關(guān)。問號多出現(xiàn)在問句當(dāng)中,結(jié)合訓(xùn)練語料的分析可以發(fā)現(xiàn):問號的出現(xiàn),體現(xiàn)了該帖子是針對相關(guān)觀點(diǎn)提出質(zhì)疑或提出問題。以上分析結(jié)果能為協(xié)同知識建構(gòu)活動的角色腳本設(shè)計(jì)提供參考[19],有利于相關(guān)角色或參與者準(zhǔn)確表達(dá)各自觀點(diǎn),進(jìn)而促進(jìn)在線協(xié)作學(xué)習(xí)的有效性。
依據(jù)隨機(jī)森林算法中MDA值的大小,本研究得到排在前3位的研討情境特征如表5所示。
表5 MDA值排在前3位的研討情境特征
①回復(fù)帖類型(Re_PoLev)特征:與KC3(協(xié)商、應(yīng)用與重構(gòu))、KC2(觀點(diǎn)沖突)行為有較高的相關(guān)度。查看訓(xùn)練語料可以發(fā)現(xiàn),回復(fù)帖若是對非主題帖的回復(fù),則該帖大概率屬于KC2、KC3類別;若是對主題帖的回復(fù),則該帖很有可能屬于KC1類別。由此可以推斷,教師在進(jìn)行協(xié)同研討知識建構(gòu)的過程中能基于研討主題分享觀點(diǎn),能針對他人的觀點(diǎn)提出不一致意見或進(jìn)行協(xié)商建構(gòu)新知識。②嚴(yán)格時(shí)間順序帖與上一帖的相似度(Str_PrePo)特征:與KC2(觀點(diǎn)沖突)行為緊密相關(guān)。查看訓(xùn)練語料可以發(fā)現(xiàn),當(dāng)本特征值較小時(shí),該帖屬于KC2類別的可能性較大;而當(dāng)本特征值較大時(shí),該帖屬于KC1、KC3類別的可能性較大。由此可以推斷,教師常引用按嚴(yán)格時(shí)間順序的上一帖的相關(guān)內(nèi)容,來分享觀點(diǎn)或協(xié)商建構(gòu)知識。③回復(fù)帖與主帖的相似度(Fst_Po)特征:與KC2(觀點(diǎn)沖突)行為緊密相關(guān)。查看訓(xùn)練語料可以發(fā)現(xiàn),當(dāng)本特征值較大時(shí),該帖屬于KC2類別的可能性較大。由此可以推斷,教師常通過直接回復(fù)他人帖子并引用該帖子中的相關(guān)內(nèi)容來發(fā)表不一致的觀點(diǎn),體現(xiàn)出教師在發(fā)表不一致觀點(diǎn)時(shí)有較強(qiáng)的針對性。引用異議帖子中的相關(guān)內(nèi)容并直接回復(fù),這種謹(jǐn)慎而有針對性地發(fā)表不一致觀點(diǎn)的方式,有利于學(xué)習(xí)共同體中良好協(xié)作氛圍的營造,進(jìn)而促進(jìn)知識的意義建構(gòu)。通過以上分析可知,研討情境特征在知識建構(gòu)行為分類中具有一定的重要性,因此對帖子進(jìn)行編碼分析時(shí),結(jié)合上下文情境是非常有必要的,這有利于提升編碼的信度和效度。
(2)知識建構(gòu)行為的序列分析
基于自動編碼獲得的結(jié)果,利益相關(guān)者可以便捷地使用滯后序列分析法(Lag Sequential Analysis,LSA),對交互行為序列及模式進(jìn)行分析,進(jìn)一步探究學(xué)習(xí)者認(rèn)知水平與互動行為之間的關(guān)系,為研修過程的干預(yù)和調(diào)節(jié)提供支持。本研究利用滯后序列分析軟件GESQ 5.1,計(jì)算出交互行為類型的調(diào)整殘差值(Z-Score)。一般來說,如果Z-Score值>1.96(<0.05),則表示從起始行為到目的行為之間的轉(zhuǎn)換具有顯著意義[20]。
圖5 網(wǎng)絡(luò)研修各階段的知識建構(gòu)行為轉(zhuǎn)換情況
本實(shí)驗(yàn)中A小學(xué)語文教師工作坊中開展的網(wǎng)絡(luò)研修活動經(jīng)歷了三個階段,各階段的知識建構(gòu)行為轉(zhuǎn)換情況如圖5所示。此次網(wǎng)絡(luò)研修活動始于案例研習(xí)階段,教師通過觀摩案例對相關(guān)教學(xué)問題進(jìn)行探討,并討論解決問題的理論和方法;當(dāng)有教師提出不一致的觀點(diǎn)和意見時(shí),他們會反復(fù)探討、辯解與協(xié)商(KC2→KC2,KC3→KC3)。在實(shí)踐探究階段,教師在線下開展實(shí)踐、線上提出疑惑并分享觀點(diǎn),教師就分享的教學(xué)事件及其相關(guān)觀點(diǎn)進(jìn)行探討、詢問或辯解(KC1→KC2);通過觀點(diǎn)的“碰撞”,教師提出協(xié)商、接受或整合建議,在具體教學(xué)情境中修正、提煉問題解決方案等(KC2→KC3,KC3→KC3);在交互過程中,教師的知識建構(gòu)水平逐步提升(KC1→KC2→KC3)。而在總結(jié)反思階段,教師對整個研修活動進(jìn)行總結(jié),積極分享自己的研修心得,交流、反思、總結(jié)自己的教學(xué)實(shí)踐和研修收獲(KC1→KC1,KC3→KC3)。
為了實(shí)現(xiàn)對在線協(xié)同研討知識建構(gòu)過程的動態(tài)跟蹤與分析,本研究首先設(shè)計(jì)了“在線協(xié)同研討知識建構(gòu)行為自動分析實(shí)施流程”;然后,基于此流程實(shí)現(xiàn)了對網(wǎng)絡(luò)研修社區(qū)中教師工作坊協(xié)同研討過程知識建構(gòu)行為的自動編碼分析,并將分類模型應(yīng)用于跨情境的測試數(shù)據(jù)集中,取得了較好的分類效果(分類準(zhǔn)確率為0.756、Kappa值為0.502);最后,對實(shí)驗(yàn)結(jié)果的應(yīng)用情況進(jìn)行了探討。本研究發(fā)現(xiàn),交互文本的語言心理特征和研討情境特征在知識建構(gòu)行為的不同類別樣本中具有不同的表現(xiàn)形式,這可為利益相關(guān)者深入理解協(xié)同知識建構(gòu)過程并對此過程進(jìn)行實(shí)時(shí)干預(yù)和調(diào)節(jié)提供支持。后續(xù)研究將增大在線協(xié)同研討知識建構(gòu)行為自動分析方法的應(yīng)用范圍,進(jìn)一步對分類模型的泛化能力進(jìn)行驗(yàn)證,以提升其應(yīng)用價(jià)值。
[1]Henri F. Computer conferencing and content analysis[A]. Collaborative Learning Through Computer Conferencing[C]. Berlin: Springer, 1992:117-136.
[2]McKlin T. Analyzing cognitive presence in online courses using an ANN[D]. Atlanta: Georgia State University, 2004:40-80.
[3]L?ms? J, Uribe P, Jiménez A, et al. Deep networks for collaboration analytics: Promoting automatic analysis of face-to-face interaction in the context of inquiry-based learning[J]. Journal of Learning Analytics, 2021,(8):113-125.
[4]Neto V, Rolim V, Pinheiro A, et al. Automatic content analysis of online discussions for cognitive presence: A study of the generalizability across educational contexts[J]. IEEE Transactions on Learning Technologies, 2021,(3): 299-312.
[5]甄園宜,鄭蘭琴.基于深度神經(jīng)網(wǎng)絡(luò)的在線協(xié)作學(xué)習(xí)交互文本分類方法[J].現(xiàn)代遠(yuǎn)程教育研究,2020,(3):104-112.
[6][7]王萍,田小勇,孫僑羽.可解釋教育人工智能研究:系統(tǒng)框架、應(yīng)用價(jià)值與案例分析[J].遠(yuǎn)程教育雜志,2021,(6):20-29.
[8]Gunawardena C N, Anderson T. Analysis of a global online debate and the development of an interaction analysis model for examining social construction of knowledge in computer conferencing[J]. Journal of Educational Computing Research, 1997,(4):397-431.
[9]Dama C I, Ludvigsen S. Learning through interaction and the co-construction of knowledge objects in teacher education[J]. Learning, Culture and Social Interaction, 2016,(11):1-18.
[10]Kanuka H, Anderson T. Online social interchange, discord, and knowledge construction[J]. Journal of Distance Education, 1998,(1):57-74.
[11]鄭勤華,熊潞穎,胡丹妮.任重道遠(yuǎn):人工智能教育應(yīng)用的困境與突破[J].開放教育研究,2019,(4):10-17.
[12]Gao R, Hao B, Li H, et al. Developing simplified Chinese psychological linguistic analysis dictionary for microblog[A]. International Conference on Brain & Health Informatics (BHI’13)[C]. Tokyo: Springer, 2013:359-368.
[13]Chawla N V, Bowyer K W, Hall L O, et al. SMOTE: Synthetic minority over-sampling technique[J]. Journal of Artificial Intelligence Research, 2002,(16):321-357.
[14]Louppe G, Wehenkel L, Sutera A, et al. Understanding variable importances in forests of randomized trees[A]. Advances in Neural Information Processing Systems 26 (NIPS 2013)[C]. Cambridge: The MIT Press, 2013:1-9.
[15]Geurts P, Ernst D, Wehenkel L. Extremely randomized trees[J]. Machine Learning, 2006,(1):3-42.
[16][17]Wever B D, Schellens T, Valcke M, et al. Content analysis schemes to analyze transcripts of online asynchronous discussion groups: A review[J]. Computers & Education, 2006,(1):6-28.
[18]Joksimovic S, Gasevic D, Kovanovic V, et al. Psychological characteristics in cognitive presence of communities of inquiry: A linguistic analysis of online discussions[J]. The Internet and Higher Education, 2014,22:1-10.
[19]Radkowitsch A, Vogel F, Fischer F. Good for learning, bad for motivation? A meta-analysis on the effects of computer- supported collaboration scripts[J]. International Journal of Computer-Supported Collaborative Learning, 2020,15:5-47.
[20]楊現(xiàn)民,王懷波,李冀紅.滯后序列分析法在學(xué)習(xí)行為分析中的應(yīng)用[J].中國電化教育,2016,(2):17-23、32.
Research on Automatic Analysis of Knowledge Construction Behaviors in Online Collaborative Discussion
HE Hao-yi1LIU Qing-tang2ZHANG Si2GUAN Xue-min1QIN Wei-hua3[Corresponding Author]
In order to realize the dynamic tracking and analysis of the knowledge construction process of online collaborative discussion, this paper used the text classification method to design the “implementation process of automatic analysis of knowledge construction behavior of online collaborative discussion”. Guided by this process, this paper took the collaborative discussion activities of teachers’ workshops in the e-learning community as an example to carry out the experiment, and the main contents include creating a “teacher workshop knowledge construction behavior coding scheme”, collecting and sorting interactive text data, selecting and extracting text features, preprocessing training set data, training and evaluating classification model, and describing and explaining the application situation of analysis results. The results showed that the automatic analysis method of knowledge construction behavior in an online collaborative discussion can provide support for stakeholders to deeply understand the collaborative knowledge construction process and to intervene and adjust the process in real time.
online collaborative discussion; knowledge construction; text classification; learning analysis
G40-057
A
1009—8097(2022)05—0093—09
10.3969/j.issn.1009-8097.2022.05.011
基金項(xiàng)目:本文受國家自然科學(xué)基金項(xiàng)目“面向大規(guī)模在線教育的學(xué)習(xí)者協(xié)作會話能力評估模型及干預(yù)機(jī)制研究”(項(xiàng)目編號:62077016)、廣西高等教育本科教學(xué)改革工程一般A類項(xiàng)目“基于創(chuàng)新實(shí)踐能力培養(yǎng)的SPOC翻轉(zhuǎn)課堂混合型教學(xué)模式研究——以管理溝通課程為例”(項(xiàng)目編號:2018JGA115)、廣西民族師范學(xué)院2021年校級科研項(xiàng)目“混合學(xué)習(xí)過程的多模態(tài)分析及歸因研究”(項(xiàng)目編號:2021BS006)資助。
何皓怡,高級工程師,博士,研究方向?yàn)閷W(xué)習(xí)分析,郵箱為he_haoyi@163.com。
2021年8月31日
編輯:小米