郗閩
關鍵詞: 學生教學; 認知診斷; 貝葉斯網(wǎng)絡; 結(jié)構學習; 層級關系; 分類性能
中圖分類號: TN711?34; TP393 ? ? ? ? ? ? ? ? 文獻標識碼: A ? ? ? ? ? ? ? ? ? ?文章編號: 1004?373X(2018)24?0079?03
Research on BN?based generalized cognitive diagnosis model for students
XI Min
(Xian Aeronautical University, Xian 710077, China)
Abstract: In allusion to the disadvantage that only score values are given for measurement and diagnosis of students′ psychological change and generalized cognition, and different knowledge structures with the same score value cannot be explained in the traditional teaching, the Bayesian network (BN) is introduced into the generalized cognitive diagnosis of students on the basis of the fact that, as for the current task of student cognitive diagnosis, information feedback of student test results is more important. The Bayesian structure learning is conducted for the data obtained from the test, so as to obtain hierarchical relationships between attributes. The BN network classifier is constructed to classify the students′ cognitive states. A verification was conducted for the constructed BN?based generalized cognitive diagnosis model of students. The results show that the obtained hierarchical relationships between attributes are reasonable, the classification performance is good, and the model has a broad application prospect.
Keywords: student teaching; cognitive diagnosis; Bayesian network; structure learning; hierarchical relationship; classification performance
在教學與學生考試評估中,評估結(jié)果的分數(shù)值并不能揭示隱藏其背后的認知過程與結(jié)構信息,而評估通常的主要任務為反饋信息[1],以有利于對學生思想政治教育的促進。針對此缺點,本文構造了基于BN網(wǎng)絡的學生廣義認知診斷模型,將貝葉斯網(wǎng)絡(Bayesian Network,BN)引入學生廣義認知診斷中。在此主要進行了兩方面的研究,分別為測驗所得數(shù)據(jù)進行貝葉斯結(jié)構的學習得到屬性間的層級關系與構建BN網(wǎng)絡分類器對學生認知狀態(tài)進行分類,從而更好的為教育服務。
1.1 ?認知診斷
新一代健康教育理論的核心:認知診斷雖處于發(fā)展初期,但已成為國內(nèi)外心理研究的熱點[2]。在教育中,期待得出學生認知過程中的具體信息,以指導不同學生有針對性的學習。認知診斷最早可追溯至20世紀六七十年代,提出為掌握而學的布魯姆認為測驗不僅要提供篩選功能,更能提供具體信息,以提高測驗效度[3]?;谛睦韺W模型,認知診斷采用心理學的各種方法分析測驗任務中所涵蓋的技能、知識等分量,從而獲得模型并進行設計測驗。最終采用測量模型獲得測量數(shù)據(jù),也即融合各種變量于測量模型,并利用統(tǒng)計方法對個體特征進行揭示。
1.2 ?貝葉斯網(wǎng)絡概念
1985年提出的貝葉斯網(wǎng)絡(BN)已在機器學習、專家系統(tǒng)與人工智能等領域得到廣泛的應用,其是統(tǒng)計學、數(shù)據(jù)挖掘等多個領域的交叉學科[4]。BN基于概率論圖形模式,采用概率分布將不確定性設計成模型以用于分析不確定事物并做出推理[5]。BN包括兩部分:條件概率分布(Conditional Probability Distribution,CPT)與有向無環(huán)圖(Directed Acyclic Graph,DAG),分別表示變量與變量之間的關系。有向無環(huán)圖又包括測試狀態(tài)、屬性等抽象成的節(jié)點與表示節(jié)點間相依關系的有向邊,條件概率表示節(jié)點間的聯(lián)系程度[6]。圖1為BN網(wǎng)絡圖的一個實例,列表中表示了預測任意實例的概率分布。式(1)為貝葉斯定理,其為貝葉斯網(wǎng)絡建立的依據(jù)。
[PAiB=PBAiPAij=1nPAjPBAj,i=1,2,…,n] (1)
式中,[A1,A2,…,An]為A的n個不相容狀態(tài),且為必然事件;[PAi,PBAi,PAiB]分別為先驗概率、條件概率與后驗概率。
1.3 ?貝葉斯網(wǎng)絡學習與分類器
1) BN網(wǎng)絡學習
BN網(wǎng)絡的推論需基于BN網(wǎng)絡學習構造的模型。BN網(wǎng)絡學習即通過數(shù)據(jù)以構造其網(wǎng)絡,其既可定性又可定量,包括參數(shù)與結(jié)構學習兩個過程[7]。結(jié)構學習是構建模型,將數(shù)據(jù)的因果關系圖形化,參數(shù)學習則是求得網(wǎng)絡結(jié)構中節(jié)點概率分布。
2) BN網(wǎng)絡分類器
BN網(wǎng)絡建立后,采用BN公式根據(jù)被試學生作答情況進行信息的預測與能力的推斷分類。BN分類器選取已知類別的訓練樣本,通過模式識別判斷測試樣本所屬類別。BN分類器模型可分為樸素、樹增廣的樸素、增廣BN網(wǎng)的樸素BN分類器等。
認知診斷的目的是通過學生的作答情況,以分析其心理狀態(tài)與知識技能掌握情況。因此,Q矩陣被應用其中。其是測試項目與認知屬性的關聯(lián)陣,是可觀察與不可觀察間的橋梁[8]?;谑孪仍O定的屬性層級關系得到Q矩陣、鄰接矩陣,化簡得到Qr矩陣,從而基于Dr編寫題目進行測試,得到最為接近被試者屬性掌握模式以使得BN結(jié)構學習結(jié)果更加可靠。
本文的屬性結(jié)構學習采用K2算法,設變量[X1,X2,…,Xn]的完整數(shù)據(jù)為D,K2算法在被正整數(shù)與排序變量所限制的空間中找尋最優(yōu)模型,其過程為:計算排序中父節(jié)點集合為空時的節(jié)點結(jié)構分數(shù),然后將排序在前的節(jié)點組合為其父節(jié)點,形成新網(wǎng)絡結(jié)構并對其進行評分;在評分最高的網(wǎng)絡結(jié)構中找到該節(jié)點的父節(jié)點,重復進行該過程,直到找出所有節(jié)點的父節(jié)點,進而找到屬性間的層級關系。認知診斷中的變量包括學生心理狀態(tài)、知識技能、試題等的認知屬性。
在認知診斷中需要依據(jù)項目反映情況識別原理[9]。BN分類器基于數(shù)據(jù),所有屬性均參與分類,且判斷對象的類是通過其概率值。因此,其為優(yōu)良的分類方法,被廣泛地應用在醫(yī)療、故障診斷等領域。
本文中所用到的分類器為樸素、增廣樸素BN分類器,樸素BN模型節(jié)點結(jié)構為一個父節(jié)點、多個子節(jié)點,分別為類別與屬性變量,表示為C,[X1,X2,…,Xn],即表示學生理想掌握模式類別與題目。分類器原理為基于屬性變量值,計算后驗概率分布,該組類別則為得到最大的C值[10]。樸素BN分類公式為:
[PCiX=PCiPXj=1nPxjCi] ? ?(2)
增廣樸素BN模型則是在節(jié)點間增加邊,以彌補樸素BN模型不符合實際的變量間獨立的假設,其分類公式為:
[PCiX=PCiPXj=1nPxjπXj] ? (3)
分類器性能評價標準為復雜度、簡潔度與準確度,本文采用最為常用的準確度對分類器進行評價,準確度的指標有:正確率、錯誤率、精度與召回率。本文對分類器模型評估采用交叉驗證法,包含hold out,K?fold,leave?one?out三種交叉驗證方法。本文采用其中10?fold法,數(shù)據(jù)會被分成10個等級,共進行10次驗證,每次取數(shù)據(jù)集中1個數(shù)據(jù)集為測試集,9個為訓練集。通過題目的細致編制,分析與報告每個學生的掌握情況,并將其分類到特定的模式中。建立BN分類器的步驟為:
1) 標識類與屬性變量及其值;
2) 搜集含有一系列屬性變量與一個類別變量的數(shù)據(jù);
3) 進行BN網(wǎng)絡參數(shù)與結(jié)構學習,從而構造出含有概率分布表與有向無環(huán)圖的BN網(wǎng)絡分類器。
4 ?實驗驗證
4.1 ?屬性層級關系
在學生心理狀態(tài)中選擇6個知識點屬性,初步設定其層級關系,如圖2所示。通過將學生的觀察反應模式與屬性層級模式作為訓練數(shù)據(jù)集,得到BN學習結(jié)果圖如圖3所示。比較圖2與圖3可得出,兩者結(jié)構變化較小,僅在有變化處做出分析可進一步在細節(jié)處了解學生心理狀態(tài)。
4.2 ?分類器性能評價
為了驗證本文所設計的分類器性能,對樸素、增廣樸素BN分類器分別運用實證數(shù)據(jù)進行驗證,表1為其分類效果。從表中可看出,兩個分類器效果相差較小,分類正確率可以達到88%,分類效果良好,結(jié)構簡單,因而其為有效的分類工具。
本文針對傳統(tǒng)教學中對學生心理變化和廣義認知的測量與診斷只給出分數(shù)值,而無法對分數(shù)值相同的不同知識結(jié)構進行解釋的缺點,基于目前學生認知診斷的任務更多的是學生測試結(jié)果的反饋信息,將具有堅實數(shù)學理論基礎、數(shù)據(jù)挖掘理論與算法支持的貝葉斯網(wǎng)絡引入學生廣義認知診斷中。文中最后對所構造的基于BN網(wǎng)絡的學生廣義認知診斷模型進行驗證,結(jié)果表明其得到的屬性層級關系合理,分類性能良好且結(jié)構簡潔,能夠較好地應用在認知診斷中,具有廣闊的應用前景。
參考文獻
[1] 朱天宇,黃振亞,陳恩紅,等.基于認知診斷的個性化試題推薦方法[J].計算機學報,2017,40(1):176?191.
ZHU Tianyu, HUANG Zhenya, CHEN Enhong, et al. Cognitive diagnosis based personalized question recommendation [J]. Chinese journal of computers, 2017, 40(1): 176?191.
[2] 毛秀珍.基于屬性掌握概率的認知診斷模型[J].四川師范大學學報(自然科學版),2014,37(3):437?443.
MAO Xiuzhen. The attribute mastery probability cognitive diagnostic model [J]. Journal of Sichuan Normal University (Natural science), 2014, 37(3): 437?443.
[3] 王郁.基于HO?DINA模型的學生心理多級評分認知診斷模型研究[J].現(xiàn)代電子技術,2018,41(2):53?55.
WANG Yu. Research on multi?level scoring cognitive diagnosis model for students′ psychology based on HO?DINA model [J]. Modern electronics technique, 2018, 41(2): 53?55.
[4] SINGH P K, CHERUKURI A K. A note on bipolar fuzzy graph representation of concept lattice [J]. International journal of computing science & mathematics, 2014, 5(4): 381?393.
[5] 王郁.基于G?AHM模型的群體水平評估認知診斷模型研究[J].現(xiàn)代電子技術,2018,41(10):105?107.
WANG Yu. Research on group?level evaluation cognitive diagnosis model based on G?AHM model [J]. Modern electronics technique, 2018, 41(10): 105?107.
[6] GLYKAS M. Fuzzy cognitive strategic maps in business process performance measurement [J]. Expert systems with applications, 2013, 40(1): 1?14.
[7] LIU Q, WU R, CHEN E, et al. Fuzzy cognitive diagnosis for modelling examinee performance [J]. ACM transactions on intelligent systems & technology, 2018, 9(4): 1?26.
[8] 丁樹良,王文義,羅芬.認知診斷中Q矩陣和Q矩陣理論[J].江西師范大學學報(自然科學版),2012,36(5):441?445.
DING Shuliang, WANG Wenyi, LUO Fen. Q matrix and Q matrix theory in cognitive diagnosis [J]. Journal of Jiangxi Normal University (Natural sciences edition), 2012, 36(5): 441?445.
[9] NIESINK P, POULIN K, ?AJNA M. Computing transitive closure of bipolar weighted digraphs [J]. Discrete applied mathematics, 2013, 161(1): 217?243.
[10] SINGH P K, KUMAR C A. Bipolar fuzzy graph representation of concept lattice [J]. Information sciences, 2014, 288: 437?448.