王郁
摘 ?要: 為了解決群體認(rèn)知診斷評估中以個(gè)體為診斷對象所導(dǎo)致的判據(jù)不直觀且單一,難以針對性進(jìn)行補(bǔ)救教學(xué),以及評估誤差大,評估過程所需的時(shí)間、物力及人力成本較高等問題?;贕?AHM模型,研究并開發(fā)了一種群體水平評估的認(rèn)知診斷模型。該模型使用貝葉斯和相似度判別法,并結(jié)合GIRT、認(rèn)知診斷模型的特點(diǎn),具有診斷成本低、誤差小等優(yōu)點(diǎn)。經(jīng)Monte Carlo模擬仿真和實(shí)證測試后發(fā)現(xiàn),該認(rèn)知診斷模型對群體水平認(rèn)知診斷的效果良好,能夠?yàn)橄嚓P(guān)高校群體心理健康水平評估認(rèn)知診斷模型的研究與開發(fā)提供支持。
關(guān)鍵詞: G?AHM; 群體水平評估; 認(rèn)知診斷; 心理健康; Monte Carlo模擬; 貝葉斯
中圖分類號: TN911?34; TP393 ? ? ? ? ? ? ? ? 文獻(xiàn)標(biāo)識碼: A ? ? ? ? ? ? ? ? ? ?文章編號: 1004?373X(2018)10?0105?03
Abstract: ?A cognitive diagnosis model for group level evaluation is studied and developed based on G?AHM model to solve the problems such as unintuitive and single judgment basis, difficulty to conduct remedial teaching objectively, big evaluation error, and high cost of time, material and labor of the evaluation process in group cognitive diagnosis evaluation which takes the individual as the diagnosis object. The model has the advantages such as low diagnosis cost and small error by adopting the Bayesian and similarity decision methods and combining the characteristics of GIRT and cognitive diagnosis model. The results of Monte Carlo simulation and empirical tests show that this cognitive diagnosis model has a good effect on group?level cognitive diagnosis and can provide support for relative research and development of the cognition diagnosis model for college students′ mental health level evaluation.
Keywords: G?AHM; group?level evaluation; cognitive diagnosis; mental health; Monte Carlo simulation; Bayesian
認(rèn)知診斷評估旨在研究人類心理活動的加工機(jī)制和活動規(guī)律,進(jìn)而對群體(個(gè)體)的認(rèn)知現(xiàn)狀進(jìn)行診斷。經(jīng)多年研究后,其已被認(rèn)為是當(dāng)代心理測量和統(tǒng)計(jì)研究中較為重要的方向與內(nèi)容。個(gè)體認(rèn)知診斷由于可以呈現(xiàn)出個(gè)體的心理缺陷信息,適用于一對一教學(xué)模式,而并不適用于高校日常教學(xué)中的一對多的教學(xué)模式。高校教學(xué)中,應(yīng)當(dāng)選用群體認(rèn)知診斷評估,通過研究群體的心理缺陷信息來制定適宜的心理輔導(dǎo)方案和策略。然而,現(xiàn)有群體認(rèn)知診斷模型的診斷對象大多以個(gè)體為基礎(chǔ),其診斷結(jié)果由個(gè)體(群體中)對屬性的掌握比例決定,判據(jù)不直觀且單一,難以針對性得進(jìn)行補(bǔ)救教學(xué)[1?4]。此外,個(gè)體診斷給群體所帶來的誤差難以估計(jì),且評估過程所需的時(shí)間、物力及人力成本較高,易造成不必要的浪費(fèi)。因此,亟待研究并開發(fā)一種群體水平評估的認(rèn)知診斷模型,從而對群體進(jìn)行直接的認(rèn)知診斷。本文基于G?AHM模型,研究并開發(fā)了一種群體水平評估的認(rèn)知診斷模型。經(jīng)Monte Carlo模擬和實(shí)證測試后發(fā)現(xiàn),該認(rèn)知診斷模型對群體水平認(rèn)知診斷的效果良好。同時(shí),其能夠?yàn)橄嚓P(guān)高校群體心理健康水平評估認(rèn)知診斷模型的研究與開發(fā)提供支持。
本文對群體水平評估認(rèn)知診斷模型的研究,主要基于群體水平項(xiàng)目反應(yīng)理論、規(guī)則空間模型(RSM)、Q矩陣?yán)碚摚▽傩噪A層模型AHM中),最終獲得的模型本文將其命名為群體水平的屬性階層模型(G?AHM)[5?9]。
1.1 ?G?AHM方法的基本概念
2.1 ?研究目的和過程
為了探究本文G?AHM模型的性能、合理性和分類判別診斷方法的準(zhǔn)確性與穩(wěn)定性,選用模式判準(zhǔn)率(PMR)、邊際判準(zhǔn)率(MMR)及可允許出現(xiàn)一個(gè)失誤的模型判準(zhǔn)率(OPMR)。通過考察統(tǒng)計(jì)數(shù)據(jù)中出現(xiàn)的失誤概率(ep)對診斷準(zhǔn)確率進(jìn)行評價(jià)。具體而言,選擇0,0.05,0.1,0.15從小到大共4個(gè)水平來代表失誤概率,總共進(jìn)行4個(gè)實(shí)驗(yàn)。
測試共涵蓋了20個(gè)項(xiàng)目,包含了7個(gè)考核屬性。數(shù)據(jù)以Monte Carlo模擬生成,并按照如下原則對Q矩陣進(jìn)行隨機(jī)模擬:包含R矩陣;每個(gè)項(xiàng)目中被考核的屬性數(shù)量應(yīng)當(dāng)小于等于4個(gè);每個(gè)屬性[10]應(yīng)當(dāng)被考核至少3次。該測試選擇了1 000個(gè)群體,其中每個(gè)群體中的作答人數(shù)對應(yīng)各項(xiàng)目均是10人,依次按照理想作答(認(rèn)知狀態(tài)賦值,得到理想作答)、觀察作答(按照ep取值產(chǎn)生觀察作答)、自編程序和30次重復(fù)后,計(jì)算獲得各個(gè)指標(biāo)的均值。
2.2 ?結(jié)果和相關(guān)分析
認(rèn)知狀態(tài)診斷準(zhǔn)確率的相關(guān)分析,如圖1所示。即為各判別方法所對應(yīng)的,診斷準(zhǔn)確率統(tǒng)計(jì)與比較圖。從中可知,各判別方法的判準(zhǔn)率指標(biāo)值總會隨著失誤數(shù)據(jù)(ep值)的增加而下降。具體而言,BDM在觀察作答上相較于SDM判別法具有較低的診斷準(zhǔn)確率,這與文獻(xiàn)[11]中敘述的個(gè)體診斷模型的結(jié)果相吻合。此外,SDM_A判別方法的MMR和OPMR均大于90%,要遠(yuǎn)優(yōu)于SDM_B判別方法,且隨著ep的增加優(yōu)勢越發(fā)明顯;而SDM_B判別方法則在PMR上有較大的優(yōu)勢。
對于屬性掌握概率診斷的結(jié)果和相關(guān)分析,可見下表1所示,即觀察和理想數(shù)據(jù)AMP的相關(guān)返真性指標(biāo)結(jié)果(包括Corr皮爾遜相關(guān)系數(shù)以及ABS平均絕對離差)。易知,在0.05水平上,絕大多數(shù)的相關(guān)系數(shù)均較為顯著,且隨著ep值的增加而存在一定幅度的下降;此外,ABS值在各個(gè)屬性中沒有過大的變化,總體保持穩(wěn)定。
總體來看,G?AHM模型具有較好的可行性和合理性。SDM判別法及對應(yīng)的AMP結(jié)果的穩(wěn)定性與診斷精度良好,且SDM_A方法在MMR和OPMR方面均具有較大的優(yōu)勢。而SDM_B方法則在PMR方面有較高的準(zhǔn)確率。
3.1 ?研究目的和過程
為了評估高校學(xué)生心理狀況的群體診斷,并洞察心理認(rèn)知發(fā)展過程中的相關(guān)群體特征以及可能存在的認(rèn)知問題,本文使用了文獻(xiàn)[10]中的實(shí)際材料和數(shù)據(jù)對G?AHM模型進(jìn)行相關(guān)測試。該材料具有7個(gè)互相無結(jié)構(gòu)層級關(guān)系的屬性(A1~A7依次分別對應(yīng)記憶、注意、感知、知識表征、推理、創(chuàng)造力以及問題解決的運(yùn)作)和20個(gè)項(xiàng)目。測試過程中,本文在群體的認(rèn)知診斷中選用了模型中的SDM_A方法,并與文獻(xiàn)[10]的結(jié)果進(jìn)行比較。
3.2 ?結(jié)果和相關(guān)分析
從表2的頻數(shù)分布表和分析中可知,即使理想狀態(tài)下的認(rèn)知狀態(tài)應(yīng)有128種,實(shí)際各學(xué)校經(jīng)診斷后表現(xiàn)的認(rèn)知狀態(tài)只有14種。從文獻(xiàn)[10]中獲知,個(gè)體診斷結(jié)果中學(xué)生產(chǎn)生這14種認(rèn)知狀態(tài)的比例較高(達(dá)到63.5%)。由此說明,個(gè)體共性部分的認(rèn)知狀態(tài)會保留在群體認(rèn)知狀態(tài)中,并在群體認(rèn)知診斷中體現(xiàn)出來。
此外,70%的學(xué)校存在1111001,1111010,1111101和1111110的認(rèn)知狀態(tài)。具體而言,學(xué)生未能掌握A5,A6以及A7中的一到兩個(gè)屬性。對每個(gè)屬性的掌握比例進(jìn)行統(tǒng)計(jì)和分析,可以發(fā)現(xiàn)A3和A4屬性掌握較好,幾乎所有學(xué)校的學(xué)生均可掌握;而A1和A2屬性的掌握最差,僅有約10%的學(xué)生能夠較好的掌握;此外,A5~A7屬性的掌握也較差,只有略大于30%的學(xué)校學(xué)生能較好掌握。值得注意的是,學(xué)校的能力及屬性掌握概率和以個(gè)體診斷為基礎(chǔ)獲得的屬性掌握比例具有較強(qiáng)的相關(guān)性(分別為0.865和0.859)。從中可以反映該模型的效度較高,能與以個(gè)體為基礎(chǔ)的群體診斷結(jié)果相吻合。
從表3中可以獲知,A2~A4屬性具有較高的準(zhǔn)確應(yīng)用水平(A4最高)。其次是A1,A6和A7,最差的是A5屬性,其已經(jīng)出現(xiàn)了較大的兩極分化趨勢,需要特別注意。總體來看,各學(xué)校反映出的心理認(rèn)知缺陷主要表現(xiàn)在推理、創(chuàng)造力以及問題解決的運(yùn)作上,學(xué)校應(yīng)針對性地對學(xué)生進(jìn)行相關(guān)的心理輔導(dǎo)。
目前群體認(rèn)知診斷模型大多以個(gè)體為診斷對象,這會使診斷結(jié)果誤差較大,且需要耗費(fèi)大量的人力、物力。為此,本文在G?AHM模型的基礎(chǔ)上,研究并開發(fā)了一種群體水平評估的認(rèn)知診斷模型。該模型結(jié)合了GIRT、認(rèn)知診斷模型的特點(diǎn),具有診斷成本低、誤差小等優(yōu)點(diǎn)。Monte Carlo模擬和實(shí)證測試表明,該認(rèn)知診斷模型具有較好的穩(wěn)定性以及較高的邊際判準(zhǔn)率,且合理性與可行性較好,對群體水平認(rèn)知診斷具有良好的效果,能對高校學(xué)生心理健康認(rèn)知診斷提供有利的參考。
[1] TATSUOKA K K, CORTER J E, TATSUOKA C. Patterns of diagnosed mathematical content and process skills in TIMSS?R across a sample of 20 countries [J]. American educational research journal, 2004, 41(4): 901?926.
[2] BIRENBAUM M, TATSUOKA C, YAMADA T. Diagnostic assessment in TIMSS?R: between?countries and within?country comparisons of eighth graders′ mathematics performance [J]. Studies in educational evaluation, 2014, 30(2): 151?173.
[3] CARMI A Y, MOSKOVICH D. Computing with coloured tangles [J/OL]. [2015?07?21]. https://arxiv.org/pdf/1408.2685v3.pdf.
[4] HLINKA O, SLUCIAK O, HLAWATSCH F, et al. Distributed data fusion using iterative covariance intersection [C]// Proceedings of IEEE International Conference on Acoustics, Speech and Signal Processing. Florence: IEEE, 2014, 29: 1861?1865.
[5] LINDEN W J, HAMBLETON R K. Handbook of modern item response theory [M]. New York: Springer, 1997.
[6] MISLEVY R J. Item response models for grouped data [J]. Journal of educational statistics, 1983, 8(4): 271?288.
[7] TATSUOKA K K. Cognitive assessment: an introduction to the rule space method [M]. Abingdon: Routledge, 2009.
[8] LEIGHTON J P, GIERL M J, HUNKA S M. The attribute hierarchy method for cognitive assessment: a variation on tatsuoka′s rule?space approach [J]. Journal of educational measurement, 2010, 41(3): 205?237.
[9] MOSKOVICH D, CARMI A Y. Tales told by coloured tangles [J]. International journal of unconventional computing, 2015, 12(1): 1?29.
[10] 毛秀珍.基于屬性掌握概率的認(rèn)知診斷模型[J].四川師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2014,37(3):437?443.
MAO Xiuzhen. The attribute mastery probability cognitive diagnostic model [J]. Journal of Sichuan Normal University (Natural science), 2014, 37(3): 437?443.
[11] 周駿,徐淑媛,董圣鴻.以實(shí)質(zhì)心理學(xué)為基礎(chǔ)的評估:認(rèn)知診斷[J].心理學(xué)探新,2011,31(3):265?269.
ZHOU Jun, XU Shuyuan, DONG Shenghong. The assessment based on substantive psychology: cognitive diagnosis [J]. Psychological exploration, 2011, 31(3): 265?269.