張 瀟 沙如雪
隨著經(jīng)典測驗理論的日趨成熟和廣泛應(yīng)用,人們對測驗的功能也提出了更高的要求。2001年,美國正式通過法案(No Child Left Behind Act of 2001,簡稱為NCLB),規(guī)定美國所有實施的測驗應(yīng)該給家長、老師及學(xué)生提供詳細診斷信息,這個法案對認知診斷的研究起了巨大的推動作用[1]。傳統(tǒng)的心理和教育測驗僅以測驗總分或單一的能力值作為評價指標,顯得過于籠統(tǒng)和概括,現(xiàn)在人們不僅要求測驗?zāi)茉诳偟哪芰用孢M行評價,更希望能深入到內(nèi)部的認知加工的層面,為此心理學(xué)家們以認知心理學(xué)和心理測量學(xué)為理論基礎(chǔ),開發(fā)出了具有認知診斷功能的心理計量模型(簡稱為認知診斷模型,Cognitive Diagnosis Model,CDM),挖掘被試作答過程和測驗分數(shù)背后的知識結(jié)構(gòu)、加工技能和認知過程,做出更加準確詳盡的診斷和評估,從而為采取相應(yīng)的補救教學(xué)提供依據(jù),為因材施教提供指導(dǎo)。
自認知診斷的概念提出以來,認知診斷模型的構(gòu)建、評價和應(yīng)用一直是該領(lǐng)域研究的熱點。涂冬波和漆書青(2008)曾報告認知診斷模型已有近60種[1],每種計量模型各具特點,比較成熟的有LLTM模型、規(guī)則空間模型、屬性層次模型DINA模型以及融合模型(Fusion Model)等[1,2,4]。從研究文獻來看,近十年內(nèi)有大量關(guān)于DINA模型的研究。與其他模型相比,DINA模型采用了較簡單的模型定義,僅涉及“失誤”和“猜測”兩參數(shù),形式更為靈活,是一個簡潔和易于解釋的模型。盡管這個模型很簡單,已被證明有很好的模型擬合(de la Torre and Douglas,2004),是現(xiàn)在認知診斷中的一個優(yōu)良模型,在實際中的應(yīng)用比較廣泛,體現(xiàn)了較好的發(fā)展前景。
DINA 模 型(Deterministic Inputs,Noisy“and”Gate Model)適用于對二元計分項目測驗進行認知診斷,該模式的創(chuàng)建和流行始于Junker和Sijtsma(2001)的研究[4],目前主要有de la Torre與Douglas(2004)等在進行比較前沿的研究[3,8,10,11,13,15]。
大部分CDM模型的實現(xiàn)都需要構(gòu)建一個Q矩陣(K.Tatsuoka,1985),即一個由0和1組成的J乘K的矩陣,矩陣中的k元素表示正確回答試題j所必須的屬性。這里所說的屬性,可以指一種技能、一個知識點或者某種加工過程。Q矩就是構(gòu)建的一個認知矩陣,這個矩陣能夠明確描述回答每個試題所需要的認知過程。建立DINA模型,要首先確定測驗的認知屬性,建立認知屬性和項目之間的Q矩陣。以de la Torre(2009)中的分數(shù)減法Q矩陣為例[3],通過對小學(xué)分數(shù)減法運算的認知過程分析,得出掌握小學(xué)分數(shù)減法需要掌握以下五種認知屬性:(1)基本的分數(shù)減法,(2)化簡,(3)將整數(shù)部分與分數(shù)部分分開,(4)從整數(shù)部分借 1,(5)將整數(shù)變?yōu)榉謹?shù)。例如要正確作答題目,需要掌握1,3,4項屬性,那么在Q矩陣中這個試題所對應(yīng)的這一屬性行向量為(1,0,1,1,0)。αi={αik}表征被試屬性掌握模式,也可以稱為被試的知識狀態(tài),k=1,2,…,K,當(dāng)在第k個屬性上得分為1,即 αik=1,則說明被試掌握了認知屬性k,得分若為0,則說明被試沒有掌握屬性k。
在DINA模型中,被試的掌握模式α和Q矩陣產(chǎn)生了一個潛在的作答向量(a latent response rector)ηij={ ηij},ηij是{αik}和 {qik}的函數(shù),這個公式中,若被試i掌握了項目j考核的所有屬性,則ηij=1;若被試i至少有一個項目j考核的屬性未掌握,則ηij=0。如果排除失誤和隨機因素,對某個試題的正確作答概率只有0或1兩種可能,被試的反應(yīng)也僅取決于α和這個試題Q矩陣的交互作用。然而,在潛在的作答過程中肯定有猜測等成分存在,所以這個潛在作答向量僅僅代表了一種理想的反應(yīng)模式?;烊脒@個過程中的“noise”就是指“失誤”和“猜測”這兩個參數(shù),也就是說,掌握了某個試題所要求的全部屬性的被試可能因為失誤將試題答錯,而那些缺少至少一項某個試題所要求的屬性的被試卻有可能通過猜測正確回答了這個試題。
在DINA模型中,試題j的失誤和猜測參數(shù)用分別sj和gj來定義。下面公式(1)中的Yij指被試在試題i上的反應(yīng),回答正確,則其值為1,反之值為0.
因此掌握模式為αi的被試i正確回答試題j的概率可用下面的公式計算:
在項目反應(yīng)理論局部獨立的假設(shè)下,DINA模型的似然函數(shù)為:
de la Torre&Douglas(2004)還指出[3],這里所說的猜測并不是指完全隨機作答,而是包含了沒有反映在Q矩陣中的其他解題策略。例如,如果一個試題可以用不同的認知屬性來解決,這些屬性未被包含在Q矩陣中,那么具備這些屬性的被試就能利用不同的策略系統(tǒng)地去解決問題,而并非是通過猜測答對。
在認知診斷中,α作為一種知識狀態(tài),它的每一個屬性元素是對某種特定的規(guī)則或信息的掌握指標。 De la Torre&Douglas(2004)[5]認為一個能評估這些屬性掌握情況的模型應(yīng)該被假定這些屬性與一種或幾種更高層的一般智力或一般能力相聯(lián)系,那些具備了高層能力(θ)的被試更有可能獲得了測試項目要求的認知屬性。de la Torre與Douglus(2004)把包含了θ的DINA模式就稱為higher-order DINA模式(HO-DINA)。在傳統(tǒng)DINA模型基礎(chǔ)之上,假設(shè)在給定θ的前提下認知屬性αi條件獨立,則關(guān)系式可用下列式子(4)(5)表示
由公式可以看出,這個模型是一個包含潛在協(xié)變量θ的邏輯回歸模型。它與試題反應(yīng)理論(IRT)中的單參數(shù)對數(shù)模型相似,類似于一個以認知屬性為項目的更高層次上的項目反應(yīng)模型,λ1是指屬性k的定位參數(shù),它類似于屬性掌握的難度參數(shù),λ0k指斜率。高階模型建立在傳統(tǒng)模型基礎(chǔ)上,增加了較“屬性”更高階的“能力”參數(shù),降低了技能組合的數(shù)量,不僅能描述被試的總體水平(θ),還能描述被試對屬性的掌握情況以及被試掌握屬性與能力的關(guān)系,從而能夠提供更豐富的信息[5]。
不管是以上提到的DINA模型,還是改進的HO-DINA模型,都是一種單策略模型,每一個項目都對應(yīng)唯一的認知屬性向量。而實際上,可以用多種策略對一個項目進行解答,因此,對于一個項目可以構(gòu)建多個認知屬性向量。多策略DINA模型[6]在單策略的DINA模型上直接進行了擴展,假設(shè)每個項目包含了能夠充分解決問題的M種不同的策略,每種策略是K屬性向量集合中的一個子集,可以用M個不同的矩陣表示,Q1,Q2,…,QM。對于被試i和項目j,重新定義,M,Qjkm表示QM的第j行第k列,nijm表示被試i能否用第m種策略解答項目j。檢測是否至少有一種策略滿足條件,一旦ηij確定之后,就可以用DINA模型中的公式進行計算了。這個模型的定義很簡單,它假設(shè)s和g的值對于任何策略都是一樣的,因此應(yīng)用此模型的前提條件必須要求不同策略的難度要相等,這顯然是有局限性的,因此如何能夠允許s和g參數(shù)在不同的策略條件下變化對于多策略模型是否具有適用性至關(guān)重要,對于這個問題還需要更進一步研究。
現(xiàn)在已開發(fā)的認知診斷的60多種模型基本上都是適用于0-1評分數(shù)據(jù),目前應(yīng)用廣泛的DINA模型模型也僅適用于0-1評分數(shù)據(jù),而實際情境中,通過一般教育與心理測驗所得的數(shù)據(jù)基本都是多級評分數(shù)據(jù)。涂冬波,蔡艷等(2010)對DINA模型進行拓廣,開發(fā)出同時適合0-1評分與多級評分數(shù)據(jù)的DINA模型(簡記為P-DINA模型)[7],并采用MCMC算法實現(xiàn)其參數(shù)估計,同時對其性能進行研究,為認知診斷在實際中的應(yīng)用提供一種新模型。
P-DINA模型DINA模型基于Samejima(1997)的等級反應(yīng)模型中的累積類別反應(yīng)函數(shù)思想,它的概率反應(yīng)函數(shù)為:
根據(jù)項目反應(yīng)理論局部獨立性假設(shè),可得出P-DINA模型的似然函數(shù)如下:
P-DINA模型下,估計的參數(shù)更多,除了0-1評分模型下要估計的α參數(shù)外,還要估計mf個失誤參數(shù)s和mf個猜測參數(shù)g,涂冬波等人采用當(dāng)前國際比較先進的MCMC算法來實現(xiàn)了此模型參數(shù)估計。經(jīng)蒙特卡洛模擬實驗研究表明,P-DINA模型具有良好的性能,參數(shù)估計的精度較高,若想保證屬性模式判準率在80%以上,建議診斷的屬性個數(shù)不宜超過7個。
DINA模式的一般化模型(Generalized DINA Model,G-DINA)由 de la Torre(2011)提出[8],比起DINA模型,G-DINA放松了對條件的限制,它的飽和模型與基于其他連接函數(shù)的認知診斷的一般模型是等值的。在合適的限制條件下,其他一些常用的認知診斷模型都可以看成一般模型的特例??梢哉f,G-DINA模型為CDM提供了一個一般性的框架模型,用方程式表示:
δj0為試題j的截距,表示沒有掌握屬性而正確回答的基線概率。δjk為對ak的主要影響,表示僅掌握了一種屬性引起正確回答概率的變化。δjkk'表示αk和αk交互影響。交互影響。當(dāng)均為0時,就是DINA模型了,所以DINA模型是G-DINA模型的特例。de la Torre對G-DINA的估計是采用EM算法,程序碼是使用高級編程語言O(shè)x(Doornik,2003)編寫的,de la Torre指出,如果參數(shù)估計程序編碼能夠由更專業(yè)的程序人員用低級的語言編寫出來,這將使得G-DINA模型在大規(guī)模數(shù)據(jù)處理上更加適用。
DINA模型是一個隨機連接模型(stochastic conjunctive model),之所以“隨機”,因為被試答對項目并非由被試掌握的屬性唯一決定,還加入了sj和gj,也就是說掌握了所有屬性不能保證一定答對,而未掌握所考屬性也不一定答錯。這里的“連接”意味著所有的屬性具非補償性,被試某一屬性沒有掌握是不能通過其它屬性來補償,只有一個屬性沒有掌握和所有屬性都沒有掌握是一樣的。DINA模型與研究得較廣泛的空間規(guī)則模型一樣,都要建立Q矩陣,不同的是,DINA模型不需要考慮層次間的屬性關(guān)系,不是通過分類或判別方法求得被試的掌握模式,而是通過MCMC方法把它作為待估參數(shù)進行估計,這些參數(shù)包括被試的掌握模式以及sj,gj。關(guān)于參數(shù)sj和gj有兩個值得注意的地方:首先模型應(yīng)滿足1-sj>gj;另外在DINA模型參數(shù)估計中,要求sj和gj值不能過大,一般是不大于0.4為界限,如果超過0.4,可能說明Q矩陣界定的不好,或者是被試使用的其他解題策略,模型不擬合資料等[9]。
DINA模型在國外已經(jīng)進行了相對廣泛的理論研究,國內(nèi)對這個模型的研究雖然不多,但是也有學(xué)者專門對此進行過探討。一方面,很多研究著重于對該模型的改進方面,de la Torre與Douglas(2004)認為受試者的能力是多元的,應(yīng)與試題難度、區(qū)分度相對應(yīng),并以此為基礎(chǔ)提出高階的DINA模型(Higher-order DINA模型),采用了MCMC方法對其模型進行了參數(shù)估計[5];de la Torre(2009)還針對選擇題型,提出multiple-choice DINA的模式,試圖從選項中獲得更多的診斷訊息,達到更精準的估計[10]。江西師范大學(xué)的涂冬波(2010)對簡單的二級評分模型進行改進,提出了DINA的多級評分模型[7]。de la Torre(2011)又在傳統(tǒng)的DINA模型基礎(chǔ)上放松對條件的限制,提出DINA的一般化模型(G-DINA模型)[8];另一方面,很多學(xué)者對于模型的性能也進行了大量研究,de la Torre與Douglas(2004)探討了DINA與LLM模型的比較,得出用MCMC法對DINA的參數(shù)估計精準度較高的結(jié)論;Zhang W.M.(2006)研究了DINA模型下的DIF檢測方法[9];Rupp&Templin(2008)研究了Q 矩陣的不完整性對DINA模型診斷結(jié)果的影響[11];Rupp&Templin(2007)和Cheng(2008)的研究表明該模型具有較高的判準率;另外,在模型的算法方面,de la Torre(2009)詳述了DINA參數(shù)估計的方法,如joint maximum likelihood estimation及marginalized maximum likelihood estimation等,降低MCMC參數(shù)估計的時間[3]。由此可見,有關(guān)DINA模型的理論研究已經(jīng)比較成熟,針對其缺陷改進的模型也均通過模擬和實證數(shù)據(jù)資料等證明了其診斷的可靠性以及參數(shù)估計方法的精確度,這都為DINA模型的進一步實際應(yīng)用打下了基礎(chǔ)。
近年來,在DINA模型的應(yīng)用研究方面也取得了一定的進展。在測驗編制和計算機自適應(yīng)測驗方面,Henson&Douglas(2005)提出了基于K-L信息量(Kullback-Leibler Information)在DINA模型下挑選認知診斷測驗的項目或組卷研究;Finkelman&Roussos(2009)提出利用遺傳算法進行自動編制認知診斷模型測驗;Cheng Y.&Chang H.(2009)在DINA模型下進行了認知診斷的計算機自適應(yīng)測驗(CD-CAT)研究[13]。其他方面,Junker&Sijtsma(2001)用該模型來研究傳遞推理,Templin&Henson(2006)將這個模型用于病理性賭博的研究[2]。此外,此模型在研究兒童心理發(fā)展和學(xué)業(yè)能力測驗診斷中應(yīng)用較多。國內(nèi)涂冬波(2009)用這個模型對項目自動生成的小學(xué)兒童數(shù)學(xué)問題解決認知診斷CAT編制進行了研究[9]。吳芳菲(2009)用該模型對六年紀學(xué)生數(shù)學(xué)評價能力評價的研究,陳艷梅(2009)用該模型對初中三年級學(xué)生閱讀能力進行評價研究等。在教育測驗中,應(yīng)用DINA模型進行認知診斷,不但可以向家長、老師和學(xué)生等各方面提供學(xué)生的掌握模式,還能根據(jù)對試題猜對或失誤的概率指導(dǎo)測驗的編制,提高試卷質(zhì)量,從而更科學(xué)準確地對學(xué)生的學(xué)業(yè)能力進行評估。
認知診斷作為新一代測驗理論,現(xiàn)在已被認為是心理測量理論的核心,在過去的幾年中,吸引了大批認知心理學(xué)家、統(tǒng)計測量學(xué)家及各專門學(xué)科專家的關(guān)注,已經(jīng)成為測量研究中的熱門領(lǐng)域,包括不斷提出不同的模型以及用EM和MCMC方法對模型參數(shù)進行估計的大量研究,并在教育實踐中進行了驗證和初步應(yīng)用。在當(dāng)今教育改革的形勢下,認知診斷能夠為教學(xué)評價、學(xué)習(xí)障礙診斷等提供更加具體更加準確的信息,使教學(xué)目標和相應(yīng)補救措施的采取更具針對性,因而已經(jīng)被成功應(yīng)用到了一些大規(guī)模的教育測驗中。比起其他CMD模型,DINA模型不需要考慮層次間的屬性關(guān)系,參數(shù)易于識別,也易于解釋,是一種優(yōu)良的認知診斷模型,逐漸得到了越來越多的關(guān)注和研究。但是該模型定義過于簡單,對心理過程的描述不夠充分,這在一定程度上限制了它在實際測驗中的應(yīng)用,近年來研究者們在傳統(tǒng)DINA基礎(chǔ)上模型上又進行了改進和擴展,出現(xiàn)了它的高階模型,多級評分模型和一般模型等,尤其在與計算機自適應(yīng)測驗相結(jié)合方面取得了進步,相信隨著理論探索的不斷加深,其應(yīng)用前景也將更加廣闊,也必將在當(dāng)前的教育和心理測量研究中發(fā)揮越來越重要的作用。
[1]涂冬波,蔡艷,戴海崎,漆書青.現(xiàn)代測量理論下四大認知診斷模型述評[J].心理學(xué)探新,2008,28(2):64-68.
[2]甘媛源,余嘉元.心理測量理論的新進展:潛在分類模型[J].寧波大學(xué)學(xué)報,2008,30(6):61-64.
[3]de la Torre,J.DINA model and parameter estimation:A didactic[J].Journal of Educational and Behavioral Statistics,2009,34:115-130.
[4]Junker B W,&Sijtsma K.Cognitive assessment models with few assumptions,and connectionswith nonparametric itemresponsetheory[J].Applied Psychological Measurement,2001,25(3):258-272.
[5]de la Torre,J.,&Douglas,J.Higher-order latent trait models for cognitivediagnosis[J].Psychometrika.2004,69(3):333-339.
[6]de la Torre,J.,&Douglas,J.Model evaluation and multiple strategies in cognitive diagnosis:An analysis of fraction subtraction data[J].Psychometrika,2008,73(4):595-601.
[7]涂冬波,蔡艷,戴海琦,丁樹良.一種多級評分的認知診斷模型:P-DINA 模型的開發(fā)[J].心理學(xué)報,2010,42(10):1011-1013.
[8]de la Torre,J.The generalized DINA model framework[J].Psychometrika,2011,76(2):179-183.
[9]涂冬波.項目自動生成的小學(xué)兒童數(shù)學(xué)問題解決認知診斷CAT編制[D].江西師范大學(xué)博士學(xué)位論文,2009:37-125.
[10]de la Torre,J.A cognitive diagnosis model for cognitively-based multiple-choice options[J].Applied Psychological Measurement,2009,33:163-183.
[11]Rupp,A.,&Templin,J.The effects of q-matrix misspecification on parameter Estimates and classification accuracy in the DINA model[J].Educational and Psychological Measurement,2008,68(1):78-96.
[12]de la Torre,J.,&Lee.A note on the invariance of DINA model parameters.Journal of Measurements,2010,47:115-127.
[13]Cheng,Y.,&Chang,H.When cognitivediagnosis meetscomputerized adaptive testing:CD-CAT[J].Psychometrika,2009,74(4):619-632.