勾建偉, 夏業(yè)茂
(南京林業(yè)大學(xué)理學(xué)院, 江蘇 南京 210037)
分類數(shù)據(jù)在社會(huì)調(diào)查中普遍存在.在客服滿意度調(diào)查中, 消費(fèi)者對(duì)服務(wù)產(chǎn)品的滿意度通常存在如下評(píng)價(jià):“很滿意”,“滿意”, “一般”,“不滿意”,“非常不滿意”; 人口普查問(wèn)卷通常設(shè)計(jì)為諸如性別、民族、受教育程度、職業(yè)等若干選項(xiàng)用以了解人口和住戶的基本情況; 在產(chǎn)品質(zhì)量檢測(cè)時(shí)對(duì)產(chǎn)品質(zhì)量等級(jí)的認(rèn)定等, 這都形成分類數(shù)據(jù).對(duì)分類數(shù)據(jù)的統(tǒng)計(jì)分析, 一般著眼于研究外部因素如何影響或作用于“類”的機(jī)制, 這通常存在兩種辦法: 一是基于類的觀測(cè)頻率并結(jié)合各種logit模型來(lái)進(jìn)行統(tǒng)計(jì)推斷.這方面存在大量的文獻(xiàn)和著作, 經(jīng)典的《Categorical data analysis》[1]一書(shū)對(duì)此做了詳細(xì)的分析和回顧.但這種方法存在一些問(wèn)題, 譬如當(dāng)分類變量個(gè)數(shù)較多時(shí), 類別總數(shù)會(huì)急劇增加, 這必將大大提高計(jì)算的強(qiáng)度和分析的復(fù)雜度, 另外, 該方法在刻畫(huà)多重分類變量的關(guān)聯(lián)性時(shí)不盡如意, 因?yàn)樗枰柚谄嚓P(guān)這一數(shù)學(xué)工具, 這無(wú)疑割裂了多重變量的整體關(guān)聯(lián)性.另一種是引入潛變量方法.該方法假定每個(gè)分類變量都聯(lián)系一個(gè)連續(xù)潛變量或向量, 類的界定是通過(guò)潛變量或向量的實(shí)現(xiàn)值落在不同區(qū)域或窗口來(lái)完成的.例如產(chǎn)品的使用期達(dá)到一定期限時(shí)可以認(rèn)為是次品, 考試成績(jī)達(dá)到一定分?jǐn)?shù)時(shí)視為合格等.相比于logit模型而言, 潛變量方法不僅在統(tǒng)計(jì)建模和計(jì)算方面具有較大優(yōu)勢(shì), 而且在刻畫(huà)不同分類變量的關(guān)聯(lián)性方面也十分自然: 連續(xù)變量之間的相關(guān)性在一定程度上就能夠體現(xiàn)出分類變量之間的關(guān)聯(lián)性.[2-7]
基于潛變量方法的分類數(shù)據(jù)分析也存在一些問(wèn)題, 例如過(guò)于依賴潛變量的分布指定等.但最突出的問(wèn)題是模型或似然對(duì)參數(shù)存在不可識(shí)別性, 也稱為模型的不確定性.若一個(gè)參數(shù)統(tǒng)計(jì)模型p(Y,θ)有p(Y,θ1) =p(Y,θ2)蘊(yùn)含θ1=θ2.則稱p(Y,θ)基于Y對(duì)未知參數(shù)θ是可識(shí)別的.[8]一個(gè)對(duì)參數(shù)不能識(shí)別的模型將對(duì)估計(jì)構(gòu)成極大威脅, 它會(huì)產(chǎn)生不相合估計(jì).帶有分類變量的潛變量模型的不確定性歸根結(jié)底是由潛變量的不可觀測(cè)性所造成的.為了解決分類數(shù)據(jù)潛變量模型的識(shí)別性問(wèn)題, 很多作者對(duì)此作了研究, 但主要工作是建立在單個(gè)分類變量的基:上并局限于回歸分析領(lǐng)域[9-13].這對(duì)于帶有多重分類變量的潛變量模型的可識(shí)別性顯然是不夠的.近年來(lái), 部分學(xué)者在多元分析領(lǐng)域內(nèi)對(duì)多重二分、次序變量展開(kāi)統(tǒng)計(jì)建模, 并針對(duì)模型的可識(shí)別性提出了一些具體方法和建議[14-16], 但這些工作大多是面向具體模型且沒(méi)有從理論上給予嚴(yán)格保證, 很多方法只是保證模型是局部可識(shí)別的.
本文主要是對(duì)帶有多重二分、次序或名義變量的潛變量模型的可識(shí)別性在因子分析框架內(nèi)給出了若干使用方便的充分條件.這些條件本質(zhì)上是將因子分析模型的可識(shí)別性和分類數(shù)據(jù)的潛變量模型的可識(shí)別性結(jié)合起來(lái), 但并不僅僅是簡(jiǎn)單組合, 而是力求從模型結(jié)構(gòu)本身去提出條件.這些條件為模型的統(tǒng)計(jì)計(jì)算提供了一定的便利.
設(shè)對(duì)i= 1,··· ,n,yi= (yi1,··· ,yip)T為p維獨(dú)立的二分觀測(cè)向量, 其中yij為取值0,1的隨機(jī)變量,j=1,··· ,p,p ≥2,“T”表示轉(zhuǎn)置.在潛變量模型框架內(nèi), 通常假定存在一個(gè)p維連續(xù)潛變量使得
其中,
μ為p×1維均值向量,Σ為p×p階協(xié)方差矩陣.對(duì)應(yīng)的似然函數(shù)為
其中,φ(·|μ,Σ)為Np(μ,Σ)的概率密度函數(shù),
為由yi確定的積分區(qū)域.
模型(2.1)-(2.2)通常稱為多元Probit模型.然而似然(2.3)卻對(duì)μ,Σ具有不可識(shí)別性.事實(shí)上,
定理2.1若存在{μ(1),Σ(1)},{μ(2),Σ(2)}使得
當(dāng)且僅當(dāng)存在一個(gè)正定對(duì)角矩陣D=diag{d1,··· ,dp}(dj >0), 使得
證必要性: 首先注意到樣本量的增加并不能改變模型的確定性, 因此考慮n=1, 略去下標(biāo)i.令由
可知, 若(2.4)成立, 則必然有
其次, 注意到:
其中,R為Σ的相關(guān)系數(shù)矩陣.上述方程組共計(jì)有2p個(gè)方程, 由(2.7)及上述方程組蘊(yùn)含R(1)=R(2), 從而Σ(2)=DΣ(1)D.
充分性: 設(shè)(2.5)成立.因?yàn)?/p>
證畢.
為了更仔細(xì)地說(shuō)明方程組(2.8)蘊(yùn)含R的唯一性, 我們以p=2為例.不難計(jì)算,
其中,φ(·)為一元標(biāo)準(zhǔn)正態(tài)概率密度函數(shù), 積分區(qū)域
定理2.1表明似然函數(shù)Lb并不能由μ,Σ唯一確定, 而是在參數(shù)的尺度變換(等價(jià)類)意義下唯一確定.在實(shí)際應(yīng)用中, 為了破壞這種同變性, 通常采用參數(shù)約束的辦法, 這導(dǎo)致如下的結(jié)果.
推論2.1若限制μ為分量不為0的已知向量μ0或Σ為相關(guān)系數(shù)矩陣, 則似然(2.3)關(guān)于未知參數(shù)是可識(shí)別的.
證由假設(shè)可知, (2.5)中D=Ip.證畢.
在因子分析領(lǐng)域, 通常將上述的延伸至帶有因子變量的因子模型[17]:
其中,Λ為p×m階因子負(fù)荷矩陣,ωi ~Nm(0,Φ)為m×1維因子變量,δi ~Np(0,Ψδ)為p×1維誤差向量, 且ωi與δi兩者獨(dú)立.記θ={μ,Λ,Φ,Ψδ}, 則(μ,Σ), 其中,
此時(shí)似然函數(shù)依然為(2.3)形式, 只不過(guò)需要將其中的Σ換成Σ(θ).很明顯, 該似然函數(shù)關(guān)于θ不可識(shí)別, 其原因有兩種: 1)因子模型本身不確定; 事實(shí)上注意到(2.11)中的邊際分布在因子可逆變換下會(huì)保持不變.2) Probit模型(2.1)不確定性; 這由定理2.1給出.為了保持最終的似然關(guān)于未知參數(shù)是可識(shí)別的, 一種有效的方法是在保證因子模型確定的基:上利用定理2.1通過(guò)約束參數(shù)來(lái)保證最終似然對(duì)參數(shù)具有識(shí)別性.
對(duì)因子分析模型的模型確定性研究已經(jīng)有相當(dāng)長(zhǎng)的歷史, Bollen[17]等就對(duì)此就作出過(guò)深刻的研究.但到目前為止, 仍無(wú)一個(gè)使用方便的充分必要條件來(lái)確定該模型.大多數(shù)的做法都是面向具體模型通過(guò)約束參數(shù)來(lái)達(dá)到模型的確定性.本文引用Bollen[17]的兩指標(biāo)準(zhǔn)則.該結(jié)果雖然是一個(gè)充分條件, 但它具有較大的普適性: 對(duì)一般的因子模型(無(wú)論正交或傾斜因子)均適合, 而且因?yàn)樗鼘?duì)因子負(fù)荷矩陣和誤差協(xié)方差矩陣的元素分開(kāi)進(jìn)行約束, 這在計(jì)算和理論分析上具有較大優(yōu)勢(shì).我們引用如下:
兩指標(biāo)準(zhǔn)則[17]:
1) 每個(gè)因子都尺度化, 即對(duì)每個(gè)因子ωik, 存在λjk=1; 亦即Λ的每一列都存在一個(gè)元素1;
2)Λ的每一行都有一個(gè)非零元素;
3) 聯(lián)系每個(gè)因子的指標(biāo)個(gè)數(shù)至少為2; 即Λ的每一列至少存在兩個(gè)非零元素;
4)Ψδ為對(duì)角正定矩陣;
5)Φ正定, 且至少存在一對(duì)非0的非對(duì)角元Φjk0().
對(duì)上述條件的說(shuō)明是必要的: 條件1)是對(duì)因子進(jìn)行標(biāo)度.由于因子變量為不可觀測(cè)變量,其單位一般不明確, 限定因子系數(shù)為1是將因子變量的尺度與觀測(cè)變量的尺度等同起來(lái), 這便于解釋該因子對(duì)其它指標(biāo)變量的貢獻(xiàn); 條件2)則表明每個(gè)指標(biāo)變量都聯(lián)系一個(gè)因子, 這也是必要的, 因?yàn)橹笜?biāo)的主要作用是明示因子; 條件3)要求明示因子變量時(shí)需要多重而非單個(gè)指標(biāo),這主要是因?yàn)橐蜃颖旧砭褪莵?lái)解釋多指標(biāo)的相關(guān)性; 條件4)則要求因子變量能夠解釋指標(biāo)間的全部相關(guān)性; 條件5)要求至少存在一對(duì)因子不獨(dú)立.這個(gè)條件可以適當(dāng)放寬.如果要求“每一列非零元素的個(gè)數(shù)至少為3”時(shí), 條件5)的因子可以允許相互獨(dú)立.
下面我們考慮模型(2.1), (2.11)的可識(shí)別性問(wèn)題.根據(jù)推論2.1, 在保證因子模型確定的基:上, 只需要約束Σ(θ)為相關(guān)系數(shù)矩陣即可.但這種約束破壞了因子負(fù)荷參數(shù)與協(xié)方差參數(shù)的分離性, 將會(huì)給統(tǒng)計(jì)計(jì)算造成一定的困難.下面的結(jié)果給出了一個(gè)充分條件.該條件只要求在模型(2.11)確定的基:上約束誤差的協(xié)方差陣為單位矩陣即可, 這保持了參數(shù)的分離性, 因此在計(jì)算上較為方便.
定理2.2假定模型(2.11)中的Λ,Ψδ和Φ滿足兩指標(biāo)準(zhǔn)則, 且Ψδ=Ip, 則邊際似然(2.3)關(guān)于μ,Λ,Φ是確定的.
證由定理2.1可知, 若Lb(θ(1)) =Lb(θ(2)), 則存在正定對(duì)角矩陣D= diag{d1,··· ,dp}(dj >0), 使得
由Σ的確定性立即可知d1=···=d4=1.0.
當(dāng)然,在(2.11)假定下,似然函數(shù)的不確定性也可以通過(guò)限制均值μ=μ0來(lái)完成,其中μ0為分量不為0的已知向量, 但這需要事先明確或估計(jì)出μ0的位置, 這又要?dú)w結(jié)到Σ約束上.
若定理2.2中的Φ含有參數(shù)結(jié)構(gòu)Φ(φ) 且Φ(φ)關(guān)于φ確定時(shí), 則最終的似然函數(shù)也關(guān)于φ確定.
推論2.2假定模型(2.11)中的Λ,Ψδ和Φ滿足兩指標(biāo)準(zhǔn)則, 且Φ=Φ(φ).若限定Ψδ=Ip且Φ(φ)關(guān)于φ確定, 則邊際似然(2.3)關(guān)于μ,Λ和φ確定.
推論2.2一個(gè)直接應(yīng)用就是結(jié)構(gòu)方程模型的確定.在潛變量分析領(lǐng)域, 結(jié)構(gòu)方程模型[17]是一種用來(lái)描述多重因子之間內(nèi)部相互關(guān)系和因果關(guān)聯(lián)的統(tǒng)計(jì)方法.該模型將因子變量ωi分為m1個(gè)內(nèi)在因子ηi和m2= (m-m1) 個(gè)外在因子ξi.內(nèi)在因子之間的關(guān)聯(lián)性以及外在因子對(duì)內(nèi)在因子的影響方式是通過(guò)如下結(jié)構(gòu)方程來(lái)體現(xiàn):
其中, 誤差變量ζi與外在因子ξi以及模型(2.11)中的誤差變量δi相互獨(dú)立,B為主對(duì)角元素為0的m1×m1階矩陣,Γ為m1×m2(m2=m-m1)階回歸系數(shù)矩陣,Ψζ為m1×m1階對(duì)角正定矩陣,Ξ >0.
推論2.3假定模型(2.11)中的ωi={ηi,ξi}滿足(2.15)-(2.16).若Λ滿足二指標(biāo)準(zhǔn)則,Ψδ=Ip,B為下三角均陣, 則似然(2.3)完全由參數(shù)μ,Λ,B,Γ,Ψζ和Ξ確定.
證很顯然, 在(2.15)-(2.16)假定下,ωi ~N(0,Φ), 其中,
B0=Im1-B.不難驗(yàn)證, 若B為下三角陣(注意其對(duì)角線元素為0), 則Φ關(guān)于B,Γ,Ψζ和Ξ確定.由推論2.1, 結(jié)論立得.證畢.
關(guān)于Φ確定性的一個(gè)具體例子為
此時(shí),
顯然,Φ關(guān)于ξ是確定的; 其次注意到
由此可知Φ對(duì)Γ11,ψζ1,β21,Γ21,ψζ2確定, 從而對(duì)B,Γ,Ψζ,Ξ確定.證畢.
注意, 當(dāng)推論2.3中B=0時(shí)結(jié)論自然成立, 這是無(wú)遞推結(jié)構(gòu)方程模型.
將多重二分變量推廣為多重次序變量, 則得到帶有多元次序變量的潛變量模型.為簡(jiǎn)單起見(jiàn), 設(shè)yi= (yi1,··· ,yip)為p維觀測(cè)向量, 其中yij均為取值于{0,1,··· ,K}(K ≥1)的次序變量.K=1即為二分變量.需要指出是, 式(2.1)式中0為的門(mén)限值并非必要.事實(shí)上, 0可以用本節(jié)的αj替代.為方便起見(jiàn), 本節(jié)假定K ≥2.在潛變量模型框架內(nèi), 假定yi聯(lián)系一個(gè)p維的連續(xù)潛變量(μ,Σ), 使得
其中,-∞=αj0<αj1<···<αjK <αjK+1=+∞為用來(lái)界定類的門(mén)限值.記
則似然函數(shù)為
其中,
是由yi確定的積分區(qū)域.
與二分變量類似, 似然(3.3)對(duì)α,μ,Σ存在不可識(shí)別性.
定理3.1若存在{α(1),μ(1),Σ(1)},{α(2),μ(2),Σ(2)}滿足
當(dāng)且僅當(dāng)存在一個(gè)對(duì)角正定矩陣D=diag{d1,··· ,dp}(dj >0), 使得
其中α?為α的第?列.
證類似地, 我們考慮n=1.令首先考慮必要性.注意到y(tǒng)i的邊際分布為
其中,Φ(·)為標(biāo)準(zhǔn)正態(tài)分布函數(shù).由(3.4)可知, 對(duì)?=1,··· ,K,j=1,··· ,p,
其次, 注意到
其中R為Σ的相關(guān)系數(shù)矩陣.(3.4),(3.7)及上式蘊(yùn)含R(1)=R(2).
令T(j)=則T(2)=DT(1).又因?yàn)?/p>
從而Σ(2)=DΣ(1)DT, 因此式(3.5)成立.
反之, 若(3.5)成立, 則在(3.4)的左邊積分中令(1)=D-1((2))立得右式.證畢.
定理3.1表明似然函數(shù)Lp是在參數(shù)的仿射變換(等價(jià)類)意義下唯一確定.同樣地, 在實(shí)際應(yīng)用中, 為了破壞這種同變性, 通常采用約束參數(shù)的辦法, 這導(dǎo)致如下結(jié)果.
定理3.2當(dāng)(μ,Σ)時(shí), 若下列條件之一成立:
1) 若對(duì)j=1,··· ,p, 約束αj1,αjK為固定值;
2) 若對(duì)某個(gè)?, 約束α?為固定值, 且Σ為相關(guān)系數(shù)矩陣;
3) 若約束μ為固定值,Σ為相關(guān)系數(shù)矩陣;
4) 若對(duì)某個(gè)?, 約束α?為固定值, 且μ為固定值.
則邊際似然(3.3)關(guān)于自由未知參數(shù)是可識(shí)別的.
證由定理3.1可知,若(3.4)成立,則存在一個(gè)對(duì)角正定矩陣D=diag{d1,··· ,dp}(dj >0),使得
1) 由假設(shè)可知
由上述定理可知, 為了保證似然Lp對(duì)未知參數(shù)的可識(shí)別性, 至少需要在門(mén)限值、均值、協(xié)方差矩陣三組參數(shù)中約束兩組參數(shù).在回歸分析領(lǐng)域中, 文獻(xiàn)上常采用定理3.2中的約束1)或2)[14-15]; 這就需要事先知道門(mén)限的具體位置.一個(gè)可行的做法是: 令αj1=Φ-1αjK=Φ-1(, 其中fj1,fjK分別為yij <1 和yij <K的頻率,Φ-1(·)為標(biāo)準(zhǔn)正態(tài)分布函數(shù)的反函數(shù).
類似地, 我們將模型(3.1)中的推廣為因子模型(2.11), 此時(shí)Σ=ΛΦΛT+Φ.與前面二分變量類似, 此時(shí)邊際似然存在兩方面不確定性.我們依然假定Λ,Ψδ,Φ滿足兩指標(biāo)準(zhǔn)則.
推論3.1假定模型(2.11)中的Λ,Ψδ和Φ滿足兩指標(biāo)準(zhǔn)則, 且下列條件之一成立:
1) 若對(duì)j=1,··· ,p, 約束αj1,αjK為固定值;
2) 若對(duì)某個(gè)?, 約束α?為固定值, 且Ψδ=Ip;
3) 若約束μ為固定值, 且Ψδ=Ip;
4) 若對(duì)某個(gè)?, 約束α?為固定值, 且μ為固定值.則邊際似然(3.3)關(guān)于α,μ,Λ,Ψδ,Φ是可識(shí)別的.
證首先, 兩指標(biāo)準(zhǔn)則保證因子模型(2.11)是可識(shí)別的.
1) 由定理3.2的1), 立得結(jié)論;
2) 由定理3.1可知,Ψδ=Ip蘊(yùn)含(3.5)中的D=Ip.再由定理3.2中2)可知似然函數(shù)關(guān)于均值參數(shù)和門(mén)限值是可識(shí)別的;
3) 同2);
4) 由定理3.2的4), 結(jié)論成立.
證畢.
類似地, 若ωi滿足結(jié)構(gòu)方程(2.15)-(2.16), 則有下列結(jié)果:
推論3.2假定模型(2.11), (2.15)中的Λ,Ψδ和Φ滿足兩指標(biāo)準(zhǔn)則,B為下三角陣, 且下列條件之一:
1) 若對(duì)j=1,··· ,p, 約束αj1,αjK為固定值;
2) 若對(duì)某個(gè)?, 約束α?為固定值, 且Ψδ=Ip;
3) 若約束μ為固定值, 且Ψδ=Ip;
4) 若對(duì)某個(gè)?, 約束α?為固定值, 且μ為固定值.
則邊際似然(3.3)關(guān)于α,μ,Λ,Ψδ,B,Γ,Ψζ,Φ是可識(shí)別的.
證結(jié)合推論2.3和定理3.2, 不難得出上述結(jié)論.證畢.
名義變量又稱為無(wú)次序變量.與次序變量類似, 名義變量取值依然表現(xiàn)為多岐性, 但此時(shí)yij ∈{0,1,··· ,K}的取值僅僅代表類別, 而無(wú)次序含義.譬如, 在若干種商品組成的選項(xiàng)中, 很難界定一種商品比另一種商品優(yōu)或劣, 這時(shí)就表現(xiàn)出名義屬性來(lái).此時(shí)用潛變量模型(3.1)來(lái)界定這樣的類并不恰當(dāng), 但可以借助于該思想, 對(duì)每個(gè)yij, 引入一個(gè)K維連續(xù)潛在向量使得
其中,
μ為pK×1維截距向量,Σ >0為pK×pK階正定協(xié)方差矩陣.在某些情形下, 為了降低參數(shù)維數(shù), 可以取Σ=U ?V, 其中U,V分別為p×p和K ×K階正定矩陣, 這導(dǎo)致服從矩陣正態(tài)分布.
此時(shí)似然(4.3)完全由參數(shù){μjk/σjk,σjk/σj?,Rjk}或等價(jià)地由參數(shù){μjk/σj1,σjk/σj1,Rjk}確定.因此, (4.4)蘊(yùn)含著
與多元次序變量潛變量模型識(shí)別性類似, 可以考慮限制參數(shù)來(lái)保證似然對(duì)參數(shù)的可識(shí)別性.
推論4.2對(duì)于模型(4.1)和(4.2), 記
若限制第?(= 1,··· ,K)列μ(?)元素為不為0的固定值或?qū)= 1,··· ,p, 限制Σjj的某個(gè)對(duì)角元素為1, 或trΣjj=dj0>0為常數(shù), 則似然(4.3)關(guān)于未知自由參數(shù)是確定的.
我們首先考慮模型(4.1), (4.11)似然的可識(shí)別性.
定理4.2考慮因子模型(4.11).若Λj,Ψδj,Φ滿足兩指標(biāo)準(zhǔn)則, 且對(duì)j=1,··· ,p,ψδj,11=1, 則似然(4.3)對(duì)參數(shù)μj,Λj,Ψδj,Φ可識(shí)別.
證由定理4.1可知,若(4.4)成立,則存在一個(gè)對(duì)角正定矩陣D=diag{d1,··· ,dp}(dj >0),使得
特別地,
類似于定理2.2證明, 可以調(diào)整Λ(1)和Φ(1)使得
證畢.
定理4.2要求(4.11)中Λj,Φ,Ψδj都滿足二指標(biāo)準(zhǔn)則, 這在實(shí)際應(yīng)用中往往難以實(shí)現(xiàn).例如m=1, 至少K=2 當(dāng)m=2時(shí),K至少要等于3.可以將上述條件稍微放寬一點(diǎn), 得到如下結(jié)果.
定理4.3考慮因子模型(4.11).記
若Λ,Φ,Ψδ滿足二指標(biāo)準(zhǔn)則, 且對(duì)j=1,··· ,p,ψδj,11=1, 則似然(4.3)對(duì)參數(shù)μj,Λj,Ψδj,Φ可識(shí)別.
證由定理4.1可知, 存在D使得
類似與定理2.2證法, 我們有
一個(gè)符合定理4.3但不符合定理4.2的例子為: 考慮p=K=m=2,
顯然,Λj并不符合兩指標(biāo)準(zhǔn)則, 但Λ卻是符合的.
不難驗(yàn)證,Σ關(guān)于λjk,φjk和ψδj是確定的.
我們按照上述模型產(chǎn)生數(shù)據(jù)集.總體參數(shù)真實(shí)值設(shè)置為:μ= 0.8×18,λjk= 0.8,ψδj=1.0, (αj1,αj2,αj3)=(-1.6,0.0,1.4)(j=3,4),
對(duì)于當(dāng)前模型而言, 由于共計(jì)存在6層2×2×4×4×3×3=576個(gè)格子, 為了避免格子中的樣本稀疏, 我們?nèi)颖救萘繛?000, 平均到每個(gè)格子的頻數(shù)約為10.
我們對(duì)上述模型進(jìn)行貝葉斯推斷.與頻率推斷相比, 貝葉斯方法不必依賴于大樣本理論,且計(jì)算簡(jiǎn)單.考慮如下先驗(yàn):
為了保證模型的可識(shí)別性, 我們將Ψδ取定為單位矩陣.在計(jì)算上, 我們執(zhí)行馬爾可夫鏈蒙特卡洛(MCMC)抽樣方法[19].馬爾可夫鏈蒙特卡洛要求從p(μ|···),p(Λ|···),p(α|···) 以及p(Φ|···)中抽樣.可以仿照[7], 不難得出這些條件分布的具體形式, 這里從略.我們考慮三組不同的初始值來(lái)確定估計(jì)的收斂性.收斂性通過(guò)EPSR值[18]來(lái)判斷.圖5.1分別給出了各個(gè)參數(shù)在先驗(yàn)I及不同初始值下EPSR值對(duì)迭代次數(shù)的關(guān)系圖.由此圖看出, 在1000步以內(nèi), 所有的參數(shù)的EPSR值都小于1.2.我們截取3000步以后的樣本來(lái)計(jì)算估計(jì)偏差、均方誤和標(biāo)準(zhǔn)誤差.結(jié)果由表5.1給出.從表5.1可以看出, 兩者估計(jì)差別區(qū)別并是不是很大, 這說(shuō)明估計(jì)對(duì)超參數(shù)值的選擇具有一定的穩(wěn)健性, 但Λ12和Φ11估計(jì)的均方誤和標(biāo)準(zhǔn)誤差較大, 這主要是因?yàn)槎謹(jǐn)?shù)據(jù)提供的總體信息較少.我們將樣本量提高到10000, 則結(jié)果明顯改善.為節(jié)省篇幅, 計(jì)算結(jié)果不再一一列出.
模型或似然的可識(shí)別問(wèn)題并不僅僅限于本文所討論的范圍, 在諸如回歸分析、方差分析、缺失數(shù)據(jù)分析等領(lǐng)域都存在一定的模型確定性問(wèn)題.本文主要是針對(duì)多重分類數(shù)據(jù)的潛變量模型的可識(shí)別性問(wèn)題進(jìn)行了討論, 給出了若干使用方便的充分條件.這些條件可視為將因子分析模型的可識(shí)別性和分類數(shù)據(jù)的潛變量模型的可識(shí)別性結(jié)合起來(lái), 但也并不僅僅是簡(jiǎn)單組合,而是力求從模型結(jié)構(gòu)本身去提出條件.盡管這些只是充分條件而非必要的, 但它們?cè)谀P偷慕y(tǒng)計(jì)計(jì)算方面提供了較大的便利.
圖5.1 先驗(yàn)I下各參數(shù)EPSR值對(duì)迭代次數(shù)的關(guān)系圖: Ψδ =I8
表5.1 兩種先驗(yàn)下各參數(shù)估計(jì): 樣本量N =6000, Ψδ =I8
不可識(shí)別的模型并非要被棄用的模型.模型可識(shí)別性只是對(duì)參數(shù)估計(jì)構(gòu)成影響, 并不影響模型對(duì)數(shù)據(jù)擬合評(píng)價(jià), 這從似然的不變性不難看出.不可識(shí)別的模型雖然對(duì)某些參數(shù)估計(jì)的確構(gòu)成困難, 但它們的某些函數(shù)卻是可估的.例如不確定的因子分析模型雖然對(duì)Λ,Φ,Ψδ估計(jì)造成麻煩, 但并不影響Σ=ΛΦΛT+Ψδ的估計(jì).有些情形下, 不可識(shí)別的模型可能有助于快速找到模型解, 如正交因子模型中的因子旋轉(zhuǎn).特別在計(jì)算上, 著名的PXEM算法(PXDA)算法正是利用模型的不確定性來(lái)擴(kuò)大解的搜索范圍從而便于快速地進(jìn)行求解(見(jiàn)文[20]).
最后需要指出的是, 對(duì)參數(shù)約束只是為了保證非約束參數(shù)的估計(jì)能夠到相合到唯一值, 但這并不意味著得到的估計(jì)就一定相合到參數(shù)真實(shí)值.實(shí)際上, 對(duì)于不可識(shí)別模型而言, 模型只能夠識(shí)別到可識(shí)別的那些參數(shù).例如, 對(duì)于正態(tài)模型N(α+β,1)而言, 模型只能對(duì)α+β識(shí)別.為了識(shí)別α, 可以將β固定成0, 也可以固定為其它值, 但這兩種不同約束導(dǎo)致α的估計(jì)相合到的結(jié)果一般并不相同.對(duì)于那些非約束參數(shù)而言, 不同的約束實(shí)際上代表不同的模型機(jī)制; 估計(jì)對(duì)約束值也相當(dāng)敏感, 一般并不具有穩(wěn)健性.這就引起一個(gè)問(wèn)題: 如何選擇一個(gè)較為適宜的約束.在本文中, 我們盡管討論了約束某些參數(shù)可以保證模型是確定的, 但沒(méi)有指明這些約束值是否一定合理, 如何約束需要考慮到問(wèn)題的實(shí)際背景.比如推論2.1中, 將協(xié)方差陣約束為相關(guān)系數(shù)矩陣, 這不并影響潛變量關(guān)性的界定.在定理2.2、推論3.1和定理4.2中, 我們將Ψδ約束為一個(gè)單位矩陣, 但在實(shí)際問(wèn)題中如果潛變量的協(xié)方差陣Σ=ΛΦΛT+Ψδ特征根過(guò)小, 上述約束可能導(dǎo)致ΛΦΛT奇異, 其結(jié)果是Λ,Φ中非約束參數(shù)可能出現(xiàn)不合理的解.一個(gè)較好的做法是將Ψδ約束為c0I形式, 其中c0=0.1或0.01.如何對(duì)約束參數(shù)賦值留作進(jìn)一步的研究和討論.