喻嘉宏 陳小娜 郜艷暉 張巖波 陳柏楠 孔羨怡 楊 朔 李麗霞△
【提 要】 目的 介紹潛變量混合增長模型理論,并將該模型應(yīng)用于醫(yī)學(xué)研究實踐。方法 以453名接受治療的抑郁患者的隨訪研究為例,采用Mplus7.4軟件構(gòu)建潛變量混合增長模型。結(jié)果 識別出2個增長趨勢不同的亞類“一般抑郁組”和“嚴重抑郁組”,每個亞類人數(shù)分別為380人(83.89%)和73人(16.11%),年齡較小患者屬于“一般抑郁組”可能性高(t=-0.051,P<0.05)。結(jié)論 潛變量增長混合模型在縱向數(shù)據(jù)分析中能夠識別不可觀測亞群的不同增長軌跡,可以很好的彌補傳統(tǒng)的增長模型在探討群體異質(zhì)性方面的不足,是縱向數(shù)據(jù)分析的有力工具。
隨著大數(shù)據(jù)時代的到來,醫(yī)學(xué)、心理學(xué)、社會學(xué)等領(lǐng)域的大型人群隊列研究越來越多,隊列研究中的數(shù)據(jù)是對每一個個體在不同時間點多次重復(fù)測量得到的追蹤數(shù)據(jù),即縱向數(shù)據(jù)??v向數(shù)據(jù)中同一個體的多次重復(fù)觀測之間往往具有相關(guān)性,不同時間點的觀測變量取值不獨立[1],如何處理這種個體內(nèi)的相關(guān)性便成為縱向數(shù)據(jù)分析中必須要解決的問題。目前,縱向隨訪數(shù)據(jù)常用的分析方法有時間序列分析(time series analysis,TSA)、多水平模型(multilevel modeling,MLM)、廣義估計方程(generalized estimated equation,GEE)和潛變量增長曲線模型(latent growth curve modeling,LGCM)等,這些方法可以對所研究特征的總體發(fā)展趨勢進行分析,或者探討個體的特征隨時間變化的特點以及個體間發(fā)展變化趨勢是否存在差異。但不論哪種分析方法前提都假設(shè)全部研究對象的發(fā)展趨勢是相同的。越來越多的研究顯示研究總體中可能存在不可觀測的亞群[2],不同亞群擁有各自不同的增長參數(shù),即不同的增長軌跡,傳統(tǒng)的縱向數(shù)據(jù)分析方法無法識別潛在亞群,這可能會導(dǎo)致研究結(jié)果的準確性和預(yù)測效果降低[3]。
Muthen等人[4]1999年提出潛變量增長混合模型(latent growth mixture modeling,LGMM),該模型是識別縱向數(shù)據(jù)變化趨勢的新的縱向數(shù)據(jù)分析方法。當研究的全部個體的發(fā)展趨勢不一致時,LGMM可以很好的彌補傳統(tǒng)的增長模型在探討群體異質(zhì)性方面的不足。LGMM假設(shè)總體中存在多個潛在的增長軌跡,每個潛在的軌跡代表一個亞類,不同亞類的增長模式不同,即允許研究總體存在異質(zhì)性。該模型的運用能夠?qū)︻A(yù)防、臨床治療及病因探索等研究領(lǐng)域提供研究線索。本文介紹潛變量增長混合模型的基本原理,并通過實例來介紹該方法的實際應(yīng)用。
潛變量增長混合模型將研究總體分成若干個不可觀測的亞群,并描述亞群的發(fā)展軌跡和亞群內(nèi)個體隨時間變化的情況,該模型包含兩種潛變量:連續(xù)潛變量和分類潛變量。連續(xù)潛變量包含增長特征參數(shù)截距和斜率,分類潛變量把研究總體分成互斥的亞群來描述群體的異質(zhì)性[5]。
潛變量增長混合模型的表達式如下:
(1)
(2)
(3)
模型中也可以考慮協(xié)變量X對發(fā)展軌跡的影響,圖1是包含協(xié)變量的LGMM路徑圖,圖中有五次重復(fù)測量(Y1,Y2,Y3,Y4和Y5),分類潛變量C和連續(xù)潛變量(截距α和斜率β)。Li等人[7]研究發(fā)現(xiàn)協(xié)變量在確定模型潛在的類別個數(shù)上有重要的作用,故協(xié)變量的納入能夠提高模型識別不可觀測亞群的能力。
圖1 包含協(xié)變量的LGMM模型路徑圖
潛變量增長混合模型的參數(shù)估計方法常用的有最大似然法(maximum likelihood,ML)和貝葉斯法,這兩種方法均是對數(shù)據(jù)進行多次迭代,獲得模型參數(shù)的估計值和后驗概率。目前,潛變量增長混合模型常在Mplus或Amos中擬合,兩種統(tǒng)計軟件進行參數(shù)估計時分別采用最大期望算法(expectation-maximization,EM)和馬爾科夫鏈蒙特卡洛法(markov chain monte carlo,MCMC)。當研究數(shù)據(jù)存在缺失值時,Mplus 7.4軟件會采用完全信息極大似然估計法(full information maximum likelihood estimator)對模型進行擬合[8]。
確定LGMM模型的類別數(shù)是模型擬合的關(guān)鍵,一般根據(jù)信息指數(shù)與模型擬合檢驗結(jié)果來選擇模型類別個數(shù)。常用的信息指數(shù)有AIC,BIC和aBIC指標,Karen等人[9]研究指出aBIC是最好的信息指標,該指標越小說明模型的擬合效果越好。此外,Entropy值表示模型能夠?qū)€體歸為相應(yīng)類別的精確程度,取值在0~1之間,一般大于0.80可認為該模型的分類準確性較高[10]。常用的模型擬合檢驗有BLRT檢驗(bootstrapped likelihood ratio test)和VLRT檢驗(vuong-lo-mcndell-rubin likelihood ratio test),其中BLRT檢驗比較含C類的模型與C-1類模型擬合情況,若結(jié)果P<0.05,則提示含C個亞類的模型更優(yōu);反之,則C-1類模型擬合較優(yōu)。VLRT檢驗也能夠評價C類模型與C-1類模型擬合情況,VLRT檢驗在確定類別數(shù)目時比BLRT檢驗更為敏感,故VLRT檢驗結(jié)果更加可靠。Tofight等人[11]研究認為aBIC和VLRT檢驗是正確選擇模型類別數(shù)的兩個最佳指標。
研究對象為山西醫(yī)科大學(xué)附屬醫(yī)院收集的符合DSM-Ⅳ(《診斷與統(tǒng)計手冊:精神障礙》)抑郁發(fā)作診斷的患者。納入標準為年齡在18~65歲,首次測量漢密頓抑郁量表(hamilton depression rating scale,HAMD)總分≥7分且整個隨訪調(diào)查中缺失次數(shù)<3次的患者。本研究共有453名患者滿足入選標準。
每名患者接受抑郁治療后,每隔3周采用HAMD量表測量患者的抑郁狀況,該量表包含17個項目,共5個維度,大部分條目采用5級評分法,“0~4”分別表示無、輕度、中度、重度、很重;少數(shù)條目采用3級評分法,“0~2”分別為無、輕中度、重度,量表得分越高表明抑郁情況越嚴重[12]。本研究僅采用前5次的得分數(shù)據(jù),并記錄患者的年齡、性別等人口學(xué)特征指標。研究探討患者抑郁癥狀隨時間的改善情況,將人口學(xué)特征指標作為協(xié)變量,5次重復(fù)測量的抑郁得分作為可測變量分別擬合線性、二次、自由估計三種類型增長混合模型。使用Epidata 3.1軟件進行錄入,使用SAS 9.4對人口學(xué)變量進行統(tǒng)計描述,Mplus 7.4軟件進行潛變量混合增長模型分析。
納入研究的抑郁癥患者共453人,年齡為(32.49±11.78)歲。其中男性217人,占47.90%;女性236人,占52.10%。其他人口學(xué)特征指標見表1。
表1 抑郁癥患者人口學(xué)特征
將潛在類別數(shù)從1增加到3,分別擬合線性、二次、自由估計三種類型增長混合模型,結(jié)果見表2。除含3個潛類別自由估計的LGMM外,BLRT均大于0.05,且VLRT在3個潛類別時也大于0.05,自由估計時Entropy值最大(Entropy=0.812),結(jié)合信息指標提示含2個潛在類別自由估計的LGMM模型較優(yōu)。
采用自由估計的含2個潛類別的模型參數(shù)估計結(jié)果和增長趨勢圖分別見表3和圖2。第一類截距和斜率的均值分別為18.935(P<0.05)和-6.607(P<0.05),該類起始抑郁得分較低,隨時間變化下降速率先加快后減緩,命名為“一般抑郁組”,該組380人,占83.89%。第一類截距和斜率的方差分別為16.187(P<0.05)和3.247(P<0.05),說明該類個體間抑郁水平初始值和抑郁下降率均存在差異。第二類截距和斜率的均值分別為23.081(P<0.05)和-1.814(P<0.05),該類起始抑郁得分較高,處于嚴重的抑郁水平,隨時間變化下降速率先緩慢后加快,命名為“重度抑郁組”,該組73人,占16.11%。第二類截距和斜率的方差為18.847(P<0.05)和1.415(P=0.072),說明該類個體間抑郁水平初始值存在差異,而抑郁下降率差異沒有統(tǒng)計學(xué)意義。第一類與第二類的截距與斜率間的協(xié)方差分別為-6.025(P<0.05)和-3.939(P<0.05),說明抑郁水平初始值與抑郁下降率之間存在關(guān)聯(lián),抑郁水平初始值越高,抑郁下降率越小。
表2 增長混合模型擬合統(tǒng)計量結(jié)果
表3 抑郁癥發(fā)展趨勢的兩個類別模型參數(shù)估計結(jié)果
以亞類為因變量(以第二類為參照),人口學(xué)特征指標為自變量擬合logistic回歸,結(jié)果見表4,結(jié)果顯示僅年齡有統(tǒng)計學(xué)意義,其估計值為-0.051(P<0.05),說明年齡較小的患者,更容易分到第一類,即年輕患者出現(xiàn)一般抑郁的可能性大。
圖2 兩類別LGMM增長趨勢圖
變量估計值標準誤t值P值年齡-0.0510.019-2.6190.009性別男1.000---女-0.2250.303-0.7430.458婚姻狀況未婚1.000---已婚0.4160.5370.7750.439家族史無1.000---有-0.1440.357-0.4050.686
傳統(tǒng)的縱向數(shù)據(jù)分析方法假設(shè)研究總體的增長軌跡是相同的,越來越多的縱向研究提示增長軌跡存在異質(zhì)性的情況,許多研究結(jié)果已證實增長混合模型在公共衛(wèi)生預(yù)防和臨床疾病病因探索等研究中都能很好地識別潛在的異質(zhì)性亞群,這使得增長混合模型在縱向研究領(lǐng)域開始受到廣泛的關(guān)注。Ryan等人[13]在一項關(guān)于青少年抑郁癥研究中,構(gòu)建LGMM模型發(fā)現(xiàn)抑郁的四種發(fā)展軌跡,認為校園暴力、網(wǎng)絡(luò)暴力和犯罪等是影響青少年抑郁發(fā)展的因素,建議學(xué)校管理者根據(jù)抑郁發(fā)展類型制定相應(yīng)有針對性的預(yù)防措施進行干預(yù)。Yoo等人[14]將LGMM用于研究隨訪5年的慢阻肺病人生活質(zhì)量變化情況,結(jié)果提示存在五種發(fā)展軌跡,發(fā)現(xiàn)年齡、睡眠質(zhì)量、抑郁水平等因素對患者生活質(zhì)量增長軌跡有影響,建議醫(yī)生根據(jù)慢阻肺患者具體情況提出個性化方案提高患者生活質(zhì)量。本研究采用增長混合模型對抑郁患者隨時間抑郁發(fā)展情況進行分析,識別出“一般抑郁組”和“嚴重抑郁組”兩個不同增長軌跡的潛在亞群,為疾病治療方案的制定提供科學(xué)依據(jù)。
LGMM模型最大特點是將連續(xù)潛變量和分類潛變量結(jié)合起來,該模型通過分類潛變量將研究總體識別為不同亞群,并根據(jù)連續(xù)潛變量描述不同亞群發(fā)展趨勢以及個體間是否存在差異[15]。擬合LGMM模型時潛在類別數(shù)的確定至關(guān)重要,雖然根據(jù)信息指數(shù)等指標可以提供一定的信息,但潛在類別數(shù)的選擇仍存在一定的主觀性,建議結(jié)合專業(yè)知識為模型的構(gòu)建提供理論支持。另外,LGMM模型雖然可以分析非正態(tài)分布的變量,但數(shù)據(jù)的非正態(tài)性可能存在多種原因:有可能是真實的非正態(tài)分布,亦或是多個不同分布類別的混合[16],故研究者可以把數(shù)據(jù)隨機分成兩組(訓(xùn)練數(shù)據(jù)集和測試數(shù)據(jù)集)或使用新一批數(shù)據(jù)進行建模來比較結(jié)果是否一致來確認類別數(shù)選擇的正確性。LGMM模型需要足夠的樣本量,否則類別識別的準確率會降低,模型類別數(shù)的選擇可以參考與樣本量無關(guān)的Entropy值。
目前,LGMM模型已在多個研究領(lǐng)域有成功的應(yīng)用,該模型在縱向數(shù)據(jù)分析中能夠識別不可觀測亞群的不同增長軌跡,進而深入剖析縱向數(shù)據(jù)中個體的發(fā)展情況,具有傳統(tǒng)增長模型所不具有的優(yōu)勢,相信會在越來越多縱向數(shù)據(jù)分析中被采用,為相關(guān)學(xué)科研究者提供更加科學(xué)合理的建議。