秦正積沈 毅△王燕南肖 靜何 書
三種重復(fù)測量資料的統(tǒng)計分析方法比較研究*
秦正積1沈 毅1△王燕南2肖 靜1何 書1
目的運(yùn)用方差分析、多變量方差分析和混合效應(yīng)線性模型方法探討重復(fù)測量資料的統(tǒng)計學(xué)分析方法,比較三種方法的統(tǒng)計分析效果。方法用實(shí)驗(yàn)法收集資料,使用excel軟件進(jìn)行繪圖分析,用SAS軟件進(jìn)行統(tǒng)計分析。結(jié)果GLM多組重復(fù)測量方差分析離子種類和鍍金方式及其交互作用有統(tǒng)計學(xué)意義、不同時間離子析出差異有統(tǒng)計學(xué)意義(所有P<0.0001);多變量方差分析離子種類、鍍金方式及其交互作用有統(tǒng)計學(xué)意義(所有P<0.0001);混合效應(yīng)模型應(yīng)用多種方差-協(xié)方差結(jié)構(gòu)進(jìn)行參數(shù)估計,以“不規(guī)則方差-協(xié)方差結(jié)構(gòu)分析”結(jié)果最為合理(-2 Res Log Likelihood、AIC、AICC及BIC統(tǒng)計量均最小,分別為894.9,914.9,916.7,930.8),模型顯示離子種類和鍍金方式及其交互作用有統(tǒng)計學(xué)意義、不同時間離子析出差異有統(tǒng)計學(xué)意義(所有P<0.0001)。結(jié)論三種分析方法各有所長,在運(yùn)用時應(yīng)結(jié)合資料的特點(diǎn)和實(shí)際可行性,擇優(yōu)選擇分析方法,也可聯(lián)合使用,使分析結(jié)果更加準(zhǔn)確合理。
多組重復(fù)測量方差分析 多變量方差分析 混合效應(yīng)模型
重復(fù)測量(repeated measure)是指對同一觀察對象的同一觀察指標(biāo)在不同時間點(diǎn)進(jìn)行多次測量。重復(fù)測量設(shè)計可對觀察指標(biāo)進(jìn)行動態(tài)觀察或監(jiān)測,采用較少的樣本含量,能夠控制個體變異,分析更加符合臨床試驗(yàn)、藥理學(xué)及毒理學(xué)的特點(diǎn)。重復(fù)測量資料的統(tǒng)計分析方法有其廣泛的應(yīng)用前景[1-5]。
本研究通過分析鍍金對中熔樁核析出離子的影響數(shù)據(jù),用三種方法分析離子析出與時間、離子類型的關(guān)系,探討重復(fù)測量資料的統(tǒng)計分析方法。
本研究以中熔樁核為對象,研究鍍金對中熔樁核析出離子的影響。將18個試件隨機(jī)分成3組,每組6個,第1組為對照組,第2組為噴砂鍍金組,第3組為拋光鍍金組。浸泡于人工唾液中,于第1個月,第2個月,第6個月,第8個月分別測其鎳離子、銅離子的濃度,比較3組不同時間離子析出是否不同。
采用excel軟件進(jìn)行圖表分析,使用SAS統(tǒng)計軟件進(jìn)行統(tǒng)計分析。
1.多組重復(fù)測量資料方差分析
按2個受試者間因素和1個受試者內(nèi)因素設(shè)計的資料的方差分析模型為:
式中Yabij為隨機(jī)反應(yīng)變量,觀察值為yabij。下標(biāo)a=1,…,m;b=1,…,q;i=1,…,ng;j=1,…,p。模型中各參數(shù)的意義是:μ為總體平均值;αa為因素A在a水平的效應(yīng);βb為因素B在第b水平的效應(yīng);(αβ)ab為因素A和B在(ab)水平上的交互作用;δi(ab)為第i個受試者在(ab)水平上的效應(yīng);γj為重復(fù)測量因素C(時間點(diǎn))在點(diǎn)j的效應(yīng);(αγ)aj、(βγ)bj分別為因素A、B與時間點(diǎn)的交互作用;(αβγ)abj屬三因素交互作用;eabij為誤差項[1]。
2.多變量方差分析
具有兩個受試者間因素和一個重復(fù)測量因素資料的多變量方差分析模型為:
式中:Yabij為隨機(jī)變量,它的觀察值為yabij。模型中各參數(shù)的意義是:μ為總體平均值;αg為因素A在g水平的效應(yīng);βh為因素B在第h水平的效應(yīng);(αβ)gh為因素A和B在(gh)水平上的交互作用;eghi為誤差項[1]。
3.混合效應(yīng)模型
在重復(fù)測量模型中,單次測量可視為低水平,個體為高水平,建立混合效應(yīng)線性模型如下:
Yi是第i受試者的pi×1維反應(yīng)變量向量。xi為pi×q維已知固定效應(yīng)設(shè)計矩陣。β為q×1維未知的固定效應(yīng)參數(shù)向量。zi為pi×r維已知隨機(jī)效應(yīng)設(shè)計矩陣。ri為r×1維未知的隨機(jī)效應(yīng)參數(shù)向量。eI是pi×1維隨機(jī)誤差向量。[1,6-8]
1.概貌分析
(1)各組統(tǒng)計描述
表1 三組試件各月份析出值(±s,μg)
表1 三組試件各月份析出值(±s,μg)
鎳離子銅離子對照 噴鍍 拋鍍第一月6.21±0.73 5.77±1.20 4.44±0.72 9.48±1.78 4.91±1.16 7.38±1.對照 噴鍍 拋鍍47第三月13.82±1.95 12.95±2.75 12.57±2.08 14.00±2.75 7.04±1.61 8.31±1.65第六月144.20±22.96 44.72±8.78 33.52±5.41 373.58±74.78 45.75±10.43 47.20±9.34第八月228.33±34.84 76.67±14.68 56.25±8.95 677.92±134.43 126.67±27.64 138.33±27.49
圖1 鎳離子各月份析出趨勢統(tǒng)計圖
圖2 銅離子各月份析出趨勢統(tǒng)計圖
由表1及圖1、圖2可見,各組鎳離子隨時間增加,析出量在1~3月相差不大,三月到八月離子析出量顯著增加。對照、噴鍍、拋鍍各組鎳離子析出量不同:對照組最多,噴鍍組次之,拋鍍組最少。各組銅離子析出隨時間增加,在1~3月相差不大,三月到八月離子析出量顯著增加。對照、噴度、拋光各組銅離子析出量不同:對照組最多,拋光組與噴度組相差不大,拋鍍組略多于噴鍍組。
2.單變量多組重復(fù)測量GLM方差分析
表2 單變量多組重復(fù)測量GLM方差分析結(jié)果
SAS輸出的Mauchly球性檢驗(yàn)結(jié)果為P<0.0001,拒絕球性假設(shè),故采用H-F校正概率做出統(tǒng)計學(xué)推斷。由表2可知,鍍金方式、離子種類及其交互作用有統(tǒng)計學(xué)意義(P<0.0001);時間、時間與鍍金方式、時間與離子種類、時間、鍍金方式和離子種類三因素間交互作用有統(tǒng)計學(xué)意義(P<0.0001)。
3.多變量方差分析[1]。
表3 MANOVA全模型分析
用SAS中的GLM過程MANOVA選項完成全模型分析顯示,鍍金方式、離子種類及其交互作用有統(tǒng)計學(xué)意義(P<0.0001)。
4.混合效應(yīng)模型
在配合混合效應(yīng)模型時,要選擇合適的協(xié)方差結(jié)構(gòu)。
選擇協(xié)方差矩陣結(jié)構(gòu)的方法是,在相同模型結(jié)構(gòu)下,選擇幾個不同結(jié)構(gòu)的協(xié)方差矩陣,從中選出似然比統(tǒng)計量(-2 Res Log Likelihood)、AIC及BIC較小的一個。如果這些統(tǒng)計量很近似,則選取含參數(shù)個數(shù)最少的一個。通常以AIC為主要判斷指標(biāo)[1]。
本模型選用UN,CS,SP(POW),UN(1)和AR(1)五種協(xié)方差結(jié)構(gòu)。用SAS計算有關(guān)協(xié)方差矩陣信息,整理后得到不同協(xié)方差的各種檢驗(yàn)統(tǒng)計量(見表4)。
混合效應(yīng)模型為:
其中,group為離子分組,trial為鍍金方式,time為鍍金時間,γi為隨機(jī)效應(yīng),ei為隨機(jī)誤差,βi(其中i=1,2,3表示單獨(dú)效應(yīng)的系數(shù),其余為交互效應(yīng))為擬合的固定效應(yīng)系數(shù)。
表4 不同協(xié)方差結(jié)構(gòu)下的各種檢驗(yàn)統(tǒng)計量
由表4可知,以UN結(jié)構(gòu)的各種統(tǒng)計量值最小,故選用它作為最適結(jié)構(gòu)。相應(yīng)的協(xié)方差矩陣的第一個區(qū)塊結(jié)構(gòu)及協(xié)方差參數(shù)的WaldZ檢驗(yàn)結(jié)果見表5、表6。
表5 第一個個體的估計R矩陣
表6 協(xié)方差矩陣參數(shù)估計值
用UN結(jié)構(gòu)計算的各種固定效應(yīng)的假設(shè)檢驗(yàn)結(jié)果見表7。
表7 固定效應(yīng)的檢驗(yàn)結(jié)果
鍍金方式、時間、離子種類、鍍金方式與時間、鍍金方式與離子種類、時間與離子種類、鍍金方式、時間及離子種類、三因素交互作用有統(tǒng)計學(xué)意義(均P<0.0001)。
5.分析結(jié)果小結(jié)
由上述分析結(jié)果可知:采用單變量GLM多組重復(fù)測量方差分析,研究得出離子種類、鍍金方式、時間及其三者間的交互作用有統(tǒng)計學(xué)意義;多變量方差分析從整體分析出發(fā),未分解時間效應(yīng),研究得出鍍金方式、離子種類及其交互作用有統(tǒng)計學(xué)意義;混合效應(yīng)線性模型先進(jìn)行估計方差-協(xié)方差結(jié)構(gòu)參數(shù)并評價,然后選用合理的方差-協(xié)方差分析得出離子種類、鍍金方式、時間及其三者間的交互作用有統(tǒng)計學(xué)意義。
1.不同模型的分析特點(diǎn)
由前述分析可知:單變量GLM多組重復(fù)測量方差分析從固定效應(yīng)出發(fā),分解出時間效應(yīng)、受試者間效應(yīng)和受試者內(nèi)效應(yīng);多變量方差分析從整體分析出發(fā),未分解時間效應(yīng);混合效應(yīng)線性模型先就方差-協(xié)方差結(jié)構(gòu)參數(shù)進(jìn)行估計并評價,然后選用合理的方差-協(xié)方差分解出固定效應(yīng)和隨機(jī)效應(yīng)。比較分析結(jié)果,可以看出各種分析方法均能得到有關(guān)影響因素的效應(yīng),但是多變量分析不能得出時間的效應(yīng)。
2.三種方法的應(yīng)用探討
(1)單變量多組重復(fù)測量方差分析
單變量分析方法對協(xié)方差結(jié)構(gòu)有嚴(yán)格的要求。在球形結(jié)構(gòu)下只有一個協(xié)方差參數(shù),在復(fù)合對稱性結(jié)構(gòu)下只有兩個協(xié)方差參數(shù),在H型條件下,也只有少數(shù)幾個協(xié)方差參數(shù)。在應(yīng)用前一定要進(jìn)行球性檢驗(yàn)。如不滿足球型條件,建議進(jìn)行校正。在研究中,GLM模型提供了離子種類、鍍金方式、時間及其三者間的交互作用,結(jié)果理論較簡單,容易解釋,而且各大統(tǒng)計軟件如SAS、SPSS、Stata等均能提供單變量重復(fù)測量方差分析的結(jié)果,信息豐富。因此,在滿足球性檢驗(yàn)的條件下,應(yīng)該首選單變量方差分析[1]。
(2)多變量方差分析
多變量方差分析是單變量方差分析的擴(kuò)展,對協(xié)方差結(jié)構(gòu)沒有要求,要估計盡可能多的方差及協(xié)方差參數(shù)。同時對多個反應(yīng)變量進(jìn)行方差分析,累積多個反應(yīng)變量的信息從而得出統(tǒng)一的統(tǒng)計學(xué)結(jié)論。它著重分析受試者在多個反應(yīng)變量基礎(chǔ)上的整體信息,而不是個別反應(yīng)變量的單獨(dú)信息。當(dāng)我們把重復(fù)測量資料在p個時間點(diǎn)上的反應(yīng)變量測量值看作p個反應(yīng)變量時,就是一種多變量資料,因此可以用多變量方差分析模型來分析重復(fù)測量資料而不存在任何理論問題。
多變量方差分忻因?yàn)閷f(xié)方差矩陣完全無限制,理論上應(yīng)用范圍更廣。但這一特點(diǎn)也使臨床試驗(yàn)千差萬別的試驗(yàn)數(shù)據(jù)的復(fù)雜關(guān)系失去意義,只能得到各時間點(diǎn)數(shù)據(jù)的整體結(jié)論。在研究中,僅提供了鍍金方式、離子種類及其交互作用的效應(yīng),沒有提供時間的效應(yīng)[1]。
(3)混合效應(yīng)線性模型
基于似然函數(shù)法原理的混合效應(yīng)線性模型分析方法,是一般線性模型的擴(kuò)展。它允許資料存在某種相關(guān)性及協(xié)方差矩陣的多樣性,從而能更好地適應(yīng)重復(fù)測量資料的特點(diǎn)[8]。其次,一般線性模型只能分析固定觀察時間點(diǎn)數(shù)目相等的資料,不能分析觀察時間點(diǎn)不等的資料。此外,在一般線性模型中,對具有缺失觀察值的受試者是完全舍棄不用的,丟失了資料信息。而混合效應(yīng)線性模型也能充分利用具有缺失觀察值的受試者資料[5]。
混合線性模型在其應(yīng)用上具有如下特點(diǎn):
(1)對固定效應(yīng)參數(shù)進(jìn)行更準(zhǔn)確的估計:混合線性模型考慮到了數(shù)據(jù)的聚集性問題,并用了相應(yīng)的迭代方法,可以獲得回歸系數(shù)的有效估計,提供正確的標(biāo)準(zhǔn)誤,從而假設(shè)檢驗(yàn)的結(jié)果更加準(zhǔn)確。它比傳統(tǒng)方法更“保守”,后者的標(biāo)準(zhǔn)誤是通過簡單的忽略聚集的存在而獲得,往往并不準(zhǔn)確。
(2)重復(fù)測量資料的分析及規(guī)律探討:傳統(tǒng)模型也可以對重復(fù)測量資料分析,要求數(shù)據(jù)是平衡的。但在實(shí)踐上,測量次數(shù)常是不規(guī)則的,此時傳統(tǒng)模型的估計可能有誤。而混合線性模型可以處理任何測量模式的數(shù)據(jù),并提供無偏的參數(shù)估計。因此其分析的準(zhǔn)確性得到提高[7]。
混合線性模型可以處理不同形式的協(xié)方差矩陣,對時間因素的效應(yīng)且內(nèi)部關(guān)系又極為復(fù)雜的研究極為有用[8]。由于引入了隨機(jī)效應(yīng),結(jié)果更具有外推性[4,6]。本研究中,既能得到固定效應(yīng),又能分析出隨機(jī)效應(yīng),同時能得到時間效應(yīng)的變化規(guī)律,使研究結(jié)果更可靠。
綜上所述,三種分析方法各有所長,在運(yùn)用時應(yīng)結(jié)合資料的特點(diǎn)和實(shí)際可行性,擇優(yōu)選擇分析方法,也可聯(lián)合應(yīng)用使分析更豐富、更準(zhǔn)確、更合理。
附 件:有關(guān)SAS程序
1.余松林,向惠云.重復(fù)測量資料分析方法與SAS程序.北京:科學(xué)出版社,2003,1-2.
2.陳峰,任仕泉,陸守曾,等.非獨(dú)立計量資料的內(nèi)部相關(guān)性研究.現(xiàn)代預(yù)防醫(yī)學(xué),1998,25(3):269-271.
3.任仕泉,陳峰,楊樹勤,等.非獨(dú)立數(shù)據(jù)及其協(xié)方差結(jié)構(gòu)表達(dá).中國衛(wèi)生統(tǒng)計,1998,(4):4-8.
4.陳峰,任仕泉,陸守曾,等.非獨(dú)立試驗(yàn)的組內(nèi)相關(guān)與廣義估計方程.南通醫(yī)學(xué)報,1999,19(4)359-362.
5.黃坤.混合線性模型在臨床試驗(yàn)中重復(fù)測量資料的應(yīng)用.現(xiàn)代預(yù)防醫(yī)學(xué),2005,32(11):1584-1585.
6.張文彤.SPSS11統(tǒng)計分析教程.北京:北京希望電子出版社,2002,65-76.
7.王超.混合效應(yīng)線性模型與單因素方差分析在重復(fù)測量數(shù)據(jù)中的應(yīng)用比較.數(shù)理醫(yī)藥學(xué)雜志,2006,19(4):355-357.
8.Cnaan A Laird N M,Slasor P.Using the general linear m ixed model to analyze unbalanced repeatedmeasures and longitudinal data.Statistics in Medicine,1997,16:2349-2380.
(責(zé)任編輯:郭海強(qiáng))
*:南通大學(xué)校自然(03041051);教改課題(2013B116)
1.江蘇南通大學(xué)公共衛(wèi)生學(xué)院流行病與醫(yī)學(xué)統(tǒng)計學(xué)教研室(226019)
2.浙江寧波市鄞州區(qū)章水社區(qū)衛(wèi)生服務(wù)中心
△通信作者:沈毅,E-mail:stata70@sohu.com