劉 暢潘 輝陳梓聰張晉昕△
基于Wald檢驗(yàn)實(shí)現(xiàn)Cox回歸中自變量影響大小的推斷*
劉 暢1潘 輝2陳梓聰1張晉昕1△
目的針對(duì)一般研究者在使用Cox回歸時(shí),直接比較標(biāo)準(zhǔn)化偏回歸系數(shù)大小的做法,提出借助Wald檢驗(yàn)進(jìn)行排序,并用小細(xì)胞肺癌患者隨訪(fǎng)研究的實(shí)例加以說(shuō)明。方法借鑒SNK多重比較法的比較策略,以盡可能少的比較次數(shù),使用Wald檢驗(yàn)對(duì)樣本標(biāo)準(zhǔn)化回歸系數(shù)進(jìn)行假設(shè)檢驗(yàn),從而探討總體標(biāo)準(zhǔn)化回歸系數(shù)之間的關(guān)系,形成依影響大小排序的若干子集。結(jié)果選入模型的4個(gè)變量被劃分在2個(gè)子集內(nèi),可認(rèn)為第1子集中的自變量(實(shí)例中的腫瘤大小、年齡)對(duì)預(yù)后的影響小于第2子集中的自變量(神經(jīng)元特異性烯醇化酶),自變量癌胚抗原對(duì)預(yù)后的影響介于兩個(gè)子集之間。結(jié)論基于Wald檢驗(yàn)對(duì)自變量進(jìn)行排序,能夠克服cox回歸模型結(jié)果報(bào)告中判斷自變量影響大小的主觀性。
標(biāo)準(zhǔn)化偏回歸系數(shù) Wald檢驗(yàn) 預(yù)后 影響程度
Cox回歸模型分析廣泛應(yīng)用于評(píng)估一組自變量對(duì)預(yù)后的影響[1]。模型分析過(guò)程主要有兩個(gè)階段,模型選擇和預(yù)測(cè)變量的解釋?zhuān)?]。在模型選擇階段,主要目標(biāo)是尋找正確的模型。模型選定后,對(duì)預(yù)測(cè)變量的意義進(jìn)行分析和解釋?zhuān)瑢⒆宰兞堪凑諏?duì)生存結(jié)局的作用大小進(jìn)行比較、獲得其排序,在公共衛(wèi)生、生態(tài)學(xué)、環(huán)境學(xué)、心理學(xué)等領(lǐng)域均有著廣泛的需求[3]。目前最常使用的指標(biāo)為標(biāo)準(zhǔn)化偏回歸系數(shù),或?qū)?yīng)的風(fēng)險(xiǎn)比(hazard ratio,HR)值。事先通過(guò)對(duì)變量或偏回歸系數(shù)進(jìn)行標(biāo)準(zhǔn)化,可使量綱不同的變量得以相互比較。
研究者在給出分析報(bào)告時(shí),通常將標(biāo)準(zhǔn)化偏回歸系數(shù)直接進(jìn)行比較,以體現(xiàn)自變量對(duì)預(yù)后的影響大小,這種做法其實(shí)不盡合理。原因是標(biāo)準(zhǔn)化偏回歸系數(shù)是由樣本估計(jì)出的一個(gè)統(tǒng)計(jì)量,存在抽樣誤差。樣本的標(biāo)準(zhǔn)化偏回歸系數(shù)取值有差別,也無(wú)法據(jù)此直接判斷兩個(gè)總體標(biāo)準(zhǔn)化偏回歸系數(shù)是否不同。因此,有必要對(duì)其進(jìn)行假設(shè)檢驗(yàn),以判斷總體偏回歸系數(shù)的關(guān)系。此外,在考慮自變量對(duì)結(jié)局的影響程度時(shí),若干個(gè)變量間不一定是A大B小的關(guān)系,不排除A與B對(duì)結(jié)局的影響程度同等的情形。本研究旨在針對(duì)以上應(yīng)用問(wèn)題,提出合理的自變量排序方法。
通過(guò)對(duì)樣本標(biāo)準(zhǔn)化回歸系數(shù)進(jìn)行假設(shè)檢驗(yàn),探討總體標(biāo)準(zhǔn)化系數(shù)的關(guān)系,并將自變量按對(duì)預(yù)后的影響程度劃分子集,彼此間差異沒(méi)有統(tǒng)計(jì)學(xué)意義的變量放在一個(gè)子集內(nèi)。
1.建立模型 根據(jù)資料建立Cox比例風(fēng)險(xiǎn)回歸模型,采用逐步回歸法篩選變量,自變量進(jìn)入模型的顯著性水準(zhǔn)為0.05,剔除的顯著性水準(zhǔn)為0.10。
2.比較策略 為了盡可能減少比較次數(shù),本研究探索一種合適的策略對(duì)變量進(jìn)行比較,即借鑒SNK(student-newman-keuls)多重比較法[4-6]的思想,劃分相似性子集。在模型建立以后,將標(biāo)準(zhǔn)化偏回歸系數(shù)按從小到大的順序進(jìn)行排列。第一步,將第一個(gè)系數(shù)與最后一個(gè)系數(shù)進(jìn)行比較,若無(wú)差異,則兩個(gè)系數(shù)之間的所有系數(shù)都被視作沒(méi)有差異,不必繼續(xù)比較;若有差異,則進(jìn)行下一步。第二步,將第二個(gè)系數(shù)與最后一個(gè)系數(shù),第一個(gè)系數(shù)與倒數(shù)第二個(gè)系數(shù)進(jìn)行比較,按第一步的邏輯類(lèi)推。以下舉例進(jìn)行說(shuō)明。
例如,當(dāng)模型中存在5個(gè)變量時(shí),先將系數(shù)按大小進(jìn)行排序,假設(shè)β1<β2<β3<β4<β5。
第一步,考察間隔3個(gè)變量的情況,將β1與β5進(jìn)行比較。若無(wú)差異,則認(rèn)為其間隔內(nèi)的所有變量都沒(méi)有差異,不必做后續(xù)比較;若有差異,進(jìn)行第二步。
第二步,考察間隔2個(gè)變量的情況,將β1與β4,β2與β5進(jìn)行比較。若無(wú)差異,則認(rèn)為其間隔內(nèi)的所有變量都無(wú)差異,不必做接下來(lái)的比較;若有差異,進(jìn)行第三步。
依此類(lèi)推。當(dāng)所有系數(shù)間都存在差異時(shí),完整的比較流程如圖1所示。
圖1 假定5個(gè)變量的比較流程示意圖
3.檢驗(yàn)方法 目前常用于回歸模型中系數(shù)比較的檢驗(yàn)有:F檢驗(yàn)、似然比檢驗(yàn)、Wald檢驗(yàn)、計(jì)分檢驗(yàn)等。本文采用Wald檢驗(yàn)對(duì)系數(shù)進(jìn)行檢驗(yàn),其優(yōu)點(diǎn)是,只需估計(jì)無(wú)約束模型。其原理是,測(cè)量約束和無(wú)約束模型間的距離,從而檢驗(yàn)約束條件是否成立。Wald統(tǒng)計(jì)量的計(jì)算公式如下:
其中,L為線(xiàn)性約束矩陣,β為系數(shù)矩陣,Cov(β)為協(xié)方差陣。由公式可以看出,該方法在計(jì)算過(guò)程中使用了系數(shù)間的協(xié)方差矩陣,因此可以更好地考慮變量間存在相關(guān)性的情況。在檢驗(yàn)時(shí),通過(guò)設(shè)置不同的L矩陣,可以考察不同的線(xiàn)性約束是否成立。例如,若要檢驗(yàn)H0∶β2=β3,則令L=(0 1 -1 0 0),相當(dāng)于檢驗(yàn)Lβ=β2-β3=0是否成立。
數(shù)據(jù)來(lái)源于本課題組收集的小細(xì)胞肺癌患者生存時(shí)間的調(diào)查數(shù)據(jù),共計(jì)275名小細(xì)胞肺癌患者。其中男性239例,女性36例;年齡最小33歲,最大86歲,平均年齡(62.6±9.3)歲。
自變量包括年齡、性別、吸煙量(包/年)、腫瘤大小、血紅蛋白、白細(xì)胞計(jì)數(shù)、中性粒細(xì)胞計(jì)數(shù)、淋巴細(xì)胞計(jì)數(shù)、血小板計(jì)數(shù)、癌胚抗原(carcino-embryonic antigen,CEA)、神經(jīng)元特異性烯醇化酶(neuron-specific enolase,NSE)、γ-谷氨酰轉(zhuǎn)肽酶、纖維蛋白酶原和白蛋白共14個(gè)可疑的影響因素,除性別外均為連續(xù)型變量。結(jié)局變量為患者的生存情況。
本研究的全部計(jì)算在SAS 9.3軟件環(huán)境下實(shí)現(xiàn)。
1.模型的建立
建立Cox比例風(fēng)險(xiǎn)回歸模型,對(duì)影響小細(xì)胞肺癌患者生存時(shí)間的因素進(jìn)行分析,最終模型中選入4個(gè)變量:年齡(Age),腫瘤大?。⊿ize),癌胚抗原(CEA),神經(jīng)元特異性烯醇化酶(NSE)。模型中變量的偏回歸系數(shù)及標(biāo)準(zhǔn)化偏回歸系數(shù)見(jiàn)表1。
表1 Cox回歸模型參數(shù)估計(jì)結(jié)果
2.標(biāo)準(zhǔn)化偏回歸系數(shù)的檢驗(yàn)
按照上文提出的比較策略,對(duì)4個(gè)標(biāo)準(zhǔn)化偏回歸系數(shù)按照從小到大的順序進(jìn)行排序,記為分別對(duì)應(yīng)Size、Age、CEA、NSE4個(gè)變量,采用Wald檢驗(yàn),分別對(duì)系數(shù)進(jìn)行檢驗(yàn)。檢驗(yàn)結(jié)果如表2所示。
表2 標(biāo)準(zhǔn)化偏回歸系數(shù)比較結(jié)果
3.劃分子集情況
根據(jù)檢驗(yàn)結(jié)果,可將自變量劃分為2個(gè)子集(見(jiàn)表3),按照從小到大的順序,前3個(gè)系數(shù)劃分在1個(gè)子集內(nèi),后2個(gè)系數(shù)劃分在1個(gè)子集內(nèi)。可認(rèn)為腫瘤大小、年齡、癌胚抗原對(duì)患者生存時(shí)間的影響程度相近,癌胚抗原、神經(jīng)元特異性烯醇化酶對(duì)生存時(shí)間的影響程度相近。神經(jīng)元特異性烯醇化酶對(duì)預(yù)后的影響大于腫瘤大小、年齡;癌胚抗原對(duì)預(yù)后的影響介于2個(gè)集合之間。
圖2 小細(xì)胞肺癌Cox回歸模型中系數(shù)比較流程圖
表3 自變量按影響程度劃分子集
標(biāo)準(zhǔn)化偏回歸系數(shù)的應(yīng)用歷史已久,由于其易于計(jì)算,便于解釋的特性,使它成為目前使用最為廣泛的、描述自變量對(duì)結(jié)局影響程度的量化指標(biāo)。然而,標(biāo)準(zhǔn)化偏回歸系數(shù)在結(jié)果報(bào)告中的解讀往往過(guò)于主觀。不時(shí)見(jiàn)到的情形是,建立回歸模型后,直接比較兩個(gè)變量的標(biāo)準(zhǔn)化回歸系數(shù)的大小,得出A指標(biāo)強(qiáng)于B指標(biāo)的影響因素的結(jié)論[7,11]。也有學(xué)者在使用標(biāo)準(zhǔn)化偏回歸系數(shù)時(shí),會(huì)報(bào)告其置信區(qū)間[8-10]。
研究資料的獲得通常都是基于隨機(jī)抽樣,計(jì)算出的標(biāo)準(zhǔn)化偏回歸系數(shù)是由樣本估計(jì)出的一個(gè)統(tǒng)計(jì)量,勢(shì)必存在抽樣誤差。因此,比較不同自變量對(duì)結(jié)局的影響大小時(shí),應(yīng)借助統(tǒng)計(jì)推斷(假設(shè)檢驗(yàn)或區(qū)間估計(jì))方法。為了指導(dǎo)研究人員正確報(bào)告自變量影響大小,統(tǒng)計(jì)學(xué)家對(duì)標(biāo)準(zhǔn)化偏回歸系數(shù)的置信區(qū)間估計(jì)提供了多種方法和建議,包括非中心性區(qū)間估計(jì),Delta法,Bootstrap法等[12]。對(duì)標(biāo)準(zhǔn)化系數(shù)進(jìn)行假設(shè)檢驗(yàn)的研究則未被足夠重視。
本文提出采用Wald檢驗(yàn)對(duì)Cox回歸模型的標(biāo)準(zhǔn)化偏回歸系數(shù)進(jìn)行假設(shè)檢驗(yàn),比較總體標(biāo)準(zhǔn)化回歸系數(shù)的大小。實(shí)際上,該方法并不局限于Cox回歸,還可以應(yīng)用于多重線(xiàn)性回歸、logistic回歸等線(xiàn)性回歸模型中。若變量間比較次數(shù)過(guò)多,會(huì)致假陽(yáng)性率上升。本研究借鑒SNK方法的思想,提出分級(jí)比較的策略,有效地減少了比較次數(shù)。例如,針對(duì)一個(gè)包含5個(gè)自變量的模型,若對(duì)全部系數(shù)進(jìn)行檢驗(yàn),需要進(jìn)行C25=10次。采用本文提供的比較流程,比較次數(shù)不會(huì)超過(guò)10次(所有變量均有差異的情況下)。
線(xiàn)性回歸模型建立以后,將自變量對(duì)結(jié)局變量的影響程度大小進(jìn)行排序,是醫(yī)學(xué)研究者都關(guān)心的問(wèn)題,因其對(duì)后續(xù)干預(yù)策略的制訂具有重要指導(dǎo)意義。本文給出的方法對(duì)于把握輕重緩急、抓住主要因素,提供了統(tǒng)計(jì)學(xué)方法支持。
[1]Chao YE,Zhao Y,Kupper L L,etal.Quantifying the Relative Importance of Predictors in Multiple Linear Regression Analyses for Public Health Studies.Journal of Occupational and Environmental Hygiene,2008,5(8):519-529.
[2]Krasikova D,LeBreton J,Tonidandel S.Estimating the relative importance of variables in multiple regression models.International Review of Industrial and Organizational Psychology 2011,Volume 26,2011:119-141.
[3]孫紅衛(wèi),王玖,羅文海.線(xiàn)性回歸模型中自變量相對(duì)重要性的衡量.中國(guó)衛(wèi)生統(tǒng)計(jì),2012,29(6):900-902.
[4]Abdi H,W illiams LJ.Newman-Keuls test and Tukey test.Encyclopedia of Research Design.Thousand Oaks,CA:Sage,2010:1-11.
[5]Keuls M.The use of the“studentized range”in connection w ith an analysis of variance.Euphytica,1952,1(2):112-122.
[6]Curran-Everett D.Multiple comparisons:philosophies and illustrations.Am JPhysiol Regul Integr Comp Physiol,2000,279(1):R1-R8.
[7]Young TK,Gelskey DE.Is noncentral obesity metabolically benign?Implications for prevention from a population survey.JAMA,1995,274(24):1939.
[8]Cheng S,Rhee E,Larson M,et al.Metabolite Profiling Identifies Pathways Associated W ith Metabolic Risk in Humans.Circulation,2012,125(18):2222-2231.
[9]Baccarelli A,W right RO,Bollati V,et al.Rapid DNA methylation changes after exposure to traffic particles.American journal of respiratory and critical caremedicine,2009,179(7):572-578.
[10]Tanaka K,Ogata S,Tanaka H,et al.The relationship between body mass index and uric acid:a study on Japanese adult twins.Environmental health and preventivemedicine,2015,20(5):347-353.
[11]Tsai A,Aung T,Yip W,et al.Relationship of Intraocular Pressure with Central Aortic Systolic Pressure.Current Eye Research,2015:1-6.
[12]Jones J,Waller N.Computing confidence intervals for standardized regression coefficients.Psychological Methods,2013,18(4):435-453.
(責(zé)任編輯:鄧 妍)
Inference of Strengths of Effects between Predictors in Cox Regression Based on W ald Test
Liu Chang,Pan Hui,Chen Zicong,et al
(Departmentof Medical Statistics and Epidemiology,School of Public Health,SunYat-Sen University(510080),Guangzhou)
ObjectiveTo solve the common problem that standardized regression coefficients are compared w ith each other directly by researchers,we propose a rankingmethod based on Wald test,and illustrate it by a example of small cell lung cancer patients.MethodsLearning Strategies from Student-Newman-Keuls test,make hypothesis tests of sample standardized regression coefficients by Wald testw ith comparing times as few as possible,in order to explore the relationship between population standardized regression coefficients and partition subsets of predictors according to theirmagnitude of effects to the dependent variable.ResultsThe four selected predictors are allocated to two subsets,we can consider that predictors in subset 1(size and age)have less effects on prognosis than predictors in subset2(neuron-specific enolase),while the effects of carcino-embryonic antigen stays between the two subsets.ConclusionRanking predictors based on Wald test can overcome subjectivity of effectsmagnitude judgement in result report of regressionmodels.
Standardized regression coefficients;Wald test;Prognosis;Effect
廣東省科學(xué)技術(shù)廳科技計(jì)劃項(xiàng)目(2014A020212713)
1.中山大學(xué)公共衛(wèi)生學(xué)院醫(yī)學(xué)統(tǒng)計(jì)與流行病學(xué)系(510080)
2.廣州醫(yī)科大學(xué)附屬第一醫(yī)院轉(zhuǎn)化醫(yī)學(xué)實(shí)驗(yàn)室
△通信作者:張晉昕,E-mail:zhjinx@m(xù)ail.sysu.edu.cn