胡純嚴(yán) ,胡良平 ,2*
(1.軍事科學(xué)院研究生院,北京 100850;2.世界中醫(yī)藥學(xué)會(huì)聯(lián)合會(huì)臨床科研統(tǒng)計(jì)學(xué)專業(yè)委員會(huì),北京 100029*通信作者:胡良平,E-mail:lphu927@163.com)
在對生存資料進(jìn)行假設(shè)檢驗(yàn)時(shí),除了在試驗(yàn)因素各水平組之間采取似然比檢驗(yàn)和六種非參數(shù)檢驗(yàn)之外,還有三種特殊的檢驗(yàn),即“多重比較”“趨勢檢驗(yàn)”和“協(xié)變量檢驗(yàn)”[1]。這些假設(shè)檢驗(yàn)方法在本質(zhì)上都屬于“χ2檢驗(yàn)”。本文將詳細(xì)介紹前述提及的三種特殊檢驗(yàn)的計(jì)算公式,結(jié)合實(shí)例并借助SAS軟件實(shí)現(xiàn)統(tǒng)計(jì)計(jì)算。
設(shè)有K(K>2)組生存函數(shù),若同時(shí)對它們進(jìn)行比較,就叫做整體比較;若每次僅取出兩組進(jìn)行比較,并按以下兩種情形之一完成全部比較,就稱為多重比較:情形一,任何兩組生存函數(shù)之間都要進(jìn)行一次比較,若K=4,總共需要比較6次;情形二,選定一個(gè)對照組,其他組都與此對照組進(jìn)行比較,若K=4,總共需要比較3次。
1.2.1 校正的必要性
當(dāng)需要對K(K>2)組生存函數(shù)進(jìn)行多重比較時(shí),基于前述提及的兩種情形,都至少需要比較2次。若每次比較都設(shè)定檢驗(yàn)水準(zhǔn)為α(通常設(shè)α=0.05),設(shè)總共需要比較m次,m的計(jì)算公式如下:
于是,m次比較所對應(yīng)的犯I類錯(cuò)誤的總概率PT就會(huì)大于α,其計(jì)算方法[1]如下:
PT=1-(1-α)m
例如,當(dāng)m=6、α=0.05時(shí),PT=0.264908>0.05。
為此,需要對每次比較所得的概率P值進(jìn)行校正,以保證整個(gè)多重比較所對應(yīng)的犯I類錯(cuò)誤的總概率PT小于等于α。
1.2.2 校正方法的種類
在 SAS/STAT 的“LIFETEST”過程中[1],基于不同的統(tǒng)計(jì)學(xué)原理,對多重比較結(jié)果進(jìn)行概率校正的方法有如下幾種:Bonferroni校正法、Dunnett-Hsu校正法、Scheffé校正法、?idák校正法、SMM校正法和Tukey校正法。
1.2.3 多重比較中變量的定義
1.2.4 多重比較中每次比較的共同檢驗(yàn)統(tǒng)計(jì)量
將第j組與第l組中生存函數(shù)進(jìn)行雙側(cè)檢驗(yàn)所對應(yīng)的檢驗(yàn)統(tǒng)計(jì)量按下式計(jì)算:
直接計(jì)算出來的P值(也稱為原始P值)由下式計(jì)算:
1.2.5 多重比較中六種校正P值的計(jì)算公式
Bonferroni校正法計(jì)算P值的公式如下:
Dunnett-Hsu校正法計(jì)算P值的公式如下:
設(shè)以第一組為對照組,讓C=(cij)代表(r-1)×(r)階對比矩陣,即:
讓∑≡(σij)與R≡(rij)分別代表矩陣Cv的協(xié)方差矩陣與相關(guān)矩陣,即:
【說明】此處涉及“v”與“V”,V是v的方差。v和V的計(jì)算比較復(fù)雜,將在下文詳細(xì)介紹。
于是,Hsu于1992年提出,從因子分解的協(xié)方差中近似求出λ1,λ2,…,λr-1,從而構(gòu)造出以下方程式:
R=D+ λλ'
這里,D是一個(gè)對角矩陣,其對角線上第j個(gè)元素為1-λj,而且,λ =(λ1,λ2,…,λ)'。于是,校正r-1的P值可通過下式計(jì)算:
采用 Scheffé校正法、?idák 校正法、SMM 校正法、Tukey校正法計(jì)算P值的公式分別見式(5)、式(6)、式(7)、式(8):
Klein和Moeschberger于1997年提出了生存資料的趨勢檢驗(yàn)方法,該法有如下兩個(gè)備擇檢驗(yàn)假設(shè),根據(jù)實(shí)際資料,選擇其中之一。
H2:S1(t)≥S2(t)≥ …≥SK(t),t≤τ,至少有一個(gè)不等式成立;
或H2:S1(t)≤S2(t)≤ …≤SK(t),t≤τ,至少有一個(gè)不等式成立。
讓a1<a2<…<aK代表與K個(gè)樣本有關(guān)聯(lián)的一組得分,則在H0成立的條件下,對應(yīng)的檢驗(yàn)統(tǒng)計(jì)量如下:
在生存資料的差異性分析中,通常涉及定性的影響因素(包括試驗(yàn)因素和/或分層因素,后者在本質(zhì)上屬于“重要非試驗(yàn)因素”)和定量的結(jié)果變量(即生存時(shí)間)。然而,在很多生存資料中,還涉及定量的和二值的影響因素或自變量,它們常被稱為“協(xié)變量”??疾靺f(xié)變量對生存函數(shù)的影響,最常見的做法是把所有需要考察的“影響因素(包括試驗(yàn)因素、重要非試驗(yàn)因素和協(xié)變量)”都當(dāng)作自變量,把生存時(shí)間或生存時(shí)間的函數(shù)作為因變量,進(jìn)行生存資料的多重回歸分析。當(dāng)因變量為生存時(shí)間時(shí),需要擬合生存資料的參數(shù)回歸模型;當(dāng)因變量為生存時(shí)間的函數(shù)(例如危險(xiǎn)率函數(shù))時(shí),需要擬合COX比例風(fēng)險(xiǎn)或非比例風(fēng)險(xiǎn)回歸模型。在SAS/STAT的“LIFETEST”過程中,還介紹了另一種處理協(xié)變量的方法,即采用“秩檢驗(yàn)”來研究協(xié)變量對生存函數(shù)的影響是否有統(tǒng)計(jì)學(xué)意義。
單協(xié)變量時(shí),檢驗(yàn)其對生存函數(shù)的影響是否有統(tǒng)計(jì)學(xué)意義,所對應(yīng)的秩檢驗(yàn)統(tǒng)計(jì)量見式(10):
在式(10)中,χ2服從自由度為1的χ2分布;v為基于協(xié)變量計(jì)算得到的“一般秩統(tǒng)計(jì)量”;V是v的方差。
多協(xié)變量時(shí),檢驗(yàn)它們對生存函數(shù)的影響是否有統(tǒng)計(jì)學(xué)意義,所對應(yīng)的秩檢驗(yàn)統(tǒng)計(jì)量見式(11):
在式(11)中,χ2服從自由度為df的χ2分布;自由度df為“當(dāng)前”所考查的協(xié)變量的個(gè)數(shù);v為基于協(xié)變量向量計(jì)算得到的“一般秩統(tǒng)計(jì)量”;V是基于v的“方差與協(xié)方差矩陣”,此矩陣主對角線上的元素就是與各協(xié)變量對應(yīng)的“一般秩統(tǒng)計(jì)量”的方差。
值得注意的是:式(11)不是一個(gè)恒定的公式,其中所包含的協(xié)變量的個(gè)數(shù)由1個(gè)逐漸遞增到全部需要考查的協(xié)變量(不妨設(shè)共有L個(gè)協(xié)變量),每次都對應(yīng)著一個(gè)χ2檢驗(yàn)結(jié)果(包括一個(gè)χ2值和一個(gè)P值)。首先基于單協(xié)變量檢驗(yàn)法選取對生存函數(shù)影響最大的單個(gè)協(xié)變量,第二次選取能使χ2值獲得最大增量的協(xié)變量,依次類推,逐一增加協(xié)變量,直至需要考查的協(xié)變量全部進(jìn)入式(11)。例如:在本文例1中考慮了5個(gè)協(xié)變量,經(jīng)過5次搜索并代入式(11)計(jì)算,由輸出結(jié)果(參見本文例1中輸出結(jié)果最后部分“對數(shù)秩檢驗(yàn)的卡方向前逐步序列”)第二列可以看出,自由度數(shù)目在逐次增加1;由第三列可以看出,χ2值逐漸增大;由第5列可看出,χ2值的增量逐漸減小,因?yàn)楹竺孢x取的協(xié)變量比之前選取的協(xié)變量對生存函數(shù)的影響小。由于式(10)是式(11)的特例,故下面僅針對式(11),介紹其有關(guān)細(xì)節(jié)。
3.4.1 一般秩統(tǒng)計(jì)量的計(jì)算公式
在式(11)中,v為基于協(xié)變量計(jì)算得到的“一般秩統(tǒng)計(jì)量”,當(dāng)只考查一個(gè)協(xié)變量時(shí),其計(jì)算結(jié)果就是一個(gè)具體的“秩和”;當(dāng)考查的協(xié)變量個(gè)數(shù)大于等于2時(shí),其計(jì)算結(jié)果就是一個(gè)“向量”,其各分量是與各協(xié)變量對應(yīng)的“秩和”。v的計(jì)算方法如下:
在式(12)中,n為總樣本含量;Cα,δα為秩得分(即把生存時(shí)間數(shù)據(jù)按由小到大排序并賦予秩次或稱為打分),δα為指示變量,δα=1代表觀測到的為“事件(即準(zhǔn)確的生存時(shí)間)”,δα=0代表觀測到的為“刪失(即截尾的生存時(shí)間)”;Zα是與第α個(gè)觀測或個(gè)體對應(yīng)的全部協(xié)變量取值組成的向量。
在SAS/STAT的“LIFETEST”過程中,有兩種定義秩得分Cα,δα的方法,分別為“對數(shù)秩秩得分”和“威爾科克森秩得分”。
3.4.2 對數(shù)秩秩得分的計(jì)算公式
對數(shù)秩秩得分的定義如下:
在式(13)中,j為排序后的事件時(shí)間的編號(hào),其對應(yīng)的時(shí)間記為t(j);ta代表所有的排序時(shí)間(包括事件時(shí)間和刪失時(shí)間);nj為恰好在t(j)之前危險(xiǎn)集中個(gè)體的數(shù)目。
3.4.3 威爾科克森秩得分的計(jì)算公式
威爾科克森秩得分的定義如下:
式(14)中各變量的含義與式(13)相同,此處不再贅述。
3.4.4 用于估計(jì)對數(shù)秩統(tǒng)計(jì)量的協(xié)方差矩陣的計(jì)算公式
用于估計(jì)對數(shù)秩統(tǒng)計(jì)量的協(xié)方差矩陣的計(jì)算方法見式(15):
在式(15)中,Vi是在時(shí)刻t(i)風(fēng)險(xiǎn)集的校正平方和以及交叉乘積和矩陣,其計(jì)算方法如下:
3.4.5 用于估計(jì)威爾科克森統(tǒng)計(jì)量的協(xié)方差矩陣的計(jì)算公式
用于估計(jì)威爾科克森統(tǒng)計(jì)量的協(xié)方差矩陣的計(jì)算公式見式(18):
式(18)中A和B的計(jì)算公式分別見式(19)、式(20):
在式(19)、式(20)中,有關(guān)變量的含義如下:
【說明】為便于理解,對以上公式的內(nèi)容扼要梳理:式(11)中的“v”由式(12)給出;式(11)中的“V”由式(15)或式(18)給出;式(10)的更一般表達(dá)見式(25):
在式(25)中,vi是式(12)中第i個(gè)分量;Vii是式(15)或式(18)中矩陣V的主對角線上第i個(gè)元素。
【例1】沿用本期科研方法專題《如何正確運(yùn)用χ2檢驗(yàn)——生存資料的似然比檢驗(yàn)與六種非參數(shù)檢驗(yàn)與SAS實(shí)現(xiàn)》一文中“例2的問題與數(shù)據(jù)”,試完成下列三項(xiàng)任務(wù):任務(wù)一:對四種癌細(xì)胞類型的生存曲線進(jìn)行兩種情形下的多重比較;任務(wù)二:對四種癌細(xì)胞類型的生存曲線進(jìn)行趨勢檢驗(yàn);任務(wù)三:對四種癌細(xì)胞類型的生存曲線進(jìn)行比較,并檢驗(yàn)5個(gè)協(xié)變量對生存曲線的影響。
【分析與解答】設(shè)所需要的SAS程序如下:
任務(wù)一的主要輸出結(jié)果:兩兩比較。
以上輸出結(jié)果表明:四種癌細(xì)胞類型的患者生存曲線之間差別有統(tǒng)計(jì)學(xué)意義。
以上是在對數(shù)秩檢驗(yàn)后再進(jìn)行兩兩比較的計(jì)算結(jié)果,具體地說,是關(guān)于“四種癌細(xì)胞類型的患者生存曲線兩兩之間的差別”的兩種假設(shè)檢驗(yàn)結(jié)果,一種是未校正的計(jì)算結(jié)果,另一種是基于“Tukey-Kramer法”校正的計(jì)算結(jié)果。其中,腺癌與大細(xì)胞癌、腺癌與鱗癌、大細(xì)胞癌與小細(xì)胞癌、小細(xì)胞癌與鱗癌患者生存曲線之間差異有統(tǒng)計(jì)學(xué)意義。
為節(jié)省篇幅,在采用Wilcoxon檢驗(yàn)后再進(jìn)行兩兩比較的計(jì)算結(jié)果從略。
任務(wù)一的主要輸出結(jié)果:與對照組比較。
以上是基于“對數(shù)秩檢驗(yàn)的多重比較調(diào)整”計(jì)算所得的結(jié)果,此結(jié)果表明:以腺癌為對照組,大細(xì)胞癌和鱗癌與腺癌患者生存函數(shù)之間的差別有統(tǒng)計(jì)學(xué)意義。為節(jié)省篇幅,在采用Wilcoxon檢驗(yàn)后再進(jìn)行與對照組比較的計(jì)算結(jié)果從略。
四種癌細(xì)胞類型的患者生存時(shí)間的P25、P50、均值、P75的計(jì)算結(jié)果見表1。
表1 四種癌細(xì)胞患者生存時(shí)間的4種分位數(shù)計(jì)算結(jié)果
任務(wù)二的主要輸出結(jié)果。
以上輸出的是趨勢檢驗(yàn)結(jié)果:第一行為基于“對數(shù)秩法”計(jì)算的結(jié)果,第二行為基于“威爾科克森法”計(jì)算的結(jié)果,倒數(shù)第三列為雙側(cè)檢驗(yàn)的結(jié)果,倒數(shù)第二列為左單側(cè)檢驗(yàn)的結(jié)果,最后一列為右單側(cè)檢驗(yàn)結(jié)果。
“威爾科克森法”計(jì)算結(jié)果表明:四種癌細(xì)胞類型的患者生存曲線之間不存在遞增或遞減的變化趨勢;而“對數(shù)秩法”計(jì)算結(jié)果表明:四種癌細(xì)胞類型的患者生存曲線之間存在遞增或遞減的變化趨勢(以雙側(cè)檢驗(yàn)為依據(jù))。
任務(wù)三的主要輸出結(jié)果。
以上是基于“威爾科克森法”進(jìn)行單協(xié)變量分析所得的計(jì)算結(jié)果,此結(jié)果表明:僅KPS一個(gè)協(xié)變量對生存函數(shù)的影響有統(tǒng)計(jì)學(xué)意義。
以上是基于“威爾科克森法”進(jìn)行累加協(xié)變量分析所得的計(jì)算結(jié)果,此結(jié)果表明:僅KPS一個(gè)協(xié)變量對生存函數(shù)的影響有統(tǒng)計(jì)學(xué)意義。
為節(jié)省篇幅,采用對數(shù)秩檢驗(yàn)輸出的結(jié)果與前面類似的兩部分計(jì)算結(jié)果從略。
基于“對數(shù)秩法”進(jìn)行單協(xié)變量分析所得的計(jì)算結(jié)果表明:僅KPS一個(gè)協(xié)變量對生存函數(shù)的影響有統(tǒng)計(jì)學(xué)意義。
基于“對數(shù)秩法”進(jìn)行累加協(xié)變量分析所得的計(jì)算結(jié)果表明:僅KPS一個(gè)協(xié)變量對生存函數(shù)的影響有統(tǒng)計(jì)學(xué)意義。
【統(tǒng)計(jì)結(jié)論和專業(yè)結(jié)論】由多重比較的情形一,即兩兩比較的結(jié)果可知:腺癌與大細(xì)胞癌、腺癌與鱗癌、大細(xì)胞癌與小細(xì)胞癌、小細(xì)胞癌與鱗癌患者生存函數(shù)之間差異有統(tǒng)計(jì)學(xué)意義;結(jié)合四種癌細(xì)胞類型患者生存時(shí)間的中位生存期(見表1)可知,大細(xì)胞癌患者的中位生存期最長,鱗癌患者的中位生存期次之,腺癌與小細(xì)胞癌患者的中位生存期相等且最短。
由多重比較的情形二,即與對照組比較的結(jié)果可知:以腺癌為對照組,大細(xì)胞癌和鱗癌與腺癌患者生存函數(shù)之間差異有統(tǒng)計(jì)學(xué)意義;小細(xì)胞癌與腺癌患者生存函數(shù)之間差異無統(tǒng)計(jì)學(xué)意義。專業(yè)結(jié)論與“兩兩比較的結(jié)論”相同。
由趨勢檢驗(yàn)的結(jié)果可知:基于“對數(shù)秩法”和“威爾科克森法”計(jì)算的結(jié)果之間存在矛盾,前者認(rèn)為:四種癌細(xì)胞類型的患者生存曲線之間存在遞增或遞減的變化趨勢(以雙側(cè)檢驗(yàn)為依據(jù));而后者認(rèn)為:四種癌細(xì)胞類型的患者生存曲線之間不存在遞增或遞減的變化趨勢(以雙側(cè)檢驗(yàn)為依據(jù))。
由協(xié)變量檢驗(yàn)的結(jié)果可知:僅KPS一個(gè)協(xié)變量對生存函數(shù)的影響有統(tǒng)計(jì)學(xué)意義。在其他影響因素取特定值的條件下,該變量的取值越大,患者的生存時(shí)間越長。
在對多因素生存資料進(jìn)行假設(shè)檢驗(yàn)時(shí),有一個(gè)值得注意的問題:試驗(yàn)因素各水平下的生存曲線之間的差別,不僅取決于計(jì)算方法(總共有7種,包括似然比檢驗(yàn)方法和六種非參數(shù)檢驗(yàn)方法[1]),還取決于是否考慮分層因素,但與是否考慮協(xié)變量檢驗(yàn)無關(guān)。嚴(yán)格地說,既然是多因素生存資料,在進(jìn)行生存分析時(shí),就應(yīng)當(dāng)同時(shí)考慮全部試驗(yàn)因素、重要非試驗(yàn)因素(即協(xié)變量)及其交互作用項(xiàng)對生存函數(shù)的影響,而不適合進(jìn)行多次單因素分析。一般來說,采取多重回歸分析方法(包括Cox比例風(fēng)險(xiǎn)與非比例風(fēng)險(xiǎn)回歸模型分析法、參數(shù)模型回歸分析法[1-8])處理多因素生存資料,能更真實(shí)地揭示多因素對生存函數(shù)的影響規(guī)律。
本文介紹了生存資料的三種特殊檢驗(yàn)方法,即多重比較、趨勢檢驗(yàn)和協(xié)變量檢驗(yàn)。其中,多重比較包括兩兩比較和與一個(gè)對照組比較的兩種情形,在兩兩比較中,又有約10種具體的校正方法;在趨勢檢驗(yàn)中,包括“對數(shù)秩檢驗(yàn)法”和“威爾科克森檢驗(yàn)法”兩種,它們的計(jì)算結(jié)果可能接近,也可能相差甚遠(yuǎn);在協(xié)變量檢驗(yàn)中,可以對單個(gè)協(xié)變量進(jìn)行檢驗(yàn),也可以對逐次累加的多個(gè)協(xié)變量進(jìn)行檢驗(yàn)。