国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

如何正確運(yùn)用χ2檢驗(yàn)
——生存資料的三種特殊檢驗(yàn)與SAS實(shí)現(xiàn)

2021-11-04 08:31胡純嚴(yán)胡良平
四川精神衛(wèi)生 2021年5期
關(guān)鍵詞:對數(shù)計(jì)算結(jié)果校正

胡純嚴(yán) ,胡良平 ,2*

(1.軍事科學(xué)院研究生院,北京 100850;2.世界中醫(yī)藥學(xué)會(huì)聯(lián)合會(huì)臨床科研統(tǒng)計(jì)學(xué)專業(yè)委員會(huì),北京 100029*通信作者:胡良平,E-mail:lphu927@163.com)

在對生存資料進(jìn)行假設(shè)檢驗(yàn)時(shí),除了在試驗(yàn)因素各水平組之間采取似然比檢驗(yàn)和六種非參數(shù)檢驗(yàn)之外,還有三種特殊的檢驗(yàn),即“多重比較”“趨勢檢驗(yàn)”和“協(xié)變量檢驗(yàn)”[1]。這些假設(shè)檢驗(yàn)方法在本質(zhì)上都屬于“χ2檢驗(yàn)”。本文將詳細(xì)介紹前述提及的三種特殊檢驗(yàn)的計(jì)算公式,結(jié)合實(shí)例并借助SAS軟件實(shí)現(xiàn)統(tǒng)計(jì)計(jì)算。

1 多組生存函數(shù)之間的多重比較

1.1 何為多重比較

設(shè)有K(K>2)組生存函數(shù),若同時(shí)對它們進(jìn)行比較,就叫做整體比較;若每次僅取出兩組進(jìn)行比較,并按以下兩種情形之一完成全部比較,就稱為多重比較:情形一,任何兩組生存函數(shù)之間都要進(jìn)行一次比較,若K=4,總共需要比較6次;情形二,選定一個(gè)對照組,其他組都與此對照組進(jìn)行比較,若K=4,總共需要比較3次。

1.2 多重比較的校正

1.2.1 校正的必要性

當(dāng)需要對K(K>2)組生存函數(shù)進(jìn)行多重比較時(shí),基于前述提及的兩種情形,都至少需要比較2次。若每次比較都設(shè)定檢驗(yàn)水準(zhǔn)為α(通常設(shè)α=0.05),設(shè)總共需要比較m次,m的計(jì)算公式如下:

于是,m次比較所對應(yīng)的犯I類錯(cuò)誤的總概率PT就會(huì)大于α,其計(jì)算方法[1]如下:

PT=1-(1-α)m

例如,當(dāng)m=6、α=0.05時(shí),PT=0.264908>0.05。

為此,需要對每次比較所得的概率P值進(jìn)行校正,以保證整個(gè)多重比較所對應(yīng)的犯I類錯(cuò)誤的總概率PT小于等于α。

1.2.2 校正方法的種類

在 SAS/STAT 的“LIFETEST”過程中[1],基于不同的統(tǒng)計(jì)學(xué)原理,對多重比較結(jié)果進(jìn)行概率校正的方法有如下幾種:Bonferroni校正法、Dunnett-Hsu校正法、Scheffé校正法、?idák校正法、SMM校正法和Tukey校正法。

1.2.3 多重比較中變量的定義

1.2.4 多重比較中每次比較的共同檢驗(yàn)統(tǒng)計(jì)量

將第j組與第l組中生存函數(shù)進(jìn)行雙側(cè)檢驗(yàn)所對應(yīng)的檢驗(yàn)統(tǒng)計(jì)量按下式計(jì)算:

直接計(jì)算出來的P值(也稱為原始P值)由下式計(jì)算:

1.2.5 多重比較中六種校正P值的計(jì)算公式

Bonferroni校正法計(jì)算P值的公式如下:

Dunnett-Hsu校正法計(jì)算P值的公式如下:

設(shè)以第一組為對照組,讓C=(cij)代表(r-1)×(r)階對比矩陣,即:

讓∑≡(σij)與R≡(rij)分別代表矩陣Cv的協(xié)方差矩陣與相關(guān)矩陣,即:

【說明】此處涉及“v”與“V”,V是v的方差。v和V的計(jì)算比較復(fù)雜,將在下文詳細(xì)介紹。

于是,Hsu于1992年提出,從因子分解的協(xié)方差中近似求出λ1,λ2,…,λr-1,從而構(gòu)造出以下方程式:

R=D+ λλ'

這里,D是一個(gè)對角矩陣,其對角線上第j個(gè)元素為1-λj,而且,λ =(λ1,λ2,…,λ)'。于是,校正r-1的P值可通過下式計(jì)算:

采用 Scheffé校正法、?idák 校正法、SMM 校正法、Tukey校正法計(jì)算P值的公式分別見式(5)、式(6)、式(7)、式(8):

2 未分層生存函數(shù)趨勢檢驗(yàn)

2.1 未分層生存函數(shù)趨勢檢驗(yàn)的檢驗(yàn)假設(shè)

Klein和Moeschberger于1997年提出了生存資料的趨勢檢驗(yàn)方法,該法有如下兩個(gè)備擇檢驗(yàn)假設(shè),根據(jù)實(shí)際資料,選擇其中之一。

H2:S1(t)≥S2(t)≥ …≥SK(t),t≤τ,至少有一個(gè)不等式成立;

或H2:S1(t)≤S2(t)≤ …≤SK(t),t≤τ,至少有一個(gè)不等式成立。

2.2 未分層生存函數(shù)趨勢檢驗(yàn)的假設(shè)檢驗(yàn)的計(jì)算公式

讓a1<a2<…<aK代表與K個(gè)樣本有關(guān)聯(lián)的一組得分,則在H0成立的條件下,對應(yīng)的檢驗(yàn)統(tǒng)計(jì)量如下:

3 協(xié)變量的秩檢驗(yàn)

3.1 協(xié)變量及其處理方法簡介

在生存資料的差異性分析中,通常涉及定性的影響因素(包括試驗(yàn)因素和/或分層因素,后者在本質(zhì)上屬于“重要非試驗(yàn)因素”)和定量的結(jié)果變量(即生存時(shí)間)。然而,在很多生存資料中,還涉及定量的和二值的影響因素或自變量,它們常被稱為“協(xié)變量”??疾靺f(xié)變量對生存函數(shù)的影響,最常見的做法是把所有需要考察的“影響因素(包括試驗(yàn)因素、重要非試驗(yàn)因素和協(xié)變量)”都當(dāng)作自變量,把生存時(shí)間或生存時(shí)間的函數(shù)作為因變量,進(jìn)行生存資料的多重回歸分析。當(dāng)因變量為生存時(shí)間時(shí),需要擬合生存資料的參數(shù)回歸模型;當(dāng)因變量為生存時(shí)間的函數(shù)(例如危險(xiǎn)率函數(shù))時(shí),需要擬合COX比例風(fēng)險(xiǎn)或非比例風(fēng)險(xiǎn)回歸模型。在SAS/STAT的“LIFETEST”過程中,還介紹了另一種處理協(xié)變量的方法,即采用“秩檢驗(yàn)”來研究協(xié)變量對生存函數(shù)的影響是否有統(tǒng)計(jì)學(xué)意義。

3.2 單協(xié)變量秩檢驗(yàn)統(tǒng)計(jì)量

單協(xié)變量時(shí),檢驗(yàn)其對生存函數(shù)的影響是否有統(tǒng)計(jì)學(xué)意義,所對應(yīng)的秩檢驗(yàn)統(tǒng)計(jì)量見式(10):

在式(10)中,χ2服從自由度為1的χ2分布;v為基于協(xié)變量計(jì)算得到的“一般秩統(tǒng)計(jì)量”;V是v的方差。

3.3 多協(xié)變量秩檢驗(yàn)統(tǒng)計(jì)量

多協(xié)變量時(shí),檢驗(yàn)它們對生存函數(shù)的影響是否有統(tǒng)計(jì)學(xué)意義,所對應(yīng)的秩檢驗(yàn)統(tǒng)計(jì)量見式(11):

在式(11)中,χ2服從自由度為df的χ2分布;自由度df為“當(dāng)前”所考查的協(xié)變量的個(gè)數(shù);v為基于協(xié)變量向量計(jì)算得到的“一般秩統(tǒng)計(jì)量”;V是基于v的“方差與協(xié)方差矩陣”,此矩陣主對角線上的元素就是與各協(xié)變量對應(yīng)的“一般秩統(tǒng)計(jì)量”的方差。

值得注意的是:式(11)不是一個(gè)恒定的公式,其中所包含的協(xié)變量的個(gè)數(shù)由1個(gè)逐漸遞增到全部需要考查的協(xié)變量(不妨設(shè)共有L個(gè)協(xié)變量),每次都對應(yīng)著一個(gè)χ2檢驗(yàn)結(jié)果(包括一個(gè)χ2值和一個(gè)P值)。首先基于單協(xié)變量檢驗(yàn)法選取對生存函數(shù)影響最大的單個(gè)協(xié)變量,第二次選取能使χ2值獲得最大增量的協(xié)變量,依次類推,逐一增加協(xié)變量,直至需要考查的協(xié)變量全部進(jìn)入式(11)。例如:在本文例1中考慮了5個(gè)協(xié)變量,經(jīng)過5次搜索并代入式(11)計(jì)算,由輸出結(jié)果(參見本文例1中輸出結(jié)果最后部分“對數(shù)秩檢驗(yàn)的卡方向前逐步序列”)第二列可以看出,自由度數(shù)目在逐次增加1;由第三列可以看出,χ2值逐漸增大;由第5列可看出,χ2值的增量逐漸減小,因?yàn)楹竺孢x取的協(xié)變量比之前選取的協(xié)變量對生存函數(shù)的影響小。由于式(10)是式(11)的特例,故下面僅針對式(11),介紹其有關(guān)細(xì)節(jié)。

3.4 式(11)中的有關(guān)細(xì)節(jié)

3.4.1 一般秩統(tǒng)計(jì)量的計(jì)算公式

在式(11)中,v為基于協(xié)變量計(jì)算得到的“一般秩統(tǒng)計(jì)量”,當(dāng)只考查一個(gè)協(xié)變量時(shí),其計(jì)算結(jié)果就是一個(gè)具體的“秩和”;當(dāng)考查的協(xié)變量個(gè)數(shù)大于等于2時(shí),其計(jì)算結(jié)果就是一個(gè)“向量”,其各分量是與各協(xié)變量對應(yīng)的“秩和”。v的計(jì)算方法如下:

在式(12)中,n為總樣本含量;Cα,δα為秩得分(即把生存時(shí)間數(shù)據(jù)按由小到大排序并賦予秩次或稱為打分),δα為指示變量,δα=1代表觀測到的為“事件(即準(zhǔn)確的生存時(shí)間)”,δα=0代表觀測到的為“刪失(即截尾的生存時(shí)間)”;Zα是與第α個(gè)觀測或個(gè)體對應(yīng)的全部協(xié)變量取值組成的向量。

在SAS/STAT的“LIFETEST”過程中,有兩種定義秩得分Cα,δα的方法,分別為“對數(shù)秩秩得分”和“威爾科克森秩得分”。

3.4.2 對數(shù)秩秩得分的計(jì)算公式

對數(shù)秩秩得分的定義如下:

在式(13)中,j為排序后的事件時(shí)間的編號(hào),其對應(yīng)的時(shí)間記為t(j);ta代表所有的排序時(shí)間(包括事件時(shí)間和刪失時(shí)間);nj為恰好在t(j)之前危險(xiǎn)集中個(gè)體的數(shù)目。

3.4.3 威爾科克森秩得分的計(jì)算公式

威爾科克森秩得分的定義如下:

式(14)中各變量的含義與式(13)相同,此處不再贅述。

3.4.4 用于估計(jì)對數(shù)秩統(tǒng)計(jì)量的協(xié)方差矩陣的計(jì)算公式

用于估計(jì)對數(shù)秩統(tǒng)計(jì)量的協(xié)方差矩陣的計(jì)算方法見式(15):

在式(15)中,Vi是在時(shí)刻t(i)風(fēng)險(xiǎn)集的校正平方和以及交叉乘積和矩陣,其計(jì)算方法如下:

3.4.5 用于估計(jì)威爾科克森統(tǒng)計(jì)量的協(xié)方差矩陣的計(jì)算公式

用于估計(jì)威爾科克森統(tǒng)計(jì)量的協(xié)方差矩陣的計(jì)算公式見式(18):

式(18)中A和B的計(jì)算公式分別見式(19)、式(20):

在式(19)、式(20)中,有關(guān)變量的含義如下:

【說明】為便于理解,對以上公式的內(nèi)容扼要梳理:式(11)中的“v”由式(12)給出;式(11)中的“V”由式(15)或式(18)給出;式(10)的更一般表達(dá)見式(25):

在式(25)中,vi是式(12)中第i個(gè)分量;Vii是式(15)或式(18)中矩陣V的主對角線上第i個(gè)元素。

4 實(shí)例及SAS實(shí)現(xiàn)

4.1 問題與數(shù)據(jù)

【例1】沿用本期科研方法專題《如何正確運(yùn)用χ2檢驗(yàn)——生存資料的似然比檢驗(yàn)與六種非參數(shù)檢驗(yàn)與SAS實(shí)現(xiàn)》一文中“例2的問題與數(shù)據(jù)”,試完成下列三項(xiàng)任務(wù):任務(wù)一:對四種癌細(xì)胞類型的生存曲線進(jìn)行兩種情形下的多重比較;任務(wù)二:對四種癌細(xì)胞類型的生存曲線進(jìn)行趨勢檢驗(yàn);任務(wù)三:對四種癌細(xì)胞類型的生存曲線進(jìn)行比較,并檢驗(yàn)5個(gè)協(xié)變量對生存曲線的影響。

4.2 SAS實(shí)現(xiàn)

【分析與解答】設(shè)所需要的SAS程序如下:

任務(wù)一的主要輸出結(jié)果:兩兩比較。

以上輸出結(jié)果表明:四種癌細(xì)胞類型的患者生存曲線之間差別有統(tǒng)計(jì)學(xué)意義。

以上是在對數(shù)秩檢驗(yàn)后再進(jìn)行兩兩比較的計(jì)算結(jié)果,具體地說,是關(guān)于“四種癌細(xì)胞類型的患者生存曲線兩兩之間的差別”的兩種假設(shè)檢驗(yàn)結(jié)果,一種是未校正的計(jì)算結(jié)果,另一種是基于“Tukey-Kramer法”校正的計(jì)算結(jié)果。其中,腺癌與大細(xì)胞癌、腺癌與鱗癌、大細(xì)胞癌與小細(xì)胞癌、小細(xì)胞癌與鱗癌患者生存曲線之間差異有統(tǒng)計(jì)學(xué)意義。

為節(jié)省篇幅,在采用Wilcoxon檢驗(yàn)后再進(jìn)行兩兩比較的計(jì)算結(jié)果從略。

任務(wù)一的主要輸出結(jié)果:與對照組比較。

以上是基于“對數(shù)秩檢驗(yàn)的多重比較調(diào)整”計(jì)算所得的結(jié)果,此結(jié)果表明:以腺癌為對照組,大細(xì)胞癌和鱗癌與腺癌患者生存函數(shù)之間的差別有統(tǒng)計(jì)學(xué)意義。為節(jié)省篇幅,在采用Wilcoxon檢驗(yàn)后再進(jìn)行與對照組比較的計(jì)算結(jié)果從略。

四種癌細(xì)胞類型的患者生存時(shí)間的P25、P50、均值、P75的計(jì)算結(jié)果見表1。

表1 四種癌細(xì)胞患者生存時(shí)間的4種分位數(shù)計(jì)算結(jié)果

任務(wù)二的主要輸出結(jié)果。

以上輸出的是趨勢檢驗(yàn)結(jié)果:第一行為基于“對數(shù)秩法”計(jì)算的結(jié)果,第二行為基于“威爾科克森法”計(jì)算的結(jié)果,倒數(shù)第三列為雙側(cè)檢驗(yàn)的結(jié)果,倒數(shù)第二列為左單側(cè)檢驗(yàn)的結(jié)果,最后一列為右單側(cè)檢驗(yàn)結(jié)果。

“威爾科克森法”計(jì)算結(jié)果表明:四種癌細(xì)胞類型的患者生存曲線之間不存在遞增或遞減的變化趨勢;而“對數(shù)秩法”計(jì)算結(jié)果表明:四種癌細(xì)胞類型的患者生存曲線之間存在遞增或遞減的變化趨勢(以雙側(cè)檢驗(yàn)為依據(jù))。

任務(wù)三的主要輸出結(jié)果。

以上是基于“威爾科克森法”進(jìn)行單協(xié)變量分析所得的計(jì)算結(jié)果,此結(jié)果表明:僅KPS一個(gè)協(xié)變量對生存函數(shù)的影響有統(tǒng)計(jì)學(xué)意義。

以上是基于“威爾科克森法”進(jìn)行累加協(xié)變量分析所得的計(jì)算結(jié)果,此結(jié)果表明:僅KPS一個(gè)協(xié)變量對生存函數(shù)的影響有統(tǒng)計(jì)學(xué)意義。

為節(jié)省篇幅,采用對數(shù)秩檢驗(yàn)輸出的結(jié)果與前面類似的兩部分計(jì)算結(jié)果從略。

基于“對數(shù)秩法”進(jìn)行單協(xié)變量分析所得的計(jì)算結(jié)果表明:僅KPS一個(gè)協(xié)變量對生存函數(shù)的影響有統(tǒng)計(jì)學(xué)意義。

基于“對數(shù)秩法”進(jìn)行累加協(xié)變量分析所得的計(jì)算結(jié)果表明:僅KPS一個(gè)協(xié)變量對生存函數(shù)的影響有統(tǒng)計(jì)學(xué)意義。

【統(tǒng)計(jì)結(jié)論和專業(yè)結(jié)論】由多重比較的情形一,即兩兩比較的結(jié)果可知:腺癌與大細(xì)胞癌、腺癌與鱗癌、大細(xì)胞癌與小細(xì)胞癌、小細(xì)胞癌與鱗癌患者生存函數(shù)之間差異有統(tǒng)計(jì)學(xué)意義;結(jié)合四種癌細(xì)胞類型患者生存時(shí)間的中位生存期(見表1)可知,大細(xì)胞癌患者的中位生存期最長,鱗癌患者的中位生存期次之,腺癌與小細(xì)胞癌患者的中位生存期相等且最短。

由多重比較的情形二,即與對照組比較的結(jié)果可知:以腺癌為對照組,大細(xì)胞癌和鱗癌與腺癌患者生存函數(shù)之間差異有統(tǒng)計(jì)學(xué)意義;小細(xì)胞癌與腺癌患者生存函數(shù)之間差異無統(tǒng)計(jì)學(xué)意義。專業(yè)結(jié)論與“兩兩比較的結(jié)論”相同。

由趨勢檢驗(yàn)的結(jié)果可知:基于“對數(shù)秩法”和“威爾科克森法”計(jì)算的結(jié)果之間存在矛盾,前者認(rèn)為:四種癌細(xì)胞類型的患者生存曲線之間存在遞增或遞減的變化趨勢(以雙側(cè)檢驗(yàn)為依據(jù));而后者認(rèn)為:四種癌細(xì)胞類型的患者生存曲線之間不存在遞增或遞減的變化趨勢(以雙側(cè)檢驗(yàn)為依據(jù))。

由協(xié)變量檢驗(yàn)的結(jié)果可知:僅KPS一個(gè)協(xié)變量對生存函數(shù)的影響有統(tǒng)計(jì)學(xué)意義。在其他影響因素取特定值的條件下,該變量的取值越大,患者的生存時(shí)間越長。

5 討論與小結(jié)

5.1 討論

在對多因素生存資料進(jìn)行假設(shè)檢驗(yàn)時(shí),有一個(gè)值得注意的問題:試驗(yàn)因素各水平下的生存曲線之間的差別,不僅取決于計(jì)算方法(總共有7種,包括似然比檢驗(yàn)方法和六種非參數(shù)檢驗(yàn)方法[1]),還取決于是否考慮分層因素,但與是否考慮協(xié)變量檢驗(yàn)無關(guān)。嚴(yán)格地說,既然是多因素生存資料,在進(jìn)行生存分析時(shí),就應(yīng)當(dāng)同時(shí)考慮全部試驗(yàn)因素、重要非試驗(yàn)因素(即協(xié)變量)及其交互作用項(xiàng)對生存函數(shù)的影響,而不適合進(jìn)行多次單因素分析。一般來說,采取多重回歸分析方法(包括Cox比例風(fēng)險(xiǎn)與非比例風(fēng)險(xiǎn)回歸模型分析法、參數(shù)模型回歸分析法[1-8])處理多因素生存資料,能更真實(shí)地揭示多因素對生存函數(shù)的影響規(guī)律。

5.2 小結(jié)

本文介紹了生存資料的三種特殊檢驗(yàn)方法,即多重比較、趨勢檢驗(yàn)和協(xié)變量檢驗(yàn)。其中,多重比較包括兩兩比較和與一個(gè)對照組比較的兩種情形,在兩兩比較中,又有約10種具體的校正方法;在趨勢檢驗(yàn)中,包括“對數(shù)秩檢驗(yàn)法”和“威爾科克森檢驗(yàn)法”兩種,它們的計(jì)算結(jié)果可能接近,也可能相差甚遠(yuǎn);在協(xié)變量檢驗(yàn)中,可以對單個(gè)協(xié)變量進(jìn)行檢驗(yàn),也可以對逐次累加的多個(gè)協(xié)變量進(jìn)行檢驗(yàn)。

猜你喜歡
對數(shù)計(jì)算結(jié)果校正
明晰底數(shù)間的區(qū)別,比較對數(shù)式的大小
基于串聯(lián)校正原理的LTI 系統(tǒng)校正實(shí)驗(yàn)綜述報(bào)告
比較底數(shù)不同的兩個(gè)對數(shù)式大小的方法
劉光第《南旋記》校正
一種具有自動(dòng)校正裝置的陶瓷切邊機(jī)
活用對數(shù)換底公式及推論
神奇的對數(shù)換底公式
趣味選路
扇面等式
求離散型隨機(jī)變量的分布列的幾種思維方式
东源县| 阿拉善左旗| 台江县| 库车县| 闽清县| 碌曲县| 阳泉市| 阳信县| 英德市| 西乌| 左权县| 清苑县| 新昌县| 浙江省| 上杭县| 林西县| 黔西| 临夏县| 乡城县| 灵山县| 嘉兴市| 留坝县| 灵川县| 遂宁市| 乐陵市| 延长县| 磐安县| 通许县| 宜宾市| 安图县| 嘉鱼县| 古交市| 南召县| 南华县| 张北县| 安庆市| 临安市| 包头市| 崇文区| 秦皇岛市| 思南县|