国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

含特定比例均勻隨機刪失生存數(shù)據(jù)的SAS模擬實現(xiàn)*

2017-01-10 03:46肖媛媛許傳志趙耐青
中國衛(wèi)生統(tǒng)計 2016年6期
關(guān)鍵詞:均勻分布宏程序比例

肖媛媛許傳志趙耐青

含特定比例均勻隨機刪失生存數(shù)據(jù)的SAS模擬實現(xiàn)*

肖媛媛1許傳志1趙耐青2△

刪失(censoring)是生存分析時經(jīng)常會遇到的一個實際問題,為生存數(shù)據(jù)的處理分析帶來了一定困難。針對這一問題,在實際研究中往往需要通過隨機模擬來產(chǎn)生含一定刪失比例的特定生存分布數(shù)據(jù),供探索性研究或?qū)Ρ刃匝芯渴褂谩N墨I(xiàn)檢索后發(fā)現(xiàn),目前國內(nèi)外針對刪失生存數(shù)據(jù)的模擬研究數(shù)量較少[1-3]。

按照其發(fā)生是否與研究對象的其他特征有關(guān),刪失分為隨機刪失(random censoring)和非隨機刪失(non-random censoring)兩類,即非信息刪失(non-informative censoring)和信息刪失(informative censoring)[4]。由于非隨機刪失的影響因素眾多,故其特征難以全面捕捉,因此目前在模擬產(chǎn)生含刪失的生存分析數(shù)據(jù)時,大都假定為完全隨機刪失。

本文針對現(xiàn)有模擬思路和方法中存在的某些問題或疑議,提出一種模擬產(chǎn)生含特定比例均勻隨機刪失生存數(shù)據(jù)的思路,以及實現(xiàn)這一思路的SAS宏程序,為科學(xué)工作者開展生存分析提供便利。

現(xiàn)有方法回顧

模擬產(chǎn)生含隨機刪失的生存數(shù)據(jù)時,步驟一般為:先產(chǎn)生符合特定分布的完整數(shù)據(jù),再在此基礎(chǔ)上產(chǎn)生刪失數(shù)據(jù)。

生成完整數(shù)據(jù)時,一般采用的是Bender等2005年提出的模擬方法[5]。該方法的基本思想是,從某一時刻風(fēng)險函數(shù)的一般表達(dá)式入手:

得到當(dāng)前時刻仍存活的概率為:

假設(shè)Y是函數(shù)F的自變量,如果生存曲線足夠平滑,可以得知服從在[0,1]區(qū)間上的均勻分布,同樣可得知,1-F(Y)也服從在[0,1]上的均勻分布,即U=exp[-H0(t)exp(β′X)]服從[0,1]上的均勻分布U[0,1]。

假設(shè)生存時間為T,對前式取反函數(shù),得到:

基于上述思想,根據(jù)目標(biāo)生存分布所對應(yīng)的累積風(fēng)險函數(shù)表達(dá)式H0和隨機模擬產(chǎn)生的均勻分布U,即可產(chǎn)生目標(biāo)生存時間。Weibull分布的累積風(fēng)險函數(shù)表達(dá)式為:

因此可得到其生存時間T的計算公式為:

在進(jìn)一步產(chǎn)生含隨機刪失的生存數(shù)據(jù)時,一般的思路為:假設(shè)生存時間T和刪失時間C服從相互獨立的兩個分布S(T)和B(C)。在模擬研究中,S(T)的參數(shù)已經(jīng)設(shè)定,可以順利產(chǎn)生生存時間Ti。再根據(jù)定義的刪失分布類型(即刪失發(fā)生時間的概率分布),如指數(shù)分布或均勻分布,結(jié)合設(shè)定的刪失比例,采用迭代或近似公式計算的方法得到刪失時間分布的參數(shù),在此基礎(chǔ)上隨機產(chǎn)生刪失時間Ci。最后通過比較生存時間Ti和刪失時間Ci的大小,形成結(jié)構(gòu)為(Ai,Ii)的數(shù)據(jù)形式。其中,A=min(T,C),I為指示變量,T<C時等于1,指代事件發(fā)生,T>C時等于0,指代截尾發(fā)生。

不難看出,通過上述模擬方法,確實可以順利得到隨機刪失的生存數(shù)據(jù),即刪失的發(fā)生與否與生存時間長短無關(guān)。但其在邏輯架構(gòu)上卻存在不恰當(dāng)之處。其一,我們通過S(T)已經(jīng)得到了“真實”的生存時間T,而按照定義,刪失的發(fā)生時間一定是小于真實生存時間的,即C一定小于T。而按照上述方法,將T和C完全當(dāng)作兩個相互獨立的分布來模擬,則可能出現(xiàn)C>T的情況。雖然在上述方法中,正好將這種情況定義為事件發(fā)生,但顯然已經(jīng)混淆了真實情況下事件發(fā)生的概念。其二,刪失分布一定是在真實生存時間T確定的基礎(chǔ)上,刪失時間C的概率分布,如某觀察對象真實生存時間為Ti,又已知其發(fā)生了刪失,假設(shè)其刪失分布為均勻分布,則表示Ci在[0,Ti]范圍內(nèi)取任意值的概率相等。因此,上述方法直接在同一時間維度上同時定義真實生存分布和刪失分布,同樣有悖常理。除此之外,在估計刪失分布的參數(shù)時,有學(xué)者提及的“迭代法”缺乏明確、詳細(xì)的出處和表述,按照Halabi等提出的公式計算得到的刪失分布參數(shù),經(jīng)實際驗證卻不能得到預(yù)先設(shè)定的刪失比例[6]。

模擬思路

由于現(xiàn)有模擬方法中存在著如上所述的問題或疑議,我們按照如下思路模擬產(chǎn)生含特定比例均勻隨機刪失的生存數(shù)據(jù):

步驟一:按照如前所述的步驟生成樣本含量為N的特定分布的完整生存數(shù)據(jù);

步驟二:根據(jù)預(yù)先設(shè)定的刪失比例P,在其中隨機抽取N×P個觀測,作為“刪失觀測”;

步驟三:每個刪失觀測的真實生存時間為Ti,由于為均勻刪失,因此在[0,Ti]的均勻分布上隨機產(chǎn)生其刪失時間Ci;

步驟四:將刪失觀測的刪失時間Ci與其他未刪失觀測的真實生存時間Tj整合為同一變量,定義為觀察時間,另外增加指示變量I,I=1表示發(fā)生結(jié)局,I=0表示刪失。

SAS模擬宏程序

模擬宏程序以理論生存時間滿足Weibull分布為例,讀者可自行拓展至指數(shù)分布和Gompertz分布,也可重新定義研究變量的數(shù)量、類型及參數(shù),程序中只分析了單一的二項分布自變量factor1~B(1,0.5)。

具體程序如下:

討 論

在當(dāng)前研究中,我們針對現(xiàn)有刪失生存數(shù)據(jù)模擬方法中存在的問題和疑議,提出了一種含特定比例均勻隨機刪失生存數(shù)據(jù)的模擬方法,并給出了實現(xiàn)這一方法的SAS宏程序。經(jīng)反復(fù)驗證,這一宏程序能正確產(chǎn)生設(shè)定特征的刪失生存數(shù)據(jù)。

模擬產(chǎn)生具有不同刪失特征的生存數(shù)據(jù),對于探索生存分析方法并驗證其價值來說,有著十分重要的意義。在當(dāng)前研究中,我們僅設(shè)定了非常理想化的假設(shè)前提:即刪失的發(fā)生完全隨機,且刪失分布滿足最簡單的均勻分布。需要指出的是,在現(xiàn)實情況下,生存數(shù)據(jù)中刪失的發(fā)生及其分布特征可能千變?nèi)f化。雖然無法對每一種可能都進(jìn)行模擬,但以下兩個方向卻值得進(jìn)一步研究:

方向一:同樣在完全隨機刪失的假設(shè)前提下,研究不同刪失分布類型生存數(shù)據(jù)的模擬實現(xiàn),如指數(shù)分布、對數(shù)分布等。

方向二:在方向一研究的基礎(chǔ)上,進(jìn)一步打破“完全隨機刪失”這一強假定,探索當(dāng)刪失的發(fā)生和理論生存時間之間存在關(guān)聯(lián),且滿足不同的關(guān)聯(lián)模式時,含不同刪失比例、不同刪失分布生存數(shù)據(jù)的模擬實現(xiàn)。

[1]高峻,董偉,高爾生,等.多結(jié)局生存分析模型與Cox模型的隨機模擬比較.中國衛(wèi)生統(tǒng)計,2007,20(3):248-251.

[2]錢俊,張超,陳平雁.模擬研究中隨機數(shù)據(jù)的產(chǎn)生及SAS實現(xiàn).中國衛(wèi)生統(tǒng)計,2008,21(6):704-706.

[3]錢俊,劉國慶,周業(yè)明.不同刪失比例下生存數(shù)據(jù)模擬生成的方法.?dāng)?shù)理醫(yī)藥學(xué)雜志,2013,26(6):644-646.

[4]Leung KM,Elashoff RM,Afifi AA.Censoring issues in survival analysis.Annual Review of Public Health,1997,18:83-104.

[5]Bender R,Augustin T,Blettner M.Generating survival times to simulate Cox proportional hazardsmodels.Statistics in Medicine,2005,24(11):1713-1723.

[6]Halabi S,Singh B.Sample size determ ination for comparing several survival curves w ith unequal allocations.Statistics in Medicine,2004,23(11):1793-1815.

(責(zé)任編輯:劉 壯)

國家自然科學(xué)基金(81460519);云南省自然科學(xué)基金(2013FZ064)

1.昆明醫(yī)科大學(xué)公共衛(wèi)生學(xué)院流行病與衛(wèi)生統(tǒng)計學(xué)系(650500)

2.復(fù)旦大學(xué)公共衛(wèi)生學(xué)院生物統(tǒng)計學(xué)教研室

△通信作者:趙耐青,E-mail:nqzhao1954@163.com

猜你喜歡
均勻分布宏程序比例
橢球槽宏程序編制及其Vericut仿真
人體比例知多少
用修正漸開線投影法螺旋銑球面宏程序的編制
應(yīng)用Fanuc宏程序的球面螺旋加工程序編制
電磁感應(yīng)綜合應(yīng)用檢測題
可逆隨機數(shù)生成器的設(shè)計
尼龍纖維分布情況對砂漿性能的影響研究
按事故責(zé)任比例賠付
限制支付比例只是治標(biāo)