山西醫(yī)科大學(xué)衛(wèi)生統(tǒng)計教研室(030001) 梁 潔 王 彤崔 燕
?
Ⅱ型區(qū)間刪失數(shù)據(jù)的生存分析
山西醫(yī)科大學(xué)衛(wèi)生統(tǒng)計教研室(030001) 梁 潔 王 彤△崔 燕
例:用兩種療法治療94名乳腺癌患者隨訪數(shù)月后的結(jié)果,其中針對46名乳腺癌患者用放射性療法(RT)治療,另48名乳腺癌患者用放射性療法加輔助性化學(xué)療法(RCT)治療,每4~6個月隨訪一次,觀察乳腺收縮情況,比較兩種療法的優(yōu)劣[1]。
表1 兩種療法治療94名乳腺癌患者隨訪數(shù)月后結(jié)果
表1中數(shù)據(jù)包含了不同患者乳腺收縮的時間信息,但沒有觀察到精確時間,其中38名患者在隨訪結(jié)束時仍沒有觀察到乳腺收縮,此為右刪失數(shù)據(jù);另56名患者的乳腺收縮時間落在不同時間區(qū)間內(nèi),例如觀察時間(6,10],表示在第6個月隨訪時患者未出現(xiàn)乳腺收縮,但是在下一次隨訪,即第10個月時,患者出現(xiàn)了乳腺收縮,乳腺收縮情況出現(xiàn)在第6個月至第10個月兩次隨訪之間,但精確的時間未知,此為Ⅱ型區(qū)間刪失數(shù)據(jù)。當(dāng)數(shù)據(jù)中包含精確數(shù)據(jù),左/右刪失數(shù)據(jù)及Ⅱ型區(qū)間刪失數(shù)據(jù)時,稱其為混合區(qū)間刪失數(shù)據(jù)。
Ⅱ型區(qū)間刪失主要發(fā)生在需要定期隨訪觀察的醫(yī)療研究數(shù)據(jù)中,許多臨床試驗和縱向研究都存在這種現(xiàn)象,如腫瘤發(fā)病率的研究,AIDS的臨床醫(yī)學(xué)研究等。由于在實際隨訪中,有些患者不是按照預(yù)先確定的觀測時間進(jìn)行觀察,而是選擇在較方便的時間進(jìn)行觀察;有些患者可能會錯過一個或多個觀察后再繼續(xù)進(jìn)行觀察。因此不同患者的隨訪觀察時間是不同的,研究者只能得到患者在出現(xiàn)某個結(jié)局之前最后一次臨床觀察的時間和出現(xiàn)此結(jié)局之后第一次臨床觀察的時間,即Ⅱ型區(qū)間刪失數(shù)據(jù)。如何正確處理此類數(shù)據(jù)是得出正確結(jié)論的關(guān)鍵。Ⅱ型區(qū)間刪失數(shù)據(jù)既不同于可以精確測得的數(shù)據(jù),又不同于缺失數(shù)據(jù),我們要根據(jù)其提供的不完整的數(shù)據(jù)信息,來估計出相對穩(wěn)定的回歸模型參數(shù),從而解決臨床實際問題。
處理此類數(shù)據(jù)的傳統(tǒng)方法有:
(1)忽略Ⅱ型區(qū)間刪失數(shù)據(jù),用剩余數(shù)據(jù)進(jìn)行生存分析。顯然這種方法會丟失數(shù)據(jù)信息,尤其在Ⅱ型區(qū)間刪失比例較大的情況下(本例Ⅱ型區(qū)間刪失數(shù)據(jù)的比例為59.6%),得到的結(jié)果通常是有偏的,不可信的。
(2)Ad hoc:用區(qū)間左端點、右端點或中點代替區(qū)間刪失數(shù)據(jù)。Flygare(1985)[2]用兩參數(shù)Weibull回歸模型,分別求得參數(shù)的最大似然估計值(MLE)以及用區(qū)間中點替代刪失數(shù)據(jù)后的參數(shù)估計值(MDE),并對兩者進(jìn)行比較,發(fā)現(xiàn)在刪失比例較大時,MDE可能會造成對參數(shù)系統(tǒng)性的錯估,MLE優(yōu)于MDE。Wei (1989)[3]將中點填補法應(yīng)用于刪失比例較小且區(qū)間寬度較窄的Ⅱ型區(qū)間刪失數(shù)據(jù),但當(dāng)刪失比例較大、區(qū)間寬度較寬且有變異時,此法對經(jīng)驗生存函數(shù)估計會產(chǎn)生偏倚,導(dǎo)致估計參數(shù)有偏,并低估回歸系數(shù)的標(biāo)準(zhǔn)誤。
為了更好地利用Ⅱ型區(qū)間刪失數(shù)據(jù)信息,獲得更精確的參數(shù)估計值,并克服復(fù)雜的計算過程,解決含有Ⅱ型區(qū)間刪失數(shù)據(jù)的回歸分析方法有:參數(shù)回歸分析,半?yún)?shù)回歸分析,非參數(shù)最大似然估計以及填補法。
1.參數(shù)回歸分析
目前對于Ⅱ型區(qū)間刪失數(shù)據(jù)的處理方法多為半?yún)?shù)回歸分析和非參數(shù)回歸分析方法,參數(shù)回歸分析方法研究相對較少。Lindsey(1998)[5]總結(jié)了含有混合區(qū)間刪失數(shù)據(jù)的參數(shù)回歸分析,分別在9種不同的分布假設(shè)下,對3個存在嚴(yán)重混合區(qū)間刪失數(shù)據(jù)的實例進(jìn)行模擬。發(fā)現(xiàn)對嚴(yán)重混合區(qū)間刪失數(shù)據(jù)進(jìn)行參數(shù)估計時,改變分布假設(shè)后所得估計結(jié)果很穩(wěn)健,并且與相應(yīng)的非參數(shù)模型相比,參數(shù)模型包含了更多的數(shù)據(jù)信息,而且可以直接利用最大似然的理論來實現(xiàn)。在分析Ⅱ型區(qū)間刪失數(shù)據(jù)或混合區(qū)間刪失數(shù)據(jù)時,常用的參數(shù)回歸模型包括線性回歸模型和Weibull回歸模型。
(1)線性回歸模型:G′omez(2003)[6]假設(shè)自變量為離散型分布,在線性回歸模型基礎(chǔ)上,用普通最小二乘法與兩步條件算法聯(lián)合估計回歸系數(shù)和協(xié)變量的邊際分布。但對于自變量為連續(xù)性分布的Ⅱ型區(qū)間刪失數(shù)據(jù),其聯(lián)合似然方程很復(fù)雜,此法不適用。G′omez (2005)[7]用優(yōu)化技術(shù)對其進(jìn)行改進(jìn),但是這種優(yōu)化技術(shù)仍然不適用于自變量連續(xù)性分布的Ⅱ型區(qū)間刪失數(shù)據(jù)。為解決這個問題,Calle(2005)[8]提出了半?yún)?shù)貝葉斯方法,用Dirichlet混合過程指定模型中除Ⅱ型區(qū)間刪失協(xié)變量以外的所有成分并將其參數(shù)化,但是其迭代算法和抽樣過程十分復(fù)雜耗時。丁邦?。?012)[9]假設(shè)自變量為離散分布的Ⅱ型區(qū)間刪失數(shù)據(jù),應(yīng)變量為可觀測數(shù)據(jù),用EM算法將區(qū)間刪失的問題轉(zhuǎn)化為缺失值問題:E步根據(jù)似然方程建立偽似然方程,用缺失值所對應(yīng)的期望值進(jìn)行填補;M步最大化偽似然方程得到下一步迭代的參數(shù)估計值。對應(yīng)每一個E步,有相應(yīng)的M步,經(jīng)過迭代得到線性回歸的參數(shù)極大似然估計值(MLE)并證明在一定條件下估計量分布漸近正態(tài)分布。Yang(2014)[10]提出在無信息區(qū)間刪失條件下,結(jié)合對數(shù)樣條的線性回歸分析來解決自變量為連續(xù)性分布的Ⅱ型區(qū)間刪失數(shù)據(jù)。將(li,ui)劃分成(K +1)個子區(qū)間,用對數(shù)樣條法構(gòu)造時間(T)的分布函數(shù),得到對數(shù)樣條模型的對數(shù)似然函數(shù),從而計算參數(shù)的極大似然估計值。需要注意的是,存在Ⅱ型區(qū)間刪失數(shù)據(jù)時,對數(shù)似然函數(shù)可能是非凸的,如果用修正的Newton-Raphson法,得到的結(jié)果可能是局部最大值而不是全局最大值,且當(dāng)刪失區(qū)間長度固定且較寬時,會出現(xiàn)找不到極值的情況或遇到算法不收斂問題(由于樣條光滑法適用于密集數(shù)據(jù),區(qū)間較寬,會導(dǎo)致數(shù)據(jù)變得非常稀疏)。此時求出T的條件期望,用條件期望替代未知T,算出線性回歸模型的最小二乘估計值。將此法與中點替代法相比,當(dāng)刪失比例較大時,由中點替代法得到的估計有偏,且偏倚隨著刪失區(qū)間的增寬而增加,而對數(shù)樣條法可得到更加精確的估計值和較小的誤差均方;與半?yún)?shù)貝葉斯方法相比,兩者結(jié)果相近,但運算速度比其快100倍。當(dāng)刪失區(qū)間寬度固定且較小時,對數(shù)樣條法表現(xiàn)最好,但當(dāng)區(qū)間寬度較大時,三種方法的表現(xiàn)都不好,特別是對數(shù)樣條法,其誤差均方相當(dāng)大,在程序運行過程中也會遇到算法不收斂的問題。
(2)Weibull回歸模型:Pradhan(2014)[11]假設(shè)區(qū)間刪失機制是無信息發(fā)生的,即刪失信息與生存事件的發(fā)生相互獨立,生存時間為Weibull分布時,計算在伽馬先驗分布下未知參數(shù)的貝葉斯估計。對于Weibull分布,當(dāng)形狀參數(shù)α已知,此時尺度參數(shù)β共軛先驗分布為Gamma分布。但當(dāng)形狀參數(shù)也未知時,即使存在連續(xù)-離散的聯(lián)合先驗分布(連續(xù)指尺度參數(shù),離散指形狀參數(shù)),Weibull分布也沒有連續(xù)共軛先驗;且由于Gamma共軛先驗不好解釋,所以此法應(yīng)用有很大的局限性。故當(dāng)兩參數(shù)都未知時,假設(shè)兩參數(shù)先驗分布為相互獨立的Gamma分布,用重要抽樣技術(shù)來實現(xiàn)貝葉斯估計。但貝葉斯方法計算復(fù)雜,且Pradhan沒有對貝葉斯估計與EM計算的最大似然估計進(jìn)行比較,也沒有考慮協(xié)變量對貝葉斯估計的影響。
2.半?yún)?shù)回歸分析
在處理Ⅱ型區(qū)間刪失數(shù)據(jù)時,半?yún)?shù)回歸方法比較常用,由于其同時考慮了發(fā)生結(jié)局的時間和影響結(jié)局的協(xié)變量,而且在計算上又優(yōu)于復(fù)雜的非參數(shù)最大似然估計,故比較常用。
(1)Cox比例風(fēng)險(Cox PH)模型:Satten (1996)[12]提出Cox比例風(fēng)險模型,用Monte-Carlo結(jié)合EM算法來估計回歸方程,此法需要進(jìn)行大量計算。Goggins(1998)[13]在Satten的基礎(chǔ)上,將Monte-Carlo模擬放在EM算法的E步,從而避免大量的計算。Goetghebeur(2000)[14]將EM算法與Breslow估計相結(jié)合:M步用最大化標(biāo)準(zhǔn)Cox偏似然來估計回歸系數(shù),然后用Breslow估計基線風(fēng)險;E步估計風(fēng)險集大小,以及在每一個可能的時間集中事件發(fā)生的個數(shù)。E步同Turnbull的自相合算法,但計算更簡單也不需要迭代。Betensky(2002)[15]發(fā)展了局部似然估計方法,平滑基線風(fēng)險函數(shù),其計算比較復(fù)雜。Cai (2003)[16]假設(shè)一個分段線性基線風(fēng)險,用懲罰樣條方法估計限制最大似然估計。Heller(2011)[17]在估計方程的基礎(chǔ)上,用一個反概率權(quán)重來選擇明確順序的事件時間對,并將其應(yīng)用于結(jié)腸癌數(shù)據(jù)分析中。此法不需要估計基線風(fēng)險,用標(biāo)準(zhǔn)的結(jié)構(gòu)方程技術(shù)產(chǎn)生估計值及其近似分布,如果恰當(dāng)定義選擇概率模型和比例風(fēng)險模型,就能建立無偏估計方程,且計算簡單,適用于刪失比例較大的臨床數(shù)據(jù)。Sun(2013)[18]基于修正的局部似然產(chǎn)生兩種估計過程:第一種估計過程是以區(qū)間的左端點填補Ⅱ型區(qū)間刪失數(shù)據(jù),轉(zhuǎn)化為右刪失數(shù)據(jù)來處理,方法簡單易行,但是只利用了區(qū)間左端點的信息;第二種估計過程利用了兩個區(qū)間端點,構(gòu)建出常見的局部似然方程。兩種方法都在估計方程理論基礎(chǔ)上進(jìn)行估計,避免了求基線累積風(fēng)險函數(shù),經(jīng)模擬研究兩種方法都有效可行。比較而言,在刪失區(qū)間較寬的情況下,第二種估計過程可能會更穩(wěn)定,效果更好。
(2)半?yún)?shù)AFT,PO,AH模型:由于Cox PH模型并不能很好地擬合所有生存數(shù)據(jù),對于某些生存數(shù)據(jù)要考慮線性轉(zhuǎn)換模型。Odell(1992)[19]將基于Weibull的加速失效時間(AFT)回歸模型,應(yīng)用于Framingham的冠心病研究數(shù)據(jù)中,計算模型參數(shù)的最大似然估計值并與中點替代法進(jìn)行比較,發(fā)現(xiàn)前者的估計結(jié)果更好。Murphy(1997)[20]提出應(yīng)用比例優(yōu)勢(PO)模型,用偽似然方法估計參數(shù)。Shen(1998)[21]用sieve極大似然估計和單調(diào)樣條方法對PO模型的基線風(fēng)險和回歸系數(shù)進(jìn)行估計。Rabinowitz(2000)[22]基于條件logistic回歸擬合PO模型,不需要估計無限維度的冗余參數(shù),風(fēng)險集越小,其估計效果越好。Zeng(2006)[23]提出了用可加風(fēng)險(AH)模型。Zhu (2008)[24]提出將Ⅱ型區(qū)間刪失數(shù)據(jù)通過某種轉(zhuǎn)換方式轉(zhuǎn)換為Ⅰ型區(qū)間刪失數(shù)據(jù),進(jìn)而用處理Ⅰ型區(qū)間刪失數(shù)據(jù)的方法構(gòu)建AH模型。Wang(2010)[25]在AH模型條件下,用一些基于估計方程的方法來處理Ⅱ型區(qū)間刪失數(shù)據(jù),這種方法比較穩(wěn)健,可以應(yīng)用于有信息和無先驗信息的區(qū)間刪失數(shù)據(jù),且不用估計基線方程,實現(xiàn)過程簡單快速。
(3)其他模型:Lin(2010)[26]提出了半?yún)?shù)probit模型,作為一種替代PH,PO,AH,AFT的模型,從頻率論和貝葉斯的觀點,進(jìn)行Ⅱ型區(qū)間刪失數(shù)據(jù)回歸系數(shù)及基線生存函數(shù)的平滑估計,簡單易行。此法基于似然且不需要對觀察過程進(jìn)行假設(shè),所以對于任何區(qū)間刪失數(shù)據(jù)都適用,可以進(jìn)行拓展。Shao(2013)[27]用二分模型來描述這種含有復(fù)雜數(shù)據(jù)的生存過程,用靈活的變系數(shù)模型擬合Ⅱ型區(qū)間刪失數(shù)據(jù)。通過交叉驗證法選擇帶寬,用局部多項式方法來擬合模型中未知方程,討論估計值的穩(wěn)定性和漸近性分布,并提出用bootstrap做推斷,構(gòu)建BIC類的模型選擇方法,合理解釋了模型中的參數(shù)和非參數(shù)部分,易于理解,計算和推斷易于完成。
3.非參數(shù)最大似然估計
在多數(shù)情況下,含Ⅱ型區(qū)間刪失數(shù)據(jù)的隨機變量總體分布未知,所以非參數(shù)回歸分析方法的研究和應(yīng)用較多。Ⅱ型區(qū)間刪失數(shù)據(jù)生存函數(shù)的非參數(shù)最大似然估計沒有閉集解,常用的獲得非參數(shù)最大似然估計值的方法有:
Turnbull算法:Turnbull(1976)[28]提出自相合算法,結(jié)合EM算法得到單調(diào)收斂的經(jīng)驗分布函數(shù)最大似然估計值,與Newton-Raphson算法相比,此法運算簡單,容易實現(xiàn),便于理解,所以Turnbull的自相合算法在處理Ⅱ型區(qū)間刪失數(shù)據(jù)時,常被采用。Gentlemen (1994)[29]應(yīng)用凸優(yōu)化技術(shù)驗證自相合算法得到的最大似然估計值是唯一的。Shen(2014)[30]在應(yīng)用Turnbull自相合算法的前提下,考慮了自變量的權(quán)重,獲得條件分布函數(shù)的非參數(shù)估計值,在帶寬固定的情況下,也容易實現(xiàn)。但是自相合算法在刪失比例較大的情況下,估計值偏倚會增大。
其他求非參數(shù)最大似然估計值的算法:Wang (2008)[31]提出Ⅱ型區(qū)間刪失數(shù)據(jù)降維的非參數(shù)最大似然算法,用CNM(constrained Newton method),SBN (subspace-based Newton),及ICM(iterative convex minorant algorithm)算法有效地剔除迭代過程中出現(xiàn)的冗余支撐區(qū)間,找到梯度最大的支撐區(qū)間,從而有效提高計算效率。用迭代的方法估計非參數(shù)最大似然估計值的缺點是難以得到估計值的漸近分布。Yuan (2014)[32]用保序回歸的方法得到一個近似的非參數(shù)最大似然估計值,并對其漸近分布和收斂速度做出評價。
上述幾種算法中自相合算法簡單易懂容易完成,對于小/中等樣本數(shù)據(jù),或右刪失比例較大的數(shù)據(jù),此法是很好的選擇,但目前還沒有方法來證明其估計值即為非參數(shù)最大似然估計值;ICM算法迭代步驟較少,計算所用時間短,收斂速度快,而且它們的整體收斂性可以被證明;保序回歸算法可以得到估計值的漸近分布,但計算較復(fù)雜。
4.填補法
在用非參數(shù)回歸分析方法分析Ⅱ型區(qū)間刪失數(shù)據(jù)時,除了用以上算法求含有Ⅱ型區(qū)間刪失數(shù)據(jù)變量的最大似然估計值之外,還可以用填補法將Ⅱ型區(qū)間刪失數(shù)據(jù)轉(zhuǎn)換成精確數(shù)據(jù)或者Ⅰ型區(qū)間刪失數(shù)據(jù),進(jìn)而用成熟的方法求解其非參數(shù)最大似然估計值。Pan(2000)[33]用兩種多重填補法:PMDA(poor man`s data augmentation)與ANDA(asymptotic normal data augmentation),將Ⅱ型區(qū)間刪失數(shù)據(jù)問題轉(zhuǎn)化為右刪失數(shù)據(jù)問題,容易實現(xiàn),與非參數(shù)最大似然估計進(jìn)行比較,在小樣本和中等樣本情況下,多重填補法得到的結(jié)果更好。當(dāng)刪失比例較大時,推薦ANDA填補法。Xiao (2012)[34]利用多重填補的思想,在Weibull分布條件下用迭代單點填補法——分位數(shù)填補法處理Ⅱ型區(qū)間刪失數(shù)據(jù),即用刪失區(qū)間的條件分位數(shù)填補刪失數(shù)據(jù),估計結(jié)果穩(wěn)定,方法簡單易實現(xiàn),但在刪失比例較大時估計可能會有偏。Deng(2014)[35]用無偏轉(zhuǎn)換的思想,將Ⅱ型區(qū)間刪失數(shù)據(jù)進(jìn)行無偏轉(zhuǎn)換,轉(zhuǎn)換后的值與真值有相同的條件期望,得到回歸函數(shù)的最鄰近估計,其有很強的穩(wěn)定性和漸近正態(tài)性。Han(2013)[36]建立刪失數(shù)據(jù)的偽觀察值POS(pseudo-observations)[37],通過PH或PO等適當(dāng)?shù)倪B接函數(shù),將問題轉(zhuǎn)化為廣義線性回歸模型,這種方法計算比較簡單,不需要建立許多假設(shè),可考慮將此法應(yīng)用于雙邊區(qū)間刪失[38]及其他類型的區(qū)間刪失數(shù)據(jù)分析。
生存分析的首要任務(wù)是估計生存函數(shù)。估計的生存函數(shù)可用來:評價生存變量的模型假設(shè)是否正確;估計生存概率;比較不同組之間的生存情況;預(yù)測患者未來的生存時間等等。參數(shù)模型有光滑數(shù)據(jù)的內(nèi)在性質(zhì),又可從鄰近點獲取數(shù)據(jù)信息,與非參數(shù)模型相比,Ⅱ型區(qū)間刪失對于參數(shù)模型的影響要小,因此如果有足夠的先驗信息提示數(shù)據(jù)可用參數(shù)模型,那么參數(shù)估計要比非參數(shù)估計更簡單高效。然而在實際研究中,常常沒有足夠的先驗信息提示哪一種參數(shù)模型假設(shè)是合理的,因而半?yún)?shù)回歸分析和非參數(shù)回歸分析被更多地應(yīng)用于分析含Ⅱ型區(qū)間刪失數(shù)據(jù)的實例中。而對于生存函數(shù)的半?yún)?shù)和非參數(shù)估計,與右刪失數(shù)據(jù)的處理方法相比,無論在理論還是實踐中,對Ⅱ型區(qū)間刪失數(shù)據(jù)的處理方法要更復(fù)雜。
在半?yún)?shù)回歸分析中,有時既要估計回歸系數(shù),也要估計基線生存函數(shù)。但對于Ⅱ型區(qū)間刪失數(shù)據(jù)而言,估計基線生存函數(shù)或風(fēng)險函數(shù)的方法和計算是比較難的,由于其復(fù)雜的數(shù)據(jù)結(jié)構(gòu)以及與樣本量近似的參數(shù)個數(shù)特點,尋找一個合適的理論依據(jù)也很難。有些方法不估計基線生存函數(shù),直接估計回歸參數(shù),比如在PH模型下的邊際似然方法、Monte Carlo EM算法,但這些方法都是在假設(shè)事件發(fā)生時間的發(fā)生次序與觀察到的數(shù)據(jù)一致的前提下估計的,而且計算都比較復(fù)雜。
非參數(shù)回歸分析常用的Turnbull自相合算法,只考察了自變量相互獨立,刪失區(qū)間寬度固定的情況,沒有考慮刪失區(qū)間較寬或有重疊或區(qū)間寬窄不一的情況,而且刪失比例的增大對結(jié)果的精度有影響。
由于上述方法計算比較復(fù)雜,或需要許多假設(shè),而這些假設(shè)在實際應(yīng)用中很難滿足,所以目前在進(jìn)行含Ⅱ型區(qū)間刪失數(shù)據(jù)的生存分析時,一方面可以考慮用其他模型來估計生存函數(shù),比如半?yún)?shù)probit模型,變系數(shù)模型,兩者估計過程中假設(shè)較少,而且應(yīng)用比較廣泛;另一方面考慮填補法,將Ⅱ型區(qū)間刪失數(shù)據(jù)的問題轉(zhuǎn)換成精確數(shù)據(jù)或Ⅰ型區(qū)間刪失數(shù)據(jù)。但是簡單地用區(qū)間中點或端點進(jìn)行填補會造成結(jié)果的偏倚,為了在轉(zhuǎn)換過程中更好地利用區(qū)間信息,得到精確有效的估計結(jié)果,可以使用Deng的無偏轉(zhuǎn)換填補思想和POS方法,這兩種方法更好地利用了區(qū)間信息,容易實現(xiàn)且估計結(jié)果更加穩(wěn)定。
在實際應(yīng)用中,對于刪失比例較小,刪失區(qū)間寬度適中、變異較小的Ⅱ型區(qū)間刪失數(shù)據(jù),上述許多方法可得到較為滿意的估計結(jié)果,但是對于刪失比例較大,刪失區(qū)間較寬,變異較大,協(xié)變量個數(shù)較多的Ⅱ型區(qū)間刪失數(shù)據(jù),如何從眾多方法中做出較好的選擇并進(jìn)行成功的應(yīng)用還需進(jìn)一步研究討論。
參考文獻(xiàn)
[1]Sun J.The Statistical Analysis of Interval-censored Failure Time Data.American:springer,2006.
[2]FlygareME.Maximum Likelihood Estimation For The 2-Parameter Weibull Distribution Based On Interval-Data.Ieee Transations on Reliability,1985,R-34,1.
[3]Wei LJ,Lin DY,Weissfeld L.Regression analysis of multivariate incomplete failure time data by modeling marginal distributions.Journal of the American Statistical Association,1989,84:1065-1073.
[4]Goggins WB.A Proportional Hazards Model for MultivariateInterval-Censored Failure Time Data.Biometrics,2000,5(6):940-943.
[5]Lindesey JK.A study of interval censoring in parametric regressionmodels.Lifetime Data Analysis,1998,4:329-354.
[6]G′omez G.Inference for a linear regression model with anintervalcensored covariate.Statist Med,2003,22:409-425.
[7]G′omez G,Calle ML,Oller R.Frequentist and Bayesian approaches for interval-censored data.Statistics Papers,2005,2:139-173.
[8]Calle ML,G′omez G.A semiparametric hierarchical method for a regression model with an interval-censored covariate.Australian &New Zealand Journal of Statistics,2005,47:351-364.
[9]Ding BJ.Regression model with an interval-censored data covariant.Chinese Journal of Applied Probability and Statistics,2012,28(2):.
[10]Yang Y.A Logspline Estimation for a Linear Regression Model withan Interval-Censored Continuous Covariate.Taylor & Francis,2014,43(10):2521-2539.
[11]Pradhan B.Analysis of Interval-Censored Data with Weibull LifetimeDistribution.Sankhya:The Indian Journal of Statistics,2014,76-B(1):120-139.
[12]Satten GA.Rank-based inference in the proportional hazards model for interval-censored data.Biometrika,1996,83:355-370.
[13]Goggins WB.A Markov chain Monte Carlo EM algorithm for ana-lyzinginterval-censored data under the Cox proportional hazards model.Biometrics,1998,54(4):1498-1507.
[14]Goetghebeur E.Semiparametric Regression Analysis of Interval-CensoredData.Biometrics,2000,5(6):1139-1144.
[15]Betensky R,JCLL,Wand AMP.A local likelihood proportional hazards model for intervalcensored data.Statistics in medicine,2002,(21):263-275.
[16]Cai T,Betensky RA.Hazard regression for interval-censored data with penalized spline.Biometrics,2003,59:570-579.
[17]Glenn Heller.Proportional hazards regression with interval censored data using an inverse probability weight.Lifetime Data Anal,2011,17:373-385.
[18]Sun J.Simple estimation procedures for regression analysis of interval-censored failure time data under the proportional hazards model.Lifetime Data Anal,2015,21(1):138-55.
[19]Odell PM.Maximum Likelihood Estimation for Interval-Censored D.Biometrics,1992,48(3):951-959.
[20]Murphy SA,Rossini AJ,Van der Vaart AW.Maximum likelihood estimation in the proportional odds model.Journal of the American Statistical Association,1997,92:968-976.
[21]Shen X.Proportional odds regression and sieve maximum likelihoodestimation.Biometrika Trust,1998,85(1):165-177.
[22]Daniel Rabinowitz RABA.Using Conditional logistic Regression to Fit ProportionalOdds Models to Interval Censored Data.Biometrics,2000,56:511-518.
[23]Zeng D.Semiparametric additive risks model for interval-censoreddata.Statistica Sinica,2006,16:287-302.
[24]Zhu L.A transformation approach for the analysis of interval-censored failure time data1.Lifetime Data Anal,2008,14:167-178.
[25]Wang L.Regression analysis of case II interval-censored failuretime data with the additive hazards model.Statistica Sinica,2010,20:1709-1723.
[26]Lin X.A semiparametric probit model for case 2 interval-censoredfailure time data.Statistics in Medicine,2010,DOI:10.1002/ sim.3832.
[27]Shao F.Semiparametric varying-coefficient model for intervalcensored data with a cured proportion.Statistics in Medicine,2013,DOI:10.1002/ sim.6054.
[28]Turnbull BW.The Empirical Distribution Function with Arbitrarily-Grouped,Censored and Truncated Data.Journal of the Royal Statistical Society,1976,38(3):290-295.
[29]Gentleman R,Geyer CJ.Maximum likelihood for interval censored data:Consistency and computation.Biometrika,1994,81:618-623.
[30]Wang Y.Dimension-reduced nonparametric maximum likelihood computation for interval-censored data.Computational Statistics & Data Analysis,2008,52:2388-2402.
[31]Shen P.A Generalization of Turnbull′s Estimator for Interval-Censored and Doubly Truncated Data.Taylor & Francis,2014,43:14,2958-2972.
[32]Yuan A.Approximate Nonparametric Maximum Likelihood Estimationfor Interval Censoring Model Case II.International Journal of Statistics and Probability,2014,3(3).
[33]Pan W.A Multiple Imputation Approach to Cox Regression with-Interval-Censored Data.Biometrics,2000(56):199-203.
[34]Xiao X.Study of an imputation algorithm for the analysis of intervalcensored data.Taylor &Francis,2012,84(3):477-490.
[35]Deng WL.Nonparametric regression with interval-censored data.Acta Mathematica Sinica,English Series,2014,30(8):1422-1434.
[36]Seungbong Han.A Semiparametric Regression Method for Interval.Communications in Statistics-Simulation and Computation,2013,1 (43):18-30.
[37]Andersen PK.Pseudo-observations in survival analysis.Statistical Methods in Medical Research,2009,0(0):1-29.
[38]Seungbong Han.A flexible semiparametric modeling approach for doublycensored data with an application to prostate cancer.Statistical Methods in Medical Research,2013,0(0):1-18.
(責(zé)任編輯:郭海強)
通信作者:△王彤,E-mail:wtstat1@ sina.com