杜彥斌,戴家佳,金 君
(貴州大學(xué) 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,貴州 貴陽 550025)
在許多縱向研究中,研究的個(gè)體有時(shí)會不止一次的經(jīng)歷某一事件,這種事件叫做復(fù)發(fā)事件。復(fù)發(fā)事件頻繁的出現(xiàn)在生物學(xué)、醫(yī)學(xué)、社會和經(jīng)濟(jì)學(xué)等研究領(lǐng)域中。例如:接受腎臟移植的病人術(shù)后的反復(fù)感染;癌癥患者在治療過程中的多次復(fù)發(fā);顧客對一件商品的重復(fù)購買等等。在復(fù)發(fā)事件過程中產(chǎn)生的數(shù)據(jù)叫做復(fù)發(fā)事件數(shù)據(jù)。
根據(jù)研究對象種類的不同,復(fù)發(fā)事件一般又分為兩種類型:一種是單類型復(fù)發(fā)事件,即感興趣的事件只有一種類型,并且不止一次發(fā)生,例如某種機(jī)器故障的多次發(fā)生,某種病毒的多次感染;然而,在許多生活應(yīng)用中,經(jīng)常會遇到多種不同類型的復(fù)發(fā)事件,即多類型復(fù)發(fā)事件。例如,在病人手術(shù)后的感染研究中,研究人員需要同時(shí)考慮病毒、真菌和細(xì)菌的感染,在臨床研究中,我們在考慮硒元素和皮膚癌關(guān)系時(shí),需要同時(shí)研究幾類皮膚癌的復(fù)發(fā)。由于不同類型的復(fù)發(fā)事件之間是相依的,我們需要同時(shí)對它們進(jìn)行分析,而不是只研究某類特定的復(fù)發(fā)事件,所以對多類型復(fù)發(fā)事件的統(tǒng)計(jì)建模和推斷具有更大的難度。
對復(fù)發(fā)事件數(shù)據(jù)的分析,研究者通常關(guān)心的是協(xié)變量對復(fù)發(fā)事件率的影響。多年來,學(xué)者已提出多種方法來分析復(fù)發(fā)事件數(shù)據(jù),包括強(qiáng)度模型[1]、脆弱模型和邊際均值(比率)模型[2,4]。經(jīng)過多年的發(fā)展,單類型復(fù)發(fā)事件的研究已經(jīng)比較成熟,但是多類型復(fù)發(fā)事件的研究卻有很大的空間。Abu-Libdeh和Turnbull考慮了有隨機(jī)和固定效應(yīng)的非齊次泊松過程,利用極大似然的方法對未知參數(shù)進(jìn)行估計(jì)[3]。然而,這些參數(shù)估計(jì)方法需要知道個(gè)體內(nèi)部潛在的相依結(jié)構(gòu),這對于多類型復(fù)發(fā)事件數(shù)據(jù)是很難做到的。因此,很多學(xué)者建立了半?yún)?shù)模型來處理多類型復(fù)發(fā)事件[5]。在半?yún)?shù)模型方面,已有的文獻(xiàn)主要研究的是加性比率模型[6-10]和乘性比率模型[11-12]。下面簡單介紹復(fù)發(fā)事件下幾個(gè)重要的半?yún)?shù)模型。
對于乘性比率模型Lin等提出了復(fù)發(fā)事件的半?yún)?shù)乘性比率模型[2]:
(1)
其中,β0是p維未知回歸參數(shù)向量,λ0(·)為未知基本比率函數(shù)。
對于加性比率模型,Schaubel等研究了復(fù)發(fā)事件的半?yún)?shù)可加比率模型[7]:
(2)
Liu提出復(fù)發(fā)事件數(shù)據(jù)下可加轉(zhuǎn)移模型[13]:
(3)
其中,μ0(·)為未知基線均值率函數(shù),β0是p維未知回歸參數(shù)向量,Q(t,x)為一個(gè)預(yù)先設(shè)定的非負(fù)連接函數(shù),且滿足:對于任意x,Q(0,x)=0。
容易發(fā)現(xiàn),當(dāng)Q(t,x)=tx,且協(xié)變量Z(t)與時(shí)間無關(guān)時(shí),模型(3)即:
孫曉娜提出了多類型復(fù)發(fā)事件數(shù)據(jù)下的可加轉(zhuǎn)移模型[14]:
(4)
在實(shí)際應(yīng)用中,研究個(gè)體可能具有多個(gè)協(xié)變量的影響,有些協(xié)變量的影響是加性的,有些是乘性的,或者某些變量的影響既是加性的又是乘性的。如戴家佳和何穗提出了一類加性-乘性比率模型[4]:
(5)
其中,β0和γ0分別表示p1和p2維回歸系數(shù)向量,g(·)和h(·)為已知聯(lián)系函數(shù)。顯然,協(xié)變量Wik(t)對基線均值率函數(shù)具有加性的影響,而協(xié)變量Xik(t)具有乘性的影響。
Schbuael在文章復(fù)發(fā)事件數(shù)據(jù)半?yún)?shù)可加比率模型中,假定協(xié)變量對未指定的基線均值率函數(shù)有一個(gè)加性的影響,并且這個(gè)影響隨著時(shí)間變化是線性的[7]。但是,在實(shí)際問題中,這種線性假定往往是不合理的[14]。例如:癌癥患者的治療過程中,塞替派對癌細(xì)胞的控制并不是線性的;商品的價(jià)格對顧客購買力的影響也不是線性的。因此,除了這種線性的假定,其他一些加性形式也是值得考慮的。所以,Liu等提出了另外一種更為一般的模型[13]:可加轉(zhuǎn)移模型,即模型(3)。模型中他們將協(xié)變量對基線均值率函數(shù)的加性影響用一個(gè)預(yù)先設(shè)定的非負(fù)連接函數(shù)來表示,且函數(shù)是關(guān)于時(shí)間和協(xié)變量的二元函數(shù)。這樣就可以根據(jù)己有的數(shù)據(jù)和想要得到參數(shù)的解釋為依據(jù)去選擇合理的連接函數(shù)。同時(shí),本文用模型來表示協(xié)變量對復(fù)發(fā)事件的影響也更加的靈活和廣泛。
模型(4)不同于戴家佳和何穗提出的一類加性-乘性比率模型(5)[4],因?yàn)樗话瑓f(xié)變量乘性的影響。事實(shí)上,在研究實(shí)際問題時(shí),協(xié)變量的加性和乘性影響可能會同時(shí)存在。所以,結(jié)合模型(4)和(5)的思想,本文提出多類型復(fù)發(fā)事件數(shù)據(jù)下一類半?yún)?shù)轉(zhuǎn)移模型。
設(shè)Wik(t)和Xik(t)分別表示p1和p2維協(xié)變量,Zik(t)=(Wik(t)′,Xik(t)′)′為p維協(xié)變量過程向量,其中p=p1+p2。我們提出的多類型復(fù)發(fā)事件數(shù)據(jù)下一類半?yún)?shù)轉(zhuǎn)移模型具有以下形式:
(6)
其中,β0和α0分別表示p1和p2維未知回歸系數(shù)向量,μ0k(t)是未知基準(zhǔn)均值函數(shù),gk(·)和Qk(t,x)是預(yù)先設(shè)定的非負(fù)連接函數(shù)。
當(dāng)gk(x)=1時(shí),模型(6)即為模型(4);當(dāng)Qk(t,x)=x時(shí),模型(6)即為模型(5)??梢?,本文提出的模型包含了一些重要的半?yún)?shù)模型。
如何選擇模型(6)中的連接函數(shù)主要基于對歷史數(shù)據(jù)和回歸系數(shù)的實(shí)際解釋來確定。下面,對模型中的未知參數(shù)向量和非參數(shù)函數(shù)給出估計(jì)方法。
在多類型復(fù)發(fā)事件下,可觀測的數(shù)據(jù)是:
{Nik(·),Yik(·),Wik(·)}(i=1,2,…;k=1,2,…,K)
定義如下過程:
對于給定的第k類事件與θ={α′,β′}′,μ0k(t)的一個(gè)自然估計(jì)是下列方程的解:
(7)
其中τ是一個(gè)預(yù)先設(shè)定的常數(shù)使得p(Ci≥τ)>0。
求解式(7)得到:
(8)
(9)
其中τk>0,Hnk(t)是[0,τk]上遞增的權(quán)函數(shù)。
將式(8)代入式(9)并做簡單的代數(shù)運(yùn)算可以得到:
(10)
其中
(C1){Nik(·),Yik(·),Zik(·)},(i=1,2,…,n;k=1,2,…,K)獨(dú)立同分布,其中Zik(·)=(Wik(·)′,Xik(·)′)′。
(C2)P{Cik≥τk}>0,并且Zik(t)是一個(gè)有界變量。
(C4)Qk(t,x)關(guān)于t單調(diào)遞增,關(guān)于x嚴(yán)格單調(diào)遞增且關(guān)于x的二階偏導(dǎo)數(shù)連續(xù)。
(C6)A是非奇異矩陣,其中:
為了方便推導(dǎo),本文給出以下標(biāo)記:
由于
所以
(11)
證明由泰勒展開式可得:
(12)
Γ(s,t)=E{ψik(s)ψik(t)}
用估計(jì)量代替未知量,可以得到協(xié)方差函數(shù)的一個(gè)相合估計(jì)為:
其中:
證明首先:
(13)
運(yùn)用泰勒展開式,式(13)右端第一項(xiàng)可以寫為:
(14)
由于
直接計(jì)算可得:
由式(12)可得:
(15)
因此,結(jié)合式(14)和(15)可得:
Mik(t;θ0)dHnk(t)+op(1)
(16)
另一方面可推導(dǎo):
(17)
最后由式(13)~(17)可得
(18)
Γ(s,t)=E{ψik(s)ψik(t)}
本文在多類型復(fù)發(fā)事件數(shù)據(jù)下提出了一類半?yún)?shù)轉(zhuǎn)移模型,模型不僅考慮了協(xié)變量的加性和乘性影響,同時(shí)假定加性影響是時(shí)間的函數(shù)。利用廣義估計(jì)方程的思想,對參數(shù)進(jìn)行了估計(jì),并證明了估計(jì)量的相合性和漸近正態(tài)性。
參考文獻(xiàn):
[1]Yin G,Cai J.Additive Hazards Model with Multivariate Failure Time Data[J].Biometrika,2004,91(4).
[2]Lin D Y,Wei L J,Yang I,et al.Semiparametric Regression for the Mean and Rate Functions of Recurrent Events[J].Journal of the Royal Statistical Society,2000,62(4).
[3]Abu-Libdeh H,Turnbull B W,Clark L C.Analysis of Multi-type Recurrent Events in Longitudinal Studies Application to a Skin Cancer Prevention Trial[J].Biometrics,1990,46(4).
[4]戴家佳,何穗.多類型復(fù)發(fā)事件下的加性乘積比率回歸模型[J].工程數(shù)學(xué)學(xué)報(bào),2008,25(6).
[5]趙明濤,許曉麗.半?yún)?shù)縱向模型的懲罰二次推斷函數(shù)估計(jì)[J].統(tǒng)計(jì)與信息論壇,2014,29(8).
[6]Chen X,Wang Q,Cai J,et al.Semiparametric Additive Marginal Regression Models for Multiple Type Recurrent Events[J].Lifetime Data Analysis,2012,18(4).
[7]Schaubel D E,Zeng D,Cai J.A Semiparametric Additive Rates Model for Recurrent Event Data[J].Lifetime Data Analysis,2006,12(4).
[8]Ye P,Zhao X,Sun L,et al.A Semiparametric Additive Rates Model for Multivariate Recurrent Events with Missing Event Categories[J].Computational Statistics&Data Analysis,2015,89(C).
[9]Zeng D,Cai J.Additive Transformation Models for Clustered Failure Time Data[J].Lifetime Data Analysis,2010,16(3).
[10] He S,Wang F,Sun L Q.A Semiparametric Additive Rates Model for Clustered Recurrent Event Data[J].Acta Mathematicae Applicatae Sinica,English Series,2013,29(1).
[11] Liu Y,Wu Y,Cai J,et al.Additive-multiplicative Rates Model for Recurrent Events[J].Lifetime Data Analysis,2010,16(3).
[12] Sun L,Kang F.An Additive-multiplicative Rates Model for Recurrent Event Data with Informative Terminal Event[J].Lifetime Data Analysis,2013,19(1).
[13] Liu Y,Sun L,Zhou Y.Additive Transformation Models for Recurrent Events[J].Communications in Statistics-Theory and Methods,2013,42(22).
[14] 孫曉娜.多類型復(fù)發(fā)事件的加性變換模型[D].武漢:華中師范大學(xué),2015.
[15] Zhang H,Yang Q L,Lianqiang Q U.A Class of Transformation Rate Models for Recurrent Event Data[J].Science China Mathematics,2016,59(11).