程 昕 藺 杉
(東北師范大學 數(shù)學與統(tǒng)計學院,吉林 長春 130024)
邏輯回歸在二分類反應研究中具有廣泛的應用。Piegorsch 和West 等[1]、Peng 和Robichaud 等[2]的定量風險和風險評估,以及Carter 和Chinchilli 等[3]、Frank 和Jason 等[4]的藥物劑量反應曲線研究的一個關鍵目標是基于邏輯回歸模型確定藥物劑量水平和藥物作用之間的關系。
關于單個有效劑量置信集的構造最早可以追溯到Fieller[5]和Cox[6]。Li 和Zhang 等[7]、Li 和Wong[8]分別提出了在貝葉斯框架下以及利用漸近理論和自舉方法構建多維單個有效劑量置信帶。
進一步地,研究者開始研究構建多個有效劑量的聯(lián)合置信帶。Al-Saidy 和Piegorsch 等[9]、Nitcheva 和Piegorsch 等[10]通過轉化Scheffé 型聯(lián)合置信帶建立多個有效劑量的聯(lián)合置信帶。Li 和Nordheim 等[11]考慮用四種方法來計算多維有效劑量的置信區(qū)域。Tompstt 和Biedermann 等[12]在向量角度等權分配的情況下討論了不同有效劑量個數(shù)和置信水平的組合會對臨界值c 造成什么樣的影響。本文在前人研究的基礎上討論向量角度不等權分配時是否會對臨界值c 的結果產生影響,進而觀察向量角度不等權分配時對有效劑量的定位效果是否優(yōu)于向量角度等權分配。
將邏輯回歸模型
記為π(x)。其中,xT=(1,x1,…,xq)T=(1,xT),β=(β0,β1,…,βq)T是未知的參數(shù)向量,且p(x)=E(Y)。
記N 個響應變量分別為Yi,i=1,…,N,相應的協(xié)變量為xi=(xi1,…,xiq)T,利用極大似然估計來估計β,記為。假設有足夠大的N,那么漸近結果是:
其中,Nq+1是q+1 維多元正態(tài)分布。0 是q+1 維零向量,漸近協(xié)方差矩陣∑可以用NJ-1估計,J-1是β^的觀測協(xié)方差矩陣。因此,對于足夠大的N,可以用NJ-1代替未知的漸近協(xié)方差矩陣∑。所以有近似分布結果:
于是,可以構建邏輯回歸模型的聯(lián)合置信帶:
其中,c 是臨界值,需要通過漸近分布結合置信水平1-α 求出。
定義如下的有效劑量為xp:
則有效劑量的雙邊型聯(lián)合置信帶為:
若選擇適當?shù)呐R界值c,則對于給定的k 值,Cpi的聯(lián)合概率至少為1-α 。
對于k≥3,q=1,臨界值c 滿足:
其中,-∞<xpi<+∞,i=1,2,…,k。當k=2 時,可以依賴于兩個Zk的獨立性求解臨界值c。但是在k≥3 時不能利用獨立性進行求解。令P2=J-1,根據(jù)公式(3),可以得到N=P-1- )β ~N(0,I2)。定義N=(n1,n2)T的極坐標為(RN,θN),則有n1=RNcosθN,n2=RNsinθN。且RN≥,θN∈[0,2π)~U[0,2π),RN與θN相互獨立。
公式(7)中的P {xpi∈Cpi,i=1,2,…,k }可以進行如下計算:
其中,V(xp)=表示與方向向量=PxP垂直并且與原點距離小于等于c 的N=(n1,n2)T 的集合。所以V(xpi)是一個2k 邊的多邊形區(qū)域。
設任意兩個方向向量Pxpi和Pxpj的夾角為θij。如圖1 所示,P(N∈Vk)等于平行四邊形區(qū)域ABCD 的概率減去陰影區(qū)域的概率。即為:
其中l(wèi)3(i)=
如圖1 所示,以k=3 為例,計算P(N∈V3)。
圖1 向量角度等權分配
具體計算步驟為:
步驟一:令V3旋轉直到n2平分θ13,將旋轉后的圖形記為V3*,由于V3旋轉后,P(N∈V3)的值不發(fā)生改變,所以N 在V3*中概率等于N 在V3中概率。
由圖1 可以看出,四邊形ABCD 是菱形。菱形ABCD 可表示為:
則菱形ABCD 的概率等于
步驟二:計算陰影部分的概率,由于左下角陰影部分與右上角陰影部分全等,所以只需計算右上角陰影部分。
陰影部分記為△PQB。接下來計算△PQB 的概率。直線PQ 的解析式為:
其中,l3(2)=
步驟三:用步驟一得到的菱形ABCD 的概率減去步驟二得到的陰影部分的概率的二倍即為P(N∈V3)。
其中l(wèi)3(2)=
在此基礎上討論向量角度不等權分配是否會對臨界值c 的結果有影響。將向量角度不等權分配分為兩種情況,一種是向量角度漸近等權分配,另一種是向量角度漸遠等權分配。將第一種情況記為AS2-1 型聯(lián)合置信帶,將第二種情況記為AS2-2 型聯(lián)合置信帶。將雙邊型聯(lián)合置信帶記為AS2 型聯(lián)合置信帶。圖2-5 畫出了有效劑量個數(shù)時向量角度漸近等權分配和漸遠等權分配的示意圖。圖2 和圖3 代表漸近等權分配情況,分別記為AS2-11 和AS2-12。圖4 和圖5 代表漸遠等權分配情況,分別記為AS2-21 和AS2-22。其中,虛線表示向量角度等權分配。
圖2 向量角度漸近等權分配(a )
圖3 向量角度漸近等權分配(b )
圖4 向量角度漸遠等權分配(a )
圖5 向量角度漸遠等權分配(b )
模擬設計:由于主要討論向量角度不等權分配時是否對臨界值的結果產生影響,因此不考慮其他因素對臨界值的影響。所以,首先假定有效劑量個數(shù)k=3。在漸近等權分布情況下,考慮θ12從左邊趨近等權分配和從右邊趨近等權分配兩種情況,分別記為AS2-11和AS2-12;在漸遠等權分布情況下,考慮θ12趨于零和趨于θ13兩種情況,分別記為AS2-21 和AS2-22。在每種情況下,分別對三種角度進行模擬。在置信水平1-α =0.99、0.95、0.90 下,分別模擬10000 次。結果如表1、表2 所示。
表1 AS2 型聯(lián)合置信帶與AS2-1 型聯(lián)合置信帶的臨界值
表2 AS2 型聯(lián)合置信帶與AS2-2 型聯(lián)合置信帶的臨界值
如果置信帶的帶寬越小,說明該置信帶的效果越好,對有效劑量的定位就越精確。而置信帶的帶寬大小判斷可以轉化為臨界值c 的大小判斷。也就是說,臨界值越小,該置信帶對有效劑量的定位越精確。利用提升率公式來比較置信帶的優(yōu)劣,以雙邊型聯(lián)合置信帶為基準,將AS2-1 型聯(lián)合置信帶和AS2-2 型聯(lián)合置信帶與之進行比較。在1-α 置信水平下,相對于雙邊型聯(lián)合置信帶的提升率可以設為:
其中,c'表示向量角度不等權分配時的臨界值,也就是AS2-1 型和AS2-2 型聯(lián)合置信帶的臨界值;c 表示向量角度等權分配時的臨界值,也就是AS2 型聯(lián)合置信帶的臨界值。
根據(jù)提升率公式,得到表3、表4。
表3 AS2-1 型聯(lián)合置信帶的臨界值提升率
表4 AS2-2 型聯(lián)合置信帶的臨界值提升率
當有效劑量的個數(shù)k 和置信水平1-α 相同時,向量角度漸近等權分布時的臨界值c 反而比等權分布時的臨界值c 更大,說明漸近等權分布對有效劑量的定位沒能更精確。向量角度漸遠等權分布時的臨界值c對等權分布時均有提升,且AS2-22 型提升的效果明顯優(yōu)于AS2-21 型。但是,在AS2-22 型的角度逐漸接近θ13的過程中可以看到,其提升效果是有限的,到達一定限度后,提升率不會再大幅增加。
本文提出了雙邊型聯(lián)合置信帶向量角度不等權分配時,將向量角度不等權分配的情況分為兩類,分別是向量角度漸近等權分配和向量角度漸遠等權分配。其中,向量角度漸近等權分配又分為AS2-11 和AS2-12兩種情況,向量角度漸遠等權分配又分為AS2-21 和AS2-22 兩種情況。通過模擬,對比向量角度等權分配的情況得出結論,向量角度漸近等權分配并不能使其臨界值小于等權分配的臨界值,但是向量角度漸遠等權分配時可以獲得相對等權分配時更小的臨界值,即向量角度漸遠等權分配時的雙邊型聯(lián)合置信帶對有效劑量的定位比向量角度等權分配時的雙邊型聯(lián)合置信帶更精確。并且,在漸遠等權分配的兩種情況下,AS2-22 情況有更明顯地提升,但這種提升是有限度的。