国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

小樣本下分層雙邊數(shù)據(jù)相對風(fēng)險比的精確檢驗?

2022-06-04 13:45牟珂漪李智明
關(guān)鍵詞:錯誤率樣本功效

牟珂漪,李智明

(新疆大學(xué) 數(shù)學(xué)與系統(tǒng)科學(xué)學(xué)院,新疆 烏魯木齊 830017)

0 引言

在臨床醫(yī)學(xué)實驗中,當(dāng)患者提供來自配對器官如眼睛、耳朵或胳膊等數(shù)據(jù)時,所有可能的結(jié)果分別為無、一個或兩個響應(yīng),此類數(shù)據(jù)稱為配對數(shù)據(jù).文獻[1]認為來自同一個個體的配對器官之間的響應(yīng)是互相關(guān)聯(lián)的,如果忽略其組內(nèi)相關(guān)性,將會導(dǎo)致統(tǒng)計推斷出現(xiàn)偏差.假定一個器官出現(xiàn)響應(yīng)時,另一個器官也出現(xiàn)響應(yīng)的概率是無條件概率的R倍,其中R為一個正常數(shù),在這個假設(shè)條件下的模型稱為Ronser模型.文獻[2]指出Ronser模型的不足,認為一個器官出現(xiàn)響應(yīng)的條件下,另一個器官也出現(xiàn)響應(yīng)的概率并不依賴于無條件響應(yīng)的概率.文獻[3]提出Donner模型并假定每個組的相關(guān)系數(shù)是固定的.文獻[4]證明Donner模型能充分利用來自單個或配對器官的數(shù)據(jù)以提高檢驗的功效.文獻[5]將此模型用于分層的配對數(shù)據(jù)并假設(shè)各層中每一組的相關(guān)系數(shù)相同,不同層之間不同.Donner模型下更多研究結(jié)果可參閱文獻[6-8].

近年來,一致性檢驗成為配對數(shù)據(jù)研究中的熱點問題.文獻[1]提出兩個統(tǒng)計量檢驗獨立或者非獨立模型中比例差的一致性.基于此,文獻[9]建立了適用于小樣本或稀疏數(shù)據(jù)結(jié)構(gòu)的精確和漸近方法.此外,文獻[10]提出檢驗治愈率一致性的統(tǒng)計量,包括獨立和非獨立模型下的似然比、Score和Wald型檢驗等.在Rosner模型下,文獻[11]提出Score和Wald型統(tǒng)計量檢驗分層雙邊設(shè)計中的比例差異.當(dāng)樣本量較大時,漸近方法下的檢驗具有良好表現(xiàn),但當(dāng)樣本量相對較小時,漸近檢驗就難以保持良好的第一類錯誤率和功效.因此,除了利用漸近方法構(gòu)造檢驗統(tǒng)計量外,小樣本下的精確方法在配對數(shù)據(jù)上的分析同樣值得關(guān)注.

在有關(guān)精確檢驗的研究中,文獻[12]使用原假設(shè)下的極大似然估計值來替換討厭參數(shù),此方法被稱為E方法.文獻[13]通過最大化所有討厭參數(shù)范圍上的尾部概率來計算p值,稱之為M方法.精確方法更多研究內(nèi)容可參閱文獻[14-17].然而,上述精確方法大多集中于單層多組情形,對多層兩組的雙邊數(shù)據(jù)進行精確檢驗的研究較少.本文提出基于Score檢驗的E方法和M方法,對分層配對數(shù)據(jù)的各層相對風(fēng)險比進行一致性檢驗,并通過擬合比較漸近方法與E方法、M方法在第一類錯誤率和功效下的表現(xiàn).

1 Donner模型和參數(shù)估計

在配對相關(guān)數(shù)據(jù)的臨床研究中,假設(shè)患者由于某種混雜因素(如年齡、性別、疾病嚴重程度等)被分為J層.設(shè)Mj為第j層的總?cè)藬?shù)(j=1,···,J),每層的患者被隨機分入2個治療組接受不同的治療.令mlij為第j層第i組中帶有l(wèi)個響應(yīng)的患者總數(shù)(l=0,1,2,i=1,2,j=1,···,J),plij分別表示第j層第i組中無、單邊及雙邊響應(yīng)的概率.對于任何固定的i和j,p0ij+p1ij+p2ij=1都成立.第j層第i組的患者總?cè)藬?shù)且各組總?cè)藬?shù)固定不變,Slj表示第j層中出現(xiàn)l個響應(yīng)的患者總數(shù).分層模型中第j層的數(shù)據(jù)結(jié)構(gòu)如表1所示.

表1 分層配對相關(guān)數(shù)據(jù)第j層結(jié)構(gòu)

記mij=(m0ij,m1ij,m2ij)T,pij=(p0ij,p1ij,p2ij)T.對于第j層,mij(i=1或2)服從三項分布.因此,mij的聯(lián)合概率密度函數(shù)為

設(shè)Zhijk表示第j層第i組中第h(h=1,2,···,Nij)位患者的第k(k=1,2)只眼睛的響應(yīng)變量.如果存在響應(yīng),Zhijk=1,否則為0.在Donner模型下,假設(shè)P(Zhijk=1)=πij,0 <πij<1,以及Corr(Zhijk,Zhij(3?k))=ρj(0 <ρj<1).故,p0ij=ρj(1-πij)+(1-ρj)(1-πij)2,p1ij=2πij(1-ρj)(1-πij),p2ij=ρjπij+(1-ρj)i=1,2,j=1,···,J.對于i=1,2,記πi=(πi1,···,πi2)T,ρ=(ρ1,···,ρJ)T.據(jù)觀察數(shù)據(jù)mij(i=1,2,j=1,···,J),其對數(shù)似然函數(shù)為

在假設(shè)H0下,π2j=π1jδ(j=1,···,J).因此其對數(shù)似然函數(shù)可以寫為

其中:δ為興趣參數(shù),π1和ρ為討厭參數(shù),并有

根據(jù)似然函數(shù),下面給出未知參數(shù)的估計值.

然而,上式并不存在顯式解,需要利用迭代算法如Fisher得分算法、牛頓法、Bootstrap方法等求得極大似然估計[18].針對多組配對相關(guān)數(shù)據(jù)的極大似然估計,文獻[19]指出相比牛頓法和廣義期望最大算法,Fisher得分算法在收斂方面具有一定優(yōu)勢.考慮到Bootstrap方法花費時間久,本文選擇Fisher得分算法得到全局極大似然估計在Donner模型中,一共有3J個未知參數(shù).對于第j層,πij,ρj(i=1,2)的初值設(shè)為

參數(shù)π1j,π2j以及ρj(j=1,···,J)的第t+1次迭代值可以通過Fisher得分算法求得

利用mlij(l=0,1,2,i=1,2,j=1,2,···,J)的期望可得Fisher信息矩陣中二階偏導(dǎo)的期望.

在原假設(shè)H0:δ1=δ2=···=δJ?δ下,π2j=π1jδ (j=1,···,J)成立,也就是說,所有層中的相對風(fēng)險比都相等.此時,第j層中的一階偏導(dǎo)式為

然而,該顯式解并不存在.因此,采用Fisher得分算法獲得限制性極大似然估計的初值在公式(1)中給定,且δ(0)=1.則δ,π1j和ρj(j=1,···,J)的第(t+1)次更新可以由Fisher得分算法計算得到

這里diag為對角矩陣符號.

2 檢驗統(tǒng)計量

基于Fisher得分算法得到的極大似然估計,可以構(gòu)造漸近方法下的一致性檢驗.

2.1 Score檢驗

其中I2(δ,π1,ρ)是一個3J×3J信息陣.在Ha下,涉及到所有層參數(shù)的信息陣

在H0下,檢驗統(tǒng)計量TSC漸近服從自由度為J-1的卡方分布.由于該方法為漸近方法,簡記為A方法.令是自由度為J-1的卡方分布的100(1-α)分位數(shù).在顯著性水平α下,如果檢驗統(tǒng)計量的值大于那么H0就應(yīng)該被拒絕.

2.2 E方法

2.1節(jié)所提出的Score檢驗統(tǒng)計量當(dāng)樣本量較大時具有令人滿意的結(jié)果,但是對于小樣本量表現(xiàn)較差.因此,基于Score檢驗構(gòu)造兩種精確方法分別為E方法與M方法.計算精確方法下的p值,需要合適的方法確定尾部區(qū)域和處理討厭參數(shù).E方法由文獻[20]提出,對于一個給定的樣本矩陣M?,固定各個組的總?cè)藬?shù)Nij(i=1,2,j=1,2,···,J),通過改變矩陣中各個元素的值,可以得到各組人數(shù)不變時所有可能的樣本矩陣.所有統(tǒng)計量值大于M?矩陣統(tǒng)計量值的對應(yīng)矩陣組成了M?的尾部區(qū)域:則p值為尾部區(qū)域的似然函數(shù)值總和.利用原假設(shè)H0下的極大似然估計來代替未知參數(shù)定義樣本矩陣M?對應(yīng)的p值

2.3 M方法

M方法由文獻[21]提出,通過在定義域內(nèi)任意選取參數(shù)π1,δ,ρ使得尾部區(qū)域的概率總和最大化.與E方法類似,M方法的尾部區(qū)域定義為M方法下的p值為

其中:π1=(π11,π12,···,π1J)T,ρ=(ρ1,ρ2,···,ρJ)T.

3 數(shù)值擬合

對給定參數(shù)下A方法、E方法與M方法的第一類錯誤率和功效進行比較.第一類錯誤率是當(dāng)原假設(shè)為真時拒絕原假設(shè)的概率.根據(jù)文獻[9],若顯著性水平為0.05,第一類錯誤率在0.04與0.06之間時稱檢驗為穩(wěn)健的;當(dāng)?shù)谝活愬e誤率大于0.06時檢驗是冒進的;當(dāng)?shù)谝活愬e誤率小于0.04時檢驗是保守的.功效即當(dāng)原假設(shè)錯誤時正確地拒絕原假設(shè)的概率.一個好的檢驗不僅要有穩(wěn)健的第一類錯誤率,也應(yīng)該有盡可能高的功效.漸近Score方法的第一類錯誤率和功效通過擬合得到,在原假設(shè)或備擇假設(shè)下設(shè)置參數(shù),然后在給定參數(shù)下隨機生成10 000個樣本.當(dāng)顯著性水平為0.05時,基于這10 000個樣本統(tǒng)計p值小于0.05時拒絕原假設(shè)的次數(shù),即可通過拒絕次數(shù)/10 000得出第一類錯誤率或功效.對于精確方法E方法和M方法,則需要計算每組樣本量固定時所有可能樣本的p值,將p值與0.05比較,統(tǒng)計拒絕的次數(shù)得到精確方法的第一類錯誤率和功效.

由于E方法和M方法需要計算每組樣本量固定時所有樣本矩陣所對應(yīng)的p值,并將識別出的尾部區(qū)域?qū)?yīng)似然函數(shù)值進行加總.考慮到精確方法求取第一類錯誤率和功效的計算量比較大,本文僅給出層數(shù)J=2時,每層中各組人數(shù)Nij=10(i=1,2)下三種方法的第一類錯誤率和功效.計算第一類錯誤率時,令πij在滿足δ1=δ2=1,π11=π12的條件下隨機生成,計算A、E和M方法的第一類錯誤率.A方法、E方法與M方法在給定參數(shù)下的第一類錯誤率如圖1所示.圖1的第一類錯誤率結(jié)果表明:在顯著性水平α=0.05下,A方法的第一類錯誤率大都接近0.04,說明在小樣本情形下該方法偏保守.M方法的第一類錯誤率比A方法低,三種方法中M方法較保守.E方法第一類錯誤率集中在0.04~0.06之間,且中心區(qū)域靠近0.05.說明在小樣本的條件下,E方法的第一類錯誤率較為穩(wěn)健.因此,當(dāng)樣本量較小時,E方法在第一類錯誤率方面的表現(xiàn)較好.

圖1 A方法、M方法與E方法的第一類錯誤率

再比較A、E與M方法在不同參數(shù)下的功效.計算功效時,在假設(shè)Ha:δj不全相等下設(shè)置參數(shù).對于兩層的數(shù)據(jù)結(jié)構(gòu),令各層相關(guān)系數(shù)為ρ1=ρ2=0.2,0.5,0.8,且π11=π12=0.3,0.6,0.9,第一層的相對風(fēng)險比為δ1=1,使第二層的相對風(fēng)險比δ2以0.1為間隔,在0.1~0.9之間變動.表2顯示了上述參數(shù)設(shè)置下A、M與E方法的功效,可以看出,在相同的參數(shù)設(shè)置下E方法的功效較高,M方法的功效較低.當(dāng)δ1=1時,隨著δ2減小,即δ2與δ1的差距增加時,三種方法的功效也會增大.中低度相關(guān)數(shù)據(jù)(ρj=0.2,0.5)下三種方法的功效往往比高度相關(guān)數(shù)據(jù)(ρj=0.8)要高.

表2 A方法、M方法與E方法的功效

綜合三種方法在第一類錯誤率和功效的表現(xiàn)來看,E方法較佳,因為E方法有較穩(wěn)健的第一類錯誤率和較高的功效.因此,對于小樣本下分層雙邊數(shù)據(jù)的相對風(fēng)險比的一致性檢驗,推薦使用E方法.

4 結(jié)論與展望

在Donner模型下利用Score檢驗推導(dǎo)出兩種適用于小樣本分層雙邊數(shù)據(jù)相對風(fēng)險比一致性檢驗的精確方法,分別為E方法和M方法.通過擬合比較漸近Score方法、E方法與M方法的第一類錯誤率和功效,表明E方法有較為穩(wěn)健的第一類錯誤率,其他兩種方法的第一類錯誤率偏保守.在功效方面,E方法的功效較高.綜合來看,對于分層雙邊數(shù)據(jù)小樣本下的一致性檢驗,推薦E方法.由于層數(shù)過多將帶來巨大的計算量,本文僅提供了三種方法在兩層設(shè)計中給定參數(shù)下的第一類錯誤率和功效,當(dāng)層數(shù)大于兩層時,精確方法的表現(xiàn)還值得進一步研究.

猜你喜歡
錯誤率樣本功效
紅景天的神奇功效及作用
墨鏡的功效
小學(xué)生分數(shù)計算高錯誤率成因及對策
規(guī)劃·樣本
如何讓你的化妝品發(fā)揮更大的功效
正視錯誤,尋求策略
隨機微分方程的樣本Lyapunov二次型估計
解析小學(xué)高段學(xué)生英語單詞抄寫作業(yè)錯誤原因
基于支持向量機的測厚儀CS值電壓漂移故障判定及處理
降低學(xué)生計算錯誤率的有效策略
合川市| 商河县| 长寿区| 安仁县| 商都县| 镇坪县| 林甸县| 夏河县| 淮滨县| 榆中县| 梨树县| 建湖县| 兴义市| 炉霍县| 富民县| 潼关县| 肃南| 锡林郭勒盟| 耒阳市| 湘潭县| 龙泉市| 敦化市| 宁海县| 托克逊县| 文安县| 蒙山县| 手机| 仙游县| 灵台县| 青浦区| 留坝县| 闽清县| 林周县| 靖江市| 平果县| 台东市| 梅河口市| 信丰县| 宣城市| 哈尔滨市| 内乡县|