国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于擬貝葉斯方法的二項(xiàng)分布總體率的區(qū)間估計(jì)

2011-03-11 14:01安金兵
中國衛(wèi)生統(tǒng)計(jì) 2011年6期
關(guān)鍵詞:二項(xiàng)分布后驗(yàn)覆蓋率

安金兵 李 勇

基于二項(xiàng)分布B(n,p)的總體率p的區(qū)間估計(jì)在生物醫(yī)學(xué)領(lǐng)域有比較廣泛的應(yīng)用,其中很常見的就是Wald區(qū)間估計(jì),不過Wald區(qū)間估計(jì)在覆蓋率及穩(wěn)定性等方面存在比較明顯的缺陷〔1,2〕。Agresti等人〔3,4〕給出了與Wald區(qū)間估計(jì)形式上比較類似的估計(jì)方法;而以精確概率為基礎(chǔ)的區(qū)間估計(jì)〔5,6〕以及貝葉斯區(qū)間估計(jì)〔7〕在實(shí)際中也有很多應(yīng)用。本文基本上沿用貝葉斯統(tǒng)計(jì)的思想,通過一種基于Kolmogrov分布距離的擬貝葉斯方法給出了總體率p的一種新的顯式解。

原理和方法

傳統(tǒng)的貝葉斯方法基于似然函數(shù)而構(gòu)造,但是似然函數(shù)容易受到異常值和模型偏差的影響,因此一個比較常用的方法就是用一個對異常取值和模型偏差不敏感的函數(shù)代替似然函數(shù)構(gòu)造擬貝葉斯后驗(yàn)分布,進(jìn)而進(jìn)行統(tǒng)計(jì)分析而獲得穩(wěn)健的性質(zhì)。假設(shè)總體X的分布函數(shù)為F(t;p),p∈Θ為未知參數(shù),通過隨機(jī)抽樣得到的容量為n的樣本所對應(yīng)的經(jīng)驗(yàn)分布函數(shù)為G(t),則我們可以定義G(t)與F(t;p)之間的Kolmogrov分布距離d(p)以及如下的一個關(guān)于參數(shù)p函數(shù)K(p):

由于Kolmogrov距離d(p)在參數(shù)p為真實(shí)值時會隨樣本量的增大而趨于0,因而函數(shù)K(p)在參數(shù)p為真實(shí)值時取較大的數(shù)值,反之則取較小的數(shù)值,這種性質(zhì)與似然函數(shù)非常類似。那么,如果參數(shù)p的先驗(yàn)分布密度為 π(p),則類似于 Lazar〔8〕、Greco〔9〕等人介紹的方法,利用函數(shù)K(p)代替似然函數(shù),就可以將貝葉斯后驗(yàn)分布修正為如下的擬貝葉斯形式:

進(jìn)而利用上述擬貝葉斯公式就可以對參數(shù)p進(jìn)行點(diǎn)估計(jì)或者區(qū)間估計(jì)。

假設(shè)總體X服從二項(xiàng)分布B(n,p),參數(shù)p∈Θ=(0,1),通過隨機(jī)抽樣得到總體X的一個觀測x。區(qū)別于以往的方法,本文并不是從B(n,p)分布的樣本觀測x的分布出發(fā)考慮問題,而是將總體率p看作是兩點(diǎn)分布B(1,p)的參數(shù),同時將二項(xiàng)分布B(n,p)的觀測x看作是一個服從兩點(diǎn)分布B(1,p)的取值為0,1的樣本序列:y=(y1,…,yn)的總和。

然后,注意到以p為參數(shù)的兩點(diǎn)分布B(1,p)的分布函數(shù)F(t;p)與樣本序列y對應(yīng)的經(jīng)驗(yàn)分布函數(shù)G(t)均為(0,1)上的階梯函數(shù),并且除去界值0,1之外分別只有一個躍度p和^p=x/n,則經(jīng)過計(jì)算得到:對于任意給定的p∈(0,1),F(xiàn)(t;p)與 G(t)之間的Kolmogrov分布距離的數(shù)值恰好為p-^p。這樣,只要給定總體率p的先驗(yàn)分布π(p),則對于給定的置信水平α,就可以按照上述后驗(yàn)分布密度π(p|x)給出參數(shù)p的區(qū)間估計(jì)[L(x),U(x)]。

本文選擇參數(shù)p的先驗(yàn)分布為均勻分布U(0,1),即π(p)=1,則對于二項(xiàng)分布B(n,p)的一個實(shí)際觀測x,其樣本頻率為 ^p=x/n,利用上述基于Kolmogrov分布距離的擬貝葉斯公式,參數(shù)p定義在參數(shù)空間Θ=(0,1)上的后驗(yàn)分布密度π(p|x)就是一個以x/n為最高點(diǎn)的單峰分布。若給定置信水平α,令:β=α/2,則置信下限L(x)可以通過下式確定:

模擬研究

本文利用隨機(jī)模擬的方法對總體率p的Wald區(qū)間估計(jì)和本文基于擬貝葉斯方法所得的區(qū)間估計(jì)進(jìn)行比較,本文選擇區(qū)間估計(jì)的覆蓋率和平均置信長度來評價區(qū)間估計(jì)的優(yōu)劣。假設(shè)從二項(xiàng)分布B(n,p)中獲得一個觀測x,如果按照某種方法給出p的一個置信水平為 α 的區(qū)間估計(jì)[L(x),U(x)],則[L(x),U(x)]對應(yīng)的覆蓋率P及平均長度L分別為:在下面的部分,我們給定置信水平α=0.05,樣本量則分別選擇25、50和100三種情形,再從均勻分布U(0,1)中隨機(jī)獲取100個數(shù)作為總體率p的取值。對于每一個p,本文分別計(jì)算了Wald區(qū)間估計(jì)和擬貝葉斯區(qū)間估計(jì)的覆蓋率和平均區(qū)間長度并進(jìn)行比較。模擬結(jié)果見圖1。分別用虛線及實(shí)線表示上述兩種區(qū)間估計(jì)的覆蓋率和平均置信長度。其中,上面的三個圖給出覆蓋率的相關(guān)結(jié)果,而下面的三個圖則給出平均置信長度的相關(guān)結(jié)果。為了清楚起見,在覆蓋率的幾個子圖中均加了一條取值為0.95的水平線以便觀察每種區(qū)間估計(jì)的覆蓋率與置信度的差別。

圖1 不同樣本量下Wald區(qū)間估計(jì)和擬貝葉斯區(qū)間估計(jì)的覆蓋率和平均置信長度

由圖1可以看出,Wald區(qū)間估計(jì)的平均區(qū)間寬度較小,而擬貝葉斯區(qū)間估計(jì)的平均區(qū)間寬度則稍大一點(diǎn);Wald區(qū)間估計(jì)在很多情形下根本未達(dá)到0.95的覆蓋率,而擬貝葉斯區(qū)間估計(jì)的覆蓋率則幾乎總在0.95水平線之上,高于Wald區(qū)間估計(jì)的覆蓋率。值得注意的是,Wald區(qū)間估計(jì)的穩(wěn)定性比較差,在參數(shù)空間Θ=(0,1)上有比較大的振蕩,并且比較容易受到總體率p的極端取值的影響,而擬貝葉斯區(qū)間估計(jì)的穩(wěn)定性則比較好。所以,本文介紹的基于擬貝葉斯方法所得的區(qū)間估計(jì)對極端取值的穩(wěn)健性較好。

討 論

首先,本文將樣本頻率 ^p=x/n與來自B(1,p)的樣本y對應(yīng)的經(jīng)驗(yàn)分布函數(shù)G(t)聯(lián)系起來,再基于G(t)及某個參數(shù)p對應(yīng)的分布函數(shù)F(t;p)的Kolmogrov分布距離d(p)構(gòu)造了一個關(guān)于參數(shù)p的函數(shù)K(p),并代替似然函數(shù)構(gòu)造擬貝葉斯后驗(yàn)分布,進(jìn)而給出參數(shù)p的區(qū)間估計(jì)的一個顯式解。函數(shù)K(p)以分布函數(shù)為基礎(chǔ)進(jìn)行定義,因而不容易受到模型偏差以及異常觀測的影響,而且隨機(jī)模擬的結(jié)果表明:當(dāng)參數(shù)p在參數(shù)空間Θ=(0,1)上取值時,尤其當(dāng)p接近0,1時,擬貝葉斯區(qū)間估計(jì)的覆蓋率比較高。事實(shí)上,生物醫(yī)學(xué)中很多有意義的數(shù)值例如治愈率、死亡率等常常在0,1附近取值,因此本方法存在實(shí)際的價值。

其次,根據(jù)擬貝葉斯后驗(yàn)分布π(p|x)的表達(dá),函數(shù)K(p)與似然函數(shù)有著類似的功能,因而擬貝葉斯公式不但能代替?zhèn)鹘y(tǒng)的貝葉斯公式完成類似的功能,而且在一定程度上滿足穩(wěn)健性。此外,根據(jù)擬貝葉斯公式的構(gòu)造,函數(shù)K(p)還可以根據(jù)實(shí)際情況選擇其他形式。

最后,由于二項(xiàng)分布的總體率p的后驗(yàn)分布是一個顯式表達(dá),因此該方法很容易擴(kuò)展到多個總體率的函數(shù)的估計(jì)問題,例如兩個總體率的差值、比值等的區(qū)間估計(jì)以及診斷試驗(yàn)的ROC曲線估計(jì)等,這也是我們將來需要探討的問題。措施。包括對患兒進(jìn)行積極的隔離治療,加強(qiáng)重點(diǎn)人群和重點(diǎn)地區(qū)的疫情主動搜索,開展行之有效的健康教育宣傳,加強(qiáng)醫(yī)療機(jī)構(gòu)和托幼機(jī)構(gòu)相關(guān)人員的業(yè)務(wù)培訓(xùn),加強(qiáng)托幼機(jī)構(gòu)的晨午檢制度和消毒制度,通過村醫(yī)加大對散居兒童的監(jiān)測和管理等,取得了較好的防控效果,使手足口病發(fā)病在4月份出現(xiàn)高峰后開始下降。

手足口病的人群分布與其他一些地區(qū)報(bào)道的情況基本相似〔4,5〕,男性發(fā)病高于女性,可能與男孩喜好活動,相互接觸密切有關(guān)。3歲以下兒童發(fā)病率高,主要原因可能為該年齡組兒童抵抗力低,家庭、社區(qū)中隱性感染者為本病的重要傳染源,散居兒童居家治療隔離不規(guī)范。

聚集性病例中83.6%發(fā)生在托幼機(jī)構(gòu),提示托幼機(jī)構(gòu)為本病的重點(diǎn)防控單位。通過對疫情的處理,認(rèn)為只要采取有效的措施即可控制手足口病的發(fā)病和流行。處理過程中除對患兒進(jìn)行嚴(yán)格的隔離治療外,還對幼兒園進(jìn)行徹底的消毒(活動室和教室開窗通風(fēng),被褥置于陽光下暴曬,餐具一用一消,玩具、教具規(guī)范消毒),并嚴(yán)格落實(shí)晨午檢制度,發(fā)現(xiàn)疑似病例及時隔離,嚴(yán)禁病例帶病上課,同時利用專家現(xiàn)場講座、張貼宣傳畫、發(fā)放手足口病明白紙進(jìn)行健康宣教,提高幼兒及家長對手足口病的認(rèn)識,掌握預(yù)防知識,取得了較好的防控效果。

綜上述結(jié)果分析,手足口病雖然傳播途徑多、傳染性強(qiáng)、隱性感染者多又無疫苗、藥物等特異性防控手段,但只要嚴(yán)格病例隔離制度、重點(diǎn)地區(qū)消毒制度、托幼機(jī)構(gòu)晨午檢制度、重點(diǎn)人群和重點(diǎn)地區(qū)的疫情主動搜索制度,同時做好手足口病的防治知識宣傳,提高群眾的防病意識和能力就能取得良好的防控效果。

1.呂冬梅,刑秀暖.46例手足口病發(fā)病情況分析.河北醫(yī)科大學(xué)學(xué)報(bào),2008,29(5):755-756.

2.周永運(yùn),武桂珍.加強(qiáng)疾病監(jiān)測與動態(tài)進(jìn)行人類腸道病毒71型生物風(fēng)險(xiǎn)評估.中華預(yù)防醫(yī)學(xué)雜志,2009,43:328-330.

3.衛(wèi)生部.手足口病預(yù)防控制指南(2009 版).2009.6.4.http://www.moh.gov.cn.

4.鄭惠貞,李劍森,康敏,等.廣東省手足口病確診病例發(fā)病及診療情況調(diào)查.華南預(yù)防醫(yī)學(xué),2008,34(5):10-13.

5.項(xiàng)娜,于海柱,崔蘭梅.北京市房山區(qū)233例手足口病流行病學(xué)分析.中國學(xué)校衛(wèi)生,2008,29(9):817-818.

猜你喜歡
二項(xiàng)分布后驗(yàn)覆蓋率
民政部等16部門:到2025年村級綜合服務(wù)設(shè)施覆蓋率超80%
二項(xiàng)分布與超幾何分布的區(qū)別與聯(lián)系
我國全面實(shí)施種業(yè)振興行動 農(nóng)作物良種覆蓋率超過96%
深度剖析超幾何分布和二項(xiàng)分布
概率與統(tǒng)計(jì)(1)——二項(xiàng)分布與超幾何分布
基于貝葉斯理論的云模型參數(shù)估計(jì)研究
電信800M與移動聯(lián)通4G網(wǎng)絡(luò)測試對比分析
一種基于最大后驗(yàn)框架的聚類分析多基線干涉SAR高度重建算法
2015年湖南省活立木蓄積量、森林覆蓋率排名前10位的縣市區(qū)
基于后驗(yàn)預(yù)測分布的貝葉斯模型評價及其在霍亂傳染數(shù)據(jù)中的應(yīng)用