李曉康
(陜西理工學(xué)院 數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院, 陜西 漢中 723000)
兩點(diǎn)分布是一類最基本、最簡(jiǎn)單的統(tǒng)計(jì)分布,它描述僅有兩種狀態(tài)(其中一個(gè)結(jié)果視為成功,另一個(gè)結(jié)果視為失敗)的隨機(jī)現(xiàn)象,許多隨機(jī)現(xiàn)象都可用它進(jìn)行描述,如產(chǎn)品合格率問(wèn)題、疾病發(fā)病率問(wèn)題等。故對(duì)其參數(shù)(成功概率)的估計(jì)成為統(tǒng)計(jì)中的重要問(wèn)題?;诓煌慕y(tǒng)計(jì)思想,可給出不同的估計(jì),常用的有矩估計(jì)、極大似然估計(jì)等。按照Bayes統(tǒng)計(jì)學(xué)的觀點(diǎn),參數(shù)估計(jì)問(wèn)題可視為一個(gè)特殊的統(tǒng)計(jì)決策問(wèn)題,可按照一定的標(biāo)準(zhǔn)進(jìn)行評(píng)價(jià),如均方誤差風(fēng)險(xiǎn)等,在不同的先驗(yàn)信息下,會(huì)給出不同的估計(jì),不同的估計(jì)即為不同的決策。故可在不同的先驗(yàn)下,尋找風(fēng)險(xiǎn)最小的估計(jì)。對(duì)此問(wèn)題,已取得了一些結(jié)果。[1-6]
本文在幾種不同先驗(yàn)信息和平方損失下研究了0-1分布參數(shù)的Bayes估計(jì),討論了其性質(zhì),并進(jìn)行了數(shù)值仿真實(shí)驗(yàn),利用仿真實(shí)驗(yàn)結(jié)果對(duì)其進(jìn)行比較。
Bayes理論認(rèn)為:未知參數(shù)θ可視為隨機(jī)變量,可用某種概率分布π(θ)去描述。至于具體用何種分布去描述,依賴于對(duì)總體參數(shù)過(guò)去的認(rèn)識(shí),是取得樣本前已有的,稱為先驗(yàn)信息(亦稱先驗(yàn)分布)。本文對(duì)0-1分布未知參數(shù)θ(成功概率)的先驗(yàn)分布考慮如下兩種。
此種先驗(yàn)分布無(wú)任何先驗(yàn)信息可用,故先驗(yàn)分布可取為參數(shù)空間Θ上的均勻分布。對(duì)0-1分布,其成功概率θ的無(wú)信息先驗(yàn)分布可取為區(qū)間[0,1]上的均勻分布,即:
(1)
Jeffreys先驗(yàn)分布為參數(shù)θ的Fisher信息陣的行列式的平方根[1],即:
π2(θ)=[I(θ)]1/2,
本文假設(shè):總體X~b(1,θ),分布列P(X=x|θ)=θx(1-θ)1-x,x=0,1。
樣本聯(lián)合條件分布(似然函數(shù)):
對(duì)數(shù)似然函數(shù):
xlnθ+(n-x)ln(1-θ),
,
故
π2(θ)=[I(θ)]1/2∝θ-1/2(1-θ)-1/2。
(2)
Bayes理論認(rèn)為:由先驗(yàn)分布和樣本信息可計(jì)算后驗(yàn)分布,即先驗(yàn)分布+樣本信息?后驗(yàn)分布:
π(θ)⊕p(x|θ)?π(θ|x),
此即Bayes公式:
(3)
下面按式(3)可計(jì)算后驗(yàn)分布。
由式(1)給出的先驗(yàn)分布及式(3)可得樣本與參數(shù)的聯(lián)合分布為
樣本邊際分布為
后驗(yàn)分布為
(4)
由式(2)給出的先驗(yàn)分布及式(3)可得樣本與參數(shù)的聯(lián)合分布為
樣本邊際分布為
故由Bayes公式,先驗(yàn)分布π2(θ)的后驗(yàn)分布為
(5)
參數(shù)的Bayes估計(jì)依賴于損失函數(shù),本文選取平方損失函數(shù),即:
在此損失函數(shù)下,參數(shù)的Bayes估計(jì)有以下結(jié)論:
由此結(jié)論,對(duì)本文給出的兩種先驗(yàn)分布,有如下結(jié)果:
由式(4)給出的后驗(yàn)分布,有:
由式(5)給出的后驗(yàn)分布,有:
即:兩種估計(jì)都不是θ的無(wú)偏估計(jì),但都是θ的漸近無(wú)偏估計(jì)。
均方誤差的定義為:
θ)2。
對(duì)如上給出的兩種參數(shù)估計(jì),可計(jì)算其均方誤差:
Bayes估計(jì)的風(fēng)險(xiǎn)定義為后驗(yàn)分布下的平均損失,即:
兩種估計(jì)的風(fēng)險(xiǎn)分別為:
由以上結(jié)果可以看出,兩種估計(jì)的均方誤差取決于樣本容量n和參數(shù)真值θ的大小,風(fēng)險(xiǎn)取決于樣本觀測(cè)值與樣本容量n的大小,可以證明:
,R1(n,x) 下面通過(guò)數(shù)值仿真來(lái)討論其性質(zhì)。 對(duì)如上給出的兩種參數(shù)估計(jì),對(duì)不同的樣本容量n和參數(shù)真值θ,下面采用數(shù)值仿真計(jì)算結(jié)果進(jìn)行比較。 對(duì)樣本容量n=30,50時(shí)的不同參數(shù)真值及不同樣本觀測(cè)值,經(jīng)隨機(jī)模擬仿真實(shí)驗(yàn),產(chǎn)生的隨機(jī)樣本,計(jì)算兩種估計(jì)的均方誤差及風(fēng)險(xiǎn),部分結(jié)果如表1—表4、圖1—圖4所示。 表1 n=30時(shí)不同參數(shù)真值的均方誤差 表2 n=50時(shí)不同參數(shù)真值的均方誤差 表3 n=30時(shí)不同樣本觀測(cè)值的風(fēng)險(xiǎn) 表4 n=50時(shí)不同樣本觀測(cè)值的風(fēng)險(xiǎn) 圖1 n=30時(shí)不同參數(shù)真值的均方誤差 圖2 n=50時(shí)不同參數(shù)真值的均方誤差 圖3 n=30時(shí)不同樣本觀測(cè)值的風(fēng)險(xiǎn) 圖4 n=50時(shí)不同樣本觀測(cè)值的風(fēng)險(xiǎn) 由表1—表4及圖1—圖2可以看出,當(dāng)n=30,50時(shí),對(duì)不同參數(shù)真值,兩種估計(jì)的均方誤差都具有隨參數(shù)真值先增大、后減小的趨勢(shì);對(duì)不同的樣本觀測(cè)值,兩種估計(jì)的風(fēng)險(xiǎn)也具有隨樣本觀測(cè)值先增大,后減小的趨勢(shì);總體來(lái)講,無(wú)信息先驗(yàn)分布下估計(jì)的均方誤差及風(fēng)險(xiǎn)要小于Jeffreys先驗(yàn)分布下估計(jì)的均方誤差及風(fēng)險(xiǎn)。 [參考文獻(xiàn)] [1] 茆詩(shī)松,王靜龍,濮曉龍.高等數(shù)理統(tǒng)計(jì)[M].北京:高等教育出版社,1998. [2] 李曉康.不同損失函數(shù)下0-1分布參數(shù)的Bayes估計(jì)[J].廊坊師范學(xué)院學(xué)報(bào):自然科學(xué)版,2013,13(2):8-10. [3] 王晶,劉福升.不同損失函數(shù)下不同無(wú)信息先驗(yàn)的Bayes估計(jì)及比較[J].山東科技大學(xué)學(xué)報(bào):自然科學(xué)版,2005,24(4):95-98. [4] 陳宜輝,姜禮平,吳樹(shù)和.無(wú)信息先驗(yàn)下幾種不同Bayes估計(jì)的比較[J].海軍工程大學(xué)學(xué)報(bào),2001,13(5):97-99. [5] BERGER O.統(tǒng)計(jì)決策及貝葉斯分析[M].賈乃光,譯.北京:中國(guó)統(tǒng)計(jì)出版社,1998.5 數(shù)值仿真及結(jié)論