張 千, 李新民
(1.山東理工大學(xué) 理學(xué)院, 山東 淄博 255091; 2.青島大學(xué) 數(shù)學(xué)科學(xué)學(xué)院, 山東 青島 266000)
對區(qū)間估計(jì)的一般方法是頻率方法,此方法只能在一些簡單情形下才能對參數(shù)和參數(shù)函數(shù)給出精確的置信區(qū)間,在大量較復(fù)雜的情形下,只能利用大樣本理論,或自助法,鞍點(diǎn)逼近等方法構(gòu)造近似區(qū)間估計(jì).Bayes方法也可用于區(qū)間估計(jì),但前提是需要參數(shù)的先驗(yàn)分布,并且不同的先驗(yàn)分布給出不同的Bayes區(qū)間,而且一般它不是頻率意義下的置信區(qū)間,即其覆蓋率不等于要求的置信水平.本文采用Fiducial推斷[1]方法,這類方法不需要先驗(yàn)分布,而是根據(jù)數(shù)據(jù)給出與參數(shù)的后驗(yàn)分布有相同作用的Fiducial分布.它由Fisher[2]首先提出并研究.其后有不少統(tǒng)計(jì)學(xué)者對之進(jìn)行討論. David和Stone[3]討論了在函數(shù)模型下求Fiducial分布的一般方法及有關(guān)的推斷.Barnard[4]基于樞軸模型研究了Fiducial推斷.雖然該類方法未能形成理論體系,但在一些頻率方法無法解決,而又沒有合適的先驗(yàn)分布的具體問題上,用Fiducial方法給出合理可行的答案,仍很有意義. Weerahandi[5]提出了廣義樞軸量和廣義區(qū)間估計(jì)的概念,并通過一些實(shí)例進(jìn)行研究,但并未提出如何構(gòu)造廣義樞軸變量.李新民和李國英利用Fiducial推斷方法給出了構(gòu)造方差分量的線性函數(shù)的廣義區(qū)間估計(jì)的一種方法.最近Hannig[6]等也討論了利用Fiducial推斷方法構(gòu)造廣義區(qū)間估計(jì),并把所得區(qū)間估計(jì)稱為Fiducial廣義區(qū)間估計(jì).最近李新民等給出了限制參數(shù)空間上求參數(shù)Fiducial區(qū)間的一般方法,并將之應(yīng)用于一些模型.徐興忠和李國英在樞軸分布族中給出了構(gòu)造參數(shù)Fiducial分布的一般方法.李新民和李國英[7]利用廣義推斷法給出了非平衡設(shè)計(jì)中方差因素和的置信區(qū)間,并且說明了通過Fiducial推斷方法很容易構(gòu)造廣義樞軸量.Bootstrap[8]方法是由美國斯坦福大學(xué)統(tǒng)計(jì)學(xué)教授Efron首先提出的,該方法通過對樣本的經(jīng)驗(yàn)分布進(jìn)行隨機(jī)再抽樣、得到Bootstrap子樣本,然后再進(jìn)行統(tǒng)計(jì)量的估計(jì)。該方法不僅對于很多統(tǒng)計(jì)量已被證明滿足大樣本的相合性,而且對于小樣本分析,更具有其不可替代的優(yōu)越性。
對于多元正態(tài)分布總體,Xi=(Xi1,Xi2,…,Xini)(i=1,2)為取自正態(tài)分布總體N(μi,σi)的樣本,其中,ni(i=1,2)為第i個樣本的樣本容量.變異系數(shù)為
易知
根據(jù)參數(shù)Bootstrap方法[4],用樣本均值和方差分別代替總體均值和方差,得到
可以推得
其中Z為標(biāo)準(zhǔn)正態(tài)分布隨機(jī)變量.
用參數(shù)自助法計(jì)算基本步驟如下:
(2)運(yùn)用Monte-Carlo模擬法,生成一個樣本容量ni的Bootstrap樣本.
(4)重復(fù)上述(2)-(3)步驟n次(一般大于1 000).
(5)將θB(j)進(jìn)行升序排列.
Tsui和Weerahandi[9]及Weerahandi[10]提出了廣義推斷的概念.設(shè)隨機(jī)變量X的概率分布Pη(·),η=(θ,δ)為參數(shù)空間Ω上的未知參數(shù),θ=θ(η)為所關(guān)心的實(shí)值參數(shù)函數(shù),δ為討厭參數(shù),記Θ為θ的參數(shù)空間,x為X的觀測值.
定義1[5]記R=R(X;x,η)為X和x及η=(θ,δ)的函數(shù).如果R滿足以下性質(zhì):
(1)R的分布與未知參數(shù)無關(guān).
(2)r=R(x;x,η)不依賴于討厭參數(shù)δ.
則稱R為廣義樞軸量.
定義2[6]設(shè)存在空間ε上的隨機(jī)變量E,它的分布已知,并且存在從Ω×ε到χ上的函數(shù)h(η,e),使得當(dāng)參數(shù)為η時,X=h(η,E).
對一切η∈Ω成立.進(jìn)一步,若對任意x∈χ和e∈ε,方程x=h(η,e)在Ω上有惟一解,記為ηx(e).于是
(1)ηx(E)的分布稱為η的分布.
(2)θ(ηx(E))的分布稱為θ=θ(η)的(邊際)分布.
由定義2,從參數(shù)θ的Fiducial分布
Fx(θ)=Pr(θ(ηx(E))≤θ).
易知0≤Fx(θ)≤1,并且Fx(θ)關(guān)于θ非減,于是可得到參數(shù)的Fiducial區(qū)間.
可知COVi的分布與未知參數(shù)無關(guān),另一方面,COVi的觀測值為
不依賴于討厭參數(shù),所以COVi為廣義樞軸量.
利用廣義推斷方法,具體的模擬步驟如下:
(2)隨機(jī)產(chǎn)生F1,F2的樣本f1,f2.
(4)重復(fù)上述(2)-(3)步驟n次(一般大于1 000).
(5)將θG(j)(j=1,2,…,N)進(jìn)行升序排列.
從表1中可以看出,當(dāng)方差相同時,均值無論怎
表1 模擬組數(shù)相同且方差相同下的精度
么變化,廣義推斷法的覆蓋率比較穩(wěn)定,并在95%左右,而參數(shù)Bootstrap方法的覆蓋率一般小于95%且不穩(wěn)定,所以廣義推斷法較好.
表2 模擬組數(shù)相同且均值方差都不同下的精度
從表2中可以看出,當(dāng)均值和方差任意取值時,廣義推斷法覆蓋率比較穩(wěn)定,并且覆蓋率接近95%,效果較好.
綜上知,廣義推斷法要優(yōu)于參數(shù)Bootstrap方法.
[1] 李新民,徐興忠,李國英.廣義P值的Fiducial推斷[J].中國科學(xué)A輯:數(shù)學(xué),2007, 37(6): 733- 741.
[2] Fisher R A. Inverse probability[J]. Mathematical proceedings of the Cambridge Philosophical Society,1930, 26: 528-535.
[3] Dawid A P, Stone M. The functional model basis of fiducial inference[J].Ann Statist,1982, 10 (4):1054-1067.
[4] Barnard G A. Pivotal models and the fiducial argument[J]. Int Statist Rev, 1995, 63:309-323.
[5] Weerahandi S. Generalized confidence intervals[J]. Journal of the American Statistical Association, 1993, 88:899-905.
[6] Hannig J. On generalized fiducial inference[J]. Statistica Sinica, 2009, 19:491-544.
[7] Li X, Li G. Confidence intervals on sum of variance components with unbalanced designs[J]. Communications in Statistics-Theory and Methods, 2005, 34(4):833-845.
[8] Efron B, Tibshirani R J. An introduction to the bootstrap [M]. New York: Chapman & Hall, 1993, 178-201.
[9] Tsui K, Weerahandi S. Generalized p-values in significance testing of hypotheses in the presence of nuisance parameters[J]. Journal of the American Statistical Association, 1989, 84: 602-607.
[10] Weerahandi S.Generalized confidence intervals[J]. Journal of the American Statistical Association, 1993,88:899-905.