劉 薇,常振海,張德生
(1.天水師范學(xué)院數(shù)學(xué)與統(tǒng)計學(xué)院,甘肅天水741001;2.西安理工大學(xué)理學(xué)院,陜西西安710054)
基于Bootstrap法的BCa區(qū)間二階矯正性質(zhì)研究
劉 薇1,常振海1,張德生2
(1.天水師范學(xué)院數(shù)學(xué)與統(tǒng)計學(xué)院,甘肅天水741001;2.西安理工大學(xué)理學(xué)院,陜西西安710054)
首先,證明了基于Bootstrap法的BCa區(qū)間二階矯正性質(zhì)的相關(guān)抽象結(jié)論;其次,討論了BCa區(qū)間的算法實現(xiàn),并進行了實證分析。結(jié)果表明,在分布左尾較長的情形下,分位數(shù)法將正態(tài)區(qū)間的端點向左調(diào)整,BCa法又將分位數(shù)區(qū)間端點進一步向左調(diào)整,區(qū)間對稱性也從正態(tài)區(qū)間的1,調(diào)整至分位數(shù)區(qū)間的0.58和BCa區(qū)間的0.38。這些調(diào)整均說明BCa區(qū)間是最為符合分布特性的估計區(qū)間,印證了BCa區(qū)間的優(yōu)良二階性質(zhì)。
Bootstrap法;BCa區(qū)間;二階修正性;二階精確性
近些年來,Bootstrap方法因為其優(yōu)良的統(tǒng)計性質(zhì)一直是眾多相關(guān)學(xué)者關(guān)注的熱點之一,如文獻[1-4]從不同領(lǐng)域、不同方面展示了Bootstrap方法及其應(yīng)用?;贐ootstrap方法的區(qū)間估計是其應(yīng)用方面之一。
依據(jù)文獻[5,6]關(guān)于BCa區(qū)間的高度概括和抽象的結(jié)論,我們首先簡化了基于Bootstrap法的BCa區(qū)間二階矯正性質(zhì)。然后討論了BCa區(qū)間的算法實現(xiàn),并進行了實證分析,印證了BCa區(qū)間的優(yōu)良二階性質(zhì)。
實例數(shù)據(jù)來源于Bootstrap法的發(fā)明者Bradley Efron所用數(shù)據(jù)[5],目的是用抽取的15對樣本數(shù)據(jù)去估計總體(共82對數(shù)據(jù))的相關(guān)系數(shù),本文進一步分析了相關(guān)系數(shù)的BCa置信區(qū)間??傮w數(shù)據(jù)和隨機抽取的樣本數(shù)據(jù)見圖1。運算基于Matlab 7.5。
圖1 總體數(shù)據(jù)點和樣本數(shù)據(jù)點
圖2 Bootstrap法相關(guān)系數(shù)分布圖
表1 三個非參數(shù)Bootstrap法置信區(qū)間
從表1能看出,非參數(shù)Bootstrap分位數(shù)法把上下區(qū)間端點分別從1.0574和0.5219調(diào)整到了0.9611和0.4619;BCa法則進一步把分位數(shù)區(qū)間上下分位點分別調(diào)整到了0.9413和0.3564。而shape則從1減小到了0.38。為了直觀的說明這些調(diào)整過程,把BCa法區(qū)間和分位數(shù)區(qū)間顯示在了圖3中。
圖3 Bootstrap法相關(guān)系數(shù)分布圖及相關(guān)置信區(qū)間
從圖3能直觀的看出,BCa法的調(diào)整更加符合分布左尾較長這個特性,從而是較適合的估計區(qū)間。
(1)文獻[5,6]中關(guān)于BCa的高度概括和抽象的結(jié)論不利于人們對BCa區(qū)間優(yōu)良性質(zhì)的理解,本文首先從理論上簡化了基于Bootstrap法的BCa區(qū)間二階修正性這個性質(zhì),它甚至把上端點延伸到了1之外,所以它的這個性質(zhì)在總體不對稱的時候是十分有害的。因為分布左邊尾巴較長,所以分位數(shù)區(qū)間的shape=0.58就比1小了很多,應(yīng)該說比正態(tài)區(qū)間好多了,而BCa法區(qū)間的shape=0.38,比分位數(shù)區(qū)間的還小,就更加符合分布的左尾較長這個分布特性,應(yīng)該說是較適合的區(qū)間。
(3)需要指出的是,本文證明二階性質(zhì)時是從總體均值入手證明的。對于更加復(fù)雜的總體參數(shù)形式或總體參數(shù)的函數(shù)的二階性質(zhì)的證明,方法類似,只不過矯正參數(shù)a,z0的表達式應(yīng)該和文中的不一樣。
另外,BCa區(qū)間需要再抽樣次數(shù)較大才能起到有效的作用[6],一般要在B=2000以上,本文為3000,對于這個不足之處本文沒有過多強調(diào),這個缺陷現(xiàn)在計算機較為發(fā)達的今天不是問題,同時也可以考慮ABC法區(qū)間[5,7],詳見相關(guān)論文。
[1]Shuang Li,Li Hsu,Jie Peng.Bootstrap inference for network construction with an application to a breast cancermicroarray study[J].Annals of Applied Statistics,2013,7(1):391-417.
[2]Xiaofeng Shao,Dimitris N.Politis.Fixed b subsampling and the block bootstrap:improved confidence sets based on pvalue Calibration[J].J.R.Statist.Soc.B,2013,75(1):161-184.
[3]Guosheng Yin.Pearson-type goodness-of-fit test with bootstrap maximum likelihood estimation[J].Electronic Journal of Statistics,2013,7:412-427.
[4]金浩,張思,喬寶明,等.基于Bootstrap的厚尾相依序列持久性變點檢驗[J].數(shù)學(xué)的實踐與認識,2012,43(13):174-179.
[5]Efron B,Tibshirani R J.An Introduction to the Bootstrap[M].New York:Chapman&Hall Ltd,1993.
[6]DiCiccio J,Efron B.Bootstrap confidence intervals[J].Statistical Science,1996,11(3):189-228.
[7]DiCiccio J,Efron B.More accurate confidence intervals in exponential families[J].Biometrika,1992,79:231-245.
[責(zé)任編輯 畢 偉]
Second-Order Correct Properties of BCa Interval Based on the Bootstrap M ethod
LIUWEI1,CHANG Zhen-hai1,ZHANG De-sheng2
(1.School of Mathematics and Statistics,Tianshui Normal University,Tianshui741001,China;2.School of Science,Xian University and Technology,Xian 710054,China)
Firstly,abstract conclusions of second-order correct property of BCa interval based on bootstrap method are simplified.Then,BCa interval algorithm is discussed,and example is used to show how this is done.The results show,in the case of long left tail distribution,standard interval endpoint is adjusted to the leftby percentilemethod,and percentile interval endpoint is further adjusted to the left by BCamethod;The shape about symmetry of standard interval is adjusted from 1to percentile interval's0.58,and further to BCa interval's0.38.These adjustments show that BCa estimation interval is themost consistentwith distribution characteristics,which also confirm excellent second-order properties of BCa interval.
Bootstrap method;BCa interval;second-order correct;second-order accuracy
O212.1
A
1004-602X(2014)04-0008-02
10.3969/J.ISSN.1004-602X.2014.04.008
2014-10-20
國家自然基金(51379173);天水師范學(xué)院中青年教師科研資助項目(TSY201204)
劉 薇(1980—),女,河南盧氏人,天水師范學(xué)院講師。