李廣正
(中國(guó)人民銀行蘭州中心支行,蘭州 730000)
數(shù)理統(tǒng)計(jì)的本質(zhì)是以樣本推斷總體,而區(qū)間估計(jì)又是統(tǒng)計(jì)推斷的核心內(nèi)容,所以研究區(qū)間估計(jì)問題具有重要意義。在給定置信水平的情況下,基于單峰對(duì)稱分布的參數(shù)的區(qū)間估計(jì),傳統(tǒng)方法構(gòu)造的區(qū)間是最短置信區(qū)間;當(dāng)分布為單峰非對(duì)稱時(shí),利用傳統(tǒng)方法構(gòu)造的區(qū)間是等尾置信區(qū)間,而不是最短置信區(qū)間。
關(guān)于研究最優(yōu)區(qū)間估計(jì)的文獻(xiàn)有很多,李柏林[1]證明了最優(yōu)區(qū)間估計(jì)的存在性,并推導(dǎo)出了常見分布的參數(shù)的區(qū)間估計(jì)公式;錢瑛[2]證明了單峰分布的最短置信區(qū)間的存在性;姜培華[3]證明了兩正態(tài)總體方差比的最優(yōu)區(qū)間的存在性,即F分布最優(yōu)區(qū)間的存在性,這些文獻(xiàn)都只是從理論上證明不同分布下的最優(yōu)區(qū)間估計(jì)的存在性。徐曉嶺[4]不僅運(yùn)用拉格朗日乘數(shù)法證明了卡方分布的最優(yōu)區(qū)間估計(jì)存在性問題,還利用matlab求解出了卡方分布最短區(qū)間估計(jì)值,并構(gòu)造了不同自由度下卡方分布的最短區(qū)間估計(jì)用表。孫鵬哲[5,6]給出了F分布和卡方分布最短置信區(qū)間的左側(cè)概率分配值表。其他針對(duì)單峰非對(duì)稱分布的最優(yōu)區(qū)間估計(jì)的研究還有很多,例如,王學(xué)敏[7]研究了指數(shù)分布和瑞利分布參數(shù)的最短區(qū)間估計(jì)問題。本文根據(jù)以上文獻(xiàn)的研究思路,研究如何計(jì)算出F分布最短區(qū)間估計(jì)用表,力爭(zhēng)在精度上優(yōu)于傳統(tǒng)方法。
設(shè)x1,x2,…,xm是來(lái)自正態(tài)分布的樣本,y1,y2,…,yn是來(lái)自正態(tài)分布的樣本,且兩樣本相互獨(dú)立。兩樣本均值分別為和兩樣本方差分別為:
對(duì)給定的置信水平1-α,由:
對(duì)給定的置信水平1-α,取滿足條件:
的x1和x2。由此得到的1-α的最短置信區(qū)間:
其中,0<x1<x2,且滿足:
F(m-1,n-1)(x)為F(m-1,n-1)的分布函數(shù) 。
姜培華[3]證明了基于F分布的兩正態(tài)總體方差比的最優(yōu)區(qū)間估計(jì)的存在性及唯一性,即上述非線性規(guī)劃問題存在最優(yōu)解。
周岱翰強(qiáng)調(diào),飲食要均衡。一年到頭,他雷打不動(dòng)要吃的“寶貝”,是最平常不過的蘋果,每天1~2個(gè)。有人問他:“蘋果就那么好吃嗎,吃多了不厭煩嗎?”“蘋果如果不好吃,就當(dāng)藥吃嘛!”他說(shuō)。
作者簡(jiǎn)介:李廣正(1990—),男,河南信陽(yáng)人,碩士,助理經(jīng)濟(jì)師,研究方向:商務(wù)統(tǒng)計(jì)。
孫鵬哲[5]運(yùn)用數(shù)值模擬方法,利用R軟件計(jì)算最短置信區(qū)間對(duì)應(yīng)的左側(cè)概率分配值,同時(shí)給出了最優(yōu)左側(cè)概率分配統(tǒng)計(jì)表。其計(jì)算步驟為:第一步,計(jì)算基于最短置信區(qū)間對(duì)應(yīng)的左側(cè)概率分配值;第二步,計(jì)算由第一步得到的左側(cè)概率分配值對(duì)應(yīng)的分位數(shù),此分位數(shù)就是最優(yōu)區(qū)間的左側(cè)端點(diǎn)值,再計(jì)算右側(cè)概率分配值對(duì)應(yīng)的分位數(shù),即為最優(yōu)區(qū)間的右側(cè)端點(diǎn)值。由于每一步的計(jì)算結(jié)果都不是精確的解析解,而是近似的數(shù)值解,所以這種分兩步計(jì)算最優(yōu)區(qū)間估計(jì)的方法擴(kuò)大了估計(jì)誤差。而且,該文章只給出了基于F分布下最優(yōu)左側(cè)概率分配統(tǒng)計(jì)表,必須通過此表再計(jì)算相應(yīng)概率下對(duì)應(yīng)的分位數(shù),才能得到最優(yōu)區(qū)間估計(jì),這給實(shí)際應(yīng)用帶來(lái)了麻煩?;谶@種考慮,本文通過運(yùn)用拉格朗日乘數(shù)法,利用mathematics軟件分別計(jì)算出了在0.9、0.95和0.99置信水平下基于F分布的最短置信區(qū)間,并構(gòu)造了F分布的最短區(qū)間估計(jì)用表。
由式(2)得:
由于F分布的分布函數(shù)形式非常復(fù)雜,一般的軟件很難求出式(6)決定的非線性規(guī)劃問題的最優(yōu)解。本文通過運(yùn)用拉格朗日乘數(shù)法,將一個(gè)求解非線性規(guī)劃問題轉(zhuǎn)換成求解方程組的問題。經(jīng)過分析可知,由式(6)決定的非線性規(guī)劃問題的最優(yōu)解和由式(4)和式(8)組成的方程組的解相同。利用mathematics軟件里的FindRoot函數(shù)能較精確地求出方程組的近似根。對(duì)于F(m,n)分布,只有當(dāng)n>4時(shí),分布的方差才存在,故為保證方差存在,本文的最優(yōu)區(qū)間估計(jì)表是在兩個(gè)自由度都大于4的條件下計(jì)算的,具體程序略。
表1 0.9置信水平下最優(yōu)區(qū)間的左側(cè)端點(diǎn)值
表2 0.9置信水平下最優(yōu)區(qū)間的右側(cè)端點(diǎn)值
表3 0.95置信水平下最優(yōu)區(qū)間的左側(cè)端點(diǎn)值
表4 0.95置信水平下最優(yōu)區(qū)間的右側(cè)端點(diǎn)值
表5 0.99置信水平下最優(yōu)區(qū)間的左側(cè)端點(diǎn)值
表6 0.99置信水平下最優(yōu)區(qū)間的右側(cè)端點(diǎn)值
本文計(jì)算出了在0.9、0.95和0.99置信水平下基于F分布的最短置信區(qū)間,構(gòu)造了最短區(qū)間估計(jì)用表,同時(shí)將本文的方法與傳統(tǒng)方法和文獻(xiàn)[5]中介紹的方法進(jìn)行比較,比較結(jié)果見表7。在表7中,區(qū)間長(zhǎng)度1表示使用本文方法構(gòu)造的最短置信區(qū)間的長(zhǎng)度,區(qū)間長(zhǎng)度2表示使用文獻(xiàn)[5]的方法構(gòu)造的最短置信區(qū)間的長(zhǎng)度,等尾置信區(qū)間長(zhǎng)度表示傳統(tǒng)方法構(gòu)造的置信區(qū)間的長(zhǎng)度。(注:此處的區(qū)間長(zhǎng)度比實(shí)際的區(qū)間長(zhǎng)度少了倍,表7中的區(qū)間長(zhǎng)度比是區(qū)間長(zhǎng)度1與等尾置信區(qū)間長(zhǎng)度的比值)。
表7 不同方法構(gòu)造的置信區(qū)間對(duì)比
從表7中可以看出,在給定置信水平情況下,三種方法求得的置信區(qū)間長(zhǎng)度都是隨著F分布的自由度的增加而減少,這是由于F分布隨著自由度的增加,其密度函數(shù)呈現(xiàn)“尖峰薄尾”的形狀,樣本的集中趨勢(shì)越來(lái)越明顯。
通過對(duì)比可以看出,在給定置信水平和自由度情況下,本文計(jì)算的最短置信區(qū)間要優(yōu)于文獻(xiàn)[5]中計(jì)算的置信區(qū)間,且兩者都遠(yuǎn)遠(yuǎn)優(yōu)于傳統(tǒng)方法構(gòu)造的置信區(qū)間。而且,三個(gè)置信區(qū)間之間的差別隨著自由度大小的不同存在一定的變化。例如,在0.9置信水平下,當(dāng)F分布的兩個(gè)自由度為4,4時(shí),區(qū)間長(zhǎng)度1為4.1041,區(qū)間長(zhǎng)度2為4.1163,區(qū)間長(zhǎng)度1略優(yōu)于區(qū)間長(zhǎng)度2;當(dāng)F分布的自由度為20,10時(shí),兩者的區(qū)間長(zhǎng)度幾乎一樣。在0.9置信水平下,當(dāng)F分布的兩個(gè)自由度為4,4時(shí),區(qū)間長(zhǎng)度1為等尾置信區(qū)間長(zhǎng)度的65.84%;當(dāng)F分布的自由度為20,10時(shí),區(qū)間長(zhǎng)度1為等尾置信區(qū)間長(zhǎng)度的92.04%,兩者之間的差別在縮小,這是由于當(dāng)F分布的自由度增加時(shí),其密度函數(shù)的對(duì)稱性越來(lái)越明顯,區(qū)間長(zhǎng)度1與等尾置信區(qū)間的長(zhǎng)度也越來(lái)越接近。所以,在小樣本情況下,研究F分布的最短區(qū)間估計(jì)是有意義的。
相比于文獻(xiàn)[5]中的方法,本文的方法一方面在精度上優(yōu)于前者(在小樣本情況下比較明顯),另一方面在使用便利程度上也優(yōu)于前者。本文直接構(gòu)造了F分布的最短置信區(qū)間估計(jì)用表,而文獻(xiàn)[5]只給出了F分布的最短置信區(qū)間的左側(cè)概率分配值表。
相比于傳統(tǒng)方法,本文的方法不僅在精度上要遠(yuǎn)遠(yuǎn)優(yōu)于傳統(tǒng)方法,而且在適用面上也要比傳統(tǒng)方法更廣泛。使用傳統(tǒng)方法構(gòu)造等尾置信區(qū)間時(shí),需要查閱F分布的分位數(shù)表,而一般教材提供的都是有限自由度下F分布的分位數(shù)表,本文介紹的方法在理論上可以計(jì)算任意自由度下的F分布的最短置信區(qū)間,所以其適用面更廣。