王晶,劉彭
(山東農(nóng)業(yè)大學(xué) 信息科學(xué)與工程學(xué)院,山東 泰安 271018)
參數(shù)估計方法是基礎(chǔ)的統(tǒng)計推斷方法之一,此類方法在自然科學(xué)和社會科學(xué)各領(lǐng)域涉及到數(shù)據(jù)分析的問題中被大量使用.在實際問題中,人們感興趣的問題往往與分布族中的未知參數(shù)有關(guān).參數(shù)估計方法是在總體分布形式已知時,利用樣本值對分布中某一個或某幾個未知參數(shù)值進(jìn)行統(tǒng)計推斷的方法,一般分為點估計和區(qū)間估計問題.
在總體分布形式已知時,對于其分布中的未知參數(shù)θ,除了求出其點估計外,還希望估計出一個范圍,使其以較大可信度包含參數(shù)θ的真值.這樣的范圍通常以區(qū)間形式給出,同時還給出其包含參數(shù)θ真值的可信程度,這種形式的估計稱為參數(shù)的區(qū)間估計,而這樣的區(qū)間稱為參數(shù)θ的置信區(qū)間[1].
定義1[2]設(shè)總體X的分布中含有未知參數(shù)θ,若有來自總體X的一組樣本(X1,X2,…,Xn)確定的2個統(tǒng)計量,使得對于給定的α(0<α<1),有,則稱隨機(jī)區(qū)間是參數(shù)θ置信度為1-α的置信區(qū)間,分別稱為置信下限和置信上限,1-α稱為置信度.
在經(jīng)典統(tǒng)計學(xué)中,構(gòu)造參數(shù)θ的置信區(qū)間最常用的方法是樞軸量法,其基本步驟可概括為:
Step1選取樣本(X1,X2,…,Xn)的一個函數(shù)G(X1,X2,…,Xn;θ),其中只含所求置信區(qū)間的未知參數(shù)θ,且分布已知;
Step2對于給出的置信水平1-α,確定Step1 中分布的雙側(cè)分位點λ1,λ2,則有
Step3利用不等式變形得到未知參數(shù)θ的置信區(qū)間.
構(gòu)造置信區(qū)間的方法關(guān)鍵在于Step1 中所選取的函數(shù)G(X1,X2,…,Xn;θ)為樞軸量.關(guān)于樞軸量,在大部分概率統(tǒng)計教材中對其是這樣描述的:選取合適的統(tǒng)計量,要求包括待檢驗的參數(shù),不含其它任何未知參數(shù),且統(tǒng)計量的分布已知[3],滿足這種要求的統(tǒng)計量即為在區(qū)間估計中所謂的樞軸量[4-5].而在參數(shù)的區(qū)間估計問題中,即使是對同一個未知參數(shù)求置信區(qū)間,滿足以上條件的統(tǒng)計量也往往不是唯一的,此時就面臨著如何選取樞軸量的問題.針對選擇不同的樞軸量得到的置信區(qū)間其性質(zhì)是否有差別,不同樞軸量下得到的同一參數(shù)的置信區(qū)間之間是否有優(yōu)劣之分問題,本文以單個正態(tài)分布總體中方差σ2這一參數(shù)的區(qū)間估計問題為例進(jìn)行討論.
設(shè)總體X~N(μ,σ2),其中總體均值μ已知,(X1,X2,…,Xn)為來自總體容量為n的簡單隨機(jī)樣本,則有
式中:X為樣本均值.
2 種區(qū)間(3)(4)是基于不同樞軸量對單個正態(tài)總體方差σ2進(jìn)行區(qū)間估計的結(jié)果,若要對其優(yōu)劣進(jìn)行比較主要基于可靠度和精度2個指標(biāo).在區(qū)間估計中,置信度1-α反映的是估計的可靠性程度,置信度越大,估計的可靠性程度也就越大;置信區(qū)間的長度反映的是估計的精度,置信區(qū)間長度越短,估計的精度也就越高.在樣本容量n一定的情況下,這2個要求往往是互相矛盾的[6].在實際應(yīng)用中,置信度一般按照應(yīng)用需求直接給定,可靠性已經(jīng)確定,此時可認(rèn)為平均長度較小的置信區(qū)間精度較高,估計結(jié)果更好.
對于置信區(qū)間(3),其平均長度為
對于置信區(qū)間(4),其平均長度為
因此可構(gòu)造兩者比值,其為樣本容量n的函數(shù),記為
顯然n=1 時,,此時L1=L2.當(dāng)n> 1時,g(n)的部分結(jié)果見表1(α=0.05).由表1可見,隨著n的增大,置信區(qū)間對應(yīng)g(n) 的差值逐漸減小,即隨著樣本容量增大,2種置信區(qū)間平均長度比逐漸趨于穩(wěn)定.
表1 不同樣本容量下2 種置信區(qū)間的平均長度比
在SPSS22.0[7-8]中得到樣本容量n∈[1,20]及n∈[1,100]時函數(shù)g(n)變化趨勢(見圖1).
圖1 置信區(qū)間長度比變化趨勢
由表1 和圖1可以看出,當(dāng)n> 1時,g(n)的值隨著n的增大持續(xù)變小,n> 5時變化趨于平緩,因此對任意樣本容量n,總有g(shù)(n) ≤ 1,即L1≤L2,在相同的置信度下,置信區(qū)間(3)的精度優(yōu)于置信區(qū)間(4).在總體均值已知情形下,用樞軸量(3)對單個正態(tài)總體的方差σ2進(jìn)行區(qū)間估計效果更好.
為了進(jìn)一步對結(jié)論進(jìn)行驗證,可從特定正態(tài)總體中抽樣隨機(jī)模擬獲得直觀比較結(jié)果.設(shè)總體X~N(0,1),即參數(shù)σ2的真值為1.運用R 軟件[9],從此分布總體中隨機(jī)抽取100 組容量為n的樣本,根據(jù)式(3)~(4),由隨機(jī)抽樣結(jié)果分別計算σ2置信度為95%的100 個置信區(qū)間.n=10,n=100時100個置信區(qū)間的模擬結(jié)果分別見圖2~3.
圖2 樣本容量為10 時的100 個置信區(qū)間
圖3 樣本容量為100 時的100 個置信區(qū)間
由圖2~3 可以看出,2種情形下均有置信區(qū)間(3)的平均長度遠(yuǎn)小于置信區(qū)間(4)的平均長度.相比較下,用樞軸量對單個正態(tài)總體的方差σ2進(jìn)行區(qū)間估計,置信區(qū)間精度較高,結(jié)果更好.
利用2種方法在總體均值已知情況下,對正態(tài)總體方差σ2進(jìn)行區(qū)間估計,通過具體實驗結(jié)果的計算比較,也能看到置信區(qū)間(3)的精度較高.
例[10]發(fā)芽期隨機(jī)抽取某種作物16 株,對株高進(jìn)行測量,測得株高(單位:cm)數(shù)據(jù)分別為2.15,2.10,2.12,2.10,2.14,2.11,2.15,2.13,2.13,2.11,2.14,2.13,2.12,2.13,2.10,2.14.求株高標(biāo)準(zhǔn)差σ的95%置信區(qū)間(設(shè)總體X~N(2,σ2)).
解由實際測量數(shù)據(jù),根據(jù)式(3)~(4)分別可計算得到株高方差σ2和標(biāo)準(zhǔn)差σ的95%置信區(qū)間,結(jié)果見表2.
表2 2種不同方法下株高方差和標(biāo)準(zhǔn)差的置信區(qū)間
對于該例題,在2種區(qū)間估計方法下,具體算得的置信區(qū)間差別比較大,顯然此例中置信區(qū)間(3)的長度遠(yuǎn)遠(yuǎn)小于置信區(qū)間(4),說明其精度較高.在實際應(yīng)用中,在可靠度一定的情況下,精度高的置信區(qū)間是應(yīng)該優(yōu)先選擇的,而在經(jīng)典教科書中對于此類均值已知情形下正態(tài)總體方差的區(qū)間估計均選用樞軸量進(jìn)行構(gòu)造,是有其深刻意義的.可見,樞軸量的選擇是有其標(biāo)準(zhǔn)可言的.
通過總體均值已知時單個正態(tài)分布總體方差σ2參數(shù)的區(qū)間估計問題,初步闡述了樞軸量的選取標(biāo)準(zhǔn)及其對置信區(qū)間結(jié)果的影響.在進(jìn)行置信區(qū)間的評價時,可靠性和精度是2個基本標(biāo)準(zhǔn),而它們也與樣本容量n的大小有直接關(guān)系,在此不再深入探討.需要注意的是當(dāng)考慮置信區(qū)間精度這一標(biāo)準(zhǔn)時,應(yīng)盡量選擇區(qū)間平均長度小的置信區(qū)間.在討論2種情況下置信區(qū)間的平均長度大小關(guān)系時,對不同樣本容量n的進(jìn)行了直觀模擬.由于比值函數(shù)中包含χ2分布分位點,其值為χ2分布的分布函數(shù)的反函數(shù)值,其取值范圍的嚴(yán)格證明仍需要進(jìn)行更深層次的思考.