郭 文
樣本容量是指按照某種規(guī)則從總體中抽取出來的樣本觀察單位的數(shù)目。在抽樣調(diào)查中,樣本容量的研究是一個(gè)非常重要的問題,樣本容量直接影響著犯兩類錯(cuò)誤的概率。在假設(shè)檢驗(yàn)中,一般討論的是犯第一類錯(cuò)誤的情況,通常只給出犯第一類錯(cuò)誤的概率,那么在樣本容量自由選擇的情況下,犯第二類錯(cuò)誤的概率是無法控制的。而犯第二類錯(cuò)誤的情形一般在醫(yī)學(xué)、風(fēng)險(xiǎn)控制、質(zhì)量控制等領(lǐng)域應(yīng)用較多。在研究這些領(lǐng)域時(shí),我們希望能同時(shí)控制兩類錯(cuò)誤的概率,那么樣本容量就需要通過計(jì)算來確定。目前國內(nèi)外對(duì)樣本容量的研究大多是建立在調(diào)查精度和費(fèi)用控制的基礎(chǔ)上。本文研究樣本容量的角度與之不同,是在控制兩類錯(cuò)誤的前提下,對(duì)方差檢驗(yàn)中樣本容量進(jìn)行探討。
如果把假設(shè)檢驗(yàn)中構(gòu)造的統(tǒng)計(jì)量記為T,把顯著性水平α下確定的拒絕域記為,把接收域記為W,則當(dāng)T服從正態(tài)分布時(shí),雙側(cè)檢驗(yàn)的與W如圖1所示。圖中陰影部分為拒絕域,非陰影部分為接受域W。
當(dāng)原假設(shè)H0為真時(shí),由于樣本的隨機(jī)性,仍然有可能以α的概率拒絕原假設(shè)H0,這就是第一類錯(cuò)誤,簡稱棄真,α為棄真的概率。如圖1,棄真顯然就是H0為真時(shí)T落入拒絕域Wˉ的事件,所以
圖1 雙側(cè)檢驗(yàn)的拒絕域與接收域
當(dāng)原假設(shè)非真時(shí),我們也仍然有可能接受它,這就是第二類錯(cuò)誤,簡稱取偽,取偽的概率以β表示。取偽顯然是當(dāng)H0為非真時(shí),T落入接受域W的事件,所以
P{T ∈ W| H0非真} =β
設(shè)隨機(jī)樣本(X1,X2,…,Xn)來自正態(tài)總體X~N(μ,σ2),μ=μ0已知。
對(duì)于右側(cè)檢驗(yàn),首先建立假設(shè)檢驗(yàn):
其次構(gòu)造χ2統(tǒng)計(jì)量:
當(dāng)H0為真時(shí):
當(dāng) H1為真時(shí):
根據(jù)定義,有
因此
uα、uβ為標(biāo)準(zhǔn)正態(tài)分布的上α分位點(diǎn)、β分位點(diǎn)。
將式(2)、(3)代入式(1)得:
解得:
同理,可計(jì)算出左側(cè)檢驗(yàn)樣本容量為:
雙側(cè)檢驗(yàn)時(shí)樣本容量為:
設(shè)隨機(jī)樣本(X1,X2,…,Xn)來自正態(tài)總體 X~N(μ,σ2),μ未知。
對(duì)于右側(cè)檢驗(yàn),首先建立假設(shè)檢驗(yàn):
構(gòu)造χ2統(tǒng)計(jì)量:
當(dāng)H0為真時(shí)
當(dāng)H1為真時(shí)
因此
同樣,當(dāng)n充分大時(shí)(通常n>45),有
這里uα、uβ為標(biāo)準(zhǔn)正態(tài)分布的上α分位點(diǎn)、β分位點(diǎn)。
將式(5)、(6)代入式(4)得:
解得
同理,可計(jì)算出左側(cè)檢驗(yàn)樣本容量為:
雙側(cè)檢驗(yàn)時(shí)樣本容量為:
設(shè) X1,X2,…,Xm和Y1,Y2,…,Yn是分別從服從和分布的兩個(gè)母體中抽出的獨(dú)立子樣,μ1、μ2已知。
首先建立假設(shè)檢驗(yàn):
其次構(gòu)造F統(tǒng)計(jì)量:
對(duì)于右側(cè)檢驗(yàn),建立假設(shè)檢驗(yàn):
則
則
當(dāng)n→∞時(shí),有 Fα(m,∞)=
又因?yàn)?/p>
因此
同理
所以,當(dāng)n→∞時(shí),有
解得:
同理,可計(jì)算出左側(cè)檢驗(yàn)時(shí)樣本容量為:
雙側(cè)檢驗(yàn)時(shí)樣本容量為:
設(shè) X1,X2,…,Xm和Y1,Y2,…,Yn是分別從服從和分布的兩個(gè)母體中抽出的獨(dú)立子樣,μ1、μ2未知。
首先建立假設(shè)檢驗(yàn):
其次構(gòu)造F統(tǒng)計(jì)量:
當(dāng)H0成立時(shí),F(xiàn)~F(m-1,n-1)。
對(duì)于右側(cè)檢驗(yàn),建立假設(shè)檢驗(yàn):
則
則
當(dāng)n→∞時(shí),有 Fα(m-1,∞)=
又因?yàn)?/p>
因此
同理
所以,當(dāng)n→∞時(shí),有
解得:
同理,可計(jì)算出左側(cè)檢驗(yàn)樣本容量為:
雙側(cè)檢驗(yàn)時(shí)樣本容量為:
以上我們對(duì)方差檢驗(yàn)中單母體及雙母體方差已知、方差未知情形下兩類錯(cuò)誤與樣本容量的關(guān)系進(jìn)行了探討,并在控制兩類錯(cuò)誤的條件下,給出了確定樣本容量的公式。從上面的討論可以看出,方差檢驗(yàn)中樣本容量的確定是件比較復(fù)雜的事情,必須給予足夠的重視。在實(shí)際操作中,樣本容量的確定既要考慮精度要求,又要考慮經(jīng)費(fèi)預(yù)算、可操作性等,必須通過綜合考慮,以達(dá)到一個(gè)最優(yōu)樣本容量的選擇。
[1] 陳國銘,李世英.統(tǒng)計(jì)質(zhì)量控制:估計(jì)和檢驗(yàn)[M].北京:中國石化出版社,北京,1995.
[2] 陳希孺.概率論與數(shù)理統(tǒng)計(jì)[M].合肥:中國科學(xué)技術(shù)大學(xué)出版社,2009.
[3] 魏宗舒.概率論與數(shù)理統(tǒng)計(jì)教程(第二版)[M].北京:高等教育出版社,2008.
[4] 馮士雍,施錫銓.抽樣調(diào)查——理論、方法與實(shí)踐[M].上海:上??茖W(xué)技術(shù)出版社,1994.
[5] W.G.Cochran.Sampling Techniques[M].Chichester:John Wiley&Sons,1997.