周富林 胡小麗 謝兆俊
摘 要:抽樣調查是一種常用的調查方式,論文以大學生群體的身高和體重為調查對象,對有較大差異的抽樣量進行了比較,利用數理統(tǒng)計方法,從均值和標準偏差的角度來判斷不同樣本量的差異顯著性。
關鍵詞:假設檢驗;抽樣調查;樣本量
一、引言
抽樣調查的一個關鍵問題就是樣本量的科學確定。樣本量的大小直接影響抽樣誤差、調查的費用、調查所需的時間、調查訪員的數量以及其他一些重要的現(xiàn)場操作的限制條件。樣本量過大,會造成人力、物力和財力的浪費;樣本量過小,會造成抽樣誤差增大,影響抽樣推斷的可靠程度。
二、問題提出和解決
本文以大學生群體為案例,擬通過實際案例,對這種樣本量的差異性帶來的均值和標準差的異同,進行比較。通過不同的抽樣量分布計算其對應的均值和標準差,與設定總體進行假設檢驗,比較異同。
(一)抽樣量的改變對結果的影響
在誤差d較小的時候,約是標準差的十分之一左右,兩種樣本量估計值的差異是最大的。本文根據這種差異來進行統(tǒng)計學意義上的對比計算。上表1中,序號1對應的等量大小的誤差,根據經驗樣本量的公式估算抽樣量n1=256,根據GB/T8054查表所得的抽樣量n2=36。當誤差的變化達到一定量時,即時標準差的1倍時,兩種方法所取得的樣本量一樣,都是11。我們將之分別與n=1150時的均值和標準差做假設檢驗。需要說明的是,在比較過程中,取的n1=256個值采用的是整群抽樣。取得的n1=36和n3=11個值,采用的是簡單隨機抽樣。下表1是在取三個樣本量的三種情況下,分別計算其均值和標準差。
表1:抽樣量改變均值和方差比較
所有調查數據符合正態(tài)分布的前提條件,可采用假設檢驗,比較兩種抽樣量的均值和標準差有無顯著性差異。從而判斷抽樣量較小的取值是否可取。若是可取,對將來的類似調查可以節(jié)省大量經費。
(二)假設檢驗
分別假設檢驗樣本n1、n2和n3與假設總體n0=1150的均值做假設檢驗,n1用如下公式
H0:μ1=μ0,H1:μ1≠μ0此時
對應n1的假設檢驗,δ=0,若t>tα/2(n-1),則拒絕原假設。
按照GB/T8053的推薦,取α=0.05,用公式
和判斷公式
,若其小于等于判定數k,則認為可以接受原假設,兩者之間無顯著性差異。依次對n2和n3重復上述步驟。
查表可得判定數k分別是t0.025(36)=2.0281和t0.025(11)=2.2010,n=256時,由于表中無法提供自由度大于45的t值來進行比較,數值只能提供參考。
根據身高的數據由計算得:t1=1.6284,由體重的均值代入上式,t1=3.9577此時可以參考表中判斷數,但無法直接比較。
下表2中,對應n=36和n=11的判斷數均小于判斷數,接受原假設。
下表2是假設檢驗的判斷數
表2:均值的假設檢驗判斷數
由此可見,在均值的比較上,樣本量n2=36和n3=11對應的抽樣調查結果都是在可接受范圍內,與對照的n=1150對應的均值沒有顯著性差異。根據判斷數的顯示和對應規(guī)則,可以發(fā)現(xiàn),n2=36的抽樣量對應的結果與對照樣本的差異性是最小的。
用卡方分布進行方差的比較,用公式:(n-1)s2/σ02≤χ1-α/2(n-1)或(n-1)s2/σ02≥χα/2(n-1) 作為拒絕域的判斷。分別用n2=36和11代入,計算結果如下表3:
表3:方差的假設檢驗判斷數
兩者比較下來都是n2=36,和n=11的抽樣量其方差的假設檢驗都在可接受范圍內。由此可見抽樣量的大小對結果的影響并不大,只要抽樣方法是合適的。
三、結論
根據數理統(tǒng)計規(guī)律,樣本量增加呈直線遞增的情況下而抽樣誤差只是樣本量相對增長速度的平方根遞減。若樣本量過大,調查單位增多,不僅增加人力、財力和物力的耗費,增加調查費用,而且還影響到抽樣調查的時效性,從而不能充分發(fā)揮抽樣調查的優(yōu)越性。因此,為節(jié)省調查費用,體現(xiàn)出抽樣的優(yōu)越性,在確定樣本容量時,應在滿足抽樣對估計數據的精確度的前提下,盡量取小一些的樣本量。