陳龍禹
【摘 要】在進(jìn)行參數(shù)估計之前,我們需耍知道如何通過樣本得到總體信息。達(dá)就需要對統(tǒng)計推斷的基礎(chǔ)理論依據(jù)——抽樣分布有一定的認(rèn)識。本文對一個總體參數(shù)估計時樣本統(tǒng)計量的抽樣分布進(jìn)行分析。
【關(guān)鍵詞】總體參數(shù)估計;樣本統(tǒng)計量;抽樣分布
統(tǒng)計推斷目的在于推斷總體特征,而這種推斷的基礎(chǔ)就是抽樣分布。參數(shù)用于描述總體;參數(shù)一般都是未知的,通過從總體中抽取隨機(jī)樣本來獲取必要的數(shù)據(jù);利用這些數(shù)據(jù)來計算一個或更多的統(tǒng)計量。例如,為了估計總體的均值,就要計算樣本均值。雖然樣本均值與總體均值之間有一定的差距,但可以預(yù)期它們是很接近的。但是,接近程度到底如何?還必須能度量它們接近的程度。抽樣分布正好可以幫助我們解決這個問題。在知道樣本均值和總體均值接近程度的基礎(chǔ)上,就可以對總體均值進(jìn)行估計了。
一、定義分析
在統(tǒng)計學(xué)中來陳述分布,我們可以通俗地將其理解為數(shù)據(jù)集合反映出的特征,對數(shù)值型數(shù)據(jù)而言,最明顯又可以和函數(shù)聯(lián)系起來的特征就是頻數(shù)分布了。理解了這個,總體分布和樣本分布的定義就呼之欲出了。
1.總體中所有數(shù)據(jù)所形成的相對頻數(shù)分布,稱為總體分布
現(xiàn)實中,無限總體是較為普遍的,有時即使是有限的,但是從成本或者破壞性上考慮,往往也得不到總體里面的所有數(shù)據(jù)。因此,總體分布往往事先是不知道的。但是我們又需要知道總體分布的相關(guān)信息,所以通常根據(jù)經(jīng)驗大致了解總體的分布類型,或者假定總體服從某種分布等等。因為最終我們作為研究者所關(guān)心的并不是所有數(shù)據(jù)到底是如何分布的,而是通過總體的參數(shù)來知道總體的特征。知道總體分布的定義之后,樣本分布的定義就可以依次類推了。
2.從總體中隨機(jī)抽取一個樣本,這一個樣本中所有數(shù)據(jù)所形成的相對頻數(shù)分布,稱為樣本分布
因為樣本是從總體中抽取的,來自于總體,所以其能反映總體的相關(guān)信息和特征也是理所當(dāng)然.這也是為什么樣本分布也稱經(jīng)驗分布的原因。但是樣本是隨機(jī)抽取的,只是總體中的一部分,當(dāng)這部分只是總體中很小的一部分時,即當(dāng)樣本容量很小時,這種代表性就會被大大削減。那么,到底怎么根據(jù)樣本推斷總體的特征呢?
描述總體特征值的稱為參數(shù),常用的總體參數(shù)有總體平均數(shù)中總體標(biāo)堆差,總體比例n而描述樣本數(shù)量特征值的稱為統(tǒng)計量。常用的統(tǒng)計量有樣本平均數(shù)z,樣本標(biāo)準(zhǔn)差,,樣本比例P。因為總體一般是未知但確定的,也就是說總體所有數(shù)據(jù)到底是多少、是怎么分布的我們不知道,但是并不會因為我們不知道,這些數(shù)據(jù)就不存在,因此,總體參數(shù)其實是一個未知的常數(shù)。但是統(tǒng)計量卻不一樣,首先,我們要明確一點,抽樣這個行為是可以重復(fù)進(jìn)行的,每進(jìn)行一次,就可以得到一個樣本,得到一個樣本,就可以算出這個樣本的相關(guān)統(tǒng)計量。既然抽樣可以進(jìn)行無數(shù)次,那說明對應(yīng)的統(tǒng)計量并不是只有一個,能抽取多少個樣本,就有多少個樣本統(tǒng)計量。因為抽樣是隨機(jī)的,所以我們說統(tǒng)計量是一個隨機(jī)變量,而樣本統(tǒng)計量的組合構(gòu)成的頻數(shù)分布就是抽樣分布。