趙虎+楊小飛+李萍+楊海龍
摘要:本文為了便于讀者對(duì)樣本方差定義的理解,以正態(tài)分布為例,通過深層次分析,總結(jié)得出:在實(shí)際應(yīng)用中,為什么樣本方差的定義選取式子■■(X■-■)■,而不選取■■(X■-■)■的結(jié)論。
關(guān)鍵詞:總體方差;樣本方差;正態(tài)分布;無偏估計(jì);一致估計(jì)
中圖分類號(hào):O21 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1674-9324(2017)33-0194-02
概率論與數(shù)理統(tǒng)計(jì)是高等學(xué)校理工科大學(xué)生的一門必修課。然而對(duì)于初學(xué)者來說,總覺得樣本方差的定義不易掌握,且容易產(chǎn)生畏懼心理。到底是除以n還是n-1,大部分學(xué)生會(huì)感到很茫然。因此有必要弄清楚二者的區(qū)別。本文以正態(tài)分布為例,對(duì)樣本方差的定義進(jìn)行深層次的分析,以便初學(xué)者了解樣本方差的定義。
一、預(yù)備知識(shí)
定義1 設(shè)X是一個(gè)隨機(jī)變量,若E(|X|■)<∞,則稱A■=E(X■)為X的K階原點(diǎn)矩。當(dāng)k=1,A■=E(X),恰好為X的期望。
定義2 設(shè)(X■,X■,…,X■)為總體X的一個(gè)樣本,稱統(tǒng)計(jì)量B■=■■X■■為樣本的K階原點(diǎn)矩。當(dāng)k=1,
B■=■■X■=■,恰好為樣本的均值。
定理1:設(shè)總體X~N(μ,σ2),若(X1,X2,…,Xn)為X的一個(gè)簡(jiǎn)單隨機(jī)樣本,X為樣本均值,
S■■=■■(Xi-■)■,則■~x2(n-1).
二、對(duì)樣本方差定義的分析
設(shè)(X■,X■,…,X■)為總體X的一個(gè)樣本,根據(jù)切比雪夫大數(shù)定理知,當(dāng)總體X的K階矩存在時(shí),樣本的K階矩依概率收斂于總體的K階矩時(shí),因此可以用樣本的K階矩近似總體的K階矩。
當(dāng)總體X的K階矩存在時(shí),若定義總體的方差
D(X)=A■-A■■=E(X■)-E(X)■,因此根據(jù)切比雪夫大數(shù)定理,樣本的方差自然地可以定義為:
S■=B■-B■■
=■■X■■-■■X■■
=■■X■■-■■
=■■(X■-■)■.
所以,從理論上講,樣本的方差應(yīng)該用
S■=■■(X■-■)■來表示。若設(shè)(x■,x■,…,x■)是樣本
(X■,X■,…,X■)的一組觀測(cè)值,c是任意常數(shù),可以推出:
s■=■■(x■-■)■=■■((x■-c)+(c-■))■
=■■(x■-c)■-(■-c)■≤■■(x■-c)■
(注意:這里的n去掉或者換成n-1不等式仍然成立)。這說明了只有當(dāng)c=■時(shí),才能取到最小值,即波動(dòng)性最小,越有效。但是在實(shí)際應(yīng)用中,為什么樣本的方差選取■■(X■-■)■,而不選取S■=■■(X■-■)■? 這是因?yàn)楣烙?jì)量的選取不僅要符合有效性,還要符合無偏和一致性,這樣選取的估計(jì)量是最好的。學(xué)生自然而然地要問,■■(X■-■)■這個(gè)表達(dá)式到底怎么來的?它是否恰好符合無偏和一致性呢?
下面以正態(tài)分布為例進(jìn)行闡述,設(shè)(X■,X■,…,X■)為總體X~N(μ,σ■)的一個(gè)簡(jiǎn)單隨機(jī)樣本。
先回憶無偏估計(jì)的定義——設(shè)θ■(X■,X■…X■)是參數(shù)θ的一個(gè)估計(jì)量,若E(θ■(X■,X■…X■))=θ,則稱θ■(X■,X■…X■)是參數(shù)θ的一個(gè)無偏估計(jì)量。由于
E(S■)=E(■■(X■-■)■)
=E(■■X■■-■■)=E(X■■)-E(■■)
=D(X■)+E(X■)?搖■-D(■)+E(■)?搖■
=σ■+μ■-■nD(X■)+■nE(X■)?搖■
=σ■+μ■-■σ■-μ■
=■σ■
因此選取S■=■■(X■-■)■作為總體方差σ■的估計(jì)量不是無偏的估計(jì)量,但是
E(■S■)=■E(S■)=■·■σ■=σ■.
故將S■修正,令
S■■=■S■=■·■■(X■-■)■
=■■(X■-■)■.
顯然有E(S■■)=σ■.
現(xiàn)在的問題是:S■■=■■(X■-■)■是否滿足一致性?
再回憶一致性的定義:設(shè)θ■(X■,X■…X■)是參數(shù)θ的一個(gè)估計(jì)量,若?坌ε>0,
■p|θ■(X■,X■…X■)-θ|<ε=1,則稱θ■(X■,X■…X■)是參數(shù)θ的一致估計(jì)量。
根據(jù)定理1,■~χ■(n-1).
因此:
D(S■■)=■D(■S■■)
=■2(n-1)=■.
即D(S■■)存在。根據(jù)切比雪夫不等式,
?坌ε>0,0≤p|S■■-E(S■■)|≥ε
=p|S■■-σ■|≥ε≤■=■.
所以■p|S■■-E(S■■)|≥ε=0.
故■p|S■■-E(S■■)|<ε=
1-■p|S■■-E(S■■)|≥ε=1.
這就證明了S■■=■■(X■-■)■是參數(shù)σ■的一致估計(jì)量。
三、結(jié)論
本文以正態(tài)分布為例,從理論上證明了在實(shí)際應(yīng)用中,為什么樣本方差的定義選取式子■■(X■-■)■,而不選取■■(X■-■)■的結(jié)論,同時(shí)還應(yīng)注意到,當(dāng)n足夠大時(shí),二者(至少在計(jì)算上)的區(qū)別可以忽略不計(jì)。
參考文獻(xiàn):
[1]魏忠舒.概率論與數(shù)理統(tǒng)計(jì)教程[M].第二版.北京:高等教育出版社,1993.
[2]盛驟,謝式千,潘承毅.概率論與數(shù)理統(tǒng)計(jì)[M].第四版.北京:高等教育出版,2010.
[3]趙健,郭良棟.樣本方差定義分析[J].高師理科學(xué)刊,2016,36(7):61-62.
[4]楊海龍.隨機(jī)事件概率的解題思路與方法[J].教育教學(xué)論壇,2016,(19):163-164.
A Deeply Analysis on the Definition of Sample Variance
ZHAO Hu1,YANG Xiao-fei1,LI Ping1,YANG Hai-long2
(1.School of Science,Xi'an Polytechnic University,Xi'an,Shaanxi 710048,China;
2. College of Mathematics and Information Science,Shaanxi Normal University,Xi'an,Shaanxi 710062,China)
Abstract:In this paper,in order to facilitate reader's understanding the definition of sample variance,taking normal distribution as an example,through a deeply analysis,we concluded the following conclusion:in real application,why people choose formula ■■(X■-■)■ as the definition of sample variance rather than choose formula■■(X■-■)■.
Key words:population variance;sample variance;normal distribution;unbiased estimator;consistent estimator