白梅花 唐駿 羅寧 翟麗麗 劉興薇
基金項目:內(nèi)蒙古教育廳項目--《數(shù)學(xué)教育工學(xué)結(jié)合人才培養(yǎng)模式的建構(gòu)與實踐》(2013nmjg029)
摘 要 :本文以一個簡單例子探討了統(tǒng)計中統(tǒng)計推斷的一項重要內(nèi)容--假設(shè)檢驗及其相關(guān)的基本問題。假設(shè)檢驗是利用樣本對總體進行某種推斷的方法。文中給出了對總體參數(shù)如何提出假設(shè);再如何利用樣本數(shù)據(jù)判斷這個假設(shè)成立與否;以及假設(shè)檢驗方法可能犯的錯誤等。
關(guān)鍵詞 :假設(shè)檢驗;統(tǒng)計量;拒絕域;錯誤
中圖分類號:O21 文獻標識碼:A文章編號:1672-3791(2015)01(c)0000-00
1.前言
假設(shè)檢驗是統(tǒng)計推斷的重要組成部分,是利用樣本對總體進行某種推斷的方法。它先對總體參數(shù)的值提出一個假設(shè),然后利用樣本信息去檢驗這個假設(shè)是否成立。那么如何利用樣本信息,對假設(shè)成立與否作出判斷的一套程序是本文探討的內(nèi)容。
在現(xiàn)實生活中有大量的事例可以歸結(jié)為假設(shè)檢驗的問題。本文從下面例子談起。
2.假設(shè)檢驗的一個例子
例:由統(tǒng)計資料得知,2008年某地新生兒的平均體重為3190克,現(xiàn)在從2010年的新生兒中隨機抽取100個,測得其平均體重為3210克,問:2010年的新生兒與2008年相比,體重有無顯著差異?
解:從結(jié)果看,2010年新生兒平均體重比2008年新生兒平均體重增加了20克,但這20克的差異可能產(chǎn)生于抽樣的隨機性或可以理解為抽樣隨機性不可能造成20克這樣大的差異,新生兒體重確實有增加。那么,這20克的差異說明了什么?下面我們可以采取假設(shè)的方法。
(1)提出假設(shè): 表示2010年新生兒平均體重; 表示2008年新生兒平均體重。假設(shè)2008年和2010年新生兒的體重沒有顯著差異,則原假設(shè)和備擇假設(shè)分別為
,
原假設(shè)與備擇假設(shè)互斥,肯定原假設(shè),意味著放棄備擇假設(shè);否定原假設(shè),意味著接受備擇假設(shè)。
(2)確定檢驗統(tǒng)計量及檢驗法:原假設(shè)是否成立呢?我們要借助樣本統(tǒng)計量進行統(tǒng)計推斷,這個統(tǒng)計量被稱為檢驗統(tǒng)計量。選擇哪個統(tǒng)計量作為檢驗統(tǒng)計量需要考慮一些因素,例如,樣本是大樣本還是小樣本,總體標準差 已知還是未知,等等。
假定已知總體的標準差 ,樣本量 , , ,所以采用 統(tǒng)計量:
,
由抽樣分布原理知統(tǒng)計量 服從標準正態(tài)分布,故檢驗用 檢驗法。
(3)確定拒絕域:
如果顯著水平 ,則95%的 應(yīng)當(dāng)落在區(qū)間 內(nèi),即 內(nèi)。那么,我們把相應(yīng)的區(qū)間
即
稱為拒絕原假設(shè)的拒絕域。如果原假設(shè)成立,那么在一次實驗中 落入拒絕域: 內(nèi)的概率只有0.05,這個概率是很小的。如果這個情況真的出現(xiàn),我們有理由認為總體的真值不是3190克,也即拒絕原假設(shè),接受備擇假設(shè)。
這利用的是小概率原理,小概率原理是指發(fā)生概率很小的隨機事件在一次實驗中是幾乎不可能發(fā)生的。根據(jù)這一原理可以作出是否拒絕原假設(shè)的決定。但是什么樣的概率才算小呢?概率0.05夠小嗎?著名的英國統(tǒng)計學(xué)家費希爾把小概率的標準定為0.05,雖然費希爾并沒有對為什么選擇0.05給出充分的解釋,但人們還是沿用了這個標準,把0.05或比0.05更小的概率看成小概率。
(4)檢驗假設(shè)做出決策:把已知數(shù)據(jù) , , , 代入 算得
,落入拒絕域,所以拒絕原假設(shè),認為與2008年相比,2010年新生兒的體重有顯著差異。
3.假設(shè)檢驗兩類錯誤
對原假設(shè)提出的命題,我們依據(jù)樣本提供的信息需要做出真與偽的判斷,也就是由部分來推斷總體。因而判斷有可能正確,有可能不正確,也就是說,我們面臨著犯錯誤的可能。所犯的錯誤有兩種類型,一類錯誤是原假設(shè) 為真卻被我們拒絕了,這種錯誤稱為棄真錯誤;另一類錯誤是原假設(shè) 為偽我們卻沒有拒絕,這種錯誤稱為納偽錯誤。
自然,人們希望犯這兩類錯誤的概率越小越好。那么只能增大樣本量 ,才能做到犯這兩類錯誤的概率都很小。但樣本量不可能沒有限制,否則就會使抽樣調(diào)查失去意義。但對于一定的樣本量 ,我們做不到犯這兩類錯誤的概率同時都很小。一般只能把帶來嚴重后果的一類錯誤作為首要的控制目標即可。
4.拒絕域檢驗的優(yōu)缺點
上面進行檢驗的方法是根據(jù)檢驗統(tǒng)計量落入的區(qū)域作出是否拒絕原假設(shè)的決策。在確定顯著水平 以后,拒絕域的位置也就相應(yīng)確定了,其好處是進行決策的界限清晰,但缺點是進行決策面臨的風(fēng)險是籠統(tǒng)的。在上例子中,計算的 ,落入拒絕域,我們拒絕原假設(shè),接受備擇假設(shè)。這時犯棄真錯誤的概率為0.05。如果計算的 ,同樣落入拒絕域,我們拒絕原假設(shè)面臨的風(fēng)險也是0.05。那么0.05是通用的風(fēng)險概率,這是用拒絕域表示的弱點。
5.結(jié)束語
在實際問題的檢驗中,我們不可能對問題的背景都有所了解,如何提出假設(shè),并沒有統(tǒng)一的標準,假設(shè)的確定通常與所要檢驗的問題的性質(zhì),檢驗者所要達到的目的有關(guān)系,也與檢驗者的經(jīng)驗和知識水平有關(guān)。
另外,通常在假設(shè)檢驗中把希望證明的命題放在備擇假設(shè)上,而把原有的、傳統(tǒng)的觀點放在原假設(shè)上,這樣我們的目的就是希望能夠用事實推翻原假設(shè),而接受備擇假設(shè)。由于推翻原假設(shè)需要檢驗統(tǒng)計量落入拒絕域,所以在一次實驗中原假設(shè)是具有優(yōu)勢的,由小概率原理,備擇假設(shè)在一次實驗中不容易出現(xiàn),但一旦發(fā)生,我們就有充分的理由推翻原假設(shè),這意味著新結(jié)論的誕生。但是沒有拒絕原假設(shè),并不意味著備擇假設(shè)是錯誤的,只是說還沒有足夠的證據(jù)證明原假設(shè)不成立。所以說我們接受備擇假設(shè)一定意味著原假設(shè)錯誤;沒有拒絕原假設(shè)并不能表明備擇假設(shè)一定是錯的。
【參考文獻】
[1] 茆詩松,澲小龍,程依明.概率論與數(shù)理統(tǒng)計簡明教程[M].第1版.北京:高等教育出版社,2012.
[2] 趙彥暉,楊金林.概率統(tǒng)計[M].第1版.北京:科學(xué)出版社,2009.
[3] 賈俊平,何曉群,金勇進.統(tǒng)計學(xué)[M].第4版.北京:中國人民大學(xué)出版社,2009.
[4] 石林,張景.概率論與數(shù)理統(tǒng)計---理論與演練[M].第1版.成都:西南交通大學(xué)出版社,2013.