楊桂元,劉德志
(安徽財經(jīng)大學 統(tǒng)計與應用數(shù)學學院,安徽 蚌埠 233030)
參數(shù)假設檢驗中的若干基本問題研究
楊桂元,劉德志
(安徽財經(jīng)大學 統(tǒng)計與應用數(shù)學學院,安徽 蚌埠 233030)
文章對參數(shù)統(tǒng)計檢驗中的基本原理、勢函數(shù)與兩類錯誤、檢驗的 p值和單邊檢驗的假設與拒絕域等若干基本問題進行了研究,并分析了它們之間的關系,闡明了參數(shù)的區(qū)間估計和假設檢驗的關系,揭示了參數(shù)統(tǒng)計推斷的本質(zhì)。
參數(shù)統(tǒng)計檢驗;兩類錯誤;勢函數(shù);p值;拒絕域
隨著科學技術和生產(chǎn)的不斷發(fā)展,數(shù)理統(tǒng)計的應用更加廣泛。而統(tǒng)計假設檢驗問題在統(tǒng)計推斷中占有很重要的地位。人們常常假設總體為正態(tài)分布,在正態(tài)總體下衍生出了統(tǒng)計學的三大分布——t分布、F分布和χ2分布,產(chǎn)生了與此相關的抽樣分布,并且研究了正態(tài)總體期望和方差的各種統(tǒng)計推斷問題。區(qū)間估計和假設檢驗是統(tǒng)計推斷中的重要內(nèi)容,是兩個不同的統(tǒng)計概念,但它們又有著密切的聯(lián)系,在某種意義下是同一問題的兩個方面。這兩種統(tǒng)計推斷方法都是通過對具體問題的隨機抽樣所得到的樣本觀察值,用數(shù)理統(tǒng)計學的方法進行統(tǒng)計分析并做出判斷。深刻理解參數(shù)假設檢驗中的若干基本問題,了解統(tǒng)計推斷中參數(shù)的假設檢驗與區(qū)間估計之間的關系、不同類型的假設檢驗適用范圍及應注意的問題,對正確的掌握和應用統(tǒng)計推斷方法是極為重要的。然而這部分內(nèi)容不易理解,從而初學者和實際應用的工作者在解決具體問題時會遇到一些困難。本文將就此問題展開討論。
在假設檢驗中,常把一個被檢驗的假設稱為原假設或者零假設,用H0表示。通常將不應輕易加以否定的假設作為原假設,當H0被拒絕時而接受的假設稱為備擇假設,用H1表示,它們常常成對出現(xiàn)。
由樣本(x1,x2,…,xn)對假設進行推斷總是通過一個恰當?shù)慕y(tǒng)計量T(x1,x2,…,xn)完成的,該統(tǒng)計量T(x1,x2,…,xn)稱為檢驗統(tǒng)計量。使原假設被拒絕的樣本觀測值所在區(qū)域稱為拒絕域,一般它是樣本空間Ω的子集,并用W表示,Wˉ稱為接受域;統(tǒng)計量T(x1,x2,…,xn)的拒絕域記為T(W)。
假設檢驗的基本原理是小概率事件原理,即:概率很小的事件在一次試驗中實際上是不可能發(fā)生的;基本方法是“反證法”,若小概率事件發(fā)生則拒絕原假設H0從而接受備擇假設H1,否則接受原假設H0。
對于給出的拒絕域W,由于抽樣的隨機性,我們做出的判斷不可能絕對正確,它可能會犯兩類錯誤。
第一類錯誤:當H0為真時,但(x1,x2,…,xn)∈W ,從而拒絕H0。這種錯誤稱為第一類錯誤,又稱為“棄真錯誤”,其發(fā)生的概率通常記為α,即
就是假設檢驗的顯著性水平。
第二類錯誤:在H0不真時,但(x1,x2,…,xn)∈Wˉ,從而接受H0。這種錯誤稱為第二類錯誤,又稱為“納偽錯誤”或你“取偽錯誤”,其發(fā)生的概率通常記為β,即
定義1設檢驗問題 H0:θ∈Θ0vs H1:θ∈Θ1的拒絕域為W,則樣本觀測值(x1,x2,…,xn)落入拒絕域W內(nèi)的概率稱為該檢驗的勢函數(shù),即
其中,Θ0,Θ1是參數(shù)空間兩個互不相交的子集。
由兩類錯誤的概率α、β與勢函數(shù)的意義,可知它們之間的關系為:
由此可以看出,當α減小時,c也減小,而c的減小必導致β的增大;當β減小時,c會增大,而c的增大必導致α的增大。故得到兩類錯誤的關系:
(1)在樣本容量n一定時,α與β不能同時減小,α的減小必導致β的增大;β的減小必導致α的增大。
(2)要使α與β同時減小,則只有加大樣本容量n,但又增加了檢驗的成本這在有些情況下又是不現(xiàn)實的。一般情況下控制α,使β盡量小。
定義2對檢驗問題 H0:θ∈Θ0vs H1:θ∈Θ1,如果一個檢驗滿足對任意的θ∈Θ0,都有
則稱該檢驗是顯著性水平為α的顯著性檢驗,簡稱水平為α的檢驗。
可見,顯著性水平α就是用來控制犯第一類錯誤的概率的。最常見的選擇是α=0.05,有時也選擇α=0.1或α=0.01。
假設檢驗的結論通常是簡單的,在給定的顯著水平α下,不是拒絕原假設就是接受原假設。然而有時也會出現(xiàn)這樣的情況:在一個較大的顯著水平下得到拒絕原假設的結論,而在一個較小的顯著水平下卻得到相反的結論。檢驗的 p-值是一個非常重要的概念,許多統(tǒng)計應用軟件(如Excel、SPSS、EViews等)檢驗的輸出結果都有檢驗的p-值(p-value),可以根據(jù) p-值和任意給定的顯著性水平α直接作出接受或拒絕原假設H0的結論。
定義3在一個假設檢驗問題中,利用樣本觀測值能夠做出拒絕原假設的最小顯著性水平稱為檢驗的p值。
引進檢驗的p值的概念有明顯的好處:首先,它比較客觀,避免了事先確定顯著水平;其次,由檢驗的p值與人們心目中顯著性水平α進行比較可以很容易做出檢驗的結論:
(1)如果α≥p,則在顯著性水平α下拒絕H0;
(2)如果α<p,則在顯著性水平α下應保留H0。
設T為檢驗統(tǒng)計量,T0為由檢驗統(tǒng)計量得到的觀察值,針對原假設和備擇假設由T0為臨界值確定的拒絕域為W0,檢驗的 p值為:
對于正態(tài)總體參數(shù)的u檢驗和t檢驗等對稱的情形有:
其他檢驗的p值可以類似推出。
對于參數(shù)的單側(cè)檢驗比較難于掌握的是原假設的設定和拒絕域的確定。單側(cè)檢驗原假設H0的設定應遵從以下原則:
(1)H0不能輕易被否定;(2)等號包含在原假設H0內(nèi);(3)根據(jù)問題的背景來設定原假設。
由于原假設H0中參數(shù)的設定不是一個常數(shù),而是一個范圍。在H0成立的條件下,檢驗統(tǒng)計量在拒絕域內(nèi)取值的概率只能通過不等式來確定,由此可以得到拒絕域是概率不超過α的更小概率得事件。
根據(jù)以下兩種單邊檢驗情況具體討論:
①σ已知時的u檢驗
其中,tα(n-1)和 t1-α(n-1)=-tα(n-1)分別表示自由度為n-1的t分布的α和1-α的上側(cè)分位數(shù)。
另外,單個正態(tài)總體方差的檢驗,兩個正態(tài)總體均值差和方差比的檢驗都符合以上的結論,即拒絕域是概率不超過α的小概率事件。
其他的各種情況同理,此不贅述。
[1]茆詩松,程依明等.概率論與數(shù)理統(tǒng)計教程[M].北京:高等教育出版社,2004.
[2]楊桂元.概率論與數(shù)理統(tǒng)計[M].北京:電子科技大學出版社,2004.
O212
A
1002-6487(2012)24-0013-02
安徽省高等學校人文社科基金重點項目;安徽財經(jīng)大學教學研究項目(ACJYZD201213)
楊桂元(1957-),男,安徽蕭縣人,教授,研究方向:數(shù)量經(jīng)濟學。
劉德志(1982-),男,山東濟寧人,講師,碩士,研究方向:隨機分析。
(責任編輯/亦 民)