徐向宏
(甘肅農(nóng)業(yè)大學(xué)生命科學(xué)技術(shù)學(xué)院,甘肅 蘭州 730070)
百分率χ2檢驗的應(yīng)用條件
徐向宏
(甘肅農(nóng)業(yè)大學(xué)生命科學(xué)技術(shù)學(xué)院,甘肅 蘭州730070)
摘要:百分率的χ2檢驗在農(nóng)業(yè)科學(xué)數(shù)據(jù)分析中的應(yīng)用非常普遍,但目前在應(yīng)用條件上仍存有偏差.本文以一個總體的百分率P是否等于常數(shù)P0的χ2 檢驗為例,根據(jù)χ2檢驗?zāi)P偷膩須v認為:應(yīng)用的條件np≥5,nq=n(1-p)≥5,在實際應(yīng)用時對應(yīng)的應(yīng)用條件應(yīng)該是:m≥5,n-m≥5,而不僅僅是目前教科書的應(yīng)用條件:np0≥5,nq0=n(1-p0)≥5.本結(jié)果將有助于研究人員在應(yīng)用χ2檢驗避免偏差,得到更客觀的統(tǒng)計結(jié)果.
關(guān)鍵詞:百分率檢驗;χ2檢驗;應(yīng)用條件
第一作者:徐向宏(1955-),男,副教授,研究方向為生物統(tǒng)計.E-mail:xuxh@gsau.edu.cn
Application conditions ofχ2 test on percentage
XU Xiang-hong
(College of Life Science and Technology,Gansu Agricultural University,Lanzhou 730070,China)
Abstract:The test on percentage is very common applied in data analysis of agricultural science,but there is still deviation in application conditions.In this paper,we took a example of making a comparison of the overall percentage P and the P0 constant,calculated whether two number were equal or not.According to the origin of χ2 model,the application conditions of np≥5,nq=n(1-p)≥5 should be corrected.In the actual application,the application condition should be :m≥5,n-m≥5,instead of the relevant content,np0≥5,nq0=n(1-p0)≥5 in the text book.The results will help researchers to avoid deviation in the application of χ2 test,and get more objective statistical results.
Key words:percentage test;χ2 test;application condition
1問題的提出
假設(shè)H0:p=p0,
(1)
或
(2)
(2)式是Yates.f的連續(xù)性校正模型.
現(xiàn)舉例用np0≥5,np0≥5的應(yīng)用條件[1-4]進行檢驗.假設(shè)總體P(A)=p=2%(實際中p的大小未知),現(xiàn)檢驗p與p0=5%差異是否顯著.對于該問題,正確的統(tǒng)計結(jié)論應(yīng)是差異顯著.但在np0≥5,nq0=n(1-p0)≥5的應(yīng)用條件下進行檢驗?zāi)芊竦贸稣_結(jié)論.
np0≥5,nq0≥5條件,
故
=3.789
χ2=3.789<3.84(或者顯著性sig.=0.052>0.05)統(tǒng)計結(jié)論是總體百分率p與5%差異不顯著.如用(2)式計算,χ2=3.184<3.84,統(tǒng)計結(jié)論同樣是總體百分率p與5%差異不顯著.
=4.737
因為χ2=4.737>3.84所以統(tǒng)計結(jié)論是總體百分率p與5%差異顯著.如用(2)式計算,χ2=4.126>3.84,統(tǒng)計結(jié)論同樣是總體百分率p與5%差異顯著.
例2統(tǒng)計分析檢驗出了的總體p=2%與p0=5%的差異,而例1的統(tǒng)計分析沒有檢驗出p=2%與p0=5%的差異,造成了統(tǒng)計結(jié)論的錯誤.同一總體的2個樣本,都滿足χ2檢驗條件,為什么例1檢驗的統(tǒng)計結(jié)論不正確,是否僅是樣本容量小造成的,現(xiàn)直接用二項分布模型對例1進行檢驗.
假設(shè)H0:p=5%,抽樣A出現(xiàn)的次數(shù)m~B(200,5%),m左尾5%的界是4.656,現(xiàn)m=4<4.656,小概率事件發(fā)生了,因此推翻假設(shè),統(tǒng)計結(jié)論是p<5%.利用二項分布模型對例1進行檢驗也檢驗出了p=2%與p0=5%的差異,這一檢驗進一步說明例1用的統(tǒng)計結(jié)論錯誤不僅是樣本容量小造成的.究其原因例1、例2統(tǒng)計結(jié)論的不同是由于χ2檢驗的應(yīng)用條件造成.例1中m=4<5,不滿足m≥5,n-m≥5的條件,而例2中m=5,n-m=245≥5,滿足m≥5,n-m≥5的條件.現(xiàn)追溯該模型的來歷,以確定應(yīng)用的正確條件.
2百分率χ2檢驗來歷
2.1χ2分布的定義
2.2二項分布近似正態(tài)分布的條件
2.3χ2檢驗?zāi)P?/p>
~χ2(df=1)
3百分率χ2檢驗正確的應(yīng)用條件
即:χ2檢驗的應(yīng)用條件是:m≥5,n-m≥5.
例3.對于例1,現(xiàn)加大樣本容量n,n=250,m=5,n-m=245,都大于等于5,可用百分率的χ2檢驗.
=4.737,p=sig.=0.030
因為p=sig.=0.03<0.05,所以統(tǒng)計結(jié)論是總體百分率P與p0=5%差異顯著,統(tǒng)計結(jié)論與實際相符.
在χ2檢驗應(yīng)用的研究中,已有人發(fā)現(xiàn)當(dāng)理論次數(shù)np0≥5,nq0=n(1-p0)≥5時,一般與χ2分布符合較好,否則有可能與χ2分布偏差變大[6-9].
綜合上述,χ2檢驗的正確應(yīng)用條件是:m≥5,n-m≥5;np0≥5,nq0≥5.
4討論
本文以一個總體的百分率p是否等于常數(shù)p0 的χ2檢驗為例說明了百分率χ2檢驗應(yīng)用條件是實際次數(shù)m≥5,n-m≥5;np0≥5,nq0≥5.關(guān)于百分率的χ2的其他檢驗的應(yīng)用條件,如獨立性檢驗、適合性檢驗等,也應(yīng)是實際和理論次數(shù)均大于等于5.
這一研究結(jié)果與統(tǒng)計學(xué)研究前輩沈恒范老先生1966年編寫的《概率論講義》中指出的百分率χ2檢驗應(yīng)用條件是:“通常取mi≥5”[10]一致.
參考文獻
[1]李春喜,姜麗娜,邵云,等.生物統(tǒng)計學(xué)[M].4版.北京:科學(xué)出版社,2011
[2]周概容.概率論與數(shù)理統(tǒng)計[M].北京:高等教育出版社,1984
[3]盛驟,謝式千,潘承毅.概率論與數(shù)理統(tǒng)計[M].北京:高等教育出版社,1989
[4]蓋鈞鎰.試驗統(tǒng)計方法[M].北京:中國農(nóng)業(yè)出版社,2008
[5]日本數(shù)學(xué)學(xué)會.數(shù)學(xué)百科辭典[M].北京:科學(xué)出版社,1984
[6]Sidney Siegel,N John Castellan Jr.Nonparametric Statistics for the Behavioral Sciences[M].2 Edition.Boston:Book-mark Press,1988
[7]陳世耀,趙耐青.臨床科研統(tǒng)計方法與選擇[J].中華消化雜志,2002,22(11):289
[8]陸運清.用 Pearson′s 卡方統(tǒng)計量進行統(tǒng)計檢驗時應(yīng)注意的問題[J].統(tǒng)計與決策,2009(15):32-33
[9]丁寧,范大志,劉麗,等.配對四格表資料χ2檢驗在SPSS和SAS軟件中的實現(xiàn)[J].中國醫(yī)院統(tǒng)計,2014,21(2):92-93
[10]沈恒范.概率論講義[M].北京:人民教育出版社,1966
(責(zé)任編輯胡文忠)
收稿日期:2014-09-10;修回日期:2015-03-16
中圖分類號:F 302.5
文獻標(biāo)志碼:A
文章編號:1003-4315(2015)03-0178-03