王宏仁,宋立新,陳 鯤
(1.吉林師范大學(xué)數(shù)學(xué)學(xué)院,吉林 四平 136000;
2.吉林師范大學(xué)環(huán)境工程學(xué)院,吉林 四平 136000)
兩個(gè)具有名義指標(biāo)總體分布相等的檢驗(yàn)
王宏仁1,宋立新1,陳 鯤2
(1.吉林師范大學(xué)數(shù)學(xué)學(xué)院,吉林 四平 136000;
2.吉林師范大學(xué)環(huán)境工程學(xué)院,吉林 四平 136000)
根據(jù)Ridit檢驗(yàn)思想方法進(jìn)行數(shù)據(jù)變換,并利用K-S檢驗(yàn)原理給出了檢驗(yàn)兩個(gè)名義指標(biāo)總體概率分布相等的檢驗(yàn)方法.其本質(zhì)是存在兩個(gè)具有名義指標(biāo)的統(tǒng)計(jì)總體,且通過抽樣得到兩個(gè)頻率直方圖,再通過頻率直方圖來檢驗(yàn)這兩個(gè)總體分布是否相等的問題.
名義指標(biāo);Ridit檢驗(yàn);K-S檢驗(yàn);經(jīng)驗(yàn)分布函數(shù);檢驗(yàn)方法
在生物學(xué)、醫(yī)學(xué)、農(nóng)業(yè)和其他學(xué)科領(lǐng)域經(jīng)常會(huì)遇到這樣一類問題:兩個(gè)群落,都含有相同的k個(gè)成分,各個(gè)成分有一定的比例,且成分比例之和為1.關(guān)鍵是兩個(gè)群落成分比例是否相同需要檢驗(yàn).其本質(zhì)[1-2]是存在兩個(gè)具有名義指標(biāo)的統(tǒng)計(jì)總體,且通過抽樣得到兩個(gè)頻率直方圖,通過頻率直方圖來檢驗(yàn)這兩個(gè)總體分布是否相等的問題.
本文應(yīng)用Ridit檢驗(yàn)[3]的思想方法將數(shù)據(jù)進(jìn)行變換,使這個(gè)問題轉(zhuǎn)化成檢驗(yàn)兩個(gè)總體分布函數(shù)是否相等的問題.并利用K-S檢驗(yàn)原理[4-9]給出了這個(gè)問題的檢驗(yàn)方法.
設(shè)總體A和B都考慮不可計(jì)量的一個(gè)名義指標(biāo)a,分為k類.則A和B的概率分布分別為:
一組屬性資料a1,a2,…,ak經(jīng)過上述這一特定的變換轉(zhuǎn)化成一組計(jì)量資料(f1,f2,…,fk).現(xiàn)在進(jìn)一步證明這組計(jì)量數(shù)據(jù)服從均勻分布.
要證明f值服從均勻分布,只要證明它的概率密度恒為1即可.如果把f的k個(gè)取值標(biāo)在[0,1]之內(nèi),不難看出fi是第i組概率pi范圍的中值.顯然每組的概率就是自身的組距.概率密度曲線與f軸所圍的面積表示概率.所以,在k個(gè)子區(qū)間上都是1.如果將分類加細(xì),則逐漸演變?yōu)橐粋€(gè)服從[0,1]上均勻分布的隨機(jī)變量,這就證明了f服從[0,1]上的均勻分布.
同理,對(duì)于B總體也有相同的結(jié)論,令
則h服從[0,1]上的均勻分布.
通過Ridit變換,將檢驗(yàn)兩個(gè)名義總體分布相等的問題,轉(zhuǎn)化成檢驗(yàn)兩個(gè)總體是否都服從[0,1]上均勻分布的問題,由于[0,1]上均勻分布的分布函數(shù)是連續(xù)的,故而滿足使用K-S檢驗(yàn)的條件.
首先對(duì)fi和hi進(jìn)行估計(jì),根據(jù)fi和hi的定義以及Bernoulli大數(shù)定律,有
這樣,我們就給出了一種檢驗(yàn)兩個(gè)具有名義指標(biāo)總體分布是否相等的方法.
某學(xué)校有6門新設(shè)的體育選修課,下面的數(shù)據(jù)分別記錄了520名男生(m)和450名女生(n)分別選修每門課程的情況,取水平α=0.05,檢驗(yàn)“m,n對(duì)這6門課程的選擇傾向性是否相同”.
表1 某校新設(shè)體育選修課選擇人數(shù)統(tǒng)計(jì) 人
現(xiàn)在有兩個(gè)總體:m,n.每個(gè)總體都分為6類,每一類都有一定的比例,且比例之和為1,欲檢驗(yàn)H0對(duì)H1的假設(shè)檢驗(yàn)問題,其中H0:m,n對(duì)這6門課程的選擇傾向性相同;H1:m,n對(duì)這6門課程的選擇傾向性有差異.
數(shù)據(jù)列表如表2.
表2 m,n對(duì)6門體育課程的選擇傾向性差異統(tǒng)計(jì)
[1] 宋立新,王德輝.具有名義尺度的兩個(gè)總體概率分布相等的檢驗(yàn)[J].吉林大學(xué)自然科學(xué)學(xué)報(bào),1997,35(3):14-16.
[2] 宋立新,趙力.兩個(gè)總體相等的廣義似然比檢驗(yàn)[J].大學(xué)數(shù)學(xué),2005(2):91-94.
[3] 宋俊杰.統(tǒng)計(jì)信息分析:上冊(cè)[M].天津:南開大學(xué)出版社,1986:299-304.
[4] 陳希孺,方兆本,李國(guó)英,等.非參數(shù)統(tǒng)計(jì)[M].上海:上??茖W(xué)技術(shù)出版社,1989:123-136.
[5] 陳希孺,柴根象.非參數(shù)統(tǒng)計(jì)教程[M].上海:華東師范大學(xué)出版社,1993:124.
[6] 張堯庭.定性資料的統(tǒng)計(jì)分析[M].桂林:廣西師范大學(xué)出版社,1991:189-193.
[7] 孫山澤.非參數(shù)統(tǒng)計(jì)講義[M].北京:北京大學(xué)出版社,2000:34-42.
[8] 宋立新,張平.K個(gè)單參數(shù)指數(shù)總體相等的假設(shè)檢驗(yàn)[J].東北師大學(xué)報(bào):自然科學(xué)版,2009,41(2):50-52.
[9] 劉銀萍,楊曉瑩.截?cái)嗲樾蜗聨缀畏植嫉膮?shù)估計(jì)[J].東北師大學(xué)報(bào):自然科學(xué)版,2009,41(3):14-16.
The test for the equality of the probability distribution of two populations with nominal scales
WANG Hong-ren1,SONG Li-xin1,CHEN Kun2
(1.School of Mathematics,Jilin Normal University,Siping 136000,China;
2.School of Environment Engineering,Jilin Normal University,Siping 136000,China)
This paper makes data transformation on the method of Ridit test and provides a method for testing of equaling on the overall distribution of two indicators with name index using the principle ofK-Stest.The nature of this problem is that two overall statistics with index name are needed,and a frequency histogram is get from statistical sampling.Through the frequency histogram the equaling on the overall distribution is tested.
index name;Ridit test;K-Stest;empirical distribution function;test methods
O 212
110·67
A
1000-1832(2011)04-0029-04
2010-09-22
國(guó)家自然科學(xué)基金資助項(xiàng)目(10971084).
王宏仁(1976—),男,博士研究生,講師;通訊作者:宋立新,(1954—),男,教授,主要從事數(shù)理統(tǒng)計(jì)研究.
陶 理)