国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

列聯(lián)表的兩種抽樣模型以及齊性和獨立性的檢驗問題

2015-12-10 20:27:39禹建奇
教育教學論壇 2015年14期

禹建奇

摘要:本文討論二維列聯(lián)表數(shù)據(jù)的兩種抽樣模型,以及相關(guān)的齊性和獨立性檢驗問題,說明兩種抽樣模型的聯(lián)系,以及齊性及獨立性檢驗的一致性.

關(guān)鍵詞:列聯(lián)表;抽樣模型;齊性;獨立性檢驗

中圖分類號:G642.0 文獻標志碼:A 文章編號:1674-9324(2015)14-0071-02

作者在講授統(tǒng)計課程時,經(jīng)常會遇到列聯(lián)表的齊性和獨立性檢驗問題,這兩個問題分別牽涉到兩種抽樣方式,但兩種檢驗的檢驗統(tǒng)計量與結(jié)果卻是一樣的.大多數(shù)教材,如吳喜之、趙博娟所著《非參數(shù)統(tǒng)計》,只是簡單指出兩種抽樣方式的不同,兩種檢驗的一致性只是殊途同歸,巧合而已.本文論證了這兩種模型的聯(lián)系,導出兩種檢驗的一致性,可見,這種一致性絕不是巧合.

一、乘積多項分布模型與整體多項分布模型

首先我們來看兩個二位列聯(lián)表的例子(摘自吳喜之、趙博娟所著《非參數(shù)統(tǒng)計》第八章).

例1 對于某種疾病有三種處理方法,某醫(yī)療機構(gòu)分別對22,15和19個病人用這三種方法處理,處理的結(jié)果分“改善”和“沒有改善”兩種,并且列在下表中:

問:不同處理的改善比例是不是一樣?

例2 在一個有三個主要百貨商場的商貿(mào)中心,調(diào)查者問479個不同年齡段的人首先去三個商場中的哪一個,結(jié)果如下:

問:人們對這三個商場的選擇和他們的年齡是否獨立?

這兩個例子的數(shù)據(jù)都有下面的兩因子列聯(lián)表形式:

這里,每個格子的頻數(shù)nij為隨機變量,行頻數(shù)總和ni?誗=∑jnij,列頻數(shù)總和n?誗j=∑inij,頻數(shù)總和n?誗?誗=∑ini?誗=∑jn?誗j,A1,A2,…,Ar為行因子的r個水平,B1,B2,…,Bc為列因子的c個水平.用pij表示第ij個格子頻數(shù)占總頻數(shù)的理論比例(概率).顯然,pij=E(nij)/n?誗?誗,這里E(nij)為nij的數(shù)學期望,而相應的第i行的理論比例(概率)pi?誗及第j列的理論比例(概率)p?誗j分別為pi?誗=∑jpij,p?誗j=∑ipij?誗

對于例1的具體問題,零假設為:“對于各種不同的處理,改善的比例或概率相同.”注意,這里因為只有兩種結(jié)果,所以,對不同處理改善的比例相同就意味著對各種處理沒有改善的比例也相同.這種關(guān)于齊性的檢驗的數(shù)據(jù)獲取,一般都類似于例8.1,對行變量的每一水平i,試驗前選定一定數(shù)目(ni·)的對象,然后在試驗時觀測并記錄在列變量的不同水平所得到的相應頻數(shù).

可以看到,這和前面檢驗齊性時零假設下的期望值一樣,由此可以得到和上面檢驗齊性時導出的同樣的統(tǒng)計量Q,這樣導出的Q當然也有同樣的漸近 χ2分布.這類關(guān)于獨立性的問題的數(shù)據(jù)獲取,通常是隨機選取一定數(shù)目的樣本,然后記錄這些個體分配到各個格子的數(shù)目(頻數(shù)).它并不事先固定某變量各水平的觀測對象數(shù)目,這和齊性問題有所區(qū)別.

一般地,對r×c的列聯(lián)表,試驗前先選定總頻數(shù)n?誗?誗,再進行獨立抽樣,記錄n?誗?誗個對象落在各個格子的頻數(shù),這樣,整個列聯(lián)表的分布為一多項分布

這種抽樣模型稱列聯(lián)表的整體多項分布模型.

二、兩種模型的聯(lián)系

如上所述,很多的統(tǒng)計教材也都指出,同一個列聯(lián)表數(shù)據(jù)可以有兩種抽樣模型,而且對兩種模型分別做齊性和獨立性檢驗時,檢驗過程與結(jié)論完全一樣,但是其中的緣由卻未見說明.其實可以證明,這并不是巧合, 它是下面兩個定理的結(jié)果.

定理一:齊性問題與獨立性問題等價, 即各行的齊性等價于行與列變量的獨立性.

三、最后結(jié)論

整體抽樣模型的獨立性當然等價于固定各行總頻數(shù)時的齊性,所以,綜合可得以下結(jié)論:

二維列聯(lián)表的數(shù)據(jù),可能來自兩種不同的抽樣模型: 整體多項分布模型和乘積多項分布模型, 但是兩種模型其實是一致的, 即乘積多項分布模型可以認為是整體多項分布模型在限定各行總頻數(shù)的條件下的條件分布模型, 同時由于齊性與獨立性的等價, 不論以何種模型分析同一個列聯(lián)表的齊性或獨立性,得到的結(jié)果是一樣的.

參考文獻:

[1]吳喜之,趙博娟.非參數(shù)統(tǒng)計[M].中國統(tǒng)計出版社,2013.

[2]阿蘭,阿格萊斯蒂.分類數(shù)據(jù)分析[M].重慶大學出版,2012.

辽中县| 正蓝旗| 松原市| 辽源市| 葵青区| 井陉县| 宁津县| 玛沁县| 化德县| 玉田县| 香港 | 邳州市| 和静县| 北票市| 阿拉尔市| 青铜峡市| 大埔区| 花莲县| 金堂县| 安福县| 大庆市| 彭山县| 扬州市| 盐源县| 深州市| 曲水县| 乐平市| 遂宁市| 互助| 怀仁县| 灵璧县| 民县| 江门市| 平远县| 沾益县| 甘泉县| 南郑县| 小金县| 东平县| 宁波市| 石屏县|