国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

無序多分類資料統(tǒng)計(jì)分析方法的選擇及在SPSS上的實(shí)現(xiàn)

2024-01-15 10:00:12張蓼紅馮孟潛包國(guó)章張曉君白春艷丁雪梅
關(guān)鍵詞:無序分類變量

張蓼紅,馮孟潛,包國(guó)章,張曉君,白春艷,丁雪梅

(1.吉林大學(xué)組織部,吉林 長(zhǎng)春 130012;2.吉林大學(xué)中日聯(lián)誼醫(yī)院,吉林 長(zhǎng)春 130033;3.吉林大學(xué)新能源與環(huán)境學(xué)院,吉林 長(zhǎng)春 130012;4.吉林大學(xué)教務(wù)處,吉林 長(zhǎng)春 130012;5.吉林大學(xué)動(dòng)物科學(xué)學(xué)院,吉林 長(zhǎng)春 130062)

在自然科學(xué)和社會(huì)科學(xué)研究中,經(jīng)常需要對(duì)無序多分類資料進(jìn)行統(tǒng)計(jì)分析。例如,研究患某病仔兔的一個(gè)基因(3個(gè)基因型)和另一個(gè)基因(3個(gè)基因型)的分布情況,以及豌豆遺傳性狀實(shí)驗(yàn)中研究豌豆桿的3個(gè)性狀和果實(shí)的3個(gè)性狀的對(duì)應(yīng)關(guān)系。再如,通過問卷調(diào)查,研究不同社區(qū)和不同性別居民獲取健康知識(shí)途徑(傳統(tǒng)大眾媒介、網(wǎng)絡(luò)、社區(qū)宣傳)是否相同,或者研究不同學(xué)習(xí)階段的學(xué)生(本科生、碩士研究生、博士研究生)學(xué)習(xí)黨的二十大報(bào)告內(nèi)容更喜歡的學(xué)習(xí)方式(自學(xué)、專家作報(bào)告、小組學(xué)習(xí))等。對(duì)于無序多分類資料的統(tǒng)計(jì)分析,要考慮變量的數(shù)量、分析目的、統(tǒng)計(jì)分析方法的前提條件等。如何快速、準(zhǔn)確地選擇正確的統(tǒng)計(jì)分析方法、如何在SPSS上實(shí)現(xiàn)統(tǒng)計(jì)分析以及如何解讀SPSS輸出結(jié)果,本研究選取典型案例,對(duì)上述問題進(jìn)行逐一解答。

1 基于無序多分類資料的常用的統(tǒng)計(jì)分析方法

通過簡(jiǎn)單易懂的典型案例分析和流程圖,厘清和展示針對(duì)無序多分類資料的常用的統(tǒng)計(jì)分析方法的選擇思路。

1.1 典型案例分析

1.1.1 案例描述

為了提高大學(xué)生學(xué)習(xí)營(yíng)養(yǎng)健康知識(shí)的學(xué)習(xí)效果,對(duì)3個(gè)學(xué)院(動(dòng)物科學(xué)學(xué)院、動(dòng)物醫(yī)學(xué)學(xué)院、植物科學(xué)學(xué)院)的大學(xué)生偏好的學(xué)習(xí)方式(自學(xué)、小組、上課)進(jìn)行問卷調(diào)查,結(jié)果見表1。

表1 三種學(xué)習(xí)方式在不同學(xué)院和不同性別學(xué)生中的分布情況

問題1:針對(duì)大學(xué)生偏好的學(xué)習(xí)方式進(jìn)行對(duì)應(yīng)分析。

問題2:不同學(xué)院的大學(xué)生偏好的學(xué)習(xí)方式構(gòu)成比有沒有差異?學(xué)院和學(xué)生偏好的學(xué)習(xí)方式之間是否有關(guān)聯(lián)?

問題3:分析學(xué)院和性別對(duì)學(xué)生學(xué)習(xí)方式偏好的影響。

1.1.2 思路分析

問題1涉及2個(gè)變量,行變量“學(xué)院”有3個(gè)水平,列變量“學(xué)生偏好的學(xué)習(xí)方式”有3個(gè)水平。行變量和列變量均為無序多分類資料,研究2個(gè)變量之間的對(duì)應(yīng)關(guān)系,可以采用簡(jiǎn)單對(duì)應(yīng)分析。

問題2要求比較三個(gè)樣本構(gòu)成比之間的差異,可以采用χ2檢驗(yàn);研究2個(gè)無序多分類資料的變量之間是否有關(guān)聯(lián),可以采用關(guān)聯(lián)性檢驗(yàn)。

問題3涉及3個(gè)變量,其中原因變量有2個(gè),為“學(xué)院”和“性別”;結(jié)果變量有1個(gè),為“學(xué)生偏好的學(xué)習(xí)方式”。若要分析2個(gè)原因變量對(duì)結(jié)果變量的影響以及影響程度,可采用無序多分類Logistic回歸分析。

1.2 統(tǒng)計(jì)分析方法選擇流程

無序多分類資料統(tǒng)計(jì)分析方法選擇的流程圖,如圖1和圖2所示,其中R和C分別表示行數(shù)和列數(shù),且都大于等于3。

圖1 基于無序多分類資料的R×2、2×C、屬性不同的R×C型常用的統(tǒng)計(jì)分析方法選擇的流程圖

圖2 基于無序多分類資料的常用的多元統(tǒng)計(jì)分析方法選擇的流程圖

2 基于無序多分類資料的常用的統(tǒng)計(jì)分析方法在SPSS 19.0上的實(shí)現(xiàn)

2.1 簡(jiǎn)單對(duì)應(yīng)分析在SPSS 19.0上的實(shí)現(xiàn)

(1)簡(jiǎn)單對(duì)應(yīng)分析實(shí)現(xiàn)步驟。①數(shù)據(jù)錄入和數(shù)據(jù)加權(quán)。數(shù)據(jù)錄入時(shí),在“變量視圖”中為行變量“學(xué)院”和列變量“大學(xué)生偏好的學(xué)習(xí)方式”每個(gè)水平賦值(動(dòng)物醫(yī)學(xué)、植物科學(xué)、動(dòng)物科學(xué)分別賦值為1、2、3;自學(xué)、小組、上課分別賦值為1、2、3)。加權(quán)步驟:數(shù)據(jù)→加權(quán)個(gè)案,加權(quán)個(gè)案(W)→頻率變量(F):頻數(shù)→確定。②簡(jiǎn)單對(duì)應(yīng)分析。分析→降維→對(duì)應(yīng)分析,學(xué)院→行,定義范圍(最小值為1,最大值為3)→更新→繼續(xù);偏好的學(xué)習(xí)方式→列,定義范圍(最小值為1,最大值為3)→更新→繼續(xù)→確定。

(2)結(jié)果解讀。針對(duì)問題1的對(duì)應(yīng)分析結(jié)果見表2。第一維慣量值為0.038,第二維慣量值為0.003,其相對(duì)應(yīng)的百分比分別解釋了總信息量的93.1%和6.9%,前兩個(gè)維度累計(jì)解釋了總信息量的100%,即二維圖形可以完全表示兩變量間的信息,并且觀察時(shí)以第一維度為主。列聯(lián)表行列獨(dú)立性的χ2檢驗(yàn)結(jié)果為χ2=29.981,P=0.000<0.01,表明列聯(lián)表的行列之間有較強(qiáng)的相關(guān)性。

表2 對(duì)應(yīng)分析結(jié)果匯總表

對(duì)應(yīng)分析圖(圖3)表明,維度1區(qū)分度好,維度2區(qū)分度差,動(dòng)物醫(yī)學(xué)學(xué)院、植物科學(xué)學(xué)院、動(dòng)物科學(xué)學(xué)院的大學(xué)生分別傾向于選擇上課、自學(xué)、小組學(xué)習(xí)的學(xué)習(xí)方式。

2.2 χ2檢驗(yàn)和關(guān)聯(lián)性檢驗(yàn)在SPSS 19.0上的實(shí)現(xiàn)

(1)χ2檢驗(yàn)和關(guān)聯(lián)性檢驗(yàn)步驟。①數(shù)據(jù)錄入和數(shù)據(jù)加權(quán)。數(shù)據(jù)錄入形式和加權(quán)步驟同“2.1”。②χ2檢驗(yàn)和關(guān)聯(lián)性檢驗(yàn)。分析→描述統(tǒng)計(jì)→交叉表,學(xué)院→行,偏好的學(xué)習(xí)方式→列,統(tǒng)計(jì)量→卡方,相依系數(shù)→繼續(xù);單元格→觀察值,期望值,行→繼續(xù)→確定。

(2)結(jié)果解讀。根據(jù)n(總數(shù))和T(理論頻數(shù))的大小選擇P值[1]。χ2檢驗(yàn)(表3)的結(jié)果表明,χ2=29.981,n=741,最小期望計(jì)數(shù)為51.65,P=0.000<0.01,即3個(gè)學(xué)院學(xué)生偏好的學(xué)習(xí)方式構(gòu)成比有極顯著差異。進(jìn)一步對(duì)每2個(gè)學(xué)院之間的學(xué)生偏好的學(xué)習(xí)方式構(gòu)成比作差異性比較,χ2檢驗(yàn)的結(jié)果表明,動(dòng)物醫(yī)學(xué)學(xué)院和植物科學(xué)學(xué)院,χ2=19.322,n=533,最小期望計(jì)數(shù)為59.05,P=0.000<0.01,即2個(gè)學(xué)院學(xué)生偏好的學(xué)習(xí)方式構(gòu)成比有極顯著差異;動(dòng)物醫(yī)學(xué)學(xué)院和動(dòng)物科學(xué)學(xué)院,χ2=23.622,n=483,最小期望計(jì)數(shù)為45.22,P=0.000<0.01,即2個(gè)學(xué)院學(xué)生偏好的學(xué)習(xí)方式構(gòu)成比有極顯著差異;植物科學(xué)學(xué)院和動(dòng)物科學(xué)學(xué)院,χ2=2.561,n=466,最小期望計(jì)數(shù)為56.69,P=0.278>0.05,即2個(gè)學(xué)院學(xué)生偏好的學(xué)習(xí)方式構(gòu)成比沒有差異。

表3 χ2檢驗(yàn)結(jié)果

對(duì)稱度量表中關(guān)聯(lián)性檢驗(yàn)結(jié)果表明,P=0.000<0.05,Pearson列聯(lián)系數(shù)為0.197,表明學(xué)院和學(xué)生偏好的學(xué)習(xí)方式之間有一定關(guān)聯(lián)。

2.3 無序多分類Logistic回歸分析在SPSS 19.0上的實(shí)現(xiàn)

(1)無序多分類Logistic回歸分析步驟。①數(shù)據(jù)錄入和數(shù)據(jù)加權(quán)。數(shù)據(jù)錄入時(shí),在“變量視圖”中為自變量“學(xué)院”“性別”和因變量“學(xué)生偏好的學(xué)習(xí)方式”的每個(gè)水平賦值(動(dòng)物醫(yī)學(xué)、植物科學(xué)、動(dòng)物科學(xué)分別賦值為1、2、3;男生、女生分別賦值為1、2;自學(xué)、小組、上課分別賦值為1、2、3)。加權(quán)步驟同2.1。②無序多分類Logistic回歸分析。分析→回歸→多項(xiàng)Logistic回歸,偏好的學(xué)習(xí)方式→因變量,學(xué)院、性別→因子→確定。

(2)結(jié)果解讀。模型擬合(表4)的結(jié)果表明,似然比卡方檢驗(yàn)結(jié)果P=0.000<0.01,說明至少有一個(gè)自變量系數(shù)不為0,模型有意義。似然比檢驗(yàn)(表5)的結(jié)果表明,學(xué)院似然比檢驗(yàn)結(jié)果P=0.000<0.01,性別似然比檢驗(yàn)結(jié)果P=0.000<0.01,表明學(xué)院和性別對(duì)模型的作用都有統(tǒng)計(jì)學(xué)意義。參數(shù)估計(jì)(表6)的結(jié)果表明(動(dòng)物科學(xué)學(xué)院和女生為參照,因此其參數(shù)默認(rèn)為0,無法估計(jì)),自學(xué)與上課兩種學(xué)習(xí)方式相比,動(dòng)物醫(yī)學(xué)學(xué)院的學(xué)生比動(dòng)物科學(xué)學(xué)院的學(xué)生更傾向于選擇上課的學(xué)習(xí)方式(χ2=19.147,P=0.000<0.01,優(yōu)勢(shì)比OR值為0.348),而植物科學(xué)學(xué)院與動(dòng)物科學(xué)學(xué)院的學(xué)生的選擇沒有差別(χ2=0.316,P=0.574>0.05);男生比女生更傾向于選擇自學(xué)的學(xué)習(xí)方式(χ2=7.205,P=0.007<0.01,優(yōu)勢(shì)比OR值為1.647,置信區(qū)間為[1.144, 2.370],置信區(qū)間不包括1)。小組學(xué)習(xí)與上課兩種學(xué)習(xí)方式相比,動(dòng)物醫(yī)學(xué)學(xué)院的學(xué)生比動(dòng)物科學(xué)學(xué)院的學(xué)生更傾向于選擇上課的學(xué)習(xí)方式(χ2=8.966,P=0.003<0.01,優(yōu)勢(shì)比OR值為0.512),而植物科學(xué)學(xué)院與動(dòng)物科學(xué)學(xué)院的學(xué)生的選擇沒有差別(χ2=2.829,P=0.093>0.05);男生比女生更傾向于選擇小組學(xué)習(xí)的學(xué)習(xí)方式(χ2=10.526,P=0.001<0.01,優(yōu)勢(shì)比OR值為1.804,置信區(qū)間為[1.263,2.576],置信區(qū)間不包括1)。由此得出兩個(gè)廣義Logit模型:

表4 模型擬合信息

表5 似然比檢驗(yàn)

表6 參數(shù)估計(jì)

其中,X1指動(dòng)物醫(yī)學(xué)學(xué)院;X2指植物科學(xué)學(xué)院;X3指男性;ps指各變量組合選擇自學(xué)學(xué)習(xí)方式的概率;pc指各變量組合選擇上課學(xué)習(xí)方式的概率;pt指各變量組合選擇小組學(xué)習(xí)方式的概率。

表5中,χ2統(tǒng)計(jì)量是最終模型與簡(jiǎn)化后模型之間在-2倍對(duì)數(shù)似然值中的差值。通過從最終模型中省略效應(yīng)而形成簡(jiǎn)化后的模型。零假設(shè)就是該效應(yīng)的所有參數(shù)均為0。

3 結(jié)語

對(duì)于經(jīng)常出現(xiàn)在R×2、2×C、屬性不同的R×C二維列聯(lián)表中的無序多分類資料,χ2檢驗(yàn)可以進(jìn)行兩個(gè)或多個(gè)樣本率或構(gòu)成比之間的差異比較,如果R×2或不同屬性的R×C類型之間樣本率或構(gòu)成比有顯著差異,還要利用χ2檢驗(yàn)進(jìn)一步對(duì)每?jī)蓚€(gè)行變量做進(jìn)一步差異比較。χ2檢驗(yàn)的前提條件是:通常各格的理論頻數(shù)不應(yīng)小于1,且1≤T≤5的格子數(shù)不宜超過格子總數(shù)的1/5[2]。對(duì)于不同屬性的R×C類型,如果是雙向無序多分類資料還可以進(jìn)行關(guān)聯(lián)性檢驗(yàn)。χ2檢驗(yàn)只能進(jìn)行兩個(gè)或多個(gè)樣本率或構(gòu)成比之間的差異比較,不能夠進(jìn)行等級(jí)強(qiáng)度的差異比較;如果對(duì)分組變量無序、指標(biāo)變量有序的單向無序的屬性不同的R×C類型進(jìn)行等級(jí)強(qiáng)度差異的比較,例如比較三種藥物的治療效果(顯效、好轉(zhuǎn)、無效),須采用秩和檢驗(yàn)或Ridit分析或有序Logistic回歸分析,其中非參數(shù)檢驗(yàn)方法秩和檢驗(yàn)和Ridit分析兩種統(tǒng)計(jì)分析方法結(jié)果是等價(jià)的,不受總體分布限制,適用面廣,但不能充分利用信息,檢驗(yàn)效能低[3-4]。

無序多分類資料的多元統(tǒng)計(jì)分析中,常用對(duì)應(yīng)分析和無序多分類Logistic回歸分析。其中,對(duì)應(yīng)分析利用降維思維,以二維效應(yīng)圖簡(jiǎn)潔、直觀地揭示屬性變量之間以及屬性變量各種狀態(tài)之間的相互關(guān)系[5]。針對(duì)兩個(gè)變量的簡(jiǎn)單對(duì)應(yīng)分析是通過SPSS軟件的“降維”下的“對(duì)應(yīng)分析”子模塊來完成,三個(gè)或者三個(gè)以上變量則需要通過“最優(yōu)尺度”子模塊來完成多元對(duì)應(yīng)分析(多重對(duì)應(yīng)分析)。變量個(gè)數(shù)越多,各個(gè)變量的類別取值越多時(shí),對(duì)應(yīng)分析的優(yōu)勢(shì)就越明顯[6]。簡(jiǎn)單對(duì)應(yīng)分析能夠輸出對(duì)應(yīng)分析圖,無序多分類Logistic回歸分析能夠獲得優(yōu)勢(shì)比(OR值)以及回歸方程。無序多分類Logistic回歸分析,要求因變量必須是無序多分類資料(自變量資料類型不限),對(duì)樣本量也有較高的要求,變量的個(gè)數(shù)愈多需要的例數(shù)相應(yīng)也愈大,樣本至少大于100,大于500比較合適,一般每一個(gè)自變量至少需要10例結(jié)局[7-9]。本研究案例中,利用SPSS軟件進(jìn)行無序多分類Logistic回歸分析時(shí),無序多分類變量“學(xué)院”、二分類變量“性別”,這2個(gè)變量都進(jìn)入到“因子”中,如果再增加一個(gè)因素:不同學(xué)習(xí)階段學(xué)生(本科生、碩士生、博士生),則此有序變量也要進(jìn)入到“因子”中,但如果增加的因素是年齡,則此連續(xù)變量就要進(jìn)入到“協(xié)變量”中。進(jìn)行無序多分類Logistic回歸分析,SPSS軟件默認(rèn)因變量的水平中賦值最高即最后一個(gè)作為參考類別,也可以手動(dòng)設(shè)置參考類別,為了方便,最關(guān)心哪個(gè)水平就賦值最高、選擇系統(tǒng)默認(rèn)即可。此外,無序多分類Logistic回歸分析還可以考察因素之間的交互作用,只需在點(diǎn)擊“模型”模塊時(shí),將系統(tǒng)默認(rèn)的“主效應(yīng)”改為“全因子”,或者選擇“設(shè)定/步進(jìn)式”,將要考察交互作用的因素選入。

猜你喜歡
無序分類變量
車身無序堆疊零件自動(dòng)抓取系統(tǒng)
分類算一算
抓住不變量解題
也談分離變量
分類討論求坐標(biāo)
數(shù)據(jù)分析中的分類討論
張博庭:煤電不能再這么無序發(fā)展下去了
能源(2017年11期)2017-12-13 08:12:30
教你一招:數(shù)的分類
高速路上右行規(guī)則與無序行駛規(guī)則的比較研究
無序體系中的國(guó)際秩序
南康市| 当阳市| 新密市| 巩义市| 玉龙| 全州县| 宜丰县| 鲁甸县| 南城县| 湟源县| 河西区| 郯城县| 洪雅县| 吉木萨尔县| 宜昌市| 临邑县| 襄樊市| 罗田县| 南丹县| 广州市| 阳山县| 文登市| 浦江县| 津南区| 瑞丽市| 怀化市| 东丰县| 蓝田县| 汉源县| 稷山县| 兖州市| 正蓝旗| 湖南省| 长阳| 石阡县| 蚌埠市| 兖州市| 遂宁市| 东方市| 九江市| 长宁区|