張云霞 蘭凌
【摘要】在生物醫(yī)學以及質(zhì)量測評等領(lǐng)域中,時常會遇到兩獨立樣本的對比問題,而經(jīng)常會用到的參數(shù)檢驗方式就是通過u檢驗和t檢驗。若所掌控的數(shù)據(jù)沒有達到u檢驗或是t檢驗的要求,那么采取非參數(shù)檢驗的方式就能更好的解決此類問題。本文是通過教學案例以及R軟件對兩獨立樣本位置的非參數(shù)檢驗進行分析、說明。
【關(guān)鍵詞】非參數(shù)統(tǒng)計 ?非參數(shù)檢驗 ?R軟件 ?Mann-Whit-ney-Wilcoxon檢驗
【中圖分類號】G64 【文獻標識碼】A 【文章編號】2095-3089(2015)05-0253-02
1.前言
在生物醫(yī)學以及質(zhì)量測評等領(lǐng)域中,時常會遇到兩獨立樣本的對比問題,而經(jīng)常會用到的參數(shù)檢驗方式就是通過u檢驗和t檢驗。u檢驗和t檢驗都是假設(shè)整體分布為正態(tài)分布,并且u檢驗需要事先知曉總體的方差,而t檢驗則需要滿足相同的總體方差。在進行實際操作的過程中,因為種種原因,所要進行分析的數(shù)據(jù)常常不能達到u檢驗抑或是t檢驗的標準,從而導(dǎo)致了無法使用u檢驗或者t檢驗進行參數(shù)檢驗對比。如若依舊使用u檢驗或t檢驗的方法,那么將會得到錯誤的判斷數(shù)據(jù)。因此在尚未得知數(shù)據(jù)的整體分布或整體分布是非正態(tài)分布的時候,應(yīng)怎么解決兩獨立樣本的對比問題呢?非參數(shù)檢驗即是解決此類問題的最科學有效的辦法。
2.通過案例分析R軟件在非參數(shù)檢驗的實用性
通過觀察到的樣本數(shù)據(jù)去估算出整體的分布數(shù)據(jù),這是統(tǒng)計推理的重點問題。比如整體的平均數(shù)的有關(guān)系數(shù)與回歸系數(shù)、區(qū)間估計或者是點估計的假設(shè)檢驗等。統(tǒng)計推斷是為了對未知的參數(shù)進行檢驗或是估計。對統(tǒng)計分析方法來說,非參數(shù)檢驗屬于其重要的形成部分。參數(shù)檢驗與非參數(shù)檢驗共同形成了統(tǒng)計分析的基礎(chǔ)。參數(shù)檢驗是在整體分列已經(jīng)明確的狀況下,對整體分列的數(shù)據(jù)進行分析,但在實際操作的過程中,常常會因種種原因無法對整體分列的形態(tài)作出假設(shè),這時候就需要非參數(shù)檢驗運用樣本數(shù)據(jù)對整體分列的形態(tài)作出判斷,從而解決問題。R軟件里的Wilcox.test( )函數(shù)能夠運用在Wilcoxon符號秩檢驗,在R軟件中輸進help(Wilcox.tes)就能夠詳細了解它的使用方法和功能。接下來筆者將結(jié)合案例來說明R軟件在兩獨立樣本位置的非參數(shù)檢驗中的實用性。例:甲公司有9名員工,乙公司有11名員工,他們的工資(單位:千元)如下表:
問:哪家公司的員工工資較高?
解法1:運用t檢驗,假設(shè)甲公司(X)和乙公司(Y)的員工工資分別符合正態(tài)分布N(μ1,σ2)和N(μ2,σ2),假設(shè)檢驗問題:H0∶μ1=μ2;H1∶μ1≠μ2,運用R軟件中的函數(shù)t.test( )進行以下分析:
X=c(2,3,4,5,6,7,8,9,25)
Y=c(9,10,11,12,13,14,15,16,18,36,54)
t.test(X,Y,var.equal=TRUE)
從而運算得出p值為0.2315>0.05,無法拒絕原假設(shè),因此認為兩公司的員工工資基本無差異。
解法2:運用Mann-Whitney-Wilcoxon檢驗,不對甲公司(X)和乙公司(Y)的分布進行假設(shè),假設(shè)檢驗問題:H0∶MX=MY;H1∶MX≠MY,運用R軟件中的函數(shù)Wilcox.test( ? )進行以下分析:
wilcox.test(X,Y)
從而運算得出p值為 0.009016<0.05, 拒絕原假設(shè),因此認為兩公司的員工工資有著明顯差異。
通過運用t檢驗和Mann-Whitney-Wilcoxon檢驗對該組數(shù)劇進行分析,得出了不同的結(jié)果。根據(jù)數(shù)據(jù)來看,甲公司的員工工資明顯要比乙公司的低,t檢驗得到的結(jié)果與數(shù)據(jù)不相符,根本原因就在于運用t檢驗的時候假設(shè)了整體的分布是正態(tài)分布,但是兩個企業(yè)的員工工資并不屬于正態(tài)分布。所以當假設(shè)違逆了實際數(shù)據(jù)的時候,運用t檢驗得出的分析結(jié)論是不正確的。由于Mann-Whitney-Wilcoxon檢驗沒有對數(shù)據(jù)進行任何的假設(shè),從而得出了更加科學合理的分析結(jié)果。
3.結(jié)束語
在解決問題的過程中,想要選擇出準確的方案來對比分析兩獨立樣本,值得關(guān)注的是要分析的數(shù)據(jù)有沒有滿足所選擇的檢驗方法的假設(shè)要求,比如在選用t檢驗方法的時候,運用柯爾莫哥洛夫檢驗方法對數(shù)據(jù)進行分析它是否為正態(tài)分布,兩樣本的正態(tài)整體的方差相不相等,唯有滿足了這些條件,才能夠使用t檢驗方法。如若完全不知曉兩樣本的整體分列,那就不妨運用非參數(shù)檢驗方式來進行分析數(shù)據(jù)。值得一提的是,如果所要分析的數(shù)據(jù)可以運用參數(shù)檢驗方式進行檢驗的時候,仍舊采取非參數(shù)檢驗方式解析該數(shù)據(jù),會造成檢驗成果的丟失,這是因為非參數(shù)檢驗沒有將數(shù)據(jù)信息充分使用。
參考文獻:
[1]吳喜之,趙博娟.非參數(shù)統(tǒng)計[M].北京:中國統(tǒng)計出版社.2010:350-461.