◆
(東北大學(xué))
假設(shè)檢驗是統(tǒng)計推斷的一個基本問題,實際生活工作中的很多問題利用統(tǒng)計方法分析,得到統(tǒng)計結(jié)論,進而有效地指導(dǎo)決策。利用兩總體均值差的假設(shè)檢驗,比較兩種處理方法的差異。當兩樣本X1,X2,L,Xn與Y1,Y2,L,Ym相互獨立時,可以利用獨立樣本的均值差的T檢驗。當樣本中測量到的兩組數(shù)據(jù)是同一對象在不同條件下測試的結(jié)果時,不能視為兩獨立的樣本,往往要對樣本進行配對處理,再利用單樣本均值差是否為零的T檢驗。如比較兩種安眠藥的安眠效果是否有差異,若試驗是在分為對照組和實驗組時進行的,此時兩組樣本是相互獨立的。若試驗是對一組試驗對象在不同時間下進行的,此時兩組樣本就不是相互獨立的,就不能利用獨立樣本的均值檢驗。再如要討論高三學(xué)生最后一次模擬考試的數(shù)學(xué)成績與高考真實的數(shù)學(xué)成績有無顯著差異?是否最后一次模擬考試的數(shù)學(xué)成績高于高考真實的數(shù)學(xué)成績?抽樣得到的兩組數(shù)據(jù)就不能視為兩個獨立樣本,需要對樣本數(shù)據(jù)進行配對后才能應(yīng)用假設(shè)檢驗的理論進行分析。
1.檢驗的理論
由于配對樣本的各觀測具有對應(yīng)關(guān)系,因此可將兩個樣本以觀測為依據(jù)對應(yīng)做差(得到的樣本稱為差值樣本)。利用單樣本T檢驗法檢驗差值樣本的均值與零是否有顯著差異,進而得到兩總體均值是否有差異。
2.檢驗的實例
R語言是目前應(yīng)用最廣泛的統(tǒng)計軟件,由于R語言的開源性及其與一些軟件具有良好的兼容性,越來越多的數(shù)據(jù)分析工作首選R語言作為分析數(shù)據(jù)的工具。另外,在這個被很多專家和學(xué)者命名的大數(shù)據(jù)時代,許多科技工者每天置身于數(shù)據(jù)的汪洋大海和崇山峻嶺之中,高效利用R語言開展數(shù)據(jù)分析工作,毫無疑問會為科學(xué)研究做出高效的貢獻,并為工作奠定良好的基礎(chǔ)。目前,我國處于改革開放的轉(zhuǎn)型時期,面臨國際化的各個方面的激烈競爭,以高效的數(shù)據(jù)分析作為科學(xué)研究的手段,是促進國家科學(xué)發(fā)展,是國家在復(fù)雜多變的國際環(huán)境競爭中處于有利位置的重要戰(zhàn)略決策。利用R語言分析數(shù)據(jù)除了調(diào)用軟件內(nèi)置的一些統(tǒng)計函數(shù)之外,用戶還可以自定義函數(shù)實現(xiàn)數(shù)據(jù)的統(tǒng)計分析。
可以從R的官方網(wǎng)站www.r-project.org免費下載并安裝R軟件,R主頁列出了R有關(guān)的各類信息,用戶下載R時,需要首先用鼠標點擊CRAN鏈接,選擇一個鏡像鏈接地址即可完成下載。成功下載R軟件后,即可按照Windows軟件的一般安裝方式進行安裝。
啟動R軟件后,用戶可以在R工作空間創(chuàng)建和管理R對像,調(diào)用R軟件中已加載包中的任何函數(shù)。在R語言中,兩配對樣本的均值差的檢驗對應(yīng)的統(tǒng)計函數(shù)為t.test,格式為t.test(數(shù)值型向量名1,數(shù)值型向量名2,paired=TRUE,alternative=檢驗方向)
在統(tǒng)計函數(shù)t.test的參數(shù)調(diào)用中,數(shù)值型向量名1和數(shù)值型向量名2分別表示配對樣本觀測值的向量對應(yīng)的名稱;參數(shù)paired=TRUE,表明觀測樣本為配對樣本,若paired=FALSE,則表示不對兩觀測樣本時行配對;參數(shù)alternative表明對立假設(shè)的檢驗方向,雙側(cè)檢驗時,對應(yīng)的alternative=“two.side”,單側(cè)檢驗時,根據(jù)實際問題的背景,對應(yīng)的對立假設(shè)的檢驗方向alternative=“l(fā)ess”或alternative=“greater”。
高考的數(shù)學(xué)成績對每一位考生非常重要,通過分析最后一次模擬考試的數(shù)學(xué)成績與高考真實的數(shù)學(xué)成績的數(shù)據(jù),對學(xué)生的高考真實成績做出合理地指導(dǎo)。
假設(shè)討論某中學(xué)的學(xué)生最后一次模擬考試的數(shù)學(xué)成績與高考真實的數(shù)學(xué)成績的問題中,隨機抽取一部分學(xué)生最后一次模擬考試的數(shù)學(xué)成績與高考真實的數(shù)學(xué)成績。如下表所示。
檢驗最后一次模擬考試的數(shù)學(xué)成績與高考真實的數(shù)學(xué)成績是否有差異?
調(diào)用R語言的函數(shù)t.test(a,b,paired=TRUE,alternative=“two.sided”),這里a表示學(xué)生最后一次模擬模擬考試的數(shù)學(xué)成績對應(yīng)的數(shù)值型向量,b表示學(xué)生高考中真實的數(shù)學(xué)成績對應(yīng)的數(shù)值型向量,輸出結(jié)果如圖所示
由輸出結(jié)果中可以看出,差值樣本對應(yīng)總體的均值的置信水平為95%的置信區(qū)間是(-3.18977,4.5897),這個區(qū)間包含0.另外,檢驗的p-值是0.6934,比較大,所以認為樣本沒有提供不利于原假設(shè)成立的顯著性證據(jù),因而不能拒絕原假設(shè),即認為最后一次模擬考試的數(shù)學(xué)成績與高考真實的數(shù)學(xué)成績無顯著差異。
在比較兩總體均值是否有差異的檢驗中,一定要確定兩樣本是否獨立,不同情形對應(yīng)著不同的統(tǒng)計方法,大多數(shù)數(shù)據(jù)分析工作者,很難區(qū)分兩樣本是否獨立。當兩組樣本是在不同的試驗對象中觀測得到的,可認為兩樣本是獨立的,可利用獨立樣本的均值差的T檢驗。當兩組樣本不獨立時,樣本值是同一組試驗對象在不同方法下的觀測值,常作配對處理,利用兩配對樣本的T檢驗,檢驗差值樣本對應(yīng)的總體均值與零是否有差異。
本文研究了R語言在兩配對樣本的均值差的T檢驗中的應(yīng)用。首先,簡要介紹了配對樣本,接著介紹了配對樣本的檢驗理論,最后接著介紹了R語言中配對板本的均值差的T檢驗的調(diào)用函數(shù),并以具體實例討論R語言在實際問題中的應(yīng)用。