基于R語言的兩配對樣本的均值差檢驗

2019-05-07 10:17:02◆

中國校外教育 2019年15期

◆

(東北大學(xué))

假設(shè)檢驗是統(tǒng)計推斷的一個基本問題，實際生活工作中的很多問題利用統(tǒng)計方法分析，得到統(tǒng)計結(jié)論，進而有效地指導(dǎo)決策。利用兩總體均值差的假設(shè)檢驗，比較兩種處理方法的差異。當兩樣本X1，X2，L，Xn與Y1，Y2，L，Ym相互獨立時，可以利用獨立樣本的均值差的T檢驗。當樣本中測量到的兩組數(shù)據(jù)是同一對象在不同條件下測試的結(jié)果時，不能視為兩獨立的樣本，往往要對樣本進行配對處理，再利用單樣本均值差是否為零的T檢驗。如比較兩種安眠藥的安眠效果是否有差異，若試驗是在分為對照組和實驗組時進行的，此時兩組樣本是相互獨立的。若試驗是對一組試驗對象在不同時間下進行的，此時兩組樣本就不是相互獨立的，就不能利用獨立樣本的均值檢驗。再如要討論高三學(xué)生最后一次模擬考試的數(shù)學(xué)成績與高考真實的數(shù)學(xué)成績有無顯著差異？是否最后一次模擬考試的數(shù)學(xué)成績高于高考真實的數(shù)學(xué)成績？抽樣得到的兩組數(shù)據(jù)就不能視為兩個獨立樣本，需要對樣本數(shù)據(jù)進行配對后才能應(yīng)用假設(shè)檢驗的理論進行分析。

一、理論及應(yīng)用

1.檢驗的理論

由于配對樣本的各觀測具有對應(yīng)關(guān)系，因此可將兩個樣本以觀測為依據(jù)對應(yīng)做差(得到的樣本稱為差值樣本)。利用單樣本T檢驗法檢驗差值樣本的均值與零是否有顯著差異，進而得到兩總體均值是否有差異。

2.檢驗的實例

R語言是目前應(yīng)用最廣泛的統(tǒng)計軟件，由于R語言的開源性及其與一些軟件具有良好的兼容性，越來越多的數(shù)據(jù)分析工作首選R語言作為分析數(shù)據(jù)的工具。另外，在這個被很多專家和學(xué)者命名的大數(shù)據(jù)時代，許多科技工者每天置身于數(shù)據(jù)的汪洋大海和崇山峻嶺之中，高效利用R語言開展數(shù)據(jù)分析工作，毫無疑問會為科學(xué)研究做出高效的貢獻，并為工作奠定良好的基礎(chǔ)。目前，我國處于改革開放的轉(zhuǎn)型時期，面臨國際化的各個方面的激烈競爭，以高效的數(shù)據(jù)分析作為科學(xué)研究的手段，是促進國家科學(xué)發(fā)展，是國家在復(fù)雜多變的國際環(huán)境競爭中處于有利位置的重要戰(zhàn)略決策。利用R語言分析數(shù)據(jù)除了調(diào)用軟件內(nèi)置的一些統(tǒng)計函數(shù)之外，用戶還可以自定義函數(shù)實現(xiàn)數(shù)據(jù)的統(tǒng)計分析。

可以從R的官方網(wǎng)站www.r-project.org免費下載并安裝R軟件，R主頁列出了R有關(guān)的各類信息，用戶下載R時，需要首先用鼠標點擊CRAN鏈接，選擇一個鏡像鏈接地址即可完成下載。成功下載R軟件后，即可按照Windows軟件的一般安裝方式進行安裝。

啟動R軟件后，用戶可以在R工作空間創(chuàng)建和管理R對像，調(diào)用R軟件中已加載包中的任何函數(shù)。在R語言中，兩配對樣本的均值差的檢驗對應(yīng)的統(tǒng)計函數(shù)為t.test，格式為t.test(數(shù)值型向量名1，數(shù)值型向量名2，paired=TRUE，alternative=檢驗方向)

在統(tǒng)計函數(shù)t.test的參數(shù)調(diào)用中，數(shù)值型向量名1和數(shù)值型向量名2分別表示配對樣本觀測值的向量對應(yīng)的名稱；參數(shù)paired=TRUE，表明觀測樣本為配對樣本，若paired=FALSE，則表示不對兩觀測樣本時行配對；參數(shù)alternative表明對立假設(shè)的檢驗方向，雙側(cè)檢驗時，對應(yīng)的alternative=“two.side”，單側(cè)檢驗時，根據(jù)實際問題的背景，對應(yīng)的對立假設(shè)的檢驗方向alternative=“l(fā)ess”或alternative=“greater”。

高考的數(shù)學(xué)成績對每一位考生非常重要，通過分析最后一次模擬考試的數(shù)學(xué)成績與高考真實的數(shù)學(xué)成績的數(shù)據(jù)，對學(xué)生的高考真實成績做出合理地指導(dǎo)。

假設(shè)討論某中學(xué)的學(xué)生最后一次模擬考試的數(shù)學(xué)成績與高考真實的數(shù)學(xué)成績的問題中，隨機抽取一部分學(xué)生最后一次模擬考試的數(shù)學(xué)成績與高考真實的數(shù)學(xué)成績。如下表所示。

檢驗最后一次模擬考試的數(shù)學(xué)成績與高考真實的數(shù)學(xué)成績是否有差異？

調(diào)用R語言的函數(shù)t.test(a，b，paired=TRUE，alternative=“two.sided”)，這里a表示學(xué)生最后一次模擬模擬考試的數(shù)學(xué)成績對應(yīng)的數(shù)值型向量，b表示學(xué)生高考中真實的數(shù)學(xué)成績對應(yīng)的數(shù)值型向量，輸出結(jié)果如圖所示

由輸出結(jié)果中可以看出，差值樣本對應(yīng)總體的均值的置信水平為95%的置信區(qū)間是(-3.18977，4.5897)，這個區(qū)間包含0.另外，檢驗的p-值是0.6934，比較大，所以認為樣本沒有提供不利于原假設(shè)成立的顯著性證據(jù)，因而不能拒絕原假設(shè)，即認為最后一次模擬考試的數(shù)學(xué)成績與高考真實的數(shù)學(xué)成績無顯著差異。

二、總結(jié)

在比較兩總體均值是否有差異的檢驗中，一定要確定兩樣本是否獨立，不同情形對應(yīng)著不同的統(tǒng)計方法，大多數(shù)數(shù)據(jù)分析工作者，很難區(qū)分兩樣本是否獨立。當兩組樣本是在不同的試驗對象中觀測得到的，可認為兩樣本是獨立的，可利用獨立樣本的均值差的T檢驗。當兩組樣本不獨立時，樣本值是同一組試驗對象在不同方法下的觀測值，常作配對處理，利用兩配對樣本的T檢驗，檢驗差值樣本對應(yīng)的總體均值與零是否有差異。

本文研究了R語言在兩配對樣本的均值差的T檢驗中的應(yīng)用。首先，簡要介紹了配對樣本，接著介紹了配對樣本的檢驗理論，最后接著介紹了R語言中配對板本的均值差的T檢驗的調(diào)用函數(shù)，并以具體實例討論R語言在實際問題中的應(yīng)用。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

基于R語言的兩配對樣本的均值差檢驗

一、理論及應(yīng)用

二、總結(jié)

一、理論及應(yīng)用

二、總結(jié)