T檢驗(yàn)在體育統(tǒng)計(jì)應(yīng)用中的一個(gè)注記

2020-06-09 01:18鄒應(yīng)軍甘勝進(jìn)

福建技術(shù)師范學(xué)院學(xué)報(bào) 2020年2期

鄒應(yīng)軍,甘勝進(jìn)

（福建技術(shù)師范學(xué)院a.體育學(xué)院；b.電子與信息工程學(xué)院,福建福清 350300）

隨著量化分析在體育活動(dòng)評(píng)價(jià)中的重要性日益顯現(xiàn),體育統(tǒng)計(jì)迅速成為體育活動(dòng)量化分析的一個(gè)有力工具,是從事體育教育與科研不可或缺的技能.許多高校甚至將《體育統(tǒng)計(jì)》這門課程納入本科生必修課程,并配備操作軟件EXCEL、SPSS、SAS等加以演示,取得了比較好的效果.然而,體育統(tǒng)計(jì)的理論基礎(chǔ)畢竟是數(shù)理統(tǒng)計(jì),涉及到復(fù)雜的數(shù)學(xué)公式和推導(dǎo),這對(duì)不具備高等數(shù)學(xué)基礎(chǔ)的體育科研與教育工作者來講,極具挑戰(zhàn)性,因此在體育統(tǒng)計(jì)應(yīng)用過程中,常常出現(xiàn)跳過數(shù)據(jù)分布類型,直接利用軟件來處理樣本,這種做法既不符合數(shù)理統(tǒng)計(jì)規(guī)范,更不符合體育統(tǒng)計(jì)要求.再者,體育數(shù)據(jù)處理軟件EXCEL雖然簡(jiǎn)潔,但在數(shù)據(jù)處理和統(tǒng)計(jì)圖表繪制方面表現(xiàn)欠佳；SPSS是菜單式軟件,不需要過多編寫程序,圖表輸出十分美觀,深受非統(tǒng)計(jì)類專業(yè)人士喜愛,但是其缺少靈活的數(shù)據(jù)分析；SAS雖然能通過手動(dòng)編程靈活分析數(shù)據(jù),但是其內(nèi)存占用較大,并且SPSS、SAS均為商用軟件,比較昂貴,但是大部分體育統(tǒng)計(jì)應(yīng)用者利用破解版軟件進(jìn)行體育統(tǒng)計(jì)分析,這在知識(shí)產(chǎn)權(quán)保護(hù)方面存在潛在風(fēng)險(xiǎn).相比之下,R軟件完全共享免費(fèi),并且其強(qiáng)大的軟件包足以滿足統(tǒng)計(jì)分析要求,因此在統(tǒng)計(jì)學(xué)界扮演著舉足輕重的角色,其詳細(xì)使用說明請(qǐng)參看文獻(xiàn)[1-2].本文以體育統(tǒng)計(jì)中常見的T檢驗(yàn)為例,借助統(tǒng)計(jì)軟件R來說明,利用T統(tǒng)計(jì)量作假設(shè)檢驗(yàn)時(shí)需要注意的幾個(gè)問題,盡管已有相關(guān)體育統(tǒng)計(jì)方面文獻(xiàn)[3-8]對(duì)T檢驗(yàn)做過注記,但是僅僅局限于依據(jù)定義概念對(duì)T檢驗(yàn)作文字性描述.本文通過R軟件產(chǎn)生的偽隨機(jī)數(shù),模擬利用T檢驗(yàn)后的名義顯著性水平來評(píng)價(jià)T檢驗(yàn)效果,事實(shí)上利用統(tǒng)計(jì)模擬進(jìn)行體育統(tǒng)計(jì)研究已有相關(guān)文獻(xiàn)[9].

1 T檢驗(yàn)相關(guān)理論

1.1 T分布基本概念

標(biāo)準(zhǔn)T分布的定義[10]為：假定獨(dú)立同分布于標(biāo)準(zhǔn)正態(tài)分布,則服從自由度為n 的卡方分布,記為

通過T分布定義可得以下結(jié)論：①構(gòu)造T分布的前提條件是總體為正態(tài)分布.②對(duì)于單樣本T分布而言,如果總體不服從正態(tài)分布,那么T1的精確分布也不是t分布,此時(shí)特別對(duì)于小樣本,如果仍然將T1看成t分布,那么統(tǒng)計(jì)推斷效果將大打折扣.如果樣本容量較大,,依據(jù) 中心極限定理可知,T1近似服從N(0,1),如果此時(shí)將T1看成t分布,那么對(duì)結(jié)果影響不大.③對(duì)于雙樣本T分布,如果兩獨(dú)立總體不服從正態(tài)分布,當(dāng)兩樣本容量較大時(shí),依據(jù)大數(shù)定律,再依據(jù)中心

1.2 T檢驗(yàn)相關(guān)概念

T檢驗(yàn)是在總體分布為正態(tài)情形下檢驗(yàn)總體均值取值情況,或者兩個(gè)獨(dú)立齊性方差正態(tài)總體均值差異.前者為單樣本T檢驗(yàn),后者為兩樣本T檢驗(yàn).由于雙邊檢驗(yàn)和單邊檢驗(yàn)檢驗(yàn)統(tǒng)計(jì)量一樣,其主要差別為拒絕域,故本文重點(diǎn)討論雙邊T檢驗(yàn).對(duì)于單樣本T檢驗(yàn)而言,

無論是單樣本T檢驗(yàn)還是雙樣本T檢驗(yàn),正態(tài)總體至關(guān)重要,判定樣本是否來自正態(tài)分布,R軟件一般采用Shapiro-Wilk正態(tài)性檢驗(yàn),例如社會(huì)體育專業(yè)某班35名學(xué)生《社會(huì)體育導(dǎo)論》考試成績(jī)?yōu)椋?7 69 93 62 71 81 46 66 70 69 75 73 69 88 60 71 85 75 74 79 77 74 82 79 73 60 69 64 50 69 73 91 91 86 64.先用頻率直方圖和Q-Q圖從直觀上判斷樣本是否來自正態(tài)分布總體,其R語言命令為：

f＜-c(87,69,93,62,71,81,46,66,70,69,75,73,6 9,88,60,71,85,75,74,79,77,74,82,79,73,60,69,64,50,69,73,91,91,86,64)

par(mfrow=c(1,2))

hist(f,pro=T,main="社體導(dǎo)論成績(jī)頻率直方圖",xlab="成績(jī)",axes = TRUE)

lines(density(f))

qqnorm(f)

qqline(f)

圖1 頻率直方圖與正態(tài)Q-Q圖

圖1 為《社會(huì)體育導(dǎo)論》成績(jī)頻率直方圖與Q-Q圖,從左邊頻率直方圖來看,數(shù)據(jù)不是完全對(duì)稱,核密度曲線與正態(tài)分布密度函數(shù)有一定差異；從右邊Q-Q圖來看,數(shù)據(jù)點(diǎn)在直線附近波動(dòng),比較接近正態(tài)分布,這是從直觀上得到結(jié)論.進(jìn)一步通過R語言命令shapiro.test(f)來檢驗(yàn)樣本是否來自正態(tài)分布,其運(yùn)行結(jié)果p值為0.4871,可以接受35名學(xué)生《社會(huì)體育導(dǎo)論》這門課的成績(jī)來自正態(tài)分布的論斷.

2 T檢驗(yàn)統(tǒng)計(jì)模擬

為了證實(shí)上述結(jié)論,選取顯著性水平α=0.05,在固定樣本容量n下,100次蒙特卡洛模擬接受原假設(shè)的次數(shù),如果原假設(shè)成立,則100次蒙特卡洛模擬大約有95次接受原假設(shè),即接受原假設(shè)次數(shù)在95次附近波動(dòng),過大過小均不好,以上模擬再重復(fù)100次.在體育統(tǒng)計(jì)中,一般將n≥30作為大樣本,為了方便比較,以下統(tǒng)計(jì)模擬中既有小樣本,又有大樣本.圖2分別為總體X～N(4,1)和總體服從參數(shù)為1/4的指數(shù)分布下,采用單樣本T檢驗(yàn)次數(shù)的箱線圖.其R語言程序代碼為：

b＜-matrix(0,nr=100,nc=3)

m＜-0

for(n in c(20,30,200)){

m＜-m+1

s1＜-0

for(j in 1：100){

s＜-0

for(i in 1：100){

a＜-rexp(n,0.25)

#a＜-rnorm(n,4,1)

t＜-(mean(a)-4)*sqrt(length(a))/sd(a)

if(pt(abs(t),length(a)-1,lower=F)＞=0.025)s=s+1 }

s1[j]＜-s}

b[,m]＜-s1}

圖2左圖為總體正態(tài)分布,在樣本容量n分別為20、30、200下箱線圖,發(fā)現(xiàn)均在95附近波動(dòng).右圖為總體參數(shù)為1/4指數(shù)分布下利用T檢驗(yàn)接受原假設(shè)次數(shù)箱線圖,從中可知,在小樣本下,表現(xiàn)得不令人滿意,隨著樣本容量增加,越來越向95靠攏.左圖中三種樣本容量下平均數(shù)分別為94.96 、95.63 、94.70,右圖中分別為92.15、 92.63、 94.58,顯然正態(tài)分布總體下T檢驗(yàn)效果更好,當(dāng)樣本容量比較大時(shí),非正態(tài)總體下選用T檢驗(yàn)效果也不錯(cuò),這進(jìn)一步證實(shí)了1.1節(jié)中結(jié)論②.

圖2 正態(tài)分布總體與指數(shù)分布總體下,100次重復(fù)下,在各個(gè)樣本容量100次蒙特卡洛模擬中,利用單樣本T檢驗(yàn)接受原假設(shè)次數(shù)的箱線圖.

圖3 分別為總體下,采用兩獨(dú)立樣本T檢驗(yàn),接受H0次數(shù)的箱線圖.其R語言程序與圖2類似,故省略.左圖為為兩樣本容量n1=n2,且分別為100、300、500下接受原假設(shè)次數(shù)的箱線圖,從圖中可知,其中位數(shù)均在95附近,采用T檢驗(yàn)逼近的效果較好.右圖為,從圖中可知,接受原假設(shè)的次數(shù)的中位數(shù)均遠(yuǎn)遠(yuǎn)大于95,隨著逐漸變大并且差別不大時(shí),接受原假設(shè)次數(shù)的中位數(shù)向95靠攏.

圖3 正態(tài)異方差總體下,100次重復(fù)下,在各個(gè)樣本容量100次蒙特卡洛模擬中,利用兩樣本T檢驗(yàn)接受原假設(shè)次數(shù)的箱線圖.

圖4為兩非正態(tài)分布總體下,利用兩樣本T檢驗(yàn)接受原假設(shè)的次數(shù)的箱線圖,兩非正態(tài)總體參數(shù)分別為1/20、1/4指數(shù)分布.左圖為兩指數(shù)分布總體樣本容量相等,分別為100、300、500時(shí)接受原假設(shè)次數(shù)的箱線圖,從中可以看出,均在95附近波動(dòng),檢驗(yàn)效果比較符合預(yù)期.右圖為樣本容量不等,可以看出,檢驗(yàn)效果極為糟糕,不過隨著樣本容量增大,兩樣本容量之間差別不大時(shí),檢驗(yàn)效果逐漸變好,這進(jìn)一步驗(yàn)證了1.1節(jié)中的結(jié)論③.

圖4 兩不同參數(shù)指數(shù)分布總體下,100次重復(fù)下,在各個(gè)樣本容量100次蒙特卡洛模擬中,利用兩樣本T檢驗(yàn)接受原假設(shè)次數(shù)的箱線圖.

3 結(jié)語