国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

假設(shè)檢驗(yàn)在體育統(tǒng)計(jì)應(yīng)用中應(yīng)注意的兩個(gè)問題

2011-11-21 02:27:36曹遠(yuǎn)紅
關(guān)鍵詞:參數(shù)檢驗(yàn)假設(shè)檢驗(yàn)單側(cè)

曹遠(yuǎn)紅

(湖南師范大學(xué) 體育學(xué)院,湖南 長沙 410012)

假設(shè)檢驗(yàn)在體育統(tǒng)計(jì)應(yīng)用中應(yīng)注意的兩個(gè)問題

曹遠(yuǎn)紅

(湖南師范大學(xué) 體育學(xué)院,湖南 長沙 410012)

現(xiàn)有的體育統(tǒng)計(jì)教材對假設(shè)檢驗(yàn)的有關(guān)問題缺乏詳盡的論述,文中以參數(shù)檢驗(yàn)為例,對體育統(tǒng)計(jì)中假設(shè)檢驗(yàn)的原理和方法進(jìn)行了論述,特別是對假設(shè)檢驗(yàn)中原假設(shè)的確立和假設(shè)檢驗(yàn)中的兩類錯(cuò)誤的控制問題進(jìn)行了深入的闡述,旨在為體育統(tǒng)計(jì)的教學(xué)和體育科研中假設(shè)檢驗(yàn)的應(yīng)用提供有益的參考。

體育統(tǒng)計(jì);假設(shè)檢驗(yàn);參數(shù)檢驗(yàn);原假設(shè)

體育統(tǒng)計(jì)的學(xué)科體系已經(jīng)基本成型,內(nèi)容主要包括描述統(tǒng)計(jì)、假設(shè)檢驗(yàn)、參數(shù)估計(jì)、相關(guān)分析、回歸分析、方差分析、多元統(tǒng)計(jì)分析等[1]。全國絕大多數(shù)體育院系早已將體育統(tǒng)計(jì)作為本科必修課程。體育統(tǒng)計(jì)方法在體育實(shí)踐中不斷發(fā)展、提高和深化,隨著近年來體育科技的飛速發(fā)展和體育科學(xué)化程度的迅速提高,體育統(tǒng)計(jì)的原理和方法已被體育界廣泛接受。假設(shè)檢驗(yàn)是統(tǒng)計(jì)推斷中的重要內(nèi)容,特別是參數(shù)檢驗(yàn)在體育科研和體育實(shí)踐中有著重要的作用,但目前我國體育院校所采用的體育統(tǒng)計(jì)教材對假設(shè)檢驗(yàn)的原理和方法缺乏較詳盡的論述,不利于體育統(tǒng)計(jì)的教學(xué)和假設(shè)檢驗(yàn)在體育實(shí)踐中的應(yīng)用,在實(shí)際應(yīng)用中容易出現(xiàn)錯(cuò)誤?;诖?,本文對假設(shè)檢驗(yàn)中的原假設(shè)的確立問題和 的控制問題進(jìn)行了論述。

1 假設(shè)檢驗(yàn)的概念和原理

所謂假設(shè)檢驗(yàn)就是對總體分布的參數(shù)或總體分布的性質(zhì)提出某種假設(shè),然后根據(jù)樣本信息對提出的假設(shè)進(jìn)行檢驗(yàn),判斷該假設(shè)是否成立[2]。假設(shè)檢驗(yàn)分為參數(shù)檢驗(yàn)和非參數(shù)檢驗(yàn),前者是對總體分布的某個(gè)參數(shù)提出某種假設(shè),利用來自總體的樣本檢驗(yàn)假設(shè)是否成立;后者是總體分布的性質(zhì)提出假設(shè),用來自總體的樣本檢驗(yàn)該假設(shè)是否成立。參數(shù)檢驗(yàn)主要有U檢驗(yàn)(也叫Z檢驗(yàn))、T檢驗(yàn)、2χ檢驗(yàn)等,非參數(shù)檢驗(yàn)主要有秩和檢驗(yàn)、符號(hào)檢驗(yàn)等。

在參數(shù)檢驗(yàn)中,原假設(shè)用0Η表示,與原假設(shè)相對立的是備擇假設(shè),用1Η表示。0Η的建立至關(guān)重要,因?yàn)榧僭O(shè)檢驗(yàn)是一種帶有概率性質(zhì)的反證法,其基本思想是小概率事件原理,即認(rèn)為小概率事件在一次實(shí)驗(yàn)中是不會(huì)發(fā)生的。假設(shè)檢驗(yàn)的過程實(shí)質(zhì)上基于原假設(shè)的一種推理過程,先假設(shè)成立,從Η0出發(fā)推導(dǎo),如果發(fā)生了小概率事件,認(rèn)為Η0不真,則作出拒絕Η0的決定,反之,就沒有理由拒絕Η0,從而接受Η0。其過程可以通俗地描述:“假設(shè)某一事實(shí)A成立,如果在A成立的基礎(chǔ)上,某事件B發(fā)生的概率很小,在一次抽樣中,B事件發(fā)生了,則認(rèn)為事實(shí)A不成立,否則只能認(rèn)為A事實(shí)成立?!?/p>

2 單側(cè)、雙側(cè)檢驗(yàn)的區(qū)分

在參數(shù)檢驗(yàn)中,單、雙側(cè)檢驗(yàn)的稱呼主要是依據(jù)其拒絕域的形式來命名的,把拒絕域分布兩側(cè)的檢驗(yàn)叫雙側(cè)檢驗(yàn),把拒絕域分布一側(cè)的檢驗(yàn)叫單側(cè)檢驗(yàn)[3]。在實(shí)際應(yīng)用中到底用單側(cè)檢驗(yàn)還是用雙側(cè)檢驗(yàn),這需要根據(jù)我們的研究目的而確定,如果要檢驗(yàn)?zāi)辰y(tǒng)計(jì)量是否來自某一總體,或者檢驗(yàn)?zāi)骋?值是否等于已知0值,這時(shí)的任務(wù)只需檢驗(yàn) 是否等于0, >0或 <0都將拒絕原假設(shè),所以雙側(cè)檢驗(yàn)的拒絕域分布在兩側(cè)。至于誰大誰小我們是不需要考慮的,這種情況通常用雙側(cè)檢驗(yàn)。在另外一些情況,我們要檢驗(yàn)的問題帶有方向性,即要檢驗(yàn)?zāi)骋?值是大于還是小于已知的 0值,這時(shí)需要采用單側(cè)檢驗(yàn)。單側(cè)檢驗(yàn)又分為左單側(cè)檢驗(yàn)和右單側(cè)檢驗(yàn),又分別叫下限檢驗(yàn)和上限檢驗(yàn)[4]。在體育科研的實(shí)踐中,往往是用單側(cè)檢驗(yàn)較多,比如說采用了某種新的訓(xùn)練方法成績是否有提高,某地區(qū)青少年的平均身高是否有所增長,通過實(shí)驗(yàn)條件的改變,某指標(biāo)是否變低還是變高等等,諸如此類的問題都是帶有方向性,需要采用單側(cè)檢驗(yàn)。不管是單側(cè)還是雙側(cè)檢驗(yàn),至于需要檢驗(yàn)的 值都是不知道的,而是根據(jù)已有的樣本信息對 值進(jìn)行檢驗(yàn)。

那么,拒絕域又如何確定呢?同樣是依據(jù)小概率事件原理而確定的。下面以檢驗(yàn)樣本平均數(shù)是否來自已知總體平均數(shù)(且總體標(biāo)準(zhǔn)差 已知)為例來說明這個(gè)問題,取

=0.05,在雙側(cè)檢驗(yàn)中,對于原假設(shè)0Η:=0,備擇假設(shè)Η1: ≠0,那么在原假設(shè)成立的基礎(chǔ)上,對于X~N(0, ),則有,根據(jù)數(shù)據(jù)標(biāo)準(zhǔn)化,則~N(0,1),因?yàn)?=0.05,所以有95%的可能處于(-1.96,1.96)之間,同理,通過轉(zhuǎn)換同樣可知樣本平均數(shù)x有95%的可能處于之間,而不在這個(gè)區(qū)間的概率僅為5%。如果落入這個(gè)區(qū)間之外則發(fā)生了小概率事件,就依據(jù)小概率事件原理認(rèn)為樣本平均數(shù)不是來自這個(gè)總體,從而拒絕原假設(shè)。因?yàn)樵谡龖B(tài)分布的鐘形曲線中95%的區(qū)間處于中間,小概率處于兩邊,所以拒絕域分布于兩側(cè),從而叫雙側(cè)檢驗(yàn)。

單側(cè)檢驗(yàn)的拒絕域?yàn)槭裁粗环植荚谝粋?cè)呢?以檢驗(yàn)已知樣本平均數(shù)x所在的總體平均數(shù) 是否大于已知總體平

均數(shù)0為例,如果原假設(shè)Η0: >0,Η1: ≤0,取 =0.05,同理,在原假設(shè)成立的基礎(chǔ)上進(jìn)行推導(dǎo),如果原假設(shè)成立,那么從平均數(shù)為 的總體中隨機(jī)抽取一個(gè)樣本,則樣本平均數(shù)落入左側(cè)小概率區(qū)間的概率很小,因?yàn)樵谡龖B(tài)分布和t分布的圖形中,我們知道左側(cè)是小于平均值的區(qū)間,右側(cè)是大于平均值的區(qū)間,也就是說:通過標(biāo)準(zhǔn)化后的U值落入(-∞,-1.65)的區(qū)間概率很小,因?yàn)閁α=1.65,則 U1?α=?1.65,如果落入這個(gè)區(qū)間,則發(fā)生了小概率事件,同理,依據(jù)小概率事件原理,就拒絕原假設(shè),這時(shí)拒絕域只分布在一側(cè),因此叫單側(cè)檢驗(yàn)。反之,如果原假設(shè)0Η:<0,則拒絕域分布于右側(cè),原理還是一樣的。

3 原假設(shè)的確立

在上文中已提到假設(shè)檢驗(yàn)是一種帶有概率性質(zhì)的反證法,假設(shè)檢驗(yàn)的過程實(shí)質(zhì)上基于原假設(shè)的一種推理過程,因此原假設(shè)的確立是假設(shè)檢驗(yàn)的開始,原假設(shè)正確與否是假設(shè)檢驗(yàn)的關(guān)鍵。為了更能說明這個(gè)問題,通過下面的實(shí)例來說明。

例:[5]已知在某運(yùn)動(dòng)飲料中,維生素C的含量服從正態(tài)分布,按規(guī)定,維生素C的含量不得低于21毫克。現(xiàn)在從一批飲料中抽取17罐,計(jì)算得知維生素C含量的平均值x=23毫克,S=3.09毫克,問該批飲料維生素C含量是否合格?( =0.05)

在上述例題中,屬于總體標(biāo)準(zhǔn)差未知且為小樣本的檢驗(yàn),所以用t檢驗(yàn)法,問題是維生素C含量是否合格,即是否大于21,屬于單側(cè)檢驗(yàn),那么原假設(shè)有兩種情況, H0:

< 2 1(假設(shè)維生素C含量不合格)或 > 2 1(假設(shè)維生素C含量合格),因?yàn)椴閠值表可知, t0.05(16)=1.746。如果原假設(shè)是 H0: < 2 1,則拒絕域?yàn)?t≥ t0.05(16)=1.746,因?yàn)閠=2.072>1.746,所以拒絕原假設(shè),認(rèn)為該批運(yùn)動(dòng)飲料維生素C含量合格;如果原假設(shè)是 H0: > 2 1,則拒絕域?yàn)?t≤ ?t0.05(16)=?1.746,因?yàn)閠=2.072>-1.746,所以接受原假設(shè),認(rèn)為該批運(yùn)動(dòng)飲料維生素C含量合格。

兩種不同的原假設(shè),得出一樣的結(jié)論,兩種方法是否都正確?檢驗(yàn)的效果是否一樣呢?要回答這些問題,還是要從假設(shè)檢驗(yàn)的原理即小概率事件原理來闡述,假設(shè)檢驗(yàn)中的顯著性水平 實(shí)際上就是我們?nèi)藶橐?guī)定小概率事件的概率,當(dāng)拒絕原假設(shè)時(shí),我就有1- 的把握認(rèn)為原假設(shè)為偽,如果接受原假設(shè)時(shí),則只表明沒有充足的理由證明原假設(shè)是錯(cuò)的,只能接受原假設(shè);反過來也就是說要拒絕原假設(shè)則需要較充足的理由,接受原假設(shè)則是“被迫”接受??梢娫僭O(shè)往往是處于受保護(hù)地位的,一般是根據(jù)已有的知識(shí)和經(jīng)驗(yàn)把不能輕易否定的東西作為原假設(shè),比如在檢驗(yàn)?zāi)钞a(chǎn)品的質(zhì)量時(shí),商家希望把“質(zhì)量合格”作為原假設(shè),因?yàn)檫@樣容易得出接受原假設(shè)的結(jié)論,而要拒絕原假設(shè)是需要充足理由的。在體育科研的實(shí)踐中往往將希望證實(shí)的反面作為原假設(shè),將希望證實(shí)的問題作為備擇假設(shè),這樣一旦拒絕原假設(shè),不僅具有充足的理由,而且往往意味科研成功,符合科學(xué)研究要嚴(yán)謹(jǐn)?shù)牧?xí)慣。比如說要檢驗(yàn)一種新的訓(xùn)練方法是否有效,就把新的訓(xùn)練方法無效作為原假設(shè)。于是,在上文中例題中,將 21< 作為原假設(shè),方法更準(zhǔn)確,結(jié)論也更有說服力。

4 兩類錯(cuò)誤的控制

假設(shè)檢驗(yàn)的邏輯是概率反證法,但做檢驗(yàn)時(shí)是根據(jù)抽樣得到的樣本值作出拒絕還是接受0Η的決定,由于樣本具有隨機(jī)性,假設(shè)檢驗(yàn)有可能犯錯(cuò)誤,這種錯(cuò)誤分為“棄真”錯(cuò)誤和“取偽”錯(cuò)誤,也即“第一類錯(cuò)誤”和“第二類錯(cuò)誤”。假設(shè)檢驗(yàn)中顯著性水平 就是犯“棄真”錯(cuò)誤的概率,“取偽”錯(cuò)誤的概率用 表示。我們都希望在假設(shè)檢驗(yàn)中這兩類錯(cuò)誤的概率越小越好,但對于一定的樣本量,當(dāng) 增加時(shí), 減小,反之當(dāng) 減小時(shí),將導(dǎo)致 的增加。就像在區(qū)間估計(jì)中,要想增大估計(jì)的可靠性,就會(huì)使區(qū)間變寬而降低精度;要想提高精度就會(huì)要求估計(jì)區(qū)間變窄,從而使可靠性下降。也就是說,我們在實(shí)際操作中根本無法找到一個(gè)能使 與 同時(shí)減小的臨界域,除非增大抽樣容量,但是無限增大樣本容量并非抽樣的本意。還是以例題來說明這個(gè)問題。

某公司生產(chǎn)的體育用品, 根據(jù)以前資料可知平均使用壽命為1000小時(shí),現(xiàn)欲采用新工藝生產(chǎn), 在新工藝試用期從生產(chǎn)的用品中隨機(jī)抽出25件,樣本平均壽命為1040小時(shí)。已知總體標(biāo)準(zhǔn)差為100小時(shí), 請?jiān)?=0.01的顯著性水平下檢驗(yàn)產(chǎn)品壽命是否有顯著提高?

根據(jù)題中條件, 該問題屬于小樣本但總體標(biāo)準(zhǔn)差已知的檢驗(yàn), 采用U檢驗(yàn)法。又因?yàn)閱栴}是檢驗(yàn)產(chǎn)品使用壽命是否有顯著提高,所以屬單側(cè)檢驗(yàn)。分別有如下兩種:已知

0=1000, =100。

解法一,Η0: ≤0(沒有顯著性提高),Η1:

U< U0.01,落入接受域內(nèi),接受原假設(shè),認(rèn)為該產(chǎn)品使用壽命沒有顯著性提高。

解法二,Η0: ≥0(有顯著性提高),Η1: <

U>- 01.0U =-2.33 ,落入接受域內(nèi),接受原假設(shè),與解法一得出的結(jié)論相反,認(rèn)為該產(chǎn)品使用壽命有顯著性提高。

對這個(gè)問題我們都是接受原假設(shè),但是結(jié)論相反,因此,其中必有一種方法犯了第二類錯(cuò)誤,即“取偽”錯(cuò)誤,這類問題如何解決呢?奈曼與皮爾遜(Neyman&Pearson)提出一個(gè)原則,即在控制犯第一類錯(cuò)誤的概率 的條件下,盡量使犯第二類錯(cuò)誤的概率 小。這其中蘊(yùn)含了這樣一種思想:我們只對犯第一類錯(cuò)誤的概率 加以限制,而不考慮犯第二類錯(cuò)誤的概率[6]。根據(jù)兩類錯(cuò)誤此消彼長的關(guān)系,既然發(fā)生了“取偽”錯(cuò)誤,不妨增加 值,在上述例題中若取 =0.05,對應(yīng)解法一有:U = 2 >U0.05=1.65,拒絕原假設(shè),認(rèn)為該產(chǎn)品使用壽命有顯著性提高;對應(yīng)解法二有:U= 2 >?U0.05=?1.65,接受原假設(shè),也認(rèn)為該產(chǎn)品使用壽命有顯著性提高。在 =0.05的水平上,兩種方法得出了一致性結(jié)論,根據(jù)上文的論述,解法一更有說服力。

可見在檢驗(yàn)中, 的概率是可以人為控制的,通過控制 而改變 , 的含義是當(dāng)原假設(shè)正確時(shí)卻被拒絕的概率或風(fēng)險(xiǎn), 通常取值0.05或0.01,但在使用時(shí)究竟取多大,應(yīng)視具體情況和根據(jù)專業(yè)知識(shí)判斷?!耙话銇碚f,哪一類錯(cuò)誤所帶來的后果越嚴(yán)重、危害越大就把哪一類錯(cuò)誤作為首要的控制目標(biāo)。[7]”需 要衡量兩類錯(cuò)誤所付出代價(jià)的大小, 如果“取偽”代價(jià)大, 則取較大 。如“棄真”代價(jià)大, 則取較小 , 容忍較大 。

[1]權(quán)德慶等.體育統(tǒng)計(jì)學(xué)科現(xiàn)狀與發(fā)展趨勢[J].西安體育學(xué)院學(xué)報(bào),2008.

[2]費(fèi)宇.應(yīng)用數(shù)理統(tǒng)計(jì)[M].北京:科學(xué)出版社,2007.

[3]叢湖平.體育統(tǒng)計(jì)學(xué)[M].北京:高等教育出版社,2007.

[4]賈俊平等.統(tǒng)計(jì)學(xué)(第二版)[M].北京:中國人民大學(xué)出版社,2004.

[5]祁國鷹等.體育統(tǒng)計(jì)簡明教程[M].北京:北京體育大學(xué)出版社,2004.

[6]康鐵祥.深入理解假設(shè)檢驗(yàn)原理[J].統(tǒng)計(jì)教育,2001,(1).

[7]賈俊平等.統(tǒng)計(jì)學(xué)(第二版)[M].北京:中國人民大學(xué)出版社,2004.

G80-32

A

1673-2219(2011)12-0193-03

2011-01-06

曹遠(yuǎn)紅(1977—),男,湖南長沙人,湖南師范大學(xué)體育學(xué)院體育人文教研室體育統(tǒng)計(jì)學(xué)教師,體育人文博士,研究方向?yàn)轶w育統(tǒng)計(jì)的原理和應(yīng)用、體育人文。

(責(zé)任編校:張京華、何俊華)

猜你喜歡
參數(shù)檢驗(yàn)假設(shè)檢驗(yàn)單側(cè)
關(guān)于單側(cè)布頂內(nèi)側(cè)安裝減速頂?shù)娜粘pB(yǎng)護(hù)及維修工作的思考
統(tǒng)計(jì)推斷的研究
雙冪變換下正態(tài)線性回歸模型參數(shù)的假設(shè)檢驗(yàn)
Primary Question and Hypothesis Testing in Randomized Controlled Clinical Trials
統(tǒng)計(jì)學(xué)教學(xué)中關(guān)于假設(shè)檢驗(yàn)問題探討
非參數(shù)檢驗(yàn)的概念
中間入路與外側(cè)入路行單側(cè)甲狀腺葉全切除術(shù)的對比
同期雙髖,單側(cè)全髖關(guān)節(jié)置換治療嚴(yán)重髖部疾病的臨床比較
非參數(shù)檢驗(yàn)的概念
非參數(shù)檢驗(yàn)的概念
拉孜县| 泾川县| 阳泉市| 南汇区| 精河县| 临高县| 霍邱县| 普兰店市| 迭部县| 南乐县| 延边| 溧阳市| 增城市| 抚顺市| 宜昌市| 鹤庆县| 高碑店市| 镇江市| 赣州市| 济源市| 大姚县| 威远县| 贺州市| 上高县| 秭归县| 杨浦区| 南靖县| 商都县| 平利县| 三亚市| 汪清县| 镇安县| 扬州市| 青川县| 陵水| 平原县| 海兴县| 龙南县| 慈利县| 松潘县| 甘谷县|