国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

關(guān)于方差分析的一種直覺推導(dǎo)和一個(gè)現(xiàn)實(shí)應(yīng)用

2012-04-29 00:44:03黃海燕
經(jīng)濟(jì)師 2012年9期
關(guān)鍵詞:方差分析假設(shè)檢驗(yàn)

黃海燕

摘 要:方差分析是一種重要的用于假設(shè)檢驗(yàn)的統(tǒng)計(jì)方法,常用于分析和判斷某一因素的不同水平對(duì)事物的影響是否有顯著差異。雖然方差分析有非常廣泛的應(yīng)用,但不少統(tǒng)計(jì)方法應(yīng)用者對(duì)方差分析中采用F檢驗(yàn)的原因并不清楚。而且,也很難發(fā)現(xiàn)有中外文獻(xiàn)或資料對(duì)此原因做出解釋。長期以來,F(xiàn)檢驗(yàn)統(tǒng)計(jì)量似乎已成為方差分析約定俗成的既定工具。文章從較為直觀的視角,結(jié)合統(tǒng)計(jì)常識(shí)和基礎(chǔ)知識(shí),對(duì)方差分析中的F檢驗(yàn)統(tǒng)計(jì)量進(jìn)行了較為充分的推導(dǎo)和證明。這種包含直覺成分的推導(dǎo)思路和過程很有可能與原有的推導(dǎo)有很大不同,但其一樣有效地詮釋了方差分析F檢驗(yàn)的機(jī)理和實(shí)質(zhì)。

關(guān)鍵詞:方差分析 F檢驗(yàn) 假設(shè)檢驗(yàn) 理論推導(dǎo) 合并總體

中圖分類號(hào):F222文獻(xiàn)標(biāo)識(shí)碼:A

文章編號(hào):1004-4914(2012)09-038-03

一、引言

方差分析是檢驗(yàn)多個(gè)總體均值是否相等的統(tǒng)計(jì)方法。當(dāng)要判斷分類型自變量是否對(duì)數(shù)值型因變量有顯著影響時(shí),可以采用方差分析的方法。例如,要判斷不同種化肥對(duì)農(nóng)作物的產(chǎn)量是否有顯著影響、不同生產(chǎn)工藝對(duì)產(chǎn)品的質(zhì)量是否有顯著影響、不同的培訓(xùn)項(xiàng)目對(duì)員工技能提高是否有顯著影響等,都可以考慮通過方差分析對(duì)問題進(jìn)行研究。

作為一種非常重要的檢驗(yàn)方法,方差分析采用F檢驗(yàn)統(tǒng)計(jì)量進(jìn)行顯著性檢驗(yàn)。雖然方差分析有非常廣泛的應(yīng)用,但不少的使用者并不十分清楚為什么采用F檢驗(yàn)進(jìn)行方差分析。所見到的文獻(xiàn)幾乎都把方差分析中的F檢驗(yàn)僅作為一種統(tǒng)計(jì)工具予以介紹,而并不對(duì)方差分析中之所以采用F檢驗(yàn)的原因進(jìn)行解釋。筆者目前還沒見到關(guān)于方差分析F檢驗(yàn)推導(dǎo)過程的中外相關(guān)文獻(xiàn)或資料。

作為一種科學(xué)的統(tǒng)計(jì)檢驗(yàn)方法,方差分析中采用F檢驗(yàn)統(tǒng)計(jì)量肯定有其非常嚴(yán)謹(jǐn)?shù)耐茖?dǎo)過程,這是勿容置疑的。但或許正是由于其推導(dǎo)過程過于嚴(yán)格和復(fù)雜,從而鮮有文獻(xiàn)資料對(duì)其給以說明和推證,只是把F檢驗(yàn)作為一種約定俗成的做法施加于方差分析過程。

本文筆者通過思考,嘗試找到一種關(guān)于方差分析F檢驗(yàn)的推導(dǎo)方法。在整個(gè)推導(dǎo)過程中,所采用的都是一些基礎(chǔ)性的統(tǒng)計(jì)知識(shí),并摻插著對(duì)統(tǒng)計(jì)學(xué)問題的直覺認(rèn)識(shí)。所以,筆者所采用的推導(dǎo)方法并不復(fù)雜,很容易讓方差分析方法的使用者明白使用F檢驗(yàn)統(tǒng)計(jì)量的個(gè)中緣由。本文第二部分再現(xiàn)了這種推導(dǎo)過程。但有別于原本的方差分析推導(dǎo)過程所應(yīng)具有的規(guī)范性和嚴(yán)謹(jǐn)性,本推導(dǎo)過程中的個(gè)別環(huán)節(jié)可能還值得進(jìn)一步推敲。希望能與讀者進(jìn)行相關(guān)交流和探討。本文的第三部分提供了一個(gè)用方差分析進(jìn)行產(chǎn)品改良的商業(yè)案例,用以展現(xiàn)方差分析的具體過程和應(yīng)用價(jià)值。

二、對(duì)方差分析F檢驗(yàn)統(tǒng)計(jì)量的直覺推導(dǎo)

(一)方差分析基本內(nèi)容

方差分析是要判斷分類型自變量是否對(duì)數(shù)值型因變量有顯著影響。分類型自變量代表著某種影響因素或稱為因子。影響因素以某一水平作用于若干個(gè)體對(duì)象上。所有可能被因素施以某一(水平)影響的個(gè)體構(gòu)成一個(gè)相應(yīng)的總體,而所觀察到的受到因素某一(水平)具體影響的所有個(gè)體構(gòu)成一個(gè)觀測樣本。這樣,如果某一影響因素具有k個(gè)水平,意味著分類型自變量可以取k個(gè)不同的數(shù)值,因素k個(gè)水平下的觀測值共構(gòu)成k個(gè)對(duì)應(yīng)樣本。

若考察單一因素不同水平的影響,樣本觀測值的數(shù)據(jù)結(jié)構(gòu)如下表1所示。影響因素第i水平下有ni個(gè)觀測值,即第i個(gè)樣本包含ni個(gè)個(gè)體。個(gè)體總數(shù)n=n1+n2+…nk。來自第i個(gè)總體(水平)的第j個(gè)觀測值為xij。

根據(jù)以上數(shù)據(jù)結(jié)構(gòu),可以計(jì)算出如下統(tǒng)計(jì)量:因素各水平下觀測值的均值xˉi、全部觀測值的總均值x=、總誤差平方和SST、組間誤差平方和SSA、組內(nèi)誤差平方和SSE。在此基礎(chǔ)上,還可以通過SSA和SSE分別除以各自的自由度,進(jìn)一步計(jì)算出組間均方MSA以及組內(nèi)均方MSE。

方差分析要根據(jù)k個(gè)樣本提供的信息判斷k個(gè)總體的均值是否相等。若k個(gè)因素水平所對(duì)應(yīng)總體的均值分別為μ1,μ2,…,μk,則方差分析的原假設(shè)和備擇假設(shè)可陳述為:

H0∶μ1=μ2…=μkH1∶μ1,μ2…,μk不全相等

對(duì)假設(shè)進(jìn)行檢驗(yàn)的統(tǒng)計(jì)量為:

F=■~F(k-1,n-k)

此為F統(tǒng)計(jì)量。其中,k-1和n-k分別為F分布的第一和第二自由度,并分別與SSA和SSE(或者說,與組間均方MSA、組內(nèi)均方MSE的計(jì)算)相對(duì)應(yīng)。

(二)F檢驗(yàn)統(tǒng)計(jì)量推導(dǎo)過程

方差分析有三個(gè)基本假定:(1)每個(gè)總體都服從正態(tài)分布;(2)各個(gè)總體的方差相同;(3)觀測值獨(dú)立。在這些假定下,k個(gè)總體的分布如圖1所示。

如果原假設(shè)“H0∶μ1=μ2…=μk”成立,則k個(gè)總體的分布完全相同,如圖2所示。由k個(gè)總體合并一起構(gòu)成的“合并總體”的分布等同于任一水平所對(duì)應(yīng)總體的分布。用σ2E表示任一水平所對(duì)應(yīng)總體的方差,σ2P表示k個(gè)總體構(gòu)成的“合并總體”的方差,μP表示“合并總體”的均值,則由“μ1=μ2…=μk”可知:μP=μk,σ2P=σ2E。所以,“μ1=μ2…=μk”等價(jià)于“σ2P=σ2E”。

如果原假設(shè)不成立,即備擇假設(shè)“H1∶μ1,μ2…,μk不全相等”成立,則由k個(gè)總體合并一起構(gòu)成的“合并總體”的分布將不同于任一水平所對(duì)應(yīng)的總體的分布?!昂喜⒖傮w”相對(duì)于與每一水平所對(duì)應(yīng)總體來說,其個(gè)體之間的差異將變大,分布將更離散,從而其概率密度曲線將更扁平,如圖3所示。類似方差分析中給出的“每個(gè)總體都服從正態(tài)分布”的基本假定,這里同樣假定“合并總體”服從正態(tài)分布。

依然用σ2E表示任一水平所對(duì)應(yīng)總體的方差,σ2P表示k個(gè)總體構(gòu)成的“合并總體”的方差,則由“μ1,μ2…,μk不全相等”可知:σ2P>σ2E。所以,“μ1,μ2…,μk不全相等”等價(jià)于“σ2P>σ2E”。

從以上的分析能夠看出,方差分析中原假設(shè)和備擇假設(shè)關(guān)于均值的陳述

H0∶μ1=μ2…=μkH1∶μ1,μ2,…,μk不全相等

可以轉(zhuǎn)換成關(guān)于方差的陳述

H0∶σ2P=σ2EH1∶σ2P>σ2E

在上述的假設(shè)陳述轉(zhuǎn)換的基礎(chǔ)上,下面分析檢驗(yàn)統(tǒng)計(jì)量的構(gòu)建。對(duì)于k個(gè)總體中的第i個(gè)總體,根據(jù)χ2分布的定義等知識(shí)或者直接根據(jù)樣本方差的抽樣分布,可得

■~χ2(ni-1)

再根據(jù)χ2分布的可加性,將k個(gè)總體的上述統(tǒng)計(jì)量相加,得

■~χ2(n-k)

即■~χ2(n-k)(式子1)

從k個(gè)總體構(gòu)成的“合并總體”的角度,原本對(duì)應(yīng)于第i個(gè)水平的ni個(gè)觀測值構(gòu)成一個(gè)容量為ni的隨機(jī)樣本。還用σ2P表示“合并總體”的方差,μp表示“合并總體”的均值。在前述的“合并總體服從正態(tài)分布”的假定下,有

x-i~N(μp,■)(式子2)

需要說明的是,如果第i個(gè)水平的ni個(gè)觀測值足夠多,亦即隨機(jī)樣本的容量ni足夠大,完全可以放松前述的“合并總體服從正態(tài)分布”的假定。

根據(jù)χ2分布的定義,由式子2得

■~χ2(1)

即■~χ2(1)

對(duì)于k個(gè)隨機(jī)樣本,根據(jù)χ2分布的可加性,得

■■~χ2(k)

上式中μp未知,用總均值x=來估計(jì)和替換。由于x=是k個(gè)x-i的加權(quán)平均數(shù),意味著對(duì)上式中所涉及到的k個(gè)x-i施加了一個(gè)約束條件,所以x-i,從而χ2分布的自由度下降1,即

■■~χ2(k-1)

于是■~χ2(k-1)(式子3)

根據(jù)F分布的定義(兩個(gè)χ2分布除以各自的自由度,服從F分布),將式子1和式子3左側(cè)除以各自對(duì)應(yīng)的自由度,然后再進(jìn)行對(duì)比,得

■■~F(k-1,n-k)

因?yàn)镸SA=■,MSE=■,所以

■~F(k-1,n-k)(式子4)

對(duì)于原假設(shè)和備擇假設(shè)

H0∶σ2P=σ2EH1∶σ2P>σ2E

檢驗(yàn)統(tǒng)計(jì)量為式子4當(dāng)原假設(shè)成立時(shí)的情形,所以檢驗(yàn)統(tǒng)計(jì)量為

F=■~F(k-1,n-k)(式子5)

此假設(shè)檢驗(yàn)為右側(cè)檢驗(yàn)。對(duì)于給定的顯著性水平α,根據(jù)式子5中F檢驗(yàn)統(tǒng)計(jì)量的值是否大于臨界值Fα(k-1,n-k)判斷是否拒絕H0∶σ2P=σ2E,亦即據(jù)此判斷是否拒絕H0∶μ1=μ2…=μk。

三、方差分析方法的一個(gè)具體運(yùn)用案例

一家飲料生產(chǎn)廠商某種飲料的銷售情況一直不好,其準(zhǔn)備從口感和營養(yǎng)概念方面對(duì)此種飲料進(jìn)行改良。針對(duì)口感方面,飲料廠商設(shè)計(jì)了三種不同的口味配方(配方A、B和C),并分別在三個(gè)大型商場同時(shí)對(duì)消費(fèi)者進(jìn)行調(diào)查。消費(fèi)者品嘗飲料某一口味配方樣品后,對(duì)口感情況進(jìn)行評(píng)分。評(píng)分分值介于0到100分之間。接受三種口味配方A、B和C品嘗調(diào)查的消費(fèi)者分別為50人、60人和55人。調(diào)查數(shù)據(jù)在這里省略。此飲料廠商希望通過調(diào)查和分析,判斷飲料的三種口味配方是否顯著影響消費(fèi)者的口感評(píng)價(jià),并確定是否從中選擇一種較優(yōu)的配方方案。

要判斷飲料的三種口味配方是否顯著影響消費(fèi)者的口感評(píng)價(jià),等同于判斷消費(fèi)者對(duì)飲料的三種口味配方的口感評(píng)價(jià)是否有顯著差異,因此要判斷消費(fèi)者(包括現(xiàn)實(shí)的和潛在的消費(fèi)者)對(duì)三種口味配方的口感評(píng)價(jià)的均值是否相等。針對(duì)此問題,可以采用方差分析(單因素方差分析)等統(tǒng)計(jì)分析方法。

方差分析作為一種假設(shè)檢驗(yàn)方法,首先要提(下轉(zhuǎn)第41頁)(上接第39頁)出原假設(shè)和備擇假設(shè)。

H0∶μA=μB=μCH1∶μA,μB,μC不全相等

而進(jìn)行方差分析,數(shù)據(jù)應(yīng)滿足前述的方差分析的三個(gè)假設(shè)條件。在此問題中,正態(tài)性檢驗(yàn)從略。由于消費(fèi)者調(diào)查是分開進(jìn)行,可認(rèn)為數(shù)據(jù)的獨(dú)立性不存在問題。對(duì)于方差相等性,使用Minitab軟件進(jìn)行檢驗(yàn)。檢驗(yàn)結(jié)果如圖4所示。

由圖4的結(jié)果容易看出,Bartlett檢驗(yàn)的P值為0.861,Levene檢驗(yàn)的P值為0.752,可以認(rèn)為飲料不同口味配方所對(duì)應(yīng)的3個(gè)消費(fèi)者總體的方差是相等的。

繼續(xù)使用Minitab軟件對(duì)數(shù)據(jù)進(jìn)行單因素方差分析,分析的主要結(jié)果如表2所示。

從表2所示的分析結(jié)果可以看出,F(xiàn)檢驗(yàn)的P值為0,檢驗(yàn)結(jié)果顯著,說明飲料的三種不同口味配方顯著影響消費(fèi)者的口感評(píng)價(jià),其效果有很大差異。另外,從口感評(píng)價(jià)的95%置信區(qū)間估計(jì)來看,口味配方B應(yīng)該是三者之中較優(yōu)的配方方案。

四、結(jié)論

方差分析是一種非常重要的假設(shè)檢驗(yàn)方法,常用于判斷某一因素的不同水平對(duì)事物的影響是否有顯著差異。方差分析在各個(gè)領(lǐng)域都有非常現(xiàn)實(shí)的應(yīng)用,廣泛用于產(chǎn)品改良和流程設(shè)計(jì)。本文運(yùn)用統(tǒng)計(jì)學(xué)的基礎(chǔ)知識(shí),結(jié)合對(duì)相關(guān)問題的直覺認(rèn)識(shí),對(duì)方差分析檢驗(yàn)統(tǒng)計(jì)量進(jìn)行了推導(dǎo)和解釋。除了對(duì)方差分析的推導(dǎo),本文還給出了一個(gè)企業(yè)通過方差分析進(jìn)行產(chǎn)品改良的商業(yè)案例。此案例雖然只是方差分析的一個(gè)具體應(yīng)用,但其真實(shí)再現(xiàn)了方差分析的應(yīng)用過程和現(xiàn)實(shí)意義。本文所進(jìn)行的關(guān)于方差分析的理論推導(dǎo)和案例演示,將有助于廣大方差分析使用者充分理解方差分析的機(jī)理和實(shí)質(zhì),而不僅僅局限于把方差分析中的檢驗(yàn)作為一種慣常做法或者約定俗成的工具。

參考文獻(xiàn):

1.馬逢時(shí)等.六西格瑪管理統(tǒng)計(jì)指南:MINITAB使用指南.北京:中國人民大學(xué)出版社,2007

2.袁衛(wèi)等.統(tǒng)計(jì)學(xué)(第三版).北京:高等教育出版社,2009

3.Anderson.D.R.,et al. Statistics for Business and Economics.

Mason,OH:South-Western Cengage Learning,2011

(作者單位:鄭州大學(xué)西亞斯國際學(xué)院 河南新鄭 451150)

(責(zé)編:賈偉)

猜你喜歡
方差分析假設(shè)檢驗(yàn)
假設(shè)檢驗(yàn)結(jié)果的對(duì)立性分析
一種求解假設(shè)檢驗(yàn)拒絕域和計(jì)算p-值的系統(tǒng)化方法
一種求解假設(shè)檢驗(yàn)拒絕域和計(jì)算p-值的系統(tǒng)化方法
統(tǒng)計(jì)推斷的研究
雙冪變換下正態(tài)線性回歸模型參數(shù)的假設(shè)檢驗(yàn)
Excel在《生物統(tǒng)計(jì)學(xué)》雙因素有重復(fù)方差分析中的應(yīng)用與探討
考試周刊(2017年6期)2017-02-13 10:43:50
Primary Question and Hypothesis Testing in Randomized Controlled Clinical Trials
統(tǒng)計(jì)學(xué)教學(xué)中關(guān)于假設(shè)檢驗(yàn)問題探討
高校二手書市場細(xì)分研究
應(yīng)用統(tǒng)計(jì)學(xué)課堂教學(xué)組織實(shí)踐與探索
宁津县| 收藏| 红桥区| 灌云县| 泽库县| 华蓥市| 长岭县| 瓮安县| 左云县| 商水县| 丹寨县| 阿拉尔市| 郧西县| 潼南县| 鹤庆县| 三都| 客服| 洛南县| 芦山县| 砚山县| 金溪县| 民县| 稷山县| 观塘区| 安康市| 延津县| 巴林左旗| 陆良县| 吉林省| 天等县| 准格尔旗| 正安县| 中宁县| 安丘市| 冀州市| 新蔡县| 沐川县| 手机| 大石桥市| 泰宁县| 乌兰浩特市|