高鑫雨,趙勝利
(曲阜師范大學(xué)統(tǒng)計(jì)學(xué)院,273165,山東省曲阜市)
自20世紀(jì)20年代英國統(tǒng)計(jì)學(xué)家Fisher R A在農(nóng)業(yè)生產(chǎn)中創(chuàng)立試驗(yàn)設(shè)計(jì)以來,試驗(yàn)設(shè)計(jì)已在各個(gè)領(lǐng)域得到廣泛的發(fā)展,其主要任務(wù)是研究最優(yōu)設(shè)計(jì)的構(gòu)造以及對(duì)試驗(yàn)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析.著名統(tǒng)計(jì)學(xué)家Box G E P說過,假如有10%的工程師使用各種試驗(yàn)設(shè)計(jì)方法,產(chǎn)品的質(zhì)量與數(shù)量都會(huì)得到很大提高[1].因子設(shè)計(jì)在各類試驗(yàn)中應(yīng)用相當(dāng)廣泛,常用于研究各因子對(duì)試驗(yàn)指標(biāo)是否具有顯著影響.在實(shí)際問題中,影響試驗(yàn)指標(biāo)的因子往往有多個(gè),而當(dāng)涉及的因子數(shù)較多時(shí),因子的水平組合數(shù)會(huì)迅速增加,受試驗(yàn)條件的限制往往難以全部實(shí)施.正交設(shè)計(jì)則是安排多因子試驗(yàn)的一種高效的試驗(yàn)設(shè)計(jì)方法.方差分析是對(duì)因子進(jìn)行顯著性檢驗(yàn)的常用方法,且方差分析需要滿足3項(xiàng)基本假定:正態(tài)性、方差齊性和隨機(jī)性.正態(tài)性和隨機(jī)性在實(shí)際中容易得到滿足,由于試驗(yàn)在實(shí)際操作時(shí)環(huán)境復(fù)雜,方差齊性通常得不到滿足,因此在不同的處理組合下會(huì)有不同的試驗(yàn)誤差方差,在這種情況下,采用方差分析對(duì)因子進(jìn)行顯著性檢驗(yàn)會(huì)產(chǎn)生一定的誤差,且檢驗(yàn)犯第一類錯(cuò)誤的概率可能與顯著性水平產(chǎn)生偏離.
在實(shí)際試驗(yàn)中經(jīng)常遇到試驗(yàn)因子的水平數(shù)不相等的情況,這種情況下實(shí)施試驗(yàn)需要用到混水平正交設(shè)計(jì).混水平正交設(shè)計(jì)因?yàn)槠潇`活的水平組合在各種混水平試驗(yàn)中得到非常廣泛的應(yīng)用[1].
本文在不同處理組合下試驗(yàn)誤差方差不等的情況下,考察混水平正交試驗(yàn)因子的顯著性檢驗(yàn)問題,從方差分析中F統(tǒng)計(jì)量的構(gòu)造給出新的檢驗(yàn)統(tǒng)計(jì)量,利用隨機(jī)模擬的方法獲得相應(yīng)的臨界值,分別通過傳統(tǒng)的F檢驗(yàn)與新檢驗(yàn)方法檢驗(yàn)各因子效應(yīng)的顯著性,模擬結(jié)果表明在試驗(yàn)誤差方差不等時(shí)F檢驗(yàn)犯第一類錯(cuò)誤的概率嚴(yán)重偏離顯著性水平,新的檢驗(yàn)方法犯第一類錯(cuò)誤的概率更精確.
對(duì)2水平正交表L8(27)通過并列法改造可以得到混水平正交表L8(4×24),由于4水平因子的自由度為3,因此在2水平正交表中應(yīng)該占3列,這3列的選法是:任取2列再加上其交互作用列,由此3列組成一個(gè)4水平列,4水平的對(duì)應(yīng)法則如下:將任取的2列的4個(gè)數(shù)對(duì)對(duì)應(yīng)4個(gè)水平,即:(1,1)→1,(1,2)→2,(2,1)→3,(2,2)→4.
此時(shí)4個(gè)數(shù)對(duì)各出現(xiàn)兩次,不失一般性,取第1、2兩列加上其交互作用列第3列組成一個(gè)4水平列,經(jīng)過上述改造,即可得到混水平正交表L8(4×24)[1].
表1 L8(4×24)正交表
對(duì)2水平正交表L16(215)通過上述相同的方法改造可以得到混水平正交表L16(4×212),此時(shí)4個(gè)數(shù)對(duì)各出現(xiàn)四次,不失一般性,仍取第1、2兩列加上其交互作用列第3列組成一個(gè)4水平列,經(jīng)過上述改造,即可得到混水平正交表L16(4×212).
表2 L16(4×212)正交表
還可將2水平正交表L16(215)改造成混水平正交表L16(8×28),由于8水平因子的自由度為7,因此在2水平正交表中應(yīng)占7列,這7列的選法是:任取3列獨(dú)立列再加上其交互作用列,由此7列組成一個(gè)八水平列,八水平的對(duì)應(yīng)法則如下:將任取的3列的8個(gè)數(shù)對(duì)對(duì)應(yīng)8個(gè)水平,即:
(1,1,1)→1,(1,1,2)→2,(1,2,1)→3,(1,2,2)→4,
(2,1,1)→5,(2,1,2)→6,(2,2,1)→7,(2,2,2)→8.
此時(shí)8個(gè)數(shù)對(duì)各出現(xiàn)2次,不失一般性,取第1、2、4列加上其交互作用列第3、5、6、7列組成一個(gè)8水平列,經(jīng)過上述改造,即可得到混水平正交表L16(8×28).
表3 L16(8×28)正交表
1.2.1 統(tǒng)計(jì)模型
考慮因子的水平數(shù)不等的等重復(fù)試驗(yàn),利用正交表進(jìn)行試驗(yàn)設(shè)計(jì),設(shè)正交表為Ln(qp),假設(shè)有n個(gè)處理組合,在同一處理組合下重復(fù)進(jìn)行m次試驗(yàn).考慮如下線性統(tǒng)計(jì)模型
yij=ui+εij,i=1,…,n,j=1,…,m,
1.2.2 顯著性檢驗(yàn)
為檢驗(yàn)各因子的效應(yīng)是否顯著,對(duì)如下假設(shè)作出檢驗(yàn)
由于存在重復(fù)試驗(yàn),因此如果把每一處理組合下的數(shù)據(jù)結(jié)果看作一個(gè)組,則組內(nèi)的平方和反應(yīng)的是純誤差,可用組內(nèi)平方和度量
fk=q-1,
由Cochran定理知,當(dāng)原假設(shè)成立即因子的效應(yīng)為0,并且各試驗(yàn)誤差的方差相等時(shí),S內(nèi)/σ2~χ2(n(m-1)),Sk/σ2~χ2(p-1),且S內(nèi)與Sk相互獨(dú)立,故
當(dāng)統(tǒng)計(jì)量Fk≥F1-α(p-1,n(m-1))時(shí),認(rèn)為在顯著性水平α下因子是顯著的,即認(rèn)為該因子的效應(yīng)不為0,其中F1-α是相應(yīng)自由度的F分布的1-α分位數(shù)[1].
由于改造后的表仍是正交表,設(shè)計(jì)仍是正交設(shè)計(jì),因此,平方和分解式與方差分析與改造前相同,并且可以用改造前的正交表計(jì)算混水平試驗(yàn)的各列平方和,只需按表頭設(shè)計(jì)計(jì)算因子在改造前的正交表中所占列的平方和.
方差分析是對(duì)因子進(jìn)行顯著性檢驗(yàn)的常用方法,然而方差分析需要假定不同處理組合下具有相同的試驗(yàn)誤差方差,由于試驗(yàn)在實(shí)際操作時(shí)環(huán)境復(fù)雜,因此在不同的處理組合下會(huì)有不同的試驗(yàn)誤差方差,在這種情況下,采用方差分析的方法對(duì)因子進(jìn)行顯著性檢驗(yàn)會(huì)產(chǎn)生一定的誤差,且檢驗(yàn)犯第一類錯(cuò)誤的概率可能與顯著性水平產(chǎn)生偏離,從而因子的顯著性檢驗(yàn)容易發(fā)生誤判,為此,從F統(tǒng)計(jì)量的構(gòu)造出發(fā)給出新的檢驗(yàn)統(tǒng)計(jì)量,并采用隨機(jī)模擬的方法獲得相應(yīng)的臨界值.
將F統(tǒng)計(jì)量變形得到
此時(shí)Fk的分子服從χ2(1),接下來考慮Fk分母的分布.注意到
因此可以將Fk的分母變形為
由上述推導(dǎo)過程可知,在原假設(shè)成立的條件下,當(dāng)不同處理組合下試驗(yàn)誤差的方差不相等時(shí),變形后的F統(tǒng)計(jì)量的分子服從χ2(1),分母是以試驗(yàn)誤差方差為權(quán)重的n個(gè)χ2(m-1)的加權(quán)和.
對(duì)于由2水平正交表改造的混水平正交試驗(yàn),可以采用改造前的正交表計(jì)算各列平方和,只需按表頭設(shè)計(jì)將因子在改造前的正交表中所占列的平方和相加,由卡方分布的可加性知,變形后的F統(tǒng)計(jì)量分子服從χ2(a),其中卡方分布的自由度a取決于因子在改造前的正交表中所占列的列數(shù),分母的分布保持不變.
顯然,此時(shí)的檢驗(yàn)統(tǒng)計(jì)量不再服從F分布,如果仍用F1-α(p-1,n(m-1))作為顯著性檢驗(yàn)的臨界值是不合理的,因子的顯著性也容易發(fā)生誤判,由于檢驗(yàn)統(tǒng)計(jì)量的精確分布很難確定,因此采用隨機(jī)模擬的方法來確定檢驗(yàn)的臨界值,隨機(jī)模擬過程如下:
步驟2 對(duì)于l=1,…,M;
步驟2.1 生成一個(gè)χ2(a)的隨機(jī)變量Ul;
步驟2.2 生成n個(gè)相互獨(dú)立的χ2(m-1)的隨機(jī)變量Vl1,…,Vln;
步驟2.3 計(jì)算檢驗(yàn)統(tǒng)計(jì)量
步驟3 取顯著性水平α,計(jì)算檢驗(yàn)統(tǒng)計(jì)量的分位數(shù)qα.
以3個(gè)由2水平正交表改造的混水平正交表為例,在不同處理組合的試驗(yàn)誤差方差相等和不等兩種情況下,分別利用F檢驗(yàn)和改進(jìn)后的新檢驗(yàn)方法對(duì)因子的顯著性檢驗(yàn)進(jìn)行模擬對(duì)比,隨機(jī)模擬過程重復(fù)10 000次.
假設(shè)試驗(yàn)1需要考察5個(gè)因子A、B、C、D、E的顯著性,其中因子A是4水平因子,因子B、C、D、E是4個(gè)2水平因子,為此,選用混合水平正交表L8(4×24)進(jìn)行試驗(yàn),置因子A在正交表的4水平列上,即由正交表L8(27)的第1,2,3列組成的列,再將因子B、C、D、E安排在剩余的2水平列上,表頭設(shè)計(jì)如表4.
表4 試驗(yàn)1的表頭設(shè)計(jì)
假設(shè)不同處理組合下的試驗(yàn)誤差具有相同的方差2,總平均為10,因子A與因子D是顯著因子,并且βA=0.4,βD=0.65,因子B、C、E均為不顯著因子,即因子B、C、E的效應(yīng)為0,因此試驗(yàn)1的統(tǒng)計(jì)模型為yij~N(10+0.4A+0.65D,2),其中A和D根據(jù)因子的水平組合取±1.假設(shè)在同一處理組合下重復(fù)進(jìn)行若干次試驗(yàn),取顯著性水平為0.05,分別利用F檢驗(yàn)與改進(jìn)后的新檢驗(yàn)方法來檢驗(yàn)各因子效應(yīng)的顯著性,得到拒絕原假設(shè)的百分比,如表5所示.
表5 試驗(yàn)1在5%水平下拒絕原假設(shè)的百分比
假設(shè)試驗(yàn)2需要考察因子A、B、C、D、E、F、G的顯著性,其中因子A是4水平因子,因子B、C、D、E、F、G是二水平因子,假定根據(jù)專業(yè)知識(shí)還需考察交互作用A×B與A×C,為此,選用混合水平正交表L16(4×212)進(jìn)行試驗(yàn).
置因子A在正交表的4水平列上,即由正交表L16(215)的第1,2,3列組成的列,再將因子B安排在第4列,交互作用A×B安排在第5,6,7列,即由因子A在L16(215)所占的3列與B所在列的交互列組成的列,再將因子C安排在第8列,交互作用A×C安排在第9,10,11列,最后將因子D、E、F、G依次安排在剩余的列,綜上可得表頭設(shè)計(jì)如表6.
表6 試驗(yàn)2的表頭設(shè)計(jì)
假設(shè)不同處理組合下的試驗(yàn)誤差具有相同的方差2,總平均為10,因子A、B以及交互作用A×B與A×C顯著,并且各個(gè)顯著因子的效應(yīng)分別為βA=0.3,βB=0.55,βA×B=0.35,βA×C=0.2,因子D、E、F、G均為不顯著因子,因此,試驗(yàn)2的統(tǒng)計(jì)模型為yij~N(10+0.3A+0.55B+0.35AB+0.2AC,2),其中A、B、AB及AC根據(jù)因子的水平組合取±1,取顯著性水平0.05,分別利用F檢驗(yàn)與改進(jìn)后的新檢驗(yàn)方法來檢驗(yàn)各因子效應(yīng)的顯著性,得到拒絕原假設(shè)的百分比,如表7所示.
表7 試驗(yàn)2在5%水平下拒絕原假設(shè)的百分比
假設(shè)試驗(yàn)3需要考察因子A、B、C、D、E、F、G的顯著性,其中因子A是8水平因子,因子B、C、D、E、F、G是2水平因子,假定試驗(yàn)不需要考察交互作用,為此,選用混合水平正交表L16(8×28)進(jìn)行試驗(yàn).置因子A在正交表的八水平列上,再將因子B、C、D、E、F、G依次安排在2~7列,可得表頭設(shè)計(jì)如表8.
表8 試驗(yàn)3的表頭設(shè)計(jì)
假設(shè)不同處理組合下的試驗(yàn)誤差具有相同的方差2,總平均為10,僅因子A是顯著因子,且因子A的效應(yīng)為βA=0.2,因子B、C、D、E、F、G均為不顯著因子,即因子的效應(yīng)為0,因此,試驗(yàn)3的統(tǒng)計(jì)模型為yij~N(10+0.2A,2),其中A根據(jù)因子的水平組合取±1,取顯著性水平為0.05,分別利用F檢驗(yàn)與改進(jìn)后的檢驗(yàn)方法來檢驗(yàn)各因子效應(yīng)的顯著性,得到拒絕原假設(shè)的百分比,如表9所示.
表9 試驗(yàn)3在5%水平下拒絕原假設(shè)的百分比
由表5、表7、表9的模擬結(jié)果對(duì)比可知,當(dāng)不同處理組合下的試驗(yàn)誤差方差相等時(shí),傳統(tǒng)的F檢驗(yàn)與改進(jìn)后的新檢驗(yàn)方法犯第一類錯(cuò)誤的概率均接近顯著性水平0.05,且隨著重復(fù)次數(shù)的增加犯第一類錯(cuò)誤的概率相對(duì)穩(wěn)定.綜上,在試驗(yàn)誤差方差相等的情況下,對(duì)混水平正交試驗(yàn)因子的顯著性作檢驗(yàn),改進(jìn)后的新檢驗(yàn)方法與F檢驗(yàn)均有較精準(zhǔn)的誤差控制.
假定試驗(yàn)4與試驗(yàn)1所考察的因子以及因子效應(yīng)的大小相同,但試驗(yàn)4在不同處理組合下的試驗(yàn)誤差方差不相等,即試驗(yàn)誤差方差與處理組合有關(guān).假定試驗(yàn)4的試驗(yàn)誤差方差受因子B、C、D的影響,且其系數(shù)分別為0.5、0.55、0.4,則試驗(yàn)4的統(tǒng)計(jì)模型為
yij~N(10+0.4A+0.65D,
exp(0.5B+0.55C+0.4D)),
取顯著性水平0.05,分別利用F檢驗(yàn)與改進(jìn)后的新檢驗(yàn)方法來檢驗(yàn)各因子效應(yīng)的顯著性,得到拒絕原假設(shè)的百分比,模擬對(duì)比的結(jié)果如表10所示.
表10 試驗(yàn)4在5%水平下拒絕原假設(shè)的百分比
假定試驗(yàn)5與試驗(yàn)2所考察的因子以及因子效應(yīng)的大小相同,但試驗(yàn)5在不同處理組合下的試驗(yàn)誤差方差不相等,即試驗(yàn)誤差方差與處理組合有關(guān).假定試驗(yàn)5的試驗(yàn)誤差方差受因子A、C以及交互作用A×B的影響,且其系數(shù)分別為0.45、0.25、0.5,則試驗(yàn)5的統(tǒng)計(jì)模型
yij~N(10+0.3A+0.55B+0.35AB+0.2AC,
exp(0.45A+0.25C+0.5AB)),
取顯著性水平0.05,分別利用F檢驗(yàn)與改進(jìn)后的新檢驗(yàn)方法來檢驗(yàn)各因子效應(yīng)的顯著性,得到拒絕原假設(shè)的百分比,模擬對(duì)比的結(jié)果如表11所示.
表11 試驗(yàn)5在5%水平下拒絕原假設(shè)的百分比
假定試驗(yàn)6與試驗(yàn)3所考察的因子以及因子效應(yīng)的大小相同,但試驗(yàn)6在不同處理組合下的試驗(yàn)誤差方差不相等,即試驗(yàn)誤差方差與處理組合有關(guān).假定試驗(yàn)6的試驗(yàn)誤差方差僅受因子A的影響,且其系數(shù)為0.45,則試驗(yàn)6的統(tǒng)計(jì)模型
yij~N(10+0.2A,exp(0.45A)),
則在顯著性水平0.05下,分別利用F檢驗(yàn)與改進(jìn)后的新檢驗(yàn)方法來檢驗(yàn)各因子效應(yīng)的顯著性,得到拒絕原假設(shè)的百分比,模擬對(duì)比的結(jié)果如表12所示.
表12 試驗(yàn)6在5%水平下拒絕原假設(shè)的百分比
由表10~表12的模擬結(jié)果對(duì)比可知,當(dāng)不同處理組合下的試驗(yàn)誤差方差不相等時(shí),傳統(tǒng)的F檢驗(yàn)犯第一類錯(cuò)誤的概率嚴(yán)重偏離0.05,從而因子效應(yīng)的顯著性容易發(fā)生誤判,改進(jìn)后的新檢驗(yàn)方法犯第一類錯(cuò)誤的概率幾乎接近顯著性水平0.05,且隨著重復(fù)次數(shù)的增加犯第一類錯(cuò)誤的概率更穩(wěn)定.綜上,在試驗(yàn)誤差方差不等的情況下,對(duì)混水平正交試驗(yàn)因子的顯著性作檢驗(yàn),改進(jìn)后的新檢驗(yàn)方法比F檢驗(yàn)有更精準(zhǔn)的誤差控制.
因子設(shè)計(jì)在各類試驗(yàn)中應(yīng)用相當(dāng)廣泛,用于研究各因子對(duì)試驗(yàn)指標(biāo)是否具有顯著影響.在實(shí)際問題中,影響試驗(yàn)指標(biāo)的因子往往有多個(gè),要考察它們就要用到多因子試驗(yàn)設(shè)計(jì),正交設(shè)計(jì)就是安排多因子試驗(yàn)的一種高效的試驗(yàn)設(shè)計(jì)方法.方差分析中的F檢驗(yàn)是對(duì)因子進(jìn)行顯著性檢驗(yàn)的常用方法,然而方差分析需要假定不同處理組合下具有相同的試驗(yàn)誤差方差,由于試驗(yàn)在實(shí)際操作時(shí)環(huán)境復(fù)雜,因此在不同的處理組合下會(huì)有不同的試驗(yàn)誤差方差,在這種情況下,采用方差分析對(duì)因子進(jìn)行顯著性檢驗(yàn)會(huì)產(chǎn)生一定的誤差.
為此,從方差分析中F統(tǒng)計(jì)量的構(gòu)造給出新的檢驗(yàn)統(tǒng)計(jì)量,通過隨機(jī)模擬的方法獲得相應(yīng)的臨界值,以3個(gè)混水平正交表為例,在不同處理組合的試驗(yàn)誤差方差相等和不等兩種情況下,分別利用F檢驗(yàn)和改進(jìn)后的新檢驗(yàn)方法對(duì)因子的顯著性檢驗(yàn)進(jìn)行模擬對(duì)比,得到結(jié)論如下:
當(dāng)不同處理組合下的試驗(yàn)誤差方差相等時(shí),考察等重復(fù)的混水平正交試驗(yàn)的因子顯著性檢驗(yàn)問題,傳統(tǒng)的F檢驗(yàn)與改進(jìn)后的新檢驗(yàn)方法犯第一類錯(cuò)誤的概率均接近顯著性水平0.05,且隨著重復(fù)次數(shù)的增加犯第一類錯(cuò)誤的概率相對(duì)穩(wěn)定,改進(jìn)后的新檢驗(yàn)方法與F檢驗(yàn)均有較精準(zhǔn)的誤差控制.當(dāng)不同處理組合下的試驗(yàn)誤差方差不相等時(shí),傳統(tǒng)的F檢驗(yàn)犯第一類錯(cuò)誤的概率嚴(yán)重偏離0.05,從而因子效應(yīng)的顯著性容易發(fā)生誤判,改進(jìn)后的新檢驗(yàn)方法犯第一類錯(cuò)誤的概率幾乎接近顯著性水平0.05,且隨著重復(fù)次數(shù)的增加犯第一類錯(cuò)誤的概率更穩(wěn)定,因此,改進(jìn)后的新檢驗(yàn)方法比F檢驗(yàn)?zāi)芨珳?zhǔn)的控制檢驗(yàn)誤差.
綜上可知,F(xiàn)檢驗(yàn)對(duì)方差齊性的偏離較為敏感,在考察等重復(fù)的混水平正交試驗(yàn)因子的顯著性檢驗(yàn)問題時(shí),方差齊性檢驗(yàn)十分必要,若不同處理組合下的試驗(yàn)誤差方差不全相等,則應(yīng)采用提出的新檢驗(yàn)方法判斷因子效應(yīng)的顯著性,否則會(huì)產(chǎn)生一定誤差.