許利可, 范永輝
(天津師范大學 數(shù)學科學學院, 天津 300387)
非平衡異方差單向分類模型中的廣義置信區(qū)間
許利可*, 范永輝
(天津師范大學 數(shù)學科學學院, 天津 300387)
討論了在單向分類模型中多個正態(tài)總體樣本容量不等, 方差不等時樣本均值的同時廣義置信區(qū)間的估計問題. 結(jié)合Scheffe 和Bonferroni 區(qū)間的定義, 給出了相應的廣義檢驗變量及廣義樞軸量, 進而求得樣本均值的同時廣義置信區(qū)間, 并且通過數(shù)據(jù)模擬, 和文獻[1]中給出的方法比較, 本文所給方法具有較好的可行性.
廣義樞軸量; 廣義置信區(qū)間; 單向分類模型
H0:μ1=μ2= …=μa?
H1:μ1,μ2, … ,μa不全相等.
(1)
如果否定了H0, 我們會繼續(xù)考慮某些總體期望兩兩之間的差異性, 即考慮一些μi-μj(i 本文考慮在多個正態(tài)總體下樣本容量不等且方差不等時正態(tài)均值的同時置信區(qū)間的估計問題, 并在廣義檢驗變量, 廣義樞軸量, 廣義置信區(qū)間定義的基礎(chǔ)之上, 結(jié)合王松桂[2]給出的Scheffe和Bonferroni區(qū)間的定義及構(gòu)造方法, 給出了類似方法構(gòu)造的廣義檢驗變量和廣義樞軸量, 進而解得樣本均值的同時廣義置信區(qū)間.并且通過數(shù)據(jù)模擬容易看出, 由Scheffe區(qū)間的定義構(gòu)造的廣義樞軸量找出的置信域的覆蓋率接近預先給定的值, 并具有較好的穩(wěn)定性. 由Bonferroni區(qū)間的定義構(gòu)造的廣義樞軸量找出的置信區(qū)間在覆蓋率和區(qū)間長度上都明顯優(yōu)于文獻[1]中給出的方法, 因此具有較好的可行性. 首先介紹廣義p值, 廣義檢驗變量和廣義樞軸量的概念. 設X為一組隨機變量,x是X的觀測值,θ是我們感興趣的參數(shù),η是冗余參數(shù), 且η可為參數(shù)向量. 假設要檢驗的問題是 H0:θ≤θ0?H1:θ>θ0, (2) 其中θ0為預先給定的值. 定義1(廣義檢驗變量[10]). 設T(X,x,θ,η) 為隨X機變量,X的觀測值x, 以及參數(shù)(θ,η)的函數(shù). 若T滿足 1)T(X,x,θ0,η) 的分布與冗余參數(shù)無關(guān); 2)T(X,x,θ,η) 的觀測值T(x,x,θ,η) 與未知參數(shù)無關(guān); 3) 對固定的x和η,T(X,x,θ,η)的分布關(guān)于θ隨機單調(diào)增或隨機單調(diào)減. 則稱T(X,x,θ,η) 為一個廣義檢驗變量. 當T(X,x,θ,η)的分布關(guān)于θ隨機單調(diào)增時, 對于檢驗問題(1)定義廣義p值為 p=Pr(T(X,x,θ,η)≥T(x,x,θ,η)|θ=θ0). 當T(X,x,θ,η)的分布關(guān)于θ隨機單調(diào)減時, 對于檢驗問題(1)定義廣義p值為 p=Pr(T(X,x,θ,η)≤T(x,x,θ,η)|θ=θ0). 對于給定顯著性水平α, 如果p<α, 則拒絕原假設, 反之接受. 定義2(廣義樞軸量[11]). 設R(X,x,θ,η)為隨機變量X,X的觀測值x, 及參數(shù)(θ,η)的函數(shù). 若R滿足 1)R(X,x,θ,η)的分布與未知參數(shù)無關(guān); 2)R(X,x,θ,η)的觀測值R(x,x,θ,η)與冗余參數(shù)無關(guān). 則稱R(X,x,θ,η)為一個廣義樞軸量. 廣義置信區(qū)間可以利用R(X,x,θ,η)來構(gòu)造. 對給定一個置信水平1-α, 如果有樣本空間的一個子集Cα,滿足Pr(R∈Cα)=α,則稱Θc(α)={θ∈Θ|R(x,x,θ,η)∈Cα}為θ的置信系數(shù)為1-α的廣義置信區(qū)間. 更多關(guān)于廣義檢驗變量和廣義置信區(qū)間的內(nèi)容可參見Tusi和Weerahandi[10]和Weerahandi[11]. 考慮非平衡異方差單向分類模型: i=1, …,a,j=1, …,ni. (3) 對于該模型, 我們首先考慮的是假設檢驗問題(1). 若拒絕了H0, 即我們會進一步考慮不同的μi之間的差異情況, 一般是考慮μi-μj(i≠j) 的置信區(qū)間. 在模型(3)中, 令 (i=1, …,a), (4) 則易知 (i=1, …,a), (5) 對于假設檢驗問題(1), 本節(jié)結(jié)合王松桂[2]給出的Scheffe區(qū)間的定義及構(gòu)造方法, 給出針對于檢驗問題(1)的廣義檢驗變量, 并且如果否定了H0, 繼續(xù)考慮樣本總體期望兩兩之間的差異性, 即考慮一些μi-μj(i 沿用上一節(jié)的估計及記號, 令 (6) 下面先給出廣義檢驗變量, 定義 (7) 3) 對于固定的y,σ2,T11關(guān)于Hμ隨機單調(diào)增. 因而(7)式定義的T11是廣義檢驗變量. 因為μ和零向量差異越多,T11越傾向于取比較大的值, 所以廣義p值為:p=P(T11>t11). 對于給定的顯著性水平α, 當p<α時拒絕檢驗(1)的原假設, 即認為Hμ≠0. 記ei是第i個分量為1, 其余分量全為0的列向量,i=1, 2, …,a. 對任意i≠j,μi-μj=(ei-ej)′μ. 因ei-ej∈M(H′), 考慮所有的l′μ,l∈M(H′)的同時置信區(qū)間.先給出如下引理. 引理1設α,β均為n×1 的向量,A為n×n的正定方陣, 則 (8) 引理易從Cauchy-Schwardz不等式(α′β)2≤(α′A-1α)(β′Aβ) 推出. 下面構(gòu)造廣義樞軸量, 定義 (9) 因而(9)式定義的T12是廣義樞軸量, 可由此來構(gòu)造μi-μj(i (10) 故對于β′Hμ, 它的置信系數(shù)為1-γ的同時置信區(qū)間為 (11) 假設Φ=H1μ=(h′1μ, …,h′mμ)′為m個線性無關(guān)的可估函數(shù), 其中rk(H1)=m, 現(xiàn)要求m個可估函數(shù)h′iμ,i=1, …,m的同時置信區(qū)間, 對每一個h′iμ作置信系數(shù)為1-γ的置信區(qū)間Ii, 這樣雖然每個Ii包含h′iμ的概率是1-γ, 但h′iμ∈Ii,i=1, …,m的同時成立的概率(即置信系數(shù))卻不再是1-γ, 一般比1-γ較小. 現(xiàn)設Ei,i=1, …,m為m個隨機事件,P(Ei)=1-γ,i=1, …,m. 則根據(jù)Bonferroni不等式: (12) 易得P(h′iμ∈Ii,i=1,…,m)≥1-mγ. 當m較大時, 這個概率的下界可以很小, 為克服這一缺陷, 把求h′iμ置信系數(shù)為1-γ的置信區(qū)間Ii, 改為求h′iμ置信系數(shù)為1-γ/m的置信區(qū)間Ii, 從而每個Ii包含h′iμ的概率提高到了1-γ/m. 一般地, 把用這種方法求得可估函數(shù)的同時置信區(qū)間稱為Bonferroni 區(qū)間. Weerahandi[10]已經(jīng)給出了關(guān)于兩樣本均值的廣義檢驗變量, 現(xiàn)在根據(jù)Weerahandi[11]給出如下廣義樞軸量: (13) (14) (15) 則(15)式的分布與下面的式子相同 (16) 由上述易知: 1)Tkl的分布與未知參數(shù)無關(guān); 因而(13)式定義的Tkl是廣義樞軸量, 可由此來構(gòu)造檢驗μk-μl的廣義置信區(qū)間, 其中k≠l. 本節(jié)將對檢驗問題(1), 首先考慮檢驗問題(1)的變形, 即H0:Hμ=0vsH1:Hμ≠0, 且當Hμ≠0成立時, 結(jié)合廣義樞軸量T12, 考慮Hμ的置信域, 給出Hμ廣義置信域覆蓋率的模擬結(jié)果; 其次結(jié)合廣義樞軸量Tkl(k,l=1, 2, …,a且k≠l), 得出μk-μl廣義置信區(qū)間長度及其覆蓋率的模擬結(jié)果. 模擬方法: 2) 然后進行3 000次內(nèi)循環(huán), 每次生成3個正態(tài)分布樣本和一組自由度分別為ni的卡方分布樣本, 根據(jù)以上生成的樣本和(9)式, 計算出一組T12的值, 然后找出T12的1-γ/2分位點, 從而得到Hμ的一個置信域, 將此置信域記為Θc1; 3) 最后根據(jù)第2步找出的Hμ的一個置信域Θc1, 統(tǒng)計第1步中由觀測值t12計算出的Hμ落在Θc1中的頻數(shù), 計算出廣義置信域的覆蓋率. 表1 基于Scheffe區(qū)間定義構(gòu)造出的Hμ的廣義置信域的覆蓋率 表2, 表3分別給出了由文中基于Bonferroni區(qū)間的定義構(gòu)造的廣義樞軸量Tkl和文獻[1] 中方法計算出的μk-μl(k,l=1, 2, …,a且k≠l) 的置信系數(shù)分別為0.9和0.95的置信區(qū)間長度lkl及其覆蓋率的模擬結(jié)果, 這里不妨把文獻[1] 中方法稱為F法,即對于兩個均值不等方差相等的獨立正態(tài)樣本, 結(jié)合F分布的一些性質(zhì), 構(gòu)造出的針對于兩樣本均值和方差的F分布, 然后利用F檢驗法求兩正態(tài)樣本均值差相等性的檢驗方法. 表2 基于Bonferroni方法和F法得出的μk-μl置信系數(shù)為0.9廣義置信區(qū)間長度及覆蓋率 表3 基于Bonferroni方法和F法得出的μk-μl置信系數(shù)為0.95廣義置信區(qū)間長度及覆蓋率 模擬方法: 2) 然后做4 000次內(nèi)循環(huán), 根據(jù)以上生成的樣本和(16)式, 計算出一組Tkl的值, 然后找出Tkl的γ/2分位點和1-γ/2分位點, 從而得到μk-μl的一個廣義置信區(qū)間, 將此廣義置信區(qū)間記為Θc2; 本文研究了在單向分類模型中多個正態(tài)總體樣本容量不等, 方差不等時樣本均值相等性檢驗問題.并在樣本均值不等時, 給出了廣義檢驗變量及廣義樞軸量, 并通過所給出的廣義樞軸量, 模擬出樣本均值的同時廣義置信區(qū)間及其覆蓋率. 由模擬結(jié)果可以看出, 根據(jù)Scheffe區(qū)間的定義構(gòu)造的廣義樞軸量找出的Hμ廣義置信域的覆蓋率接近預先給定的值, 且具有較好的穩(wěn)定性; 根據(jù)Bonferroni 區(qū)間的定義構(gòu)造的廣義樞軸量找出的μk-μl(k,l=1, 2, …,a且k≠l)的同時廣義置信區(qū)間的覆蓋率接近由Bonferroni 方法確定的區(qū)間覆蓋率, 并且通過與文獻[1]中方法計算出的區(qū)間長度比較, 很容易看出基于Bonferroni 方法確定的區(qū)間長度遠小于文獻[1]中方法計算出的區(qū)間長度, 而由文獻[1]構(gòu)造出置信區(qū)間的覆蓋率雖然接近預先給定的值, 但從總體的區(qū)間覆蓋率來說遠低于預先給定的值. 綜上說明了本文所提供的方法很好的解決了求多個正態(tài)總體樣本均值的同時置信區(qū)間問題. [1] 高 峰, 郭 云. 正態(tài)總體均值的F檢驗法[J].淮陰工學院學報, 2005,14(5): 6-7. [2] 王松桂, 史建紅, 尹素菊, 等. 線性模型引論[M].北京: 科學出版社, 2004. [3] 梅長林, 范金城. 數(shù)據(jù)分析方法[M].北京: 高等教育出版社, 2006. [4] 茆詩松, 王靜龍, 濮曉龍. 高等數(shù)理統(tǒng)計[M].北京: 高等教育出版社, 2006. [5] WELCH B L. The significance of the difference between two means when the population variances are unequal[J].Biometrika, 1938,29(3): 350-362. [6] 宋立新. 一類Behrens-Fisher檢驗問題的解法[J].汕頭大學學報(自然科學版), 2013,28(3): 36-39. [7] 徐禮文, 梅 波. Behrens-Fisher問題的參數(shù)Bootstrap檢驗[J].統(tǒng)計與決策, 2015(10): 23-27. [8] GAMAGE J K. Generalized p-values and the multivariate Behrens-Fisher problem[J]. Linear Algebra & Its Applications, 1997,253(1): 369-377. [9] 許家清. Behrens-Fisher 問題的廣義置信區(qū)間[J].統(tǒng)計與決策, 2011(2): 29-30. [10] TSUI K W, WEERAHANDI S. Generalized p-Values in significance testing of hypotheses in the presence of nuisance parameters[J]. Journal of the American Statistical Association, 1989,84(406): 602-607. [11] WEERAHANDI S. Generalized confidence intervals[J]. Journal of the American Statistical Association, 1993,88(423):899-905. [12] KRISHNAMOORTHY K, LU Y. Inferences on the common mean of several normal populations based on the generalized variable method[J]. Biometrics, 2003,59(2): 237-247. [13] CHANG C H, PAL N. Testing on the common mean of several normal distributions[J]. Computational Statistics & Date Analysis, 2008,53(2): 321-333. [14] 王 琰, 李樹有, 宓 穎. 多個正態(tài)總體均值相等性檢驗方法的模擬比較[J].東北師大學報(自然科學版), 2012,44(4): 10-15. Thegeneralizedconfidenceregionsintheone-wayclassificationmodelofunbalancedheteroscedasticity XU Like, FAN Yonghui (College of Mathematical Science, Tianjin Normal University, Tianjin 300387, China) The paper discusses the simultaneous generalized confidence regions of means estimation of multiple normal populations which means and variances are all different. With the definition of Scheffe and Bonferroni intervals, the paper gives the relevant generalized test variable and generalized pivotal quantity and acquires the simultaneous generalized confidence regions of population means, and through the date simulation and compared with the methods given in literature[1],the method given in this paper is good feasible. generalized pivotal quantity; generalized confidence regions; one-way classification model 2017-06-27. 國家自然科學基金項目(41272245). *E-mail: 1660469349@qq.com. 10.19603/j.cnki.1000-1190.2017.06.004 1000-1190(2017)06-0747-07 O212.1 A1 預備知識
2 問題簡介
3 正態(tài)總體均值的相等性檢驗和置信區(qū)間
3.1 基于Scheffe方法的廣義檢驗及同時置信區(qū)間
3.2 基于Bonferroni方法的廣義置信區(qū)間
4 模擬結(jié)果和模擬方法
4.1 基于Scheffe區(qū)間的定義構(gòu)造出廣義置信域的模擬結(jié)果
4.2 基于Bonferroni方法構(gòu)造的廣義置信區(qū)間的模擬結(jié)果
5 總結(jié)