劉 明
異方差White檢驗應(yīng)用的幾個問題
劉 明a,b
(蘭州商學(xué)院a.統(tǒng)計學(xué)院;b.甘肅經(jīng)濟發(fā)展數(shù)量分析研究中心,甘肅蘭州730020)
White檢驗通常由LM檢驗來完成,現(xiàn)實中也可以使用更簡單的F檢驗來替代LM檢驗;White檢驗過程中需要構(gòu)筑輔助回歸模型,它可以有不同的形式以應(yīng)對實際問題的需要;討論了四類不同的輔助回歸模型,理論分析表明,它們在應(yīng)用中各有所長;最后通過一個實際例子,驗證了理論分析的結(jié)論,展示了White檢驗應(yīng)用的靈活性。
異方差;White檢驗;輔助回歸模型
異方差是計量經(jīng)濟學(xué)中所討論的一個重要問題,異方差的檢驗方法在異方差問題的討論中居于核心地位。在線性回歸模型中,異方差的檢驗方法有很多,依據(jù)不同的前提條件,這些檢驗又各有所倚。在諸多異方差檢驗方法中,最有效、最常用的當屬White檢驗了,這種檢驗方法提出以后,以其快捷的檢驗過程和有效的檢驗結(jié)論而得到廣大學(xué)者的認可,并迅速成為異方差檢驗的經(jīng)典方法。筆者在計量經(jīng)濟學(xué)課程教學(xué)過程中發(fā)現(xiàn),White檢驗是初學(xué)者的一個學(xué)習(xí)難點,很多初學(xué)者只懂得White檢驗的思路和方法,而不會對其加以靈活應(yīng)用。本文將對White檢驗的使用技巧進行總結(jié)提煉,為初學(xué)者提供學(xué)習(xí)便利,為研究者提供借鑒。
White檢驗是Halbert White在1980年提出的,他在隨機項存在異方差的情形下,構(gòu)造出參數(shù)估計量方差協(xié)方差矩陣的一致估計,并根據(jù)這個估計結(jié)果,導(dǎo)出了一個服從χ2分布的統(tǒng)計量,即拉格朗日乘數(shù)(LM),用此統(tǒng)計量可完成異方差的檢驗[1]。在統(tǒng)計學(xué)中,通過構(gòu)造LM統(tǒng)計量進行的檢驗也可簡稱為LM檢驗。為避免繁雜的數(shù)學(xué)推導(dǎo)公式,這里借用普通教科書中的關(guān)于White檢驗的表述內(nèi)容,并以此作為討論的開始。對于更嚴謹?shù)?、一般化的論述,可參見Halbert White所述[1]。
White檢驗基于這樣的一個前提:隨機干擾項的異方差和解釋變量有關(guān)。經(jīng)驗證明這是合乎實際的。以二元線性回歸模型為例的White檢驗方法如下[2]413-414:
設(shè)二元線性回歸模型:
該模型存在異方差:var(μi)=
第一步,構(gòu)造檢驗輔助回歸模型:
式(2)表明隨機項的方差受到解釋變量的影響。
第二步,提出假設(shè)H0∶αi=0,(i=1,2,3,4,5),即原模型不存在異方差;H1∶αi(i=1,2,3,4,5)不同時等于零,即原模型存在異方差。
第三步,估計輔助回歸模型。首先用OLS方法估計式(1)得到殘差ei并取平方得e2i,再利用e2i估計出輔助回歸模型。進一步計算出輔助回歸模型的多重可決系數(shù)R2。
第四步,構(gòu)造并計算檢驗統(tǒng)計量nR2,即拉格朗日乘數(shù)。該統(tǒng)計量服從自由度為約束條件個數(shù)的χ2分布。式中n為樣本容量,R2為輔助回歸模型的多重可決系數(shù)。此處約束條件個數(shù)為5。
第五步,做出檢驗決策。如果nR2大于χ2分布上自由度為5的上端100α%的臨界點χ2α(5),則拒絕原假設(shè)。
以上即為異方差White檢驗的基本過程。在現(xiàn)實應(yīng)用中,針對具體的情況和檢驗要求,可以做出不同的處理。下面將基于上述檢驗過程,討論在具體問題中如何靈活應(yīng)用White檢驗。
在實際問題中,White檢驗可以演化為不同的檢驗形式,在不同情形下對這些檢驗形式也有著不同的要求,下面對這些具體的檢驗方法做出分析。
(一)White檢驗中的統(tǒng)計檢驗方法
White檢驗通過構(gòu)建反映隨機項的方差和解釋變量之間關(guān)系的線性回歸模型即輔助回歸模型,并利用LM檢驗方法來檢驗輔助回歸模型的顯著性,依此判斷原模型是否存在異方差。這里使用的LM檢驗屬于χ2檢驗范疇。LM檢驗的對象是輔助回歸模型的偏回歸系數(shù)全部等于0,注意到輔助回歸模型是一個線性模型,由此可知,這里所檢驗的就是輔助回歸模型的整體顯著性,原假設(shè)可看成是輔助回歸模型的偏回歸系數(shù)等于零所形成的線性約束條件。對此,White在他的論文中使用了LM檢驗,而事實上,也可以用一個更為簡單的檢驗來替代,那就是F檢驗。
仍以上述二元回歸模型為例,針對輔助回歸模型所構(gòu)造的原假設(shè)仍然為αi=0(i=1,2,3,4,5),顯然,這5個線性約束條件表明所檢驗的是模型整體的顯著性,由此可以構(gòu)造F統(tǒng)計量:
其中ESS、RSS分別為輔助回歸模型的回歸平方和及剩余平方和,5、n-6分別為它們各自的自由度。接下來即可根據(jù)F檢驗方法來完成檢驗決策,因此用F檢驗替代LM檢驗亦可完成White檢驗。
(二)White檢驗中輔助回歸模型的構(gòu)造
在White檢驗中,構(gòu)造輔助回歸模型是檢驗的核心環(huán)節(jié),White在其論文中提出的輔助回歸模型在現(xiàn)實應(yīng)用中即為:用原始模型的殘差平方對原始模型中的解釋變量、解釋變量的平方和解釋變量的交叉乘積進行回歸所建立的回歸模型。在二元回歸中所構(gòu)建的輔助回歸模型如式(2)所示。這類輔助回歸模型涵蓋的信息全面,考慮到了異方差出現(xiàn)的多種可能途徑,同時對這些可能的出現(xiàn)途徑也有著明確的展示,在大樣本的前提下,用此類輔助回歸模型所得到的檢驗結(jié)論是極具說服力的。但是,這類輔助回歸模型由于待估參數(shù)較多而造成了模型自由度的損失,例如,在三元回歸模型的異方差檢驗中按上述方法構(gòu)建的輔助回歸模型的參數(shù)個數(shù)是10個,而在四元回歸模型中就達到了15個。在此情形下就會降低輔助回歸模型估計的精度,進而對檢驗結(jié)論造成不利影響。
為避免參數(shù)個數(shù)較多而造成的輔助回歸模型自由度損失的問題,可以考慮簡化輔助回歸模型,一般的做法是剔除模型中的解釋變量的交叉乘積項,從而減少了參數(shù)的個數(shù),降低自由度損失的影響。在二元回歸模型中,剔除交叉乘積項的輔助回歸模型為:
不難發(fā)現(xiàn)模型中參數(shù)的個數(shù)減少了一個。如果原模型中有更多的解釋變量,參數(shù)的個數(shù)會減少得更多。
繼續(xù)考察輔助回歸模型(2),其解釋變量是原回歸模型的解釋變量、解釋變量的平方和解釋變量的交叉乘積。如果考慮使用原回歸模型的解釋變量的線性組合來重新構(gòu)造輔助回歸模型,則又會產(chǎn)生一種新的構(gòu)造輔助回歸模型的辦法。以二元回歸模型為例,具體方法是:
首先估計出原始模型(1),得到殘差ei并進而得到e2i,同時得到被解釋變量Yi的估計值:
式(4)即為所構(gòu)造的輔助回歸模型。對于式(4)存在這樣兩個特點:一是參數(shù)個數(shù)較式(2)大幅減少,事實上,按此法構(gòu)建的輔助回歸模型的參數(shù)在任何情形下都只有3個;二是式(4)中的解釋變量囊括了式(2)中的所有解釋變量,只要將^Yi=^β0+^β1X1i+^β2X2i代入式(4)即可看出這一點。對模型(4)實施F檢驗或LM檢驗即可以完成White檢驗。
(三)White檢驗中輔助回歸模型的選擇
通過上述討論可以發(fā)現(xiàn),White檢驗中的輔助回歸模型可根據(jù)不同的研究視點構(gòu)造出式(2)、式(3)和式(4)三種形式,應(yīng)用中可根據(jù)不同的研究需要加以選擇。式(2)的優(yōu)點在于,涵蓋信息全面,能夠發(fā)現(xiàn)異方差變動的路徑,但模型中包括的參數(shù)較多,易造成自由度的損失,形成相應(yīng)的缺點;式(3)在一定程度上解決了自由度損失的問題,但由于丟失了一部分解釋變量而使得信息不夠全面——實際上是通過犧牲更多的信息來源,以彌補自由度的損失;式(4)解決了由于參數(shù)過多而造成的自由度損失的問題,提高了檢驗結(jié)果的可靠性,同時它也沒有從根本上丟棄交叉乘積項——它將所有的解釋變量都隱含在^Yi和^Y2i中了,但式(4)卻無法表述異方差和原模型解釋變量之間的具體聯(lián)系,同時,擬合的^Yi實際上相當于對X1、X2、X21、X22、X1X2等解釋變量形成了約束,進而使得式(4)估計結(jié)果的可靠性降低,不利于異方差進一步的解決。
根據(jù)上述三類輔助回歸模型的優(yōu)缺點分析,不難得出如下簡單結(jié)論:如果樣本容量足夠大,自由度的損失不會影響估計結(jié)果和檢驗結(jié)果,則輔助回歸模型選擇式(2);如果樣本容量不夠大,同時還需要構(gòu)造異方差和解釋變量之間的關(guān)系,則式(3)可委曲求全;若樣本容量較小,同時只想檢驗異方差是否存在而不關(guān)注其具體的形式,則式(4)較為可靠。如果檢驗的目的僅在于是否存在異方差,而不關(guān)注異方差和解釋變量的關(guān)系,筆者認為下述輔助回歸模型亦較為可靠:
lne2i=?0+?1ln^Yi+πi(5)
其中πi是隨機項。式(5)中e2i、^Yi取對數(shù)的原因有:一是降低數(shù)據(jù)的波動,減少異方差對其估計結(jié)果的影響;二是^Yi取對數(shù)后在一定程度上包括了其他次冪的信息。對于式(5)的顯著性檢驗借助于t統(tǒng)計量即可完成,更方便快捷。
(四)White檢驗對解決異方差問題的作用
異方差問題的解決通常需要借助于加權(quán)最小二乘法,而實施加權(quán)最小二乘法的關(guān)鍵是確定權(quán)重。加權(quán)最小二乘法的權(quán)重在理論上是隨機項方差的倒數(shù),但在實際應(yīng)用中隨機項方差是未知的,因而需要對權(quán)重進行構(gòu)造,用已知量加以估計。現(xiàn)實中是通過估計隨機項方差關(guān)于解釋變量的函數(shù)來構(gòu)造權(quán)重,即:
σ2i=f(X1,X2,…,Xk)
如果用e2i代表隨機項方差,則可以利用輔助回歸模型式(2)構(gòu)造函數(shù)f的估計結(jié)果,將1/f作為權(quán)重,加權(quán)最小二乘法即可順利實施,異方差問題便得到解決。這一過程將在文中下一部分的例證中予以展示。
為了展示異方差White檢驗的靈活性和實用性,筆者收集了2009年中國各省、市、區(qū)人均GDP、人均消費、人均投資等宏觀經(jīng)濟指標的數(shù)據(jù),構(gòu)建了反映人均GDP變動的線性回歸模型,利用此模型對上述理論分析內(nèi)容做出實證展示。
表1 2009年中國各省、市、區(qū)人均GDP、人均消費、人均投資數(shù)據(jù)表 單位:萬元/人
用PGDP表示人均GDP,PC表示人均消費,PI表示人均投資,則以PGDP為被解釋變量,PC、PI為解釋變量的線性回歸模型的估計結(jié)果為①需要指出的是,這里所構(gòu)建的模型未必是正確的,例如它沒有考慮到進出口的影響,但這并不影響本文的研究目的和分析結(jié)論。:
通過各項統(tǒng)計檢驗指標可以看出,模型擬合結(jié)果較好;通過進一步考察表明,模型未受到多重共線性的干擾,同時模型也不存在空間自相關(guān)問題。下面利用White檢驗法來檢驗該模型是否存在異方差,檢驗思路是:同時使用F檢驗和LM檢驗對前文所構(gòu)造的四類輔助回歸模型進行檢驗,以比較彼此間在過程上和結(jié)果上的差異。
首先利用輔助回歸模型式(2)進行異方差檢驗。輔助回歸模型的估計結(jié)果為:
可以看出,無論是LM檢驗還是F檢驗,都拒絕了同方差的假定。
再利用輔助回歸模型式(3)進行檢驗,其估計結(jié)果為:
估計結(jié)果式(8)也得到了拒絕同方差假定的結(jié)論。值得注意的一點是,式(8)的整體擬合效果優(yōu)于式(7),這說明在樣本容量不是充分大的條件下,剔除輔助回歸模型的交叉乘積項對于其估計結(jié)果來說是有利的。
輔助回歸模型式(4)的估計結(jié)果如下:
估計結(jié)果式(9)同樣表明原模型存在異方差。式(9)整體上非常顯著,這由LM及F統(tǒng)計量即可看出,但也應(yīng)注意到,對于單個參數(shù)的估計結(jié)果,t檢驗是不顯著的。
利用輔助回歸模型式(5)對原回歸模型作異方差檢驗,根據(jù)其回歸系數(shù)的t檢驗結(jié)果得知,原模型存在異方差。式(5)的估計結(jié)果如下:
各類檢驗結(jié)果均表明,原模型存在異方差問題,可以使用加權(quán)最小二乘法對其加以解決。首先需要構(gòu)建權(quán)重。按前文表述,可以依據(jù)輔助回歸模型式(2)的估計結(jié)果來構(gòu)造權(quán)重的表達式。通過估計結(jié)果式(7)可以看出,隨機項的方差(由式(6)的殘差的平方來表示)的變動主要和PIi、PI2i有關(guān),因此可構(gòu)建如下回歸模型:
式(11)擬合效果較好。^e2i是PIi和PI2i的線性組合,可以用它的倒數(shù)1/^e2i作為所估計的權(quán)重。為了保證權(quán)重的非負性,可以在運算過程中取其絕對值。用式(11)所得到的權(quán)重1/^e2i對原模型進行加權(quán)最小二乘估計,估計結(jié)果如下:
模型各項統(tǒng)計檢驗均通過,擬合效果較好。該模型的殘差和殘差的平方變動都較為平穩(wěn),對此模型進行異方差檢驗發(fā)現(xiàn)沒有異方差問題。因此,以為權(quán)重的加權(quán)最小二乘法很好地解決了異方差的問題。
筆者也試著根據(jù)輔助回歸模型式(4)(其估計結(jié)果為式(9))構(gòu)建權(quán)重,對原模型進行加權(quán)最小二乘估計,但得到的估計結(jié)果不甚理想。
異方差White檢驗的思想和使用過程均不復(fù)雜,在現(xiàn)實中可以靈活應(yīng)用。通過分析研究表明,異方差White檢驗可以使用經(jīng)典的LM檢驗方法,也可以借助于F檢驗來完成,因為檢驗?zāi)繕硕际禽o助回歸模型的整體顯著性;在White檢驗中,可以根據(jù)不同的前提條件(例如樣本容量)和檢驗?zāi)康模ɡ缡欠窨疾飚惙讲畹淖儎樱﹣順?gòu)造不同的輔助回歸模型,以滿足研究的需要,文中所討論的四類輔助回歸模型在不同的場合中都有各自的優(yōu)勢,使用時可以根據(jù)實際加以選擇;White檢驗的一個顯著的優(yōu)點在于,可以利用輔助回歸模型探尋隨機項方差與解釋變量之間的關(guān)系,并據(jù)此構(gòu)造加權(quán)最小二乘法中的權(quán)重函數(shù),以有效解決存在異方差問題的線性回歸模型的參數(shù)估計問題。所有上述觀點均在文中最后的例證中得到了充分的論證和展示。
[1] Halbert White.A Heteroscedasticity-Consistent Covariance Matrix Estimator and a Direct Test of Heteroscedasticity[J].Econometrica,1980,48(5).
[2] Gujarati Damodar N.Basic Econometrics[M].Fourth ed.New York:McGraw-Hill,2004.
Some Application Problems of White Heteroscedasticity Test
LIU Minga,b
(a.School of Statistics;b.Gansu Economics &Development Quantitative Analysis Institute,Lanzhou University of Finance and Economics,Lanzhou 730020,China)
It is true that White test is usually done by LM test,but we also can use the F-test to replace the LM test in reality.It need to build an auxiliary regression model during the proceeding of White test,and it can take different forms in response to practical needs.It discusses four types of different auxiliary regression models in the paper,theoretical analysis showed that every of them has its own advantage.In finally we show a practical example to verify that the conclusions of the theoretical analysis,and show the flexibility of White test in application.
heteroscedasticity;White test;auxiliary regression models
book=45,ebook=92
O212
A
1007-3116(2012)06-0045-05
(責(zé)任編輯:崔國平)
2012-02-18
劉 明,男,安徽霍邱人,經(jīng)濟學(xué)碩士,講師,研究方向:統(tǒng)計理論與方法,經(jīng)濟計量分析。