王 重,劉黎明
(首都經(jīng)濟(jì)貿(mào)易大學(xué) 統(tǒng)計學(xué)院,北京 100026)
構(gòu)建經(jīng)濟(jì)計量模型研究經(jīng)濟(jì)問題,首先確定研究對象,然后分析研究對象,確定影響研究對象的變量;根據(jù)變量之間的相互關(guān)系,確定經(jīng)濟(jì)計量模型的結(jié)構(gòu)解析式;而后利用搜集到的數(shù)據(jù)估計模型未知參數(shù);最后,對模型進(jìn)行檢驗,模型通過檢驗后,就可以利用經(jīng)濟(jì)計量模型解釋經(jīng)濟(jì)現(xiàn)象。
經(jīng)濟(jì)計量模型的變量選取,模型結(jié)構(gòu)解析式的確定需要經(jīng)濟(jì)理論和先驗的經(jīng)驗研究,模型檢驗是經(jīng)濟(jì)計量模型能夠解釋經(jīng)濟(jì)現(xiàn)象的保證。經(jīng)典線性模型中的檢驗中有擬合優(yōu)度檢驗、模型系數(shù)檢驗、模型總體檢驗。三個檢驗方法中,擬合優(yōu)度檢驗和模型總體檢驗主要檢驗?zāi)P偷臄M合程度,模型通過擬合優(yōu)度檢驗,才可以進(jìn)行系數(shù)檢驗。
擬合優(yōu)度檢驗最早由英國統(tǒng)計學(xué)家K·皮爾遜提出,皮爾遜明確指出統(tǒng)計學(xué)不僅僅研究樣本,而是根據(jù)樣本對總體進(jìn)行推斷。模型檢驗是構(gòu)建模型過程中重要的一環(huán)。經(jīng)典的計量經(jīng)濟(jì)學(xué)通過構(gòu)造檢驗統(tǒng)計量進(jìn)行模型假設(shè)檢驗。模型擬合優(yōu)度檢驗,模型假設(shè)和檢驗統(tǒng)計量的構(gòu)造以數(shù)理統(tǒng)計知識為基礎(chǔ)。經(jīng)典的模型檢驗,需要檢驗?zāi)P蛥?shù),并且還需檢驗?zāi)P涂傮w顯著性。
回歸擬合度評價統(tǒng)計量:
擬合優(yōu)度檢驗用于檢驗回歸模型的擬合程度,擬合優(yōu)度檢驗是模型系數(shù)檢驗的基礎(chǔ),在模型通過擬合優(yōu)度檢驗后,才可進(jìn)行模型系數(shù)檢驗。統(tǒng)計量檢驗?zāi)P偷臄M合程度被證明存在問題,Anscombe在1973年給出了四組著名數(shù)據(jù),證明了R2不能充分檢驗回歸模型擬合情況,統(tǒng)計量R2無法充分反映模型的擬合程度,使用統(tǒng)計量R2無法有效的檢驗?zāi)P偷臄M合程度。
表1中數(shù)據(jù)被分為四組,G1(x1,y1),G2(x2,y2),G3(x3,y3),G4(x2,y4),對這四組數(shù)據(jù)進(jìn)行一元線性回歸。設(shè)定模型:
y=β0+β1x+ε
采用最小二乘法估計模型,得到模型參數(shù)和模型的主要統(tǒng)計量。
表1 Anscombe數(shù)據(jù)
表2 各數(shù)據(jù)組模型統(tǒng)計量
表3 各組數(shù)據(jù)估計模型殘差表
從表2可以看出,數(shù)據(jù)組G1,G2,G3的模型參數(shù)估計值和模型的擬合優(yōu)度檢驗統(tǒng)計量基本一致,0.7。擬合優(yōu)度檢驗統(tǒng)計量的值不是很高,但還是不能否認(rèn)R2本身存在的問題。四組數(shù)據(jù)擬合模型,我們得到相似的回歸方程,但數(shù)據(jù)卻存在很大差別。
如圖1所示,模型y=3+0.5x對于數(shù)據(jù)組G1與G3的擬合優(yōu)度檢驗統(tǒng)計量為0.7,基本可以擬合,但是對于數(shù)據(jù)組G2,擬合優(yōu)度檢驗統(tǒng)計量也是0.7,擬合效果就要差很多,因此單獨(dú)利用R2檢驗?zāi)P偷臄M合優(yōu)度是欠妥的。
擬合優(yōu)度檢驗統(tǒng)計量R2不能夠很好檢驗?zāi)P偷臄M合情況,這與統(tǒng)計量 R2的構(gòu)造有關(guān)。 R2中包含有(Y-)與(Y^-),獲得自變量數(shù)值的方式不同,也就具有不同的含義。自變量Y數(shù)據(jù)來源有兩種方式,第一類是通過可重復(fù)實驗獲得的數(shù)據(jù)。例如:在常溫,常壓狀態(tài)下,某工廠測量合金A的強(qiáng)度,對合金A施加100000牛沖擊力,實驗3萬次,合金A的3萬次實驗的數(shù)據(jù)記錄下來,測算合金A的強(qiáng)度。合金A的強(qiáng)度為研究對象,構(gòu)造模型y=p×s+ε,利用數(shù)理方法,估計合金A的強(qiáng)度??芍貜?fù)實驗得到數(shù)據(jù),可以保證實驗條件的穩(wěn)定性,把外界的干擾控制到最低。在實驗中,可以精確的控制每一個Y影響研究對象的變量。本例中,可以精確的控制溫度、壓強(qiáng)、沖擊力。此時R2的就是試驗觀測數(shù)值得均值,并且與每一個十分接近,此時R2作為檢驗?zāi)P偷臄M合程度不是很合適。第二類是不可重復(fù)性試驗的時間序列數(shù)據(jù)。在經(jīng)濟(jì)問題的研究中,我們得到大量無法重復(fù)的時間序列數(shù)據(jù)。例如:為了研究某地區(qū)的消費(fèi)規(guī)律,根據(jù)統(tǒng)計資料查到該地區(qū)人均收入、人均儲蓄和人均消費(fèi)1981年到2002年的年度數(shù)據(jù),通過對數(shù)據(jù)的分析,估計人均收入、人均儲蓄對人均消費(fèi)的影響程度。人均消費(fèi)作為研究對象,記錄縱向年度不同時刻變量的值,利用這些統(tǒng)計數(shù)據(jù)構(gòu)建模型研究人均收入、人均儲蓄與人均消費(fèi)的關(guān)系。構(gòu)建面板數(shù)據(jù)模型,存在個自變量,研究面板數(shù)據(jù)研究自變量與因變量的關(guān)系,面板數(shù)據(jù)收集時,n個自變量與因變量同時變化,這時就變成自變量Y的算術(shù)平均值,并不能保證與每一個Y十分接近,那么借助R2與對模型進(jìn)行擬合的檢驗就可能出現(xiàn)Anscombe所論證的問題。
檢驗?zāi)P偷臄M合優(yōu)度可以構(gòu)建新的統(tǒng)計量,擬合優(yōu)度檢驗的統(tǒng)計量可以設(shè)定為:
模型的擬合優(yōu)度檢驗是檢驗設(shè)定模型的擬合程度,檢驗擬合優(yōu)度的統(tǒng)計量應(yīng)該實際反映模型的擬合水平。檢驗?zāi)P偷臄M合程度,殘差是良好的統(tǒng)計量,使用殘差必須消除殘差的量綱影響,統(tǒng)計量αi消除量綱影響,殘差表示估計值與真實值之間的差別,殘差除以真實值表示殘差占真實值的比率。
模型因變量與自變量關(guān)系穩(wěn)定,確定模型變量之間的函數(shù)關(guān)系,yi服從正態(tài)分布。模型因變量服從正態(tài)分布,不可采用擬合優(yōu)度X2統(tǒng)計量檢驗?zāi)P蛿M合優(yōu)度。估計模型函數(shù)關(guān)系確定后,構(gòu)造模型的擬合優(yōu)度檢驗X2統(tǒng)計量
模型假設(shè) εi服從獨(dú)立正態(tài)分布,εi~N(0,σ2),計算 X2統(tǒng)計量,必須知道殘差的方差 σ 的值,在 εi~N(0,σ2)的前提假設(shè)條件下,采用無偏統(tǒng)計量σ^2代替,代入X2統(tǒng)計量,得到X2(n-k-1)=n-k-1,因此X2統(tǒng)計量無法作為模型的擬合優(yōu)度檢驗統(tǒng)計量。模型總體檢驗使用F統(tǒng)計量,F(xiàn)統(tǒng)計量構(gòu)造中含有R2,R2檢驗擬合優(yōu)度存在不足,那么使用F統(tǒng)計量檢驗?zāi)P偷臄M合優(yōu)度也是存在問題的,因此使用統(tǒng)計量β檢驗?zāi)P蛿M合優(yōu)度是可行。
如果模型每一個ai都是小于0.95,那么可以認(rèn)定模型擬合程度高,在上例中,數(shù)據(jù)組G3的統(tǒng)計量R2受異常點(diǎn)的影響,R2值不理想,但模型的擬合程度還是很高的。統(tǒng)計量β由所有因變量的殘差與真實值比值絕對值的平均數(shù),表示模型總體的擬合情況。數(shù)據(jù)組 G1(x1,y1),G2(x2,y2),G3(x3,y3),G4(x2,y4)的檢驗結(jié)果見表3,表4。
表4 各模型擬合檢驗統(tǒng)計量表
從檢驗結(jié)果來看,模型y=β0+β1x+ε對四組數(shù)據(jù)模擬,G3(x1,y3)的檢驗值最小,統(tǒng)計量β=0.07,若假設(shè)β<0.1就可以接受模型,那么就可以利用模型對數(shù)據(jù)G3(x1,y3)進(jìn)行經(jīng)濟(jì)分析,數(shù)據(jù)組 G1(x1,y1),G2(x2,y2),G4(x2,y4)的模型需要進(jìn)行修正,僅當(dāng) G1、G2、G3 的模型統(tǒng)計量 βi<0.1,才可借助模型進(jìn)行經(jīng)濟(jì)分析。
檢驗?zāi)P蛿M合優(yōu)度,統(tǒng)計量R2構(gòu)造存在問題,不能很好地反映模型的實際擬合程度,而統(tǒng)計量β從模型本身出發(fā),可以準(zhǔn)確的辨別模型的擬合情況。實際研究中,根據(jù)研究對象的不同,設(shè)定不同精度,得到擬合數(shù)據(jù)的最佳模型,分析經(jīng)濟(jì)問題。
[1]Anscombe,F.J,et al.Graphs in Statistical Analysis[J].Am.Statist,1973,27.
[2]Braun,H,et al.A Simple Method for Testing Goodness of Fit in the Presence of Nuisance Parameters[J].R.Staat.Soc.1980,42.
[3]Larntz,K,Small-sample Comparisons of Exact levels for Goodness of Fit Statistics[J].J.Am.Stat.Assoc,1978,73.
[4]Khan,Azizur Rahman,Carl Riskin,et al. Growth and Distribution of Household Income in China between 1995 and 2002[C].Working Paper,2008.
[5]Tigor,Robert L.W.Arthur Lewis and the Birth of Development Economics[M].Princeton:Princeton University Press,2006.
[6]Christopher M,Fleming Robert R,et al.Single-species Versus Multiple-species Models:the Economic Implications[J].Ecol Model,2003,170.
[7]Fafchamps,M Minten,et al.Returns to Social Network Capital Among Traders[J].Oxford Economic,2002,542.
[8]韋博成,魯國斌,史建清等.統(tǒng)計診斷引論(第一版)[M].南京:東南大學(xué)出版社,1991.
[9]謝識予,朱宏鑫.高級計量經(jīng)濟(jì)學(xué)(第一版)[M].上海:復(fù)旦大學(xué)出版社,2005.
[10]李子奈,潘文卿.計量經(jīng)濟(jì)學(xué)(第二版)[M].北京:高等教育出版社,2005.