范傳棋
(西南財經(jīng)大學 中國西部經(jīng)濟研究中心,成都 611130)
Rule在研究1866年到1911年英國的人口死亡率和教堂舉行婚禮次數(shù)關(guān)系時發(fā)現(xiàn)二者具有很高的相關(guān)關(guān)系。如果將1950年到2011年間俄羅斯的人口數(shù)量與中國的人口數(shù)量進行回歸,我們會得出同樣的結(jié)論。在時間序列中分析中,如果對兩個獨立的時序列建立回歸模型,我們有時會得出兩個序列之間具有很高擬合度的結(jié)論,各個回歸參數(shù)也具有統(tǒng)計學意義,這種現(xiàn)象稱為謬誤回歸,在統(tǒng)計上也稱為無意義相關(guān)。當出現(xiàn)謬誤回歸時,回歸參數(shù)的估計特征異于經(jīng)典單方程回歸模型中各個參數(shù)的估計特征,同時相關(guān)統(tǒng)計量的分布不再滿足正態(tài)分布特征。國內(nèi)外學者在一元謬誤回歸方面做了大量的研究,1974年Granger and Newbold針對回歸方程各個系數(shù)在統(tǒng)計學上顯著,可決系數(shù)R2值接近1,而DW統(tǒng)計量接近0的現(xiàn)象做了分析,他們利用蒙特卡羅模擬方法證明了即使是兩個獨立的隨機游走序列在做回歸的時候也會出現(xiàn)謬誤回歸現(xiàn)象;1986年P(guān)hillips運用泛函中心極限定理從理論上揭示了謬誤回歸的表現(xiàn),推導出了兩個獨立的隨機游走變量回歸時幾個常用統(tǒng)計量的極限分布,指出謬誤回歸的t和F統(tǒng)計量的分布都是發(fā)散的;2004年Kim,Lee and Newbold研究發(fā)現(xiàn)謬誤回歸現(xiàn)象不僅僅發(fā)生在非平穩(wěn)時間序列中,也存在于獨立的趨勢平穩(wěn)時間序列中。張凌翔,張曉峒運用蒙特卡羅模擬方法對結(jié)構(gòu)突變平穩(wěn)過程與隨機趨勢過程中的謬誤回歸進行了研究,指出出現(xiàn)謬誤回歸時F統(tǒng)計量的極限分布是發(fā)散的,DW統(tǒng)計量以概率收斂于0,R2具有不退化的極限分布,并且在有限樣本條件下謬誤回歸發(fā)生的概率較大。本文將Granger and Newbold的謬誤回歸理論以及Phillips泛函中心極限定理結(jié)合起來,利用蒙特卡羅模擬方法考察OLS下出現(xiàn)謬誤回歸時相關(guān)參數(shù)及常用統(tǒng)計量的極限分布。
考察如下兩個隨機游走時間序列{yt}和{xt}:
其中W(t)是在C[0,1]上一個獨立的維納過程,對于序列{yt}上式的推導同樣成立,序列{yt}中的維納過程用V(t)表示,當T→∞時,式(2)中的各個系數(shù)與統(tǒng)計量滿足
下列特征:
本文用于研究的數(shù)據(jù)均由式(1)生成,檢驗水平設(shè)置為5%;為了考察隨著樣本容量的增加,各個相關(guān)參數(shù)以及統(tǒng)計量呈現(xiàn)出的變化規(guī)律與分布特征,將樣本分為十位樣本、百位樣本以及千位樣本,百位樣本選取T=20,40,60,80 ,100;千位樣本選取T=200,400,600,800,1000;萬位樣本選取T=2000,4000,6000,8000,10000。
R2是衡量回歸方程擬合優(yōu)度的統(tǒng)計量,在判別謬誤回歸中R2是一個很重要的判別指標。在出現(xiàn)謬誤回歸時,其分極限分布與樣本特征異于經(jīng)典回歸方程中的R2分布形式與樣本特征,其極限分布見圖1(圖1中縱坐標為當解釋變量的t統(tǒng)計量顯著時R2的頻數(shù)F,橫坐標為R2值),R2的樣本特征見表1。
圖1 10000次模擬的R2極限分布圖
從圖1中可以看出,盡管隨機游走序列{yt}和{xt}之間是相互獨立的,但是在解釋變量的t統(tǒng)計量顯著時,R2>0.5的頻數(shù)F=1631次,即在10000次模擬回歸中R2>0.5出現(xiàn)了1631次,從理論上來講,在這10000次模擬回歸中R2的值都應該為零,因此可以認定此次模擬回歸出現(xiàn)了謬誤回歸。此時R2極限分布的偏度S=0.859>0,峰度K=2.685<3,JB=1271.4(數(shù)據(jù)見表1),其不滿足正態(tài)分布特征,R2極限分布呈現(xiàn)低峰、薄尾、右偏的分布特征,具有一個不退化的極限分布。
表1 10000次模擬R2的樣本特征
表1給出了出現(xiàn)謬誤回歸時,R2隨著樣本的增加而表現(xiàn)出的樣本特征??梢钥闯鲭S著樣本的增加,標準差Std、偏度S、峰度K以及JB統(tǒng)計量變化不大,基本上保持穩(wěn)定,而F值隨著樣本容量的增加而遞增,也就是說在謬誤回歸中R2的分布是穩(wěn)定的,其并不隨著樣本的增加而發(fā)生改變,同時樣本容量的增加不但未能弱化謬誤回歸反而增加了出現(xiàn)謬誤回歸的可能性。
DW統(tǒng)計量是利用殘差構(gòu)成的統(tǒng)計量來推斷誤差項是否存在自相關(guān),DW統(tǒng)計值的范圍為[0,4],其為0的情況是很罕見的。下文給出了10000次模擬DW統(tǒng)計量的極限分布圖,見圖2,以及DW統(tǒng)計量的樣本特征,見表2。
圖2 DW統(tǒng)計量的極限分布圖
從圖2中可以看出,DW統(tǒng)計量值都小于0.01,DW統(tǒng)計量偏度S=1.402>0,峰度K=6.193>3,JB=7527(見表2),DW統(tǒng)計量的極限分布不滿足正態(tài)分布特征,呈現(xiàn)高峰、厚尾、右偏的分布特征。
表2 DW統(tǒng)計量的樣本特征
表2為在出現(xiàn)謬誤回歸時,DW統(tǒng)計量隨著樣本的增加而表現(xiàn)出的樣本特征。DW統(tǒng)計量的標準差和均值均隨著樣本的增加而不斷的趨近于0,當樣本無窮大時,DW統(tǒng)計量以概率收斂于0;DW統(tǒng)計量的偏度隨著樣本的增加并沒有發(fā)生太大的變化,而DW統(tǒng)計量的峰度和JB統(tǒng)計量隨著樣本的增減而遞增,其高峰、厚尾、右偏的分布特征并未隨著樣本的增加而改變。
t(α)為歸方程中常數(shù)項的t統(tǒng)計量,出現(xiàn)謬誤回歸時,其極限分布與參數(shù)特征也同樣會發(fā)生改變。
從圖3中可知 t(α)為一個對稱分布,其偏度S=-0.0145<0,峰度K=3.3347>3(見表3),其極限分布不滿足正態(tài)分布的特征,呈現(xiàn)高峰、厚尾、左偏的分布特征。
圖3 t(α)的極限分布圖
表3 t(α)的樣本特征
從表3中可知,在謬誤回歸的前提下,t(α)的標準差是隨著樣本的增加而不斷遞增的,也就是說t(α)是發(fā)散的,并未收斂于某個值;t(α)的偏度隨著樣本的增加并未呈現(xiàn)出較強的規(guī)律性,但S值始終大于0,JB統(tǒng)計量隨著樣本的增加呈現(xiàn)遞增的趨勢,可以肯定的是t(α)的極限分布不再服從正態(tài)分布。
α為回歸方程中常數(shù)項系數(shù),在發(fā)生謬誤回歸時,其相關(guān)參數(shù)與各個統(tǒng)計量隨著樣本容量的增加發(fā)生著不同的變化,見表4,隨著樣本的增加,α的均值絕對值不斷遞增,同時α的標準差隨著樣本的增加也在不斷地遞增,也就是說α隨著樣本容量的增加而發(fā)散,并不會收斂與某一值。由于S不等于0、K不等于3,所以α的極限分布不再服從正態(tài)分布,但是在樣本為10000時α的S值有趨近于0,K值有趨近于3的趨勢,隨著樣本的無限擴展α是否會近似服從正態(tài)分布這一論點需要更高級的計算機進行模擬論證。但是本文傾向隨著樣本的無限擴展,α仍然不會近似服從正態(tài)分布這一觀點。
t(β)是判別解釋變量系數(shù)是否顯著異于0的指標,在經(jīng)典單方程回歸中t(β)是服從正態(tài)分布的,在發(fā)生謬誤回歸時,其分布也發(fā)生了顯著的變化。從圖4中可以看出|t(β)|>1.96的頻數(shù)非常高,這意味著在對兩個獨立的隨機游走序列作模特卡羅模擬時,出現(xiàn)了謬誤回歸。t(β)的偏度S=0.02>0,峰度K=3.75>3(見表5),其極限分布為一個對稱分布,不再滿足正態(tài)分布的特征,呈現(xiàn)高峰、厚尾、右偏的分布特征。
表4 α的樣本特征
圖4 t(β)的極限分布圖
從表5中可以看出P值隨著樣本的增加而增加,也就是說隨著樣本的增加,出現(xiàn)謬誤回歸的可能性也在增加。
t(β)的標準差隨著樣本的增加不斷增大,可以認定t(β)不會收斂于某一個值,也就是說 t(β)是發(fā)散的;t(β)的偏度、峰度以及JB統(tǒng)計量并不隨著樣本的增加有過多的改變。
β為回歸方程的系數(shù),在出現(xiàn)謬誤回歸后,β的偏度S隨著樣本的增加時而為正時而為負,峰度K值和JB統(tǒng)計量值呈不斷遞減的趨勢,S值有趨近于0的趨勢、K不斷趨近于3。在樣本為10000的模擬條件下,β的分布呈現(xiàn)高峰、厚尾、右偏的分布特征,但是隨著樣本的無限增加,其分布是否會出現(xiàn)近似正態(tài)分布的特征,這就需要更高級、運算速度更快的計算機進行模擬。本文傾向隨著樣本無限擴展,β仍然不會近似服從正態(tài)分布這一觀點。
表6 β的樣本特征
β的均值呈現(xiàn)不斷遞增的趨勢,也就是回歸方程中解釋變量的系數(shù)異于0的趨勢在增強,β的標準差并未隨著樣本的增加有太大的變化,可以認定β會收斂于某個常數(shù)。
綜合理論分析與Monte Carlo模擬結(jié)果可以得出以下結(jié)論:
(1)出現(xiàn)謬誤回歸時,R2的極限分布不再服從正態(tài)分布,而是呈現(xiàn)低峰、薄尾、右偏的分布特征;R2的極限分布不會隨著樣本的增加而有所改變,但是R2>0.5的頻數(shù)會隨著樣本的增加而遞增,所以樣本容量的增加不但不會弱化或者消除謬誤回歸現(xiàn)象,反而會增加出現(xiàn)謬誤回歸的可能性。
(2)出現(xiàn)謬誤回歸時,DW統(tǒng)計量的極限分布不再滿足正態(tài)分布,而是呈現(xiàn)高峰、厚尾、右偏的分布特征;DW統(tǒng)計量的極限分布并未受到樣本增加的影響;當樣本無限大時,DW統(tǒng)計量依概率收斂于0。
(3)出現(xiàn)謬誤回歸時,隨著樣本容量的增加α不會收斂于某一個常數(shù),也就是說α是發(fā)散的;隨著樣本的無限擴展α是否會近似服從正態(tài)分布這一論點需要更高級的計算機進行模擬論證,但是本文傾向認同即使樣本無窮大α仍然不會近似服從正態(tài)分布這一觀點。t(α)的極限分布不再滿足正態(tài)分布而是呈現(xiàn)高峰、厚尾、左偏的分布特征,隨著樣本的增加,t(α)不會收斂于某個常數(shù),同樣可以認定t(α)是發(fā)散的。
(4)出現(xiàn)謬誤回歸時,在樣本為10000的模擬條件下,β的分布呈現(xiàn)高峰、厚尾、右偏的分布特征,但是樣本無窮大的情況下,其分布是否會出現(xiàn)近似正態(tài)分布的特征,這就需要更高級、運算速度更快的計算機進行模擬,本文傾向即使樣本無窮大,β仍然不會近似服從正態(tài)分布這一觀點;t(β)的極限分布為一個對稱分布,同樣不再滿足正態(tài)分布,而是呈現(xiàn)高峰、厚尾、右偏的分布特征,t(β)的標準差隨著樣本容量的增加而不斷增大,所以t(β)不會收斂于某個常數(shù),也就是說t(β)是發(fā)散的。
[1]Phillips P C B.Understanding Spurious Regression in Econometrics[J].Journals of Econometrics,1986,33(3).
[2]Kim T H,Lee Y S,Newbold P.Spurious Regressions with Stationary Processes Around Linear Trends[J].Economics letters,2004,83(2).
[3]Granger C W J.Hyung W,Jeon Y.Spurious Regressions with Stationary Series[J].Escholarship,1998,(3).
[4]張曉峒,王貴鵬,聶巧平.一般序列相關(guān)下面板謬誤回歸研究—估計量的漸進分布和小樣本性質(zhì)[J].南開經(jīng)濟研究,2006,(2).
[5]張凌翔,張曉峒.結(jié)構(gòu)突變趨勢平穩(wěn)過程與隨機趨勢過程的謬誤回歸研究[J].統(tǒng)計研究,2011,(28).
[6]樊歡歡,李嫣怡,陳勝可.EViews統(tǒng)計分析與應用[M].北京:機械工業(yè)出版社,2011.