吳夢婷,王義鬧
(溫州大學(xué)數(shù)學(xué)與信息科學(xué)學(xué)院,浙江溫州 325035)
用線性模型模擬線性-對數(shù)問題產(chǎn)生的自相關(guān)情況統(tǒng)計分析
吳夢婷,王義鬧?
(溫州大學(xué)數(shù)學(xué)與信息科學(xué)學(xué)院,浙江溫州 325035)
用線性模型模擬線性-對數(shù)問題,殘差序列會表現(xiàn)出自相關(guān)性.從線性-對數(shù)模型的參數(shù)取值大小、隨機(jī)誤差項方差大小、樣本范圍大小等三個方面,對用線性模型模擬線性-對數(shù)問題產(chǎn)生的自相關(guān)情況進(jìn)行了統(tǒng)計分析,結(jié)果表明,當(dāng)半對數(shù)模型的參數(shù)取值較大、隨機(jī)誤差項較小、樣本范圍較大時,殘差序列的自相關(guān)性的百分比較大,此時不易誤用線性模型.該研究對加深認(rèn)識線性-對數(shù)模型,避免誤用線性模型有一定的參考意義.
線性-對數(shù)模型;線性化;數(shù)值模擬;D-W檢驗
半對數(shù)模型又稱增長模型,在回歸分析中可以用半對數(shù)模型來測度增長率,如人口增長率、勞動增長率、GDP增長率等等.模型形式為:
由于模型中只有某一側(cè)的變量為對數(shù)形式,所以稱為半對數(shù)模型[1].例如可通過模型ln(GDPt)= b0+b1t+ut,得到我國GDP年增長率的估計值,這里t為時間變量.
在日常生活中,當(dāng)實際問題的非線性程度不明顯時,常常會首先選擇簡單的線性模型描述該問題,這樣就會產(chǎn)生采用錯誤函數(shù)形式的問題.采用錯誤的函數(shù)形式,不僅會使模型誤差變大,而且對變量之間的關(guān)系也會出現(xiàn)錯誤的認(rèn)識[2].如果根據(jù)經(jīng)濟(jì)理論或其它先驗知識可以確定模型的函數(shù)形式,就不會出現(xiàn)錯用函數(shù)形式的問題了.但在實際問題中,往往難以根據(jù)經(jīng)濟(jì)理論或其它先驗知識來確定模型函數(shù)形式,這就需要我們從數(shù)據(jù)出發(fā)尋找好的模型.采用錯誤的函數(shù)形式會表現(xiàn)出殘差序列自相關(guān),而建立計量經(jīng)濟(jì)模型軟件的基本報告中都有DW統(tǒng)計量的值,那么,DW統(tǒng)計量在多大程度上能反映出模型有問題,進(jìn)而提示去尋找原因,避免采用錯誤的函數(shù)形式,就是本文關(guān)注的問題.本文將用DW檢驗方法,從模型參數(shù)、隨機(jī)誤差項、樣本范圍等三方面對線性-對數(shù)模型誤用了線性模型是否表現(xiàn)出顯著自相關(guān)問題進(jìn)行數(shù)值模擬與統(tǒng)計分析,這對深刻認(rèn)識線性-對數(shù)模型,從而在實際建模中避免誤用線性模型有一定幫助.
對線性-對數(shù)函數(shù)lny=1+10x ,利用Eviews軟件畫出x-y的曲線圖(見圖1),并利用數(shù)值模擬進(jìn)行線性回歸,得參數(shù),的估計值分別為-6.5和159,因此y^=-6.5+159x,并給出該方程的直線圖(見圖2).
比較x-y曲線圖和x-y直線圖可見,把線性-對數(shù)規(guī)律誤認(rèn)為線性規(guī)律,存在一定的誤差.利用數(shù)值模擬得到殘差分布圖(見圖3).
由殘差分布圖可知,殘差在兩邊為正,在中間為負(fù),呈有規(guī)律的變動,說明很可能存在自相關(guān)性.因此可以通過D-W檢驗來檢驗線性-對數(shù)模型誤用線性模型后的自相關(guān)性,從而得到線性-對數(shù)模型是否誤用線性模型的情況以及如果誤用誤差的大小[3].
圖1 x-y曲線圖
圖2 x-y曲線圖
圖3 殘差分布圖
本文主要分析線性-對數(shù)模型(2),分別從隨機(jī)誤差項u、參數(shù)b1及x的樣本范圍三方面,利用Eviews軟件及D-W檢驗,分析誤用線性模型處理之后的自相關(guān)性,從而判斷線性-對數(shù)模型有無誤用線性模型.
2.1 隨機(jī)誤差項大小對誤用線性模型的影響
2.1.1數(shù)值模擬具體步驟
第一步:取定參數(shù)b0=1和b1=2;
第二步:選定解釋變量的一個容量為30的樣本,數(shù)值依次為:0.01,0.02,0.03,0.04,0.05,0.06,0.07,0.08,0.09,0.1,0.11,0.12,0.13,0.14,0.15,0.16,0.17,0.18,0.19,0.2,0.21,0.22,0.23,0.24,0.25,0.26,0.27,0.28,0.29,0.3;
第三步:利用軟件在實數(shù)范圍內(nèi)產(chǎn)生一組隨機(jī)誤差項:u1, u2, u3…u30,ui服從N(0,0.012),之后將標(biāo)準(zhǔn)差0.01改成0.02、0.05和0.1再進(jìn)行數(shù)值模擬;
第四步:將得到的隨機(jī)誤差和已知的解釋變量值代入lny=1+2x+u模型中,得到30個lnyi的模擬觀測值,進(jìn)而由y=exp(lny),得到30個yi的模擬觀測值;
第五步:利用產(chǎn)生的30個lnyi值,對所選的30個x值進(jìn)行回歸,得線性-對數(shù)模型(2)的估計;利用如此產(chǎn)生的yi值,對所選的30個x值進(jìn)行回歸,得線性模型的估計;
第六步:提取線性模型的DW統(tǒng)計量,并且查表得n=30,k=2,顯著性水平α=0.05時,dl=1.35,du=1.49,判斷并記錄是否存在一階自相關(guān);
第七步:循環(huán)10 000次,統(tǒng)計檢驗結(jié)果存在顯著一階自相關(guān)性或DW檢驗失效的百分比[4].
2.1.2 數(shù)值模擬結(jié)果具體分析
根據(jù)數(shù)值模擬的結(jié)果,對數(shù)據(jù)進(jìn)行處理,得到表1.
表1 數(shù)據(jù)處理結(jié)果
由表1可知,線性-對數(shù)模型中的隨機(jī)誤差項對于誤用線性模型后,DW檢驗是否存在顯著自相關(guān)有明顯影響.當(dāng)隨機(jī)誤差項服從的正態(tài)分布的標(biāo)準(zhǔn)差為0.01時,殘差序列存在顯著自相關(guān)或DW檢驗失效的比例較高,達(dá)到94.2%,說明線性-對數(shù)規(guī)律性明顯,隨機(jī)干擾較弱,容易發(fā)現(xiàn)線性模型有問題,如果用線性模型處理,會產(chǎn)生較大的誤差,從而會影響問題的解決.當(dāng)標(biāo)準(zhǔn)差由0.01逐漸變大時,殘差序列存在顯著自相關(guān)或DW檢驗失效的比例會逐漸降低,當(dāng)標(biāo)準(zhǔn)差達(dá)到0.05時,存在顯著自相關(guān)或DW檢驗失效的比例僅為18.8%,這反映出干擾較大時,樣本觀察值的線性-對數(shù)規(guī)律性不太明顯,這時,難以通過DW檢驗發(fā)現(xiàn)是否誤用了線性模型,這時要注意從經(jīng)濟(jì)規(guī)律本身分析變量之間的關(guān)系,從而確定模型函數(shù)形式,或用其它檢驗方法進(jìn)行進(jìn)一步檢驗.當(dāng)然,如果僅以預(yù)測為目標(biāo),這時用線性模型也是可以考慮的.
2.2 樣本范圍大小對誤用線性模型的影響
2.2.1 數(shù)值模擬具體步驟
第一步:取定參數(shù)b0=1和b1=2;
第二步:選定解釋變量的一個容量為30的樣本,在一個實數(shù)范圍內(nèi)選擇30個實數(shù)作為xi的模擬觀測值:x1, x2, x3,…x30(首先選實數(shù)范圍為0.01 – 0.3,之后將實數(shù)范圍分別改為0.01 – 0.6,0.01 – 0.9,0.01 – 1.2,再分別進(jìn)行數(shù)值模擬);
第三步:利用軟件在實數(shù)范圍內(nèi)產(chǎn)生一組隨機(jī)誤差項:u1, u2, u3…u30,ui服從N(0,0.12);
第四步:將得到的隨機(jī)數(shù)和已知的變量代入lny=1+2x+u模型中,從而得到30個lnyi的模擬觀測值.將得到的隨機(jī)數(shù)和已知的變量代入y=exp(lny),從而得到30個yi的模擬觀測值;
第五步:利用產(chǎn)生的30個lnyi值,對所選的30個x值進(jìn)行回歸,得線性-對數(shù)模型(2)的估計,并利用如此產(chǎn)生的yi值,對所選的30個x值進(jìn)行回歸,得線性模型的估計;
第六步:提取線性模型的DW統(tǒng)計量,并查表得n=30,k=2,顯著性水平α=0.05時,dl=1.35,du=1.49;
第七步:循環(huán)10 000次,統(tǒng)計檢驗結(jié)果存在顯著一階自相關(guān)性或DW檢驗失效的百分比.
2.2.2 數(shù)值模擬結(jié)果具體分析
根據(jù)數(shù)值模擬結(jié)果,統(tǒng)計分析得到表2.樣本范圍大小不同時,殘差序列存在顯著自相關(guān)的分布圖見圖1.
表2 數(shù)值模擬結(jié)果的統(tǒng)計分析
圖1 殘差序列存在顯著自相關(guān)的分布圖
由表2和圖1可以看出,在隨機(jī)誤差項u和b1取值確定的情況下,x的取值范圍也會影響線性-對數(shù)模型誤用線性模型后DW檢驗的結(jié)果.當(dāng)樣本范圍逐漸擴(kuò)大時,殘差序列的自相關(guān)性逐漸顯著.在樣本范圍為(0.01 – 0.3)的情況下,線性-對數(shù)模型用線性模型處理后,DW檢驗殘差序列顯著自相關(guān)或DW檢驗失效的比例為17.2%,隨著樣本范圍變大為(0.01 – 0.6),可以看到顯著自相關(guān)或DW檢驗失效的比例有所提高,為36.9%,在圖1中看到模型的非線性還不明顯,如果DW檢驗殘差序列不存在自相關(guān)性,誤將線性-對數(shù)模型用線性模型處理,得到的線性模型誤差不太大,是可以接受的.但是,當(dāng)x范圍變?yōu)椋?.01 – 0.9)的時候,D-W檢驗出的顯著自相關(guān)或DW檢驗失效的比例很大,從圖1中也可以看出線性-對數(shù)模型不宜用線性模型處理,否則誤差會比較大.當(dāng)樣本范圍再次擴(kuò)大的時候,可以發(fā)現(xiàn)線性-對數(shù)模型的非線性更加明顯了,而且D-W檢驗的殘差序列的顯著自相關(guān)或DW檢驗失效的比例接近100%,此時線性-對數(shù)模型完全不能用線性模型處理.
因此,對線性-對數(shù)問題,用線性模型處理的時候,如果x的解釋取值范圍較小,即使DW檢驗顯示不存在顯著一階自相關(guān),也應(yīng)該注意檢驗是否存在誤用函數(shù)形式的問題,否則就可能出現(xiàn)誤用函數(shù)形式的錯誤.當(dāng)然,這時即使犯了誤用函數(shù)形式的錯誤,因為非線性規(guī)律不明顯,單純從誤差的角度來看,與用非線性模型處理相差也不會很多.
2.3 參數(shù)取值的大小對誤用線性模型的影響
2.3.1數(shù)值模擬具體步驟
第一步:取定參數(shù)b0=1和b1=6(之后將參數(shù)b1改為5,2,1,分別進(jìn)行數(shù)值模擬);
第二步:選定解釋變量的一個容量為30的樣本,數(shù)值分別為:0.01,0.02,0.03,0.04,0.05,0.06,0.07,0.08,0.09,0.1,0.11,0.12,0.13,0.14,0.15,0.16,0.17,0.18,0.19,0.2,0.21,0.22,0.23,0.24,0.25,0.26,0.27,0.28,0.29,0.3;
第三步:利用軟件在實數(shù)范圍內(nèi)產(chǎn)生一組隨機(jī)誤差項:u1, u2, u3…u30,ui服從N(0,0.12);
第四步:將得到的隨機(jī)數(shù)和已知的變量代入lny=1+ 6x+u模型中,從而得到30個lnyi的模擬觀測值.將得到的隨機(jī)數(shù)和已知的變量代入y=exp(lny),從而得到30個yi的模擬觀測值;
第五步:利用產(chǎn)生的30個lnyi值,對所選的30個x值進(jìn)行回歸,得線性-對數(shù)模型(2)的估計,并且利用如此產(chǎn)生的yi值,對所選的30個x值進(jìn)行回歸,得線性模型的估計;
第六步:提取得線性模型的DW統(tǒng)計量,并查表得n=30,k=2,在顯著性水平α=0.05時,dl=1.35,du=1.49;
第七步:循環(huán)10 000次,統(tǒng)計檢驗結(jié)果有自相關(guān)性或DW檢驗失效的百分比.
2.3.2 數(shù)值模擬結(jié)果具體分析
根據(jù)數(shù)值模擬的結(jié)果,對數(shù)據(jù)進(jìn)行統(tǒng)計分析,得表3.
表3 數(shù)值模擬結(jié)果的統(tǒng)計分析
由表3可以看出,在隨機(jī)誤差項方差和樣本范圍大小確定的情況下,線性-對數(shù)模型中的b1的不同取值,對誤用線性模型后DW檢驗顯著自相關(guān)或檢驗失效的比例有明顯影響.當(dāng)b1為6的時候可以看到線性-對數(shù)模型線性化后,殘差序列顯著自相關(guān)或DW檢驗失效的比例為100%,在這種情況下,容易發(fā)現(xiàn)線性模型存在問題,不容易犯誤用線性模型的錯誤.當(dāng)改變b1的取值時,顯著自相關(guān)或DW檢驗失效的比例也隨之改變,當(dāng)取值逐漸變小的時候,顯著自相關(guān)或DW檢驗失效的比例會逐漸降低.當(dāng)b1取值達(dá)到2的時候,顯著自相關(guān)或DW檢驗失效的比例為17.2%,當(dāng)b1取值為1的時候,顯著自相關(guān)或DW檢驗失效的比例為16.2%,雖有所降低,但是幅度有所減慢,如果以為不存在一階自相關(guān)就應(yīng)用線性模型處理,則會出現(xiàn)誤用線性模型的問題.不過當(dāng)b1為2和比2小的時候,線性-對數(shù)模型的曲率較小,用線性模型作為線性-對數(shù)模型的近似,誤差是較小的,對預(yù)測結(jié)果影響不大.
由此可以得出,在半對數(shù)模型用線性模型處理的過程中,b1是重要的影響因素,需要根據(jù)線性-對數(shù)模型的實際情況,通過數(shù)值模擬的結(jié)果分析和DW檢驗,查看半對數(shù)模型線性化后殘差序列的自相關(guān)性程度.如果顯著自相關(guān),則線性-對數(shù)模型用線性模型處理帶來的誤差就較大,應(yīng)進(jìn)一步探索自相關(guān)的原因,當(dāng)不存在顯著自相關(guān)時,可能會出現(xiàn)誤用線性模型問題,如果僅研究變量間的數(shù)量關(guān)系,也可以將線性-對數(shù)模型用線性模型近似.
本文分析了線性-對數(shù)模型誤用線性模型的三種情況。運用Eviews進(jìn)行蒙特卡洛實驗,以及D-W檢驗,直觀地說明了線性-對數(shù)模型中的隨機(jī)誤差項u、參數(shù)b1取值大小和x的取值范圍影響誤用線性模型的可能性.當(dāng)總體非線性規(guī)律明顯時,常常能檢驗出殘差序列自相關(guān)或出現(xiàn)DW檢驗失效的情況,因此出現(xiàn)殘差序列自相關(guān)或出現(xiàn)DW檢驗失效的情況,要注意檢驗是否因為總體規(guī)律非線性所致.當(dāng)DW檢驗不存在一階自相關(guān)時,容易忽略總體規(guī)律非線性檢驗,會造成誤用線性模型的失誤.但幸運的是,這時非線性規(guī)律實際是不太明顯的,如果僅考慮變量之間的數(shù)量關(guān)系的話,線性模型也是可以接受的.
[1] 孫敬水. 計量經(jīng)濟(jì)學(xué)[M]. 第二版. 北京: 清華大學(xué)出版社, 2009: 104.
[2] 佘光輝, 劉恩斌, 葉金盛, 等. 非線性模型線性化的度量準(zhǔn)則及其應(yīng)用[J]. 南京林業(yè)大學(xué)學(xué)報, 2005, 29(5):17-20.
[3] 李子奈, 潘文卿. 計量經(jīng)濟(jì)學(xué)[M]. 第二版. 北京: 高等教育出版社, 2005: 162.
[4] 張曉峒. EViews使用指南與案例[M]. 第一版. 北京: 機(jī)械工業(yè)出版社, 2007: 1-36.
The Statistic Analysis of Autocorrelation Generated from Linear-logarithmic Problem Simulated by Linear Model
WU Mengting, WANG Yinao
(College of Mathematics and Information Science, Wenzhou University, Wenzhou, China 325035)
While the linear-logarithmic problem is simulated by a linear model, the residual error series may produce autocorrelation. In this paper, the statistic analysis of the autocorrelation is achieved in terms of the parameter value, the variance of the random error and the sample range of the linear-logarithmic model. The final statistical analysis indicates: when the semi-logarithmic model parameter is larger, the random error is smaller; when the sample range is broader, then the percentage of autocorrelation of residual error percent is higher. In two cases it is not easy to misuse of linear model. This result has a certain reference significance to deepen the understanding of linear- logarithm model in order to avoid the misuse of linear model.
Linear -logarithmic Model; Linearization; Numerical Simulation; D-W Test
O241
A
1674-3563(2015)02-0013-06
10.3875/j.issn.1674-3563.2015.02.003 本文的PDF文件可以從xuebao.wzu.edu.cn獲得
(編輯:王一芳)
2014-04-17
吳夢婷(1991- ),女,浙江海寧人,研究方向:統(tǒng)計分析.? 通訊作者,wyinao@sina.com.cn