李 杰,劉兆鵬,費(fèi)時(shí)龍,任 敏
( 宿州學(xué)院 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,安徽 宿州 234000 )
回歸模型與VEC模型在旅游業(yè)的應(yīng)用研究
李 杰,劉兆鵬,費(fèi)時(shí)龍,任 敏
( 宿州學(xué)院 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,安徽 宿州 234000 )
根據(jù)多元線性回歸模型理論,摘取安徽省近些年旅游業(yè)相關(guān)原始數(shù)據(jù)進(jìn)行相關(guān)性分析,給出了多重因素下的線性回歸模型,并對(duì)模型進(jìn)行優(yōu)化,修復(fù)了嚴(yán)重共線性。進(jìn)一步,運(yùn)用VEC模型預(yù)測(cè)安徽省旅游業(yè)的發(fā)展前景,為安徽省的旅游發(fā)展和規(guī)劃提供參考。
旅游業(yè); 回歸模型; VEC模型; 檢驗(yàn)
根據(jù)安徽省統(tǒng)計(jì)年鑒獲取的歷年有關(guān)數(shù)據(jù)[1],進(jìn)行簡單的圖表處理得圖1、圖2、表1、表2和表3。
圖1 歷年安徽省旅游收入
圖2 歷年安徽省旅游人次
2.1.相關(guān)性分析及模型建立
根據(jù)影響因素設(shè)五個(gè)相關(guān)變量[2]。X2:來皖旅游人數(shù);X3:來皖游客人均花費(fèi);X4:旅游者可支配收入;X5:公路里程;X6:鐵路里程。Y表示安徽省省內(nèi)旅游需求,對(duì)Y進(jìn)行初步回歸分析。為此設(shè)定了如下形式的計(jì)量經(jīng)濟(jì)模型[3]:
其中tY為第t年安徽省省內(nèi)旅游需求。
為估計(jì)模型參數(shù),本文選用安徽省統(tǒng)計(jì)年鑒上1999年至2012年的統(tǒng)計(jì)數(shù)據(jù)。利用EViews軟件,生成Yt、X2、X3、X4、X5、X6等數(shù)據(jù),采用這些數(shù)據(jù)對(duì)模型進(jìn)行OLS回歸,由OLS回歸結(jié)果可知該模型可決系數(shù)很高,F(xiàn)檢驗(yàn)值575.5910,明顯顯著。但是當(dāng)α=0.05時(shí),的系數(shù)t檢驗(yàn)不顯著,而且X6系數(shù)的符號(hào)是負(fù)號(hào),與實(shí)際情況不符,這表明很可能存在嚴(yán)重的多重共線性[4]。
計(jì)算解釋變量的相關(guān)系數(shù),選擇X2、X3、X4、 X5、X6的數(shù)據(jù),點(diǎn)“view/correlation”得相關(guān)系數(shù)
矩陣,如表4所示。由表4可以看出,各解釋變量間的相關(guān)系數(shù)較高,這表明存在嚴(yán)重共線性。
2.2.修正多重共線性
依次作Y對(duì)X2、X3、X4、X5、X6的一元回歸,其中加入X的方程最大。以X為基礎(chǔ),順次加入其他變量逐步回歸,經(jīng)比較,新加入的X3的方程=0.9912,改進(jìn)最大,而且各參數(shù)的t檢驗(yàn)顯著,選擇保留X3,再加入其他新變量逐步回歸。在X、X基礎(chǔ)上加入X后的方程有所改善,且各參數(shù)的t檢驗(yàn)都顯著。保留X4,再加入其他新變量逐步回歸。當(dāng)加入X時(shí),有所增加,但其參數(shù)的t檢驗(yàn)不顯著。加入X后,也有所增加,但其參數(shù)的t檢驗(yàn)不顯著,且參數(shù)為負(fù)值,不合理。從相關(guān)系數(shù)也可以看出,X5、X6與其他變量高度相關(guān),這說明主要是X5、X6引起了多重共線性,予以剔除。
表1 全國城鄉(xiāng)居民人民幣儲(chǔ)蓄情況(1999年~2012年)(單位:億元)
表2 歷年來皖游客在安徽省的消費(fèi)(單位:元)
表3 安徽省公路、鐵路的運(yùn)營里程
2.3.優(yōu)化模型
修正后的回歸模型為:
逐步回歸后的結(jié)果雖然實(shí)現(xiàn)了減輕多重共線性的目的,但反映基礎(chǔ)設(shè)施類影響的因素X5、X6也一并從模型中剔除了,可能會(huì)帶來設(shè)定誤偏。
表4 相關(guān)系數(shù)矩陣
3.1.單位根檢驗(yàn)
使用PP檢驗(yàn),根據(jù)序列的形態(tài),對(duì)各列采用同時(shí)包含截距和趨勢(shì)項(xiàng)的檢驗(yàn),最大滯后期采用Eview5.0[5]。根據(jù)樣本量自動(dòng)推薦的q值序列,LY, LX2,LX3,LX4,LX5,LX6的PP值分別為-2.30、-2.02、-0.59、-0.09、-1.82、-1.39,對(duì)應(yīng)95%置信水準(zhǔn)的臨界值是-3.57,故均不能拒絕時(shí)間序列存在單位根的假設(shè),從而它們都是非平穩(wěn)的。對(duì)經(jīng)過一階差分后序列進(jìn)行單位根檢驗(yàn),所得PP統(tǒng)計(jì)量分別為-4.74、-3.82、-4.27、-4.37、-3.62、-5.65,至少可以在95%的置信水準(zhǔn)下拒絕原假設(shè)。從每個(gè)變數(shù)的序列圖和一階差分圖中可以看出,每個(gè)對(duì)數(shù)化變數(shù)的序列圖有明顯的趨勢(shì),是非平穩(wěn)序列,而每個(gè)對(duì)數(shù)化變數(shù)的差分序列圖基本上在0附近波動(dòng),近似于平穩(wěn)序列。以上分析表明,6個(gè)對(duì)數(shù)化的產(chǎn)生序列都是I(1)序列,滿足協(xié)整檢驗(yàn)的條件。
3.2. 協(xié)整檢驗(yàn)
表5是年度資料在滯后區(qū)間為(1,1)時(shí)的JJ檢驗(yàn)結(jié)果。從表5可以看出,有4個(gè)擬然比統(tǒng)計(jì)量大于99%水準(zhǔn)下的臨界值,因而有4個(gè)原假設(shè)被拒絕,即存在多個(gè)協(xié)整關(guān)系。本文只關(guān)心擬然比統(tǒng)計(jì)量=329.5468時(shí)的協(xié)整假定關(guān)系下經(jīng)過標(biāo)準(zhǔn)化的協(xié)整系數(shù)[6],如表6所示。
表5 Johansen協(xié)整檢驗(yàn)結(jié)果
表6 標(biāo)準(zhǔn)化協(xié)整系數(shù)表
將上述協(xié)整關(guān)系用數(shù)學(xué)運(yùn)算式表達(dá)出來,使其結(jié)果等于vecm,具體如下:
對(duì)序列vecm進(jìn)行單位根檢驗(yàn),得出其是平穩(wěn)序列,并且其取值在0附近波動(dòng),驗(yàn)證了協(xié)整關(guān)系的正確性。上式反應(yīng)了6個(gè)時(shí)間序列之間長期穩(wěn)定的平衡關(guān)系。
3.3.向量誤差修正模型(VEC)
表6表明6個(gè)序列是協(xié)整的,并且通過驗(yàn)證的只有一個(gè)協(xié)整關(guān)系[7],可以建立該6個(gè)變量的VEC模型。根據(jù)Eview軟件的運(yùn)行可以得到VEC模型的參數(shù)估計(jì)值,估計(jì)結(jié)果如下:
研究年度VEC模型[8]整體效果的主要標(biāo)準(zhǔn)是AIC和SC,模型的AIC=-14.90264,SC=-11.03475都較小,說明該模型的整體模擬效果較好。
保留樣本模型誤差驗(yàn)證:(1)RMSE=1960.17;(2)MAE=4139;(3)MAPE=10.55%;(4)Theil’s IC=0.017。對(duì)2016年至2019年的安徽省游客量進(jìn)行預(yù)測(cè),預(yù)測(cè)資料見表7:
表7 安徽省游客量預(yù)測(cè)值(年度)
第一個(gè)多元線性回歸模型研究了安徽省旅游需求的影響因素,因?yàn)楣防锍毯丸F路里程引起了嚴(yán)重的多重共線性,所以被剔除。由模型可以看出,國內(nèi)旅游人數(shù)和可支配收入對(duì)旅游需求有很大影響,因此,如何最大程度的吸引游客和控制旅游物價(jià)應(yīng)該是安徽省旅游機(jī)構(gòu)的當(dāng)務(wù)之急。
第二個(gè)分析運(yùn)用了VEC模型,得出了安徽省游客量的未來預(yù)測(cè),為安徽省的旅游發(fā)展和規(guī)劃提供了很好的參考。如完善公共服務(wù)體系:擴(kuò)大安徽省
內(nèi)旅游公路的覆蓋率;注重旅游形態(tài)方面的協(xié)調(diào)發(fā)展轉(zhuǎn)變:隨著當(dāng)今生活水平的不斷提高,人們?cè)絹碓絻A向于自駕游和自助游,傳統(tǒng)的旅游模式已經(jīng)不能滿足當(dāng)前的市場(chǎng)需求,旅游業(yè)應(yīng)順應(yīng)這種發(fā)展趨勢(shì);結(jié)合省內(nèi)的資源和區(qū)位優(yōu)勢(shì),不斷創(chuàng)新,多層次多角度豐富旅游產(chǎn)品:全面發(fā)展休閑觀光度假游。
[1] 安徽省統(tǒng)計(jì)局.2012安徽統(tǒng)計(jì)年鑒[M].北京:中國統(tǒng)計(jì)出版社,2012.
[2] 龐皓,李南成.計(jì)量經(jīng)濟(jì)學(xué)學(xué)[M].四川:西南財(cái)經(jīng)大學(xué)出版社,2002.
[3] 何曉群,劉文卿.應(yīng)用回歸分析[M].北京:中國人民大學(xué)出版社,2001.
[4] 王燕.應(yīng)用時(shí)間序列分析,第三版[M].北京:中國人民大學(xué)出版社,2011.
[5] 姜啟源.數(shù)學(xué)模型[M].北京:高等教育出版社,1993.
[6] 沈繼紅,施久玉,高搬濱,等.數(shù)學(xué)建模[M].哈爾濱:哈爾濱工程大學(xué)出版社,1998.
[7] 余建英,何旭宏.數(shù)據(jù)統(tǒng)計(jì)分析與SPSS應(yīng)用[M].北京:人民郵電出版社,2003.
[8] 李柏文.國內(nèi)外城鎮(zhèn)旅游研究綜述[J].旅游學(xué)刊,2010,(6):28-35.
The application of regression model and VEC model in tourism research
LI Jie, Liu Zhaopeng, Fei Shilong, Ren Min ( Department of mathematics and statistics, Suzhou University, Suzhou, Anhui 234000, China )
According to the theory of multiple linear regression model, gather tourism related original data in Anhui province in recent years, for correlation analysis. Multiple linear regression model in the case of factors are given, and optimize the model, repair the serious collinearity. Further, use the VEC model to predict the prospects for development of tourism in Anhui province, provide reference for Anhui province's tourism development and planning.
the tourism industry, the regression model, the VEC model, test
O212
A
1673-9639 (2016) 04-0173-05
(責(zé)任編輯 毛 志)(責(zé)任校對(duì) 印有家)
2015-04-13
高校創(chuàng)新訓(xùn)練項(xiàng)目“Mean-CvaR模型及其兩基金定理的應(yīng)用研究”(AH201410379077);高校自然科學(xué)研究項(xiàng)目(KJ2016A770);宿州學(xué)院教學(xué)研究項(xiàng)目(szxy2015jy09;szxyjyxm201322)。
李 杰(1983-),男,安徽六安人,碩士,研究方向:概率論與數(shù)量統(tǒng)計(jì)。