張雪艷,陳傳鐘,胡曉華
(海南師范大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,海南海口571158)
海南從建省之初的“工、農(nóng)、貿(mào)、旅”并舉到后來的“一省兩地”戰(zhàn)略的提出,再到“大企業(yè)進(jìn)入,大項(xiàng)目帶動(dòng)”的實(shí)施,以及隨著《國務(wù)院關(guān)于推進(jìn)海南國際旅游島建設(shè)發(fā)展的若干意見》的發(fā)布,海南國際旅游島建設(shè)正式上升為國家戰(zhàn)略,極大拓寬了海南的發(fā)展視野.能否在這一歷史機(jī)遇面前實(shí)現(xiàn)歷史性突破,對于海南至關(guān)重要.
時(shí)間序列是按時(shí)間順序排列的一組數(shù)字序列.利用這組序列,應(yīng)用數(shù)理統(tǒng)計(jì)方法加以處理,以預(yù)測未來事物的發(fā)展.本文是以海南省過夜旅游人數(shù)作預(yù)測分析.所謂過夜旅游人數(shù)是指逗留時(shí)間至少超過一夜的旅游人數(shù).旅游人數(shù)是考核旅游業(yè)的重要指標(biāo)之一.
季節(jié)模型[1]是反映具有季節(jié)變動(dòng)規(guī)律的時(shí)間序列模型.為了更好的觀察數(shù)據(jù)波動(dòng)的情況一般把傳統(tǒng)時(shí)間序列的波動(dòng)歸結(jié)為四大因素:趨勢變動(dòng)(trend T),季節(jié)變動(dòng)(seasonal S),循環(huán)變動(dòng)(circle C)和不規(guī)則變動(dòng)(irregular I).含有趨勢性的時(shí)間序列用乘法模型X=TSCI;四大因素之間相互獨(dú)立時(shí)則用加法模型X=T+S+C+I.季節(jié)因子(S)反映隨時(shí)間變化受季節(jié)因素的影響程度.季節(jié)調(diào)整模型的建立主要是對季節(jié)因子的測定,其基本步驟是:(1)測定趨勢T(采用移動(dòng)平均法);(2)剔除趨勢部分;(3)測定季節(jié)因子.
SARIMA模型[2]是ARIMA模型的特例,是描述一些明顯由季節(jié)變化或其他固有因素引起的周期性時(shí)間序列的模型.
SARIMA模型是建立在平穩(wěn)時(shí)間序列基礎(chǔ)上的模型,通過對原序列的不斷平穩(wěn)化最終建立模型,見式(1):
式中B為滯后算子,Φp(B)是非季節(jié)p階自回歸算子;Ap(Bs)是季節(jié)P階自回歸算子;Θq(B)是非季節(jié)q階移動(dòng)回歸算子;HQ(Bs)是季節(jié)Q階移動(dòng)回歸算子;Δd=(1-B)d是進(jìn)行d階逐期差分算子;=(1-Bs)D是D階季節(jié)差分算子;Δdxt是原序列xt經(jīng)過d階逐期差分與D階季節(jié)差分后的平穩(wěn)序列;且
Φp(B) Δdxt表示同一周期內(nèi)不同周期點(diǎn)的相關(guān)關(guān)系;Ap(B)則描述不同周期的同一周期點(diǎn)上的相關(guān)關(guān)系;兩者的乘積則刻畫了兩個(gè)因素的共同作用.
SARIMA建模的基本步驟[3]:(1)根據(jù)原數(shù)列時(shí)序圖的特性,進(jìn)行差分與季節(jié)差分把原序列xt變成一個(gè)平穩(wěn)的時(shí)間序列yt,然后進(jìn)行平穩(wěn)性的單位根與相關(guān)圖檢驗(yàn)最終確定d,D;(2)通過對相關(guān)圖在S周期處的自相關(guān)與偏自相關(guān)系數(shù)值,確定P,Q的值;并通過相關(guān)圖的拖尾性與截尾性來判定p,q的值;(3)對原序列xt建立
模型;(4)進(jìn)行模型的參數(shù)估計(jì)與適應(yīng)性檢驗(yàn):(a)由差分序列的適當(dāng)自相關(guān)與偏自相值求得模型的初始估計(jì)值,并將這些估計(jì)值作為最小二乘估計(jì)的初始值,對模型參數(shù)進(jìn)行最小二乘估計(jì).(b)對估計(jì)得到的暫定模型進(jìn)行適應(yīng)性檢驗(yàn),若不接受暫定模型則表明不是最優(yōu)模型,可根據(jù)檢驗(yàn)所提供的有關(guān)信息改進(jìn)模型,重新擬合改進(jìn)模型,并對其進(jìn)行適應(yīng)性檢驗(yàn),直到得到最優(yōu)模型為止;(5)根據(jù)(4)建立的方程模型使用Eviews6.0軟件中的Forecast功能對其進(jìn)行預(yù)測,并估計(jì)其值誤差的大小來判定最終預(yù)測值.
通過使用計(jì)量經(jīng)濟(jì)學(xué)軟件Eviews6.0[4]對附表1的數(shù)據(jù)進(jìn)行季節(jié)調(diào)整,所得相關(guān)圖形見圖1~圖5.
由圖1~圖5看出,該序列有明顯的規(guī)律性.因此可以建立如下的乘積預(yù)測模型,見式(4):
其中f(t)為模型的趨勢部分,si為季節(jié)指數(shù).
通過對季節(jié)調(diào)整后的序列X_SA進(jìn)行試擬合f(t)模型,所得的相關(guān)參數(shù)值見表1.
表1 相關(guān)參數(shù)值Tab.1 The relevant parameter value
根據(jù)數(shù)據(jù)調(diào)整后的樣本決定系數(shù)(Adjusted R2)、AIC準(zhǔn)則與SC準(zhǔn)則、預(yù)測時(shí)的平均絕對百分誤差(Mean Abs.percent Error簡記MAPE)和希爾不等系數(shù)(T heil Inequality coefficient簡記T-I-C),確定趨勢模型為式(5):
所建立的預(yù)測模型為式(6):
2.2.1 數(shù)據(jù)分析(平穩(wěn)化)
根據(jù)圖3對應(yīng)的季節(jié)因子,利用式(5)、式(6)計(jì)算2011年9月至2012年8月海南過夜旅游人數(shù)得到預(yù)測結(jié)果,見表2.
表2 2011年9月至2012年8月海南過夜旅游人數(shù)預(yù)測結(jié)果Tab.2 The forecast number of overnight tourist in Hainan from September 2011 to October 2012
利用Eviews6對2011年9月到2012年8月的數(shù)據(jù)作時(shí)序見圖6,圖6表明:序列隨時(shí)間變化存在周期性與趨勢性,從而該序列為非平穩(wěn)的時(shí)間序列.由于數(shù)據(jù)具有指數(shù)函數(shù)增長趨勢,為了減小數(shù)據(jù)的這種波動(dòng)影響首先對其取對數(shù)后進(jìn)行一階差分,即yt=ln(xt)-ln(xt-1),再檢驗(yàn)?zāi)P褪欠窈屑竟?jié)性.所得的自相關(guān)圖中,當(dāng)K=12時(shí)序列的自相關(guān)系數(shù)是0.684,大大超出了隨機(jī)區(qū)間的范圍,有顯著的差異,表明該序列具有周期性的季節(jié)波動(dòng).要使數(shù)列平穩(wěn)需再進(jìn)行一次季節(jié)差分,即zt=yt-yt-12,所得自相關(guān)圖,見表3.
表3 一次差分與一次季節(jié)差分后的自相關(guān)表Tab.3 A difference and once the season differential autocorrelogram
表3表明:當(dāng)K>4時(shí),序列的自相關(guān)系數(shù)很快的趨于0,即落入隨機(jī)區(qū)間.對此時(shí)序進(jìn)行單位根檢驗(yàn),所得結(jié)果見表4.
?
由表4知,t統(tǒng)計(jì)量的檢測值為-14.48537小于所有置信區(qū)間的臨界值,表明序列平穩(wěn).即:H0∶r=0H1∶r=1
t統(tǒng)計(jì)量的檢驗(yàn)值<臨界值,所以拒絕H0,序列沒有單位根,即平穩(wěn).
2.2.2 模型的識(shí)別與檢驗(yàn)
由AR、MA、ARMA模型的自相關(guān)與偏自相關(guān)特性,判定其模型類型參照表5.
表5 AR、MA、ARMA模型的自相關(guān)與偏自相關(guān)的識(shí)別與檢驗(yàn)表[5]Tab.5 AR、MA、ARMA model's identification and inspection of ACF and PACF
由上述平穩(wěn)化的過程可知:d=1,D=1;由于K=12時(shí)樣本的自相關(guān)系數(shù)-0.084與偏自相關(guān)系數(shù)-0.202都不顯著,為0,所以P=Q=1;再次由zt的相關(guān)圖可以嘗試建立(p,q)分別為(1,1),(2,1),(3,1),(3,2),(4,1),(4,2),(4,3)的模型,然后進(jìn)行取優(yōu),所得相關(guān)檢驗(yàn)結(jié)果見表6.
由表6知:首先,擬建立的七個(gè)模型都滿足AR?MA過程的平穩(wěn)條件(無單位根)及可逆條件(AR模型與MA模型可以相互轉(zhuǎn)化),可知模型設(shè)定的合理.其次,殘差序列的白噪聲檢驗(yàn)的相伴概率(p-Q)的值看出,各模型殘差均是白噪聲過程,滿足獨(dú)立性的假設(shè).再次,根據(jù)模型的平均絕對百分誤差(MAPE)的值都小于10,可知模型擬合的都很好.最后,鑒于AIC與SC準(zhǔn)則與希爾不等系數(shù)(Theil Inequality coefficient)、樣本決定系數(shù)(Ad?justed R2)及考慮到AR模型是線性方程估計(jì),實(shí)際建模時(shí)一般希望用高階的AR模型替換ARMA模型,因此選定(p,q)?。?,1)時(shí)進(jìn)行建立SARIMA(1,1,1)×(1,1,1)12模型比較合適.擬合模型的相關(guān)系數(shù)見表7.
代入(1)式整理成方程,見式(7).
表6 模型檢驗(yàn)結(jié)果Tab.6 The results of model
?
其中μt為上述檢驗(yàn)為零均值的白噪聲序列,即原序列的殘差序列是白噪聲序列.
2.2.3 預(yù)測
根據(jù)(7)式,直接在Eviews6中預(yù)測2011年9月至2012年8月的旅游人數(shù),所得結(jié)果見表8.對海南2012年9月-2013年8月的旅游人數(shù)作出預(yù)測,所得結(jié)果見表9.
表8 2011年9月至2012年8月海南過夜旅游人數(shù)預(yù)測結(jié)果Tab.8 The forecast number of overnight tourist in Hainan from September 2011 to October 2012
1)比較季節(jié)調(diào)整模型與SARIMA模型對2011年9月到2012年8月海南過夜旅游人數(shù)的真實(shí)值與預(yù)測值的均方誤差發(fā)現(xiàn):對于季節(jié)調(diào)整模型的均方誤差為15.26,而SARIMA模型所得的均方誤差為12.15,從而可知SARIMA模型預(yù)測較優(yōu).根據(jù)數(shù)據(jù)作季節(jié)調(diào)整模型與SARIMA模型擬合圖,結(jié)果見圖7.其中X表示實(shí)際值;X1表示季節(jié)調(diào)整模型的預(yù)測值;X2表示SARIMA模型的預(yù)測值.
表9 2012年9月至2013年8月海南過夜旅游人數(shù)預(yù)測結(jié)果Tab.9 The forecast number of overnight tourist in Hainan from September 2012 to October 2013
[1] 易丹輝.數(shù)據(jù)分析與Eviews6應(yīng)用[M].北京:中國人民大學(xué)出版社,2008:103-111,122-151.
[2] 王振龍.時(shí)間序列分析[M].北京:中國統(tǒng)計(jì)出版社,2000:184-192.
[3] 安瀟瀟.ARMA相關(guān)模型及其應(yīng)用[D].河北:燕山大學(xué)碩士學(xué)位論文,2008.
[4] 張曉峒.計(jì)量經(jīng)濟(jì)學(xué)軟件Eviews2使用指南[M].天津:南開大學(xué)出版社,2004:29-47.
[5]過曉芳.基于ARIMA模型的國內(nèi)旅游人數(shù)預(yù)測研究[J].科技信息,2007(8):21-22.
附表1海南省2002年9月至2012年8月接待過夜旅游者人數(shù)(單位:萬人)Extra Tab.1 The number of overnight tourist in Hainan from September 2002 to October 2012(Unit:ten thousand)