陳榮梁昌勇葛立新
(1.蚌埠學(xué)院經(jīng)濟(jì)與管理學(xué)院,安徽蚌埠233030;
2.合肥工業(yè)大學(xué)管理學(xué)院,安徽合肥230009;3.蚌埠學(xué)院理學(xué)院,安徽蚌埠233030)
基于SEA的AGA-SVR節(jié)假日客流量預(yù)測(cè)方法研究
陳榮1梁昌勇2葛立新3
(1.蚌埠學(xué)院經(jīng)濟(jì)與管理學(xué)院,安徽蚌埠233030;
2.合肥工業(yè)大學(xué)管理學(xué)院,安徽合肥230009;3.蚌埠學(xué)院理學(xué)院,安徽蚌埠233030)
節(jié)假日旅游客流量由于游客在短期內(nèi)大量集中于同一地點(diǎn)、不同節(jié)假日休假時(shí)間長短、所處季節(jié)等不同,呈現(xiàn)復(fù)雜非線性特征和明顯季節(jié)性特點(diǎn)。本文提出一種基于季節(jié)指數(shù)調(diào)整(Seasonal Exponential Adjustment,SEA)的自適應(yīng)遺傳算法(Adaptive Genetic Algorithm,AGA)-支持向量回歸(Support Vector Regression,SVR)預(yù)測(cè)模型,即基于SEA的AGA-SVR模型,并用國內(nèi)著名5A級(jí)風(fēng)景區(qū)黃山2008~2012年節(jié)假日客流量數(shù)據(jù)對(duì)模型進(jìn)行驗(yàn)證。研究結(jié)果表明,基于SEA的AGA-SVR預(yù)測(cè)模型能夠準(zhǔn)確處理節(jié)假日旅游客流量預(yù)測(cè)中的非線性和季節(jié)性問題,較AGA-SVR和GASVR等方法具有更高的預(yù)測(cè)精度,在旅游預(yù)測(cè)領(lǐng)域應(yīng)用前景廣闊。
季節(jié)指數(shù)調(diào)整;支持向量回歸;自適應(yīng)遺傳算法;節(jié)假日旅游客流量預(yù)測(cè)
2008年我國實(shí)行新的休假制度,將每年節(jié)假日休假定為元旦、春節(jié)、清明節(jié)、端午節(jié)、勞動(dòng)節(jié)、中秋節(jié)和國慶節(jié),每年休假天數(shù)共計(jì)29天。新休假制度的實(shí)施帶動(dòng)了假日經(jīng)濟(jì)、假日旅游的興起,成為我國國民經(jīng)濟(jì)新的增長點(diǎn),但同時(shí)也帶來一系列問題:大量游客在同一時(shí)間集中于同一地點(diǎn),造成景區(qū)超載、交通擁擠、住宿緊張、服務(wù)質(zhì)量下降、安全隱患增多等問題。近年來九寨溝、華山、張家界、黃山等景區(qū)頻繁發(fā)生的節(jié)假日游客擁堵事件,給旅游景區(qū)造成了很大的負(fù)面影響。準(zhǔn)確的節(jié)假日客流量預(yù)測(cè)能夠使景區(qū)管理部門提前決策,有效避免此類事件發(fā)生。但是由于各節(jié)假日所處季節(jié)不同、休假時(shí)間長短不同,節(jié)假日旅游客流量除了由一年四季等自然因素形成的自然季節(jié)性外,還存在由節(jié)假日等制度因素而造成制度季節(jié)性。兩種季節(jié)性的疊加對(duì)節(jié)假日客流量的準(zhǔn)確預(yù)測(cè)產(chǎn)生很大的影響(Song,Li,2008)。因此如何進(jìn)行季節(jié)調(diào)整、實(shí)現(xiàn)準(zhǔn)確預(yù)測(cè)一直是文獻(xiàn)研究關(guān)注的重點(diǎn)。
目前季節(jié)調(diào)整的方法,一種是以自回歸移動(dòng)平均模型(Autoregressive Integrated Moving Average,ARIMA)為基礎(chǔ)的季節(jié)處理方法,如季節(jié)自回歸移動(dòng)平均模型(Seasonal Autoregressive Integrated Moving Average,SARIMA)方法,Huang和Min (2002)利用該種方法實(shí)現(xiàn)了對(duì)季節(jié)性的處理;此外,X-11-ARIMA和X-12-ARIMA等方法也常被用來進(jìn)行季節(jié)調(diào)整(Shiskin,et al.,1967;Findley,et al.,1998)。該類方法主要通過差分的方式來消除季節(jié)性的影響,但實(shí)踐證明,差分只對(duì)消除線性趨勢(shì)的季節(jié)性有效(Nelson,Plosser,1982),對(duì)非線性趨勢(shì)明顯的季節(jié)性,以ARIMA為基礎(chǔ)的方法預(yù)測(cè)精度明顯不足;而且以ARIMA為基礎(chǔ)的季節(jié)處理方法,缺乏明確的關(guān)于原時(shí)間序列的分解模型,必須要事先設(shè)定好模型形式,因而在實(shí)際運(yùn)用過程中,無法知道數(shù)據(jù)的真正形成過程,不能正確把握客流量性質(zhì)(Zhang,Qi,2005)。季節(jié)調(diào)整的另一種方法為季節(jié)指數(shù)調(diào)整方法(Seasonal Exponential Adjustment,SEA),這是一種對(duì)原始數(shù)據(jù)直接進(jìn)行季節(jié)處理(data deseasonalization)的方法,它通過季節(jié)指數(shù)來修正原始數(shù)據(jù)及預(yù)測(cè)結(jié)果,使其更符合實(shí)際數(shù)據(jù)變化的客觀規(guī)律。通過SEA,原始數(shù)據(jù)的季節(jié)性得到調(diào)整及消除。Gardne和McKenzie(1989)、翁鋼民和李凌雁(2014)通過研究發(fā)現(xiàn),利用該方法對(duì)數(shù)據(jù)進(jìn)行季節(jié)處理,預(yù)測(cè)的準(zhǔn)確性大大提高;Tseng等人(2002)的研究顯示,當(dāng)SEA方法和其他預(yù)測(cè)方法組合進(jìn)行預(yù)測(cè)時(shí),預(yù)測(cè)效果均好于不使用SEA方法。
另一方面,節(jié)假日旅游客流量除了季節(jié)性特點(diǎn)之外,非線性趨勢(shì)明顯。傳統(tǒng)時(shí)間序列預(yù)測(cè)方法對(duì)具有線性特征的旅游客流量有較好的預(yù)測(cè)效果,但對(duì)于復(fù)雜的非線性旅游客流量預(yù)測(cè)往往難以實(shí)現(xiàn)。人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,ANN)為非線性旅游客流量預(yù)測(cè)提供了一種方法,但難以克服自身局部最優(yōu)等缺點(diǎn),且ANN方法往往需要大樣本訓(xùn)練,國內(nèi)各大景區(qū)由于實(shí)現(xiàn)數(shù)字信息化時(shí)間短,難以獲得所需要的大量樣本,因此ANN方法往往達(dá)不到所需的預(yù)測(cè)精度。SVR作為一種統(tǒng)計(jì)學(xué)習(xí)理論方法,克服了傳統(tǒng)時(shí)間序列預(yù)測(cè)方法和ANN的上述缺點(diǎn),在解決非線性、小樣本旅游客流量預(yù)測(cè)方面表現(xiàn)出許多特有的優(yōu)勢(shì),逐漸成為學(xué)者們預(yù)測(cè)旅游客流量的一種重要工具,預(yù)測(cè)效果明顯優(yōu)于ARIMA、ANN等方法(Chen,Wang,2007;Cai,et al.,2009;Chen,2011)。雖然SVR在非線性預(yù)測(cè)方面表現(xiàn)出特有優(yōu)勢(shì),但在處理季節(jié)性方面仍有一定不足。因此建立一個(gè)科學(xué)準(zhǔn)確的、能夠同時(shí)處理季節(jié)性和非線性的節(jié)假日客流量預(yù)測(cè)模型,可為旅游景區(qū)在節(jié)假日旅游高峰期分流游客、科學(xué)調(diào)度提供直接信息,對(duì)旅游風(fēng)景區(qū)尤其是熱門景區(qū)乃至整個(gè)旅游行業(yè)意義重大。
由于SVR預(yù)測(cè)精度受其自由參數(shù)(C,ε,σ)影響,Chen等(2007)將遺傳算法(Genetic Algorithm,GA)和SVR結(jié)合實(shí)現(xiàn)客流量預(yù)測(cè),效果雖優(yōu)于反向傳播神經(jīng)絡(luò)(Back-Propagation Neural Network,BPNN)方法,但是GA存在過早收斂、局部最優(yōu)等問題。AGA克服了GA的缺陷,已有研究表明,將AGA和SVR結(jié)合可以實(shí)現(xiàn)準(zhǔn)確預(yù)測(cè)(Zhang,et al.,2014)。因此,本文引入AGA實(shí)現(xiàn)對(duì)SVR參數(shù)的自適應(yīng)尋優(yōu),將SEA、AGA和SVR這3種工具結(jié)合,建立基于SEA的AGA-SVR預(yù)測(cè)模型,實(shí)現(xiàn)對(duì)季節(jié)性、非線性的節(jié)假日旅游客流量的預(yù)測(cè)。
1.1SEA過程
步驟1在時(shí)間t的客流量xt可表示為季節(jié)成分與趨勢(shì)成分的乘積,則季節(jié)指數(shù)Is為:
步驟2用每一個(gè)周期中xi的均值作為趨勢(shì)成分近似值,重新對(duì)數(shù)據(jù)集x1,x2,…,xT排列為:x1l,x2l,…,x1l,…;xk1,xk2,…,xkl,…;xm1,xm2,…,xml。k=1,2,…,m;s=1,2,…,l;T=m×l,m為周期數(shù),l為周期內(nèi)數(shù)據(jù)數(shù)目。
步驟3計(jì)算每個(gè)周期的均值,然后將數(shù)據(jù)xks標(biāo)準(zhǔn)化,計(jì)算季節(jié)指數(shù)Ij,即:
因?yàn)?/p>
所以季節(jié)指數(shù)Ij遵循標(biāo)準(zhǔn)化的定義。
步驟4利用季節(jié)指數(shù)Ij,消除過季節(jié)影響因素的新數(shù)據(jù)為:
再重新排列數(shù)據(jù)集x'11,x'12,…,x'1l,…;x'k1,x'k2,…,x'kl,…;x'm1,x'm2,…,x'ml得到了經(jīng)過季節(jié)指數(shù)調(diào)整的新數(shù)據(jù)集。具體流程如圖1所示(ave表示均值)。
圖1 季節(jié)指數(shù)調(diào)整(SEA)流程
1.2SVR原理
SVR主要原理是通過一個(gè)非線性變換x→(x)將訓(xùn)練樣本映射到高維空間,在高維空間通過核函數(shù)實(shí)現(xiàn)線性變換(Vapnik,2009)。設(shè)給定的訓(xùn)練樣本(xi,yi),i=1,2,…,n;xi=Rn;yi∈R;xi為輸入向量;yi為xi相對(duì)應(yīng)的輸出值;n為訓(xùn)練樣本個(gè)數(shù),SVR根據(jù)如下式子來對(duì)回歸函數(shù)進(jìn)行估計(jì):
由結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則可知,下式即為尋求使風(fēng)險(xiǎn)最小的f:
通過引入Lagrange函數(shù)和KKT(Karush-Kuhn-Tucker)條件(Vapnik,2009),最后得到回歸函數(shù)f(x)的表達(dá)式為:
ai,為Lagrange乘子。根據(jù)節(jié)假日客流量非線性特點(diǎn),本文選取Gaussian RBF為核函數(shù),即:
上式中σ為核的寬度,xi為訓(xùn)練集輸入值,x為測(cè)試集輸入值。
1.3 AGA算法尋優(yōu)原理
AGA克服了經(jīng)典GA的無法收斂到全局最優(yōu)、染色體易丟失和過早收斂等問題(許光濘,等,2007)。它的主要原理是交叉和變異概率pc、pm隨種群適應(yīng)值自適應(yīng)變化(Srinivas,Patnaik,1994)。具體過程如下(王萬良,等,2004):
其中,favg表示為每代群體平均適應(yīng)值,fmax分別表示每代群體中個(gè)體最大適應(yīng)值,f為被選擇變異個(gè)體適應(yīng)值,f'為被選擇交叉的兩個(gè)個(gè)體中較大適應(yīng)值;pc2、pm2均非零,分別為群體中最大適應(yīng)值個(gè)體的交叉概率和變異概率。由(12)知,如f'=fmax,f=fmax,則pc= pc2,pm=pm2。算法采用精英保留策略,將每一代的優(yōu)良個(gè)體直接復(fù)制到下一代中。
1.4 基于SEA的AGA-SVR模型建模過程
步驟1歸一化季節(jié)指數(shù)調(diào)整數(shù)據(jù)。根據(jù)式(2)~(6),按照?qǐng)D1流程順序,對(duì)原始數(shù)據(jù)進(jìn)行季節(jié)指數(shù)調(diào)整,將消除季節(jié)因素的新數(shù)據(jù)進(jìn)行歸一化,再根據(jù)預(yù)測(cè)需要將新數(shù)據(jù)分為訓(xùn)練集、測(cè)試集,并分別輸入模型。
步驟2種群初始化。將SVR參數(shù)(C,ε,σ)編碼為染色體X,即X={C,ε,σ},對(duì)其隨機(jī)初始化。
步驟3適應(yīng)值評(píng)估。用訓(xùn)練集對(duì)初始化的SVR參數(shù)對(duì)進(jìn)行訓(xùn)練,參數(shù)優(yōu)化準(zhǔn)則采用交叉驗(yàn)證(Cross Validation,CV)。選取均方誤差(Mean Square Error,MSE)為適應(yīng)值函數(shù)(杜京義,侯媛彬,2006):
這里yi分別為實(shí)際值和預(yù)測(cè)值,n是測(cè)試樣本個(gè)數(shù)。通過(13)式計(jì)算SVR參數(shù)適應(yīng)值f,以f值作為選取參數(shù)的標(biāo)準(zhǔn)。同時(shí)根據(jù)輪盤賭方法選擇N個(gè)個(gè)體(N為偶數(shù)),計(jì)算群體favg、fmax。
步驟4交叉和突變。根據(jù)公式(12)計(jì)算自適應(yīng)pc和pm,以pc和pm分別進(jìn)行交叉和突變,隨機(jī)產(chǎn)生R(0,1),若R小于pc、pm,則對(duì)SVR參數(shù)(C,ε,σ)進(jìn)行交叉和突變。
步驟5最優(yōu)策略。計(jì)算通過交叉、變異產(chǎn)生的新個(gè)體f值,新個(gè)體同父代共同組成新一代種群,若新種群產(chǎn)生的最小f值較老種群的小,則替換老的染色體。
步驟6停止準(zhǔn)則。若被執(zhí)行代數(shù)和指定代數(shù)相等(這里進(jìn)化代數(shù)設(shè)置為100),則結(jié)束,同時(shí)將獲得的最優(yōu)參數(shù)(C,ε,σ)帶入SVR預(yù)測(cè)。否則轉(zhuǎn)向步驟3。
步驟7預(yù)測(cè)值季節(jié)調(diào)整。將AGA-SVR預(yù)測(cè)值乘以季節(jié)指數(shù)(Is),得到經(jīng)過季節(jié)調(diào)整的預(yù)測(cè)值。具體的模型流程圖見圖2。
圖2 基于SEA的AGA-SVR模型流程圖
2.1 數(shù)據(jù)來源
本文數(shù)據(jù)來源于黃山風(fēng)景區(qū)信息中心。數(shù)據(jù)顯示,2008~2012年,黃山風(fēng)景區(qū)節(jié)假日(元旦、春節(jié)、清明節(jié)、端午節(jié)、勞動(dòng)節(jié)、中秋節(jié)和國慶節(jié))客流總量占全年客流總量的百分比分別為15.01%、13.05%、15.79%、18.71%和15.56%,客流量在短期內(nèi)聚集,多而集中,給景區(qū)的資源和調(diào)度等工作造成很大的壓力。因此本文選取黃山風(fēng)景區(qū)2008~2012年4年間每年所有節(jié)假日每日數(shù)據(jù)作為研究對(duì)象,具有重要的代表性。該數(shù)據(jù)集包括:每年所有節(jié)假日每日客流量、每年所有節(jié)假日每日上午8點(diǎn)前客流量和每年所有節(jié)假日每日人體舒適度指數(shù)(Human Comfort Index,HCI),分別定義為{X1,X2,X3},其中每個(gè)變量包含數(shù)據(jù)的個(gè)數(shù)為145。具體如圖3、圖4所示。
圖3 2008~2012年節(jié)假日每日客流量
圖4 2008~2012年節(jié)假日每日人體舒適度指數(shù)(HCI)
由圖3、圖4可知:
(1)不同的節(jié)假日休假時(shí)間長短不同,客流量的波動(dòng)情況不同,每個(gè)節(jié)假日均呈現(xiàn)明顯“兩頭低中間高”現(xiàn)象,非線性趨勢(shì)明顯;
(2)由于氣候、消費(fèi)者每年相同旅游行為等因素影響,每年節(jié)假日客流量數(shù)據(jù)呈現(xiàn)出明顯的季節(jié)性和年度周期性的特征,大體表現(xiàn)為“三峰三谷”特點(diǎn);
(3)每日8點(diǎn)前客流量、每日人體舒適度指數(shù)對(duì)每日客流量產(chǎn)生重要影響,可將這兩個(gè)因素作為客流量的影響因素。
2.2 數(shù)據(jù)處理
按照?qǐng)D2流程,首先對(duì)原始數(shù)據(jù)集進(jìn)行SEA處理,計(jì)算出每個(gè)節(jié)假日每天的季節(jié)調(diào)整指數(shù)(Is)(見表1)。然后根據(jù)(7)式,對(duì)2008~2012年節(jié)假日每日客流量、每日8點(diǎn)前上山客流量及每日人體舒適度指數(shù)進(jìn)行季節(jié)指數(shù)調(diào)整。調(diào)整后的數(shù)據(jù)如圖5、圖6所示??梢钥闯?,經(jīng)過季節(jié)指數(shù)調(diào)整,每日客流量、每日8點(diǎn)前上山客流量及每日人體舒適度指數(shù)等數(shù)據(jù)波動(dòng)幅度降低,數(shù)據(jù)集的季節(jié)性得到消除,呈現(xiàn)典型非線性特點(diǎn)。
表1 不同節(jié)假日季節(jié)指數(shù)(Is)
圖5 2008~2012年SEA調(diào)整后每日客流量、每日8點(diǎn)前客流量
圖6 2008~2012年SEA調(diào)整后每日人體舒適度指數(shù)
2.3 模型參數(shù)設(shè)置及預(yù)測(cè)過程
不同節(jié)假日休假時(shí)間長短對(duì)客流量產(chǎn)生明顯的影響,為了能夠體現(xiàn)出它們?cè)诳土髁款A(yù)測(cè)中的影響,引入虛擬變量(Kyriakides,Polycarpou,2007),具體如下:
設(shè)季節(jié)調(diào)整處理后的新數(shù)據(jù)集為{X'1,X'2,X'3;D1,D2,…,D7}。將新數(shù)據(jù)集被分為訓(xùn)練集和測(cè)試集,其中訓(xùn)練集所選數(shù)據(jù)為2008~2011年黃山風(fēng)景區(qū)節(jié)假日客流量相關(guān)數(shù)據(jù),樣本數(shù)目116個(gè);測(cè)試集為2012年節(jié)假日客流量相關(guān)數(shù)據(jù),樣本數(shù)目為29個(gè),同時(shí)對(duì)數(shù)據(jù)進(jìn)行歸一化。
表2AGA參數(shù)設(shè)置
通過Matlab7.0(R2010b)試驗(yàn)平臺(tái),輸入歸一化后的新數(shù)據(jù)集,定義SVR自由參數(shù)初始化種群的粒子,然后對(duì)種群數(shù)量、進(jìn)化代數(shù)、學(xué)習(xí)因子、自適應(yīng)權(quán)重進(jìn)行反復(fù)取值測(cè)試,最終將AGA各參數(shù)設(shè)置為如表2所示。同時(shí)將交叉驗(yàn)證的折數(shù)設(shè)為10。經(jīng)過AGA參數(shù)尋優(yōu),最終獲得SVR模型的最優(yōu)參數(shù)值分別為:C=9.9427,σ2=9.1912,ε=0.0167;CVmse=0.0145%;支持向量個(gè)數(shù)為47,b=-0.6455。將獲得的最優(yōu)參數(shù)值帶入SVR模型進(jìn)行測(cè)試,得到模型預(yù)測(cè)值,將預(yù)測(cè)值乘以季節(jié)調(diào)整指數(shù),即為2012年節(jié)假日客流量預(yù)測(cè)值。
2.4 實(shí)驗(yàn)結(jié)果分析
為了驗(yàn)證基于SEA的AGA-SVR預(yù)測(cè)的準(zhǔn)確性,本文將用AGA-SVR作為對(duì)比模型,同時(shí)為了證明本文所選取的AGA的有效性,將GA-SVR也作為對(duì)比方法。將沒有經(jīng)過季節(jié)處理的AGA-SVR預(yù)測(cè)值、GA-SVR預(yù)測(cè)值與實(shí)際值進(jìn)行比較,結(jié)果如圖7、表3所示。為了進(jìn)一步比較各模型預(yù)測(cè)結(jié)果與實(shí)際值的偏差程度,本文使用的評(píng)價(jià)指標(biāo)分別為平均絕對(duì)誤差(Mean Absolute Error,MAE)和均方根誤差(Root Mean Square Error,RMSE)(Hong,et al.,2011)、平均絕對(duì)百分誤差(Mean Absolute Percentage Error,MAPE)和相關(guān)系數(shù)R(Chen,Wang,2007)(見表4)。
由圖7、表3和表4可知:
(1)從圖7可以看出,基于SEA的AGA-SVR模型由于在預(yù)測(cè)之前有效地消除了原始數(shù)據(jù)的季節(jié)成分,使得消除季節(jié)成分后的數(shù)據(jù)更符合SVR預(yù)測(cè)的要求,且預(yù)測(cè)之后通過對(duì)預(yù)測(cè)值再次季節(jié)調(diào)整,使得預(yù)測(cè)值更接近于實(shí)際值,因此預(yù)測(cè)效果較AGA-SVR、GA-SVR更優(yōu)。
(2)通過表3可以看出,2012年節(jié)假日29天預(yù)測(cè)值中,基于SEA的AGA-SVR模型預(yù)測(cè)值最接近實(shí)際值的天數(shù)為15天,而AGA-SVR為9天,GA-SVR僅為5天,充分說明了本文提出的基于SEA的AGA-SVR模型預(yù)測(cè)效果優(yōu)于AGA-SVR、GASVR,尤其體現(xiàn)在每個(gè)節(jié)假日的人數(shù)高峰期如春節(jié)(第4、5天)、端午節(jié)(第2天)、中秋節(jié)(第2天)和國慶節(jié)(第2、3天)等,可能的原因在于:在節(jié)假日期間,客流量一般呈現(xiàn)出典型的“兩頭低中間高”季節(jié)性趨勢(shì),該模型對(duì)處理這種季節(jié)趨勢(shì)明顯的客流量相對(duì)更有效。這對(duì)旅游景區(qū)有極大的實(shí)際意義,因?yàn)檫@些時(shí)段游客最多,最容易發(fā)生擁堵等突發(fā)事件,提前預(yù)知客流量,為游客分流、減少門票售出等決策提供重要參考。
圖7 不同模型預(yù)測(cè)值比較
表3 不同模型預(yù)測(cè)值比較(歸一化后)
表4 不同模型評(píng)價(jià)指標(biāo)比較
(3)從預(yù)測(cè)偏差的角度可以看出(見表4),基于SEA的AGA-SVR模型MAE、MAPE和RMSE值較AGA-SVR、GA-SVR最小,相關(guān)系數(shù)R最大,說明基于SEA的AGA-SVR模型預(yù)測(cè)的值最接近實(shí)際值,結(jié)果進(jìn)一步證明了經(jīng)過季節(jié)處理的SVR模型預(yù)測(cè)效果優(yōu)于未進(jìn)行季節(jié)處理模型。
(4)同時(shí)也可以發(fā)現(xiàn),在3種模型中,基于SEA的AGA-SVR模型預(yù)測(cè)效果并不總是好于AGA-SVR和GA-SVR,這種情況多出現(xiàn)在節(jié)假日的最后1天,如勞動(dòng)節(jié)、端午節(jié)、中秋節(jié)、國慶節(jié)及整個(gè)元旦期間,可能的原因在于:在節(jié)假日最后1天,客流量將會(huì)急劇的回落,這種情況更符合“旅游系統(tǒng)發(fā)展天然而穩(wěn)定的趨勢(shì)和時(shí)間規(guī)律”(Faulkner,Russell,1997),人數(shù)波動(dòng)較小,季節(jié)性趨勢(shì)不明顯,此時(shí)AGA-SVR和GA-SVR相對(duì)來說更有效些,也從另外一個(gè)側(cè)面說明了基于SEA的AGA-SVR模型對(duì)季節(jié)趨勢(shì)明顯的節(jié)假日客流量預(yù)測(cè)的有效性。
(5)在AGA-SVR和GA-SVR比較中,AGA-SVR的總體評(píng)價(jià)指標(biāo)較GA-SVR相對(duì)來說更有效些,說明了AGA克服了經(jīng)典GA的無法收斂到全局最優(yōu)、染色體易丟失和過早收斂等問題,自適應(yīng)尋優(yōu)參數(shù)能力較GA更有效。
綜合以上因素,基于SEA的AGA-SVR模型將季節(jié)指數(shù)調(diào)整、SVR及AGA有效結(jié)合,同時(shí)處理了節(jié)假日客流量預(yù)測(cè)中的季節(jié)性和非線性問題,預(yù)測(cè)精度最高,是進(jìn)行節(jié)假日客流量預(yù)測(cè)的有效方法。
(1)由于節(jié)假日客流量季節(jié)性和非線性的雙重特征,單純某一種方法無法準(zhǔn)確預(yù)測(cè)。本文提出了一種基于SEA的AGA-SVR模型,將SEA對(duì)季節(jié)性的處理、SVR對(duì)非線性的預(yù)測(cè)及AGA對(duì)SVR參數(shù)的尋優(yōu)等3種優(yōu)勢(shì)結(jié)合起來,對(duì)節(jié)假日客流量進(jìn)行預(yù)測(cè)。來自黃山風(fēng)景區(qū)2008~2012年節(jié)假日的數(shù)據(jù)驗(yàn)證結(jié)果表明:在和AGA-SVR及GA-SVR等方法比較中,基于SEA的AGA-SVR模型預(yù)測(cè)精度最高,誤差最小,是進(jìn)行節(jié)假日客流量預(yù)測(cè)的有效方法。
(2)本文提供的節(jié)假日客流量預(yù)測(cè)方法,對(duì)旅游景區(qū)管理者具有指導(dǎo)意義。節(jié)假日是客流量的集中爆發(fā)期,準(zhǔn)確的預(yù)測(cè)可為景區(qū)管理者在節(jié)假日資源統(tǒng)一管理和合理調(diào)度、分流游客等方面提供直接信息支持,這對(duì)旅游風(fēng)景區(qū)尤其是熱門景區(qū)乃至整個(gè)旅游行業(yè)意義重大。該方法同時(shí)在相關(guān)行業(yè)如航空、鐵路等交通部門及酒店等行業(yè)相關(guān)客流量預(yù)測(cè)中也具有很好的推廣應(yīng)用前景。
除了節(jié)假日客流量預(yù)測(cè)外,旅游業(yè)經(jīng)常會(huì)遇到各種突發(fā)事件,如自然災(zāi)害及突發(fā)公共衛(wèi)生事件等,這種突發(fā)事件會(huì)對(duì)客流量產(chǎn)生極大的沖擊,客流量的規(guī)律將會(huì)打破,因此,突發(fā)事件發(fā)生后客流量的預(yù)測(cè)問題將是我們下一步研究和關(guān)注的內(nèi)容。
致謝感謝黃山風(fēng)景區(qū)管理委員會(huì)信息中心為本文提供所有相關(guān)數(shù)據(jù)。
[1]杜京義,侯媛彬.基于遺傳算法的支持向量回歸機(jī)參數(shù)選?。跩].系統(tǒng)工程與電子技術(shù),2006(9):1430-1433.
[2]Vapnik V N.The Nature of Statistical Learning Theory[M].許建華,張學(xué)工,譯.北京:電子工業(yè)出版社,2009.
[3]王萬良,吳啟迪,宋毅.求解作業(yè)車間調(diào)度問題的改進(jìn)自適應(yīng)遺傳算法[J].系統(tǒng)工程理論與實(shí)踐,2004(2):58-62.
[4]翁鋼民,李凌雁.旅游客流量預(yù)測(cè):基于季節(jié)調(diào)整的PSO-SVR模型研究[J].計(jì)算機(jī)應(yīng)用研究,2014(3):692-695.
[5]許光濘,肖志勇,俞金壽.應(yīng)用自適應(yīng)遺傳算法解決集裝箱裝載問題[J].控制與決策,2007(11):1280-1283.
[6]Cai Z J,Lu S,Zhang X B(2009).Tourism demand forecasting by support vector regression and genetic algorithm[C].Computer Science and Information Technology,IEEE,144-146.
[7]Chen K Y(2011).Combining linear and nonlinear model in forecasting tourism demand[J].Expert Systems with Applications,38(8),10368-10376.
[8]Chen K Y,Wang C H(2007).Support vector regression with genetic algorithms in forecasting tourism demand[J].Tourism Management,28(1):215-226.
[9]Faulkner B,Russell R(1997).Chaos and complexity in tourism:In search of a new perspective[J].Pacific Tourism Review,1(2):93-102.
[10]Findley D F,Monsell B C,Bell W R,Otto M C,Chen B C(1998).New capabilities and methods of the X-12-ARIMA seasonal-adjustment program[J].Journal of Business&Economic Statistics,16(2),127-152.
[11]Gardner J E S,McKenzie E(1989).Note-Seasonal Exponential Smoothing with Damped Trends[J].Management Science,35(3),372-376.
[12]Hong W C,Dong Y,Chen L Y,Wei S Y(2011).SVR with hybrid chaotic genetic algorithms for tourism demand forecasting[J].Applied Soft Computing,11(2):1881-1890.
[13]Huang J H,Min C H J(2002).Earthquake devastation and recovery in tourism:The Taiwan case[J].Tourism Management,23(2),145-154.
[14]Kyriakides E,Polycarpou M(2007).Short Term Electric Load Forecasting:A Tutorial[J].Trends in Neural Computation,35,391-418.
[15]Nelson C R,Plosser C R(1982).Trends and random walks in macroeconomic time series:some evidence and implications[J].Journal of monetary economics,10(2),139-162.
[16]Shiskin J,Young A H,Musgrave J C(1967).The X-11 Variant of the Census Method II Seasonal Adjustment Program[M].US Department of Commerce,Bureau of the Census.
[17]Song H,Li G(2008).Tourism demand modeling and forecasting—A review of recent research[J].Tourism Management,29(2),203-220.
[18]Srinivas M,Patnaik L M(1994).Adaptive probabilities of crossover and mutation in genetic algorithms[J].Systems,Man and Cybernetics,IEEE Transactions on,24(4),656-667.
[19]Tseng F M,Yu H C,Tzeng G H(2002).Combining neural network model with seasonal time series ARIMA model[J].Technological Forecasting and Social Change,69(1),71-87.
[20]Zhang G P,Qi M(2005).Neural network forecasting for seasonal and trend time series[J].European journal of operational research,160(2),501-514.
[21]Zhang H,Wang M,Huang X,Roth H(2014).Application of adaptive genetic algorithm for the parameter selection of support vector regression[J].International Journal of Modeling,Identification and Control,21(1):29-37.
A Study on the Forecasting Method of AGA-SVR Modeled Holiday Tourist Flows Based on SEA
CHEN Rong1,LIANG Changyong2,GE Lixin3
(1.Department of Economic and Management,Bengbu University,Bengbu,Anhui 233000,China;
2.School of Management,HeFei University of Technology,HeFei 230009,China;
3.Department of science,Bengbu University,Bengbu,Anhui 233000,China)
In virtue of tourists amassing at the same scenic spots in a short term and the different lengths of holidays and seasons,holiday tourist flow is found to present complicated nonlinear features and obvious seasonal characteristics.This paper proposed a forecasting model which combined seasonal exponential adjustment with adaptive genetic algorithm(AGA)and support vector regression(SVR),and used the new holiday daily data from the famous 5A scenic spot Mount.Huangshan during 2008~2012 to verify its effectiveness.The results indicate that the model,superior to AGA-SVR and GASVR,is an effective way to forecast daily holiday tourist flow.
seasonal exponential adjustment;support vector regression(SVR);adaptive genetic algorithm(AGA);holiday daily tourist flow forecasting
TP 181
A
1006-575(2016)-05-0012-12
(責(zé)任編輯:車婷婷)
2015-10-29;
2016-05-18
國家自然科學(xué)基金重點(diǎn)項(xiàng)目“基于云的管理信息系統(tǒng)再造研究”(71331002);安徽高校自然科學(xué)研究重點(diǎn)項(xiàng)目“智慧景區(qū)背景下的旅游客流量預(yù)測(cè)方法研究”(KJ2015A143);安徽省教育廳2016年高校優(yōu)秀拔尖人才培育資助項(xiàng)目“高校優(yōu)秀青年骨干人才國內(nèi)外訪學(xué)研修重點(diǎn)項(xiàng)目”(gxfxZD2016283);國家自然科學(xué)基金面上項(xiàng)目“基于行為決策的隱性目標(biāo)決策模型與方法研究”(71271072)。
陳榮(1973-),女,博士,蚌埠學(xué)院經(jīng)濟(jì)與管理學(xué)院副教授,研究方向?yàn)槁糜涡枨箢A(yù)測(cè),E-mail:chenrongustc@163.com。梁昌勇(1965-),男,博士,合肥工業(yè)大學(xué)管理學(xué)院教授,博導(dǎo),研究方向?yàn)楣芾硇畔⑾到y(tǒng)、行為決策及云計(jì)算技術(shù)等。葛立新(1971-),男,蚌埠學(xué)院理學(xué)院副教授,研究方向?yàn)閿?shù)據(jù)仿真。