劉柱勝 卿芳雅 戈 鵬 任佩瑜 冉建華
(1.四川大學工商管理學院,四川成都610064;2.九寨溝管理局,四川九寨溝623402)
自20世紀50年代以來,世界旅游業(yè)發(fā)展迅速。蓬勃發(fā)展的旅游業(yè)給目的地帶來經(jīng)濟效益與社會效益的同時,也給旅游風景區(qū)的自然生態(tài)環(huán)境造成了威脅。怎樣協(xié)調(diào)好經(jīng)濟效益、社會效益和生態(tài)環(huán)境三者的關(guān)系,是我們亟待解決的問題。許多旅游景點的游客量呈現(xiàn)持續(xù)增長的趨勢,但這種增長并不是一條直線,往往表現(xiàn)為在旺季人滿為患,在淡季卻門庭冷落。游客數(shù)量在時間上的不均衡波動給景區(qū)管理帶來很大挑戰(zhàn)。要實現(xiàn)風景區(qū)科學規(guī)劃與永續(xù)利用,需要把握游客的時空變化規(guī)律,準確預測游客數(shù)量。其中短期游客量的預測是景區(qū)進行資源科學管理與合理調(diào)度的基本依據(jù),對此進行深入研究有重要的現(xiàn)實意義。
九寨溝位于四川省阿壩藏族羌族自治州九寨溝縣境內(nèi),海拔在2000米以上,溝內(nèi)遍布原始森林,分布了108個湖泊,是我國被列入世界遺產(chǎn)名錄的著名旅游風景區(qū)之一。九寨溝一年四季景色都十分迷人,各個季節(jié)有不同的景致,因此游客絡(luò)繹不絕,其中以4月至11月游客量最多(章小平,朱忠福,2007)。
國內(nèi)外學者對旅游景區(qū)容量及游客量預測問題的研究始于20世紀60年代,幾十年的發(fā)展取得了豐富的成果,如Law(1999)利用神經(jīng)網(wǎng)絡(luò)模型預測游客需求,Mello(2001)使用向量自回歸方法預測英國旅游者的長期旅游需求及目的地份額,Stucka(2002)使用了計量經(jīng)濟學中普通最小二乘法(OLS)與相似非相關(guān)模型(SUR)來預測克羅地亞的旅游需求。國內(nèi)學者的研究成果也比較豐富,如楚方林研究發(fā)現(xiàn)非季節(jié)性自回歸移動平均結(jié)合模型能獲得較優(yōu)的預測結(jié)果(Chu Fonglin,1998),王朝宏使用模糊時間序列與混合灰色理論預測到臺灣的美國和香港游客的旅游需求(Wang Chao-Hung,2004),曾忠祿、鄭勇(2009)使用計量經(jīng)濟學模型預測了內(nèi)地赴澳門的游客量,雷可為、陳瑛(2007)應用了BP神經(jīng)網(wǎng)絡(luò)和ARIMA組合模型預測中國入境游客量,顏磊等(2009)提出了小波分析法并用此方法分析了九寨溝景區(qū)游客旅游時間流的特征,胡小猛等(2006)通過研究得出三個主要阻礙上海居民去崇明島旅游的障礙因素,得出了游客量與潛在游客規(guī)模及各類阻礙相關(guān)的預測模型。這些方法大多以預測某地游客量的發(fā)展趨勢以及分析影響這些地區(qū)游客量的因素為主。雖然國內(nèi)外學者對年際游客量的預測形成了豐富的成果,但是對日游客量的預測問題鮮有研究。隨著游客的旅游方式的變化,影響一個地區(qū)游客量的因素已經(jīng)不僅僅是由旅游的季節(jié)性因子和景區(qū)基礎(chǔ)條件所決定,各種社會因素、自然突發(fā)狀況也會對一個景區(qū)的游客量產(chǎn)生重要影響(吳耀宇,黃震方,2010)。本文研究日游客量的預測問題正是基于對上述變化的思考。考慮季節(jié)與季節(jié)之間的各種影響游客量的因子存在很大差別,而相鄰兩日的各個影響因素變化不大,因此在預測中前一日的游客數(shù)量有重要的參考意義。
本研究通過實地調(diào)查和數(shù)據(jù)采集獲得研究數(shù)據(jù)。采用逐步回歸法對日游客量預測建立回歸模型,再利用BP神經(jīng)網(wǎng)絡(luò)對回歸模型計算出的預測結(jié)果進行誤差的修正,最后將修正出來的結(jié)果作為最終預測的日游客量。圖1為本文的研究路徑。
圖1 研究路徑
本研究通過實地調(diào)研采集了大量數(shù)據(jù),其中包括九寨溝2009年和2010年上半年日游客量數(shù)據(jù)、九寨溝2009年和2010年每日的氣象數(shù)據(jù),全國2009年和2010年法定假日的數(shù)據(jù)等。有研究表明氣候的季節(jié)性固然會對一個景區(qū)游客量的大小產(chǎn)生重要的影響,但是也應該加大對社會因素、自然突發(fā)狀況的關(guān)注。因此本文重點考慮社會因素和自然突發(fā)狀況對游客量的影響,設(shè)定出與游客量波動有關(guān)的主要因子。影響游客量的因子在季節(jié)與季節(jié)之間差異大,在相鄰兩日之間差異小,因此在考慮到景區(qū)前后兩日季節(jié)性因子相差不大的情況下,設(shè)定出前日游客數(shù)量級、前日溫度、前日降雨等因子,再考慮到前后兩日的社會因子可能會因為放假等原因而產(chǎn)生差異的情況,設(shè)定出法定假日、寒暑假、旅游淡旺季等幾個因子。由于自然突發(fā)狀況無法準確預測以及定量,因此將其作為影響隨機誤差的一個因子。綜合考慮上述因素對景區(qū)游客量的影響之后,得出了可能影響九寨溝日游客量的因子。
本文通過研究2009年數(shù)據(jù)來建立模型。首先利用SPSS軟件分別對設(shè)定的因子與九寨溝游客量之間進行相關(guān)性分析,得到前日溫度、前日降雨、法定假日、前日游客數(shù)量級、寒暑假、旅游淡旺季幾個與九寨溝游客量相關(guān)性較高的因子。然后將九寨溝實際游客量的數(shù)據(jù)和因子導入SPSS,通過模塊—逐步回歸建立回歸模型。逐步回歸的基本思想是,在考慮對Y已知的一群變量(X1…Xk)回歸時,從變量X1,…,Xk中,逐步選出對已解釋變差的貢獻最大的變量進入回歸方程,并且同時滿足偏解釋變差的F統(tǒng)計量的值fj的顯著性概率p小于等于選定的顯著性水平α。采用逐步回歸法,在顯著性水平α為0.05水平下,一共有4個因子依次進入回歸方程,依次是前日游客數(shù)量級、法定假期、前日溫度和旅游淡旺季,從模型匯總表中可以看出,最后一個包含了以上4個因子的回歸模型的判定系數(shù)R=0.919,校正判定系數(shù),各種影響因子對實際游客量的回歸效果良好。檢驗模型的多重共線性、異方差性和序列相關(guān)性,三個問題均不存在。模型方差檢驗、回歸系數(shù)檢驗也都通過。根據(jù)高斯-馬爾柯夫(BLUE)定理,回歸系數(shù)表所求得的回歸系數(shù)具有最優(yōu)性、線性和無偏性。以上從SPSS中獲取的結(jié)果證明通過多元回歸得出的模型擬合度比較高,結(jié)果比較理想。最后根據(jù)回歸系數(shù)得出的多元回歸方程為:
y=-14394.805+781.351x1+1143.616x2+45.851x3+416.860x4+ μ (1)
其中y為預測的日游客量,x1為前日游客數(shù)量級,x2為法定假期,x3為前日溫度,x4為旅游淡旺季,μ為隨機誤差。
理論已證明,三層BP網(wǎng)絡(luò)可以以任意精度逼近任何連續(xù)函數(shù)(張興會,等,2004)。以多元回歸模型的預測誤差作為輸入的學習樣本,在神經(jīng)網(wǎng)絡(luò)中經(jīng)過不斷修正可以得到更好的預測結(jié)果。BP神經(jīng)網(wǎng)絡(luò)可以從大量的離散實驗數(shù)據(jù)中,經(jīng)過學習訓練,提取其領(lǐng)域知識,并將知識表示為網(wǎng)絡(luò)連接權(quán)值的大小與分布,建立起反映實際過程內(nèi)在規(guī)律的系統(tǒng)模型。BP網(wǎng)絡(luò)可以包含不同的隱層,理論上已經(jīng)證明,在不限制隱層節(jié)點數(shù)的情況下,只有一個隱層的BP網(wǎng)絡(luò)可以實現(xiàn)任意非線性映射。在模式樣本相對較多的情況下,較多的隱層節(jié)點,可以實現(xiàn)模式樣本空間的超平面劃分,因此本文使用具有單隱層的BP網(wǎng)絡(luò)來實現(xiàn)對多元線性回歸模型的修正(陳如云,2007)。圖2為BP神經(jīng)網(wǎng)絡(luò)原理示意圖,其中Wij是輸入層到隱層的權(quán)重,Wjl是隱單元層到輸出層的權(quán)重。
圖2 單隱層BP網(wǎng)絡(luò)原理圖
3.2.1 訓練樣本歸一化
原始樣本中數(shù)據(jù)為預測游客量的誤差均大于1,而BP神經(jīng)網(wǎng)絡(luò)所處理的是數(shù)值在[-1,1]區(qū)間的數(shù)據(jù),因此這些樣本數(shù)據(jù)在研究中都需要將它們轉(zhuǎn)化為區(qū)間之間的數(shù)據(jù)。本文對樣本數(shù)據(jù)采用的歸一化公式如下:
其中a=-6000,b=6000,這是根據(jù)預測可能出現(xiàn)的最大誤差來確定的。
式中I為原始誤差輸入數(shù)據(jù),I^為歸一化后的輸入數(shù)據(jù),g為原始樣本期望目標數(shù)據(jù)即實際游客量,g^為歸一化后的期望目標數(shù)據(jù)。
3.2.2 網(wǎng)絡(luò)訓練
本文采用三層的神經(jīng)網(wǎng)絡(luò)進行建模,對游客數(shù)量預測誤差進行修正。采用2009年數(shù)據(jù)作為訓練樣本,因數(shù)據(jù)量比較大,隱層神經(jīng)元的節(jié)點個數(shù)n2要盡量多,故本文選擇n2=150,這里的隱層神經(jīng)元節(jié)點個數(shù)不是固定的,要根據(jù)實際訓練的檢驗修正。輸入層神經(jīng)元節(jié)點個數(shù)n1=5,輸出層神經(jīng)節(jié)點個數(shù)n3=1,將1月1日-5日、2日-6日、3日-7日等的游客數(shù)量預測實際誤差作為網(wǎng)絡(luò)輸入,以6日、7日、8日等的實際游客量作為網(wǎng)絡(luò)輸出,組成樣本數(shù)據(jù)對網(wǎng)絡(luò)進行訓練,最后得出預測誤差。采用MATLAB測試,輸入層到中間層和中間層到輸出層的傳遞函數(shù)均受用正切函數(shù),學習率設(shè)為0.5,訓練次數(shù)設(shè)為5000,訓練目標誤差為1×1010。
使用MATLAB進行神經(jīng)網(wǎng)絡(luò)訓練得到歸一化處理過的輸出層數(shù)據(jù),首先需要對輸出層數(shù)據(jù)還原,根據(jù)歸一化公式得到還原公式:
式中I為還原的神經(jīng)網(wǎng)絡(luò)輸出數(shù)據(jù),I*為神經(jīng)網(wǎng)絡(luò)原始輸出數(shù)據(jù)。經(jīng)過MATLAB的處理,將預測誤差與回歸模型預測值相加,得到最終預測值。
3.3.1 回歸部分
將2010年數(shù)據(jù)帶入回歸方程,通過計算得出游客量預測值。下圖3所示為根據(jù)回歸方程(1)計算得到的2010年上半年日游客量的實際值與預測值之間的對比圖,其中y為預測游客量,g為期望目標數(shù)據(jù),即實際游客量,橫坐標為日期的序列值,縱坐標為游客數(shù)。
圖3 多元回歸模型預測游客量與實際游客量對比圖
3.3.2 BP 神經(jīng)網(wǎng)絡(luò)部分
要預測某天的游客數(shù)量誤差,應該將回歸模型預測的前五日實際誤差作為神經(jīng)網(wǎng)絡(luò)輸入,經(jīng)過神經(jīng)網(wǎng)絡(luò)的運算之后得到輸出為當日游客量預測誤差,將此輸出的預測誤差與回歸模型的當日游客量值進行相加或相減,得到最終游客量預測值。
圖4是經(jīng)過BP神經(jīng)網(wǎng)絡(luò)修正前后的兩個日游客量預測值的對比圖,其中,y為多元回歸預測值,Y為BP神經(jīng)網(wǎng)絡(luò)修正值,橫坐標為日期的序列值,縱坐標為游客數(shù)。
圖4 多元回歸模型預測游客量與BP神經(jīng)網(wǎng)絡(luò)修正游客量對比圖
由圖4可以看到經(jīng)過BP神經(jīng)網(wǎng)絡(luò)修正前后的游客數(shù)變化趨勢是基本一致的,只是在游客數(shù)的多少上存在差別。下圖5為經(jīng)多元回歸模型預測,BP神經(jīng)網(wǎng)絡(luò)修正后的最終預測到達人數(shù)(Y)與九寨溝實際到達人數(shù)(g)對比圖,橫坐標為日期的序列值,縱坐標為游客數(shù)。
圖5 BP神經(jīng)網(wǎng)絡(luò)修正游客量與實際游客量對比圖
從多元回歸模型的預測到BP神經(jīng)網(wǎng)絡(luò)的修正,預測值與實際值的變化趨勢是基本一致的,從圖2與圖5的對比可以看出:九寨溝游客每年實際到達人數(shù)呈現(xiàn)出多峰性;實際到達人數(shù)與預測到達人數(shù)所呈現(xiàn)出的峰值是基本一致的;二者的對比圖顯示二者在數(shù)量上的預測也基本準確。而且經(jīng)BP神經(jīng)網(wǎng)絡(luò)修正后,游客到達預測值與游客實際到達值之間更為接近,通過計算,可以得到神經(jīng)網(wǎng)絡(luò)模型對預測值修正后誤差顯著變小,經(jīng)計算得修正預測值與實際值的平均誤差率為2.05%。其中誤差在1%以內(nèi)的占總預測量的33.5%。誤差在2%以內(nèi)的占65.9%,誤差在10%以上的占0.6%。分析有如下幾個可能產(chǎn)生誤差的原因:
(1)由于回歸模型選擇的影響因子而造成的預測誤差。影響一個地區(qū)游客量的因素眾多,并不能全部被挑選出來,因此影響因子的選擇是造成誤差的一個最主要原因。(2)自然突發(fā)狀況。由于自然突發(fā)狀況存在突發(fā)性和偶然性,事先很難準確預測,也是一個誤差來源。(3)除法定假日以外的周末。由于周末多是九寨溝周邊城鎮(zhèn)的游客去旅游,而去九寨溝所花的時間可能較多,因此周末可能不是一周當中游客最多的時候,但是周末會對游客量有一定影響。(4)單位組織旅游?,F(xiàn)在許多單位都會選擇一個相對于自身合適的時間組織員工集體旅游。(5)地震的殘留影響。
國內(nèi)外學者對游客量預測問題的研究始于20世紀中葉,經(jīng)過半個多世紀的發(fā)展,形成了諸如ARIMA模型、神經(jīng)網(wǎng)絡(luò)模型等重要預測模型,但是這些模型主要預測后幾年的游客規(guī)模趨勢,涉及的是年際間的游客量。本文是以日為單位來預測九寨溝景區(qū)的游客量。一個景區(qū)游客量的大小固然會受到季節(jié)的重要影響,但是隨著社會的發(fā)展,社會因素對游客量的影響越來越大,因而本文以此為依據(jù)設(shè)定與游客量的波動有關(guān)的主要因子。經(jīng)過研究發(fā)現(xiàn):影響九寨溝游客量的因子已不僅僅局限在諸如氣溫、降水、風力等季相因子之中,我們應該更加重視各種社會因子諸如法定假日、假期等因素對游客量的影響。此外,由于現(xiàn)實中社會因子已經(jīng)在很大程度上影響景區(qū)的游客量,因此本文認為以日為單位研究游客量的到達比以年為單位研究游客量會更符合預測時點的實際情況,本文的研究結(jié)果也顯示通過模型的預測和修正能夠得到比較理想的預測結(jié)果。
分析發(fā)現(xiàn),影響旅游淡旺季游客量的因子可能存在差別,所以在后續(xù)研究中,考慮通過擴大樣本容量,在景區(qū)發(fā)放問卷,深入調(diào)查影響因子,以淡旺季分別建立更為完善和成熟的預測模型。
致謝:感謝九寨溝管理局為本文提供了游客量以及氣象等基礎(chǔ)數(shù)據(jù)。
[1] Chu Fonglin.Forecasting tourist arrivals:non linear sine wave or ARIMA?[J].Journal of Travel Research,1998,36:79-84.
[2] De Mello M M.The forecasting ability of a cointegrated VAR demand system with endogenous vs.exogenous expenditure variable:an application to the UK imports of tourism from neighbouring countries(Working Paper)[Z].2001.
[3] Law R,Au N.A neural networkmodel to forecast Japanese demand for travel to Hong Kong[J].Tourism Management,1999,20(1):89-97.
[4] Stucka T.A comparison of two econometric models(OLS and SUR)for forecasting Croatian tourism arrivels(Working Paper)[Z].Croatian National Bank,2002.
[5] Wang Chao-Hung.Predicting tourism demand using fuzzy time series and hybrid grey theory[J].Tourism Management,2004,25(3):367-374.
[6] 陳如云.基于BP神經(jīng)網(wǎng)絡(luò)的應用研究[J].微計算機信息,2007(8-3):258-259.
[7] 胡小猛,李浡,牛家叢,李怡.上海崇明島農(nóng)業(yè)旅游客源市場特征及未來入島游客量預測研究[J].旅游科學,2006(4):54-59.
[8] 雷可為,陳瑛.基于BP神經(jīng)網(wǎng)絡(luò)和ARIMA組合模型的中國入境游客量預測[J].旅游學刊,2007(4):20-25.
[9] 吳耀宇,黃震方.江蘇省入境旅游客流波動性問題研究[J].經(jīng)濟經(jīng)緯,2010(2):117-121.
[10] 顏磊,許學工,章小平.九寨溝世界遺產(chǎn)地旅游流時間特征分析[J].北京大學學報(自然科學版),2009(1):171-177.
[11] 曾忠祿,鄭勇.基于計量經(jīng)濟學模型的內(nèi)地赴澳門游客量預測[J].旅游科學,2009(3):55-61.
[12] 張興會,陳增強,袁著祉.基于神經(jīng)網(wǎng)絡(luò)誤差補償?shù)幕煦缦到y(tǒng)廣義預測控制[J].南開大學學報(自然科學版),2004(2):88-92.
[13] 章小平,朱忠福.九寨溝景區(qū)旅游環(huán)境容量研究[J].旅游學刊,2007(9):20-57.