国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

線性回歸在世博會(huì)散客流量預(yù)測(cè)中的實(shí)驗(yàn)

2010-04-11 01:04
關(guān)鍵詞:散客世博客流量

施 原

(復(fù)旦大學(xué)管理學(xué)院,上海200433)

0 引言

2010年5月1日開(kāi)幕的上海世界博覽會(huì),是中國(guó)有史以來(lái)承辦的最大規(guī)模的展覽盛會(huì),這是綜合性世界博覽會(huì)第一次在世界上人口最多的國(guó)家、最大城市的中心區(qū)域舉辦[1],引來(lái)了全世界媒體的聚焦。

世博會(huì)中游客的觀博品質(zhì)、游覽體驗(yàn)是媒體關(guān)注的焦點(diǎn)之一。例如日本媒體《讀賣新聞》于開(kāi)幕初日?qǐng)?bào)道中國(guó)館前因預(yù)約券問(wèn)題引發(fā)爭(zhēng)吵抗議[2]、臺(tái)灣媒體《蘋(píng)果日?qǐng)?bào)》于5月31日?qǐng)?bào)道網(wǎng)絡(luò)上流傳甚廣的踩踏事件造成嚴(yán)重后果[3]。世博會(huì)帶來(lái)的是獨(dú)一無(wú)二的“體驗(yàn)經(jīng)濟(jì)”,豐富的互動(dòng)項(xiàng)目和展品可以為各種類型的游客帶來(lái)全部四個(gè)領(lǐng)域的體驗(yàn)[4]。雖然鑒此游客的滿意度無(wú)法使用簡(jiǎn)單標(biāo)準(zhǔn)化的指標(biāo)來(lái)衡量,然而毫無(wú)疑問(wèn),在10萬(wàn)人次不到的普通日游客能一天參觀24個(gè)場(chǎng)館[5],而在客流突破40萬(wàn)后,一個(gè)場(chǎng)館就可能排隊(duì)超過(guò)9小時(shí) 的強(qiáng)烈反差下,我們還是可以推斷:和其他大部分服務(wù)一樣,需求與供給的不平衡會(huì)嚴(yán)重影響世博游客的滿意度,而世博會(huì)游覽活動(dòng)中需求供給不平衡的背后,是各展館有限接待能力和客流量波動(dòng)變化的劇烈矛盾。為了提供給觀博游客更好的參觀品質(zhì),必須合理配置包括人力、展館接待容量在內(nèi)的各種資源滿足需求(例如沙特館在最長(zhǎng)排隊(duì)時(shí)間突破9小時(shí)后,于6月8日增發(fā)VIP直通券200張[7]),或者利用杠桿效應(yīng)調(diào)節(jié)需求、平均資源的利用率(例如在5月初人數(shù)寥寥的浦西城市最佳實(shí)踐區(qū),推出集齊《城市名片冊(cè)》中特定組合的城市印章后,兌換相應(yīng)國(guó)家館的預(yù)約券的“東西聯(lián)動(dòng)”方案,成功分流了大量浦東客流[8])。然而合理配置各類資源的成功前提,是對(duì)客流量有一個(gè)大致準(zhǔn)確的預(yù)期。

世界博覽會(huì)在上海舉辦,是對(duì)中國(guó)三十多年來(lái)改革開(kāi)放建設(shè)成果的檢閱,既是對(duì)諸如交通工具、各大場(chǎng)館等展覽中硬件設(shè)施建設(shè)的檢驗(yàn),也是對(duì)資源調(diào)控、信息調(diào)度等大型活動(dòng)中軟實(shí)力發(fā)展的檢驗(yàn)。只有依賴于協(xié)同發(fā)展的軟硬件,才能夠更好地服務(wù)世博會(huì)的游客、參展方、媒體等諸多方面。在與客流相關(guān)的方面,世博局也做了一些工作。在開(kāi)幕前夕的兩周內(nèi),密集進(jìn)行了人數(shù)分別為20萬(wàn)、5萬(wàn)、10萬(wàn)、30萬(wàn)、35萬(wàn)、10萬(wàn)的6次壓力測(cè)試,測(cè)試園內(nèi)設(shè)施在各種水平上對(duì)客流的承受能力并作出改進(jìn),例如中國(guó)館的預(yù)約機(jī)在壓力測(cè)試之中,被發(fā)現(xiàn)難以承受人流的負(fù)荷,而在實(shí)際運(yùn)營(yíng)中改為人工發(fā)放預(yù)約券的形式[9]。在世博局綜合某美國(guó)公司的預(yù)測(cè)和國(guó)際展覽局考察結(jié)果,而為全會(huì)期客流做出7000萬(wàn)人次的預(yù)期后[10],實(shí)際開(kāi)園前兩周人流大幅低于預(yù)期,有關(guān)方面開(kāi)始轉(zhuǎn)移焦點(diǎn)指出“游客體驗(yàn)比人次數(shù)更重要”[11]、“客流很難有規(guī)律性預(yù)測(cè)”[12],并于5月5日撤下官方網(wǎng)站上詳細(xì)的實(shí)時(shí)監(jiān)測(cè)數(shù)據(jù)指標(biāo)[13],換上精簡(jiǎn)的版本[14]。

客流預(yù)測(cè)屬于服務(wù)需求預(yù)測(cè)的范疇,理論上中短期的預(yù)測(cè)主要以因果模型和時(shí)間序列模型為主。回顧相關(guān)方面的研究,主要集中于對(duì)鐵路、公路、地鐵等的交通客流量采取灰色模型[15]、時(shí)間序列模型[16]的預(yù)測(cè)以及對(duì)旅游客流采取線性回歸模型[17]、Logistic 增長(zhǎng)模型[18]等的預(yù)測(cè)。

線性回歸是一種最基礎(chǔ)的回歸模型,屬于因果模型的范疇,較時(shí)間序列模型的缺點(diǎn)在于對(duì)于最新的隨機(jī)變動(dòng)反應(yīng)不及時(shí)、變量選取難度較大,數(shù)據(jù)要求高,其優(yōu)點(diǎn)在于由于含有實(shí)際因素的解釋度,能夠給各方?jīng)Q策者帶來(lái)現(xiàn)實(shí)層面的參考,在統(tǒng)計(jì)意義的基礎(chǔ)上有現(xiàn)實(shí)參照意義。線性回歸在預(yù)測(cè)工作中有廣泛的應(yīng)用價(jià)值,在旅游客源預(yù)測(cè)、運(yùn)動(dòng)員成績(jī)預(yù)測(cè)[19]、城市化水平預(yù)測(cè)[20]等其他領(lǐng)域都有所應(yīng)用,而在需求預(yù)測(cè)的領(lǐng)域中,特種產(chǎn)品需求[21]、人才需求[22]等方面也都有利用線性回歸預(yù)測(cè)的先例。

對(duì)于本屆世博會(huì)各方面的預(yù)測(cè)工作,已經(jīng)有人在“后世博”時(shí)期經(jīng)濟(jì)發(fā)展預(yù)測(cè)[23]、相關(guān)領(lǐng)域人才需求預(yù)測(cè)[24]等方面做了一定的研究,而客流量預(yù)測(cè)方面,亦有學(xué)者基于往屆世博會(huì)的客流分布,給出了上海世博會(huì)的客流日分布預(yù)測(cè)及7300萬(wàn)的總量預(yù)測(cè)[25]。鑒于世博會(huì)客流預(yù)測(cè)工作的獨(dú)特性和復(fù)雜性,將線性回歸運(yùn)用于世博會(huì)客流的預(yù)測(cè)當(dāng)中僅是一種嘗試。由于缺乏可參考的范例、更多翔實(shí)有效的數(shù)據(jù)并囿于筆者的理論水平和實(shí)際經(jīng)驗(yàn),這一工作只能定義為一次實(shí)驗(yàn),其合理性和可行性有待進(jìn)一步考量。

1 數(shù)據(jù)與方法

為保證研究的信度,本實(shí)驗(yàn)中所選用數(shù)據(jù)均來(lái)自官方公布口徑,觀察時(shí)間跨度為世博會(huì)開(kāi)園后1個(gè)月(計(jì)31天),主要包括四個(gè)方面。

1.1 客流量方面

日總客流量:每一日記錄前一日日總客流量,數(shù)據(jù)全部來(lái)自上海世博會(huì)官方網(wǎng)站“園區(qū)即時(shí)客流統(tǒng)計(jì)”欄目;日?qǐng)F(tuán)隊(duì)客流量:每一日記錄本日、次日?qǐng)F(tuán)隊(duì)客流量,數(shù)據(jù)全部來(lái)自上海《解放日?qǐng)?bào)》當(dāng)日公布的《旅游信息》專欄[26];日散客客流量:在二分的觀點(diǎn)下,采用計(jì)算得到,其中日總客流量為T(mén)T,日?qǐng)F(tuán)隊(duì)客流量為GT,日散客客流量為FT,對(duì)應(yīng)日期為同日。

1.2 天氣方面

日預(yù)報(bào)最高溫、最低溫:每一日記錄明日天氣預(yù)報(bào)中的最高氣溫和最高氣溫,日預(yù)報(bào)日間濕度、夜間濕度:每一日記錄明日天氣預(yù)報(bào)中的日間濕度和夜間濕度,數(shù)據(jù)全部來(lái)自上海中心氣象臺(tái)[27]①;日預(yù)報(bào)人體舒適度指數(shù):采用公式[28]計(jì)算得到,其中E為人體舒適度指數(shù),R為預(yù)報(bào)日間濕度與夜間濕度的平均,T為預(yù)報(bào)最高溫與最低溫的華氏溫標(biāo)下的平均。在我們的觀察區(qū)間內(nèi),其實(shí)際值較小時(shí),體感較為舒適。

1.3 信息方面

日網(wǎng)頁(yè)檢索記錄量:原本設(shè)想以新聞報(bào)導(dǎo)量作為指標(biāo),然而考慮目前中國(guó)網(wǎng)民數(shù)量高達(dá)3.84億,每日接受信息的渠道豐富,新聞可能不能反映信息輸出量的全貌,故嘗試性使用“世博”和“新聞”作為組合檢索詞,每日通過(guò)知名引擎谷歌請(qǐng)求檢索前一日24小時(shí)內(nèi)網(wǎng)頁(yè)總數(shù),作為每日接受相關(guān)信息量的表示。

周網(wǎng)頁(yè)檢索記錄量:考慮到信息對(duì)人影響的延續(xù)性,每日對(duì)前七日的網(wǎng)頁(yè)檢索記錄量進(jìn)行加總,作為近期接受相關(guān)信息量累積的表示。此處因?yàn)槿〉脭?shù)據(jù)的格式及其大小,使用“萬(wàn)條”計(jì)量。

1.4 日期性質(zhì)方面

周末因素:直觀觀察顯示,周末因素顯著影響客流,而周六和周日對(duì)于客流的影響又不盡相同。周六之后的周日仍為休息日,即可選擇繼續(xù)游覽也可選擇休息調(diào)整;而周日之后即為緊張的工作日,對(duì)于游覽世博這樣體力消耗較大的活動(dòng)游客應(yīng)當(dāng)會(huì)有所顧慮。采取如下的設(shè)定:對(duì)于觀察期間內(nèi)所有非指定日有:當(dāng)日為工作日,周末因素WF=0;當(dāng)日為周六,周末因素WF=2;當(dāng)日為周日,周末因素WF=1。

指定日因素:指定日對(duì)客流的影響較為復(fù)雜,一方面指定日為世博會(huì)進(jìn)行當(dāng)中的關(guān)鍵時(shí)間點(diǎn)(“五一”開(kāi)幕、“十一”長(zhǎng)假及閉幕前最后一周共17日),園內(nèi)活動(dòng)較為豐富,故預(yù)售火爆[29],對(duì)客流有放大作用;另一方面,由于指定日票可平日使用,但平日票指定日不可使用,對(duì)客流又存在著約束作用,研究時(shí)間內(nèi)的指定日僅開(kāi)幕三日,資料有限,暫記指定日有指定日因素ADF=1,其余日期ADF=0。面對(duì)較多因素的情形,在無(wú)其它模型可以參考的情況下,從最簡(jiǎn)單的模型入手,采取多元線性回歸模型。

給定一個(gè)隨機(jī)樣本 (Yi,Xi1,…,Xip),i=1,…,n,一個(gè)線性回歸模型假設(shè)回歸因子Y和回歸量(Xi1,…,Xip)之間的關(guān)系可能是不完美的。加入一個(gè)誤差項(xiàng)εi(也是一個(gè)隨機(jī)變量)來(lái)捕獲除了(Xi1,…,Xip)之外任何對(duì)Yi的影響。所以一個(gè)多變量線性回歸模型表示為以下的形式:

Yi= β0+ β1Xi1+ β2Xi2+ … + βpXip+ εi,i=1,…,n[30]

2 實(shí)證分析

2.1 回歸變量選擇

在本文研究情境中,依變量選擇為日散客客流量,原因在于團(tuán)隊(duì)客主要依靠預(yù)約方式入園,所以說(shuō)有關(guān)方面不需預(yù)測(cè)就可知未來(lái)一段時(shí)間范圍中某一日的團(tuán)隊(duì)客流量。不論對(duì)于某一個(gè)場(chǎng)館還是對(duì)于整個(gè)世博園,預(yù)約都是一種有效的需求管理。團(tuán)隊(duì)客在預(yù)約后就較少有選擇余地,上文中提到的因素影響也不明顯。而散客則對(duì)購(gòu)票、入園時(shí)機(jī)均擁有較大的選擇空間,決策易受各種因素影響。在基本統(tǒng)計(jì)量的分析中,我們發(fā)現(xiàn)在5月份期間,無(wú)論是振幅還是方差,散客客流量都大于團(tuán)體客流量,選取散客客流量(標(biāo)記為FT)更為合適,見(jiàn)表1。

表1 描述性統(tǒng)計(jì)量

在自變量方面,將選取每個(gè)方面的最終處理所得的代表性變量帶入回歸,具體如下:日?qǐng)F(tuán)體客流量(標(biāo)記為GT)、日預(yù)報(bào)人體舒適度指數(shù)(標(biāo)記為CI)、周網(wǎng)頁(yè)檢索記錄量(標(biāo)記為WR)、周末因素(標(biāo)記為WF)、指定日因素(標(biāo)記為ADF)。在選取完自變量和因變量之后,對(duì)其進(jìn)行標(biāo)準(zhǔn)化處理,消除量綱上的差異。

2.2 相關(guān)性分析

因?yàn)闃?biāo)準(zhǔn)化過(guò)程不會(huì)影響變量間的相關(guān)性,所以對(duì)標(biāo)準(zhǔn)化后數(shù)據(jù)進(jìn)行相關(guān)性分析,由于可能有多個(gè)因素共同作用于同一變量,簡(jiǎn)單相關(guān)性分析的結(jié)果可能會(huì)扭曲變量間的實(shí)際關(guān)系,所以采取偏相關(guān)分析控制其它變量,單尾檢驗(yàn)結(jié)果見(jiàn)表2。

表2 偏相關(guān)分析

從結(jié)果中可見(jiàn),去除其它因素影響后,周末因素與日散客客流量的相關(guān)性不顯著,所以在直接回歸過(guò)程中應(yīng)當(dāng)不予考慮;同時(shí)人體舒適度指數(shù)預(yù)報(bào)與日散客客流量的關(guān)系也較弱,在此暫時(shí)保留,以檢驗(yàn)其回歸中的效果。其余變量相關(guān)性顯著(95%置信水平下)??紤]到周末因素的實(shí)際意義較為合理,富于解釋性,筆者曾嘗試將周末因素轉(zhuǎn)換為定性變量處理(即:將所有周六的數(shù)據(jù)單獨(dú)回歸、周日的數(shù)據(jù)單獨(dú)回歸、工作日的數(shù)據(jù)單獨(dú)回歸),但是由于所研究數(shù)據(jù)量較小、周六與周日差別顯著等諸多原因,按周末因素分類進(jìn)行回歸效果并不理想,解釋度較低。

2.3 多元線性回歸分析

將剩下的日?qǐng)F(tuán)體客流量(GT)、日預(yù)報(bào)人體舒適度指數(shù)(CI)、周網(wǎng)頁(yè)檢索記錄量(WR)、指定日因素(標(biāo)記為ADF)對(duì)日散客客流量(FT)采取Stepwise法進(jìn)行多元線性回歸(中間結(jié)果已省略),見(jiàn)表3。

表3 模型概要

由表3可知,得到的第四個(gè)模型調(diào)整后,R方值已達(dá)0.828,屬于較好的解釋水平;德賓檢驗(yàn)值為1.849,距離2也較近,所以殘差的自相關(guān)性問(wèn)題也不顯著。

表4 方差分析模型

由表4可知,對(duì)該模型F檢驗(yàn)的線性特征顯著,總體上進(jìn)行線性回歸可行,模型有實(shí)際意義。

表5 共線性診斷

由表5可見(jiàn),特征值和條件指數(shù)都沒(méi)有出現(xiàn)異常,可判定共線性沒(méi)有對(duì)模型造成較大不良影響。

表6 多元線性回歸系數(shù)報(bào)告

從表6中可見(jiàn),對(duì)于各個(gè)變量的回歸系數(shù)存在性檢驗(yàn)在95%的置信水平下也都為顯著,其中值得注意的是,代表天氣預(yù)測(cè)狀況的人體舒適度指數(shù)預(yù)報(bào),值在回歸模型中的加入對(duì)模型的解釋度具有正向作用,且其回歸系數(shù)存在性亦通過(guò)檢驗(yàn),所以決定保留這一變量,其相關(guān)性檢驗(yàn)方面表現(xiàn)不良可能和樣本量少、指標(biāo)本身敏感度不夠等有關(guān),這一點(diǎn)有進(jìn)一步改進(jìn)的空間。最后可得標(biāo)準(zhǔn)化數(shù)據(jù)下的多元回歸方程為(其中s代表標(biāo)準(zhǔn)化數(shù)據(jù)):

FTs=0.973GTs+0.332ADFs-0.198CIs+0.176WRs

在此模型下,使用原始數(shù)據(jù)代入,則可以得到合理的未標(biāo)準(zhǔn)化下原始數(shù)據(jù)的回歸方程:

FT1=24526.7+1.043GT+57197.611ADF -2961.555CI+1.034WR

回歸方程中各個(gè)因素實(shí)際表現(xiàn)出來(lái)的對(duì)散客客流的影響值得探討。首先,對(duì)于天氣的預(yù)期的確能影響潛在散客的決策,當(dāng)對(duì)天氣的舒適程度預(yù)期較高(指標(biāo)較小)時(shí),散客可能更傾向于決定游園,在回歸方程中表達(dá)出負(fù)相關(guān)的關(guān)系。其次,人群接受相關(guān)信息量也顯著正向作用于觀博的動(dòng)機(jī),這一點(diǎn)亦容易從廣告學(xué)的理論得到解釋。再次,指定日的因素從這個(gè)模型中看來(lái),對(duì)散客客流量的影響是正向的,說(shuō)明指定日人流較少,所以因?yàn)槠狈N差別產(chǎn)生上文提到的限流作用不明顯。最后,團(tuán)體客流量與散客客流量的高度相關(guān)性就顯得較為難以解釋。

按常理來(lái)說(shuō),如果散客知道某日?qǐng)F(tuán)體客流較大,會(huì)選擇回避該日觀博,然而現(xiàn)實(shí)情況是散客客流量與團(tuán)體客流量幾乎同向波動(dòng),且散客的波幅大于團(tuán)體客。原因可能如下:(1)散客大部分都不太了解未來(lái)團(tuán)體客流的情況,除了各大媒體新聞中只字片語(yǔ)的報(bào)道,第二天的團(tuán)體客流通告只見(jiàn)于《解放日?qǐng)?bào)》的《旅游信息》專欄。(2)即便散客可以正確預(yù)期團(tuán)體客流高峰的日期,因?yàn)樗麄兠媾R的和團(tuán)體客同樣的約束,而無(wú)法做出回避的選擇,比如上班族大多只能選擇周末游覽。(3)團(tuán)體客對(duì)散客具有一定的拉動(dòng)作用,外地的團(tuán)體客可能帶來(lái)他們生活在上海的親友散客客流。然而團(tuán)體客客流與散客客流間的關(guān)系尚未有現(xiàn)實(shí)意義的解釋,仍然需要進(jìn)一步的、也許是其他角度的研究。

2.4 預(yù)測(cè)效果分析

已知調(diào)整R方值為0.828,屬于良好水平。下面對(duì)回歸值、預(yù)測(cè)值進(jìn)行簡(jiǎn)要分析,并對(duì)模型的進(jìn)一步修正做出初步設(shè)想,觀察區(qū)間內(nèi)的回歸值和真實(shí)值按日期的描點(diǎn)圖見(jiàn)圖1。

圖1 觀察區(qū)間內(nèi)回歸值與真實(shí)值描點(diǎn)圖

從圖1可見(jiàn),擬合情況雖然總體良好,但是在一點(diǎn)出現(xiàn)較大偏差,即5月最后一個(gè)周六(29日)客流總量出現(xiàn)井噴首破50萬(wàn),而前后兩日則均不到40萬(wàn),28~30日?qǐng)F(tuán)體客流在14~18萬(wàn)的水平小幅波動(dòng),所以實(shí)際客流井噴的主要力量來(lái)自散客。散客自28~30日從22.16萬(wàn)飆升至31.99萬(wàn)又回落至22.18萬(wàn),猶如“脈沖”的波動(dòng)形態(tài)線性回歸模型未能成功預(yù)測(cè),實(shí)際上這是下面預(yù)測(cè)過(guò)程中暴露問(wèn)題的先兆。

利用該預(yù)測(cè)模型對(duì)觀察區(qū)間以后的6月前14天的日散客客流量進(jìn)行預(yù)測(cè),計(jì)算預(yù)測(cè)誤差見(jiàn)表7。

表7 2010年6月1~14日預(yù)測(cè)基本指標(biāo)匯總

對(duì)相對(duì)誤差進(jìn)行分析,由表7可知其中誤差在10%以內(nèi)的有5天,誤差在20%以內(nèi)的有9天,而其余5天的預(yù)測(cè)誤差在21.88% ~37.88%。而誤差超過(guò)15%的日期均為假期前后。結(jié)合前面觀察期間內(nèi)回歸誤差較大的5月29日(周六),推斷可能隨著暑期臨近,假期因素對(duì)客流的影響將走向顯著。模型的修正也應(yīng)當(dāng)圍繞假期的影響進(jìn)行。

我驚奇地發(fā)現(xiàn),學(xué)員們不但在知識(shí)水平上有了明顯提高,思想意識(shí)也有了很大改變。坦白講,我也改變了想法,決心終身務(wù)農(nóng)了。

對(duì)絕對(duì)預(yù)測(cè)誤差分析,發(fā)現(xiàn)絕對(duì)誤差并非隨機(jī)分布。從誤差超過(guò)15%的日期作絕對(duì)誤差的直方圖(圖2)可見(jiàn),預(yù)測(cè)值與現(xiàn)實(shí)值差別較大的日期,絕對(duì)誤差大致集中在5萬(wàn)和10萬(wàn)兩個(gè)水平附近。

圖2 觀察期外預(yù)測(cè)較大絕對(duì)誤差直方圖

綜上可見(jiàn),五月底開(kāi)始散客客流的波動(dòng)模式 開(kāi)始發(fā)生顯著變化,主要表現(xiàn)在假日前到假日中的放量增長(zhǎng),以及爆發(fā)性平日大客流。由此試探性為六月份的散客客流增加假日因素WF,修訂假日前一日WF=1,假日因素最大值2出現(xiàn)在假日首日,試探性修正預(yù)測(cè)公式:

則可以將5個(gè)假日相關(guān)日期的預(yù)測(cè)誤差減小在6%以內(nèi),即14日中12日預(yù)測(cè)誤差在10%以內(nèi)。

3 總結(jié)與反思

本研究先確定回歸擬合的對(duì)象為日散客客流量,再?gòu)奶鞖忸A(yù)期、接受信息量、周末因素、指定日因素、團(tuán)體客流五個(gè)方面選擇代表性變量與日散客客流量進(jìn)行偏相關(guān)分析,進(jìn)而選擇出四個(gè)與日散客客流量顯著相關(guān)的變量進(jìn)行多元線性回歸分析。通過(guò)一系列檢驗(yàn)確認(rèn)模型的有效性和解釋度,然后將觀察期間內(nèi)的回歸值、觀察期間后兩周的預(yù)測(cè)值分別同真實(shí)值做出比較與分析,并提出下一階段的模型修正設(shè)想。

從整個(gè)分析過(guò)程可以看到一些不盡如人意之處,首先,標(biāo)準(zhǔn)化是一個(gè)消除數(shù)據(jù)量綱差異的慣常處理手法,然而在實(shí)例中標(biāo)準(zhǔn)化后的回歸方程的極小值(4.87E-016)的常數(shù)項(xiàng)顯示存在性不顯著,而原始數(shù)據(jù)的回歸下常數(shù)項(xiàng)存在性顯著,面對(duì)復(fù)雜的多個(gè)變量指標(biāo),標(biāo)準(zhǔn)化回歸“丟失”常數(shù)量,讓人重新考慮這個(gè)模型是否真正需要標(biāo)準(zhǔn)化的預(yù)處理。另外,天氣方面早期濕度預(yù)報(bào)值因?yàn)檎也坏劫Y料的原因,用真實(shí)值代替可能是人體舒適度預(yù)報(bào)值與散客客流量相關(guān)存在假設(shè)的置信水平僅達(dá)93.8%的一個(gè)重要原因。當(dāng)然,由于數(shù)據(jù)取得時(shí)間縱度、涵蓋廣度的有限,全部回歸指標(biāo)都來(lái)自世博會(huì)本身的“外部”,忽略了世博會(huì)本身的動(dòng)態(tài)變化特征(比如每日各類活動(dòng)數(shù)量)對(duì)于客流量的解釋作用,也是本研究的一個(gè)局限。

從分析結(jié)果可見(jiàn),不能過(guò)分高估線性回歸模型的意義,對(duì)于世博會(huì)日散客客流量的多元線性回歸,可以作為世博會(huì)客流量預(yù)測(cè)研究工作的起點(diǎn),因?yàn)榫€性回歸模型是最簡(jiǎn)單的一種回歸。對(duì)線性回歸模型進(jìn)行擴(kuò)充、加入其他預(yù)測(cè)模型的元素進(jìn)行修正才有可能使模型的預(yù)測(cè)精度提升。比如后期假日前后的客流量預(yù)測(cè)誤差往往較大,然而“周末因素”的觀察期內(nèi)的線性相關(guān)不顯著。同時(shí)直觀觀察可見(jiàn)周五、周六的客流普遍有所上升,而周日較周六客流回落明顯,同時(shí)按照實(shí)際情況下,散客選擇周五晚以及周六全天入園參觀有較工作日應(yīng)有更強(qiáng)的參觀動(dòng)機(jī),這里可能“周末效應(yīng)”要將周五擴(kuò)充入,并且可能“周末效應(yīng)”并非線性的疊加,而是一種乘數(shù)的“放大”,周五至周日三日的指標(biāo)如何定量才能取得最佳的預(yù)測(cè)效果都是值得進(jìn)一步探討的問(wèn)題。

隨著時(shí)間的推移,模型一定是需要持續(xù)修正的。一是因?yàn)榭赡苡绊懮⒖蛥⒂^日期決策的因素可能會(huì)增加,不過(guò)在新增因素的時(shí)候必須了解因素過(guò)多的線性回歸是不合理的,譬如:若為高考結(jié)束單獨(dú)增加因素就是不合理的,因?yàn)槿虾?010年的高考人數(shù)為6.6萬(wàn)。二是因?yàn)樵械囊蛩亟忉尪瓤赡馨l(fā)生變化,譬如:同屬指定日的國(guó)慶長(zhǎng)假、最后一周閉幕的人流變動(dòng)模式可能和開(kāi)幕期間相比就不盡相同,或者園區(qū)內(nèi)傳出重大的公共事件也將顯著影響原先的模型。三是有些一直存在的、顯著影響散客決策的因素我們也許尚未發(fā)現(xiàn)或是未能找到一個(gè)合理的定量指標(biāo)來(lái)表示,譬如:到6月12日為止出現(xiàn)的三次50萬(wàn)以上的大客流,模型中就沒(méi)有變量能夠充分解釋。當(dāng)然,對(duì)于世博客流量這樣一個(gè)現(xiàn)實(shí)環(huán)境中較為復(fù)雜的變量,也必須認(rèn)識(shí)到其中必然存在不可解釋的隨機(jī)因素。同時(shí),也不能拔高預(yù)測(cè)工作的意義,客流量預(yù)測(cè)只是更好服務(wù)世博游客的一項(xiàng)準(zhǔn)備工作,而基于客流量預(yù)測(cè)做好資源的優(yōu)化配置工作,積極響應(yīng)各種預(yù)測(cè)外的變化,擁有前瞻性的觀念和視角,才可能全面提高世博游客的滿意度、全面提升他們的觀博體驗(yàn)。

注釋:

①由于天氣預(yù)報(bào)歷史記錄取得的困難,5月1日~5月10日的濕度采用真實(shí)值代替。

[1]維基百科.中國(guó)2010年上海世界博覽會(huì)[EB/OL].[2010 -06 -14].http://zh.wikipedia.org/zh.

[2][日]加藤隆則.上海萬(wàn)博開(kāi)幕、初日1萬(wàn)人大行列[EB/OL].[2010 -05 -01].http://www.yomiuri.co.jp/world/news/20100501-OYT1T00402.htm.

[3]《蘋(píng)果日?qǐng)?bào)》香港版官方網(wǎng)站.世博韓國(guó)館推擠1死百傷[EB/OL].[2010-05-31].http://www.nextmedia.com/applenews/article/art.

[4][美]菲茨西蒙斯.服務(wù)管理 運(yùn)作、戰(zhàn)略與信息技術(shù)[M].張金成,譯.北京:機(jī)械工業(yè)出版社,2008.

[5]王琪舒.游園技巧 五進(jìn)世博園的達(dá)人教你逛世博[N].復(fù)旦學(xué)生服務(wù)導(dǎo)報(bào),2010-05-18(6).

[6]東方早報(bào).沙特館排隊(duì)長(zhǎng)達(dá)4000米 究竟為何讓游客癡迷[EB/OL].[2010 -06 -09].http://expo2010.ifeng.com/dongtai/detail_2010_06/09/1600465_0.shtml.

[7]毛麗君.沙特館直通VIP券增至每天200張 最晚20時(shí)可兌換[EB/OL].[2010-06-08].http://news.xinmin.cn/rollnews/2010/06/08/5154484.html.

[8]許明,屠仕超.“東西場(chǎng)館聯(lián)動(dòng)”顯效 城市最佳實(shí)踐區(qū)今火爆[EB/OL].[2010-05-19].http://sh.xinmin.cn/shizheng/2010/05/19/4938260.html.

[9]曹玲娟,王有佳.完成六場(chǎng)試運(yùn)行演練?世博熱身收獲百萬(wàn)熱情[EB/OL].[2010-04-28].http://travel.people.com.cn/GB/11471357.html.

[10]邱瑞賢.世博局局長(zhǎng)洪浩:客流數(shù)低于預(yù)期他“松了一口氣”[EB/OL].[2010-05-05].http://gzdaily.dayoo.com/html/2010 -05/05/content_952652.htm.

[11]南方日?qǐng)?bào).世博游客大幅低于預(yù)期 外界猜測(cè)門(mén)票將減價(jià)[EB/OL].[2010 -05 -20].http://china.nfdaily.cn/content/2010 -05/20/content_12081708.htm.

[12]東方早報(bào).世博局局長(zhǎng)洪浩坦言:世博客流很難有規(guī)律性預(yù)測(cè)[EB/OL].[2010-05-31].http://sh.sina.com.cn/news/s/2010 - 05 - 31/0810144473.html.

[13]世博網(wǎng).上海世博官方網(wǎng)站園區(qū)即時(shí)客流統(tǒng)計(jì)[EB/OL].[2010 - 05 - 05].http://www.expo2010.cn/yqkl/indexn.htm.

[14]世博網(wǎng).中國(guó)2010年上海世博園區(qū)即時(shí)客流統(tǒng)計(jì)[EB/OL].[2010 -05 -06].http://www.expo2010.cn/yqkl/indexn.htm.

[15]劉長(zhǎng)虹.客流量預(yù)測(cè)方法的探討[J].上海工程技術(shù)大學(xué)學(xué)報(bào),2004(3):236-238.

[16]張世英.時(shí)間序列在城市交通預(yù)測(cè)中的運(yùn)用[J].天津大學(xué)學(xué)報(bào),2006(5):13-16.

[17]蔣文燕.基于不同空間尺度的旅游客源預(yù)測(cè)模型對(duì)比研究[J].旅游學(xué)刊,2007(11):17-21.

[18]嚴(yán)汾,蒙吉軍.Logistic增長(zhǎng)模型在游客流量預(yù)測(cè)中的應(yīng)用:以貴州省綏陽(yáng)縣為例[J].人文地理,2005(4):22-26.

[19]魏春玲,孫晉海.中外優(yōu)秀十項(xiàng)全能運(yùn)動(dòng)員成績(jī)結(jié)構(gòu)的因子分析及回歸預(yù)測(cè)模型研究[J].北京體育大學(xué)學(xué)報(bào),2004(5):653-655.

[20]鄧謀優(yōu).基于線性回歸模型的城市化水平預(yù)測(cè):以內(nèi)江市為例[J].內(nèi)江師范學(xué)院學(xué)報(bào),2008(12):36-38.

[21]鄒亮.基于多元線性回歸模型的懷化卷煙需求預(yù)測(cè)分析[J].湖南煙草,2009(1):28-38.

[22]楊月,沈進(jìn).多元線性回歸分析在人才需求預(yù)測(cè)中的應(yīng)用[J].商業(yè)現(xiàn)代化,2006(32):33-34.

[23]徐炳勝.后世博效應(yīng)研究及預(yù)測(cè):以上海為例[J].上海經(jīng)濟(jì)研究,2010(1):103-110.

[24]傅冰.2010年世博會(huì)后上海會(huì)展人才需求分析[J].特區(qū)經(jīng)濟(jì),2009(12):60-61.

[25]李克平.2010年上海世博會(huì)客流預(yù)測(cè)分析[J].交通與運(yùn)輸,2005(1):21-22.

[26]解放牛網(wǎng).旅游信息[EB/OL].[2010-06-14].http://find.jfdaily.com/search.asp.

[27]上海市氣象局.天氣預(yù)報(bào):本市天氣預(yù)報(bào)[EB/OL].[2010 - 06 - 14].http://www.smb.gov.cn/SMBWeb/WeatherForecast/Forecast.aspx.

[28]吳兌.多種人體舒適度公式預(yù)報(bào)討論[J].氣象科技,2003(6):370-372.

[29]陶寧寧.世博五一門(mén)票售罄[N].東方早報(bào),2010-04-08(6).

[30]李志強(qiáng).概率論與數(shù)理統(tǒng)計(jì)教程[M].北京:科學(xué)出版社,2008:210-211.

猜你喜歡
散客世博客流量
十年磨劍,世博再出發(fā)
基于散客旅游供應(yīng)鏈視角的旅游產(chǎn)品探討
基于嵌入式系統(tǒng)的商場(chǎng)客流量統(tǒng)計(jì)算法
分析旅行社對(duì)散客的服務(wù)管理
倫理視域下城市散客旅游者行為特征研究——以南京市為例
基于AFC數(shù)據(jù)的城軌站間客流量分布預(yù)測(cè)
從客流量推算公交出行PA矩陣的方法
新建旅游項(xiàng)目客流量分析方法初探
難忘世博難說(shuō)再見(jiàn)
給“世博”拍張照
齐齐哈尔市| 麻栗坡县| 莒南县| 安吉县| 平山县| 新源县| 宜州市| 仙居县| 保靖县| 沙河市| 青岛市| 石棉县| 孟连| 新沂市| 陆河县| 临沧市| 邯郸市| 北安市| 涟水县| 杭锦后旗| 深州市| 稷山县| 本溪| 息烽县| 柳江县| 佳木斯市| 洛浦县| 留坝县| 宁南县| 郸城县| 洪泽县| 克拉玛依市| 石阡县| 绍兴市| 勐海县| 铜陵市| 工布江达县| 新密市| 娄底市| 武汉市| 镇江市|