王晨雨 常雪松 潘運偉 董宇恒 王彬汕
古典園林的服務(wù)對象在當(dāng)代發(fā)生了顯著變化,從歷史上為少數(shù)達官顯貴服務(wù)變成為當(dāng)代為人民大眾服務(wù)。由于服務(wù)對象發(fā)生變化,所以知名園林景區(qū)在高峰期發(fā)生擁堵?lián)頂D的現(xiàn)象屢見不鮮。頤和園是中國古典園林的杰出代表,是北京古都文化旅游的核心景區(qū)之一,目前也存在高峰超載、客流時空分布不均等問題。本文以網(wǎng)絡(luò)大數(shù)據(jù)為基礎(chǔ),揭示了頤和園游人空間分布特點和游線組織特征:第一,頤和園游人分布呈現(xiàn)北多南少,東多西少的特點;第二,游人線路組織主要有5條,其中北宮門——佛香閣——東宮門一線比例最大;第三,北宮門與佛香閣,長廊西與石舫,南湖島與十七孔橋三組景點的關(guān)聯(lián)度最大。
頤和園是中國古典園林的杰出代表,坐落在北京西郊,占地約290 hm2,是三山五園的核心組成部分。頤和園2017年接待1 700萬人次游人(含免票游人),是北京接待游人最多的景區(qū)。如此大的客流給頤和園的游人管理帶來極大壓力。一是高峰超載,小長假和黃金周期間日均接待游人量一般超過12萬人次,遠遠超過《頤和園總體規(guī)劃》所核定的日容量6.1萬人次游人量。二是時空分布不均,突出表現(xiàn)為北多南少,東多西少,同時核心景點游人超載,給遺產(chǎn)保護帶來比較大的隱患。
目前,學(xué)術(shù)界對頤和園的客流不平衡問題的關(guān)注較少。黃瀟婷(2009)研究了頤和園六類客流流向,但對游人的時空分布特點研究不足。她還以GPS追蹤調(diào)查的數(shù)據(jù)為基礎(chǔ),比較了其與傳統(tǒng)的活動日志調(diào)查方法的利弊。黎巎(2014)運用Agent模型探索頤和園全園客流預(yù)測與調(diào)控的方法。本文結(jié)合《頤和園風(fēng)景區(qū)總體規(guī)劃》編制工作,重點介紹在頤和園中運用大數(shù)據(jù)研究客流的技術(shù)方法和主要結(jié)論。
(一)數(shù)據(jù)來源
以全網(wǎng)游記數(shù)據(jù)為基礎(chǔ),包括攜程、馬蜂窩、去哪兒、同程、窮游和貓途鷹等旅游網(wǎng)站抓取頤和園相關(guān)的游記文本素材,得到50 00余篇游記,共約300萬字文本素材。
(二)技術(shù)流程
技術(shù)流程步驟包括數(shù)據(jù)抓取、數(shù)據(jù)清洗、軌跡抽取和軌跡分析幾個部分。
1.數(shù)據(jù)抓取
利用八爪魚等網(wǎng)頁爬蟲工具獲取頤和園游記數(shù)據(jù)。首先了解每個游記網(wǎng)站的網(wǎng)頁結(jié)構(gòu),利用XPath導(dǎo)航找準(zhǔn)網(wǎng)頁中的標(biāo)題、正文和其它結(jié)構(gòu)化數(shù)據(jù)的節(jié)點位置,并在爬蟲軟件中設(shè)置自動翻頁、列表循環(huán)、詳細(xì)頁進入、文本定位和數(shù)據(jù)抓取等流程,通過Ajax(主要用于頁面的異步加載)、休眠時間和特殊錨點定位等動作調(diào)試流程無誤后,進行頤和園游記數(shù)據(jù)的自動采集和抓取。
2.數(shù)據(jù)清洗
對游記文本數(shù)據(jù)進行本地篩選處理。刪除重復(fù)內(nèi)容,刪除按照正則表達式抽取出的網(wǎng)站模板和廣告等無效數(shù)據(jù),刪除過短或純符號等無意義素材,最后共得到的5 000余篇(即5 000余條行程),共約300萬字游記素材,保存為純文本格式文件。
3.軌跡抽取
利用excel進行軌跡抽取。將已經(jīng)掌握的全部頤和園景點和停留節(jié)點作為行內(nèi)容,將每一條行程作為列內(nèi)容,利用find函數(shù)查找每個節(jié)點是否出現(xiàn)在每條行程中,以及出現(xiàn)的具體字節(jié)位置,根據(jù)出現(xiàn)的字節(jié)位置進行排序構(gòu)成單條行程中的游人軌跡。對5000條行程進行相同操作,形成5 000條游人軌跡。如圖1所示。
4.軌跡分析
以客流軌跡線路圖為基礎(chǔ),對客流軌跡進行聚類分析、軌跡密度分析、關(guān)聯(lián)力分析。其中,聚類分析可獲取游人的主要游線,軌跡密度分析能夠反映游人的空間分布特點,關(guān)聯(lián)力分析可以揭示兩兩景點之間的聯(lián)系強度。
(一)客流軌跡
通過聚類分析,排除明顯不合理的線路“噪音”后,共得出5條主要線路如下。
線路1:東宮門—長廊—佛香閣—萬壽山—蘇州街—北宮門。
線路2:北宮門—蘇州街—萬壽山—佛香閣—石舫—仁壽殿—十七孔橋—新建宮門。
線路3:新建宮門—南湖島—石舫—長廊—仁壽殿—東宮門。
線路4:東宮門—長廊—石舫—長廊—東宮門。
線路5:南如意門—南湖島—文昌院—長廊—佛香閣—北宮門。
游人主要線路見圖1。
從客流軌跡反映的情況來看,主要有如下各個特點:線路1是游人選擇最多的游線,其次為線路4;經(jīng)過西堤、山后地區(qū)的游覽線路比較少;游人出入口主要集中在北宮門、東宮門,新建宮門、南如意門次之。這些特點出現(xiàn)的主要原因在于地鐵4號線在北宮門設(shè)站,北京觀光三線的終點站也位于北宮門。東宮門是頤和園正門,一般游人會選擇東宮門出入頤和園,另外東宮門外有公交場站和停車場,游人來此也比較方便,因此,從東宮門出入的游人較多。新建宮門距離頤和園核心景點南湖島較近,因此,也有不少游人選擇從新建宮門出入。從南如意門出入的游人主要來自于長河、昆玉河游船的游人。
(二)客流密度
從客流軌跡密度來看,主要呈現(xiàn)如下幾個特點。
首先,頤和園客流整體呈現(xiàn)北密南疏,東多西少的特點??土鬈壽E密度見圖2。
其次,圖2中的線路1是游人最多的一條線路,即北宮門—蘇州街—佛香閣—長廊—東宮門。
最后,所有游線都經(jīng)過長廊一線,這也是造成長廊旅游高峰期較為擁堵的重要原因。除此之外,當(dāng)?shù)氐臒衢T景點還有南湖島、玉瀾堂、東宮門等,在旅游旺季,過大的游客量給文物和遺產(chǎn)保護帶來較大壓力。
(三)景點關(guān)聯(lián)度
關(guān)聯(lián)景點反映的是游人線路組織過程中的景點聯(lián)系強度特征。從圖3反映的情況來看,主要有3組關(guān)聯(lián)度比較密切的景群,分別是北宮門—佛香閣、長廊西—石舫、南湖島—十七孔橋。此外,北宮門—石舫、北宮門—長廊西、北宮門—東宮門和新建宮門—十七孔橋等景點的聯(lián)系度也比較緊密。
景點間聯(lián)系越緊密,2個景點間聚集的游人密度就越高,基于微博數(shù)據(jù)所作的游人熱力圖也直接證明了這點(圖4)。上述3組關(guān)聯(lián)度比較強烈的景點,極易在旅游高峰期形成擁堵,需要相關(guān)人員在實際管理中妥善應(yīng)對,以保障旅游安全和遺產(chǎn)安全。
本文以網(wǎng)絡(luò)大數(shù)據(jù)為基礎(chǔ),揭示了頤和園游人空間分布特點和游線組織特征。作為一種新的技術(shù)方法,網(wǎng)絡(luò)大數(shù)據(jù)技術(shù)具有數(shù)據(jù)開放、展示直觀、費用低廉等優(yōu)點,能夠有效展示游人分布特征和游線組織形式,無論在古典園林規(guī)劃設(shè)計,還是在園林和公園管理方面都具有非常重大的意義。在古典園林規(guī)劃設(shè)計方面,其分析結(jié)果能夠為空間和線路調(diào)整提供支撐;在園林和公園管理方面,能夠促進古典園林和公園管理升級,從而提高游人的游覽品質(zhì)。
網(wǎng)絡(luò)大數(shù)據(jù)在揭示游人空間部分方面具有一定優(yōu)勢,通過頤和園的案例可知,其也呈現(xiàn)出較好的效果。其不足之處在于以下幾點。第一,數(shù)據(jù)的有效性問題。目前一些旅游網(wǎng)站上存在營銷“軟文”的現(xiàn)象,即不是真實的游人所寫的文章,這部分?jǐn)?shù)據(jù)會對結(jié)果產(chǎn)生影響,但影響到何種程度還有待于進一步研究。第二,網(wǎng)絡(luò)大數(shù)據(jù)雖能夠比較好地反映空間方面的特征,但不能反映時間特征,未來人們可以結(jié)合手機信令的實時數(shù)據(jù)進行進一步優(yōu)化。
(作者單位:北京清華同衡規(guī)劃設(shè)計研究院有限公司旅游與風(fēng)景區(qū)規(guī)劃所)