韓 艷,龔 浩
(北京工業(yè)大學(xué) 交通工程北京市重點(diǎn)實(shí)驗(yàn)室,北京 100124)
在節(jié)假日等旅游高峰期,部分熱門景區(qū)(點(diǎn))大量游客聚集而形成區(qū)域擁堵,對(duì)游客體驗(yàn)、安全和景區(qū)管理產(chǎn)生較大影響,急需精準(zhǔn)識(shí)別景區(qū)內(nèi)不同區(qū)域或景點(diǎn)的游客,實(shí)時(shí)預(yù)測(cè)預(yù)警游客流量,實(shí)施分流和限流[1-3]等客流調(diào)控方案。
游客客流采集數(shù)據(jù)有視頻數(shù)據(jù)、閘機(jī)刷卡數(shù)據(jù)、RIDF數(shù)據(jù)、人工統(tǒng)計(jì)數(shù)據(jù)等,多為景區(qū)整體客流數(shù)據(jù),無法準(zhǔn)確獲取景區(qū)某些局部區(qū)域或者某熱門景點(diǎn)的客流量,數(shù)據(jù)實(shí)時(shí)性較差,無法滿足實(shí)時(shí)客流預(yù)測(cè)預(yù)警的要求[4]。手機(jī)信令數(shù)據(jù)具有覆蓋面全、實(shí)時(shí)性高等優(yōu)勢(shì)[5-6],被廣泛用于游客的識(shí)別與出行特性分析。手機(jī)信令數(shù)據(jù)是由手機(jī)終端和手機(jī)基站間聯(lián)系時(shí)生成的數(shù)據(jù),景區(qū)的邊界與基站服務(wù)邊界通常不完全重合,服務(wù)于景區(qū)與其周邊的基站用戶包含游客和非游客,不少學(xué)者開展了基于手機(jī)信令數(shù)據(jù)的游客識(shí)別方法研究,提出用停留時(shí)間等指標(biāo)差異進(jìn)行用戶分類。楊東、LI等[7-8]將景區(qū)基站服務(wù)用戶分為游客與非游客兩類,前者以8 h為長白山景區(qū)內(nèi)游客平均停留時(shí)間閾值,后者以8—18點(diǎn)內(nèi)的停留時(shí)間在0.5~5 h為閾值,區(qū)分游客與非游客。龍奮杰等[9]將用戶分為園區(qū)工作者、路人和游客3類,假設(shè)在景區(qū)基站停留時(shí)間不超過0.5 h的用戶為路人;一周內(nèi)出現(xiàn)5 d以上且每天停留時(shí)間超過5 h的用戶為園區(qū)工作者,其余為游客,校驗(yàn)結(jié)果顯示精度達(dá)到80%左右。ZHAI等[10]先將至少2次經(jīng)過出入口基站的用戶篩選為潛在游客,再根據(jù)用戶停留時(shí)間(1~6 h)和連接景區(qū)基站的時(shí)間占比(超過90%)兩個(gè)指標(biāo)識(shí)別游客。方家、陳圣威等[11-12]將用戶分為路人、居民、工作人員和游客4類,方家假定0—5點(diǎn)手機(jī)為關(guān)機(jī)狀態(tài)的用戶為居民。陳圣威根據(jù)用戶多日凌晨、工作時(shí)間內(nèi)在研究區(qū)域的停留時(shí)長,識(shí)別用戶的工作地與居住地,篩選并剔除在景區(qū)周邊居住或工作的用戶,根據(jù)景區(qū)面積設(shè)置停留時(shí)間的閾值為1~3 h,識(shí)別游客,精度達(dá)到75%左右。
已有研究多用單一指標(biāo)景點(diǎn)停留時(shí)間進(jìn)行用戶分類,問題在于不同類型用戶在不同景點(diǎn)的停留時(shí)間的閾值不同,且當(dāng)將用戶分為路人、居民、工作人員和游客4類時(shí),短時(shí)游覽的游客與路人特性、長時(shí)間游覽的游客與工作人員的停留時(shí)間接近,導(dǎo)致游客的識(shí)別精度為60%~80%[9,12]。為解決上述問題,論文提出基于手機(jī)信令數(shù)據(jù)提取出行者的出行鏈,分析游客與非游客(工作人員、路人)一日、多日或者更長時(shí)間內(nèi)(工作日、假日)的出行鏈時(shí)空特性差異,修正現(xiàn)有游客識(shí)別方法,以提高識(shí)別精度,為不同景區(qū)游客停留時(shí)間閾值和后續(xù)景區(qū)局部客流預(yù)測(cè)預(yù)警提供數(shù)據(jù)支持。
手機(jī)信令數(shù)據(jù)是由手機(jī)終端和手機(jī)基站間聯(lián)系時(shí)生成的數(shù)據(jù)。當(dāng)用戶在某個(gè)基站內(nèi)進(jìn)行通話、短信、開關(guān)機(jī)等事件時(shí),事件會(huì)被該基站記錄,并生成一條數(shù)據(jù)。當(dāng)用戶進(jìn)行基站間移動(dòng)時(shí),會(huì)自動(dòng)切換連接的基站,同時(shí)生成一條數(shù)據(jù)。因此用戶接打電話、開關(guān)機(jī)或進(jìn)行較大范圍移動(dòng)時(shí),均會(huì)生成信令數(shù)據(jù)[13]。手機(jī)信令數(shù)據(jù)主要包含國際移動(dòng)用戶識(shí)別碼(IMSI,International Mobile Subscriber Identity)、時(shí)間(TIME)、基站編號(hào)(CELLID)、基站經(jīng)度(LONGITUDE)和基站緯度(LATITUDE)5類信息,部分信息如表1所示。
表1 手機(jī)信令數(shù)據(jù)表(部分)Table1 Mobile data sheet (part)國際移動(dòng)用戶識(shí)別碼時(shí)間基站編號(hào)基站經(jīng)度基站緯度114:00:182 057116.586 8640.078114:17:2053 167116.478 3339.979 69115:04:5339 667116.339 9139.944 63116:58:593 827116.331 6639.956 67
現(xiàn)有數(shù)據(jù)獲取技術(shù)包括射頻識(shí)別技術(shù)、視頻識(shí)別技術(shù)、人工統(tǒng)計(jì)和手機(jī)信令數(shù)據(jù)等方式,各類數(shù)據(jù)的特點(diǎn)和適用場(chǎng)景如表2所示。
表2 數(shù)據(jù)類別和特點(diǎn)Table 2 Data types and characteristics數(shù)據(jù)類別適用場(chǎng)景優(yōu)點(diǎn)缺點(diǎn)射頻識(shí)別數(shù)據(jù)設(shè)有門禁的區(qū)域精度高開放區(qū)域數(shù)據(jù)和分布獲取困難視頻采集數(shù)據(jù)室內(nèi)區(qū)域精度較高可獲取客流分布數(shù)據(jù)室外數(shù)據(jù)精度低人工統(tǒng)計(jì)數(shù)據(jù)多用于局部區(qū)域精度高處理方便成本高實(shí)時(shí)性低手機(jī)信令數(shù)據(jù)較大范圍區(qū)域較小范圍識(shí)別精度不足實(shí)時(shí)性高可獲取時(shí)空分布數(shù)據(jù)
對(duì)于不同應(yīng)用場(chǎng)景,不同的數(shù)據(jù)適用程度不同。以景區(qū)為例,對(duì)于景區(qū)的整體客流量數(shù)據(jù)獲取來說,通過門禁的統(tǒng)計(jì)數(shù)據(jù)可以準(zhǔn)確的得到景區(qū)內(nèi)不同時(shí)段的入園人數(shù)、在園人數(shù)等整體數(shù)據(jù),但對(duì)于景區(qū)內(nèi)不同區(qū)域、不同景點(diǎn)的客流分布情況卻無法準(zhǔn)確及時(shí)地獲??;對(duì)景區(qū)內(nèi)較小的室內(nèi)景點(diǎn)來說,視頻識(shí)別數(shù)據(jù)可以簡單地獲取到室內(nèi)的客流量、密度和分布情況,對(duì)于室內(nèi)區(qū)域的客流情況可以快速做出識(shí)別與分析,但該技術(shù)在室外的效果會(huì)受到天氣、建筑遮擋等多種因素的影響,造成精度不足的問題;傳統(tǒng)的人工計(jì)數(shù)方式能解決前面兩類技術(shù)存在的問題,可以通過增加調(diào)查人員獲取景區(qū)不同區(qū)域、不同景點(diǎn)的客流量、密度、分布等數(shù)據(jù),但數(shù)據(jù)采集成本高、實(shí)時(shí)性低,對(duì)于景區(qū)短時(shí)預(yù)測(cè)預(yù)警和景區(qū)管控等參考價(jià)值有限。
手機(jī)信令數(shù)據(jù)具有覆蓋范圍廣、定位速度快、實(shí)時(shí)性強(qiáng)、連續(xù)性強(qiáng)等特點(diǎn)。結(jié)合數(shù)據(jù)的連續(xù)性,對(duì)客流進(jìn)行連續(xù)的追蹤與分析,因此多用于城市內(nèi)多個(gè)景區(qū)間的客流特征分析和挖掘[14-18]。并且根據(jù)景區(qū)類型的不同,可以通過手機(jī)信令數(shù)據(jù),實(shí)時(shí)獲取景區(qū)內(nèi)不同區(qū)域的客流分布數(shù)據(jù),針對(duì)景區(qū)內(nèi)不同區(qū)域的客流量、分布情況、客流特征和出行特點(diǎn)進(jìn)行提取與分析。
景區(qū)游客識(shí)別中需要考慮游客的停留時(shí)間、出行軌跡等出行的因素,以及景區(qū)的類型、景區(qū)大小、景區(qū)位置、景區(qū)周邊用地性質(zhì)和道路情況等景區(qū)的因素,這兩部分。
出行因素中,主要考慮游客在景區(qū)研究范圍內(nèi)的停留時(shí)間,以及出行軌跡是否經(jīng)過景區(qū)范圍。
景區(qū)因素中,首先旅游景區(qū)分為開放型與封閉型兩種,開放型是沒有面積和空間限制、免費(fèi)、游客流動(dòng)性更大不易管控的一類景區(qū)[19],封閉型是指有空間限制,通過一定的物理設(shè)施隔離景區(qū)與外圍的空間的一類景區(qū)。研究中提出的識(shí)別方法適用于設(shè)有出入口的封閉式景區(qū)。
不同景區(qū)的覆蓋面積大小不同、所處位置有所差異、且不同的地理地貌均會(huì)對(duì)游客識(shí)別造成影響,因此選擇手機(jī)基站為最小單位,進(jìn)行游客數(shù)據(jù)的識(shí)別。大型景區(qū)內(nèi)包含的基站數(shù)會(huì)較多,單個(gè)基站面積較大;小型景區(qū)基站數(shù)較少,單個(gè)基站面積較小?;据^多的景區(qū)中,基站在游客識(shí)別中的作用也會(huì)有所差異,需要根據(jù)功能和位置進(jìn)行分類以保證識(shí)別精度。
同時(shí),景區(qū)周邊的用地性質(zhì)、路網(wǎng)特征也會(huì)對(duì)景區(qū)游客識(shí)別產(chǎn)生干擾。當(dāng)景區(qū)周邊存在居住用地、商業(yè)用地和工作用地等,用戶類型就會(huì)出現(xiàn)居民、路人和周邊工作人員等;當(dāng)景區(qū)周邊路網(wǎng)較為密集時(shí),周邊路人的比例也會(huì)提升。
因此景區(qū)的游客識(shí)別中,需要將基站進(jìn)行分類,根據(jù)特定的基站選定研究區(qū)域,以保證識(shí)別方法適用于不同面積和位置的景區(qū);需要將用戶進(jìn)行分類,保證識(shí)別方法可以將游客與居民、路人和周邊工作人員進(jìn)行區(qū)分,保證識(shí)別精度。
景區(qū)內(nèi)部和周邊設(shè)置了一定數(shù)量的基站為景區(qū)用戶服務(wù),手機(jī)基站受到周邊環(huán)境干擾、基站空間分布與基站信號(hào)強(qiáng)度等影響,服務(wù)范圍不規(guī)則,通常采用泰森多邊形的方法表示基站的實(shí)際服務(wù)范圍[20],如圖1所示。
圖1 泰森多邊形
可以發(fā)現(xiàn)基站服務(wù)范圍通常略大于景區(qū)的物理邊界,如圖2所示。根據(jù)景區(qū)邊界與基站服務(wù)范圍的空間重疊關(guān)系,考慮到游客均通過景區(qū)出入口進(jìn)出,景區(qū)出入口基站具有特殊性,將景區(qū)基站分為3類:第一類為覆蓋景區(qū)出入口的基站;第二類為完全處于景區(qū)邊界內(nèi)的基站;第三類為與景區(qū)有部分重疊的基站。為獲取全部游客數(shù)據(jù),選取第一、二和三類基站覆蓋的范圍作為景區(qū)研究區(qū)域。
圖2 景區(qū)邊界和基站分類示意圖
景區(qū)研究區(qū)域內(nèi)的手機(jī)用戶有游客和非游客,非游客包括景區(qū)周邊的居民、工作人員和經(jīng)過景區(qū)周邊道路的路人。研究將景區(qū)研究范圍內(nèi)的用戶分為4類:路人、居民、工作人員和游客。4類用戶與3類基站的對(duì)應(yīng)關(guān)系如表3所示。
a.居民:具有固定的居住地,即凌晨至早上、或晚間時(shí)段內(nèi),具有固定停留點(diǎn),停留時(shí)間超過一定的時(shí)間閾值。居民數(shù)據(jù)一定出現(xiàn)在第三類基站,可能出現(xiàn)在第二類基站。現(xiàn)有研究多將凌晨0:00—5:00停留時(shí)間大于4 h的景區(qū)研究區(qū)域內(nèi)用戶認(rèn)定為居民[11]。
b.周邊工作人員:具有固定的工作地點(diǎn),即連續(xù)幾天出現(xiàn)在同一地點(diǎn),在工作地累計(jì)停留時(shí)間超過一定的時(shí)間閾值。工作人員一定不會(huì)出現(xiàn)在第二類基站,可能出現(xiàn)在第一類和第三類基站。我國工作時(shí)間多為:8:00—17:00,根據(jù)《2016-2017年中國休閑發(fā)展報(bào)告》(休閑綠皮書)中數(shù)據(jù),2016年北京市居民工作時(shí)長約為362 min/d,現(xiàn)有研究將9:00—16:00時(shí)段內(nèi)累計(jì)停留時(shí)間超過5 h的用戶識(shí)別為工作人員。
c.游客:在研究區(qū)域停留時(shí)間超過一定的時(shí)間閾值,不會(huì)連續(xù)幾天出現(xiàn)在研究區(qū)域,出行目的地較多。游客經(jīng)景區(qū)出入口進(jìn)出景區(qū),因此一定出現(xiàn)在第一類基站,可能出現(xiàn)在第二類和第三類基站。
d.路人:在景區(qū)覆蓋范圍內(nèi)沒有固定的駐留地點(diǎn),在研究區(qū)域內(nèi)的總停留時(shí)間短于其他類型用戶。路人一定不會(huì)出現(xiàn)在第二類基站,可能出現(xiàn)在第一類和第三類基站。
從表2分析可以看出,路人、居民、工作人員和游客在空間分布特性上存在一定重疊。如何應(yīng)用手機(jī)信令數(shù)據(jù)進(jìn)行游客的識(shí)別,成為景區(qū)客流預(yù)測(cè)的重要環(huán)節(jié)。
2.4.1不同用戶的出行特征
手機(jī)信令數(shù)據(jù)中包含了表示手機(jī)用戶所在位置的經(jīng)緯度坐標(biāo),以及用戶出現(xiàn)在該坐標(biāo)下的時(shí)刻。基于這兩類數(shù)據(jù),將用戶出行的時(shí)間與空間數(shù)據(jù)進(jìn)行整合,得到按時(shí)間順序排列的用戶全天的出行軌跡,即出行鏈。游客出行鏈?zhǔn)怯慰鸵月糜螢槟康?,從出發(fā)至到達(dá)景區(qū)目的地,以及從當(dāng)前景區(qū)目的地至下一目的地的出行全過程?;谟慰统鲂墟湹臅r(shí)空分布特性,研究基于4類用戶的出行鏈特性分析,提出基于出行鏈的游客識(shí)別和特征分析方法。
基于手機(jī)信令數(shù)據(jù),進(jìn)行數(shù)據(jù)預(yù)處理后,提取用戶的出行鏈[21-24],繪制用戶的出行鏈,4類用戶的出行鏈形式如圖3所示。
a.居民用戶出行鏈特征:居民的多日出行鏈起訖點(diǎn)具有較強(qiáng)的規(guī)律性,出行起訖點(diǎn)均在研究區(qū)域內(nèi),凌晨至早上在區(qū)域內(nèi)沒有移動(dòng)。當(dāng)出行鏈包含多個(gè)活動(dòng)點(diǎn)時(shí),通常離開研究區(qū)域,并在中午或晚上返回研究區(qū)域內(nèi)的居住地,凌晨停留時(shí)間較長。
b.工作人員出行鏈特征:出行起點(diǎn)在研究區(qū)域外,進(jìn)入研究區(qū)域后,在工作時(shí)間內(nèi)、景區(qū)外圍基站有固定的停留地點(diǎn),最后離開研究區(qū)域,工作時(shí)間段內(nèi)停留時(shí)間較長。
c.路人出行特征:出行起點(diǎn)在研究區(qū)域外,進(jìn)入研究區(qū)域后,沿研究區(qū)域外圍邊界移動(dòng),沒有長時(shí)間停留點(diǎn),最后離開研究區(qū)域,總停留時(shí)間較短。
d.游客出行特征:出行起點(diǎn)在研究區(qū)域外,在開園時(shí)間段內(nèi),由景區(qū)出入口基站進(jìn)入研究區(qū)域,且在研究區(qū)域內(nèi)有多處停留時(shí)間較長的地點(diǎn),最后經(jīng)過景區(qū)出入口基站離開研究區(qū)域,總停留時(shí)間較長。
2.4.2游客識(shí)別步驟
基于手機(jī)信令數(shù)據(jù)提取用戶的出行鏈,結(jié)合出行鏈中的活動(dòng)點(diǎn)和每個(gè)活動(dòng)點(diǎn)的停留時(shí)間,構(gòu)建基于出行鏈的景區(qū)游客身份識(shí)別方法。游客識(shí)別步驟流程如圖3所示。具體步驟為:
圖3 游客識(shí)別流程
a.將服務(wù)景區(qū)的基站分為3類:①覆蓋景區(qū)出入口的基站,用Ω1表示;②位于景區(qū)邊界內(nèi)的基站,用Ω2表示;③與景區(qū)有重疊部分的基站,用Ω3表示。將這3類基站選定為研究區(qū)域,在區(qū)域中的用戶用Ω表示。
Ω=Ω1+Ω2+Ω3
(1)
c.將用戶分為4類:①居民;②工作人員;③路人;④游客。
(2)
式中:Oi,Di為用戶i的出行起訖點(diǎn)所在基站,Ω為研究區(qū)域;Pi為用戶i經(jīng)過的中途點(diǎn);t1為用戶在凌晨期間在區(qū)域內(nèi)的停留時(shí)長。
(3)
式中:Oi,Di為用戶i的出行起訖點(diǎn)所在基站,Ω為研究區(qū)域;Pi為用戶i經(jīng)過的中途點(diǎn);t2為用戶在工作時(shí)間內(nèi)在區(qū)域內(nèi)的停留時(shí)長。
f.在景區(qū)開園時(shí)間內(nèi),存在用戶經(jīng)過景區(qū)周邊的基站,在景區(qū)基站的停留時(shí)間t3<1.5 h,出行鏈起訖點(diǎn)均在研究區(qū)域外,在研究區(qū)域內(nèi)沒有固定停留點(diǎn),僅在景區(qū)外圍活動(dòng),將這類用戶識(shí)別為經(jīng)過的路人。剔除路人數(shù)據(jù)。
(4)
式中:Oi,Di為用戶i的出行起訖點(diǎn)所在基站,Ω為研究區(qū)域;Pi為用戶i經(jīng)過的中途點(diǎn);t3為用戶全天在區(qū)域內(nèi)的停留時(shí)長。
g.將d至f中識(shí)別的非游客數(shù)據(jù)剔除后,數(shù)據(jù)中仍可能存在無法通過前面步驟識(shí)別篩除的非游客,因此需要根據(jù)以下兩步進(jìn)行游客的識(shí)別:
① 若景區(qū)邊界內(nèi)包含一個(gè)或多個(gè)完整基站,則將出現(xiàn)在這些基站內(nèi)的用戶識(shí)別為游客。
?Pi∈Ω2
(5)
② 若用戶第一次進(jìn)入出入口基站的時(shí)間為開園時(shí)間以內(nèi),停留時(shí)間t4≥1.5 h,經(jīng)過景區(qū)多個(gè)基站且出行鏈起訖點(diǎn)均在景區(qū)相關(guān)基站外的用戶,判斷為景區(qū)游客。
(6)
式中:tin為用戶進(jìn)入出入口基站的時(shí)刻;T開,T閉為景區(qū)開園和閉園時(shí)間;Pi為用戶i經(jīng)過的中途點(diǎn);t4為用戶在景區(qū)開園時(shí)間內(nèi)在區(qū)域內(nèi)的停留時(shí)長。
3.1.1景區(qū)和手機(jī)信令數(shù)據(jù)簡介
頤和園位于北京市西郊,是國家5A級(jí)旅游景區(qū),中國清朝時(shí)期皇家園林,自然風(fēng)光優(yōu)美秀麗,節(jié)假日期間會(huì)吸引國內(nèi)外眾多游客前往游覽,是我國最熱門的景區(qū)之一。頤和園占地面積大,不同區(qū)域的熱門程度不同,在節(jié)假日期間會(huì)形成明顯的客流分布不均的現(xiàn)象。同時(shí),頤和園周邊基站布置較為密集,因此,選取頤和園為研究對(duì)象,開展基于手機(jī)信令數(shù)據(jù)的游客識(shí)別案例分析具有典型意義。
手機(jī)信令數(shù)據(jù)來自北京移動(dòng)公司某年5月1日0時(shí)至5月3日24時(shí)的全部數(shù)據(jù),劃分研究區(qū)域,基于手機(jī)信令數(shù)據(jù)提取出行鏈,開展基于出行鏈的游客識(shí)別和出行特性研究。
3.1.2研究區(qū)域選取
使用ARCGIS軟件,繪制每個(gè)基站的泰森多邊形,使用泰森多邊形表示該基站的服務(wù)范圍,并將多邊形范圍與頤和園景區(qū)范圍進(jìn)行比較,選取相交和包含關(guān)系的基站,即選擇可以覆蓋頤和園景區(qū)的多邊形所在的基站作為頤和園景區(qū)的研究區(qū)域。頤和園景區(qū)研究區(qū)域共設(shè)有13個(gè)基站。為方便后續(xù)研究,將基站重新編號(hào),編號(hào)如圖4所示。
圖4 頤和園研究區(qū)域
識(shí)別結(jié)果顯示:5月1日至3日頤和園景區(qū)研究區(qū)域內(nèi)游客總數(shù)量為103 966人次。其中5月1日頤和園景區(qū)游客數(shù)為45 136人,居民769人,工作人員1 255人,路人97 039人。
在5月1日的所有出現(xiàn)在頤和園景區(qū)附近的用戶中,路人占比最大,為67%,游客占比31%,居民最少,僅占1%,如圖5所示。
圖5 各類用戶人數(shù)比例圖
根據(jù)數(shù)據(jù)當(dāng)年通信運(yùn)營業(yè)統(tǒng)計(jì)公報(bào)數(shù)據(jù)顯示,北京手機(jī)普及率為90.8%,中國移動(dòng)市場(chǎng)份額為62.1%,根據(jù)普及率與市場(chǎng)份額,將識(shí)別的游客數(shù)量進(jìn)行擴(kuò)樣,得到景區(qū)接待客流量的數(shù)據(jù),得到擴(kuò)樣后的景區(qū)3 d接待游客184 380人。
根據(jù)頤和園“智慧旅游”系統(tǒng)數(shù)據(jù)顯示,當(dāng)年五一長假頤和園景區(qū)接待有客流量為32.7萬人次,其中4月30日接待人數(shù)最多,達(dá)到13.8萬人次,由此計(jì)算得到5月1日至3日頤和園共接待游客18.9萬人次。擴(kuò)樣后識(shí)別數(shù)量占實(shí)際數(shù)據(jù)的97.56%,認(rèn)為提出的基于出行鏈的游客識(shí)別模型精度較高,識(shí)別較為準(zhǔn)確。
游客停留時(shí)間指游客在研究區(qū)域內(nèi)停留的時(shí)間長度,研究以游客出現(xiàn)在研究區(qū)域的累計(jì)時(shí)長,即游客第一次出現(xiàn)在景區(qū)出入口基站時(shí)的數(shù)據(jù)時(shí)間,與最后一次出現(xiàn)在景區(qū)出入口基站的時(shí)間內(nèi),連接研究區(qū)域基站的時(shí)間長度。
游客停留時(shí)間的分布,會(huì)影響到游客識(shí)別流程中停留閾值選擇。因此根據(jù)識(shí)別后得到的游客數(shù)據(jù),進(jìn)行統(tǒng)計(jì)分析,得到如圖6所示的游客停留時(shí)間分布情況。
圖6 頤和園游客停留時(shí)間分布圖
從圖6可以看出,5月1日的頤和園游客停留時(shí)間分布主要集中在1~3 h,占45.74%;其次是游覽3~5 h的游客占30.2%;占比最少的是停留時(shí)間小于1 h的游客,僅為6.31%。由此可以看出,頤和園景區(qū)范圍較大,所需停留時(shí)間稍長,游客也更傾向于中長時(shí)間的游覽。
得到的游客停留時(shí)間分布,與游客識(shí)別模型中選定的大于1.5 h的游客停留時(shí)間判斷閾值相比,分布大致相同,說明選取的閾值適用于頤和園景區(qū)的客流識(shí)別。
通過景區(qū)停留時(shí)間分布也可以反映出,在頤和園景區(qū)中,超過93%的游客在景區(qū)的停留時(shí)間超過1 h,在進(jìn)行游客識(shí)別時(shí),選取的游客停留時(shí)間判斷閾值應(yīng)大于1 h,可以提升識(shí)別精度。
研究基于手機(jī)信令數(shù)據(jù),對(duì)景區(qū)的客流識(shí)別方法進(jìn)行研究,根據(jù)景區(qū)邊界與基站服務(wù)范圍的空間重疊關(guān)系,考慮游客通過景區(qū)出入口進(jìn)出景區(qū)而產(chǎn)生的出入口基站的特殊性,將景區(qū)基站分為3類,第一類為覆蓋景區(qū)出入口的基站;第二類為完全處于景區(qū)邊界內(nèi)的基站;第三類為與景區(qū)有部分重疊的基站,選定了景區(qū)的研究區(qū)域。將用戶分為居民、工作人員、路人和游客4類,分析不同用戶的出行特征,提取用戶出行鏈,提出基于出行鏈的游客識(shí)別方法,最后以北京市頤和園景區(qū)為例進(jìn)行案例分析,得到五一期間共識(shí)別游客103 966人次,游客識(shí)別準(zhǔn)確率達(dá)到97.56%,識(shí)別精度較高。結(jié)果顯示,識(shí)別方法對(duì)于如頤和園占地面積較大的自然類景區(qū)有較好的識(shí)別精度。研究提出的游客識(shí)別方法可以用于大型自然類景區(qū)的客流統(tǒng)計(jì),為景區(qū)的客流分布和移動(dòng)等研究提供數(shù)據(jù)支持,給景區(qū)管理員進(jìn)行大客流預(yù)警調(diào)控提供參考。