史立凱、韓竹斌、胡城峰,3
(1.江蘇電子信息職業(yè)學(xué)院,江蘇 淮安 223003;2.南京城驛城市與交通規(guī)劃設(shè)計(jì)有限公司,江蘇 南京 210000;3.淮安市元亙交通規(guī)劃設(shè)計(jì)有限公司,江蘇 淮安 223021)
城市交通需求預(yù)測(cè)不僅是城市交通規(guī)劃、交通政策制定的依據(jù),也是城市交通重大建設(shè)項(xiàng)目建設(shè)過程的重要參考。近年來,隨著交通精細(xì)化管理的進(jìn)一步發(fā)展,對(duì)交通需求預(yù)測(cè)的精確度要求也進(jìn)一步提高,而較為準(zhǔn)確的交通需求預(yù)測(cè)離不開精準(zhǔn)、全面的交通現(xiàn)狀調(diào)查工作。
傳統(tǒng)的交通現(xiàn)狀調(diào)查手段主要是基于問卷的抽樣調(diào)查,包括居民出行調(diào)查、交通核查線調(diào)查、對(duì)外出入口調(diào)查、交通樞紐調(diào)查等[1]。一方面,傳統(tǒng)調(diào)查需投入較大的人力、財(cái)力,且一般以紙質(zhì)問卷調(diào)查形式為主,效率相對(duì)較低,為了獲得同一天的出行數(shù)據(jù),往往需要幾百人同時(shí)開展調(diào)查工作;另一方面,傳統(tǒng)調(diào)查方式的抽樣率較低,無法有效保證調(diào)查結(jié)果,以居民出行調(diào)查為例,一般城市的抽樣率不超過4%,大城市則更低,難以全面地反饋居民的出行數(shù)據(jù)。
隨著“互聯(lián)網(wǎng)+”、信息化技術(shù)的進(jìn)一步發(fā)展,交通調(diào)查的信息化手段也逐步豐富,包括移動(dòng)終端數(shù)據(jù)(手機(jī)信令數(shù)據(jù)、APP 應(yīng)用數(shù)據(jù)等)、交通設(shè)施數(shù)據(jù)(ETC、IC 卡、電子警察等)及基于GPS 的動(dòng)態(tài)數(shù)據(jù)等[2]。手機(jī)信令數(shù)據(jù)因具備用戶較多、基礎(chǔ)設(shè)施分布較廣、數(shù)據(jù)可挖掘性較強(qiáng)等特點(diǎn),逐步成為重要的交通調(diào)查輔助手段。手機(jī)信令數(shù)據(jù)在交通需求分析領(lǐng)域從最初的分析城市居民職住分布情況,逐步發(fā)展到基于手機(jī)信令數(shù)據(jù)的出行數(shù)據(jù)分析、在交通專項(xiàng)需求分析中的應(yīng)用及出行模型的應(yīng)用等研究[3]。
手機(jī)信令數(shù)據(jù)的現(xiàn)狀研究集中在調(diào)查分析及交通出行分析方面,缺乏在城市交通需求預(yù)測(cè)方法方面的應(yīng)用和研究。對(duì)此,基于手機(jī)信令數(shù)據(jù)的應(yīng)用原理、交通需求預(yù)測(cè)方法對(duì)手機(jī)信令數(shù)據(jù)在城市交通需求預(yù)測(cè)中的應(yīng)用進(jìn)行研究,并基于南通手機(jī)信令數(shù)據(jù)的應(yīng)用進(jìn)行分析。
手機(jī)信令數(shù)據(jù)的處理包括多個(gè)步驟:對(duì)原始手機(jī)信令數(shù)據(jù)的采集、預(yù)處理(清洗、排序、修補(bǔ)),基于交通分區(qū)的數(shù)據(jù)匹配、出行需求OD 整理等。通過這一系列步驟可獲得居民出行的相關(guān)數(shù)據(jù)信息。
手機(jī)使用終端與發(fā)射基站或微站之間會(huì)產(chǎn)生交互的通信數(shù)據(jù),這一數(shù)據(jù)從手機(jī)終端開啟后即產(chǎn)生,這一通信數(shù)據(jù)即為手機(jī)信令[4]。手機(jī)信令數(shù)據(jù)可記錄終端編號(hào)、出現(xiàn)時(shí)間,結(jié)合基站坐標(biāo)串聯(lián)起來,即可描述手機(jī)終端使用者的行動(dòng)軌跡,形成出行數(shù)據(jù)。
手機(jī)信令數(shù)據(jù)包含的字段較多,脫敏(去除用戶個(gè)人信息數(shù)據(jù))后的手機(jī)信令數(shù)據(jù)一般包含7 個(gè)字段:移動(dòng)端ID、發(fā)生時(shí)間、位置區(qū)域編號(hào)、基站網(wǎng)格編號(hào)、事件編號(hào)、國(guó)際用戶識(shí)別碼。通過數(shù)據(jù)的清洗、排序、修補(bǔ)等過程,按照出行需求分析的各個(gè)階段,將數(shù)據(jù)整理成數(shù)據(jù)表格,包括人口分布、崗位分布、人口動(dòng)態(tài)分布、OD 分布等數(shù)據(jù)表格(見表1)。
表1 基于手機(jī)信令數(shù)據(jù)處理的出行數(shù)據(jù)表格
通過記錄同一手機(jī)使用終端在不同基站之間的時(shí)間差,結(jié)合基站坐標(biāo),可獲得居民出行數(shù)據(jù),即基站密度越大,出行數(shù)據(jù)越精確,但隨著基站數(shù)量的增加,手機(jī)信令數(shù)據(jù)會(huì)出現(xiàn)一定的誤差。因此,需要從“乒乓效應(yīng)”、數(shù)據(jù)漂移兩個(gè)方面分析手機(jī)信令數(shù)據(jù)清洗原理。
1.2.1 乒乓切換處理
“乒乓效應(yīng)”的產(chǎn)生是由于相同的位置可能被多個(gè)基站信號(hào)所覆蓋,處于該區(qū)域的手機(jī)號(hào)會(huì)因?yàn)橹丿B覆蓋的各個(gè)基站信號(hào)強(qiáng)度、負(fù)荷問題發(fā)生切換,在信令數(shù)據(jù)的體現(xiàn)方面,會(huì)出現(xiàn)該用戶真實(shí)位置沒有發(fā)生變化的情況下,產(chǎn)生多條位置切換的信令數(shù)據(jù)的現(xiàn)象。
應(yīng)對(duì)“乒乓效應(yīng)”,一般采用較基于RSSI 的三角定位模型進(jìn)行用戶位置定位,即已知三個(gè)點(diǎn)的坐標(biāo)和其與目標(biāo)用戶的距離,求解目標(biāo)用戶的位置[5]。三個(gè)基站與目標(biāo)用戶的距離可以根據(jù)RSSI 信號(hào)的強(qiáng)弱轉(zhuǎn)換來確定。
1.2.2 數(shù)據(jù)漂移清洗
數(shù)據(jù)漂移是指因特殊原因?qū)е率謾C(jī)信令服務(wù)基站位置跳躍而出現(xiàn)數(shù)據(jù)信息脫離實(shí)際位置的情況。數(shù)據(jù)漂移清洗擬采用數(shù)據(jù)點(diǎn)速度的閾值清除方法開展。根據(jù)居民出行方式速度特性確定最大出行速度的閾值,并清除超過速度閾值的數(shù)據(jù)條。
2.1.1 城市概況
南通是長(zhǎng)三角城市群核心地帶的主要城市之一,2021 年年末常住總?cè)丝诩s773 萬人,市區(qū)常住人口約380 萬(數(shù)據(jù)來源:南通市統(tǒng)計(jì)局網(wǎng)站http://tjj.nantong.gov.cn/)。近年來,城市綜合交通得到大力發(fā)展,“一軸一環(huán)六射”快速路系統(tǒng)、城市軌道1 號(hào)線、2號(hào)線開通在即。為了支撐南通未來的“八橫八縱”快速路系統(tǒng)建設(shè)、“4 普2 快”城市軌道系統(tǒng)建設(shè),有必要量化分析南通市城市出行需求。
2.1.2 運(yùn)營(yíng)商選擇
手機(jī)運(yùn)營(yíng)商包括中國(guó)移動(dòng)、中國(guó)電信和中國(guó)聯(lián)通。從市場(chǎng)占比上看,中國(guó)移動(dòng)遙遙領(lǐng)先,但其沒有統(tǒng)一的全國(guó)數(shù)據(jù)中心,較難獲得對(duì)外出行的手機(jī)信令數(shù)據(jù)[6]。中國(guó)聯(lián)通與中國(guó)電信都具有全國(guó)數(shù)據(jù)中心,溝通成本低,數(shù)據(jù)格式統(tǒng)一。因此,此次調(diào)查以中國(guó)電信數(shù)據(jù)中心作為數(shù)據(jù)來源,以中國(guó)電信在南通的市場(chǎng)占有率作為擴(kuò)樣系數(shù)。
2.1.3 基站分布
南通市全市分布基站網(wǎng)格約1.13 萬個(gè)(分布情況見圖1),密度約1.4 個(gè)/km2,其中市區(qū)范圍分布基站網(wǎng)格約5000 個(gè),密度約1.7 個(gè)/km2。結(jié)合城市用地分布將南通市區(qū)劃分約1100 個(gè)交通小區(qū)(分布情況見圖2),坐標(biāo)與基站統(tǒng)一為WGS84 坐標(biāo)體系。
圖1 南通市域基站網(wǎng)格分布圖
圖2 南通市區(qū)交通小區(qū)劃分圖
2.2.1 現(xiàn)狀人口崗位分布
根據(jù)中國(guó)電信手機(jī)信令數(shù)據(jù)擴(kuò)樣,結(jié)合南通市官方現(xiàn)狀人口崗位規(guī)模,得到全市范圍人口崗位分布情況。將手機(jī)信令數(shù)據(jù)集計(jì)到交通小區(qū),可統(tǒng)計(jì)分區(qū)數(shù)據(jù)情況[7]。根據(jù)分析,南通常住人口大多就業(yè)選擇所在縣區(qū),內(nèi)部就業(yè)比例均高于85%。市區(qū)范圍內(nèi)的跨區(qū)就業(yè)相對(duì)較高,如南通新城區(qū)、通州副城、空港片區(qū)跨區(qū)就業(yè)比例為10%~15%。
2.2.2 出行生成的應(yīng)用
城市居民出行調(diào)查一般認(rèn)為出行距離大于500m作為一次有效出行,而手機(jī)信令數(shù)據(jù)相對(duì)精度較高,數(shù)據(jù)融合過程中仍以大于500m 作為一次有效出行進(jìn)行數(shù)據(jù)清洗,并與居民出行調(diào)查數(shù)據(jù)進(jìn)行校核,作為出行生成率和出行吸引率回歸計(jì)算的依據(jù)[8]。
2.2.3 出行分布的應(yīng)用
結(jié)合南通市城市發(fā)展趨勢(shì),出行分布采用雙約束重力模型,模型的標(biāo)定數(shù)據(jù)材料包括現(xiàn)狀出行OD,現(xiàn)狀分區(qū)的發(fā)生量、吸引量。為保證數(shù)據(jù)的一致性,均采用手機(jī)信令集計(jì)的數(shù)據(jù),標(biāo)定獲得的α、β、γ 參數(shù)及K-factor 矩陣,作為交通需求預(yù)測(cè)預(yù)置參數(shù),得到預(yù)測(cè)年交通分布矩陣。南通市現(xiàn)狀全方式出行期望線見圖3,南通市2035 年預(yù)測(cè)出行期望線見圖4。
圖3 南通市現(xiàn)狀全方式出行期望線
圖4 南通市2035 年預(yù)測(cè)出行期望線
2.2.4 方式劃分的應(yīng)用
方式劃分采用巢式競(jìng)爭(zhēng)(NL)模型,各出行方式出行選擇肢通過競(jìng)爭(zhēng)模型進(jìn)行選擇,出行效用包括出行時(shí)間和費(fèi)用等。
因出行距離清洗、速度拆分等過程存在較多數(shù)據(jù)噪點(diǎn),因此通過居民出行調(diào)查中的分距離、分方式的方式比例,對(duì)通過手機(jī)信令數(shù)據(jù)獲得的出行方式矩陣進(jìn)行修正。
手機(jī)信令數(shù)據(jù)在交通需求預(yù)測(cè)中的應(yīng)用不僅包括對(duì)需求相關(guān)參數(shù)標(biāo)定和需求的校核,還可以用于分析指定通道的交通需求,為新建、改擴(kuò)建的大型交通通道提供需求依據(jù);交通來源分析,為重點(diǎn)分析某些片區(qū)或建筑的出行特征等提供數(shù)據(jù)支持;用于分析特定斷面的出行需求,主要用于分析跨片區(qū)出行規(guī)模,作為特定交通分區(qū)出行校核是依據(jù)。
與傳統(tǒng)的交通調(diào)查方式相比,手機(jī)信令數(shù)據(jù)具有抽樣率更高、數(shù)據(jù)更準(zhǔn)確的特點(diǎn),可幫助相關(guān)部門更全面地掌握城市交通需求狀況。然而手機(jī)信令數(shù)據(jù)在交通需求方面的應(yīng)用仍有兩個(gè)待解難題:一是匹配終端使用者的出行特征(個(gè)人特征、出行目的等),二是匹配更為準(zhǔn)確的出行方式矩陣。
目前,城市交通需求模型仍主要采用基于交通小區(qū)的集計(jì)模型,隨著手機(jī)信令數(shù)據(jù)挖掘技術(shù)的進(jìn)一步發(fā)展,在基于手機(jī)信令出行方式劃分交通區(qū)方法逐步可靠的基礎(chǔ)上,可適時(shí)開展城市交通需求預(yù)測(cè)非集計(jì)模型研究。