陳小鴻,陳先龍,,李彩霞,陳嘉超
(1.同濟大學(xué)道路與交通工程教育部重點實驗室上海201804;2.廣州市交通規(guī)劃研究院信息模型所,廣東廣州510030)
居民出行調(diào)查(household travel survey,HTS)是對城市居民家庭屬性、個人特征、出行日志活動和意愿等的專項調(diào)查,是交通模型開發(fā)與城市交通需求中長期的預(yù)測基礎(chǔ)。居民出行調(diào)查最早起源于1930年代的美國[1],并在隨后的底特律都市區(qū)交通研究[2-3]和芝加哥交通研究[4-5]中得以完善。由于調(diào)查數(shù)據(jù)可以關(guān)聯(lián)出行者屬性和出行活動屬性,迄今為止沒有其他調(diào)查或數(shù)據(jù)可以替代。但居民出行調(diào)查是一種抽樣調(diào)查,必須通過擴樣來推斷總體特征指標。既有居民出行調(diào)查擴樣[6]模型主要包括基于抽樣率的簡單加權(quán)擴樣和基于多種母體數(shù)據(jù)多重加權(quán)擴樣。從擴樣結(jié)果來看看,多重加權(quán)擴樣由于引入了更多的約束條件,更能夠接近城市實際,但樣本的缺陷及誤差,特別是沉默出行需求(unreported trip record)難以在擴樣過程中得到根本上的修正。沉默出行需求主要是指調(diào)查過程中因調(diào)查員漏填或者被調(diào)查對象漏報或者瞞報出行活動記錄。一般而言,調(diào)查數(shù)據(jù)采集過程中,上下班、上學(xué)/放學(xué)、日常生活部分的剛性出行記錄填報通常比較完整,其他非日?;顒拥膹椥猿鲂谢顒觿t容易缺失,特別是涉及個人私密信息的出行活動基本無法獲取。居民出行調(diào)查本身是一項高投入、高成本的綜合性調(diào)查,難以重復(fù)實施,且一旦調(diào)查實施完成就無法更改。所以對沉默出行需求的處理辦法不多,目前使用最廣泛的技術(shù)為開展志愿者調(diào)查,利用GPS輔助技術(shù)獲得志愿者全軌跡數(shù)據(jù),對出行調(diào)查記錄表格進行補充,但通常志愿者樣本量有限??傮w來說,由于沉默出行需求的占比高,數(shù)據(jù)挖掘難度大,這也是擴樣分析過程中公認的重點和難點。
從 國 際 上 來 看,全 美 居 民 出 行 調(diào) 查[7,8](National Household Travel Survey,NHTS)所采用的擴樣方法均為加權(quán)擴樣,主要考慮了家庭和個人2種母體要素及無響應(yīng)率(none-response rate)。2010/2011紐 約 居 民 出 行 調(diào) 查[9]及HOBBS[10]、Richardson[11]等所采用的擴樣方法也同樣是加權(quán)擴樣模型。英格蘭全國居民出行調(diào)查[12]開始于1988年,每年度開展一次,2018年調(diào)查[13]擴樣仍采用的是加權(quán)擴樣模型。其他一些國家也開展全國性的居民出行調(diào)查,如新西蘭[14],愛爾蘭[15],南非[16]等均采用的是加權(quán)擴樣模型。國外的研究主要采用加權(quán)擴樣模型,依賴較為詳細的家庭屬性和個人屬性分類數(shù)據(jù),在此基礎(chǔ)上非常重視對沉默出行需求的 研 究 ,如 Argiropoulos[17]、Forsman[18]、Heathcote[19]等,DVRPC[20]還采用了志愿者GPS軌跡數(shù)據(jù)來進行修正。
中國大陸城市開展居民出行調(diào)查起步較晚,天津[21]于1981年率先在國內(nèi)開展居民出行調(diào)查,隨后北京[22]、上海[23]、廣州[24]等超大城市陸續(xù)開展了該項工作。住房和城鄉(xiāng)建設(shè)部2014年發(fā)布的《城市綜合交通體系規(guī)劃交通調(diào)查導(dǎo)則》[25]和2018年推出的《城市綜合交通調(diào)查技術(shù)標準(GB/T 51334—2018)》[26]進一步促進了中國大陸城市開展居民出行調(diào)查的規(guī)范化。在擴樣方法方面,國外城市基本采用的都是按照人口的分類來構(gòu)造擴樣母體進行加權(quán)擴樣的方法,主要考慮的因素包括家庭特征(家庭組成、收入、車輛擁有)及個人屬性(年齡、性別、就業(yè)就學(xué)等)。本世紀之前,國內(nèi)城市基本沿用了此類加權(quán)擴樣方法[27-28]。香港[29-30]開展居民出行調(diào)查工作相對較早,1973年開展了第一次居民出行調(diào)查,并在1981、1992、2002和2011年相繼開展該項工作,并配合完成了五次交通模型的開發(fā)和維護工作。在擴樣模型方面,香港也采用的是加權(quán)擴樣方法。其他方面,李炬[31]設(shè)計了分數(shù)據(jù)源、分對象、分方式的三步式組合擴樣模型;彭澤宇[32]在組合擴樣模型的基礎(chǔ)上引入了Bootstrap重抽樣原理構(gòu)建擴樣評價指標體系;李元[33]同樣使用加權(quán)擴樣方法來設(shè)計居民出行調(diào)查擴樣分析系統(tǒng)。同樣,國內(nèi)也比較重視對沉默出行需求的挖掘工作,天津在2011年第五次綜合交通調(diào)查[21]中在國內(nèi)率先使用GPS輔助設(shè)備來挖掘沉默出行需求,隨后廣州[6,34]也進行了應(yīng)用,取得了較好的效果。
總體來說,采用加權(quán)校核擴樣模型推斷的居民出行特征指標,雖然能夠比樣本指標更加符合城市實際,但無法彌補抽樣調(diào)查的局限性。首先是調(diào)查母體可靠性問題,特別是城市人口規(guī)模的準確性;其次是漏報率問題,國內(nèi)外研究的結(jié)論居民出行調(diào)查漏報率通常在30%以上;最后是小樣本調(diào)查所得結(jié)果的空間分布誤差影響。本文通過對居民出行調(diào)查誤差成因解析,嘗試通過手機信令數(shù)據(jù)和交通模型相結(jié)合的方法對母體特征、出行強度和空間分布等進行研究,以修正居民出行調(diào)查的原生缺陷。
正如Weisberg[35]所描述的,調(diào)查誤差分為涵蓋誤差(樣本母體的準確性)、抽樣誤差、測量誤差、未響應(yīng)誤差和后處理誤差。作為一種典型的抽樣調(diào)查,居民出行調(diào)查的誤差來源包含3個階段:抽樣階段、調(diào)查階段和分析階段。抽樣誤差主要是因為不能做到完全隨機抽樣或者均勻抽樣,造成樣本分布與母體特征不能完全一致,如年齡結(jié)構(gòu)、從業(yè)情況、車輛擁有等特征的差異,此外作為抽樣母體的人口數(shù)據(jù)不準確也會帶來抽樣率失真,特別是中國城市仍然處于快速城鎮(zhèn)化過程中、人口流動性大。第二階段是調(diào)查誤差,主要包括漏報/瞞報,錯填等,特別是當(dāng)前市民對隱私保護意識不斷增強,瞞報、漏報普遍存在,這也是后續(xù)擴樣分析難度最大的沉默出行需求的主要組成部分;同時,調(diào)查員填寫錯誤也難以完全避免。第三階段則是擴樣分析誤差,原始調(diào)查數(shù)據(jù)校驗、母體數(shù)據(jù)可靠性甄別以及擴樣模型選擇等。三個階段的調(diào)查誤差疊加、最終有可能導(dǎo)致推斷的居民出行調(diào)查指標失真。
加權(quán)擴樣是指通過樣本量乘以權(quán)重系數(shù)(樣本數(shù)/總體),居民出行調(diào)查中所采用的直接擴樣方法為最簡單的加權(quán)擴樣模型。
式中:G′為擴樣所得總體指標;S為樣本指標;W為權(quán)重,取值為1/抽樣率。
在居民出行調(diào)查過程中,單因素擴樣所得結(jié)果通常與實際偏差較大,這就要求引入更多的約束條件,如出行主體的年齡段、車輛擁有、從業(yè)情況等進行分類。理想情形是按照交叉分類進行擴樣,但由于居民出行調(diào)查抽樣率較低,更詳細分類(圖1所示,人口可以細分為多達8 640類)相應(yīng)的樣本數(shù)量會比較少,且對應(yīng)母體可獲得性差,同時由于樣本數(shù)量過少對母體特征覆蓋更差,擴樣結(jié)果可能會產(chǎn)生更大的偏差。此外,采用單一變量逐步擴樣方法只能滿足當(dāng)前變量的擴樣約束條件,例如滿足了年齡段結(jié)構(gòu)的要求而車輛擁有可能發(fā)生了改變,為此嵌套了迭代循環(huán)的多重加權(quán)擴樣模型被提出。由于多重加權(quán)擴樣的各層之間互相獨立,必然產(chǎn)生無法同時滿足各重約束的問題,基于循環(huán)的多重加權(quán)擴樣模型被用于增強對多重約束條件的符合度。國內(nèi)2015年之前開展的居民出行調(diào)查擴樣工作大多采用此類方法,計算流程見圖2。
圖1 調(diào)查對象分類示意Fig.1 Population classification for HTS
圖2 多重循環(huán)加權(quán)擴樣計算流程Fig.2 Procedure of multilevel expansion with loop
雖然多重循環(huán)加權(quán)擴樣能夠避免單因素加權(quán)擴樣誤差,同時增加對多重約束條件的符合性,但還是存在一定問題。首先,加權(quán)擴樣完全依賴調(diào)查樣本數(shù)據(jù),而沉默出行需求部分的出行幾乎沒有記錄,只能通過漏報率指標強行補充和修正,難以對其目的、方式、空間分布等指標進行校正。其次,出行主體人具有多重屬性,包括家庭特征(家庭區(qū)位、人口組成、車輛擁有等)和個人特征(年齡、性別、從業(yè)情況、收入等),進行完備分類并獲取母體指標的難度較大。第三,出行本身是多維指標,包括強度、目的、方式、空間和時間等要素,由于居民出行調(diào)查基于家庭開展,是一種發(fā)生端調(diào)查,所得出行強度和目的指標相對比較可靠,交通方式、空間聯(lián)系和時間及耗時分布則受樣本影響較大。第四,加權(quán)擴樣結(jié)果受樣本指標的影響較大,一方面抽樣率相對較小無法覆蓋所有類型的樣本,另一方面小概率出行記錄會影響整體指標。第五,居民出行調(diào)查的本質(zhì)為特征調(diào)查,前面幾種問題的影響在加權(quán)擴樣中會產(chǎn)生疊加甚至放大,所得城市總體出行指標與實際存在偏差,不能直接應(yīng)用于城市交通運行評價,只能作為交通模型的輸入?yún)?shù)間接使用。最后,多重循環(huán)加權(quán)擴樣模型的收斂條件難以確定,只能是在實際應(yīng)用過程中根據(jù)具體情況取值,一般經(jīng)驗是內(nèi)層循環(huán)次數(shù)為3~5次、外層循環(huán)8~10次計算結(jié)果即可基本穩(wěn)定。
隨著智能手機的普及,2010以來手機話單數(shù)據(jù)、信令數(shù)據(jù)和各類互聯(lián)網(wǎng)數(shù)據(jù)被逐漸應(yīng)用到出行行為[36-38]分析中。一方面使得對人的行為與活動追蹤成為可能,另一方面也為交通模型眾多不確定的輸入提供了可能邊界。首先,人口母體更加明確。以往人口數(shù)據(jù)更多依賴統(tǒng)計局、公安局和民政局等政府部門提供的統(tǒng)計數(shù)據(jù),不僅數(shù)據(jù)因統(tǒng)計口徑不同差異較大,活動人口數(shù)量與真實住地也不能充分反映。其次,就業(yè)崗位分布更加準確。經(jīng)濟普查所得的就業(yè)崗位數(shù)為機構(gòu)注冊地,注冊地和實際工作地分離較為普遍。長周期的移動通信大數(shù)據(jù)有助于推算更加準確的崗位分布情況。第三,職住之間的對應(yīng)關(guān)系得以建立。傳統(tǒng)統(tǒng)計口徑人口和崗位數(shù)據(jù)之間是互相獨立的,通過長周期移動通信數(shù)據(jù)分析,可以建立人口和崗位之間的對應(yīng)關(guān)系,這為解析城市通勤出行打下更堅實的基礎(chǔ)。第四,移動通信數(shù)據(jù)可以用于人的空間移動識別。傳統(tǒng)調(diào)查對人的出行來自受訪對象的填報,存在可能涉及隱私出行瞞報和遺忘出行漏報的情形,而移動通行數(shù)據(jù)可以還原全日出行活動,有助于沉默出行需求[29]的挖掘。第五,手機信令數(shù)據(jù)的樣本量大,能夠減少抽樣調(diào)查樣本代表性不足帶來的誤差。
手機信令數(shù)據(jù)的特點能夠較好地彌補抽樣調(diào)查的不足,但也存在一定的局限性。首先,難以實現(xiàn)活動人口完全覆蓋。即便是用戶數(shù)最多的中國移動公司其市場占有率也只是70%左右,總有非手機用戶的存在,即使獲得了所有運營商的數(shù)據(jù)也不能覆蓋所有人口,而且一人多號的問題普遍存在,所以使用手機信令數(shù)據(jù)也需要進行擴樣和校核。其次,手機信令數(shù)據(jù)的信息量相對有限,并不能開展準確的出行行為及影響要素分析。手機信令數(shù)據(jù)提供的位置信息依賴于的基站地理位置坐標,精度受限;移動過程中觸發(fā)基站位置漂移頻發(fā),帶來駐點識別難度大且存在不確定性;出行活動的目的識別難度大且所用交通方式獲取困難;缺少出行主體的職業(yè)等用戶特征信息。而這些恰是居民出行調(diào)查的優(yōu)勢所在。
綜上所述,充分發(fā)揮手機信令和抽樣調(diào)查數(shù)據(jù)的特點,將二者的優(yōu)點融合、有助于更準確地解析居民出行特征和城市交通系統(tǒng)運行狀態(tài)。
本文所使用的數(shù)據(jù)基礎(chǔ)主要包括居民出行調(diào)查數(shù)據(jù)、手機信令數(shù)據(jù)、交通運行狀態(tài)監(jiān)測數(shù)據(jù)、公交IC卡、出租車GPS數(shù)據(jù)和高速公路收費數(shù)據(jù)、卡口車牌識別數(shù)據(jù)和其他統(tǒng)計數(shù)據(jù),詳見表1所示。
傳統(tǒng)方法中,居民出行調(diào)查所得特征指標是交通模型的核心輸入?yún)?shù)。需求預(yù)測建模基本思路是基于交通小區(qū)的人口、就業(yè)、車輛擁有等屬性和交通設(shè)施網(wǎng)絡(luò),結(jié)合居民出行調(diào)查指標和城市交通運行指標及統(tǒng)計數(shù)據(jù)、對交通模型進行標定和校核,完成初步交通模型開發(fā)。在此基礎(chǔ)上,利用城市交通運行指標,使用包括OD矩陣估計等方法,完成交通模型的進一步校正,得到能夠與城市交通運行狀況基本匹配的交通模型。從結(jié)果來看,出行分布是基于數(shù)學(xué)規(guī)劃模型最優(yōu)化求解結(jié)果,滿足modelled trip length distribution(MTLD)和observed trip length distribution(OTLD)最佳擬合,可以理解為無窮解中與設(shè)定約束和收斂條件匹配最好的一組。但是否能夠真實反映城市交通活動實際狀況仍然存疑,主要包含兩個方面的問題,一是觀測所得OTLD為抽樣調(diào)查結(jié)果,存在誤差是必然的;二是城市通常是多中心的,數(shù)學(xué)上的最優(yōu)解只是可行解而必定不是現(xiàn)實的唯一正確解。為了解決傳統(tǒng)加權(quán)擴樣及交通模型中存在的這些問題,本文提出了基于手機信令數(shù)據(jù)的居民出行調(diào)查擴樣模型,核心思想是基于手機信令數(shù)據(jù)開展出行分布研究,獲得分時段分目的出行分布矩陣,在此基礎(chǔ)上完成基于居民出行調(diào)查記錄RP(revealed preference)數(shù)據(jù)的交通方式劃分模型標定、并利用交通運行數(shù)據(jù)進行校驗,最后獲得城市居民出行特征指標,模型結(jié)構(gòu)見圖3。
模型主要包含5個步驟:
(1)基于手機信令數(shù)據(jù)的分目的分時段OD矩陣計算:通過手機信令數(shù)據(jù)推斷用戶的職住分布,結(jié)合嵌入職住位置信息的駐點分析模型,推斷出行目的(分通勤、基家生活、基家其他和非基家),進而獲得分時段、分目的OD矩陣,這是模型的第一個難點。
(2)居民出行調(diào)查數(shù)據(jù)整理:對調(diào)查所得出行記錄進行整理,獲得每次出行的基本屬性,包括交通方式、出行距離、出行耗時、出行費用及其他指標,并通過加權(quán)擴樣獲得初始權(quán)重系數(shù)。
表1 主要數(shù)據(jù)源及說明Tab.1 Description of datasets
(3)基于交通模型的分時段交通系統(tǒng)運行指標:分早、晚高峰和平峰、夜間4個時段,各OD點對之間的出行距離、耗時、費用等指標,一方面用于檢驗校核對應(yīng)的樣本數(shù)據(jù),同時為無樣本OD點對提供出行指標數(shù)據(jù)。
(4)基于RP數(shù)據(jù)的交通方式劃分模型標定:通過居民出行調(diào)查所獲得出行記錄和初始權(quán)重系數(shù),對交通方式劃分模型進行標定,并計算模擬所得分時段分目的分方式OD矩陣,這是模型第二個難點。
(5)交通系統(tǒng)運行監(jiān)測數(shù)據(jù)校驗:將第四步所得調(diào)查OD矩陣與交通系統(tǒng)運行監(jiān)測所得矩陣進行校驗,作為模型收斂條件,如滿足要求則循環(huán)停止,否則重新計算出行記錄的權(quán)重系數(shù),并返回第二步開始新的循環(huán)。所使用的公交OD和軌道OD矩陣數(shù)據(jù)源自公交IC卡數(shù)據(jù)分析結(jié)果;出租車OD矩陣源自出租車GPS軌跡及載客數(shù)據(jù)分析結(jié)果;小汽車OD矩陣則來自2 379個道路卡口及高速公路收費流水分析結(jié)果。
利用手機信令數(shù)據(jù)進行職住分析已經(jīng)有較為成熟的解決方案,但用于分析出行活動尚處于探索過程中。究其原因,手機信令數(shù)據(jù)的位置信息依賴基站且在活動過程中漂移頻發(fā),造成結(jié)果不穩(wěn)定。為此,對于常住人口筆者設(shè)計了嵌入職住的時空核聚類初始駐點分類模型[6],模型結(jié)構(gòu)見圖4,研究的基本要素主要包括時間、距離、速度,基于中國移動PaaS平臺工作環(huán)境,先對用戶進行時間坐標排序,并將初始點標識為駐留點,采用啟發(fā)式搜索方法,從初始點往下搜索每一個時間點的坐標是否滿足時空出行的時間、距離和速度要求,滿足時空間出行要求的坐標點,暫定為位移點,直至搜索到不滿足出行要求的坐標點,則上一刻坐標點為駐留點,再基于此刻駐留點,再循環(huán)向下搜索滿足條件的駐留點。駐點識別主要參數(shù)閾值如下:①由于信令為模糊位置數(shù)據(jù),短距離出行較為敏感,經(jīng)測試將最小可識別出行距離設(shè)為700m計算結(jié)果趨于穩(wěn)定;②對于出行距離小于5km的短距離出行,出行時間大于5min,出行速度大于步行速度1km·h-1;③對于出行距離大于5km的長距離出行,出行速度大于5km·h-1。
以駐點分類為基礎(chǔ),研究結(jié)合出行者的駐點序列、職住地及駐點時空聯(lián)系,提出了駐點與出行目的分類準則(見圖5):①通勤(含通學(xué)):與居住地高頻聯(lián)系,且活動呈周期性;②生活出行:高頻聯(lián)系駐點,經(jīng)常居家往返或返家過程中逗留,活動時間較為固定,且呈區(qū)域一致性(區(qū)域中較多用戶訪問該駐點的頻率較高);③商務(wù)出行:和工作地高頻聯(lián)系;④其他出行:其他無規(guī)律出行。
圖3 基于手機信令數(shù)據(jù)的居民出行調(diào)查擴樣模型系統(tǒng)結(jié)構(gòu)Fig.3 Expansion model framework of HTSbased on cellphone data
根據(jù)以上分類準則,最終獲得各類出行活動組成見表2,由于商務(wù)出行比例較低(約1.5%),在后續(xù)應(yīng)用中將商務(wù)出行并入其他出行來處理。從數(shù)據(jù)中不難發(fā)現(xiàn),城市日常出行活動中與三類具有穩(wěn)定性特點的駐點(家、工作地和生活駐點)相關(guān)的出行活動約占2/3,其他偶然出行則約占1/3,這也在一定程度上說明了城市的相對穩(wěn)定性。
與SP調(diào)查數(shù)據(jù)不同,居民出行記錄只包含本次出行所使用的交通方式的特征指標信息,缺少其他可供選擇交通方式的特征指標,需要進行補充。一般可以使用交通模型進行特征矩陣計算(Skim Matrix)獲得。關(guān)于交通方式劃分模型的標定William Greene[39]在其綜述性文獻《Discrete Choice modelling》中對多元logit模型(Multinational Logit Model,MNL)、混 合logit模 型(Mixed Logit Model)、巢式logit模型(Nested Logit Model)等離散選擇模型均有非常全面的描述,考慮各種交通方式的無關(guān)獨立性(Independence of irrelevant alternatives,IIA),本文選擇Nested logit模型作為待標定的模型結(jié)構(gòu)。鑒于手機信令數(shù)據(jù)在短距離出行識別誤差較大的特點,研究結(jié)合調(diào)查基礎(chǔ)數(shù)據(jù)和既有交通模型,剔除了步行交通方式,設(shè)計了包含自行車、助動車、摩托車、出租車、小汽車、公交車和軌道交通在內(nèi)的7種交通方式組成的Nested Logit模型(圖6)。
經(jīng)整理,調(diào)查數(shù)據(jù)庫中包含非步行交通方式的從家出發(fā)去工作的出行記錄53 336條,約占全部調(diào)查記錄的32.3%。結(jié)合不同交通方式的特點選擇不同特征變量指標來構(gòu)建效用函數(shù)(utility function),主要包括時間、費用(票價或使用費、停車費、道路收費,……)、換乘次數(shù)、車內(nèi)時間、車外時間等指標。對于單次出行所選擇的交通方式使用調(diào)查所得指標,對于未選擇交通方式則利用高德地圖API獲取出行起終點對應(yīng)出行時段的起訖點(居民出行調(diào)查出行互動的起訖點信息為經(jīng)緯度坐標)之間各種交通方式的距離、耗時、換乘、票價等指標。
使用通用離散選擇模型分析軟件NLOGIT對該模型進行標定,模型計算結(jié)果見表4,所有特征變量的參數(shù)標定結(jié)果的特征參數(shù)的顯著性水平都在1%以內(nèi),模型結(jié)果可以用于后續(xù)的計算。
圖4 駐點判斷及分類模型結(jié)構(gòu)Fig.4 Model framework of stay-points identification and classification
圖5 手機信令駐點分類邏輯示意Fig.5 Logic diagram for classification of stationary points based on cellphone data
表2 基于手機信令數(shù)據(jù)的出行活動分類識別結(jié)果Tab.2 Classification of trip purposes based on cellphone data%
圖6 Nested Logit模型結(jié)構(gòu)Fig.6 Framework of Nested Logit model
表3 各交通方式效用函數(shù)Tab.3 Utility function by different modes
表4 基家工作(HBW)出行交通方式劃分模型標定結(jié)果指標Tab.4 HBW parameter calibration result for mode split
提出的居民出行調(diào)查擴樣方法,在傳統(tǒng)調(diào)查方法可獲得出行多要素影響關(guān)系基礎(chǔ)上、利用了手機信令數(shù)據(jù)在職住關(guān)系和出行空間分布識別的優(yōu)勢,獲得出行關(guān)鍵指標更可靠的估計。本節(jié)主要從出行目的構(gòu)成、時辰分布和出行距離,比較傳統(tǒng)多維加權(quán)擴樣與入戶調(diào)查+手機信令相結(jié)合方法的差異,以及后者的改善效果。
調(diào)查樣本中通勤及通學(xué)出行目的等剛性交通出行記錄占比最大,達67.3%,而非基家出行目的僅占1.5%。對照志愿者調(diào)查結(jié)果,約存在31%的漏報、瞞報出行,而其出行目的主要為非基家的彈性出行活動。如表5所示,結(jié)合志愿者調(diào)查的加權(quán)擴樣方法能夠有效挖掘彈性出行目的交通需求,非基家出行比例增加到12.4%。與樣本及加權(quán)擴樣的結(jié)果相比,基于手機信令駐點分類技術(shù)所獲得的結(jié)果中基家通勤/通學(xué)出行比例進一步減少,而非基家及基家其他出行的彈性出行活動明顯增加。通勤及通學(xué)占比減少原因,主要是部分中小學(xué)生無手機且大部分小學(xué)生出行距離較短,難以通過手機信令識別,而非基家彈性出行目的占比的提升,可以解釋為手機信令數(shù)據(jù)對此類出行活動的捕獲更加全面。
表5 不同分類方法出行目的組成結(jié)構(gòu)比較Tab.5 Comparison of trip purpose composition for different methods%
從出發(fā)時間分布來看(見圖7),調(diào)查樣本對通勤時段覆蓋較好,通過疊加沉默出行需求的加權(quán)擴樣方法能夠在一定程度上實現(xiàn)出行時辰分布的更優(yōu)化,彌補抽樣調(diào)查的不足。但從形態(tài)來看,手機信令數(shù)據(jù)的晚間高峰特征更符合廣州的實際。
圖7 不同擴樣模型出行時間分布比較Fig.7 Comparison of time of day of different models
從出行距離分布來看(見表6),調(diào)查樣本的短距離出行所占比重較大,長距離出行則相對較少。通過加權(quán)擴樣能夠在一定程度上修正調(diào)查樣本出行距離分布的偏差,但由于擴樣的基礎(chǔ)為調(diào)查樣本,其原生缺陷無法得到修正,具體表現(xiàn)為跨區(qū)域超長距離出行樣本擴樣系數(shù)較大、導(dǎo)致超過50km出行占比達6.1%,這與地鐵OD、出租車OD及道路卡口推算所得小汽車OD所獲得的長距離出行量存在一定的差異,無疑手機信令推算結(jié)果在空間分布和距離分布上具有更高的可靠性。
表6 出行距離分布比較Tab.6 Trip length distribution of different models
基于手機信令數(shù)據(jù)的居民出行調(diào)查擴樣,本質(zhì)是一種仿真模擬的計算方法。通過長周期的手機信令數(shù)據(jù)推斷人口職住分布及出行OD,并利用居民出行調(diào)查所獲得RP數(shù)據(jù)進行交通方式劃分模型標定,得到分目的、分交通方式出行OD矩陣,擴樣結(jié)果能夠在一定程度上對樣本的原生缺陷進行修正。對比傳統(tǒng)的加權(quán)擴樣方法,新的模型在出行強度及目的組成、時辰分布、距離分布的符合性等方面有明顯改善作用,特別是在揭示因瞞報、漏報而產(chǎn)生等的沉默出行需求方面作用顯著,這為開展居民出行調(diào)查擴樣和校核工作提供了一種新的手段。但由于手機信令數(shù)據(jù)本身為用戶的副產(chǎn)品,模糊地址、出行目的存在不確定性,無可靠交通方式信息等局限,也決定了它不能完全替代傳統(tǒng)的居民出行問卷調(diào)查。此外,由于缺少手機用戶屬性個體信息,難以按照傳統(tǒng)交通模型的有無車輛來開展模型標定工作,有必要結(jié)合交通模型技術(shù)開展進一步的標定和校驗。手機信令數(shù)據(jù)、交通運行動態(tài)監(jiān)測數(shù)據(jù)、傳統(tǒng)居民出行特征調(diào)查與交通模型技術(shù)的聯(lián)合,有助于更好地闡釋城市出行活動規(guī)律,為城市交通綜合治理與規(guī)劃、運行和管理決策提供科學(xué)依據(jù)。
作者貢獻申明:
陳小鴻:參與研究選題、論文框架設(shè)計、論文修訂和審核。
陳先龍:參與研究選題、方案設(shè)計和實施,并承當(dāng)了論文的撰寫和修改工作。
李彩霞:參與了部分數(shù)據(jù)整理和統(tǒng)計分析工作。
陳嘉超:參與了部分數(shù)據(jù)整理和統(tǒng)計分析工作。