国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于手機信令的交通出行特征分析
——以日照市為例

2023-11-22 09:27:04李秋曼
現(xiàn)代交通技術(shù) 2023年5期
關(guān)鍵詞:信令時空基站

李秋曼

[華交科(上海)規(guī)劃設(shè)計有限公司,上海 200433]

利用手機信令數(shù)據(jù)能夠較完整地識別手機用戶的出行信息,可進(jìn)一步應(yīng)用于人口規(guī)模、職住分布、出行特征等指標(biāo)的分析,進(jìn)而更全面地把握城市交通現(xiàn)狀特征。近年來,對手機信令數(shù)據(jù)的分析和應(yīng)用逐漸增多,手機信令數(shù)據(jù)分析在樣本量、覆蓋范圍、更新周期上與傳統(tǒng)居民出行調(diào)查相比更具優(yōu)勢,是當(dāng)前交通數(shù)據(jù)采集的重要補充手段[1-2]。手機信令數(shù)據(jù)的處理技術(shù)已相對成熟,基于信令數(shù)據(jù)的研究已從方法和技術(shù)的研究逐步轉(zhuǎn)入實踐應(yīng)用。文獻(xiàn)[3-5]對通過手機信令數(shù)據(jù)獲取信息的主要方法進(jìn)行了梳理;張?zhí)烊籟6]將手機信令數(shù)據(jù)應(yīng)用到上海市的職住空間研究及通勤分析中;丘建棟等[7]利用手機信令數(shù)據(jù)的時空信息,對深圳市交通出行特征進(jìn)行分析。

本項目以手機信令數(shù)據(jù)為研究對象,梳理數(shù)據(jù)處理流程及主要算法,研究關(guān)鍵參數(shù)確定方法,并結(jié)合實例提取案例城市的有關(guān)特征指標(biāo)。

1 數(shù)據(jù)處理

1.1 數(shù)據(jù)格式

手機信令數(shù)據(jù)產(chǎn)生于用戶手機端與無線通信網(wǎng)絡(luò)的互動聯(lián)系中,兩者之間用于感知控制的信號即信令。信令依靠運營商的基站進(jìn)行傳遞,基站將捕獲的數(shù)據(jù),如手機編號、通信時間、通信類型和基站編號傳回運營商數(shù)據(jù)后臺,由此生成具有時空屬性的信令數(shù)據(jù)記錄,每條信令數(shù)據(jù)記錄包括移動用戶識別號、時間戳、位置區(qū)編號等字段信息。信令數(shù)據(jù)字段如表1 所示。

表1 信令數(shù)據(jù)字段

1.2 數(shù)據(jù)清洗

基于通信網(wǎng)絡(luò)產(chǎn)生的原始信令數(shù)據(jù),有很多無效數(shù)據(jù),如一人多卡數(shù)據(jù)、乒乓數(shù)據(jù)、漂移數(shù)據(jù)等,無效數(shù)據(jù)會影響數(shù)據(jù)處理的效率和質(zhì)量,可通過數(shù)據(jù)清洗處理無效數(shù)據(jù)。

(1) 一人多卡數(shù)據(jù)清洗。同一用戶多個同運營商的手機卡,通過計算多個加密移動用戶識別號的軌跡重合度進(jìn)行去重。

(2) 乒乓數(shù)據(jù)清洗。在鄰近基站交叉覆蓋區(qū)域,手機數(shù)據(jù)會在基站間頻繁切換,產(chǎn)生乒乓效應(yīng)。具體處理方法是將用戶在乒乓效應(yīng)發(fā)生期間連接次數(shù)最多的基站設(shè)為主基站,剔除乒乓效應(yīng)期間產(chǎn)生的信令數(shù)據(jù)中主基站以外的記錄,完成對數(shù)據(jù)的清洗。

(3) 漂移數(shù)據(jù)清洗。數(shù)據(jù)漂移是指移動通信用戶數(shù)據(jù)突然從鄰近基站切換至遠(yuǎn)處基站,一段時間后又切回鄰近基站的情況。具體處理方法是根據(jù)每條信令記錄的停留時間、停留位置及其下一條記錄的停留時間、停留位置,剔除短時間內(nèi)發(fā)生大位移的信令記錄。

1.3 有效軌跡點算法

將經(jīng)過數(shù)據(jù)清洗后的信令數(shù)據(jù)作為輸入數(shù)據(jù),軌跡生成過程中會有大量的中間點,其中會有差異性較大的點,為提高數(shù)據(jù)運算效率,首先篩除軌跡點中差異性較大的點,然后讓有效軌跡點再參與到后續(xù)停留點識別算法的計算中。

離群點檢測有多種方法,考慮到出行路徑中軌跡點的具體點線集聚特征,選用基于密度的離群檢測算法,即根據(jù)數(shù)據(jù)的密集情況,計算每個數(shù)據(jù)對象的離群因子,以此標(biāo)識數(shù)據(jù)的離群程度[8],檢測出與所需數(shù)據(jù)行為或特征屬性差別較大的數(shù)據(jù)。算法具體實現(xiàn)步驟如下。

步驟1:遍歷所有軌跡點對象,對軌跡點集D中的任意一點p,計算k距離dk(p),并定義兩點間距離d(p,o) 滿足:至少有不包括p在內(nèi)的k個點o',使得d(p,o') ≤d(p,o);最多有不包括p在內(nèi)的k-1 個點o″,使得d(p,o″)<d(p,o)。

步驟2:獲得每個數(shù)據(jù)點的k距離領(lǐng)域Nk(p),包含k距離以內(nèi)的所有數(shù)據(jù)點。

步驟3:計算每個點的可達(dá)距離reach_distk(p,o)=max{dk(o),d(p,o)}。

步驟4:計算每個點的可達(dá)密度,將Nk(p) 鄰域內(nèi)點到p的平均可達(dá)距離的倒數(shù)作為每個點的可達(dá)密度,即

步驟5:計算每個點的離群因子LOFk(p),即點p的鄰域點Nk(p) 的可達(dá)密度與點p的可達(dá)密度之比的平均值,即

步驟6:判斷密集點和離群點,如果是密集點,則該點的可達(dá)密度與其鄰近點的可達(dá)密度相近,離群因子≤1;相反,如果是離群點,則該點位于低密度區(qū)域,離群因子>1。

1.4 出行識別算法

出行識別算法可對有效軌跡數(shù)據(jù)進(jìn)行停留點提取,從而獲得用戶的出行信息,該算法是提取城市交通出行活動特征的關(guān)鍵算法。研究中首先給出出行識別的常用算法,同時結(jié)合交通出行的有關(guān)特征,給出出行識別主要參數(shù)的確定方法。

傳統(tǒng)的DBSCAN(density-based spatial clustering of applications with noise,基于密度的聚類算法)依據(jù)距離度量,僅從空間維度判定核心對象。考慮交通出行特征及手機信令數(shù)據(jù)的時空屬性,基于時空維度的聚類算法是出行識別的常用算法,算法中的參數(shù)主要有以下5 項。

(1) 時空Eps 鄰域:對于軌跡點集D中的每一數(shù)據(jù)點p,以p為圓心,在時間閾值T內(nèi),Eps 為半徑的區(qū)域,為p的Eps 時空鄰域。

(2) 核心點:MinPts(領(lǐng)域密度閾值)為各用戶Eps 內(nèi)的點數(shù)量均值,若點p的Eps 鄰域中的點數(shù)量≥MinPts,則標(biāo)記為核心點。

(3) 直接密度可達(dá):對于任意兩點p、g,如果g為核心點,p位于g的Eps 鄰域內(nèi),那么將點p和點g作為直接密度可達(dá)。

(4) 密度可達(dá):假設(shè)軌跡點集D中存在一系列點p1,p2,p3,…,pn-1,pn,其中p1=g、pn=p。如果點pi+1從點pi直接密度可達(dá),那么點p從點g是密度可達(dá)的。

(5) 密度相連:對于軌跡點集D的點p、g、o,如果點p與點g都是到點o密度可達(dá)的,則稱點p與點g密度相連。

有效停留算法是針對有效軌跡鏈在時空距離閾值范圍內(nèi)的再次聚合,停留點識別實現(xiàn)步驟如下。

步驟1:給定時間閾值T、距離閾值Eps,判定閾值MinPts,遍歷所有軌跡點,找出核心對象。

步驟2:以核心點為中心,找出與核心點密度可達(dá)的數(shù)據(jù)對象,形成一個密度聚類簇。

步驟3:對聚類簇內(nèi)所有核心點重復(fù)步驟2,找出其密度相連點,并轉(zhuǎn)到聚類簇中,直到密度可達(dá)的對象全部找出。

步驟4:重復(fù)以上步驟,獲得停留區(qū)域。

步驟5:確定停留點位置和時間,提取停留區(qū)域的幾何中心點坐標(biāo),將其作為停留點的空間位置點;將停留區(qū)域內(nèi)最早軌跡點的時間作為起始時間,最晚軌跡點的時間作為終止時間,停留點劃分示意如圖1 所示。

圖1 停留點劃分示意

根據(jù)有效停留算法的提取,篩選滿足出行停留時空閾值的位置信息,兩次停留點間作為一次出行,識別用戶出行的起訖點,獲取出行 OD(origin-destination,起訖點)表。一次交通出行通常指為完成其出行目的、步行超過5 min 或使用交通工具單程距離超過500 m 的出行。

根據(jù)出行定義判斷,停留區(qū)域內(nèi)相鄰兩點的空間距離應(yīng)小于500 m,時間間隔應(yīng)小于5 min,分別對應(yīng)時空鄰域的時間閾值和距離閾值。鑒于停留點的聚集效應(yīng),通過密度可達(dá)不斷擴充停留區(qū)域,可將時間閾值設(shè)置為15 min,以此作為參數(shù)基準(zhǔn)值開展調(diào)節(jié)測試。出行識別的具體步驟如下。

步驟1:根據(jù)時空鄰域閾值定義及相應(yīng)基準(zhǔn)值,給出時間閾值和距離閾值的可選集合,其中,時間閾值集合為{900 s,1 800 s,2 800 s},距離閾值集合為{300 m,500 m,1 000 m}。

步驟2:針對停留時長和出行距離條件建立時空閾值參數(shù)組合,即時空鄰域閾值集合。例如停留點停留時長>1 800 s 且與上一停留點之間累計出行距離>300 m,即為(1 800 s,300 m)。依次讀取閾值集合參數(shù),開展出行識別算法計算。

步驟3:提取出行識別算法結(jié)果,將平均出行率作為主要核算因子,與調(diào)查數(shù)據(jù)進(jìn)行驗證比對,確定最終閾值參數(shù)。

1.5 職住地識別

職住地識別主要目的是識別出用戶的居住地和工作地,主要通過3 個參數(shù)共同確定。

(1) 時間段,包括日間時段(當(dāng)日9 點至18點)和夜間時段(當(dāng)日20 點至次日8 點)。

(2) 停留時間,以第一次在A 基站出現(xiàn)為起始時間,以第一次出現(xiàn)在其他基站為A 基站的結(jié)束時間,兩值相減即為A 基站的停留時間。其中,日間在停留點的停留時長≥3 h,夜間在停留點的停留時長≥6 h。

(3) 日期逗留頻次,每個停留點的停留天數(shù)比例≥60%的總樣本天數(shù)。

職住地識別的具體步驟如下:

步驟1:讀取完整的用戶軌跡數(shù)據(jù),基于時間段判斷出居住標(biāo)記和工作標(biāo)記的點集合;

步驟2:計算居住標(biāo)記和工作標(biāo)記的點集合中每個位置的累計停留時間,判斷其是否滿足停留時間,每天每個基站的累計停留時間大于日間或夜間停留時間閾值的地點,作為備選工作地點或居住地點;

步驟3:統(tǒng)計備選工作地點或居住地點的總天數(shù),將超過總樣本天數(shù)比例閾值且停留時間最長的地點作為工作地或居住地。

1.6 通勤識別

通勤識別的主要目的是獲取通勤數(shù)據(jù),分析通勤特征。其中輸入數(shù)據(jù)是基于出行識別算法和職住地識別算法獲取的結(jié)果數(shù)據(jù),通勤識別的具體實現(xiàn)步驟如下。

步驟1:通過手機唯一標(biāo)識碼,關(guān)聯(lián)職住表和出行OD 表;

步驟2:判斷職住表中既有居住地又有工作地的移動用戶;

步驟3:在出行OD 表中篩選出步驟2 的移動用戶,遍歷出行數(shù)據(jù),其中,從居住地到工作地的出行標(biāo)記為上班通勤,從工作地到居住地的出行標(biāo)記為下班通勤。

2 實例應(yīng)用

以采集的中國移動運營商2 個月的手機信令數(shù)據(jù)作為基本數(shù)據(jù),其范圍涵蓋山東省日照市市域范圍內(nèi)的移動用戶,對信令數(shù)據(jù)的整體情況、時間分布等進(jìn)行綜合評價,每日移動用戶數(shù)量基本穩(wěn)定,人均記錄數(shù)超過120 條,數(shù)據(jù)質(zhì)量相對較高。樣本日用戶量及信令記錄整體分布如圖2 所示,樣本信令數(shù)據(jù)時間分布如圖3 所示。

圖2 樣本日用戶量及信令記錄整體分布

圖3 樣本信令數(shù)據(jù)時間分布

2.1 停留點參數(shù)測試

在移動用戶有效軌跡中,對停留時間超過1 800 s、2 400 s、3 000 s、3 600 s,且距離超過300 m、500 m 組成的時空鄰域參數(shù)集合開展停留點識別計算,依次獲取出行率指標(biāo),不同時空鄰域下的出行率計算如圖4 所示。對計算值與城市居民出行調(diào)查值(2.53 次/人·d)進(jìn)行校核,其中停留點時空閾值為(1 800 s、500 m),計算所得的出行率2.51 次/人·d 最為接近。

圖4 不同時空鄰域下的出行率計算

2.2 人口崗位分布識別

通過手機信令數(shù)據(jù)識別出常住人口數(shù)量,結(jié)合移動市場占有率、一機多卡率、手機用戶占比等進(jìn)行綜合擴樣,得到該市常住人口數(shù)量約為296 萬人,計算數(shù)值與統(tǒng)計數(shù)據(jù)基本一致。但對于不同的區(qū)域,尤其是人口活動密集的市區(qū)范圍,兩者結(jié)果略有不同,手機識別常住人口數(shù)量略高于統(tǒng)計值。對于城市人口崗位密度分布的分析,主要聚集在主城區(qū)與外圍區(qū)縣的核心區(qū)域,中心城區(qū)人口密度遠(yuǎn)高于外圍區(qū)域,其中日照市秦樓街道與石臼街道的常住人口密度較大。

2.3 出行特征分析

2.3.1 出行規(guī)模

結(jié)合手機信令數(shù)據(jù)的出行識別算法,使用停留距離的閾值為500 m,停留時間的閾值為1 800 s,計算得出居民出行率為2.51 次/(人·d),與居民出行調(diào)查分析所得的2.53 次/(人·d)基本吻合。另外,從對不同區(qū)域統(tǒng)計分析中可以看出,中心城區(qū)由于公共設(shè)施、生活配套設(shè)施相對完善,相應(yīng)出行次數(shù)最高,出行率為2.65 次/(人·d),約占出行總量的40%,日照市居民出行總量與出行率統(tǒng)計如圖5 所示。

圖5 日照市居民出行總量與出行率統(tǒng)計

2.3.2 出行空間分布

出行空間分布與城市空間結(jié)構(gòu)、土地布局、人口密度、基礎(chǔ)設(shè)施的布置有密切關(guān)系,通過數(shù)據(jù)分析可獲取不同區(qū)域間的出行聯(lián)系量。在案例城市分析中,得到主城區(qū)內(nèi)各個街道間的出行聯(lián)系強度,通過數(shù)據(jù)分析發(fā)現(xiàn),聯(lián)系主要集中在日照街道與秦樓街道、秦樓街道與石臼街道之間,全日雙向交換量分別約為24 萬人次與14 萬人次。同時,得到日照全市跨區(qū)出行總量為54 萬人次,區(qū)間出行量主要集中在該市東港區(qū)與嵐山區(qū),約占總區(qū)間出行總量的一半。

2.3.3 出行時間分布

基于信令數(shù)據(jù)識別居民的出行時間分布情況,居民工作日存在明顯的早、晚高峰出行特征,其中,早高峰時間段為7:00 至9:00,晚高峰時間段為17:00 至19:00,平均出行時間約為28 min,出行時間及時長分布如圖6 所示。

圖6 出行時間及時長分布

2.3.4 出行距離分布

通過手機信令數(shù)據(jù)分析人口出行距離分布情況,可以得到出行距離以中短距離為主,平均出行距離約為5.1 km,其中工作出行距離相對其他出行目的的出行距離略遠(yuǎn),出行距離分布及分目的出行距離分布如圖7 所示。

圖7 出行距離分布及分目的出行距離分布

2.4 通勤特征分析

結(jié)合通勤識別算法獲得通勤出行的時間及距離分布。其中,通勤時間主要集中在6:30 至8:30、17:00 至19:00,平均通勤出行時間約28 min。出行距離以中短距離為主,與職住的計算結(jié)果相吻合,跨區(qū)出行較少,4 km 以內(nèi)的出行占比約為70%。通勤時間及距離分布如圖8 所示。

圖8 通勤時間及距離分布

3 結(jié)語

本研究對手機信令數(shù)據(jù)處理和出行特征提取的過程進(jìn)行梳理,詳細(xì)介紹了關(guān)鍵處理算法,給出出行軌跡識別及提取的關(guān)鍵參數(shù)和驗證方法,可為其他城市開展數(shù)據(jù)應(yīng)用實踐提供參考。

猜你喜歡
信令時空基站
跨越時空的相遇
鏡中的時空穿梭
SLS字段在七號信令中的運用
移動信令在交通大數(shù)據(jù)分析中的應(yīng)用探索
玩一次時空大“穿越”
基于信令分析的TD-LTE無線網(wǎng)絡(luò)應(yīng)用研究
可惡的“偽基站”
基于GSM基站ID的高速公路路徑識別系統(tǒng)
時空之門
LTE網(wǎng)絡(luò)信令采集數(shù)據(jù)的分析及探討
三河市| 仙桃市| 剑川县| 岑巩县| 南安市| 神池县| 唐海县| 夏津县| 定兴县| 沅江市| 晋州市| 仙游县| 芦溪县| 烟台市| 兰考县| 乐至县| 固阳县| 高唐县| 广丰县| 澳门| 高要市| 沽源县| 安塞县| 宝应县| 济宁市| 富阳市| 黑山县| 江川县| 株洲市| 驻马店市| 汾西县| 仲巴县| 济南市| 毕节市| 高碑店市| 太和县| 西畴县| 比如县| 甘洛县| 大冶市| 滦南县|