国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于K-Means聚類與灰色關(guān)聯(lián)分析的城市交通狀況分析

2020-12-04 02:17陳永勝
關(guān)鍵詞:關(guān)聯(lián)度聚類交通

陳永勝

深圳高速工程顧問有限公司 交通規(guī)劃事業(yè)部, 廣東 深圳 518000

0 引言

近年來,隨著社會(huì)經(jīng)濟(jì)的持續(xù)發(fā)展與城市居民生活水平的提高,機(jī)動(dòng)化出行需求急劇增加,尤其是私人機(jī)動(dòng)化出行迅猛增長,由此產(chǎn)生的城市交通擁堵日益嚴(yán)重。隨著人工智能、科學(xué)計(jì)算、機(jī)器學(xué)習(xí)、模式識(shí)別等數(shù)據(jù)挖掘技術(shù)的成熟,探索交通大數(shù)據(jù)與城市交通治理的前沿趨勢(shì),深層次挖掘城市交通擁堵問題,并提出相關(guān)改進(jìn)舉措,已成為智慧交通研究的重要課題。

為提高交通運(yùn)營效率和路網(wǎng)通行能力,文獻(xiàn)[1]從交通實(shí)時(shí)數(shù)據(jù)采集、整合、分析、應(yīng)用4個(gè)層次開展研究,提出基于物聯(lián)網(wǎng)和大數(shù)據(jù)融合技術(shù)的城市交通狀況分析方法。文獻(xiàn)[2]以浮動(dòng)車數(shù)據(jù)可視化分析路網(wǎng)交通空間分布特征,采用空間聚類法實(shí)現(xiàn)了城市交通擁堵狀況的識(shí)別與分類。文獻(xiàn)[3]結(jié)合車輛全球定位系統(tǒng)(global positioning system,GPS)軌跡數(shù)據(jù),運(yùn)用數(shù)據(jù)挖掘理論,提出一種道路網(wǎng)交通狀態(tài)時(shí)空特征分析技術(shù),以提升城市交通規(guī)劃與管理決策的支持水平。文獻(xiàn)[4]利用圖像處理技術(shù)對(duì)監(jiān)控視頻進(jìn)一步處理,實(shí)時(shí)檢測(cè)城市交通擁堵狀況,為交通決策提供理論依據(jù)。文獻(xiàn)[5]建立基于北京、上海、廣州、深圳交通運(yùn)行數(shù)據(jù)的聚類分析數(shù)學(xué)模型,研究不同城市間交通擁堵狀況及緩堵政策的異同性。文獻(xiàn)[6]基于應(yīng)用程序編程接口(application programming interface, API)規(guī)劃路徑數(shù)據(jù)與地理信息系統(tǒng)(geographic information system,GIS)可視化技術(shù),對(duì)比分析我國重點(diǎn)城市步行、小汽車、公交車3種出行方式的可達(dá)性特征,提出強(qiáng)化公交優(yōu)先相關(guān)建議。文獻(xiàn)[7]以道路平均行程時(shí)間及速度作為評(píng)價(jià)指標(biāo),建立評(píng)價(jià)模型對(duì)城市路網(wǎng)交通狀況進(jìn)行評(píng)價(jià)。文獻(xiàn)[8]運(yùn)用數(shù)據(jù)挖掘算法,搭建Three-phase框架,對(duì)多個(gè)路段之間的擁堵狀況進(jìn)行關(guān)聯(lián)分析。文獻(xiàn)[9]采集我國11個(gè)城市的交通狀態(tài)和交通基礎(chǔ)設(shè)施信息數(shù)據(jù),構(gòu)建聚類與相關(guān)性分析組合模型,研究城市交通擁堵的原因。文獻(xiàn)[10]利用模糊理論對(duì)城市交通運(yùn)行狀態(tài)進(jìn)行評(píng)價(jià)分析,并將評(píng)價(jià)結(jié)果用于關(guān)聯(lián)規(guī)則挖掘中,研究出行潛在規(guī)律,為交通規(guī)劃決策提供技術(shù)支撐。

目前多數(shù)研究側(cè)重于城市交通擁堵成因分析方面,采用多種數(shù)據(jù)挖掘方法挖掘交通運(yùn)行相關(guān)數(shù)據(jù),但在對(duì)客觀指標(biāo)進(jìn)行深度挖掘、研究交通擁堵影響因素方面稍顯不足。另外,對(duì)城市交通基礎(chǔ)設(shè)施、國民經(jīng)濟(jì)與社會(huì)發(fā)展對(duì)交通擁堵狀況的實(shí)際影響規(guī)律缺乏總結(jié)。為此,本文選取全國36個(gè)重點(diǎn)城市作為研究對(duì)象,構(gòu)建城市交通狀況分析指標(biāo)體系,運(yùn)用聚類理論劃分城市交通擁堵等級(jí),通過灰色系統(tǒng)理論分析城市擁堵與交通基礎(chǔ)設(shè)施建設(shè)、國民經(jīng)濟(jì)與社會(huì)發(fā)展水平之間的內(nèi)在關(guān)聯(lián),研究城市擁堵成因,探索相應(yīng)的城市交通發(fā)展對(duì)策與思路。

2 城市交通狀況指標(biāo)體系構(gòu)建

城市交通狀況受城市國民經(jīng)濟(jì)水平、人口與崗位、機(jī)動(dòng)車擁有量、交通設(shè)施建設(shè)等眾多因素影響,且各個(gè)因素與城市交通狀況之間存在相互獨(dú)立、相互影響的關(guān)系。本文基于對(duì)指標(biāo)體系的綜合性、適量性和針對(duì)性考慮,參考文獻(xiàn)[11-14]以及不同城市統(tǒng)計(jì)年鑒,構(gòu)建包括交通擁堵狀況、交通基礎(chǔ)設(shè)施、城市國民經(jīng)濟(jì)與社會(huì)發(fā)展的城市交通狀況分析指標(biāo)體系,如圖1所示。其中,交通擁堵狀況指標(biāo)用于城市擁堵聚類分析,聚類結(jié)果與其他指標(biāo)應(yīng)用于城市交通狀況的關(guān)聯(lián)性分析。

圖1 城市交通狀況分析指標(biāo)體系

3 城市交通狀況聚類分析

3.1 數(shù)據(jù)整理

文獻(xiàn)[11]基于城市交通擁堵時(shí)空特征考慮,以B0~B5指標(biāo)構(gòu)建城市交通擁堵綜合評(píng)價(jià)指標(biāo)體系,并結(jié)合百度地圖海量交通出行數(shù)據(jù)、車輛GPS軌跡數(shù)據(jù)、位置定位數(shù)據(jù)等,計(jì)算全國100個(gè)城市的B0~B5。本文以此為基礎(chǔ)數(shù)據(jù),進(jìn)行標(biāo)準(zhǔn)化處理,得出研究城市交通擁堵狀況的數(shù)據(jù)集。

3.2 方法基礎(chǔ)

K-Means聚類分析具有原理簡明、收斂快速、聚類效果較優(yōu)等優(yōu)勢(shì),本文運(yùn)用K-Means聚類法對(duì)交通擁堵狀況數(shù)據(jù)集進(jìn)行聚類。該方法的基本思想為:把所有觀測(cè)值劃分為K類,使每類中的觀測(cè)值距離該類的中心(即類均值)較其余類的中心更近,且類和類之間盡可能的遠(yuǎn)離。具體為:1)從所有觀測(cè)值中任選K個(gè)作為類中心;2)分別計(jì)算其余每個(gè)觀測(cè)值與每個(gè)類中心的距離,距哪個(gè)類中心最近,則該觀測(cè)值劃分至該類中心所屬的集合,共組成K類;3)重新計(jì)算每類中觀測(cè)值之間的平均值,作為新類中心;4)重新劃分每個(gè)觀測(cè)值到離它最近的類;5)重復(fù)步驟3)、4),直到所有的類中心不再改變。

K-Means聚類中常用的距離度量指標(biāo)為歐幾里得距離的平方

式中:xi、yi為不同樣本x、y的N維數(shù)值(N為特征數(shù)量)。

確定數(shù)據(jù)集的最佳聚類數(shù)目K,常用的測(cè)定方法為手肘法,該方法度量指標(biāo)為類間誤差平方和SSSE,指每次聚類完成后,所有觀測(cè)值到其所屬類中心的距離平方和,即

式中:Ci為第i個(gè)類集合,p為Ci中的觀測(cè)點(diǎn),mi為Ci的中心。

隨著K的增大,數(shù)據(jù)集劃分更加精細(xì),SSSE逐漸變小,直到最后趨于穩(wěn)定,同樣聚類程度回報(bào)也隨之減小。K-SSSE曲線變化過程存在拐點(diǎn)(亦稱“肘”點(diǎn)),SSSE下降突然變緩時(shí),此時(shí)的K為最佳值,大于該值時(shí)無法帶來更多的聚類程度回報(bào)。

3.3 數(shù)據(jù)處理

圖2 K-Means聚類的SSSE

以36座城市交通擁堵狀況數(shù)據(jù)為分析數(shù)據(jù)集,利用Python程序計(jì)算不同K對(duì)應(yīng)的SSSE,繪制K-SSSE曲線,如圖2所示。由圖2可知,K=3,即分析數(shù)據(jù)集劃分為3類較為合適。

隨機(jī)選擇3個(gè)城市的觀測(cè)值為初始類中心,觀測(cè)值為由指標(biāo)B0~B5組成的6維數(shù)值。其他城市根據(jù)其觀測(cè)值與各個(gè)類中心的距離遠(yuǎn)近,分別分配給距離最近的類中心,共組成3類。然后計(jì)算現(xiàn)有每個(gè)類中觀測(cè)值的平均值,生成新的類中心,所有城市根據(jù)與新的類中心距離重新劃分為3類。這個(gè)過程不斷重復(fù),多次迭代至滿足終止條件,輸出聚類結(jié)果。

為了在二維平面中觀察聚類結(jié)果,運(yùn)用主成分分析法,將指標(biāo)B0~B5數(shù)據(jù)空間進(jìn)行降維,重新生成2項(xiàng)綜合指標(biāo)來代替B0~B5。綜合指標(biāo)1、2累計(jì)貢獻(xiàn)率約95.42%,可以認(rèn)為綜合反映了交通擁堵狀況。交通擁堵狀況K-Means聚類結(jié)果如圖3所示。圖3中圓圈表示每類城市的類中心,虛線圈表示同類城市。

圖3 交通擁堵狀況 K-Means聚類結(jié)果

3.4 結(jié)果分析

圖4 城市交通擁堵六維特征

根據(jù)圖3及36座城市的B0~B5指標(biāo),將城市交通狀況劃分為嚴(yán)重?fù)矶隆⑤^為擁堵、交通順暢3個(gè)等級(jí),其中嚴(yán)重?fù)矶碌某鞘邪ū本?、重慶、哈爾濱3個(gè)城市;較為擁堵的城市包括貴陽、呼和浩特、長沙等9個(gè)城市;交通順暢的城市包括昆明、廈門、福州等24個(gè)城市。聚類結(jié)果與文獻(xiàn)[7]的分析結(jié)論基本一致。哈爾濱、北京、重慶B0~B5指標(biāo)標(biāo)準(zhǔn)化后的數(shù)值如圖4所示。由圖4可知:哈爾濱6項(xiàng)指標(biāo)均較高,位列擁堵榜單首位;北京、重慶擁堵均呈現(xiàn)高峰擁堵嚴(yán)重、持續(xù)時(shí)間長、空間蔓延廣、區(qū)域間不均衡嚴(yán)重、常發(fā)性路段占比高等特點(diǎn),分別居擁堵榜單第二、第三位。

4 交通擁堵狀況關(guān)聯(lián)性分析

對(duì)嚴(yán)重?fù)矶鲁鞘匈x值為0,較為擁堵城市賦值為1,交通順暢城市賦值為2,對(duì)城市交通擁堵狀況A0與交通基礎(chǔ)設(shè)施建設(shè)A1、國民經(jīng)濟(jì)與社會(huì)發(fā)展水平A2間的關(guān)聯(lián)性進(jìn)行分析。

4.1 數(shù)據(jù)整理

參考文獻(xiàn)[11-14],收集整理城市交通基礎(chǔ)設(shè)施、國民經(jīng)濟(jì)與社會(huì)發(fā)展指標(biāo)數(shù)據(jù),進(jìn)行均值化處理,得出關(guān)聯(lián)性分析數(shù)據(jù)集,如表1所示。

表1 關(guān)聯(lián)性分析數(shù)據(jù)集

表1(續(xù))

4.2 灰色關(guān)聯(lián)分析

灰色關(guān)聯(lián)分析是灰色理論中衡量關(guān)聯(lián)程度的一種方法,可將影響因素之間不明確的關(guān)系進(jìn)行白化,對(duì)數(shù)據(jù)不精準(zhǔn)、不完整的樣本系統(tǒng)有顯著的理論研究優(yōu)勢(shì)。交通擁堵狀況與交通基礎(chǔ)設(shè)施、國民經(jīng)濟(jì)與社會(huì)發(fā)展指標(biāo)之間的內(nèi)在聯(lián)系難以準(zhǔn)確量化,且各因素自身的發(fā)展?fàn)顩r比較模糊,所以運(yùn)用灰色關(guān)聯(lián)分析對(duì)影響城市交通狀況的各個(gè)指標(biāo)進(jìn)行排序,探索影響城市擁堵的主導(dǎo)因素。

1)確定參考序列矩陣和比較序列矩陣

參考序列矩陣一般采用評(píng)價(jià)指標(biāo)的最優(yōu)值或最劣值,也可根據(jù)評(píng)價(jià)目的確定其他參照值。設(shè)評(píng)價(jià)指標(biāo)為n個(gè),每個(gè)指標(biāo)有m個(gè)觀測(cè)值,建立比較序列矩陣。分別表述為:

2)無量綱化數(shù)據(jù)集

由于各個(gè)評(píng)價(jià)指標(biāo)的本質(zhì)不同,造成指標(biāo)數(shù)值的量綱不盡相同,不能直接進(jìn)行比較,所以在做關(guān)聯(lián)度分析之前,常采用均值化法、初始值法等無量綱化方法進(jìn)行數(shù)據(jù)處理。無量綱化后的參考序列矩陣與比較序列矩陣為:

(1)

(2)

3)計(jì)算每個(gè)比較序列矩陣與參考序列矩陣對(duì)應(yīng)元素的絕對(duì)差值

絕對(duì)差值矩陣

(3)

第t個(gè)評(píng)價(jià)指標(biāo)第k個(gè)觀測(cè)值與參考序列矩陣對(duì)應(yīng)元素的絕對(duì)差值

Δt(k)=|x0(k)-xt(k)|,

(4)

4)確定最大、最小絕對(duì)差值

5)計(jì)算關(guān)聯(lián)因數(shù)

(5)

6)計(jì)算關(guān)聯(lián)度

針對(duì)各個(gè)比較序列矩陣分別計(jì)算參考序列矩陣對(duì)應(yīng)元素的關(guān)聯(lián)系數(shù)均值,即灰色關(guān)聯(lián)度

(6)

若各個(gè)指標(biāo)在綜合評(píng)價(jià)中所起的作用不同,可對(duì)關(guān)聯(lián)系數(shù)求加權(quán)平均值,即灰色加權(quán)關(guān)聯(lián)度

(7)

式中Wk為評(píng)價(jià)指標(biāo)的權(quán)重矩陣。

7)建立關(guān)聯(lián)度矩陣進(jìn)行優(yōu)勢(shì)分析

選擇36個(gè)城市評(píng)價(jià)指標(biāo)體系中的某一項(xiàng)指標(biāo),以其觀測(cè)值建立參考序列矩陣,以其他指標(biāo)觀測(cè)值建立比較序列矩陣,運(yùn)用式(1)~(7),分別計(jì)算該指標(biāo)與其他指標(biāo)之間的關(guān)聯(lián)度。同理依次確定參考序列矩陣與比較序列矩陣,計(jì)算各個(gè)指標(biāo)之間的關(guān)聯(lián)度,以參考序列指標(biāo)為橫軸,比較序列指標(biāo)為縱軸,建立關(guān)聯(lián)度矩陣。再根據(jù)指標(biāo)關(guān)聯(lián)度大小,依次排序,得出較為重要的影響因素,進(jìn)行相關(guān)評(píng)價(jià)。

4.3 數(shù)據(jù)處理及分析

以36個(gè)城市交通擁堵狀況指標(biāo)A0觀測(cè)數(shù)據(jù)構(gòu)建參考序列矩陣,以交通基礎(chǔ)設(shè)施指標(biāo)B6~B14、國民經(jīng)濟(jì)與社會(huì)發(fā)展指標(biāo)B15~B18觀測(cè)數(shù)據(jù)構(gòu)建比較序列矩陣,分別計(jì)算A0與B6~B14、B15~B18的關(guān)聯(lián)度。同理在城市交通狀況分析指標(biāo)體系中,將B6~B14、B15~B18依次作為參考序列指標(biāo),分別計(jì)算與其他指標(biāo)的關(guān)聯(lián)度,建立關(guān)聯(lián)度矩陣。為了觀察各類指標(biāo)間的關(guān)聯(lián)性,使用熱力圖來描述關(guān)聯(lián)度矩陣,如圖5所示。

由圖5可得:城市交通擁堵狀況影響因素的關(guān)聯(lián)序?yàn)椋築18>B6>B14>B7>B17>B15>B16>B13>B12>B9>B8>B10>B11,說明每千人民用汽車擁有量、建成區(qū)道路密度為影響交通擁堵的主導(dǎo)因素,每萬人公共汽車擁有量以及建成區(qū)人均道路面積為主要間接影響因素。

圖5 關(guān)聯(lián)度矩陣熱力圖

因此在今后的城市綜合交通改善過程中,北京、重慶等汽車總量較多,應(yīng)采取行政、經(jīng)濟(jì)、市場(chǎng)綜合調(diào)控,引導(dǎo)和限制私人小汽車的過快增長;哈爾濱、長春、呼和浩特等路網(wǎng)密度較低的城市可引入“窄馬路模式”等道路布局新理念,盡快完善完整道路網(wǎng)系統(tǒng),逐步緩解交通擁堵問題。

指標(biāo)B6~B14表示交通基礎(chǔ)設(shè)施建設(shè)情況,內(nèi)部沒有直接聯(lián)系,僅考慮其與國民經(jīng)濟(jì)與社會(huì)發(fā)展指標(biāo)之間的內(nèi)在關(guān)聯(lián)性,結(jié)合圖5綜合考慮可知:影響交通運(yùn)輸網(wǎng)絡(luò)密度指標(biāo)B6、B11和B13的主導(dǎo)因素為B18、B16、B17,說明城市汽車、人口與就業(yè)崗位數(shù)量可間接影響城市交通基礎(chǔ)設(shè)施建設(shè)。

5 結(jié)語

根據(jù)城市交通實(shí)際情況,構(gòu)建交通狀況分析指標(biāo)體系,提出基于K-Means聚類與灰色關(guān)聯(lián)的集成方法,研究導(dǎo)致城市擁堵的關(guān)鍵因素,提出相應(yīng)的交通改善措施,為交通發(fā)展政策的制定提供參考。

本文提出的方法仍有待改進(jìn),例如:交通狀況分析指標(biāo)體系應(yīng)考慮城市規(guī)模、形態(tài)、區(qū)位、面積等因素,對(duì)相近城市之間進(jìn)行關(guān)聯(lián)分析;此外,灰色關(guān)聯(lián)分析為定量、定性相結(jié)合的灰色理論方法,以后可采用專家評(píng)估法進(jìn)一步明確其分辨系數(shù)。

猜你喜歡
關(guān)聯(lián)度聚類交通
繁忙的交通
基于K-means聚類的車-地?zé)o線通信場(chǎng)強(qiáng)研究
中國制造業(yè)產(chǎn)業(yè)關(guān)聯(lián)度分析
中國制造業(yè)產(chǎn)業(yè)關(guān)聯(lián)度分析
小小交通勸導(dǎo)員
沉香揮發(fā)性成分與其抗腫瘤活性的灰色關(guān)聯(lián)度分析
基于高斯混合聚類的陣列干涉SAR三維成像
基于Spark平臺(tái)的K-means聚類算法改進(jìn)及并行化實(shí)現(xiàn)
基于改進(jìn)的遺傳算法的模糊聚類算法
廣義區(qū)間灰數(shù)關(guān)聯(lián)度模型
原阳县| 凉山| 鄂托克旗| 吴川市| 松溪县| 乌什县| 襄汾县| 广德县| 西畴县| 吕梁市| 龙游县| 南郑县| 锡林郭勒盟| 久治县| 阿图什市| 固安县| 门源| 保亭| 海南省| 来宾市| 淳安县| 阜新| 昌宁县| 金溪县| 襄垣县| 修水县| 西藏| 芜湖市| 剑阁县| 太原市| 吉安市| 永年县| 桐柏县| 富宁县| 晋江市| 廉江市| 中卫市| 鄂温| 伊通| 铜梁县| 准格尔旗|