国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于系統(tǒng)聚類的高速公路超載超限分析

2018-10-15 08:03李保龍王曉峰
現(xiàn)代計算機(jī) 2018年24期
關(guān)鍵詞:時間段季度聚類

李保龍,王曉峰

(上海海事大學(xué)信息工程學(xué)院,上海201306)

0 引言

公路運輸在國民經(jīng)濟(jì)發(fā)展中具有重要作用,相比于鐵道運輸、空中運輸、航海運輸具有方便快捷、價格低廉、機(jī)動性強(qiáng)、服務(wù)面廣等優(yōu)勢,占據(jù)了運輸方式的主導(dǎo)地位[1]。但受利益驅(qū)動,車輛運輸中經(jīng)常出現(xiàn)超限超載現(xiàn)象。超載超限就是公路運輸中出現(xiàn)貨運車輛實際裝載量超過道路限定裝載量的現(xiàn)象[2]。超限超載會導(dǎo)致公路損壞,嚴(yán)重縮短公路使用壽命,容易引發(fā)安全事故,還會擾亂運輸市場秩序,阻礙公路運輸事業(yè)的發(fā)展[3]。因此,分析車輛超載超限的規(guī)律,進(jìn)一步降低車輛超載超限,能夠有效降低高速公路的維護(hù)費用,減少由超限超載所引發(fā)的交通事故從而避免重大經(jīng)濟(jì)損失,有助于高速公路的健康發(fā)展。

目前高速公路超載超限治理多以車輛自動識別管理系統(tǒng)的研究與聯(lián)網(wǎng)檢測的結(jié)合。例如美國使用傳感器技術(shù),全美約有1000多個動態(tài)稱重站,采用視頻采集設(shè)備和路邊控制器技術(shù),通過計算機(jī)系統(tǒng)與高速公路巡警的電腦相連接,對貨車進(jìn)行撿測,及時獲得檢測數(shù)據(jù)和鑒別超載車輛的身份[4]。日本多采用靜態(tài)固定的或移動的稱重設(shè)備對超限車輛進(jìn)行檢測,南非也很重視自動稱重技術(shù)的研究和應(yīng)用,并且將電子稱重設(shè)備應(yīng)用于治理超限超載工作中。王鵬、劉震、劉強(qiáng)等人從高速公路車輛超限檢測聯(lián)網(wǎng)系統(tǒng)的應(yīng)用來檢測車輛超載超限[5]。我國采用設(shè)立固定檢查站和抽調(diào)人力在高速公路上抽查等方式檢查車輛超載超限情況。這種方式存在檢測范圍有限、車輛選擇輔路逃避檢測、耗費人力物力較大、檢測過程時松時緊等問題。因此分析車輛超載與時間、季節(jié)的關(guān)系是很有必要的,這樣能夠為科學(xué)合理的分配人力物力、節(jié)約資源作出指導(dǎo)。

為了使檢測站科學(xué)合理地分配資源,本文從時間角度應(yīng)用系統(tǒng)聚類方法對車輛超限率問題進(jìn)行分析,客觀反映了車輛超限率的現(xiàn)狀,為有效降低高速公路超載超限率提供理論依據(jù),解決成本過高和檢測站車輛通過效率的問題,提高高速公路治理水平。

1 數(shù)據(jù)處理

本文的原始數(shù)據(jù)源于某省高速公路聯(lián)網(wǎng)監(jiān)控系統(tǒng)2016年全年的實際監(jiān)測記錄,由于人工操作不規(guī)范和工作繁雜,實際記錄數(shù)據(jù)量龐大,存在很多無效的數(shù)據(jù),無法直接應(yīng)用。因此,在進(jìn)行數(shù)據(jù)聚類分析之前有必要對數(shù)據(jù)進(jìn)行預(yù)處理,解決原始數(shù)據(jù)中不一致、重復(fù)、緯度高等噪聲問題[6]。處理中應(yīng)選取合適的屬性,盡可能賦予屬性名和屬性值明確的含義,統(tǒng)一多數(shù)據(jù)源的屬性值編碼,去除惟一屬性,去除重復(fù)性,去除可忽略字段,合理選擇關(guān)聯(lián)字段為主要原則[7]。具體處理如下:

(1)數(shù)據(jù)存儲方式轉(zhuǎn)換。原始數(shù)據(jù)為2016年1月至2016年12月的CSV文件,文件存儲量巨大不易處理,所以需要把文件存儲到MySQL數(shù)據(jù)庫中。

(2)數(shù)據(jù)預(yù)處理。對以下不同情況采取的處理方式:

①數(shù)據(jù)缺失。數(shù)據(jù)元素缺失分兩種情況:第一種是無效屬性字段的缺失,這種情況下直接將該屬性丟棄;第二種是部分字段缺失,數(shù)據(jù)元素不能補(bǔ)全,這種情況應(yīng)忽略該記錄。例如:記錄中ETC車輛電子標(biāo)簽OBU編號、支付方式代碼屬性并未錄入,并且該屬性也使用不到,所以對其作丟棄處理。

②數(shù)據(jù)錯誤。原始數(shù)據(jù)部分字段的數(shù)據(jù)是錯誤的,不能達(dá)到本文數(shù)據(jù)處理要求,所以對這些數(shù)據(jù)進(jìn)行修復(fù)處理。修復(fù)分為三種情況:第一種情況:部分字段錯誤的數(shù)據(jù),該記錄直接丟棄;第二種情況:部分字段缺失,需要手工填寫空缺值;第三種情況是字段的部分缺失,這時要進(jìn)行截取。例如:部分時間是1997年開始的,這些記錄是操作失誤或者儀器調(diào)試的無用數(shù)據(jù),應(yīng)丟棄;有些記錄的超限率為空值,可以根據(jù)載重和核重計算出來。

③數(shù)據(jù)過濾。一般來講,車輛超載之后才有超限率,所以對結(jié)果數(shù)據(jù)中超出該范圍的數(shù)據(jù)進(jìn)行過濾,降低錯誤記錄對結(jié)果的影響。

2 車輛超限率聚類分析模型

車輛超限率能夠較好的反映出車輛超載超限的情況。降低車輛超限率就表示有效地治理了車輛超載超限現(xiàn)象,因車輛超限超載而造成的道路交通事故就會減少,道路運輸市場秩序?qū)⒌玫矫黠@好轉(zhuǎn),公路通行率和運輸效益就會得到提高。設(shè)車輛實際載重為w(單位:噸),車輛額定載重為u(單位:噸),車輛超限率為v,定義超限率如(1)式所示。

為了分析出不同時間段車輛超載情況,我們定義車輛平均超限率,表示在單位時間內(nèi)每輛車的超限率之和與通行車次的均值。平均超限率可以較好地體現(xiàn)車輛在不同時間段的超載情況。如果時間跨度大,就對車輛超限的作用減小??紤]到以月和季度劃分時間跨度大,對車輛超載超限影響太大,另外由于數(shù)據(jù)量龐大,數(shù)據(jù)不易處理,所以取車輛平均超限率的時間單位為每小時。以每天0-24小時為總的統(tǒng)計時間段,分析各個時間段車輛超載超限的變化規(guī)律。平均超限率為vˉ,單位時間內(nèi)通行車次為n,vi表示每輛車的超限率,,其中未超限車輛超限率為0,平均超限率定義為式(2)。

3 聚類方法和原理分析

聚類分析就是按照某個特定標(biāo)準(zhǔn)把一個數(shù)據(jù)集劃分成不同的類或簇。通常劃分后同一簇內(nèi)的數(shù)據(jù)特征相近,不同簇間的差異很大。聚類的屬性語言描述為:

初始時將每小時的平均超限率作為一簇,然后計算各小時超限率之間的距離,選擇特征距離最小的一對合并成新簇,計算新簇與其他簇之間的特征距離,再將特征距離最近的兩個簇合并,循序漸進(jìn),直至所有小時的平均超限率歸并一簇為止。

設(shè) Ni表示小時特征,把 N1,N2,N3,…,Nn各自為一簇,Vi表示 Ni的平均超限率,dij表示Ni與Nj之間的特征距離:

聚類步驟:

(1)使用式(3)計算各個小時特征之間的距離,得到特征距離矩陣D0,各時間段集合自成一類。

(2)在矩陣D0非對角線的元素中找出最小元素,設(shè)為 dij,將 Ni和 Nj合并成新的簇 NM1,則{Ni,Nj}即NM1的全部樣本,使用式(2)計算出NM1的平均超限率。

(3)使用式⑶計算NM1與其他時間段特征的距離,得到距離矩陣D1。

(4)重復(fù)(2)(3)步驟,直到所有的小時特征歸為一個簇。

例如:N1,N2,N3,N4的平均超限率為2.2245,2.7173,3.1212,3.3530,第一步計算出D0矩陣(因為特征距離得出的為對稱矩陣,因此只展示上三角矩陣)如表1:

表1

第二步可以得出D0中計算將N3和 N4特征距離最近,合并成新的簇 NM1,接著計算NM1與其他屬性的特征距離矩陣D1,如表2:

表2

重復(fù)以上步驟,直到所有的特征分為一個簇為止。

4 車輛超限率聚類分析

4.1 數(shù)據(jù)選取

2016年分為四個季度,可以分析出季節(jié)對超限率的影響,對超限車輛的時間屬性進(jìn)行分析,探討超限率分布規(guī)律。

4.2 平均超限率聚類分析

把時間序列分成不同簇,對圖1中四個季度聚類譜系圖進(jìn)行對比分析,為了更清楚地描述車輛超載的嚴(yán)重程度,使用A、B、C三個等級來表示(A表示嚴(yán)重超限,B表示一般超限,C表示輕微超限),把每個季度的平均超限率以表格形式表現(xiàn),如表3所示。由表3可知,各個簇分別按照A、B、C各自的平均超限率依次降低,可以清晰的顯示四個季度車輛平均時間超限率的差異。同樣的對圖2的2016年全年譜系圖進(jìn)行分析,由表4顯示超限率在時間上的差異。

表4 2016年全年數(shù)據(jù)聚類結(jié)果

圖1 2016年各季度聚類譜系圖

圖2 2016年全年聚類譜系圖

系統(tǒng)聚類算法根據(jù)每個時間段的平均超限率把24個時間段對應(yīng)的數(shù)據(jù)分成了不同的簇,再根據(jù)不同超限率水平將簇分為高、中、低三類,分類結(jié)果如表3所示。從表3中可以看出,車輛在1-6h時間段內(nèi)的平均超限率在四個季度都比較嚴(yán)重;在19-24h時間段四個季度的平均超載率表現(xiàn)一般;在12-17時間段四個季度內(nèi)平均超限率都較低。在第一季度內(nèi)車輛超限程度分布的時間段也和其他季度差別較大,第一季度嚴(yán)重超限集中分布在1-11時間段之間,而其他幾個季度相差不大且集中分布在1-6時間段,說明車輛受季節(jié)的影響較大。對比表3和表4車輛嚴(yán)重超載的高峰期在1-6時間段,這個時間段應(yīng)加大超限檢測和治理力度;在19-24時間段內(nèi)超載率一般,在這個時間段內(nèi)保持正常檢查力度即可;在12-17時間段內(nèi)平均超載率較低,說明下午的超限平均水平較低,應(yīng)適當(dāng)減少交通檢測人力投入。根據(jù)不同時間段超限率的高低決定檢測及相關(guān)人員的投入力度,可以最大程度的節(jié)約人力等相關(guān)資源,提高交通部門的管理水平和治理效率。同時交通管理部門可以結(jié)合不同的季節(jié)合理調(diào)整工作人員的上班時間,有效提高工作效率。

表3 2016年各季度聚類結(jié)果

5 結(jié)語

本文構(gòu)建了車輛超載超限模型,結(jié)合單位時間內(nèi)的平均超限率對24個時間段車輛平均超限率進(jìn)行了分析。以2016年全年高速公路通行流水?dāng)?shù)據(jù)為研究對象,運用系統(tǒng)聚類方法對一天24小時時間段進(jìn)行了聚類分析,挖掘出車輛超載存在的時間特征和規(guī)律。高速公路檢測站可以在車輛超載超限嚴(yán)重的時間高峰期采取措施,例如加大力度檢查,上路抽查等手段去檢查過往車輛,以此來降低車輛超限率。在車輛超載超限較低的時間段內(nèi)減少人力物力投入,以此來節(jié)約成本。

猜你喜歡
時間段季度聚類
一種傅里葉域海量數(shù)據(jù)高速譜聚類方法
2021年第4季度航天器發(fā)射統(tǒng)計
2021年第3季度航天器發(fā)射統(tǒng)計
2021年第2季度航天器發(fā)射統(tǒng)計
夏天曬太陽防病要注意時間段
面向WSN的聚類頭選舉與維護(hù)協(xié)議的研究綜述
改進(jìn)K均值聚類算法
發(fā)朋友圈沒人看是一種怎樣的體驗
“三天后”是啥時候?
2016年1季度A股各板塊漲跌幅前50名