李偉強(qiáng),李亞?wèn)|,趙 佳
(1.北京易華錄信息技術(shù)股份有限公司,北京 100043;2.中國(guó)衛(wèi)通集團(tuán)股份有限公司,北京 100190)
隨著經(jīng)濟(jì)社會(huì)的持續(xù)快速發(fā)展,我國(guó)迎來(lái)了道路交通大發(fā)展的有利時(shí)機(jī),截至2018年11月,全國(guó)機(jī)動(dòng)車保有量達(dá)3.25億輛,機(jī)動(dòng)車駕駛?cè)诉_(dá)4.07億人,與此同時(shí),高速公路、公路及城市道路通車?yán)锍坛掷m(xù)快速增長(zhǎng)。為對(duì)應(yīng)人、車、路快速增長(zhǎng)帶來(lái)的交通管理嚴(yán)峻形勢(shì)和巨大壓力,全國(guó)公安交通管理部門落實(shí)科技強(qiáng)警戰(zhàn)略,積極推動(dòng)智能交通管理系統(tǒng)建設(shè),初步實(shí)現(xiàn)了交通管理業(yè)務(wù)信息化,完善了道路交通監(jiān)控設(shè)施,完成了全國(guó)機(jī)動(dòng)車緝查布控系統(tǒng)聯(lián)網(wǎng)建設(shè)。近年來(lái)各地陸續(xù)開展了公安交通集成指揮平臺(tái)、大數(shù)據(jù)分析研判平臺(tái)等系統(tǒng)建設(shè),有力提升了交通管理服務(wù)能力和水平,但是,仍面臨著交通擁堵、交通事故頻發(fā)、交通陋習(xí)多等諸多城市交通頑疾,仍存在設(shè)備集成度低、交通管控范圍不夠廣、數(shù)據(jù)應(yīng)用缺乏信息關(guān)聯(lián)共享等問(wèn)題。依靠科技力量,推進(jìn)智能交通系統(tǒng)建設(shè)發(fā)展,提高交通數(shù)據(jù)應(yīng)用水平,仍是未來(lái)相當(dāng)長(zhǎng)時(shí)間的工作重點(diǎn)。
(1)“保安全、保暢通”工作需要。近年來(lái)全國(guó)范圍內(nèi)人、車、路快速增長(zhǎng),機(jī)動(dòng)車駕駛員素質(zhì)總體不高,群眾參與交通守法意識(shí)仍比較低,駕駛?cè)恕⑿腥私煌ㄟ`法行為多發(fā),造成交通擁堵常態(tài)化、道路通行效率低下、事故頻發(fā)且處置能力不足、重點(diǎn)車輛多頭共管信息不完整,交通運(yùn)行整體效率偏低。
(2)交通科技應(yīng)用需要。近年來(lái),各地以“向科技要警力”為目標(biāo)陸續(xù)建立了大量的信息化系統(tǒng),但是,客觀上仍然存在交通違法監(jiān)測(cè)手段覆蓋不足、交通綜合評(píng)估缺少?zèng)Q策依據(jù)、肇事逃逸事故偵破手段不足、信息發(fā)布渠道不多、數(shù)據(jù)量爆發(fā)式增長(zhǎng)卻難以有效挖掘有效信息等技術(shù)應(yīng)用難題,直接制約著道路交通管理工作的成效。
(3)公眾服務(wù)需要。隨著人民群眾交通出行需求的日益增長(zhǎng),不斷提高交通公共服務(wù)的能力和水平,拓展服務(wù)手段,必將是今后交通管理部門工作的重點(diǎn)之一。人民群眾在交通管理方面,既是受益者也是參與者,便民服務(wù)手段不足、出行缺乏精準(zhǔn)指引、信息獲取不足、參與度低是交通公眾服務(wù)亟需改善的幾個(gè)方面。
(4)數(shù)據(jù)共享需要。各類交通信息都分散在交通管理各業(yè)務(wù)信息系統(tǒng)和新興互聯(lián)網(wǎng)的平臺(tái)中,需要實(shí)現(xiàn)跨部門、跨業(yè)務(wù)、跨平臺(tái)的數(shù)據(jù)采集、處理、整合、存儲(chǔ),為各級(jí)各類應(yīng)用提供更為豐富的數(shù)據(jù)信息資源,實(shí)現(xiàn)不同行業(yè)之間實(shí)時(shí)的數(shù)據(jù)交換和共享,并進(jìn)行綜合、全面、深入的數(shù)據(jù)應(yīng)用,滿足交通管理精細(xì)化、智能化、動(dòng)態(tài)化的要求,滿足公眾信息服務(wù)和政府決策數(shù)據(jù)支持的需要。
交通大數(shù)據(jù)是大數(shù)據(jù)的一種,它具備一般大數(shù)據(jù)的“4V”(Volume,Variety,Value,VeIocity)特點(diǎn)。
(1)規(guī)模大。交通系統(tǒng)是一個(gè)復(fù)雜的系統(tǒng),涉及人、車、線路、環(huán)境等,數(shù)據(jù)量巨大。比如手機(jī)數(shù)據(jù)、車輛的北斗/GPS數(shù)據(jù)、道路的流量數(shù)據(jù)和天氣狀況數(shù)據(jù)等。
(2)種類多。交通大數(shù)據(jù)包括物理空間的數(shù)據(jù),比如車輛移動(dòng)的北斗/GPS位置數(shù)據(jù)、車輛狀態(tài)數(shù)據(jù)、攝像頭視頻數(shù)據(jù)、天氣數(shù)據(jù)以及路網(wǎng)數(shù)據(jù)等;也包括與人類社會(huì)息息相關(guān)的移動(dòng)數(shù)據(jù),比如手機(jī)基站數(shù)據(jù)、交通智能卡數(shù)據(jù)等;還可以包括網(wǎng)絡(luò)空間數(shù)據(jù),比如論壇、新聞、微博及微信等眾包數(shù)據(jù)。
(3)價(jià)值密度低。數(shù)據(jù)總量雖然很大,但對(duì)于具體應(yīng)用而言,挖掘有用的數(shù)據(jù)有可能像大海撈針一般。比如為分析交通事故,可能只有與事故相關(guān)的天氣、車輛、人員及視頻數(shù)據(jù)才是有用的,而其他不相關(guān)的大量數(shù)據(jù)需要被過(guò)濾掉。
(4)速度快。交通數(shù)據(jù)具有強(qiáng)實(shí)時(shí)性特征。無(wú)論是交通基礎(chǔ)設(shè)施、交通運(yùn)行狀態(tài)還是交通服務(wù)對(duì)象和交通運(yùn)載工具,每時(shí)每刻都在涌現(xiàn)大量的數(shù)據(jù),同時(shí)也需要快速處理、分析和挖掘,并給出反饋。例如交通實(shí)時(shí)動(dòng)態(tài)路況,一方面大量的視頻數(shù)據(jù)、北斗/GPS位置數(shù)據(jù)、地感線圈數(shù)據(jù)等不斷涌現(xiàn),亟待實(shí)時(shí)處理計(jì)算;另一方面還需要根據(jù)歷史數(shù)據(jù),對(duì)將要發(fā)生的情況進(jìn)行實(shí)時(shí)預(yù)測(cè),并反饋給出行者。
此外,交通大數(shù)據(jù)是城市大數(shù)據(jù)的重要組成部分。城市大數(shù)據(jù)是在城市管理、生活、建設(shè)、發(fā)展過(guò)程中,由信息空間、物理世界和人類社會(huì)“三元空間”所產(chǎn)生的多源、多模態(tài)、異構(gòu)海量數(shù)據(jù),蘊(yùn)涵著豐富的知識(shí)和價(jià)值。因此,交通大數(shù)據(jù)還具有時(shí)空移動(dòng)性(時(shí)空變化并蘊(yùn)涵規(guī)律)、社會(huì)關(guān)聯(lián)性(三元空間分布但彼此關(guān)聯(lián))、人的參與性(來(lái)源于人且服務(wù)于人)等特點(diǎn)。
(5)時(shí)空移動(dòng)性。任何交通事件都具有地域和時(shí)域特征。為了全面深入理解交通大數(shù)據(jù),需要從時(shí)間和空間兩個(gè)維度分析其動(dòng)態(tài)演化特性。
(6)多維結(jié)構(gòu)特征。如一段公路上,既有交通流量屬性,也有路面介質(zhì)信息,還有路基結(jié)構(gòu)等。
(7)社會(huì)關(guān)聯(lián)性。人類社會(huì)大量的移動(dòng)軌跡同時(shí)存在于信息空間和物理世界,使得信息空問(wèn)、物理世界和人類社會(huì)三元空間之間有機(jī)連接與互動(dòng),體現(xiàn)在城市發(fā)展上即動(dòng)態(tài)信息、個(gè)體流動(dòng)規(guī)律以及人群生活與城市交通發(fā)展的深層交互上。
交通大數(shù)據(jù)共享服務(wù)平臺(tái)是一個(gè)完整體系,涵蓋數(shù)據(jù)采集、處理與應(yīng)用,系統(tǒng)提供多源異構(gòu)大數(shù)據(jù)采集能力、大數(shù)據(jù)集中存儲(chǔ)管理能力、大數(shù)據(jù)實(shí)時(shí)流處理能力、大數(shù)據(jù)分布式處理分析能力、圖像大數(shù)據(jù)解析能力、海量數(shù)據(jù)秒級(jí)檢索能力等,實(shí)現(xiàn)對(duì)跨公安網(wǎng)、專網(wǎng)(視頻圖像、政務(wù)、社會(huì))、互聯(lián)網(wǎng)三網(wǎng),來(lái)自交警部門(總隊(duì)、地市支隊(duì))、各類社會(huì)面系統(tǒng)數(shù)據(jù)的集中匯聚、實(shí)時(shí)分析處理、融合關(guān)聯(lián)處理、深度挖掘,為道路通行狀態(tài)研判、道路信號(hào)控制、機(jī)動(dòng)車及駕駛?cè)搜信?、車輛動(dòng)態(tài)監(jiān)管、駕駛?cè)斯芾?、重大警情研判、交通違法數(shù)據(jù)研判、交通事故分析研判和輿情研判分析等交通管理業(yè)務(wù)提供全面支撐。
(1)大數(shù)據(jù)采集技術(shù)。數(shù)據(jù)是指涉及交通大數(shù)據(jù)平臺(tái)相關(guān)的所有數(shù)據(jù)包括多種方式獲得的各種類型的結(jié)構(gòu)化、半結(jié)構(gòu)化及非結(jié)構(gòu)化的海量數(shù)據(jù),數(shù)據(jù)是大數(shù)據(jù)知識(shí)服務(wù)模型的根本。運(yùn)用的采集技術(shù)主要包括高速高可靠數(shù)據(jù)采集、遷移技術(shù);高速數(shù)據(jù)解析、轉(zhuǎn)換與裝載技術(shù)等;同時(shí)設(shè)計(jì)質(zhì)量評(píng)估模型,提供數(shù)據(jù)質(zhì)量技術(shù)。
(2)大數(shù)據(jù)分析與挖掘技術(shù)。數(shù)據(jù)挖掘就是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識(shí)的過(guò)程。數(shù)據(jù)挖掘涉及的技術(shù)方法很多,有多種分類法。根據(jù)挖掘任務(wù)可分為分類或預(yù)測(cè)模型發(fā)現(xiàn)、數(shù)據(jù)總結(jié)、聚類、關(guān)聯(lián)規(guī)則發(fā)現(xiàn)、序列模式發(fā)現(xiàn)、依賴關(guān)系或依賴模型發(fā)現(xiàn)、異常和趨勢(shì)發(fā)現(xiàn)等等;挖掘方法可粗分為:機(jī)器學(xué)習(xí)方法、統(tǒng)計(jì)方法、神經(jīng)網(wǎng)絡(luò)方法和數(shù)據(jù)庫(kù)方法。
(3)大數(shù)據(jù)檢索技術(shù)。大數(shù)據(jù)檢索旨在能夠快速的在海量數(shù)據(jù)中檢索出用戶關(guān)心的數(shù)據(jù),檢索的目標(biāo)包括各種數(shù)據(jù)類型。對(duì)于結(jié)構(gòu)化數(shù)據(jù)庫(kù)能夠?qū)λ邢嚓P(guān)行列信息進(jìn)行快速全文檢索、對(duì)于非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)庫(kù)能夠不局限于文本自身的信息還能夠深入檢索到文本內(nèi)部的數(shù)據(jù)。同時(shí)能夠提供多種檢索方式,包括過(guò)濾檢索、條件檢索、邏輯查詢、分類檢索等。
(4)大數(shù)據(jù)可視化技術(shù)。大數(shù)據(jù)可視化無(wú)論對(duì)于普通用戶或是數(shù)據(jù)分析專家,都是最基本的功能,將數(shù)據(jù)圖像化可以讓數(shù)據(jù)自己說(shuō)話,讓用戶直觀的感受到結(jié)果。大數(shù)據(jù)可視化技術(shù)不僅能夠看到原始的數(shù)據(jù),同時(shí)能夠?qū)?shù)據(jù)進(jìn)行簡(jiǎn)單的統(tǒng)計(jì)分析,并以直觀的統(tǒng)計(jì)圖表進(jìn)行數(shù)據(jù)展現(xiàn),可以幫助用戶發(fā)現(xiàn)數(shù)據(jù)內(nèi)部隱含的價(jià)值和規(guī)律。
整個(gè)系統(tǒng)由一中心(云計(jì)算中心)、兩庫(kù)(交通業(yè)務(wù)數(shù)據(jù)庫(kù)、交通圖像數(shù)據(jù)庫(kù))、三平臺(tái)(數(shù)據(jù)服務(wù)平臺(tái)、業(yè)務(wù)服務(wù)平臺(tái)、行業(yè)應(yīng)用平臺(tái))構(gòu)成。
(1)一中心:云計(jì)算中心。充分利用云計(jì)算、大數(shù)據(jù)的高性能、高可用、高擴(kuò)展的優(yōu)勢(shì),為平臺(tái)提供強(qiáng)大的網(wǎng)絡(luò)、計(jì)算、存儲(chǔ)等基礎(chǔ)處理能力。
(2)兩庫(kù):交通大數(shù)據(jù)中心(交通業(yè)務(wù)數(shù)據(jù)庫(kù)、交通圖像數(shù)據(jù)庫(kù))。包含圖像、業(yè)務(wù)兩大數(shù)據(jù)庫(kù),匯聚交通管理業(yè)務(wù)數(shù)據(jù),整合接入外部數(shù)據(jù),實(shí)現(xiàn)數(shù)據(jù)的全面融合。
一是圖像大數(shù)據(jù)。視頻圖像是交通大數(shù)據(jù)中規(guī)模最大、增長(zhǎng)最快、信息含量最豐富的大數(shù)據(jù)源,也是交通管理的重要資源。圖像數(shù)據(jù)信息的完整性、真實(shí)性、時(shí)效性直接關(guān)系到上層應(yīng)用的使用效率。建立交通管理圖像大數(shù)據(jù),實(shí)現(xiàn)視頻、圖片資源的全面智能化管理,依托大數(shù)據(jù)、云計(jì)算、機(jī)器視覺及深度學(xué)習(xí)技術(shù),建立圖像資源池及圖像特征庫(kù),實(shí)現(xiàn)視頻圖片的結(jié)構(gòu)化、語(yǔ)義化,實(shí)現(xiàn)圖像價(jià)值的實(shí)時(shí)提取與應(yīng)用,實(shí)現(xiàn)交通圖像數(shù)據(jù)的存儲(chǔ)、解析、管理、檢索、應(yīng)用服務(wù),比如道路路況感知、事件感知、車牌、車型等車輛信息的提取等。二是業(yè)務(wù)大數(shù)據(jù)。業(yè)務(wù)大數(shù)據(jù),實(shí)現(xiàn)跨部門、跨業(yè)務(wù)、跨地域的交通業(yè)務(wù)數(shù)據(jù)采集、處理、整合、存儲(chǔ)、交換共享等功能;建設(shè)統(tǒng)一的數(shù)據(jù)中心,實(shí)現(xiàn)不同條塊之間的數(shù)據(jù)交換和共享,并進(jìn)行綜合、全面、深入的數(shù)據(jù)應(yīng)用,滿足交通業(yè)務(wù)管理、公眾信息服務(wù)和政府決策數(shù)據(jù)支持的需要。
(3)數(shù)據(jù)服務(wù)平臺(tái)。運(yùn)用大數(shù)據(jù)、機(jī)器視覺、深度學(xué)習(xí)等技術(shù),提供數(shù)據(jù)的解析、挖掘與共享;在數(shù)據(jù)融合共享的基礎(chǔ)上,依據(jù)交通管理最核心的要素,對(duì)人、車、路、環(huán)境、管理等進(jìn)行主題化梳理,形成跨業(yè)務(wù)庫(kù)、跨平臺(tái)的全息大數(shù)據(jù)服務(wù)。一是全息大數(shù)據(jù)服務(wù)。在全面建立基礎(chǔ)數(shù)據(jù)庫(kù)之上,按照交管業(yè)務(wù)關(guān)注的重點(diǎn),從基礎(chǔ)數(shù)據(jù)庫(kù)中抽取、清洗、提煉并重新聚合,形成跨業(yè)務(wù)庫(kù)的全息數(shù)據(jù)檔案,滿足交通管理綜合研判、分析等業(yè)務(wù)需求,主要包括車輛全息數(shù)據(jù)庫(kù)、人員全息數(shù)據(jù)庫(kù)、道路(路口、路段)全息數(shù)據(jù)庫(kù)、事故全息數(shù)據(jù)庫(kù)、設(shè)施設(shè)備數(shù)據(jù)庫(kù)等。二是海量數(shù)據(jù)搜索服務(wù)。隨著交通管理業(yè)務(wù)數(shù)據(jù)規(guī)模的爆炸式增長(zhǎng),如何從海量的歷史、實(shí)時(shí)數(shù)據(jù)中快速獲取有用信息,變得越來(lái)越具有挑戰(zhàn)性。搜索是獲取信息最高效的途徑之一,因此也是各類數(shù)據(jù)資源、應(yīng)用的基礎(chǔ)標(biāo)配功能。該服務(wù)基于兩個(gè)大數(shù)據(jù)庫(kù)匯聚的數(shù)據(jù)信息,運(yùn)用大數(shù)據(jù)技術(shù)對(duì)交通管理各類數(shù)據(jù)優(yōu)化、融合,實(shí)現(xiàn)實(shí)時(shí)在線對(duì)各類交通資源數(shù)據(jù)進(jìn)行一鍵搜索、綜合查詢,豐富查詢內(nèi)容,提升查詢效率。三是大數(shù)據(jù)可視化服務(wù)。大數(shù)據(jù)可視化平臺(tái)提供統(tǒng)一數(shù)據(jù)訪問(wèn)接口,致力于用更生動(dòng)、友好的形式,即時(shí)呈現(xiàn)隱藏在瞬息萬(wàn)變且龐雜數(shù)據(jù)背后的業(yè)務(wù)洞察。通過(guò)交互式實(shí)時(shí)數(shù)據(jù)可視化展示來(lái)幫助指揮人員發(fā)現(xiàn)、診斷業(yè)務(wù)問(wèn)題,越來(lái)越成為大數(shù)據(jù)解決方案中不可或缺的一環(huán)。幫助非專業(yè)的業(yè)務(wù)人員通過(guò)圖形化的界面輕松搭建專業(yè)水準(zhǔn)的可視化應(yīng)用。提供豐富的可視化模板,滿足指揮調(diào)度、業(yè)務(wù)監(jiān)控、交通態(tài)勢(shì)分析等多種業(yè)務(wù)的展示需求。四是數(shù)據(jù)支撐服務(wù)。系統(tǒng)數(shù)據(jù)支撐服務(wù)提供了基于大數(shù)據(jù)架構(gòu)的服務(wù)框架,建立數(shù)據(jù)的基礎(chǔ)管理、數(shù)據(jù)監(jiān)控、共享服務(wù)等數(shù)據(jù)基礎(chǔ)支撐服務(wù)。
(4)業(yè)務(wù)服務(wù)平臺(tái)。面向各級(jí)業(yè)務(wù),構(gòu)建“去平臺(tái)化、工具化、可定制”的交通專題分析工具及服務(wù),如勤務(wù)崗位分析、事故預(yù)警預(yù)測(cè)、車輛情報(bào)分析、違法分析、停車管理等,為上層應(yīng)用提供模塊化支撐;構(gòu)建模塊化、組件化的交通專題分析模型及服務(wù),實(shí)現(xiàn)應(yīng)用模塊的注冊(cè)、發(fā)布、分類、搜索、展示等集中管理,共享給需要此服務(wù)的各個(gè)行業(yè)應(yīng)用,豐富和拓展業(yè)務(wù)管理手段。
(5)行業(yè)應(yīng)用平臺(tái)。面向交通管理和公眾服務(wù),充分融合大數(shù)據(jù)平臺(tái)的數(shù)據(jù)服務(wù)和業(yè)務(wù)服務(wù),進(jìn)一步創(chuàng)新和拓展應(yīng)用手段,建立更加完善、更加智能的指揮調(diào)度、信號(hào)控制、決策支持、交通安全評(píng)估等綜合應(yīng)用。
交通大數(shù)據(jù)共享服務(wù)平臺(tái)依托大數(shù)據(jù)、云計(jì)算、人工智能技術(shù),建立圖像大數(shù)據(jù)與業(yè)務(wù)大數(shù)據(jù),形成圖像、業(yè)務(wù)主題資源池及跨業(yè)務(wù)庫(kù)的交通全息數(shù)據(jù)檔案,構(gòu)建“工具化、碎片化、可視化”的交通專題分析模型及服務(wù),豐富交通管理業(yè)務(wù)應(yīng)用,拓展業(yè)務(wù)管理手段,實(shí)現(xiàn)交通管理數(shù)據(jù)的“大融合、大碰撞、大應(yīng)用”,促進(jìn)數(shù)據(jù)向價(jià)值轉(zhuǎn)變,促進(jìn)依靠“經(jīng)驗(yàn)”的決策模式向“數(shù)據(jù)驅(qū)動(dòng)”的新模式轉(zhuǎn)變,構(gòu)建大數(shù)據(jù)時(shí)代的交通管理新常態(tài)。