大數(shù)據(jù)在體量上指規(guī)模龐大的信息和海量的數(shù)據(jù),信息量大到無法利用傳統(tǒng)的方法(無論是技術(shù)手段還是人工方式)進(jìn)行分析或有針對(duì)性地過濾。同時(shí),大數(shù)據(jù)技術(shù)不適用于所有應(yīng)用場景,也不能解決所有交通問題。但是,仍然有許多企業(yè)為了自身的利益,過度宣傳大數(shù)據(jù)的效用,把大數(shù)據(jù)說成是“包治百病”的“萬能藥”。此外,有許多交通業(yè)務(wù)部門由于交通問題解決的迫切性,對(duì)大數(shù)據(jù)技術(shù)期望太高,認(rèn)為大數(shù)據(jù)技術(shù)能夠解決目前急需解決的問題,投入大量的資金、物力和人力,卻導(dǎo)致了“一窩蜂”的浪費(fèi)。
大數(shù)據(jù)平臺(tái)需要高投入,高投入?yún)s很難帶來高效益,這才是目前大數(shù)據(jù)給交通行業(yè)帶來的不能承受之重。
一方面,過去幾年隨著大數(shù)據(jù)概念的興起,大數(shù)據(jù)技術(shù)不斷發(fā)展,IT公司紛紛轉(zhuǎn)型成為大數(shù)據(jù)公司,意圖獲得高估值。但是,大數(shù)據(jù)概念的熱炒,催生了一個(gè)又一個(gè)泡沫,原因在于概念多于實(shí)踐,忽視了技術(shù)發(fā)展過程中的問題,如國內(nèi)數(shù)據(jù)開放程度低,沒有充足的“大”數(shù)據(jù);數(shù)據(jù)應(yīng)用概念不落地,沒有技術(shù)支撐;數(shù)據(jù)服務(wù)或者技術(shù)服務(wù)目標(biāo)不明確,只為建設(shè)而建設(shè);定制化屬性難以標(biāo)準(zhǔn)化,難以達(dá)成規(guī)模效益。
另一方面,交通管理層對(duì)“大數(shù)據(jù)技術(shù)”期望太高,無論是否具有大數(shù)據(jù)所必需的基礎(chǔ),都要建設(shè)大數(shù)據(jù)平臺(tái),好像應(yīng)用了大數(shù)據(jù)技術(shù),建立了大數(shù)據(jù)平臺(tái),便擁有當(dāng)今最先進(jìn)的技術(shù),擁有了今后所有業(yè)務(wù)系統(tǒng)的基礎(chǔ),并可以解決所有交通問題。
大數(shù)據(jù)不是萬能的,不可能成為解決關(guān)鍵交通問題的靈丹妙藥。
大數(shù)據(jù)應(yīng)用的業(yè)務(wù)鏈條,包括數(shù)據(jù)源、數(shù)據(jù)技術(shù)和數(shù)據(jù)應(yīng)用。國外大數(shù)據(jù)公司可以專注于業(yè)務(wù)鏈條中的單一環(huán)節(jié),將一個(gè)環(huán)節(jié)做好,便可成長為10億美元以上的獨(dú)角獸公司。我國的大數(shù)據(jù)公司僅做好其中一個(gè)環(huán)節(jié),業(yè)務(wù)開展都非常困難,發(fā)展很容易遇到瓶頸。大數(shù)據(jù)需要數(shù)據(jù)互聯(lián),僅僅一個(gè)公司掌握數(shù)據(jù),另一個(gè)公司掌握技術(shù),則大數(shù)據(jù)依然發(fā)展不起來。大數(shù)據(jù)之大不可能一家獨(dú)大。正如維克多·舍恩伯格所著的《大數(shù)據(jù)時(shí)代》所言,大數(shù)據(jù)分析非隨機(jī)樣本,而是全體數(shù)據(jù);非精確性,而是混雜性;非因果關(guān)系,而是相關(guān)關(guān)系。因此,只追求數(shù)據(jù)的量不是大數(shù)據(jù)。
比如,車輛的動(dòng)態(tài)定位數(shù)據(jù)數(shù)量以每秒十幾萬、幾十萬條記,但是若僅用于統(tǒng)計(jì)在線率、查找軌跡就并不是大數(shù)據(jù)應(yīng)用,但要看其時(shí)空分布特征,以分析背后原因,僅僅GPS位置數(shù)據(jù)還遠(yuǎn)遠(yuǎn)不夠。
大量數(shù)字化不是大數(shù)據(jù)。交通管理部門存在大量的文本化紙制文件,又進(jìn)行了大量的數(shù)字化處理,如掃描、錄入等,這些數(shù)據(jù)并沒有太多的歷史價(jià)值和全局性、連續(xù)性特征,只是片面的、臨時(shí)性的數(shù)據(jù)積累,因此,不適用于大數(shù)據(jù)處理。數(shù)據(jù)大集合不是大數(shù)據(jù),所有實(shí)際上并不存在任何內(nèi)在關(guān)聯(lián)的數(shù)據(jù),無論其量如何之大都不適用于大數(shù)據(jù)技術(shù),大數(shù)據(jù)技術(shù)是尋找數(shù)據(jù)之間的關(guān)系,并分析其規(guī)律。
傳統(tǒng)統(tǒng)計(jì)分析不是大數(shù)據(jù)。正如上述所描述,很多交通部門依然延用傳統(tǒng)思維中的統(tǒng)計(jì)分析方法,談不上大數(shù)據(jù)分析與大數(shù)據(jù)計(jì)算模型。因此,傳統(tǒng)意義上的主題分析不是大數(shù)據(jù)。
大數(shù)據(jù)只是解決特定問題的特定技術(shù),需要體現(xiàn)大數(shù)據(jù)背后的現(xiàn)象、實(shí)際,更需要說明原因。在(移動(dòng))互聯(lián)網(wǎng)的背景下,分析深度關(guān)聯(lián)、多層原因變得更為重要,這就面臨一個(gè)大數(shù)據(jù)分析難題:如何提升數(shù)據(jù)分析能力,即如何將數(shù)據(jù)與人的心理、行為聯(lián)系起來。不是簡單的聯(lián)系,而是預(yù)測這些關(guān)聯(lián)性。大數(shù)據(jù)從龐大繁雜的交通運(yùn)行數(shù)據(jù)中,尋找到人們所需要的交通問題之邏輯關(guān)系,然后“理解”人們更深層的需求,如交通問題原因探究,這才是大數(shù)據(jù)技術(shù)真正的價(jià)值體現(xiàn)。
大數(shù)據(jù)在帶來機(jī)遇的同時(shí),也面臨很多問題: 需要在明確數(shù)據(jù)的屬性、價(jià)值及本質(zhì)的基礎(chǔ)上才能進(jìn)一步挖掘其價(jià)值;大數(shù)據(jù)在應(yīng)用過程中會(huì)涉及信息安全及隱私保護(hù)問題;整合信息資源需要強(qiáng)大的技術(shù)支撐;目前在專業(yè)人才上還存在缺口。
目前,大多數(shù)大數(shù)據(jù)平臺(tái)分析系統(tǒng),仍然局限于“條件分析”,遠(yuǎn)沒有實(shí)現(xiàn)“智能探究”。人為設(shè)置的主題和分析方向,大多數(shù)情況下是已經(jīng)知道原因,只是為了得到數(shù)字的驗(yàn)證。交通管理部門僅使用了大數(shù)據(jù)的存儲(chǔ)和計(jì)算技術(shù),但卻大大忽略了大數(shù)據(jù)的分析能力,而這正是需要真正投入研究的。目前,可行的方法還是借助“半人工”方式,通過大數(shù)據(jù)自主分析,人工發(fā)現(xiàn)需要探究的目標(biāo),然后再一次挖掘大數(shù)據(jù),循環(huán)往復(fù)。
當(dāng)然,大數(shù)據(jù)技術(shù)正在飛速發(fā)展,人工智能的深入研究與介入,對(duì)于大數(shù)據(jù)中語義的分析、自然語言的理解、數(shù)據(jù)關(guān)聯(lián)性的主動(dòng)性關(guān)聯(lián)等技能不斷發(fā)展,能夠逐步實(shí)現(xiàn)行業(yè)期待的大數(shù)據(jù)真正的應(yīng)用價(jià)值——自主發(fā)現(xiàn)、自主探究。
交通大數(shù)據(jù)要取得真正實(shí)用的價(jià)值,沒有任何捷徑,必須理性地看待這一技術(shù)和“工具”的使用,并認(rèn)清交通大數(shù)據(jù)應(yīng)用仍然是初級(jí)階段。交通大數(shù)據(jù)應(yīng)用,先從最易入手的分析開始;大數(shù)據(jù)分析,又要先從數(shù)據(jù)互聯(lián)開始。先實(shí)現(xiàn)信息傳遞,才能實(shí)現(xiàn)價(jià)值轉(zhuǎn)移。
交通大數(shù)據(jù)重中之重是需要數(shù)據(jù),有能夠互聯(lián)的數(shù)據(jù)。智能交通管理系統(tǒng)的發(fā)展水平與數(shù)據(jù)的公開化程度息息相關(guān)。但是,我國交通管理的“條塊分割”嚴(yán)重,政府業(yè)務(wù)系統(tǒng)一般被承建企業(yè)把控,系統(tǒng)中的數(shù)據(jù)對(duì)接與數(shù)據(jù)互聯(lián)、信息互通,是目前交通大數(shù)據(jù)的最大障礙,是交通管理和參與企業(yè)應(yīng)該調(diào)度重視的問題。信息公開能帶來諸多便利之處,對(duì)于政府來說,信息公開有利于樹立起良好形象;對(duì)于企業(yè)來說,信息公開能增加其收益;對(duì)于民眾來說,信息公開能保障決策參與權(quán)。要提高交通數(shù)據(jù)的利用率,需要提高信息的公開化程度,信息管理方式的開放性較低,無法挖掘信息的價(jià)值,更無從談大數(shù)據(jù)價(jià)值。
大數(shù)據(jù)公司要為交通管理部門提供優(yōu)質(zhì)的大數(shù)據(jù)分析及其應(yīng)用和相關(guān)服務(wù),數(shù)據(jù)源(對(duì)數(shù)據(jù)采集匯聚能力)、數(shù)據(jù)技術(shù)(對(duì)數(shù)據(jù)處理計(jì)算能力)和數(shù)據(jù)應(yīng)用(對(duì)數(shù)據(jù)內(nèi)涵和外延的發(fā)掘能力)3個(gè)環(huán)節(jié)都要有獨(dú)特競爭力,而交通行業(yè)所有部門,也必須真正基于“大數(shù)據(jù)”技術(shù)本身的能力,結(jié)合交通問題的解決意圖建設(shè)交通大數(shù)據(jù)系統(tǒng)。
人工智能、區(qū)塊鏈技術(shù)的興起,無疑會(huì)給大數(shù)據(jù)應(yīng)用的技術(shù)進(jìn)步帶來更多的發(fā)展空間,但是,這會(huì)不會(huì)又是一輪新的概念炒作?“大數(shù)據(jù)”成本之大,是大數(shù)據(jù)之殤,對(duì)企業(yè)、對(duì)政府都是不可承受之重。