李川鵬 王秀旭 王耀福
摘 要:本文基于共享出行模式,首先提出了一套出行數(shù)據(jù)采集、通信、存儲(chǔ)、分析的方法論;其次通過具體實(shí)踐,構(gòu)建了較為完善的全景出行大數(shù)據(jù)體系;最后從智能研發(fā)、智能應(yīng)用、智慧交通三個(gè)方面重點(diǎn)闡釋了出行大數(shù)據(jù)的具體應(yīng)用。
關(guān)鍵詞:共享模式 大數(shù)據(jù) 智慧交通
Research on the Construction and Application of Big Data System for Travel Based on Sharing Mode
Li Chuanpeng Wang Xiuxu Wang Yaofu
Abstract:Based on the shared travel model, this article first proposes a set of methodology for travel data collection, communication, storage, and analysis; secondly, through specific practices, the article builds a relatively complete panoramic travel big data system; finally, from the three aspects of transportation: intelligent R&D, intelligent application, and wisdom, the article focuses on the specific application of travel big data.
Key words:Keywords: Sharing Mode, Big Data, intelligent transportation
1 引言
在未來城市出行供給不能依賴汽車保有量的粗放增長,出租車和公共交通的運(yùn)力提升亦遭遇瓶頸以及城市道路資源緊缺的情況下,汽車共享出行成為一種短期有效的解決方案[1]。同時(shí)伴隨著新一輪的科技革命和產(chǎn)業(yè)變革,數(shù)字經(jīng)濟(jì)和共享經(jīng)濟(jì)在逐步取代傳統(tǒng)的商業(yè)模式[2],進(jìn)一步使得汽車產(chǎn)業(yè)、出行服務(wù)乃至交通運(yùn)輸系統(tǒng)的形態(tài)及價(jià)值鏈發(fā)生了顛覆性改變,催化共享出行模式發(fā)生著深刻的變化[3]。針對(duì)這一現(xiàn)實(shí)情境,共享出行作為人、車和服務(wù)的鏈接,有助于推進(jìn)汽車行業(yè)全產(chǎn)業(yè)鏈的生態(tài)布局。而整個(gè)汽車全產(chǎn)業(yè)鏈匯集著海量數(shù)據(jù),基于共享模式如何捕捉汽車產(chǎn)業(yè)上下游價(jià)值鏈動(dòng)態(tài)并開發(fā)潛力,有效變現(xiàn)數(shù)據(jù)成為重中之重[4]。鑒于此,本文基于共享出行模式,首先提出了一套出行數(shù)據(jù)采集、通信、存儲(chǔ)、分析的方法論;其次通過具體實(shí)踐,構(gòu)建了較為完善的全景出行大數(shù)據(jù)體系;最后結(jié)合汽車專業(yè)細(xì)分領(lǐng)域的研究,對(duì)運(yùn)營大數(shù)據(jù)進(jìn)行即時(shí)分析,從智能研發(fā)、智能應(yīng)用、智慧交通三個(gè)方面重點(diǎn)闡釋出行大數(shù)據(jù)的具體應(yīng)用。
2 出行大數(shù)據(jù)體系的構(gòu)建
隨著共享出行車輛持續(xù)運(yùn)營,采集到實(shí)際情況下的運(yùn)營數(shù)據(jù)已達(dá)TB級(jí),目前已形成一整套較為完備的數(shù)據(jù)采集方案,但本文旨在數(shù)據(jù)采集標(biāo)準(zhǔn)化和數(shù)據(jù)采集、傳輸、存儲(chǔ)和處理的體系化方面實(shí)現(xiàn)重點(diǎn)突破。因此,本文構(gòu)建了出行大數(shù)據(jù)采集、傳輸、存儲(chǔ)、處理的全生命周期的數(shù)據(jù)體系。
2.1 數(shù)據(jù)的采集
在數(shù)據(jù)采集標(biāo)準(zhǔn)化方面,首先確認(rèn)數(shù)據(jù)采集的范圍,確認(rèn)采集人、車、環(huán)境三大類構(gòu)建運(yùn)營數(shù)據(jù)體系,采集頻率方面將數(shù)據(jù)分為周期性采集、觸發(fā)性采集兩類,其中為保證數(shù)據(jù)分析價(jià)值,單數(shù)據(jù)周期性采集最快頻率為100Hz,硬件到數(shù)采的接口以及數(shù)據(jù)處理的平臺(tái)標(biāo)準(zhǔn)。具體如表1所示。
數(shù)據(jù)采集通過T-BOX、V-BOX、記錄儀、傳感器和攝像頭等多種方式融合的方法來實(shí)現(xiàn)。通過T-BOX、車身CAN總線、GPS/BM、加速度傳感器等來采集車的數(shù)據(jù)和人的部分?jǐn)?shù)據(jù)(如駕駛行為等數(shù)據(jù)),通過CAN 解碼數(shù)據(jù)處理與主控MCU融合,實(shí)現(xiàn)數(shù)據(jù)精準(zhǔn)讀取、支持實(shí)時(shí)數(shù)據(jù)獲取;通過攝像頭、記錄儀和V-BOX實(shí)現(xiàn)人的部分?jǐn)?shù)據(jù)和環(huán)境數(shù)據(jù)的采集。
2.2 數(shù)據(jù)的傳輸
在數(shù)據(jù)傳輸方面,通過在T-BOX硬件中內(nèi)置的8G內(nèi)存卡和高靈敏度蜂窩網(wǎng)絡(luò)天線,將車的數(shù)據(jù)和人的部分?jǐn)?shù)據(jù)以時(shí)間戳的形式打包實(shí)現(xiàn)異步傳輸,最終通過4G網(wǎng)絡(luò)以FTP文件形式傳輸?shù)椒?wù)器后進(jìn)行解析;而人的數(shù)據(jù)和環(huán)境的數(shù)據(jù)基于V-BOX通過4G網(wǎng)絡(luò)傳輸?shù)椒?wù)器,同時(shí)選擇高規(guī)格的服務(wù)器來保證每條遷移同步鏈路都能擁有良好的傳輸性。
2.3 數(shù)據(jù)的存儲(chǔ)
在數(shù)據(jù)存儲(chǔ)方面,對(duì)不同類型的數(shù)據(jù)建立相應(yīng)的數(shù)據(jù)庫進(jìn)行存儲(chǔ)。首先對(duì)于人的數(shù)據(jù)、車的數(shù)據(jù)和環(huán)境的數(shù)據(jù)中屬于結(jié)構(gòu)化類型的數(shù)據(jù),通過建立關(guān)系型數(shù)據(jù)庫來完成存儲(chǔ);對(duì)于如道路狀況等屬于非結(jié)構(gòu)化類型的數(shù)據(jù),通過非結(jié)構(gòu)化WEB數(shù)據(jù)庫進(jìn)行存儲(chǔ)。
2.4 數(shù)據(jù)的處理
在數(shù)據(jù)處理方面,不同類型需求采取的處理方式不同。通常,實(shí)時(shí)性需求用EMC的GreenPlum、Oracle的Exadata,以及基于MySQL的列式存儲(chǔ)Infobright進(jìn)行處理;一些批處理,或者基于半結(jié)構(gòu)化數(shù)據(jù)的需求使用Hadoop進(jìn)行處理。在此基礎(chǔ)上,可以利用機(jī)器學(xué)習(xí)中的聚類算法建立標(biāo)簽體系,利用SVM、NaiveBayes等算法建立模型體系。
2.5 數(shù)據(jù)可視化
綜上,本文構(gòu)建了出行大數(shù)據(jù)采集、傳輸、存儲(chǔ)、處理全生命周期的數(shù)據(jù)體系。但是該體系本身既龐大又復(fù)雜,為了后續(xù)標(biāo)簽體系建立和模型體系的建立,我們需要將借助圖形化的手段將出行大數(shù)據(jù)進(jìn)行可視化處理。
3 出行大數(shù)據(jù)的應(yīng)用探索
每一臺(tái)車不僅僅是出行的工具,而且是互聯(lián)網(wǎng)、數(shù)字化屬性的載體,面對(duì)海量數(shù)據(jù)如何提取出重要信息并進(jìn)行分析,以及如何變現(xiàn)成為關(guān)鍵的問題。因此,本文需要通過TBOX、VBOX、GPS、RFID、傳感器和攝像頭圖像處理器等裝置設(shè)備采集人的數(shù)據(jù)、車的數(shù)據(jù)和環(huán)境的數(shù)據(jù),構(gòu)建以駕駛行為、生理特征等多維度的數(shù)據(jù)集?;诓杉臄?shù)據(jù),結(jié)合汽車產(chǎn)業(yè)鏈細(xì)分領(lǐng)域的研究,對(duì)運(yùn)營大數(shù)據(jù)進(jìn)行即時(shí)分析。通過算法優(yōu)化,實(shí)現(xiàn)對(duì)各類數(shù)據(jù)信息的讀取和控制,構(gòu)建各類數(shù)據(jù)應(yīng)用模型,深度挖掘數(shù)據(jù)價(jià)值。本文擬與主機(jī)廠一起探索一個(gè)全景數(shù)據(jù)運(yùn)營的鏈條。首先,從底層為主機(jī)廠做基礎(chǔ)的數(shù)據(jù)咨詢規(guī)劃,并搭建專屬的數(shù)據(jù)平臺(tái);其次,基于采集數(shù)據(jù)建立針對(duì)車和用戶的標(biāo)簽體系和模型體系,從而為用戶提供精準(zhǔn)的個(gè)性化的服務(wù);最后,基于標(biāo)簽體系和應(yīng)用需求,進(jìn)一步把模型和相關(guān)應(yīng)用場景、產(chǎn)品形態(tài)相結(jié)合,建立反映硬件損耗關(guān)聯(lián)度、甚至反映預(yù)測用戶價(jià)值需求的模型體系,進(jìn)行產(chǎn)品和服務(wù)的專屬設(shè)計(jì),并形成一種商業(yè)化的運(yùn)營模式。
在具體的數(shù)據(jù)應(yīng)用環(huán)節(jié),本文擬從智能研發(fā)、智能應(yīng)用、智能交通三個(gè)方面構(gòu)建大數(shù)據(jù)應(yīng)用體系。
3.1 智能研發(fā)
在智能研發(fā)方面,通過對(duì)TBOX、GPS、RFID、傳感器、攝像頭圖像處理器等裝置設(shè)備采集到的車況監(jiān)測信息和環(huán)境信息進(jìn)行整合處理,首先全面準(zhǔn)確地分析出研發(fā)階段的零部件、整車性能評(píng)估、試驗(yàn)車的DTC問題預(yù)警、管理優(yōu)化、生產(chǎn)線等問題;其次通過GPS、VBOX、攝像頭和傳感器等處理裝置采集到的人的信息和環(huán)境的信息,分析出在不同環(huán)境下消費(fèi)者比較中意的車型、最為關(guān)注的產(chǎn)品性能等其他方面的偏好,針對(duì)消費(fèi)者的產(chǎn)品需求偏好來對(duì)產(chǎn)品進(jìn)行改進(jìn)創(chuàng)新,設(shè)計(jì)生產(chǎn)出大眾消費(fèi)者心中理想的汽車款型,并根據(jù)售后的消費(fèi)反饋數(shù)據(jù),持續(xù)地改進(jìn)調(diào)整產(chǎn)品。
3.2 智能應(yīng)用
圍繞汽車產(chǎn)業(yè)鏈,以數(shù)據(jù)為基礎(chǔ),用人工智能做出明智的判斷與決定,形成汽車的“數(shù)智大腦”。同時(shí)基于數(shù)據(jù),探索四大數(shù)據(jù)智能應(yīng)用方向:智+服務(wù)、智+營銷、智+保險(xiǎn)和智+調(diào)度。本文具體從智+營銷和智+保險(xiǎn)談智能應(yīng)用方向。
智+營銷主要是基于用戶行為構(gòu)建用戶畫像,提供精準(zhǔn)的個(gè)性化服務(wù)?;诔鲂写髷?shù)據(jù)體系,用機(jī)器學(xué)習(xí)中的K-means算法建立用戶畫像,準(zhǔn)確把握用戶的區(qū)域分布、性別分布、年齡分布、興趣愛好、消費(fèi)偏好等重要信息,從而進(jìn)行精準(zhǔn)的線上產(chǎn)品信息推送和廣告投放;而智+保險(xiǎn)主要實(shí)現(xiàn)UBI保險(xiǎn)創(chuàng)新及共享出行保險(xiǎn)機(jī)制創(chuàng)新。基于出行大數(shù)據(jù)體系,到的車的數(shù)據(jù)、人的數(shù)據(jù)和環(huán)境的數(shù)據(jù),建立UBI定價(jià)模型對(duì)人、車和環(huán)境的各個(gè)維度數(shù)據(jù)進(jìn)行精細(xì)化的分析,從而制定出服務(wù)不同用戶的差異化的車險(xiǎn)定價(jià),以滿足不同用戶不同場景下的需求。
3.3 智慧交通
基于大數(shù)據(jù)的智慧交通存在多種可能,交通的智能化是根本的趨勢,利用大數(shù)據(jù)技術(shù)和智能分析技術(shù),整合城市管理的其他數(shù)據(jù),將真正推動(dòng)智慧交通建設(shè),為交通管理奠定良好的基礎(chǔ)?;诠蚕砟J浇⒌某鲂写髷?shù)據(jù)體系,在獲得人的數(shù)據(jù)、車的數(shù)據(jù)和環(huán)境的數(shù)據(jù)的情況下,一方面,交通部門實(shí)時(shí)掌握了道路上共享汽車流量、客流量信息以及各種道路環(huán)境信息,從而科學(xué)合理的制定出疏散和管制措施預(yù)案,提前預(yù)警和疏導(dǎo)交通;另一方面,用戶通過其車載終端或數(shù)據(jù)采集系統(tǒng)提供的實(shí)時(shí)數(shù)據(jù),幾乎掌握全部主要道路的交通路況,進(jìn)而科學(xué)合理的制定自己的行車路線。同時(shí)基于出行大數(shù)據(jù)體系,結(jié)合天津南站項(xiàng)目的具體實(shí)踐,將出行大數(shù)據(jù)與南站數(shù)據(jù)平臺(tái)有機(jī)銜接,數(shù)據(jù)進(jìn)行實(shí)時(shí)共享,構(gòu)建暢達(dá)、高效、安全、綠色的南站交通服務(wù)系統(tǒng),提供客運(yùn)交通網(wǎng)絡(luò)實(shí)時(shí)狀態(tài)感知、汽車車輛運(yùn)行智能監(jiān)控與調(diào)度、多模式運(yùn)營服務(wù)協(xié)調(diào)、全出行鏈客運(yùn)信息服務(wù)等。
參考文獻(xiàn):
[1]羅蘭貝格.2018年中國汽車共享出行市場分析預(yù)測報(bào)告[R].德國:羅蘭貝格,2018.
[2]謝雅玲.新常態(tài)下的共享經(jīng)濟(jì)效應(yīng)[J].現(xiàn)代經(jīng)濟(jì)信息,2017(15):32.