楊樺
【摘 要】針對(duì)新能源汽車充電樁數(shù)據(jù)的特點(diǎn),文章提出了一種新能源汽車充電樁數(shù)據(jù)分析挖掘框架,并詳細(xì)介紹了該框架涉及的關(guān)鍵技術(shù)。通過分析和挖掘新能源汽車充電樁數(shù)據(jù),為運(yùn)營商提供決策支持,為充電用戶提供智能服務(wù)。
【關(guān)鍵詞】新能源汽車;充電樁;海量數(shù)據(jù);數(shù)據(jù)分析
【中圖分類號(hào)】F426.61 【文獻(xiàn)標(biāo)識(shí)碼】A 【文章編號(hào)】1674-0688(2020)01-0040-04
0 引言
隨著新能源汽車使用人數(shù)的增長,電動(dòng)汽車充電需求迅速提升,截至2019年4月,全國充電基礎(chǔ)設(shè)施累計(jì)數(shù)量已達(dá)到95.3萬臺(tái)。然而,由于布局不合理、維護(hù)不到位、缺乏平臺(tái)管理等問題,可充電設(shè)施的利用率卻長期偏低。2015年10月9日,國家發(fā)展改革委、國家能源局、工業(yè)和信息化部、住房城鄉(xiāng)建設(shè)部共同印發(fā)了《電動(dòng)汽車充電基礎(chǔ)設(shè)施發(fā)展指南(2015—2020年)》,提出:“充電智能服務(wù)平臺(tái)建設(shè)要與充電基礎(chǔ)設(shè)施建設(shè)同步考慮,融合互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、智能交通、大數(shù)據(jù)等技術(shù),通過‘互聯(lián)網(wǎng)+充電基礎(chǔ)設(shè)施,積極推進(jìn)電動(dòng)汽車與智能電網(wǎng)間的能量和信息互動(dòng),提升充電服務(wù)的智能化水平。鼓勵(lì)圍繞用戶需求,為用戶提供充電導(dǎo)航、狀態(tài)查詢、充電預(yù)約、費(fèi)用結(jié)算等服務(wù),拓展增值業(yè)務(wù),提升用戶體驗(yàn)和運(yùn)營效率。”[1]實(shí)現(xiàn)上述目標(biāo)的重點(diǎn)就是對(duì)充電樁數(shù)據(jù)進(jìn)行分析挖掘。
1 新能源汽車充電樁數(shù)據(jù)描述
我們需要收集的新能源汽車充電樁數(shù)據(jù)主要有兩類:第一類是運(yùn)營管理系統(tǒng)與充電設(shè)備之間的通信數(shù)據(jù),這類數(shù)據(jù)可以在上級(jí)監(jiān)控管理系統(tǒng)中獲取。由于信息通信對(duì)新能源汽車充電運(yùn)營的重要性,因此國家能源局、國家電網(wǎng)公司、中國南方電網(wǎng)有限責(zé)任公司發(fā)布了系統(tǒng)與離散充電樁通信規(guī)約,在這些規(guī)約的要求下,現(xiàn)行建設(shè)的充電樁大多具備與上級(jí)監(jiān)控管理系統(tǒng)進(jìn)行通信的功能,運(yùn)營管理系統(tǒng)與充電設(shè)備之間通信的接口支持TCP/IP協(xié)議,數(shù)據(jù)可通過有線網(wǎng)絡(luò)或無線網(wǎng)絡(luò)進(jìn)行傳輸。第二類是用戶評(píng)價(jià)和建議數(shù)據(jù),這類數(shù)據(jù)主要來源于社交網(wǎng)絡(luò),是充電用戶對(duì)新能源汽車充電服務(wù)的各種評(píng)論及建議,需要到網(wǎng)頁中抓取。
1.1 數(shù)據(jù)內(nèi)容及類型介紹
(1)運(yùn)營管理系統(tǒng)與充電設(shè)備之間的通信數(shù)據(jù)。這類數(shù)據(jù)主要用于判斷充電樁的運(yùn)行情況及分析其利用率。根據(jù)中國南方電網(wǎng)有限責(zé)任公司發(fā)布的《電動(dòng)汽車充換電服務(wù)網(wǎng)絡(luò)運(yùn)營監(jiān)控系統(tǒng)通信規(guī)約第2部分:系統(tǒng)與充電設(shè)施》(試行),運(yùn)營管理系統(tǒng)與充電設(shè)備之間的通信數(shù)據(jù)主要包括充電過程實(shí)時(shí)監(jiān)測(cè)數(shù)據(jù)、鑒權(quán)數(shù)據(jù)、遠(yuǎn)程控制數(shù)據(jù)、交易數(shù)據(jù)等。規(guī)約中對(duì)這些數(shù)據(jù)的參數(shù)名稱、字段類型、字段長度都做了定義,不同廠家的充電樁遵從不同的通信規(guī)約,內(nèi)容會(huì)有所差異(見表1)。
(2)用戶評(píng)價(jià)和建議數(shù)據(jù)。這類數(shù)據(jù)是一種補(bǔ)充數(shù)據(jù),用于分析用戶的滿意度,主要包括各網(wǎng)頁中用戶對(duì)新能源汽車充電服務(wù)的評(píng)價(jià)和建議,例如對(duì)現(xiàn)有充電樁安裝地點(diǎn)、數(shù)量密度是否滿意,充電時(shí)長能否接受等。
1.2 數(shù)據(jù)特點(diǎn)分析
(1)數(shù)據(jù)海量增長。以北京為例,根據(jù)中商產(chǎn)業(yè)研究院的數(shù)據(jù),截至2019年3月北京市公共類充電樁數(shù)量已達(dá)50 694個(gè),這些電樁采集的實(shí)時(shí)數(shù)據(jù),日增長量早已超過TB級(jí)。
(2)結(jié)構(gòu)化數(shù)據(jù)占比大。在我們收集的新能源汽車充電樁數(shù)據(jù)中,運(yùn)營管理系統(tǒng)與充電設(shè)備之間的通信數(shù)據(jù)多為結(jié)構(gòu)化數(shù)據(jù),用戶評(píng)價(jià)和建議數(shù)據(jù)多為半結(jié)構(gòu)化數(shù)據(jù)及非結(jié)構(gòu)化數(shù)據(jù)。但從數(shù)據(jù)收集量來看,主要是以第一類數(shù)據(jù)為主,它是分析挖掘的最有價(jià)值的數(shù)據(jù),并且隨著標(biāo)準(zhǔn)體系的逐步完善,這類數(shù)據(jù)的結(jié)構(gòu)會(huì)越來越規(guī)范。
(3)價(jià)值密度低。新能源汽車充電樁數(shù)據(jù)雖然海量,但是多半都是記錄數(shù)據(jù),價(jià)值密度并不高。例如,充電過程實(shí)時(shí)監(jiān)測(cè)數(shù)據(jù)一般是正常的,異常數(shù)據(jù)非常少,但是后者才是狀態(tài)檢修的最重要依據(jù)。
(4)處理速度快。對(duì)新能源汽車充電樁數(shù)據(jù)的分析挖掘需要在極短的時(shí)間內(nèi)對(duì)大量數(shù)據(jù)進(jìn)行分析,用于決策制定。在線狀態(tài)數(shù)據(jù)的處理性能要求遠(yuǎn)高于離線數(shù)據(jù),若未得到及時(shí)到位的處理,數(shù)據(jù)信息價(jià)值就會(huì)遞減。因此,在線的流數(shù)據(jù)分析挖掘相比傳統(tǒng)數(shù)據(jù)挖掘技術(shù)有本質(zhì)的不同。
2 新能源汽車充電樁數(shù)據(jù)分析挖掘方案
2.1 需求分析
新能源汽車充電樁數(shù)據(jù)分析主要對(duì)海量數(shù)據(jù)進(jìn)行智能采集、分析、管理和高效利用,需要支持PB級(jí)的數(shù)據(jù)存儲(chǔ)和處理。通過統(tǒng)計(jì)和挖掘分析充電樁運(yùn)行數(shù)據(jù),進(jìn)行故障預(yù)警及判斷,提高設(shè)備的運(yùn)檢水平和運(yùn)作效率;通過分析用戶充電時(shí)間、分布狀況等數(shù)據(jù),合理規(guī)劃安裝充電樁,提前進(jìn)行電力資源配置;通過持續(xù)跟蹤觀察電動(dòng)汽車用戶充電特征狀況,探索電動(dòng)汽車用戶充電行為習(xí)慣,研究電動(dòng)汽車用戶充電消費(fèi)模式,為用戶的充電行為提供智能推薦,提高服務(wù)的效率和質(zhì)量。
2.2 新能源汽車充電樁數(shù)據(jù)分析挖掘框架
針對(duì)新能源汽車充電樁數(shù)據(jù)的特點(diǎn),最大限度地為新能源汽車充電樁運(yùn)營商及充電用戶提供更有用的知識(shí)、更精確的信息及更及時(shí)的響應(yīng),本文提出了一種能源汽車充電樁數(shù)據(jù)分析挖掘框架,該框架包括5層(如圖1所示)。
(1)數(shù)據(jù)源。數(shù)據(jù)來源主要有運(yùn)營監(jiān)控系統(tǒng)和互聯(lián)網(wǎng)兩個(gè)。從運(yùn)營監(jiān)控系統(tǒng)中獲取充電樁傳回的通信數(shù)據(jù),包括充電過程實(shí)時(shí)監(jiān)測(cè)數(shù)據(jù)、鑒權(quán)數(shù)據(jù)、遠(yuǎn)程控制數(shù)據(jù)、交易數(shù)據(jù)等。在互聯(lián)網(wǎng)中抓取帶有用戶評(píng)價(jià)和建議的網(wǎng)頁。
(2)數(shù)據(jù)采集及預(yù)處理層。兩種不同的數(shù)據(jù)源分別采用不同的數(shù)據(jù)采集方法。運(yùn)營監(jiān)控系統(tǒng)數(shù)據(jù)庫中數(shù)據(jù)是結(jié)構(gòu)化的,采集方法可以使用數(shù)據(jù)庫導(dǎo)入工具或特定系統(tǒng)接口。互聯(lián)網(wǎng)頁面中的數(shù)據(jù)是非結(jié)構(gòu)化和半結(jié)構(gòu)化的,可以先用網(wǎng)站公開的API或網(wǎng)絡(luò)爬蟲進(jìn)行原始網(wǎng)頁抓取,再利用網(wǎng)頁解析工具解析并提取數(shù)據(jù)。然后將簡單、獨(dú)立的數(shù)據(jù)通過解析、清洗、重構(gòu),轉(zhuǎn)換成適合數(shù)據(jù)挖掘的形式,再對(duì)數(shù)據(jù)進(jìn)行過濾、抽取和融合。經(jīng)過上述預(yù)處理后,所獲取的源數(shù)據(jù)保存在由數(shù)據(jù)存儲(chǔ)計(jì)算層提供的分布式存儲(chǔ)中,可供數(shù)據(jù)分析層直接使用。
(3)數(shù)據(jù)存儲(chǔ)計(jì)算層。數(shù)據(jù)存儲(chǔ)計(jì)算層的主要功能是將數(shù)據(jù)采集及預(yù)處理層的數(shù)據(jù)進(jìn)行高效存儲(chǔ),并提高系統(tǒng)的容錯(cuò)性。傳統(tǒng)的數(shù)據(jù)存儲(chǔ)方法和數(shù)據(jù)庫技術(shù)無法有效處理海量數(shù)據(jù),所以本層中采用分布式的存儲(chǔ)架構(gòu)解決該問題,通過分布式架構(gòu)提升數(shù)據(jù)的存儲(chǔ)能力及數(shù)據(jù)吞吐量,通過在不同分布節(jié)點(diǎn)上的備份提高系統(tǒng)的容錯(cuò)能力。
(4)數(shù)據(jù)分析層。數(shù)據(jù)分析分為兩類,分別是統(tǒng)計(jì)分析和數(shù)據(jù)挖掘。統(tǒng)計(jì)分析部分主要是對(duì)充電集中時(shí)間、充電電量增量情況和故障出現(xiàn)情況等信息的統(tǒng)計(jì)。數(shù)據(jù)挖掘部分包括基于用戶畫像的行為分析、趨勢(shì)分析、客戶分析等。針對(duì)用戶畫像的行為分析包括用戶充電統(tǒng)計(jì)、用戶偏好計(jì)算、用戶偏好調(diào)整。用戶充電統(tǒng)計(jì)算包括充電時(shí)長統(tǒng)計(jì)、充電時(shí)間段統(tǒng)計(jì)、充電地點(diǎn)統(tǒng)計(jì);用戶偏好計(jì)算包括充電時(shí)長偏好計(jì)算、充電時(shí)間段偏好計(jì)算、充電地點(diǎn)偏好計(jì)算。數(shù)據(jù)挖掘分析可以根據(jù)需要進(jìn)行擴(kuò)展。
(5)數(shù)據(jù)應(yīng)用層。數(shù)據(jù)應(yīng)用層的主要功能是將數(shù)據(jù)分析層的分析結(jié)果為充電樁運(yùn)營商及充電用戶服務(wù)。運(yùn)營商服務(wù)方面包括數(shù)據(jù)分析結(jié)果的圖表展現(xiàn),基于業(yè)故障分析的解決方案和預(yù)防措施,基于用戶行為分析的精準(zhǔn)營銷和后續(xù)充電設(shè)施建設(shè)等。充電用戶服務(wù)方面包括基于充電樁位置及狀態(tài)信息的充電導(dǎo)航及充狀態(tài)查詢和充電預(yù)約,基于用戶行為分析的智能推薦。
3 新能源汽車充電樁數(shù)據(jù)分析挖掘關(guān)鍵技術(shù)
3.1 新能源汽車充電樁數(shù)據(jù)存儲(chǔ)計(jì)算技術(shù)
新能源汽車充電樁數(shù)據(jù)存儲(chǔ)計(jì)算技術(shù)主要包括由Hadoop的MapReduce分布式并行計(jì)算框架和HDFS分布式文件系統(tǒng),以及存儲(chǔ)結(jié)構(gòu)化數(shù)據(jù)和基礎(chǔ)結(jié)果數(shù)據(jù)的分布式數(shù)據(jù)庫。利用HDFS超大的存儲(chǔ)空間解決海量數(shù)據(jù)的存儲(chǔ)問題(如圖2所示),利用MapReduce分布式并行計(jì)算框架進(jìn)行高速、可靠的數(shù)據(jù)分析處理(如圖3所示)。
3.2 新能源汽車充電樁數(shù)據(jù)挖掘技術(shù)
海量數(shù)據(jù)的挖掘常用的方法有分類、聚類、回歸分析、關(guān)聯(lián)規(guī)則、偏差分析等,它們分別從不同的角度對(duì)數(shù)據(jù)進(jìn)行挖掘[4]。
(1)分類與聚類。分類與聚類都是按照相似性和差異性,把一組對(duì)象劃分成若干類。在新能源汽車充電樁海量數(shù)據(jù)分析中我們可以運(yùn)用這兩種分析方法進(jìn)行充電用戶的分類、屬性和特征分析、滿意度分析、充電行為趨勢(shì)預(yù)測(cè)等工作。分類方法有許多種,其中較為成熟的有決策樹、貝葉斯、支持向量機(jī)、人工神經(jīng)網(wǎng)絡(luò)等。傳統(tǒng)的分區(qū)聚類、層次聚類、基于密度的聚類、基于模型的聚類和基于網(wǎng)格的聚類算法應(yīng)用到大數(shù)據(jù)的聚類中需要進(jìn)行抽樣或降維,而損失了聚類的精確性;并行聚類雖然對(duì)于大數(shù)據(jù)的聚類具有效率高、可擴(kuò)展性好的優(yōu)點(diǎn),但是算法實(shí)現(xiàn)非常難;基于MapReduce能夠?qū)崿F(xiàn)高可擴(kuò)展的面向大數(shù)據(jù)的聚類算法,但對(duì)軟硬件資源要求高[5]。
(2)回歸分析?;貧w分析是大數(shù)據(jù)分析中的一種預(yù)測(cè)性的建模技術(shù),它研究的是自變量和因變量之間的數(shù)量變化關(guān)系,該技術(shù)一般用于預(yù)測(cè)分析,常用的有線性回歸、邏輯回歸、多項(xiàng)式回歸、逐步回歸、嶺回歸、套索回歸和ElasticNet回歸。其中,邏輯回歸在數(shù)據(jù)化運(yùn)營中有更主流、更頻繁的應(yīng)用,該分析技術(shù)可以很好地回答諸如預(yù)測(cè)、分類等數(shù)據(jù)化運(yùn)營常見的分析項(xiàng)目主題。在新能源汽車充電樁數(shù)據(jù)挖掘中,可應(yīng)用該技術(shù)預(yù)測(cè)用戶接受新服務(wù)的可能性。例如,通過降價(jià)等手段能否讓用戶在指定地點(diǎn)或時(shí)間進(jìn)行充電。
(3)關(guān)聯(lián)規(guī)則分析。關(guān)聯(lián)規(guī)則分析在數(shù)據(jù)挖掘領(lǐng)域主要用于發(fā)現(xiàn)隱藏在大型數(shù)據(jù)集中有意義的聯(lián)系。關(guān)聯(lián)規(guī)則最初用于購物籃分析,通過分析顧客購物籃中商品之間的關(guān)聯(lián),掌握顧客的購物習(xí)慣,幫助零售商開發(fā)更好的營銷策略?,F(xiàn)在,該技術(shù)因?yàn)槟軌虺晒︻A(yù)測(cè)銀行客戶需求,而在西方金融業(yè)中得到廣泛應(yīng)用。在新能源汽車充電樁數(shù)據(jù)挖掘中,可以運(yùn)用該技術(shù)進(jìn)行用戶需求預(yù)測(cè),利用預(yù)測(cè)信息,幫助充電樁運(yùn)營商改善自身營銷。Apriori算法是著名的關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘算法,其最大的缺陷是多次掃描事務(wù)數(shù)據(jù)。因此,在新能源汽車充電樁海量數(shù)據(jù)挖掘中,我們可以使用FP-樹頻集算法,該算法比Apriori算法效率高且能較好地適應(yīng)不同長度的規(guī)則。
(4)偏差分析。偏差分析的目的是發(fā)現(xiàn)與大部分其他對(duì)象不同的對(duì)象。例如,分類中的反常實(shí)例、模式的例外、觀察結(jié)果對(duì)期望的偏差等。偏差分析可采用的方法有橫道圖法、表格法及曲線法。在新能源汽車充電樁數(shù)據(jù)挖掘中,它可以應(yīng)用到充電樁設(shè)備異常信息的發(fā)現(xiàn)、分析、識(shí)別及預(yù)警等方面。
4 結(jié)語
文章提出了一種能源汽車充電樁數(shù)據(jù)分析挖掘框架,詳細(xì)描述了該框架各層的作用及數(shù)據(jù)挖掘技術(shù)。通過對(duì)新能源汽車充電樁海量數(shù)據(jù)進(jìn)行分析挖掘,找出充電用戶的行為特征和充電喜好,為運(yùn)營商及用戶雙方提供更大價(jià)值的信息。隨著信息壁壘的打破,該數(shù)據(jù)分析挖掘框架也可用于車、樁、網(wǎng)數(shù)據(jù)融合后充電、用電、駕駛等大數(shù)據(jù)分析,結(jié)合用戶交通指數(shù)為充電站建設(shè)提供數(shù)據(jù)支持,進(jìn)一步提高充電樁利用率,幫助運(yùn)營商調(diào)整運(yùn)營策略。
參 考 文 獻(xiàn)
[1]國家發(fā)展改革委.電動(dòng)汽車充電基礎(chǔ)設(shè)施發(fā)展指南(2015—2020年)[Z].2015.
[2]中國南方電網(wǎng)有限責(zé)任公司.電動(dòng)汽車充換電服務(wù)網(wǎng)絡(luò)運(yùn)營監(jiān)控系統(tǒng)通信規(guī)約第2部分:系統(tǒng)與充電設(shè)施(試行)[Z].2016
[3]管天云,侯春華.大數(shù)據(jù)技術(shù)在智能管道海量數(shù)據(jù)分析與挖掘中的應(yīng)用[J].現(xiàn)代電信科技,2014(2).
[4]李蓉蓉.基于Hadoop的電商平臺(tái)大數(shù)據(jù)挖掘研究[J].南方農(nóng)機(jī),2017(22).
[5]海沫.大數(shù)據(jù)聚類算法綜述[J].計(jì)算機(jī)科學(xué),2016(S1).
[6]張文,王東,鄭靜楠,等.電動(dòng)汽車領(lǐng)域的大數(shù)據(jù)研究與應(yīng)用[J].大眾用電,2016(12).
[7]潘鳴宇,張祿,孫舟,等.電動(dòng)汽車領(lǐng)域的大數(shù)據(jù)處理與分析[J].電氣應(yīng)用,2016(5).
[8]邢偉寅,鐘樂海,羅金生.基于互聯(lián)網(wǎng)+新能源汽車充電導(dǎo)航系統(tǒng)設(shè)計(jì)[J].價(jià)值工程,2017(12).