許 笑, 高 翔, 李光熹, 徐緯河
(國網(wǎng)連云港供電公司, 江蘇 連云港 222200)
與傳統(tǒng)燃料汽車相比,電動汽車環(huán)保且無噪聲,發(fā)展電動汽車有助于緩解能源短缺和環(huán)境污染,電動汽車充電樁是電動汽車發(fā)展的前提。充電樁運行時產(chǎn)生海量數(shù)據(jù),這些數(shù)據(jù)類型、屬性等多樣化,給后續(xù)對數(shù)據(jù)的統(tǒng)計及分析帶來困難。同時,電動汽車充電過程存在安全性問題,會給用戶帶來財產(chǎn)威脅和充電安全威脅等影響[1]。電動汽車充電過程中影響安全性的因素包括動力電池、充電設施、供電設備等方面[2],其中充電設施故障率較高是制約電動汽車發(fā)展的主要因素[3]。充電設施一般放置于室外,環(huán)境等不可控因素都會影響充電設施的安全運行[4]。因此,采用數(shù)據(jù)挖掘技術分析充電設施運行安全故障特性成為電動汽車的發(fā)展趨勢是非常重要的。
目前,結(jié)合數(shù)據(jù)挖掘技術的充電設施故障特性研究已成為國內(nèi)外學者研究重點。文獻[5-7]對當前數(shù)據(jù)挖掘技術及大數(shù)據(jù)技術進行總結(jié)分析,研究如何應用到電網(wǎng)中。文獻[8]基于數(shù)據(jù)挖掘的方法,提取電池SOC狀態(tài)的重要影響參數(shù),結(jié)合GA-BP神經(jīng)網(wǎng)絡對電池SOC的狀態(tài)進行評估。文獻[9]基于大數(shù)據(jù)技術,挖掘臺區(qū)異動信息,建立判別體系,實現(xiàn)對臺區(qū)異常狀態(tài)進行預警分析。文獻[10]針對充電設施的安全隱患及故障類型,通過數(shù)據(jù)采集技術和數(shù)據(jù)挖掘方法,建立數(shù)據(jù)挖掘模型,并將其輸出作為預測故障的基礎。文獻[11]通過分析電池管理系統(tǒng)(Battery Managment System,BMS)的保護需求以及充電樁對BMS的響應率,結(jié)合層次分析法,建立電動汽車一體化的BMS響應率指標體系。文獻[12]基于隨機森林模型的數(shù)據(jù)處理方法,對充電樁數(shù)據(jù)源進行數(shù)據(jù)挖掘,結(jié)合機器學習算法,建立故障預測模型,預測即將發(fā)生的故障。文獻[13]基于隨機森林算法,訓練出故障診斷器模型,用于診斷直流充電樁的開關模塊,該方案具有現(xiàn)實意義。
基于上述背景,本文首先基于直流充電樁的工作原理及充電安全影響因素進行分析,其次研究數(shù)據(jù)挖掘處理方法,詳細介紹數(shù)據(jù)挖掘的數(shù)據(jù)提取、數(shù)據(jù)預處理、數(shù)據(jù)特征挖掘3個步驟,進而分析安全故障數(shù)據(jù)特征,建立充電設施一體化故障樹,通過提取規(guī)則,分析各層故障源和具體故障類型之間的內(nèi)在關系。最后,基于數(shù)據(jù)挖掘技術對2021年3月~4月江蘇省各充電站充電設施的運行數(shù)據(jù)如電壓、電流、溫度等進行特征挖掘,結(jié)合充電設施一體化故障樹,對主要故障類型及次數(shù)進行統(tǒng)計,驗證了該數(shù)據(jù)挖掘方法對充電設施安全故障特性分析的實用性。
普通直流充電設備系統(tǒng)結(jié)構(gòu)主要由充電設備控制器、人機界面、IC卡讀卡器、電源轉(zhuǎn)換模塊、計量計費模塊、急停按鈕組成。充電站電氣系統(tǒng)的三相交流電經(jīng)過整流濾波后,進入驅(qū)動電路控制的高頻DC/DC功率變換器,進行電壓調(diào)節(jié),然后由功率變換器中的高頻變壓器進行電氣隔離,再通過濾波獲得直流輸出,同時可對直流輸出進行采樣檢測,發(fā)送到控制器進行決策。常見的直流充電樁工作原理如圖1所示。
圖1 常見的直流充電樁工作原理
1.2.1 絕緣問題
影響充電設施絕緣性的因素包括外殼防護能力、電氣間隙與爬電距離、介電強度、絕緣電阻、接觸電流、沖擊耐壓等。
1.2.2 環(huán)境因素
充電設施常年放置于室外,其環(huán)境因素是不可控的,充電設施內(nèi)部有許多個模塊和大量高精密度的電力電子元件,臺風、冰雹、雨天、高溫等惡劣天氣環(huán)境都會影響這些元器件的性能及絕緣性,威脅著充電設施的安全運行,進一步可能導致安全事故的發(fā)生。
1.2.3 通信問題
充電設施在運行過程中會實時與BMS系統(tǒng)進行通信,充電樁的輸出電壓、電流大小會根據(jù)BMS系統(tǒng)的指令進行調(diào)整,當電動汽車充電結(jié)束時,BMS會發(fā)出指令要求終止充電。若通信中斷,充電樁繼續(xù)輸出,會出現(xiàn)電池過充,可能發(fā)生事故;充電設施內(nèi)部充電控制器也會實時與充電樁計費控制單元(TCU)進行通信,外界的網(wǎng)絡攻擊如竊取、篡改數(shù)據(jù)等操作,都會給用戶和運營商帶來財產(chǎn)及信息安全問題。因此,可靠的通信可以保障用戶的財產(chǎn)安全及用戶信息安全。
數(shù)據(jù)挖掘是指對海量數(shù)據(jù)進行分析,并從中提取信息以達到不同的目的。本文通過數(shù)據(jù)挖掘算法對充電設施故障特性進行分析并統(tǒng)計,以備后續(xù)工作及決策。數(shù)據(jù)挖掘流程一般包括數(shù)據(jù)提取、數(shù)據(jù)預處理、數(shù)據(jù)特征挖掘處理等。
電動汽車充電設施的運行狀態(tài)數(shù)據(jù)來源包括互聯(lián)網(wǎng)、BMS系統(tǒng)以及運營監(jiān)控平臺,充電設施運行狀態(tài)量如電壓、電流、溫度等數(shù)據(jù)異常都會給充電設施帶來安全隱患,而初始數(shù)據(jù)集的各種數(shù)據(jù)類型、屬性等多樣化,給后續(xù)對數(shù)據(jù)的統(tǒng)計及分析帶來困難,因此需要進一步處理從各個數(shù)據(jù)來源采集到的數(shù)據(jù)。
從科學到工程,從管理到過程控制,數(shù)據(jù)分析是許多知識領域研究的基礎。以符號和數(shù)字屬性的形式獲取充電設施運行狀態(tài)的數(shù)據(jù),這些數(shù)據(jù)來源于不同平臺和性能不同的傳感器,且類型多樣,屬性具有不同程度的復雜性。因此,需要進行數(shù)據(jù)預處理操作,其主要目標是為挖掘數(shù)據(jù)特征并發(fā)現(xiàn)用于解決問題或做出決策的知識奠定基礎。
2.2.1 不良數(shù)據(jù)處理
傳感器測量的數(shù)據(jù)在采集、存儲、傳輸過程中會產(chǎn)生不良數(shù)據(jù),還有可能是本地信道通信質(zhì)量、充電設施或電動汽車故障引起的不良數(shù)據(jù)。由于這些不良數(shù)據(jù)會對狀態(tài)估計結(jié)果產(chǎn)生負面影響,因此需要識別這些不良數(shù)據(jù),并更正檢測到的不良數(shù)據(jù)[14]。
(1)不良數(shù)據(jù)的檢測。不良數(shù)據(jù)對狀態(tài)估計產(chǎn)生影響,故有必要對其進行檢測。不良數(shù)據(jù)可分為兩類:單個不良數(shù)據(jù),由于高干擾或設備配置不正確,只有一個測量值會有較大的偏差;多個不良數(shù)據(jù),多個測量值同時出現(xiàn)偏差。
加權(quán)最小二乘法(WLS)和卡方檢驗可分別用于充電設施運行狀態(tài)估計和檢測不良數(shù)據(jù)的存在。狀態(tài)估計廣泛應用于真實電力系統(tǒng),以確保電力系統(tǒng)的最佳運行。測量值與狀態(tài)變量之間的關系為
Z=h(x)+e
h(x)=[h1(x1,x2,…,xn),…,hm(x1,x2,…,xn)]
(1)
式中:x——n×1的狀態(tài)變量向量;
Z——m×1的測量向量;
h(x)——將狀態(tài)變量與測量值關聯(lián)的非線性變換;
e——m×1的誤差向量,表示測量誤差,服從零均值高斯分布。
一般情況下,測量值的數(shù)量大于狀態(tài)變量的數(shù)量。因為方程的數(shù)量大于未知數(shù)的數(shù)量,所以式(1)有無窮多個解。WLS的目標是從這些可能的解決方案中找到最佳的解決方案,可以通過最小化計算值和測量值之間的殘差來實現(xiàn)。加權(quán)平方差J(x)表示為
(2)
式中:m——測量值的數(shù)量;
其中,非線性函數(shù)h(x)通過使用泰勒級數(shù)展開進行線性化。
h(x+Δx)≈h(x)+H(x)·Δx
(3)
式中:H(x)——雅可比木矩陣。
(4)
結(jié)合式(1)、式(3)、式(4),式(2)可以改寫為
(5)
式中:R——加權(quán)矩陣,對角線元素是每個測量值誤差的方差。
取式(5)的一階導數(shù),并找到最小值。
HTR-1HΔx=HTR-1e
(6)
令G=HTR-1H,即
GΔx=HTR-1e
(7)
式中:G——增益矩陣。
如果系統(tǒng)是完全可觀測的,那么G是一個正定對稱的稀疏矩陣。
(8)
(9)
(10)
(2)不良數(shù)據(jù)的修正?;赪LS法和卡方檢驗對充電設施運行時的不良數(shù)據(jù)進行檢測,得到不良數(shù)據(jù)集合。當不良數(shù)據(jù)出現(xiàn)過多時,不能一味將其舍棄,可利用人工神經(jīng)網(wǎng)絡(ANN)對其進行修正。首先使用正常數(shù)據(jù)作為輸入訓練ANN模型,訓練優(yōu)化好的ANN模型具有預測功能。然后將不良數(shù)據(jù)前一時刻的正常數(shù)據(jù)作為ANN的輸入,由于ANN的輸出表示正常數(shù)據(jù)的預測值,因此輸出的預測值將用來替換不良數(shù)據(jù)值,以此修正不良數(shù)據(jù),為后續(xù)數(shù)據(jù)質(zhì)量評價和數(shù)據(jù)轉(zhuǎn)換奠定基礎。
2.2.2 數(shù)據(jù)質(zhì)量評價
基于不良數(shù)據(jù)的處理結(jié)果,進行電動汽車充電設施運行狀態(tài)數(shù)據(jù)質(zhì)量評價,根據(jù)運行狀態(tài)數(shù)據(jù)特征,充電設施運行狀態(tài)數(shù)據(jù)質(zhì)量評價體系如圖2所示。
圖2 充電設施運行狀態(tài)數(shù)據(jù)質(zhì)量評價體系
充電設施運行狀態(tài)數(shù)據(jù)質(zhì)量評價模型如圖3所示。
圖3 充電設施運行狀態(tài)數(shù)據(jù)質(zhì)量評價模型
首先對充電設施運行狀態(tài)數(shù)據(jù)集進行檢測,包括充電設施運行時的各子模塊電壓、電流、阻抗、溫度等數(shù)據(jù)間的相關性進行描述。然后通過規(guī)則庫和智能算法庫,進行規(guī)則權(quán)重和指標評價處理,形成數(shù)據(jù)質(zhì)量報告。其中規(guī)則庫是指在檢測充電設施運行狀態(tài)數(shù)據(jù)質(zhì)量的基礎上形成的問題規(guī)則集合;規(guī)則權(quán)重處理是指利用專家系統(tǒng)或者其他人工智能算法對各規(guī)則按照其重要程度進行權(quán)重分配;智能算法庫是指數(shù)據(jù)質(zhì)量評價過程所使用的算法集合;指標評價是指根據(jù)規(guī)則權(quán)重對各規(guī)則進行打分評價的過程,并形成最終的數(shù)據(jù)質(zhì)量報告。
2.2.3 數(shù)據(jù)轉(zhuǎn)換
數(shù)據(jù)轉(zhuǎn)換包含以下幾種處理方式,目的是構(gòu)造出更合適數(shù)據(jù)處理的描述形式。
(1)數(shù)據(jù)合計處理:對采集到的充電設施運行狀態(tài)數(shù)據(jù)進行不良數(shù)據(jù)的修正及數(shù)據(jù)評價等操作后,再對其進行總結(jié)歸并處理,可用于數(shù)據(jù)的多粒度分析。
(2)數(shù)據(jù)規(guī)范化處理:將采集到的數(shù)據(jù)按一定比例映射到特定的區(qū)間中,更好地進行比較評價,其方法包括最小-最大標準化法、零-均值規(guī)范法等。
最小-最大標準化法是將最小值歸為0或者-1,最大值歸為1,其余值分布在最大值與最小值之間。標準化后的值x′為
(11)
式中:xi——樣本里第i個原始數(shù)據(jù);
xmin——原始數(shù)據(jù)樣本里最小值;
xmax——原始數(shù)據(jù)樣本里最大值。
(12)
式中:n——原始數(shù)據(jù)樣本的數(shù)據(jù)個數(shù)。
標準差S為
(13)
則規(guī)范化后的值x″為
(14)
(3)數(shù)據(jù)泛化處理:將原始低層次的數(shù)據(jù)對象泛化為高層次(更抽象)的概念,比如溫度屬性,可以泛化到更抽象的概念如高溫、常溫和低溫。
(4)屬性構(gòu)造處理:基于原有屬性的特點,根據(jù)計算公式,構(gòu)造出新的屬性。比如充電設施某個模塊的接觸器溫度與環(huán)境溫度兩個原始屬性的差值,可以構(gòu)造出一個新的屬性為接觸器的溫升。比如電網(wǎng)線路上的供入電量與供出電量的差值,構(gòu)造出線損這個新的屬性。
充電設施運行狀態(tài)數(shù)據(jù)通過互聯(lián)網(wǎng)傳輸,其數(shù)據(jù)量龐大,通過對前述的各種數(shù)據(jù)來源的數(shù)據(jù)進行預處理,將其輸出、輸入到充電設施運行狀態(tài)數(shù)據(jù)挖掘模型,對復雜數(shù)據(jù)進行簡化,比如降維抽取特征等,才能保證結(jié)果的實時性和有效性,能夠有效控制充電設施的運行狀態(tài)。
抽取數(shù)據(jù)特征常采用主成分分析法(PCA),通過PCA提取主成分(PCs),PCs是使數(shù)據(jù)方差最大的基礎。在此基礎上處理數(shù)據(jù),可以獲取大部分的方差,這是區(qū)分每個數(shù)據(jù)的重要信息類型。主要分為3個過程,首先是將分類信息添加到數(shù)據(jù)的過程;然后是對增強數(shù)據(jù)執(zhí)行PCA的過程,該過程包括協(xié)方差矩陣的計算和主成分的選擇。最后,確定在特征空間上投影數(shù)據(jù)的權(quán)重矩陣。
2.3.1 分類信息擴充到數(shù)據(jù)
定義Zclass為類別數(shù),C(X)=[C1,C2,…,CZclass]為輸入量X的每個分類信息。如果X屬于類i,則X的類標簽Ci就設為Pi,否則Ci設為Ni;確定Pi和Ni后,使Ci對所有X都具有正態(tài)分布。
例如,X的3個實例分別為X1、X2、X3,其對應的類標簽為1、2、2,其分類信息為
(15)
(16)
(17)
對于具有正態(tài)分布的C1,第一個元素P1、-N1、-N2的均值應為0,標準差應為1,在此基礎上,可以確定P1、N1的值,進而確定P2、N2的值。
將C(X)擴充到X,還需要對X進行標準化,使得X的每個因子呈正態(tài)分布,將標準化后的輸入量定義為Xnorm。擴充數(shù)據(jù)Xaug定義為
(18)
其中,Xnorm的維度為1×Zinput,Zinput就是輸入的數(shù)量;C(X)的維度為1×Zclass;Xaug的維度為1×(Zinput+Zclass)。
2.3.2 基于PCA的特征提取
將PCA方法應用于上述得到的Xaug,可以提取到主成分PCs。初始的PCs維度為1×(Zinput+Zclass),如果要降低輸入數(shù)據(jù)的維度至Zfeature (19) 其中,PCi的維度為1×(Zinput+Zclass);Waug的維度為(Zinput+Zclass)×Zfeature。Winput和Wclass對應于擴充輸入中的輸入和類。 2.3.3 確定變換矩陣W 將Waug與Xaug相乘,可以得到特征空間上的轉(zhuǎn)換數(shù)據(jù)Xfeature: (20) 通過選擇合適的充電設施數(shù)據(jù)挖掘方案,設計合理的數(shù)據(jù)挖掘模型,分析安全故障數(shù)據(jù)特征,展示數(shù)據(jù)挖掘結(jié)果。數(shù)據(jù)挖掘流程圖如圖4所示。 圖4 數(shù)據(jù)挖掘流程圖 故障樹是使用事件符號和邏輯符號顯示物理系統(tǒng)的邏輯結(jié)構(gòu)。網(wǎng)絡的輸入和輸出應由“IF-THEN”規(guī)則確定。我國制定了故障樹符號統(tǒng)一的標準,部分故障樹基本符號及其含義如表1所示。 表1 部分故障樹基本符號及其含義 建立故障樹的步驟如下。 步驟1:故障樹的建立從對象中所有故障的根源件作為頂部事件的陳述開始。 步驟2:找到輸入事件,得出下層輸出事件。 步驟3:重復步驟2,直到獲得底部事件(具體故障原因)。 步驟4:用邏輯符號連接所有級別的事件,形成故障樹。 規(guī)則表述如下: IFP,THENQ (21) 式中:P——由“與”和“或”連接的一組先決條件,pi∈P; Q——一組結(jié)果,qi∈Q。 當規(guī)則滿足先決條件時,即可得出結(jié)論。 研究常見的故障類型,主要是由儀器故障、機械故障和通信故障引起的頂部事件,建立故障樹。充電設施一體化故障樹如圖5所示。 圖5 充電設施一體化故障樹 由“或”邏輯來連接,充電設施故障樹的輸入包括18個節(jié)點,對應故障源X1~X18。充電設施故障樹的輸入源如表2所示。 表2 充電設施故障樹的輸入源 接著,從故障樹中提取“IF THEN”規(guī)則,例如:IFX2THENY1,IFX3THENY1;IFX6THENY5,IFX11THENY5。 充電設施故障的輸出有6個節(jié)點,對應Y1~Y6個故障類型。充電設施故障樹的輸出如表3所示。 表3 充電設施故障樹的輸出 對2021年3月~4月江蘇省各充電站充電設施運行數(shù)據(jù),如各個模塊的電壓、電流、溫度、阻抗等數(shù)據(jù)進行提取、預處理及特征挖掘,通過上述建立的充電設施一體化故障樹分析,對故障類型及次數(shù)進行統(tǒng)計,對主要故障類型包括儀器故障、機械故障和通信故障進行統(tǒng)計。充電設施各故障類型占比如圖6所示。 圖6 充電設施各故障類型占比 由圖6可知,充電設施的儀器故障和通信故障占比較高,而本身的機械故障占比較低。常見的儀器故障原因又分為控制器故障、斷路器故障、避雷器故障以及接觸器故障;常見的通信故障原因分為BMS通信故障和TCU通信故障;常見的機械故障原因分為充電槍故障和電子鎖故障。儀器故障、機械故障和通信故障各故障次數(shù)分別如圖7~圖9所示。 圖7 儀器故障各故障次數(shù) 圖8 機械故障各故障次數(shù) 圖9 通信故障各故障次數(shù) 結(jié)合3月~4月的充電設施運行數(shù)據(jù)分析,由圖7~圖9可知,BMS通信故障、控制器故障、TCU通信故障和斷路器故障次數(shù)較多。BMS通信故障還分為握手階段通信超時、配置階段通信超時、充電階段通信超時、結(jié)束階段通信超時、車輛就緒超時等多種故障,其故障原因主要是BMS絕緣模塊發(fā)生故障或者BMS采集模塊故障等因素造成的;控制器故障可以從控制器過熱、控制器溢出、控制電壓過高或控制電壓過低推斷出來;TCU通信故障一般是充電樁與計費模塊通信超時,其原因主要是TCU離線和TCU輔助電源損壞;斷路器可用來分配電能以及對線路、元器件等進行保護,當發(fā)生異常如短路、過載時實現(xiàn)對電路的自動切斷,電壓異常、電流異常、老化、觸頭不能閉合等原因都會導致斷路器故障。通過數(shù)據(jù)特征挖掘展示故障類型,分析其產(chǎn)生原因,可為充電設施的安全運維奠定基礎,對提高充電設施的穩(wěn)定性和安全性具有一定的作用,同時推動電動汽車的發(fā)展。 本文首先對直流充電樁的工作原理及充電安全影響因素進行分析。其次研究數(shù)據(jù)挖掘處理方法,詳細介紹數(shù)據(jù)挖掘的數(shù)據(jù)提取、數(shù)據(jù)預處理、數(shù)據(jù)特征挖掘3個步驟,建立合理的數(shù)據(jù)挖掘模型。進而分析安全故障數(shù)據(jù)特征,建立充電設施一體化故障樹,分析各層故障源和具體故障類型之間的內(nèi)在關系。最后,基于數(shù)據(jù)挖掘技術對2021年3月~4月江蘇省各充電站充電設施的運行數(shù)據(jù)如電壓、電流、溫度等進行特征挖掘,結(jié)合充電設施一體化故障樹,對主要故障的類型及次數(shù)進行統(tǒng)計,分析其故障產(chǎn)生原因,為充電設施的安全運維奠定基礎。但是,本文尚未考慮各個故障之間的相關性對整體充電設施的影響,需開展進一步的研究。3 充電設施一體化故障樹
3.1 故障樹分析
3.2 一體化故障樹
4 算例分析
5 結(jié) 語