国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于數(shù)據(jù)挖掘的城軌系統(tǒng)電能消耗模式分析

2020-11-17 12:05:10孫玉霖
關(guān)鍵詞:城軌決策樹軌道交通

荀 徑,趙 嬌,孫玉霖,吳 穎

(北京交通大學(xué) 軌道交通控制與安全國家重點(diǎn)實(shí)驗(yàn)室,北京 100044)

近年來,我國城市軌道交通發(fā)展迅猛,中國城市交通協(xié)會(huì)的統(tǒng)計(jì)數(shù)據(jù)顯示[1],截至2019年底,中國內(nèi)地共計(jì)開通城軌線路210條,運(yùn)營里程達(dá)到5 948 km.全年累計(jì)完成客運(yùn)量超過210億人次.作為一種綠色環(huán)保的交通方式,城軌系統(tǒng)單位運(yùn)輸能耗低,但運(yùn)輸總量激增導(dǎo)致城軌系統(tǒng)能源消耗體量大,引人關(guān)注.此外,整體能耗增加也使運(yùn)營單位承受巨大的成本壓力.據(jù)統(tǒng)計(jì),在城市軌道交通的運(yùn)營費(fèi)用中,電耗費(fèi)用[2]為第二大成本,目前我國城市軌道交通系統(tǒng)能耗支出占運(yùn)輸總支出的比例高達(dá)35%.因此,如何準(zhǔn)確分析城軌系統(tǒng)能耗,合理制定能耗指標(biāo)和查找能耗波動(dòng)原因成為城市軌道交通系統(tǒng)研究的重點(diǎn)之一.

為方便統(tǒng)計(jì)和分析能耗相關(guān)數(shù)據(jù),各地地鐵公司建立了能耗管理監(jiān)控平臺(tái).北京市地鐵運(yùn)營有限公司[3]提出能效管理平臺(tái),為地鐵提供電能綜合管理和電能質(zhì)量分析.上海城市軌道交通已建立了由站、線、網(wǎng)三級(jí)架構(gòu)組成的能耗監(jiān)測(cè)管理系統(tǒng),各級(jí)系統(tǒng)之間通過專用通信網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)傳輸[4].針對(duì)牽引用電部分,上海地鐵2015年在上海軌道交通1號(hào)線01A02車開展了城市軌道交通車輛能耗計(jì)量相關(guān)試驗(yàn)[5].廣州地鐵6號(hào)線的電能質(zhì)量管理系統(tǒng)具備了海量數(shù)據(jù)分析以及智能化數(shù)據(jù)展示與預(yù)警功能,但面向牽引用電的數(shù)據(jù)分析,局限于牽引變電所[6].除此之外,成都、深圳、南京等地鐵公司也已建立了地鐵能源管理系統(tǒng)[7-9].這些系統(tǒng)為監(jiān)控地鐵線網(wǎng)能耗總量情況及趨勢(shì)、監(jiān)控地鐵線網(wǎng)運(yùn)營能耗數(shù)據(jù)、分析各條線路的能耗時(shí)空分布的變化特征提供了便利條件.

目前國內(nèi)多個(gè)地區(qū)為城市軌道交通系統(tǒng)的能耗管理和評(píng)價(jià)指標(biāo)制定了相關(guān)標(biāo)準(zhǔn).文獻(xiàn)[10]規(guī)定了線路能源管理系統(tǒng)的架構(gòu)和功能,同時(shí)包含關(guān)于表計(jì)配置原則、能耗數(shù)據(jù)監(jiān)測(cè)、統(tǒng)計(jì)和分析等多項(xiàng)要求,用于規(guī)范北京市軌道交通合理用能.文獻(xiàn)[11]包含對(duì)城市軌道交通各子系統(tǒng)的節(jié)能管理要求和電耗統(tǒng)計(jì)范圍等內(nèi)容,適用于運(yùn)營期的城市軌道交通的節(jié)能管理和綜合電耗計(jì)算方法等.北京市地方標(biāo)準(zhǔn)《城市軌道交通能源消耗評(píng)價(jià)方法》[12]規(guī)定了城市軌道交通能耗的計(jì)量器具安裝要求、統(tǒng)計(jì)內(nèi)容與要求、評(píng)價(jià)指標(biāo)、能耗評(píng)價(jià)方法.根據(jù)對(duì)北京地鐵的實(shí)際調(diào)查,目前對(duì)所有線路統(tǒng)一設(shè)定一個(gè)本年度每車百公里列車實(shí)耗作為每條線路的評(píng)價(jià)指標(biāo).

2011年,文獻(xiàn)[13]提出一套嚴(yán)格的鐵路系統(tǒng)能耗評(píng)價(jià)指標(biāo)體系,這種方法包括衡量系統(tǒng)整體能源消耗,但并沒有提供有關(guān)不同子系統(tǒng)性能的信息.文獻(xiàn)[14]分析了城軌系統(tǒng)能耗組成、牽引供電系統(tǒng)和能量流,提出KEPI,包含KPI和PI.使用能耗值、客流量和距離等相關(guān)數(shù)據(jù),將這些值組合得到KPI和PI,能夠?qū)ο到y(tǒng)的實(shí)際能耗表現(xiàn)進(jìn)行全方位的分析,評(píng)估節(jié)能策略的節(jié)能潛力.與此同時(shí),國內(nèi)學(xué)者提出了城市軌道交通評(píng)價(jià)體系[15].我國也已發(fā)布了MOPES指標(biāo)體系和一些地方標(biāo)準(zhǔn),例如北京地標(biāo)《城市軌道交通路網(wǎng)運(yùn)營指標(biāo)體系》[16].

軌道交通領(lǐng)域?qū)δ芎牡姆治鲋饕性谀芎念A(yù)測(cè)方面.有部分學(xué)者利用機(jī)器學(xué)習(xí)的方法預(yù)測(cè)軌道交通系統(tǒng)的能耗值.文獻(xiàn)[17]提出利用支持向量回歸(SVR)預(yù)測(cè)地鐵牽引能耗,模型的輸入有日均周轉(zhuǎn)量,全日走行公里、最小發(fā)車間隔等,采用遺傳算法與交叉驗(yàn)證方法對(duì)SVR模型參數(shù)進(jìn)行尋優(yōu),并對(duì)比了神經(jīng)網(wǎng)絡(luò)模型、多元線性回歸模型等能耗模型的預(yù)測(cè)效果.文獻(xiàn)[18]認(rèn)為交通的能耗影響因素主要包括經(jīng)濟(jì)活動(dòng)總量、技術(shù)進(jìn)步和交通運(yùn)輸結(jié)構(gòu)等,計(jì)算出影響大小的數(shù)值并提取核心影響因素,分析了每個(gè)因素的變動(dòng)對(duì)于整體影響的靈敏性,用貝葉斯估計(jì)預(yù)測(cè)能耗,給出節(jié)能政策建議.文獻(xiàn)[19]探索了動(dòng)態(tài)客流和牽引能耗的耦合機(jī)理.

當(dāng)前我國地鐵運(yùn)營單位主要通過計(jì)算各種指標(biāo),例如車公里、人公里指標(biāo)等,設(shè)置閾值判斷線路運(yùn)營能耗的異常情況,進(jìn)而分析每條線路和列車的電能使用和查找能耗異常原因.各地投入使用的電能管理系統(tǒng)已實(shí)現(xiàn)對(duì)城市軌道交通能耗較為精確的計(jì)量和采集,能耗相關(guān)數(shù)據(jù)逐年累積,具有維度高、數(shù)量大等特點(diǎn).存在的問題主要有兩個(gè)方面:1)現(xiàn)有方法以針對(duì)年度/月度數(shù)據(jù)的靜態(tài)分析為主,由人工計(jì)算一定周期內(nèi)的能耗指標(biāo),受限于人的能力,時(shí)間跨度大,不利于能耗異常原因的溯源;2)所用能耗指標(biāo)與日常生產(chǎn)任務(wù)關(guān)聯(lián)較為松散,不同時(shí)間段(工作日、周末、節(jié)假日)的判斷閾值“一刀切”,亟待研究不同時(shí)間段的能耗模式,作為判別異常的依據(jù).

本文作者針對(duì)以上問題提出了一種基于數(shù)據(jù)挖掘的城軌能耗動(dòng)態(tài)分析方法,可用于分析牽引能耗和動(dòng)照能耗的能耗模式,作為判別異常的依據(jù).

1 牽引能耗和動(dòng)照能耗數(shù)據(jù)集

本文研究所使用的數(shù)據(jù)是2019年3月國內(nèi)某地鐵某線路記錄的牽引能耗數(shù)據(jù)集和動(dòng)照能耗數(shù)據(jù)集.此類數(shù)據(jù)通常由城軌電能管理系統(tǒng)記錄,記錄間隔可以有半小時(shí)、一小時(shí)等選擇,本文選取每半個(gè)小時(shí)記錄一次.由于原始記錄的數(shù)據(jù)是累計(jì)值,將相鄰的采樣數(shù)據(jù)相減可以得到整條線路每半個(gè)小時(shí)之內(nèi)的牽引和動(dòng)照能耗.基于此數(shù)據(jù)繪制的牽引能耗曲線如圖1所示,發(fā)現(xiàn)數(shù)據(jù)曲線在一天中的某個(gè)時(shí)間段具有類似的波動(dòng)形狀,這是典型的周期模式特征.與牽引能耗數(shù)據(jù)類似,動(dòng)照數(shù)據(jù)也具有周期性模式特征.

為了便于后續(xù)的分析,對(duì)數(shù)據(jù)進(jìn)行了預(yù)處理獲得4類數(shù)據(jù)集:1)動(dòng)照能耗數(shù)據(jù)全集,包含各個(gè)車站動(dòng)照能耗數(shù)據(jù)集;2)牽引能耗數(shù)據(jù)全集,包含正線和車輛段的各變電站牽引能耗數(shù)據(jù)集;3)包含正線和車輛段的全線牽引能耗數(shù)據(jù)集(不區(qū)分各個(gè)牽引變電站);4)正線數(shù)據(jù)集,僅包含正線牽引能耗數(shù)據(jù)的數(shù)據(jù)集(不區(qū)分各個(gè)牽引變電站).

2 城軌能耗分析方法

城軌能耗分析方法的流程為:1)由于目前尚無系統(tǒng)權(quán)限下載數(shù)據(jù),數(shù)據(jù)集通過人工抄錄系統(tǒng)顯示數(shù)據(jù)獲得,存在較多“疑問”數(shù)據(jù)(可能是由于記錄疏忽造成的),必須要對(duì)數(shù)據(jù)進(jìn)行清洗.采用Log變換和基于標(biāo)準(zhǔn)差的方法進(jìn)行數(shù)據(jù)清洗.2)構(gòu)建特征向量,選擇合適的聚類方法對(duì)數(shù)據(jù)進(jìn)行聚類,得到不同日期城軌系統(tǒng)的耗能規(guī)律.3)基于聚類得到的耗能規(guī)律,構(gòu)建決策樹,進(jìn)行分類,獲得不同時(shí)段城軌系統(tǒng)的能耗模式;4)基于分析得到的能耗模式,采用聚類方法,可用于分析其他日期的能耗數(shù)據(jù)是否異常.

2.1 K-Means算法

由于本文中數(shù)據(jù)集屬于時(shí)間序列聚類,數(shù)據(jù)之間不存在平移,波動(dòng)性不影響聚類結(jié)果,適合使用基于距離的聚類算法,可直接用歐式距離來衡量時(shí)間序列之間的差異,因此選擇K-Means聚類算法.

K-Means(K均值)算法是一種無監(jiān)督學(xué)習(xí)的聚類算法,它可以將相似的對(duì)象歸到同一個(gè)簇中.聚類分析試圖將相似的對(duì)象歸入同一個(gè)簇中,將不相似的對(duì)象歸到不同的簇中.而是否相似則取決于算法中的相似度計(jì)算方法.K-Means算法的相似度計(jì)算是通過計(jì)算與數(shù)據(jù)點(diǎn)與各個(gè)簇中心的距離,選取最相近的簇中心來確定的.這里的距離計(jì)算常使用歐氏距離.

算法1:K-Means算法

輸入:(x1,x2,…,xn-1,xn),k

輸出:k個(gè)聚類中心

1. 從數(shù)據(jù)集中隨機(jī)選擇K個(gè)樣本作為初始集群中心C={c1,c1,…,ck}

2. do

3. fori=1,2,…,n-1,n

4. 計(jì)算xi所屬的類:

(1)

5. end for

6. forj=1,2,…,k-1,k

7. 重新計(jì)算每個(gè)類別cj的聚類中心:

(2)

8. end for

9. while 聚類中心發(fā)生變化

其中最優(yōu)K值的選取有很多種方法,在本文中選擇使用手肘法.

2.2 決策樹與CART算法

決策樹算法具有計(jì)算復(fù)雜度不高,輸出結(jié)果易于理解,對(duì)數(shù)據(jù)的缺失不敏感等優(yōu)點(diǎn),也存在著可能產(chǎn)生過度匹配問題的缺點(diǎn),但可以通過一些限制和優(yōu)化方法進(jìn)行改進(jìn).構(gòu)造決策樹時(shí),首先要尋找能夠?qū)?shù)據(jù)集進(jìn)行最大劃分的特征.為了找到這個(gè)特征,需要通過一些算法計(jì)算數(shù)據(jù)的最大劃分.常見的算法有ID3、C4.5、CART等,本文在對(duì)比了如上算法后,考慮到進(jìn)行能耗時(shí)段分類時(shí)對(duì)于能耗時(shí)段的過濾需求,采用了可以計(jì)算數(shù)值型特征和具有剪枝過程的CART算法.

CART算法構(gòu)建的決策樹是二叉樹,其內(nèi)部節(jié)點(diǎn)特征的取值為“是”和“否”,其中左子樹代表“是”的分支,右子樹代表“否”的分支.CART決策樹通過遞歸的二分每個(gè)特征,將特征劃分為有限個(gè)單元,并在這些單元上確定預(yù)測(cè)的概率分布.

CART分類決策樹算法使用Gini系數(shù)最小化準(zhǔn)則來進(jìn)行特征選擇,生成二叉樹.首先,CART算法檢查每個(gè)變量和該變量所有可能的劃分值來發(fā)現(xiàn)最好的劃分.將每個(gè)屬性的所有劃分按照他們能減少的雜質(zhì)量來進(jìn)行排序,本文所使用的雜質(zhì)度量方法是Gini系數(shù).一個(gè)節(jié)點(diǎn)A的Gini系數(shù)的計(jì)算式為

(3)

式中:pk表示節(jié)點(diǎn)包含的數(shù)據(jù)中屬于k類的概率;C為類的數(shù)量.

當(dāng)所有類在節(jié)點(diǎn)中以相同概率出現(xiàn)時(shí),Gini(A)最大;當(dāng)Gini(A)取最小值時(shí),節(jié)點(diǎn)A得到最大劃分.將全部數(shù)據(jù)作為根節(jié)點(diǎn),對(duì)此過程進(jìn)行遞歸,直到滿足限定條件,即得到分類決策樹.

算法2:CART分類決策樹算法

輸入:D=(x1,x2,…xn),基尼系數(shù)閾值,樣本個(gè)數(shù)閾值

輸出:決策樹T

1. 從根節(jié)點(diǎn)開始

對(duì)于當(dāng)前節(jié)點(diǎn)的數(shù)據(jù)集D,如果樣本個(gè)數(shù)小于閾值或沒有特征,則返回決策子樹,當(dāng)前節(jié)點(diǎn)停止遞歸.

2. if Gini(D)<基尼系數(shù)閾值

return

3. else

4. 計(jì)算當(dāng)前節(jié)點(diǎn)現(xiàn)有的各個(gè)特征值對(duì)數(shù)據(jù)集D的基尼系數(shù),由

(4)

得到使基尼系數(shù)最小的特征A和對(duì)應(yīng)的特征值

a,將D劃分成兩個(gè)子節(jié)點(diǎn)D1和D2

5. 對(duì)左右子節(jié)點(diǎn)遞歸調(diào)用1~4步,生成決策樹

6. return

2.3 LOF算法

LOF算法是基于密度的經(jīng)典算法,對(duì)數(shù)據(jù)的分布無特殊要求,允許數(shù)據(jù)分布不均勻,可量化每個(gè)點(diǎn)的異常程度,通過給每個(gè)數(shù)據(jù)點(diǎn)都分配一個(gè)依賴于鄰域密度的離群因子 LOF,進(jìn)而判斷該數(shù)據(jù)點(diǎn)是否為離群點(diǎn).LOF值越遠(yuǎn)離1,越可能判為異常值.

1)k-鄰近距離:在距離數(shù)據(jù)點(diǎn)o最近的點(diǎn)中,第k個(gè)最近的點(diǎn)與o之間的距離.記為kd(o).

2)第k距離鄰域:與o的距離小于等于k-鄰近距離的點(diǎn),記為|Nk(o)|.

3)可達(dá)距離:給定參數(shù)k,點(diǎn)o的k-鄰近距離和數(shù)據(jù)點(diǎn)p與數(shù)據(jù)點(diǎn)o直接距離的最大值.

rdk(p,o)=(p,o)=max {kd(o),d(p,o)}

(5)

4)局部可達(dá)密度:點(diǎn)p的第k鄰域內(nèi)點(diǎn)到p的平均可達(dá)距離的倒數(shù).

(6)

5)局部異常因子:點(diǎn)p的第k鄰域內(nèi)點(diǎn)的平均局部可達(dá)密度與點(diǎn)p的局部可達(dá)密度之比.

(7)

算法3:LOF異常值檢測(cè)算法

輸入:(x1,x2,…,xn),k,threshold

輸出:異常值outliers

1. fori=1,2,…,n-1,n

2. 根據(jù)式(5)~式(7),

3. ifLOFi>threshold

4. outliers←xi

5. end if

6. end for

3 驗(yàn)證和分析

3.1 線路牽引能耗

由于圖1的曲線表現(xiàn)出典型的周期性特點(diǎn),因此重新定義時(shí)間跨度為一天對(duì)數(shù)據(jù)展示,見圖2.

針對(duì)圖2的觀察發(fā)現(xiàn)工作日(周一—周五)和非工作日(周六、日)的能耗曲線波動(dòng)不太相同,若是進(jìn)行聚類,可能會(huì)聚為兩類.為了驗(yàn)證此猜測(cè),首先利用手肘法進(jìn)行最優(yōu)K值的選擇.基于數(shù)據(jù)計(jì)算不同K值時(shí)誤差平方和SEE(Sum of the Squared Errors).肘部對(duì)應(yīng)的k值為2(曲率最高),故對(duì)于這個(gè)數(shù)據(jù)集的聚類,最佳聚類數(shù)應(yīng)該選2.基于此結(jié)果,采用KAMeans方法,對(duì)數(shù)據(jù)集進(jìn)行聚類,得到的聚類結(jié)果如圖3所示.其中非工作日(周六、日)被歸為一類,而工作日被歸為了另一類.圖3中帶狀分別描述數(shù)據(jù)的平均值和波動(dòng)范圍.

基于上述聚類結(jié)果進(jìn)行能耗模式分析.受車輛段夜間用電的影響,最初采用包含正線和車輛段的全線牽引能耗數(shù)據(jù)集進(jìn)行能耗模式分析,未得到解釋性較好的結(jié)果.此后改為使用僅包含正線牽引能耗數(shù)據(jù)的正線數(shù)據(jù)集進(jìn)行牽引能耗模式分析,通過聚類方法將能耗相近的時(shí)間段歸到一起,將所有時(shí)間段劃分為高能耗時(shí)段和低能耗時(shí)段兩類.然后通過決策樹算法建立高低能耗時(shí)間段分類與星期、時(shí)間兩個(gè)屬性的聯(lián)系,運(yùn)行程序得到圖4中的決策樹.決策樹中X[0]為代表周幾的數(shù)字表示,X[1]為小時(shí)的數(shù)字表示.Gini系數(shù)在決策樹分類時(shí)用來衡量不確定度的大小,samples為樣本數(shù)量,value代表被分到不同類別中的樣本數(shù)量.

以圖4(a)中最右下角的葉子節(jié)點(diǎn)N為例,說明對(duì)決策樹整理解釋的過程.N中有7個(gè)樣本,全部被分為第2類,從N向根節(jié)點(diǎn)的路徑搜索N的判定條件,由于每個(gè)節(jié)點(diǎn)的左子節(jié)點(diǎn)代表節(jié)點(diǎn)中的條件成立,右子節(jié)點(diǎn)代表?xiàng)l件不成立,N為其父節(jié)點(diǎn)的右子節(jié)點(diǎn),父節(jié)點(diǎn)的特征判定條件為X[1]<=23.25,因此可知N中的樣本有X[1]>23.25.X[1]代表能耗數(shù)據(jù)的時(shí)間,取值范圍為[0, 24),23.25即代表23時(shí)15分,即節(jié)點(diǎn)N具有條件為時(shí)間在23:15以后.對(duì)N的父節(jié)點(diǎn)繼續(xù)向根節(jié)點(diǎn)的方向搜索,到達(dá)根節(jié)點(diǎn),知其具有判定條件X[1]<=5.75為假,即時(shí)間在5:45以后,此條件是“時(shí)間在23:15以后”條件的必要條件,因此省略.決策樹中時(shí)間的表示是[0, 24)的數(shù)字,且從根節(jié)點(diǎn)到葉子節(jié)點(diǎn)N的路徑中沒有X[0]的判斷條件,因此從節(jié)點(diǎn)N中讀出的信息為:從周一到周日,23:15—0:00的牽引能耗屬于第2類.其他葉子節(jié)點(diǎn)的解釋方式相同.通過對(duì)決策樹A進(jìn)行整理解釋得到了區(qū)分明顯的特殊時(shí)段和運(yùn)行時(shí)段.

對(duì)運(yùn)行時(shí)段使用K-Means和決策樹算法進(jìn)行進(jìn)一步的劃分,得到了決策樹B.通過對(duì)決策樹B整理,同時(shí)在整理分析時(shí)忽略較明顯的離群點(diǎn),將運(yùn)行時(shí)段的牽引能耗分為第1等級(jí)(能耗較高時(shí)段)和第2等級(jí)(能耗較低時(shí)段),得到完整的牽引能耗模式,如表1所示.

表1 牽引能耗模式

3.2 車輛段牽引能耗

單獨(dú)繪制車輛段的牽引能耗數(shù)據(jù),如圖5所示.每條曲線表示車輛段從周一到周日每天0:00—23:30的數(shù)據(jù).發(fā)現(xiàn)能耗模式與其他車站以及線路整體有著較明顯的差異,并且沒有工作日與非工作日間的差別.

對(duì)車輛段進(jìn)行單獨(dú)的聚類與決策樹分析,程序運(yùn)行結(jié)果見圖6.類似圖4,經(jīng)過分析整理可得能耗時(shí)段與模式的關(guān)系如下:0:00—3:00時(shí)段為第2等級(jí);3:00—6:30為第1等級(jí);6:30—24:00為第2等級(jí).其他時(shí)段因數(shù)據(jù)量有限不能得到明顯的區(qū)分.

3.3 動(dòng)照能耗

動(dòng)照數(shù)據(jù)集中有兩個(gè)重要屬性:車站名稱和日期.基于日期,可以獲得日動(dòng)照能耗數(shù)據(jù)這一時(shí)間序列數(shù)據(jù);基于車站名稱則是另一種分類方式.

1)日動(dòng)照能耗數(shù)據(jù)的車站聚類.

采用上述牽引能耗模式分析方法,也可以找到動(dòng)照能耗的能耗模式.圖7為利用正線動(dòng)照數(shù)據(jù)集繪制的各個(gè)車站全天能耗曲線.采用K-Means聚類算法,可將各個(gè)車站聚為3類:動(dòng)照第1等級(jí)、第2等級(jí)和第3等級(jí).7 d的聚類結(jié)果如表2所示.可以發(fā)現(xiàn),車站I的能耗值在3月23日與3月24日(周末)與其他時(shí)間(工作日)的能耗不同,其能耗的聚類周末屬于第1等級(jí)而工作日屬于第2等級(jí),這種變化是否是由于某種措施帶來的能耗異常值需要進(jìn)一步分析(圖7中紅色曲線所示).

表2 基于動(dòng)照能耗的車站聚類結(jié)果

2)各車站動(dòng)照能耗的異常值監(jiān)測(cè).

17:00-次日16:30每半小時(shí)記錄一組數(shù)據(jù),將23.5 h內(nèi)記錄的47組數(shù)據(jù)點(diǎn)視為一個(gè)多維數(shù)據(jù).采用LOF算法對(duì)每個(gè)站7 d內(nèi)的數(shù)據(jù)進(jìn)行異常值分析結(jié)果,見表3.異常值閾值設(shè)置為1.5.其中車站F周三和周六的能耗、車站G周日的能耗被判為異常.

表3 每站每天的動(dòng)照能耗LOF值

4 結(jié)論

1)針對(duì)傳統(tǒng)城軌能耗數(shù)據(jù)分析以靜態(tài)統(tǒng)計(jì)分析為主的特點(diǎn)和判斷能耗異常的閾值“一刀切”的問題,提出了一種基于數(shù)據(jù)挖掘的城軌能耗動(dòng)態(tài)分析方法,可用于分析牽引能耗和動(dòng)照能耗模式,作為判別異常的依據(jù).首先基于聚類方法獲取基于時(shí)序的耗能規(guī)律.其次基于聚類得到的耗能規(guī)律,采用決策樹分類方法分析其能耗模式;最后,基于分析得到的能耗模式,采用聚類方法,分析新的能耗數(shù)據(jù)是否異常.

2)利用國內(nèi)某地鐵線路供電系統(tǒng)記錄的牽引能耗數(shù)據(jù)集和動(dòng)照能耗數(shù)據(jù)集,進(jìn)行了分析,通過數(shù)據(jù)實(shí)驗(yàn)得到了該線路的牽引能耗模式和動(dòng)照能耗模式,并發(fā)現(xiàn)了數(shù)據(jù)集中某日以及某車站的能耗數(shù)據(jù)異常,驗(yàn)證了方法的有效性.

3)基于此方法可以從多角度(例如牽引和動(dòng)照)、多層面(線路或者車站)全面分析城軌系統(tǒng)的能耗模式、快速準(zhǔn)確地發(fā)現(xiàn)能耗異常,為城軌系統(tǒng)能耗分析提供了一種基于數(shù)據(jù)的動(dòng)態(tài)分析手段.

猜你喜歡
城軌決策樹軌道交通
軌道交通產(chǎn)品CE認(rèn)證論述
高速軌道交通發(fā)展趨勢(shì)
一種針對(duì)不均衡數(shù)據(jù)集的SVM決策樹算法
決策樹和隨機(jī)森林方法在管理決策中的應(yīng)用
電子制作(2018年16期)2018-09-26 03:27:06
漫說城軌
漫說城軌
漫說城軌
漫說城軌
基于決策樹的出租車乘客出行目的識(shí)別
基于CAN的冗余控制及其在軌道交通門禁環(huán)網(wǎng)中的應(yīng)用
黔西| 多伦县| 连城县| 景德镇市| 兴山县| 北辰区| 雷波县| 桃园市| 偃师市| 镇巴县| 阳城县| 青岛市| 翁源县| 大邑县| 南江县| 上思县| 蒙自县| 麻阳| 循化| 金秀| 高雄市| 台东市| 渭南市| 安多县| 湄潭县| 铜鼓县| 淮安市| 出国| 福泉市| 葫芦岛市| 澄迈县| 海淀区| 含山县| 揭西县| 万山特区| 信丰县| 成都市| 余庆县| 鹰潭市| 无棣县| 景谷|