基于頻繁模式挖掘的風(fēng)電爬坡事件統(tǒng)計(jì)特性建模及預(yù)測(cè)

2021-01-09 05:38屈尹鵬姜尚光孫元章柯德平

電力系統(tǒng)自動(dòng)化 2021年1期

屈尹鵬，徐箭，姜尚光，柳玉，孫元章，柯德平

（1. 武漢大學(xué)電氣與自動(dòng)化學(xué)院,湖北省武漢市430072；2. 國(guó)家電網(wǎng)公司華北分部,北京市100053）

0 引言

風(fēng)電等高比例可再生能源發(fā)電的接入［1］,對(duì)電力系統(tǒng)的輔助服務(wù)［2-3］提出了更高的要求。準(zhǔn)確建立可再生能源爬坡事件的統(tǒng)計(jì)特性和預(yù)測(cè)模型,能更好地為輔助服務(wù)提供數(shù)據(jù)支撐［4-7］。

文獻(xiàn)［8］采用旋轉(zhuǎn)門(mén)算法分析了爬坡事件單屬性統(tǒng)計(jì)特性。文獻(xiàn)［9-10］采用L1 滑窗算法和動(dòng)態(tài)規(guī)劃算法進(jìn)行爬坡檢測(cè),并建立了爬坡參數(shù)的二維統(tǒng)計(jì)特性模型。文獻(xiàn)［11］分析了不同季節(jié)下爬坡參數(shù)統(tǒng)計(jì)特性的差異。文獻(xiàn)［12］分析了風(fēng)電原始數(shù)據(jù)特性對(duì)檢測(cè)到的爬坡事件單個(gè)參數(shù)統(tǒng)計(jì)特性的影響。文獻(xiàn)［13］將風(fēng)電功率映射到頻域空間,建立了爬坡事件各個(gè)參數(shù)的時(shí)頻特性并進(jìn)行分類(lèi)。文獻(xiàn)［14］采用高斯混合模型擬合爬坡參數(shù)的一維概率分布。

風(fēng)電爬坡預(yù)測(cè)可分為間接功率序列預(yù)測(cè)［15-16］和事件預(yù)測(cè)［17-18］兩大類(lèi)。文獻(xiàn)［19］采用優(yōu)化的旋轉(zhuǎn)門(mén)算法從大量風(fēng)電功率預(yù)測(cè)場(chǎng)景中提取風(fēng)電爬坡事件。文獻(xiàn)［20］使用風(fēng)電功率序列多項(xiàng)式logit 結(jié)構(gòu)和分類(lèi)分布估計(jì)爬坡事件超出不同參數(shù)閾值的概率。文獻(xiàn)［21］利用風(fēng)電功率的分位數(shù)生成功率場(chǎng)景,通過(guò)邏輯回歸來(lái)估計(jì)在特定時(shí)間間隔內(nèi)風(fēng)電爬坡發(fā)生的概率。文獻(xiàn)［22］建立了正交檢驗(yàn)和支持向量機(jī)的混合預(yù)測(cè)模型,分析當(dāng)前點(diǎn)發(fā)生爬坡事件的概率。文獻(xiàn)［23］使用Granger 因果檢測(cè)法,構(gòu)建了基于多變量的支持向量機(jī)回歸預(yù)測(cè)模型,對(duì)下一次爬坡事件進(jìn)行預(yù)測(cè)。文獻(xiàn)［24］對(duì)風(fēng)電功率爬坡持續(xù)時(shí)間和爬坡幅值采用原子分解算法進(jìn)行滑動(dòng)分解得到原子分量和殘差分量進(jìn)行預(yù)測(cè),并采用線性回歸方法校正各個(gè)參數(shù)的誤差。

爬坡統(tǒng)計(jì)特性建模的基本現(xiàn)狀是:①對(duì)單個(gè)爬坡事件而言,多為單屬性或雙屬性的統(tǒng)計(jì)特性建模分析；②相鄰爬坡事件之間自相關(guān)統(tǒng)計(jì)特性模型研究較少。針對(duì)上述問(wèn)題,本文提出了爬坡事件的多屬性聯(lián)合統(tǒng)計(jì)特性建模方法?；谠撃Ｐ偷玫脚榔率录幕灸Ｊ?將風(fēng)電功率序列降維為爬坡事件序列,對(duì)其進(jìn)行頻繁項(xiàng)挖掘從而進(jìn)一步建立多個(gè)相鄰爬坡事件之間的自相關(guān)統(tǒng)計(jì)特性模型。

現(xiàn)階段爬坡預(yù)測(cè)尚待解決的主要問(wèn)題體現(xiàn)在:①基于事件的預(yù)測(cè)方法無(wú)法全方位充分利用爬坡事件的歷史信息；②日前爬坡預(yù)測(cè)往往通過(guò)對(duì)日前的風(fēng)電功率預(yù)測(cè)數(shù)據(jù)進(jìn)行爬坡檢測(cè)得到。但由于預(yù)測(cè)的點(diǎn)數(shù)較多、易造成爬坡預(yù)測(cè)誤差的累積和發(fā)散,從而造成爬坡事件的正確捕獲率的降低。針對(duì)上述問(wèn)題,本文基于所提出的爬坡事件基本模式以及爬坡事件的自相關(guān)統(tǒng)計(jì)特性模型,設(shè)計(jì)了一種日前爬坡事件序列預(yù)測(cè)算法。以爬坡事件為預(yù)測(cè)點(diǎn),通過(guò)自相關(guān)模型進(jìn)行迭代,生成新的預(yù)測(cè)事件。相較于以風(fēng)電功率為預(yù)測(cè)點(diǎn)的間接爬坡事件預(yù)測(cè)算法,其有效地減少了爬坡事件預(yù)測(cè)中的誤捕和漏捕現(xiàn)象。

1 爬坡事件多屬性統(tǒng)計(jì)特性建模

1.1 參數(shù)和分辨率自適應(yīng)算法的爬坡事件檢測(cè)

文獻(xiàn)［12］提出了一種對(duì)參數(shù)和數(shù)據(jù)分辨率進(jìn)行魯棒分析的爬坡檢測(cè)算法——參數(shù)和分辨率自適應(yīng)算法（PRAA）,其使用異常旋轉(zhuǎn)門(mén)算法［25］對(duì)原始數(shù)據(jù)進(jìn)行壞數(shù)據(jù)處理和趨勢(shì)擬合,旋轉(zhuǎn)門(mén)的檢測(cè)公式為:

式中:Vc為當(dāng)前被檢測(cè)點(diǎn)的信號(hào)幅值；Vo為起點(diǎn)的信號(hào)幅值；Vg為門(mén)點(diǎn)的信號(hào)幅值；tc為當(dāng)前時(shí)刻；tg為門(mén)點(diǎn)的時(shí)刻；to為起始點(diǎn)的時(shí)刻；Vub為上邊界；Vlb為下邊界；ε 為旋轉(zhuǎn)門(mén)的門(mén)寬。

得到的旋轉(zhuǎn)門(mén)數(shù)據(jù)段代表了原始數(shù)據(jù)的趨勢(shì),可以用來(lái)進(jìn)行爬坡檢測(cè)。該爬坡檢測(cè)共分為如下2 個(gè)階段。

第1 階段用來(lái)合并相鄰的具有相同方向的旋轉(zhuǎn)門(mén)數(shù)據(jù)段。給定一個(gè)風(fēng)電旋轉(zhuǎn)門(mén)序列X ={(t1,p1),(t2,p2),…,(tm,pm),…,(tN,pN)},其中,tm為時(shí)標(biāo),pm為該時(shí)標(biāo)下的風(fēng)電功率,N 為風(fēng)電旋轉(zhuǎn)門(mén)數(shù)據(jù)段總數(shù)。風(fēng)電爬坡事件集合表示為EX={ E1,E2,…,Ed,…,EL},其中,Ed={ sd,ed},sd為第d 個(gè)爬坡事件的起點(diǎn),ed為第d 個(gè)爬坡事件的終點(diǎn),L 為該集合中總的爬坡事件數(shù),則合并標(biāo)準(zhǔn)可寫(xiě)為:

將式（5）—式（9）求出的等效旋轉(zhuǎn)門(mén)參數(shù)代入式（1）中進(jìn)行檢測(cè),若式（1）成立,則這2 個(gè)非有效爬坡事件屬于同一趨勢(shì)段,進(jìn)行合并；否則屬于不同的趨勢(shì)段,繼續(xù)檢測(cè)下一對(duì)非有效爬坡事件。有關(guān)于PRAA 的詳細(xì)信息參見(jiàn)文獻(xiàn)［10］。

在本文中,有效爬坡事件的定義為:

式中:PGN為風(fēng)電場(chǎng)的額定功率。

式（10）和式（11）表示,如果風(fēng)電功率4 h 內(nèi)向上爬坡20% 的額定功率或向下爬坡15% 的額定功率,則判定為發(fā)生一次有效爬坡事件。通過(guò)PRAA得到的所有有效爬坡事件集合和爬坡間隔將作為下一階段爬坡分類(lèi)的輸入數(shù)據(jù)。

1.2 聯(lián)合統(tǒng)計(jì)特性檢測(cè)

爬坡事件具有3 個(gè)重要屬性:爬坡幅值、爬坡斜率和爬坡持續(xù)時(shí)間。通過(guò)對(duì)原始風(fēng)電數(shù)據(jù)進(jìn)行爬坡檢測(cè),可以得到爬坡事件單個(gè)屬性的統(tǒng)計(jì)特性。在此基礎(chǔ)上,對(duì)爬坡事件集合進(jìn)行多屬性聚類(lèi)得到爬坡事件的多屬性統(tǒng)計(jì)特性模型。為了方便對(duì)風(fēng)電功率時(shí)間序列進(jìn)行事件重編碼,本文選擇爬坡起點(diǎn)、爬坡持續(xù)時(shí)間和爬坡終點(diǎn)作為爬坡事件的數(shù)據(jù)屬性。需要注意的是,這3 個(gè)屬性同樣包含了幅值和斜率信息。通過(guò)實(shí)驗(yàn)發(fā)現(xiàn),爬坡事件的聯(lián)合分布圖具有分布區(qū)域形狀復(fù)雜、分布密度具有伸縮性和延展性等特點(diǎn)。以中國(guó)某風(fēng)電場(chǎng)一年實(shí)測(cè)數(shù)據(jù)中的向上爬坡事件為例,爬坡事件多屬性聯(lián)合分布圖如附錄A圖A1 所示。

附錄A 圖A1（a）中,紅色圓圈部分為高密度區(qū)域,綠色圓圈部分為中密度區(qū)域,剩余部分為低密度區(qū)域；圖A1（b）中,紅色三角形部分為高密度區(qū)域,綠色三角形部分為中密度區(qū)域,剩余部分為低密度區(qū)域。由于在一個(gè)聚類(lèi)過(guò)程中需要不同的密度參數(shù),而常見(jiàn)的密度算法［26］對(duì)輸入的參數(shù)極為敏感,因此不適用。又由于簇形狀的復(fù)雜性,使得圓形簇聚類(lèi)算法如K-means 算法［27］也不適用。

針對(duì)上述難點(diǎn),本文使用排序識(shí)別聚類(lèi)結(jié)構(gòu)（ordering points to identify clustering structure,OPTICS）算法［26］進(jìn)行數(shù)據(jù)挖掘,通過(guò)輸出點(diǎn)的距離排序的方式聚類(lèi),因此能夠檢測(cè)到任意形狀的簇,并保持對(duì)輸入?yún)?shù)的魯棒性,適用于風(fēng)電爬坡事件多屬性聯(lián)合統(tǒng)計(jì)特性檢測(cè)。OPTICS 算法的基本參數(shù)及原理見(jiàn)附錄A。

在進(jìn)行聚類(lèi)之前為了保證點(diǎn)距離不會(huì)被某一個(gè)數(shù)據(jù)屬性所淹沒(méi),需要對(duì)所有數(shù)據(jù)點(diǎn)的屬性值進(jìn)行標(biāo)準(zhǔn)化,即轉(zhuǎn)化到一個(gè)特定的數(shù)據(jù)區(qū)間內(nèi),如[-1,1]。為了防止噪聲點(diǎn)對(duì)標(biāo)準(zhǔn)化的影響,本文使用中位數(shù)和絕對(duì)標(biāo)準(zhǔn)差進(jìn)行數(shù)據(jù)x 的標(biāo)準(zhǔn)化,即

式中:Asd為絕對(duì)標(biāo)準(zhǔn)差；xmid為中位數(shù)；Md為對(duì)象的個(gè)數(shù)；xq為第q 個(gè)對(duì)象。

OPTICS 算法流程見(jiàn)附錄A 圖A3。不斷更新有序隊(duì)列（核心點(diǎn)及該核心點(diǎn)的直接密度可達(dá)點(diǎn)）和結(jié)果隊(duì)列（存儲(chǔ)樣本輸出及處理次序）,直至數(shù)據(jù)庫(kù)為空。最后,OPTICS 算法輸出的結(jié)果隊(duì)列保證了距離近的點(diǎn)在一起,可根據(jù)簇排序決定最后實(shí)際的輸出聚類(lèi),從而檢測(cè)出爬坡事件的基本模式即多屬性聯(lián)合統(tǒng)計(jì)特性。

2 基于關(guān)聯(lián)規(guī)則算法的爬坡事件自相關(guān)性建模及預(yù)測(cè)

2.1 時(shí)序序列的事件編碼

基于功率時(shí)序序列的日前爬坡預(yù)測(cè)易造成誤捕和漏捕的很大一部分原因是預(yù)測(cè)的點(diǎn)數(shù)較多,誤差的累積和發(fā)散難以控制。因此,如何從功率序列中提取出有效信息和摒棄冗余信息來(lái)進(jìn)行時(shí)序序列降維,對(duì)減少爬坡預(yù)測(cè)的預(yù)測(cè)點(diǎn)和提高事件捕獲率顯得尤為關(guān)鍵。

通過(guò)爬坡事件聚類(lèi)所用的數(shù)據(jù)屬性（爬坡起點(diǎn)、爬坡終點(diǎn)、爬坡持續(xù)時(shí)間和爬坡間隔持續(xù)時(shí)間）能夠完整地表達(dá)時(shí)序序列中的爬坡信息。再者,使用爬坡事件和爬坡間隔進(jìn)行聚類(lèi)得到的爬坡模式完成對(duì)時(shí)序序列的重新編碼,如圖1 所示。時(shí)序序列{(t42,p42),(t43,p43)…,(t190,p190)}能夠重編碼為事件序列{A,B,C},其中,A,B,C 為爬坡事件聚類(lèi)得到的爬坡模式（簇）。以模式A 數(shù)據(jù)段為例,數(shù)據(jù)段內(nèi)的小幅波動(dòng)信息對(duì)于爬坡事件來(lái)說(shuō)為冗余信息,而紅色直線為爬坡事件,包含有效的爬坡信息（爬坡幅值、爬坡持續(xù)時(shí)間、爬坡起點(diǎn)、爬坡斜率等）。由于模式A 為爬坡聚類(lèi)得到的基本模式（簇心）,因此,若使用模式A 來(lái)代表該爬坡事件,會(huì)損失一定程度的爬坡信息,然而由于模式A 為聚類(lèi)的簇心,因此損失的信息是有限的。同樣對(duì)模式B 和模式C 的數(shù)據(jù)段進(jìn)行降維編碼之后,可將一個(gè)150 維的功率序列降維為一個(gè)3 維的事件序列。

圖1 事件編碼圖Fig.1 Diagram of event encoding

2.2 關(guān)聯(lián)規(guī)則算法的關(guān)聯(lián)性分析

在風(fēng)電功率預(yù)測(cè)中,風(fēng)電功率的自相關(guān)特性往往被用來(lái)進(jìn)行功率序列的預(yù)測(cè)。然而在爬坡預(yù)測(cè)模型中,由于缺少類(lèi)似的風(fēng)電爬坡事件的自相關(guān)統(tǒng)計(jì)特性模型,現(xiàn)階段基于事件的爬坡預(yù)測(cè)大部分集中于中短期的爬坡預(yù)測(cè),因此在進(jìn)行了功率序列的事件重編碼之后,進(jìn)一步挖掘出爬坡事件的自相關(guān)特性,有助于爬坡事件序列預(yù)測(cè)模型的建模。

本文采用關(guān)聯(lián)規(guī)則挖掘算法——APRIORI 算法進(jìn)行爬坡事件頻繁模式挖掘,建立爬坡事件的自相關(guān)統(tǒng)計(jì)特性模型。APRIORI 算法［26］的基本參數(shù)及原理見(jiàn)附錄B。

本文應(yīng)用上述方法對(duì)2.1 節(jié)中的模式事件序列進(jìn)行搜索。由于相隔較遠(yuǎn)的爬坡事件相關(guān)性較小,只需考慮到頻繁四項(xiàng)集即可,即依次包含2 起爬坡事件和2 個(gè)爬坡間隔的頻繁項(xiàng)集。因此,從頻繁二項(xiàng)集到頻繁四項(xiàng)集包含了爬坡事件的自相關(guān)信息。例如,附錄B 圖B1 中,在模式A 發(fā)生之后,模式B 發(fā)生的概率如式（14）所示,其中（A,B）、（A,E）、（A,F）為所有包含模式A 的頻繁二項(xiàng)集,從而建立起模式A 和模式B 的自相關(guān)特性。

式中:SC(?)為支持度計(jì)數(shù)函數(shù)；E 和F 為爬坡模式。

2.3 基于事件序列的爬坡預(yù)測(cè)模型

為了展示爬坡事件的聯(lián)合屬性統(tǒng)計(jì)特性和自相關(guān)統(tǒng)計(jì)特性對(duì)于風(fēng)電爬坡預(yù)測(cè)的數(shù)據(jù)支撐作用,本文研究了一種基于上述統(tǒng)計(jì)特性模型的爬坡事件序列預(yù)測(cè)的基本概念和模型。

本文采用功率事件對(duì)的形式交替進(jìn)行預(yù)測(cè)。給定一個(gè)功率點(diǎn)事件對(duì)Fd={(td,pd),Rd},td為第d 個(gè)爬坡事件起點(diǎn)時(shí)刻,pd為第d 個(gè)爬坡事件起點(diǎn)的功率值,Rd=(Ud,Gd)為第d 個(gè)爬坡事件,其中,Ud為持續(xù)時(shí)間,Gd為爬坡幅值,若為爬坡間隔模式,則爬坡幅值為0。給定預(yù)測(cè)起始點(diǎn)前3 個(gè)爬坡模式為{MO1,MO2,MO3},頻繁二項(xiàng)集至頻繁四項(xiàng)集的支持度計(jì)數(shù)分別為SC2(?),SC3(?),SC4(?),括號(hào)內(nèi)為相應(yīng)的模式。將首個(gè)功率事件對(duì)的功率點(diǎn)設(shè)置為第3 個(gè)爬坡模式的終點(diǎn),則首個(gè)爬坡事件的預(yù)測(cè)模型為:

其中,K 為頻繁四項(xiàng)集中前 3 項(xiàng)為{MO1,MO2,MO3}的頻繁項(xiàng)的總個(gè)數(shù),Mk為其中第k 個(gè)頻繁項(xiàng)的第4 個(gè)模式。需要注意的是,若K 為0,刪除MO1,在頻繁三項(xiàng)集中進(jìn)行匹配,若仍然沒(méi)有匹配到相應(yīng)的頻繁項(xiàng),則在頻繁二項(xiàng)集中進(jìn)行搜索。直至得到首個(gè)功率事件對(duì)F1={(t1,p1),R1},接著進(jìn)行第2 個(gè)功率事件對(duì)功率點(diǎn)的預(yù)測(cè),其預(yù)測(cè)模型為:

提取第1 個(gè)爬坡事件的起點(diǎn)、爬坡終點(diǎn)和爬坡持續(xù)時(shí)間,計(jì)算其與已有各個(gè)模式簇心的距離,將其歸為距離其簇心最近的模式,設(shè)為MOn,然后更新前3 個(gè)爬坡模式為:

在更新完已有模式之后,用式（15）進(jìn)行第2 個(gè)爬坡事件的預(yù)測(cè),用式（16）和式（17）進(jìn)行第3 個(gè)功率事件對(duì)功率點(diǎn)的預(yù)測(cè),重復(fù)該過(guò)程,交替預(yù)測(cè)功率事件對(duì)的功率點(diǎn)和爬坡事件并更新,直至完成一天的爬坡事件預(yù)測(cè)。式（15）—式（18）為爬坡事件序列預(yù)測(cè)模型,其流程圖見(jiàn)附錄C 圖C1。

從預(yù)測(cè)模型中可以發(fā)現(xiàn),正是由于爬坡事件自相關(guān)模型的建立,才能夠通過(guò)式（15）由歷史爬坡事件序列推導(dǎo)出新的爬坡事件序列。且由于對(duì)功率序列進(jìn)行了降維,減弱了預(yù)測(cè)誤差累積及發(fā)散,從而提高了爬坡事件的捕獲率。

整體算法的結(jié)構(gòu)圖見(jiàn)附錄C 圖C2。爬坡檢測(cè)為所有算法的基礎(chǔ),本文所使用的PRAA 能夠?qū)Σ煌瑪?shù)據(jù)源和數(shù)據(jù)屬性（如分辨率）的數(shù)據(jù)庫(kù)進(jìn)行原始數(shù)據(jù)處理和爬坡檢測(cè),得到的有效爬坡事件集合作為其他算法的輸入數(shù)據(jù)。對(duì)PRAA 得到的爬坡事件集合使用OPTICS 算法進(jìn)行爬坡聚類(lèi),可以得到爬坡事件的多屬性統(tǒng)計(jì)特性建模,即基本爬坡事件模式?；贠PTICS 算法得到的基本爬坡模式,對(duì)風(fēng)電功率序列進(jìn)行事件重編碼,使用關(guān)聯(lián)規(guī)則算法對(duì)事件序列進(jìn)行頻繁模式挖掘,即可以得到爬坡事件的自相關(guān)統(tǒng)計(jì)特性模型。所得到的單爬坡事件多屬性統(tǒng)計(jì)特性模型和爬坡事件自相關(guān)統(tǒng)計(jì)特性模型為輔助服務(wù)或爬坡預(yù)測(cè)等高級(jí)應(yīng)用提供數(shù)據(jù)支撐。

3 算例分析

本文通過(guò)2 個(gè)實(shí)際風(fēng)電場(chǎng)的原始數(shù)據(jù)集來(lái)驗(yàn)證所提算法的有效性。第1 個(gè)數(shù)據(jù)集來(lái)自BPA（Bonneville Power Authority）,包含2 年共184 032 個(gè)數(shù)據(jù)樣本,采樣時(shí)間間隔為200 s。該數(shù)據(jù)集主要用來(lái)展示所提的爬坡聚類(lèi)方法并驗(yàn)證其有效性。第2個(gè)數(shù)據(jù)集來(lái)自中國(guó)中部省份某風(fēng)電場(chǎng),共包含1 年6 個(gè)月的風(fēng)電功率數(shù)據(jù),采樣時(shí)間間隔為15 min,有58 477 個(gè)實(shí)測(cè)點(diǎn)和58 477 個(gè)預(yù)測(cè)點(diǎn)（來(lái)自某商用預(yù)測(cè)軟件）。該數(shù)據(jù)集主要用來(lái)驗(yàn)證所提爬坡事件自相關(guān)統(tǒng)計(jì)特性建模方法并對(duì)比展示基于事件序列的爬坡預(yù)測(cè)效果。其中,1 年5 個(gè)月的數(shù)據(jù)用來(lái)做樣本學(xué)習(xí)集,剩余1 個(gè)月的數(shù)據(jù)用來(lái)驗(yàn)證預(yù)測(cè)算法。

3.1 數(shù)據(jù)集1 算例

對(duì)BPA 的原始風(fēng)電數(shù)據(jù)進(jìn)行PRAA 爬坡檢測(cè),共檢測(cè)到1 062 次有效爬坡事件,其中包括478 次上爬坡事件和584 次下爬坡事件。檢測(cè)到的上爬坡事件的二維屬性分布見(jiàn)附錄D 圖D1。從圖D1 中可以發(fā)現(xiàn),小幅值、短時(shí)間的爬坡事件密度較高,而爬坡起點(diǎn)和終點(diǎn)的分布則相對(duì)而言較為均勻,呈現(xiàn)倒三角的形式。上爬坡事件的三維屬性（爬坡起點(diǎn)、爬坡終點(diǎn)和爬坡持續(xù)時(shí)間）的整體分布圖以及使用OPTICS 進(jìn)行聚類(lèi)得到的結(jié)果如圖2 所示。BPA 的上爬坡事件分類(lèi)如表1 所示。

圖2 上爬坡事件聚類(lèi)圖Fig.2 Cluster diagram of up-ramp events

表1 BPA 的上爬坡事件分類(lèi)Table 1 Classification of up-ramp for BPA

對(duì)上爬坡事件聚類(lèi)得到3 種模式,如表1 和圖2所示。其中,模式1 和模式2 均代表小幅值且短時(shí)間的爬坡事件,區(qū)別在于模式1 的爬坡起點(diǎn)較低而模式2 則表征高起點(diǎn)的爬坡事件,小幅值且短時(shí)間的上爬坡事件占所有上爬坡事件的86.4%。模式3代表大幅值、長(zhǎng)持續(xù)時(shí)間且低起點(diǎn)的上爬坡事件,其占比為13.6%。

檢測(cè)到的下爬坡事件的二維屬性分布見(jiàn)附錄D圖D2,其整體分布特性與上爬坡事件分布特性類(lèi)似。對(duì)下爬坡事件聚類(lèi)得到4 種模式,見(jiàn)表D1 和圖D3。其中,模式5 代表小幅值、超短持續(xù)時(shí)間且高起點(diǎn)的爬坡事件,占比為35.96%；模式6 代表小幅值、短持續(xù)時(shí)間且低起點(diǎn)的爬坡事件,占比為40.07%；模式7 代表大幅值、超長(zhǎng)持續(xù)時(shí)間且低起點(diǎn)的爬坡事件,占比為12.67%；模式8 代表大幅值、長(zhǎng)持續(xù)時(shí)間且高起點(diǎn)的爬坡事件,占比為11.99%。

爬坡間隔由持續(xù)時(shí)間構(gòu)成,對(duì)其進(jìn)行聚類(lèi),可得到6 種模式,見(jiàn)附錄D 表D2?？梢园l(fā)現(xiàn),短期的爬坡間隔占比較高。如4 h 內(nèi)的爬坡間隔占比為73.43%。而長(zhǎng)時(shí)間的爬坡間隔如9 h 以上的則占比較少,為26.57%。需要特別注意的是模式12,其爬坡間隔時(shí)長(zhǎng)為0,說(shuō)明發(fā)生了連續(xù)爬坡事件,如發(fā)生了上爬坡事件之后立刻發(fā)生下爬坡事件,該類(lèi)事件所造成的爬坡間隔為0 的占比為22.6%。若該類(lèi)爬坡間隔的占比較高,說(shuō)明該地區(qū)的風(fēng)電波動(dòng)相當(dāng)頻繁,否則說(shuō)明該地區(qū)的風(fēng)電相對(duì)平穩(wěn)。因此,爬坡間隔為0 占整體爬坡間隔的比例能夠作為一個(gè)地區(qū)風(fēng)電波動(dòng)特性的體現(xiàn)。

至此,數(shù)據(jù)集1 的爬坡事件多屬性聯(lián)合統(tǒng)計(jì)特性檢測(cè)完成。在單屬性的統(tǒng)計(jì)特性的基礎(chǔ)上,多屬性統(tǒng)計(jì)特性模型進(jìn)一步完善了爬坡事件統(tǒng)計(jì)特性建模,使得對(duì)于爬坡事件的描述更加直觀和完整,對(duì)風(fēng)電爬坡預(yù)測(cè)能夠給予更好的數(shù)據(jù)支撐。

3.2 數(shù)據(jù)集2 算例

對(duì)數(shù)據(jù)集2 的實(shí)測(cè)數(shù)據(jù)學(xué)習(xí)集進(jìn)行爬坡檢測(cè)并進(jìn)行事件聚類(lèi),得到5 個(gè)上爬坡模式、5 個(gè)下爬坡模式和6 個(gè)爬坡間隔模式。如前所述,數(shù)據(jù)集2 主要用來(lái)驗(yàn)證爬坡事件自相關(guān)統(tǒng)計(jì)特性模型,由于篇幅限制,其聚類(lèi)結(jié)果不在此展示。

為便于事件編碼,將上爬坡模式編號(hào)為1～5,下爬坡模式編號(hào)為6～10,爬坡間隔模式編號(hào)為11～16。對(duì)重編碼之后的事件序列進(jìn)行APRIORI算法關(guān)聯(lián)性分析,設(shè)定頻繁項(xiàng)閾值為10 個(gè)支持度計(jì)數(shù)。

如附錄D 圖D4 所示,共搜索到91 個(gè)頻繁二項(xiàng)、126 個(gè)頻繁三項(xiàng)和33 個(gè)頻繁四項(xiàng)。其中,頻繁二項(xiàng)集總的支持度計(jì)數(shù)和為4 534,頻繁三項(xiàng)集的支持度計(jì)數(shù)和為2 587,頻繁四項(xiàng)集的支持度計(jì)數(shù)和為537。圖3 和附錄D 圖D5 分別為頻繁四項(xiàng)集和頻繁三項(xiàng)集具有相同N -1 前綴項(xiàng)的示例。

圖3 頻繁四項(xiàng)集自相關(guān)特性示例Fig.3 An example of autocorrelation characteristicin frequent four itemset

圖3 顯示前綴為11,1,11 的頻繁四項(xiàng)第4 項(xiàng)的概率圖。其中,模式11 為爬坡間隔模式,持續(xù)時(shí)間為0,模式1 為上爬坡模式。從圖中可以看出,當(dāng)前面接連發(fā)生爬坡事件（間隔）的模式分別為11,1,11后,緊接著會(huì)發(fā)生一起下爬坡事件（模式7,8,9 均代表下爬坡事件）且模式8 下爬坡事件概率最大,為49%。模式7 和9 下爬坡事件的發(fā)生概率相近,分別為24%和27%。這樣就建立了模式11,1,11 和模式7,8,9 的自相關(guān)特性統(tǒng)計(jì)特性模型。但由于頻繁四項(xiàng)集內(nèi)項(xiàng)數(shù)較少,在某些情況下可能匹配不到相同的前綴,此時(shí)需從頻繁三項(xiàng)集中進(jìn)行搜索。

如附錄D 圖D5 所示,當(dāng)發(fā)生了模式9 和11 的爬坡事件和爬坡間隔之后,接下來(lái)會(huì)發(fā)生一起上爬坡事件（模式1,2,3,4 均代表上爬坡事件）,其中模式2和3 上爬坡事件的概率較大,分別為35%和33%,而發(fā)生模式1 和4 上爬坡事件的概率較小,分別為14%和17%。這樣就建立了模式9,11 和模式1,2,3,4 的自相關(guān)統(tǒng)計(jì)特性模型。同樣,若在頻繁三項(xiàng)集中匹配不到前綴,則繼續(xù)搜索頻繁二項(xiàng)集。因此,頻繁二項(xiàng)集、頻繁三項(xiàng)集和頻繁四項(xiàng)集表征了爬坡事件的自相關(guān)特性。

為了展示這種基于事件序列自相關(guān)特性的風(fēng)電爬坡事件預(yù)測(cè)方法的效果,本文將其所得到的結(jié)果與基于風(fēng)電場(chǎng)風(fēng)電功率預(yù)測(cè)序列的爬坡檢測(cè)結(jié)果進(jìn)行對(duì)比。

如附錄D 圖D6 所示,一個(gè)月的實(shí)際風(fēng)電功率數(shù)據(jù)中共檢測(cè)到150 起有效風(fēng)電爬坡事件,而風(fēng)電功率預(yù)測(cè)數(shù)據(jù)中僅檢測(cè)到39 起爬坡事件,并且出現(xiàn)多次誤捕的現(xiàn)象。該預(yù)測(cè)軟件預(yù)測(cè)周期為24 h,預(yù)測(cè)數(shù)據(jù)分辨率為15 min,即一天產(chǎn)生96 個(gè)預(yù)測(cè)點(diǎn)。漏捕的主要原因是爬坡誤差在96 點(diǎn)預(yù)測(cè)過(guò)程中的不斷積累和發(fā)散。然而,本文所提的基于事件序列自相關(guān)特性的風(fēng)電爬坡事件預(yù)測(cè)能夠預(yù)測(cè)到168 起爬坡事件,其中,誤捕27 次、漏捕9 次。圖4 展示了該月第一天的預(yù)測(cè)效果。日前捕獲率相較于基于功率序列的爬坡預(yù)測(cè)有了提高。這也體現(xiàn)了本文所研究的爬坡事件多屬性統(tǒng)計(jì)特性模型和爬坡事件自相關(guān)統(tǒng)計(jì)特性模型對(duì)于日前爬坡預(yù)測(cè)所提供的數(shù)據(jù)支撐的有效性。

圖4 一天預(yù)測(cè)效果對(duì)比Fig.4 Comparision of forecasting results in one day

從圖4 中可以發(fā)現(xiàn),雖然風(fēng)電功率預(yù)測(cè)序列能夠大致在趨勢(shì)上擬合實(shí)際的風(fēng)電功率序列,但由于其預(yù)測(cè)誤差會(huì)隨時(shí)間發(fā)散,無(wú)法起到爬坡預(yù)測(cè)的作用。相反的,若使用基于事件序列自相關(guān)特性的爬坡預(yù)測(cè)方法,雖然無(wú)法提供逐點(diǎn)的風(fēng)電功率序列信息,但卻能夠在爬坡事件上做到相當(dāng)高的捕獲率。從算例結(jié)果中發(fā)現(xiàn),漏捕9 次的主要原因如圖4 綠色虛線所示,由于爬坡起點(diǎn)的預(yù)測(cè)誤差累積,導(dǎo)致一天之內(nèi)最后一起預(yù)測(cè)爬坡事件起點(diǎn)距離預(yù)測(cè)起點(diǎn)超過(guò)24 h,因此沒(méi)有計(jì)入當(dāng)日的預(yù)測(cè)事件中,從而出現(xiàn)漏捕事件。從上述算例中可以發(fā)現(xiàn),僅依靠風(fēng)電功率進(jìn)行爬坡預(yù)測(cè)的精確性仍然有提高的空間。

4 結(jié)語(yǔ)

本文利用數(shù)據(jù)挖掘技術(shù)、設(shè)計(jì)了一套爬坡事件統(tǒng)計(jì)特性建模方法,主要包含以下幾個(gè)步驟:①PRAA 的原始風(fēng)電數(shù)據(jù)爬坡檢測(cè),得到歷史風(fēng)電爬坡數(shù)據(jù)集；②OPTICS 算法爬坡聚類(lèi),得到單爬坡事件多屬性統(tǒng)計(jì)特性模型；③關(guān)聯(lián)規(guī)則算法頻繁模式挖掘,得到爬坡事件自相關(guān)統(tǒng)計(jì)特性模型。通過(guò)BPA 風(fēng)電場(chǎng)數(shù)據(jù)和國(guó)內(nèi)某風(fēng)電場(chǎng)數(shù)據(jù)的對(duì)比驗(yàn)證可以發(fā)現(xiàn),所提算法的多屬性聯(lián)合統(tǒng)計(jì)特性模型相較于單屬性或雙屬性統(tǒng)計(jì)特性模型能夠更為完整且直觀地提供爬坡事件信息。所提出的爬坡事件自相關(guān)統(tǒng)計(jì)特性模型在以往僅提供單個(gè)爬坡事件的統(tǒng)計(jì)特性模型的基礎(chǔ)上,能夠進(jìn)一步提供相鄰爬坡事件的相關(guān)特性。

在此基礎(chǔ)上,本文研究了基于上述模型的日前爬坡事件序列預(yù)測(cè)的基本概念和模型。實(shí)驗(yàn)證明,相較于某商業(yè)軟件的基于風(fēng)電功率序列的間接爬坡預(yù)測(cè)算法,本文所研究的方法在不包含誤差控制算法的前提下,能夠提供更高的爬坡事件捕獲率,將漏捕事件從功率事件序列預(yù)測(cè)算法中的111 次減少到了9 次,反映了本文所研究的爬坡事件統(tǒng)計(jì)特性模型對(duì)于爬坡預(yù)測(cè)算法的數(shù)據(jù)支撐作用。

本文所提預(yù)測(cè)模型僅包含了風(fēng)電功率數(shù)據(jù),在未來(lái)工作中,將通過(guò)引入數(shù)值天氣預(yù)報(bào)數(shù)據(jù)來(lái)抑制爬坡事件預(yù)測(cè)誤差的累積和發(fā)散,進(jìn)一步提升爬坡事件預(yù)測(cè)算法的正確捕獲率,合理選擇預(yù)測(cè)時(shí)間窗,建立中長(zhǎng)期的爬坡事件序列預(yù)測(cè)模型。

附錄見(jiàn)本刊網(wǎng)絡(luò)版（http：//www.aeps-info.com/aeps/ch/index.aspx），掃英文摘要后二維碼可以閱讀網(wǎng)絡(luò)全文。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡