国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

改進(jìn)Bayesian后驗(yàn)比的異常風(fēng)速值檢測(cè)方法

2017-04-14 12:44:54陳偉吳布托裴喜平王懿喆
電網(wǎng)與清潔能源 2017年2期
關(guān)鍵詞:后驗(yàn)殘差風(fēng)速

陳偉,吳布托,裴喜平,王懿喆

(蘭州理工大學(xué)電氣工程與信息工程學(xué)院,甘肅蘭州 730050)

改進(jìn)Bayesian后驗(yàn)比的異常風(fēng)速值檢測(cè)方法

陳偉,吳布托,裴喜平,王懿喆

(蘭州理工大學(xué)電氣工程與信息工程學(xué)院,甘肅蘭州 730050)

風(fēng)電場(chǎng)運(yùn)行數(shù)據(jù)中含有異常風(fēng)速值,為了優(yōu)化風(fēng)電數(shù)據(jù)的質(zhì)量,提出了組合預(yù)測(cè)與Bayesian后驗(yàn)比的異常值檢測(cè)方法。為了降低預(yù)測(cè)誤差,先對(duì)風(fēng)速序列建立Adaboost-BP網(wǎng)絡(luò)和EMD-LV-SVM的組合預(yù)測(cè)模型,利用預(yù)測(cè)值與測(cè)量值的偏差得到含有粗大誤差的殘差序列;為了提高檢測(cè)方法的可靠性,采用Bayesian后驗(yàn)比的檢驗(yàn)方法識(shí)別殘差序列中粗大

異常風(fēng)速值檢測(cè);組合預(yù)測(cè)模型;殘差分析;Bayesian后驗(yàn)比

風(fēng)電場(chǎng)運(yùn)行數(shù)據(jù)中的風(fēng)速值是分析監(jiān)測(cè)風(fēng)機(jī)運(yùn)行狀態(tài)和預(yù)測(cè)風(fēng)機(jī)出力情況的重要依據(jù)。因傳感器故障和傳輸信道噪聲產(chǎn)生的異常疊加在監(jiān)控終端的數(shù)據(jù)中,由于風(fēng)速特有的間歇性和不確定性[1],造成異常值在風(fēng)速序列特征信息不明顯,使得異常值辨識(shí)困難。

在諸多風(fēng)速功率預(yù)測(cè)方法中,如人工神經(jīng)網(wǎng)絡(luò)[2-4]、支持向量機(jī)[5]、卡爾曼濾波[6]和時(shí)間序列分析法[7-8]都直接采用測(cè)量數(shù)據(jù)進(jìn)行分析計(jì)算,對(duì)含有異常值的數(shù)據(jù)建模分析勢(shì)必會(huì)影響預(yù)測(cè)精度。因此,分析數(shù)據(jù)前需要對(duì)異常數(shù)據(jù)識(shí)別與修正。在異常數(shù)據(jù)檢測(cè)方面,文獻(xiàn)[9]最早提出了運(yùn)用統(tǒng)計(jì)學(xué)的思想檢測(cè)異常值,根據(jù)歷史數(shù)據(jù)設(shè)定一個(gè)概率模型,如果數(shù)據(jù)服從同一分布則判定為正常值,反之則為異常數(shù)據(jù)點(diǎn),該方法的統(tǒng)計(jì)量計(jì)算復(fù)雜且統(tǒng)計(jì)參數(shù)對(duì)辨識(shí)異常值異常敏感。文獻(xiàn)[10]是基于距離的方法檢測(cè)異常值,需要計(jì)算每個(gè)點(diǎn)之間的距離,通過(guò)相似度檢測(cè)異常距離,因計(jì)算量過(guò)大,不適處理大量的風(fēng)速時(shí)間序列。文獻(xiàn)[11]提出了小波模極大值的方法辨識(shí)異常風(fēng)速值,該方法通過(guò)采用閾值和Lipschitz指數(shù)聯(lián)合判定異常風(fēng)速值,由于小波方法不能兼顧時(shí)間分辨率和頻率分辨率,易產(chǎn)生漏檢現(xiàn)象。文獻(xiàn)[12]提出了采用Gibbs抽樣算法估計(jì)Bayesian參數(shù)并通過(guò)閾值檢測(cè)異常值,該方法只適用于線性系統(tǒng)不適用于多變的風(fēng)速序列。文獻(xiàn)[13]提出了利用支持向量機(jī)的回歸估計(jì)值與實(shí)測(cè)值之間的殘差來(lái)識(shí)別測(cè)量數(shù)據(jù)中的異常數(shù),由于擬合殘差的方差異常敏感,方差值決定著辨識(shí)粗大誤差的準(zhǔn)確性。

基于以上分析,結(jié)合傳統(tǒng)殘差分析和Bayesian參數(shù)估計(jì)方法,本文提出了組合預(yù)測(cè)模型和邊緣化后驗(yàn)比的方法檢測(cè)異常風(fēng)速值。首先分別建立Adaboost-BP網(wǎng)絡(luò)和EMD-LS-SVM的單一預(yù)測(cè)模型,通過(guò)計(jì)算每個(gè)模型的方差確定組合預(yù)測(cè)模型的最優(yōu)權(quán)重系數(shù),使得到的殘差序列更準(zhǔn)確。為了降低Bayesian后驗(yàn)概率的未知參數(shù)的數(shù)目,對(duì)其參數(shù)邊緣化處理可簡(jiǎn)化計(jì)算方法,并剔除后驗(yàn)比值小于檢測(cè)閾值的異常風(fēng)速值。最后采用ARIMA方法修正異常風(fēng)速點(diǎn),從而優(yōu)化了風(fēng)速數(shù)據(jù)的質(zhì)量。通過(guò)對(duì)仿真數(shù)據(jù)異常點(diǎn)的檢測(cè)結(jié)果驗(yàn)證了本文方法的可行性,并對(duì)甘肅酒泉風(fēng)電場(chǎng)的實(shí)測(cè)運(yùn)行風(fēng)速序列進(jìn)行異常檢測(cè)和修正,預(yù)測(cè)結(jié)果表明對(duì)風(fēng)速數(shù)據(jù)處理后可提高預(yù)測(cè)精度。

1 異常風(fēng)速值檢測(cè)算法

由于異常風(fēng)速值在風(fēng)速序列中表征不明顯,用現(xiàn)有的異常檢測(cè)方法不易檢測(cè)出[14-17],為了凸顯異常風(fēng)速值的特征信息,本文通過(guò)建立風(fēng)速預(yù)測(cè)模型計(jì)算出預(yù)測(cè)值,比較預(yù)測(cè)值與測(cè)量值之間的差值,得到異常特征明顯的殘差序列。殘差序列是由隨機(jī)誤差、系統(tǒng)誤差和粗大誤差構(gòu)成,而系統(tǒng)誤差受風(fēng)速傳感器測(cè)量精度和風(fēng)速預(yù)測(cè)精度的影響,系統(tǒng)誤差幅值波動(dòng)穩(wěn)定,誤差的絕對(duì)值小于等于3σ[18],且服從高斯分布。而粗大誤差是由傳感器故障和數(shù)據(jù)存儲(chǔ)故障產(chǎn)生,具有隨機(jī)性和幅值波動(dòng)大的特點(diǎn)[19],其誤差絕對(duì)值大于3σ。針對(duì)這種特點(diǎn),本文利用邊緣化后驗(yàn)比的方法檢測(cè)識(shí)別粗大誤差點(diǎn),從而間接地檢測(cè)出風(fēng)速序列的異常值。

1.1 預(yù)測(cè)模型的選取

常見(jiàn)的風(fēng)速預(yù)測(cè)模型包括:持續(xù)法[20]、ARMA預(yù)測(cè)法、神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)法和支持向量機(jī)預(yù)測(cè)法。由于風(fēng)速的隨機(jī)性和間歇性,造成單一預(yù)測(cè)模型精度不高,預(yù)測(cè)模型的系統(tǒng)誤差較大,不利于準(zhǔn)確識(shí)別殘差序列中的粗大誤差值。因此,本文選取基于自方差優(yōu)選的組合預(yù)測(cè)方法提高預(yù)測(cè)精度,盡可能地使系統(tǒng)誤差達(dá)到最小,盡可能地接近真實(shí)風(fēng)速時(shí)間序列。

1.1.1 Adaboost-BP模型

在BP網(wǎng)絡(luò)建立過(guò)程中存在過(guò)擬合、泛化能力弱和易陷入局部最優(yōu)的問(wèn)題,本文引入Adaboost迭代算法改進(jìn)BP算法[21-22],使其將訓(xùn)練集中不同的弱學(xué)習(xí)器結(jié)合起來(lái)搭建成一個(gè)穩(wěn)健的強(qiáng)學(xué)習(xí)器。Adaboost迭代算法的基本思想是在訓(xùn)練過(guò)程中重視預(yù)測(cè)誤差大的樣本和性能好的弱學(xué)習(xí)器,從而提高了BP網(wǎng)絡(luò)的泛化能力和預(yù)測(cè)精度。

建立Adaboost-BP模型的過(guò)程如下:

1)對(duì)訓(xùn)練集進(jìn)行數(shù)據(jù)歸一化處理,然后將數(shù)據(jù)分成N組,每組數(shù)據(jù)中含有n個(gè)訓(xùn)練值和m個(gè)預(yù)測(cè)數(shù)據(jù)。

2)隨機(jī)選取一組數(shù)據(jù),建立結(jié)構(gòu)為3-6-1的BP網(wǎng)絡(luò),其中NN(tx)表示第t次構(gòu)建的BP網(wǎng)絡(luò)。在該網(wǎng)絡(luò)下計(jì)算每組數(shù)據(jù)的預(yù)測(cè)誤差εi和N組數(shù)據(jù)的平均

3)更新樣本權(quán)重Dt其中βt=εt/的歸一化因子,D0(i)=1/N。根據(jù)βt可得到弱學(xué)習(xí)器的權(quán)重為

4)重復(fù)步驟2)和3),直到迭代的次數(shù)T>10或者預(yù)測(cè)平均誤差εt<10-5跳出循環(huán)。

5)最終得到強(qiáng)學(xué)習(xí)器的Adaboost-BP預(yù)測(cè)模型表達(dá)式為

1.1.2 EMD-LS-SVM模型

風(fēng)速序列是一組隨機(jī)性較強(qiáng)的非線性、非穩(wěn)態(tài)的時(shí)間序列,單一的模型存在預(yù)測(cè)精度低、泛化能力弱的問(wèn)題。經(jīng)驗(yàn)?zāi)B(tài)分解[23]EMD常用于處理非線性、非穩(wěn)態(tài)的信號(hào),把信號(hào)分解成不同頻率的序列,降低了信號(hào)中的不同頻率之間的相互影響。針對(duì)不同頻率的分解量固有模態(tài)函數(shù)(IMF)和趨勢(shì)量(Res)分別建立LV-SVM回歸模型[24-25]。最后對(duì)不同分量進(jìn)行合成重構(gòu)得到預(yù)測(cè)結(jié)果。

建立EMD-LS-SVM模型的步驟:

1)輸入訓(xùn)練集數(shù)據(jù),采用EMD方法對(duì)風(fēng)速序列進(jìn)行分解得到多個(gè)IMF分量和Res分量的代數(shù)和,即:

式中:M為IMF分量的個(gè)數(shù);IMFi(t)為風(fēng)速時(shí)間序列的第i個(gè)固有模態(tài)函數(shù);Res(t)為分解后的趨勢(shì)分量。

2)分別對(duì)分量IMFi(t)和Res(t)建立LV-SVM回歸模型,構(gòu)造的拉格朗日函數(shù)計(jì)算方法算法如下:

式中:c為容錯(cuò)懲罰系數(shù),c>0;ξi為松弛因子,ξi≥0;w為權(quán)向量;b為常數(shù);αi(i=1,2,…,l)為拉格朗日乘子。本文參考文獻(xiàn)[20]的方法確定超參數(shù),選取c= 30,σ2=0.22。

通過(guò)式(4)計(jì)算出LS-SVM回歸函數(shù)表示為

式中:高斯核函數(shù)K(x,xi)=e-‖x-xi‖2/(2σ2)。

3)利用式(4)建立各個(gè)分量的模型,并預(yù)測(cè)出每個(gè)分量的值,對(duì)分量結(jié)果進(jìn)行合成重構(gòu),得到最終的預(yù)測(cè)值y2(x)。

1.1.3 建立風(fēng)速組合預(yù)測(cè)模型

方差優(yōu)選風(fēng)速組合預(yù)測(cè)模型的風(fēng)速輸出y(t/ t-1)為

式中:λ1為在t時(shí)刻Adaboost-BP網(wǎng)絡(luò)預(yù)測(cè)模型的權(quán)重值;λ2為在t時(shí)刻EMD-LS-SVM預(yù)測(cè)模型的權(quán)重值,且λ1+λ2=1。y(1t/t-1)為t時(shí)刻Adaboost-BP網(wǎng)絡(luò)預(yù)測(cè)模型的預(yù)測(cè)值;y(2t/t-1)為t時(shí)刻EMD-LS-SVM預(yù)測(cè)模型的預(yù)測(cè)值。

求取最優(yōu)權(quán)重的過(guò)程等同為如下優(yōu)化問(wèn)題:

采用構(gòu)造拉格朗日函數(shù)的方法求解式(7),可以解得:

通過(guò)式(10)得到的殘差序列是由預(yù)測(cè)模型產(chǎn)生的系統(tǒng)誤差(誤差較小接近于0)和異常風(fēng)速值產(chǎn)生的粗大誤差的代數(shù)和構(gòu)成。隨后通過(guò)識(shí)別粗大誤差來(lái)確定風(fēng)速值的異常情況。

1.2 Bayesian后驗(yàn)比檢測(cè)準(zhǔn)則

由于殘差序列服從高斯分布[26],因此根據(jù)Bayesian后驗(yàn)的思想,ALARCON-AQUINO V[27]等人建立檢測(cè)窗口和學(xué)習(xí)窗口,其中學(xué)習(xí)窗口中的數(shù)據(jù)用于建立高斯分布,檢測(cè)窗口中的數(shù)據(jù)用于檢測(cè)該數(shù)據(jù)的異常情況。通過(guò)分析2個(gè)窗口的殘差序列是否服從同一高斯分布的方法檢測(cè)異常數(shù)據(jù)。如果檢測(cè)窗口服從學(xué)習(xí)窗口的高斯分布,判為正常(系統(tǒng)誤差)數(shù)據(jù),反之,則判為異常(粗大誤差)數(shù)據(jù)。

隨著檢測(cè)數(shù)據(jù)的不斷增加,學(xué)習(xí)窗口中堆積了大量數(shù)據(jù)使得統(tǒng)計(jì)分析復(fù)雜。本文結(jié)合風(fēng)速殘差序列中粗大誤差的分布特點(diǎn),通過(guò)固定學(xué)習(xí)窗口中數(shù)據(jù)的長(zhǎng)度L保持不變,并保持檢測(cè)窗口只含有一個(gè)待檢測(cè)的數(shù)據(jù),利用學(xué)習(xí)窗口和檢測(cè)窗口同步滑動(dòng)實(shí)現(xiàn)殘差序列中粗大誤差的檢測(cè)與識(shí)別。

根據(jù)學(xué)習(xí)窗口中L個(gè)數(shù)據(jù)的分布情況得到高斯分布N(0,δ2),讀取檢測(cè)窗口t時(shí)刻的殘差值et。當(dāng)et服從N(0,δ2)時(shí),則et判為系統(tǒng)誤差數(shù)據(jù)(正常風(fēng)速點(diǎn));當(dāng)et不服從N(0,δ2)時(shí),則et判為粗大誤差數(shù)據(jù)(異常風(fēng)速點(diǎn))。從粗大誤差數(shù)據(jù)得到2個(gè)假設(shè),分別為H0:t時(shí)刻的殘差et為正常值;H1:t時(shí)刻的殘差et為異常值。

在2個(gè)假設(shè)條件下,L+1個(gè)殘差數(shù)據(jù)的似然分別為

根據(jù)Bayesian原理[28]得到2個(gè)假設(shè)的后驗(yàn)概率分別為

式中:假設(shè)H0和H1的先驗(yàn)概率分別為p(H0)和p(H1);p(e)表示風(fēng)速預(yù)測(cè)殘差ei的先驗(yàn)概率i=t-L,…,t;后驗(yàn)概率p(H0|e)和p(H1|e)表示在取當(dāng)前殘差值e(ii=t-L,…,t)時(shí),假設(shè)H0和H1成立的概率,可用統(tǒng)計(jì)量后驗(yàn)概率直接描述檢測(cè)窗口殘差值的異常情況。因此可以利用2個(gè)假設(shè)的后驗(yàn)概率的大小關(guān)系判斷哪個(gè)假設(shè)成立,具體實(shí)施采用后驗(yàn)概率對(duì)數(shù)比作為異常判斷準(zhǔn)則:

根據(jù)式(14)可知,如果et為粗大誤差數(shù)據(jù)(v(t)為異常風(fēng)速值),則異常假設(shè)的后驗(yàn)概率p(H1|遠(yuǎn)大于正常假設(shè)后驗(yàn)概率p(H0|e),即φ(t)小于η;如果et為系統(tǒng)誤差(v(t)為正常風(fēng)速值),則φ(t)大于η。本文選取檢測(cè)閾值η=0.95,即異常值識(shí)別水平的可信度為0.95:

對(duì)于式(11)和式(12),如果計(jì)算假設(shè)H0和H1的似然函數(shù),需要依據(jù)歷史數(shù)據(jù)擬合概率密度函數(shù)求取高斯分布的方差δ2和δ,由于受到擬合精度的影響,計(jì)算出的方差精度不高,方差值的準(zhǔn)確性直接關(guān)乎到檢測(cè)異常值的合理性。為了避免因方差估計(jì)不準(zhǔn)確造成的檢測(cè)異常值不理想,本文引入邊緣化處理的方法[29],對(duì)方差δ2和用積分運(yùn)算的方式估計(jì)出式(11)和式(12)的后驗(yàn)概率。所以式(13)可換成以下2個(gè)公式:

對(duì)式(13)采用邊緣化處理后,式(16)和式(17)出現(xiàn)了2個(gè)未知分布即方差的先驗(yàn)密度p(δ2)和p(),引入Jeffreys提出的先驗(yàn)分布函數(shù)來(lái)計(jì)算p(δ)2和p(),根據(jù)文獻(xiàn)[30]給出了在高斯分布條件下的先驗(yàn)計(jì)算方法p(t)=1/t,0<t<∞,將Jeffreys先驗(yàn)代入假設(shè)H0的式(16)可得:

式(18)中的被積函數(shù)正好為逆Wishart分布的密度函數(shù),即。文獻(xiàn)[28]給出了積分項(xiàng)逆Wishart分布的證明過(guò)程。因此式(18)化簡(jiǎn)為

同理對(duì)式(17)采用同樣的推導(dǎo)過(guò)程可得出:

推導(dǎo)出的式(19)和式(20)可直接用于計(jì)算假設(shè)H0和H1的后驗(yàn)概率,再根據(jù)異常值判斷準(zhǔn)則式(14)計(jì)算出φ(t),通過(guò)比較φ(t)和η的大小進(jìn)行檢測(cè)殘差序列中的粗大誤差點(diǎn)。

2 異常風(fēng)速值的修正

利用邊緣化后驗(yàn)比的檢測(cè)方法辨識(shí)擬合殘差序列中的t時(shí)刻的粗大誤差點(diǎn),同時(shí)對(duì)該時(shí)刻的異常風(fēng)速值剔除。為了進(jìn)一步提高風(fēng)速序列的連續(xù)性和可利用性,需要分兩步對(duì)數(shù)據(jù)處理。第一步對(duì)異常風(fēng)速序列二階差分處理使其平穩(wěn)化,第二步采用ARMA模型修正異常值。ARIMA算法[31-32]是依據(jù)風(fēng)速序列的時(shí)序性和自相關(guān)性建立的,對(duì)異常風(fēng)速值修正精度高。其中ARMA模型可以表示為

式中:α1,α2,…,αp為AR模型系數(shù);β1,β2,…,βq為MA模型系數(shù);εi為獨(dú)立同分布的隨機(jī)變量序列。

由于風(fēng)速序列是非平穩(wěn)序列,需要對(duì)其進(jìn)行二階差分平穩(wěn)化,平穩(wěn)化后的風(fēng)速序列采用式(21)的方法建立ARMA模型,修正被剔除異常風(fēng)速值。

3 檢測(cè)異常風(fēng)速值的步驟

本文通過(guò)組合預(yù)測(cè)方法與邊緣化后驗(yàn)比方法相結(jié)合建立了風(fēng)電場(chǎng)異常風(fēng)速檢測(cè)算法,對(duì)采集到的運(yùn)行風(fēng)速值優(yōu)化處理,從而提高數(shù)據(jù)分析的精度。檢測(cè)并修正風(fēng)電場(chǎng)運(yùn)行風(fēng)速值的流程如圖1所示,具體步驟如下所述。

圖1 異常風(fēng)速值檢測(cè)流程Fig.1 Flow chart of anomaly w ind speed detection algorithm

1)輸入待檢測(cè)的風(fēng)電場(chǎng)運(yùn)行風(fēng)速數(shù)據(jù)(含有異常風(fēng)速值)。

2)建立單一預(yù)測(cè)模型。運(yùn)用運(yùn)行風(fēng)速數(shù)據(jù)分別建立Adaboost-BP網(wǎng)絡(luò)預(yù)測(cè)模型和EMD-LS-SVM預(yù)測(cè)模型,并計(jì)算出每個(gè)單一預(yù)測(cè)模型的預(yù)測(cè)誤差e1和e2。

3)建立組合預(yù)測(cè)模型。采用拉格朗日的方法求取組合預(yù)測(cè)模型的最優(yōu)權(quán)重系數(shù)λ1和λ2,得到組合模型的預(yù)測(cè)值y(t/t-1),并計(jì)算出含有粗大誤差信息的殘差序列e(t)。

4)計(jì)算后驗(yàn)比φ(t)。針對(duì)學(xué)習(xí)窗口中L個(gè)殘差序列得到殘差分布,并計(jì)算出檢測(cè)窗口的殘差值et服從2個(gè)假設(shè)H0和H1的后驗(yàn)概率,利用式(14)計(jì)算出后驗(yàn)比φ(t)。

5)判定異常風(fēng)速值。比較后驗(yàn)比φ(t)與檢測(cè)閾值η,當(dāng)t時(shí)刻的后驗(yàn)比φ(t)小于η時(shí),t時(shí)刻的殘差為粗大誤差,即t時(shí)刻的風(fēng)速值異常;反之則為正常值。判定后同時(shí)滑動(dòng)學(xué)習(xí)窗口和檢測(cè)窗口,重復(fù)步驟4),檢測(cè)t+1時(shí)刻的異常情況,直至檢測(cè)完成。

6)修正異常風(fēng)速值。采用ARIMA修正模型對(duì)步驟5)檢測(cè)出的異常數(shù)據(jù)點(diǎn)進(jìn)行修正,從而得到正常的風(fēng)速值。

4 案例分析

4.1 案例一

為了驗(yàn)證本文所提出的組合預(yù)測(cè)和邊緣化后驗(yàn)比算法識(shí)別異常值的有效性,采用本文所提方法檢測(cè)余弦信號(hào)中的異常值,選取長(zhǎng)度3 000的余弦信號(hào),為了進(jìn)一步驗(yàn)證檢測(cè)算法的可靠性,在余弦信號(hào)再加入信噪比為10 dB的高斯噪聲。前2 000個(gè)數(shù)據(jù)用組合預(yù)測(cè)模型的建立,后1 000個(gè)數(shù)據(jù)中隨機(jī)加入10個(gè)異常點(diǎn)。用于異常檢測(cè)的余弦信號(hào)如圖2所示。

圖2 含有異常值的仿真信號(hào)Fig.2 Simulation signalw ith abnormal value

用前2 000個(gè)數(shù)據(jù)點(diǎn)得到的組合預(yù)測(cè)模型對(duì)后1 000個(gè)數(shù)據(jù)進(jìn)行預(yù)測(cè),得到的殘差序列如圖3所示。從圖3中可以看出,由預(yù)測(cè)系統(tǒng)造成的系統(tǒng)誤差接近0,在殘差序列中10個(gè)異常值以粗大誤差的形式全部顯示出。

圖3 仿真信號(hào)的殘差序列Fig.3 Residual series of simulation signal

分別建立學(xué)習(xí)窗口和檢測(cè)窗口,其中學(xué)習(xí)窗口的長(zhǎng)度L為100,檢測(cè)窗口為1,取p(H0)=0.95[14]。采用式(14)計(jì)算后驗(yàn)概率比。從圖4中可以看出,殘差序列中的粗大誤差點(diǎn)的后驗(yàn)對(duì)數(shù)比值φ(t)顯然遠(yuǎn)遠(yuǎn)小于其他時(shí)刻的比值。當(dāng)φ(t)小于η時(shí),判為異常點(diǎn);否則殘差序列正常。采用組合預(yù)測(cè)模型和后驗(yàn)概率比的方法全部檢測(cè)出10個(gè)異常點(diǎn)的位置,證明了本文所提方法的可行性。

圖4 仿真信號(hào)數(shù)據(jù)的檢測(cè)結(jié)果Fig.4 Detection result of simulation signal

4.2 案例二

對(duì)甘肅酒泉風(fēng)電場(chǎng)實(shí)際采集的數(shù)據(jù)進(jìn)行異常風(fēng)速檢測(cè),選取2010年5月15日—5月22日中的7 000個(gè)風(fēng)速數(shù)據(jù),其中將含有異常值的4 000個(gè)數(shù)據(jù)用于單一和組合模型的搭建,3 000個(gè)風(fēng)速數(shù)據(jù)用于預(yù)測(cè)并得到殘差序列。

從圖6可以看出粗大誤差點(diǎn)在600~1 000和2 100~2 400之間出現(xiàn)的頻率比較高,而在圖5中該段異常風(fēng)速點(diǎn)很難被觀察識(shí)別。組合預(yù)測(cè)的方法能有效地凸顯異常風(fēng)速點(diǎn),為下一步的準(zhǔn)確檢測(cè)異常值提供了保障。

圖5 酒泉風(fēng)電場(chǎng)實(shí)測(cè)風(fēng)速序列Fig.5 M easured w ind speed series from Jiuquan w ind farm s

圖6 酒泉風(fēng)電場(chǎng)的風(fēng)速殘差序列Fig.6 Residual series ofwind speed from Jiuquan wind farms

對(duì)殘差序列采用學(xué)習(xí)窗口和檢測(cè)窗口滑動(dòng)的方式檢測(cè)粗大誤差點(diǎn),固定學(xué)習(xí)窗口的長(zhǎng)度L=100,統(tǒng)計(jì)學(xué)習(xí)窗口內(nèi)的誤差分布參數(shù),并借助后驗(yàn)概率的方法在2個(gè)假設(shè)H0和H1的條件下計(jì)算出學(xué)習(xí)窗口t時(shí)刻的后驗(yàn)對(duì)數(shù)比。對(duì)比圖6和7,發(fā)現(xiàn)殘差序列中的較大粗大誤差對(duì)應(yīng)的后驗(yàn)對(duì)數(shù)比值明顯小于檢測(cè)閾值η。

圖7 酒泉風(fēng)速數(shù)據(jù)的檢測(cè)結(jié)果Fig.7 Detection result of w ind speed from Jiuquan w ind farm s

采用ARIMA方法修正粗大誤差點(diǎn)所對(duì)應(yīng)的異常風(fēng)速值,使其得到正常的風(fēng)速序列,為進(jìn)一步的分析應(yīng)用提供可靠的數(shù)據(jù)質(zhì)量。

為驗(yàn)證本文識(shí)別剔除異常風(fēng)速值的有效性,采用(RBF)神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)算法[15-16]對(duì)修正后的2 900個(gè)風(fēng)速序列進(jìn)行預(yù)測(cè)。其中選取2 000個(gè)數(shù)據(jù)用于RBF模型的訓(xùn)練,900個(gè)數(shù)據(jù)用于預(yù)測(cè)結(jié)果的測(cè)試。選用平均絕對(duì)誤差(MAE)、平均絕對(duì)百分誤差(MAPE)、均方根誤差(RMSE)作為預(yù)測(cè)結(jié)果評(píng)價(jià)指標(biāo)。

從表1中的RBF預(yù)測(cè)結(jié)果發(fā)現(xiàn),修正后的風(fēng)速序列與含有異常值的風(fēng)速序列相比,3項(xiàng)預(yù)測(cè)指標(biāo)都有不同程度的提升,因此采用修正異常值后的風(fēng)速序列進(jìn)行風(fēng)速預(yù)測(cè)可提高預(yù)測(cè)精度,為風(fēng)電場(chǎng)風(fēng)速序列的研究提供了可靠保障。

表1 酒泉風(fēng)電場(chǎng)預(yù)測(cè)誤差分析Tab.1 Prediction error analysis from Jiuquan w ind farms

5 結(jié)語(yǔ)

由于風(fēng)電場(chǎng)測(cè)量風(fēng)速數(shù)據(jù)中存在一些異常風(fēng)速值,不經(jīng)預(yù)處理直接對(duì)其進(jìn)行預(yù)測(cè)分析嚴(yán)重影響預(yù)測(cè)精度,本文提出了Adaboost-BP與EMD-LVSVM的組合預(yù)測(cè)和邊緣化后驗(yàn)比的檢測(cè)算法。為了避免殘差序列中的系統(tǒng)誤差與粗大誤差的混疊現(xiàn)象,使系統(tǒng)誤差降低到最低,本文將含有異常值的數(shù)據(jù)采用組合預(yù)測(cè)方法獲得訓(xùn)練模型,并得到殘差序列。由于殘差序列中的系統(tǒng)誤差服從高斯分布,因此選用后驗(yàn)概率對(duì)數(shù)比的方法辨識(shí)系統(tǒng)誤差與粗大誤差。為了提高估計(jì)參數(shù)的魯棒性,對(duì)估計(jì)參數(shù)邊緣化處理,從而提高了檢測(cè)算法的可行性。仿真結(jié)果表明,本文方法能合理地檢測(cè)風(fēng)電場(chǎng)異常風(fēng)速值,可為短期風(fēng)速預(yù)測(cè)提供可靠的數(shù)據(jù)質(zhì)量。本文方法局限性有以下2點(diǎn):第一,誤差的大小取決于所建立的預(yù)測(cè)模型的精度,在以后的研究中需進(jìn)一步探索合理的預(yù)測(cè)方法以降低系統(tǒng)誤差;第二,本文的后驗(yàn)比檢測(cè)方法是建立在誤差服從高斯分布的假設(shè)下,但異常數(shù)據(jù)很難用服從一種單一的分布,今后需探索適用范圍更廣泛的檢測(cè)異常值的方法。

[1]王勃,馮雙磊,劉純.考慮預(yù)報(bào)風(fēng)速與功率曲線因素的風(fēng)電功率預(yù)測(cè)不確定性估計(jì)[J].電網(wǎng)技術(shù),2014,38(2): 463-468. WANG Bo,F(xiàn)ENG Shuanglei,LIU Chun.Uncertainty estimation of wind power forecasting considering wind speed and power curve factor[J].Power Grid Technology,2014,38(2):463-468(in Chinese).

[2]劉興杰,岑添云,鄭文書(shū),等.基于模糊粗糙集與改進(jìn)聚類(lèi)的神經(jīng)網(wǎng)絡(luò)風(fēng)速預(yù)測(cè)[J].中國(guó)電機(jī)工程學(xué)報(bào),2014,34(19):3162-3169. LIUXingjie,CEN Tianyun,ZHENGWenshu,etal.Neural network wind speed forecasting based on fuzzy rough set and improved clustering[J].Journal of Chinese Electrical Engineering Science,2014,34(19):3162-3169(in Chinese).

[3]艾格林,孫永輝,衛(wèi)志農(nóng).基于MEA_Elman神經(jīng)網(wǎng)絡(luò)的光伏發(fā)電功率短期預(yù)測(cè)[J].電網(wǎng)與清潔能源,2016,32(4):119-124. AIGelin,SUN Yonghui,WEIZhinong.Short-term photovolataic power forecasting based on MEA and elman neural network[J].Power System and Clean Energy,2016,32(4):119-124(in Chinese).

[4]于群,樸在林,胡博.基于EEMD和BP神經(jīng)網(wǎng)絡(luò)的短期光伏功率預(yù)測(cè)模型[J].電網(wǎng)與清潔能源,2016,32(7): 132-137. YU Qun,PIAO Zailin,HU Bo.A hybridmodel for shortterm photovoltaic power forecasting based on EEMD-BP combined method[J].Power System and Clean Energy,2016,32(7):132-137(in Chinese).

[5]陳偉,郭建鵬,裴喜平,等.風(fēng)電場(chǎng)短期風(fēng)速變化區(qū)間與變化趨勢(shì)預(yù)測(cè)算法[J].電力系統(tǒng)及其自動(dòng)化學(xué)報(bào),2015,27(9):47-52. CHENWei,GUO Jianpeng,PEIXiping,et al.Short term wind speed variation range and variation trend prediction algorithm for wind farm[J].Proceedings of the CSU-EPSA,2015,27(9):47-52(in Chinese).

[6]修春波,任曉,李艷晴,等.基于卡爾曼濾波的風(fēng)速序列短期預(yù)測(cè)方法[J].電工技術(shù)學(xué)報(bào),2014,29(2):253-259. XIU Chunbo,REN Xiao,LI Yanqing,et al.Short term forecasting method of wind speed series based on calman filter[J].Transactions of China Electrotechnical Society,2014,29(2):253-259(in Chinese).

[7]陳道君,李幕,楊楠,等.基于最優(yōu)權(quán)系數(shù)的風(fēng)電功率組合預(yù)測(cè)方法[J].電網(wǎng)與清潔能源,2016,32(4):99-105. CHEN Daojun,LIMu,YANG Nan,et al.Combination forecastingmethod of wind power based on optimal weight coefficient[J].Power System and Clean Energy,2016,32(4):99-105(in Chinese).

[8]田波,樸在林,王慧.基于時(shí)間序列建模在風(fēng)力發(fā)電功率短期預(yù)測(cè)中的研究[J].電網(wǎng)與清潔能源,2016,32(3):115-119. TIAN Bo,PIAO Zailin,WANG Hui.Short term prodiction of wind power based on time series modeling[J].Power System and Clean Energy,2016,32(3):115-119(in Chinese).

[9]BARNET V,LEWIS T.Outlier in statistical data[M]. Chichester:John Wiley and Sons,1994.

[10]ZHENG Le,MIN Yong.Raw wind data preprocessing:A data-mining approach[J].IEEE Transactions on Sustainable Energy,2015,6(1):11-19.

[11]李麗,葉林.風(fēng)速數(shù)據(jù)奇異點(diǎn)辨識(shí)研究[J].電力系統(tǒng)保護(hù)與控制,2011,39(21):92-97. LILi,YE Lin.Research on singular point identification of wind speed data[J].Power System Protection and Control,2011,39(21):92-97(in Chinese).

[12]尚華,馮牧,張貝貝.基于Bayesian方法的參數(shù)估計(jì)和異常值檢測(cè)[J].重慶郵電大學(xué)學(xué)報(bào)(自然科學(xué)版),2016,28(1):138-142. SHANG Hua,F(xiàn)ENG Mu,ZHANG Beibei.Parameter estimation and outlier detection based on bayesian method[J].Journal of Chongqing University of Posts and Telecommunications,2016,28(1):138-142(in Chinese).

[13]王雷,張瑞青,盛偉,等.基于支持向量機(jī)的回歸預(yù)測(cè)和異常數(shù)據(jù)檢測(cè)[J].中國(guó)電機(jī)工程學(xué)報(bào),2009,29(8): 92-96. WANG Lei,ZHANG Ruiqing,SHENG Wei,et al. Regression prediction and anomaly data detection based on support vector machine[J].Proceedings of the CSEE,2009,29(8):92-96(in Chinese).

[14]張鋒利,陳文獻(xiàn),賈海英.支持向量機(jī)和BP神經(jīng)網(wǎng)絡(luò)在水輪發(fā)電機(jī)軸承故障診斷中的應(yīng)用[J].電網(wǎng)與清潔能源,2013,29(4):62-66. ZHANG Fengli,CHENWenxian,JIA Haiying.Application of support vectormachines and BP neural network in the rolling bearing of hydraulic turbine generator fault diagnosis[J].Power System and Clean Energy,2013,29(4):62-66(in Chinese).

[15]張宇航,蘭生.基于廣義神經(jīng)網(wǎng)絡(luò)與模糊聚類(lèi)的變壓器故障診斷[J].高壓電器,2016,52(5):116-120. ZHANG Yuhang,LAN Sheng.Transformer fault diagnosis based on GRNN and FCM[J].High Voltage Apparatus,2016,52(5):116-120(in Chinese).

[16]苗長(zhǎng)新,申坤,鐘世華,等.基于優(yōu)化神經(jīng)網(wǎng)絡(luò)和DGA的變壓器故障診斷[J].高壓電器,2016,52(11):163-167. MIAO Changxin,SHEN Kun,ZHONG Shihua,et al. Power transformer fault diagnosis based on improved neutral network and DGA[J].High Voltage Apparatus,2016,52(11):163-167(in Chinese).

[17]劉太洪,趙永雷.動(dòng)態(tài)加權(quán)模糊聚類(lèi)在變壓器故障診斷中的應(yīng)用研究[J].電網(wǎng)與清潔能源,2016,32(4):89-92. LIU Taihong,ZHAO Yonglei.Application of dynamic weighted fuzzy clustering algorithm to fault diagnosis of transformer[J].Power System and Clean Energy,2016,32(4):89-92(in Chinese).

[18]劉輝舟,周開(kāi)樂(lè),胡小建.基于模糊負(fù)荷聚類(lèi)的不良負(fù)荷數(shù)據(jù)辨識(shí)與修正[J].中國(guó)電力,2013,46(10):29-34. LIU Huizhou,ZHOU Kaile,HU Xiaojian.Identification and correction of bad load data based on fuzzy load clustering[J].Electric Power,2013,46(10):29-34(in Chinese).

[19]BRETASN G,BRETAS A S,PIERETIS A.Innovation concept for measurement gross error detection and identification in power system state estimation[J].IETGeneration,Transmission&Distribution,2011,5(6):603-608.

[20]李麗,葉林.基于改進(jìn)持續(xù)法的短期風(fēng)電功率預(yù)測(cè)[J].農(nóng)業(yè)工程學(xué)報(bào),2010,26(12):182-187. LILi,YE Lin.Short term wind power prediction based on improved continuation method[J].Transactions of the Chinese Society of Agricultural Engineering,2010,26(12):182-187(in Chinese).

[21]劉亞南,范立新,徐鋼,等.基于非負(fù)矩陣分解與改進(jìn)極端學(xué)習(xí)機(jī)的變壓器油中溶解氣體濃度預(yù)測(cè)模型[J].高壓電器,2016,52(1):162-169. LIU Yanan,F(xiàn)AN Lixin,XU Gang,et al.Concentration prediction model of dissolved gases in transformer oil based on NMF and improved ELM[J].High Voltage Apparatus,2016,52(1):162-169(in Chinese).

[22]柳玉,郭虎全.基于AdaBoost與BP神經(jīng)網(wǎng)絡(luò)的風(fēng)速預(yù)測(cè)研究[J].電網(wǎng)與清潔能源,2012,28(2):80-83. LIU Yu,GUO Huquan.Wind speed prediction based on AdaBoost and BP neural networks[J].Power System and Clean Energy,2012,28(2):80-83(in Chinese).

[23]呂帥,張靠社.基于小波變換去噪預(yù)處理的EMD諧波檢測(cè)方法[J].電網(wǎng)與清潔能源,2016,32(6):59-61. Lü Shuai,ZHANG Kaoshe.EMD harmonic detection method of denoising preprocessing based on wavelet transform[J].Power System and Clean Energy,2016,32(6):59-61(in Chinese).

[24]鄭港,鄢小虎,謝齊家,等.一種基于螢火蟲(chóng)支持向量機(jī)的油色譜在線數(shù)據(jù)校正方法[J].高壓電器,2013,49(9):23-27. ZHENGGang,YAN Xiaohu,XIEQijia,etal.Method for the oil chromatographic on-line data reconciliation based on GSO and SVM[J].High Voltage Apparatus,2013,49(9):23-27(in Chinese).

[25]曾杰,張華.基于最小二乘支持向量機(jī)的風(fēng)速預(yù)測(cè)模型[J].電網(wǎng)技術(shù),2009,33(18):144-147. ZENG Jie,ZHANG Hua.Wind speed forecasting model based on least square support vector machine[J].Power System Technology,2009,33(18):144-147(in Chinese).

[26]葉林,任成,趙永寧,等.超短期風(fēng)電功率預(yù)測(cè)誤差數(shù)值特性分層分析方法[J].中國(guó)電機(jī)工程報(bào),2016,36(3):692-700. YE Lin,REN Cheng,ZHAO Yongning,etal.Super short term wind power prediction error numerical characteristic analysismethod[J].Journal of Chinese Electrical Engineering Science,2016,36(3):692-700(in Chinese).

[27]ALARCON-AQUINO V,BARRIA JA.Anomaly detection in communications[J].IET Journals&Magaines,2001,148(6):355-362.

[28]GUSTAFSSON F.The marginalized likelihood ratio test for detecting abrupt changes[J].IEEE Transactions on Automatic Control,1996,41(1):355-362.

[29]蘇衛(wèi)星,朱云龍,胡琨元,等.基于模型的過(guò)程工業(yè)時(shí)間序列異常值檢測(cè)方法[J].儀器儀表報(bào),2012(9):2080-2087. SUWeixing,ZHU Yunlong,HU Kunyuan,et al.Method for detecting outliers in process industry time series based on model[J].Instrument and Meter,2012(9):2080-2087(in Chinese).

[30]BERNARDO JM,SMITH A F M.Bayesian theory[M].

New York:Wiley,1994.

[31]GONG Shuhong,GAO Yifeng,SHI Houbao,et al.A practical MGA-ARIMA model for forecasting real-time dynamic rain-induced attenuation[J].IEEE Transactions on Radio Science,2013,48(3):208-225.

[32]YUNUS K,THIRINGER T,CHEN Peiyuan.ARIMA-based frequency-decomposedmodeling ofwind speed time series[J].IEEE Transactions on Power Systems,2016,31(4):2546-2556.

Anomaly W ind Speed Detection M ethod w ith Im proved Bayesian Posterior Ratio

CHENWei,WU Butuo,PEIXiping,WANG Yizhe
(Institute of Electrical Engineering and Information Engineering,Lanzhou University of Technology,Lanzhou 730050,Gansu,China)

As wind speed data contains abnormal values from wind farms,in order to optimize the quality ofwind power data,this paper proposes an outlier detection method with the improved Bayesian posterior ratio.To reduce the prediction error,the paper establishes a combination forecasting model based on BP network and least square support vectormachine. The residual error sequence is obtained by calculating the deviation between the predicted value and themeasured value. The gross errors in the residual series are identified by the test method of Bayesian posterior ratio,and this approach can improve the reliability and determine the location of the abnormal value.Finally,we use the ARIMA method to correct the abnormal wind speed.RBF prediction results show that the proposed method can accurately identify outliers,thus improving the forecasting accuracy ofwind speed.

anomaly wind speed detection method;combined forecasting model;residual analysis;Bayesian posterior ratio

2016-08-15。

陳 偉(1976—),男,博士,教授,博導(dǎo),主要研究方向?yàn)殡娔苜|(zhì)量分析和控制、新能源發(fā)電技術(shù);

(編輯 馮露)

國(guó)家重點(diǎn)研發(fā)計(jì)劃(2016YFB0601600);國(guó)家自然科學(xué)基金項(xiàng)目(51267012);甘肅省科技支撐工業(yè)計(jì)劃項(xiàng)目(1504GKCA033)。

Project Supported by National Key Research and Development Program(2016YFB060 1600);the National Natural Science Foundation of China(51267012);Science and Technology Support Industry Program of Gansu Province(1504GKCA033).

1674-3814(2017)02-0104-08

TM614

A

誤差,從而確定異常風(fēng)速值的位置,并利用ARIMA方法修正異常風(fēng)速值。RBF預(yù)測(cè)結(jié)果表明,所提方法能準(zhǔn)確識(shí)別異常值,從而提高了風(fēng)電場(chǎng)短期風(fēng)速預(yù)測(cè)精度。

吳布托(1988—),男,碩士研究生,主要研究方向?yàn)樾履茉窗l(fā)電技術(shù)。

猜你喜歡
后驗(yàn)殘差風(fēng)速
基于雙向GRU與殘差擬合的車(chē)輛跟馳建模
基于Kmeans-VMD-LSTM的短期風(fēng)速預(yù)測(cè)
基于最優(yōu)TS評(píng)分和頻率匹配的江蘇近海風(fēng)速訂正
基于殘差學(xué)習(xí)的自適應(yīng)無(wú)人機(jī)目標(biāo)跟蹤算法
基于對(duì)偶理論的橢圓變分不等式的后驗(yàn)誤差分析(英)
貝葉斯統(tǒng)計(jì)中單參數(shù)后驗(yàn)分布的精確計(jì)算方法
基于遞歸殘差網(wǎng)絡(luò)的圖像超分辨率重建
一種基于最大后驗(yàn)框架的聚類(lèi)分析多基線干涉SAR高度重建算法
基于GARCH的短時(shí)風(fēng)速預(yù)測(cè)方法
平穩(wěn)自相關(guān)過(guò)程的殘差累積和控制圖
河南科技(2015年8期)2015-03-11 16:23:52
凤台县| 庄河市| 巨鹿县| 阿荣旗| 富顺县| 海城市| 河源市| 星座| 军事| 溧水县| 芦山县| 城步| 肃南| 黄大仙区| 广德县| 东山县| 乐陵市| 涟水县| 健康| 民县| 如东县| 霍城县| 沾益县| 筠连县| 舞阳县| 保德县| 攀枝花市| 闵行区| 金沙县| 阿拉善右旗| 淄博市| 天祝| 乌拉特中旗| 南宁市| 体育| 辽宁省| 含山县| 抚远县| 襄垣县| 旬阳县| 平顶山市|