国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于改進非參數(shù)核密度估計的光伏出力概率分布建模方法

2021-10-11 07:14:06趙鐵軍孫玲玲牛益國謝小英賈清泉
燕山大學(xué)學(xué)報 2021年5期
關(guān)鍵詞:密度估計概率密度概率分布

趙鐵軍,孫玲玲,牛益國,謝小英,賈清泉,*

(1.國網(wǎng)冀北電力有限公司秦皇島供電公司,河北 秦皇島 066004;2.燕山大學(xué) 電力電子節(jié)能與傳動控制河北省重點實驗室,河北 秦皇島 066004)

0 引言

根據(jù)國家能源局的數(shù)據(jù)統(tǒng)計,截至2019年9月底,中國光伏發(fā)電累計裝機容量達到1.9億kW,正向電能增量的主力供應(yīng)者過渡[1-2]。預(yù)計“十四五”期間光伏發(fā)電裝機容量和發(fā)電量仍將持續(xù)提高,光伏發(fā)電即將步入替代能源和平價上網(wǎng)時代,面臨規(guī)?;尤搿⒏哒急裙┠?、主導(dǎo)電網(wǎng)行為的態(tài)勢,其出力的隨機性和不確定性極大地增加了電網(wǎng)復(fù)雜性和風(fēng)險程度,對電網(wǎng)的安全、可靠、經(jīng)濟運行產(chǎn)生重大影響[3-4]。因此,探索建立精準(zhǔn)的光伏出力概率模型,對含光伏電網(wǎng)的不確定潮流分析、規(guī)劃與消納能力分析、安全分析等具有重要意義。

與光伏功率預(yù)測建模不同,光伏出力的概率建模,是在統(tǒng)計平均意義上用概率密度描述不同天氣、不同條件下光伏出力的概率分布。光伏出力的概率建??刹捎脜?shù)模型和非參數(shù)模型。β分布是一種典型的參數(shù)模型,但不同地區(qū)、不同條件下β分布模型的參數(shù)不易確定,因而模型準(zhǔn)確度差、分析精度低。核密度估計模型是一種數(shù)據(jù)驅(qū)動的統(tǒng)計模型,是基于歷史數(shù)據(jù)的統(tǒng)計學(xué)方法,從而掌握特定地區(qū)或特定光伏出力的隨機分布特征[5-6]。文獻[7]創(chuàng)建了一種基于正交級數(shù)密度估計的光伏出力概率建模方法,能夠準(zhǔn)確模擬在不同地區(qū)不同時段下光伏出力的分布規(guī)律,并且在應(yīng)用中表現(xiàn)出高適用性、計算簡便等性能優(yōu)勢。文獻[8]基于解集與條件核密度估計理論構(gòu)建了光伏出力的時序概率模型,能夠計及太陽輻射度的小時輻射和日總輻射之間的加和特性,適用于多種現(xiàn)實場景。文獻[9]提出將數(shù)據(jù)按氣象條件分類,采用非參數(shù)核密度估計法建立晴天、多云、陰天、雨雪4種氣象條件下光伏出力的隨機分布模型。文獻[10]采用核密度估計函數(shù),將光伏出力的歷史數(shù)據(jù)作為樣本創(chuàng)建了一種非參數(shù)的建模方法;該方法能夠準(zhǔn)確模擬不同氣象條件下的光伏出力特性,但核密度估計的準(zhǔn)確性取決于所選帶寬,且不同的帶寬計算方法適用于不同的數(shù)據(jù)樣本。文獻[11]利用非參數(shù)核密度估計法(Nonparametric Kernel Density Estimation,NKDE)建立光伏發(fā)電出力誤差的概率分布模型。文獻[12]為避免因光伏模型設(shè)定和參數(shù)估計誤差帶來的影響,提出一種基于非參數(shù)核密度估計法的光伏功率短期預(yù)測誤差分布模型,對分布模式的多樣性進行建模。文獻[13]提出綜合使用神經(jīng)網(wǎng)絡(luò)分位數(shù)回歸、k近鄰算法、通徑分析和核密度估計的光伏出力概率分布估計方法,構(gòu)造了光伏出力概率密度函數(shù)。由上述研究結(jié)果分析可知,NKDE建模方法僅需根據(jù)歷史數(shù)據(jù)既能生成概率分布,不需預(yù)先假定任何分布,在應(yīng)用中表現(xiàn)出準(zhǔn)確性高、適用性強等特點,非常適合具有隨機性分布的特征空間。然而,對于像光伏發(fā)電出力這種具有上下界限的樣本數(shù)據(jù),NKDE在建模過程中仍存在一定不足,表現(xiàn)為:無法在邊界點附近給出良好的估計結(jié)果,易出現(xiàn)邊界偏差;概率密度函數(shù)曲線在高密度樣本區(qū)間過于平滑,缺乏局部適應(yīng)性。因此,有必要探尋有效的方法改進以克服NKDE在光伏出力建模中的問題,得到更加精準(zhǔn)的光伏出力隨機模型。

本文針對非參數(shù)核密度估計方法應(yīng)用于光伏出力概率建模中存在邊界偏差和局部適應(yīng)性不足問題,提出一種改進的非參數(shù)核密度估計光伏出力概率建模方法。首先,闡述了采用參數(shù)法和非參數(shù)法建立的光伏出力概率分布模型;將自適應(yīng)核密度估計方法與基于偽數(shù)據(jù)的核密度估計相結(jié)合,在估計區(qū)間外生成偽數(shù)據(jù),將偽數(shù)據(jù)添加到邊界附近以修正偏差,構(gòu)建更加準(zhǔn)確的光伏出力概率模型;在此基礎(chǔ)上,采用χ2檢驗作為擬合優(yōu)度指標(biāo)對模型進行校驗。最后,結(jié)合不同天氣條件下的光伏發(fā)電出力的實測數(shù)據(jù),對模型有效性進行驗證。

1 光伏出力概率模型的構(gòu)建

1.1 光伏出力概率模型的非參數(shù)核密度估計

1) 光伏出力的核密度估計模型

首先建立光伏出力的單變量核密度估計模型[14]。設(shè)光伏輸出功率樣本值為PPV,1,PPV,2,…,PPV,n,其經(jīng)驗分布函數(shù)為

(1)

其中,k=1,2,…,r-1。

光伏出力的概率密度函數(shù)f(PPV)是通過累積概率分布函數(shù)F(PPV)求導(dǎo)得到的,根據(jù)導(dǎo)數(shù)的定義有

(2)

由式(1)和式(2)可得到f(PPV)的密度估計為

(3)

由上述推導(dǎo)過程得出光伏出力概率密度函數(shù)估計后,需聯(lián)合常用的核函數(shù)從而構(gòu)建光伏出力核密度估計函數(shù)。常用的核函數(shù)類型及具體計算公式如表1所示。

表1 常用的核函數(shù)Tab.1 Commonly used kernel functions

從表1中選擇均勻核函數(shù)公式并聯(lián)合式(3),從而計算得出基于非參數(shù)核密度估計的光伏出力概率分布模型為

(4)

式中:K(*)為核函數(shù);h為帶寬。

2) 基于自適應(yīng)核密度估計的光伏出力模型

自適應(yīng)核密度估計(Adaptive Kernel Density Estimation, AKDE)是一種使帶寬適應(yīng)樣本數(shù)據(jù)的密度估計方法,通過改變帶寬從而減少數(shù)據(jù)異常值對整體估計的影響。AKDE本質(zhì)上與NKDE相同,區(qū)別在于AKDE使用可變帶寬替換NKDE中的固定帶寬。首先通過交叉驗證法計算出一個適當(dāng)?shù)娜止潭◣抙0,然后計算f(PPV)的先導(dǎo)估計函數(shù)

(5)

定義帶寬因子λi為

(6)

(7)

1.2 非參數(shù)核密度估計的邊界效應(yīng)和局部適應(yīng)性分析

盡管NKDE有很多優(yōu)點,但在光伏出力建模的實際使用過程中,仍存在如下不足或局限性,具體包括:

1) 邊界偏差

光伏出力的實際樣本數(shù)據(jù)具有上下界限,而NKDE對于樣本數(shù)據(jù)邊界以外的估計值大于零,這就意味著NKDE無法在邊界點附近給出良好的估計結(jié)果,導(dǎo)致估計結(jié)果出現(xiàn)邊界偏差。

(8)

由式(8)可得邊界偏差為

(9)

若f(x)是以零為邊界的概率密度函數(shù),則邊界偏差為

(10)

2) 缺乏局部適應(yīng)性

表2 常用評判指標(biāo)Tab.2 Common evaluation index

核密度估計的MSE為其方差與偏差平方之和,具體表達式為

(11)

(12)

由式(12)可知,MSE由h-1f(x)和h4[f″(x)]2決定,因此可以通過改變帶寬來降低MSE,進而改善核密度估計的局部適應(yīng)性。

2 光伏出力核密度估計模型的改進

2.1 基于偽數(shù)據(jù)法的核密度估計模型修正

修正核密度估計邊界偏差的方法有很多,如數(shù)據(jù)反射法[16]、邊界核函數(shù)法[17]以及轉(zhuǎn)換法[18]等,但這些方法均不適用于二階及以上的核函數(shù)。而偽數(shù)據(jù)法沒有這些限制,可以與任意階的核函數(shù)一起使用,并且比普通數(shù)據(jù)反射方法的自適應(yīng)能力更強[19]。本文將自適應(yīng)核密度估計與基于偽數(shù)據(jù)法的核密度估計相結(jié)合,修正核密度估計邊界偏差。

(13)

將樣本從小到大排列,得到隨機變量X的順序統(tǒng)計量X(1),X(2),…,X(n)。設(shè)G=F-1為樣本Xi的分位函數(shù),其中F為隨機變量X的累計分布函數(shù),則在區(qū)間(-∞,0)上生成的偽數(shù)據(jù)為

(14)

(15)

由式(15)可得偽數(shù)據(jù)X(-i)為

(16)

則基于偽數(shù)據(jù)法的核密度估計為

(17)

式中,x>0,m為比nh大但比n小的整數(shù)。

基于偽數(shù)據(jù)法的核密度估計(Kernel Density Estimation with Pseudo-data,KDEP)雖然在一定條件下可以消除邊界偏差,但在樣本數(shù)值變化較大的局部區(qū)域,對受諸多因素影響的隨機變量使用固定帶寬的KDEP可能效果較差。為此,本文通過引入AKDE來改善局部適應(yīng)性問題。

設(shè)光伏出力樣本為PPV,1,PPV,2,…,PPV,n,其概率密度函數(shù)為f(PPV),將KDEP與AKDE相結(jié)合,用式(7)中的自適應(yīng)帶寬h(PPV,i)代替式(17)中的固定帶寬,進而得到基于偽數(shù)據(jù)法自適應(yīng)核密度估計(Adaptive Kernel Density Estimation with Pseudo-data,AKDEP)的光伏出力概率分布模型為

(18)

式(18)建立的基于AKDEP的光伏出力概率分布模型將偽數(shù)據(jù)添加到邊界附近以修正偏差,通過引入AKDE的自適應(yīng)帶寬來改善核密度估計的局部適應(yīng)性,從而克服了傳統(tǒng)非參數(shù)核密度估計模型的局限性。

2.2 光伏出力AKDEP模型的精度

(19)

(20)

2.3 最優(yōu)帶寬的選取

核密度估計曲線反映觀測數(shù)據(jù)在曲線生成中的占比,其平滑程度是通過帶寬來體現(xiàn)的,帶寬選擇的不同會直接導(dǎo)致估計結(jié)果存在差異。一般而言,帶寬選擇越大,觀測數(shù)據(jù)點在曲線中的占比越小,核密度估計曲線越平滑;反之,帶寬選擇越小,核密度估計曲線波動越顯著。

目前,最優(yōu)帶寬的選取主要有經(jīng)驗法和交叉驗證法。經(jīng)驗法通過使MISE或AMISE最小來求得最優(yōu)帶寬,計算出的最優(yōu)帶寬比較適合于樣本數(shù)據(jù)整體分布與正態(tài)分布差距不大的函數(shù),對于隨機性強、整體分布與正態(tài)分布相差較大的樣本數(shù)據(jù)不適用。本文采用交叉驗證法計算最優(yōu)帶寬,具體計算過程為

(21)

(22)

則有

(23)

最終得出最優(yōu)帶寬h為

(24)

3 光伏出力概率模型擬合度檢驗

3.1 擬合優(yōu)度檢驗

擬合優(yōu)度檢驗是判斷光伏出力理論分布是否符合樣本實際分布。如果理論分布與樣本實際分布有較大差距,那么依據(jù)理論分布建立的模型結(jié)果就可能與實際數(shù)據(jù)存在較大的誤差[20]。本文采用χ2檢驗作為擬合優(yōu)度的指標(biāo)對基于AKDEP的光伏出力概率分布模型進行檢驗,判斷其結(jié)果分布是否可以反映光伏隨機出力特性,以及其概率分布曲線是否與歷史實測數(shù)據(jù)有較高的擬合程度。

χ2檢驗是根據(jù)理論頻數(shù)與觀察頻數(shù)的差值來衡量擬合優(yōu)度優(yōu)劣的一種方法。設(shè)光伏出力的樣本為PPV,1,PPV,2,…,PPVn,并將其劃分為m組不重復(fù)的數(shù)據(jù),則χ2檢驗統(tǒng)計量為

(25)

式中:Ai為光伏出力樣本在第i個區(qū)間的觀測頻數(shù);Ei為光伏出力樣本在第i個區(qū)間的期望頻數(shù),其計算式為

Ei=F(PPV,max)-F(PPV,min)=npPV,i,

(26)

式中:PPV,max、PPV,min為第i組光伏出力樣本數(shù)據(jù)的最大值和最小值;pPV,i為光伏出力樣本在第i個區(qū)間的概率值;F為累積概率密度函數(shù)。

根據(jù)K.Pearson定理,當(dāng)樣本n足夠大時,χ2統(tǒng)計量近似服從自由度為m-1的χ2分布,即

(27)

(28)

3.2 誤差分析

為分析光伏出力概率模型的輸出結(jié)果與實測數(shù)據(jù)之間的差異,本文采用均方根誤差判定,其表達式為

(29)

式中:m為劃分的區(qū)間總數(shù);xi為光伏出力的估計值;yi為第i個區(qū)間實測數(shù)據(jù)的概率。

4 算例分析

本文數(shù)據(jù)來源于澳大利亞某大學(xué)新能源實驗室光伏出力實測數(shù)據(jù),對基于AKDEP建立的光伏出力模型進行檢驗。將理論模型結(jié)果與歷史實測數(shù)據(jù)進行對比,以便直觀地體現(xiàn)理論分布與實際數(shù)據(jù)的差異。該光伏電站的規(guī)模是255 kW,電池板建于校園內(nèi)部分屋頂和地面。該光伏系統(tǒng)單片組件的功率為255 W,共1 000片,采用集中逆變器并網(wǎng)方式,直流側(cè)用匯流箱接入逆變器并網(wǎng)。

4.1 不同光伏出力模型邊界偏差對比分析

實驗室提供的全年13:00時光伏出力實測數(shù)據(jù)如圖1所示。

將上述實測光伏出力數(shù)據(jù)為輸入樣本,計算得出基于NKDE的光伏模型和基于AKDEP的光伏模型出力概率密度曲線邊界對比結(jié)果如圖2所示。

圖1 全年13:00時光伏出力實測數(shù)據(jù)直方圖Fig. 1 Histogram of measured photovoltaic output datas at13:00 of the year

圖2 不同光伏模型的出力概率密度曲線邊界對比Fig. 2 The output probability density curve boundary comparison of different photovoltaic models

由圖2分析可知,NKDE光伏模型在小于0的區(qū)域仍有概率分布,存在邊界偏差;而AKDEP光伏模型在小于0的區(qū)域無概率分布,很好地修正了邊界偏差,與實際樣本數(shù)據(jù)分布基本相符。而且從整體來看,NKDE光伏模型雖然能反映光伏出力的變化趨勢,但由于采用固定帶寬,局部適應(yīng)性較差,分布曲線比較平滑;AKDEP光伏模型采用可變帶寬,具有較強的局部適應(yīng)性,能更加精確地模擬光伏出力的隨機特性。

4.2 不同天氣光伏出力模型的對比分析

本文使用的數(shù)據(jù)范圍為該光伏電站2016至2018年的歷史數(shù)據(jù),其中包括每天各小時級光伏出力數(shù)據(jù),以及該數(shù)據(jù)對應(yīng)的日期、時段和天氣數(shù)據(jù)等。將全年各天分為晴天和陰天。天氣預(yù)報為晴,則該日的光伏出力數(shù)據(jù)劃為晴天數(shù)據(jù);天氣預(yù)報為多云和陰雨雪,則該日光伏出力數(shù)據(jù)作為陰天數(shù)據(jù)。分別以晴天和陰雨天的光伏出力實測數(shù)據(jù)作為輸入樣本,基于NKDE光伏模型和AKDEP光伏模型擬合光伏出力概率密度分布,與隨機抽取的單日相應(yīng)天氣條件下光伏出力實測數(shù)據(jù)進行對比,以檢驗不同光伏模型對于光伏出力隨機性模擬的優(yōu)劣。

其中,晴天情況下兩種模型得出的光伏出力概率密度曲線如圖3所示。對比分析結(jié)果可知,基于AKDEP模型得出的光伏出力概率密度曲線與全年實測數(shù)據(jù)分布的擬合程度優(yōu)于NKDE光伏出力模型,能夠更好地反映光伏出力的隨機特性。利用生成的光伏出力概率分布模型與隨機抽取單日晴天各時段光伏出力分布的對比結(jié)果如圖4所示??梢妰煞N模型整體變化趨勢與單日實測光伏出力分布基本相符,但NKDE概率密度曲線過于平滑,在波動和峰值區(qū)域誤差更大,對波動的適應(yīng)性較差。

圖3 不同模型生成的晴天光伏出力概率密度曲線Fig.3 Probability density curves of photovoltaic output generated by different photovoltaic models under sunny weather

圖4 晴天光伏出力概率密度曲線與實測數(shù)據(jù)對比

陰雨天情況下兩種模型得出的光伏出力概率密度曲線如圖5所示。利用生成的光伏出力概率分布模型與隨機抽取的單日陰雨天各時段光伏出力分布的對比結(jié)果如圖6所示??梢娫陉幱晏烨闆r下NKDE與AKDEP的光伏模型都能夠較好反映光伏出力的整體變化趨勢。原因是陰雨天光伏出力波動較小,AKDEP和NKDE方法均能較好地適應(yīng)。對比單日光伏出力實測數(shù)據(jù),兩種方法的準(zhǔn)確度都較高。

圖5 陰雨天不同光伏模型生成的光伏出力概率密度曲線Fig.5 Probability density curves of photovoltaic output generated by different photovoltaic models in rainy days

圖6 陰雨天下光伏出力概率密度曲線與實測數(shù)據(jù)對比Fig.6 Comparison of probability density curve of PV output and histogram of measured data under cloudy and rainy days

由圖4和圖6也可以看出,本文建立的光伏出力模型與光伏單日出力分布有一定差異,這是由于本文模型是對光伏出力的全年統(tǒng)計平均分布,反映了全年的平均水平。

4.3 光伏出力概率模型擬合度檢驗結(jié)果

本文χ2檢驗的門檻值設(shè)為31.54,不同光伏模型的χ2檢驗結(jié)果和誤差分析結(jié)果見表3。

表3 光伏出力模型的χ2檢驗和誤差分析Tab.3 Chi-square test and error analysis of photovoltaic output model

由表3檢驗結(jié)果分析可知,基于參數(shù)分布建立的光伏模型未通過檢驗;雖然NKDE光伏模型與AKDEP光伏模型檢驗統(tǒng)計量都小于臨界值,但后者的檢驗統(tǒng)計量更小。由誤差分析結(jié)果可知,相較于其他兩種光伏模型,AKDEP光伏模型RMSE最小,說明基于AKDEP的光伏模型出力概率分布與實測數(shù)據(jù)分布最接近。

5 結(jié)論

本文針對非參數(shù)核密度估計在光伏出力概率建模中存在邊界偏差以及缺乏適應(yīng)性的問題,將自適應(yīng)核密度估計和基于偽數(shù)據(jù)法的核密度估計相結(jié)合,提出一種改進的非參數(shù)核密度估計建模方法,并基于此方法建立了光伏出力概率模型,結(jié)合算例分析,得出如下結(jié)論:

1) 基于偽數(shù)據(jù)法的自適應(yīng)核密度估計光伏出力概率模型可以很好地模擬不同天氣條件下光伏出力的隨機特性,更加精確地表征光伏出力隨機分布的整體趨勢。

2) 基于偽數(shù)據(jù)法的自適應(yīng)核密度估計所建光伏出力概率模型克服了傳統(tǒng)非參數(shù)核密度估計所建光伏出力模型的局限性,在避免邊界偏差的同時改善了局部適應(yīng)性。

猜你喜歡
密度估計概率密度概率分布
中國人均可支配收入的空間區(qū)域動態(tài)演變與差異分析
m-NOD樣本最近鄰密度估計的相合性
面向魚眼圖像的人群密度估計
基于MATLAB 的核密度估計研究
科技視界(2021年4期)2021-04-13 06:03:56
離散型概率分布的ORB圖像特征點誤匹配剔除算法
連續(xù)型隨機變量函數(shù)的概率密度公式
關(guān)于概率分布函數(shù)定義的辨析
科技視界(2016年19期)2017-05-18 10:18:46
基于概率分布的PPP項目風(fēng)險承擔(dān)支出測算
Hunt過程在Girsanov變換下的轉(zhuǎn)移概率密度的表示公式
隨機變量線性組合的分布的一個算法
林芝县| 英山县| 西安市| 玉门市| 盐边县| 龙里县| 济南市| 寻甸| 合川市| 卫辉市| 双江| 通州市| 廉江市| 嘉义县| 宿州市| 遂昌县| 通山县| 苍溪县| 泾阳县| 景宁| 镇康县| 赤水市| 蛟河市| 霍州市| 乐亭县| 贵德县| 隆安县| 青州市| 文化| 中江县| 高唐县| 海伦市| 盐津县| 台州市| 乐至县| 山阳县| 乾安县| 汶上县| 黑水县| 达州市| 靖西县|