樊安潔, 高 山, 方濟城 , 韓海騰, 吳 晨
(1. 東南大學(xué)電氣工程學(xué)院,江蘇 南京 210096;2. 上海電力學(xué)院電子與信息工程學(xué)院, 上海 200090;3. 國網(wǎng)江蘇省電力有限公司經(jīng)濟技術(shù)研究院,江蘇 南京 210008)
隨著光伏發(fā)電滲透率的提高,光伏出力功率的隨機性對電力系統(tǒng)的規(guī)劃和運行提出了更高的要求。研究光伏出力時間序列的生成方法,更好地研究其出力的特性,對于進一步研究滿足電力系統(tǒng)規(guī)劃和運行具有重要的意義。電力系統(tǒng)的規(guī)劃需要未來長時間的光伏預(yù)測出力數(shù)據(jù)作為分析基礎(chǔ),因此光伏出力功率預(yù)測模型應(yīng)當能夠從有限的實測數(shù)據(jù)中充分學(xué)習(xí)光伏出力的特性,保留歷史出力的基本統(tǒng)計規(guī)律,涵蓋影響光伏出力不確定性的各種因素。目前光伏序列的隨機生成算法主要包括神經(jīng)網(wǎng)絡(luò)算法、支持向量機算法、卡爾曼濾波算法、馬爾可夫鏈算法等[1-2]。其中傳統(tǒng)一階馬爾科夫鏈模型在現(xiàn)有的風(fēng)光發(fā)電功率的預(yù)測中取得了較好的效果,能夠生成在概率特征及波動特性上與原始序列較為精確的預(yù)測序列[4-8]。
目前對光伏出力功率的研究主要集中在對單個光伏電源出力序列的模擬上。未來的電力系統(tǒng)規(guī)劃中,為充分計及影響可再生能源出力不確定性的各項因素,在模擬可再生能源出力的時間序列時要考慮它們之間的相關(guān)特性[9-10]。文獻[11]采用典型日方法描述無云狀態(tài)下的太陽輻照情況,并引入向量自回歸模型,較好模擬了歷史出力中各分解成分的統(tǒng)計特征和各時間尺度下的波動特性,保留了光伏電站之間的相關(guān)性。但由于向量自回歸模型的限制,該模型適合于短時期的光伏出力時序模擬,難以滿足電力系統(tǒng)靈活性規(guī)劃的要求。文獻[12]采用交叉譜法對可再生能源和負荷之間的相關(guān)特性進行分析,提出了一種雙鏈馬爾模型對負荷和可再生能源出力序列進行預(yù)測。但該模型建立在已有精度較高的未來負荷序列的基礎(chǔ)上,未能同時生成可再生能源和負荷的時間序列。
文中提出一種多鏈馬爾科夫-蒙特卡洛(Markov Chain Monte Carlo,MCMC)方法,采用統(tǒng)一的離散狀態(tài)定義將光伏出力序列轉(zhuǎn)化為反映大氣特征的離散狀態(tài)序列,簡化了仿真復(fù)雜度,建立了多條相互服從完全條件分布的馬爾科夫鏈來模擬光伏電站上空的隨機變化的大氣狀態(tài),充分保留了光伏電站之間的相關(guān)特性。對3組不同相關(guān)程度的光伏電站仿真其出力序列,相較于傳統(tǒng)單鏈方法,該方法在生成任意相關(guān)程度的光伏電站出力序列時均能較好地模擬光伏電站間的相關(guān)特性,其生成序列的基本統(tǒng)計參數(shù)和歷史序列吻合度更高,驗證了該方法在考慮相關(guān)性的多光伏電站出力時間序列預(yù)測中的有效性。
光伏發(fā)電受到地球公轉(zhuǎn)和自轉(zhuǎn)的影響,日地距離和太陽高度角呈現(xiàn)周期性變化,因此光伏出力也呈現(xiàn)出明顯的規(guī)律性。和其他可再生能源相比,光伏出力主要呈現(xiàn)出季節(jié)特性與日特性、大氣特性和隨機波動特性這三大固有規(guī)律。在模擬光伏出力的固有規(guī)律的同時,考慮多個可再生能源對彼此出力不確定性的影響,基于MCMC法提出了考慮多光伏電站相關(guān)性的光伏出力序列的模擬方法。
為了提高數(shù)據(jù)的準確性,需要對光伏電站的歷史出力數(shù)據(jù)進行預(yù)處理,剔除錯誤的測量數(shù)據(jù),補全空缺數(shù)據(jù)。對于連續(xù)日的數(shù)據(jù)空缺,采用線性插值法對空缺數(shù)據(jù)進行差值;對于內(nèi)部個別數(shù)據(jù)空缺,采用非鄰均值生成法進行填補。
利用相關(guān)系數(shù)分析多個光伏電站出力序列的相關(guān)程度,其計算方式為:
(1)
式中:X1,X2為任意2個電站出力序列;Cov(X1,X2)為序列X1與X2之間的協(xié)方差;Var(X1)為X1的方差;Var(X2)為X2方差。2個時間序列間的相關(guān)系數(shù)越大,其相關(guān)性越強。地理位置上越接近的光伏電站,太陽輻照情況相似度越大,則其光伏出力序列之間的相關(guān)性越強。相反,距離較遠的光伏電站出力序列之間的相關(guān)性較弱。一般認為,2個時間序列間的相關(guān)系數(shù)大于0.7,則其具有強相關(guān)性。
根據(jù)各個光伏電站出力序列的相關(guān)程度,建立多鏈馬爾科夫模型,并對多個光伏電站的光伏出力序列進行預(yù)測,比較不同相關(guān)性程度下模型的預(yù)測效果。如果一個離散的時序過程在當前時刻的狀態(tài)僅由上一時刻的狀態(tài)所決定,該時序過程即是一個馬爾科夫過程。無云狀態(tài)下光伏出力序列的不確定性主要由大氣狀態(tài)所決定,而當前的大氣狀態(tài)和前一時刻的大氣狀態(tài)相關(guān)程度較高,因此可以采用馬爾科夫鏈表征大氣狀態(tài)序列。
由于鄰近地區(qū)光照情形類似,地區(qū)上空的大氣層狀況主要影響該區(qū)域內(nèi)的光伏電站出力,因而光伏電站出力的不確定性受到周圍區(qū)域光伏電站出力的影響。為了將光伏電站出力之間的相互影響因素考慮在內(nèi),在多個馬爾科夫鏈之間引入相關(guān)性條件概率得到多鏈馬爾科夫模型,將某變量下一時刻的狀態(tài)看作該變量前一時刻的狀態(tài)及其他變量當前時刻狀態(tài)已知時的條件分布,對于多個光伏電站的出力進行模擬。
圖1 多鏈馬爾科夫過程Fig.1 Diagram of multi Markov Chain process
光伏出力預(yù)測模型包括離散狀態(tài)劃分、狀態(tài)轉(zhuǎn)移規(guī)律學(xué)習(xí)、蒙特卡洛狀態(tài)抽樣、光伏序列生成和修正四個部分。其具體流程如圖2所示。
圖2 多鏈MCMC方法組合預(yù)測模型流程Fig.2 Flow chart of PV power time series forecasting process using multi MCMC method
馬爾科夫鏈對應(yīng)于一系列離散化的狀態(tài),因而對各個光伏電站的歷史出力數(shù)據(jù)進行預(yù)處理后,將每一個發(fā)電功率值對應(yīng)于特定的狀態(tài)。文中采用一種統(tǒng)一離散狀態(tài)定義的方法,避免傳統(tǒng)馬爾科夫模型對每個出力時段采用差異化的離散狀態(tài)劃分方法,降低了模型復(fù)雜度。離散狀態(tài)的定義包含兩個要素:出力范圍和離散狀態(tài)數(shù)。
離散狀態(tài)的選取要能反應(yīng)光伏出力的季節(jié)特性和日特性,假定一定時段內(nèi)大氣上空的太陽輻照度變化不大,可以將一年劃分為M個時期,將一天內(nèi)光伏的有效出力時間劃分為T個時段,統(tǒng)計光伏電源在第m時期的每天第i個時段內(nèi)的出力范圍為(Pm,i,min,Pm,i,max),將該出力范圍劃分為N個離散狀態(tài),每一狀態(tài)覆蓋的功率區(qū)間大小hm,i為:
(2)
該區(qū)間內(nèi)某時刻的光伏出力P(t)對應(yīng)的離散狀態(tài)s(t)(s(t)∈{1,2,…,N})為:
s(t)=[P(t)/hm,i]
(3)
由于光伏電池板接收到的能夠產(chǎn)生光伏出力的太陽輻照度主要受到大氣狀態(tài)的影響,因此N個不同的離散狀態(tài)對應(yīng)于N種大氣狀態(tài)。從而12個月份的光伏出力功率可以采用統(tǒng)一的離散狀態(tài)定義,均轉(zhuǎn)化為1,2,…,N表示的離散狀態(tài)量,建立起一個歷史狀態(tài)序列。這種方法對于整個時間尺度上的歷史數(shù)據(jù)建立統(tǒng)一的離散狀態(tài)定義,進一步建立的狀態(tài)轉(zhuǎn)移矩陣無需區(qū)分季節(jié)和上下午時段,能夠大大減少模擬的規(guī)模。
2.2.1 初始狀態(tài)規(guī)律
光伏出力的初始狀態(tài)包括出力開始時間和起始離散狀態(tài)。由于不同地區(qū)太陽輻照情況不同,為了使預(yù)測更加真實有效,模型在學(xué)習(xí)光伏出力歷史數(shù)據(jù)規(guī)律的過程中,需要對各個光伏電站的出力開始時間和起始離散狀態(tài)規(guī)律進行統(tǒng)計學(xué)習(xí),便于后期抽樣生成各光伏電站每日出力的初始狀態(tài)。
2.2.2 狀態(tài)轉(zhuǎn)移過程
按照馬爾科夫模型的參數(shù)學(xué)習(xí)的統(tǒng)計估算方法,根據(jù)大數(shù)定律,在樣本數(shù)量足夠的情況下以頻率代替概率,計算各個狀態(tài)之間的概率轉(zhuǎn)移規(guī)律。
設(shè)某個區(qū)域內(nèi)k個光伏電站的出力之間具有相關(guān)性,各光伏電站的離散出力狀態(tài)用k維變量s表示,s=(s1,…,si,…,sk),si∈(1,…N),第i個光伏電站在t+1時刻的出力服從以下分布。
(4)
由上式構(gòu)成的狀態(tài)轉(zhuǎn)移矩陣Pi,其維數(shù)為Nk×N。以k=2,N=3為例,s1服從分布。
(5)
s1對應(yīng)的狀態(tài)轉(zhuǎn)移矩陣P1可以表示為:
(6)
其中:
(7)
抽樣生成服從完全條件分布的多條馬爾科夫狀態(tài)鏈的過程中,將狀態(tài)轉(zhuǎn)移矩陣作為抽樣中的完全條件分布,依次對各個變量進行輪流抽樣。抽樣的具體過程如下:
(1) 設(shè)定狀態(tài)轉(zhuǎn)移次數(shù)閾值n1,需要的樣本個數(shù)n2;
(3) Fort=1 ton1+n2
……
在多鏈馬爾科夫模型學(xué)習(xí)了歷史數(shù)據(jù)的狀態(tài)轉(zhuǎn)移規(guī)律的基礎(chǔ)之上,進一步采用蒙特卡羅抽樣方法生成離散狀態(tài)序列,需要將其還原為光伏出力值。大氣中云層的隨機移動、聚集和消散給大氣狀態(tài)帶來了瞬時擾動,為考慮這種隨機波動特性,需要在狀態(tài)序列中疊加白噪聲序列ψ進行修正。若某光伏電站某一時刻所處的離散狀態(tài)為s(t),其所屬的時段為第m個時期的第i個時段,那么該時刻的光伏發(fā)電功率為:
P(t)=Xm,i,min+(s(t)-ψ(t))hm,i
(8)
為了驗證多鏈馬爾科夫模型對于考慮相關(guān)性光伏電站出力建模的有效性,文中采用了美國俄勒岡地區(qū)6個光伏電站及我國寧夏地區(qū)光伏電站出力的數(shù)據(jù)進行仿真測試。美國俄勒岡地區(qū)的光伏電站的分布于4個區(qū)域,如圖3所示。
圖3 美國俄勒岡地區(qū)光伏電站地區(qū)分布Fig.3 Diagram of regional distribution of photovoltaic power plants in Oregon, USA
對本文選取的7個光伏出力觀測數(shù)據(jù)序列進行相關(guān)性分析,其出力序列的互相關(guān)程度如表1所示。
表1 光伏電站相關(guān)程度Tab.1 Correlation coefficients between PV power plants
(b) 算例2
(c) 算例3
從表1中可以看出,Portland地區(qū)的3個光伏電站出力序列的相關(guān)程度超過0.9,呈現(xiàn)高度相關(guān)關(guān)系;分布于Portland、Ashland和Bend 3個地區(qū)的光伏電站的出力序列的相關(guān)程度均大于0.7,其相關(guān)程度小于集中位于Portland的3個電站;Sheldon Village地區(qū)和我國寧夏地區(qū)光伏出力相關(guān)系數(shù)較小,由于兩地區(qū)緯度相近,兩地光伏電站的出力仍具有一定的相關(guān)性。顯然,地理位置上越接近的光伏電站,地區(qū)上空的大氣層狀態(tài)之間的相互影響越大,其光伏出力序列的相關(guān)程度越強。
采用單鏈MCMC方法對7個光伏電站的出力進行仿真模擬,離散狀態(tài)數(shù)選取為20,仿真時間長度為10 a。光伏出力的極限轉(zhuǎn)移矩陣約在1500~2000次達到收斂,設(shè)置狀態(tài)轉(zhuǎn)移次數(shù)的閾值為2000。
光伏出力序列的一般統(tǒng)計參數(shù)包括均值、標準差、概率密度函數(shù)和累積概率密度數(shù)。其中,概率密度函數(shù)和累計概率密度函數(shù)描述了光伏電站發(fā)電功率的長期概率分布。圖4中給出了各個光伏電站預(yù)測序列的一般統(tǒng)計參數(shù)對比,可以看出,單鏈MCMC方法預(yù)測的光伏出力序列能夠較好地繼承歷史序列的基本統(tǒng)計特性。
圖4 單鏈方法下7個光伏電站原始/預(yù)測基本統(tǒng)計特性對比Fig.4 Comparison of basic statistical characteristics of historical and predicted time series of 7 PV plants outputs using single MCMC method
從圖5中可以看出生成序列的概率密度分布和累計概率分布均和歷史序列十分接近,說明單鏈MCMC方法能夠較好地模擬歷史序列的分布效果。
圖5 生成光伏序列概率密度和累積概率密度對比Fig.5 Comparison of probability density and cumulative probability density between single and multi MCMC method
3.3.1 一般統(tǒng)計參數(shù)對比
采用多鏈MCMC方法對3組光伏電站出力序列進行仿真,其生成序列的一般統(tǒng)計參數(shù)和單鏈方法的對比如圖5和圖6所示,將光伏出力范圍等分為10個區(qū)間按從小到大的順序編號為1-10。從圖5可以看出,多鏈方法生成序列的概率密度和累積概率密度與歷史序列更為接近,更能體現(xiàn)歷史序列的統(tǒng)計特征。圖6描述了兩種方法所預(yù)測的序列相比于歷史序列的平均絕對百分誤差(MAPE),從圖6中可以看出,光伏電站之間的相關(guān)程度越高時,采用多鏈方法生成的預(yù)測序列的均值和標準差相較于歷史序列的誤差越小,能更好地維持歷史序列的基本統(tǒng)計特性。但隨著組間光伏電站出力的相關(guān)程度的降低,多鏈方法的預(yù)測精確度有所降低,可能是因為相關(guān)程度較低的光伏電站在地理位置上相距較遠,大氣和云層之間的影響也較小??傮w上,考慮相關(guān)性的多鏈MCMC方法在描述光伏電站的出力特性上仍然優(yōu)于原始的單鏈方法。
圖6 單鏈/多鏈方法下不同相關(guān)水平的 光伏電站預(yù)測序列和歷史序列的 基本統(tǒng)計參數(shù)對比Fig.6 Comparison of basic statistical characteristics of historical and predicted time series of PV plants outputs of different relevant levels between single and multi MCMC method
3.3.2 相關(guān)性參數(shù)對比
采用兩種方法預(yù)測3組光伏電站的出力序列的相關(guān)系數(shù)對比如表 2所示。
表2 單鏈/多鏈方法下不同相關(guān)水平的光伏電站 預(yù)測序列和歷史序列的相關(guān)系數(shù)對比Tab.2 Comparison of correlation coefficients of predicted time series of PV plants outputs of different relevant levels between single and multi MCMC method
相關(guān)程度光伏電站歷史序列單鏈方法多鏈方法相關(guān)系數(shù)誤差/%相關(guān)系數(shù)誤差/%1—20.9720.586-41.30.954-1.81強2—30.9720.565-41.90.951-2.153—10.9980.597-40.20.966-3.203—40.8010.642-19.80.8455.42中強4—50.7260.589-18.90.7726.395—30.7480.612-18.20.7824.64中6—70.5820.5860.6350.5860.635
從表2中可以明顯看出,光伏電站之間的相關(guān)程度越高,多鏈方法所生成的預(yù)測序列保留原始序列之間相關(guān)性的效果越好。當光伏電站之間的相關(guān)系數(shù)較小時,單鏈方法和多鏈方法均能較好地繼承歷史序列之間的相關(guān)特性。這是因為光伏電站出力序列之間的相關(guān)程度由它們之間的地理距離決定,地理上相距越遠的電站,其上空的大氣狀態(tài)之間的影響也越小,此時單鏈馬爾科夫模型可以較好地刻畫各地區(qū)大氣狀態(tài)的隨機變化特性。而光伏電站之間的地理位置越接近時,它們的出力序列的相互影響越大,各光伏電站出力所對應(yīng)的大氣狀態(tài)服從彼此之間的完全條件分布,因而此時考慮相關(guān)性的多鏈方法能夠更好地分析各個光伏電站之間的相互影響因素。
統(tǒng)計方法中,自相關(guān)系數(shù)常用來表示時間序列的前后相關(guān)程度,其計算方法如式9所示:
(9)
式中:Xi為時間序列;μ和σ分別為該時間序列的均值和方差;k表示時延階數(shù)。
單鏈方法和多鏈方法生成的預(yù)測序列的自相關(guān)系數(shù)對比如圖7所示,可以看出,多鏈方法預(yù)測序列的自相關(guān)曲線與歷史序列更加接近,能夠較好地保留原序列的時間相關(guān)性。
圖7 兩種方法光伏電站預(yù)測/ 歷史序列的自相關(guān)系數(shù)對比Fig.7 Comparison of autocorrelation coefficients of predicted time series of PV plants outputs between single and multi MCMC method
文中提出一種考慮多光伏電站出力相關(guān)性的光伏出力序列預(yù)測方法。將多個光伏電站的出力序列轉(zhuǎn)化為反應(yīng)大氣特征的離散狀態(tài)序列,辨識多條歷史序列的狀態(tài)轉(zhuǎn)移規(guī)律,建立多條相互服從完全條件分布的馬爾科夫鏈,對離散狀態(tài)的隨機波動特性進行修正后還原生成光伏出力序列。該多鏈MCMC方法應(yīng)用于國內(nèi)外7個具有不同相關(guān)程度的光伏電站功率序列生成,通過與歷史數(shù)據(jù)和單鏈方法進行對比分析,得到以下結(jié)論:
(1) 基本統(tǒng)計特性上,當一組光伏電站之間的相關(guān)程度較高時,多鏈方法較單鏈方法所生成的光伏功率序列,在均值和標準差上與原始光伏功率序列更為接近,在概率分布上更接近于原始分布,且對于相關(guān)性越強的光伏電站模擬準確度越高。
(2) 相關(guān)特性上,多鏈方法在預(yù)測不同相關(guān)程度的光伏電站的出力序列時,均能較好地維持光伏電站之間的相關(guān)特性,而單鏈方法不適用于相關(guān)程度較高的多個光伏電站出力序列的組合預(yù)測。
(3) 文中的多鏈MCMC方法適用于不同相關(guān)水平的光伏電站出力序列的組合預(yù)測,能夠繼承原始序列的基本統(tǒng)計特性,有效地體現(xiàn)多個光伏電站出力水平之間相互影響的特點。