楊 柳 楊德友 張宇時 許小鵬 李典陽
(1. 東北電力大學電氣工程學院 吉林 132012;2. 國網遼寧省電力有限公司 沈陽 110000)
隨著我國大規(guī)模的風電并網,給電網的運行也帶來了一定的沖擊,風電與熱、電負荷在時間和空間上均可能存在較強的相關性,如果不考慮這種關系將會影響風電的合理消納及風能的利用效率[1-2]。因此,在電網經濟調度中有必要對風電與熱、電負荷間的相關性進行建模,以量化變量的隨機性給電力系統(tǒng)帶來的影響,實現電網安全經濟運行。
研究變量間相關性問題的關鍵在于正確處理非正態(tài)隨機變量之間的相關性[3]。Copula理論作為多元分析方法中的一種方法,能較準確地描述多元變量的相關結構,被廣泛應用于兩個(或多個)隨機變量的依賴結構建模。該方法被用于許多領域的研究,包括金融[4]、風電場相關性分析[5]、洪水風險分析[6]、頻率分析等[7]。文獻[8]提出構造混合Copula函數來模擬兩個風場之間的風速相關性,但沒有關于模型結構和驗證的細節(jié)。文獻[9]基于動態(tài)Copula理論構建風光聯(lián)合出力模型,用動態(tài)相關系數來描述相關性,并將其運用于數據驅動的風光聯(lián)合系統(tǒng)中。文獻[10]基于Copula理論,通過描述變量間非線性相關系數,對冷熱電負荷之間的相關性進行定量分析,但僅限于少量的Copula函數。文獻[11]利用Copula理論對不同風電場下風速和風力的聯(lián)合分布進行了建模,采用兩階段最大似然估計方法來估計聯(lián)合Copula函數中的未知參數,但該方法容易陷入局部最優(yōu)。以上研究方法均采用Copula理論分析了變量間的相關性,但僅限于少量的Copula函數,并且沒有分析Copula建模中潛在的不確定性,以至于不能準確地描述變量間相關性。
鑒于此,本文采用Copula函數構建風-電-熱相關性模型。以某一地區(qū)的熱負荷、電負荷和風電出力作為數據樣本,利用全局優(yōu)化方法 MCMC對不同Copula族的參數進行約束,并提供了參數值的后驗分布,來擬合 Copula概率等值線的不確定性信息。結果表明所提方法構造的Copula函數模型可以準確地描述變量間的相關性,并且可以定量地反映建模的潛在不確定性。
Copula是一個無論其單變量分布如何,“連接”或“耦合”兩個或多個與時間無關變量的數學函數[12]。設H是具有邊際單變量分布F和G的聯(lián)合累積分布函數,(x,y)是連續(xù)的二維隨機變量。Sklar定理指出當 F和 G連續(xù)時,存在唯一一個確定的Copula 函數 C( · )滿足
Sklar定理也可以推廣到多元分布的聯(lián)合分布函數。
在非正態(tài)分布情況下,需要引入能夠很好測量隨機變量相關性的指標,通常通過參數和經驗依賴性度量之間的理論關系來估計,如 Kendall秩相關系數τ和Spearman相關系數ρ,若τ>0,表示變量間呈正相關;τ<0,表示變量間呈負相關[13]。ρ相關系數也呈同樣的變化關系。設兩隨機變量x、y的分布函數分別為F(x)、G(y),若u=F(x),v=G(y),則兩變量之間的相關性可由τ和ρ相關系數得到,即
貝葉斯(Bayes)分析已成功地應用于各個領域,用于模型推斷和不確定性量化[14-15]。MvCAT采用基于殘差高斯似然函數的貝葉斯框架來推斷 Copula參數和估計潛在的不確定性。當獲得新信息時,Bayes定理更新某個假設的先驗概率,方便地將所有建模不確定性歸結為參數,并通過以下方法估計模型參數的后驗分布
Bayes方程計算起來有點困難,為了解決這一問題,本文采用了 MCMC模擬的數值分析方法,從后驗分布中提取樣本。
馬爾可夫鏈蒙特卡羅(MCMC)算法提出了一種新的混合卷積 MCMC方法,該方法利用自適應建議分布來描述貝葉斯背景下的后驗參數區(qū)域[16]?;旌涎莼?MCMC受益于智能起點的選擇,并采用自適應大都市(Adaptive metropolis,AM)、差分演化(Differential evolution,DE)和斯諾克更新算法來搜索可行空間。MCMC算法可在一次運行中受益于多個起點,多個并行鏈可以即時通信以適應搜索的規(guī)模和方向。MCMC算法能夠搜索多個吸引區(qū)域,不僅可以找到全局最優(yōu)解的估計值,還可以近似于參數的后驗分布。局部優(yōu)化方法得益于高效、快速的搜索,并權衡了尋找局部最優(yōu)的敏感性。與局部優(yōu)化算法相比,MCMC算法計算范圍更廣,其優(yōu)越性在于它可以確保找到全局最優(yōu)估計,并可以描述潛在的不確定性。
在本研究中,使用幾種擬合優(yōu)度來評價不同的Copula模型的性能,包括似然值、Akaike信息標準(Akaike information criterion,AIC)、貝葉斯信息準則(Bayesian information criterion,BIC)、均方根誤差(Root mean square error,RMSE)和 Nash-Sutcliffe效率(Nash-Sutcliffe efficiency,NSE)[17]。最大似然參數集通過式(6)進行計算,從殘差最小化意義上講,它提供了最適合觀測數據。AIC通過增加一個基于參數的懲罰項來避免過度調整的問題,AIC被表述為
式中,D是統(tǒng)計模型的參數;CS為常數。AIC值越低,模型擬合越好。類似地,BIC表示為
與AIC相似,BIC值越低,模型擬合越好。NSE和RMSE也是兩種廣泛使用的擬合優(yōu)度措施,僅側重于最小化殘差,其表達式為
基于Copula函數變量相關性分析理論,計算風電出力、熱負荷、電負荷之間的相關性及其潛在的不確定性,算法流程如圖1所示。
本文在貝葉斯框架內采用馬爾可夫鏈蒙特卡羅模擬的多元 Copula分析工具箱(MvCAT)來估計Copula參數和潛在的不確定性。當前版本的MvCAT僅適用于二元變量分析,所以風-電-熱三變量需要分成兩兩一組進行分析,采用基于核密度的估計方法來確立隨機變量的邊緣分布,對各變量的邊緣分布進行了實證估計,并構造了變量間的聯(lián)合分布。根據最大似然法、Akaike信息準則(AIC)和貝葉斯信息準則(BIC)對所選Copulas的性能進行排序,選取五個最好的 Copula函數,進而選出最優(yōu)的 Copula函數來刻畫變量間的相關性。采用基于殘差的高斯似然函數的貝葉斯框架對所選取的 Copula函數進行參數估計和潛在的不確定性估計。
本文選取阜新區(qū)域一年的風力發(fā)電和電、熱負荷的數據進行分析,采樣的時間間隔為1 h,如圖2所示,它代表了在“三北”地區(qū)一年中熱負荷和電負荷的基本趨勢和風電場輸出功率的波動情況。
首先分析電負荷與風電出力的相關性,確立電負荷與風電出力的邊緣分布,并構造了電負荷與風電出力的聯(lián)合分布。根據最大似然法(Max-Likelihood)、Akaike信息準則(AIC)和貝葉斯信息準則(BIC)對所選Copulas的性能進行排序,如表1所示。
表1 五個最好的Copula函數
通過擬合優(yōu)度檢驗確定最合適的模型—Linear-Spearman函數,它能更好地擬合電負荷和風電出力兩個指標間的相關性,表達式為
采用基于殘差的高斯似然函數的貝葉斯框架對所選取的 Copula函數進行參數估計和潛在的不確定性估計。表2為模型估計所得到的參數,圖3是阜新區(qū)域電負荷和風電出力的依賴結構。
表2 模型估計所得參數
由表2可知,電負荷和風電出力的相關性系數Kendall=?0.325 2,Spearman=?0.563 7,Pearson=?0.430 6,存在較強的負相關性。圖3顯示了電負荷和風電出力之間的依賴關系,圖3a、3c分別為風電出力的邊緣分布函數和電負荷的邊緣分布函數,圖 3b中實線表示Copula的概率等值線,散點表示觀測數據。圖 3b中可以看出數據的不對稱和傾斜依賴結構,用Linear-Spearman Copula得到的概率等值線明顯偏向左上角(電負荷概率低,風電出力概率高)。在其他26個Copula函數中,Linear-Spearman Copula對于觀測數據提供了最好的擬合,NSE=0.981 4,RMSE=0.793 3。這突出了選擇合適Copula函數的重要性,更重要的是RMSE量化潛在的Copula建模不確定性。在觀測數據中缺乏足夠約束信息的情況下,不確定性量化尤為必要。
將關注Copula建模的不確定性,并繪制一組六個代表性Copula家族的后驗參數分布,如圖4所示。
每個圖上方的實心點表示為局部優(yōu)化方法導出的Copula參數值,而柱狀圖區(qū)域是MCMC衍生的參數,橫坐標的“×”表示為 MCMC的最大似然參數。Linear-Spearman、Galambos Copula的后驗參數(圖 4b、圖 4f)受到很好的約束。更重要的是,Copula參數通過局部優(yōu)化算法(每個圖頂部的星號)導出的值與從MCMC模擬得到的分布模式(最可能的參數,在每個圖的底部以十字顯示)一致。然而,來自局部優(yōu)化算法的Shih-Louis、Nelsen Copula的推斷參數與 MCMC模擬的對應參數明顯不同,MCMC模擬的Shih-Louis最佳參數返回RMSE值為0.863 2,而局部優(yōu)化算法的RMSE值為2.019 7。與MCMC結果相比局部優(yōu)化具有較差擬合度(根據RMSE),所以采用全局優(yōu)化算法非常重要,這些算法和 MCMC框架受益于多個起始點,可以更好地檢索目標值。Cubic Copula的參數分布合并到參數邊界,最大似然(最佳)參數放在邊界上。優(yōu)化算法試圖通過超出邊界來改善擬合,這是強制不允許的,也就是說可能這種數據的 Copula選擇不合適。由圖 4d可以看出Burr參數幾乎具有統(tǒng)一的邊緣分布,這表明觀察數據中的信息(24個數據點)不足以約束Burr Copula參數。
使用貝葉斯分析和 MCMC模擬找到后驗參數分布,并將它們轉化為概率等值線不確定性,為了研究數據長度對依賴結構和潛在模型不確定性的影響,使用了年數據和典型日數據進行對比分析,圖 5和圖6分別給出了年數據和典型日數據與后驗參數相關的概率等值線的不確定性范圍。
Copula等值線的不確定性范圍用概率等值線中的不規(guī)則區(qū)域面積表示,不確定性范圍僅歸因于貝葉斯分析中得出的參數不確定性,數據長度也對不確定度有顯著影響。由圖5可以看出不確定性范圍很小,這種情況表示數據集可以很好地約束Copula模型中的參數,這也跟觀測數據的長短有關。當概率等值線的不確定性范圍很大時(圖6),它可以包含本文所研究的大多數Copula函數的最佳預測,以至于不能準確地選擇到最優(yōu)的 Copula函數進行建模分析,這一點也突出了Copula應用的不確定性分析的重要性。
熱負荷和電負荷、熱負荷和風電出力同樣采用Copula理論相關分析方法進行分析,由于篇幅有限,不再贅述??傊?,在數據長度一定的情況下(盡量采用長的數據),在貝葉斯框架內選取的最優(yōu) Copula函數可以很好地反映變量間的相關性。
熱負荷、電負荷和風電出力三者之間的相關性對于風電合理消納、提高風能利用效率具有重要的意義。
(1) 以Copula理論為基礎,在貝葉斯框架內采用基于殘差高斯似然函數來推斷 Copula參數和估計潛在的不確定性,通過擬合優(yōu)度檢驗有效地評價了相對于其數據長度的Copula的最佳選擇,并說明數據長度對建模的不確定度有顯著影響。
(2) 通過實例分析表明,在數據長度更長的情況下,所選取的最優(yōu) Copula函數能更好地刻畫風-電-熱間的相關結構,避免了傳統(tǒng)相關性分析方法中只關注相關程度的缺點,定量反映建模的潛在不確定性,也驗證了所提方法的有效性。
(3) 基于所提方法的優(yōu)越性為下一步優(yōu)化經濟調度奠定了基礎。