張玉敏,孫鵬凱,吉興全,楊 明,于一瀟,張 旋
(1.山東科技大學(xué)電氣與自動(dòng)化工程學(xué)院,山東省青島市 266590;2.電網(wǎng)智能化調(diào)度與控制教育部重點(diǎn)實(shí)驗(yàn)室(山東大學(xué)),山東省濟(jì)南市 250061;3.智能電網(wǎng)教育部重點(diǎn)實(shí)驗(yàn)室(天津大學(xué)),天津市 300072)
新能源的大規(guī)模消納在實(shí)現(xiàn)清潔化和低碳化的同時(shí),其出力固有的不確定性為電力系統(tǒng)的經(jīng)濟(jì)調(diào)度帶來(lái)新的挑戰(zhàn)[1-2]。在綜合能源系統(tǒng)(integrated energy system,IES)中,電、氣、熱能之間具有深度耦合特性及相互轉(zhuǎn)化的潛能。因此,充分挖掘電-氣-熱多能流的靈活性資源,提高IES 優(yōu)化調(diào)度決策水平,是應(yīng)對(duì)新能源的不確定性、提高新能源消納水平的有效途徑[3-4]。
為此,諸多國(guó)內(nèi)外學(xué)者圍繞多能耦合的綜合能源系統(tǒng)隨機(jī)動(dòng)態(tài)經(jīng)濟(jì)調(diào)度(integrated energy system stochastic dynamic economic dispatch,IES-SDED)問(wèn)題展開(kāi)了研究。在應(yīng)對(duì)IES 中不確定性方面,隨機(jī) 優(yōu) 化(stochastic optimization,SO)[5-7]、魯 棒 優(yōu)化[8-10]和分布魯棒優(yōu)化算法[11-14]被廣泛應(yīng)用。此外,模型預(yù)測(cè)控制(model predictive control,MPC)算法由于其對(duì)模型的廣泛適應(yīng)性,已被成功應(yīng)用于IESSDED 問(wèn)題中[15-16]。然而,MPC 對(duì)預(yù)測(cè)的準(zhǔn)確性有較強(qiáng)的依賴,往往難以獲得整個(gè)調(diào)度周期的全局最優(yōu)解。近年來(lái),基于大數(shù)據(jù)的智能算法在IES 經(jīng)濟(jì)調(diào)度中被廣泛應(yīng)用[17-19],然而其過(guò)于依賴訓(xùn)練的數(shù)據(jù)量,因而影響其工程實(shí)用性。此外,上述研究中對(duì)不確定性的處理僅局限于單一元素,目前鮮有研究同時(shí)考慮風(fēng)電、電價(jià)以及負(fù)荷等多元不確定性情況下的IES 隨機(jī)經(jīng)濟(jì)調(diào)度問(wèn)題。
近 似 動(dòng) 態(tài) 規(guī) 劃(approximate dynamic programming,ADP)算法既兼顧傳統(tǒng)動(dòng)態(tài)規(guī)劃(dynamic programming,DP)算法[20-21]易于獲取全局最優(yōu)解的優(yōu)勢(shì)[22],也利用值函數(shù)近似,解決了“維數(shù)災(zāi)”的問(wèn)題?,F(xiàn)今,ADP 算法已成功應(yīng)用于電力系統(tǒng)優(yōu)化調(diào)度領(lǐng)域中的儲(chǔ)能控制[23]、發(fā)電計(jì)劃制定[24]、機(jī)組組合[25]、電動(dòng)汽車充放電控制[26]以及隨機(jī)經(jīng)濟(jì)調(diào)度[27-28]等問(wèn)題中。然而,目前鮮有研究利用ADP 算法充分挖掘電-氣-熱多能流中蘊(yùn)含的靈活性資源。因此,亟須研究一種能夠充分發(fā)揮多能互補(bǔ)優(yōu)勢(shì)的IES 調(diào)度策略及高效求解方法。
考慮到電-氣-熱IES-SDED 是一種多維隨機(jī)動(dòng)態(tài)規(guī)劃問(wèn)題,ADP 算法在保持求解精度的前提下,計(jì)算效率會(huì)隨之降低[29]。并行計(jì)算作為一種發(fā)展成熟的高效計(jì)算技術(shù),其與ADP 算法相結(jié)合的并行多維近似動(dòng)態(tài)規(guī)劃(parallel multi-dimensional approximate dynamic programming,PMADP)算 法已經(jīng)成功應(yīng)用于電力系統(tǒng)和水電優(yōu)化調(diào)度領(lǐng)域[30-31]。本文引入PMADP 算法的思想,用于求解電-氣-熱IES-SDED 問(wèn)題,主要貢獻(xiàn)如下:
1)提出3 層循環(huán)嵌套結(jié)構(gòu)的IES-SDED 問(wèn)題求解框架,使多能耦合IES 優(yōu)化調(diào)度問(wèn)題的求解與基于并行全局尋優(yōu)思想的多維近似動(dòng)態(tài)規(guī)劃求解策略相契合,有效解決了IES 中多元高維數(shù)據(jù)在離線訓(xùn)練中耗時(shí)長(zhǎng)的問(wèn)題。
2)提出狀態(tài)變量聚合方法,通過(guò)構(gòu)建由高維狀態(tài)變量聚合到低維狀態(tài)變量的篩選機(jī)制,解決動(dòng)態(tài)規(guī)劃的“維數(shù)災(zāi)”問(wèn)題,提升了求解效率。
3)提出狀態(tài)空間壓縮策略,依據(jù)電儲(chǔ)能系統(tǒng)(electrical storage system,ESS)和 蓄 熱 罐(heat storage tank,HST)決策更新過(guò)程中調(diào)度基點(diǎn)對(duì)搜索空間的影響,剔除無(wú)效狀態(tài),降低求解規(guī)模,在兼顧求解精度的同時(shí)顯著提升了計(jì)算速度。
本文提出PMADP 算法對(duì)附錄A 中構(gòu)建的IES-SDED 模型進(jìn)行求解。
PMADP 模型包括狀態(tài)變量、決策變量、外部信息及值函數(shù)等。為便于理解,結(jié)合IES-SDED 問(wèn)題,給出如下定義。
1)狀態(tài)變量
狀態(tài)變量反映了IES 在場(chǎng)景n中時(shí)段t的狀態(tài):
式中:Sn,t為場(chǎng)景n中時(shí)段t的狀態(tài);Pg,n,t-Δt、Pc,n,t-Δt和Pk,n,t-Δt分別為場(chǎng)景n中燃煤機(jī)組g、熱電聯(lián)產(chǎn)(combined heat and power,CHP)機(jī)組c和燃?xì)廨啓C(jī)k在時(shí)段t-Δt的出力;Ee,n,t和Hh,n,t分別為場(chǎng)景n中第e個(gè)ESS 和第h個(gè)HST 在時(shí)段t的可用容量;Pw,n,t為 場(chǎng) 景n中 風(fēng) 電 機(jī) 組w在 時(shí) 段t的 出 力;Di,n,t、Hf,n,t和Gm,n,t分別為場(chǎng)景n中電網(wǎng)節(jié)點(diǎn)i、熱網(wǎng)節(jié)點(diǎn)f和氣網(wǎng)節(jié)點(diǎn)m的負(fù)荷;pn,t為場(chǎng)景n時(shí)段t的電價(jià)。
2)決策變量
將場(chǎng)景n中時(shí)段t的決策變量xn,t分為xn,t,e、xn,t,gas和xn,t,h3 個(gè)部分,分別為場(chǎng)景n中時(shí)段t電力系統(tǒng)(electric power system,EPS)、天 然 氣 系 統(tǒng)(natural gas system,NGS)和區(qū)域供熱系統(tǒng)(district heating system,DHS)的決策變量,表達(dá)式為:
3)外部信息
外部信息反映了系統(tǒng)的隨機(jī)性,其由日前預(yù)測(cè)信息Fn,t及預(yù)測(cè)誤差ΔFn,t兩部分組成。在IESSDED 中,本文考慮了風(fēng)電、電負(fù)荷、熱負(fù)荷、氣負(fù)荷及電價(jià)的不確定性,表示為:
式中:Pw,n,t,f、Di,n,t,f、Hf,n,t,f、Gm,n,t,f和pn,t,f分 別 為場(chǎng)景n中時(shí)段t的風(fēng)電機(jī)組w的出力、電網(wǎng)節(jié)點(diǎn)i處的電負(fù)荷、熱網(wǎng)節(jié)點(diǎn)f處的熱負(fù)荷、氣網(wǎng)節(jié)點(diǎn)m處的氣負(fù)荷 和 電 價(jià) 的 日 前 預(yù) 測(cè) 信 息;ΔPw,n,t,f、ΔDi,n,t,f、ΔHf,n,t,f、ΔGm,n,t,f和Δpn,t,f分別為場(chǎng)景n中時(shí)段t的風(fēng)電機(jī)組w的出力、電網(wǎng)節(jié)點(diǎn)i處的電負(fù)荷、熱網(wǎng)節(jié)點(diǎn)f處的熱負(fù)荷、氣網(wǎng)節(jié)點(diǎn)m處的氣負(fù)荷和電價(jià)的日前預(yù)測(cè)誤差。
4)值函數(shù)
在動(dòng)態(tài)規(guī)劃框架下,通過(guò)遞歸求解Bellman 方程[32],可以獲得IES 的最優(yōu)運(yùn)行成本為:
式中:Vn,t(Sn,t)為在狀態(tài)Sn,t下系統(tǒng)的最優(yōu)總運(yùn)行成本;E(?)為期望函數(shù);Cn,t(Sn,t,xn,t)為由狀態(tài)Sn,t執(zhí)行決策xn,t而轉(zhuǎn)移到狀態(tài)Sn,t+1產(chǎn)生的瞬時(shí)成本;γ為范圍從0 到1 的回報(bào)因子,γ=0,則值函數(shù)僅與當(dāng)前時(shí)間的成本相關(guān),γ越接近1,則值函數(shù)越多地考慮未來(lái)回報(bào),使優(yōu)化更具遠(yuǎn)見(jiàn)。
PMADP 算法求解思想是利用狀態(tài)變量聚合的方法,將狀態(tài)變量以其靈活性資源豐富程度為依據(jù)進(jìn)行篩選和聚合,利用值函數(shù)近似,解決“維數(shù)災(zāi)”的問(wèn)題,利用狀態(tài)空間壓縮策略減小尋優(yōu)范圍,從而構(gòu)造與并行計(jì)算相契合的PMADP 算法循環(huán)嵌套框架。
1.2.1 狀態(tài)變量的聚合
引入決策后狀態(tài)變量Sn,t,x表示做出決策后但隨機(jī)因素的新信息還未到來(lái)之前的狀態(tài)。通過(guò)采用Sn,t,x來(lái)避免式(8)中復(fù)雜的期望求解過(guò)程?;诖?式(8)可以表示為:
借助決策后值函數(shù)Vn,t,x(Sn,t,x)克服了隨機(jī)因素對(duì)狀態(tài)空間維數(shù)的影響。然而,在IES-SDED 問(wèn)題求解中,高維連續(xù)狀態(tài)變量使得Vn,t,x(Sn,t,x)的計(jì)算仍很困難,“維數(shù)災(zāi)”的問(wèn)題依然存在。因此,本文提出以低維替代高維的狀態(tài)空間聚合策略。狀態(tài)變量聚合后的Bellman 方程為:
1.2.2 值函數(shù)的更新
本文建立由不同狀態(tài)組合下的值函數(shù)組成的值表記錄不同狀態(tài)的值。若將ESS 的可用容量離散為E個(gè)狀態(tài),將HST 的可用熱量離散為H個(gè)狀態(tài),則構(gòu)建的值表大小為E×H×T。
每一次訓(xùn)練中,根據(jù)IES 每個(gè)時(shí)段t的當(dāng)前狀態(tài)及上一次訓(xùn)練所構(gòu)建的值表進(jìn)行決策,即
式中:arg min {?}為IES 所做出的最優(yōu)決策;n為訓(xùn)練迭代次數(shù)。
在做出最優(yōu)決策后,計(jì)算當(dāng)前狀態(tài)的樣本估計(jì)值(如式(12)所示),據(jù)此更新本次訓(xùn)練中的值函數(shù),并記入值表。
式中:αn為0~1 之間的參數(shù),通過(guò)調(diào)整αn的值,可以改變之前經(jīng)驗(yàn)在本次值函數(shù)更新中的比重;v?n,t為當(dāng)前狀態(tài)下的樣本估計(jì)值。
1.2.3 狀態(tài)空間的壓縮
本文提出了僅保留有效狀態(tài)的狀態(tài)空間壓縮策略,該策略利用ESS 和HST 的最大充放電/蓄放熱限值約束將無(wú)效狀態(tài)剔除,實(shí)現(xiàn)對(duì)狀態(tài)空間的壓縮。狀態(tài)空間壓縮思想,如附錄B 圖B1 所示。
由附錄B 圖B1 可見(jiàn),第k′次迭代中時(shí)段t所解得第e個(gè)ESS 的可用容量和第h個(gè)HST 的可用熱量的狀態(tài)分別為Ee,t,k′和Hh,t,k′,將其設(shè)為當(dāng)前狀態(tài),制定時(shí)段t+1 的最優(yōu)決策,從而將狀態(tài)分別轉(zhuǎn)移到Ee,t+1,k′和Hh,t+1,k′。由ESS 運(yùn) 行 約 束(附 錄A 式(A15)和式(A16))及HST 的運(yùn)行約束式(A22)和式(A23)可知,以狀態(tài)Ee,t,k′和Hh,t,k′為起點(diǎn)可以轉(zhuǎn)移得到的新?tīng)顟B(tài)Ee,t+1,k′和Hh,t+1,k′是有限的?;诖?將滿足ESS 的最大充放電限值式(A15)和式(A16)、以 及HST 的 蓄 放 熱 限 值 式(A22)和 式(A23)約束的狀態(tài)定義為可到達(dá)的狀態(tài);否則定義為無(wú)法到達(dá)的狀態(tài),即無(wú)效狀態(tài),在計(jì)算中直接剔除,可有效降低求解規(guī)模,提高計(jì)算效率。
1.2.4 并行化
本文提出了將并行計(jì)算與多維近似動(dòng)態(tài)規(guī)劃(multi-dimensional approximate dynamic programming,MADP)相結(jié)合的PMADP 算法,以解決IES-SDED 問(wèn)題中狀態(tài)空間壓縮后離線訓(xùn)練耗時(shí)長(zhǎng)的問(wèn)題。通過(guò)基于MADP 的IES-SDED 模型的并行計(jì)算可行性分析,將其描述為適用于并行求解的嵌套架構(gòu),并構(gòu)建并行性能評(píng)價(jià)指標(biāo)以衡量PMADP 算法的性能。
1)多維近似動(dòng)態(tài)規(guī)劃算法并行計(jì)算可行性分析
循環(huán)迭代任務(wù)可并行化的前提是該循環(huán)可以分解為若干個(gè)獨(dú)立部分,即當(dāng)前循環(huán)的執(zhí)行不受之前循環(huán)結(jié)果的影響。基于該思想,構(gòu)造IES-SDED 的3 層嵌套循環(huán)結(jié)構(gòu)模型:最外層為訓(xùn)練次數(shù)循環(huán);中間層為階段變量循環(huán),即對(duì)所有優(yōu)化時(shí)段進(jìn)行遍歷循環(huán);最內(nèi)層為獨(dú)立的狀態(tài)變量循環(huán),即對(duì)每個(gè)優(yōu)化時(shí)段中的狀態(tài)變量組合空間進(jìn)行獨(dú)立遍歷循環(huán)。由此,本文模型架構(gòu)與并行計(jì)算思想相契合,可采用并行計(jì)算的方式進(jìn)行求解。
2)并行性能評(píng)價(jià)指標(biāo)
為了驗(yàn)證并行求解策略的性能,本文以加速比SP和并行效率PE作為衡量并行計(jì)算性能的指標(biāo),表達(dá)式為:
式中:ts和tp分別為求解同一任務(wù)時(shí)的串行計(jì)算時(shí)間和并行計(jì)算時(shí)間;Pcore為參與并行計(jì)算的核心數(shù)。
若SP越接近于參與任務(wù)執(zhí)行的核心數(shù)目,即PE越接近于1,則越能充分表征核心并行計(jì)算的參與度,并行計(jì)算的性能越高。
本文以E6-H6-G6 測(cè)試系統(tǒng)和E118-H12-G12測(cè)試系統(tǒng)為例,驗(yàn)證本文所提IES-SDED 模型和PMADP 算法的有效性。E6-H6-G6 測(cè)試系統(tǒng)如附錄B 圖B2 所示,發(fā)電機(jī)和外網(wǎng)參數(shù)、氣源參數(shù)、儲(chǔ)能裝置參數(shù)和日前預(yù)測(cè)信息(電價(jià)、電負(fù)荷、熱負(fù)荷、氣負(fù)荷和風(fēng)電功率)見(jiàn)文獻(xiàn)[33-34]。E118-H12-G12測(cè)試系統(tǒng)相關(guān)數(shù)據(jù)見(jiàn)文獻(xiàn)[35],采用MATLAB 軟件調(diào)用CPLEX 求解器進(jìn)行求解,計(jì)算機(jī)配置為Windows 10 系統(tǒng),Intel Xeon E5-2678 CPU,主頻為2.5 GHz,內(nèi)存為64 GB。調(diào)度周期為24 h,每時(shí)段長(zhǎng)度為1 h。
假設(shè)風(fēng)電、電價(jià)以及負(fù)荷的預(yù)測(cè)誤差均服從正態(tài) 分 布( 即 ΔPw,n,t,f~N(0,0.2), ΔDi,n,t,f~N(0 ,0.05), ΔHf,n,t,f~N(0,0.05), ΔGm,n,t,f~N(0,0.05),Δpn,t,f~N(0, 0.05)),利用蒙特卡洛模擬 生 成10 000 組訓(xùn)練場(chǎng)景,對(duì)PMADP 算法進(jìn)行充分訓(xùn)練,并用1 000 組測(cè)試場(chǎng)景來(lái)驗(yàn)證算法的準(zhǔn)確性。
2.1.1 狀態(tài)變量聚合策略靈活性比較
基于本文提出的狀態(tài)變量聚合策略,以靈活性資源可調(diào)程度為依據(jù),僅由靈活性能力高的狀態(tài)變量組成狀態(tài)空間,實(shí)現(xiàn)低維替代高維的目的。為了驗(yàn)證該聚合策略對(duì)IES-SDED 結(jié)果的影響,構(gòu)建以下2 種場(chǎng)景:
1)場(chǎng)景1:不考慮狀態(tài)變量聚合的貪心策略。
2)場(chǎng)景2:同時(shí)將狀態(tài)變量聚合至ESS 可用容量和HST 可用熱量。
其中,ESS 可用容量的離散間隔均設(shè)置為20 MW,HST 可用熱量的離散間隔均設(shè)置為10 MW。
從1 000 組測(cè)試場(chǎng)景中隨機(jī)抽取1 組分析場(chǎng)景1和場(chǎng)景2 中EPS、DHS、ESS 和HST 的調(diào)度決策,結(jié)果如圖1 和圖2 所示。圖中,GT 為燃?xì)廨啓C(jī)組,WT為風(fēng)電機(jī)組。
圖1 場(chǎng)景1 的調(diào)度決策結(jié)果Fig.1 Dispatch decision results in scenario 1
圖2 場(chǎng)景2 的調(diào)度決策結(jié)果Fig.2 Dispatch decision results in scenario 2
1)場(chǎng)景1
由圖1(a)和圖1(c)可知,在調(diào)度初始時(shí)段(01:00―03:00),ESS 完全釋放,以實(shí)現(xiàn)每個(gè)獨(dú)立調(diào)度時(shí)段經(jīng)濟(jì)性最優(yōu)的目標(biāo)。由于ESS 充放電行為只取決于當(dāng)前調(diào)度尋優(yōu)策略,該調(diào)度結(jié)果無(wú)法表征其對(duì)剩余獨(dú)立調(diào)度周期的影響。因此,在低電價(jià)和電負(fù)荷低谷時(shí)段(14:00—17:00),ESS 不充電;在高電價(jià)和電負(fù)荷高峰時(shí)段(11:00—13:00 和18:00—21:00),ESS 不放電;而在18:00,由于ESS的可用容量已經(jīng)耗盡,所以EPS 不得不以高價(jià)從外電網(wǎng)購(gòu)電。在調(diào)度周期結(jié)束時(shí)刻,ESS 的可用容量無(wú)法回到初始狀態(tài),影響下一個(gè)周期調(diào)度策略的制定。
由圖1(b)和圖1(c)可知,在電負(fù)荷第1 個(gè)上升時(shí)段(從06:00 開(kāi)始),CHP 機(jī)組通過(guò)增加產(chǎn)電以滿足電負(fù)荷需求,避免切負(fù)荷造成的高額懲罰成本。CHP 機(jī)組由此產(chǎn)生的多余熱量被儲(chǔ)存在HST中。由于HST 無(wú)法制定兼顧對(duì)未來(lái)影響的全局最優(yōu)調(diào)度策略,在HST 擁有可調(diào)靈活性資源的時(shí)段(06:00―24:00)不放熱。在調(diào)度周期結(jié)束時(shí)刻,HST 的可用熱量無(wú)法回到初始狀態(tài),影響下一周期的調(diào)度。場(chǎng)景1 中ESS 和HST 的這種以單一獨(dú)立調(diào)度時(shí)段經(jīng)濟(jì)性最優(yōu)為目標(biāo)的貪心調(diào)度策略無(wú)法充分發(fā)揮靈活性資源的柔性互補(bǔ)特性,無(wú)法得到全局最優(yōu)決策。
2)場(chǎng)景2
由圖2 可見(jiàn),ESS 在高電價(jià)和電負(fù)荷高峰時(shí)段(08:00―13:00 和19:00―21:00)放電以滿足電負(fù)荷需求;在低電價(jià)和電負(fù)荷低谷時(shí)段(01:00―02:00、04:00―05:00、14:00―17:00 和22:00―24:00)充電以避免棄風(fēng);HST 在電負(fù)荷低谷和熱負(fù)荷高峰時(shí)段(01:00、04:00 和22:00―24:00),以及電、熱負(fù)荷低谷時(shí)段(14:00―16:00)放熱以降低CHP 機(jī)組產(chǎn)電從而避免棄風(fēng);在電負(fù)荷高峰和熱負(fù)荷低谷時(shí)段(11:00―13:00 和18:00―20:00)蓄熱以儲(chǔ)存CHP 機(jī)組為滿足高電負(fù)荷而產(chǎn)生的多余熱量。相較于場(chǎng)景1 的貪心策略,場(chǎng)景2 依據(jù)多能流耦合特點(diǎn),綜合考慮ESS 和HST 這2 種不同性質(zhì)的靈活性存儲(chǔ)設(shè)備,可充分發(fā)揮多能源荷之間的柔性互補(bǔ)優(yōu)勢(shì),進(jìn)而從全局的角度制定最優(yōu)調(diào)度策略,避免由于靈活性資源挖掘不充分導(dǎo)致的棄風(fēng)、高電價(jià)購(gòu)電等風(fēng)險(xiǎn)。
2.1.2 狀態(tài)變量離散策略對(duì)并行多維近似動(dòng)態(tài)規(guī)劃算法的影響
為了分析不同狀態(tài)變量離散策略對(duì)PMADP 算法離線訓(xùn)練時(shí)間、在線調(diào)度時(shí)間、充分訓(xùn)練所需要的迭代次數(shù)以及單個(gè)不確定場(chǎng)景運(yùn)行成本的影響,本文在場(chǎng)景2 的基礎(chǔ)上,對(duì)ESS 的可用容量和HST 的可用熱量選擇不同的離散間隔以獲得不同的狀態(tài)空間離散策略,具體構(gòu)建方案及結(jié)果比較如表1所示。
表1 不同狀態(tài)變量離散策略對(duì)PMADP 算法的影響Table 1 Influence of discrete strategies of different state variables on PMADP algorithm
由表1 可知,隨著ESS 和HST 的離散間隔減小,PMADP 算法離線訓(xùn)練時(shí)間、在線調(diào)度時(shí)間和迭代次數(shù)均呈明顯的上升趨勢(shì)。這是由于聚合后的狀態(tài)空間中包含的狀態(tài)數(shù)量與ESS 和HST 的離散間隔成反比,即離散間隔越小,狀態(tài)空間中包含的狀態(tài)數(shù)量越多。隨著組成狀態(tài)空間的狀態(tài)數(shù)量的增加,PMADP 算法在每個(gè)時(shí)段都需要遍歷更多的狀態(tài)來(lái)獲得全局最優(yōu)的調(diào)度策略。因此,離線訓(xùn)練時(shí)間、在線調(diào)度時(shí)間和迭代次數(shù)均會(huì)明顯增加。
隨著ESS 和HST 離散間隔的減小,優(yōu)化調(diào)度結(jié)果中運(yùn)行成本整體呈下降趨勢(shì)。在將ESS 和HST 分別以最小離散間隔10 MW 和5 MW 設(shè)置的E10-H5 離散策略下,PMADP 算法獲得了最優(yōu)的運(yùn)行成本11 329 113.0 美元、最長(zhǎng)離線訓(xùn)練時(shí)間1 930.8 s 和最長(zhǎng)在線調(diào)度時(shí)間4.218 s;在E25-H25離散策略下,PMADP 算法獲得了最差的運(yùn)行成本11 383 869.6 美元、最短離線訓(xùn)練時(shí)間40.945 s 和最短在線調(diào)度時(shí)間1.07 s。由于PMADP 算法的優(yōu)化復(fù)雜度與計(jì)算精度正相關(guān),在實(shí)際的工程應(yīng)用中,需要根據(jù)計(jì)算平臺(tái)的性能及工程精度需求,在兩者之間進(jìn)行權(quán)衡。
2.1.3 狀態(tài)空間壓縮策略性能分析
本文從1 000 個(gè)測(cè)試場(chǎng)景中隨機(jī)選取100 個(gè)訓(xùn)練場(chǎng)景驗(yàn)證壓縮空間策略對(duì)提升計(jì)算效率的有效性。壓縮前后的狀態(tài)空間規(guī)模及計(jì)算時(shí)間比較結(jié)果如附錄B 圖B3 所示。
由附錄B 圖B3 可知,對(duì)所選取的100 個(gè)測(cè)試場(chǎng)景,采用本文提出的狀態(tài)空間壓縮策略后,在狀態(tài)空間規(guī)模及計(jì)算時(shí)間方面均有大幅降低。平均狀態(tài)空間規(guī)模降低了73.07%,平均求解時(shí)間降低了67.91%。這是因?yàn)楸疚奶岢龅囊詢?chǔ)能裝置運(yùn)行約束為限值的狀態(tài)空間壓縮策略,可將不滿足儲(chǔ)能裝置運(yùn)行約束的狀態(tài)剔除,通過(guò)對(duì)狀態(tài)空間進(jìn)行壓縮,大大降低了求解規(guī)模,使求解效率得到有效提高。
2.1.4 并行多維近似動(dòng)態(tài)規(guī)劃收斂性驗(yàn)證
為驗(yàn)證本文所設(shè)置不確定性場(chǎng)景數(shù)量的合理性,從10 000 組不確定性場(chǎng)景中隨機(jī)抽取4 000 組對(duì)采用E20-H10 離散策略的PMADP 算法進(jìn)行訓(xùn)練,附錄B 圖B4 給出了運(yùn)行成本的分布情況。
由附錄B 圖B4 可知,運(yùn)行成本擬合曲線隨迭代次數(shù)的增加呈下降趨勢(shì)。當(dāng)?shù)螖?shù)達(dá)到3 000 次時(shí),運(yùn)行成本擬合曲線已基本達(dá)到平穩(wěn),可以認(rèn)為PMADP 算法已經(jīng)過(guò)充分訓(xùn)練,算法已經(jīng)收斂。與確定性場(chǎng)景下的2 563 次迭代次數(shù)相比,算法收斂所需要的迭代次數(shù)增加了17.05%。因此,本文選取10 000 組訓(xùn)練場(chǎng)景以保證PAMDP 算法經(jīng)過(guò)充分訓(xùn)練,保證了收斂性。
2.1.5 并行多維近似動(dòng)態(tài)規(guī)劃并行性能分析
本文采用加速比SP和計(jì)算效率PE這2 個(gè)評(píng)價(jià)指標(biāo)衡量PMADP 算法在不同策略下求解IESSDED 問(wèn)題的性能,不同狀態(tài)變量離散策略下SP和PE隨核心數(shù)的變化情況如附錄B 圖B5 所示。
由附錄B 圖B5 可知,在參與并行計(jì)算的CPU核心數(shù)相同的情況下,離散數(shù)目越多,SP越高,PE也越高。在離散數(shù)目相同的情況下,參與并行的CPU核心數(shù)越多,并行效率PE越低。這是由于CPU 內(nèi)部各個(gè)核心在進(jìn)行并行計(jì)算時(shí)需要通信和協(xié)調(diào),隨著參與并行計(jì)算的CPU 核心數(shù)的增加,核心之間的信息通信時(shí)間也會(huì)增加。然而,在處理大規(guī)模問(wèn)題時(shí),由于求解時(shí)間的增加,可忽略信息通信的時(shí)間。因此,在實(shí)際工程應(yīng)用中,需要根據(jù)求解問(wèn)題的計(jì)算規(guī)模合理選擇CPU 核心數(shù),以獲得理想的SP和PE。
2.1.6 并行多維近似動(dòng)態(tài)規(guī)劃性能對(duì)比
不同算法下的運(yùn)行成本期望值和總耗時(shí)如表2所示。
表2 E6-H6-G6 算例中3 種算法的計(jì)算結(jié)果Table 2 Calculation results of three algorithms in the case of E6-H6-G6
由表2 可知,在運(yùn)行成本的期望值方面,SO 算法最低,為1 123 714.62 美元;MPC 算法最高,為1 144 954.7 美元,較SO 算法增加1.89%;本文所提PMADP 算 法 居 中,為1 128 131.24 美 元,較SO 算法僅增加0.83%。這是由于SO 算法對(duì)每個(gè)場(chǎng)景精確求解,進(jìn)而獲得了最低的成本期望值;而MPC 算法僅利用較短時(shí)間的不確定性預(yù)測(cè)值,制定的調(diào)度策略靈活性受限,故其成本期望值最高;本文所提PMADP 算法充分利用全局不確定性信息,解決了MPC 算法的靈活性受限問(wèn)題。在總調(diào)度時(shí)間方面,本文所提出的PMADP 算法由于利用并行化求解思想充分調(diào)用求解資源,在3 種算法中耗時(shí)最短,為4 551 s,較MPC 算法加快了53.80%,較SO 算法加快了82.77%??梢?jiàn),本文所提PMADP 算法雖然在計(jì)算精度方面略低于SO 算法,但在計(jì)算效率上具有顯著優(yōu)勢(shì)。因此,在處理對(duì)計(jì)算時(shí)間有著較高要求的IES-SDED 問(wèn)題時(shí),利用本文所提PMADP 算法求解可以獲得理想的效果。
為進(jìn)一步驗(yàn)證本文所提PMADP 算法在求解計(jì)及多元不確定性的大規(guī)模復(fù)雜系統(tǒng)時(shí)的適應(yīng)性,本文分別將PMADP 算法、MPC 算法及傳統(tǒng)的串行MADP 算法應(yīng)用于E118-H12-G12 測(cè)試系統(tǒng)的IESSDED 問(wèn)題求解中,對(duì)比其計(jì)算精度及計(jì)算效率。
本文所采用的E118-H12-G12 測(cè)試系統(tǒng)考慮2臺(tái)ESS 和2 臺(tái)HST,EPS、DHS 及NGS 的 其 他 數(shù) 據(jù)設(shè)置參考文獻(xiàn)[34]。本算例設(shè)定的離線訓(xùn)練場(chǎng)景和在線測(cè)試場(chǎng)景同E6-H6-G6 算例。
2.2.1 運(yùn)行成本及計(jì)算時(shí)間對(duì)比
3 種算法求解計(jì)及多元不確定性的IES-SDED問(wèn)題的運(yùn)行成本期望值及單個(gè)測(cè)試場(chǎng)景計(jì)算時(shí)間如表3 所示。
表3 E118-H12-G12 算例中3 種算法的計(jì)算結(jié)果Table 3 Calculation results of three algorithms in the case of E118-H12-G12
由表3 可知,運(yùn)行成本的期望值方面,本文所提PMADP 算法為4 150 742.27 美元,相較于MPC 算法降低了8.27%,體現(xiàn)出明顯的計(jì)算精度優(yōu)勢(shì);計(jì)算時(shí)間方面,本文所提PMADP 算法為152.251 s,較MPC 算法和MADP 算法分別減少了79.93% 和53.09%。傳統(tǒng)的串行MADP 算法雖然獲得了與PMADP 算法相同的運(yùn)行成本期望值,但過(guò)低的計(jì)算效率使其難以應(yīng)用于大規(guī)模復(fù)雜系統(tǒng)的求解。因此,從整體最優(yōu)角度,本文所提PMADP 算法在對(duì)大規(guī)模復(fù)雜系統(tǒng)求解時(shí)仍能在計(jì)算精度和計(jì)算效率上均保持顯著的優(yōu)越性。
2.2.2 狀態(tài)變量離散策略對(duì)并行多維近似動(dòng)態(tài)規(guī)劃算法影響分析
在大規(guī)模復(fù)雜系統(tǒng)IES-SDED 問(wèn)題的求解中,大量?jī)?chǔ)能裝置計(jì)入狀態(tài)空間對(duì)狀態(tài)變量離散策略的合理制定提出了更高的要求,附錄B 圖B6 為不同狀態(tài)變量離散策略下本文所提PMADP 算法和傳統(tǒng)MADP 算法在計(jì)算時(shí)間方面的比較結(jié)果,以及PMADP 算法對(duì)計(jì)算效率的提升趨勢(shì)。
由附錄B 圖B6 可知,隨著ESS 和HST 的離散間隔減小即狀態(tài)空間增大,MADP 算法和PMADP算法的計(jì)算時(shí)間均有明顯增加。由圖B6(d)可知,2 種算法的計(jì)算時(shí)間增加率有著明顯的不同。隨著狀態(tài)空間的增大,本文所提出的PMADP 算法的計(jì)算時(shí)間增加平緩,而傳統(tǒng)MADP 算法的計(jì)算時(shí)間呈指數(shù)級(jí)上升。這是由于隨著狀態(tài)空間的增大,每個(gè)時(shí)段都需要遍歷更多的狀態(tài)來(lái)獲得全局最優(yōu)的調(diào)度策略,求解復(fù)雜度急劇升高。本文所提PMADP 算法較傳統(tǒng)串行MADP 算法可以更充分地利用多核CPU 的計(jì)算資源,將規(guī)模龐大的復(fù)雜問(wèn)題拆分為多個(gè)簡(jiǎn)單問(wèn)題并行求解,大大減少了計(jì)算時(shí)間。隨著計(jì)算復(fù)雜程度及問(wèn)題規(guī)模的增大,CPU 核心內(nèi)部信息交換時(shí)間可以被忽略,本文所提PMADP 算法能充分挖掘CPU 的多核并行計(jì)算資源,效率提升更加明顯,從而發(fā)揮出其在大規(guī)模問(wèn)題求解上的優(yōu)越性。
本文提出了一種可以快速求解IES-SDED 問(wèn)題的PMADP 算法,通過(guò)算例分析,得出以下結(jié)論:
1)提出的低維替代高維的狀態(tài)變量聚合機(jī)制,與傳統(tǒng)ADP 算法相比,有效降低了狀態(tài)空間的維數(shù),克服了“維數(shù)災(zāi)”的問(wèn)題,提高了求解效率。
2)提出的基于儲(chǔ)能運(yùn)行限值的狀態(tài)空間壓縮策略,通過(guò)剔除不可行狀態(tài),避免了對(duì)整個(gè)狀態(tài)空間的窮舉計(jì)算,狀態(tài)空間規(guī)??山档?0%以上,求解時(shí)間可減少60%以上,進(jìn)一步提高了求解效率。
3)在確定性和不確定性場(chǎng)景下,相比于其他算法,本文所提出的PMADP 算法能更好地兼顧計(jì)算精度和計(jì)算效率,對(duì)大規(guī)模復(fù)雜系統(tǒng)也具有較好的適用性。
未來(lái)工作將深入研究PMADP 算法效率提升方法和求解計(jì)及大規(guī)模儲(chǔ)能裝置IES-SDED 問(wèn)題的適用性,進(jìn)一步提高PMADP 算法在實(shí)際工程中的應(yīng)用范圍。
附錄見(jiàn)本刊網(wǎng)絡(luò)版(http://www.aeps-info.com/aeps/ch/index.aspx),掃英文摘要后二維碼可以閱讀網(wǎng)絡(luò)全文。