李東東, 周冠廷,李寬宏,林順富,3,段維伊,沈運帷
(1.上海電力大學院電氣工程學院,上海市200090;2.國網(wǎng)福建省電力有限公司福州供電公司,福州市 350009;3.上海市教委高效電能應用工程研究中心,上海市 200090)
能源是人類生存和發(fā)展必不可少的資源,隨著經(jīng)濟的發(fā)展和人類生活水平的不斷提高,人們對能源的需求越來越大[1]。目前,世界各國都在大力研究如何使多種能源協(xié)調(diào)運行,打破原有的各能源系統(tǒng)之間單獨規(guī)劃、單獨運行的模式,構(gòu)建綜合能源服務系統(tǒng)[2]。綜合能源服務將能源銷售服務、分布式能源服務、節(jié)能減排及需求響應服務等組合在一起,在我國擁有巨大的市場潛力。
分析美國[3]、德國[4]、日本[5]等發(fā)達國家的成功案例可知,綜合能源服務的發(fā)展不僅僅是發(fā)電方式的改變和新型能源技術(shù)的推廣,還要通過市場化運作,對消費方式和供給結(jié)構(gòu)進行改革,才能獲得規(guī)?;陌l(fā)展。目前,對于區(qū)域綜合能源服務商(regional integrated energy service provider,RIESP)的研究主要側(cè)重于對綜合能源服務的市場模式分析[6-7]、交易及博弈方法[8-9]、可靠性和穩(wěn)定性評估[10-11]、經(jīng)濟性優(yōu)化調(diào)度[12-13]等。隨著電力體制改革的推進,經(jīng)濟性成為研究綜合能源系統(tǒng)過程中必不可忽略的因素,通過價格調(diào)控手段可以有效優(yōu)化多方利益,調(diào)整用戶用能行為。文獻[14]基于高比例風電滲透的情況,建立博弈論模型,討論了電力市場環(huán)境下參與者的最優(yōu)決策行為。文獻[15]考慮不同供能設備之間互補特性,同時參與能量市場和旋轉(zhuǎn)備用市場,建立了日前優(yōu)化調(diào)度模型,制定運行計劃和安排備用資源。文獻[16]在考慮區(qū)域電力現(xiàn)貨市場交易機制的基礎上,建立了跨區(qū)域現(xiàn)貨市場下多主體購售能主從博弈模型。上述文獻主要考慮供能側(cè)和售能側(cè)行為,均未站在用戶角度進行考慮。
電價可以影響用戶負荷需求,同時用戶的負荷需求也會反作用于電價,售電側(cè)需要根據(jù)用戶的需求進行定價,用戶根據(jù)價格進行需求響應,目前兩者之間的交互行為主要通過主從博弈的方法進行研究。文獻[17]提出了含電動汽車(electric vehicle, EV)和電轉(zhuǎn)氣(power to gas,P2G)設備的園區(qū)能源互聯(lián)網(wǎng)能源定價與管理策略,建立了園區(qū)運營商和用戶代理商利益最大化的主從博弈模型。文獻[18]提出了社區(qū)能源互聯(lián)網(wǎng)分布式能量管理的方法和流程,建立了基于主從博弈的運行商與產(chǎn)銷者的博弈模型。文獻[19]將經(jīng)濟運行和輔助服務綜合考慮,建立了含有熱電耦合模型的工業(yè)園區(qū)綜合能源系統(tǒng)優(yōu)化模型。文獻[20]建立了多主多從的綜合能源系統(tǒng)博弈模型,研究多參與者參與的交互策略。上述研究集中于售能側(cè)與用戶側(cè)的博弈行為,但均缺乏對供能側(cè)及綜合能源服務商自身設備發(fā)電成本的考慮,并且忽略了綜合能源服務商由于分布式能源的不確定性和供需不平衡而參與實時市場的影響,此時所制定的RIESP自身設備出力及能源價格并非最優(yōu)。
針對上述背景,本文基于主從博弈模型,提出考慮RIESP自身設備發(fā)電成本及用戶購能效用的區(qū)域綜合能源服務商運行策略。RIESP作為領導者,優(yōu)化目標為RIESP運行利潤最大;用戶作為跟隨者,優(yōu)化目標為用戶消費剩余最大。同時對RIESP定價策略、自身設備出力和用戶負荷進行優(yōu)化。然后,證明本文所建模型解的均衡性和唯一性,并采用基于差分進化和粒子群(differential evolution- particle swarm optimization,DE-PSO)的混合算法進行求解。最后,通過算例驗證本文所提RIESP運行策略的有效性。
本文中的區(qū)域綜合能源服務商是在區(qū)域綜合能源系統(tǒng)的基礎上構(gòu)建的。區(qū)域綜合能源系統(tǒng)主要由能源供應商、RIESP、用戶三部分組成,如圖1所示。能源供應商由電網(wǎng)和天然氣網(wǎng)構(gòu)成,RIESP可根據(jù)能源需求量,通過日前市場和實時市場從能源供應商處購能。RIESP是區(qū)域綜合能源系統(tǒng)的橋梁部分,通過連接能源供應商和用戶,實現(xiàn)能源的協(xié)調(diào)運行。用戶側(cè)包括常規(guī)電負荷、主動電負荷、熱負荷和天然氣負荷。RIESP上層通過調(diào)度中心與電網(wǎng)和天然氣網(wǎng)相連,調(diào)度中心接收RIESP的購能量和電網(wǎng)、天然氣網(wǎng)的售能量,傳遞RIESP的能源需求量和向供應商購能的價格;下層直接與用戶交互,接收用戶日前預測的用能量和需求響應量,傳遞RIESP對用戶的售能價格。RIESP通過向能源供應商購能并合理調(diào)控風、光等可再生能源、儲能裝置和能源轉(zhuǎn)換設備,賺取差價利潤,實現(xiàn)削峰填谷,如圖2所示。相比于目前電網(wǎng)公司處于壟斷地位的售電模式,基于RIESP的售能模式更加靈活可靠,有利于電力市場中各售能主體的競爭與合作。
RIESP作為區(qū)域綜合能源系統(tǒng)的能量樞紐管理者,可以有效地引導分布式設備的利用,提高能源的利用率。但同時也要承擔由于供需不平衡、分布式能源的不確定性等因素帶來的風險。當RIESP所能提供的最大電能無法滿足用戶的正常負荷時,則需要高價從能源供應商處購能。因此RIESP運行策略包含定價策略和設備運行策略,基于此提出兩步式?jīng)Q策機制。
第1步:RIESP對電價、RIESP自身設備出力、用戶負荷等歷史信息進行分析,按照用戶上報的購能計劃,制定售能策略并調(diào)整各設備運行狀態(tài)。
圖1 區(qū)域綜合能源系統(tǒng)能量流Fig.1 Energy flow of the regional integrated energy system
圖2 區(qū)域綜合能源服務商運營架構(gòu)Fig.2 Operational structure of RIESP
第2步:用戶根據(jù)RIESP提出的售能策略,改變負荷需求,調(diào)整用能策略。用戶的用能策略又會反作用于RIESP的售能策略,以此循環(huán),確定出最有利于供、需雙方的價格點。
RIESP和用戶是2個相互獨立的利益?zhèn)€體。RIESP通過調(diào)整向能源供應商的購能策略,避免向能源供應商購入的能量出現(xiàn)大量不足或大量過剩;同時,控制各設備的運行狀態(tài),調(diào)整區(qū)域綜合能源系統(tǒng)自身產(chǎn)生的能量和各能量間的轉(zhuǎn)化以及儲能裝置的運行狀態(tài),實現(xiàn)利益最大化。用戶通過調(diào)整EV充電策略和可中斷負荷,安排用能策略,最大化自己的消費剩余。因此,RIESP在制定售能策略和設備運行狀態(tài)時,不僅需要考慮自身的利益,還需要充分考慮用戶對其的反饋行為。由此可見,RIESP和用戶之間存在博弈行為。RIESP作為能源價格的制定者,擁有優(yōu)先決定權(quán),因此,進一步認為RIESP和用戶之間的博弈行為是一種主從博弈。上層模型中,RIESP屬于領導者;下層模型中,用戶屬于跟隨者。
上層模型以RIESP運行利潤最大為目標函數(shù),主要包括售電利潤、售氣利潤和儲能裝置損耗成本。具體可描述為:
(1)
售電利潤由日前售電利潤、實時售電利潤、RIESP自身發(fā)電燃料成本構(gòu)成,如式(2)所示:
(2)
t時刻RIESP日前購買的電量取決于用戶上報的用電量和自身發(fā)電設備出力。t時刻RIESP實時購買的電量受用戶實際用電量、RIESP日前購電量和自身發(fā)電設備實際出力的影響。
(3)
(4)
(5)
t時刻RIESP發(fā)電消耗的燃料成本主要考慮RIESP內(nèi)的CHP設備發(fā)電成本,其成本與設備出力成二次函數(shù)關(guān)系[21]:
(6)
式中:a、b、c為CHP設備的成本系數(shù)。
售氣利潤包括售氣收入、購氣成本和RIESP中P2G設備運行成本,如式(7)所示:
(7)
(8)
儲能裝置不斷充放電,會對其壽命產(chǎn)生一定的不良影響,降低儲能裝置的性能。在計算RIESP的利潤時,需要將儲能裝置的成本考慮在內(nèi)。儲能裝置損耗成本如式(9)所示:
(9)
式中:κ1、κ2、κ3為儲能裝置損耗系數(shù)。
RIESP模型主要考慮如下約束條件:
1)功率平衡約束。
RIESP在運行過程中,需時刻滿足區(qū)域綜合能源系統(tǒng)的電功率平衡和天然氣功率平衡,如式(10)和(11)所示:
(10)
(11)
2)電價約束。
當RIESP所能提供的最大電能無法滿足用戶的正常負荷時,需要高價從能源供應商處購能。為保證RIESP為盈利狀態(tài),電價約束如下:
(12)
(13)
在區(qū)域綜合能源系統(tǒng)中,不同能源之間可以相互轉(zhuǎn)化,因此RIESP在制定定價策略時,需有一個參考值[17],本文采用電價為參考價格,天然氣價可描述為如式(14)所示:
(14)
3)能源轉(zhuǎn)換設備約束。
本文中,假設在額定運行工況附近工作的設備,其效率不隨工況的變化而變化,即視其為定值。據(jù)此,多能流耦合約束可以描述為:
Pg,p2g=ηp2gPe,p2g
(15)
式中:ηp2g為P2G設備的電轉(zhuǎn)氣效率。
P2G設備的功率主要由其額定功率約束:
(16)
4)儲能裝置約束。
t時刻的儲能裝置功率主要由t-1時刻儲能裝置的充放電情況決定:
(17)
(18)
(19)
下層用戶在上層給定的RIESP售能策略的基礎上,調(diào)整自身用能策略,優(yōu)化目標為用戶消費剩余最大,即用戶的效用值與支出成本之差最大[22]。
maxψ=ψuti-ψe-ψg
(20)
式中:ψuti為用戶效用值函數(shù),表示用戶購能的滿意程度,如式(21)所示[22];ψe、ψg分別為用戶用電支出成本和用氣支出成本,如式(25)(26)所示。
(21)
式中:νDhe、μDhe、νRe、μRe、νg、μg分別為用戶對購買日前電能、實時電能和天然氣的偏好程度,可以反映用戶對不同能源的需求程度。
用戶電負荷包括固定電負荷、可平移電負荷和可削減電負荷,氣負荷包括固定氣負荷和可削減氣負荷,具體表示為:
(22)
(23)
(24)
(25)
(26)
(27)
式中:γ1、γ2表示可中斷的電負荷的價格系數(shù);γ3、γ4表示可中斷的氣負荷的價格系數(shù)。
下層用戶模型主要考慮負荷中斷和轉(zhuǎn)移約束,用戶中斷的負荷和轉(zhuǎn)移的負荷均需在其可控范圍內(nèi),即:
(28)
(29)
(30)
(31)
對于一個有N個參與者的博弈行為,如果主從博弈的領導者的收益函數(shù)為F1,其策略集為Xi;跟隨者的收益函數(shù)為F2,其策略集為Yi。當Xi、Yi均為非空緊凸集且無論領導者還是跟隨者任意一方策略集確定后,另一方均存在唯一的解。則證明該主從博弈模型存在唯一的主從博弈均衡解[23]。
證明過程如下:
1)本文中,上層領導者RIESP的策略約束為式(10)—(19),下層跟隨者用戶的策略約束為式(28)—(30),所有的策略集都是非空緊凸集。
2)證明當上層領導者RIESP的策略集給定后,下層跟隨者用戶存在唯一解。
(32)
(33)
(34)
令一階偏導數(shù)為0,可得:
(35)
(36)
(37)
目標函數(shù)式(20)的二階偏導數(shù)如下:
(38)
(39)
(40)
由此可知,其二階偏導數(shù)均小于0,在約束條件內(nèi),當上層領導者RIESP售能策略和設備運行狀態(tài)給定后,下層跟隨者用戶存在唯一的最優(yōu)解。
3)證明當下層跟隨者用戶的策略集給定后,上層領導者RIESP存在唯一解。
(41)
由于該Hessian矩陣是負定的,根據(jù)多元函數(shù)極值判定原則可知,存在極大值點。綜上所述,本文所建立的主從博弈模型存在唯一的均衡解。
為克服粒子群算法(particle swarm optimization,PSO)收斂精度不高、容易陷入局部最優(yōu)和差分進化算法(differential evolution,DE)在進化后期收斂速度較慢,且易陷入局部最優(yōu)的缺點,本文將PSO算法與DE算法結(jié)合,提出DE-PSO混合優(yōu)化算法[24],通過引入新的信息交流機制,允許信息在2個不同的種群中進行傳遞,從而有效防止由于錯誤的信息判斷而導致陷入局部最優(yōu)解。DE-PSO算法求解步驟為:
1)設置種群規(guī)模及算法基本參數(shù)。
2)根據(jù)群體維度將所有粒子等分為PSO種群和DE種群。分別對2個種群進行初始化;設置隨機變量,即RIESP的購/售能價格及設備運行狀態(tài)。
3)根據(jù)RIESP的售能策略和設備運行狀態(tài),用戶調(diào)整用能策略,計算用戶消費剩余。
4)根據(jù)用戶的用能策略,計算RIESP運行利潤。
5)DE種群根據(jù)差分進化算法的雜交、變異和選擇規(guī)則進行迭代進化;PSO種群按照種群速度和位置更新規(guī)則進行迭代更新。
6)根據(jù)適應度函數(shù),分別選出PSO種群中的最佳個體和DE種群中的最佳個體,比較兩個體的優(yōu)劣,進行種群融合。
7)判斷是否有停滯現(xiàn)象,若停滯則按照式(42)進行變異。
x=rand(0,1)×(xmax-xmin)
(42)
式中:x為當前個體的設置信息;rand(0,1)為0~1之間的隨機數(shù);xmin、xmax為允許搜尋的最小值和最大值。
8)判斷是否達到均衡條件,若滿足條件則輸出最優(yōu)解;否則轉(zhuǎn)至步驟3)。
算法流程如圖3所示。
本文以1 h為一個時間段,將一天分為24個時間段。RIESP向能源供應商的購能價格可假定為固定值,天然氣價格折算為電價,RIESP向能源供應商購能的電價和天然氣價格曲線如圖4所示。將風機出力、光伏發(fā)電出力及負荷的原始數(shù)據(jù)進行預處理后,采用Holt-winter方法進行預測,所得到的預測曲線如圖5所示。假設最大可中斷的電負荷和氣負荷占總負荷的15%,EV能夠接受充電調(diào)整的最小電量為總電量的50%。用戶對不同能源的偏好系數(shù)νDhe、μDhe、νRe、μRe、νg、μg的取值分別為0.000 5、1.8、0.000 8、1.5、0.001 0、1.2。P2G運行成本中,α1、α2、CM的取值分別為0.001、0.02、4.5??芍袛嗟呢摵蓛r格系數(shù)γ1、γ2、γ3、γ4分別取0.5、0.015、0.8、0.025。
圖3 DE-PSO算法流程Fig.3 Algorithm flow of DE-PSO
圖4 RIESP購能的電價與天然氣價Fig.4 Purchase price of electricity and natural gas for RIESP
如圖6所示,當?shù)?80次左右時,結(jié)果趨于收斂,此時RIESP凈利潤為14 518元,用戶消費剩余為11 168元。當結(jié)果收斂時,RIESP的利潤和用戶的消費剩余也趨于穩(wěn)定,這說明當主從博弈達到均衡時,無論是領導者還是跟隨者,都不會單方面調(diào)整策略而獨立增加收益。證明了本文所采用DE-PSO混合算法具有良好的收斂性。
圖5 Holt-winter預測數(shù)據(jù)圖Fig.5 Holt-winter prediction data graph
圖6 迭代收斂曲線圖Fig.6 Iterative convergence curve
上層領導者RIESP的售能策略和設備出力如圖7所示。
圖7 RIESP售電策略和設備運行狀態(tài)Fig.7 RIESP power-sales strategy and equipment operation status
在售能策略方面,實時電價、日前電價以及其差值按大小幅度可以分為3類,這也對應了用戶用電負荷的峰、平、谷3個時間段。在用電高峰期,實時電價和日前電價相對較高,其差值也相對較大,用戶購電成本增加,會促使用戶減少用能負荷,降低成本,CHP出力增加,儲能設備開始放電。在低谷期,實時電價和日前電價相對較低,其差值也相對較低,在這一時間段,用戶購電成本降低,RIESP的購能成本也較低,用戶會增加用電負荷,CHP設備出力降低,P2G設備進行工作,儲能設備開始充電。
下層跟隨者用戶根據(jù)上層領導者RIESP的售能策略及設備運行狀態(tài)所制定的用戶用能策略及優(yōu)化前后的負荷曲線如圖8所示。在電價的激勵作用下,用戶為了降低用能支出,在高峰期10:00—14:00,18:00—21:00,由于電價較高,用戶減少EV充電電量并中斷部分電負荷,用電負荷峰值下降;在低谷期00:00—06:00,由于電價較低,用戶增加EV充電電量,用戶負荷谷值上升。優(yōu)化前后,用戶的電負荷曲線呈現(xiàn)了明顯的“削峰填谷”的特點,RIESP的凈利潤由12 016元增加到14 518元,用戶的消費剩余由8 501元增加到11 168元,其中用戶效用函數(shù)值由34 362元增加到35 097元,用能成本從25 861元降低到23 929元。說明了本文提出的運行策略可以有效提高RIESP的凈利潤,并減少用戶的用能成本。
圖8 用戶用電策略和負荷調(diào)整曲線Fig.8 User power-consumption strategy and load adjustment curve
當去除RIESP中的儲能設備和P2G設備后,上層領導者RIESP的售能策略和設備運行狀態(tài)如圖9所示。可以看出,在定價策略方面,峰、谷、平3個時期的電價相對圖7均有所上升,即售電電價升高。設備運行狀態(tài)方面,在谷期,CHP設備出力減少;在峰期,CHP設備出力增加,這是由于沒有了儲能設備和P2G設備的調(diào)節(jié)作用,RIESP僅能通過購電和增加CHP設備出力滿足用戶負荷。
圖9 RIESP售電策略和設備運行狀態(tài)(無P2G和儲能)Fig.9 RIESP power-sales strategy and equipment operation status (without P2G and storage)
去除儲能設備和P2G設備后,下層跟隨者用戶根據(jù)上層領導者RIESP的售能策略及設備運行狀態(tài)所制定的用戶用能策略及優(yōu)化前后負荷曲線如圖10所示??梢钥闯?,由于RIESP中去除了P2G設備和儲能裝置,導致用戶購能價格增加,價格對用戶的激勵作用減弱,負荷整體的“削峰填谷”效果降低。優(yōu)化前后,RIESP的凈利潤由12 016元增加到13 855元,用戶的消費剩余由8 501元增加到10 048元,其中用戶效用函數(shù)值由34 362元增加到34 727元,用能成本從25 861元降低到24 679元。說明本文提出的含P2G設備和儲能裝置的RIESP,對提高RIESP凈利潤、減少用戶的用能成本有積極作用。
圖10 用戶用電策略和負荷調(diào)整曲線(無P2G和儲能)Fig.10 User power-consumption strategy and load adjustment curve (without P2G and storage)
本文針對含P2G和儲能裝置的區(qū)域綜合能源服務商,建立了考慮服務商自身發(fā)電成本和用戶消費剩余的區(qū)域綜合能源服務商運行策略。首先,建立了含P2G設備和儲能裝置的區(qū)域綜合能源系統(tǒng)的結(jié)構(gòu)模型,制定了區(qū)域綜合能源服務商的兩步式?jīng)Q策機制。然后,建立了區(qū)域綜合能源服務商與用戶的主從博弈模型,上層領導者區(qū)域綜合能源服務商以運行利潤最大為目標函數(shù),下層跟隨者用戶以用戶消費剩余最大為目標函數(shù)。通過理論分析推導,證明了該主從博弈模型均衡解的存在性和唯一性,并采用DE-PSO混合算法進行求解。算例仿真證明,本文所提的基于主從博弈的區(qū)域綜合能源服務商的運行策略模型能夠合理制定該區(qū)域綜合能源服務商的價格和設備運行狀態(tài);通過價格的激勵作用,減小負荷波動程度,提高區(qū)域綜合能源服務商的運行利潤,降低用戶支出成本。
本文忽略了熱能在區(qū)域綜合能源系統(tǒng)中的產(chǎn)供消問題,同時未考慮不同區(qū)域綜合能源服務商之間的聯(lián)系。下一步需要在這些問題上展開更進一步的研究。