曾 君,符致敏,黃向敏,袁功獻(xiàn),劉俊峰
(1.華南理工大學(xué)電力學(xué)院,廣東廣州 510640;2.華南理工大學(xué)自動(dòng)化科學(xué)與工程學(xué)院,廣東廣州 510640)
隨著可再生能源發(fā)電在電力系統(tǒng)的高比例滲透和電力用戶主動(dòng)用電需求的提升,未來(lái)分布式儲(chǔ)能將廣泛配置于發(fā)電側(cè)、配網(wǎng)側(cè)和用戶側(cè),其在響應(yīng)原有需求基礎(chǔ)上還具有一定的閑置容量和閑置時(shí)間[1].若能有效匯聚該部分閑置資源形成規(guī)?;瘍?chǔ)能集群,可為電網(wǎng)提供調(diào)峰、調(diào)頻和可再生能源消納等輔助服務(wù),助力以新能源為主體的新型電力系統(tǒng)的構(gòu)建和雙碳目標(biāo)的實(shí)現(xiàn)[2].
近年來(lái),電動(dòng)汽車(chē)(electric vehicle,EV)保有量不斷提升.EV作為一種典型的用戶側(cè)分布式儲(chǔ)能資源,相比于其他固定式儲(chǔ)能,具有“可移動(dòng)、小容量、高自主、強(qiáng)自利、低可控”的特點(diǎn)[3],其匯聚復(fù)用難度更加大.EV在滿足電量預(yù)期、降低充放電成本、減少電池?fù)p耗的需求驅(qū)動(dòng)且無(wú)外界激勵(lì)引導(dǎo)下,通常進(jìn)行無(wú)序并網(wǎng)充電,而大規(guī)模無(wú)序充電行為將會(huì)帶來(lái)系統(tǒng)隨機(jī)性增強(qiáng)、電壓頻率波動(dòng)和設(shè)備利用率降低等問(wèn)題[4].但是,有研究顯示EV在滿足基本出行需求的前提下還具備可觀的閑置容量和閑置時(shí)間[5],若能將這部分閑置資源有效匯聚形成一個(gè)大規(guī)模的靈活性儲(chǔ)能集群,不僅可以最大限度降低EV無(wú)序充電帶來(lái)的不利影響,還能為電網(wǎng)提供多類(lèi)型的輔助服務(wù).而且隨著相關(guān)技術(shù)進(jìn)步和市場(chǎng)條件成熟,分布式EV儲(chǔ)能匯聚具備良好的現(xiàn)實(shí)基礎(chǔ): 1)電力市場(chǎng)的開(kāi)放為其提供了有效手段;2)物聯(lián)網(wǎng)、邊緣計(jì)算和5G等技術(shù)的發(fā)展為其提供了硬件基礎(chǔ);3)EV消費(fèi)者“主動(dòng)”特性的覺(jué)醒[6]使得更多的用戶愿意參與到電網(wǎng)互動(dòng)以節(jié)約用能成本.在此背景下,本文以EV作為匯聚對(duì)象研究分布式儲(chǔ)能匯聚復(fù)用,可為其他類(lèi)型的分布式儲(chǔ)能匯聚提供強(qiáng)有力的理論支撐.
目前,針對(duì)分布式EV儲(chǔ)能參與匯聚復(fù)用的研究還未多見(jiàn).大部分研究集中在V2G(vehicle to grid)上面:文獻(xiàn)[7]從EV出行數(shù)據(jù)信息中挖掘EV的V2G輔助服務(wù)能力和特征;文獻(xiàn)[8]基于對(duì)大規(guī)模EV的集群劃分,實(shí)現(xiàn)了集群EV的充放電功率策略制定,并基于一致性緩沖算法完成單一EV的功率分配.但是上述研究忽略了EV的控制權(quán)在用戶而非運(yùn)營(yíng)商或電網(wǎng),無(wú)法對(duì)EV采取直接負(fù)荷控制的方法.通常,分布式EV儲(chǔ)能匯聚可以看成是運(yùn)營(yíng)商或電網(wǎng)與EV之間的多智能體[9]博弈過(guò)程,可采用博弈論來(lái)對(duì)該過(guò)程進(jìn)行建模:文獻(xiàn)[10]基于勢(shì)博弈,提出一種完全分布式多目標(biāo)運(yùn)行優(yōu)化算法以支撐微電網(wǎng)場(chǎng)景下個(gè)體自利、自治和即插即用的發(fā)展要求,實(shí)現(xiàn)了分布式個(gè)體利益與全局利益得以統(tǒng)一;文獻(xiàn)[11]基于動(dòng)態(tài)非合作博弈理論,提出一種基于電價(jià)和碳配額雙重激勵(lì)協(xié)同博弈的含EV微電網(wǎng)的優(yōu)化調(diào)度策略,實(shí)現(xiàn)了削峰填谷效果和整體效益的提升.可見(jiàn),引入博弈論分析多智能體的信息能量互動(dòng)、利益博弈過(guò)程是可行的,博弈論方法契合于分布式儲(chǔ)能匯聚過(guò)程的建模.但是,現(xiàn)有博弈論建模方法一致認(rèn)為參與者是完全理性的[12–13],但現(xiàn)實(shí)中每一個(gè)獨(dú)立的電能消費(fèi)者都是有限理性的個(gè)體,他們參與利益博弈過(guò)程受到歷史經(jīng)驗(yàn)和風(fēng)險(xiǎn)偏好的影響[14].
為此,本文研究考慮EV有限理性特征下的分布式儲(chǔ)能匯聚方案,完成了以下工作:1)基于斯塔克伯格博弈(Stackelberg game)架構(gòu)對(duì)微電網(wǎng)運(yùn)營(yíng)商(microgrid operator,MGO)–主動(dòng)EV互動(dòng)過(guò)程建模,充分遵從個(gè)體自利性和自主性.采用靈活充放電范圍(flexible charging and discharging area,FCDA)理論建立統(tǒng)一化的電動(dòng)汽車(chē)約束模型;2)引入前景理論(prospect theory,PT)捕捉主動(dòng)EV面對(duì)不確定電價(jià)的有限理性行為,基于以下3點(diǎn)個(gè)體有限理性特征建立EV個(gè)體的行為響應(yīng)模型: ①EV首先是交通工具,其次才是分布式儲(chǔ)能的身份;②EV充電偏好存在差異;③EV用戶并非完全理性等;3)基于Gurobi求解器采用一種分布式交互算法對(duì)模型求解,驗(yàn)證了模型在實(shí)現(xiàn)分布式EV儲(chǔ)能匯聚,促進(jìn)可再生能源就地消納方面的可行性和有效性.
對(duì)含本地可再生能源發(fā)電和大規(guī)模EV的商/居型并網(wǎng)微網(wǎng)系統(tǒng)展開(kāi)研究,如圖1 所示.該系統(tǒng)包括MGO、光伏發(fā)電(photovoltaics,PV)、風(fēng)力發(fā)電(wind turbines,WT)、基本負(fù)荷(load,LD)、主動(dòng)EV和無(wú)序EV,其中,主動(dòng)EV指商/居型并網(wǎng)微網(wǎng)系統(tǒng)中位于商業(yè)園區(qū)停車(chē)場(chǎng)或住宅小區(qū)地下車(chē)庫(kù)參與并網(wǎng)充放電的EV,該類(lèi)型EV行為規(guī)律性強(qiáng)、停駛時(shí)間長(zhǎng),是具有較好靈活性的分布式儲(chǔ)能資源,本文主要面向此類(lèi)EV展開(kāi)研究.微網(wǎng)通過(guò)公共連接點(diǎn)(point of common coupling,PCC)與上層配電網(wǎng)互聯(lián)進(jìn)行電能交換.
圖1 含主動(dòng)EV的微網(wǎng)系統(tǒng)架構(gòu)Fig.1 Microgrid system architecture with active EV
該架構(gòu)服務(wù)于微電網(wǎng)系統(tǒng)內(nèi)MGO對(duì)分布式主動(dòng)EV儲(chǔ)能的日前匯聚過(guò)程(考慮到系統(tǒng)資源的隨機(jī)性,匯聚優(yōu)化多為日前優(yōu)化–日內(nèi)滾動(dòng)–實(shí)時(shí)校正的多時(shí)間尺度優(yōu)化,以逐級(jí)減少預(yù)測(cè)誤差帶來(lái)的影響.本文主要研究日前階段的匯聚優(yōu)化方法).MGO與主動(dòng)EV的互動(dòng)流程如下: 1)EV上傳次日的參與匯聚意愿和基本出行信息至MGO,即EV申報(bào)過(guò)程;2)MGO對(duì)愿意參與匯聚的EV進(jìn)行匯聚潛力評(píng)估,并將通過(guò)評(píng)估的EV列為主動(dòng)EV,未通過(guò)評(píng)估的EV列為無(wú)序EV;3)對(duì)主動(dòng)EV 進(jìn)行集群劃分;4)MGO 預(yù)測(cè)次日的PV、WT和LD出力,并獲取次日的配網(wǎng)購(gòu)/售電價(jià)信息;5)MGO與主動(dòng)EV通過(guò)信息互動(dòng)進(jìn)行博弈:MGO下發(fā)不確定電價(jià)至主動(dòng)EV,主動(dòng)EV基于感知到的電價(jià)分布優(yōu)化充放電功率,并將優(yōu)化結(jié)果上傳給MGO,MGO基于接收到的主動(dòng)EV 的累積優(yōu)化結(jié)果,優(yōu)化不確定電價(jià)概率分布,并再次將電價(jià)信息下發(fā)給主動(dòng)EV.二者決策相互影響并逐漸改善,可通過(guò)循環(huán)迭代實(shí)現(xiàn)均衡.
此外,為避免求解大規(guī)模主動(dòng)EV充放電行為帶來(lái)的維數(shù)災(zāi)問(wèn)題,需要對(duì)主動(dòng)EV進(jìn)行集群劃分: 基于主動(dòng)EV的入網(wǎng)時(shí)間Tin和預(yù)計(jì)離網(wǎng)時(shí)間Tout.exp,對(duì)具有相鄰Tin和相鄰Tout.exp的主動(dòng)EV個(gè)體劃入同一集群,用劃分尺度?l來(lái)描述相鄰程度
即k±?l時(shí)刻入/離網(wǎng)的主動(dòng)EV均認(rèn)為是第k時(shí)刻入/離網(wǎng)的,理論上?l越小精度越高,越能體現(xiàn)真實(shí)的情況,但起不到降低優(yōu)化維數(shù)的目的.本文取?l=0.5 h,最終可以采用能量緩沖一致性算法[8]把集群優(yōu)化功率分配至每一輛主動(dòng)EV.
在上述匯聚過(guò)程中,最關(guān)鍵的問(wèn)題是選擇何種匯聚模型對(duì)MGO–主動(dòng)EV互動(dòng)過(guò)程進(jìn)行建模,以及如何描述主動(dòng)EV(有限理性個(gè)體)面對(duì)不確定電價(jià)的反應(yīng)行為.
1)Stackelberg game.
博弈論是分析具有競(jìng)爭(zhēng)或者對(duì)抗性質(zhì)的決策主體行為發(fā)生相互作用時(shí)是否存在最為合理的行為決策及如何找出最優(yōu)的行為決策的數(shù)學(xué)理論[15].其中,Stackelberg game是一種雙層的主從復(fù)合非合作博弈方法,是博弈雙方?jīng)Q策存在先后順序而又相互影響改善的博弈形式[16].本文搭建面向主動(dòng)EV的分布式儲(chǔ)能主動(dòng)匯聚方案,MGO處于決策的領(lǐng)導(dǎo)者地位,主動(dòng)EV處于跟隨者地位,二者決策存在先后順序且相互影響.因此,一主多從的Stackelberg game博弈形式完全契合于MGO匯聚分布式主動(dòng)EV的互動(dòng)過(guò)程,解決了匯聚模型選擇難的問(wèn)題.
2)期待效用理論和前景理論.
傳統(tǒng)博弈論方法研究多智能體博弈過(guò)程,多將參與者簡(jiǎn)化為具有完全理性的個(gè)體,即參與者根據(jù)期待效用理論(expected utility theory,EUT)來(lái)指導(dǎo)決策行為,是一種純粹理性的決策方式.參與者依據(jù)期待效用最大化來(lái)指導(dǎo)決策,即
其中:Xm為動(dòng)作,U(Xm)為選擇動(dòng)作Xm的效用,p(Xm)為動(dòng)作Xm發(fā)生的客觀概率,EEUT表示期待效用,M為可能的動(dòng)作集合.
然而,現(xiàn)實(shí)的人都是有限理性的個(gè)體,在面對(duì)不確定事件時(shí),人們通常會(huì)根據(jù)歷史經(jīng)驗(yàn)和風(fēng)險(xiǎn)偏好來(lái)指導(dǎo)決策,表現(xiàn)出過(guò)度權(quán)衡低概率的結(jié)果,而低估中等概率到高概率的結(jié)果[14].Kahneman和Twosky在1979年提出了前景理論[17],可以很好地捕捉有限理性人心理因素對(duì)決策行為的影響過(guò)程.該理論指出,人的心理因素會(huì)將不確定事件的客觀概率p扭曲成個(gè)體主觀概率w(p),扭曲過(guò)程體現(xiàn)出對(duì)低概率風(fēng)險(xiǎn)的過(guò)度權(quán)衡和對(duì)中高概率風(fēng)險(xiǎn)的估計(jì)不足.參考Prelec等[18]提出的新版本前景理論,使用不確定性的累積表示法,以低復(fù)雜度的分析形式捕捉高概率損失的風(fēng)險(xiǎn)規(guī)避和風(fēng)險(xiǎn)尋求行為,即
其中:p是不確定事件的客觀概率;w(p(Xm),γ)是感知的主觀概率;γ ∈[0,1]是理性系數(shù),用來(lái)表征人們的理性程度.圖2揭示了不同理性系數(shù)下,個(gè)體對(duì)客觀概率的扭曲程度.
圖2 概率扭曲函數(shù)Fig.2 Probability distortion function
主動(dòng)EV作為有限理性個(gè)體,參與匯聚過(guò)程同樣受歷史經(jīng)驗(yàn)和風(fēng)險(xiǎn)偏好的影響.因此,本文采用PT理論來(lái)描述主動(dòng)EV面對(duì)不確定電價(jià)的反應(yīng)行為,即主動(dòng)EV根據(jù)下式來(lái)指導(dǎo)決策:
MGO需要基于PV、WT和LD的出力預(yù)測(cè)結(jié)果進(jìn)行電價(jià)決策.但在日前尺度上,上述資源具有明顯的隨機(jī)特性,進(jìn)而給MGO帶來(lái)一定的定價(jià)風(fēng)險(xiǎn).所以,MGO為應(yīng)對(duì)上述資源隨機(jī)特性導(dǎo)致的定價(jià)風(fēng)險(xiǎn),在日前市場(chǎng)制訂的是概率分布形式的不確定電價(jià).同時(shí),MGO還配備一定容量的柴油機(jī)(diesel engine,DE)、電池儲(chǔ)能(battery,BA)輔助資源以促進(jìn)可再生能源發(fā)電就地消納.
3.1.1 電價(jià)機(jī)制
首先指出本文所提的購(gòu)/售電價(jià)均是下層向上層購(gòu)入/售出電能的電價(jià),圖1中,Hgb(t)和Hgs(t)分別是MGO向上層配電網(wǎng)購(gòu)入和售出電能的電價(jià);分別是主動(dòng)EV向MGO購(gòu)入和售出電能的電價(jià),角標(biāo)p表示MGO制訂的是概率形式的電價(jià),體現(xiàn)電價(jià)的不確定性.
MGO制訂t時(shí)段的購(gòu)電價(jià)向量表示為
其中:J為電價(jià)向量長(zhǎng)度,即每個(gè)時(shí)段存在J個(gè)電價(jià),而每個(gè)電價(jià)對(duì)應(yīng)一個(gè)概率,對(duì)應(yīng)的概率分布向量pmb(t)表示為
為了防止問(wèn)題退化,即避免主動(dòng)EV直接參與配電網(wǎng)互動(dòng),引入以下電價(jià)約束:
MGO作為領(lǐng)導(dǎo)者,為防止其惡意抬升購(gòu)電價(jià)和下壓售電價(jià)以獲得高額利潤(rùn),從單時(shí)段和全時(shí)段兩個(gè)角度制定電價(jià)協(xié)議避免此類(lèi)情況的發(fā)生:
1)單時(shí)段電價(jià)協(xié)議.
其中:α(t)為購(gòu)電價(jià)利益保護(hù)系數(shù),β(t)為售電價(jià)利益保護(hù)系數(shù).
2)全時(shí)段電價(jià)協(xié)議.
同時(shí),作為MGO決策變量的電價(jià)概率存在以下約束:
對(duì)電價(jià)機(jī)制進(jìn)一步說(shuō)明: 1)為降低系統(tǒng)隨機(jī)性帶來(lái)的定價(jià)風(fēng)險(xiǎn),MGO在日前制訂的是概率形式的不確定電價(jià);2)原始的購(gòu)售電價(jià)向量的具體數(shù)值根據(jù)主動(dòng)EV的理性程度設(shè)計(jì),主動(dòng)EV理性程度越低,電價(jià)向量原始數(shù)值設(shè)計(jì)應(yīng)對(duì)主動(dòng)EV越有利;3)原始的購(gòu)售電價(jià)向量的長(zhǎng)度J由系統(tǒng)隨機(jī)性決定,隨機(jī)性越強(qiáng),J值應(yīng)越大.需要注意,由于上述電價(jià)硬約束的存在,即使購(gòu)售電價(jià)向量的具體數(shù)值或向量長(zhǎng)度J發(fā)生改變,對(duì)后文算法實(shí)現(xiàn)并無(wú)影響.
3.1.2 MGO目標(biāo)及約束
1)目標(biāo)函數(shù).
MGO除了具有最小化成本目的外,還具有促進(jìn)可再生能源就地消納的職責(zé),特地引入罰函數(shù)項(xiàng)來(lái)刻畫(huà)MGO該部分職責(zé).因此,MGO的目標(biāo)函數(shù)表示為
其中:CM-E(t)包括主動(dòng)EV向MGO購(gòu)入電能的購(gòu)電成本和售出電能的售電收益;(t)表示第i個(gè)主動(dòng)EV集群的充放電功率,大于0表示充電,小于0表示放電;N為主動(dòng)EV集群數(shù)量.需要注意,MGO無(wú)法估計(jì)主動(dòng)EV的理性程度,其在優(yōu)化過(guò)程視主動(dòng)EV為完全理性個(gè)體.
其中: DE運(yùn)行成本Cde(t)包括燃料成本coilDiesel(t)和維護(hù)成本kdePde(t),coil為燃油價(jià)格,Diesel(t)為油耗量,kde為運(yùn)維成本系數(shù),Pde(t)為DE 出力;c1,c2,c3是與DE耗量特性有關(guān)的系數(shù).
其中:kba為電池的單位平方功率運(yùn)維成本系數(shù);Pba(t)為電池出力,充電功率為正,放電功率為負(fù).
定義MGO的罰函數(shù)項(xiàng)為
其中:PLD(t)為基本負(fù)荷;PPV(t)為PV出力;PWT(t)為WT出力;μ1為MGO的電網(wǎng)系數(shù),隨著博弈進(jìn)行,μ1不斷增大以促進(jìn)系統(tǒng)均衡.
2)約束條件.
MGO的電價(jià)約束在第3.1.1節(jié)已經(jīng)給出.此處給出DE運(yùn)行約束、BA運(yùn)行約束和MGO與上層配電網(wǎng)的交互功率上下限約束.
其中: 式(19)和式(20)分別為DE功率約束和爬坡約束,Pde,rated為DE額定發(fā)電功率,Pde,cl為DE爬坡功率上限;式(21)–(23)分別為BA功率約束、能量約束和荷電狀態(tài)(state of charge,SOC)約束,Pba,rated為BA額定功率,SOCba(1)和SOCba(24)分別為BA初始SOC和結(jié)束SOC,SOCba.max和SOCba.min分別為BA最大SOC和最小SOC;式(24)為BA的SOC更新過(guò)程,Qba,rated為BA額定容量;式(25)為MGO與上層配電網(wǎng)的交互功率上下限約束,分別為交互功率的上下限.
日前,EV用戶基于自身的次日用車(chē)需求上傳基本信息至MGO系統(tǒng).對(duì)任一輛主動(dòng)EV-i的基本信息集合infi包括
以上基本信息集合決定了EV-i所能提供的匯聚潛力,可用靈活充放電范圍理論(FCDA)如圖3來(lái)描述EV_i的參與匯聚潛力.
圖3 電動(dòng)汽車(chē)靈活充放電范圍Fig.3 Flexible charging and discharging area of electric vehicle
圖3中:C點(diǎn)為入網(wǎng)時(shí)刻;G點(diǎn)為預(yù)期離網(wǎng)時(shí)刻;線段CF表征入網(wǎng)SOC;線段BG表征預(yù)期SOC;線段DE表征最小SOC約束;線段AH表征最大SOC約束;線段AC平行于EG,其斜率表征充電功率約束;線段CD斜率表征放電功率約束;ABCDEFGH圍成的多邊形表征了EV-i的靈活充放電范圍.帶箭頭的虛線代表一條可行的充放電SOC變化曲線.
對(duì)應(yīng)的EV約束數(shù)學(xué)模型表示為
其中: 式(27)表征了EV-i在并網(wǎng)時(shí)段期間內(nèi)可進(jìn)行充電、放電或浮充操作,由圖3的多邊形區(qū)域來(lái)表征;式(28)表征了EV-i充放電功率約束,由圖3的充放電SOC變化曲線的斜率來(lái)表征;式(29)表征了EV-i的SOC上下限約束,由圖3的線段AH,DE來(lái)表征;式(30)表征了EV-i的SOC更新過(guò)程;式(31)為充放電效率與充放電功率的關(guān)系,η為充放電效率,ηc為充電效率,ηdis為放電效率;式(32)表征了EV-i預(yù)期SOC約束,即EV-i經(jīng)過(guò)靈活充放電后,其SOC的最終落點(diǎn)一定在線段HG上;式(33)是離網(wǎng)SOC的表達(dá)式;式(34)是EV-i預(yù)期SOC的表達(dá)式,Ld表示日行駛里程,Lres表示為防止突發(fā)的額外用車(chē)需求而預(yù)留的行駛里程,Lcom表示為了更高行車(chē)舒適度而預(yù)留的行駛里程,Q100表示百公里耗電量.
3.3.1 主動(dòng)EV目標(biāo)
EV-i接收到MGO下發(fā)的電價(jià)概率分布信息,優(yōu)化充放電功率.主動(dòng)EV作為微網(wǎng)成員之一,具有一定的促進(jìn)可再生能源就地消納的職責(zé),并將這一項(xiàng)作為罰函數(shù)體現(xiàn)在目標(biāo)函數(shù)中.
EV-i作為有限理性個(gè)體,基于感知到的電價(jià)概率分布優(yōu)化自身的充放電行為,因此采用式(4)的形式刻畫(huà)主動(dòng)EV的目標(biāo)函數(shù)效益項(xiàng).
其中ρt為單位放電損耗成本.
EV-i的罰函數(shù)項(xiàng)表示為
其中:μ2為主動(dòng)EV的電網(wǎng)系數(shù),μ2的初始值及增長(zhǎng)速度由主動(dòng)EV的電網(wǎng)責(zé)任意識(shí)決定.電網(wǎng)責(zé)任意識(shí)是指某些具有環(huán)保意識(shí)的電能用戶,他們更愿意犧牲一定的用能體驗(yàn)或經(jīng)濟(jì)性來(lái)提升電網(wǎng)的運(yùn)行性能.在本文中,假設(shè)主動(dòng)EV均是此類(lèi)用戶.
主動(dòng)EV的最優(yōu)響應(yīng)是基于MGO制訂的電價(jià)概率分布進(jìn)行的,而他們的累積優(yōu)化結(jié)果又反過(guò)來(lái)作用于MGO的定價(jià)策略.這種優(yōu)化結(jié)果相互促進(jìn)的互動(dòng)形式符合Stackelberg game的特征.該博弈表示為
包含博弈3要素:參與者、策略集和效益函數(shù),各要素?cái)⑹鋈缦?
1)參與者: 博弈的領(lǐng)導(dǎo)者為MGO,博弈的跟隨者為EV-i|i∈N;
2)策略集: MGO的策略集YMGO為
3)效益函數(shù): 本文一致表示為成本函數(shù)形式.MGO的成本函數(shù)GMGO用式(13)來(lái)表示,EV-i|i∈N的成本函數(shù)GEV-i用式(35)來(lái)表示.
在博弈過(guò)程中,當(dāng)所有博弈參與者均獨(dú)立做出決策后,各參與者的效益都趨優(yōu)且穩(wěn)定,博弈再無(wú)改進(jìn)的余地,這樣的狀態(tài)稱(chēng)為納什均衡,使博弈達(dá)到納什均衡的動(dòng)作集合稱(chēng)為納什均衡解.假設(shè)為該Stackelberg game的納什均衡解,則有
在問(wèn)題求解之前,必須證明博弈均衡解的存在性和唯一性,具體步驟: 1)各參與方的策略為非空緊凸集;2)給定領(lǐng)導(dǎo)者策略后,跟隨者具有最優(yōu)解集;3)給定跟隨者策略后,領(lǐng)導(dǎo)者具有最優(yōu)解集[19].均衡解的存在唯一性證明見(jiàn)附錄A.
所提Stackelberg game模型中不同決策隸屬于不同參與者,尤其是主動(dòng)EV具有較高的自主性和智能性,傳統(tǒng)的集中式求解方法已不再適用.因此,本文基于MATLAB平臺(tái)Yalmip工具箱調(diào)用Gurobi求解器對(duì)模型分布式交互求解,優(yōu)化流程如圖4.Gurobi作為一種全局優(yōu)化器,可求解的問(wèn)題包括線性規(guī)劃、二次規(guī)劃、混合整數(shù)規(guī)劃和二階錐規(guī)劃等.而本文所建模型均屬于含線性約束的二次規(guī)劃問(wèn)題,可采用Gurobi求解器精確求解.
圖4 優(yōu)化流程圖Fig.4 Flow chart of optimization
具體優(yōu)化流程如下:
步驟1輸入基礎(chǔ)參數(shù),包括: EV基本信息和PV,WT,LD預(yù)測(cè)出力;
步驟2MGO對(duì)EV進(jìn)行匯聚潛力評(píng)估,并對(duì)通過(guò)評(píng)估的主動(dòng)EV個(gè)體進(jìn)行集群劃分;
步驟3博弈初始化: MGO初始化分時(shí)購(gòu)/售電價(jià)概率分布、DE和BA出力、與上層配電網(wǎng)的交互功率;
步驟4迭代次數(shù)初始化:r=1;
步驟5主動(dòng)EV 決策: 在約束(27)–(34)下對(duì)目標(biāo)(35)進(jìn)行優(yōu)化求解;并將優(yōu)化結(jié)果信息傳遞至MGO;
步驟6MGO決策: 在約束(9)–(12)(19)–(25)對(duì)目標(biāo)(13)進(jìn)行優(yōu)化求解;并將優(yōu)化結(jié)果信息傳遞至主動(dòng)EV;
步驟7收斂判斷: 所有決策變量的相鄰兩次優(yōu)化結(jié)果誤差小于ε? 若是,則轉(zhuǎn)至步驟9;若否,則轉(zhuǎn)至步驟8.ε為一個(gè)很小的數(shù),作為均衡判據(jù);
步驟8r=r+1,轉(zhuǎn)至步驟5;
步驟9結(jié)果輸出.
設(shè)定無(wú)序EV為25輛,主動(dòng)EV為100輛,并將主動(dòng)EV劃分為兩類(lèi): 第1類(lèi)尋求在住宅小區(qū)地下車(chē)庫(kù)并網(wǎng),希望在結(jié)束一天行程后在夜間以低價(jià)充電;第2類(lèi)尋求在商業(yè)園區(qū)停車(chē)場(chǎng)并網(wǎng),其入網(wǎng)SOC較高并希望參與放電獲得收益,同時(shí)這類(lèi)EV的離網(wǎng)SOC預(yù)期會(huì)更小,僅需滿足日行駛里程需求即可.EV的出行數(shù)據(jù)參考文獻(xiàn)[20]通過(guò)蒙特卡洛模擬方法獲取.
基于預(yù)測(cè)技術(shù),獲得該微網(wǎng)區(qū)域內(nèi)的PV,WT,LD出力,并以25輛電動(dòng)汽車(chē)參與無(wú)序過(guò)程計(jì)算充電負(fù)荷,如圖5.無(wú)序充電過(guò)程是指EV剛一接入充電樁就以最大功率充電直至滿足電量預(yù)期.
圖5 PV,WT,LD出力預(yù)測(cè)及EV無(wú)序充電負(fù)荷數(shù)據(jù)Fig.5 PV,WT,LD output forecast and EV unordered charging load data
可以看出,微電網(wǎng)基本負(fù)荷存在兩個(gè)高峰時(shí)段,分別是12:00~15:00與19:00~21:00;由于部分電動(dòng)汽車(chē)的無(wú)序充電行為,會(huì)導(dǎo)致負(fù)荷出現(xiàn)“峰上疊峰”的現(xiàn)象;光伏集中在白天9:00~16:00出力,較契合于負(fù)荷高峰需求;風(fēng)電集中在夜間20:00~05:00出力,具有明顯的“逆調(diào)峰”現(xiàn)象.可再生能源發(fā)電與負(fù)荷不匹配的現(xiàn)象存在于該微網(wǎng)系統(tǒng),迫切需要尋找靈活資源來(lái)就地消納這部分日前差額功率.
DE,BA參數(shù),PV,WT,LD數(shù)據(jù),分時(shí)電價(jià)數(shù)據(jù)參考文獻(xiàn)[10],EV參數(shù)參考文獻(xiàn)[20].見(jiàn)附錄B.算例設(shè)定主動(dòng)EV的電網(wǎng)系數(shù)初始值為0.0008,增長(zhǎng)速度為2倍;MGO的電網(wǎng)系數(shù)初始值為0.005,增長(zhǎng)速度為5倍.主動(dòng)EV與MGO的電網(wǎng)系數(shù)初始值及增長(zhǎng)速度的量化問(wèn)題,可采用演化博弈[21]的方法,經(jīng)過(guò)長(zhǎng)期的動(dòng)態(tài)博弈過(guò)程獲得.
設(shè)定主動(dòng)EV理性系數(shù)為0.8,博弈均衡判據(jù)ε=10-2,MGO與主動(dòng)EV經(jīng)過(guò)7次互動(dòng)可實(shí)現(xiàn)系統(tǒng)均衡,耗時(shí)20 min左右,滿足日前調(diào)度時(shí)間要求.主動(dòng)EV優(yōu)化維度從100 下降至41 個(gè),有效降低了優(yōu)化維度.在經(jīng)濟(jì)性方面,主動(dòng)EV的充放電成本從1166.52 元(直接參與配電網(wǎng)互動(dòng))下降至983.61元,下降了15.68%;MGO實(shí)現(xiàn)經(jīng)濟(jì)獲利424.45元.
圖6是博弈后主動(dòng)EV總功率、DE出力、BA出力、MGO與上層配電網(wǎng)交互功率的決策結(jié)果.主動(dòng)EV集中在08:00~16:00放電和在18:00~07:00充電,有效補(bǔ)充了微網(wǎng)系統(tǒng)的差額功率.DE和BA都以小額功率參與博弈以促進(jìn)負(fù)荷和可再生能源就地平衡.MGO將系統(tǒng)多余的電能出售給上層配電網(wǎng),并在低電價(jià)時(shí)段購(gòu)入上層配電網(wǎng)的電能,同時(shí)實(shí)現(xiàn)自身獲利和博弈均衡.系統(tǒng)不平衡功率處于較小范圍之內(nèi),可認(rèn)為系統(tǒng)處于均衡狀態(tài).
圖6 功率決策結(jié)果Fig.6 Power decision results
5.2.1 MGO博弈結(jié)果
為直觀展示MGO電價(jià)決策結(jié)果,取電價(jià)向量長(zhǎng)度J=3,圖7和圖8是MGO分時(shí)售/購(gòu)電價(jià)的優(yōu)化結(jié)果.
圖7 MGO電價(jià)概率分布Fig.7 Power price probability distribution of MGO
圖8 分時(shí)購(gòu)售電價(jià)均值Fig.8 Average price of time-of-use electricity
圖7是MGO分時(shí)購(gòu)售電價(jià)的概率分布情況.MGO通過(guò)優(yōu)化電價(jià)概率分布使得每個(gè)時(shí)刻電價(jià)均值最優(yōu),實(shí)現(xiàn)獲益最大化.
圖8是MGO分時(shí)購(gòu)售電價(jià)的均值分布情況.可以看出,分時(shí)購(gòu)售電價(jià)均值均處于上層配電網(wǎng)的分時(shí)購(gòu)售電價(jià)范圍之內(nèi),體現(xiàn)了模型的非退化,這一結(jié)果是通過(guò)引入電價(jià)保護(hù)協(xié)議實(shí)現(xiàn)的.在00:00~7:00 和20:00~24:00時(shí)間段,購(gòu)電價(jià)有所降低,有效促進(jìn)主動(dòng)EV參與充電;在7:00~20:00時(shí)間段,售電價(jià)有所上升,有效促進(jìn)主動(dòng)EV參與放電.MGO所制訂的電價(jià)策略契合于微網(wǎng)系統(tǒng)差額功率的變化趨勢(shì),符合于主動(dòng)EV的利益訴求,能有效實(shí)現(xiàn)主動(dòng)EV功率在合理時(shí)間區(qū)間下的匯聚.
5.2.2 主動(dòng)EV博弈結(jié)果
圖9和圖10是主動(dòng)EV集群的優(yōu)化結(jié)果.
圖9 主動(dòng)EV集群充放電功率Fig.9 Charge and discharge power of active EV cluster
圖10 主動(dòng)EV的SOC曲線Fig.10 SOC curves of active EV
圖9是41個(gè)主動(dòng)EV集群的充放電功率情況.第1類(lèi)主動(dòng)EV集中在夜間18:00~07:00充電,同時(shí)滿足次日的正常行程需求和預(yù)留行程需求,能有效消納夜間多余的風(fēng)力發(fā)電;第2類(lèi)主動(dòng)EV 集中在08:00~16:00 放電,并保證剩余電量滿足正常的日行程需求,能有效補(bǔ)償白天負(fù)荷需求大于可再生能源發(fā)電出力的情況.結(jié)果符合EV出行規(guī)律.對(duì)比主動(dòng)EV的充放電行為和無(wú)序EV的充放電行為,體現(xiàn)本文所提策略能有效匯聚主動(dòng)EV儲(chǔ)能資源.
圖10是主動(dòng)EV的SOC變化曲線,選取第1類(lèi)主動(dòng)EV的集群23和第2類(lèi)主動(dòng)EV的集群4作為代表進(jìn)行分析.集群23在時(shí)段15入網(wǎng),并預(yù)計(jì)在時(shí)段6離網(wǎng);集群4在時(shí)段6入網(wǎng),并預(yù)計(jì)在時(shí)段16離網(wǎng).二者在離網(wǎng)時(shí)刻的SOC均滿足預(yù)期電量要求.
5.2.3 EUT與PT對(duì)比分析
分析EUT和PT在指導(dǎo)主動(dòng)EV行為上的差異,同時(shí)考慮到大多數(shù)主動(dòng)EV為有限理性用戶,其理性系數(shù)并不會(huì)過(guò)于小,設(shè)定主動(dòng)EV的理性系數(shù)ε=10-2,并觀察每種情況下的博弈結(jié)果,如表1.
表1 不同理性系數(shù)下的博弈結(jié)果Table 1 Game results under different rational coefficients
EUT理論指導(dǎo)下的博弈過(guò)程可以看作是γ的特殊情況.可以看出,隨著主動(dòng)EV理性程度的提高,主動(dòng)EV的充放電成本逐漸降低,MGO的參與收益逐漸提高.歸結(jié)原因在于,MGO無(wú)法準(zhǔn)確估計(jì)主動(dòng)EV的理性系數(shù),在優(yōu)化過(guò)程中一致認(rèn)為主動(dòng)EV是完全理性的個(gè)體,真實(shí)的情況是主動(dòng)EV的決策行為受理性程度的影響,即雙方對(duì)理性系數(shù)的估計(jì)是存在偏差的.所以,當(dāng)主動(dòng)EV的理性程度提高時(shí),其對(duì)購(gòu)售電價(jià)概率的扭曲程度降低,MGO與主動(dòng)EV對(duì)理性系數(shù)的估計(jì)偏差逐漸減小,二者的博弈趨向透明,進(jìn)而導(dǎo)致參與者的整體經(jīng)濟(jì)效益提升.
同樣說(shuō)明,EUT雖然能為發(fā)揮EV主動(dòng)特性實(shí)現(xiàn)匯聚復(fù)用提供指導(dǎo)意見(jiàn),但并不能反映真實(shí)的主動(dòng)EV參與MGO匯聚互動(dòng)過(guò)程.驗(yàn)證了采用PT理論對(duì)分布式EV儲(chǔ)能匯聚建模的正確性和可行性,更具現(xiàn)實(shí)意義.
5.2.4 算法適用性分析
為了考察本文算法在不同場(chǎng)景下的適用性,特地設(shè)置以下情況加以分析.
情況1隨著地區(qū)經(jīng)濟(jì)發(fā)展,假設(shè)微網(wǎng)區(qū)域負(fù)荷增長(zhǎng)15%.
情況2隨著可再生能源發(fā)電的相關(guān)支持政策出臺(tái),假設(shè)微網(wǎng)區(qū)域光伏發(fā)電配置增加15%,風(fēng)力發(fā)電配置增加10%.
情況3惡劣天氣條件下,假設(shè)光伏發(fā)電量減少20%,風(fēng)力發(fā)電量減少10%.
情況4隨著電動(dòng)汽車(chē)優(yōu)惠政策的推出,假設(shè)微網(wǎng)區(qū)域EV數(shù)量增加20%.
情況5由于MGO對(duì)分布式儲(chǔ)能匯聚平臺(tái)的管理不當(dāng),假設(shè)有20%的主動(dòng)EV退出匯聚行列.
觀察不同情況下的分布式主動(dòng)EV參與匯聚后系統(tǒng)不平衡功率的情況,如圖11.
圖11 不平衡功率Fig.11 Unbalanced power
可以看出,在負(fù)荷增長(zhǎng)、可再生能源發(fā)電量發(fā)生變化和EV數(shù)量規(guī)模發(fā)生變化等場(chǎng)景下,經(jīng)過(guò)MGO對(duì)分布式主動(dòng)EV儲(chǔ)能的匯聚復(fù)用后,微網(wǎng)系統(tǒng)的不平衡功率不會(huì)超過(guò)最大負(fù)荷的0.68%,可以認(rèn)為系統(tǒng)功率處于平衡狀態(tài),驗(yàn)證了本文所提算法能夠有效促進(jìn)可再生能源就地消納,具有一般應(yīng)用性.
本文研究微網(wǎng)場(chǎng)景下MGO對(duì)分布式主動(dòng)EV的匯聚復(fù)用過(guò)程: 通過(guò)構(gòu)建基于靈活充放電范圍的主動(dòng)EV約束模型,實(shí)現(xiàn)主動(dòng)EV約束的統(tǒng)一建模;采用前景理論描述主動(dòng)EV的有限理性行為,充分遵從個(gè)體自主性;基于Stackelberg game架構(gòu)實(shí)現(xiàn)了對(duì)分布式EV儲(chǔ)能的主動(dòng)匯聚.
結(jié)果表明: 1)所采用的Stackelberg game架構(gòu)完全契合于分布式主動(dòng)EV儲(chǔ)能匯聚過(guò)程;2)完成MGO最優(yōu)分時(shí)電價(jià)的制訂和主動(dòng)EV最優(yōu)充放電計(jì)劃的制訂,實(shí)現(xiàn)了MGO獲益、主動(dòng)EV充放電成本降低和高滲透率可再生能源就地消納,兼具環(huán)保和經(jīng)濟(jì)上的效益;3)對(duì)比分析了前景理論和期待效用理論對(duì)效益結(jié)果的影響,驗(yàn)證了采用前景理論描述主動(dòng)EV有限理性行為的正確性和可行性,具有現(xiàn)實(shí)意義.
附錄A 博弈均衡解的存在唯一性證明
證明過(guò)程如下:
1)各方參與者的策略集為非空緊凸集.
對(duì)于跟隨者EV-i|i∈N,其策略集由式(27)–(34)表示,是非空且緊凸的;對(duì)于MGO,其策略集由式(9)–(12)(19)–(25)表示,均是非空且緊凸的.所以各參與方的策略集為非空緊凸集.
2)給定領(lǐng)導(dǎo)者策略后,跟隨者具有最優(yōu)解集.
再求二階導(dǎo)數(shù),得到
由于μ2>0,所以二階導(dǎo)數(shù)恒大于0,跟隨者的目標(biāo)函數(shù)在領(lǐng)導(dǎo)者給定策略后存在極小值.
3)給定跟隨者策略后,領(lǐng)導(dǎo)者具有最優(yōu)解集.
可見(jiàn),Hessian矩陣的任意階主子式均大于等于0,因此Hessian矩陣半正定,即領(lǐng)導(dǎo)者的目標(biāo)函數(shù)在跟隨者給定策略后存在極小值.
因此,本文所提出的MGO-EV-i|i∈NStackelberg game模型存在唯一的納什均衡解.
附錄B 算例基礎(chǔ)參數(shù)
EV,DE和BA參數(shù)如表B1–B3所示.
表B1 電動(dòng)汽車(chē)EV參數(shù)Table B1 Electric vehicle parameters
上層配電網(wǎng)的分時(shí)購(gòu)售電價(jià)信息如表B4所示.
表B4 配電網(wǎng)電價(jià)信息Table B4 Distribution network price information