国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于不完全信息的工業(yè)園區(qū)多主體需求響應博弈策略研究

2024-02-27 02:28:08王惠鋒孟祥東李寶聚王大亮陳厚合
電工電能新技術 2024年2期
關鍵詞:申報收益容量

孫 勇, 王惠鋒, 孟祥東, 李寶聚, 王大亮, 王 堯, 胡 梟, 陳厚合

(1. 國網(wǎng)吉林省電力有限公司, 吉林 長春 130022; 2. 東北電力大學電氣工程學院, 吉林省 吉林市 132012; 3. 國網(wǎng)吉林省電力有限公司電力科學研究院, 吉林 長春 130021; 4. 國網(wǎng)吉林省電力有限公司長春供電公司, 吉林 長春 130021)

1 引言

需求響應(Demand Response, DR)作為智能電網(wǎng)框架下的重要互動資源,對于維護系統(tǒng)穩(wěn)定性、減少電網(wǎng)公司投資、促進新能源消納等方面起到積極作用。由于用戶側多能負荷的耦合程度日漸加深,且可調控資源潛力和用戶用能偏好都與系統(tǒng)的高效運行息息相關,因此用戶參與需求響應收益的準確建模、利益分配機制的選擇和博弈過程分析都對于繼續(xù)推進電力市場化改革以及良性的電力現(xiàn)貨市場建設具有重要意義。

受惠于電力市場化進程早、電力金融體系相對完備和市場化自由度較高,國外在需求響應的研究中很早就使用了博弈論作為研究手段,并且展望了不同類型博弈在電力市場中不同領域的應用前景[1-4],國內相關研究也緊隨其后。文獻[5]結合非合作博弈探討了需求響應在無功支撐和改善電網(wǎng)性能方面的影響,但對經濟方面的考量則較為模糊。文獻[6]以經濟角度作為主要出發(fā)點,通過對售電商需求響應策略和補貼價格的制定,論證了在其模型下參與響應的各方都能夠因此獲利;在此基礎上,文獻[7]繼續(xù)結合經濟因素,針對風險厭惡型能源,考慮市場價格不確定性,提出一種雙層兩階段模型以探尋電力零售商競價策略和能源定價問題;文獻[8]通過光熱聚合商、多能運營商和用戶三方的利益均衡,采用主從博弈架構,在有效提升用戶側用能滿意度的同時,也在一定幅度上提高了系統(tǒng)的經濟效益。文獻[9]轉而從發(fā)電側角度出發(fā),在模型方面作出改進,選擇主從博弈與討價還價博弈共同組成了雙層模型,論證了機制上的部分改動可以進一步使博弈各方的經濟效益顯著提升,然而一定程度上忽略了用電側作為需求響應主體的重要地位。文獻[10,11]從家庭角度,使用了多周期微分博弈建立模型,采用0-1混合線性規(guī)劃計算納什均衡,給出了個人房主與電力供應商之間參與需求響應的博弈策略;文獻[12]則完全從用戶角度切入,設計了家庭之間的點對點能源交易,結合非合作博弈探討了該交易下的動態(tài)定價策略,不過由于家庭用電只占電力負荷比重中較小的部分,意義上仍較為有限;文獻[13,14]雖聚焦于需求側,提出了多層博弈競標模型和主從架構下的多微網(wǎng)綜合需求響應方法,但具體到策略刻畫上較為模糊;文獻[15-19]雖主要聚焦于工業(yè)用戶,采用了主從博弈來描述聚合商與用戶之間的博弈關系并探尋了二者在此架構下交互的收益問題,但其中部分背景環(huán)境與國內電力市場現(xiàn)狀仍客觀上存在有一定差異,在參考價值方面具備一定的局限性。

總體而言,現(xiàn)有的研究在用戶主動響應決策方面的描述尚不全面。譬如在目標群體選擇上,大部分文獻僅針對單一用戶的響應策略,且忽略了用戶在制定其響應策略時的有限理性;在用戶用能消費的決策方面,現(xiàn)有研究通常通過考慮用戶用能時的購買成本、參與需求響應的收益、補貼、市場消費剩余等因素來量化用戶用能消費的估值,建立用戶用能決策模型,但對于參與需求響應行為反映在用戶自身之影響的刻畫仍較為粗糙[20,21]。

本文引入Bayes博弈理論來研究用戶參與需求側響應的博弈行為,在按容量區(qū)分不同體量用戶的基礎上建立雙層模型,構建了層間交互關系,設計了聚合商與用戶的收益分配機制;最后通過算例分析,得到了在聚合商不同利益分配機制下,用戶的合作策略傾向以及聚合商參與需求響應的價格和容量申報策略,分析了園區(qū)內需求響應對用戶側資源調控具有重要作用和意義,一定程度上可為工業(yè)園區(qū)內有意愿參與需求響應的各級各利益主體策略決策的制定提供部分參考和依據(jù)。

2 工業(yè)園區(qū)需求響應主體分析

2.1 需求響應交互結構

需求響應的參與者包括執(zhí)行者與運營商兩部分;執(zhí)行者為用戶側的各類可控負荷,運營商可按角色分為三個主體:負荷聚合商、電力調度中心與電力交易中心。負荷聚合商負責聚合各類電力用戶需求響應資源,參與市場化需求響應,為年用電量5 GW·h以上的用戶(批發(fā)用戶)和5 GW·h以下的用戶(零售用戶)提供服務;電力調度中心負責組織市場主體注冊的安全校核、交易出清、評價考核、建設運維;而電力交易中心負責需求響應市場主體的注冊申報、合同管理、信息披露、出具結算等[22]。運營商各主體間交互狀況可從信息層和物理層兩個層面上進行描述,如圖1和圖2所示。

圖1 工業(yè)園區(qū)需求響應的信息層交互結構Fig.1 Information layer interaction structure for demand response in industrial parks

圖2 工業(yè)園區(qū)需求響應的物理層交互結構Fig.2 Physical layer interaction structure for demand response in industrial parks

信息層交互是指整個系統(tǒng)內參與需求響應的全部主體,其信息流動的交互狀況。如圖1所示,園區(qū)內存在多個規(guī)模不同的負荷聚合商,每個負荷聚合商各自與園區(qū)內有意向參與需求響應的用戶簽訂服務合同,在合同有效期內,聚合商代行參與需求響應。需要說明的是,大用戶(批發(fā)用戶)可以繞過負荷聚合商,直接參與負荷響應。

物理層交互則是考慮到了負荷聚合商的特殊屬性——無實體。由于聚合商本身不提供任何負荷,只是其所代理的全部用戶的負荷集合,因此在物理層面上實際只有一類節(jié)點,即電力用戶,包括批發(fā)用戶和零售用戶。

綜上所述,調度中心和交易中心可視為供電公司在參與需求響應管理過程中在物理層和信息層的兩種表現(xiàn)形式;相對而言,前者更關注需求響應過程中的響應執(zhí)行行為本身,而后者則更側重于在經濟層面對市場內用戶的激勵及其所產生的正面引導作用。

2.2 需求響應交易機制

本文根據(jù)我國現(xiàn)行工業(yè)園區(qū)中需求響應的商業(yè)模式,即交易中心-聚合商-用戶三層結構,設定了需求響應采取邀約制,即:在用電高峰時,由于電力供應緊張,交易中心發(fā)出邀約在市場中尋求提供更多可用電能,試圖彌補用電缺口;而在用電低谷時,由于供電能力盈余,交易中心發(fā)出邀約在市場中尋求消耗更多電能,以保證電網(wǎng)的經濟運行。設置邀約在響應執(zhí)行日2天前的上午發(fā)布,在需求發(fā)布后,各負荷聚合商和批發(fā)用戶各自決定申報容量和申報價格,在邀約發(fā)布后12 h內完成市場申報,隨后在市場出清過程中,按申報價格由低到高依次調用,報價相同時按截止時間前、最近一次申報時間的先后順序依次調用,直至滿足響應容量需求。出清容量按照全量中標,次日執(zhí)行響應;在響應執(zhí)行后、結果申訴前,還會進行響應評價并作出結算[22],該過程如圖3所示。

圖3 需求響應邀約機制Fig.3 Demand response invitation mechanism

3 園區(qū)需求響應的博弈架構構建

3.1 利益邊界與雙層模型

圖3中,申報和出清兩個步驟意味著不同的負荷聚合商之間必然存在利益沖突。且因為用戶具有自主選擇簽約聚合商的權利,故對于聚合商而言應在博弈過程中盡可能多地擊敗其他聚合商,從而謀求獲得更多的用戶資源,并通過合理的利益分配機制將簽約用戶保持在自己名下從而最大化自身利益,這體現(xiàn)了聚合商作為商業(yè)機構本征存在的逐利性。聚合商、批發(fā)用戶和零售用戶三類博弈參與者參與需求響應的一般狀態(tài)模式如圖4所示,粗直線表示與交易中心進行需求響應行為時各參與者的利益邊界,在博弈過程中會被不斷推動,直至博弈達到均衡點時停止。

圖4 參與需求響應的一般狀態(tài)Fig.4 General state of participation in demand response

實際上,圖4中的利益邊界并非一種具象化的、物理存在的實體邊界,而是用以表達需求響應過程中不同參與者收益流動的交互邊界。圖4中任意兩條相鄰的利益邊界所夾圍成的區(qū)域都可視為上層博弈中的一個對象整體,且該區(qū)域的全部收益來源均由交易中心提供,各扇區(qū)圓心角的比值即為園區(qū)內對應區(qū)域的市場份額之比。

在利益邊界的動止問題上,本文擬通過不滿意度機制的設置對用戶與聚合商的合約關系進行更新,這意味著一旦合約關系發(fā)生變化,圖4中某些區(qū)域原有的合作關系便不再能夠維持原狀(這表征為區(qū)域元素的變動),此即為驅動利益邊界推動的原動力;而邊界的推動過程本身則在次月的需求響應行為中體現(xiàn),并且由于次月的合約關系表很大可能仍會發(fā)生變化,這意味著在次次月,邊界仍會被再次推動;當且僅當達到博弈的均衡點,即所有用戶都沒有在次月改變運營商的動機(因為任何單方面的改動都無法獲得更多收益)時,邊界失去驅動力,變動停止。

整體博弈架構如圖5所示,由于上層博弈中的所有參與者都直接從交易中心獲取收益,而所獲收益的總額取決于該次響應的出清價格,出清價格又與各參與者的策略決策(也即響應申報容量和申報價格)二者強相關,故任一參與者在參與響應的過程中,其策略決策都會影響其他參與者的收益,這是一種典型的多方非合作博弈[23]。又因為實際的出清結果中只公開中標容量和中標單價,競爭對手的其他信息對于博弈參與者而言是缺失的,無法對其申報策略產生明確的引導方向,故而該博弈是一種不完全信息博弈。

圖5 園區(qū)需求響應雙層博弈架構Fig.5 Bi-level game structure of demand response in park

而在亞結構視角的博弈下層,由于批發(fā)用戶本身不具備組織其他用戶參與需求響應的能力,零售用戶若想要獲得需求響應的收益必須與聚合商結盟;又因為聚合商并非園區(qū)內的用戶,自身無法提供任何其所申報的響應容量,本質上其僅是一個由眾多用戶組成的聯(lián)盟代理,以與用戶簽訂合約的方式為聯(lián)盟提供協(xié)議約束力,并對所獲得的收益進行再分配,而后下發(fā)給其名下用戶。這意味著在博弈下層,每一負荷聚合商的名下,都形成了支付可轉移的合作博弈,也即在下層形成了多個合作博弈格局[24]。至此,一個由Bayes博弈作為上層、數(shù)個合作博弈作為下層的雙層博弈模型得以構建。

3.2 模型層間關系與用戶不滿意度

3.1節(jié)提及推動利益邊界的原動力是下層博弈中用戶合約的改變,而促成該變化的原因涉及模型的層間交互過程以及不滿意度機制的設計,其中用戶的不滿意度直接影響下層所形成的合作聯(lián)盟。如表1所示,數(shù)字1表示對應行的用戶與對應列的負荷聚合商締結了聯(lián)盟關系,否則使用數(shù)字0表示;合作聯(lián)盟一旦形成,僅在本月全部單次響應完成后、下月需求響應開始前允許變更。

表1 下層合約關系表Tab.1 Lower level contract relationship table

當初始的下層合約關系表給定后,各聚合商的可響應容量上限隨即確定。對用戶而言,自身的博弈策略表現(xiàn)為合作對象的選擇,而用戶所提供的可響應容量會直接影響聚合商在上層博弈中的收益。當輪Bayes博弈后所產生的上層收益表見表2,表2中,r為用戶的收益,R為聚合商的收益。

表2 上層收益矩陣表Tab.2 Upper level income matrix table

表1中,任意一個用戶只能與一個聚合商在本月簽訂合約,表示與該聚合商名下的全部其他用戶組成聯(lián)盟,然后開始第i次迭代過程。由于在第i次迭代過程中的上層博弈時,申報的響應容量上限受制于第i次的合約關系表,而響應容量上限又會影響聚合商的申報策略,這進一步影響了其收益,改變了上層收益矩陣表中的元素,這就形成了下層博弈對上層博弈的影響。而在當次響應過程結束后,聚合商通過對已獲得收益的再分配,來直接影響其聯(lián)盟內每個用戶的收益;若用戶對分得的該收益不滿意,就會在合約到期時改變其聯(lián)盟對象,轉投其他聚合商尋求合作,就會導致下層合約關系表中的元素的變化,形成了上層博弈對下層博弈的影響。

通過這種相互影響和不斷迭代,兩層博弈通過該機制建立起了內在關聯(lián),如圖6所示。最終在經歷多個子博弈均衡后,可以達到穩(wěn)固的聯(lián)盟關系,在該關系中,任一參與者脫離聯(lián)盟都無法單方面獲得較之前更高的收益,這一狀態(tài)即為該博弈的一個Nash均衡點。而對任一聚合商而言,此時其即將采用的申報容量和申報價格,即是其全部動作策略的最佳反應,也稱最優(yōu)決策。

圖6 層間迭代關系Fig.6 Iterative relationship between layers

由于用戶對經負荷聚合商再分配后的、自身分得的利益未必達到預期收益值,因此可能會在次月更換其他合作聚合商以圖獲取更多收益,具體表現(xiàn)為用戶對當前對象不滿意度的積累到達一定程度時,對自身在下層合約關系表中相應的元素作出變更,以不滿意度函數(shù)zk作為用戶做出該變更行為的概率。不滿意度函數(shù)如式(1)所示:

ak<1,bk>0

(1)

式中,ak和bk為不滿意度函數(shù)參數(shù),用來調節(jié)不滿意度的影響權重;∑r(i)為用戶i在本月內實際獲得的全部響應收益;∑Er(i)為用戶i在本月內期望獲得的響應收益(與某用戶自己響應容量絕對值最小的5位其他用戶收益的算數(shù)平均值);ReLU(·)函數(shù)即線性整流函數(shù)作為激活函數(shù)對非正部分進行歸零處理。例如當用戶i在本月內實際共獲得3萬元,ak取0.8、bk取1時,隨期望獲得收益不同而引起的其不滿意度的變化如圖7所示。當且僅當博弈達到均衡點處且無外部條件改變時,所有用戶都不會在次月主動改變自己的合作策略。

圖7 期望收益變化引起的其不滿意度的變化Fig.7 Changes in dissatisfaction caused by changes in expected earnings

3.3 用戶收益分配機制

由于用戶的收益實質上依賴于聚合商所獲收益后再分配的過程,因此分配機制直接決定了用戶收益和不滿意度。本文在下層模型中的支付可轉移的合作博弈中,擬設置五種利益分配方式:等分、按容量比例分配、按Shapley值分配、按核仁分配和等MDP(Modified Disruption Propensity, MDP)指標[25]分配五種。

(1)等分:聯(lián)盟下每位參與者平等分割該聯(lián)盟的聯(lián)盟價值。

(2)按容量比例分配:參與者分得的收益與其組成聯(lián)盟的容量成正比。

(3)按Shapley值分配:通過加權因子的控制,按照參與者的邊際貢獻進行分配。Shapley值具體計算如式(2)所示,式中變量詳釋見參考文獻[25]:

[v(s)-v(s{i})]

(2)

(4)按核仁分配:通過對核的幾何中心的求取,將表征核仁的向量映射回三維坐標。由于核的存在性滿足了穩(wěn)定分配的最低要求,保證了所有參與者在該分配下都不會脫離聯(lián)盟,選擇通過犧牲一定的經濟性來確保聯(lián)盟的穩(wěn)定。

(5)等MDP指標分配:MDP指標是一種改進的破壞聯(lián)盟傾向指標,用來表示某參與者拒絕合作所帶給其他參與者的人均損失與自身損失之比,其核心思路是考慮讓所有參與者的這種破壞聯(lián)盟的傾向相等,來保證對分配的接受程度一致。具體公式如式(3)所示,式中變量詳釋見參考文獻[25]:

(3)

對于用戶收益分配機制的對比和分析將在算例部分進一步闡明。

4 基于日清月結的聚合商收益模型

4.1 聚合商收益函數(shù)

聚合商收益RLA采用日清月結的方式,其收益包括三個部分,分別為日前邀約需求響應收益RRI、可中斷負荷交易響應收益RIL以及零售分成電費收益RRS,如式(4)所示:

RLA=RRI+RIL+RRS

(4)

其中RRI和RIL作為獎勵響應收益,分別來自于兩種不同的交易類型,而零售分成電費的收益RRS,則是來自于未參與響應,但享受了響應所帶來的便利的各個用戶所繳納電費中的一部分。

如式(5)所示,日前邀約需求響應收益,主要是響應費用RRIDR和考核費用RRIA兩部分構成,兩項分別主要是圍繞有效響應容量和無效響應容量來構建,本節(jié)各式中部分參數(shù)含義見附表1。

附表1 《廣東省市場化需求響應實施細則(試行)》中部分參數(shù)設置App.Tab.1 Partial parameter in commercialized demand response implementation rules of Guangdong province (trial)

RRI=RRIDR-RRIA
=∑QECRI+∑[QI·max(M1CRI,P3)]

(5)

總體而言根據(jù)有效響應容量獲得正的收益,根據(jù)無效響應容量獲得懲罰,也就是所謂的考核費用。在約束上則要滿足日前邀約的可響應容量能力約束,和日前邀約的非虛假申報約束如式(6)所示:

(6)

可中斷負荷交易響應收益則是由備用費用RSP和調用費用RTR兩部分組成的,如式(7)所示:

(7)

由于在單次響應過程中,如果某聚合商被當次調用,則備用費用部分不會獲得收益,這意味著兩部分收益不可能同時存在,故而使用調用狀態(tài)函數(shù)u,令u=1表示調用,u=0表示未調用。約束方面則要滿足可中斷負荷的可響應容量能力約束和可中斷負荷的非虛假申報約束,如式(8)所示:

(8)

以上各式中的無效響應容量QI和有效響應容量QE則按照式(9)計算:

(9)

式中,QF為實際響應容量;QBL為結算基線負荷;QR為實測負荷。在之前的實際響應容量求取當中,需要用到結算基線負荷,即未實施需求響應和有序用電時響應資源的用電負荷。進一步可以劃分為五種制定類型,主要區(qū)別在于負荷樣本數(shù)不同,其制定標準參考文獻[22]中的附錄部分。

零售分成電費由全月需求地區(qū)電力用戶分攤費用與地區(qū)電力用戶月度實際用電量的比值確定:

(10)

由于度電分攤費用無限增加是不現(xiàn)實的,所以在此基礎之上設置度電分攤上限CT。在用戶分攤費用RZU>CT時,當月不再組織日前邀約和可中斷負荷交易,并且要按照折算系數(shù)K去等比例地調整響應收益。K具體值如式(11)所示:

(11)

4.2 博弈的數(shù)學表述及均衡存在性證明

對于聚合商之間的非合作關系,該Bayes博弈模型可以使用五元組Γ=〈N,S,Θ,p,u〉描述為:

i∈N+

(12)

在均衡解的存在性證明方面,Nash在Kakutani定理和Berge定理的基礎之上給出了混合策略Nash均衡存在性定理,即:對策略式博弈G={N;S1,…,Sn,u1,…,un},若策略集合Si為Euclid空間的非空緊子集,支付函數(shù)ui關于策略組合s連續(xù),則該博弈存在混合策略Nash均衡[25]。對于本文的博弈模型,由于策略集合來源于申報價格和申報容量兩種不相干動作組成的二維策略空間,且二者在各自維度上均是連續(xù)的,故而其組成的二維策略空間也是稠密且連續(xù)的,所以策略集合顯然為Euclid空間的非空緊子集;對于式(4)的收益函數(shù),由于其三部分RRI、RIL、RRS都是連續(xù)的,故而其和也是連續(xù)的,滿足該定理的全部條件,從而該博弈均衡解的存在性得證。

4.3 均衡求解方法

在均衡解求取方面,本文提出一種改進的虛擬遺憾最小化[26,27]算法,在動作空間內隨機一個出來作為行動策略,依靠出清信息與實際收益來確定虛擬遺憾值,通過虛擬遺憾的梯度最速下降方向來對本輪內的、先前生成的策略來進行獎勵與懲罰,獎勵與懲罰的具體權重按照生成策略與出清信息的歐式空間距離來確定。當最小化平均整體遺憾值趨于0時,其所得的平均策略通過2ε-均衡定理認為近似收斂到納什均衡策略[28]。該算法流程如圖8所示。

圖8 改進的虛擬遺憾最小化算法流程圖Fig.8 Flow chart of improved counterfactual regret minimization

本文所提算法通過對策略使用遺憾值進行獎勵或懲罰來不斷自我學習,從而引導策略的生成傾向以較快的速度逼近平均整體遺憾更小的方向,并保證模型收斂性與求解效率。

5 算例仿真

本文算例采取2020和2021年廣東省某工業(yè)園區(qū)邀約響應的實際數(shù)據(jù)。在收益模型部分,對第3節(jié)公式中的全部參數(shù)設置見附表1,其中,共統(tǒng)計了28個聚合商在2020和2021兩個年度在本園區(qū)內共計1 585次需求響應中隨機抽取5名聚合商響應的實際收益平均值,并在表3中給出了此5名聚合商若采用本文給出的策略所能取得的預期收益,而后將二者進行了對比。此外,全部28個聚合商的平均每次響應收益增長和平均每次響應收益增幅如圖9所示。通過分析可以認為總體而言,多數(shù)聚合商如果采用了本文提出的策略,其平均收益對比采用策略前均會有所提升,僅有少數(shù)聚合商的收益一定程度上下降。

表3 部分聚合商實際收益與采用本文策略后的預期收益及對比Tab.3 Actual income of some aggregators and expected income after adopting strategies in this paper

圖9 全部聚合商的平均每次響應收益增長和平均每次響應收益增幅Fig.9 Average revenue per response growth and average revenue per response growth across all aggregators

在策略曲線的變化趨勢方面,以聚合商1為例,其申報策略曲線如圖10所示。每個需求場景下,都包含其之前全部場景的歷史數(shù)據(jù),由圖10可知,該聚合商的申報價格策略在第300次邀約響應場景附近開始趨于平穩(wěn),在經歷了全部1 585次邀約響應的場景后最終在800元/(MW·h)附近小幅度波動;其申報容量策略在第380次邀約響應的場景附近開始趨于平穩(wěn),在經歷了全部1 585次邀約響應的場景后,最終在3.5 MW·h附近波動但幅度較大,這是由于前文提出的不滿意度機制作為一種變更合作關系的概率,會在一定程度上導致申報策略的波動。根據(jù)多次學習結果的統(tǒng)計,伴隨著訓練集數(shù)量的提升,其策略波動性會在一定程度上漸趨于平緩。

圖10 1 585個需求響應場景下聚合商1申報策略曲線Fig.10 Curve of declaration strategy of aggregator 1 under 1 585 demand response scenarios

對于下層博弈的利益分配機制,為便于對比分析,現(xiàn)進行4處理想化處理:

(1)為排除用戶在下層博弈中不完全理性所帶來的對結果的不確定性影響,假設用戶完全理性,即式(1)中的概率性不滿意度zk使用式(13)中的確定性不滿意度zk′來進行簡化替代,概率性不滿意度zk在此僅作為評價指標:

(13)

(2)用戶i每月提供的響應容量上限恒定不變,即不隨月份發(fā)生變化。

(3)聚合商用以分配給用戶的總支付,占其全部收益的百分比固定不變,本文按照75%取值。

(4)不滿意度冷卻:用戶不會在離開某聚合商名下后的相鄰兩個月內再回到該聚合商名下。

在此前提下,為方便對利益分配機制的分析,此處設置一新算例,選用表3中的五名聚合商作為園區(qū)內全部的可選聚合商,將每個聚合商都分配一種不同的收益分配機制,即在此場景下,園區(qū)內全部137名用戶同一時間僅能選擇這五名聚合商中的某一個進行合作。為了方便比對,這五類分配機制下的初始合作用戶數(shù)量應盡可能保持一致,具體見表4。

表4 所選聚合商及其對應的收益分配機制Tab.4 Selected aggregators and their corresponding income distribution mechanism

圖11和圖12分別展示了五種不同分配方式下用戶數(shù)量變化趨勢和用戶平均不滿意度變化趨勢?,F(xiàn)對5種收益分配機制分析如下:

圖11 不同分配方式下聚合商名下用戶數(shù)量變化趨勢Fig.11 Change trend of number of users under aggregator name with different allocation methods

圖12 不同分配方式下聚合商名下用戶平均不滿意度變化趨勢Fig.12 Change trend of average user dissatisfaction of aggregators with different distribution methods

等分:在該園區(qū)用戶數(shù)量的規(guī)模下,由于初始合作的用戶體量差異客觀存在,而等分的利益分配方式總會妨害部分用戶利益,使其不滿意度維持較高狀態(tài),并且隨時間的推移該變化呈升高趨勢,引起客戶持續(xù)流失直至用戶數(shù)量下降至足夠低的水平,此時采用該分配方式的聚合商被迫以極低的響應容量上限參與需求響應,其收益也持續(xù)走低。在此情形下,一旦用戶所能提供的響應容量上限小于上層博弈中聚合商參與需求響應的響應下限時,該聚合商便不再滿足需求響應的基本條件,失去次月參與上層博弈的資格,進而不再能獲得任何收益,最終導致采用該分配方式的聚合商退市。

按容量比例分配:相比于等分的分配方式,按容量比例分配會在一定程度上降低用戶的總體不滿意度,但算例中受制于用戶完全理性的理想化條件,用戶數(shù)量流失速度并未有明顯改善??傮w而言可以認為在足夠長的時間尺度內,機械地按照容量比例的分配方式仍會流失全部用戶,直至聚合商退市。從博弈論中核仁這一概念的視角下來看,意味著前兩種分配方式下的分配策略必然不在核中,即策略元素不是核范圍內的元素。

按Shapley值分配:按Shapley值分配的方式實際上是按照參與者的邊際貢獻來進行分配的,作為一種平均主義思想的分配方式,對于用戶而言相對較為公平。圖12中該分配方式下的平均不滿意度水平在全部五種方式中處于相對較低水平??傮w來看其在用戶組成上雖未必穩(wěn)定,但能夠提供的響應容量上限和與之強相關的收益必然相對平穩(wěn),可以認為是一種較為公平的分配方式。

按核仁分配:如圖12所示,按核仁分配最為明顯的特點是用戶的平均不滿意度能夠維持在相對較低的水平,并且有緩慢下降的趨勢。然而雖然其用戶數(shù)量的增長水平較高,但仍以規(guī)模較小的小容量用戶為主,其總提供容量上限的趨勢仍不明朗。這意味著按照核仁分配收益的方式,雖在物理意義上較為明確(最小化最大剩余思想),也相對較為符合多數(shù)用戶的決策理念,但隨著其他分配方式下壟斷聯(lián)盟的形成,其穩(wěn)定度在長時間尺度下也必然會下降,依然將存在退市風險。然而在理論上,如果在長時間內其他聚合商未能形成體量足夠的聯(lián)盟,該分配方式仍可認為表現(xiàn)優(yōu)異,并在適宜條件下可以保持規(guī)模的緩步增長。

按等MDP指標分配:在該分配方式下,用戶平均不滿意度水平較高。由于該方式著眼于退出聯(lián)盟給他人帶來的損失與給自身帶來損失的比值,意味著對于體量較大的用戶通常能獲得更低的不滿意度,也即自身持有較高容量的用戶更傾向于選擇在該規(guī)則下與聚合商達成合作。實際上在本算例的限制條件下,該分配方式的優(yōu)越性較難體現(xiàn),但若用戶池中不同用戶持有容量的方差較大,且聚合商在上層博弈中的響應容量上限不會被限制在較低的水平時,則若采用該分配方式將會逐漸自發(fā)擴大其聯(lián)盟的規(guī)模,并不斷擠壓其他聚合商的生存空間,如圖13所示,在經歷足夠長的時間后將可能會形成壟斷地位。

圖13 取消響應容量上限前后使用等MDP指標分配對用戶數(shù)量的影響Fig.13 Impact on number of users of MDP indicator allocation before and after canceling response capacity ceiling

綜上所述,在園區(qū)內的聚合商僅有上述5類收益分配方式且滿足前述4種理想化條件的場景下,等分和按容量比例分配的收益分配方式均會以不同的速度流失用戶,造成聯(lián)盟崩解導致對應的上位聚合商被迫退市,而其他3種利益分配方式能夠在稍長的時間里維持相對穩(wěn)定的運營狀況,且各自有其特點;其中,按核仁分配在用戶不滿意度方面表現(xiàn)較好,按等MDP指標分配則可以在滿足一定條件(較大的用戶容量方差、申報響應容量上限足夠高)時發(fā)揮優(yōu)勢形成壟斷地位,而按Shapley值分配能在用戶平均不滿意度水平維持在較低水平的同時一定程度上緩和用戶流失,是一種較為平衡的可選分配方式。

6 結論

本文從不同利益視角下出發(fā),通過提出園區(qū)內全部需求響應參與者參與至需求響應過程中的利益關系并構建博弈架構,算例驗證了所提方法的可行性與有效性,并得到以下結論:

(1)通過理論分析與推導,證明所提出的Bayes博弈模型存在均衡解,并應用一種改進的虛擬遺憾最小化方法求解,結果表明該算法具有較好的收斂效果,可以在部分信息不公開的情況下對博弈策略的生成進行引導。

(2)算例仿真結果說明本文通過引入博弈架構描述聚合商與用戶在參與需求響應過程中的關系,能夠提高聚合商的收益,通過收益維持已參與需求響應的用戶繼續(xù)參與需求響應,吸引未參與需求響應的用戶參與到需求響應中來,改善用戶用電模式,達到削峰填谷的作用。

(3)從聚合商視角下審視收益分配制度,若采用等分和容量比例方式均會在較短時間內發(fā)生退市,而隨著用戶容量方差、申報響應容量上限等外部條件的不同,按Shapley值分配、按核仁分配和等MDP指標分配三種分配方式各有優(yōu)劣,仍需結合具體環(huán)境下的具體條件進一步計算才能保證所選擇的收益分配方式可以持續(xù)運營。

附錄

猜你喜歡
申報收益容量
少先隊活動(2022年9期)2022-11-23 06:56:24
螃蟹爬上“網(wǎng)” 收益落進兜
國際收支間接申報問答
中國外匯(2019年13期)2019-10-10 03:37:42
《申報》與上海民國時期禁戲
中華戲曲(2016年1期)2016-09-26 08:49:02
2015年理財“6宗最”誰能給你穩(wěn)穩(wěn)的收益
金色年華(2016年1期)2016-02-28 01:38:19
東芝驚爆會計丑聞 憑空捏造1518億日元收益
IT時代周刊(2015年8期)2015-11-11 05:50:38
SnO2納米片容量異常行為的新解釋
電源技術(2015年12期)2015-08-21 08:58:20
2015年上半年我國風電新增并網(wǎng)容量916萬千瓦
風能(2015年8期)2015-02-27 10:15:12
2015年一季度我國風電新增并網(wǎng)容量470萬千瓦
風能(2015年5期)2015-02-27 10:14:46
如何解開設計院BIM應用的收益困惑?
安泽县| 汉阴县| 商都县| 庄河市| 武陟县| 赤峰市| 当阳市| 特克斯县| 广元市| 灵丘县| 拜城县| 郸城县| 丰顺县| 松潘县| 钦州市| 兴业县| 曲靖市| 佛山市| 石渠县| 阳山县| 永定县| 和顺县| 奇台县| 阿图什市| 吉木萨尔县| 河津市| 蒲城县| 英德市| 天镇县| 白朗县| 海门市| 淮滨县| 兴海县| 梓潼县| 延边| 康保县| 三门峡市| 自治县| 大悟县| 泰宁县| 德兴市|