姜展鵬,劉 洋,劉守恒,郝立超
(1.沈陽工業(yè)大學(xué)電氣工程學(xué)院,遼寧 沈陽 110870;2.中電投東北新能源發(fā)展有限公司,遼寧 沈陽 110170)
隨著“雙碳”戰(zhàn)略的實施,可再生能源如風(fēng)能、水能、太陽能引起了人們廣泛關(guān)注,其中光伏發(fā)電是利用太陽能發(fā)電的一種常見形式。然而,光伏發(fā)電具有很強的不確定性,尤其在陰天具有很強的波動性,由于不知光伏陣列上方何時有云遮擋,光伏發(fā)電功率很難預(yù)測[1-4],同時,由于人們生活水平的提高,負(fù)荷種類也越來越多,且有極大的不確定性,嚴(yán)重影響了微電網(wǎng)頻率的穩(wěn)定性。
微電網(wǎng)頻率波動可能影響用電設(shè)備,解決這個問題通常有減少發(fā)電的不確定性和利用控制策略來穩(wěn)定頻率2種方式。由于天氣實時變化的因素,很難預(yù)測光伏發(fā)電的功率,因此,很多學(xué)者更加青睞于第2種方式。
增強學(xué)習(xí)算法是一種具有函數(shù)逼近最優(yōu)性的有效方法,特別適用于非線性系統(tǒng)和復(fù)雜系統(tǒng)。在面對“維數(shù)災(zāi)”時,可以得到近似最優(yōu)解[5-9]。增強學(xué)習(xí)算法在電力系統(tǒng)領(lǐng)域應(yīng)用頗豐,在文獻(xiàn)[10]中,通過基于數(shù)據(jù)的策略迭代對一類離散時間系統(tǒng)進(jìn)行H∞控制,并將其應(yīng)用于風(fēng)力渦輪機。在文獻(xiàn)[11]中,設(shè)計了一種基于自適應(yīng)動態(tài)規(guī)劃的控制方案,以輔助電力系統(tǒng)的負(fù)荷頻率控制。在文獻(xiàn)[12]中,研究了基于數(shù)據(jù)的魯棒值迭代方法,并將其應(yīng)用于風(fēng)機變槳距控制。在文獻(xiàn)[13]中,采用自適應(yīng)的設(shè)計方法,在智能電網(wǎng)中應(yīng)用了一種基于廣域測量的動態(tài)隨機最優(yōu)潮流控制算法。然而,在現(xiàn)有的電力系統(tǒng)研究中,增強學(xué)習(xí)算法經(jīng)常被設(shè)計為輔助控制,而利用增強學(xué)習(xí)算法對電力系統(tǒng)直接控制卻很少見[14-15]。本文利用增強學(xué)習(xí)算法直接控制微型燃?xì)廨啓C和儲能設(shè)備的輸出功率來抑制頻率波動,為未來微電網(wǎng)的應(yīng)用提供了理論依據(jù)。
本文研究了由光伏發(fā)電、負(fù)荷需求、儲能系統(tǒng)和微型燃?xì)廨啓C組成的微電網(wǎng),如圖1所示。
圖1 微電網(wǎng)結(jié)構(gòu)
等效微型燃?xì)廨啓C、儲能系統(tǒng)和電力系統(tǒng)的傳遞函數(shù)分別為G(t)、Ge、Gp,公式如下:
(1)
式中:Tt、Te、Tp分別為微型燃?xì)廨啓C、儲能設(shè)備和系統(tǒng)慣性的時間常數(shù);kp為電力系統(tǒng)的增益系數(shù)。
定義x(t)=[Δf(t),ΔPt(t),ΔPe(t)]T∈m作為初始狀態(tài)為x(0)的微電網(wǎng)的狀態(tài)向量。式中:Δf(t)為頻率偏差;ΔPt(t)為微型燃?xì)廨啓C的頻率輸出;ΔPe(t)為儲能設(shè)備的功率輸出。
頻率動力學(xué)可以描述如下:
(2)
(3)
(4)
式中:Δpl(t)為負(fù)荷變化;Δpp(t)為光伏發(fā)電產(chǎn)生的不確定性;R為調(diào)速系數(shù);ut(t)為微型渦輪機的控制信號;ue(t)為儲能設(shè)備的控制信號。微電網(wǎng)的頻率動力學(xué)可以用以下形式表示:
(5)
(6)
(7)
(8)
式中:A為系統(tǒng)矩陣;B為控制矩陣;u(t)=[ut(t),ue(t)]T∈n為控制輸入;Π(t)表示光伏發(fā)電以及負(fù)荷的不確定性。
微電網(wǎng)中儲能設(shè)備的主要作用是抑制由光伏發(fā)電和負(fù)荷不確定性引起的頻率波動,對于該場景下的儲能設(shè)備具有如下荷電狀態(tài)限制:
(9)
(10)
其余情況時:
Soc(t+1)=Soc(t)
(11)
在調(diào)頻過程中,考慮負(fù)載和光伏發(fā)電功率的不確定性,利用儲能設(shè)備智能充放電來抑制該不確定性,具體調(diào)頻過程如圖2所示。
圖2 微電網(wǎng)頻率調(diào)節(jié)過程
本文設(shè)計了一種基于負(fù)荷變化和光伏發(fā)電不確定性引起的功率不確定性的微電網(wǎng)頻率智能控制策略,采用增強學(xué)習(xí)算法進(jìn)行調(diào)節(jié),并由神經(jīng)網(wǎng)絡(luò)實現(xiàn)。
微電網(wǎng)Δf(t),ΔPt(t),ΔPe(t)的狀態(tài)均為頻率控制器的輸入端。
所研究的微電網(wǎng)的頻率動態(tài)用式(5)表示,對于頻率控制,設(shè)計了一個狀態(tài)反饋控制律u(t)來調(diào)節(jié)微型燃?xì)廨啓C和儲能設(shè)備的功率輸出,通過對不確定系統(tǒng)的頻率最優(yōu)控制,可以得到對不確定頻率動力系統(tǒng)式(5)的魯棒控制,并表示為
(12)
對于系統(tǒng)式(12),通過最小化代價函數(shù)設(shè)計了控制律u(t)。
(13)
式中:U(x(t),u(t))為效用函數(shù),U(x(t),u(t))=xT(t)Qx(t)+uT(t)Ru(t);Q,R為具有適當(dāng)維數(shù)的正定對稱矩陣。
最優(yōu)代價函數(shù)定義為
(14)
基于貝爾曼最優(yōu)性原理,可以得到哈密頓函數(shù)為
+U(x(t),u(t))
(15)
最優(yōu)控制律u*(t)滿足哈密頓-雅可比-貝爾曼方程。
(16)
式中:Ωc為1個可接受的控制集。
由此可以推斷出系統(tǒng)式(12)的最優(yōu)頻率控制律為
(17)
將最優(yōu)控制律式(17)代入(16),然后將HJB方程進(jìn)一步轉(zhuǎn)化為以下形式。
(18)
最優(yōu)HJB方程符合0=H(x(t),u*(t),?J*(x)),u*(t)為最優(yōu)控制律。
一般來說,由于式(18)中存在偏微分項,幾乎不可能直接求解,因此,利用迭代算法得到了最優(yōu)控制律u*(t)和最優(yōu)代價函數(shù)J*(x)的近似解。迭代算法流程如下:
a.初始化
設(shè)置迭代索引i=0,并讓J(i)(x)=0。定義一個足夠小的正數(shù)ε作為停止該算法的先決條件,從一個初始可接受的控制律u(0)(t)開始迭代。
b.迭代過程
在第1次迭代過程中,用J(0)(x)=0將初始值u(0)(t)代入式(18),然后,J(i+1)(x)可以用式(19)表示:
0=(?J(i+1)(x))T(Ax(t)+Bu(i)(t))+U(x(t),u(i)(t))
(19)
c.更新控制律
根據(jù)式(20)更新控制律u(i+1)(t)。
(20)
d.停止條件
在此迭代過程中,迭代控制律u(i+1)(t)近似收斂到最優(yōu)控制律u*(t),隨著迭代指數(shù)足夠大,迭代代價函數(shù)J(i+1)(x)也收斂到最優(yōu)值J*(x)。
假設(shè)存在權(quán)值W1,使得J(x)被一個神經(jīng)網(wǎng)絡(luò)近似為
(21)
式中:φ1(x):n→N為激活函數(shù)向量;N為隱層神經(jīng)元數(shù);ε(x)為神經(jīng)網(wǎng)絡(luò)近似誤差。選擇激活函數(shù)以提供一個完整的基集,使J(x)及其導(dǎo)數(shù)一致。
(22)
神經(jīng)網(wǎng)絡(luò)權(quán)值W1未知,那么神經(jīng)網(wǎng)絡(luò)的輸出為
(23)
U(x(t),u*(t))=e1
(24)
利用神經(jīng)網(wǎng)絡(luò)近似方法可以得到系統(tǒng)式(12)的近似最優(yōu)控制律。
(25)
(26)
通過最小化平方誤差,權(quán)值更新定律可以設(shè)計為
(27)
式中:γc>0為評價網(wǎng)絡(luò)的主要學(xué)習(xí)速率;γa>0為輔助學(xué)習(xí)速率;Js(x)=0.5xT(t)x(t)是根據(jù)李雅普諾夫定理選擇的。
因此,利用權(quán)值更新定律可以得到評價網(wǎng)絡(luò)的估計權(quán)值,可以為系統(tǒng)提供頻率控制律。
根據(jù)圖2給出的微電網(wǎng)日前調(diào)度曲線,對微電網(wǎng)模型進(jìn)行仿真,抑制光伏發(fā)電及負(fù)荷不確定性引起的頻率波動,提高微電網(wǎng)供電可靠性。在頻率調(diào)節(jié)中考慮儲能設(shè)備的功率約束,微電網(wǎng)參數(shù)如下:Tt=0.2,Te=0.7,Tp=9,kp=1,R=0.1,儲能設(shè)備功率約束見表1。
表1 儲能設(shè)備功率約束
由于光伏電源連接到微電網(wǎng),本文考慮了光照和溫度2個影響光伏功率的主要因素,受環(huán)境影響的光伏發(fā)電不確定性如圖3所示。同時,考慮了實際負(fù)荷需求的不確定性,如圖4所示。
圖3 光伏發(fā)電不確定度
圖4 負(fù)荷變化干擾
在智能頻率控制中,所使用的參數(shù)如下:Q=2.5×I3×3,R=2.5×I2×2,γc=0.9,γa=0.15,其中I為單位矩陣。根據(jù)系統(tǒng)數(shù)據(jù),可以得到評價網(wǎng)絡(luò)的權(quán)值,如圖5所示。
根據(jù)頻率控制器在隨機干擾激勵下,頻率偏差Δf(t)、微型燃?xì)廨啓C功率輸出ΔPt(t)和儲能設(shè)備功率輸出ΔPe(t)的變化誤差最終收斂為零,如圖6所示,即通過神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程。至此,微電網(wǎng)智能頻率控制策略訓(xùn)練過程完畢。
圖5 在訓(xùn)練過程中的權(quán)重更新律
圖6 微電網(wǎng)系統(tǒng)的狀態(tài)收斂
儲能設(shè)備在該控制策略中應(yīng)用于整個微電網(wǎng)頻率調(diào)節(jié)過程,維持微電網(wǎng)頻率穩(wěn)定,提高了微電網(wǎng)供電可靠性。
本文研究了具有光伏發(fā)電和負(fù)荷不確定性的微電網(wǎng)頻率控制問題,設(shè)計了一種基于增強學(xué)習(xí)算法的智能控制策略,并由神經(jīng)網(wǎng)絡(luò)實現(xiàn),通過調(diào)節(jié)微型燃?xì)廨啓C和儲能設(shè)備的功率輸出,抑制微電網(wǎng)頻率波動,可有效提高供電可靠性,增加用戶用電滿意度。仿真結(jié)果顯示,所提出的智能頻率控制策略能夠較好地調(diào)整頻率波動。在未來,可以考慮微電網(wǎng)的拓?fù)浣Y(jié)構(gòu),將該控制策略應(yīng)用于更多場景。