馬 瓊,馬 雷,汪佐浩,張 浩
(1.國網(wǎng)臨夏供電公司,甘肅臨夏 731100;2.西安理工大學(xué)水利水電學(xué)院,陜西西安 710048)
光伏發(fā)電系統(tǒng)因其分布靈活、可靠性高的特點(diǎn)在推動(dòng)電源結(jié)構(gòu)清潔化進(jìn)程中擁有較強(qiáng)的競爭力,是實(shí)現(xiàn)我國“碳達(dá)峰、碳中和”戰(zhàn)略目標(biāo)及推動(dòng)構(gòu)建以新能源為主體的新型電力系統(tǒng)的重要支撐技術(shù)之一[1-2]。然而,光伏輸出功率較強(qiáng)的隨機(jī)性、間歇性與非平穩(wěn)特性給光伏發(fā)電系統(tǒng)進(jìn)一步的集成應(yīng)用帶來巨大挑戰(zhàn)[3-5]。穩(wěn)定可靠的預(yù)測技術(shù)對于電網(wǎng)適應(yīng)高比例新能源接入與構(gòu)建健全的電力系統(tǒng)風(fēng)險(xiǎn)防控機(jī)制具有重要意義。
傳統(tǒng)光伏功率預(yù)測的研究大都致力于建立輸出更接近預(yù)測對象真實(shí)測量值的確定性預(yù)測模型,即輸出預(yù)測對象未來某時(shí)刻的單點(diǎn)期望值[6]。然而,確定性預(yù)測結(jié)果缺乏對光伏發(fā)電功率不確定性信息的描述,使得能源系統(tǒng)設(shè)計(jì)規(guī)劃、電網(wǎng)調(diào)度、電力市場等場景決策者難以在實(shí)際工程實(shí)踐中做出最優(yōu)決策。因此,需要更為全面的預(yù)測信息以在最大程度上提高實(shí)踐中應(yīng)對光伏出力不確定性的能力。在這種情況下,概率預(yù)測理論開始逐漸得到關(guān)注。
概率預(yù)測是應(yīng)對光伏出力高度不確定及可變性的一種解決方案,通過量化隨機(jī)過程不確定性,以概率密度、分位數(shù)、預(yù)測區(qū)間或綜合形式發(fā)布預(yù)測結(jié)果,提供待預(yù)測對象完整的概率統(tǒng)計(jì)信息。近年來,越來越多的光伏發(fā)電應(yīng)用場景將能源不確定性納入決策制定的考慮范圍,如分布式能源系統(tǒng)設(shè)計(jì)規(guī)劃、能源管理系統(tǒng)(energy management system,EMS)優(yōu)化調(diào)度、電力市場交易等,這就需要穩(wěn)定、可靠、準(zhǔn)確的功率概率分布信息提供數(shù)據(jù)支撐。概率預(yù)測在提高可再生能源占比、能源利用率及能源系統(tǒng)彈性性能中發(fā)揮重要作用。
概率預(yù)測方法按照采用模型的不同可分為物理方法、統(tǒng)計(jì)學(xué)方法、人工智能方法、組合方法等。劉潔等基于高階馬爾可夫鏈和高斯混合模型進(jìn)行建模,計(jì)算得到光伏出力概率密度函數(shù)[8]。王開艷等基于氣象特征數(shù)據(jù),采用模糊C 均值聚類方法進(jìn)行相似日劃分,利用分位數(shù)回歸及卷積神經(jīng)網(wǎng)絡(luò)(CNN)與雙向長短記憶神經(jīng)網(wǎng)絡(luò)算法(BiLSTM)建立了QRCNN-BiLSTM 光伏功率短期概率預(yù)測模型[9]。盡管這些方法都取得了一定程度的效果,然而他們要么過于復(fù)雜難以在實(shí)踐中應(yīng)用,要么基于一些在實(shí)際應(yīng)用中難以驗(yàn)證的假設(shè)。
隱馬爾可夫模型(hidden Markov model,HMM)基于少量非限制性假設(shè),描述雙隨機(jī)過程非線性動(dòng)力學(xué)特性,被廣泛應(yīng)用于故障診斷、信號識別、氣象預(yù)測等領(lǐng)域[10]。由于光伏發(fā)電過程與氣象變化過程均為隨機(jī)過程,理論上只要確定狀態(tài)空間與觀測空間,便可使用HMM 很好地描述兩者的關(guān)系。同時(shí),非齊次HMM 允許隱藏狀態(tài)受到相關(guān)協(xié)變量的作用,考慮了時(shí)間尺度的影響,能更好地描述研究對象與復(fù)雜作用因素關(guān)系。
鑒于此,本文提出基于多觀測非齊次HMM 的光伏出力概率預(yù)測模型。首先,介紹了傳統(tǒng)HMM 的基礎(chǔ)原理及多觀測非齊次HMM 的推導(dǎo)與基礎(chǔ)問題的求解。接著,引入百分比離散參數(shù)建立光伏出力及相關(guān)氣象參數(shù)離散有限集合,即建模所需的狀態(tài)空間與觀測空間?;谡鎸?shí)光伏電站運(yùn)行數(shù)據(jù)建立出力概率預(yù)測模型,輸出未來各時(shí)刻點(diǎn)光伏出力概率分布信息。最后,通過與傳統(tǒng)HMM、單/多觀測非齊次HMM 模型、支持向量機(jī)模型(support vector machine,SVM)的比較對所提出模型的可行性與預(yù)測性能進(jìn)行了分析驗(yàn)證。
圖1 展示了隱馬爾可夫過程示意圖,st-1,st,st+1分別表示在t-1、t、t+1 連續(xù)時(shí)刻下狀態(tài)值,相對應(yīng)的ot-1,ot,ot+1分別為各時(shí)刻下的觀測值。
圖1 隱馬爾可夫過程
狀態(tài)值與觀測值分別屬于對應(yīng)的狀態(tài)空間與觀測空間。使用Q與V分別表示HMM 的狀態(tài)空間與觀測空間:
式中:N與M分別為可能存在的狀態(tài)與觀測數(shù)量。
隱馬爾可夫模型可以表示為:
式中:A與B分別表示狀態(tài)轉(zhuǎn)移概率矩陣與觀測概率矩陣;π為初始狀態(tài)概率向量。
式中:aij為從t時(shí)刻狀態(tài)為qi轉(zhuǎn)移到t+1 時(shí)刻狀態(tài)為qj的概率;bi(k)為t時(shí)刻在狀態(tài)為qi情況下產(chǎn)生觀測值vk的概率;πi為初始處在狀態(tài)qi的概率。
傳統(tǒng)的隱馬爾可夫模型有兩個(gè)基本假設(shè):
(1)齊次馬爾可夫性質(zhì)。對于狀態(tài)序列而言,任意時(shí)刻狀態(tài)只與前一個(gè)狀態(tài)有關(guān),與其他時(shí)刻的狀態(tài)和觀察無關(guān)。
(2)觀測獨(dú)立假設(shè)。對于觀測序列而言,任意時(shí)刻觀察只取決于同一時(shí)刻狀態(tài)值,而與其他時(shí)刻觀察與狀態(tài)無關(guān)。
如圖2 所示,本文將傳統(tǒng)HMM 擴(kuò)展為擁有σ 階記憶馬爾可夫鏈的非齊次HMM,即未來狀態(tài)的條件概率分布取決于過去的σ個(gè)狀態(tài),同時(shí)引入多觀察序列,記為σ-MOHMM。
圖2 σ階多觀測隱馬爾可夫模型(σ-MOHMM)
本文采用最大似然估計(jì)(maximum likelihood estimate,MLE)、前向后向算法及近似算法來解決光伏概率預(yù)測模型建立過程中的學(xué)習(xí)問題與預(yù)測問題。對于HMM,使用MLE 方法得到其轉(zhuǎn)移概率與觀測概率,可以表示為:
式中:nij為數(shù)據(jù)集中由狀態(tài)qi向狀態(tài)qj轉(zhuǎn)移的個(gè)數(shù);nik為在狀態(tài)qi下觀測為vk的個(gè)數(shù)。
對于有N個(gè)狀態(tài)M個(gè)觀測的HMM,狀態(tài)轉(zhuǎn)移概率組成N×N矩陣,觀測概率組成N×M矩陣,矩陣的每一行元素的總和為1,如圖3 所示。
圖3 概率矩陣
σ-MOHMM 的轉(zhuǎn)移概率與觀測概率矩陣:
高階HMM 概率矩陣的維度隨之增加,圖4 展示了二階狀態(tài)轉(zhuǎn)移概率矩陣,為N×N×N的矩陣。
圖4 二階狀態(tài)轉(zhuǎn)移概率矩陣
預(yù)測問題是指在給定模型λ 及一定時(shí)間段的觀測序列O(d),計(jì)算最有可能出現(xiàn)的狀態(tài)序列。對于σ-MOHMM,其前向后向概率可以由以下步驟計(jì)算:
(1)計(jì)算初值:
式中:α與β分別表示前向概率與后向概率。
(2)迭代計(jì)算:
(3)最終,t時(shí)刻處于狀態(tài)qj的概率可以表示為:
光伏電站的額定功率決定了其最大出力的理論值。用Pn表示光伏電站額定功率,則狀態(tài)空間區(qū)間可以表示為[0,Pn]。同理,用Rn表示理論最大觀測值,則觀測空間區(qū)間可以表示為[0,Rn]。參數(shù)離散化后得到的狀態(tài)空間與觀測空間的可以表示為:
式中:θ為百分比參數(shù),θ×Pn與θ×Rn分別為狀態(tài)空間與觀測空間的數(shù)據(jù)間隔。
本文采用以下兩種方式計(jì)算確定性預(yù)測結(jié)果:
(1)均值
(2)眾數(shù)
置信度1-μ下預(yù)測區(qū)間可以表示為:
采用歸一化均方根誤差(NRMSE)作為確定性預(yù)測評價(jià)指標(biāo),計(jì)算方式如下:
式中:T為觀測序列長度,即待預(yù)測點(diǎn)個(gè)數(shù);st為t時(shí)刻實(shí)測狀態(tài)值;為t時(shí)刻預(yù)測狀態(tài)值;Pn為光伏電站額定出力。
概率預(yù)測區(qū)間一般從可靠性、銳度兩個(gè)方面進(jìn)行評價(jià)??煽啃灾笜?biāo)用來描述預(yù)測分布與預(yù)測對象實(shí)際分布的接近程度。采用預(yù)測區(qū)間覆蓋率PICP來描述預(yù)測區(qū)間的可靠性,PICP越接近實(shí)際置信度(1-μ)%則代表預(yù)測結(jié)果有更好的可靠性,計(jì)算方式如下:
銳度指標(biāo)用于衡量概率預(yù)測結(jié)果集中于實(shí)際值的程度。采用Winkler 分?jǐn)?shù)(SW)描述模型銳度性能,SW越小則預(yù)測結(jié)果有更好的銳度性能與綜合性能,計(jì)算方式如下:
本文基于國內(nèi)某光伏電站時(shí)間跨度為2 年的光伏出力及氣象參數(shù)數(shù)據(jù),電站額定出力20 MW,最大短波輻射810 W/m2,最小潛熱通量-450 W/m2,數(shù)據(jù)步長為15 min,有效數(shù)據(jù)698 d。表1 展示了光伏出力與各氣象參數(shù)皮爾遜相關(guān)性系數(shù)關(guān)系,選取與光伏出力具有較強(qiáng)相關(guān)性的總輻照度與潛熱通量作為觀測變量。由此得到狀態(tài)空間與兩個(gè)觀測空間區(qū)間分別為狀態(tài)空間A=[0,20],觀測空間B1=[0,810]與B2=[-420,0],離散參數(shù)θ為1%。
表1 光伏出力與氣象參數(shù)皮爾遜相關(guān)性系數(shù)表
圖5 展示了傳統(tǒng)HMM 模型的狀態(tài)轉(zhuǎn)移概率矩陣直方圖??梢钥闯?,轉(zhuǎn)移概率分布在矩陣的對角線上,同時(shí)由兩側(cè)對角線向內(nèi)逐漸衰減,表明出力數(shù)據(jù)步長滿足連續(xù)時(shí)間物理過程的近似表示。圖6 展示了觀測概率矩陣直方圖,相較于狀態(tài)轉(zhuǎn)移概率矩陣更為分散。這意味著同一氣象參數(shù)值對應(yīng)多個(gè)光伏出力,從側(cè)面印證了光伏發(fā)電是一個(gè)受到多因素共同作用的復(fù)雜隨機(jī)過程。
圖5 狀態(tài)轉(zhuǎn)移概率矩陣圖
圖6 觀測概率矩陣圖
基于待預(yù)測時(shí)間段的氣象預(yù)測序列,通過計(jì)算前向后向算法得到各時(shí)刻點(diǎn)對應(yīng)出力概率分布。如圖7 所示,結(jié)果概率分布是一個(gè)T×N矩陣,即每個(gè)時(shí)刻下對應(yīng)N個(gè)狀態(tài)的概率分布。基于此,可以得到各時(shí)刻點(diǎn)確定性預(yù)測結(jié)果及不同置信度下預(yù)測區(qū)間,如圖8 所示。
圖7 預(yù)測結(jié)果概率分布圖
圖8 光伏出力概率預(yù)測與確定性預(yù)測結(jié)果
本節(jié)將對傳統(tǒng)HMM、2-HMM 以及2-MOHMM 三個(gè)概率預(yù)測模型的概率預(yù)測性能,以及與SVM 模型確定性預(yù)測性能進(jìn)行對比分析。其中,SVM 模型選取徑向基核函數(shù),正則化參數(shù)為200,核參數(shù)為10。按照以下步驟對上述各個(gè)模型進(jìn)行交叉實(shí)驗(yàn):(1)隨機(jī)選取三天數(shù)據(jù)作為測試集,其余數(shù)據(jù)用于模型訓(xùn)練。(2)訓(xùn)練好的模型輸出90%置信度預(yù)測區(qū)間與確定性預(yù)測,同時(shí)記錄保存模型評價(jià)指標(biāo)計(jì)算結(jié)果。(3)重復(fù)(1)(2)步驟,直至達(dá)到設(shè)定閾值。(4)對指標(biāo)進(jìn)行統(tǒng)計(jì)分析,得到預(yù)測性能指標(biāo)分布。
通過測試發(fā)現(xiàn),當(dāng)閾值達(dá)到1 000 次之后,各模型預(yù)測性能指標(biāo)分布趨于穩(wěn)定,因此選擇測試迭代次數(shù)1 000。圖9 與圖10 分別展示了概率預(yù)測性能統(tǒng)計(jì)結(jié)果與確定性預(yù)測性能統(tǒng)計(jì)結(jié)果,以概率密度直方圖形式進(jìn)行展示,陰影部分為概率分布的核密度估計(jì)。
圖9 光伏出力概率預(yù)測性能指標(biāo)統(tǒng)計(jì)圖
圖10 光伏出力確定性預(yù)測性能指標(biāo)統(tǒng)計(jì)圖
由圖9 可以看出,概率預(yù)測性能隨著馬爾可夫鏈階數(shù)的提升有明顯的提高,具體表現(xiàn)為可靠性指標(biāo)PICP 分布明顯右移,更接近實(shí)際置信度,擁有更好可靠性。同時(shí),區(qū)間分?jǐn)?shù)SW隨著階數(shù)δ的提升逐漸減小,說明概率預(yù)測模型銳度及綜合性能的提升。另一方面,多觀測變量的引入對概率預(yù)測模型的可靠性與銳度性能有促進(jìn)作用。
對于確定性預(yù)測結(jié)果的輸出而言,均值法相較于眾數(shù)法擁有更準(zhǔn)確的點(diǎn)預(yù)測輸出,指標(biāo)分布偏向于更小的NRMSE。與概率預(yù)測性能類似,階數(shù)的提升及雙觀測變量對模型的確定性預(yù)測性能有明顯提升。傳統(tǒng)HMM 模型確定性預(yù)測性能與SVM 模型接近,擴(kuò)展后的2-HMM 與2-MOHMM 均明顯優(yōu)于SVM。
本文將隱馬爾可夫模型擴(kuò)展并應(yīng)用于短期光伏發(fā)電功率預(yù)測,包括不同置信水平的概率預(yù)測區(qū)間及通過統(tǒng)計(jì)方法得到確定性預(yù)測結(jié)果。首先通過確定相關(guān)參數(shù)邊界及對其離散化處理獲得狀態(tài)空間和觀測空間,接著基于真實(shí)運(yùn)行數(shù)據(jù)建立HMM 概率預(yù)測模型,輸出未來時(shí)刻點(diǎn)光伏功率概率分布信息?;谡鎸?shí)光伏電站兩年共計(jì)698 d 運(yùn)行數(shù)據(jù)對傳統(tǒng)HMM、單觀測二階HMM、雙觀測二階HMM 以及支持向量機(jī)SVM 四種模型進(jìn)行了交叉模擬預(yù)測實(shí)驗(yàn)。通過統(tǒng)計(jì)分析比較各個(gè)模型預(yù)測性能指標(biāo)證實(shí)了基于HMM 的光伏概率預(yù)測模型的可行性與有效性。同時(shí),考慮歷史狀態(tài)和觀測對當(dāng)前觀測和狀態(tài)的影響對HMM 模型確定性預(yù)測及區(qū)間預(yù)測性能都有明顯提升。