馮 侃,邊 輝,陳麗娜,張 洋,王浩強
(國網(wǎng)甘肅省電力公司平?jīng)龉╇姽?,甘肅平?jīng)?744000)
隨著新能源發(fā)電的快速推進,其大量接入電網(wǎng)導致電網(wǎng)規(guī)模不斷擴大,且電力系統(tǒng)中的知識量也呈現(xiàn)爆炸式增長[1-2]。新能源發(fā)電的接入,促進了微網(wǎng)系統(tǒng)的應用。但光伏、風電的出力具有隨機性、間歇性特點,導致其消納能力受限。因此,如何高效管理利用微網(wǎng)中海量數(shù)據(jù)以掌握新能源消納狀況成為了研究熱點[3-4]。
目前,對于電力數(shù)據(jù)的分析已取得了一定的研究成果,如聚類算法、神經(jīng)網(wǎng)絡模型等[5-6];通過不同的算法模型提取數(shù)據(jù)特征并完成數(shù)據(jù)應用,如負荷分類、新能源出力預測等。但關于新能源在微網(wǎng)中的消納分析仍較少,且數(shù)據(jù)分析結(jié)果缺乏可視性,因此該文基于知識圖譜與特征識別技術設計了一種新能源微網(wǎng)消納數(shù)據(jù)分析算法。該算法采用知識圖譜將數(shù)據(jù)轉(zhuǎn)化成圖形結(jié)構(gòu),并利用圖卷積神經(jīng)網(wǎng)絡(Graph Convolutional Networks,GCN)模型學習圖特征,進而根據(jù)圖特征制定相應的微網(wǎng)能量調(diào)控措施。
由于分布式發(fā)電具有傳統(tǒng)大電網(wǎng)所不具備的可再生、分布廣泛等優(yōu)勢,因此微網(wǎng)作為新能源組網(wǎng)的主要形式得到了迅速的發(fā)展,并使分布式電源的并網(wǎng)運行更加便捷[7-8]。將分布式發(fā)電、儲能單元、負荷、電能變換裝置進行整合,從而構(gòu)成一個微網(wǎng)系統(tǒng),其結(jié)構(gòu)如圖1 所示。
圖1 微網(wǎng)結(jié)構(gòu)示意圖
微網(wǎng)中,光伏(Photovoltaic,PV)、風力(Wind Turbine,WT)等新能源發(fā)電通過變換器等裝置轉(zhuǎn)換成交流電并入母線,各種類型的負荷從母線上取電。同時配備儲能裝置,在新能源出力較多時進行存儲,從而減少棄風、棄光現(xiàn)象的發(fā)生;當新能源為負荷供電出力不足時,可通過負荷及儲能裝置的調(diào)節(jié)提升系統(tǒng)的新能源消納能力[9]。
光伏陣列的輸出功率PPV是在標準實驗條件下,考慮到現(xiàn)場實際的光照強度和環(huán)境溫度,所產(chǎn)生的每個光伏板的功率總和。PPV的計算如下:
式中,PPV為光伏板的輸出功率;PSTC為標準實驗條件下的光伏板輸出;η為光伏板的轉(zhuǎn)移效率;DC、DSTC分別為實際和標準實驗條件下的太陽輻射強度;TC、TSTC分別是光伏板的實際溫度和標準測試條件下的溫度。
同樣,風力發(fā)電輸出功率PWT的計算方法如下:
式中,Vw為風速;ρ為空氣密度;A為風車轉(zhuǎn)子的橫截面;γ為功率系數(shù);α為葉片的俯仰角;λ=rω/Vw為包括轉(zhuǎn)子角速度ω的葉尖速比,r為風葉長度。
綜合來看,微網(wǎng)中新能源發(fā)電的出力計算為:
式中,MGi為第i個新能源。
由于PV 和WT 的輸出功率具有隨機性而被視為不可控發(fā)電機組,因此需要明確二者的出力限制,以便進行系統(tǒng)內(nèi)能源的協(xié)同控制并增加新能源的消納。PV 和WT 應滿足的功率約束為:
對于微網(wǎng)中新能源消納數(shù)據(jù)的分析,首先采用知識圖譜將數(shù)據(jù)轉(zhuǎn)化成圖形結(jié)構(gòu);然后利用GCN 模型學習新能源消納的圖特征;最終根據(jù)圖特征制定微網(wǎng)能量調(diào)控措施,例如切負荷或儲能充電等?;谥R圖譜和特征識別的微電網(wǎng)數(shù)據(jù)分析系統(tǒng)架構(gòu),如圖2 所示。
圖2 微電網(wǎng)新能源數(shù)據(jù)分析系統(tǒng)的架構(gòu)
構(gòu)建知識圖譜的原始數(shù)據(jù)來源于微網(wǎng)資源數(shù)據(jù)集,通過抽取知識圖譜實體,并結(jié)合知識融合計算形成三元組,最終保存到知識圖譜庫[10-11]。隨后利用GCN 模型識別圖特征,掌握當下系統(tǒng)的新能源消納情況,并為之后的決策提供條件和依據(jù)。
自2012 年谷歌引入“知識圖譜”概念并推出其第一個版本以來,知識圖譜的研究引起了業(yè)界的廣泛關注[12]。其本質(zhì)上是一種圖結(jié)構(gòu),使用數(shù)據(jù)中的“實體”概念作為節(jié)點,以實體之間的關系為邊,進而形成間接圖。這樣不僅可以集成不同類型實體的特征信息,且還能獲得實體之間不同類型的關系。
“實體-關系-實體”三元組模型可表征為G=(E,R,S),其是知識圖譜常用的表示方式;其中,E、R、S分別表示知識庫中的實體集合、實體間關系集合和三元組集合,即S?E×R×E。三元組主要可體現(xiàn)為兩種形式,分別為“實體-關系-實體”以及“實體-屬性-屬性”。實體身份的編碼值是唯一的,作為知識圖譜的基本元素,其可通過“屬性-屬性值”形式對實體間的特征信息進行記錄;而不同實體間的特征關聯(lián)信息,則由實體之間的關系記錄。
構(gòu)建知識圖譜主要包含知識抽取、融合與應用三步。其中,數(shù)據(jù)庫的知識提取包括實體詞提取和關系詞提取兩部分。
1)實體詞提取:利用長短時記憶網(wǎng)絡(Long Short-Term Memory,LSTM)模型結(jié)合條件隨機場(Conditional Random Fields,CRF)從數(shù)據(jù)庫中提取實體。給定一個單詞特征Xt作為LSTM 記憶單元ct在時間步長t的輸入,從先前隱藏層信息Ht-1和當前輸入特征Xt獲得新記憶信息Ht。
LSTM 的輸入門it、遺忘門ft以及記憶單元ct可表示如下:
式中,ω*與b*分別為各層的權(quán)重和偏置量;δ為激活函數(shù)。
根據(jù)輸入門與遺忘門,可更新記憶單元的信息為:
2)關系詞提取:將數(shù)據(jù)庫中實體之間的關系劃分為預定義的類別,以完成關系提取。與CRF 模型結(jié)合的LSTM 也可用于關系詞提取,并且在最后一個Ht中添加SoFtmax 分類器完成關系分類。
在微網(wǎng)新能源消納知識提取中,首先將數(shù)據(jù)庫中的實體詞進行分割后嵌入到向量中,以提取詞的功率和屬性信息作為特征,即X={X1,X2,…,Xn} 。輸入LSTM 模型得到序列H={H1,H2,…,Hn},然后將序列H輸入CRF 層,計算包含上下文信息的序列以獲得實體注釋序列的最終分類[13];最后,手動構(gòu)建并修改包含頭、關系和尾的三元組集,以生成正確的三元組。
為了提高微網(wǎng)新能源消納數(shù)據(jù)分析的準確性,利用GCN 模型學習微網(wǎng)數(shù)據(jù)知識的圖譜特征[14]。GCN 模型的綜合性能優(yōu)越,能夠直接從任意圖形結(jié)構(gòu)的輸入中自動學習類型特征[15-16],其架構(gòu)如圖3所示。
圖3 GCN架構(gòu)
GCN 層通過將所有相鄰節(jié)點的特征添加到節(jié)點特征來學習圖形拓撲。圖形中的節(jié)點集可作為特征矩陣Ul∈?n×d嵌入,其中n是節(jié)點數(shù),d是節(jié)點特征的維數(shù),l是GCN 的層數(shù);鄰接矩陣B∈?n×n是GCN層的輸入,其對角線元素設置為1。節(jié)點特征Ul+1∈?n×d'由卷積運算函數(shù)更新生成為:
式中,σ為激活函數(shù);為歸一化對稱鄰接矩陣;為變換權(quán)重;T為B∈?n×n的度矩陣。
為驗證文中方法的有效性和可行性,使用Protégé本體建模工具對研究問題進行建模。同時,結(jié)合開源可視化工具、Eclipse 編程工具和MySQL 數(shù)據(jù)庫等組件實現(xiàn)算法性能的驗證。
利用所提算法查詢微網(wǎng)內(nèi)新能源的消納情況,選擇時間段、風力、光伏、雷擊、負荷類型、供需平衡、供大于需以及需大于供這八個搜索條件進行查詢,結(jié)果如圖4 所示。
圖4 微網(wǎng)新能源消納情況查詢結(jié)果
從圖4 中可以看出,基于知識圖譜查詢結(jié)果的查準率和召回率大約分布在85%~95%之間,且均優(yōu)于基于關鍵詞的查詢方法。由于利用知識圖譜進行查詢,可根據(jù)搜索條件的屬性以及與其他實體的關系判定查詢效果,因此較大程度上保證了查詢的準確率。圖4(b)中的第8 個搜索條件為“供需平衡”,基于關鍵詞搜索的方法無法理解,故搜索結(jié)果的召回率僅約為10%,而該文算法能夠獲取屬性關系,得到的召回率約為85%,展現(xiàn)出了知識圖譜技術在語義搜索上的優(yōu)越性。
為了驗證該文算法的性能,采用準確率、召回率、F1 值三個指標評價其與文獻[3]、文獻[6]、文獻[8]中算法的分析結(jié)果。其中,分析測試集內(nèi)2 000 條新能源消納情況記錄數(shù)據(jù)在語料庫中的匹配記錄,并將這2 000 條測試記錄的混淆矩陣取平均值進行統(tǒng)計,結(jié)果如表1 所示。
表1 不同算法的分析結(jié)果對比
從表中可以看出,相對于其他算法,該文算法的分析性能最佳,其準確率、召回率和F1 值分別為91.53%、89.95%和90.81%,均具有明顯優(yōu)勢。這是由于其利用知識圖譜技術,通過加入結(jié)構(gòu)化數(shù)據(jù)信息可以提升分析效果,且GCN 模型能夠更優(yōu)地進行特征識別,便于制定決策。文獻[3]采用改進K-means算法,文獻[6]采用決策樹算法完成數(shù)據(jù)分析,其算法性能較為單一且難以處理復雜的微網(wǎng)數(shù)據(jù),故整體分析效果不佳。而文獻[8]通過求解以新能源成本最小化為目標的優(yōu)化模型,實現(xiàn)數(shù)據(jù)分析及能量的管控。其對于數(shù)據(jù)特征缺乏深入的分析,所以導致整體分析準確率低于90%。
在當今的大數(shù)據(jù)時代,各行業(yè)知識均面臨爆炸式增長。為了更為理想地獲取微網(wǎng)數(shù)據(jù)信息,在深入研究了知識圖譜與特征識別技術的基礎上,該文提出了一種新能源微網(wǎng)消納數(shù)據(jù)分析算法。通過對微網(wǎng)中的新能源消納數(shù)據(jù)進行圖形化處理以后,結(jié)合GCN 模型,最終識別出數(shù)據(jù)的圖特征。實驗結(jié)果表明,所提算法查準率和召回率大約分布在85%~95%,且數(shù)據(jù)分析準確率、召回率及F1 值分別為91.53%、89.95%、90.81%,綜合性能較為理想,可以為后續(xù)研究提供參考。
目前知識圖譜技術在電網(wǎng)中的應用研究尚處于初級階段,且所提算法僅在知識圖譜的知識提取階段進行了技術融合。而在接下來的研究中,將深入分析知識圖譜技術,以進一步提高所提算法的分析性能。