魏 偉, 李永勝, 程 逍, 孫立時, 朵向陽, 吳卓青
(1. 鄭州大學 能源環(huán)境經(jīng)濟研究中心, 鄭州 450001; 2. 青海省電力公司 海東供電公司, 青海 海東 810600; 3. 國家電網(wǎng)有限公司 國家電力調(diào)度控制中心, 北京 100031; 4. 大連理工大學 系統(tǒng)工程研究所, 遼寧 大連 116024)
近年來,隨著能源革命的深入推進,多行業(yè)在能源消費理念和消費方式方面發(fā)生了深刻變化,使得用能和新興負荷逐年增加[1].電網(wǎng)需要響應市場需求提供多樣化、個性化和互動化服務,與此同時還面臨頻率快速下跌、電能難以存儲和備用容量嚴重不足的問題[2].然而傳統(tǒng)電源調(diào)度提升空間越來越小,新興能源特性決定其無法為系統(tǒng)提供穩(wěn)定的備用容量,但用戶側(cè)存在大量柔性負荷可供調(diào)度[3].
當前對于負荷特性的研究主要從兩方面展開,分別是用戶負荷特性的基本特點研究和電力用戶分類研究.在用戶負荷特性的基本特點研究方面,主要從時間、季節(jié)、政策等角度分析電力負荷特性,但尚未形成針對各類電力用戶負荷特性開展的系統(tǒng)性分析方法[4-5].而在電力用戶分類研究方面,主要包括三大類:基于距離的聚類算法、基于密度的聚類方法以及基于互連性的聚類算法.Li等[6]提出一種可以對智能電表端大數(shù)據(jù)進行精確處理的多分辨率聚類算法;陳建楓等[7]提出改進聚類算法,通過對需求側(cè)負荷曲線分析獲得數(shù)個典型用電特性曲線,確定負荷分類用以代替一般用戶電力特性分析;袁兆祥等[8]提出一種基于DBSCAN聚類算法的電力工程完整性分析方法,對于提高電力工程數(shù)據(jù)的完整性及分析用戶的用電情況均具有較好的參考價值;蘇適等[9]提出了一種基于密度空間聚類和引力搜索算法的用戶用電模式分類模型;胡昌斌等[10]提出了使用模糊C均值聚類將電網(wǎng)用戶的用電數(shù)據(jù)聚類為不同的用電模式.
目前已有研究采用多聚類融合的方法識別用電負荷模式,如林錦波[11]提出了基于聚類融合的負荷曲線聚類方法;Wang等[12]提出一種基于特征指標降維和改進熵權(quán)法的電力負荷模式識別解決方案,在運行效率和分類準確率上具有一定優(yōu)勢.然而聚類融合方法是在已知采樣數(shù)據(jù)基礎上進行的多視角模型融合研究,忽略了采樣數(shù)據(jù)本身各個視角中的內(nèi)部度量信息,難以克服不同特征的量綱差異及分布不一致問題.
本文基于采樣數(shù)據(jù)不同視角,從數(shù)據(jù)層融合角度提出了基于多視角網(wǎng)絡融合學習的典型用電負荷模式挖掘方法,并通過兩類不同行業(yè)的實際用電負荷數(shù)據(jù)論證了該方法的穩(wěn)定性,識別了最具代表性用電負荷模式.
本研究中,典型用電負荷模式挖掘研究流程共包含5個關(guān)鍵過程,如圖1所示.
1) 根據(jù)電網(wǎng)用戶基本信息及用戶用電量數(shù)據(jù),按照每周7天進行多視角數(shù)據(jù)獲取和預處理;
2) 根據(jù)3個層次數(shù)據(jù),選擇合適的度量方法計算出配對的相似度矩陣;
3) 根據(jù)3個相似度矩陣的最近鄰信息,使用多視角相似度網(wǎng)絡融合方法計算相似度矩陣;
4) 基于多視角融合相似度矩陣分別進行每周7天的譜聚類分析;
5) 根據(jù)用戶每周7天的聚類結(jié)果,生成用戶間的共現(xiàn)矩陣,識別用戶典型負荷模式.
當前用電負荷采集點采樣頻率為每日96次,數(shù)據(jù)粒度較為細致,單次采樣數(shù)值變化不大,導致聚類得到的各個簇的輪廓不明顯.若每日僅采集4次,數(shù)據(jù)粒度過大,導致聚類得到的各個簇存在較大差異.本文兼顧多粒度視角,根據(jù)96次采樣數(shù)據(jù)合并出每日24次采樣數(shù)據(jù)及每日4次采樣數(shù)據(jù).
本文分別采集教育行業(yè)與房地產(chǎn)行業(yè)從2017年1月1日至2017年1月31日連續(xù)一個月的用電數(shù)據(jù).以每日96次采樣數(shù)據(jù)為例,采樣數(shù)據(jù)周期按照周一到周日的順序,其天數(shù)分別表示為:n1,n2,…,n7.按照周一到周日,將用戶采樣時間周期內(nèi)的數(shù)據(jù)劃分為7個數(shù)據(jù)集data961,data962,…,data967.
合并后的全月用電采樣數(shù)據(jù)表示為
Dp={data961,data962,…,data967}
同理將每類24次采樣數(shù)據(jù)和每類4次采樣數(shù)據(jù)合并后,分別表示為Dh與Ds.
本文采用歐式距離度量用戶i采樣數(shù)據(jù)xi和用戶j采樣數(shù)據(jù)xj之間的距離,即
(1)
然后采用歸一化指數(shù)相似度方法計算用戶i和用戶j之間的相似度,即
(2)
式中:μ為一個經(jīng)驗值為(0.3,0.8)的超參數(shù),通常選取0.5;εi,j為縮放比例參數(shù).最終輸出3個采樣視角的相似度矩陣,分別為Wp,Wh和Ws.
在對多個相似度矩陣進行融合時,可以使用線性權(quán)重加權(quán)法或者非線性融合方法.然而前者對于權(quán)重的選擇依賴專家經(jīng)驗和大量實驗,而非線性融合方法在集成不同視角相似度網(wǎng)絡上具備優(yōu)勢,對噪聲和數(shù)據(jù)異質(zhì)性具有更好的魯棒性[13-15],故本文采用多視角相似度網(wǎng)絡融合方法將3個層次的相似度網(wǎng)絡融合成一個網(wǎng)絡.
將n個用戶之間的相似網(wǎng)絡定義為一個圖G=(V,E),其中頂點V表示用戶,邊E表示用戶之間的相似關(guān)系.相似度網(wǎng)絡融合方法的步驟為:
(3)
2) 計算k個最相似用戶的相似度.使用Ni表示用戶i在圖G中的鄰居個數(shù),采用K近鄰方法計算用戶i與其k個最近鄰用戶間的相似度,并且保證非相鄰點之間的相似度為0.用戶i與用戶j的用電行為融合相似度S(i,j)為
(4)
(5)
譜聚類是將全部樣本點看成網(wǎng)絡中的結(jié)點,這些點可以用邊進行連接,通過對所有結(jié)點組成的圖進行切圖,使得不同子圖間的邊權(quán)之和較低,子圖內(nèi)的邊權(quán)之和較高,從而達到聚類目的.譜聚類是基于圖的聚類,故本文使用譜聚類算法來挖掘用電負荷模式.
聚類方法的評價指標包括外部評價和內(nèi)部評價.外部評價是指將聚類結(jié)果與帶有真實類別標簽的數(shù)據(jù)進行比較;內(nèi)部評價則是在真實類別標簽數(shù)據(jù)未知情況下的一種評估指標,常見的評價指標為內(nèi)平方和、外平方和與輪廓評分.本文使用綜合指標和輪廓評分對聚類結(jié)果進行評價,綜合指標計算公式為
(6)
式中:WSS為相同聚類內(nèi)部樣本之間的不相似度,該值越小越好;BSS為不同聚類間樣本的不相似度,該值越大越好.綜合指標Φ越接近于1,表示聚類效果越好.輪廓評分s(i)用以衡量聚類的一致性,數(shù)值在[-1,1]之間,越接近于1越好,其計算公式為
(7)
式中:a(i)為樣本i的簇內(nèi)不相似度;b(i)為樣本i的簇間不相似度.
按照周一到周日7類分別計算用戶的融合相似度矩陣,然后使用譜聚類得到所有用戶7類的聚類結(jié)果,即第1類(周一)的聚類結(jié)果為C11,C12,…,C1K1,第2類(周二)的聚類結(jié)果為C11,C12,…,C1K2,其中K1和K2分別為周一和周二聚類后簇的數(shù)目.用戶i和j在一周內(nèi)聚類結(jié)果相同的次數(shù)可以采用共現(xiàn)度進行度量,形式化定義為
(8)
(9)
式中,K′為周一到周日的聚類后簇數(shù)目.
本文假定兩個用戶在一周中如果有4 d以上時間同屬于一個簇,則認為其具有相似的典型用電負荷模式,即CoP(i,j)≥4/7,然后對所有的用戶進一步劃分,并將每一類模式中入度最高的用戶作為代表進行典型用電負荷模式分析.
本文采集了江蘇省59家教育機構(gòu)和41家房地產(chǎn)機構(gòu)2017年1月份的用電負荷數(shù)據(jù),以每日96次進行數(shù)據(jù)采樣.其中用戶基本信息包括:用戶ID、用戶名稱、供電機構(gòu)、電壓等級、用戶行業(yè)類別、用戶用電目的、用戶用電量、專變數(shù)量、專變總供電量以及經(jīng)緯度等數(shù)據(jù).
教育機構(gòu)容量指標中,最大值為235 880 kVA,最小值為5 260 kVA,平均值為29 853 kVA;專變數(shù)量指標中,最大值為63,最小值為2,平均值為13.7;專變總供電量指標中,最大值為71 260 kVA,最小值為2 630 kVA,平均值為14 593 kVA.
房地產(chǎn)機構(gòu)用戶容量指標中,最大值為54 600 kVA,最小值為10 000 kVA,平均值為18 349 kVA;專變數(shù)量指標中,最大值為20,最小值為2,平均值為6.7;專變總供電量指標中,最大值為26 517 kVA,最小值為2 060 kVA,平均值為9 307.4 kVA.
對單視角96次、24次、4次采樣以及融合多視角相似度網(wǎng)絡得到相似度矩陣使用譜聚類算法進行簇的劃分.本文獲得了基于Wp,Wh,Ws和Pall與譜聚類算法相結(jié)合的聚類結(jié)果,以綜合指標和輪廓評分作為評價指標,其結(jié)果如表1所示.由表1可知:實驗中多視角融合聚類效果優(yōu)于單視角聚類,因為使用多視角相似度網(wǎng)絡融合的方法能夠集成多視角互補信息,提升用電用戶的聚類效果;輪廓系數(shù)數(shù)值均大于0.7,表明多視角融合聚類的魯棒性優(yōu)于單視角聚類.
表1 單視角與多視角融合的譜聚類評價結(jié)果Tab.1 Spectral clustering evaluation results based on fusion of single-view and multi-view
根據(jù)多視角相似度網(wǎng)絡融合的相似度矩陣譜聚類結(jié)果,計算各個采樣點在一周內(nèi)被劃分為同一個簇的共現(xiàn)矩陣.本文定義:若一周中2個采樣點有4天及以上同時被劃分到同一個簇內(nèi),則2個采樣點具有較強的關(guān)聯(lián)性.以59個教育機構(gòu)為結(jié)點,若2個教育機構(gòu)之間具有較強關(guān)聯(lián)性則使用邊相連,以教育機構(gòu)間的共現(xiàn)值作為邊權(quán),使用Gephi軟件繪制基于共現(xiàn)矩陣的關(guān)聯(lián)關(guān)系圖.考慮到數(shù)據(jù)中同一教育機構(gòu)具有不同的用電類別,其類別分別為教學教育用電和非居民照明,因此圖形的結(jié)點以“教育機構(gòu)_用電類型”表示.
劃分后教育機構(gòu)擁有5類不同的用電負荷模式,房地產(chǎn)機構(gòu)則擁有3類不同的用電模式.入度越大的點表示該點與其他點的聯(lián)系越緊密,故選擇各個用電負荷模式中入度最高的結(jié)點作為代表點.教育機構(gòu)的代表點為:江蘇省省級機關(guān)房屋建設中心、南京大學、東南大學、南京醫(yī)科大學和中國人民解放軍陸軍工程大學.房地產(chǎn)機構(gòu)的代表點為:江蘇長江物業(yè)管理公司、南京天悅置業(yè)投資顧問公司和江蘇運通房地產(chǎn)開發(fā)有限公司.各個代表點的用電負荷曲線如圖2所示.
圖2 教育機構(gòu)與房地產(chǎn)機構(gòu)典型用電負荷曲線Fig.2 Typical power load curves of education and real estate institutions
利用圖2中教育機構(gòu)5個代表點的用電負荷曲線探究用電負荷趨勢特征,圖2a~e展示了以每日采樣24次的5家代表性教育機構(gòu)周一到周日的用電負荷曲線.5家代表性教育機構(gòu)的用電負荷曲線趨勢基本一致,在12點和18點時間段附近出現(xiàn)兩次用電高峰,驗證了本研究識別的教育機構(gòu)典型用電負荷模式具有較強的穩(wěn)定性,與教育機構(gòu)的作息時間大致相同.差異性分析:5家機構(gòu)中除南京大學用電負荷均在周三達到峰值.而東南大學和南京大學的用電峰值和谷值差異明顯,較容易區(qū)分.南京醫(yī)科大學自12點后到第二天凌晨的用電量較為均衡,波動較小,可能與其醫(yī)科類院校性質(zhì)有關(guān).中國人民解放軍大學自晚上17點后用電量下降較快,可能與其晚上加訓、用電設備較少有關(guān).江蘇省省級機關(guān)房屋建設中心的用電規(guī)律與行政事業(yè)單位較為類似.
圖2f~h展示了以每日采樣24次的3家代表性房地產(chǎn)機構(gòu)周一到周日的用電負荷曲線.從周一到周日,3家代表性房地產(chǎn)機構(gòu)的用電負荷曲線趨勢基本一致,且工作日用電量均高于休息日用電量,且周二到周四的用電量為一周中最高,注冊資本多,規(guī)模較大的公司用電峰值更高.
研究結(jié)果表明,對于教育機構(gòu),供電機構(gòu)可以根據(jù)院校性質(zhì)采取錯峰供電策略以緩解系統(tǒng)備用容量不足問題。針對985類高??梢愿鶕?jù)其峰值和谷值的差異性進行供電,針對軍事院校晚上可以給予較少的供電,針對醫(yī)療性質(zhì)院校需要持續(xù)穩(wěn)定供電,針對行政事業(yè)機關(guān)則按照行政事業(yè)機關(guān)的辦公規(guī)律供電即可.對于房地產(chǎn)機構(gòu),可以根據(jù)公司的注冊資本和規(guī)模大小對其進行分級,進行差異化供電.
本文以多視角用電負荷采樣數(shù)據(jù)作為研究對象,提出了一種基于多視角相似度網(wǎng)絡融合的典型用電負荷模式挖掘方法.針對江蘇省59家教育機構(gòu)和41家房地產(chǎn)機構(gòu)的用電負荷數(shù)據(jù)進行實驗,結(jié)果表明:以簇內(nèi)誤差平方和為聚類效果的評價指標,多視角融合的聚類結(jié)果優(yōu)于各單視角的聚類結(jié)果.通過對各個典型機構(gòu)的基本信息和用電負荷模式趨勢曲線分析,找出了各典型機構(gòu)用電負荷的影響因素。對兩大行業(yè)進行穩(wěn)定性與差異性分析后,為電網(wǎng)公司采用錯峰供電、削峰填谷及采取各種節(jié)能技術(shù)和措施來緩解系統(tǒng)備用容量不足問題提出決策依據(jù).在此基礎上仍可以繼續(xù)研究,例如擴大收集的用電負荷數(shù)據(jù)時間跨度,探究該結(jié)論是否會隨著季節(jié)改變而發(fā)生變化,為電網(wǎng)公司在不同季節(jié)針對不同行業(yè)機構(gòu)供電采取動態(tài)措施提供參考.