彭明洋,陳曉科,彭發(fā)東,楊強,林金郁,冉楊
(1.廣東電網有限責任公司電力科學研究院,廣東 廣州 510080;2.廣東電網有限責任公司,廣東 廣州 510600;3. 廣東電網有限責任公司潮州供電局,廣東 潮州 521051;4.廣東電網有限責任公司云浮供電局,廣東 云浮 527399)
“十三五”以來,隨著配電網建設改造的推進和新一輪農村電網升級工作的開展以及新型城鎮(zhèn)化速度的加快,市政建設工程量增大,電網建設和改造任務繁重,造成大量的計劃施工及檢修停電。預安排停電仍然是我國停電的主要原因[1],而且造成了相當一部分用戶多次重復停電。挖掘預安排停電影響的關鍵業(yè)務要素,更有針對性地制訂業(yè)務管控策略,減少重復停電次數(shù),是提升配電網供電可靠性的重要突破點。
近年來,隨著智能電網的不斷發(fā)展和配電網智能化水平的不斷提高[2],對電網運行狀態(tài)的數(shù)據(jù)收集技術趨于成熟,機器學習、數(shù)據(jù)挖掘等數(shù)據(jù)科學技術在電網大數(shù)據(jù)分析中的應用越來越受到重視[3-14]?,F(xiàn)階段關于配電網可靠性分析方法的研究中:或受限于數(shù)據(jù)渠道窄、數(shù)據(jù)集成處理能力弱,對配電網投資規(guī)模、網架結構、系統(tǒng)運行、設備運維等領域多源異構數(shù)據(jù)的信息挖掘不足;或針對較為粗糙的總體性指標,采用層次分析法、德爾菲評分法等進行分析,主觀性相對較大[15-22]。劉科研等[16]依據(jù)各類工程單位投資造成的預安排停電量的歷史數(shù)據(jù),設置不同類別工程停電管理水平的可行域上下界,通過對比待評價時間段各類工程單位投資造成的預安排停電量,對預安排停電管理水平進行量化評價。姚忠勝等[17]采用層次分析法和熵權法組合賦權,并引進相關性影響系數(shù),修正計算供電可靠性綜合評價指標。鄭瑜等[21]通過計算項目單位投資造成的停電時戶數(shù),定性研究各類項目投資對配電網可靠性的影響??傮w而言,現(xiàn)有分析方法所進行的相關性分析多為匯總、比對等較為粗糙的方法,只關注各類投資、網架結構等單一領域,導致所反映的配電網預安排停電相關運行可靠性的顆粒度不足,對多領域業(yè)務指標間的多源性協(xié)同作用機制利用不充分,評價結果可能存在不同程度的失真情況;而過分依賴專家經驗的定性討論,也難以深入挖掘多源異構狀態(tài)下的復雜關聯(lián)機制。
為此,本文首先從配電網規(guī)劃建設、系統(tǒng)運行、設備運維等領域出發(fā),選取與預安排停電相關的業(yè)務指標,構建特征指標池,并選取多次預安排停電用戶占比作為預安排重復停電評價指標;再結合業(yè)務分析需求,基于歷史數(shù)據(jù),通過計算皮爾遜線性相關系數(shù)、肯德爾秩相關系數(shù)、斯皮爾曼秩相關系數(shù)對特征指標進行篩選;然后采用彈性網絡算法估計相關業(yè)務指標對預安排重復停電指標的關聯(lián)系數(shù),并計算得到相應的權重系數(shù);最后進行算例分析,以國內某區(qū)域所轄19個供電管理單位的歷史數(shù)據(jù)構建關聯(lián)模型,分析各業(yè)務指標對預安排重復停電的影響權重。
從預安排停電管理現(xiàn)狀來看,每年基建、大修技改投資涉及的電網改造建設、設備檢修類項目是預安排停電需求的主要來源,年度投資規(guī)模很大程度上直接關聯(lián)當年預安排停電需求數(shù)量。為盡可能降低預安排停電的影響,供電企業(yè)不斷完善網架結構,提升轉供電能力,在停電前充分統(tǒng)籌整合停電計劃,減少臨時停電,并采用合環(huán)轉電、不停電作業(yè)等措施。因此,預安排停電相關的影響因素主要來自電網投資規(guī)模、網架結構、系統(tǒng)運行、設備運維等業(yè)務領域,建立預安排重復停電分析模型需要提取預安排停電影響因素特征指標作為自變量指標組合,選取預安排重復停電評價指標作為因變量指標,挖掘業(yè)務指標和預安排重復停電指標之間存在的內在聯(lián)系。
根據(jù)目前各領域業(yè)務指標統(tǒng)計情況,綜合指標數(shù)據(jù)采集的可行性與數(shù)據(jù)質量,初步選取的預安排停電影響因素特征指標主要包括:基建投資、大修技改投資、單輻射線路數(shù)量比例、可轉供電率、架空線平均分段數(shù)、用戶臨時停電率、合環(huán)轉供電比例、計劃停電不停電作業(yè)化率。以多次預安排停電用戶占比作為預安排重復停電評價指標。上述指標組合待進一步數(shù)據(jù)校驗后,用于構建預安排重復停電分析模型的特征指標池。初步構建的特征指標池層級結構如圖1所示。
圖1 特征指標層級結構
針對初步構建的特征指標池,收集各業(yè)務指標與預安排重復停電指標的歷史數(shù)據(jù),采用皮爾遜線性相關系數(shù)、肯德爾秩相關系數(shù)、斯皮爾曼秩相關系數(shù)等分別量化二者之間的關聯(lián)程度,進一步篩選具備一定關聯(lián)程度的業(yè)務指標,并增補關聯(lián)程度不顯著但符合業(yè)務分析需求的業(yè)務指標,最終確定用于構建關聯(lián)模型的有效業(yè)務指標組合。對數(shù)據(jù)進行標準化預處理,采用彈性網絡算法構建關聯(lián)模型,基于擬合優(yōu)度系數(shù)評估關聯(lián)模型的有效性,計算單位自變量指標變化對因變量指標變化的加權平均值,獲得各領域業(yè)務指標對預安排重復停電指標的貢獻度。
針對所構建的特征指標池,基于歷史數(shù)據(jù),采用皮爾遜線性相關系數(shù)、肯德爾秩相關系數(shù)、斯皮爾曼秩相關系數(shù)分別計算自變量和因變量之間的關聯(lián)程度,探索業(yè)務指標與預安排重復停電指標之間的關聯(lián)程度,結合業(yè)務分析需求篩選用于構建關聯(lián)模型的有效業(yè)務指標。
皮爾遜線性相關系數(shù)rp可用于計算2個指標之間的線性關聯(lián)程度,是極為經典且通用的關聯(lián)度指標,其計算公式為
(1)
式中xi、yi(i=1,2,…,n)分別為2個指標的樣本數(shù)據(jù)點,n為樣本容量。rp的取值范圍為[-1,1]。rp越接近0,表明2個指標之間的線性關聯(lián)程度越弱;rp越接近-1,表明2個指標之間越具有相反的線性變化趨勢;rp越接近1,表明2個指標之間越具有相同的線性變化趨勢。
肯德爾秩相關系數(shù)及斯皮爾曼秩相關系數(shù)可用于計算2個指標之間的非關聯(lián)程度,反映數(shù)據(jù)樣本中所蘊含的秩關聯(lián)程度??系聽栔认嚓P系數(shù)τ經典定義的計算公式為
(2)
式中:sgn(B)為符號函數(shù),當B>0時取值為1,當B<0時取值為-1,當B=0時取值為0。τ的取值范圍為[-1,1]。τ越接近0,表明2個指標之間的秩關聯(lián)程度越弱,當2個指標之間完全無關聯(lián)度時,該指標取值為0;τ越接近-1,表明2個指標之間的秩排列呈現(xiàn)越相反的變化趨勢;τ越接近1,則表明2個指標之間的秩排列呈現(xiàn)越相同的變化趨勢。
與肯德爾秩相關系數(shù)不同,斯皮爾曼秩相關系數(shù)ρ首先將數(shù)據(jù)樣本點對應轉換為次序樣本點,然后計算次序樣本點的皮爾遜線性相關系數(shù),其計算公式為
(3)
式中rx,1,…,rx,n和ry,1,…,ry,n分別為對應樣本數(shù)據(jù)x1,…,xn和y1,…,yn的次序,即rx,i為樣本點xi在x1,…,xn中排序的序號。當樣本數(shù)據(jù)(x1,y1),…,(xn,yn)互不相等時,斯皮爾曼秩相關系數(shù)的計算公式為
(4)
ρ的取值范圍為[-1,1]。ρ越接近0,表明2個指標之間的基于次序變換后的線性關聯(lián)程度越弱,當2個指標之間完全無關聯(lián)度時,ρ取值為0;ρ越接近-1,表明2個指標之間基于次序變換后呈現(xiàn)越線性相反的變化趨勢;ρ越接近1,表明2個指標之間基于次序變換后呈現(xiàn)越線性相同的變化趨勢。
基于計算所得的各業(yè)務指標與預安排重復停電指標的皮爾遜線性關聯(lián)系數(shù)、肯德爾秩相關系數(shù)和斯皮爾曼秩相關系數(shù),對初步選取的8個業(yè)務指標進行關聯(lián)度校驗,最終確定用于構建關聯(lián)模型的業(yè)務指標組合。給定的業(yè)務指標入選標準為:皮爾遜線性相關系數(shù)、肯德爾秩相關系數(shù)、斯皮爾曼秩相關系數(shù)三者之一達到0.2及以上;或者3個指標數(shù)值均低于0.2,但符合業(yè)務分析需求。
經過0-1標準化處理之后的數(shù)據(jù)會呈現(xiàn)平均值為0、標準差為1的規(guī)范性和固定性。具備規(guī)范性及固定性的數(shù)據(jù)可提高后續(xù)彈性網絡算法的準確性。雖然0-1標準化處理可能對后續(xù)建模具備一定的效果改善作用,但對樣本數(shù)據(jù)量也有一定的要求,可用的數(shù)據(jù)量越大,效果越明顯。若數(shù)據(jù)量相比自變量指標的數(shù)量而言不夠大,且數(shù)據(jù)之間的數(shù)量級差異不大,則0-1標準化處理的效果反而可能不理想(數(shù)據(jù)量不足容易導致樣本數(shù)據(jù)特征的代表性不足)。此時不進行0-1標準化處理而直接使用原始數(shù)據(jù),也是一種合理方案,可結合實際業(yè)務的特征決定。此外,也可以分別基于0-1標準化處理的數(shù)據(jù)、原始數(shù)據(jù)構建關聯(lián)模型,根據(jù)業(yè)務分析需求及業(yè)務背景,確定最佳的關聯(lián)模型所對應的數(shù)據(jù)預處理方式。
基于標準化預處理后得到的各業(yè)務指標與預安排重復停電指標數(shù)據(jù),結合業(yè)務場景分析需求,采用彈性網絡算法構建關聯(lián)模型。
彈性網絡算法[23]是結合了嶺回歸和套索回歸算法優(yōu)點的一般性正則化算法,在諸多實際領域有著廣泛的應用。具體而言,該算法考慮線性回歸模型
G=ζ0+ζ1H1+…+ζdHd+ε
(5)
的未知系數(shù)估計問題。式(5)中:G為多次預安排停電用戶占比;Hk(k=1,2,…,d)為預安排停電影響因素指標,d為指標總數(shù);ζk為指標Hk對多次預安排停電用戶占比影響的關聯(lián)系數(shù)(待確定);ζ0反映配電網自身所具有的基準多次預安排停電用戶占比;ε為不可觀測項,包括其他未被納入模型的指標對多次預安排停電用戶占比G的潛在影響及誤差。
對式(5)的回歸模型求平均,消去不可觀測項ε,得到模型E(G)=ζ0+ζ1H1+…+ζdHd,E(G)為多次預安排停電用戶占比的平均值,反映配電網運行的預安排停電狀態(tài)。通過求解式(6)的帶二次規(guī)劃問題,計算線性回歸方程的各領域業(yè)務指標關聯(lián)系數(shù)的彈性網絡估計值。
(6)
式中:α、β為調整參數(shù),對業(yè)務指標的關聯(lián)系數(shù)估計值進行控制;gi為多次預安排停電用戶占比的第i個樣本數(shù)據(jù);hij為第j個預安排停電影響因素指標的第i個樣本數(shù)據(jù)。當β=1時,彈性網絡算法即為套索回歸算法;當β=0時,彈性網絡算法即為嶺回歸算法;當0<β<1時,彈性網絡算法可同時具備套索回歸算法和嶺回歸算法的變量選擇和壓縮系數(shù)特性。以上優(yōu)化問題可通過經典的優(yōu)化算法求解。
根據(jù)關聯(lián)模型的擬合優(yōu)度系數(shù)RS評估關聯(lián)模型的有效性,計算公式為
(7)
式中γj為關聯(lián)系數(shù)的彈性網絡估計值。當RS≥0.85時(閾值0.85可根據(jù)實際數(shù)據(jù)量結合專家意見進行調整)即可認為關聯(lián)模型刻畫達到所需精度。若RS<0.85,可增補更多的業(yè)務指標到自變量指標組合中,重新構建關聯(lián)模型直至擬合優(yōu)度系數(shù)達到要求;亦可結合實際業(yè)務分析需求依然使用所得的關聯(lián)模型。
如果γj為0,表明對應的業(yè)務指標對多次預安排停電用戶占比無影響;如果γj為負(正)值,表明對應的業(yè)務指標對多次預安排停電用戶占比的大小有反向(正向)的效果。
根據(jù)擬合優(yōu)度系數(shù)符合要求的關聯(lián)模型結果,將單位自變量指標變化對因變量指標變化的加權平均值作為貢獻度指標,進一步評判各業(yè)務指標對預安排重復停電指標的貢獻度,計算公式為
(8)
式中Ik為第k個預安排停電影響因素指標對預安排重復停電指標的貢獻度。
本節(jié)以國內某區(qū)域電網所轄19個管理單位的配電網投資規(guī)模、網架結構、系統(tǒng)運行、設備運維等領域業(yè)務指標及預安排重復停電指標的歷史數(shù)據(jù)作為樣本進行算例分析。
所考慮的自變量指標包括基建投資、大修技改投資、單輻射線路數(shù)量比例、可轉供電率、架空線平均分段數(shù)、用戶臨時停電率、合環(huán)轉供電比例、計劃停電不停電作業(yè)化率共8個指標,所考慮的因變量指標為多次預安排停電用戶占比。分別計算8個業(yè)務指標與因變量指標間的皮爾遜線性相關系數(shù)、肯德爾秩相關系數(shù)及斯皮爾曼秩相關系數(shù),見表1??梢钥闯?,全部業(yè)務指標與因變量指標均具備一定的關聯(lián)程度,可共同構成后續(xù)關聯(lián)模型的自變量指標組合。
表1 各自變量指標與因變量指標的關聯(lián)程度
所選19個管理單位8個業(yè)務指標的歷史數(shù)據(jù)量相比自變量指標數(shù)量不夠大(只有19個樣本數(shù)據(jù),不到所選8個指標數(shù)量的3倍),且原始數(shù)據(jù)各指標的數(shù)量級差別不大(基建投資、大修技改投資均以億元為單位,指標數(shù)值大部分為個位數(shù),架空線平均分段數(shù)的數(shù)值也為個位數(shù),其余指標取值范圍均為0~1),故不進行0-1標準化處理,采用原始數(shù)據(jù)構建關聯(lián)模型。
采用彈性網絡算法構建所選8個業(yè)務指標對多次預安排停電用戶占比的關聯(lián)模型,得到的關聯(lián)模型擬合優(yōu)度系數(shù)為0.918 5,表明關聯(lián)模型的精度足夠高。提取關聯(lián)模型中各自變量的關聯(lián)系數(shù)見表2,影響權重見表3。
表2 彈性網絡關聯(lián)模型自變量的關聯(lián)系數(shù)
表3 彈性網絡關聯(lián)模型自變量的影響權重
由表3可知,可轉供電率及計劃停電不停電作業(yè)化率的影響權重排名前2且遠超其他指標,表明多次預安排停電用戶占比的主要影響因素為可轉供電率及計劃停電不停電作業(yè)化率。結合表2中這2個指標的關聯(lián)系數(shù)可以發(fā)現(xiàn),可轉供電率、計劃停電不停電作業(yè)化率每提高10%,可分別降低2.2%、1%的多次預安排停電用戶占比。因此,該區(qū)域可著力優(yōu)先改善這2個指標,通過完善網架結構、提升環(huán)網轉供電能力、充分應用不停電作業(yè)手段,來降低多次預安排停電用戶占比。大修技改投資相比基建投資對預安排重復停電影響權重較大,需要加強對設備檢修類項目的停電計劃管控,減少因電網設施計劃檢修對用戶重復停電的影響。用戶臨時停電率的影響權重為0.000 2,表明該區(qū)域臨時停電管控能力較好,基本上不造成用戶預安排重復停電影響。
針對現(xiàn)有配電網預安排停電相關的分析方法存在適用場景單一、顆粒度粗糙、客觀性欠缺等問題,本文提出一種基于彈性網絡算法的預安排重復停電分析模型。構建配電網預安排重復停電指標及投資規(guī)模、網架結構、系統(tǒng)運行、設備運維等領域業(yè)務指標的多重評估維度指標體系,以多次預安排停電用戶占比指標為標準,采用彈性網絡算法構建各領域業(yè)務指標與預安排重復停電指標的關聯(lián)模型。通過關聯(lián)模型分析挖掘多次預安排停電用戶占比與預安排停電因素相關的業(yè)務指標間的內在關系,可有效準確地挖掘內在作用規(guī)律,量化各領域業(yè)務主要影響因素指標的貢獻度。該分析模型可用于配電網預安排重復停電管控分析,根據(jù)預安排重復停電主要影響因素有針對性制訂改善措施,也可通過不同領域業(yè)務指標目標值組合分析預測預安排重復停電指標目標值。該模型可為電網公司了解預安排重復停電主要影響因素提供客觀精準的參考依據(jù),為支撐多領域業(yè)務協(xié)同優(yōu)化管控、精準施策、進一步提高預安排停電管理水平提供數(shù)據(jù)賦能。