郭飛,吳佳靜,周怡,高利燕,麥曉慶
(1.國(guó)網(wǎng)寧夏電力有限公司,寧夏 銀川 750001;2.寧夏信通網(wǎng)絡(luò)科技有限公司,寧夏 銀川 750001;3.國(guó)網(wǎng)寧夏電力有限公司信息通信公司,寧夏 銀川 750001;4.濟(jì)南銀華信息技術(shù)有限公司,山東 濟(jì)南 250000;5.國(guó)網(wǎng)寧夏電力有限公司中衛(wèi)供電公司,寧夏 中衛(wèi) 755000)
臺(tái)區(qū)線損管理水平綜合反映了電力系統(tǒng)規(guī)劃設(shè)計(jì)、生產(chǎn)運(yùn)行和經(jīng)營(yíng)管理的水平,是電網(wǎng)經(jīng)營(yíng)的一項(xiàng)重要經(jīng)濟(jì)指標(biāo)。目前影響臺(tái)區(qū)線損的主要因素有技術(shù)因素和管理因素。文獻(xiàn)[1]研究了基于機(jī)器學(xué)習(xí)的電網(wǎng)臺(tái)區(qū)線損異常診斷方法,提出利用機(jī)器學(xué)習(xí)構(gòu)建臺(tái)區(qū)線損異常分析模型,從計(jì)量差錯(cuò)分析、臺(tái)區(qū)串戶等技術(shù)方面分析了線損異常的原因。文獻(xiàn)[2]利用概率分布的方法對(duì)線損異常進(jìn)行識(shí)別,從用戶側(cè)判斷評(píng)估管理對(duì)線損的影響程度。文獻(xiàn)[3]針對(duì)計(jì)量失誤、計(jì)量故障等原因產(chǎn)生的臺(tái)區(qū)線損問(wèn)題,提出線損在線監(jiān)管,并給出具體解決方案。文獻(xiàn)[4]研究了基于數(shù)據(jù)知識(shí)融合的輸電線路線損計(jì)算方法,分析了環(huán)境影響量對(duì)導(dǎo)線損耗的影響和降雨強(qiáng)度對(duì)導(dǎo)線表面最大場(chǎng)強(qiáng)、電暈損耗的影響。文獻(xiàn)[5]研究了基于K 最鄰近法(K-nearest neighbor,KNN)和局部離群因子(local outlier factor,LOF)算法的臺(tái)區(qū)線損異常監(jiān)測(cè)方法,有效提高了供電企業(yè)對(duì)臺(tái)區(qū)線損的判斷效率,但現(xiàn)有研究結(jié)果中,很少考慮在地形較為偏遠(yuǎn)、氣候多變的山區(qū),氣象因素對(duì)臺(tái)區(qū)線損異常波動(dòng)的影響?;诖?,本文建立了考慮氣象因素的臺(tái)區(qū)線損異常智能識(shí)別模型,利用離群點(diǎn)檢測(cè)算法建立考慮氣象因素的臺(tái)區(qū)線損異常智能識(shí)別模型,判斷某一段時(shí)間內(nèi)日線損易受異常天氣影響的臺(tái)區(qū),并評(píng)估影響程度的大小。最后以某縣供電公司532 個(gè)臺(tái)區(qū)91天內(nèi)日線損數(shù)據(jù)為基礎(chǔ),結(jié)合實(shí)時(shí)和預(yù)報(bào)氣象數(shù)據(jù),量化分析異常天氣對(duì)某縣臺(tái)區(qū)日線損波動(dòng)的影響,識(shí)別日線損容易受天氣影響的臺(tái)區(qū),實(shí)現(xiàn)線損異常預(yù)警分析,為各專業(yè)完善線損指標(biāo)的風(fēng)險(xiǎn)防控機(jī)制提供科學(xué)依據(jù),助力提升線損精益化管理水平。
線損是線路損耗的簡(jiǎn)稱,即電能通過(guò)輸電線路傳輸而產(chǎn)生的能量損耗,包括變壓器等配變?cè)O(shè)備,也會(huì)產(chǎn)生電能的損耗。臺(tái)區(qū)線損是指整個(gè)臺(tái)區(qū)能量損耗的總和,一般情況下,可根據(jù)臺(tái)區(qū)供電量與售電量計(jì)算臺(tái)區(qū)的線損情況,即:
臺(tái)區(qū)線損異常主要有高損臺(tái)區(qū)和負(fù)損臺(tái)區(qū)。一般情況下,將偏遠(yuǎn)山區(qū)線損率大于10%的臺(tái)區(qū)定義為高損臺(tái)區(qū),線損率小于-0.5%的臺(tái)區(qū)定義為負(fù)損臺(tái)區(qū)。臺(tái)區(qū)線損異常的具體表現(xiàn)有以下方面:
1)“此消彼長(zhǎng)”型。某臺(tái)區(qū)線損率連續(xù)異常增大,同時(shí),相鄰臺(tái)區(qū)的線損率明顯較低甚至出現(xiàn)負(fù)值,線損率呈現(xiàn)互補(bǔ)的現(xiàn)象。
2)“異常波動(dòng)”型。臺(tái)區(qū)在某段時(shí)間內(nèi)線損率變化幅度較大,線損率總體不穩(wěn)定。
3)“異常突變”型。臺(tái)區(qū)線損在一段時(shí)間內(nèi)保持穩(wěn)定,突然在某一時(shí)刻發(fā)生突變,之后保持在一定水平。
線損異常關(guān)系到電網(wǎng)供電效率,影響供電企業(yè)服務(wù)質(zhì)量和經(jīng)濟(jì)效益,嚴(yán)重時(shí),會(huì)造成巨大的電能浪費(fèi),對(duì)企業(yè)的發(fā)展產(chǎn)生負(fù)面影響。臺(tái)區(qū)線損異常的主要原因有技術(shù)因素和管理因素,但是在某些氣候多變的山區(qū),臺(tái)區(qū)線損異常波動(dòng)也受氣象因素的影響。
離群點(diǎn)檢測(cè)是基于統(tǒng)計(jì)、頻率、深度、距離等多角度對(duì)異常數(shù)據(jù)進(jìn)行識(shí)別的大數(shù)據(jù)挖掘算法之一,可快速實(shí)現(xiàn)異常信息的高效提取[6]。LOF算法是基于距離和密度的離群點(diǎn)檢測(cè)方法中一個(gè)比較有代表性的算法,該算法對(duì)數(shù)據(jù)集中的每個(gè)點(diǎn)計(jì)算一個(gè)離群因子LOF,通過(guò)判斷LOF 是否接近于1來(lái)判定是否為離群因子[7-8]。具體算法步驟如下。
2.1.1 計(jì)算對(duì)象p的k距離
對(duì)于正整數(shù)k,對(duì)象p的k距離可記作distk(p)。在樣本空間D中,存在對(duì)象o,它與對(duì)象p之間的距離為d(p,o)。如果滿足以下兩個(gè)條件,則認(rèn)為distk(p)=d(p,o)。
1)在樣本空間D中,至少存在k個(gè)對(duì)象q,使得d(p,q) ≤d(p,o);
2)在樣本空間D中,至多存在k-1個(gè)對(duì)象q,使得d(p,q) <d(p,o)。
本文選用歐式距離計(jì)算p的k距離:
使用distk( )p量化對(duì)象p的局部空間區(qū)域范圍,對(duì)于對(duì)象密度較大的區(qū)域,distk( )p值較??;而對(duì)象密度較小的區(qū)域,distk( )p值較大,因此用distk( )p值大小可初步識(shí)別離群點(diǎn)。
2.1.2 確定對(duì)象p的第k距離鄰域
在樣本空間D中,將與對(duì)象k之間的距離小于等于distk( )p的對(duì)象集合稱為對(duì)象p的k距離鄰域,記作Nk(p)。該鄰域是以p為中心,distk( )p為半徑的區(qū)域內(nèi)所有對(duì)象的集合(不包括p本身)。由于可能同時(shí)存在多個(gè)第k距離的數(shù)據(jù),因此該集合至少包括k個(gè)對(duì)象。
2.1.3 計(jì)算對(duì)象p相對(duì)于對(duì)象o的可達(dá)距離
如果對(duì)象p遠(yuǎn)離對(duì)象o,則兩者之間的可達(dá)距離就是它們之間的實(shí)際距離,如果它們足夠近,則實(shí)際距離用o的k距離代替。
2.1.4 計(jì)算局部可達(dá)密度
對(duì)象p的局部可達(dá)密度定義為p的k最近鄰點(diǎn)的平均可達(dá)密度的倒數(shù)。
2.1.5 計(jì)算局部離群點(diǎn)因子
式中:Nk(p)是對(duì)象p的k距離鄰域;lrdk(o)是對(duì)象o的局部可達(dá)密度;lrdk(p)是對(duì)象p的局部可達(dá)密度。
如果對(duì)象p不是局部離群點(diǎn),則LOF(p)接近于1,即p是局部離群點(diǎn)的程度較小,對(duì)象o的局部可達(dá)密度和對(duì)象p的局部可達(dá)密度相似,最后所得的LOF(p)值接近于1;反之,p是局部離群點(diǎn)的程度越大,LOF(p)值越高。
數(shù)據(jù)處理主要是對(duì)原始數(shù)據(jù)的清洗,包括數(shù)據(jù)的完整性、有效性、可代表性等處理過(guò)程,使數(shù)據(jù)包含的信息能更準(zhǔn)確、更有效地反映真實(shí)情況。
2.2.1 完整性處理
對(duì)于提取的原始數(shù)據(jù),篩選出所需相關(guān)字段,按日期進(jìn)行重新組合,形成完整的數(shù)據(jù)表。
2.2.2 有效性處理
對(duì)于數(shù)據(jù)表中的空值數(shù)據(jù)和錯(cuò)誤數(shù)據(jù),根據(jù)實(shí)際情況選擇刪除該異常值所在記錄或?qū)ζ溥M(jìn)行平滑處理,保證數(shù)據(jù)的有效性。
2.2.3 歸一化處理
各臺(tái)區(qū)日線損數(shù)據(jù)間存在數(shù)量級(jí)差別大的問(wèn)題,在數(shù)據(jù)分析之前,對(duì)其進(jìn)行歸一化處理,避免“大數(shù)據(jù)吞沒小數(shù)據(jù)”的情況,造成最終分析結(jié)果的偏差。本文采用Z-score 標(biāo)準(zhǔn)化方法對(duì)數(shù)據(jù)進(jìn)行處理,表達(dá)式為
式中:xˉ為樣本數(shù)據(jù)的均值,S為樣本數(shù)據(jù)的標(biāo)準(zhǔn)差。
通過(guò)離群點(diǎn)檢測(cè)算法建立基于氣象因素的臺(tái)區(qū)線損異常智能識(shí)別模型,判斷日線損易受異常天氣影響的臺(tái)區(qū),并評(píng)估影響程度的大小。具體模型運(yùn)行步驟如下:
1)對(duì)臺(tái)區(qū)日線損數(shù)據(jù)進(jìn)行完整性、有效性和歸一化處理,同時(shí)將氣象數(shù)據(jù)按異常天氣和正常天氣兩種情況進(jìn)行判別分類。
2)將處理后的日線損數(shù)據(jù)作為樣本數(shù)據(jù)構(gòu)建樣本空間D,依次計(jì)算D中所有樣本數(shù)據(jù)x的k距離、k距離鄰域Nk(x)、可達(dá)距離reachdist(x)、可達(dá)密度lrdk( )x,最終計(jì)算出離群點(diǎn)因子LOFk(x)。
3)對(duì)LOF 進(jìn)行判斷,當(dāng)LOF 接近于1 時(shí),則日線損正常;當(dāng)LOF遠(yuǎn)大于1時(shí),則日線損屬于波動(dòng)較為明顯的異常值。
4)將LOF遠(yuǎn)大于1的線損數(shù)據(jù)與已分類的氣象數(shù)據(jù)根據(jù)日期進(jìn)行匹配,并按當(dāng)天是異常天氣的日線損異常點(diǎn),當(dāng)天是異常天氣前后一天的日線損異常點(diǎn),其他天氣的線損異常點(diǎn)三種情況進(jìn)行分類統(tǒng)計(jì)。
5)篩選當(dāng)天是異常天氣的日線損異常點(diǎn)和當(dāng)天是異常天氣前后一天的日線損異常點(diǎn)兩種統(tǒng)計(jì)類型,根據(jù)業(yè)務(wù)實(shí)際情況,判斷線損受異常天氣影響程度z的大小。然后篩選出樣本空間D中異常點(diǎn)占比大于z的情況,即篩選的結(jié)果是樣本空間中容易受異常天氣影響的臺(tái)區(qū)。
6)將易受異常天氣影響的臺(tái)區(qū)建立新臺(tái)賬,根據(jù)氣象預(yù)報(bào)數(shù)據(jù),定期對(duì)這些臺(tái)區(qū)線損波動(dòng)異常情況進(jìn)行預(yù)警,為臺(tái)區(qū)巡視檢查及線損治理提供依據(jù)。如圖1所示。
圖1 臺(tái)區(qū)線損異常識(shí)別與預(yù)警模型運(yùn)行步驟
對(duì)于線損波動(dòng)的分析,當(dāng)時(shí)間跨度過(guò)長(zhǎng)時(shí),不易排除技術(shù)因素和管理因素的影響,而在一段時(shí)間內(nèi),比如一個(gè)季度,當(dāng)氣象因素差異不大,例如都是晴天時(shí),線損波動(dòng)不明顯,則可忽略技術(shù)因素和管理因素對(duì)臺(tái)區(qū)線損異常波動(dòng)的影響。因此,可利用上述模型對(duì)偏遠(yuǎn)山區(qū)某段時(shí)間內(nèi)頻發(fā)的異常氣象因素導(dǎo)致線損波動(dòng)的臺(tái)區(qū)進(jìn)行識(shí)別,并根據(jù)實(shí)際情況判斷影響程度的大小。將上述臺(tái)區(qū)線損異常識(shí)別與預(yù)警模型運(yùn)行步驟利用Python 工具編寫成相應(yīng)的代碼,實(shí)現(xiàn)快速高效智能識(shí)別易受異常天氣影響的臺(tái)區(qū),并形成相應(yīng)的臺(tái)賬,根據(jù)當(dāng)?shù)仡l發(fā)的異常天氣情況,建立相應(yīng)的預(yù)警機(jī)制。
某縣供電公司共管轄532 個(gè)臺(tái)區(qū),對(duì)其根據(jù)實(shí)際情況進(jìn)行預(yù)處理后,有效臺(tái)區(qū)520 個(gè)。其所屬縣地處偏遠(yuǎn)山區(qū),氣候多變,晴雨不定。二季度的天氣中,溫度波動(dòng)不大,較為穩(wěn)定,因此按天氣情況進(jìn)行分類,多云天氣33 天、雨天28 天、晴天26 天、陰天2 天、揚(yáng)沙1 天、陰轉(zhuǎn)晴1 天,如圖2所示。其中異常天氣中的雨天包含了小雨、中雨及雷陣雨三種情況,且占比較大。
圖2 某縣二季度天氣情況
某縣將偏遠(yuǎn)地區(qū)臺(tái)區(qū)線損率大于10%的值定義為高損,但是因?yàn)榧夹g(shù)和管理方面的因素,存在連續(xù)時(shí)間段日線損均大于10%的臺(tái)區(qū),因此本文利用基于距離和密度的離群點(diǎn)檢測(cè)算法識(shí)別異常天氣時(shí)線損突然升高或降低的臺(tái)區(qū),并進(jìn)行篩選標(biāo)記。
利用基于氣象因素的臺(tái)區(qū)線損異常智能識(shí)別模型對(duì)某縣520 個(gè)有效臺(tái)區(qū)91 天的日線損數(shù)據(jù)進(jìn)行識(shí)別,并根據(jù)識(shí)別結(jié)果與氣象數(shù)據(jù)進(jìn)行匹配,判斷線損易受異常天氣影響的臺(tái)區(qū)。選取離群點(diǎn)檢測(cè)結(jié)果中存在LOF 遠(yuǎn)大于1 的某臺(tái)區(qū),繪制其91 天日線損數(shù)據(jù)散點(diǎn)圖,如圖3 所示。圓圈內(nèi)的離群點(diǎn)較為明顯,即此臺(tái)區(qū)二季度中部分日期日線損確實(shí)存在異常值,說(shuō)明離群點(diǎn)檢測(cè)可有效識(shí)別海量日線損數(shù)據(jù)中的異常值。
圖3 某臺(tái)區(qū)91天日線損離群點(diǎn)
隨機(jī)選取某臺(tái)區(qū)相近的時(shí)間點(diǎn),對(duì)離群點(diǎn)檢測(cè)分析結(jié)果與天氣情況進(jìn)行匹配,結(jié)果如表1所示。
表1 基于離群點(diǎn)檢測(cè)算法的某臺(tái)區(qū)部分分析結(jié)果
在分析的47 320 個(gè)數(shù)據(jù)點(diǎn)中,分析發(fā)現(xiàn)異常點(diǎn)共計(jì)17 175 個(gè),與氣象數(shù)據(jù)匹配后總體情況如表2 所示。揚(yáng)沙引起的日線損均值最高,其次是雨天,第三是雨天前后的陰天或陰轉(zhuǎn)晴。說(shuō)明在某縣二季度內(nèi),揚(yáng)沙天氣對(duì)臺(tái)區(qū)線損影響波動(dòng)最大,雨天對(duì)臺(tái)區(qū)線損波動(dòng)影響次之。
表2 某縣二季度異常天氣日線損波動(dòng)情況
在某縣二季度的天氣中,揚(yáng)沙天氣只有一天,占比太小,無(wú)法再次進(jìn)行驗(yàn)證,且揚(yáng)沙天氣對(duì)某縣臺(tái)區(qū)線損整體波動(dòng)無(wú)法形成預(yù)警,因此對(duì)某縣異常氣象因素的分析主要以雨天為主進(jìn)行分析。對(duì)28 天雨天對(duì)應(yīng)的日線損異常數(shù)據(jù)進(jìn)行篩選,發(fā)現(xiàn)28 天雨天中,至少有17 天部分臺(tái)區(qū)線損率波動(dòng)明顯,說(shuō)明在某縣偏遠(yuǎn)山區(qū),雨天對(duì)部分臺(tái)區(qū)日線損的影響至少有60.72%,且影響超過(guò)60.72%的臺(tái)區(qū)共計(jì)38個(gè),如圖4所示。
圖4 受雨天影響的38個(gè)臺(tái)區(qū)線損異常次數(shù)
提取某縣7月份天氣情況的數(shù)據(jù),雨天共計(jì)9天。根據(jù)上述離群點(diǎn)檢測(cè)模型預(yù)測(cè)上述38 個(gè)臺(tái)區(qū)在7 月份雨天發(fā)生日線損異常的數(shù)量,并與實(shí)際發(fā)生日線損數(shù)據(jù)進(jìn)行比對(duì),判斷模型的擬合程度和效果,如圖5 所示。雖然預(yù)測(cè)值與實(shí)際值由于不同時(shí)間段負(fù)荷波動(dòng)存在一定的誤差,但是在可信度范圍內(nèi),具有一定的實(shí)際意義。
圖5 某縣臺(tái)區(qū)日線損異常值預(yù)測(cè)數(shù)量與實(shí)際數(shù)量
上述模型驗(yàn)證,說(shuō)明基于距離和密度的離群點(diǎn)檢測(cè)算法適用于基于氣象因素的臺(tái)區(qū)日線損異常判斷。因此,在氣候多變的山區(qū),利用離群點(diǎn)檢測(cè)算法智能識(shí)別日線損異常值,并與當(dāng)?shù)啬扯螘r(shí)間內(nèi)頻發(fā)的異常天氣情況進(jìn)行匹配,當(dāng)異常天氣對(duì)應(yīng)的線損異常超過(guò)60%(根據(jù)實(shí)際情況確定z值),且正常天氣線損率波動(dòng)不大時(shí),將此類臺(tái)區(qū)定義為易受異常天氣影響的臺(tái)區(qū),然后根據(jù)時(shí)間段內(nèi)的天氣預(yù)報(bào),在異常天氣前夕,重點(diǎn)關(guān)注此類臺(tái)區(qū),做到及時(shí)巡視檢修,可有效減少因?yàn)楫?dāng)?shù)靥厥鈵毫犹鞖庠斐傻碾娏繐p失,保障電網(wǎng)安全。
利用離群點(diǎn)檢測(cè)算法構(gòu)建臺(tái)區(qū)線損異常分析模型,實(shí)現(xiàn)考慮氣象因素條件下的臺(tái)區(qū)線損異常智能識(shí)別。通過(guò)對(duì)某縣臺(tái)區(qū)日線損數(shù)據(jù)的分析,有效識(shí)別臺(tái)區(qū)線損容易受當(dāng)?shù)仡l發(fā)雨天影響的臺(tái)區(qū),并評(píng)估影響程度的大小。結(jié)果表明,針對(duì)氣候多變的偏遠(yuǎn)山區(qū),將當(dāng)?shù)仡l發(fā)的異常氣象因素納入臺(tái)區(qū)線損指標(biāo)的風(fēng)險(xiǎn)防控機(jī)制,并建立氣象因素對(duì)日線損的預(yù)警機(jī)制,可為開展臺(tái)區(qū)線損治理提供依據(jù),有效提升線損的精益化管理水平,達(dá)到節(jié)能降損的目的。隨著數(shù)據(jù)采集終端的升級(jí)和數(shù)量的積累,未來(lái)該方法可以納入更多對(duì)配電網(wǎng)供電質(zhì)量的外在影響因素分析,助力提升配電網(wǎng)供電質(zhì)量。