国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于k-means聚類的居民階梯電量制定方法

2019-12-11 01:27鄧雅心
關(guān)鍵詞:用電量階梯電價(jià)

李 昂,葉 欣,鄧雅心

(1.陜西理工大學(xué) 電氣工程學(xué)院, 陜西 漢中 723000;2.國(guó)網(wǎng)青海省電力公司 經(jīng)濟(jì)技術(shù)研究院, 青海 西寧 810000)

近年來,國(guó)家持續(xù)深化電力體制改革,推進(jìn)銷售電價(jià)改革工作。階梯式電價(jià)改革方案能夠改善交叉補(bǔ)貼現(xiàn)象、促進(jìn)節(jié)能減排、引導(dǎo)用戶合理用電,在我國(guó)經(jīng)過試點(diǎn)探索,隨后實(shí)現(xiàn)全面推廣。長(zhǎng)期以來,分段電量的制定一直是研究的重點(diǎn)。

居民階梯電價(jià)是一種先進(jìn)的非線性電價(jià)定價(jià)機(jī)制,它按照用戶消費(fèi)的電量分段定價(jià),單位電價(jià)隨用電量累計(jì)增加呈階梯狀逐級(jí)改變。付飛翔等[1-3]介紹了階梯電價(jià)的產(chǎn)生背景以及在多國(guó)的發(fā)展與差異。張粒子[4]指出,居民階梯電價(jià)分為遞增式和遞減式兩類,我國(guó)適宜采用居民階梯式遞增電價(jià)(下文統(tǒng)一簡(jiǎn)稱階梯電價(jià))。分檔次數(shù)是整個(gè)階梯電價(jià)方案的基石,只有確定好合適的分檔次數(shù)才能確定分檔電量與分檔電價(jià)[5]。張粒子等[6]應(yīng)用家庭電器設(shè)備估算法和概率統(tǒng)計(jì)方法確定各段階梯電量及其覆蓋率的范圍。黃海濤等[7]基于改進(jìn)的密度聚類的分析方法來確定各階梯電量。朱柯丁等[8]采用秩和比法以及計(jì)算機(jī)循環(huán)算法確定合理的分段階梯數(shù)和各階梯電量。劉自敏等[9]基于中國(guó)家庭動(dòng)態(tài)跟蹤調(diào)查數(shù)據(jù),通過反事實(shí)場(chǎng)景構(gòu)建和截面門檻模型來分析各階梯電量。

上述文獻(xiàn)所探討的階梯分段電量制定方法,大多是運(yùn)用經(jīng)濟(jì)學(xué)原理和數(shù)理統(tǒng)計(jì)分析的數(shù)學(xué)建模過程,其模擬結(jié)果具有一定的理論性與科學(xué)性,在實(shí)際應(yīng)用中也起到了不錯(cuò)的效果。但是,建模函數(shù)往往不能將所有的影響因素考慮周全,導(dǎo)致其擬合結(jié)果存在一定程度的偏差。另一方面,我國(guó)各地現(xiàn)行的階梯電價(jià)政策,大多都是幾年前制定的,已不能完全適應(yīng)與貼合快速發(fā)展變化的市場(chǎng)環(huán)境。因此,有必要建立一種新的階梯電價(jià)制定策略。智能電網(wǎng)的推廣和大數(shù)據(jù)理念的應(yīng)用,為解決類似問題提供了新思路。智能電網(wǎng)是大數(shù)據(jù)最重要的應(yīng)用領(lǐng)域之一[10]。在智能電網(wǎng)深入推進(jìn)的形勢(shì)下,電力系統(tǒng)的數(shù)字化、信息化、智能化不斷發(fā)展,帶來了更多的數(shù)據(jù)源[11]。何文韜等[12-13]對(duì)未來大數(shù)據(jù)的發(fā)展與應(yīng)用進(jìn)行了探討與展望。楊德昌等[14]結(jié)合聚類與預(yù)測(cè)方法進(jìn)行短期負(fù)荷預(yù)測(cè)。王帥等[15]使用密度峰值聚類算法分析多種用戶類型的負(fù)荷曲線。楊衛(wèi)紅等[16]通過對(duì)用戶的用電行為聚類以分析用戶參與電網(wǎng)調(diào)節(jié)的潛力。王保義等[17]關(guān)注用電數(shù)據(jù)的隱私保護(hù)并提出兩階段聚類方法。

智能電表、在線狀態(tài)監(jiān)測(cè)設(shè)備、數(shù)據(jù)傳輸和存儲(chǔ)設(shè)備的推廣使用,方便電網(wǎng)企業(yè)從億萬居民家庭終端采集、傳遞和存儲(chǔ)海量的居民用戶歷史用電信息。本文正是基于這些電力大數(shù)據(jù),運(yùn)用聚類的大數(shù)據(jù)分析方法,探討階梯電價(jià)的分段階梯數(shù)和各階梯電量的制定方法。與前文中提到的傳統(tǒng)策略相比,本方法直接從居民用電實(shí)際情況出發(fā),原理簡(jiǎn)單,避免了建模誤差,具有良好的真實(shí)性、時(shí)效性。

1 階梯分段的k-means聚類方法原理

聚類起源于分類學(xué),是數(shù)據(jù)挖掘與統(tǒng)計(jì)分析中的一個(gè)重要的研究領(lǐng)域。從機(jī)器學(xué)習(xí)的角度看,它是一種無監(jiān)督的機(jī)器學(xué)習(xí)方法[18]。在事先對(duì)數(shù)據(jù)集的分布沒有任何了解的情況下,通過聚類,可以將數(shù)據(jù)集劃分為由若干相似對(duì)象組成的多個(gè)組或簇,使得同一組中對(duì)象間的相似度最大化,不同組中對(duì)象間的相似度最小化。k-means算法是一種基于劃分的聚類算法,是MacQueen在1967年首次提出。通常使用誤差平方和(Sum of Squared Error, SSE)作為度量聚類完成度的閾值目標(biāo),即對(duì)每個(gè)簇中的每個(gè)對(duì)象,求對(duì)象到其所屬簇的聚類中心的距離的平方和。這個(gè)準(zhǔn)則試圖使生成的k個(gè)結(jié)果簇盡可能地緊湊和獨(dú)立。SSE定義如下:

(1)

式中x表示數(shù)據(jù)對(duì)象,vi表示聚類ci的聚類中心,k表示聚類個(gè)數(shù),d(vi,x)表示距離函數(shù),i=1,2,…,k。

聚類分析中所用到的距離函數(shù)有多種定義形式,其中最常用的是歐幾里得距離,表示如下:

(2)

圖1展示了k-means聚類的具體步驟。

圖1 k-means聚類的原理

由智能電網(wǎng)系統(tǒng)獲得的居民歷史用電量數(shù)據(jù),是對(duì)居民用電行為特性的最真實(shí)、最直觀、最可靠的反映。而居民用電行為特性的形成,是多種因素綜合作用的結(jié)果,如各地區(qū)的經(jīng)濟(jì)發(fā)展水平、電力資源的稀缺程度、居民用戶的電力需求彈性、家庭的人員組成與電器存量、居民的收入差距與消費(fèi)特性、地區(qū)的季節(jié)規(guī)律和氣候環(huán)境等。

應(yīng)用k-means算法,根據(jù)歷史用電量數(shù)據(jù)對(duì)居民用戶進(jìn)行聚類,將具有相似用電量級(jí)的用戶劃分為一個(gè)簇,最終形成多個(gè)簇。在一個(gè)周期內(nèi),相似的用電量級(jí)很大程度上能反映出相似的用電行為特性,進(jìn)而間接反映出其背后的多種影響因素。可以認(rèn)為,借助k-means算法能夠避免對(duì)影響因素考慮不周的風(fēng)險(xiǎn),由此跳過傳統(tǒng)建模的缺陷,直接從實(shí)際現(xiàn)象出發(fā)處理問題。

聚類的結(jié)果是形成多個(gè)簇,可將這些簇作為天然的階梯電量劃分依據(jù),其中,簇的數(shù)量對(duì)應(yīng)分段階梯數(shù),簇與簇之間的邊界量對(duì)應(yīng)各階梯段的分界電量限值。

2 聚類有效性評(píng)價(jià)

2.1 進(jìn)行有效性評(píng)價(jià)的必要性

由上文可知,階梯分段數(shù)量等同于k-means算法的初始k值,要將居民歷史用電量信息的數(shù)據(jù)集劃分為多少個(gè)簇群,成為問題的關(guān)鍵。

通過文獻(xiàn)研究可知,在目前采用階梯電價(jià)制度的國(guó)家中,國(guó)際上階梯分段數(shù)量從2階到9階不等,并在不時(shí)調(diào)整變化;就我國(guó)而言,階梯電價(jià)被劃分為三檔。目前世界范圍內(nèi)并沒有一個(gè)完全明確的分段依據(jù)。

因此,在使用k-means算法進(jìn)行聚類時(shí),應(yīng)該選取多個(gè)不同的k值,得到不同的階梯分段方案,再選擇合適的評(píng)判方法,通過對(duì)比來評(píng)價(jià)各個(gè)方案的效果,選出相對(duì)最優(yōu)方案作為階梯分段方案的參考。

2.2 有效性評(píng)價(jià)的原理

評(píng)價(jià)聚類結(jié)果主要采用內(nèi)部質(zhì)量評(píng)價(jià)準(zhǔn)則和外部質(zhì)量評(píng)價(jià)準(zhǔn)則,其中內(nèi)部質(zhì)量評(píng)價(jià)準(zhǔn)則僅依賴數(shù)據(jù)集的固有特征和量值來進(jìn)行評(píng)價(jià),適合用來評(píng)價(jià)聚類效果的優(yōu)劣和判斷簇的最優(yōu)個(gè)數(shù)。

Yanchi Liu等[19]列舉了CH指標(biāo)、DB指標(biāo)、S_Dbw指標(biāo)等11種廣泛使用的內(nèi)部質(zhì)量評(píng)價(jià)方法,并結(jié)合實(shí)例,從識(shí)別單調(diào)性、噪聲、密度不均、亞群和偏態(tài)分布等五類不同干擾的能力上對(duì)這些方法進(jìn)行了對(duì)比驗(yàn)證,最后認(rèn)為S_Dbw指標(biāo)表現(xiàn)最為良好。Halkidi等[20]詳細(xì)介紹了S_Dbw指標(biāo)的定義方式。本文采用S_Dbw指標(biāo)來評(píng)價(jià)聚類有效性。

對(duì)于包含n個(gè)樣本的數(shù)據(jù)集S的一個(gè)劃分D={vi|i=1,2,…,k},對(duì)聚類的平均標(biāo)準(zhǔn)差stdev、方差σ2、密度函數(shù)density(uij) 、功能函數(shù)f(x,u)做預(yù)定義。如下:

(3)

(4)

(5)

(6)

(7)

由于聚類的目標(biāo)是使同一簇內(nèi)的對(duì)象盡可能相似且不同簇中的對(duì)象盡可能不同,因此內(nèi)部質(zhì)量評(píng)價(jià)準(zhǔn)則通常基于以下兩個(gè)標(biāo)準(zhǔn):簇間分離度和簇內(nèi)緊湊度。在S_Dbw指標(biāo)中,這兩個(gè)標(biāo)準(zhǔn)由簇間密度Dens_bw(k)和簇內(nèi)方差Scat(k)反映。

簇間密度定義

(8)

式中分子表示兩個(gè)簇的分界點(diǎn)附近的樣本密度,分母表示這兩個(gè)簇的聚類中心附近的樣本密度。如果兩個(gè)聚類中心分得很開則分子就較小,每個(gè)簇各自密度很高很緊湊則分母就較大。因此,簇間密度指標(biāo)越小,表示聚類效果越好。

簇內(nèi)方差定義

(9)

式中分子反映了每個(gè)簇內(nèi)部的各自的離散程度,分母反映了整個(gè)數(shù)據(jù)樣本集的離散程度。方差越大,表示特定數(shù)據(jù)集的離散程度越大。如果簇內(nèi)分布越緊密則分子就越小,簇間分布越離散則分母就越大。因此,簇內(nèi)方差指標(biāo)越小,表示聚類效果越好。

綜上,可將S_Dbw指標(biāo)定義為簇間密度指標(biāo)與簇內(nèi)方差指標(biāo)之和:

S_Dbw(k)=Dens_bw(k)+Scat(k)。

(10)

對(duì)于同一個(gè)數(shù)據(jù)集S,能使S_Dbw指標(biāo)最小化的值,則為能使聚類效果達(dá)到最優(yōu)的聚類簇?cái)?shù)。

3 實(shí)例分析

圖2 階梯分段方案實(shí)現(xiàn)流程圖

本文討論的基于k-means聚類的居民階梯電量制定方法,其具體實(shí)現(xiàn)流程如圖2所示?,F(xiàn)結(jié)合實(shí)例進(jìn)行分析。

3.1 數(shù)據(jù)采集

本文以西北地區(qū)某三線城市H市的居民家庭用電量數(shù)據(jù)進(jìn)行實(shí)例分析。該數(shù)據(jù)來源于2017年H市21 645戶居民家庭的實(shí)際年用電量數(shù)據(jù),樣本數(shù)據(jù)來自本地高中低檔小區(qū)的城市居民家庭以及轄區(qū)內(nèi)的農(nóng)村居民家庭。

圖3展示了H市居民家庭的年用電量與家庭數(shù)目的比例關(guān)系。由帕累托曲線可知,用電量最大的20%的家庭消耗了約40%的電能,而用電量較少的40%的家庭只消耗了約15%的電能。該地區(qū)的電能消費(fèi)分布不均。

圖4展示了H市居民家庭年用電量的概率分布情況,由圖可知,約90%的居民家庭用戶其年用電量在3300 kW·h以內(nèi),且總體上呈線性趨勢(shì)分布。

H市居民階梯電價(jià)現(xiàn)行標(biāo)準(zhǔn)于2012年頒布,執(zhí)行三段階梯分段,分段電量限值每月為180 kW·h和350 kW·h,折合每年為2160 kW·h和4200 kW·h。結(jié)合圖3可知,三段家庭用戶數(shù)量占比分別約為60%、38%、2%。前兩段覆蓋用戶比例明顯偏大,使得三段式階梯不能完全發(fā)揮理想的調(diào)節(jié)分檔作用,還可能導(dǎo)致電力公司的營(yíng)業(yè)損失。

圖3 用電量帕累托曲線 圖4 用電量概率分布曲線

3.2 數(shù)據(jù)處理

將樣本數(shù)據(jù)按照年用電量大小進(jìn)行排序,設(shè)定每戶保障電量為每月60 kW·h,極大電量為每月600 kW·h,折合為每年720 kW·h和每年7200 kW·h。按照此標(biāo)準(zhǔn)篩選出17 422戶數(shù)據(jù)樣本進(jìn)行聚類。通過數(shù)據(jù)篩選,可以人為提高初始階梯段的用戶覆蓋范圍,并且排除極大離群值對(duì)聚類準(zhǔn)確性的影響。

使用k-means算法將篩選后的數(shù)據(jù)進(jìn)行聚類,初始k值依次選擇為2到9,得到8組k值不同的聚類結(jié)果。表1展示了幾組聚類結(jié)果的S_Dbw指標(biāo),圖5展示了這些指標(biāo)的變化趨勢(shì)。

表1 聚類有效性評(píng)價(jià)指標(biāo)

圖5 聚類有效性評(píng)價(jià)指標(biāo)變化趨勢(shì)

3.3 分段階數(shù)的選取

由表1和圖5信息,結(jié)合S_Dbw指標(biāo)屬性可知,隨著k值的增加,聚類有效性遞增,但有效性的正向加速效率逐漸降低。

同時(shí)分析聚類結(jié)果,觀察到k值取6到9時(shí),聚類差異主要表現(xiàn)在對(duì)電量極大值的分配上。另外還應(yīng)考慮到,階梯分段數(shù)量過多,會(huì)對(duì)電力用戶的認(rèn)知、接納和電網(wǎng)企業(yè)的推廣、結(jié)算帶來諸多不便。綜合上述因素,可考慮選取k值為5。對(duì)各簇分界點(diǎn)數(shù)值適當(dāng)取整,結(jié)合整個(gè)數(shù)據(jù)樣本,得到各段電量界限以及用戶分布,如表2所示。

表2 階梯分段和用戶分布

表2中分段方案與H市現(xiàn)行方案相比,具有明顯的特點(diǎn),具體表現(xiàn)在:

(1)將原本的3段階梯細(xì)分為5段階梯,第1、2階屬于低電量段,第3、4階屬于中電量段,第5階屬于高電量段;低、中、高三階用戶覆蓋率大體上維持在原水平,但各段電量上限適當(dāng)降低,更適應(yīng)當(dāng)?shù)氐慕?jīng)濟(jì)發(fā)展水平。

(2)第1階用戶數(shù)超過40%,但用電量卻不到20%,將這部分用戶細(xì)分出來,能夠更有針對(duì)性地制定相應(yīng)的電價(jià)補(bǔ)貼政策,保障低收入群體的民生需求。

(3)中電量段的兩階共30%用戶消耗了超過50%的電量,這部分用戶屬于社會(huì)的中產(chǎn)階級(jí),是電力消費(fèi)的主力軍。

(4)在后續(xù)制定電價(jià)費(fèi)率時(shí),考慮保證電網(wǎng)在第3階的合理盈利,對(duì)于第4、5階用戶,應(yīng)該制定相對(duì)較高的費(fèi)率,引導(dǎo)用戶節(jié)能減排,同時(shí)達(dá)到對(duì)第1階的補(bǔ)貼作用。

4 結(jié) 論

本文結(jié)合電力大數(shù)據(jù)的發(fā)展背景,應(yīng)用k-means算法對(duì)地區(qū)家庭用戶的歷史用電量數(shù)據(jù)進(jìn)行聚類分析,并且選用S_Dbw指標(biāo)對(duì)聚類結(jié)果的有效性進(jìn)行驗(yàn)證,選擇最優(yōu)聚類方案,從而得到一種貼合當(dāng)?shù)貙?shí)際情況的階梯電價(jià)分段電量的制定方案。

在本文的基礎(chǔ)上,選擇合適的階梯費(fèi)率制定方案,以及將階梯電價(jià)與峰谷分時(shí)電價(jià)、居民電采暖電價(jià)等政策相結(jié)合,以更深入地進(jìn)行下一階段的研究。

猜你喜歡
用電量階梯電價(jià)
02 國(guó)家能源局:1~7月全社會(huì)用電量同比增長(zhǎng)3.4%
01 國(guó)家能源局:3月份全社會(huì)用電量同比增長(zhǎng)3.5%
國(guó)家能源局:3月份全社會(huì)用電量同比下降4.2%
德國(guó):電價(jià)上漲的背后邏輯
探索電價(jià)改革
良師·階梯·加油站
時(shí)光階梯
可再生能源電價(jià)附加的收支平衡分析
爭(zhēng)議光伏標(biāo)桿上網(wǎng)電價(jià)
藝術(shù)創(chuàng)意階梯