何 覓,覃日升,何 鑫,段銳敏,王廣雪,束洪春
(1.云南電網(wǎng)有限責(zé)任公司 昆明供電局,云南 昆明 650011;2.云南電力科學(xué)研究院,云南 昆明 650217;3.昆明理工大學(xué) 電力工程學(xué)院,云南 昆明 650500)
隨著智能電網(wǎng)建設(shè)的不斷推進(jìn),越來越多的智能電力設(shè)備比如智能電表被廣泛應(yīng)用,電力系統(tǒng)行業(yè)迎來“大數(shù)據(jù)時代”.面對龐大的電力用戶,很難對每個用戶單獨建模分析用戶特性,而是先要對典型用電用戶進(jìn)行準(zhǔn)確的劃分,以此遞推其他用戶[1-3].用戶負(fù)荷的增加需合理安排調(diào)整電網(wǎng)運行方式,將負(fù)荷轉(zhuǎn)化為電網(wǎng)的可調(diào)節(jié)資源,在電網(wǎng)出現(xiàn)或即將出現(xiàn)問題時,對負(fù)荷主動調(diào)節(jié)改變潮流分布,確保電網(wǎng)安全、經(jīng)濟(jì)、可靠運行.因此利用數(shù)據(jù)挖掘技術(shù)對大量用戶負(fù)荷數(shù)據(jù)進(jìn)行有效劃分,有助于電網(wǎng)人員深度分析電網(wǎng)運行方式,為電網(wǎng)穩(wěn)定運行提供保障.負(fù)荷聚類分析是指對電力負(fù)荷按時間序列進(jìn)行科學(xué)有效地劃分,通過聚類分析挖掘出不同種類負(fù)荷間的關(guān)系及構(gòu)成,在大量無序的負(fù)荷中挖掘出潛藏的負(fù)荷模式,并對其進(jìn)行歸類.此方法有助于調(diào)度人員了解用戶用電行為,為電力負(fù)荷預(yù)測、需求側(cè)響應(yīng)分析提供保障[4-5].
文獻(xiàn)[6]首先利用綜合評價體系對用戶進(jìn)行初次分類,其次在考慮季節(jié)變化和工作日上對每類用戶的用電負(fù)荷運用K-means二次聚類,最后運用標(biāo)桿分析的方法進(jìn)行評價,但該算法K值的選取不好把握,難以尋找全局最優(yōu)解.文獻(xiàn)[7]提出一種降維思想的日負(fù)荷曲線分類方法,通過對日負(fù)荷曲線所選取的特征進(jìn)行降維、配比權(quán)重及利用歐式距離作為判據(jù),很大程度上縮短程序運行時間,但該算法涉及專家打分制,結(jié)果受個人主觀影響.文獻(xiàn)[8]提出一種高斯混合模型(Gaussian Mixture Model,GMM)分類算法,從大量負(fù)荷數(shù)據(jù)中提取典型日負(fù)荷曲線,再將已知用戶打標(biāo)簽作為訓(xùn)練集,最后利用支持向量機(jī)建立典型負(fù)荷與行業(yè)用戶相關(guān)模型,屬于半監(jiān)督聚類,引入測試集進(jìn)行行業(yè)判別.支持向量機(jī)(Support Vector Machine,SVM)擁有優(yōu)秀的泛化能力,但訓(xùn)練時間較長.文獻(xiàn)[9]提出一種采用中心優(yōu)化和雙尺度相似性度量的改進(jìn)K-means負(fù)荷聚類方法,引入局部密度思想獲得負(fù)荷曲線的初始中心,解決了K-means隨機(jī)化帶來的不穩(wěn)定問題,但未考慮噪聲對歐式距離的影響.文獻(xiàn)[10]提出一種基于粒子群優(yōu)化分段聚合近似的負(fù)荷分類方法,該方法通過壓縮手段對日負(fù)荷曲線降維,并利用粒子群算法優(yōu)化最優(yōu)分類數(shù),但降維喪失了原始日負(fù)荷曲線的部分特征,且只優(yōu)化了最優(yōu)分類數(shù),未對初始聚類中心優(yōu)化,造成日負(fù)荷曲線聚類準(zhǔn)確性降低.
綜上,大多數(shù)日負(fù)荷曲線聚類算法易陷入局部最優(yōu)解,未得到最優(yōu)初始聚類中心,使得分類結(jié)果產(chǎn)生偏差;少數(shù)算法為了提高算法準(zhǔn)確性,未顧及算法的快速性.因此本文提出一種基于融合進(jìn)化算法優(yōu)化模糊C均值(Fuzzy C-Means,F(xiàn)CM)的用戶日負(fù)荷曲線聚類方法.該方法首先基于重心Lagrange與線性函數(shù)歸一化的數(shù)據(jù)預(yù)處理方法對數(shù)據(jù)進(jìn)行預(yù)處理,并整合遺傳算法與模擬退火算法的優(yōu)點尋找FCM最優(yōu)初始聚類中心;然后給出模擬退火溫度迭代曲線,在迭代至22次時達(dá)到了算法要求,迭代次數(shù)較少.與未優(yōu)化FCM進(jìn)行分類結(jié)果準(zhǔn)確性的對比,結(jié)果顯示融合進(jìn)化算法優(yōu)化FCM解決了傳統(tǒng)FCM局部最優(yōu)解的問題,使得分類結(jié)果更準(zhǔn)確,最后采用云南某地區(qū)實際日負(fù)荷曲線驗證該算法在一定噪聲下仍能準(zhǔn)確進(jìn)行負(fù)荷分類.
傳統(tǒng)負(fù)荷分類按用電部門可分為工業(yè)、商業(yè)、農(nóng)業(yè)、教育四類.工業(yè)包括重工業(yè)與輕工業(yè),輕工業(yè)包含煙草、紡織、食品等,重工業(yè)包括冶金(電解鋁)、煤炭、機(jī)械制造等,大部分工業(yè)企業(yè)實行三班制連續(xù)工作,負(fù)荷率較高;商業(yè)負(fù)荷主要包括動力、照明、制冷等,且商業(yè)性負(fù)荷在營業(yè)開始后較平穩(wěn),營業(yè)結(jié)束呈低負(fù)荷狀態(tài);農(nóng)業(yè)負(fù)荷一般為農(nóng)機(jī)、畜牧、灌溉等,畜牧、灌溉通常隔一段時間運作一次,因此農(nóng)業(yè)負(fù)荷呈現(xiàn)出不連續(xù)性;教育負(fù)荷主要表現(xiàn)在上午、下午用電量多,中午休息造成負(fù)荷率降低,負(fù)荷曲線呈雙峰狀.不同行業(yè)負(fù)荷由其所在部門的電器消耗功率組成,不同行業(yè)設(shè)備運行所產(chǎn)生的功率也不盡相同,負(fù)荷特征有所區(qū)別.
為準(zhǔn)確描述用戶用電負(fù)荷特征,需建立具體特征指標(biāo)實現(xiàn)負(fù)荷分析及計算.負(fù)荷特征指標(biāo)按不同計算方法可分為比較類型、曲線類型和描述類型三類,負(fù)荷特征指標(biāo)體系如圖1所示[11].其中,用戶負(fù)荷隨時間變化的曲線稱作負(fù)荷曲線,不同用戶類型的負(fù)荷曲線有所不同,同一用戶類型的負(fù)荷曲線在不同季節(jié)、特定時間段(如節(jié)假日)所表現(xiàn)的負(fù)荷曲線也不盡相同,電網(wǎng)人員可根據(jù)負(fù)荷曲線進(jìn)行規(guī)劃調(diào)度.
圖1 用戶用電負(fù)荷特征指標(biāo)Fig.1 Consumer electricity load characteristic index
某商業(yè)用戶有功功率日負(fù)荷曲線(以下簡稱負(fù)荷曲線)如圖2所示.商業(yè)日負(fù)荷曲線在營業(yè)開始后起負(fù)荷,且較平穩(wěn),營業(yè)結(jié)束后呈低負(fù)荷狀態(tài).負(fù)荷曲線可為發(fā)電廠制訂發(fā)電計劃提供有效依據(jù).
圖2 某商業(yè)用戶有功功率日負(fù)荷曲線Fig.2 A commercial active power daily load curve
設(shè)有n條用戶日負(fù)荷曲線,每條曲線維數(shù)為m,構(gòu)成n×m階日負(fù)荷曲線矩陣,記初始矩陣為X.負(fù)荷異常數(shù)據(jù)包括數(shù)據(jù)缺失以及突變.測量裝置的損壞以及異常工作狀態(tài)可能導(dǎo)致數(shù)據(jù)缺失;測量裝置到分析終端的傳輸可能導(dǎo)致數(shù)據(jù)突變,包括傳輸中的噪聲、測量偏差等.大多聚類算法對異常數(shù)據(jù)不具備自適應(yīng)能力,異常數(shù)據(jù)可能導(dǎo)致錯誤聚類,所以需要對異常數(shù)據(jù)進(jìn)行清洗.
當(dāng)某條數(shù)據(jù)的缺失及突變測量點達(dá)到10%及以上,認(rèn)為該數(shù)據(jù)無效,剔除該條數(shù)據(jù).設(shè)需要剔除的數(shù)據(jù)為x條,則有效數(shù)據(jù)包含n-x條,形成(n-x)×m的新矩陣,記為Z.當(dāng)某條數(shù)據(jù)的缺失及突變測量點小于10%,僅需對缺失點及突變點利用拉格朗日插值進(jìn)行填補即可[12-13].
Lagrange插值法定義如下:現(xiàn)有k+1個節(jié)點的多項式函數(shù)(x0,y0),…,(xk,yk),其中xj為自變量,yj為因變量(j=0,…,k).設(shè)函數(shù)中任意兩個xj互異,則Lagrange插值多項式為:
(1)
式中,lj(x)為Lagrange插值基函數(shù):
(2)
Lagrange插值法公式結(jié)構(gòu)整齊緊湊,在理論分析中十分方便,但插值點增加或減少時,所對應(yīng)的基函數(shù)要重新計算,過程繁瑣,因此利用重心Lagrange插值法解決此問題.
(3)
Lagrange基函數(shù)可重新定義為:
(4)
式中,l(x)=(x-x0)…(x-xk),則經(jīng)改進(jìn)后的Lagrange插值多項式為:
(5)
改進(jìn)后的插值多項式優(yōu)點為當(dāng)插值點增加一個時,每個ωj都除以xj-xk+1便得到重心權(quán)ωk+1,計算復(fù)雜度為O(n),相比傳統(tǒng)的基本多項式復(fù)雜度O(n2)減少一個量級.
將改進(jìn)后的Lagrange插值多項式對函數(shù)g(x)≡1插值,得到:
(6)
(7)
式(7)為重心Lagrange插值公式,其優(yōu)點為在計算L′(x)時不必計算l(x),可大幅度減少計算量.
數(shù)據(jù)歸一化處理是數(shù)據(jù)挖掘的前期準(zhǔn)備工作,日負(fù)荷曲線因用戶屬性不同往往量綱不盡相同,數(shù)據(jù)歸一化處理可消除指標(biāo)之間的量綱影響,使得結(jié)果分析更加準(zhǔn)確.原始日負(fù)荷曲線經(jīng)過數(shù)據(jù)歸一化后,各維度處于同一量級,適合對比評價分析.線性函數(shù)歸一化(Min-Max scaling)與0均值標(biāo)準(zhǔn)化(Z-score standardization)是常用的兩種歸一化方法.其中Z-score歸一化后的數(shù)據(jù)最終結(jié)果不一定落在0到1之間,對日負(fù)荷曲線的聚類可能造成偏差,所以本文采用線性函數(shù)歸一化日負(fù)荷曲線.線性函數(shù)歸一化公式如下:
(8)
同一行業(yè)的日負(fù)荷曲線具有相似性,例如大工業(yè)用電一般進(jìn)行連續(xù)生產(chǎn),全天負(fù)荷率高;而一般商業(yè)是在早上9點到夜晚10點負(fù)荷較大,其他時間負(fù)荷??;農(nóng)業(yè)負(fù)荷因電機(jī)間接性啟動,負(fù)荷也呈間接性波動;教育類負(fù)荷在上午、下午兩段時間呈現(xiàn)較大負(fù)荷,其他時間負(fù)荷較小.不同行業(yè)的日負(fù)荷曲線負(fù)荷特性差異較大,F(xiàn)CM的本質(zhì)是計算聚類曲線與聚類中心各點之間的歐氏距離,曲線相似度小,曲線之間的歐氏距離大,以此提出基于FCM的負(fù)荷曲線聚類方法,F(xiàn)CM根據(jù)距離函數(shù)確定樣本的相似程度.
模糊C均值屬于模式識別領(lǐng)域分支,廣泛應(yīng)用于電力系統(tǒng)、計算機(jī)科學(xué)、自動化技術(shù)等領(lǐng)域.電力系統(tǒng)中日負(fù)荷曲線的分類也屬于模式識別問題,為快速實現(xiàn)日負(fù)荷曲線的快速、實時、準(zhǔn)確的劃分,本文采用了FCM聚類算法作為主體算法[14].FCM聚類融合了模糊理論的精髓,將模糊集理論和聚類理論相結(jié)合,根據(jù)樣本內(nèi)在規(guī)律,將樣本分為多個模糊組,通過距離函數(shù)確定樣本間的相似度,利用數(shù)學(xué)規(guī)劃理論獲得最優(yōu)聚類結(jié)果.
FCM聚類算法:數(shù)據(jù)預(yù)處理后得矩陣Z={z1,m,z2,m,…,zn-x,m},其中n-x為清洗后的樣本數(shù)量,每個樣本為m維向量.將所有樣本分為c個類型,2≤c≤n-x,相似分類矩陣U={u1,u2,…,uc},V={v1,v2,…,vc}為各類型的聚類中心,則目標(biāo)函數(shù)Jr為:
(9)
式中:uik為樣本zij對于類型Uk的隸屬度,uik∈[0,1],r為模糊指數(shù).算法尋優(yōu)期間,要求隸屬度和為1,即:
(10)
dik表示第i個負(fù)荷數(shù)據(jù)與第k個聚類中心的歐式距離:
(11)
FCM算法需要尋得目標(biāo)函數(shù)Jr的最小值,可利用Lagrange函數(shù)對目標(biāo)函數(shù)求解,得到最優(yōu)解uik與vik:
(12)
(13)
FCM聚類算法屬于局部搜索算法,搜索速度快,但聚類結(jié)果過于依賴初始聚類中心,容易收斂于局部極值點,陷入局部最優(yōu)解,最終導(dǎo)致日負(fù)荷曲線分類結(jié)果出現(xiàn)偏差.大數(shù)據(jù)監(jiān)測識別應(yīng)用系統(tǒng)中,日負(fù)荷曲線的分類需要保證算法能夠求得最優(yōu)解,否則聚類質(zhì)量無法保證,因此提出融合進(jìn)化算法優(yōu)化FCM以便得到初始聚類中心的全局最優(yōu)解,達(dá)到最優(yōu)聚類效果.
進(jìn)化算法也被稱為演化算法(Evolutionary Algorithms,EAs).進(jìn)化算法借鑒大自然中生物的進(jìn)化操作,一般包括基因編碼、種群初始化和交叉變異算子等基本操作.遺傳算法(Genetic Algorithm,GA)是一種最基本的進(jìn)化算法.1975年,Holland教授等提出基于遺傳學(xué)機(jī)理與自然選擇的遺傳算法,該算法將個體的隨機(jī)信息交換機(jī)制與適者生存規(guī)則結(jié)合在一起,模擬自然進(jìn)化過程搜索最優(yōu)解.遺傳算法對目標(biāo)函數(shù)的約束較少,全局搜索能力強(qiáng),魯棒性強(qiáng),但是遺傳算法在后期容易出現(xiàn)“早期早熟、后期進(jìn)化停滯”的收斂現(xiàn)象,即容易陷入局部最優(yōu)解.模擬退火算法(Simulated Annealing,SA)是一種貪心算法,在一定的概率情況下接受較差解,有概率跳出局部最優(yōu)解,尋找到全局最優(yōu)解[15-16].該算法的局部搜索能力較強(qiáng),計算時間較短,但是由于其不能完全掌握整個搜索空間的情況,導(dǎo)致該算法的全局搜索效率不高.本文融合模擬退火與遺傳算法(SAGA)的優(yōu)點對初始聚類中心尋優(yōu).融合進(jìn)化算法的基本原理是將GA算法初始種群的個體適應(yīng)度值作為SA算法的初始解[17];將GA算法經(jīng)過選擇、交叉、變異等進(jìn)化過程得到的下一代種群的個體適應(yīng)度值作為SA算法的新解;將SA算法中滿足Metropolis準(zhǔn)則的解對應(yīng)的個體匯集在一起作為GA算法下一代的初始種群.因此有機(jī)結(jié)合SAGA改進(jìn)傳統(tǒng)FCM算法可更加高效求得全局最優(yōu)解.
融合進(jìn)化算法優(yōu)化FCM具體算法步驟如下:
Step 1:初始化SAGA-FCM算法參數(shù).除3.1節(jié)所提到的FCM聚類算法的參數(shù),還需初始化模擬退火參數(shù):初始退火溫度T0,終止溫度Te,冷卻系數(shù)p.初始化遺傳算法參數(shù):種群個體數(shù)目sizepop,最大遺傳代數(shù)MAXGEN,交叉概率Pc,變異概率Pm.
Step 2:隨機(jī)選定日負(fù)荷曲線初始聚類中心,初始化遺傳算法種群Chrom.
Step 3:計算日負(fù)荷曲線各聚類樣本個體隸屬度、個體適應(yīng)度fi=ranking(Jr),其中i=1,2,…,sizepop.
Step 4:設(shè)定遺傳代數(shù)初值gen=0.
Step 6:若遺傳算法進(jìn)化次數(shù)gen Step 7:若退火溫度T 融合進(jìn)化算法優(yōu)化FCM流程如圖3所示. 圖3 融合進(jìn)化算法優(yōu)化FCM流程圖Fig.3 Fusion evolutionary algorithm to optimize FCM flow chart 選取云南某地區(qū)若干用戶96點(采樣點間隔 15 min)日負(fù)荷曲線作為研究對象,用戶選取范圍包括工業(yè)、商業(yè)、農(nóng)業(yè)、教育四類用電行業(yè)共412條數(shù)據(jù),以此檢驗本文所提方法的準(zhǔn)確性. 剔除無效數(shù)據(jù)(缺失10個采樣點及以上)12條,剩余400條數(shù)據(jù),對剔除后的原始數(shù)據(jù)利用重心Lagrange插值法進(jìn)行缺失數(shù)據(jù)的填補.以某工業(yè)用戶為例,原始日負(fù)荷曲線數(shù)據(jù)缺失5個采樣點,根據(jù)刪補原則,為達(dá)到刪除要求,對數(shù)據(jù)進(jìn)行填補即可.數(shù)據(jù)填補前后如圖4所示. 圖4 重心Lagrange插值法填補數(shù)據(jù)前后對比圖Fig.4 Contrast chart before and after data filling by Lagrange interpolation 給出不同行業(yè)日負(fù)荷曲線各一條,歸一化后的日負(fù)荷曲線如圖5所示. 圖5 不同行業(yè)歸一化后的日負(fù)荷曲線Fig.5 Normalized daily load curves of different industries SAGA-FCM算法所涉及的參數(shù)如表1所示. 表1 算法參數(shù)Tab.1 Algorithm parameters 將400條預(yù)處理后的數(shù)據(jù)分別進(jìn)行FCM與SAGA-FCM分類,聚類中心結(jié)果如圖6所示. 從圖6可以看出,由于傳統(tǒng)的FCM易陷入局部最優(yōu)解,其中兩個聚類中心距離較近,產(chǎn)生了混疊現(xiàn)象;經(jīng)SAGA優(yōu)化后的FCM尋找全局最優(yōu)解,四個聚類中心距離較遠(yuǎn),分類結(jié)果清晰.雖然SAGA-FCM較傳統(tǒng)FCM聚類中心距離較遠(yuǎn),不易產(chǎn)生混疊現(xiàn)象,但SAGA-FCM仿真時間較長,對于本文所使用的400條實際數(shù)據(jù),F(xiàn)CM運行時間為0.11s,SAGA-FCM運行時間為0.57s.優(yōu)化前后聚類中心坐標(biāo)值如表2所示,聚類中心之間的的距離如表3所示. (a)FCM聚類結(jié)果 (b)SAGA-FCM聚類結(jié)果圖6 不同行業(yè)聚類中心Fig.6 Different industry cluster centers 表2 FCM優(yōu)化前后聚類中心坐標(biāo)Tab.2 Cluster center coordinates before and after FCM optimization 表3 FCM聚類中心之間距離Tab.3 Distance between FCM cluster centers 由表3可以看出FCM聚類中心d2、d3距離為0.02,SAGA-FCM聚類中心d2、d3距離為0.17,相較于FCM聚類中心d2、d3之間的距離,SAGA-FCM聚類中心d2、d3距離之間區(qū)分度較大,不易陷入混疊現(xiàn)象,聚類結(jié)果更準(zhǔn)確. 模擬退火溫度迭代曲線如圖7所示.SAGA-FCM對用戶負(fù)荷曲線聚類后的結(jié)果如圖8所示. 圖7 模擬退火溫度迭代曲線Fig.7 Simulated annealing temperature iteration curve 圖8 SAGA-FCM分類結(jié)果Fig.8 SAGA-FCM classification results SAGA-FCM算法將400條數(shù)據(jù)準(zhǔn)確分為4類,其中用戶類別I呈現(xiàn)雙峰狀態(tài),此類用戶多為教育類行業(yè),此類行業(yè)清晨起負(fù)荷,上午和下午負(fù)荷較高,中午需要休息,所示負(fù)荷略微下降;用戶類別II呈峰平狀態(tài),此類行業(yè)多為工業(yè),工業(yè)包含各種大型機(jī)器,大型機(jī)器負(fù)荷較高,且為保證效益,需全天運行,因此呈高負(fù)荷峰平狀態(tài);用戶類別III多為商業(yè),上午9點起負(fù)荷,持續(xù)至晚上10點,符合商業(yè)運行模式;用戶類別IV多為農(nóng)業(yè),農(nóng)業(yè)機(jī)組多數(shù)在白天運行,且運行周期不定,時長較短,如灌溉、畜牧. 對原始日負(fù)荷曲線增加 30 db 噪聲進(jìn)行聚類,驗證本文算法對噪聲干擾具有較強(qiáng)魯棒性. (a)各行業(yè)分類結(jié)果 (b)各行業(yè)聚類中心圖9 增加 30 db 噪聲SAGA-FCM分類結(jié)果Fig.9 Classification results of SAGA-FCM with 30 dB noise added 從圖9可以看出,增加 30 db 噪聲后本文所提算法依舊可以準(zhǔn)確分類,聚類中心距離依舊較遠(yuǎn),分類清晰.聚類中心坐標(biāo)及聚類中心間的距離如表4、表5所示. 由表4、表5知,30 db 噪聲下SAGA優(yōu)化FCM后各聚類中心距離均大于0.1,聚類效果較好,因此從工程角度看,SAGA-FCM算法分類較合理. 表4 30 db噪聲下聚類中心坐標(biāo)Tab.4 Cluster center coordinates after adding 30 dB noise 表5 30 db噪聲下聚類中心之間距離Tab.5 Distance between cluster centers under 30 dB noise 將本文所提SAGA-FCM負(fù)荷分類算法與K-means、PSO-kmeans算法做對比,驗證本文所提算法的優(yōu)勢.K-means、PSO-kmeans對 30 db 噪聲下日負(fù)荷曲線分類結(jié)果如圖10所示. (a)K-means分類結(jié)果 (b)PSO-Kmeans分類結(jié)果圖10 增加30 db噪聲K-means與PSO-Kmeans分類結(jié)果Fig.10 K-means and PSO-Kmeans classification results with 30 db noise added 由圖10知,利用K-means與PSO-Kmeans對增加 30 db 的日負(fù)荷曲線分類結(jié)果均不準(zhǔn)確,利用K-means對日負(fù)荷曲線進(jìn)行分類,部分居民負(fù)荷與商業(yè)負(fù)荷、農(nóng)業(yè)負(fù)荷分為一類;利用PSO-Kmeans分類時居民負(fù)荷與商業(yè)負(fù)荷分為一類,而農(nóng)業(yè)負(fù)荷分為兩類,分類準(zhǔn)確性低.綜上,相較于K-means、PSO-Kmeans等算法,本文所提SAGA-FCM在 30 db 噪聲下仍能準(zhǔn)確進(jìn)行負(fù)荷分類. 運用聚類算法挖掘電力系統(tǒng)日負(fù)荷曲線的負(fù)荷模式需要精準(zhǔn)分類模型.針對傳統(tǒng)負(fù)荷分類算法易陷入局部最優(yōu)解而無法準(zhǔn)確分類的問題,本文提出一種融合進(jìn)化算法優(yōu)化FCM的負(fù)荷聚類算法. 1)利用重心Lagrange插值法解決日負(fù)荷曲線數(shù)據(jù)缺失問題,提出一種基于FCM的日負(fù)荷曲線聚類算法,但FCM因初始聚類中心選擇不當(dāng)易陷入局部最優(yōu)解.模擬退火尋優(yōu)能力強(qiáng),遺傳算法全局搜索能力強(qiáng),融合SAGA優(yōu)化 FCM能夠計算出全局最優(yōu)解,使分類結(jié)果最優(yōu). 2)利用實際日負(fù)荷曲線驗證算法準(zhǔn)確性,結(jié)果表明在數(shù)據(jù)量較大的情況下仍具有較高的分類準(zhǔn)確率,給出聚類中心,使分類結(jié)果更具可視化,增加30db噪聲驗證了SAGA-FCM魯棒性較強(qiáng). 3)該方法涉及SAGA優(yōu)化,相比于傳統(tǒng)FCM計算速度較慢.如何對數(shù)據(jù)進(jìn)行降維處理,提高算法運行速度是本文下一步的工作.4 算例驗證
4.1 實際數(shù)據(jù)預(yù)處理
4.2 SAGA-FCM分類結(jié)果與評價
4.3 魯棒性分析
4.4 算法對比
5 結(jié) 論