王文生,王 進(jìn),王科文
(1.長(zhǎng)沙理工大學(xué)電氣與信息工程學(xué)院,長(zhǎng)沙 410114;2.湛江中心人民醫(yī)院,湛江 524037)
在電力系統(tǒng)運(yùn)行分析與仿真計(jì)算中,將變電站母線或線路供電的所有用戶的集合稱(chēng)為綜合負(fù)荷。綜合負(fù)荷從電網(wǎng)吸收的功率隨母線電壓與頻率而變化的關(guān)系稱(chēng)為綜合負(fù)荷特性[1]。工程中用到的負(fù)荷模型要求有一定的精度且簡(jiǎn)單實(shí)用,又隨著負(fù)荷特性記錄裝置記錄的負(fù)荷特性數(shù)據(jù)不斷積累,對(duì)負(fù)荷動(dòng)態(tài)特性的聚類(lèi)與綜合是負(fù)荷模型走向?qū)嵱没挠行侄巍X?fù)荷動(dòng)特性的分類(lèi)包括特征向量的選取和聚類(lèi)方法的確定兩方面。
較早提出的最小距離分類(lèi)法和貝葉斯分類(lèi)法等統(tǒng)計(jì)模式識(shí)別方法使用的模型過(guò)于簡(jiǎn)單,相應(yīng)的負(fù)荷特性聚類(lèi)效果不盡人意。文獻(xiàn)[3]首次提出負(fù)荷特性分類(lèi)與綜合的理論和實(shí)踐方法;文獻(xiàn)[4]提出應(yīng)用KOHONEN神經(jīng)網(wǎng)絡(luò)對(duì)負(fù)荷動(dòng)態(tài)特性進(jìn)行聚類(lèi);文獻(xiàn)[5]應(yīng)用模糊等價(jià)關(guān)系對(duì)電力系統(tǒng)負(fù)荷特性進(jìn)行分類(lèi)與綜合研究;文獻(xiàn)[6,7]分別基于模型激勵(lì)響應(yīng)和軌跡靈敏度對(duì)負(fù)荷特性進(jìn)行分類(lèi)。
SOM神經(jīng)網(wǎng)絡(luò)[2],即自組織特征映射神經(jīng)網(wǎng)絡(luò),它將多維數(shù)據(jù)映射到低維規(guī)則網(wǎng)絡(luò)中,屬于無(wú)監(jiān)督競(jìng)爭(zhēng)學(xué)習(xí)算法,可有效進(jìn)行大規(guī)模的數(shù)據(jù)挖掘,且速度快,但不能提供分類(lèi)后精確的聚類(lèi)信息。而C-均值聚類(lèi)在已知聚類(lèi)數(shù)目和中心點(diǎn)的情況下有著很高的精確性,比較適用于中小型數(shù)據(jù)集。結(jié)合這兩種算法的優(yōu)缺點(diǎn),本文提出基于SOM神經(jīng)網(wǎng)絡(luò)的C-均值聚類(lèi)算法的負(fù)荷特性分類(lèi),對(duì)于分類(lèi)樣本龐大的應(yīng)用場(chǎng)合,以此算法為基礎(chǔ)的建模實(shí)踐表明了該方法的適應(yīng)性和有效性。
SOM神經(jīng)網(wǎng)絡(luò)是由Kohonen教授提出的對(duì)神經(jīng)網(wǎng)絡(luò)的數(shù)值模擬方法。該網(wǎng)絡(luò)由輸入層和輸出層組成。其中輸入層神經(jīng)元個(gè)數(shù)的選取按輸入網(wǎng)絡(luò)的向量個(gè)數(shù)而定,輸入神經(jīng)元接收網(wǎng)絡(luò)的輸入信號(hào),輸出層則是由神經(jīng)元按一定的方式排列成一個(gè)平面。輸入層的神經(jīng)元與輸出層的神經(jīng)元通過(guò)權(quán)值聯(lián)結(jié)在一起。當(dāng)網(wǎng)絡(luò)接收到外部輸入信號(hào)后,輸出層的某個(gè)神經(jīng)元便會(huì)興奮起來(lái)。自組織特征映射神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)如圖1所示。
圖1 SOM神經(jīng)網(wǎng)絡(luò)Fig.1 SOM neural network
SOM神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)具有兩個(gè)明顯特點(diǎn):其一,拓?fù)溆成浣Y(jié)構(gòu)不是通過(guò)神經(jīng)元的運(yùn)動(dòng)重新組織實(shí)現(xiàn)的,而是由各神經(jīng)元在不同興奮狀態(tài)下構(gòu)成一個(gè)整體,所形成的拓?fù)浣Y(jié)構(gòu);其二,這種拓?fù)溆成浣Y(jié)構(gòu)的形成具有自組織特點(diǎn),還具有按幾何中心或特征進(jìn)行聚類(lèi)的獨(dú)特性質(zhì)。SOM神經(jīng)網(wǎng)絡(luò)是一種無(wú)監(jiān)督的學(xué)習(xí)模式,它可將數(shù)據(jù)從高維空間映射到低維空間上,經(jīng)降維尋找到多維數(shù)據(jù)的主要統(tǒng)計(jì)特征,并根據(jù)數(shù)據(jù)間的相似性自動(dòng)將數(shù)據(jù)分成不同類(lèi)別,以此達(dá)到增強(qiáng)顧客有用信息、降低噪聲的目的。但SOM神經(jīng)網(wǎng)絡(luò)不能提供分類(lèi)后精確的聚類(lèi)信息。
C-均值聚類(lèi)算法是一種應(yīng)用較廣泛的聚類(lèi)算法,該方法簡(jiǎn)單、快速以及能有效處理大型數(shù)據(jù)庫(kù)。但是C-均值聚類(lèi)算法存在一些缺點(diǎn):1)隨機(jī)選取初始值可能會(huì)導(dǎo)致不同的聚類(lèi)結(jié)果,甚至可能無(wú)解;2)該算法基于梯度下降,故有可能陷入局部極優(yōu);3)該算法要求預(yù)先輸入聚類(lèi)數(shù)目,但很多情況下聚類(lèi)數(shù)目是未知的;4)該算法對(duì)“噪音”和孤立點(diǎn)數(shù)據(jù)有些敏感,少量的該類(lèi)數(shù)據(jù)能對(duì)平均值產(chǎn)生很大影響。
許多研究者對(duì)C-均值聚類(lèi)算法進(jìn)行各種改進(jìn)。其中常見(jiàn)的是結(jié)合遺傳算法對(duì)C-均值聚類(lèi)算法進(jìn)行改進(jìn),但當(dāng)樣本數(shù)目、維數(shù)和類(lèi)別較大時(shí),這種算法會(huì)出現(xiàn)過(guò)早收斂于局部極值點(diǎn)的問(wèn)題。
本文提出的基于SOM神經(jīng)網(wǎng)絡(luò)的C-均值聚類(lèi)算法須由兩階段實(shí)現(xiàn)。
第一階段通過(guò)SOM網(wǎng)絡(luò)初始聚類(lèi),得到聚類(lèi)數(shù)目和各類(lèi)中心點(diǎn)。
1)設(shè)輸入矢量,即負(fù)荷特性向量集合為X=[x1,x2,x3,…,xn]T,第 i神經(jīng)元的權(quán)系數(shù)構(gòu)成的加權(quán)矢量wi= [wi0,wi1,…,win]T,在沒(méi)有反饋的情況下,神經(jīng)元的穩(wěn)態(tài)輸出值為
2)找到y(tǒng)i取最大值時(shí)的神經(jīng)元i,則其為最佳匹配單元c。
3)為使網(wǎng)絡(luò)具有一種聚類(lèi)功能,定義最佳匹配單元c的一個(gè)拓?fù)溧徲騈c,使Nc內(nèi)的單元輸出為1,Nc外的單元輸出為0,即
4)權(quán)值的訓(xùn)練公式為
式中0<a(t)<1,為學(xué)習(xí)因子。權(quán)值訓(xùn)練后返回步驟2),直到Nc或a(t)滿足要求為止。
5)輸入下一個(gè)輸入矢量,轉(zhuǎn)入1)進(jìn)行下一輪的學(xué)習(xí),直到所有的樣本都學(xué)習(xí)完為止。
6)輸出聚類(lèi)數(shù)目C和聚類(lèi)中心Z={Z1,Z2,…,Zc}。
第二階段將第一階段的輸出結(jié)果作為C-均值算法的初始輸入,進(jìn)行迭代。
7)選擇閾值ε,置迭代次數(shù)k=0,以步驟6)的輸出結(jié)果作為C-均值聚類(lèi)算法的初始輸入值進(jìn)行迭代計(jì)算,直至收斂。
8)輸出聚類(lèi)信息。
聚類(lèi)過(guò)程是在特征空間進(jìn)行的,因此樣本特征向量的選取相當(dāng)關(guān)鍵。對(duì)于負(fù)荷分類(lèi),應(yīng)用最為廣泛的特征向量包括:負(fù)荷的實(shí)測(cè)響應(yīng)、標(biāo)準(zhǔn)電壓激勵(lì)下的模型響應(yīng)、負(fù)荷模型參數(shù)。
采用模型參數(shù)作為負(fù)荷特性分類(lèi)特征向量,用具有全局收斂性的遺傳算法進(jìn)行模型參數(shù)辨識(shí),遺傳算法具有很好的全局尋優(yōu)能力,辨識(shí)得到的參數(shù)較穩(wěn)定。根據(jù)文獻(xiàn)[8],參數(shù)靈敏度[8]反映了模型參數(shù)取值對(duì)模型響應(yīng)的影響程度。若由于參數(shù)靈敏度過(guò)小而在模型響應(yīng)中看不到參數(shù)變化產(chǎn)生的貢獻(xiàn),則所辨識(shí)的結(jié)果誤差相對(duì)較大,即靈敏度小的參數(shù)在辨識(shí)結(jié)果中呈現(xiàn)較大分散性??紤]每個(gè)參數(shù)辨識(shí)結(jié)果誤差不同,故對(duì)不同參數(shù)取不同的權(quán)值。對(duì)于辨識(shí)結(jié)果誤差較小的參數(shù)取較大的權(quán)值,而對(duì)誤差較大的參數(shù)則選取較小的權(quán)值。
1)對(duì)采集到的n組負(fù)荷擾動(dòng)數(shù)據(jù)分別進(jìn)行辨識(shí),得出相應(yīng)的模型參數(shù)辨識(shí)結(jié)果為x=(x1,x2,…,xn),其中的每個(gè)xi表示為xi=[GBRsx'T0nH](i=1,2,…,n)。
2)對(duì)原始數(shù)據(jù)進(jìn)行歸一化。由于采集的各數(shù)據(jù)單位不一致,可能引起網(wǎng)絡(luò)訓(xùn)練時(shí)間增加,還可能引起網(wǎng)絡(luò)無(wú)法收斂,所以需要在進(jìn)行聚類(lèi)之前對(duì)要處理的數(shù)據(jù)限制在一定范圍內(nèi)。這里采用數(shù)據(jù)極差正規(guī)化方法,如式(4)所示。
式中:[xij]min為第j列元素的最小值;[xij]max為第j列元素的最大值。
3)權(quán)值處理。根據(jù)前人研究成果,各參數(shù)取值情況如表1。將要分類(lèi)的輸入樣本就可表示成:
表1 負(fù)荷模型參數(shù)權(quán)值的選取Tab.1 Selection of parameters weight
算例數(shù)據(jù)來(lái)自動(dòng)模實(shí)驗(yàn)[9],其中實(shí)驗(yàn)數(shù)據(jù)的負(fù)荷為恒阻抗加感應(yīng)電動(dòng)機(jī)形式,分別代表對(duì)應(yīng)民用和商業(yè)的靜態(tài)負(fù)荷及工業(yè)的動(dòng)態(tài)負(fù)荷。采用遺傳算法對(duì)處理過(guò)的動(dòng)模數(shù)據(jù)進(jìn)行綜合電動(dòng)機(jī)負(fù)荷模型參數(shù)辨識(shí),辨識(shí)結(jié)果、樣本負(fù)荷構(gòu)成及電壓擾動(dòng)情況如表2??芍瑯颖竟灿?類(lèi)。第1類(lèi)為樣本1和2,第2類(lèi)為樣本3和4,第3類(lèi)為樣本5和6。
表2 負(fù)荷特性數(shù)據(jù)特征及參數(shù)辨識(shí)結(jié)果Tab.2 Data of load characteristics and parameter identification results of the sample
對(duì)樣本特征向量數(shù)據(jù)按照前述方法進(jìn)行歸一化,權(quán)值處理后,采用基于SOM神經(jīng)網(wǎng)絡(luò)的C-均值聚類(lèi)算法對(duì)樣本進(jìn)行負(fù)荷特性分類(lèi)。最后求得每個(gè)樣本與每個(gè)類(lèi)重心之間的距離矩陣,見(jiàn)表3。
由表3可知分類(lèi)結(jié)果為,樣本1和2分為第1類(lèi),樣本3和4分為第2類(lèi),樣本5和6分別為第4類(lèi)和第3類(lèi)。樣本5錯(cuò)誤分為第4類(lèi),其余分類(lèi)結(jié)果都正確。分析樣本,由于辨識(shí)結(jié)果中兩者差異過(guò)大,導(dǎo)致樣本5和樣本6不能分到同一類(lèi)。
表3 距離矩陣Tab.3 Distance matrix
對(duì)表2中的數(shù)據(jù)采用單一的C-均值聚類(lèi)方法進(jìn)行分類(lèi),首先設(shè)定有3個(gè)聚類(lèi)中心,將此聚類(lèi)結(jié)果和基于SOM神經(jīng)網(wǎng)絡(luò)的C-均值聚類(lèi)算法的分類(lèi)情況作比較,結(jié)果如表4所示。
表4 兩種算法分類(lèi)的對(duì)比Tab.4 Comparison of two algorithms classification
從表4可知,采用基于SOM神經(jīng)網(wǎng)絡(luò)的C-均值聚類(lèi)算法的分類(lèi)不但可自動(dòng)給出合適的聚類(lèi)數(shù)及穩(wěn)定的聚類(lèi)結(jié)果,而且效果要比單一C-均值聚類(lèi)效果好。尤其遇到大量負(fù)荷樣本時(shí),基于SOM神經(jīng)網(wǎng)絡(luò)的C-均值聚類(lèi)算法更能體現(xiàn)出優(yōu)勢(shì)。
對(duì)負(fù)荷進(jìn)行分類(lèi)是解決負(fù)荷時(shí)變性,提高仿真準(zhǔn)確度的重要方法。本文結(jié)合兩種算法的優(yōu)點(diǎn),提出基于SOM神經(jīng)網(wǎng)絡(luò)的C-均值聚類(lèi)算法的新的負(fù)荷分類(lèi)方法,可有效進(jìn)行大規(guī)模數(shù)據(jù)挖掘的SOM網(wǎng)絡(luò)首先找出負(fù)荷特性向量樣本的聚類(lèi)數(shù)目和各中心點(diǎn),因C-均值具有較強(qiáng)的局部搜索能力,得到合適初始值的C-均值聚類(lèi)算法收斂速度和精度提高。并將其應(yīng)用于電力負(fù)荷的動(dòng)態(tài)特性聚類(lèi)分析中,然后與基于單一C-均值聚類(lèi)的分類(lèi)結(jié)果進(jìn)行比較。結(jié)果表明此算法不依賴于任何的初始條件,可自動(dòng)獲取聚類(lèi)數(shù)目,實(shí)現(xiàn)無(wú)監(jiān)督學(xué)習(xí),聚類(lèi)結(jié)果更加穩(wěn)定,能夠更加客觀、準(zhǔn)確地提取同類(lèi)負(fù)荷的共同本質(zhì)特征,取得良好的分類(lèi)效果。
[1]Carson W Taylor.Power System Voltage Stability[M].北京:中國(guó)電力出版社,2001.
[2]Kohonen T.Self-organized formation of topologically correct feature maps[J].Biological Cybernetics,1982,43(1):59-69.
[3]賀仁睦,周文(He Renmu,Zhou Wen).電力系統(tǒng)負(fù)荷模型的分類(lèi)與綜合(The cluster and sunthesis of electric power system load models)[J].電力系統(tǒng)自動(dòng)化(Automation of Electric Power Systems),1999,23(19):12-16.
[4]張紅斌,賀仁睦(Zhang Hongbin,He Renmu).基于KOHONEN神經(jīng)網(wǎng)絡(luò)的電力系統(tǒng)負(fù)荷動(dòng)特性聚類(lèi)與綜合(The characteristics clustering and synthesis of electric dynamic loads based on Kohonen neural network)[J].中國(guó)電機(jī)工程學(xué)報(bào)(Proceedings of the CSEE),2003,23(5):1 -5,43.
[5]李培強(qiáng),李欣然,陳輝華,等(Li Peiqiang,Li Xinran,Chen Huihua,et al).基于模糊聚類(lèi)的電力負(fù)荷特性的分類(lèi)與綜合(The characteristics classification and synthesis of power load based on fuzzy clustering)[J].中國(guó)電機(jī)工程學(xué)報(bào)(Proceedings of the CSEE),2005,25(24):75-78.
[6]鄭曉雨,馬進(jìn),賀仁睦,等(Zheng Xiaoyu,Ma Jin,He Renmu,et al).基于模型激勵(lì)響應(yīng)的負(fù)荷分類(lèi)及泛化能力(Classification and generalization of the load model based on model dynamic responses)[J].電工技術(shù)學(xué)報(bào)(Transactions of China Electrotechnical Society),2009,24(2):132 -138.
[7]鄭曉雨,賀仁睦,馬進(jìn),等(Zheng Xiaoyu,He Renmu,Ma Jin,et al).基于軌跡靈敏度的負(fù)荷分類(lèi)(A method of load classification based on the trajectory sensitivity)[J].電工技術(shù)學(xué)報(bào)(Transactions of China Electrotechnical Society),2010,25(9):145 -150.
[8]鞠平,金艷,吳峰,等(Ju Ping,Jin Yan,Wu Feng,et al).綜合負(fù)荷特性的分類(lèi)綜合方法及其應(yīng)用(Studies on classification and synthesis of componsite dynamic loads)[J].電力系統(tǒng)自動(dòng)化(Automation of Electric Power Systems),2004,28(1):64 -68.
[9]周玉光(Zhou Yuguang).電力系統(tǒng)動(dòng)態(tài)負(fù)荷建模與負(fù)荷動(dòng)靜比例的提取(Power System Dynamic Load Modeling And Acquisition of Dynamicstatic Percentage)[D].上海:上海交通大學(xué)電子信息與電氣工程學(xué)院(Shanghai:College of Electronic and Electrical Engineering of Shanghai Jiaotong University),2006.
[10]金群,李欣然,劉艷陽(yáng),等(Jin Qun,Li Xinran,Liu Yanyang,et al).一種改進(jìn)遺傳算法及其在負(fù)荷建模中的應(yīng)用(An improved genetic algorithm and its application to load modeling)[J].電力系統(tǒng)及其自動(dòng)化學(xué)報(bào)(Proceeding of the CSU-EPSA),2006,18(2):35-40.