何軒,王永慶,溫步瀛
(1.福州大學(xué)電氣工程與自動(dòng)化學(xué)院,福建閩侯 350108;2.國網(wǎng)陜西省電力公司電力科學(xué)研究院,陜西西安 710054)
基于粒子群算法優(yōu)化支持向量機(jī)的專用工程費(fèi)用量化研究
何軒1,王永慶2,溫步瀛1
(1.福州大學(xué)電氣工程與自動(dòng)化學(xué)院,福建閩侯350108;2.國網(wǎng)陜西省電力公司電力科學(xué)研究院,陜西西安710054)
針對電力專用工程費(fèi)用的復(fù)雜性且易受各種因素影響的問題,以某地區(qū)專用工程數(shù)據(jù)為基礎(chǔ),參考國內(nèi)其他地區(qū)的收費(fèi)標(biāo)準(zhǔn),提出了一種基于粒子群算法優(yōu)化支持向量機(jī)的專用工程費(fèi)用預(yù)測。通過歷史的專用工程費(fèi)用數(shù)據(jù)樣本對支持向量機(jī)進(jìn)行訓(xùn)練,利用訓(xùn)練的模型對專用工程費(fèi)用進(jìn)行預(yù)測。同時(shí)用粒子群優(yōu)化算法優(yōu)化支持向量機(jī)的關(guān)鍵參數(shù),提高專項(xiàng)工程費(fèi)用的預(yù)測精度。
專項(xiàng)工程;粒子群優(yōu)化;支持向量機(jī)
為了滿足不斷增長的電力需求,需要進(jìn)行大量電網(wǎng)基礎(chǔ)設(shè)施建設(shè)。2015年3月中央已明確提出鼓勵(lì)社會(huì)資本投資配電業(yè)務(wù),巨大的投資和繁重的建設(shè)任務(wù)將對工程費(fèi)用測算提出更高的要求。
專用工程輸電價(jià)指電網(wǎng)經(jīng)營企業(yè)利用專用工程提供電能輸送服務(wù)的價(jià)格。同時(shí),隨著供、配電貼費(fèi)停止收取,電力專用工程的建設(shè)和出資形式發(fā)生了改變,由供電企業(yè)統(tǒng)一建設(shè)轉(zhuǎn)型為用戶可根據(jù)自身情況自購或自建,從而提高工程建設(shè)的效率,降低了工程的成本[1]。用戶接入工程市場化的同時(shí),也發(fā)現(xiàn)許多需要解決的問題,如用戶投資建設(shè)缺乏后期維護(hù)與更新改造的能力;供電部門對用戶專用工程建設(shè)、維護(hù)及更新改造的監(jiān)管缺少法規(guī)和政策依據(jù);對專用工程無法實(shí)行統(tǒng)一的規(guī)劃,造成布局混亂及工程建設(shè)和管理分散。
基于此,電力專用工程費(fèi)用的量化研究顯得尤為重要,其不僅可以為專用工程同一收取提供參考依據(jù),而且可保障電網(wǎng)的安全穩(wěn)定運(yùn)行[2]。
當(dāng)前國內(nèi)對于輸電工程造價(jià)的預(yù)測研究,主要從多元線性回歸分析[3]、灰色關(guān)聯(lián)度[4]、支持向量機(jī)[5]等方法入手。多元線性回歸和灰色關(guān)聯(lián)度計(jì)算法在一些特定的歷史時(shí)期內(nèi)或者工程中能較快地對工程造價(jià)進(jìn)行預(yù)測,但是普遍都有把競爭中最活躍的因素固定化的缺點(diǎn),忽略資金隨時(shí)間的變化量,缺乏動(dòng)態(tài)性。而粒子群優(yōu)化算法優(yōu)化簡單,全局優(yōu)化問題性能卓越。支持向量機(jī)如今已經(jīng)被運(yùn)用到很多優(yōu)化中。所以本文將采用粒子群優(yōu)化的支持向量機(jī)等方法進(jìn)行專用工程費(fèi)用模型的研究。
1.1支持向量機(jī)理論
支持向量機(jī)是一種基于統(tǒng)計(jì)學(xué)習(xí)理論和結(jié)構(gòu)風(fēng)險(xiǎn)最小化原理的算法,在函數(shù)擬合問題中就稱為支持向量回歸。并且支持向量機(jī)引入了特征空間和核函數(shù)的概念,把非線性問題映射到特征空間,然后在高維特征空間中當(dāng)作線性問題解決,同時(shí)解決了“維數(shù)災(zāi)難”問題。在新的高維線性空間中求取最優(yōu)線性分類面來分離訓(xùn)練樣本,將尋找最優(yōu)線性回歸超平面的算法歸結(jié)為求解一個(gè)凸約束條件下的一個(gè)凸規(guī)劃問題,求取全局最優(yōu)解[6]。
所以支持向量回歸的基本思想是:首先通過一個(gè)非線性映射函數(shù)φ將數(shù)據(jù)x映射到高緯特征空間F,然后在該高維特征空間F進(jìn)行線性擬合。SVR的擬合函數(shù)可得出
式中:l為支持向量的數(shù)目;αi和α*i為拉格朗日乘子;k(x,xi)=φ(x)φ(xi)為核函數(shù);b為閥值。
選擇一個(gè)合適的核函數(shù)k(x,xi),就可以實(shí)現(xiàn)非線性變換后的線性回歸。
1.2粒子群優(yōu)化算法
粒子群優(yōu)化算法是群體智能的一個(gè)新的分支,通過個(gè)體協(xié)作來尋找最優(yōu)解。所有的粒子都有一個(gè)由被優(yōu)化的函數(shù)決定的適應(yīng)值,每個(gè)粒子還有一個(gè)速度決定它們的方向和距離[7]。粒子群初始化為一群隨機(jī)粒子,然后通過迭代找到最優(yōu)解。在每一次迭代中,粒子通過跟蹤2個(gè)“極值”來更新自己。第一個(gè)就是粒子本身所得到的最優(yōu)解,另一個(gè)極值是整個(gè)種群目前找到的最優(yōu)解。這樣可以找到支持向量機(jī)中的最優(yōu)參數(shù),提高預(yù)測精度。
1.3基于粒子群算法的支持向量機(jī)參數(shù)優(yōu)化
由于支持向量回歸的泛化性能依賴于核參數(shù)C和誤差懲罰參數(shù)γ,所以對(C,γ)參數(shù)集進(jìn)行尋優(yōu)是十分關(guān)鍵的。因此本文采用粒子群優(yōu)化算法來尋求最優(yōu)參數(shù)子集(C,γ)。
首先載入已有的數(shù)據(jù),初始化一組核參數(shù)C和誤差懲罰參數(shù)γ作為粒子的初始位置。把全部數(shù)據(jù)均勻地分為n個(gè)互不包含的子集m1,m2,…,mn。根據(jù)現(xiàn)有的核參數(shù)C和誤差懲罰參數(shù)γ訓(xùn)練模型,選用均方根誤差(root-mean-square error,RMSE)作為適應(yīng)度函數(shù)來反映出支持向量回歸的性能其表達(dá)式為:
式中:n為訓(xùn)練樣本數(shù);mi和分別為第i個(gè)訓(xùn)練樣本目標(biāo)量的實(shí)測值和預(yù)測值。根據(jù)泛化誤差尋找最優(yōu)的核參數(shù)C和誤差懲罰參數(shù)γ[8]。
核參數(shù)C和誤差懲罰參數(shù)γ的優(yōu)化步驟如下:
1)讀取以后樣本,初始化一組核參數(shù)C和誤差懲罰參數(shù)γ作為粒子的初始位置。
2)把全部樣本數(shù)據(jù)均勻分為n個(gè)互不包含的子集X={m1,m2,…,mn}。
3)根據(jù)當(dāng)前的核參數(shù)C和誤差懲罰參數(shù)γ訓(xùn)練模型,計(jì)算交叉驗(yàn)證誤差:假設(shè)i=1;把子集m1作為檢驗(yàn)集,其余的子集一起作為訓(xùn)練模型的訓(xùn)練集;根據(jù)計(jì)算m1的泛化誤差;然后i=i+1,重復(fù)上一步,直到i=k+1;最后把k次泛化誤差作為交叉驗(yàn)證誤差。
4)上一步交叉驗(yàn)證誤差作為適應(yīng)值,并記錄個(gè)體最佳適應(yīng)位置和群體最佳適應(yīng)位置。找到這2個(gè)最優(yōu)值時(shí),粒子群根據(jù)式(1)和式(2)更新自己的速度和位置,尋找更好的核參數(shù)C和誤差懲罰參數(shù)γ。
5)當(dāng)?shù)螖?shù)達(dá)到所要求的最大迭代次數(shù)或者獲得了滿足要求的粒子適應(yīng)函數(shù)值時(shí),終止迭代,輸出結(jié)果。否則返回第3步繼續(xù)計(jì)算,直至達(dá)到最大迭代的次數(shù)或獲得滿足要求的粒子適應(yīng)值為止。
2.1相關(guān)性分析
對專用工程的影響因數(shù)很多,從歷史工程經(jīng)驗(yàn)中可知主要的影響因素是線路長度、輸送容量、風(fēng)速、地形系數(shù)。
在SPSS19.0軟件中進(jìn)行偏相關(guān)分析,取相關(guān)性系數(shù)0.5為界限,結(jié)果顯示與工程實(shí)際費(fèi)用的相關(guān)性最密切的屬性如表1所示。通常認(rèn)定相關(guān)性系數(shù)大于0.5為強(qiáng)相關(guān),即風(fēng)速與地形系數(shù)相關(guān)性系數(shù)為弱相關(guān),線路長度與輸送容量為強(qiáng)相關(guān)[9]。
2.2模型的建立
專用輸電工程費(fèi)用影響因素很多,參考我國原有的供、配電貼費(fèi)政策和國內(nèi)多個(gè)地區(qū)的收費(fèi)政策,根據(jù)實(shí)際工作的情況以及相關(guān)性分析,把專用工程費(fèi)用分為容量費(fèi)用與線路長度費(fèi)用,可通過分別求取容量單價(jià)及線路單價(jià)為專用工程費(fèi)用核算提供參考依據(jù)。
表1 元素相關(guān)性Tab.1 Element correlation table
針對專用工程造價(jià)的主要影響因數(shù),考慮到主要的影響變量為容量費(fèi)用與線路長度費(fèi)用。所以以配電變壓器容量和線路長度作為輸入變量,以實(shí)際工程費(fèi)用作為輸出變量進(jìn)行學(xué)習(xí)訓(xùn)練。建模時(shí)首先用24個(gè)訓(xùn)練樣本數(shù)據(jù)對粒子群優(yōu)化支持向量機(jī)進(jìn)行回歸訓(xùn)練學(xué)習(xí),通過不斷地訓(xùn)練和調(diào)整后,經(jīng)粒子群算法尋優(yōu)得到的SVR最佳參數(shù)g=0.01,c=83.17,然后利用建立的模型對樣本數(shù)據(jù)進(jìn)行預(yù)測[10]。
表2為某地區(qū)專用工程案例數(shù)據(jù),利用MATLAB編程分別進(jìn)行傳統(tǒng)多元線性回歸預(yù)測、支持向量回歸預(yù)測和粒子群優(yōu)化支持向量回歸預(yù)測,求取多變量模型。
表2 某地區(qū)專用工程案例數(shù)據(jù)表Tab.2 Case data sheet of a specific power transmission project in a certain area
針對這3種預(yù)測方法進(jìn)行測算,結(jié)果見表3,相對誤差分析如圖1所示。
表3 幾種方法測算結(jié)果對比Tab.3 Comparison of several methods to calculate the results
圖1 二元線性回歸殘差圖Fig.1 Multivariate linear regression residuals chart
根據(jù)表3,分別算出全樣本數(shù)據(jù)3種方法的平均相對誤差及殘差圖,圖2為支持向量回歸殘差圖,圖3為粒子群優(yōu)化支持向量回歸線差圖。
二元線性回歸平均相對誤差:
支持向量回歸平均相對誤差:
圖2 支持向量回歸殘差圖Fig.2 Support vector machine regression residuals chart
粒子群優(yōu)化支持向量回歸平均相對誤差:
圖3 粒子群優(yōu)化支持向量回歸殘差圖Fig.3 Particle swarm optimization support vector machine regression residuals chart
由表3可以看出,雖然有個(gè)別數(shù)據(jù)比優(yōu)化前誤差更大,但在允許范圍內(nèi)。總體上看,優(yōu)化后的預(yù)測數(shù)據(jù)跟真實(shí)數(shù)據(jù)的平均相對誤差更小,模型精度比優(yōu)化之前的模型精度要高。因?yàn)閿?shù)據(jù)中變壓器容量的范圍很大,可以看出在變壓器容量較小時(shí),預(yù)測的誤差會(huì)偏大,實(shí)際工程中在小容量的線路模型可能會(huì)出現(xiàn)偏差。
本文按照實(shí)際工程實(shí)際需求,提出基于粒子群算法優(yōu)化支持向量機(jī)的專用工程費(fèi)用量化模型,并與原有的二元線性回歸和支持向量機(jī)的預(yù)測模型進(jìn)行對比,提高了算法精度,較好解決了專用工程費(fèi)用量化的問題,為專用工程費(fèi)的預(yù)測提供了可靠的依據(jù)。本文局限是雖然利用優(yōu)化后參數(shù)的支持向量回歸模型提高了整體的預(yù)測精度,但是個(gè)別數(shù)據(jù)由于算法本身不確定性限制,使個(gè)別數(shù)據(jù)誤差偏大,有待進(jìn)一步研究。
[1]黨曉峰.750 kV輸電工程造價(jià)分析[J].電網(wǎng)與清潔能源,2009,25(11):37-39.DANG Xiaofeng.Cost analyses of 750 kV transmission projects[J].Power System and Clean Energy,2009,25(11):37-39(in Chinese).
[2]劉志鵬.淺析輸變電工程的造價(jià)管理[J].電子制作,電腦維護(hù)與應(yīng)用,2015(2):260.LIU Zhipeng.Cost management of power transmission project[J].Computer Maintenance and Application,2015(2):260(in Chinese).
[3]王黎明,陳穎,楊楠,等.應(yīng)用回歸分析[M].上海:復(fù)旦大學(xué)出版社,2008.
[4]趙學(xué)明.基于一元回歸法和灰色預(yù)測模型GM(1,1)的工程項(xiàng)目成本預(yù)測[J].華北電力大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2011(S2):114-117.ZHAO Xueming.Project cost forecast based on one element regression method and grey forecasting model GM(1,1)[J].Journal of North China Electric Power University(Social Science Edition),2011(2):114-117(in Chinese).
[5]王綿斌,李歡歡,譚忠富,等.基于支持向量機(jī)方法的輸電工程造價(jià)指標(biāo)評估體系[J].電力建設(shè),2014(3):102-106.WANG Mianbin,LI Huanhuan,TAN Zhongfu,et al.Evaluation system of transmission cost index based on support vector machine method[J].Electric Power Construction,2014(3):102-106(in Chinese).
[6]丁龍,郝虎在,呂玉祥,等.基于支持向量機(jī)回歸法的絕緣子污閃電壓預(yù)測研究[J].電瓷避雷器,2014,57(1):23-25.DING Long,HAO Huzai,Lü Yuxiang,et al.Research on the prediction of the pollution flashover voltage of insulators based on support vector machine regression[J].Insulators and Surge Arresters,2014,57(1):23-25(in Chinese).
[7]王宏志,陳帥,侍洪波.基于最小二乘支持向量機(jī)和PSO算法的電廠煙氣含氧量軟測量[J].熱力發(fā)電,2008,37(3):35-38.WANG Hongzhi,CHEN Shuai,SHI Hongbo.Soft sensing of oxygen content in power plant based on least square support vector machine and PSO algorithm[J].Thermal Power Generation,2008,37(3):35-38(in Chinese).
[8]舒服華,張望祥.最小二乘支持向量機(jī)預(yù)測絕緣子等值附鹽密度[J].高壓電器,2008,44(5):420-423.SHU Fuhua,ZHANG Wangxiang.A prediction model for insulator's ESDD based on least square support vector machine[J].High Voltage Apparatus,2008,44(5):420-423(in Chinese).[9]宋九飛.影響500 kV送電線路工程造價(jià)敏感因素分析[J].電力建設(shè),2007,28(4):42-44.SONG Jiufei.Analysis of the factors affecting the cost of 500 kV power transmission line project[J].Electric Power Construction,2007,28(4):42-44(in Chinese).
[10]夏向陽,徐林菊.考慮諧振基于改進(jìn)PSO算法的電容器優(yōu)化配置[J].電力電容器與無功補(bǔ)償,2012,33(2):7-11.XIA Xiangyang,XU Linju.Optimal allocation of the capacitor based on improved PSO algorithm considering harmonic resonance[J].Power Capacitor&Reactive Power Compensation,2012,33(2):7-11(in Chinese).
(編輯馮露)
Quantization Research on Special Power Transmission Project Cost Based on Particle Swarm Optimization and Support Vector Machine
HE Xuan1,WANG Yongqing2,WEN Buying1
(1.School of Electrical Engineering and Automation,F(xiàn)uzhou University,Minhou 350108,F(xiàn)ujian,China;2.Shaanxi Electric Power Research Institute,Xi'an 710054,Shaanxi,China)
To address the complexity of the specific cost of the power transmission project and its proneness to be affected by various factors,based on the data of a specific power transmission project in a certain area and with reference to the costing standards in other regions of China,this paper puts forward a cost prediction method for the special transmission line based on Particle Swarm Optimization and Support Vector Machine.The historical project cost growth data samples are used to train the support vector machine(SVM),and the training model is used to forecast the cost of the line.At the same time Particle Swarm optimization is used to optimize the key parameters of the support vector machine to improve the prediction accuracy of the project cost.
special power transmission project;Particle Swarm Optimization(PSO);support vector machine(SVM)
1674-3814(2015)12-0027-04
TM-9
A
2015-06-29。
何軒(1991—),男,在讀碩士研究生,研究方向?yàn)殡娏ο到y(tǒng)優(yōu)化運(yùn)行與電力經(jīng)濟(jì);
溫步瀛(1967—),男,博士,教授,研究方向?yàn)殡娏ο到y(tǒng)優(yōu)化運(yùn)行、電力市場和風(fēng)電并網(wǎng)運(yùn)行。
福建省自然科學(xué)基金項(xiàng)目(2013J01176)。
Project Supported by Natural Science Foundation of Fujian Province(No.2013J01176).