国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于加權(quán)偏最小二乘回歸的中長期負(fù)荷預(yù)測

2014-09-17 08:57:30陳素玲姚建剛
電力需求側(cè)管理 2014年1期
關(guān)鍵詞:權(quán)值負(fù)荷樣本

陳素玲,姚建剛,龔 磊

(湖南大學(xué) 電氣與信息工程學(xué)院,長沙 410082)

基于加權(quán)偏最小二乘回歸的中長期負(fù)荷預(yù)測

陳素玲,姚建剛,龔 磊

(湖南大學(xué) 電氣與信息工程學(xué)院,長沙 410082)

針對中長期負(fù)荷預(yù)測,考慮各歷史樣本在建立適用于預(yù)測對象的模型時(shí)處于不同的地位,應(yīng)分配不同的權(quán)值,提出一種基于加權(quán)偏最小二乘回歸(weighted partial least squares regression,WPLSR)的預(yù)測方法。利用相似離度計(jì)算歷史樣本與預(yù)測對象的相似度,判定樣本是否含有異常值,自適應(yīng)地為歷史樣本分配權(quán)值,進(jìn)而采用偏最小二乘回歸(partial least squares regression,PLSR)提取主成分和回歸分析。算例結(jié)果表明WPLSR方法的預(yù)測精度比普通PLSR模型有顯著提高,具有良好的可行性和有效性。

中長期負(fù)荷預(yù)測;偏最小二乘回歸;相似離度;權(quán)值

電力系統(tǒng)中長期負(fù)荷預(yù)測工作是電網(wǎng)規(guī)劃及制定年度檢修計(jì)劃、運(yùn)行方式的重要基礎(chǔ)。準(zhǔn)確的負(fù)荷預(yù)測有利于提高電網(wǎng)運(yùn)行的安全穩(wěn)定性,有效地降低發(fā)電成本,保證用電需求,增強(qiáng)供電可靠性,從而提高電力系統(tǒng)的經(jīng)濟(jì)效益和社會效益[1]。

由于影響中長期負(fù)荷預(yù)測的因素很多,如:氣候因素、經(jīng)濟(jì)因素、能源因素等,各因素之間存在著嚴(yán)重多重相關(guān)性,國內(nèi)外研究學(xué)者建立了許多實(shí)用的預(yù)測模型[2—8]。其中,偏最小二乘回歸分析在中長期電力負(fù)荷預(yù)測的應(yīng)用比較突出,文獻(xiàn)[2]—[3]采用偏最小二乘回歸(partial least squares regression,PLSR)進(jìn)行中長期負(fù)荷預(yù)測,解決了多重共線性的問題且模型的解釋能力較好,表明了PLSR在中長期負(fù)荷預(yù)測中的實(shí)用性和有效性;文獻(xiàn)[4]在PLSR的基礎(chǔ)上引入正交信號修正法對原始數(shù)據(jù)進(jìn)行預(yù)測處理,進(jìn)一步提高了模型的預(yù)測精度;文獻(xiàn)[5]先采用灰色建模預(yù)測,再以經(jīng)驗(yàn)風(fēng)險(xiǎn)最小的預(yù)測值代替原始數(shù)據(jù)進(jìn)行PLSR建模,削弱了隨機(jī)因素的影響;文獻(xiàn)[6]采用Bootstrap方法篩選自變量,剔除那些對負(fù)荷影響不顯著的因素,然后進(jìn)行PLSR回歸分析;文獻(xiàn)[7]采用神經(jīng)網(wǎng)絡(luò)對PLSR建模過程中產(chǎn)生的權(quán)值和回歸系數(shù)進(jìn)行修正,這幾種方法都在一定程度上提高了模型的預(yù)測精度。

本文為得到適用于預(yù)測對象最優(yōu)歷史樣本集,引入了相似離度自適應(yīng)為歷史樣本分配權(quán)值,同時(shí)也將利用相似離度判定樣本是否含有異常值,然后對新的樣本序列進(jìn)行PLSR建模。在PLSR的基礎(chǔ)上,構(gòu)建了加權(quán)偏最小二乘回歸(weighted partial least squares regression,WPLSR)模型,結(jié)果表明,新模型的電力負(fù)荷預(yù)測結(jié)果更加精確。

1 基于相似離度的樣本相似度計(jì)算

1.1 相似離度的數(shù)學(xué)意義

衡量2個(gè)樣本之間的相似程度須從“形”和“值”2個(gè)方面去比較:①相似系數(shù)描述樣本內(nèi)數(shù)據(jù)變化規(guī)律的差異性,反映2個(gè)樣本之間的形狀相似程度,即為“形”的相似程度;②距離系數(shù)描述樣本數(shù)據(jù)的數(shù)值差異性,反映2個(gè)樣本的因子之間在總平均數(shù)值上的差異程度,即為“值”的相似程度。相似離度將相似系數(shù)和距離系數(shù)有機(jī)結(jié)合起來建立統(tǒng)一的模型,以更精確地判斷數(shù)據(jù)樣本間的相似程度[9—10]。

1.2 相似系數(shù)

為消除因子數(shù)值變化域的不同,須先把因子原始數(shù)據(jù)標(biāo)準(zhǔn)化。設(shè)負(fù)荷數(shù)據(jù)庫中包含p個(gè)樣本,每個(gè)樣本含有m個(gè)影響因子。將數(shù)據(jù)中的影響因子樣本記為矩陣 X={xij}p×m,其中xij為第i個(gè)樣本在第j個(gè)影響因子上的取值,數(shù)據(jù)標(biāo)準(zhǔn)化公式

經(jīng)過標(biāo)準(zhǔn)化后,所有樣本的因子數(shù)據(jù)都統(tǒng)一變?yōu)?~1之間的數(shù)值,即0≤zi≤1。

設(shè)經(jīng)過標(biāo)準(zhǔn)化后的2個(gè)樣本數(shù)據(jù)的因子相量分別為Zi={zi1,zi2,…,zim},Zj={zj1,zj2,…,zjm},相似系數(shù)為

相似系數(shù)的值域?yàn)椋?,1],Sij=1表示2個(gè)樣本完全相似,Sij=0表示兩個(gè)樣本完全不相似。

1.3 距離系數(shù)

距離系數(shù)有多種表達(dá)形式,若采用較為常用的歐氏距離,其表達(dá)式為

歐氏距離系數(shù)為有量綱數(shù)據(jù),為與相似系數(shù)的數(shù)值意義保持一致進(jìn)而建立相似離度綜合指標(biāo),取相對歐氏距離系數(shù)為

式中:Dmax為樣本集間存在的最大歐氏距離。相對歐氏距離系數(shù)的值域?yàn)椋?,1],Eij=1表示2個(gè)樣本在數(shù)值上的完全沒有差異,Eij=0表示2個(gè)樣本的數(shù)值差異程度最大。

1.4 相似離度計(jì)算模型

對相似系數(shù)Sij和相對歐氏距離系數(shù)Eij進(jìn)行權(quán)重賦值后建立相似離度Aij的計(jì)算模型

式中:α∈[0,1],表示相似系數(shù)在相似離度的計(jì)算中所占的重要程度。

相似離度Aij的值域?yàn)椋?,1],Aij=1時(shí)可認(rèn)為2個(gè)樣本數(shù)據(jù)相似程度最大,而Aij越小則表示2個(gè)樣本數(shù)據(jù)相似程度越小。Aij即為本文所定義的樣本相似度。

1.5 異常樣本的辨識

由以上分析可知,相似離度Aij越小,表示2個(gè)樣本數(shù)據(jù)相似程度越小,但也不能排除是存在異常樣本的緣故,相似離度Aij越小,也表示樣本存在異常值的概率越大。預(yù)測對象有n個(gè)樣本時(shí)(n≥1),計(jì)算歷史樣本i(1≤i≤p)與預(yù)測對象j(1≤j≤n)的相似離度將得到Ai1,Ai2,…,Ain,本文取其中的最小值(記為Aij(min))作為樣本i與預(yù)測對象的相似離度值,在檢測異常樣本時(shí),本文進(jìn)一步選取Aij(min)中值較小的p/5(四舍五入)個(gè)樣本進(jìn)行核實(shí)。

2WPLSR模型

2.1 PLSR原理

偏最小二乘回歸(PLSR)[11]是一種先進(jìn)的多元統(tǒng)計(jì)分析方法,集中了主成分分析、典型相關(guān)分析和線性回歸分析方法的優(yōu)點(diǎn),能有效的解決變量間多重相關(guān)性的問題,較適用于中長期電力負(fù)荷預(yù)測中影響因素多重相關(guān)的分析。本文的中長期負(fù)荷預(yù)測為單因變量,單因變量PLSR回歸建模過程如下。

(1)數(shù)據(jù)的標(biāo)準(zhǔn)化處理。設(shè)自變量矩陣X=[x1x2…xk]n×k和因變量矩陣 Y=[y]n×1。將 X 與 Y進(jìn)行標(biāo)準(zhǔn)化處理,得到標(biāo)準(zhǔn)化后的自變量矩陣E0和因變量矩陣F0。

其中是矩陣的最大特征值所對應(yīng)的特征向量。殘差矩陣

(4)交叉有效性分析,主成分提取的終止準(zhǔn)則。每增加一個(gè)新成分th都需要檢驗(yàn)其引入能否對模型的預(yù)測精度有明顯的改進(jìn),有改進(jìn)則該成分被引入。設(shè)h個(gè)成分?jǐn)M合后,y?hi是yi的擬合值,去除樣本i,利用剩余的樣本提取h個(gè)成分回歸計(jì)算得到y(tǒng)i的預(yù)測值為y?h(-i)。記一般認(rèn)為當(dāng)≥0.097 5時(shí),增加成分th對于預(yù)測的貢獻(xiàn)是顯著的,否則不引入此成分,停止主成分的提取。

(5)建立回歸方程。根據(jù)以上步驟,確定共提取m個(gè)主成分,F(xiàn)0的回歸方程為

最后,通過標(biāo)準(zhǔn)化的逆過程,得到y(tǒng)關(guān)于xj的回歸方程為

2.2 WPLSR模型的建立

WPLSR認(rèn)為在建立適用于預(yù)測對象的模型時(shí),各歷史樣本處于不同的地位,應(yīng)賦予不同的權(quán)值,權(quán)值的大小將根據(jù)樣本與預(yù)測對象之間的相似度進(jìn)行分配。依據(jù)樣本與預(yù)測對象的相似度應(yīng)有多種權(quán)值分配方案,本文采用等權(quán)分配方案:設(shè)權(quán)值分配參數(shù)為m,與預(yù)測對象相似度最高的前m個(gè)樣本權(quán)值為1,其余樣本權(quán)值為0。WPLSR模型的預(yù)測流程如圖1所示。

圖1 基于WPLSR的預(yù)測流程圖

3 WPLSR應(yīng)用在中長期負(fù)荷預(yù)測的實(shí)例分析

3.1 原始數(shù)據(jù)

為驗(yàn)證基于WPLSR中長期負(fù)荷預(yù)測模型的可靠性和有效性,本文采用某地區(qū)1990—2009年社會經(jīng)濟(jì)發(fā)展指標(biāo)及全社會用電量的數(shù)據(jù)進(jìn)行建模和預(yù)測,數(shù)據(jù)見表1。其中:x1為第一產(chǎn)業(yè)產(chǎn)值;x2為第二產(chǎn)業(yè)產(chǎn)值;x3為第三產(chǎn)業(yè)產(chǎn)值;x4為農(nóng)村居民消費(fèi)支出;x5為城鎮(zhèn)居民消費(fèi)支出;x6為政府消費(fèi)支出;x7為人均國內(nèi)生產(chǎn)總值;x8為固定資產(chǎn)投資額;y為全社會用電量。本文將1990—2005年的數(shù)據(jù)作為歷史樣本,2006—2009年的全社會用電量作為負(fù)荷預(yù)測模型檢測數(shù)據(jù)。

表1 某地區(qū)1990—2009年社會經(jīng)濟(jì)發(fā)展指標(biāo)及全社會用電量

3.2 異常樣本辨識

采用本文的WPLSR模型計(jì)算16個(gè)歷史樣本與4個(gè)預(yù)測對象的相似離度,選取計(jì)算結(jié)果最小的3個(gè)樣本分別為:1998年、2003年、1993年,核實(shí)發(fā)現(xiàn)1993年無異常值,而1998年和2003年確實(shí)含有異常數(shù)據(jù),1998年城鎮(zhèn)居民消費(fèi)支出為329.66萬元,2003年第三產(chǎn)業(yè)產(chǎn)值為616.40億元,修正異常數(shù)據(jù)更新歷史樣本重新進(jìn)行計(jì)算與預(yù)測。

3.3 成分解釋能力分析

PLSR模型成分的解釋能力是模型攜帶多少數(shù)據(jù)信息的重要標(biāo)志[4]。本文對原樣本數(shù)據(jù)(含有異常值,記為樣本I)和核實(shí)后的樣本(記為樣本II)分別用普通PLSR建模、WPLSR建模,由于WPLSR模型能夠識別異常樣本,因此WPLSR模型對樣本I和樣本II的預(yù)測結(jié)果是一致的,將合并討論。表2比較了對樣本II的PLSR模型和WPLSR模型的成分解釋能力。表中R為成分對變量的累計(jì)解釋能力,計(jì)算公式如式(12)所示。

式中:r(xi,tj)表示xi和tj的相關(guān)系數(shù)。

表2 成分解釋能力對比

從表2可以看出,2個(gè)模型的成分對自變量和因變量的累計(jì)解釋能力均能達(dá)到99%以上,因此,WPLSR模型并沒有破壞普通PLSR模型的良好解釋能力。

3.4 預(yù)測結(jié)果分析

上述3種情況下的預(yù)測結(jié)果見表3所示,針對2009年用電量的預(yù)測可以看到:樣本I的PLSR模型誤差達(dá)到12.57%,樣本II的PLSR的模型誤差達(dá)10.38%,WPLSR預(yù)測的誤差為5.74%,樣本Ⅱ的PLSR預(yù)測結(jié)果優(yōu)于樣本Ⅰ的PLSR預(yù)測結(jié)果,說明識別異常樣本對于提高預(yù)測精度是十分重要的。相比之下,WPLSR模型精度最高,表明通過引入樣本相似度的計(jì)算和樣本異常值的檢測,能夠自適應(yīng)選擇適用于預(yù)測對象的最優(yōu)樣本,避免了傳統(tǒng)PLSR將壞樣本和好樣本同等對待的情況,有效地提高了預(yù)測精度。

4 結(jié)論

本文在PLSR模型的基礎(chǔ)上,引入樣本相似度的計(jì)算、樣本異常值的判定及樣本權(quán)值的分配,構(gòu)建了WPLSR模型。該模型利用相似離度的計(jì)算來修正樣本權(quán)值以及檢測樣本是否含有異常值,以此得到適合預(yù)測對象的最優(yōu)樣本集。通過實(shí)驗(yàn)表明,該方法沒有破壞傳統(tǒng)PLSR良好的解釋能力,且在PLSR模型的預(yù)測結(jié)果上得到了較好的改善,驗(yàn)證了該模型的有效性。

表3 預(yù)測結(jié)果比較

[1]牛東曉,曹樹華,趙磊,等.電力負(fù)荷預(yù)測技術(shù)及其應(yīng)用[M].北京:中國電力出版社,1998:5-30.

[2]毛李帆,江岳春,龍瑞華,等.基于偏最小二乘回歸分析的中長期電力負(fù)荷預(yù)測[J].電網(wǎng)技術(shù),2008,32(19):71-77.

[3]王文圣,丁晶,趙玉龍,等.基于偏最小二乘回歸的年用電量預(yù)測研究[J].中國電機(jī)工程學(xué)報(bào),2003,23(10):17-21.

[4]毛李帆,江岳春,姚建剛,等.采用正交信號修正法與偏最小二乘回歸的中長期負(fù)荷預(yù)測[J].中國電機(jī)工程學(xué)報(bào),2009,29(16):82-88.

[5]牛東曉,李春祥,孟明.基于灰色和偏最小二乘方法的年度負(fù)荷預(yù)測[J].華東電力,2009,37(6):989-992.

[6]季澤宇,袁越,鄒文仲.改進(jìn)偏最小二乘回歸在電力負(fù)荷預(yù)測中的應(yīng)用[J].電力需求側(cè)管理,2011,13(1):10-14.

[7]張成,滕歡.基于偏最小二乘法與BP神經(jīng)網(wǎng)絡(luò)的電力中長期負(fù)荷預(yù)測[J].電力建設(shè),2012,33(7):26-29.

[8]徐聰穎,廖峰,陳震海.灰色組合模型在中長期電力負(fù)荷預(yù)測中的應(yīng)用[J].電力需求側(cè)管理,2011,13(2):20-23.

[9]李開樂.用相似離度做臺風(fēng)全路徑預(yù)報(bào)[J].海洋預(yù)報(bào),1987,4(2):1-7.

[10]張楊,葉舒帆,高立群.一種基于相似離度匹配的人臉精確跟蹤算法[J].東北大學(xué)學(xué)報(bào):自然科學(xué)版,2011,32(2):188-192.

[11]王惠文.偏最小二乘回歸方法及應(yīng)用[M].北京:國防工業(yè)出版社,1999.

[12]康重慶,夏清,張伯明.電力系統(tǒng)負(fù)荷預(yù)測研究綜述與發(fā)展方向的探討[J].電力系統(tǒng)自動(dòng)化,2004,28(17):1-11.

Mid?long term load forecasting based on weighted partial least squares regression

CHEN Su?ling,YAO Jian?gang,GONG Lei
(Hunan University,Changsha 410082,China)

Considering that historical load samples each have asymmetrical status and should be assigned to different weightings in the med?long?term load forecasting,this paper pro?poses a weighted partial least squares regression(WPLSR)algo?rithm.The specific modeling procedures are:Analog Deviation be?tween the historical samples and predicting samples is computed;identify abnormal samples;adjust sample weights;partial least squares regression analysis.Experimental results show that the pre?diction accuracy of the weighted partial least squares regression(WPLSR)algorithm is remarkably higher than that of traditional PLSR model.the proposed modeling method is practicable and ef?fective.

mid?long term load forecast;partial least squares regression;analogue deviation;weight

TM715;F407.61

B

1009-1831(2014)01-0021-04

2013-09-06;修回日期:2013-10-14

陳素玲(1989),女,回族,河南開封人,碩士研究生,主要從事電力系統(tǒng)規(guī)劃及負(fù)荷預(yù)測方面的研究;姚建剛(1952),男,湖南望城人,教授,博士生導(dǎo)師,主要從事電力市場及負(fù)荷預(yù)測方面的研究;龔磊(1988),男,湖南邵陽人,碩士研究生,主要從事電力系統(tǒng)規(guī)劃及輸電線路狀態(tài)檢修、診斷方面的研究。

猜你喜歡
權(quán)值負(fù)荷樣本
一種融合時(shí)間權(quán)值和用戶行為序列的電影推薦模型
用樣本估計(jì)總體復(fù)習(xí)點(diǎn)撥
CONTENTS
CONTENTS
推動(dòng)醫(yī)改的“直銷樣本”
基于權(quán)值動(dòng)量的RBM加速學(xué)習(xí)算法研究
隨機(jī)微分方程的樣本Lyapunov二次型估計(jì)
防止過負(fù)荷時(shí)距離保護(hù)誤動(dòng)新判據(jù)
主動(dòng)降負(fù)荷才是正經(jīng)事
村企共贏的樣本
乐平市| 手机| 舟曲县| 保亭| 西平县| 环江| 宁津县| 海晏县| 池州市| 黑水县| 高碑店市| 洪湖市| 海阳市| 剑阁县| 股票| 平凉市| 镇康县| 喜德县| 曲麻莱县| 平定县| 云林县| 玉屏| 宜宾县| 兴山县| 调兵山市| 卢龙县| 金阳县| 英山县| 三都| 屏南县| 酒泉市| 海门市| 乐都县| 黑山县| 丰都县| 南投县| 云和县| 惠安县| 方正县| 巴楚县| 盐源县|