基于數(shù)據(jù)驅(qū)動技術(shù)的樣本學(xué)習(xí)和訓(xùn)練為信號預(yù)測提供一個可行的途徑.信號預(yù)測的方法主要有時間序列、神經(jīng)網(wǎng)絡(luò)、支持向量機(support rector machine,SVM)等[1-5],但這些方法在理論或應(yīng)用上都存在不足.例如:時間序列方法中的高階模型參數(shù)估計難度大,而低階模型預(yù)測精度低.傳統(tǒng)的人工神經(jīng)網(wǎng)絡(luò)存在運行時間長、容易陷入局部極小等問題.SVM通過核函數(shù)定義的非線性變換將輸入空間變換到高維空間,并在這個高維空間中尋找輸入變量和輸出變量的線性關(guān)系,解決了“維數(shù)災(zāi)難”問題,然而核函數(shù)的選擇和參數(shù)優(yōu)化決定了SVM的特性.
本工作利用Hilbert空間運算的封閉性,首先將B(包括B1、B3和B5)樣條核函數(shù)和徑向基(radial basic function,RBF)核函數(shù)進(jìn)行線性組合,構(gòu)造B-RBF組合核函數(shù),進(jìn)而提出基于粒子群優(yōu)化(particle swarm optimization,PSO)B-RBF核的最小二乘支持向量機(least squares support vector machine,LSSVM).最后使用某超高層建筑的脈動風(fēng)速樣本數(shù)據(jù)數(shù)值驗證PSO-B-RBF-LSSVM的預(yù)測性能.
式中,ω為權(quán)向量,b為偏置項,C為懲罰參數(shù),ei∈R為誤差,e∈Rl×l為誤差向量.為解決式(1)的優(yōu)化問題,構(gòu)造Lagrange函數(shù):
對式(2)求偏導(dǎo),并根據(jù)最優(yōu)化理論中的KKT(Karush-Kuhn-Tucher)條件,可以得到如下等式和約束條件:
式中,i=1,2,···,l. 設(shè)α =(α1,α2,···,αl)T,Q=(1,1,···,1)T,Y=(y1,y2,···,yl)T,I 為單位矩陣.聯(lián)立求解方程組,消去ω和ei,則式(3)的解為
最后,得到LSSVM的回歸模型為
給定訓(xùn)練集X=(x1,x2,···,xp)和核函數(shù)k(x,x′),定義核內(nèi)元素k(xu,xv),u,v=1,2,···,p的矩陣為核矩陣或Gram矩陣.對于所有的訓(xùn)練集X,如果它的核矩陣是對稱且半正定的,則函數(shù)K為有效核.
RBF核函數(shù)為
式中,σ為核寬度.因此,它的核矩陣為
RBF核函數(shù)的核矩陣K(xu,xv)具有如下性質(zhì):
B樣條核函數(shù)為
因此,它的核矩陣為
B樣條核函數(shù)的核矩陣K(xu,xv)具有如下性質(zhì):
因此,組合核函數(shù)核矩陣為
式中,α為加權(quán)系數(shù),σ為核寬度.組合核函數(shù)的核矩陣K(xu,xv)具有如下性質(zhì):
B-RBF組合核函數(shù)的參數(shù)分別為懲罰參數(shù)C、核參數(shù)σ(核寬度)、核參數(shù)p(次數(shù))和權(quán)重α.采用粒子群優(yōu)化(particle swarm optimization,PSO)算法對于上述參數(shù)進(jìn)行優(yōu)化,建立基于PSO-B-RBF核的LSSVM.
(1)進(jìn)行粒子種群初始化.設(shè)定粒子群維數(shù)為4,種群規(guī)模m=50,最大迭代次數(shù)K=100,以及初始速度矩陣以及初始粒子個體最優(yōu)位置和全局最優(yōu)位置.
(2)RBF核函數(shù)待優(yōu)化參數(shù)分別取c∈[0,1 000]和σ2∈[0.01,100.00].
(3)定義粒子適應(yīng)度F(xi)為均方根誤差函數(shù),并將F(xi)與自身最優(yōu)適應(yīng)度Fp和全局最優(yōu)適應(yīng)度Fg進(jìn)行比較,據(jù)此調(diào)整粒子個體最優(yōu)位置和全局最優(yōu)位置.粒子適應(yīng)度函數(shù)為
式中,yi為第i個樣本的實測值,fi為第i個樣本的預(yù)測值.
(4)更新粒子的速度和位置,獲得新的PSO-B-RBF核LSSVM參數(shù).
(5)當(dāng)?shù)螖?shù)達(dá)到最大迭代次數(shù)K或適應(yīng)度的值滿足要求時,停止迭代,得到優(yōu)化參數(shù),建立PSO-B-RBF-LSSVM模型.
PSO-B-RBF-LSSVM的流程如圖1所示.
圖1 PSO-B-RBF-LSSVM流程Fig.1 Flow chart of PSO-B-RBF-LSSVM
采用自回歸滑動平均(auto-regressive and moving arerage,ARMA)模型對某超高層建筑高200 m的脈動風(fēng)速進(jìn)行模擬.由地面開始每間隔10 m設(shè)置一個風(fēng)速模擬點,選擇60和130 m高度處的脈動風(fēng)速時程作為樣本,用于學(xué)習(xí)訓(xùn)練和驗證預(yù)測算法.脈動風(fēng)速時程如圖2所示.
圖2 脈動風(fēng)速時程樣本Fig.2 Simulation of f l uctuating wind speed time-history series
(1)分別將60和130 m處的模擬風(fēng)速時程前500 s(500個采樣點)的數(shù)據(jù)作為訓(xùn)練集,后100 s(100個采樣點)的數(shù)據(jù)作為測試集.取嵌入維數(shù)k=10,運用交叉驗證法對樣本數(shù)據(jù)進(jìn)行相關(guān)空間重構(gòu).首先,將風(fēng)速時程樣本進(jìn)行歸一化處理后輸入到B-RBF組合核函數(shù)中,構(gòu)造核函數(shù)矩陣;然后,采用PSO方法選取各項參數(shù)值,建立PSO-B-RBF-LSSVM的預(yù)測回歸模型;最后,對后100 s采樣時間點的脈動風(fēng)速進(jìn)行預(yù)測.分別計算60和130 m處風(fēng)速時程樣本中的前500 s采樣時間點(訓(xùn)練集)和預(yù)測結(jié)果中的100 s采樣時間點(測試集)的脈動風(fēng)速與實際(模擬)風(fēng)速樣本數(shù)據(jù)的相關(guān)系數(shù)R、平均絕對誤差(mean absolute error,MAE)及均方根誤差(root mean squoore error,RMSE),對PSO-B-RBF-LSSVM預(yù)測性能進(jìn)行評價.數(shù)值計算結(jié)果分別如圖3~4和表1~2所示.
圖3 60 m處預(yù)測風(fēng)速與實際風(fēng)速的比較Fig.3 Comparison of forecast wind speed and actual wind speed at 60 m
由表1和2可以發(fā)現(xiàn),B樣條核LSSVM的預(yù)測結(jié)果好于PSO-RBF核LSSVM,這是因為RBF的局部性特征明顯,只能對小范圍內(nèi)的樣本數(shù)據(jù)產(chǎn)生影響,而B樣條函數(shù)核的全局性較好,具有很強的外推能力.根據(jù)Mercer核定理,利用RBF的局部性和B樣條函數(shù)核的全局性特點,線性相加(αRBF+(1?α)B樣條函數(shù)核)構(gòu)造出的B-RBF組合核函數(shù)兼顧了局部性和全局性特征.因此,B-RBF-LSSVM能進(jìn)一步提高脈動風(fēng)速的預(yù)測性能.值得指出的是,在B1,B3和B5樣條函數(shù)核中,B3樣條函數(shù)核在計算精度和速度方面表現(xiàn)均衡,是更為理想的一種核函數(shù).因此,PSO-B3-RBF-LSSVM比PSO-B1-RBF-LSSVM,PSO-B5-RBF-LSSVM和PSO-RBF-LSSVM具有更好的預(yù)測性能.
表1 60 m處脈動風(fēng)速的預(yù)測性能指標(biāo)Table 1 Prediction performance index of f l uctuating wind velocity at 60 m
表2 130 m處脈動風(fēng)速的預(yù)測性能指標(biāo)Table 2 Prediction performance index of f l uctuating wind velocity at 130 m
本工作首先將B樣條(B1,B3和B5)核函數(shù)和徑向基核函數(shù)進(jìn)行線性組合構(gòu)造了BRBF組合核函數(shù),然后建立了基于PSO-B-RBF的最小二乘支持向量機,最后使用某超高層建筑的脈動風(fēng)速模擬樣本數(shù)據(jù)驗證了模型的預(yù)測性能.數(shù)值結(jié)果分析表明,PSO-B3-RBFLSSVM比PSO-B1-RBF-LSSVM,PSO-B5-RBF-LSSVM和PSO-RBF-LSSVM具有更好的預(yù)測性能.