蔣 鋒,楊嘉偉
(中南財(cái)經(jīng)政法大學(xué) 統(tǒng)計(jì)與數(shù)學(xué)學(xué)院,湖北 武漢430073)
隨著化石燃料的消費(fèi)和能源環(huán)境問(wèn)題的增加,發(fā)展可再生的清潔能源已成為國(guó)際社會(huì)的共識(shí).近年來(lái)太陽(yáng)能作為最理想的清潔能源在各國(guó)得到了廣泛應(yīng)用.隨著太陽(yáng)輻射應(yīng)用發(fā)展,對(duì)預(yù)測(cè)精度提出了更高的要求.預(yù)報(bào)技術(shù)已經(jīng)逐漸成長(zhǎng)為光伏發(fā)電領(lǐng)域的關(guān)鍵性基礎(chǔ)科學(xué).
目前,國(guó)內(nèi)外學(xué)者提出了許多方法以預(yù)測(cè)太陽(yáng)輻射強(qiáng)度,這些方法大致分為3類(lèi):物理計(jì)算方法、時(shí)間序列方法和機(jī)器學(xué)習(xí)方法.在傳統(tǒng)的物理計(jì)算方法中有晴天太陽(yáng)模型[1]、Collares-Pereira和Rabl模型[2-3]等.時(shí)間序列方法[4]也被廣泛應(yīng)用于太陽(yáng)輻射預(yù)測(cè),比如自回歸差分移動(dòng)平均(Autore-Rressive Integrated Moving Average,ARIMA)[5]模型、線性回歸[6-7]、冪指數(shù)移動(dòng)平均法[8]、動(dòng)態(tài)諧波回歸模型[9]等.機(jī)器學(xué)習(xí)由于其優(yōu)異的非線性擬合能力被大量學(xué)者研究,其中人工神經(jīng)網(wǎng)絡(luò)[10-13]、支持向量機(jī)[14]等機(jī)器學(xué)習(xí)方法在工業(yè)、農(nóng)業(yè)、金融、醫(yī)療等領(lǐng)域得到了廣泛的應(yīng)用.陳杰等[15]建立了基于優(yōu)化的神經(jīng)網(wǎng)絡(luò)的太陽(yáng)輻射預(yù)測(cè)模型,模型預(yù)測(cè)效果極佳.顧萬(wàn)龍等[16]運(yùn)用支持向量機(jī)方法來(lái)預(yù)測(cè)太陽(yáng)輻射,其精度遠(yuǎn)高于傳統(tǒng)線性模型.
由于太陽(yáng)輻射數(shù)據(jù)具有很強(qiáng)的波動(dòng)性和非線性特征,并且對(duì)預(yù)測(cè)精度的要求也在不斷提高,一些學(xué)者通過(guò)集成學(xué)習(xí)的范式及單目標(biāo)優(yōu)化的方法來(lái)提升預(yù)測(cè)的準(zhǔn)確率和泛化能力.比如Jiang等[17]使用鴿子算法優(yōu)化的極限學(xué)習(xí)機(jī)對(duì)小波包分解的分量預(yù)測(cè),加權(quán)集成方法得到結(jié)果,提升了預(yù)測(cè)的準(zhǔn)確率.Sun等[18]利用集合經(jīng)驗(yàn)?zāi)B(tài)分解將太陽(yáng)輻射分解為若干分量,運(yùn)用鯨魚(yú)算法優(yōu)化的最小二乘支持向量機(jī)(Least Squares Support Vector Machine,LSSVM)預(yù)測(cè)分量結(jié)果,并運(yùn)用分類(lèi)集成的思想將分量結(jié)果整合,得到了較好的預(yù)測(cè)精度.Wang等[19]利用多響應(yīng)稀疏回歸、留一交叉驗(yàn)證和布谷鳥(niǎo)優(yōu)化的極限學(xué)習(xí)機(jī)建立網(wǎng)絡(luò)結(jié)構(gòu)來(lái)預(yù)測(cè)2015年的太陽(yáng)每小時(shí)輻射量. 預(yù)測(cè)結(jié)果表明,該組合模型比ARIMA、BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)和最優(yōu)剪枝極限學(xué)習(xí)機(jī)更強(qiáng).
同時(shí)多目標(biāo)算法在調(diào)度、醫(yī)療、集成策略預(yù)測(cè)領(lǐng)域得到了廣泛研究.He等[20]利用多目標(biāo)粒子群
(Multi-Objective Particle Swarm Optimization,MOPSO)算法對(duì)風(fēng)速數(shù)據(jù)預(yù)測(cè)結(jié)果的精確度和穩(wěn)定性進(jìn)行優(yōu)化.Jiang等[21]運(yùn)用多目標(biāo)差分算法、模糊時(shí)間序列和經(jīng)驗(yàn)?zāi)B(tài)分解技術(shù)對(duì)風(fēng)速數(shù)據(jù)進(jìn)行預(yù)測(cè),預(yù)測(cè)結(jié)果表明,其混合框架具有良好的性能.Priyanka等[22]運(yùn)用多目標(biāo)領(lǐng)袖算法(Multi-Objective Follow The Leader,MOFTL)算法與人工神經(jīng)網(wǎng)絡(luò)結(jié)合,對(duì)兩個(gè)地區(qū)電力數(shù)據(jù)集進(jìn)行預(yù)測(cè),結(jié)果表明MOFTL算法性能優(yōu)于多目標(biāo)狼群算法(Multi-Objective Wolf Colony Algorithm,MOWCA)、MOPSO和非支配排序遺傳算法(Non-dominated Sorting Genetic Algorithm, NSGAII). Abdolrahman
等[23]比較了NSGAII、MOPSO及改進(jìn)型強(qiáng)Pareto進(jìn)化算法(improved Strength Pareto Evolutionary Algorithm,SPEA-II)等3種算法對(duì)集成效果的差異性.Lam等[24]運(yùn)用多目標(biāo)差分進(jìn)化算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)進(jìn)行匯率預(yù)測(cè),對(duì)比NSGAII等其他多目標(biāo)優(yōu)化算法具有更好的性能.
上述多目標(biāo)優(yōu)化集成框架的目標(biāo)函數(shù)均設(shè)計(jì)為預(yù)測(cè)精度與模型穩(wěn)定性,并未考慮方向精度.本文同時(shí)考慮水平精度和方向精度,提出了一種新的多目標(biāo)優(yōu)化的集成學(xué)習(xí)框架來(lái)預(yù)測(cè)太陽(yáng)輻射強(qiáng)度.本文主要貢獻(xiàn)在于:①在進(jìn)行奇異譜分析(Singular Spectrum Analysis,SSA)分解降噪后,利用多目標(biāo)優(yōu)化能夠很好兼顧水平精度和方向精度,相比較于單目標(biāo)優(yōu)化更有效;②將不同特征的樣本進(jìn)行聚類(lèi);③摒棄了線性加總的集成思想,提出了新的集成方法,能夠最大限度使用數(shù)據(jù)信息.
1.1 奇異譜分析(SSA)分解與重構(gòu)是SSA的兩個(gè)主要階段[25],設(shè)x=[x1,x2,···,xN]T為長(zhǎng)度N>2的時(shí)間序列,長(zhǎng)度限定為2≤L≤N-1,K=N-L+1.通過(guò)滑動(dòng)長(zhǎng)度為L(zhǎng)的窗口對(duì)原序列進(jìn)行截取,可得到軌跡矩陣,如下所示:
對(duì)軌跡矩陣X進(jìn)行奇異值分解(Singular Value Decomposion,SVD):
其中,S是X的奇異值,U和V分別是X的左奇異向量和右奇異向量.
其中,E kj為XXT的特征向量,E為時(shí)間經(jīng)驗(yàn)正交函數(shù),a ij,k為時(shí)間主成分分量,n、m為不同重構(gòu)組的時(shí)間窗口,N、M為其時(shí)間窗口的最大值.
1.2 NSGAII算法
1.2.1 快速非支配排序策略 假設(shè)NSGAII算法[24]的初始種群為N,每個(gè)個(gè)體i都有兩個(gè)參數(shù):個(gè)體數(shù)目ni和 被i支配的個(gè)體數(shù)目集合Si.首先,找到種群中的非支配個(gè)體存入當(dāng)前集合Fi;然后,遍歷被支配集合Si,對(duì)集合個(gè)體l進(jìn) 行nl=nl-1操作,若nl=0,將l存入集合H中[26];最后,當(dāng)Fi中個(gè)體為第一非支配層個(gè)體,對(duì)H進(jìn)行分級(jí)且賦予非支配序,直至所有個(gè)體均被分級(jí).
1.2.2 多樣性保持策略NSGAII算法通過(guò)擁擠距離和非支配排序使個(gè)體充滿(mǎn)Pareto面.每個(gè)個(gè)體i有兩個(gè)基本屬性:非支配排序(irank)和擁擠距離(idistance) .如果個(gè)體i和j滿(mǎn)足irank≤jrank,且idistance>jdistance成立,則i<jn.
1.2.3 選擇交叉變異步驟NSGAII算法選擇策略采用競(jìng)標(biāo)賽規(guī)則:①計(jì)算個(gè)體適應(yīng)度函數(shù)得分;②隨機(jī)選取兩個(gè)個(gè)體進(jìn)行比較,淘汰低分個(gè)體,保留高分個(gè)體進(jìn)入下一次迭代;③重復(fù)執(zhí)行操作②,直至得到N個(gè)個(gè)體.
本文采用模擬二進(jìn)制交叉進(jìn)行基因交叉操作,兩個(gè)個(gè)體轉(zhuǎn)為二進(jìn)制序列進(jìn)行交叉,轉(zhuǎn)譯后進(jìn)入下一代.而算法的基因變異操作采用多項(xiàng)式變異方法,保證算子多樣性,防止陷入局部最優(yōu).
1.2.4 NSGAII步驟 算法的具體步驟如下:
步驟1初始化種群P0,設(shè)個(gè)體數(shù)目為N,當(dāng)前迭代次數(shù)為t,最大迭代次數(shù)為T(mén);
步驟2從Pt中隨機(jī)選取個(gè)體進(jìn)行基因的交叉、變異操作,產(chǎn)生新N個(gè)個(gè)體,構(gòu)成集合Qt,將Pt和Qt進(jìn)行合并,形成種群Rt;
步驟3Rt的種群剪枝,生成規(guī)模為N的下一代種群Pt+1;
步驟4當(dāng)t<T時(shí),重復(fù)步驟2~3,否則輸出當(dāng)前種群中的非支配個(gè)體.
為了提高非線性數(shù)據(jù)預(yù)測(cè)的水平精度和方向精度,本文提出了一種新的多目標(biāo)優(yōu)化集成學(xué)習(xí)框架.該框架體系主要包括4個(gè)步驟:首先,引入SSA方法將原始時(shí)間序列分解成一系列分量序列;然后,運(yùn)用帶精英策略的NSGAII優(yōu)化的LSSVM對(duì)每個(gè)分量信號(hào)進(jìn)行預(yù)測(cè);接著,運(yùn)用K-means聚類(lèi)方法將各分量數(shù)據(jù)進(jìn)行聚類(lèi),得到n個(gè)樣本集合;最后,對(duì)不同聚類(lèi)樣本以各分量數(shù)據(jù)作為輸入數(shù)據(jù),分別運(yùn)用不同的NSGAII-LSSVM模型進(jìn)行集成訓(xùn)練,最終得到預(yù)測(cè)結(jié)果.在沒(méi)有考慮決策者偏好[27-30]的情況下,對(duì)NSGAII-LSSVM生成的非劣解集[31-32]采用隨機(jī)選取Pareto解的方法進(jìn)入下一步.多目標(biāo)優(yōu)化集成學(xué)習(xí)框架流程如圖1所示.
為使整個(gè)框架的預(yù)測(cè)結(jié)果兼顧水平精度和方向精度,令NSGAII的目標(biāo)函數(shù)如下:
本文運(yùn)用多目標(biāo)優(yōu)化集成學(xué)習(xí)框架對(duì)意大利2017年太陽(yáng)輻射數(shù)據(jù)進(jìn)行預(yù)測(cè),并通過(guò)誤差分析、模型對(duì)比、穩(wěn)健性分析,顯示了新方法的優(yōu)越性.3.1 數(shù)據(jù)來(lái)源及評(píng)價(jià)準(zhǔn)則本文使用意大利2017
年1月1日至12月31日的8 760個(gè)觀測(cè)值作為仿真數(shù)據(jù). 意大利大部分地區(qū)屬亞熱帶地中海型氣候,冬溫夏熱、四季分明、降水豐沛,各季度太陽(yáng)輻射量具有明顯差別,如圖2所示.從圖2可以看出,第一季度和第四季度的太陽(yáng)輻射每天峰值差距極大,第二季度和第三季度峰值差距較小,各季度差異性較大.我們將每個(gè)季度前75%的數(shù)據(jù)作為訓(xùn)練集,后25%的數(shù)據(jù)作為測(cè)試集.
為了從水平精度和方向精度來(lái)比較不同模型的預(yù)測(cè)性能,我們選擇均方誤差(Mean-Square Error,MSE)、標(biāo)準(zhǔn)均方根誤差(Normalized Root Mean Square Error, NRMSE)、平均絕對(duì)誤差(Mean Absolute Error,MAE)和方向統(tǒng)計(jì)量(Directional symmetry,Ds)等4個(gè)評(píng)價(jià)指標(biāo).Ds統(tǒng)計(jì)量能夠用來(lái)判斷模型的預(yù)測(cè)結(jié)果是否與真實(shí)值的變動(dòng)方向相同,常用在波動(dòng)性較大的非線性數(shù)據(jù)中[33].為了檢驗(yàn)不同模型之間效果的差異性,本文采用了Diebold-Mariano(DM)[34]檢驗(yàn)來(lái)比較不同模型的預(yù)測(cè)能力是否顯著相同,其原假設(shè)為測(cè)試模型的預(yù)測(cè)精度與基準(zhǔn)模型無(wú)顯著差異.評(píng)價(jià)指標(biāo)NRMSE(ENRMS),MSE(EMS)及MAE(EMA)的計(jì)算公式如下:
圖1 多目標(biāo)優(yōu)化集成學(xué)習(xí)框架流程圖Fig.1 Flow chart of integrated learning framework for multi-objectiveoptimization
3.2 實(shí)證結(jié)果本節(jié)對(duì)多目標(biāo)優(yōu)化集成學(xué)習(xí)框架的結(jié)果進(jìn)行對(duì)比分析,選取了ARIMA[4]、BP神經(jīng)網(wǎng)絡(luò)[15]、LSSVM[14]、單目標(biāo)加總模型(Singleobjective-ADD,SO-ADD)、單目標(biāo)集成模型(Singleobjective-Ensemble,SO-E)、單目標(biāo)聚類(lèi)集成模型(Singleobjective-Kmeans-Ensemble,SO-K-E)[18]、多目標(biāo)加總模型(Multiobjective-ADD,MO-ADD)和多目標(biāo)集成模型(Multiobjective-Ensemble,MO-E)等8個(gè)對(duì)比模型.同時(shí),從水平精度和方向精度兩個(gè)方面進(jìn)行誤差分析;利用DM檢驗(yàn)[34]對(duì)各模型預(yù)測(cè)效果進(jìn)行對(duì)比;最后對(duì)各個(gè)模型穩(wěn)健性進(jìn)行討論.通過(guò)各模型分析對(duì)比,驗(yàn)證了該框架的優(yōu)越性和穩(wěn)定性.
3.2.1 模型參數(shù)設(shè)置 選取ARIMA模型[4]、BP神經(jīng)網(wǎng)絡(luò)模型[15]和LSSVM[16]及鯨魚(yú)優(yōu)化算法(WOA)[32]的單目標(biāo)學(xué)習(xí)框架作為單一基準(zhǔn)模型,并用鯨魚(yú)優(yōu)化算法替代NSGAII作為優(yōu)化LSSVM的組件進(jìn)行對(duì)比分析.在集成上,與線性加總做對(duì)比.同時(shí),分析聚類(lèi)對(duì)集成的影響,選取ARIMA、BP神經(jīng)網(wǎng)絡(luò)、LSSVM、SO-ADD、SO-E、SO-K-E、MO-ADD和MO-E與多目標(biāo)優(yōu)化集成學(xué)習(xí)框架(Multiobjective-Kmeans-Ensemble,MO-K-E)進(jìn)行對(duì)比.
圖2 2017年意大利太陽(yáng)輻射數(shù)據(jù)Fig.2 Solar radiation data of Italy in 2017
ARIMA(p-d-q)模型的參數(shù)由AIC準(zhǔn)則確定.BP神經(jīng)網(wǎng)絡(luò)的輸入神經(jīng)元為3個(gè),隱含層為1層,隱含層神經(jīng)元個(gè)數(shù)為8,輸出層為1個(gè)神經(jīng)元.學(xué)習(xí)率設(shè)置為0.000 1,迭代次數(shù)為1 000次,停止誤差為0.000 01.為保證LSSVM的可比性,作為單一基準(zhǔn)模型預(yù)測(cè)的LSSVM的參數(shù)經(jīng)過(guò)NSGAII優(yōu)化. NSGAII的種群設(shè)置為20個(gè),迭代次數(shù)為100次,交叉概率為0.8,變異概率為0.02,交叉參數(shù)和變異參數(shù)均設(shè)為20.鯨魚(yú)優(yōu)化算法的螺旋形狀參數(shù)設(shè)置為0.01,迭代次數(shù)為100次.LSSVM需要優(yōu)化的參數(shù)分別為高斯核寬度參數(shù)σ2和正則化參數(shù) γ, σ2為[1,1 000],γ為[0.01,3].
3.2.2 模型對(duì)比分析 多目標(biāo)優(yōu)化集成學(xué)習(xí)框架得出的最終預(yù)測(cè)結(jié)果與8個(gè)基準(zhǔn)模型進(jìn)行對(duì)比,分析不同評(píng)價(jià)指標(biāo)下的模型性能.
表1和表2分別展示了不同模型各類(lèi)誤差值和評(píng)價(jià)指標(biāo)季度均值.圖3~6為8個(gè)模型誤差對(duì)比柱形圖(因ARIMA指標(biāo)遠(yuǎn)劣于其他模型,在此未展示).為突出各指標(biāo)的表現(xiàn),采用對(duì)數(shù)方法壓縮坐標(biāo)軸來(lái)增強(qiáng)對(duì)比效果.從表1和圖3~6可以看出:①LSSVM是最優(yōu)的基準(zhǔn)模型,LSSVM各類(lèi)評(píng)價(jià)指標(biāo)均優(yōu)于ARIMA,而B(niǎo)P神經(jīng)網(wǎng)絡(luò)雖在第二季度上整體指標(biāo)優(yōu)于LSSVM,在其他三個(gè)季度上的表現(xiàn)仍略次于LSSVM.從模型的適應(yīng)性和穩(wěn)定性來(lái)看,LSSVM具有很好的適應(yīng)性.②傳統(tǒng)的線性模型ARIMA無(wú)法捕捉數(shù)據(jù)的復(fù)雜性和非線性,人工智能方法對(duì)復(fù)雜的非線性數(shù)據(jù)具有更好的表現(xiàn)力,更適合于探索非線性數(shù)據(jù).③ LSSVM和BP神經(jīng)網(wǎng)絡(luò)對(duì)于該數(shù)據(jù)來(lái)說(shuō),預(yù)測(cè)效果差距不大,但LSSVM在4個(gè)季度上的預(yù)測(cè)表現(xiàn)更穩(wěn)定.④混合模型在各個(gè)季度的表現(xiàn)優(yōu)于單一模型.混合模型通過(guò)特征分解和優(yōu)化集成步驟使數(shù)據(jù)擬合更加穩(wěn)定,更適合于不同時(shí)期的太陽(yáng)輻射預(yù)測(cè).
表1 不同模型評(píng)價(jià)指標(biāo)對(duì)比結(jié)果Tab.1 Thecomparison resultsof evaluation indexesfor different models
表2 不同模型評(píng)價(jià)指標(biāo)均值對(duì)比結(jié)果Tab.2 The mean comparison resultsof evaluation indexesfor different models
圖3 模型MAE對(duì)比圖Fig.3 Comparison of MAE for models
圖4 模型MSE對(duì)比圖Fig.4 Comparison of MSEfor models
圖5 模型NRMSE對(duì)比圖Fig.5 Comparison of NRMSEfor models
圖6 模型Ds對(duì)比圖Fig.6 Comparison of Dsfor models
通過(guò)表1~2可以得出:①混合模型的各評(píng)價(jià)指標(biāo)遠(yuǎn)優(yōu)于單一模型.在方向精度上,除了SOADD的Ds指標(biāo)為87.86%外,其它單目標(biāo)集成框架和多目標(biāo)集成框架的Ds指標(biāo)均在90%以上,同時(shí)所有集成框架的Ds均值都在93%以上,而單一模型的Ds均值都在89%以下;在水平精度上,無(wú)論是單目標(biāo)還是多目標(biāo)優(yōu)化的模型,評(píng)價(jià)指標(biāo)均優(yōu)于單一模型,這充分說(shuō)明混合模型預(yù)測(cè)的優(yōu)良性能,能夠很好地捕捉數(shù)據(jù)信息,提高了整體的預(yù)測(cè)性能.②聚類(lèi)能夠很好地提升集成效果,MO-K-E和SO-K-E分別是多目標(biāo)和單目標(biāo)中最優(yōu)的模型,其誤差均低于MO-E和SO-E.③加總并不是一個(gè)好的集成策略.SO-ADD和MO-ADD模型的精度遠(yuǎn)低于相應(yīng)的集成模型.由表2可知在水平精度上,SO-K-E的NRMSE均值為7.529 0%,SO-ADD的NRMSE均值為14.860 6%,MO-ADD的NRMSE均值雖已經(jīng)在較低水平為4.427 3%,但MO-K-E的NRMSE均值更低,達(dá)到了0.032 8%.其主要原因是加總很難識(shí)別分量預(yù)測(cè)結(jié)果的特征,無(wú)法識(shí)別各個(gè)分量預(yù)測(cè)結(jié)果所包含的不同屬性.④多目標(biāo)能夠很好地權(quán)衡方向和水平上的誤差,在第一季度上,MO-ADD在與SO-ADD方向精度相同的情況下(0.978 0),找到了水平精度更高的解,在其他模型對(duì)比中多目標(biāo)方法在水平和方向上其各類(lèi)指標(biāo)均優(yōu)于單目標(biāo)方法,說(shuō)明多目標(biāo)優(yōu)化算法能夠更好地找到最優(yōu)解集.
在SO-K-E和MO-K-E框架中,聚類(lèi)將不同特征的樣本區(qū)分的重要組件.表3和表4分別展示了SO-K-E和MO-K-E的聚類(lèi)中心.從表4簡(jiǎn)單計(jì)算可知全年的低輻射觀測(cè)數(shù)為1 056個(gè),與中高輻射觀測(cè)數(shù)1 139個(gè)基本相當(dāng);每季度的高輻射觀測(cè)量數(shù)占各季度的30%以下;第三、四季度的高輻射觀測(cè)數(shù)為253個(gè)少于第一、二季度觀測(cè)數(shù)317個(gè),其占比不高.第四季度的高輻射中心遠(yuǎn)小于其它三個(gè)季度,這與意大利2017年冬季陰天較多,云密度較大相匹配,單日內(nèi)可利用的高強(qiáng)度光輻射僅有幾個(gè)小時(shí).表3和表4顯示各季度高輻射數(shù)據(jù)中心點(diǎn)位置差距不大,但第二、三季度的高輻射數(shù)據(jù)數(shù)量差距較大.低輻射數(shù)據(jù)中心點(diǎn)位置差距巨大,各聚類(lèi)數(shù)目差距較小.從結(jié)果上看,MO-K-E的精度要遠(yuǎn)高于SO-K-E模型的精度.這說(shuō)明區(qū)分不同屬性數(shù)據(jù)有利于提取數(shù)據(jù)特征和集成處理.因此,聚類(lèi)是至關(guān)重要的.
表3 SO-K-E聚類(lèi)中心Tab.3 Cluster center of SO-K-E model
表4 MO-K-E聚類(lèi)中心Tab.4 Cluster center of MO-K-E model
通過(guò)DM檢驗(yàn)分析模型性能差異可以得出:①本文提出的多目標(biāo)優(yōu)化集成學(xué)習(xí)框架明顯優(yōu)于其他8個(gè)模型,DM檢驗(yàn)的結(jié)論與上述統(tǒng)計(jì)評(píng)價(jià)指標(biāo)的結(jié)論相同;②MO-E模型穩(wěn)定性不足,這說(shuō)明區(qū)分不同屬性數(shù)據(jù)有利于提取數(shù)據(jù)特征,有利于集成處理;③單目標(biāo)優(yōu)化的學(xué)習(xí)框架穩(wěn)定性不足.單目標(biāo)學(xué)習(xí)框架因僅在單一目標(biāo)上尋找最優(yōu)解,而多目標(biāo)能夠在平衡不同目標(biāo)的前提下,找到當(dāng)前解空間下的最優(yōu)Pareto解集,能夠給決策者提供不同的方案進(jìn)行選擇,其輔助決策的能力更具有現(xiàn)實(shí)意義,從數(shù)據(jù)預(yù)測(cè)精度來(lái)看,多目標(biāo)優(yōu)化的集成學(xué)習(xí)框架明顯優(yōu)于單目標(biāo)模型,能夠很好地詮釋數(shù)據(jù)信息,在預(yù)測(cè)非線性高波動(dòng)數(shù)據(jù)上具有更強(qiáng)的性能.
3.2.3 穩(wěn)健性分析 不同的初始條件可能會(huì)產(chǎn)生不同的結(jié)果.因此,我們將各個(gè)模型分別運(yùn)行20次,計(jì)算他們的NRMSE和Ds的標(biāo)準(zhǔn)差.分析表5中各個(gè)模型的標(biāo)準(zhǔn)差可以看出:①多目標(biāo)優(yōu)化集成學(xué)習(xí)框架是最穩(wěn)健的混合學(xué)習(xí)模型,其N(xiāo)RMSE的標(biāo)準(zhǔn)差均小于0.05,Ds的標(biāo)準(zhǔn)差均小于0.0 1. ② SO-ADD的方向穩(wěn)健性不如單一的LSSVM.其加總集成方法不能夠有效提取特征導(dǎo)致每次結(jié)果差距較大,又由于單目標(biāo)優(yōu)化無(wú)法尋找到解空間最優(yōu)方案導(dǎo)致其穩(wěn)健性較差.③在單一模型中,LSSVM是最穩(wěn)健的.從穩(wěn)健性來(lái)看,遠(yuǎn)優(yōu)于普通線性模型ARIMA,而NRMSE的標(biāo)準(zhǔn)差與BP差距不大,但方向標(biāo)準(zhǔn)差要比BP神經(jīng)網(wǎng)絡(luò)小.④聚類(lèi)能夠提升集成的穩(wěn)定性,使框架的具有更強(qiáng)的穩(wěn)健性.分類(lèi)集成能夠提升數(shù)據(jù)擬合效果,使多次試驗(yàn)的結(jié)果趨于穩(wěn)定.⑤集成框架的穩(wěn)健性?xún)?yōu)于加總框架的穩(wěn)健性.加總方法的弊端導(dǎo)致了其預(yù)測(cè)精度和穩(wěn)健性都較差,因此集成的選擇是十分重要的.
表5 模型的NRMSE和DS穩(wěn)健性分析Tab.5 NRMSEand DS robustnessanalysis of models
本文提出了一種多目標(biāo)優(yōu)化的集成學(xué)習(xí)框架,并對(duì)太陽(yáng)輻射進(jìn)行預(yù)測(cè).該模型首先運(yùn)用SSA技術(shù)將太陽(yáng)輻射數(shù)據(jù)分解為了一系列信號(hào)組;然后使用NSGAII-LSSVM分別對(duì)分量信號(hào)進(jìn)行預(yù)測(cè);接著K-means聚類(lèi)方法將各預(yù)測(cè)結(jié)果分為高、中、低輻射數(shù)據(jù);最后使用NSGAII-LSSVM分別進(jìn)行集成,得到預(yù)測(cè)結(jié)果.通過(guò)各類(lèi)模型對(duì)比,我們發(fā)現(xiàn)本文提出的多目標(biāo)優(yōu)化集成學(xué)習(xí)框架預(yù)測(cè)效果明顯優(yōu)于基準(zhǔn)模型.通過(guò)各類(lèi)指標(biāo)分析和穩(wěn)健性分析,該學(xué)習(xí)框架無(wú)論在水平精度還是方向精度上均能對(duì)太陽(yáng)輻射進(jìn)行有效預(yù)測(cè). 本文得出幾點(diǎn)結(jié)論:①聚類(lèi)的思想來(lái)源于各時(shí)間段包含有不同的特征,將各類(lèi)特征進(jìn)行分類(lèi)集成,能夠很好地詮釋時(shí)間帶來(lái)的影響,如在夜間和中午時(shí)刻數(shù)據(jù)在量級(jí)和波動(dòng)性上差異巨大;②集成學(xué)習(xí)對(duì)最終的預(yù)測(cè)結(jié)果是至關(guān)重要的,集成學(xué)習(xí)能夠充分反映數(shù)據(jù)信息,提升預(yù)測(cè)效果,僅僅是簡(jiǎn)單線性加總的方式無(wú)法捕獲子序列的不同特征;③多目標(biāo)的預(yù)測(cè)模型能夠很好地兼顧水平精度和方向精度,能夠更好地找到當(dāng)前解空間下的最優(yōu)解集.
本文提出的多目標(biāo)優(yōu)化的集成學(xué)習(xí)框架能夠很好地預(yù)測(cè)非線性高波動(dòng)數(shù)據(jù).因此,可以推廣至風(fēng)速預(yù)測(cè)、電力負(fù)荷預(yù)測(cè)和能源數(shù)據(jù)預(yù)測(cè)等方面.在今后的研究中,還可以將云密度、天氣、大氣污染等影響太陽(yáng)輻射的因素納入輸入變量.