基于SVM的蒸發(fā)量預(yù)測因子組合與模型研究

2019-10-21 09:23程才華

山西水利 2019年7期

程才華

（山西水利職業(yè)技術(shù)學(xué)院，山西太原 030027）

據(jù)統(tǒng)計我國現(xiàn)有2 474個國家級地面站，國土面積963萬km2，氣象站覆蓋率低，且現(xiàn)有的氣象站存在嚴(yán)重的蒸發(fā)數(shù)據(jù)缺測情況，現(xiàn)有的蒸發(fā)資料難以滿足農(nóng)田灌溉及水文預(yù)報的需求[1-3]。已有學(xué)者針對蒸發(fā)數(shù)據(jù)不足的問題展開了蒸發(fā)量預(yù)測研究，但研究的時間尺度較短，預(yù)測過程中缺乏對各氣象因子與蒸發(fā)量關(guān)系的考慮，對于長期蒸發(fā)量預(yù)測成果的合理性與可行性有待評估[4-5]。文章以山西長治氣象站為例，首先以該氣象站2015-2016年的日氣象數(shù)據(jù)為基礎(chǔ)，利用灰色關(guān)聯(lián)法得到蒸發(fā)量與其他氣象因子之間的關(guān)聯(lián)程度，對影響蒸發(fā)量的主要氣象因子進行篩選，并輸入主要氣象因子，輸出相應(yīng)時段的蒸發(fā)量數(shù)據(jù)，為作為構(gòu)建蒸發(fā)量SVM預(yù)測模型的基礎(chǔ)，研究在不同氣象因子組合下模型預(yù)測精度的變化，研究氣象因子的選取及組合對模型預(yù)測效果的影響。

1 數(shù)據(jù)來源

長治站基礎(chǔ)氣象數(shù)據(jù)源于中國氣象科學(xué)數(shù)據(jù)共享服務(wù)網(wǎng)，氣象數(shù)據(jù)包括長治站2015—2017年的日系列蒸發(fā)量（EVP）、平均風(fēng)速（WIN）、逐日日照時數(shù)（SSD）、逐日平均氣溫（TEM）、逐日平均相對濕度（RHU）、逐日20～20時累計降水量（PRE）。

2 理論依據(jù)

2.1 灰色關(guān)聯(lián)度排序及輸入因子選擇

各氣象因子與蒸發(fā)量關(guān)聯(lián)程度信息量及數(shù)據(jù)量均較少，而灰色關(guān)聯(lián)方法可利用灰色關(guān)聯(lián)度來描述因素間關(guān)系的強弱，可有效解決信息量貧瘠數(shù)據(jù)量少的問題。因此本研究以灰色關(guān)聯(lián)理論確定了各氣象因子對蒸發(fā)量作用的大小[7]，為蒸發(fā)量預(yù)測模型輸入因子的合理確定提供依據(jù)。

2.2 預(yù)測模型

本文選取支持向量機（SVM）神經(jīng)網(wǎng)絡(luò)模型對蒸發(fā)量進行預(yù)測[8-9]。預(yù)測應(yīng)用非線性回歸算法。最優(yōu)分類回歸方程為：

式中，ω為權(quán)系數(shù)向量，φ（x）為映射關(guān)系，b為閾值。

對于給定的訓(xùn)練樣本集合{（x1，y1），（x2，y2），…，（xn，yn）}，其函數(shù)形式為：

對應(yīng)的約束條件為：

式中，C用于衡模型精度和復(fù)雜度，為懲罰因子；ε為不敏感損失函數(shù)；ξi為松弛變量的上限為松弛變量的下限。

判定函數(shù)通過Lagrange因子法來描述優(yōu)化問題：

式中，αi（i=1，2，…，l）為Lagrange因子；K（x，xi）為向量機核函數(shù)；

本次研究所用預(yù)報模型為高斯核函數(shù)：

本研究支持向量機模型利用Libsvm工具箱，在Matlab環(huán)境下建立。

2.3 評定標(biāo)準(zhǔn)

本研究選擇常用的預(yù)測精度評價指標(biāo)均方根誤差RMSE及決定系數(shù)R2對預(yù)測效果進行評價。其中：

式中，N代表樣本數(shù)量，θi和分別代表代實測值和預(yù)測值代表實測值的平均值。RMSE越小R2越大，預(yù)測精度越高。

3 蒸發(fā)量影響因子分析

利用灰色關(guān)聯(lián)理論計算得到影響蒸發(fā)量的5個參數(shù)對蒸發(fā)量的關(guān)聯(lián)度，如表1所示。一般認(rèn)為關(guān)聯(lián)度大于等于0.8時，序列間的關(guān)聯(lián)顯著[6]。本研究所用5個氣象因子與蒸發(fā)量都表現(xiàn)出顯著的關(guān)聯(lián)性（＞0.8），表明本研究所選取的5個氣象因子都是影響蒸發(fā)量的重要因素，可作為預(yù)測模型的輸入。

表1 關(guān)聯(lián)系數(shù)計算結(jié)果表

4 模型的預(yù)測精度對比

分析可知，本研究所選擇的5個氣象因子都是影響蒸發(fā)量的重要因素，預(yù)測模型輸入需要充分考慮這5種因子對蒸發(fā)量的影響。為研究模型在不同因子組合下的預(yù)測效果，分別構(gòu)建不同數(shù)量因子組合下的預(yù)測模型，共計26組，對模型輸出結(jié)果進行檢驗，從而尋求最佳的模型輸入因子組合。預(yù)測模型由建模樣本組構(gòu)成，通過調(diào)節(jié)模型參數(shù)使得輸出的預(yù)測值與實測值誤差最小，輸入建模組選擇2015—2016年逐日系列氣象因子的組合，對2015—2016年蒸發(fā)量進行預(yù)測與實測蒸發(fā)量進行對比，調(diào)節(jié)模型參數(shù)使SVM模型預(yù)測精度達(dá)到最高。將調(diào)節(jié)好的模型參數(shù)應(yīng)用于2017年的蒸發(fā)量預(yù)測，以2017年相應(yīng)的氣象因子組合作為所建預(yù)測模型的測試樣本，從而計算得到模型的擬合結(jié)果。

通過對26種因子組合樣本進行訓(xùn)練，建立了26個蒸發(fā)量預(yù)測模型，各因子組合下的模擬效果如表2所示。由表2可知，各因子組合下的模型所得RMSE介于0.403～0.575之間，模型R2介于0.191～0.824之間，模擬效果差距較大，表明因子組合是影響蒸發(fā)量預(yù)測精度的關(guān)鍵因素，文章所建立的SVM蒸發(fā)量預(yù)測模型精度最高即R2最大取為0.824時對應(yīng)的因子組合為第21組，即TEM+WIN+SSD+RHU，此時模型的RMSE值也最小為0.403；預(yù)測模型精度最低即R2最小為0.191時對應(yīng)的因子組合為第10組，即RHU+PRE，此時模型的RMSE值也最大即0.575，最佳與最差模擬結(jié)果對比見圖1。這表明，對長治地區(qū)的蒸發(fā)量預(yù)測取TEM+WIN+SSD+RHU組合其結(jié)果最為可靠，接近實際情況，取RHU+PRE組合其結(jié)果較差，不能為實際提供參考。

表2 各因子組合下的模擬效果

圖1 預(yù)測結(jié)果對比圖

5 結(jié)語

文章基于灰色關(guān)聯(lián)與SVM建立了20個不同因子組合下的長治地區(qū)蒸發(fā)量預(yù)測模型，對模型精度進行對比分析，得到氣象因子組合對模型模擬效果具有重大影響，在長治地區(qū)模型模擬精度最高時對應(yīng)的因子組合為TEM+WIN+SSD+RHU，此時模型預(yù)測R2值0.824，RMSE值為0.403。在不同區(qū)域進行蒸發(fā)量預(yù)測時，會存在當(dāng)?shù)貧庀筚Y料不滿足最佳蒸發(fā)量預(yù)測因子組合的情況，此時借助本研究在不同區(qū)域選取所能得到的預(yù)測精度最高因子組合，對蒸發(fā)量進行預(yù)測。文章研究內(nèi)容可為蒸發(fā)量預(yù)測提供新的思路，一方面有助于提高資料充足地區(qū)的蒸發(fā)量預(yù)測精度，另一方面可以為缺資料地區(qū)的蒸發(fā)量預(yù)測提供參考，未來需要對不同地區(qū)的季節(jié)性蒸發(fā)量預(yù)測模型進行研究，尋找區(qū)域性最佳預(yù)測因子組合，為蒸發(fā)量預(yù)測提供更多依據(jù)。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡