程才華
(山西水利職業(yè)技術(shù)學(xué)院,山西 太原 030027)
據(jù)統(tǒng)計我國現(xiàn)有2 474個國家級地面站,國土面積963萬km2,氣象站覆蓋率低,且現(xiàn)有的氣象站存在嚴(yán)重的蒸發(fā)數(shù)據(jù)缺測情況,現(xiàn)有的蒸發(fā)資料難以滿足農(nóng)田灌溉及水文預(yù)報的需求[1-3]。已有學(xué)者針對蒸發(fā)數(shù)據(jù)不足的問題展開了蒸發(fā)量預(yù)測研究,但研究的時間尺度較短,預(yù)測過程中缺乏對各氣象因子與蒸發(fā)量關(guān)系的考慮,對于長期蒸發(fā)量預(yù)測成果的合理性與可行性有待評估[4-5]。文章以山西長治氣象站為例,首先以該氣象站2015-2016年的日氣象數(shù)據(jù)為基礎(chǔ),利用灰色關(guān)聯(lián)法得到蒸發(fā)量與其他氣象因子之間的關(guān)聯(lián)程度,對影響蒸發(fā)量的主要氣象因子進行篩選,并輸入主要氣象因子,輸出相應(yīng)時段的蒸發(fā)量數(shù)據(jù),為作為構(gòu)建蒸發(fā)量SVM預(yù)測模型的基礎(chǔ),研究在不同氣象因子組合下模型預(yù)測精度的變化,研究氣象因子的選取及組合對模型預(yù)測效果的影響。
長治站基礎(chǔ)氣象數(shù)據(jù)源于中國氣象科學(xué)數(shù)據(jù)共享服務(wù)網(wǎng),氣象數(shù)據(jù)包括長治站2015—2017年的日系列蒸發(fā)量(EVP)、平均風(fēng)速(WIN)、逐日日照時數(shù)(SSD)、逐日平均氣溫(TEM)、逐日平均相對濕度(RHU)、逐日20~20時累計降水量(PRE)。
各氣象因子與蒸發(fā)量關(guān)聯(lián)程度信息量及數(shù)據(jù)量均較少,而灰色關(guān)聯(lián)方法可利用灰色關(guān)聯(lián)度來描述因素間關(guān)系的強弱,可有效解決信息量貧瘠數(shù)據(jù)量少的問題。因此本研究以灰色關(guān)聯(lián)理論確定了各氣象因子對蒸發(fā)量作用的大小[7],為蒸發(fā)量預(yù)測模型輸入因子的合理確定提供依據(jù)。
本文選取支持向量機(SVM)神經(jīng)網(wǎng)絡(luò)模型對蒸發(fā)量進行預(yù)測[8-9]。預(yù)測應(yīng)用非線性回歸算法。最優(yōu)分類回歸方程為:
式中,ω為權(quán)系數(shù)向量,φ(x)為映射關(guān)系,b為閾值。
對于給定的訓(xùn)練樣本集合{(x1,y1),(x2,y2),…,(xn,yn)},其函數(shù)形式為:
對應(yīng)的約束條件為:
式中,C用于衡模型精度和復(fù)雜度,為懲罰因子;ε為不敏感損失函數(shù);ξi為松弛變量的上限為松弛變量的下限。
判定函數(shù)通過Lagrange因子法來描述優(yōu)化問題:
式中,αi(i=1,2,…,l)為Lagrange因子;K(x,xi)為向量機核函數(shù);
本次研究所用預(yù)報模型為高斯核函數(shù):
本研究支持向量機模型利用Libsvm工具箱,在Matlab環(huán)境下建立。
本研究選擇常用的預(yù)測精度評價指標(biāo)均方根誤差RMSE及決定系數(shù)R2對預(yù)測效果進行評價。其中:
式中,N代表樣本數(shù)量,θi和分別代表代實測值和預(yù)測值代表實測值的平均值。RMSE越小R2越大,預(yù)測精度越高。
利用灰色關(guān)聯(lián)理論計算得到影響蒸發(fā)量的5個參數(shù)對蒸發(fā)量的關(guān)聯(lián)度,如表1所示。一般認(rèn)為關(guān)聯(lián)度大于等于0.8時,序列間的關(guān)聯(lián)顯著[6]。本研究所用5個氣象因子與蒸發(fā)量都表現(xiàn)出顯著的關(guān)聯(lián)性(>0.8),表明本研究所選取的5個氣象因子都是影響蒸發(fā)量的重要因素,可作為預(yù)測模型的輸入。
表1 關(guān)聯(lián)系數(shù)計算結(jié)果表
分析可知,本研究所選擇的5個氣象因子都是影響蒸發(fā)量的重要因素,預(yù)測模型輸入需要充分考慮這5種因子對蒸發(fā)量的影響。為研究模型在不同因子組合下的預(yù)測效果,分別構(gòu)建不同數(shù)量因子組合下的預(yù)測模型,共計26組,對模型輸出結(jié)果進行檢驗,從而尋求最佳的模型輸入因子組合。預(yù)測模型由建模樣本組構(gòu)成,通過調(diào)節(jié)模型參數(shù)使得輸出的預(yù)測值與實測值誤差最小,輸入建模組選擇2015—2016年逐日系列氣象因子的組合,對2015—2016年蒸發(fā)量進行預(yù)測與實測蒸發(fā)量進行對比,調(diào)節(jié)模型參數(shù)使SVM模型預(yù)測精度達(dá)到最高。將調(diào)節(jié)好的模型參數(shù)應(yīng)用于2017年的蒸發(fā)量預(yù)測,以2017年相應(yīng)的氣象因子組合作為所建預(yù)測模型的測試樣本,從而計算得到模型的擬合結(jié)果。
通過對26種因子組合樣本進行訓(xùn)練,建立了26個蒸發(fā)量預(yù)測模型,各因子組合下的模擬效果如表2所示。由表2可知,各因子組合下的模型所得RMSE介于0.403~0.575之間,模型R2介于0.191~0.824之間,模擬效果差距較大,表明因子組合是影響蒸發(fā)量預(yù)測精度的關(guān)鍵因素,文章所建立的SVM蒸發(fā)量預(yù)測模型精度最高即R2最大取為0.824時對應(yīng)的因子組合為第21組,即TEM+WIN+SSD+RHU,此時模型的RMSE值也最小為0.403;預(yù)測模型精度最低即R2最小為0.191時對應(yīng)的因子組合為第10組,即RHU+PRE,此時模型的RMSE值也最大即0.575,最佳與最差模擬結(jié)果對比見圖1。這表明,對長治地區(qū)的蒸發(fā)量預(yù)測取TEM+WIN+SSD+RHU組合其結(jié)果最為可靠,接近實際情況,取RHU+PRE組合其結(jié)果較差,不能為實際提供參考。
表2 各因子組合下的模擬效果
圖1 預(yù)測結(jié)果對比圖
文章基于灰色關(guān)聯(lián)與SVM建立了20個不同因子組合下的長治地區(qū)蒸發(fā)量預(yù)測模型,對模型精度進行對比分析,得到氣象因子組合對模型模擬效果具有重大影響,在長治地區(qū)模型模擬精度最高時對應(yīng)的因子組合為TEM+WIN+SSD+RHU,此時模型預(yù)測R2值0.824,RMSE值為0.403。在不同區(qū)域進行蒸發(fā)量預(yù)測時,會存在當(dāng)?shù)貧庀筚Y料不滿足最佳蒸發(fā)量預(yù)測因子組合的情況,此時借助本研究在不同區(qū)域選取所能得到的預(yù)測精度最高因子組合,對蒸發(fā)量進行預(yù)測。文章研究內(nèi)容可為蒸發(fā)量預(yù)測提供新的思路,一方面有助于提高資料充足地區(qū)的蒸發(fā)量預(yù)測精度,另一方面可以為缺資料地區(qū)的蒸發(fā)量預(yù)測提供參考,未來需要對不同地區(qū)的季節(jié)性蒸發(fā)量預(yù)測模型進行研究,尋找區(qū)域性最佳預(yù)測因子組合,為蒸發(fā)量預(yù)測提供更多依據(jù)。