周銀明 吳達(dá)勝
摘 ?要: 我國眾多的氣象站點(diǎn)為氣象監(jiān)測、預(yù)測及其他資源與環(huán)境相關(guān)研究提供了較好的條件,但因受各種復(fù)雜因素的影響,已有監(jiān)測站點(diǎn)的數(shù)據(jù)存在部分缺失問題。為此,需要對現(xiàn)有站點(diǎn)缺失數(shù)據(jù)進(jìn)行補(bǔ)全?;谡憬?00個(gè)站點(diǎn)的2014年6月 至2016年5月兩年的氣象數(shù)據(jù),分別采用IDW(反距離權(quán)重法)和RBF(徑向基函數(shù)法)對各個(gè)氣象因子進(jìn)行插值比較。結(jié)果表明,RBF的插值精度總體優(yōu)于IDW,RBF更適合作為缺失氣象數(shù)據(jù)的補(bǔ)全方法。
關(guān)鍵詞: 氣象要素; IDW; RBF; 插值
中圖分類號:TP301 ? ? ? ? ?文獻(xiàn)標(biāo)志碼:A ? ? 文章編號:1006-8228(2019)10-08-03
Abstract: Numerous meteorological stations in China provide good conditions for meteorological monitoring, forecasting and other resources and environment related research, however, due to the influence of various complex factors, some data in existing meteorological stations are partially lost. It is necessary to complete the missing data. Based on the meteorological data of 100 stations in Zhejiang province from June 2014 to May 2016, in this paper, IDW (inverse distance weighting method) and RBF (radial basis function method) are used respectively to interpolate for each meteorological factor. The results show that the interpolation accuracy of RBF is better than that of IDW, so, RBF is more suitable as a complement method for the missing meteorological data.
Key words: meteorological elements; IDW; RBF; interpolation
0 引言
氣象要素不僅與我們的日常生活悉悉相關(guān),而且也是其他資源與環(huán)境類研究(如森林資源、大氣污染等)的數(shù)據(jù)基礎(chǔ)[1]。我國氣象站有人工氣象站和自動(dòng)氣象站,數(shù)量較多,其監(jiān)測技術(shù)正在逐步提高,為氣象監(jiān)測、預(yù)測及其他資源與環(huán)境相關(guān)研究提供了較好的條件。但不管是人工氣象站還是自動(dòng)氣象站都存在一些的缺點(diǎn):已有監(jiān)測站的數(shù)據(jù)不完整問題;受經(jīng)濟(jì)、地理?xiàng)l件等制約,一些區(qū)域的氣象數(shù)據(jù)難以獲取。為此需要對現(xiàn)有站點(diǎn)缺失數(shù)據(jù)補(bǔ)全,并實(shí)現(xiàn)氣象數(shù)據(jù)從點(diǎn)到面的估測。
氣象要素?cái)?shù)據(jù)補(bǔ)全方法有多種,其中空間插值方法(如多項(xiàng)式插值法、趨勢面法、反距離權(quán)重法、樣條函數(shù)法、克里金插值法等)被廣泛使用[2-8]。
克里金插值法插值結(jié)果更準(zhǔn)確,但其要求樣本數(shù)據(jù)服從正態(tài)分布[9]。
本文研究中待插值的氣象要素涉及氣溫、氣壓、水汽壓、濕度、降水量、風(fēng)速等,每個(gè)要素又根據(jù)采集時(shí)間的不同分為若干個(gè)子要素(共計(jì)33個(gè)),數(shù)據(jù)量較大,時(shí)間跨度2014年6月至2016年5月(共計(jì)24個(gè)月)。對樣本數(shù)據(jù)進(jìn)行正態(tài)分布檢驗(yàn)后,發(fā)現(xiàn)存在部分氣象要素?cái)?shù)據(jù)不服從正態(tài)分布的情況,因此克里金插值法不適合作為本研究中的插值法補(bǔ)全數(shù)據(jù)。
本文分別采用了反距離權(quán)重法(IDW)和徑向基函數(shù)法(RBF)對各個(gè)氣象要素進(jìn)行插值比較,發(fā)現(xiàn)考慮最近距離點(diǎn)值、下一時(shí)間段值的RBF插值法比IDW插值法的精度更高,更適合作為各個(gè)氣象因子的插值方法。
1 研究區(qū)域與研究數(shù)據(jù)
本文研究區(qū)域?yàn)檎憬?,共?jì)氣象站點(diǎn)100個(gè)。采集的氣象要素涉及到氣溫、氣壓、水汽壓、濕度、降水量、風(fēng)速等,每個(gè)要素又根據(jù)不同的采集時(shí)間分為若干個(gè)子要素(共計(jì)33個(gè)),具體包括:02時(shí)氣溫(T02)、08時(shí)氣溫(T08)、14時(shí)氣溫(T14)、20時(shí)氣溫(T20)、平均氣溫(Ta)、最高氣溫(Tx)、最低氣溫(Tn)、日溫差(Tx- Tn)、02時(shí)氣壓(P02)、08時(shí)氣壓(P08)、14時(shí)氣壓(P14)、20時(shí)氣壓(P20)、平均氣壓(Pa)、最高氣壓(Px)、最低氣壓(Pn)、02時(shí)水汽壓(E02)、08時(shí)水汽壓(E08)、14時(shí)水汽壓(E14)、20時(shí)水汽壓(E20)、平均水氣壓(Ea)、02時(shí)相對濕度(U02)、08時(shí)相對濕度(U08)、14時(shí)相對濕度(U14)、20時(shí)相對濕度(U20)、平均相對濕度(Ua)、最小相對濕度(Un)、20-08時(shí)間的降水量(R20_08)、08-20時(shí)間的降水量(R08-20)、20-20時(shí)降水量(R20_20)、02時(shí)風(fēng)速(fF02)、08時(shí)風(fēng)速(fF08)、14時(shí)風(fēng)速(fF14)、20時(shí)風(fēng)速(fF20)。研究數(shù)據(jù)來自于浙江省氣象局,包含2014年6月至2016年5月期間每一天各個(gè)氣象站點(diǎn)的氣象數(shù)據(jù)。
歷史氣象要素?cái)?shù)據(jù)共計(jì)68202條,每條數(shù)據(jù)信息含有:站點(diǎn)、日期、各個(gè)氣象要素值,其中110條數(shù)據(jù)無效,剩余68092條數(shù)據(jù)不完整,尚存在如下問題:
⑴ 數(shù)據(jù)缺失,部分氣象因子的日期數(shù)據(jù)缺失;
⑵ 數(shù)據(jù)異常,部分氣象因子的少數(shù)時(shí)刻值超出最大值和最小值區(qū)間;
⑶ 氣壓、水汽壓、相對濕度等要素中少部分?jǐn)?shù)值出現(xiàn)零值;
⑷ 降水量的數(shù)據(jù)規(guī)則是0值代表有雨跡,空值代表不下雨。樣本數(shù)據(jù)中空值就有兩種含義:不下雨和未獲取到數(shù)據(jù)。此時(shí)處理方式如下:當(dāng)存在溫度數(shù)據(jù)時(shí),認(rèn)為該日降雨量為不下雨;當(dāng)不存在溫度數(shù)據(jù)時(shí),認(rèn)為該日降雨量未獲取到。
最終將根據(jù)每個(gè)站點(diǎn)、日期、各個(gè)氣象要素,對數(shù)據(jù)進(jìn)行過濾,篩選出針對每個(gè)氣象因子的有效數(shù)據(jù)進(jìn)行實(shí)驗(yàn)。
本次研究的主要目的是尋找缺失值和異常值并進(jìn)行插值和修正,以獲得完整的歷史氣象數(shù)據(jù)。
2 實(shí)驗(yàn)方法
2.1 反距離權(quán)重插值法
反距離權(quán)重插值法(IDW)基于Tobler第一定律(地理第一定律)的概念,從1970年開始,被定義為一切事物都與其他事物相關(guān),而且與越近的事物越相關(guān)[10]。IDW的基本思想是假設(shè)一個(gè)待插值點(diǎn)的屬性值是鄰域內(nèi)一組已知樣本點(diǎn)屬性值的反距離加權(quán)平均值[11]。
IDW的優(yōu)點(diǎn)是便于理解且簡單易行,缺點(diǎn)是只考慮已知樣本點(diǎn)和待插值點(diǎn)的距離,沒有考慮到其他因素的影響及變化規(guī)律。
2.2 徑向基函數(shù)插值法
2.2.1 徑向基函數(shù)插值法的基本原理
徑向基函數(shù)(RBF)神經(jīng)網(wǎng)絡(luò)可以處理系統(tǒng)內(nèi)難以獲取的規(guī)律性,可以根據(jù)具體問題確定相應(yīng)的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),學(xué)習(xí)速度和收斂速度較快,具有良好的泛化能力,對非線性問題的處理具有優(yōu)勢。RBF神經(jīng)網(wǎng)絡(luò)通常只有三層:輸入層、隱含層和輸出層。隱含層的作用是將向量從低維映射到高維,使得在低維線性不可分的問題變成高維線性可分[12]。
2.2.2 插值思路
氣象要素之間既有空間相關(guān)性又有時(shí)間相關(guān)性,因此要從時(shí)間和空間兩個(gè)角度去考慮篩選自變量因子。如圖1所示,本文在基于RBF估算第i點(diǎn)的氣象因子時(shí),篩選了“最近1個(gè)點(diǎn)的氣象因子”、“下一時(shí)刻的氣象因子”作為自變量。
3 實(shí)驗(yàn)結(jié)果與分析
表1為采用RBF和IDW插值后的各氣象因子的MRE總和,隨機(jī)取10日,計(jì)算每日各個(gè)氣象因子的MRE,重復(fù)10次實(shí)驗(yàn),取10次實(shí)驗(yàn)的MRE平均值作為各組的最終性能指標(biāo),總體而言各個(gè)氣象因子RBF插值的誤差小于IDW插值誤差。表中也可看出,氣象因子中降水量和風(fēng)速(fF20)插值結(jié)果與實(shí)際偏差較大,其MRE相對較高,而且其RBF插值結(jié)果的誤差較IDW高,原因來自兩個(gè)方面:一方面降水量數(shù)據(jù)缺乏從而影響其插值精度;另一方面降水和風(fēng)速在時(shí)間和空間上變化速度更快、幅度更大從而影響插值精度。如2015年2月21日次蓬山站20時(shí)-08時(shí)的降水量(R08_20)值為4,但下一時(shí)刻值變?yōu)?1.2,2014年7月29日定海站20時(shí)風(fēng)速(fF20)值為2.2,下一時(shí)刻值為5.2,最近距離點(diǎn)值為6.7。
4 結(jié)論
本文基于浙江省2014年6月至2016年5月兩年氣象數(shù)據(jù),分別采用IDW和RBF對各個(gè)氣象因子進(jìn)行插值比較,得出以下結(jié)論:
⑴ RBF插值法中輸入變量并非越多越好,需要預(yù)先篩選合適的輸入變量作為自變量;
⑵ 總體而言,RBF的插值精度比IDW更高;
⑶ 從氣象因子角度來說,不管是IDW還是RBF插值法對風(fēng)速的插值精度均不及其他氣象因子的插值精度高;
⑷ 風(fēng)速和降雨的空間局部變化和時(shí)間短時(shí)變化較大,可能是導(dǎo)致預(yù)測精度較低的原因。
后期在條件允許情況下將嘗試對插值方法進(jìn)行改進(jìn),如引入海拔、坡度、坡向等,或者用其他氣象要素作為輸入變量,重點(diǎn)是探索提高風(fēng)速插值的精度。
參考文獻(xiàn)(References):
[1] 韓穎,蒲希.中國的氣象服務(wù)及其效益評估[J].氣象科學(xué),2010.30(3):420-426
[2] 朱業(yè)玉,宋麗莉,姬興杰,孟寒冬,李鳳秀,羅璇.基于分段三次樣條函數(shù)逐時(shí)氣象資料模擬方法研究[J].氣象與環(huán)境學(xué)報(bào), 2017.33(2):44-52
[3] 儲(chǔ)少林,周兆葉,袁雷,陳全功.降水空間插值方法應(yīng)用研究——以甘肅省為例[J].草業(yè)科學(xué),2008.25(6):19-23
[4] 李志,趙西寧.1961—2009年黃土高原氣象要素的時(shí)空變化分析[J].自然資源學(xué)報(bào),2013.2:287-299
[5] 林金煌,林廣發(fā).福建省降水空間插值方法比較與區(qū)域分布特征研究[J].海南師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2015.1:61-65
[6] 宋亞男,王秀蘭,馮仲科.區(qū)域氣象要素的空間插值方法比較研究——以華北地區(qū)為例[J].山東林業(yè)科技,2014.6:1-6
[7] 閆星光,吳琳娜,周涌,宋具蘭,鄧仕雄.喀斯特地區(qū)月均降水協(xié)克里金插值方法研究——以貴州省為例[J].云南大學(xué)學(xué)報(bào)(自然科學(xué)版),2017.39(3):432-439
[8] 劉琰琰.氣象要素插值的空間化精度提高方法研究[J].氣象科學(xué),2017.2:278-282
[9] 地統(tǒng)計(jì)學(xué)概論[M]. 科學(xué)出版社,劉愛利, 2012.
[10] Feng-Wen Chen (1) (2),Chen-Wuing Liu (1). Estimation of the spatial rainfall distribution using inverse distance weighting (IDW) in the middle of Taiwan [J]. Paddy and Water Environment,2012.10.
[11] Lu, George Y, Wong, David W. An adaptive inverse-distance weighting spatial interpolation technique [J]. Computers and Geosciences,2008.34:1044-1055
[12] 衛(wèi)敏,余樂安.具有最優(yōu)學(xué)習(xí)率的RBF神經(jīng)網(wǎng)絡(luò)及其應(yīng)用[J].管理科學(xué)學(xué)報(bào),2012.15(4):50-57