国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

一種區(qū)域降水預(yù)測的時空集成模型

2024-05-15 21:04:29馬宇紅薛生倩王小小路金葉
關(guān)鍵詞:機器學(xué)習(xí)

馬宇紅 薛生倩 王小小 路金葉

DOI:10.16783/j.cnki.nwnuz.2024.03.012

收稿日期:2023-12-05;修改稿收到日期:2024-03-12

基金項目:國家自然科學(xué)基金資助項目(51368055)

作者簡介:馬宇紅(1971—),男,甘肅天水人,副編審,博士.主要研究方向為時空序列數(shù)據(jù)建模和預(yù)測.

E-mail:mayh@nwnu.edu.cn

摘要:提出了一種融合多種深度學(xué)習(xí)方法的時空預(yù)測集成模型LSTM-ARIMA-SARIMA-BP-CNN(簡稱LASBC模型),其中ARIMA模型捕捉降水時間序列的近鄰性,SARIMA模型捕捉周期性,BP神經(jīng)網(wǎng)絡(luò)揭示降水分布的時空相關(guān)性,CNN挖掘氣象、地理因素對降水的影響,最后通過LSTM網(wǎng)絡(luò)對4個模型的預(yù)測結(jié)果進行融合,提高預(yù)測精度.以中國西部地區(qū)12個城市1985年1月至2021年12月的月降水量數(shù)據(jù)為主,應(yīng)用LASBC模型對12個城市的月降水量進行預(yù)測,結(jié)果顯示:LASBC模型的預(yù)測精度顯著提高;基于預(yù)測月降水量,給出了6個主要城市未來10年氣候偏干旱或濕潤的月份及降水量;未來10年,我國西北干旱區(qū)年均降水基本保持穩(wěn)定,高寒凍土區(qū)略有增加,西南濕潤區(qū)增長趨勢明顯.

關(guān)鍵詞:降水分布;時空預(yù)測;機器學(xué)習(xí);集成模型;時空相關(guān)性

中圖分類號:TP 391.42;R 742.5??? 文獻標志碼:A??? 文章編號:1001-988Ⅹ(2024)03-0105-10

A spatiotemporal integrated model for

regional precipitation prediction

MA Yu-hong1,2,XUE Sheng-qian1,WANG Xiao-xiao1,LU Jin-ye1

(1.College of Mathematics and Statistics,Northwest Normal University,Lanzhou 730070,Gansu,China;

2.Editorial Department of the University Journal,Northwest Normal University,Lanzhou 730070,Gansu,China)

Abstract:A spatiotemporal prediction model LSTM-ARIMA-SARIMA-BP-CNN(LASBC) for regional precipitation is proposed,which integrates multiple deep learning methods.Among them,ARIMA model captures the time-neighbor correlation of precipitation time series,SARIMA model captures the periodic trend of precipitation time series,BP neural network reveals the spatiotemporal correlation of precipitation distribution,CNN network excavates the influence of meteorological and geographical factors on precipitation,and finally,LSTM network is used to fuses the prediction results of the four models so as to improve the prediction accuracy.Based on the monthly precipitation data of major cities in western China from January 1985 to December 2021,the LASBC model is used to forecast the monthly precipitation of 12 cities in western China.The results show that the prediction accuracy of the LASBC model is greatly improved;the predicting months and precipitations for six major cities with a slightly arid or humid climate in the next 10 years are given

based on? the predicted monthly precipitation;in the next ten years the annual average precipitation in the northwest

arid region has remained stable,with a slight increase in the high-altitude permafrost region and a significant growth trend in the southwest humid region.

Key words:precipitation distribution;spatiotemporal prediction;machine learning;integration model;spatiotemporal correlation

眾所周知,一個地區(qū)降水量的時空分布嚴重影響著人們生產(chǎn)生活的各個方面.我國西部地區(qū)地域遼闊,地形復(fù)雜,屬于典型的溫帶大陸性氣候和高原山地氣候,降水空間分布極不均勻,局地差異大;降水量按季度、按月度分布很不平衡,冬季干旱少雨,夏季水量充沛.降水的時空不均衡嚴重影響區(qū)域生態(tài)環(huán)境及經(jīng)濟發(fā)展,所以挖掘區(qū)域降水數(shù)據(jù)的時空分布規(guī)律,準確預(yù)測未來降水的時空分布對于高效利用降水改善生態(tài)環(huán)境、發(fā)展區(qū)域經(jīng)濟及預(yù)防地質(zhì)災(zāi)害都具有重要的現(xiàn)實意義.

1? 研究綜述

降水預(yù)測模型通常分為5類:物理模型、統(tǒng)計模型、機器學(xué)習(xí)模型、深度學(xué)習(xí)模型和集成學(xué)習(xí)模型,物理模型也稱為過程模型,它需要考慮影響降水的各種氣象因素,通過模擬降水的物理過程對降水進行預(yù)測,統(tǒng)計模型、機器學(xué)習(xí)模型、深度學(xué)習(xí)模型和集成學(xué)習(xí)模型統(tǒng)稱為數(shù)據(jù)驅(qū)動模型,它通過挖掘蘊含在降水歷史數(shù)據(jù)中的內(nèi)在規(guī)律和演化趨勢對降水的時空分布和強度進行預(yù)測.

物理模型根據(jù)空氣動力學(xué)和熱力學(xué)原理揭示降水過程中各種氣象因素對降水分布及強度的影響.2004年,陳菊英等[1]通過集成多種降水前兆敏感因子,建立了海河流域汛期降水的多級預(yù)報物理模型;馬振鋒等[2]根據(jù)四川盆地固有的三類降水分布特征,建立了一種預(yù)測川渝地區(qū)汛期降水量的物理模型.物理模型雖然對降水的物理過程和各種氣象因素的影響解釋清晰,預(yù)測精度高,但物理模型的建立需要大量專業(yè)的氣象知識,且很容易受到各種突發(fā)性隨機因素的干擾.

統(tǒng)計模型主要通過對歷史降水數(shù)據(jù)的統(tǒng)計分析建立回歸方程進行預(yù)測,當前最流行的統(tǒng)計模型是差分自回歸移動平均(Auto-Regressive Integrated Moving Average, ARIMA)模型.胡盈等[3]利用江西省 16 個氣象站點逐月降水量數(shù)據(jù)建立 ARIMA 模型,并對 2020—2021 年的逐月降水量進行預(yù)測;Coban等[4]基于ARIMA模型對土耳其馬爾馬拉地區(qū)的降水進行預(yù)測;Nayagam等[5]通過線性回歸模型對印度喀拉拉邦夏季降水進行預(yù)測;Huang等[6]提出了一種年際增量結(jié)合經(jīng)驗正交分解的統(tǒng)計預(yù)測方法;Wang等[7]采用經(jīng)驗正交函數(shù)和旋轉(zhuǎn)經(jīng)驗正交函數(shù)分析了1960—2010年我國降水的時空分布特征及演化規(guī)律.統(tǒng)計模型簡單直觀,當降水時間序列是線性或接近線性時,統(tǒng)計模型能產(chǎn)生令人滿意的預(yù)測結(jié)果,但當時間序列呈現(xiàn)非線性時預(yù)測精度往往差強人意.

機器學(xué)習(xí)模型通過模擬人腦的工作方式,自動學(xué)習(xí)和提取降水數(shù)據(jù)的特征進行預(yù)測.機器學(xué)習(xí)模型具有較強的自適應(yīng)性和學(xué)習(xí)能力,能夠處理非線性和非平穩(wěn)的數(shù)據(jù),但需要大量的訓(xùn)練數(shù)據(jù)和計算資源.近來,Chau等[8]結(jié)合奇異譜分析(Singular Spectrum Analysis, SSA)和支持向量回歸(Support Vector Regression, SVR)實現(xiàn)了巴基斯坦3類農(nóng)業(yè)帶的月降水預(yù)測;Hartigan等[9]使用隨機森林(Random Forest, RF)和SVR對悉尼流域的降水和氣溫進行預(yù)測;Xiang 等[10]利用決策樹(Decision Tree, DT)和RF對重慶市的夏季降水進行預(yù)測;Rostam等[11]通過多層感知器探索伊朗首都德黑蘭大尺度氣候指數(shù)與降水之間的聯(lián)系;Lu等[12]通過具有不同核函數(shù)的支持向量機(Support Vector Machine, SVM)預(yù)測廣西地區(qū)的月降水量;Kisi等[13]結(jié)合離散小波變換(Discrete Wavelet Transform, DWT)和SVM對土耳其伊茲密爾和阿菲永站的日降水量進行預(yù)測.

深度學(xué)習(xí)模型是神經(jīng)網(wǎng)絡(luò)模型的擴展,它通過增加網(wǎng)絡(luò)深度和寬度處理更為復(fù)雜的數(shù)據(jù).降水數(shù)據(jù)通常具有時空依賴性、大規(guī)模和高維度屬性,深度學(xué)習(xí)模型不僅適應(yīng)于大規(guī)模數(shù)據(jù)建模,而且能夠自動捕獲數(shù)據(jù)的時空依賴性,所以廣泛應(yīng)用于時空數(shù)據(jù)建模與預(yù)測.典型的深度學(xué)習(xí)模型有卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)、深度置信網(wǎng)絡(luò)(Deep Belief Networks, DBN)和堆棧自編碼網(wǎng)絡(luò)(Stacked Auto-Encoder Network, SAEN).Luc等[14]使用多層前饋神經(jīng)網(wǎng)絡(luò)(Multi-Layer Feed-forward Network, MLFN)、偏循環(huán)神經(jīng)網(wǎng)絡(luò)和時間延遲神經(jīng)網(wǎng)絡(luò)對悉尼帕拉馬塔河流域10次暴雨事件的降水量進行預(yù)測;Baratta等[15]結(jié)合MLFN和SSA對意大利臺伯河流域的日降水量進行預(yù)測;Nasseri等[16]將遺傳算法與ANN相結(jié)合,對悉尼帕拉馬塔河流域上游降水進行短期預(yù)測;LI等[17]基于BP神經(jīng)網(wǎng)絡(luò)對浙江北部夏季降水量進行預(yù)測;Shi等[18]提出了一種基于CNN的降水預(yù)測方法;Du等[19]成功地將DBN模型應(yīng)用到天氣降水預(yù)測研究中;Ha等[20]使用DBN提高了韓國首爾地區(qū)降水和溫度等的預(yù)測精度;Tao等[21]結(jié)合Atrous小波變換建立了一個具有注意機制的多尺度長短期記憶(Multiscale Long-Short Term Memory, MLSTM)神經(jīng)網(wǎng)絡(luò),并對長江流域129個監(jiān)測站月降水量的預(yù)報精度進行改進;Misra等[22]提出了基于LSTM的循環(huán)神經(jīng)網(wǎng)絡(luò)模型,并利用印度馬哈納迪盆地的降水數(shù)據(jù)和加拿大坎貝爾河流域的降水數(shù)據(jù)測試了模型的可靠性.

集成學(xué)習(xí)模型可以對多種預(yù)測模型進行融合,如將統(tǒng)計模型和物理模型進行加權(quán)融合,或?qū)Χ鄠€深度學(xué)習(xí)模型集成優(yōu)化.多模式集成預(yù)測是一種信息后處理技術(shù),它通過綜合不同方面的信息或各有所長的建模方法有效改善模型的預(yù)測精度.近來,Wu等[23]建立了一種混和深度學(xué)習(xí)模型預(yù)測具有時空依賴的區(qū)域O3和NO2的濃度;Ding等[24]結(jié)合時空建模和多尺度網(wǎng)絡(luò)預(yù)測城市出租車的需求;Yu等[25]建立了基于集成深度圖注意強化學(xué)習(xí)網(wǎng)絡(luò)的多因素驅(qū)動時空風(fēng)電預(yù)測模型.

受集成學(xué)習(xí)方法的啟發(fā),本文根據(jù)降水數(shù)據(jù)的高度時空依賴性和外在氣象因素的強關(guān)聯(lián)性,首先通過ARIMA模型、季節(jié)性ARIMA模型(SARIMA)、BP神經(jīng)網(wǎng)絡(luò)和CNN分別對某區(qū)域的降水進行預(yù)測,然后再通過LSTM 對4種模型的預(yù)測結(jié)果進行融合,建立了一種深度學(xué)習(xí)集成預(yù)測模型LSTM-ARIMA-SARIMA-BP-CNN(簡稱LASBC模型),其中 ARIMA模型和SARIMA模型分別捕捉降水的時間近鄰性和周期性,BP神經(jīng)網(wǎng)絡(luò)模型挖掘降水數(shù)據(jù)的時空相關(guān)性,CNN模型揭示外在的氣象和地理因素對降水的影響.以中國西部地區(qū)12個城市1985年1月至2021年12月的月降水量數(shù)據(jù)為主,結(jié)合當月平均溫度、相對濕度、日照時數(shù)等氣象因素以及經(jīng)度、緯度、海拔高度等地理數(shù)據(jù),應(yīng)用LASBC模型對西部12個主要城市的月降水量進行預(yù)測,結(jié)果顯示:與4個單一預(yù)測模型相比,新模型的預(yù)測精度大幅提高;基于預(yù)測月降水量,給出了6個主要城市未來10年氣候偏干旱或濕潤的月份及相應(yīng)的降水量;分析每5年的年均降水量可知,未來10年我國西北干旱區(qū)降水量基本穩(wěn)定,高寒凍土區(qū)略有增加,西南濕潤區(qū)增長明顯.

2? 模型與方法

2.1? 時空序列模式

2.1.1? 時間的近鄰性和周期性? 一般而言,事物的發(fā)展變化在時間上具有近鄰相關(guān)性,時間越接近狀態(tài)越相似,時間近鄰預(yù)測就是用時間序列連續(xù)的前n個值去預(yù)測當前值;時間序列的周期性刻畫了事物發(fā)展的周期性變化,如月亮的圓缺和河水潮汐的變化明顯以月為周期,所以第t天的變化不僅與前n天的變化密切相關(guān),而且與其上個月、上上個月相鄰日期的變化高度相似.

時空序列的時間近鄰模式和周期模式可以表述為

TCs,t~(xs,t-n,xs,t-(n-1),…,xs,t-2,xs,t-1),

TPs,t~(xs,t-n·T,xs,t-(n-1)·T,…,xs,t-2·T,xs,t-1·T),

其中s為數(shù)據(jù)監(jiān)測點,t為當前時刻,n是歷史時間滯后期,即用監(jiān)測站s前n個時刻的值預(yù)測當前時刻的值,T是時間序列的周期;TC代表時間近鄰模式,TP代表時間周期模式.所以時間近鄰預(yù)測和時間周期預(yù)測分別表達為

TCs,t=fTCs(xs,t-n,xs,t-(n-1),…,xs,t-2,xs,t-1),

TPs,t=fTPs(xs,t-n·T,xs,t-(n-1)·T,…,

xs,t-2·T,xs,t-1·T).

2.1.2? 時空的近鄰性? 根據(jù)地理學(xué)第一定律,任何地理事物在時間和空間上都是高度依賴的,時間越接近狀態(tài)越相似,空間越接近屬性越相似.時空預(yù)測就是用事物所有近鄰前n個時刻的狀態(tài)或?qū)傩匀ネ茢嗥洚斍暗臓顟B(tài)或?qū)傩?以B(s,r)表示以s為中心、r為半徑的鄰域,記

Γs={1≤i≤S:i∈B(s,r)}={s1,s2,…,sk}

為監(jiān)測點s在其r鄰域內(nèi)所有近鄰點的集合,因為監(jiān)測點s在t時刻的預(yù)測值STs,t與其所有k個近鄰前n個時刻的值相關(guān),所以對空序列的時空相關(guān)模式可以表述為

STs,t~(xs1,t-n,xs1,t-(n-1),…,xs1,t-1,…,

xsk,t-n,xsk,t-(n-1),…,xsk,t-1),

其中si(1≤i≤k)為監(jiān)測點s的第i個近鄰,ST代表時空近鄰模式.所以時空近鄰預(yù)測表達為

STs,t=fSTs(xs1,t-n,xs1,t-(n-1),…,xs1,t-1,…,

xsk,t-n,xsk,t-(n-1),…,xsk,t-1).

2.1.3? 外在因素相關(guān)性? 任何事物都不是孤立存在的,其發(fā)展變化必然受環(huán)境因素的影響,當前狀態(tài)或?qū)傩耘c許多特定因素具有很強的相關(guān)性,如一地某時刻的空氣質(zhì)量不僅受到該地前n個時刻風(fēng)速、風(fēng)向、溫度、濕度等氣象因素的影響,也受到地形及人類活動的影響.所以外在因素相關(guān)性模式可以表述為

FCs,t~(y1s,t-n,y1s,t-(n-1),…,y1s,t-1…,

yms,t-n,yms,t-(n-1),…,yms,t-1),

其中FC代表因素相關(guān),m代表相關(guān)因子數(shù),n代表時間滯后期.所以外在因素相關(guān)的預(yù)測可以表述為

FCs,t=fFCs(y1s,t-n,y1s,t-(n-1),…,y1s,t-1…,

yms,t-n,yms,t-(n-1),…,yms,t-1).

2.2? 基礎(chǔ)模型

2.2.1? ARIMA和SARIMA模型? ARIMA模型是20世紀70年代Box和Jenkins提出的一種時間序列預(yù)測方法[26].在ARIMA(p,d,q)模型中,AR為自回歸項,MA為滑動平均項;p為自回歸階數(shù),q為滑動平均階數(shù),d為使時間序列成為平穩(wěn)序列所做的差分次數(shù)(階數(shù)).一般地,d=0的ARIMA(p,d,q)模型表示為

t=c+∑pi=1φiXt-i+∑qj=1θjεt-j+εt,

其中φi(1≤i≤p)和θj(1≤j≤q)為不全為零的待定系數(shù);εt為獨立的誤差項;Xt為平穩(wěn)、正態(tài)、零均值的時間序列.ARIMA模型簡單,但缺點是要求時間序列數(shù)據(jù)是平穩(wěn)的或者差分后是平穩(wěn)的,并且其只能捕捉時間序列數(shù)據(jù)的線性關(guān)系而不能捕捉非線性關(guān)系.SARIMA模型主要處理具有明顯周期性的時間序列.如果時間序列數(shù)據(jù)是一個非平穩(wěn)時間序列,并且在大尺度上存在明顯的周期性,則需要先對時間序列進行周期差分,然后再進行若干次趨勢差分,使之成為平穩(wěn)時間序列然后才能應(yīng)用ARIMA模型.

平穩(wěn)時間序列的均值和協(xié)方差不隨時間變化,數(shù)據(jù)序列的平穩(wěn)性一般使用ADF檢驗和KPSS檢驗來判斷.ADF檢驗是一種基于單位根檢驗的平穩(wěn)性檢驗方法,如果ADF統(tǒng)計量小于對應(yīng)的臨界值,且P值小于顯著性水平,則認為時間序列是平穩(wěn)的;KPSS檢驗與ADF檢驗相反,它假設(shè)時間序列是平穩(wěn)的,然后通過KPSS統(tǒng)計量來檢驗這個假設(shè),如果KPSS統(tǒng)計量小于對應(yīng)的臨界值,且P值小于顯著性水平,則時間序列是平穩(wěn)的.

2.2.2? BP神經(jīng)網(wǎng)絡(luò)? BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)是1986年Mcclleland等[27]建立的一種按照誤差逆向傳播算法訓(xùn)練的多層前饋神經(jīng)網(wǎng)絡(luò),它的基本思想是利用梯度下降法使網(wǎng)絡(luò)的實際輸出值和期望輸出值之間的均方誤差最小.BP神經(jīng)網(wǎng)絡(luò)在輸入層與輸出層之間增加了若干隱含層神經(jīng)元,神經(jīng)元狀態(tài)的改變影響輸入與輸出之間的關(guān)系.BP神經(jīng)網(wǎng)絡(luò)由正向計算過程和反向計算過程組成,正向傳播過程從輸入層經(jīng)過隱含層逐層處理,并轉(zhuǎn)向輸出層,每一層神經(jīng)元的狀態(tài)只影響下一層神經(jīng)元的狀態(tài);如果輸出層不能得到預(yù)期輸出,則將誤差沿原路反向傳播,通過修改各神經(jīng)元的權(quán)值使得輸出誤差最小.

2.2.3? 卷積神經(jīng)網(wǎng)絡(luò)(CNN)? CNN是一類包含卷積操作且具有深度結(jié)構(gòu)的前饋神經(jīng)網(wǎng)絡(luò),其研究始于20世紀80~90年代,時間延遲網(wǎng)絡(luò)和LeNet-5是最早出現(xiàn)的卷積神經(jīng)網(wǎng)絡(luò)[28].CNN既具有良好的特征提取能力,又具有較強的辨別能力,因此在機器學(xué)習(xí)系統(tǒng)中主要用于特征提取和分類.經(jīng)典的CNN結(jié)構(gòu)由卷積層和池化層交替疊加組成,最后由全連接層輸出.首先,數(shù)據(jù)在卷積層和若干個卷積核進行卷積操作,提取輸入特征;然后,池化層對卷積層提取的特征進行選擇,池化操作有助于特征的組合;最后,全連接層進行擬合,減少特征信息的損失.

2.3.4? 長短期記憶網(wǎng)絡(luò)(LSTM)? LSTM網(wǎng)絡(luò)是一種具有獨特三門結(jié)構(gòu)的循環(huán)神經(jīng)網(wǎng)絡(luò)[29],遺忘門決定網(wǎng)絡(luò)對上一層輸入的保留程度,輸入門決定網(wǎng)絡(luò)對新輸入的保留程度,輸出門決定網(wǎng)絡(luò)對輸出的保留程度.LSTM的這種門結(jié)構(gòu)不僅可以控制信息流的走向,而且可以防止循環(huán)神經(jīng)網(wǎng)絡(luò)長時間依賴上的梯度消失或梯度爆炸現(xiàn)象,特別適合處理間隔較長的時間序列.

2.3? 集成模型結(jié)構(gòu)

一個地區(qū)所在的海陸位置、地形、氣壓、風(fēng)

帶、洋流、太陽黑子以及人類活動對降水均有很大影響,所以降水序列數(shù)據(jù)具有特殊的時空結(jié)構(gòu)特征.為了綜合考慮影響降水的各種氣象因素及地理因素,并充分發(fā)掘蘊含在歷史降水數(shù)據(jù)中的內(nèi)在規(guī)律,提高降水預(yù)測精度,本文建立一個多模型集成學(xué)習(xí)預(yù)測模型LASBC,其中ARIMA模型捕捉降水時間序列的近鄰性特證,SARIMA模型捕捉周期性特征,BP神經(jīng)網(wǎng)絡(luò)模型挖掘時空相關(guān)性,CNN揭示氣象和地理因素在時間和空間維度上對降水的影響,最后,4個子模型的預(yù)測結(jié)果再由LSTM模型進行融合,得到更高精度的預(yù)測結(jié)果.

LASBC集成學(xué)習(xí)模型的基本思想為

s,t=fs(TCs,t,TPs,t,STs,t,F(xiàn)Cs,t),

其中TCs,t,TPs,t,STs,t,F(xiàn)Cs,t分別是ARIMA、SARIMA、CP和CNN 模型的預(yù)測結(jié)果,集成學(xué)習(xí)模型的整體流程與結(jié)構(gòu)如圖1所示.

2.4? 性能評估指標

使用平均絕對誤差(MAE)、均方誤差(MSE)、均方根誤差(RMSE)和平均絕對百分比誤差(MAPE)4個指標對模型的預(yù)測性能進行評價,其定義分別為

MAE=1n∑ni=1|i-xi|,

MSE=1n∑ni=1(i-xi)2,

RMSE=1n∑ni=1(i-xi)2,

MAPE=1n∑ni=1|(i-xi)/xi|·100%,

其中,n為數(shù)據(jù)的個數(shù),xi表示第i個數(shù)據(jù)的真實值,i表示所有第i個數(shù)據(jù)的預(yù)測值.評價指標的值越接近于0,模型預(yù)測精度越高.

3? 應(yīng)用分析

3.1? 數(shù)據(jù)集介紹

我國西部地區(qū)屬于典型的溫帶大陸性氣候和高原山地氣候,在氣候上可以分為高寒凍土區(qū)、西北干旱區(qū)和西南濕潤區(qū)3個區(qū)域,降水在時間分布上具有明顯季節(jié)性,夏季降水豐沛,冬季降水稀少;降水量空間分布極為不均,總體表現(xiàn)為從東南向西北逐步減少.西部地區(qū)地域廣闊、城市眾多,我們選取氣象、地理數(shù)據(jù)及降水監(jiān)測數(shù)據(jù)相對完整的12個省會城市西安、銀川、蘭州、西寧、烏魯木齊、成都、重慶、拉薩、昆明、貴陽、南寧、呼和浩特作為研究對象,數(shù)據(jù)集為12個城市1985年1月到2021年12月共37年的月降水量數(shù)據(jù),以及每月的平均溫度、相對濕度、日照時數(shù)等氣象數(shù)據(jù)和城市經(jīng)度、緯度、海拔高度等地理數(shù)據(jù),數(shù)據(jù)整理自《中國氣象統(tǒng)計年鑒》(1985—2021)及中國氣象網(wǎng).

為了直觀展示各模型的預(yù)測精度,我們選取高寒凍土區(qū)的拉薩和西寧、西北干旱區(qū)的烏魯木齊和西安、西南濕潤區(qū)的重慶和南寧6個主要城市進行對比,以1985年1月至2016年12月的數(shù)據(jù)為訓(xùn)練集,2017年1月至2021年12月的數(shù)據(jù)為測試集,并對2022年1月至2031年12月各城市的降水進行前瞻性預(yù)測.

3.2? 模型參數(shù)設(shè)置

6個主要城市:拉薩、西寧、烏魯木齊、西安、重慶、南寧的降水量數(shù)據(jù)先做一次周期差分,再做一次趨勢差分后經(jīng)檢驗成為平穩(wěn)時間序列,最后通過AIC和BIC準則確定最優(yōu)的自回歸階數(shù)p和滑動平均階數(shù)q,得到6個城市對應(yīng)的ARIMA模型分別為ARIMA(2,1,4),ARIMA(3,1,4),ARIMA(3,1,2),ARIMA(4,1,4),ARIMA(4,1,4)和ARIMA(3,1,2).BP神經(jīng)網(wǎng)絡(luò)為4層結(jié)構(gòu),輸入層4個神經(jīng)元(時間滯后期n=4),第一隱層30個神經(jīng)元,第二隱層10個神經(jīng)元,輸出層1個神經(jīng)元;訓(xùn)練函數(shù)選擇traingd梯度下降法,最大訓(xùn)練次數(shù)為4000,學(xué)習(xí)率為0.02,訓(xùn)練精度10-5.CNN網(wǎng)絡(luò)為LeNet-5架構(gòu),不同城市近鄰數(shù)可能有所不同,但時間滯后期統(tǒng)一設(shè)置為3,若城市的近鄰數(shù)為m,則輸入特征為3m,使用adam優(yōu)化器,設(shè)置最小批處理數(shù)為16,梯度閾值為1,初始學(xué)習(xí)率為0.05,迭代次數(shù)為250.LSTM的輸入層特征維度為4,隱含單元數(shù)為100,輸出全連接層特征維度為1,使用adam優(yōu)化器,最大訓(xùn)練輪數(shù)為250,梯度閾值為1,初始學(xué)習(xí)率為0.005.

3.3? 結(jié)果與分析

圖2是6個主要城市測試集的預(yù)測結(jié)果,其中紅線代表預(yù)測值,藍線代表真實值.由圖2可知,6個主要城市的降水量在時間上具有明顯的周期性,每年豐水期、枯水期特征分明,水量差別大.表1為LASBC模型和SARIMA模型、ARIMA模型、BP模型、CNN模型對6個主要城市降水預(yù)測性能的評價指標.結(jié)合圖2和表1可知,LASBC模型對6個城市降水量的預(yù)測與實際降水量最為接近,誤差最小.以經(jīng)典的RMSE為例,拉薩的RMSE為10.72,比單純的SARIMA模型、ARIMA模型、BP模型和CNN模型分別改進了73.4%,62.2%,70.7%和42.9%,平均改進率62.3%;西安的RMSE為15.75,比單純的SARIMA模型、ARIMA模型、BP模型和CNN模型分別改進了55.6%,58.8%,64.9%和49.4%,平均改進率57.2%;LASBC模型對烏魯木齊、拉薩、西寧和西安的預(yù)測精度最高,RMSE分別為7.63,10.72,11.21和15.75,而對重慶和南寧的預(yù)測精度較低,RMSE分別為46.35和46.57,原因是:一方面,重慶和南寧地處西南濕潤區(qū),月降水量的絕對數(shù)值大導(dǎo)致誤差偏大;另一方面,西南濕潤區(qū)受拉尼娜和厄爾尼諾氣候影響明顯,降水分布隨機性強、強度波動性大導(dǎo)致誤差偏大.綜合評價可知,本文模型預(yù)測精度更高,性能更好.

3.4? 未來預(yù)測

為了探究中國西部地區(qū)未來10年降水量的變化,我們應(yīng)用LASBC模型對西部地區(qū)6個主要城市:拉薩、西寧、烏魯木齊、西安、重慶、南寧2022年1月至2031年12月共10年的降水分布及強度進行前瞻性預(yù)測,結(jié)果見圖3.由圖3可以看出,整個西部地區(qū)未來10年的月降水量及分布與前40年相比變化不大,夏季降水集中,水量充沛,冬季降水稀少;西南濕潤區(qū)的重慶和南寧,夏季降水量明顯高于西北干旱區(qū)的烏魯木齊和西安,其中南寧市2023年8月降水量會突破400 mm,2031年8月降水量更是接近500 mm;烏魯木齊和西寧全年降水稀少,烏魯木齊最高月降水量不會超過100 mm,西寧更是在50 mm附近徘徊,但烏魯木齊和西寧市夏季和冬季降水量差異最少,原因可能是冬季降雪補償引起的.

圖4是拉薩、西寧、烏魯木齊、西安、重慶、南寧6個主要城市1991年1月至2031年12月每5年平均年降水量變化趨勢.從圖4可以看到,高寒凍土區(qū)的拉薩和西寧未來10年內(nèi)降水量略有增加,2021—2025年年均降水量為479.74 mm和423.79 mm,2026—2030年年均降水量為502.16 mm和470.16 mm,相比上個5年降水分別增加22.42 mm和46.37 mm;西北干旱區(qū)的烏魯木齊和西安的降水量有波動,但變化不大,烏魯木齊和西安市2021—2025年的年均降水量分別為423.79和303.27 mm,而2026—2030年的年均降水量為470.16和292.73 mm,烏魯木齊略有增加,而西安則略有減少;西南濕潤區(qū)的重慶的降水量在1996年后持續(xù)增加,至2016年后年降水量已經(jīng)超過1 000 mm,預(yù)測未來降水量總體會波動增加,南寧市年均降水量多年保持在1 200~1 400 mm之間,雖然偶爾有所波動,但總體保持平穩(wěn),變化不大.

總體來說,中國西部地區(qū)近40年降水量呈現(xiàn)緩慢增加的趨勢,高寒凍土區(qū)與西北干旱區(qū)增長緩慢,而西南濕潤區(qū)降水呈現(xiàn)較明顯的增長趨勢.未來10年,中國西部地區(qū)的年平均降水量總體不會有明顯增加的趨勢.

表2是模型預(yù)測得到的我國西部6個城市未來10年內(nèi)偏干旱和濕潤的月份及降水量,降水分布的巨大差異對西部地區(qū)的工農(nóng)業(yè)生產(chǎn)、生態(tài)保護和防災(zāi)減災(zāi)工作都提出了新的挑戰(zhàn),針對降水稀少和豐沛的月份,各地政府部門可提前做好水資源調(diào)配利用和防旱防澇準備工作.

4? 總結(jié)

中國西部地區(qū)降水量在時間上呈現(xiàn)出較強的周期性和季節(jié)性,夏秋降水最多,冬春較少;在空間上呈現(xiàn)出南多北少,由南到北遞減的趨勢.本文建立了一種融合多種深度學(xué)習(xí)方法的時空集成預(yù)測模型LASBC,利用SARIMA模型捕捉降水時間序列的周期性,ARIMA模型捕捉時間近鄰性, BP神經(jīng)網(wǎng)絡(luò)揭示降水量分布的空間相關(guān)性,CNN網(wǎng)絡(luò)捕捉氣象、地理因素對降水的影響,最后通過LSTM網(wǎng)絡(luò)對4個模型的預(yù)測結(jié)果進行融合.選取高寒凍土區(qū)、西北干旱區(qū)和西南濕潤區(qū)的6個主要城市的月降水量進行預(yù)測,結(jié)果表明:多模式集成模型的預(yù)測誤差更低,精度更高;基于預(yù)測的月降水量,給出了6個主要城市未來10年氣候可能趨于干旱或濕潤的月份及預(yù)測降水量;未來10年,我國西北干旱區(qū)年均降水量基本保持穩(wěn)定,高寒凍土區(qū)略有增加,西南濕潤區(qū)增長趨勢明顯.然而,有兩個方面的因素對LASBC模型的應(yīng)用帶來了一定程度的挑戰(zhàn):一是西南濕潤區(qū)受厄爾尼諾現(xiàn)象影響,突發(fā)性極端降水事件頻發(fā)影響預(yù)測精度;二是我國西部地區(qū)地域廣闊,城市空間相關(guān)性明顯不足影響模型性能.

參考文獻:

[1]? 陳菊英,齊晶,楊鵬,等.海河流域分區(qū)汛期降水量的多級預(yù)報物理模型的應(yīng)用前景[C]//全國水文學(xué)術(shù)討論會,南京:2004-12-01.

[2]? 馬振鋒,譚友邦.預(yù)測川渝地區(qū)汛期降水量的一種物理統(tǒng)計模型[J].大氣科學(xué),2004,28(1):138.

[3]? 胡盈,吳靜.基于ARIMA模型的降水空間特征分析及預(yù)測[J]. 江西科學(xué), 2021,39(1):99.

[4]? ?COBAN V,GULER E,KILIC T,et al.Precipitation forecasting in Marmara region of Turkey[J].Arab J Geosci,2021,14(2):86.

[5]? NAYAGAM L R,JANARDANAN R,MOHAN H S R.An empirical model for the seasonal prediction of southwest monsoon rainfall over Kerala,a meteorological subdivision of India[J].Int J Climatol,2010,28(6):823.

[6]? HUANG Yan-yan,WANG Hui-jun,ZHANG Pei-yi.A skillful method for precipitation prediction over eastern China[J].Atmos Ocean Sci Lett,2022,15:100133.

[7]? WANG Yan-jiao,CHEN Xian-yan,YAN Feng.Spatial and temporal variations of annual precipitation during 1960—2010 in China[J].Quatern Int,2015,380/381:5.

[8]? CHAU K W,WU C L.A hybrid model coupled with singular spectrum analysis for daily rainfall prediction[J].J Hydroinform,2010,12(4):458.

[9]? HARTIGAN,Mac NAMARA S,ESLIE L M,et al.Attribution and prediction of precipitation and temperature trends within the Sydney catchment using machine learning[J].Climate,2020,8(10):120.

[10]? XIANG B,ZENG C F,DONG X N,et al.The application of a decision tree and stochastic forest model in summer precipitation prediction in Chongqing[J].Atmosphere,2020,11(5):508.

[11]? ROSTAM M G,SADATINEJAD S J,MALEKIAN A.Precipitation forecasting by large-scale climate indices and machine learning techniques[J].J Arid Land,2020,2(5):854.

[12]? LU Ke-sheng,WANG Ling-zhi.A novel nonlinear combination model based on support vector machine for rainfall prediction[C]//2011 Fourth International Joint Conference on Computational Sciences and Optimization,Kunming and Lijiang,China,2011:1343.

[13]? KISI O,CIMEN M.A wavelet-support vector machine conjunction model for monthly streamflow forecasting[J].J Hydrol,2011,399(1/2):132.

[14]? ?LUC K C,BALL J E,SHARMA A.An application of artificial neural networks for rainfall forecasting[J].Math Comp Model,2001,33(6):683.

[15]? BARATTA D,MASULLI F,CICIONI G,et al.Application of an ensemble technique based on singular spectrum analysis to daily rainfall forecasting[J].Neural Networks,2003,16(3):375.

[16]? NASSERI M,ASGHARI K,ABEDINI M J.Optimized scenario for rainfall forecasting using genetic algorithm coupled with artificial neural network[J].Expert Syst Appl,2008,35(3):1415.

[17]? LI Yue-jun,GUO Pin-wen. Application of downscaling forecast for the north of Zhejiang precipitation in summer based on the BP neural network model[J].Trans Atmos Sci,2017,40(3):425.

[18]? SHI X J,SHI Z R,WAN H G,et al.Convolutional LSTM network:A machine learning approach for precipitation nowcasting[C]//Neural Information Processing Systems,Cambridge,MA:MIT Press,2015:802.

[19]? DU J,LIU Y,LIU Z.Study of precipitation forecast based on deep belief networks[J].Algorithms,2018,11(9):132.

[20]? HA J H,YONG H L,KIM Y H.Forecasting the precipitation of the next day using deep learning[J].Korean Inst Intell Syst,2016,26:93.

[21]? TAO Li-zhi,HE Xin-guang,LI Jia-jia,et al.A multiscale long short-term memory model with attention mechanism for improving monthly precipitation prediction[J].J Hydrol,2021,602:126815.

[22]? MISRA S,SARKAR S,MITRA P.Statistical downscaling of precipitation using long short-term memory recurrent neural networks[J].Theor Appl Clim,2018,134(3/4):1179.

[23]? WU Cui-lin,HE Hong-di,SONG Rui-feng,et al.A hybrid deep learning model for regional O3 and NO2 concentrations prediction based on spatiotemporal dependencies in air quality monitoring network[J].Environ Pollut,2023,320:121075.

[24]? DING Fei,ZHU Yue,YIN Qi,et al.MS-ResCnet:A combined spatiotemporal modeling and multi-scale network for taxi demand prediction[J].Comput Electr Eng,2023,105:108558.

[25]? YU Cheng-qing,YAN Guang-xi,YU Cheng-ming,et al.A multi-factor driven spatiotemporal wind power prediction model based on ensemble deep graph attention reinforcement learning network[J].Energy,2023,263:126034.

[26]? BOX G E P,JENKINS G M.Time Series Analysis:Forecasting and Control[M].San Francisco:Holden-Day,1976.

[27]? MCCLELLAND J,RUMELHART D.Parallel Distributed Processing:Explorations in the Microstructure of Cognition:Psychological and Biological Models[M].Cambridge,MA:MIT Press,1987.

[28]? LECUN Y,BOTTOU L,BENGIO Y,et al.Gradient-based learning applied to document recognition[J].P IEEE,1998,86(11):2278.

[29]? SUNDERMEYER M,SCHLUTER R,NEY H.LSTM neural networks for language modeling[R].Human Language Technology and Pattern Recognition,Computer Science Department,Aachen,Germany:RWTH Aachen University,2012.

(責任編輯? 馬宇鴻)

猜你喜歡
機器學(xué)習(xí)
基于詞典與機器學(xué)習(xí)的中文微博情感分析
基于機器學(xué)習(xí)的圖像特征提取技術(shù)在圖像版權(quán)保護中的應(yīng)用
基于網(wǎng)絡(luò)搜索數(shù)據(jù)的平遙旅游客流量預(yù)測分析
時代金融(2016年27期)2016-11-25 17:51:36
前綴字母為特征在維吾爾語文本情感分類中的研究
下一代廣播電視網(wǎng)中“人工智能”的應(yīng)用
活力(2016年8期)2016-11-12 17:30:08
基于支持向量機的金融數(shù)據(jù)分析研究
基于Spark的大數(shù)據(jù)計算模型
基于樸素貝葉斯算法的垃圾短信智能識別系統(tǒng)
基于圖的半監(jiān)督學(xué)習(xí)方法綜述
機器學(xué)習(xí)理論在高中自主學(xué)習(xí)中的應(yīng)用
巴林右旗| 鹤山市| 康平县| 左权县| 丽江市| 鸡西市| 白玉县| 万荣县| 万盛区| 鹿泉市| 淮北市| 万宁市| 两当县| 精河县| 肇州县| 陈巴尔虎旗| 广安市| 香格里拉县| 横山县| 兴文县| 武义县| 巴里| 新源县| 江达县| 江山市| 深州市| 辰溪县| 武安市| 同心县| 五莲县| 呼和浩特市| 永和县| 得荣县| 津南区| 罗山县| 广平县| 瑞昌市| 昭平县| 万安县| 康平县| 黔西|