魏森濤,王澄海,張飛民,楊凱
(甘肅省氣候資源開發(fā)及防災(zāi)減災(zāi)重點實驗室,蘭州大學大氣科學學院,甘肅 蘭州 730000)
作為陸地下墊面的主要組成部分,土壤不僅承載著陸地生態(tài)系統(tǒng),還扮演著陸-氣之間水分循環(huán)、能量平衡“調(diào)節(jié)器”的重要角色。土壤可以感知來自大氣的異常變化信號,還可將這些信息反饋給大氣,對水資源、農(nóng)業(yè)和生態(tài)系統(tǒng)的時空演變有著重要影響。作為陸面過程研究的重要參量,土壤濕度在氣候預(yù)測和全球氣候變化研究中也起著至關(guān)重要的作用。土壤濕度通過改變地表蒸發(fā)和反照率、土壤熱容量等物理屬性以及植被生長狀況等直接或間接影響局地及區(qū)域氣候,還通過參與陸-氣之間相互作用影響區(qū)域乃至全球氣候。因此,土壤濕度既是氣候變化的重要影響因子,也是反映地表水文變化的一個總體指標(王澄海等,2008)。通過研究土壤濕度的變化特性,可以更好地理解和提高對全球氣候變化的認知水平(Shinoda and Nandintsetseg,2011;Seneviratne and Koster, 2012;Hagemann and Stacke,2015)。
在氣候模式中,土壤溫、濕度是模式下邊界的重要物理量。然而,目前氣候模式初始場中的土壤溫、濕度多以多年平均值作為參考值,而邊界場在大氣場的強迫迭代下形成,需要較長的模式平衡時間(spin-up)并高度依賴于陸面過程模式和大氣模式的耦合過程,往往偏差較大。近年來,隨著機器學習方法的興起完善,根據(jù)土壤溫、濕度自身變化規(guī)律,建立土壤溫、濕度變化的預(yù)測模型,預(yù)測未來時刻的土壤溫、濕度變化,然后將其作為模式的下邊界條件,已顯示出廣闊前景。同時,土壤溫、濕度空間差異性較大,且觀測站點相對稀少,機器學習建立的預(yù)測模型難以全面準確地獲得土壤溫、濕度空間信息,另外目前衛(wèi)星觀測反演的土壤濕度也存在較大誤差。因此,利用機器學習的方法建立理想的土壤濕度預(yù)測模型,克服已有預(yù)測模型存在預(yù)測精度、泛化能力、多特征處理能力等問題,對提高預(yù)測性能有著重要的探索意義(Prakash et al., 2018;Cai et al., 2019)。
近年來,隨著訓練算法的優(yōu)化、人工智能的快速發(fā)展,機器學習方法已成功應(yīng)用于大氣科學領(lǐng)域(Hinton et al., 2006),如降水、氣溫預(yù)測(陳浩等,2017;Cifuentes et al., 2020),厄爾尼諾/南方濤動預(yù)測(Guo et al., 2020),數(shù)值模式初邊界條件、物理參數(shù)化方案構(gòu)建(任萍等,2020)等。利用隨機森林方法預(yù)測麥田土壤濕度,在0~20 cm和20~40 cm土層的預(yù)測精度達到88%以上,顯示出機器學習算法在土壤水分建模預(yù)測中具有良好潛力(聶紅梅,2019)。相比傳統(tǒng)前饋神經(jīng)網(wǎng)絡(luò)在預(yù)測過程中會出現(xiàn)局部最小化及收斂速度慢的問題,深度學習方法采用多層隱藏層結(jié)構(gòu),增加了對大數(shù)據(jù)和多特征數(shù)據(jù)的分類和擬合能力;此外,深度學習方法在圖像和序列處理方面有優(yōu)勢,對于呈指數(shù)級增長的地球系統(tǒng)科學數(shù)據(jù)可以通過深度學習進行信息挖掘。研究表明,引入卷積核的卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN),可以很好地捕捉圖像中的信息(Lecun and Bengio, 1998),通過卷積核進行空間局部連接,將臨近點之間相聯(lián)系,能夠有效提取要素分布的空間信息。與傳統(tǒng)前饋神經(jīng)網(wǎng)絡(luò)對比,卷積神經(jīng)網(wǎng)絡(luò)方法表現(xiàn)出明顯優(yōu)勢(Tan et al., 2019;Garcia, 2021)。卷積神經(jīng)網(wǎng)絡(luò)方法對ENSO指數(shù)預(yù)測(Ham et al., 2019)、東亞夏季風預(yù)測(Tang and Duan, 2021)方面也有出色表現(xiàn)。土壤濕度的空間差異明顯,根據(jù)卷積神經(jīng)網(wǎng)絡(luò)方法可以自動學習土壤濕度空間分布特征與聯(lián)系,對預(yù)測土壤濕度具有很好的潛力。
上述研究表明,利用機器學習進行土壤溫、濕度預(yù)測,具有良好的潛力和廣泛的應(yīng)用前景。利用機器學習建立單獨的土壤濕度預(yù)測模型,還可以獲得較為精確的土壤濕度預(yù)測值,從而代替物理模型為大氣模式提供初邊界場。已有研究大多考慮預(yù)測變量自身變化信息建模,在土壤濕度預(yù)測建模時考慮土壤溫度的影響,是否可以提高預(yù)測性能也是值得探索的問題。本文試圖利用土壤濕度自身記憶性特征,基于卷積神經(jīng)網(wǎng)絡(luò)深度學習方法預(yù)測土壤濕度,探索提高未來月到季節(jié)尺度上土壤濕度預(yù)測性能。
本文使用歐洲中期天氣預(yù)報中心第五代(ERA5)全球再分析資料中的土壤濕度數(shù)據(jù)集,研究表明,該數(shù)據(jù)能很好地刻畫土壤濕度的空間分布,其年際變化與觀測值高度相關(guān),對土壤濕度季節(jié)和年際變化的再現(xiàn)能力較優(yōu)(王一昕,2019;宋海清等,2020)。為了數(shù)據(jù)統(tǒng)一和便于討論,在基于卷積神經(jīng)網(wǎng)絡(luò)的土壤濕度預(yù)測模型構(gòu)建中,將ERA5再分析土壤濕度數(shù)據(jù)視為真值并作為訓練數(shù)據(jù)集。數(shù)據(jù)空間分辨率為 0.1°×0.1°,土壤溫、濕度數(shù)據(jù)有4個垂直層,深度分別為0~7、7~28、28~100、100~289 cm。選用1961年1月至2020年12月的月平均數(shù)據(jù)建立神經(jīng)網(wǎng)絡(luò)模型,并對2021年1—12月的土壤濕度進行預(yù)報和驗證。
以往研究在構(gòu)建土壤濕度預(yù)測模型時忽略了土壤溫度的影響,Wang和Yang(2018)將等溫模型的CLM4.5進行了重構(gòu),建立了水熱完全耦合的水熱傳輸模式(Fully Coupled-Community Land Model,F(xiàn)CCLM),從而使得土壤水熱耦合在理論上更加完備(楊凱,2017),獲得了良好的效果。同理,在使用深度學習建立預(yù)測模型時不僅需要考慮土壤濕度自身變化信息,也需要考慮土壤溫度的影響。因此,本文構(gòu)建土壤濕度預(yù)測模型時選用土壤溫、濕度作為預(yù)測因子??紤]到大氣要素的記憶性較短,在預(yù)測月尺度的土壤濕度時暫不把反映大氣要素的因子納入到預(yù)測因子中。
所有數(shù)據(jù)均線性插值到1°×1°網(wǎng)格,研究范圍為全球,共181個緯度格點,360個經(jīng)度格點。為消除不同預(yù)測因子之間量綱和單位的影響,在進行數(shù)據(jù)訓練之前,對所有數(shù)據(jù)進行歸一化處理。
卷積神經(jīng)網(wǎng)絡(luò)是一種專門用來處理具有類似網(wǎng)格結(jié)構(gòu)的數(shù)據(jù)方法,網(wǎng)絡(luò)中至少有一層用卷積運算來替代一般的矩陣乘法運算。其核心是卷積層,卷積層功能是對輸入數(shù)據(jù)進行特征提取,其內(nèi)部包含多個卷積核,組成卷積核的每個元素都對應(yīng)一個權(quán)重系數(shù)和一個偏差量,類似于一個前饋神經(jīng)網(wǎng)絡(luò)的神經(jīng)元。卷積層內(nèi)每個神經(jīng)元都與前一層中位置接近區(qū)域的多個神經(jīng)元相連,區(qū)域的大小取決于卷積核大小,稱為“感受野”。卷積核工作時,會有規(guī)律地掃過輸入特征,在感受野內(nèi)對輸入特征進行矩陣元素乘法求和并疊加偏差量。卷積核的大小、步長和填充共同決定卷積層輸出特征圖的尺寸,是卷積神經(jīng)網(wǎng)絡(luò)的超參數(shù),其中卷積核大小可以指定為小于輸入圖像尺寸的任意值,卷積核越大,可提取的輸入特征越復(fù)雜;卷積步長定義了卷積核相鄰兩次掃過特征圖時位置的距離,卷積步長為1時,卷積核會逐個掃過特征圖的元素,步長為n時會在下一次掃描跳過n-1個元素;隨著卷積層的堆疊,特征圖的尺寸逐步減小,因此填充是在特征圖通過卷積核之前人為增大其尺寸以抵消計算中尺寸收縮影響的方法,常用的填充方法為按零填充和重復(fù)邊界值填充。卷積運算定義如下:
式中:X和Y分別表示輸入和輸出矩陣;W為卷積核的權(quán)值矩陣;f為非線性激活函數(shù),對卷積層的輸出進行非線性變換,常用的激活函數(shù)有sigmoid、tanh和ReLu等;b表示偏置矩陣;i和j分別表示第i層卷積層第j個卷積核;k和l分別表示卷積核的寬度和長度。
卷積神經(jīng)網(wǎng)絡(luò)模型減少了訓練參數(shù)的數(shù)量,并且能夠保持空間鄰域的局部特征。此外,卷積層的輸入通常包括平均子采樣和最大子采樣形式,這樣可以減少網(wǎng)絡(luò)層之間的連接數(shù),降低過擬合風險(Yosinski et al., 2014;周飛燕等,2017)。
把陸地上每一個格點作為一次預(yù)測,以預(yù)測值為橫坐標,真實值為縱坐標作散點圖,并計算回歸擬合決定系數(shù)(R2)來直觀對比模型對不同深度層土壤濕度的預(yù)測效果?;貧w擬合決定系數(shù)計算公式如下:
式中:n為格點數(shù);f(xi)表示預(yù)測值;yi表示真實值;yˉ表示真實值的平均值。R2越接近1,表示預(yù)測效果越好。
圖1為基于土壤濕度記憶性特征建立的卷積神經(jīng)網(wǎng)絡(luò)土壤濕度預(yù)測模型基本原理。卷積神經(jīng)網(wǎng)絡(luò)包含4個卷積層,每層分別有128、64、32、16個濾波器,1個全連接層和1個輸出層,每個濾波器的內(nèi)核大小為5×5。輸入層的變量對應(yīng)于τ-5~τ月的土壤溫、濕度(τ表示當前月),把τ+1到τ+6的土壤濕度作為輸出變量。對每個卷積層特征映射的邊界使用零填充,激活函數(shù)是漏校正線性單元(Leaky-ReLU)。為了防止過度擬合,每個卷積層后面都有一個超參數(shù)0.3的dropout層,即暫時隨機移除30%的神經(jīng)元。模型的自適應(yīng)學習率為0.001。
圖1 土壤濕度卷積神經(jīng)網(wǎng)絡(luò)預(yù)測模型示意圖Fig.1 The schematic of the convolutional neural network prediction model of soil moisture
在訓練過程中,以1961年1月至2020年6月0~7、7~28、28~100、100~289 cm層深度的土壤溫、濕度作為預(yù)測因子,以1961年7月至2020年12月上述4層土壤溫、濕度作為模型逼近和預(yù)測對象。用前6個月的土壤溫、濕度來預(yù)測后6個月的土壤濕度,每連續(xù)6個月的土壤溫、濕度數(shù)據(jù)及后6個月的土壤濕度數(shù)據(jù)分組為一個樣本,共709個樣本,其中150個樣本作為驗證集,剩下的樣本作為訓練集。
圖2為訓練過程中損失函數(shù)變化情況,發(fā)現(xiàn)隨著訓練進行,訓練集的損失函數(shù)逐漸下降,驗證集的損失函數(shù)呈明顯下降趨勢,表明模型穩(wěn)健且具有良好的魯棒性能。
圖2 訓練數(shù)據(jù)集和驗證數(shù)據(jù)集的損失函數(shù)Fig.2 The loss function of the training dataset and the test dataset
為了檢驗土壤濕度預(yù)測模型的有效性,分別做兩組試驗:(1)使用2020年7—12月土壤溫、濕度預(yù)測2021年1—6月土壤濕度;(2)利用2021年1—6月土壤溫、濕度預(yù)測7—12月土壤濕度。通過比較兩組試驗,驗證模型預(yù)測全年土壤濕度的可靠性。從預(yù)測和ERA5的2021年7—12月0~7 cm(圖3)、7~28 cm(圖4)、28~100 cm(圖5)、100~289 cm(圖6)深度層的土壤濕度差值發(fā)現(xiàn),總體上預(yù)測誤差大部分在0.05 m3·m-3以內(nèi),南北極地地區(qū)的預(yù)測誤差在0.02 m3·m-3以內(nèi);熱帶地區(qū)預(yù)測誤差大于中高緯度地區(qū),且誤差隨著深度增加明顯減小,在28~289 cm深度內(nèi)預(yù)測誤差幾乎均小于0.02 m3·m-3。具體來看,7—12月隨著時間變化,歐亞區(qū)域預(yù)測效果先變差后變好,北美區(qū)域預(yù)測效果整體較好,非洲、澳洲、南美洲區(qū)域整體上預(yù)測效果變差,且4個深度層的變化類似;從土壤淺層到深層,預(yù)測效果逐漸變好,其中0~7 cm和7~28 cm的預(yù)測效果變化不明顯,28~100 cm開始預(yù)測效果明顯變好,這是由于月尺度上的土壤濕度變化受大氣要素變化影響的緣故。
圖3 2021年7—12月0~7 cm深度土壤濕度預(yù)測值與真實值差值分布(單位:m3·m-3)(a)7月,(b)8月,(c)9月,(d)10月,(e)11月,(f)12月Fig.3 The distribution of difference between the predicted soil moisture of 0-7 cm depth and the real value from July to December 2021 (Unit: m3·m-3)(a) July, (b) August, (c) September, (d) October, (e) November, (f) December
圖4 2021年7—12月7~28 cm深度土壤濕度預(yù)測值與真實值差值分布(單位:m3·m-3)(a)7月,(b)8月,(c)9月,(d)10月,(e)11月,(f)12月Fig.4 The distribution of difference between the predicted soil moisture of 7-28 cm depth and the real value from July to December 2021 (Unit: m3·m-3)(a) July, (b) August, (c) September, (d) October, (e) November, (f) December
圖5 2021年7—12月28~100 cm深度土壤濕度預(yù)測值與真實值差值分布(單位:m3·m-3)(a)7月,(b)8月,(c)9月,(d)10月,(e)11月,(f)12月Fig.5 The distribution of difference between the predicted soil moisture of 28-100 cm depth and the real value from July to December 2021 (Unit: m3·m-3)(a) July, (b) August, (c) September, (d) October, (e) November, (f) December
圖6 2021年7—12月100~289 cm深度土壤濕度預(yù)測值與真實值差值分布(單位:m3·m-3)(a)7月,(b)8月,(c)9月,(d)10月,(e)11月,(f)12月Fig.6 The distribution of difference between the predicted soil moisture of 100-289 cm depth and the real value from July to December 2021 (Unit: m3·m-3)(a) July, (b) August, (c) September, (d) October, (e) November, (f) December
為檢驗?zāi)P蛯Σ煌疃葘油寥罎穸鹊念A(yù)測效果,繪散點圖并計算回歸擬合決定系數(shù),圖7為2021年1—6月不同土壤深度層的擬合結(jié)果。可以看出,0~7、7~28、28~100、100~289 cm深度層的決定系數(shù)R2分別為0.89~0.93、0.91~0.95、0.92~0.96、0.98以上,表明深層土壤濕度的預(yù)測效果優(yōu)于淺層,且距起報時間越近預(yù)測效果越好。對比1—6月和7—12月(圖略)預(yù)測效果,發(fā)現(xiàn)后者略好于前者,可能與北半球土壤濕度的記憶性在春季最長,與后期土壤濕度的關(guān)系更密切有關(guān)(李若麟等,2016)。
圖7 2021年1—6月不同土壤深度層土壤濕度預(yù)測值和真實值的擬合關(guān)系Fig.7 The fitting relation between the predicted soil moisture with different depth layers and real values from January to June 2021
淺層土壤與大氣的相互作用最為直接,也是陸-氣相互作用的重要過程。研究表明,全球土壤濕度的記憶性變化在1~3個月,如北美南部、北非、中國北部、蒙古、南美南部以及澳大利亞等干旱區(qū)土壤濕度記憶性在1個月左右;北美東部、歐洲、西西伯利亞、亞洲南部以及剛果盆地等濕潤區(qū)土壤濕度記憶性在2~3個月;青藏高原、伊朗高原、落基山脈、巴西高原以及南非高原等高山寒區(qū)土壤濕度記憶約2~3個月(李若麟等,2016)。因此,選取這幾類區(qū)域淺層土壤濕度來驗證模型的預(yù)測效果。選擇中國北部、蒙古地區(qū)(73°E—123°E,32°N—52°N)及南美洲南部地區(qū)(50°W—70°W,20°S—32°S)兩個區(qū)域作為干旱區(qū)代表,北美東部(60°W—80°W,50°N—60°N)、南非高原(17°E—33°E,22°S—35°S)分別代表濕潤區(qū)和高山區(qū),比較2021年7—12月0~7 cm深度層土壤濕度的真實值和預(yù)測值(圖8)??梢钥闯?,4個區(qū)域土壤濕度真實值平均分別為0.230、0.237、0.292、0.136 m3·m-3,預(yù)測的6個月土壤濕度平均值分別為0.215、0.254、0.298、0.140 m3·m-3,兩者差值均在0.02 m3·m-3以內(nèi),這些區(qū)域在7—12月的預(yù)測效果均較好,表明建立的模型不僅能夠預(yù)測連續(xù)的土壤濕度變化,而且能夠較為準確地捕捉到土壤濕度變化的異常信號。
圖8 2021年7—12月不同代表區(qū)域平均土壤濕度預(yù)測值與真實值變化(a)中國北部及蒙古,(b)南美南部,(c)北美東部,(d)南非高原Fig.8 Variation of mean values of predicted soil moisture and real values in different representative regions from July to December 2021(a) northern China and Mongolia, (b) southern South America,(c) eastern North America, (d) highlands of South Africa
目前關(guān)于機器學習預(yù)測土壤濕度的研究,以前主要在較小范圍內(nèi)開展。如利用隨機森林方法對一個局域的麥田土壤濕度進行預(yù)測(聶紅梅,2019),基于BP神經(jīng)網(wǎng)絡(luò)對草原土壤濕度預(yù)測(孫浩和吳夢碟,2023)等。本文將機器學習方法應(yīng)用到全球土壤濕度預(yù)測上,并得到較好的效果,預(yù)測的土壤濕度可以作為全球氣候預(yù)測模式的初始場和邊界場。此外,土壤濕度作為干旱監(jiān)測的重要指標,本文提出的方法也可以在未來應(yīng)用于干旱的預(yù)測。
本文基于EAR5再分析資料,利用土壤濕度的記憶性特點,并考慮影響土壤濕度的土壤溫度,探索建立了基于CNN的土壤濕度預(yù)測模型,并對預(yù)測結(jié)果進行了驗證。結(jié)果表明,本方法對月、季尺度上的土壤濕度具有很好的預(yù)測潛力。得到的初步結(jié)論如下:
(1)在土壤濕度預(yù)測模型中加入土壤溫度作為預(yù)測因子,可提高預(yù)測效果。
(2)卷積神經(jīng)網(wǎng)絡(luò)模型可以有效提取土壤溫、濕度的時空特征,可用于預(yù)測全球尺度較長時間的土壤濕度。其中,淺層土壤濕度預(yù)測誤差大部分在0.05 m3·m-3以內(nèi),深層誤差大部分在0.02 m3·m-3以內(nèi)。
(3)基于土壤溫、濕度變化信號建立的CNN模型可預(yù)測不同干濕區(qū)域土壤濕度的異常特征,預(yù)測誤差平均在0.02 m3·m-3以內(nèi)。
本研究提供了一種利用土壤溫、濕度預(yù)測土壤濕度的方法,延長了預(yù)測的前置時間。雖然未考慮氣象要素的影響,但仍然能夠較好地預(yù)測土壤表層的濕度變化。一方面表明土壤溫、濕度的變化更多來自與陸面自身的變化;另一方面也表明,建立的陸地下墊面土壤溫、濕度變化的預(yù)測模型,可為大氣模式提供初始和下邊界條件,也可用于早期氣候災(zāi)害如干旱、野火和洪水等的預(yù)警預(yù)測。
需要指出的是,土壤濕度的時間演變是一個復(fù)雜的動力過程,從理論上講,加入更多的預(yù)測因子和更龐大的訓練數(shù)據(jù)集可以提高其可預(yù)測性,未來研究將進一步探索。