段 浩,朱彥儒,2,趙紅莉,郝 震,3,靳曉輝,蔣云鐘
(1.中國水利水電科學(xué)研究院水資源研究所,北京 100038; 2.蘭州交通大學(xué)測繪與地理信息學(xué)院,甘肅 蘭州 730070;3.大連理工大學(xué)水利工程學(xué)院,遼寧 大連 116024; 4.黃河水利科學(xué)研究院引黃灌溉工程技術(shù)研究中心,河南 鄭州 450003)
土壤含水量是水文模擬和陸面過程模擬的重要參數(shù)[1],對地表熱量平衡和蒸散發(fā)有著顯著的影響[2]。因此,對土壤含水量進行準確觀測和模擬,獲取準確的地表土壤含水量數(shù)據(jù),對水資源管理、流域產(chǎn)流模擬等都有著重要意義[3]。
遙感技術(shù)的發(fā)展使大尺度的土壤含水量計算成為可能,但遙感反演常需一定的地表參數(shù)做支撐,如IEM(integral equation model)模型[4]。而當研究區(qū)域數(shù)據(jù)匱乏時,對土壤含水量的反演則成為非線性、且難以通過理論推導(dǎo)進行求解的計算問題,此時,學(xué)者開始用人工智能技術(shù)來彌補實際觀測的不足[5]。代表性的成果包括Han 等[6]利用分類與回歸樹(classification and regression tree,CART)方法,基于遙感、氣象數(shù)據(jù)及DEM等估算我國全國尺度的土壤含水量;Ahmad等[7]采用機器學(xué)習(xí)的方法,使用TRMM(tropical rainfall measuring mission)降水數(shù)據(jù)和歸一化植被指數(shù)(normalized difference vegetation index,NDVI)指數(shù)來推求美國南部的土壤含水量等。此外,還有一類應(yīng)用是利用人工智能的方法估算站點觀測的土壤含水量變化,如侯曉麗等[8]利用人工神經(jīng)網(wǎng)絡(luò)(ANN)模擬了河南三義寨灌區(qū)不同埋深的站點土壤含水量變化,采用數(shù)據(jù)為降水、氣溫、風(fēng)速等氣象數(shù)據(jù),較為準確地刻畫了不同埋深條件下的土壤墑情分布;羅黨等[9]采用灰色神經(jīng)網(wǎng)絡(luò),分析了氣象數(shù)據(jù)對河南新鄭市土壤含水量的關(guān)系,取得了良好效果。
整體上,人工智能技術(shù)在土壤含水量的模擬應(yīng)用方面包含點尺度和面尺度的模擬,但對土壤含水量變化的影響要素主要集中在參考氣象要素、下墊面條件等,或基于遙感數(shù)據(jù)計算各類指數(shù)[10]對土壤含水量進行分析,而在考慮自然要素的同時又能考慮人類活動用水的分析較少。而只將自然要素與土壤含水量進行關(guān)聯(lián),難以表達非自然因素對土壤的水分補給,如灌區(qū)的灌溉用水補給土壤水分[11]等。利用遙感對地面干旱情況的監(jiān)測可在一定程度上彌補這個問題,相關(guān)的研究工作有黃友昕等[12]利用MODIS(moderate-resolution imaging spectroradiometer)干旱指數(shù)和RBFNN(radial basis function neural network)方法反演了河南地區(qū)土壤含水量,但該研究只考慮了遙感數(shù)據(jù)源,同時也只考慮了返青期的冬小麥地區(qū)的土壤水分狀況,且只選用了少量樣本進行了訓(xùn)練。氣象要素、地形條件、NDVI等要素對地表土壤含水量的變化關(guān)系更為密切,同時,該思路在更大時空范圍的土壤含水量反演方面仍需探索。
本文采用MPDI(modified perpendicular drought index)反映地表的干旱情況,以此來體現(xiàn)地表土壤在考慮人類用水條件下的干濕狀況,同時選取降水、潛在蒸散發(fā)、NDVI、DEM等與地表土壤含水量關(guān)系密切的要素,通過構(gòu)建神經(jīng)網(wǎng)絡(luò)對河北地區(qū)的地表土壤含水量進行模擬。
以地處華北平原的河北省為研究區(qū)。該區(qū)域占地面積18.88萬km2,海拔高差達2 600 m以上。河北省的主要地形包括平原、溫帶落葉闊葉林和草地等,主要氣候類型是溫帶季風(fēng)氣候,夏季高溫多雨,冬季寒冷干燥,多年平均降水量為480 mm,多年平均蒸發(fā)量為1 600 mm。河北省的主要地形及土壤墑情站點分布如圖1所示。
圖1 研究區(qū)概況
1.2.1土壤含水量數(shù)據(jù)
土壤含水實測數(shù)據(jù)選用河北省水文局2018年3—11月10 cm深度的墑情監(jiān)測數(shù)據(jù)。在河北省范圍內(nèi),約有180個土壤墑情自動監(jiān)測點(受各站點匯報及時性限制,每日實際可用數(shù)據(jù)不足180個)。土壤墑情站采用TDR(time domain reflectometry)傳感器進行監(jiān)測,約每隔10 d監(jiān)測1次。
1.2.2氣象數(shù)據(jù)
氣象數(shù)據(jù)主要來自國家氣象站(www.data.cma.gov.cn),包括用來計算潛在蒸散發(fā)的氣溫、濕度、日照時數(shù)、風(fēng)速和氣壓等的逐日數(shù)據(jù)。用來與土壤含水量進行模擬的降水數(shù)據(jù)采用CLDAS(CMA land data assimilation system)的降水產(chǎn)品。將國家氣象站點的觀測數(shù)據(jù)插值成柵格數(shù)據(jù),空間分辨率統(tǒng)一到0.01°上,時間分辨率為逐日。利用插值后的氣象數(shù)據(jù)來計算河北省的潛在蒸散發(fā),計算方法選用FAO-56算法[13]。
1.2.3遙感數(shù)據(jù)
MODIS遙感產(chǎn)品被廣泛用來進行地表參數(shù)的觀測和反演。這里采用2018年的250 m分辨率的MOD09地表輻射產(chǎn)品進行MPDI的反演,該數(shù)據(jù)可從EARTHDATA (https://search.earthdata.nasa.gov/)下載,計算過程采用Ghulam等[14〗提出的方法。NDVI的計算選用MODIS的一級影像數(shù)據(jù)。利用MRT(MODIS reprojection tool)工具將MODIS產(chǎn)品進行拼接和投影轉(zhuǎn)換,得到河北省地區(qū)的相應(yīng)數(shù)據(jù)產(chǎn)品。其他遙感數(shù)據(jù)使用ENVI軟件進行處理,所有影像均轉(zhuǎn)換到0.01°的分辨率上。
為從較大空間尺度上評估本研究模擬結(jié)果的準確性,選取土壤含水量研究中常用的SMAP(soil moisture active and passive)9 km產(chǎn)品作為對比數(shù)據(jù)。SMAP衛(wèi)星由美國國家航空航天局(NASA)在2015年發(fā)射升空,搭載L波段輻射計,主要用來監(jiān)測全球土壤水分變化,已在全球范圍內(nèi)開展了驗證和應(yīng)用工作[15〗,具有較好的精度,是分析大尺度土壤含水量的主流產(chǎn)品之一。
FAO-56算法是具有物理機理的、考慮生理學(xué)和空氣動力學(xué)參數(shù)的潛在蒸散發(fā)估算方法,能較好地估算地面冠層的潛在蒸散發(fā)?;赑enman-Monteith方法的蒸散發(fā)計算公式為
式中:ET0為潛在蒸散發(fā);u2為2 m高處的風(fēng)速;Δ為氣壓曲線斜率;γ為濕度常數(shù);Rn為凈輻射;G為土壤熱通量;T為2 m高度處的氣溫;es-ea為飽和水汽壓差。
利用遙感監(jiān)測地表干濕狀況源于垂直干旱指數(shù)(perpendicular drought index,PDI)的提出,該指數(shù)利用土壤在紅光與近紅外波段反射率的差異來估算土壤含水量,PDI越大表明土壤越干旱。MPDI在PDI基礎(chǔ)上引入了植被蓋度,改善了對混合像元的分解,在干旱的監(jiān)測上可取得更好的監(jiān)測效果,尤其是在植被覆蓋區(qū)域[16〗。MPDI的表達式為
式中:I為MPDI;Rv,Red、Rv,NIR分別為紅光和近紅外波段的植被反射率;fv為植被蓋度;M為土壤線斜率;RRed為大氣校正后的紅光波段反射率;RNIR為大氣校正后的近紅外波段反射率。關(guān)于MPDI的更多計算細節(jié),可參見Ghulam等[14〗的研究。
MPDI的大小與土壤含水量和植被覆蓋度成反比,據(jù)此可通過構(gòu)建MPDI與土壤含水量的關(guān)系,來模擬區(qū)域土壤含水量。
在對土壤含水量的相關(guān)研究中,降水和NDVI是傳統(tǒng)的考慮因素,近年的研究表明,潛在蒸散發(fā)和地形條件[17〗對土壤含水量的影響也非常顯著。為能在充分考慮自然要素的基礎(chǔ)上,進一步考慮人類活動用水對土壤含水量帶來的影響,將MPDI這一通過遙感反演來表征地表干濕狀況的要素作為輸入變量。由此,構(gòu)建了以降水、潛在蒸散發(fā)、MPDI、NDVI和DEM作為輸入,以實測站點10 cm深度土壤含水量值為輸出的神經(jīng)網(wǎng)絡(luò)模型。在具體的實現(xiàn)上,采用序貫?zāi)P徒⑸窠?jīng)網(wǎng)絡(luò)[18]對土壤含水量進行模擬,激活函數(shù)選用relu,訓(xùn)練次數(shù)為1 000,目標函數(shù)選取MAE(mean absolute error),優(yōu)化器選用Adam(adaptive moment estimation)。本文建立的神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)及研究的整體技術(shù)路線如圖2和圖3所示。
圖2 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)示意圖
圖3 土壤含水量反演流程
利用相關(guān)系數(shù)r、均方根誤差ERMS及偏離度Bias指標來對土壤含水量的模擬結(jié)果進行評價。各指標的計算形式如下:
(3)
(4)
(5)
式中:yi為模擬值;xi為實測值;N為樣本數(shù)。
以河北地區(qū)土壤墑情站點位置為準,分別獲取有墑情觀測日的模型輸入信息,即DEM、MPDI、降水、潛在蒸散發(fā)和NDVI,然后以實測土壤含水量值為參照,利用神經(jīng)網(wǎng)絡(luò)模型對輸入數(shù)據(jù)進行模擬。在2018年,共可獲取2 934組訓(xùn)練樣本,隨機選取其中70%的樣本進行訓(xùn)練,15%的樣本作為驗證,其余15%的樣本進行測試。結(jié)果(圖4)顯示,在訓(xùn)練期的r=0.7,ERMS=0.037 5 cm3/cm3,Bias=-0.002 6;驗證期r=0.5,ERMS=0.042 7 cm3/cm3,Bias=0.000 4??傮w來看,訓(xùn)練期的相關(guān)性較好,且模擬期與驗證期r相差不大,模型具備一定的泛化能力。
圖4 神經(jīng)網(wǎng)絡(luò)模擬結(jié)果與實測值對比
基于氣象數(shù)據(jù)及植被狀況數(shù)據(jù),利用神經(jīng)網(wǎng)絡(luò)進行土壤含水量預(yù)測的研究可分為站點尺度的模擬和大區(qū)域尺度的模擬兩類。站點尺度的模擬上,模擬結(jié)果??扇〉幂^好精度[19],而就較大尺度、大量樣本的模擬而言,本文r=0.7,優(yōu)于Han等[6]對全國尺度的模擬精度。同時,該精度也與利用多種要素對某單一變量進行模擬和預(yù)測的已有研究較為符合[20]。因此,本文對河北地區(qū)地表土壤含水量的模擬結(jié)果與實測值間具有較好的一致性。
為進一步評價神經(jīng)網(wǎng)絡(luò)模擬的精度,選取單一日期的河北省土壤含水量模擬值與實測值進行對比,以此分析本文所建模型在特定日期對土壤含水量空間異質(zhì)性的模擬效果。以2018年4月24日的監(jiān)測結(jié)果作為示例,圖5給出了該日河北省范圍內(nèi)土壤墑情站點的土壤含水量監(jiān)測數(shù)據(jù),以及對各站點位置用神經(jīng)網(wǎng)絡(luò)方法計算得到的土壤含水量結(jié)果。
從圖5(a)可以看出,利用神經(jīng)網(wǎng)絡(luò)方法得到的土壤含水量模擬結(jié)果能較好地反映地表土壤含水量的變化趨勢,模擬結(jié)果的r=0.67、ERMS=0.069 5 cm3/cm3、Bias=-0.22(圖5(b))。從絕對值上看,神經(jīng)網(wǎng)絡(luò)方法的模擬結(jié)果比實測值偏低,但總體的相關(guān)系數(shù)在0.6以上,仍具有較好的相關(guān)性。
圖5 2018年4月24日土壤含水量模擬結(jié)果與實測值對比
將模擬得到的2018年1—10月的河北省逐日土壤含水量作算術(shù)平均,得到2018年1—10月河北省土壤含水量均值的空間分布(圖6)。從圖6可以看出,土壤含水量的均值最小值約為0.04 cm3/cm3,最大值約為0.23 cm3/cm3,空間差異較大,東部、東北部平原地區(qū)較高,西部及北部山地較低。
圖6 2018年1—10月河北省地表土壤含水量均值空間分布
為進一步對模擬結(jié)果的準確性進行評估,基于逐日土壤含水量數(shù)據(jù)計算得到2018年春季和夏季的土壤含水量均值,并與SMAP的9 km土壤含水量產(chǎn)品進行空間差異性的比較(圖7)。由圖7可以看出,模擬結(jié)果與SMAP產(chǎn)品在空間分布的趨勢上具有一致性。在春季和夏季,均體現(xiàn)出東南部、東北部土壤含水量較大,而西部和北部山區(qū)的土壤含水量較小的特征,這與劉榮華等[21]的研究結(jié)果基本一致。在夏季,兩種數(shù)據(jù)的高值區(qū)均明顯擴大,體現(xiàn)出河北省地表土壤含水量在季節(jié)上有較為明顯的差異性,平原區(qū)夏季的土壤含水量高于春季節(jié),這與該地區(qū)降水集中在夏季的氣候特征相一致。同時,夏季作物需水較大,引入MPDI后,凸顯了灌溉用水在夏季集中的特點。
圖7 2018年河北省地表土壤含水量春季和夏季模擬均值與SMAP產(chǎn)品對比
圖8 2018年河北省土壤含水量實測值與神經(jīng)網(wǎng)絡(luò)模擬值及SMAP產(chǎn)品對比
雖然在區(qū)域特征上,本文方法模擬結(jié)果與SMAP產(chǎn)品具有一致性,但在絕對值的差異上,本文的模擬結(jié)果比SMAP產(chǎn)品偏高。在華北平原部分站點的研究顯示,SMAP產(chǎn)品的土壤含水量值與實測值在趨勢上具有一致性,但明顯偏低[22]。為此,將河北省土壤含水量的實測值與上述兩種產(chǎn)品分別進行對比(圖8),以進一步分析本文方法模擬結(jié)果的精度。因SMAP產(chǎn)品在無數(shù)據(jù)的網(wǎng)格使用了填充值,在對比分析未考慮這些位置的相關(guān)數(shù)據(jù)。從圖8可以看出,本文方法模擬得到的土壤含水量與實測值的相關(guān)性較好、偏離度較小,3個評估指標分別為:r=0.59、ERMS=0.039 9 cm3/cm3、Bias=0.016;SMAP產(chǎn)品的相應(yīng)數(shù)值為r=0.23,ERMS=0.066 5 cm3/cm3、Bias=-0.12。需指出的是,SMAP產(chǎn)品的空間分辨率為9 km,將實測值與其直接進行對比具有不確定性,系統(tǒng)論證本文土壤含水量產(chǎn)品的精度仍需用更多的土壤含水量實測數(shù)據(jù)、或與更多的遙感土壤含水量產(chǎn)品進行驗證,相關(guān)工作將在后續(xù)研究中開展。
a. 在利用神經(jīng)網(wǎng)絡(luò)進行土壤含水量的模擬研究時,考慮能反映地表干濕狀態(tài)的MPDI產(chǎn)品,能較好地豐富人類活動作用下的地表土壤含水量信息,模擬結(jié)果與實測數(shù)據(jù)具有較好的一致性。
b. 在土壤含水量的空間異質(zhì)性方面,考慮MPDI指數(shù)作為神經(jīng)網(wǎng)絡(luò)模型的輸入來對土壤含水量進行預(yù)測,同樣取得了較好精度,可充分體現(xiàn)土壤含水量在空間上的分布情況。
c. 研究得到的土壤含水量產(chǎn)品與SMAP數(shù)據(jù)具有較好的空間一致性,但比SMAP產(chǎn)品偏高,后續(xù)仍需利用更多的實測數(shù)據(jù)、在更大的時空尺度上對本文方法的有效性進行檢驗。