王書(shū)韜,史明昌,陳春陽(yáng),陳靖濤
(北京林業(yè)大學(xué)水土保持學(xué)院,100083,北京)
土壤侵蝕易導(dǎo)致土壤退化,土質(zhì)惡化和作物減產(chǎn),威脅生態(tài)環(huán)境和社會(huì)經(jīng)濟(jì)的可持續(xù)發(fā)展。高效、精準(zhǔn)分析區(qū)域土壤侵蝕空間分布信息,把握生態(tài)環(huán)境的時(shí)空格局和演變規(guī)律,為生態(tài)修復(fù)和土地優(yōu)化利用決策提供支撐,對(duì)調(diào)節(jié)土壤侵蝕風(fēng)險(xiǎn)具有重要意義[1]。
土壤侵蝕的研究結(jié)果受尺度效應(yīng)影響較明顯,該區(qū)域土壤侵蝕空間分布研究主要是在>100 km2的區(qū)域研究土壤侵蝕在空間上的分布格局和規(guī)律,研究仍處于探索階段[2]。深度學(xué)習(xí)可使用多隱藏層、多感知器的網(wǎng)絡(luò)結(jié)構(gòu),抽象、深層次獲取屬性和特征[3]。近年來(lái),有學(xué)者應(yīng)用傳統(tǒng)神經(jīng)網(wǎng)絡(luò)模型對(duì)土壤侵蝕空間分布進(jìn)行有益探索,但該類(lèi)模型缺乏對(duì)區(qū)位信息的考慮,對(duì)深層信息的表達(dá)有待提高[4]。
針對(duì)傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的不足,筆者在區(qū)域尺度上,引用UNet++ 神經(jīng)網(wǎng)絡(luò),利用多層卷積核,建立土壤侵蝕因子和強(qiáng)度之間的深層聯(lián)系,借助具有局部感知空間信息特點(diǎn)的感受野,表達(dá)區(qū)位信息,優(yōu)化土壤侵蝕空間模型。
湖北省位于長(zhǎng)江中游地區(qū),地處第二、三階梯的過(guò)渡帶,地貌類(lèi)型多樣;海拔西高東低,存在明顯空間差異;土壤和植被類(lèi)型復(fù)雜,包括水稻土、潮土、黃棕壤等土類(lèi),木本植物達(dá)1 300余種。湖北省林冠層覆蓋度較大,但70%為針葉林,導(dǎo)致林下水土流失嚴(yán)重。
地理空間數(shù)據(jù)云發(fā)布的30 m分辨率Landsat 8 OLI遙感數(shù)據(jù); NASA發(fā)布的30 m分辨率ASRTER GDEM V2數(shù)據(jù);南京土壤所發(fā)布的1∶100萬(wàn)土壤數(shù)據(jù);中科院資源與環(huán)境中心發(fā)布的1 km分辨率湖北省2015年土壤侵蝕空間分布數(shù)據(jù);湖北省及周邊108個(gè)氣象站點(diǎn)2015年逐月降水?dāng)?shù)據(jù)。
筆者選擇降雨侵蝕力、土壤可蝕性、地表覆蓋、植被覆蓋、坡度、地形起伏度因子作為土壤侵蝕空間分布信息的輸入因子,各因子計(jì)算方法[5-10]如表1所示。
根據(jù)神經(jīng)網(wǎng)絡(luò)特點(diǎn),在Jupyter Notebook平臺(tái)對(duì)植被覆蓋因子和地表覆蓋類(lèi)型進(jìn)行處理,將非植被類(lèi)型設(shè)為0,對(duì)地表覆蓋類(lèi)型進(jìn)行獨(dú)熱編碼,通過(guò)UNet++ 神經(jīng)網(wǎng)絡(luò)的自動(dòng)擬合能力,獲取地表覆蓋因子,避免因子間的共線性問(wèn)題。
將湖北省的降雨侵蝕力、土壤可蝕性、地表覆蓋、植被覆蓋、坡度和地形起伏度因子空間分布柵格數(shù)據(jù)進(jìn)行疊加,獲取含各因子空間分布信息的數(shù)據(jù)集。將數(shù)據(jù)集按面積平均分成10個(gè)區(qū)域,在Jupyter Notebook平臺(tái)下,通過(guò)tf.random_clip模塊在各區(qū)域內(nèi)隨機(jī)提取100個(gè)16×16像元窗口。將像元窗口按1∶1分為訓(xùn)練集和驗(yàn)證集,用于UNet++ 神經(jīng)網(wǎng)絡(luò)訓(xùn)練。
BP神經(jīng)網(wǎng)絡(luò)以UNet++ 神經(jīng)網(wǎng)絡(luò)訓(xùn)練集和驗(yàn)證集窗口內(nèi)的像元作為訓(xùn)練集和驗(yàn)證集。
表1 土壤侵蝕因子計(jì)算方法Tab.1 Calculation method of soil erosion factor
UNet++ 神經(jīng)網(wǎng)絡(luò)是Unet模型的改進(jìn)算法[11](圖1)。模型計(jì)算土壤侵蝕空間分布過(guò)程為:訓(xùn)練集輸入模型,對(duì)土壤侵蝕各因子進(jìn)行卷積計(jì)算,完成區(qū)位和深層信息的表達(dá),映射至卷積層;經(jīng)過(guò)池化操作,完成土壤侵蝕因子深層信息的簡(jiǎn)化和裁剪,傳遞到池化層;經(jīng)過(guò)轉(zhuǎn)置卷積操作,進(jìn)行土壤侵蝕因子的分析表達(dá),上采樣為含土壤侵蝕空間分布擬合結(jié)果的像元窗口,作為模型輸出;將訓(xùn)練集輸出結(jié)果與對(duì)土壤侵蝕空間分布數(shù)據(jù)對(duì)比,獲取訓(xùn)練精度;借助優(yōu)化算法,對(duì)卷積核的權(quán)重進(jìn)行調(diào)整,實(shí)現(xiàn)模型訓(xùn)練;將驗(yàn)證集像元窗口輸入模型,輸出結(jié)果與真實(shí)的土壤侵蝕分布數(shù)據(jù)對(duì)比,防止模型過(guò)擬合。訓(xùn)練精度與驗(yàn)證精度均達(dá)預(yù)期,表示模型訓(xùn)練完成;將研究區(qū)土壤侵蝕因子輸入訓(xùn)練完成的模型運(yùn)算,獲得全區(qū)域的土壤侵蝕空間分布結(jié)果和總體精度。
UNet++ 神經(jīng)網(wǎng)絡(luò)構(gòu)造設(shè)定為卷積層、池化層和轉(zhuǎn)置卷積層各4層,可以保持模型的復(fù)雜度和魯棒性。卷積操作中,前2層卷積核設(shè)置為5×5像元、后2層為3×3像元,通過(guò)改變感受野大小,實(shí)現(xiàn)不同尺度下土壤侵蝕因子深層信息的分析。池化層選擇池化單元為2的最大池化方法,對(duì)土壤侵蝕因子進(jìn)行降維和去除冗余。轉(zhuǎn)置卷積層根據(jù)卷積層設(shè)置,對(duì)圖層信息進(jìn)行分析和上采樣操作,保證模型輸入輸出的空間一致性。
土壤侵蝕的發(fā)生、發(fā)展具有連續(xù)和非負(fù)性,對(duì)比tan、RELU等函數(shù),激活函數(shù)(Activation Function)選擇sigmoid函數(shù),如式(1),更符合土壤侵蝕物理意義,便于求導(dǎo),對(duì)數(shù)據(jù)有壓縮和土壤侵蝕因子標(biāo)準(zhǔn)化的功能,便于向前傳輸。
(1)
式中:S(x)為輸出;x為輸入。
丟失率用式(2)的交叉熵?fù)p失函數(shù)(Cross Entropy Loss)。該函數(shù)能保持較高梯度狀態(tài),改進(jìn)sigmoid函數(shù)在訓(xùn)練結(jié)果接近真實(shí)值時(shí)的梯度彌散現(xiàn)象[12]。
H(p,q)=-∑(p(x)lgq(x))。
(2)
式中:H(p,q)為交叉熵;p(x)為實(shí)際輸出概率;q(x)為期望輸出概率。
Kingma等[13]試驗(yàn)證明,梯度下降方法選用Adam優(yōu)化器,在大型模型和數(shù)據(jù)集的情況下,能高效解決局部深度學(xué)習(xí)問(wèn)題,適用于區(qū)域尺度土壤侵蝕空間分布研究。
利用BP神經(jīng)網(wǎng)絡(luò)前饋型人工神經(jīng)網(wǎng)絡(luò)的原理[14](圖1),計(jì)算過(guò)程為:將訓(xùn)練集像元輸入模型中,映射至隱含層;通過(guò)矩陣運(yùn)算,獲得土壤侵蝕強(qiáng)度作為模型輸出;將輸出結(jié)果與土壤侵蝕空間分布數(shù)據(jù)對(duì)比,獲取訓(xùn)練精度;調(diào)整神經(jīng)元權(quán)重,進(jìn)行模型訓(xùn)練;借助驗(yàn)證集觀察過(guò)擬合情況;訓(xùn)練完成后,將土壤侵蝕各因子輸入模型,獲得研究區(qū)整體土壤侵蝕空間分布結(jié)果和總體精度。
圖1 BP和UNet++ 神經(jīng)網(wǎng)絡(luò)框架Fig.1 BP and UNet++ network structure
BP神經(jīng)網(wǎng)絡(luò)包含4個(gè)隱藏層,各層神經(jīng)元數(shù)分別設(shè)置為64、128、256、512個(gè)。其余超參數(shù)設(shè)置與UNet++ 保持一致。
如圖2所示,UNet++ 神經(jīng)網(wǎng)絡(luò)隨訓(xùn)練次數(shù)增加,訓(xùn)練精度和驗(yàn)證精度不斷提高,直至訓(xùn)練4萬(wàn)5 000次后,訓(xùn)練精度和驗(yàn)證精度出現(xiàn)震蕩并逐漸平穩(wěn),說(shuō)明模型難以進(jìn)一步優(yōu)化土壤侵蝕擬合結(jié)果。最終用于土壤侵蝕空間分布研究的UNet++ 模型驗(yàn)證精度為96.52%。
BP神經(jīng)網(wǎng)絡(luò)隨迭代次數(shù)增加,驗(yàn)證精度先增大后減小,說(shuō)明模型已出現(xiàn)過(guò)擬合現(xiàn)象,繼續(xù)訓(xùn)練會(huì)導(dǎo)致模型對(duì)訓(xùn)練集外的土壤侵蝕空間分布結(jié)果擬合精度下降。最終用于土壤侵蝕強(qiáng)度空間分布研究的BP神經(jīng)網(wǎng)絡(luò)驗(yàn)證精度為94.91%。
圖2 模型訓(xùn)練過(guò)程Fig.2 Training process of neural networks
采用BP神經(jīng)網(wǎng)絡(luò)和UNet++ 神經(jīng)網(wǎng)絡(luò)對(duì)研究區(qū)進(jìn)行試驗(yàn),用式(3)總體精度(overall accuracy)作為指標(biāo)對(duì)土壤侵蝕空間分布結(jié)果進(jìn)行評(píng)價(jià)。表2評(píng)價(jià)結(jié)果顯示,UNet++ 神經(jīng)網(wǎng)絡(luò)總體精度為95.7%,BP神經(jīng)網(wǎng)絡(luò)總體精度91.4%,均超過(guò)90%,說(shuō)明深度學(xué)習(xí)模型都能較好反映真實(shí)土壤侵蝕空間分布狀況;UNet++ 神經(jīng)網(wǎng)絡(luò)精度比BP神經(jīng)網(wǎng)絡(luò)高4.3%,在評(píng)價(jià)精度上表現(xiàn)更為優(yōu)越。
(3)
式中:OA為總體精度;n為像元數(shù);kk為坐標(biāo)中(k,k)處位置;akk為(k,k)處像元。
表2 不同模型侵蝕結(jié)果總體精度對(duì)比Tab.2 Overall accuracy comparison of erosion resultsby different models %
獲取侵蝕空間分布(圖3),根據(jù)SL190—2007《土壤侵蝕分類(lèi)分級(jí)標(biāo)準(zhǔn)》,統(tǒng)計(jì)結(jié)果中各級(jí)土壤侵蝕強(qiáng)度像元數(shù)、面積(表3),結(jié)果表明:1)2種模型計(jì)算所得土壤侵蝕空間分布結(jié)果在空間格局上與真實(shí)數(shù)據(jù)具有一致性;2)2種方法得到的土壤侵蝕空間分布結(jié)果均未出現(xiàn)明顯區(qū)塊化特征,未呈現(xiàn)與單一因子空間分布趨勢(shì)一致性過(guò)高的現(xiàn)象;3)BP神經(jīng)網(wǎng)絡(luò)結(jié)果中,中部微度侵蝕集中區(qū)域呈現(xiàn)大量點(diǎn)狀分布的極強(qiáng)度侵蝕像元“椒鹽”現(xiàn)象;UNet++ 神經(jīng)網(wǎng)絡(luò)結(jié)果中未出現(xiàn)明顯“椒鹽”現(xiàn)象;4)BP神經(jīng)網(wǎng)絡(luò)和UNet++ 神經(jīng)網(wǎng)絡(luò)結(jié)果中各級(jí)土壤侵蝕強(qiáng)度面積的構(gòu)成與真實(shí)數(shù)據(jù)接近。
圖3 土壤侵蝕強(qiáng)度空間分布對(duì)比圖Fig.3 Comparison of spatial distribution of soil erosion
表3 侵蝕強(qiáng)度面積統(tǒng)計(jì)
圖4 不同模型的誤差空間分布圖Fig.4 Error space distribution among the different models
由表3可得:BP神經(jīng)網(wǎng)絡(luò)結(jié)果中,微度、輕度、中度、強(qiáng)度、極強(qiáng)度侵蝕面積誤差分別為-2.53%、0.33%、5.41%、8.10%、166.99%。極強(qiáng)度侵蝕面積僅占湖北省全區(qū)域的0.49%,訓(xùn)練集樣本數(shù)量嚴(yán)重不足,導(dǎo)致識(shí)別能力差。如圖4所示,BP神經(jīng)網(wǎng)絡(luò)結(jié)果中,在西北部高山區(qū)和中部平原區(qū)錯(cuò)分像元呈明顯的聚集型分布。對(duì)比高山區(qū)錯(cuò)分像元分布坡度因子發(fā)現(xiàn),誤差大部分發(fā)生在坡度因子較高的地方,說(shuō)明隨坡度因子增大,模型對(duì)其敏感度下降。平原區(qū)誤差聚集于地形起伏度<5 m的區(qū)域,是由于激活函數(shù)將地形起伏度因子中較小的值進(jìn)一步壓縮導(dǎo)致該區(qū)域坡度因子未能正常反映侵蝕輕度的實(shí)際情況。
UNet++ 神經(jīng)網(wǎng)絡(luò)結(jié)果中,微度、輕度、中度、強(qiáng)度和極強(qiáng)度侵蝕面積誤差分別為-0.55%、12.51%、-5.58%、-19.61%和6.38%。輕度侵蝕誤差較大,錯(cuò)分像元主要分布在微度、輕度和強(qiáng)度侵蝕交織處,區(qū)域內(nèi)輕度侵蝕比例大,模型訓(xùn)練該類(lèi)像元窗口時(shí),易將微度和中度侵蝕錯(cuò)分為輕度侵蝕。強(qiáng)度侵蝕面積誤差較大主要是由于比例僅3.99%,樣本數(shù)量少。極強(qiáng)度侵蝕比例更小,卻與BP神經(jīng)網(wǎng)絡(luò)一樣出現(xiàn)誤差,是由于該類(lèi)型侵蝕集中分布,且UNet++ 神經(jīng)網(wǎng)絡(luò)以像元窗口的形式輸入,對(duì)集中分布的侵蝕類(lèi)型有較好的識(shí)別能力。
如圖4所示,Unet++ 結(jié)果未呈現(xiàn)明顯聚集型分布,錯(cuò)分像元未聚集在土壤侵蝕強(qiáng)度較大或較小區(qū)域,說(shuō)明該模型能較好擬合土壤侵蝕因子極端區(qū)域。用像元窗口對(duì)UNet++ 誤差進(jìn)行區(qū)域分析,發(fā)現(xiàn)錯(cuò)分像元集中在2類(lèi)像元窗口中。一類(lèi)像元窗口內(nèi)有4個(gè)土壤侵蝕因子跨度>50%;另一類(lèi)像元窗口為微度、輕度和中度侵蝕交織處。2類(lèi)像元窗口誤差的產(chǎn)生原因都是由于樣本數(shù)量不足,導(dǎo)致模型難以針對(duì)該情況進(jìn)行擬合。
選擇降雨侵蝕力、土壤可蝕性、地表覆蓋、植被覆蓋、坡度和地形起伏度因子作為輸入數(shù)據(jù),利用UNet++ 神經(jīng)網(wǎng)絡(luò)輸出結(jié)果,總體精度達(dá)95.7%,與真實(shí)數(shù)據(jù)在空間格局上具有一致性;誤差在各強(qiáng)度侵蝕、空間分布上都較為均勻,沒(méi)有明顯誤差聚集現(xiàn)象和“椒鹽”現(xiàn)象,該模型可以用于土壤侵蝕強(qiáng)度空間分布計(jì)算。
結(jié)合sigmoid函數(shù)和交叉熵?fù)p失函數(shù)能在符合土壤侵蝕物理意義的情況下,改進(jìn)梯度彌散現(xiàn)象;使用Adam優(yōu)化算法能修正梯度,能有效避免模型過(guò)早進(jìn)入局部最優(yōu)解范圍的同時(shí),保證模型的訓(xùn)練速度。
湖北省位于長(zhǎng)江中游,是長(zhǎng)江徑流里程最長(zhǎng)的省份,地貌、土壤和植被狀況復(fù)雜,土壤侵蝕狀況對(duì)長(zhǎng)江水質(zhì)具有較大影響。利用其地形、植被、土壤多樣性的特點(diǎn),模型訓(xùn)練過(guò)程中能夠減少過(guò)擬合現(xiàn)象的發(fā)生,最終建立推廣性強(qiáng)的深度學(xué)習(xí)模型。
構(gòu)建的UNet++ 神經(jīng)網(wǎng)絡(luò),在輸入數(shù)據(jù)和模型參數(shù)上,是傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)的百倍以上;如圖2所示,UNet++ 神經(jīng)網(wǎng)絡(luò)的迭代次數(shù)也是BP神經(jīng)網(wǎng)絡(luò)的3倍左右;隨著輸入數(shù)據(jù)量的增加,精度會(huì)提高,但運(yùn)算時(shí)間隨之幾何增長(zhǎng)。現(xiàn)階段根據(jù)不同生產(chǎn)需求,學(xué)者對(duì)土壤侵蝕分辨率選擇存在差異,劉寶元等選取10 m分辨率對(duì)中國(guó)水力侵蝕進(jìn)行抽煙調(diào)查[15];BATJES等選取0.5°分辨率對(duì)全球的土壤侵蝕進(jìn)行研究[16]。1 km分辨率土壤侵蝕等級(jí)空間分布信息足以支撐省級(jí)區(qū)域的資源調(diào)查評(píng)價(jià)、植被的土壤保持效應(yīng)評(píng)估[15,17]; 選用1 km分辨率的土壤侵蝕因子作為輸入數(shù)據(jù),可以滿(mǎn)足生產(chǎn)需要,同時(shí)縮短模型運(yùn)算時(shí)間。
本模型加入地形起伏度,表達(dá)徑流路徑對(duì)侵蝕的影響,更切實(shí)地反映區(qū)域侵蝕特征,模型建立的各因子與侵蝕強(qiáng)度間的聯(lián)系,更適合中國(guó)復(fù)雜的地形狀況。在地表覆蓋因子的分類(lèi)上仍存在不足,未劃分永久灌概地及稻田,未考慮作物種類(lèi)及作物輪作。