周 聶,侯精明,陳光照,馬紅麗,洪增林,李新林
(1.西安理工大學(xué)省部共建西北旱區(qū)生態(tài)水利國(guó)家重點(diǎn)實(shí)驗(yàn)室,陜西 西安 710048;2.鄂爾多斯市水利勘測(cè)設(shè)計(jì)院,內(nèi)蒙古 鄂爾多斯 017000; 3.陜西省地質(zhì)調(diào)查院,陜西 西安 710054)
山洪指在山區(qū)溪溝中由于強(qiáng)降雨等原因引起水位短時(shí)間內(nèi)暴漲形成的洪水,具有流速大、沖刷力強(qiáng)、破壞力強(qiáng)等特點(diǎn),通常會(huì)給交通、農(nóng)業(yè)、居民生命財(cái)產(chǎn)安全等造成巨大威脅[1]。據(jù)《2017年中國(guó)生態(tài)環(huán)境狀況公報(bào)》統(tǒng)計(jì),2017年洪澇災(zāi)害累計(jì)受災(zāi)人口5 515萬(wàn)人,因?yàn)?zāi)直接造成經(jīng)濟(jì)損失達(dá)2 143億元[2]。隨著全球氣候變化,極端降雨事件頻率增大,2018年全國(guó)累計(jì)454條河流出現(xiàn)超過(guò)警戒水位的洪水,其中24條河流發(fā)生超歷史洪水[3]。由于山洪災(zāi)害具有突發(fā)性及破壞性特點(diǎn),如何應(yīng)對(duì)山洪災(zāi)害,降低損失,一直以來(lái)都是國(guó)內(nèi)外學(xué)者研究的熱點(diǎn)與難點(diǎn)。
山洪災(zāi)害模擬預(yù)報(bào)能夠有效模擬山洪災(zāi)害的受災(zāi)范圍,為山洪風(fēng)險(xiǎn)管理、應(yīng)急決策提供依據(jù),是協(xié)助防災(zāi)減災(zāi)工作的重要方式之一。眾多學(xué)者對(duì)此進(jìn)行了研究,包紅軍等[4]基于新安江模型開(kāi)發(fā)了分布式混合水文模型,模型預(yù)報(bào)精度較高;胡國(guó)華等[5]用HEC-HMS半分布式水文模型進(jìn)行山洪模擬,洪峰流量及洪量相對(duì)誤差可控制在20%以?xún)?nèi);孟天翔[6]基于MIKE FLOOD構(gòu)建水動(dòng)力模型開(kāi)展山洪數(shù)值模擬,獲得各類(lèi)洪水淹沒(méi)演進(jìn)變化情況。然而傳統(tǒng)山洪模擬研究都有一個(gè)共同的缺陷,即需要求解復(fù)雜的方程組,按步時(shí)順序迭代以獲取洪水的演進(jìn)過(guò)程,模擬運(yùn)算耗時(shí)長(zhǎng),無(wú)法滿(mǎn)足緊急決策的需求。近年來(lái),隨著人工智能技術(shù)的發(fā)展,機(jī)器學(xué)習(xí)技術(shù)以其普適性與高效性,在醫(yī)學(xué)、化學(xué)、數(shù)據(jù)挖掘等領(lǐng)域都得到了廣泛應(yīng)用并展現(xiàn)出突出優(yōu)勢(shì)[7-9],國(guó)內(nèi)外學(xué)者也逐漸將人工神經(jīng)網(wǎng)絡(luò)、邏輯回歸、極限樹(shù)回歸等機(jī)器學(xué)習(xí)算法應(yīng)用于洪澇災(zāi)害的預(yù)測(cè)中[10-12]。闞光遠(yuǎn)等[13]將ANN與KNN方法相耦合,提高了ANN預(yù)報(bào)能力不佳等問(wèn)題;張珂等[14]將洪水預(yù)報(bào)智能模型應(yīng)用于中國(guó)半干旱半濕潤(rùn)地區(qū),所建模型在半濕潤(rùn)區(qū)典型流域可獲得良好的預(yù)報(bào)結(jié)果;張軒等[15]基于BP神經(jīng)網(wǎng)絡(luò)算法建立經(jīng)驗(yàn)預(yù)報(bào),模型預(yù)報(bào)精度可達(dá)乙級(jí)以上;Chang等[16]基于ANN構(gòu)建了洪水淹沒(méi)多步預(yù)測(cè)模型;Fauzi等[17]同樣基于機(jī)器學(xué)習(xí)算法構(gòu)建了海嘯淹沒(méi)的預(yù)報(bào)模型。這些研究表明,機(jī)器學(xué)習(xí)技術(shù)在洪水預(yù)報(bào)方面同樣具有廣闊的應(yīng)用前景。
機(jī)器學(xué)習(xí)往往需要大量的訓(xùn)練數(shù)據(jù),目前洪水災(zāi)害快速預(yù)報(bào)多基于水文站多年的實(shí)測(cè)數(shù)據(jù),依靠完備的大數(shù)據(jù)進(jìn)行訓(xùn)練,但對(duì)于未發(fā)生過(guò)洪水或歷史淹沒(méi)資料匱乏的地區(qū)無(wú)法進(jìn)行有效預(yù)測(cè)。為此,本文基于高精度水動(dòng)力模型與機(jī)器學(xué)習(xí)技術(shù),選取王茂溝流域?yàn)檠芯繀^(qū)域,以數(shù)值模型模擬數(shù)據(jù)作為驅(qū)動(dòng)數(shù)據(jù),探索構(gòu)建實(shí)測(cè)洪水資料匱乏流域的山洪災(zāi)害快速預(yù)報(bào)模型,旨在為緊急決策提供足夠的前置時(shí)間,協(xié)助決策者更好地采取應(yīng)對(duì)措施。
本文選取陜西省榆林市綏德縣的王茂溝流域作為研究區(qū)域,該流域位于東經(jīng)110°20′26″~110°22′46″,北緯37°34′13″~37°36′03″,總面積約為5.74 km2,王茂溝主溝長(zhǎng)3.75 km,溝道平均比降為2.7%。流域海拔高度介于940~1 200 m,屬溫帶半干旱大陸性季風(fēng)氣候,歷史最大年降水量為735.3 mm,多年平均降水量為475.1 mm,7—9月降水量可達(dá)全年降雨的64%,且多為短歷時(shí)強(qiáng)降雨,極易引起山洪、泥石流等災(zāi)害。2012年7月15日及2017年7月26日均出現(xiàn)高強(qiáng)度暴雨,形成山洪,造成巨大經(jīng)濟(jì)損失[18-19]。
地形精度對(duì)數(shù)值模擬至關(guān)重要,精度不足將無(wú)法反映實(shí)際地形特征,影響模擬的可靠性;精度過(guò)高對(duì)模擬精確性提高不大,但會(huì)嚴(yán)重延長(zhǎng)模型的運(yùn)行時(shí)間。經(jīng)綜合考慮,將研究區(qū)域以5 m的水平分辨率劃分為232 037個(gè)網(wǎng)格,其數(shù)字高程圖見(jiàn)圖1,土地利用情況見(jiàn)圖2。同時(shí),為更好地表征下墊面信息,將研究區(qū)根據(jù)不同的土地利用類(lèi)型,基于最大似然法劃分為8類(lèi)。預(yù)報(bào)模型采用Green-Ampt入滲模型,下滲系數(shù)根據(jù)文獻(xiàn)[20]確定,土地的曼寧系數(shù)根據(jù)文獻(xiàn)[21]確定,各土地利用類(lèi)型具體參數(shù)見(jiàn)表1。
圖1 研究區(qū)域數(shù)字高程
圖2 研究區(qū)土地利用情況
表1 各類(lèi)型土地曼寧及下滲參數(shù)
本研究降雨資料時(shí)間分辨率取1 h。研究區(qū)實(shí)測(cè)降雨資料有限,僅用歷史數(shù)據(jù)無(wú)法完成模型訓(xùn)練,因此,在進(jìn)行模型訓(xùn)練時(shí),同時(shí)加入了歷史降雨資料與設(shè)計(jì)降雨資料。張茹等[22]研究表明GPM(global precipitation measurement)在強(qiáng)降水區(qū)域表現(xiàn)出較高的命中率和較低的誤報(bào)率,衛(wèi)星產(chǎn)品對(duì)強(qiáng)降水的探測(cè)能力較優(yōu),故歷史降雨資料從GPM網(wǎng)站(https://gpm.nasa.gov)獲取[23]。本研究主要針對(duì)短歷時(shí)強(qiáng)降雨引發(fā)的山洪事件,與芝加哥雨型具有一定相似特征,薛宇雷等[24-25]通過(guò)芝加哥雨型生成器生成短歷時(shí)設(shè)計(jì)降雨,應(yīng)用于周河流域及梅溪流域,均取得良好模擬效果。據(jù)此,研究選用芝加哥雨型生成器生成各類(lèi)情況下的短歷時(shí)設(shè)計(jì)降雨。榆林市暴雨公式為
(1)
式中:i為暴雨強(qiáng)度,mm/h;p為重現(xiàn)期,a;t為降雨歷時(shí),min。
為實(shí)現(xiàn)山洪災(zāi)害快速精準(zhǔn)預(yù)測(cè),基于水動(dòng)力模型,結(jié)合機(jī)器學(xué)習(xí)算法構(gòu)建了山洪災(zāi)害快速預(yù)報(bào)模型。預(yù)報(bào)流程圖如圖3所示,首先輸入地形數(shù)據(jù)、降雨數(shù)據(jù)等驅(qū)動(dòng)水動(dòng)力模型,獲得降雨-致洪數(shù)據(jù),并將其劃分為訓(xùn)練集與測(cè)試集,供機(jī)器學(xué)習(xí)算法擬合使用;同時(shí),從降雨數(shù)據(jù)中提取特征參數(shù),經(jīng)相關(guān)性分析,獲取用于算法擬合的最終參數(shù);通過(guò)機(jī)器學(xué)習(xí)算法擬合訓(xùn)練集與特征參數(shù),通過(guò)網(wǎng)格搜索算法尋找最優(yōu)參數(shù),獲取初步模型;再通過(guò)機(jī)器學(xué)習(xí)算法預(yù)報(bào)結(jié)果與水動(dòng)力模型模擬結(jié)果獲得誤差矩陣,并將誤差作為訓(xùn)練數(shù)據(jù)生成誤差修正模型;預(yù)報(bào)結(jié)果由機(jī)器學(xué)習(xí)算法預(yù)報(bào)模型與誤差修正模型共同生成,同時(shí)為降低單一算法自身局限性,將兩種算法(KNN算法和極限隨機(jī)樹(shù)(ERT)算法)結(jié)果按其在訓(xùn)練集中評(píng)價(jià)指標(biāo)得分進(jìn)行權(quán)值分配,生成混合模型預(yù)報(bào)結(jié)果,并以測(cè)試集數(shù)據(jù)檢驗(yàn)?zāi)P皖A(yù)報(bào)可靠性,若誤差過(guò)大,將參數(shù)調(diào)整后重新生成模型,直至預(yù)報(bào)精度達(dá)到要求后,得到最終預(yù)報(bào)模型。
圖3 快速預(yù)報(bào)流程
洪水淹沒(méi)范圍、過(guò)水?dāng)嗝婧榉辶髁?、最大流速以及最大水深是評(píng)價(jià)洪水風(fēng)險(xiǎn)的重要指標(biāo),因地形數(shù)據(jù)中可能存在的個(gè)別噪點(diǎn)會(huì)嚴(yán)重影響過(guò)水?dāng)嗝娴淖畲笊疃?,因而本文主要采用洪水淹沒(méi)面積、斷面流量、平均流速及水深來(lái)評(píng)價(jià)模型的可靠性。
模型控制方程為耦合水文過(guò)程的二維淺水方程,忽略運(yùn)動(dòng)黏性項(xiàng)、科氏力、風(fēng)應(yīng)力及紊流黏性項(xiàng)。其對(duì)應(yīng)的二維非線(xiàn)性淺水方程守恒格式的矢量形式表示如下:
(2)
其中
式中:q為變量矢量,包括水深h以及x和y方向的單寬流量qx和qy;u、v分別為x和y方向的流速;F和G分別為x、y方向的通量矢量;r為凈雨率;S為源項(xiàng)矢量;zb為河床底面高程;Cf=gn2/h1/3為河床糙率系數(shù);n為曼寧系數(shù)。
模型選取對(duì)物理問(wèn)題考慮最全面的動(dòng)力波法進(jìn)行地表洪水過(guò)程的模擬運(yùn)算,通過(guò)基于Godunov格式的有限體積法進(jìn)行空間離散求解二維淺水方程[26-27],并運(yùn)用Runge- Kutta方法構(gòu)造具有二階時(shí)空精度的MUSCL(monotonic upwind scheme for conservation)型格式,確保物質(zhì)守恒并有效解決不連續(xù)問(wèn)題[28]。針對(duì)模擬過(guò)程中可能產(chǎn)生急變流與非連續(xù)等復(fù)雜問(wèn)題,模型選用HLLC近似黎曼求解器對(duì)單元界面上的質(zhì)量以及動(dòng)量的通量進(jìn)行求解。通過(guò)靜水重構(gòu)法處理干濕邊界處可能出現(xiàn)負(fù)水深的問(wèn)題[29],并以流速替代單寬流量作為計(jì)算變量,可在水深低于或流速高于一定值時(shí),將易失穩(wěn)的二階格式有效地轉(zhuǎn)換為穩(wěn)定的一階計(jì)算格式。保證計(jì)算精度的同時(shí),將計(jì)算單元中的坡面源項(xiàng)轉(zhuǎn)換為該單元邊界上的通量,確保其在進(jìn)行復(fù)雜地形計(jì)算時(shí)同樣滿(mǎn)足全穩(wěn)條件。摩阻源項(xiàng)使用Hou等[30]優(yōu)化的分裂點(diǎn)隱式法確保運(yùn)算結(jié)果的穩(wěn)定性。
該模型可對(duì)下墊面條件復(fù)雜區(qū)域進(jìn)行高精度的雨洪模擬,并采用GPU(graphics processing unit)并行技術(shù)加速模擬計(jì)算過(guò)程,保障模型運(yùn)算效率。侯精明等[31]對(duì)流域模擬數(shù)據(jù)與實(shí)測(cè)數(shù)據(jù)進(jìn)行了可靠性對(duì)比,結(jié)果表明模型模擬性能良好;并且隨后的文獻(xiàn)[32]中另一區(qū)域模擬結(jié)果與實(shí)測(cè)數(shù)據(jù)同樣符合,再次驗(yàn)證了模型的可靠性。
機(jī)器學(xué)習(xí)是人工智能的核心,包含有SVM、邏輯回歸、決策樹(shù)、隨機(jī)森林、KNN等算法,本研究主要選用ERT算法及KNN算法構(gòu)建山洪災(zāi)害快速預(yù)報(bào)模型。
2.3.1ERT算法
ERT算法是Geurts等[33]于2006年提出的一種基于決策樹(shù)的集成學(xué)習(xí)算法。該方法類(lèi)似于隨機(jī)森林算法[34],通過(guò)自上而下的方式生成若干決策樹(shù),運(yùn)用多棵決策樹(shù)的綜合結(jié)果進(jìn)行預(yù)測(cè)。訓(xùn)練模型時(shí)每棵決策樹(shù)使用相同的訓(xùn)練樣本;節(jié)點(diǎn)分裂時(shí),省略對(duì)GINI系數(shù)或均方差的計(jì)算過(guò)程,采用參數(shù)完全隨機(jī)的方式提升算法的隨機(jī)性。因節(jié)點(diǎn)分裂屬性完全隨機(jī)決定,單棵決策樹(shù)的擬合精度通常較低,但綜合多棵決策樹(shù)結(jié)果,可大幅提升其預(yù)報(bào)精度。
在ERT算法的眾多參數(shù)中,模型性能對(duì)結(jié)點(diǎn)處隨機(jī)選擇的特征個(gè)數(shù)Max features及構(gòu)成模型的決策樹(shù)深度Max depth較敏感。對(duì)于同一組訓(xùn)練數(shù)據(jù),Max features值越小,模型隨機(jī)性越強(qiáng),同時(shí)對(duì)訓(xùn)練樣本的輸出值的依賴(lài)性越弱。預(yù)測(cè)誤差隨Max depth的增加而減小,但Max depth值過(guò)大將造成模型的過(guò)擬合,致使模型在訓(xùn)練集上可達(dá)到近乎完美的表現(xiàn),但在測(cè)試集中會(huì)出現(xiàn)較大誤差,模型參數(shù)的選取需根據(jù)具體數(shù)據(jù)集確定[35]。
2.3.2KNN算法
KNN算法是Cover和Hart基于向量空間模型于1968年提出的一種機(jī)器學(xué)習(xí)算法[36],該算法具有理論成熟、方法簡(jiǎn)單以及魯棒性良好的優(yōu)勢(shì),可有效過(guò)濾訓(xùn)練集中的噪聲。在KNN算法中,每個(gè)樣本均被視為Rn空間中的向量或坐標(biāo)點(diǎn),利用距離公式找出與待分類(lèi)樣本最近的K個(gè)樣本,以此進(jìn)行樣本估計(jì)。其主要步驟如下:
步驟1對(duì)已有樣本進(jìn)行實(shí)例化,轉(zhuǎn)換為(x,f(x))的形式,其中x為樣本的特征參數(shù),x由(x1,x2, …,xn)表示,xn為樣本的第n個(gè)屬性值,即特征參數(shù)的數(shù)量等于向量組成的維度,實(shí)例化后所有的樣本構(gòu)成訓(xùn)練集與測(cè)試集。
步驟2給定一個(gè)新的測(cè)試樣本xi,運(yùn)用距離公式分別計(jì)算xi與訓(xùn)練集中各個(gè)原本樣本之間的距離,并從中篩選出與xi距離最近的K個(gè)樣本。其距離公式主要有:曼哈頓距離公式、歐式距離公式及閔可夫斯基距離公式等,通過(guò)擬合效果綜合對(duì)比,最終選擇在訓(xùn)練集及測(cè)試集上均表現(xiàn)良好的歐式距離公式:
(3)
式中:xi、xj為兩個(gè)樣本;xil、xjl分別為xi和xj的第l個(gè)特征值;L(xi,xj)為樣本xi和xj之間的歐式距離。
步驟3將選擇出的K個(gè)樣本與未知樣本的接近程度,按權(quán)重分配K個(gè)樣本的預(yù)測(cè)結(jié)果,并將其分配給新的測(cè)試樣本,作為預(yù)報(bào)值。
機(jī)器學(xué)習(xí)算法對(duì)算法參數(shù)十分敏感,算法最大深度、最大特征數(shù)等參數(shù)的選取不合適將直接導(dǎo)致模型預(yù)報(bào)的失敗。為使預(yù)報(bào)模型能有效擬合所提供數(shù)據(jù),研究采用網(wǎng)格搜索的方法對(duì)機(jī)器學(xué)習(xí)算法參數(shù)進(jìn)行優(yōu)選。網(wǎng)格搜索是一種窮舉型算法,可自動(dòng)模擬各類(lèi)參數(shù)的組合情況,進(jìn)行多次模型訓(xùn)練,并由交叉驗(yàn)證進(jìn)行誤差對(duì)比,最終找到訓(xùn)練誤差最小的模型,確定出最適合訓(xùn)練數(shù)據(jù)的最優(yōu)的參數(shù)組合,進(jìn)而通過(guò)對(duì)模型參數(shù)的優(yōu)化提升模型的可靠性。研究中,交叉驗(yàn)證系數(shù)選取為0.2,最終確定ERT算法的最大深度為10,誤差公式選取均方根誤差(RMSE),最小分裂數(shù)為2;KNN模型K鄰近個(gè)數(shù)取為3,采用球狀樹(shù)算法進(jìn)行數(shù)據(jù)分割,距離公式選擇為歐式距離公式。
為降低由水動(dòng)力模型及機(jī)器學(xué)習(xí)造成的誤差累積,利用水動(dòng)力模型模擬結(jié)果與機(jī)器學(xué)習(xí)算法初步預(yù)報(bào)結(jié)果生成誤差矩陣,而后以降雨特征參數(shù)為輸入條件,誤差矩陣為輸出結(jié)果,運(yùn)用機(jī)器學(xué)習(xí)算法建立降雨特征參數(shù)與誤差矩陣之間的對(duì)應(yīng)關(guān)系,構(gòu)建誤差修正模型。機(jī)器學(xué)習(xí)算法最終預(yù)報(bào)結(jié)果由初步預(yù)報(bào)結(jié)果累加上誤差修正模型所得出的對(duì)應(yīng)誤差矩陣生成。同時(shí),為降低由單一機(jī)器學(xué)習(xí)算法本身的缺陷產(chǎn)生的誤差,通過(guò)將KNN算法模型及ERT算法模型的模擬結(jié)果依據(jù)其在訓(xùn)練數(shù)據(jù)集中的確定系數(shù)(R2),進(jìn)行加權(quán)分配,獲得混合模型預(yù)報(bào)結(jié)果。計(jì)算公式為
(4)
式中:RC為混合模型預(yù)報(bào)結(jié)果;RERT和RKNN分別為ERT模型和KNN模型各個(gè)網(wǎng)格上的預(yù)報(bào)結(jié)果;SERT和SKNN分別為ERT模型和KNN模型的R2值。
選擇R2、絕對(duì)平均誤差(MAE)和RMSE作為模型整體可靠性的評(píng)價(jià)指標(biāo)。
在洪水安全應(yīng)急管理中,決策者最關(guān)心的往往是洪水最大淹沒(méi)面積及洪峰流量情況,據(jù)此,通過(guò)水動(dòng)力模型累計(jì)模擬108場(chǎng)降雨事件,其中歷史降雨事件為18場(chǎng),設(shè)計(jì)降雨事件90場(chǎng),獲得其雨洪過(guò)程作為樣本數(shù)據(jù),運(yùn)用ERT算法及KNN算法訓(xùn)練生成快速預(yù)報(bào)模型,運(yùn)用R2、MAE和RMSE評(píng)估預(yù)報(bào)整體性能。此外,在流域主溝道下游出口處選擇斷面,通過(guò)計(jì)算出口斷面的洪峰流量、流速及由流量與流速近似估算出的斷面平均水深對(duì)模型預(yù)報(bào)性能進(jìn)一步進(jìn)行復(fù)核。
快速預(yù)報(bào)模型的訓(xùn)練數(shù)據(jù)均為水動(dòng)力模型模擬結(jié)果,因此在進(jìn)行模型構(gòu)建時(shí),需先對(duì)水動(dòng)力模型的模擬性能進(jìn)行驗(yàn)證。模型驗(yàn)證所用降雨資料為王茂溝水文站觀測(cè)數(shù)據(jù),降雨開(kāi)始于2012年7月15日00:25,降雨歷時(shí)為5 h,流量資料為王茂溝水文站實(shí)測(cè)數(shù)據(jù),模擬時(shí)長(zhǎng)為10 h,流域出口處的模擬流量過(guò)程與實(shí)測(cè)流量過(guò)程對(duì)比見(jiàn)圖4。由圖4可見(jiàn),水動(dòng)力模型模擬結(jié)果與觀測(cè)流量數(shù)據(jù)變化趨勢(shì)基本一致,流量峰值滯后約0.5 h,流量消退過(guò)程較觀測(cè)數(shù)據(jù)稍快,因遙測(cè)地形數(shù)據(jù)與實(shí)際地形存在差異,在進(jìn)行土地利用劃分時(shí)產(chǎn)生了一定誤差,但模型總體效果良好,納什系數(shù)可達(dá)0.78,可有效模擬該流域降雨致洪過(guò)程。
圖4 流域出口流量過(guò)程對(duì)比
在進(jìn)行機(jī)器學(xué)習(xí)訓(xùn)練時(shí),輸入?yún)?shù)的選取至關(guān)重要,合理優(yōu)選參數(shù)即可保證模型精度,也可增強(qiáng)模型的時(shí)效性[37]。因此,研究選用皮爾遜相關(guān)性分析方法對(duì)模型所選降雨特征參數(shù)進(jìn)行相關(guān)性分析。皮爾遜相關(guān)系數(shù)小于0.4時(shí)為弱相關(guān)、極弱相關(guān)或無(wú)相關(guān),0.4~0.6為中等強(qiáng)度相關(guān),0.6~1為強(qiáng)相關(guān)或極強(qiáng)相關(guān)。計(jì)算公式為
(5)
式中:ρxy為皮爾遜相關(guān)系數(shù);σxy是參數(shù)x和y的協(xié)方差;σx、σy分別為x和y的方差。
選用流域總淹沒(méi)面積、總淹沒(méi)水量與所選降雨特征參數(shù)進(jìn)行相關(guān)性分析,相關(guān)系數(shù)計(jì)算結(jié)果見(jiàn)表2。降雨重現(xiàn)期、降雨峰值、最大3 h降水量、最大5 h降水量、累計(jì)降水量及峰值前降水量與淹沒(méi)面積及淹沒(méi)水量都具有較強(qiáng)的相關(guān)性??傃蜎](méi)面積、總淹沒(méi)水量與降雨歷時(shí)的皮爾遜相關(guān)系數(shù)分別為0.054和0.096,屬于極弱相關(guān)或無(wú)相關(guān),因此最終降雨特征參數(shù)舍棄降雨歷時(shí),保留其余參數(shù)。
表2 降雨特征參數(shù)相關(guān)性分析
選取93場(chǎng)降雨事件作為模型訓(xùn)練數(shù)據(jù),15場(chǎng)作為測(cè)試數(shù)據(jù),分別運(yùn)用ERT算法、KNN算法和混合算法構(gòu)建山洪快速預(yù)報(bào)模型,3種模型的統(tǒng)計(jì)指標(biāo)如表3所示。由表3可知,所有模型R2值均可達(dá)到0.90以上,說(shuō)明模型能對(duì)數(shù)據(jù)形成較好擬合,可應(yīng)用于洪水快速預(yù)報(bào)研究。在對(duì)水深進(jìn)行模擬時(shí),各預(yù)報(bào)模型均能獲得較好的得分,其中ERT模型略?xún)?yōu),R2值為0.958 7,MAE值為0.001 4,RMSE值為0.010 0;在進(jìn)行流速預(yù)報(bào)時(shí),KNN模型預(yù)報(bào)效果最佳,R2值為0.951 7,模擬效果較好,ERT模型預(yù)報(bào)性能略差于KNN模型。混合模型在對(duì)水深及流速的整體預(yù)測(cè)上表現(xiàn)最好,R2值均達(dá)到0.95以上,MAE值和RMSE值均相對(duì)較小。
表3 快速預(yù)報(bào)模型評(píng)估指標(biāo)值
圖5為水動(dòng)力模型、KNN模型、ERT模型以及混合模型在出口斷面達(dá)洪峰流量時(shí)刻的水深圖,可以看出,KNN模型、ERT模型以及混合模型在出口斷面達(dá)洪峰流量時(shí)刻,對(duì)流域范圍內(nèi)水深模擬結(jié)果與水動(dòng)力模型模擬結(jié)果基本一致,能準(zhǔn)確反映各處水深與各溝道中的行洪情況。
(a) 水動(dòng)力模型
圖6為水動(dòng)力模型、KNN模型、ERT模型以及混合模型對(duì)15場(chǎng)測(cè)試降雨事件模擬淹沒(méi)面積和淹沒(méi)水量的結(jié)果。圖7為KNN模型、ERT模型以及混合模型對(duì)淹沒(méi)面積、淹沒(méi)水量和平均水深模擬的相對(duì)誤差,忽略積水深度為10 cm以下的區(qū)域,在15場(chǎng)測(cè)試降雨事件中,模型對(duì)平均水深的預(yù)測(cè)最準(zhǔn)確,對(duì)淹沒(méi)水量的預(yù)測(cè)效果稍差。由圖6可見(jiàn),KNN模型、ERT模型以及混合模型模擬的淹沒(méi)面積變化情況與水動(dòng)力模型模擬結(jié)果相同,其中KNN模型誤差較為穩(wěn)定,平均相對(duì)誤差為0.39%,ERT模型平均相對(duì)誤差為1.14%,混合模型平均相對(duì)誤差為0.69%,均達(dá)到了近乎完美的擬合效果。淹沒(méi)面積與淹沒(méi)水量的平均誤差也可控制在5%以?xún)?nèi),表明所構(gòu)建的學(xué)習(xí)模型能較好反映山洪災(zāi)害整體情況,預(yù)報(bào)性能良好。
(a) 淹沒(méi)面積
圖7 3種模型模擬相對(duì)誤差
水動(dòng)力模型需從0時(shí)刻開(kāi)始迭代運(yùn)算,模擬單場(chǎng)降雨10 h致洪過(guò)程平均用時(shí)為1 688.4 s,KNN模型對(duì)15場(chǎng)降雨數(shù)據(jù)進(jìn)行最大洪量預(yù)測(cè)累計(jì)用時(shí)為33 s,單場(chǎng)降雨平均用時(shí)為2.2 s。ERT模型速度略快,單場(chǎng)降雨平均用時(shí)為1.7 s,兩類(lèi)模型均能在極短時(shí)間內(nèi)給出預(yù)測(cè)結(jié)果?;旌夏P托枰C合ERT模型及KNN模型結(jié)果,因此模擬用時(shí)稍長(zhǎng),單場(chǎng)降雨平均用時(shí)約為4.1 s,亦可滿(mǎn)足快速山洪快速預(yù)報(bào)需求。
因山區(qū)地形起伏較大,在將地形網(wǎng)格化進(jìn)行洪水模擬計(jì)算時(shí),地勢(shì)高的區(qū)域降雨將迅速向低洼區(qū)域匯集,這會(huì)使地勢(shì)高的區(qū)域出現(xiàn)大量積水量極小的網(wǎng)格,因此預(yù)報(bào)模型在該區(qū)域?qū)?huì)達(dá)到近乎完美的預(yù)報(bào)效果,在運(yùn)用傳統(tǒng)指標(biāo)進(jìn)行模型可靠性評(píng)估時(shí)將會(huì)過(guò)高估計(jì)模型的實(shí)際預(yù)報(bào)效果。因此,本文以流域出口斷面作為研究斷面,通過(guò)分析出口斷面的流量、流速及平均斷面水深進(jìn)一步驗(yàn)證模型預(yù)報(bào)性能。在15場(chǎng)降雨事件中,盡管模型在整體指標(biāo)評(píng)估中均得到了較高的分?jǐn)?shù),但在實(shí)際的出口斷面處,模型性能仍存在一定差異。4種模型在出口斷面處平均水深、平均流速和斷面流量模擬結(jié)果見(jiàn)表4。
表4 出口斷面處平均水深、平均流速和斷面流量模擬結(jié)果
圖8為模型在出口斷面的平均水深、平均流速和斷面流量的相對(duì)誤差。由圖8(a)可見(jiàn),3種模型對(duì)斷面平均水深預(yù)測(cè)的平均誤差均小于10%,其中KNN模型平均誤差為3.51%,ERT模型平均誤差為5.98%,KNN模型整體誤差較?。粌煞N模型在對(duì)個(gè)別場(chǎng)次降雨模擬時(shí)仍然存在較大誤差,KNN模型最大誤差為13.90%,ERT模型最大誤差為13.51%?;旌夏P推骄`差為3.39%,最大單場(chǎng)降雨誤差為11.27%,有效綜合了兩種算法結(jié)果,降低對(duì)個(gè)別場(chǎng)次降雨致洪信息的誤報(bào)。由圖8(b)可見(jiàn),3種模型在進(jìn)行流速預(yù)測(cè)時(shí)誤差均較小。其中,KNN模型對(duì)斷面流速預(yù)測(cè)性能最佳,平均誤差為1.85%,比ERT模型低1.03%,同時(shí),最大誤差也最小,為6.00%?;旌夏P推骄`差為1.92%,比KNN算法模型預(yù)報(bào)性能略差,這是由于在對(duì)流速進(jìn)行預(yù)測(cè)時(shí),KNN模型擬合效果普遍高于ERT模型,在這種情況下混合模型通過(guò)綜合兩種模型模擬結(jié)果對(duì)誤差的校正效果不明顯。由圖8(c)可見(jiàn),3個(gè)模型對(duì)于斷面流速及水深的預(yù)測(cè)準(zhǔn)確性要優(yōu)于斷面流量,這是由于斷面流量是通過(guò)構(gòu)成斷面網(wǎng)格上的水深、流速計(jì)算求得,因此存在一定的誤差累積現(xiàn)象,導(dǎo)致模型對(duì)流量的預(yù)報(bào)性能稍差。但所建混合模型對(duì)斷面流量最大誤差可控制在15%以?xún)?nèi),平均誤差為4.50%,低于10%,仍具有較高準(zhǔn)確性,可滿(mǎn)足緊急決策需求。
(a) 平均水深
a.經(jīng)評(píng)價(jià)指標(biāo)分析,本文選取的機(jī)器學(xué)習(xí)算法在進(jìn)行山洪災(zāi)害預(yù)報(bào)時(shí)均能有較好性能,進(jìn)行水深模擬預(yù)測(cè)時(shí),各模型預(yù)報(bào)均能獲得較好的得分,其中ERT模型最佳;進(jìn)行流速預(yù)報(bào)時(shí),KNN模型預(yù)報(bào)效果較好,ERT模型略差于KNN模型,混合模型可有效綜合預(yù)報(bào)結(jié)果,可將整體誤差控制在5%以?xún)?nèi)。
b.根據(jù)流域出口斷面特征信息,算法對(duì)斷面平均流速預(yù)測(cè)差距不大,KNN算法表現(xiàn)最佳,平均相對(duì)誤差為1.85%,混合模型對(duì)誤差降低不明顯;在進(jìn)行斷面水深及流量預(yù)測(cè)時(shí),算法預(yù)報(bào)效果差距較大,KNN算法模擬平均水深及斷面流量平均誤差分別為3.51%和5.10%,ERT算法表現(xiàn)稍差,平均誤差均分別為5.98%和6.07%,混合模型對(duì)誤差校正效果明顯,最終平均誤差分別為3.39%和4.50%,可為應(yīng)急決策提供可靠依據(jù)。
c.所建模型單場(chǎng)降雨平均模擬時(shí)間可控制在10 s以?xún)?nèi),可為緊急決策爭(zhēng)取大量前置時(shí)間,協(xié)助決策者更好地采取應(yīng)急管理措施。