国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于可解釋機(jī)器學(xué)習(xí)的黃河源區(qū)徑流分期組合預(yù)報(bào)

2024-09-23 00:00:00黃強(qiáng)尚嘉楠方偉等
人民黃河 2024年9期

關(guān)鍵詞:中長(zhǎng)期徑流預(yù)報(bào);分期組合;機(jī)器學(xué)習(xí);可解釋性;黃河源區(qū)

中圖分類號(hào):P338+ .2;TV882.1 文獻(xiàn)標(biāo)志碼:A doi:10.3969/ j.issn.1000-1379.2024.09.008

引用格式:黃強(qiáng),尚嘉楠,方偉,等.基于可解釋機(jī)器學(xué)習(xí)的黃河源區(qū)徑流分期組合預(yù)報(bào)[J].人民黃河,2024,46(9):50-59.

0引言

黃河源區(qū)年徑流量占全流域的34.1%,是黃河重要的產(chǎn)流區(qū)和水源涵養(yǎng)區(qū),素有“黃河水塔”之稱[1-2] 。黃河流域?qū)儆谫Y源性缺水地區(qū),源區(qū)來水的變化對(duì)全流域水資源開發(fā)、利用和管理影響巨大,加強(qiáng)黃河源區(qū)徑流預(yù)報(bào)研究至關(guān)重要。此外,全球升溫對(duì)黃河源區(qū)在內(nèi)的冰凍圈、大氣圈、水圈、生物圈等多個(gè)圈層產(chǎn)生了顯著影響[3] ,綠色低碳發(fā)展已經(jīng)成為實(shí)現(xiàn)溫控目標(biāo)的全球共識(shí)。黃河源區(qū)跨越我國(guó)一、二級(jí)階梯,地勢(shì)落差大,水能資源蘊(yùn)藏量達(dá)2 000 萬kW。在水能資源富集區(qū)規(guī)劃建設(shè)水風(fēng)光一體化清潔能源基地,是黃河等我國(guó)主要流域綠色低碳轉(zhuǎn)型的重要舉措[4] 。流域水電站是改善風(fēng)、光出力隨機(jī)波動(dòng)性的調(diào)節(jié)中樞,徑流則是決定其調(diào)節(jié)能力的主控因素,準(zhǔn)確預(yù)報(bào)徑流情勢(shì)可為流域清潔能源高效利用、綠色低碳轉(zhuǎn)型提供關(guān)鍵技術(shù)支撐。因此,開展黃河源區(qū)徑流預(yù)報(bào)研究對(duì)于流域水資源科學(xué)調(diào)配和綠色低碳發(fā)展具有重要意義。

近年來,基于機(jī)器學(xué)習(xí)的數(shù)據(jù)驅(qū)動(dòng)模型在徑流預(yù)報(bào)領(lǐng)域快速發(fā)展,并得到廣泛應(yīng)用[5] 。Lu 等[6] 將XG?Boost( Extreme Gradient Boosting) 模型、RF ( RandomForest)模型、AdaBoost(Adaptive Boosting)模型應(yīng)用于富春江水庫的日出庫流量預(yù)測(cè),結(jié)果表明XGBoost 模型預(yù)測(cè)精度最高且預(yù)報(bào)能力比較穩(wěn)定。Han 等[7] 將深度學(xué)習(xí)方法作為預(yù)測(cè)模型誤差后處理器,校正了俄羅斯河徑流預(yù)報(bào)結(jié)果,有效提升了預(yù)測(cè)精度,并有助于揭示多種不確定因素對(duì)模型預(yù)測(cè)結(jié)果的影響。

雖然機(jī)器學(xué)習(xí)善于模擬高維非線性復(fù)雜系統(tǒng),在徑流預(yù)報(bào)研究中表現(xiàn)良好,但是其結(jié)構(gòu)復(fù)雜且具有“黑箱”屬性,無法真正理解和刻畫水文過程及其物理規(guī)律,導(dǎo)致預(yù)測(cè)結(jié)果難以被充分信任[8] 。機(jī)器學(xué)習(xí)的可解釋性分析旨在揭示模型輸入因子對(duì)預(yù)報(bào)對(duì)象的驅(qū)動(dòng)機(jī)制,提高機(jī)器學(xué)習(xí)模型決策過程的透明度。Lundberg 等[9] 將博弈論與局部解釋性關(guān)聯(lián)起來,提出了機(jī)器學(xué)習(xí)模型的SHAP 可解釋性分析框架,闡明了各輸入變量對(duì)機(jī)器學(xué)習(xí)決策的影響機(jī)理。Liu 等[10] 構(gòu)建了一個(gè)月預(yù)見期的XGBoost 徑流預(yù)測(cè)模型,并使用SHAP 可解釋性分析方法計(jì)算了SHAP 總效應(yīng)值、主效應(yīng)值、交互作用值和損失值,量化了XGBoost 徑流預(yù)報(bào)模型中氣象要素、歷史徑流、全球氣候因子等輸入變量對(duì)徑流預(yù)報(bào)結(jié)果的貢獻(xiàn)率。Jing 等[11] 將LSTM 模型應(yīng)用于漢江上游日徑流預(yù)測(cè)中,利用IG(Integrated Gradient)可解釋性方法研究了徑流預(yù)測(cè)的潛在決策機(jī)制。

基于上述研究,筆者以黃河源區(qū)唐乃亥和瑪曲水文站為研究對(duì)象,考慮季節(jié)性融雪變化影響,建立中長(zhǎng)期徑流分期組合機(jī)器學(xué)習(xí)預(yù)報(bào)模型,構(gòu)建機(jī)器學(xué)習(xí)預(yù)報(bào)模型的可解釋性分析框架,定量識(shí)別不同預(yù)報(bào)因子的貢獻(xiàn)率及多因子的復(fù)雜交互作用。

1研究區(qū)概況與數(shù)據(jù)來源

1.1研究區(qū)概況

黃河發(fā)源于青藏高原的巴顏喀拉山北麓,全長(zhǎng)5 464 km,流域面積79.5 萬km。其中,唐乃亥站以上為黃河源區(qū)(見圖1)。源區(qū)河道總長(zhǎng)1 553 km,面積達(dá)12.19 萬km,占黃河流域總面積的16.2%。唐乃亥站多年平均來水量200 億m,年徑流量占全流域的34.1%[2] ,源區(qū)多年平均徑流量分割統(tǒng)計(jì)顯示,降雨、地下水補(bǔ)給(基流)、冰雪及凍土融水分別占年總徑流量的63.15%、26.18%和9.17%[12] 。黃河源區(qū)湖泊數(shù)量眾多,水資源豐沛。河段落差達(dá)3 745 m,水能資源豐富[13-14] ,是我國(guó)九大清潔能源基地之一。

1.2數(shù)據(jù)來源

研究數(shù)據(jù)涵蓋了水文、氣象、積雪覆蓋、大尺度環(huán)流因子等多源數(shù)據(jù),時(shí)段跨度為1960—2020年。具體的數(shù)據(jù)類型及其來源見表1。

2研究方法

基于積雪覆蓋變化和彈性系數(shù)精細(xì)劃分徑流的年內(nèi)預(yù)報(bào)時(shí)段,構(gòu)建基于XGBoost 的分期組合預(yù)報(bào)模型,并使用SHAP 可解釋性分析方法研究不同預(yù)報(bào)因子對(duì)徑流的驅(qū)動(dòng)機(jī)制。技術(shù)路線見圖2。

黃河源區(qū)年內(nèi)不同時(shí)期的融雪徑流占比差異較大,為提升中長(zhǎng)期徑流預(yù)報(bào)的精度,本研究以融雪水當(dāng)量彈性系數(shù)和流域積雪覆蓋率變化為判斷依據(jù),將年內(nèi)的徑流預(yù)報(bào)時(shí)段劃分為融雪影響期和非融雪主導(dǎo)期,分別構(gòu)建徑流預(yù)報(bào)模型。融雪影響期的劃分標(biāo)準(zhǔn)為:1)融雪水當(dāng)量彈性系數(shù)大于0;2)時(shí)段內(nèi)流域積雪覆蓋率呈下降趨勢(shì);3)流域內(nèi)積雪覆蓋率不小于年內(nèi)最大積雪覆蓋率(其中,唐乃亥以上流域?yàn)椋常玻?、瑪曲以上流域?yàn)椋常福ィ┑模保埃?;4)融雪徑流占比達(dá)到10%。參考文獻(xiàn)[17],采用下式估算融雪徑流比。

SW =SW / (SW+P)×100% (4)

式中:SW為融雪徑流占比,SW 為融雪水當(dāng)量。

2.2中長(zhǎng)期徑流分期組合預(yù)報(bào)模型

采用分期組合預(yù)報(bào)策略,分別對(duì)融雪影響期和非融雪主導(dǎo)期開展徑流預(yù)報(bào),再將兩個(gè)時(shí)期的預(yù)報(bào)結(jié)果組合,得到年內(nèi)所有月份的預(yù)報(bào)結(jié)果。分期組合預(yù)報(bào)策略見圖3。

備選的預(yù)報(bào)因子分為3 類,包括水文氣象因子(Ⅰ類,歷史月平均流量、月累計(jì)降水量等8 種)、大尺度環(huán)流因子(Ⅱ類,8 種大尺度環(huán)流因子與太陽黑子指數(shù))和融雪水當(dāng)量(Ⅲ類)。針對(duì)融雪影響期和非融雪主導(dǎo)期,采用點(diǎn)間互信息法和相關(guān)系數(shù)法依次篩選預(yù)報(bào)因子的最佳組合及最優(yōu)滯時(shí)。需要注意的是,非融雪主導(dǎo)期的融雪徑流占比低,融雪水當(dāng)量可不作為該期的主要預(yù)報(bào)因子。

從“預(yù)報(bào)因子類型”和“是否進(jìn)行預(yù)報(bào)因子篩選”兩個(gè)角度出發(fā),設(shè)置多種組合方案,在融雪影響期和非融雪主導(dǎo)期分別優(yōu)選出性能最好的預(yù)報(bào)模型,具體的方案設(shè)置見表2。

基于優(yōu)選出的融雪影響期和非融雪主導(dǎo)期預(yù)報(bào)模型,建立中長(zhǎng)期徑流分期組合預(yù)報(bào)模型。此外,為評(píng)估分期組合預(yù)報(bào)策略在研究區(qū)的適用性,對(duì)比分期組合模型和傳統(tǒng)不分期模型的預(yù)測(cè)性能,對(duì)比方案設(shè)置見表3。

上述方案的徑流預(yù)報(bào)模型均基于XGBoost模型構(gòu)建,通過粒子群算法迭代尋優(yōu)XGBoost模型的超參數(shù)。模型的率定期設(shè)定為1960—1999年, 驗(yàn)證期為2000—2014年,測(cè)試期為2015—2020年。

2.3SHAP 機(jī)器學(xué)習(xí)可解釋性分析框架

為了深入挖掘預(yù)報(bào)模型的決策機(jī)制并提升可解釋性,基于XGBoost 模型構(gòu)建徑流分期組合預(yù)報(bào)模型,并采用SHAP 方法研究其可解釋性分析框架。

通過計(jì)算SHAP 值來衡量單變量預(yù)報(bào)因子、多因子組合對(duì)預(yù)報(bào)結(jié)果的貢獻(xiàn)程度,由此可開展預(yù)報(bào)結(jié)果的歸因分析[18] 。對(duì)于一個(gè)已經(jīng)訓(xùn)練好的機(jī)器學(xué)習(xí)預(yù)報(bào)模型,各預(yù)報(bào)因子的SHAP 值可由下式計(jì)算:

根據(jù)SHAP 值、SHAP 主效應(yīng)值和SHAP交互作用值,從各預(yù)報(bào)因子對(duì)預(yù)報(bào)結(jié)果的貢獻(xiàn)程度、預(yù)報(bào)結(jié)果對(duì)預(yù)報(bào)因子的依賴關(guān)系、預(yù)報(bào)因子間的交互作用等角度對(duì)建立的徑流預(yù)報(bào)e206805ff1c1c201b07b8c74d44b5c705ecba92e9ec79d5b53dfcc459f7cd7ef模型進(jìn)行可解釋性研究。

3結(jié)果與分析

3.1融雪影響期與非融雪主導(dǎo)期

基于水量平衡原理,計(jì)算了唐乃亥站和瑪曲站以上流域不同月份降水彈性系數(shù)和融雪水當(dāng)量彈性系數(shù)(見表4)。結(jié)果顯示兩者均為正值,說明降水、融雪水當(dāng)量與徑流正相關(guān),彈性系數(shù)計(jì)算結(jié)果具有合理性。融雪水當(dāng)量彈性系數(shù)在唐乃亥站以上流域和瑪曲站以上流域的年內(nèi)變化過程相似,于4—5 月達(dá)最大值,此時(shí)徑流對(duì)融雪變化最敏感。如圖4 所示,融雪徑流占比從3 月起顯著上升,在4—5 月達(dá)到最大(40% ~50%)。由此可見,融雪水是黃河源區(qū)地表徑流的重要組成部分[19-20] 。

如圖5 所示,根據(jù)2.1 節(jié)所述的年內(nèi)預(yù)報(bào)時(shí)段劃分方法,識(shí)別出融雪影響期為3—6 月,非融雪主導(dǎo)期為7 月—次年2 月,唐乃亥站和瑪曲站以上流域的預(yù)報(bào)時(shí)段劃分結(jié)果一致。

3.2黃河源區(qū)中長(zhǎng)期徑流分期組合預(yù)報(bào)

3.2.1融雪影響期和非融雪主導(dǎo)期預(yù)報(bào)模型優(yōu)選

根據(jù)表2設(shè)定的預(yù)報(bào)模型方案集,分別在融雪影響期和非融雪主導(dǎo)期優(yōu)選出預(yù)報(bào)性能最佳的模型方案。

首先,利用點(diǎn)間互信息法初篩各方案(見表2)的徑流預(yù)報(bào)因子。圖6 顯示了各預(yù)報(bào)因子的點(diǎn)間互信息(PMI,Pointwise Mutual Information)值。在融雪影響期和非融雪主導(dǎo)期,PMI 值較大的前一個(gè)月流量(Q)、氣溫、蒸發(fā)等氣象要素與唐乃亥站、瑪曲站流量表現(xiàn)出顯著相關(guān)性。此外,在融雪影響期,融雪水當(dāng)量的PMI 值均超過0.4(排名第6),也是重要的預(yù)報(bào)因子。

分別取兩時(shí)期內(nèi)PMI 值較大的10 種因子作為對(duì)應(yīng)徑流預(yù)報(bào)時(shí)期的預(yù)報(bào)因子。采用相關(guān)系數(shù)法確定各方案初篩得到的預(yù)報(bào)因子的最優(yōu)滯時(shí),不同滯時(shí)預(yù)報(bào)因子與徑流的相關(guān)系數(shù)如圖7 所示。由圖7 可見,在融雪影響期和非融雪主導(dǎo)期,滯時(shí)為一個(gè)月的前期流量、前期降水與當(dāng)月流量之間的相關(guān)系數(shù)均為1~12 個(gè)月中的最大值(大于0.68),關(guān)系密切。在融雪影響期,徑流與前一個(gè)月融雪水當(dāng)量的相關(guān)系數(shù)達(dá)0.75。根據(jù)不同滯時(shí)預(yù)報(bào)因子與流量的相關(guān)系數(shù)大小,確定了不同模型方案預(yù)報(bào)因子的最優(yōu)滯時(shí),見表5,其中,Q表示滯時(shí)為1 個(gè)月的前期流量,其余因子采用類似的表達(dá)方式。

根據(jù)表5中的不同方案預(yù)報(bào)因子集合,采用粒子群優(yōu)化算法優(yōu)化XGBoost 的超參數(shù),分別率定融雪影響期和非融雪主導(dǎo)期的徑流預(yù)報(bào)模型。并基于測(cè)試期的納什效率系數(shù)(NSE)、確定系數(shù)(R)、均方根誤差與標(biāo)準(zhǔn)偏差之比(RSR)和均方根誤差(RMSE),分別篩選融雪影響期和非融雪主導(dǎo)期最優(yōu)預(yù)測(cè)模型,結(jié)果見表6。

由表6 可以發(fā)現(xiàn):在融雪影響期,以水文氣象要素和融雪水當(dāng)量作為預(yù)報(bào)因子時(shí)(TNH-Sw-3-S 和MQSw-3-S 方案),模型預(yù)報(bào)能力均達(dá)到最優(yōu);在非融雪主導(dǎo)期,將水文氣象要素作為預(yù)報(bào)因子時(shí)(TNH-Pr-1-S和MQ-Pr-1-S 方案),其模型預(yù)報(bào)能力在兩站均為最佳。

通過篩選預(yù)報(bào)因子并以最優(yōu)滯時(shí)作為輸入(對(duì)應(yīng)表6 中加星號(hào)的方案),模型預(yù)報(bào)精度可得到提升。例如,在唐乃亥站,經(jīng)預(yù)報(bào)因子篩選后的模型方案TNH-Sw-3-S 和TNH-Pr-1-S 與未篩選方案TNH-Sw-3 和TNH-Pr-1 相比,NSE 分別提高約17%和6%、RSR 分別降低約44%和17%、RMSE 分別減少約44%和17%。

由表6 還可知:TNH-Sw-3-S、TNH-Pr-1-S 和MQ-Sw-3-S模型方案表現(xiàn)較佳;在瑪曲站非融雪主導(dǎo)期內(nèi),雖然MQ-Pr-1-S 的R2略低于MQ-Pr-2,但其余3 個(gè)指標(biāo)均更優(yōu),可視為最優(yōu)模型。據(jù)此,得到研究區(qū)中長(zhǎng)期分期組合預(yù)報(bào)模型方案如下:由方案TNH-Sw-3-S 和TNH-Pr-1-S 可得到唐乃亥站性能最優(yōu)的分期組合模型(記為TNH-F-0-S);由方案MQ-Sw-3-S和MQ-Pr-1-S 得到瑪曲站性能最佳的分期組合模型(記為MQ-F-0-S)。

3.2.2分期組合預(yù)報(bào)模型性能分析

將得到的最優(yōu)分期組合模型與傳統(tǒng)不分期模型(建模方案見表3)進(jìn)行對(duì)比,評(píng)估分期組合預(yù)報(bào)策略在研究區(qū)的適用性及其預(yù)報(bào)性能提升效果。

在構(gòu)建不分期模型時(shí),運(yùn)用點(diǎn)間互信息和相關(guān)系數(shù)方法篩選各模型方案(表3 中Z-1-S、Z-2-S、Z-3-S 和Z-4-S 方案)中預(yù)報(bào)因子類型及其最優(yōu)滯時(shí),進(jìn)而采用PSO 優(yōu)化的XGBoost 機(jī)器學(xué)習(xí)算法構(gòu)建預(yù)測(cè)模型,4 種方案不分期模型性能見表7。由表7 可見,與不分期模型相比,分期預(yù)報(bào)模型在唐乃亥站和瑪曲站的NSE 分別提高3%和10%、RSR 分別降低10%和17%、RMSE 分別減少10%和17%,兩站徑流預(yù)報(bào)的準(zhǔn)確率得到提高。綜上可知,本研究構(gòu)建的分期組合預(yù)報(bào)模型(即表7 中TNH-F-0-S 和MQ-F-0-S)的預(yù)報(bào)精度高,整體性能較傳統(tǒng)不分期模型明顯提升,分期組合預(yù)報(bào)策略在研究區(qū)具有良好適用性。

為進(jìn)一步減小徑流預(yù)報(bào)誤差,提升分期組合預(yù)報(bào)模型的精度,采用分位數(shù)映射方法校正徑流預(yù)報(bào)誤差,結(jié)果見表8。根據(jù)《水文情報(bào)預(yù)報(bào)規(guī)范》(GB/ T 22482—2008)對(duì)預(yù)報(bào)精度的分級(jí)標(biāo)準(zhǔn),在校正后的TNH-F-0-S分期組合模型的確定系數(shù)R 為0.926,達(dá)到甲等精度;MQ-F-0-S 分期組合模型的確定系數(shù)R2為0.850,接近甲等精度。

3.3分期組合預(yù)報(bào)模型的可解釋性分析

分期組合模型預(yù)報(bào)功能的實(shí)現(xiàn), 需要利用XGBoost 機(jī)器學(xué)習(xí)方法擬合預(yù)報(bào)因子與徑流的復(fù)雜響應(yīng)關(guān)系。為了深入理解XGBoost 在徑流預(yù)報(bào)中的決策邏輯和工作機(jī)制,提升分期組合預(yù)報(bào)模型的可理解性和透明度,基于上文優(yōu)選的最優(yōu)組合預(yù)報(bào)模型及其預(yù)測(cè)結(jié)果,計(jì)算各預(yù)報(bào)因子的SHAP 值、SHAP 主效應(yīng)值和SHAP交互效應(yīng)值,依次解析組合預(yù)報(bào)模型的單因子貢獻(xiàn)度、因子依賴關(guān)系和多因子間交互作用。

3.3.1單因子貢獻(xiàn)度

SHAP 值可以衡量某一模型預(yù)報(bào)因子對(duì)預(yù)報(bào)結(jié)果的貢獻(xiàn)程度,值越大表示其對(duì)預(yù)報(bào)結(jié)果的貢獻(xiàn)越大。計(jì)算各預(yù)報(bào)因子的SHAP 均值,并按其絕對(duì)值大小進(jìn)行排序,如圖8 所示。由圖8可知,在不同水文站和不同預(yù)報(bào)時(shí)段,盡管預(yù)報(bào)因子對(duì)預(yù)報(bào)結(jié)果的貢獻(xiàn)度略有差異,但排名前列的預(yù)報(bào)因子類型相同。綜合SHAP 均值來看,預(yù)測(cè)因子按貢獻(xiàn)由大到小依次為降水、前一個(gè)月流量、蒸發(fā)、氣溫、相對(duì)濕度、融雪水當(dāng)量、氣壓和風(fēng)速。

采用SHAP 方法進(jìn)行預(yù)報(bào)模型可解釋性分析的優(yōu)勢(shì)還在于能夠可視化模型的決策路徑。圖9 中每條折線代表預(yù)報(bào)模型對(duì)樣本的決策路徑,顏色表示預(yù)報(bào)流量的大?。ㄋ{(lán)色表示小流量預(yù)報(bào)值,紅色表示大流量預(yù)報(bào)值)。線條方向的變化指示預(yù)報(bào)因子的影響效果,向左(SHAP 值<0) 表示會(huì)減小預(yù)報(bào)值, 向右(SHAP 值>0)則增大預(yù)報(bào)值。結(jié)果表明,在小流量模型中,預(yù)報(bào)因子的影響較一致,歸納其典型決策路徑為:Q(減?。ⅲ校遥牛p?。?、EVP(減?。ⅲ裕牛停ㄔ龃螅?、RHU(增大)、WIN(增大)、PRS(減?。?、SW(減?。?;但隨著預(yù)報(bào)流量的增大,其預(yù)報(bào)因子的決策路徑變得更加復(fù)雜。

3.3.2預(yù)報(bào)值對(duì)因子的依賴關(guān)系

繪制SHAP部分依賴圖,可以識(shí)別預(yù)報(bào)結(jié)果與預(yù)報(bào)因子間線性或非線性、單調(diào)或非單調(diào)的復(fù)雜依賴關(guān)系,如圖10所示。圖10中,橫、縱軸分別代表預(yù)報(bào)因子數(shù)值與SHAP 主效應(yīng)值??梢园l(fā)現(xiàn):流量預(yù)報(bào)值與前期降水整體成單調(diào)遞增的依賴關(guān)系,與蒸發(fā)則成單調(diào)遞減的依賴關(guān)系,且在較大范圍內(nèi)以線性依賴關(guān)系為主。除單調(diào)線性關(guān)系外,預(yù)報(bào)徑流與風(fēng)速還存在非單調(diào)、非線性的復(fù)雜依賴關(guān)系。此外,預(yù)報(bào)流量值與前期流量、相對(duì)濕度整體同樣成單調(diào)遞增的關(guān)系,與氣溫、氣壓成非單調(diào)、非線性的復(fù)雜依賴關(guān)系。受篇幅限制,此處不再贅述。

對(duì)于成單調(diào)依賴關(guān)系的預(yù)報(bào)因子,其依賴關(guān)系在各徑流預(yù)報(bào)時(shí)段基本相似,但變化閾值存在一定差異。以降水為例,構(gòu)建的預(yù)報(bào)模型在不同時(shí)期均顯示出了單調(diào)遞增的線性依賴關(guān)系,在同一預(yù)報(bào)時(shí)期內(nèi)預(yù)報(bào)因子閾值接近,推測(cè)與研究區(qū)高寒山區(qū)下墊面對(duì)徑流調(diào)節(jié)機(jī)制的影響有關(guān)[21] 。例如,在融雪影響期,氣溫較低且冰雪、凍土未完全消融,土壤下滲能力弱,少量降水即可產(chǎn)生徑流,在局部依賴圖中表現(xiàn)為SHAP 主效應(yīng)值開始增長(zhǎng)的閾值較小但之后的響應(yīng)斜率較大;而在非融雪主導(dǎo)期,氣溫和蒸發(fā)強(qiáng)度較大,土壤下滲能力增強(qiáng),需要更加充足的降水才能產(chǎn)生地表徑流,因此相應(yīng)的閾值也較大。

3.3.3兩因子的交互作用

計(jì)算預(yù)報(bào)因子兩兩組合的SHAP 交互作用值,揭示多因子交互作用對(duì)預(yù)報(bào)流量的影響。圖11 為降水與其他預(yù)報(bào)因t9/YGQpi2FhawAuHBCgpMQ==子的SHAP 交互作用散點(diǎn)圖(以唐乃亥站非融雪主導(dǎo)期TNH-Pr-1-S 模型、瑪曲站非融雪主導(dǎo)期MQ-Pr-1-S 模型為例)。圖中,縱軸表示SHAP交互作用值,散點(diǎn)顏色表示預(yù)報(bào)因子(降水)值,橫軸是與降水組合的預(yù)報(bào)因子。SHAP 交互作用值的絕對(duì)值越大,交互作用越強(qiáng);交互作用值為正表示有增大徑流量的效果,負(fù)值則相反。

以SHAP 交互作用絕對(duì)值判斷交互作用強(qiáng)度,發(fā)現(xiàn)降水與氣溫、降水與蒸發(fā)、降水與前期流量的交互作用較強(qiáng)。其中,在唐乃亥站非融雪主導(dǎo)期TNH-Pr-1-S 模型中,前期降水與氣溫交互作用值達(dá)-100,表明在低氣溫下的降水以積雪為主,導(dǎo)致徑流預(yù)報(bào)值容易出現(xiàn)減小的情況。在瑪曲站非融雪主導(dǎo)期MQ-Pr-1-S模型中,前期降水與蒸發(fā)交互作用值約為70,表明當(dāng)降水量較大、蒸發(fā)較少時(shí),會(huì)導(dǎo)致徑流量增大。

同時(shí)還發(fā)現(xiàn)SHAP 交互作用散點(diǎn)分布具有拖尾式或階躍式的特征。拖尾式的特點(diǎn)為在某一區(qū)間內(nèi)交互作用變化不顯著(SHAP 交互作用值基本保持不變),區(qū)間外連續(xù)變化顯著( 散點(diǎn)連續(xù)分布), 如TNH-Pr-1-S模型中降水與蒸發(fā)、降水與風(fēng)速的組合。階躍式的特點(diǎn)為在某一區(qū)間內(nèi)散點(diǎn)分層(分區(qū))現(xiàn)象明顯,反映出當(dāng)給定某一降水時(shí)交互作用變化對(duì)橫坐標(biāo)預(yù)報(bào)因子的變化不敏感,此時(shí)交互作用強(qiáng)度主要由降水量決定,如MQ-Pr-1-S 模型中降水與流量、降水與氣壓組合等。

4結(jié)論

以黃河源區(qū)唐乃亥站和瑪曲站為研究對(duì)象,提出了分期組合預(yù)報(bào)策略,構(gòu)建了中長(zhǎng)期徑流分期組合預(yù)報(bào)機(jī)器學(xué)習(xí)模型及其可解釋性分析框架,主要結(jié)論如下。

1)黃河源區(qū)存在顯著的季節(jié)性積融雪過程,基于水量平衡原理并結(jié)合積雪覆蓋率、融雪水當(dāng)量變化,定量劃分年內(nèi)的徑流預(yù)報(bào)時(shí)段,其中融雪影響期為3 月至6 月,非融雪主導(dǎo)期為7 月至次年2月。

2)與傳統(tǒng)模型相比,采用分期組合預(yù)報(bào)模型能提高黃河上游唐乃亥站和瑪曲站徑流預(yù)報(bào)精度。與不分期模型相比,分期組合預(yù)報(bào)模型在唐乃亥站和瑪曲站的NSE分別提高3%和10%、RSR 分別降低10%和17%、RMSE 分別降低10%和17%,經(jīng)誤差校正后唐乃亥站預(yù)報(bào)模型R為0.926,瑪曲站預(yù)報(bào)模型R為0.850。

3)基于SHAP 機(jī)器學(xué)習(xí)可解釋性分析框架,識(shí)別出預(yù)報(bào)因子對(duì)徑流預(yù)報(bào)結(jié)果的貢獻(xiàn)程度從大到小依次為降水、前一個(gè)月流量、蒸發(fā)、氣溫、相對(duì)濕度、融雪水當(dāng)量等。徑流對(duì)不同預(yù)報(bào)因子的依賴關(guān)系復(fù)雜,其中降水、前期流量和相對(duì)濕度以單調(diào)遞增的依賴關(guān)系為主,蒸發(fā)在一定范圍內(nèi)成單調(diào)遞減的線性依賴關(guān)系,不同預(yù)報(bào)因子之間交互作用具有拖尾式或階躍式的特征。

茶陵县| 松滋市| 泽库县| 长葛市| 哈尔滨市| 县级市| 福贡县| 德化县| 景洪市| 缙云县| 马龙县| 桑日县| 沽源县| 武鸣县| 靖远县| 兰溪市| 绵竹市| 乡宁县| 商水县| 随州市| 纳雍县| 潞西市| 龙陵县| 信阳市| 西昌市| 陕西省| 桐柏县| 枣庄市| 吕梁市| 呼图壁县| 弥勒县| 株洲市| 津南区| 商丘市| 龙泉市| 白水县| 太康县| 普洱| 新巴尔虎右旗| 麻阳| 新营市|