国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于Azure AutoML的泥沙預(yù)報(bào)模型構(gòu)建與應(yīng)用

2023-06-27 02:54:01曹輝陳柯兵董炳江
人民長(zhǎng)江 2023年4期
關(guān)鍵詞:黃陵清溪含沙量

曹輝 陳柯兵 董炳江

摘要:泥沙預(yù)報(bào)是開展水庫(kù)泥沙實(shí)時(shí)調(diào)度的前提,而水沙作用機(jī)理和演進(jìn)規(guī)律的復(fù)雜性又導(dǎo)致開展高效、精準(zhǔn)的泥沙預(yù)報(bào)較為困難?;谖④浽?018年發(fā)布的Azure AutoML自動(dòng)化機(jī)器學(xué)習(xí)技術(shù),進(jìn)行了泥沙預(yù)報(bào)模型構(gòu)建與應(yīng)用的探索。選取三峽水庫(kù)泥沙重要控制站——寸灘、清溪場(chǎng)、萬縣、黃陵廟站構(gòu)建了含沙量預(yù)報(bào)模型,并從模型構(gòu)建與評(píng)估、預(yù)報(bào)精度、輸入因子重要性等角度開展了分析。研究結(jié)果表明:Azure AutoML技術(shù)可便捷地進(jìn)行自動(dòng)化機(jī)器學(xué)習(xí)模型的構(gòu)建,基于該技術(shù)建立的預(yù)見期為1~3 d的模型針對(duì)沙峰消退階段和含沙量較小階段預(yù)報(bào)效果較好;預(yù)見期為1~2 d的模型可以對(duì)沙峰開展較為準(zhǔn)確的預(yù)報(bào);寸灘、清溪場(chǎng)站含沙量主要受到上游來沙的影響,而萬縣、黃陵廟站的含沙量自相關(guān)性較強(qiáng)。

關(guān) 鍵 詞:泥沙預(yù)報(bào); 沙峰傳播; 含沙量; Azure AutoML; 自動(dòng)化機(jī)器學(xué)習(xí); 三峽水庫(kù)

中圖法分類號(hào): P338+.5

文獻(xiàn)標(biāo)志碼: A

DOI:10.16232/j.cnki.1001-4179.2023.04.014

0 引 言

泥沙預(yù)報(bào)是水庫(kù)開展泥沙實(shí)時(shí)調(diào)度的前提[1-2]。由于下墊面條件的差異和水沙產(chǎn)輸機(jī)理的復(fù)雜,泥沙預(yù)報(bào)一直是一個(gè)世界性的技術(shù)難題。許多學(xué)者采用水文學(xué)和水力學(xué)的方法對(duì)此開展了研究[3-5],近20 a來也有學(xué)者將人工神經(jīng)網(wǎng)絡(luò)等機(jī)器學(xué)習(xí)方法運(yùn)用于河流的泥沙預(yù)報(bào)。苑希民等[6]闡述了人工神經(jīng)網(wǎng)絡(luò)方法對(duì)多泥沙洪水演進(jìn)的辨識(shí)機(jī)理,通過模型聯(lián)想實(shí)現(xiàn)水沙演進(jìn)預(yù)報(bào),研究結(jié)果與實(shí)測(cè)結(jié)果吻合良好,體現(xiàn)了人工神經(jīng)網(wǎng)絡(luò)的應(yīng)用價(jià)值和發(fā)展前景。李義天等[7]將神經(jīng)網(wǎng)絡(luò)理論應(yīng)用于河道水沙運(yùn)動(dòng)規(guī)律的模擬與預(yù)報(bào),并與傳統(tǒng)回歸模型進(jìn)行了對(duì)比分析,回歸模型具有數(shù)學(xué)表達(dá)直觀、易于理解的特點(diǎn),而神經(jīng)網(wǎng)絡(luò)模型在模型結(jié)構(gòu)確定、模型容錯(cuò)性能等方面較優(yōu),但在模型學(xué)習(xí)速度、算法復(fù)雜程度、實(shí)用性和直觀性等方面遜于回歸模型。

利用機(jī)器學(xué)習(xí)開展研究工作,一般均包含數(shù)據(jù)清潔、特征選擇、模型選擇、參數(shù)優(yōu)化以及最終模型驗(yàn)證等幾個(gè)步驟。這些步驟當(dāng)中仍然包含大量既耗時(shí)又重復(fù)的手動(dòng)操作流程,且往往需要具有經(jīng)驗(yàn)的專家來開展這些工作,特別是根據(jù)特定的問題選取最合適的機(jī)器學(xué)習(xí)算法。

自動(dòng)化機(jī)器學(xué)習(xí)(AutoML)則通過技術(shù)手段,將機(jī)器學(xué)習(xí)專家的經(jīng)驗(yàn)固化下來,使機(jī)器可以自動(dòng)建模、自動(dòng)調(diào)參,將整個(gè)機(jī)器學(xué)習(xí)過程自動(dòng)化,減少專家在整個(gè)機(jī)器學(xué)習(xí)過程中的參與[8]。谷歌、微軟、百度等紛紛在該領(lǐng)域發(fā)力,并提供了零門檻AI開發(fā)平臺(tái),實(shí)現(xiàn)零算法基礎(chǔ)定制高精度AI模型。Azure AutoML是微軟在2018年發(fā)布的自動(dòng)建模技術(shù),支持模型結(jié)構(gòu)搜索和超參數(shù)搜索,在算法上支持分類、回歸和時(shí)序預(yù)測(cè)的常用算法。相較于同類型的Google AutoML、Baidu EasyDL,它具有網(wǎng)絡(luò)易于訪問、低代碼(Low-Code)的特點(diǎn),大部分的計(jì)算與操作可以在Web瀏覽器中完成。

隨著長(zhǎng)江上游大型梯級(jí)水庫(kù)群的開發(fā)與建成,以三峽工程為核心的干支流控制性水庫(kù)群已形成規(guī)模[9-10],三峽水庫(kù)入庫(kù)泥沙特性大幅改變[11],針對(duì)三峽水庫(kù)開展高效、精準(zhǔn)的泥沙預(yù)報(bào)也就極為關(guān)鍵[12]。為探索Azure AutoML技術(shù)在泥沙預(yù)報(bào)領(lǐng)域的運(yùn)用效果,推動(dòng)基于機(jī)器學(xué)習(xí)方法的泥沙預(yù)報(bào)模型應(yīng)用于三峽水庫(kù)的泥沙預(yù)報(bào)生產(chǎn)實(shí)踐,本文基于Azure AutoML技術(shù),以三峽水庫(kù)入庫(kù)、出庫(kù)沙量重要控制站——寸灘、清溪場(chǎng)、萬縣、黃陵廟站為例,開展泥沙預(yù)報(bào)研究。

1 研究數(shù)據(jù)與方法

1.1 研究數(shù)據(jù)

收集的數(shù)據(jù)資料為2010~2021年(7~9月)朱沱、北碚、寸灘、武隆、清溪場(chǎng)、萬縣、廟河、黃陵廟站的水沙整編資料,各站點(diǎn)的位置分布如圖1所示,數(shù)據(jù)時(shí)間間隔為1 d。收集的水沙要素為:各站的水位、流量、含沙量、輸沙率。此外,也收集了三峽水庫(kù)壩前水位(茅坪站)的同期數(shù)據(jù)。

研究對(duì)寸灘、清溪場(chǎng)、萬縣、黃陵廟站含沙量開展預(yù)報(bào)模型建模,使用數(shù)據(jù)如表1所列。以清溪場(chǎng)與黃陵廟兩站為例,具體說明如下。

(1)清溪場(chǎng)站。構(gòu)建機(jī)器學(xué)習(xí)模型時(shí),考慮寸灘、武隆至清溪場(chǎng)站的水沙傳播時(shí)間,選定21個(gè)水沙要素作為模型輸入因子(自變量,又稱為特征因子),分別為:當(dāng)天與前一天的寸灘站水位、流量、含沙量、輸沙率,武隆站水位、流量、含沙量、輸沙率,清溪場(chǎng)站水位、流量;前一天的清溪場(chǎng)站含沙量。

為了探索預(yù)報(bào)模型性能受預(yù)見期時(shí)長(zhǎng)的影響,共建立3種不同預(yù)見期的模型,模型輸出因子(因變量,又稱為標(biāo)簽變量)為不同時(shí)段的清溪場(chǎng)站含沙量。舉例說明,如表2所列,若模型輸入為7月17日清溪場(chǎng)站日均含沙量,以及17,18日的日均寸灘站水位、流量、含沙量、輸沙率,武隆站水位、流量、含沙量、輸沙率,清溪場(chǎng)站水位、流量,則3種模型輸出分別為18日清溪場(chǎng)站日均含沙量(清溪場(chǎng)模型1)、19日清溪場(chǎng)站日均含沙量(清溪場(chǎng)模型2)、20日清溪場(chǎng)站日均含沙量(清溪場(chǎng)模型3)。

(2) 黃陵廟站。與清溪場(chǎng)站原理類似,選定15個(gè)水沙要素作為模型輸入因子。若模型輸入為7月17日黃陵廟站日均含沙量,以及17,18日的日均廟河站水位、流量、含沙量、輸沙率,茅坪站水位、黃陵廟站水位、黃陵廟站流量,則3種模型輸出分別為18日黃陵廟站日均含沙量(黃陵廟模型1)、19日黃陵廟站日均含沙量(黃陵廟模型2)、20日黃陵廟站日均含沙量(黃陵廟模型3)。

寸灘站建模過程與清溪場(chǎng)站類似,將清溪場(chǎng)站輸入的寸灘、武隆、清溪場(chǎng)站數(shù)據(jù),對(duì)應(yīng)替換為朱沱、北碚、寸灘站數(shù)據(jù)即可。萬縣站建模過程與黃陵廟站類似,將黃陵廟站輸入的廟河、茅坪、黃陵廟站數(shù)據(jù),對(duì)應(yīng)替換為清溪場(chǎng)、茅坪、萬縣站數(shù)據(jù)即可。

1.2 Azure AutoML計(jì)算流程

本文采用微軟Azure機(jī)器學(xué)習(xí)平臺(tái)(microsoft azure machine learning studio,Azure ML)中的AutoML功能對(duì)水沙數(shù)據(jù)進(jìn)行建模。Azure ML是一種面向機(jī)器學(xué)習(xí)與大數(shù)據(jù)分析的云服務(wù)平臺(tái),能夠有效提升采用機(jī)器學(xué)習(xí)方法進(jìn)行數(shù)據(jù)分析的效率[13]。該平臺(tái)的優(yōu)勢(shì)主要有[14]:能夠在單個(gè)實(shí)驗(yàn)中一次性嘗試多種模型并比較結(jié)果,有助于找到最適合的解決方案。具體即:在同一個(gè)實(shí)驗(yàn)中建立多算法模型,對(duì)預(yù)測(cè)結(jié)果進(jìn)行對(duì)比分析,通過選擇合適的學(xué)習(xí)算法和海量數(shù)據(jù)的訓(xùn)練,從而達(dá)到建立預(yù)測(cè)模型的目的。

基于Azure AutoML的數(shù)據(jù)分析流程如圖2所示,主要由選擇數(shù)據(jù)資產(chǎn)、配置作業(yè)、選擇任務(wù)和設(shè)置、超參數(shù)配置(僅計(jì)算機(jī)視覺,本次研究不涉及)、驗(yàn)證和測(cè)試等步驟組成。下文將結(jié)合清溪場(chǎng)站含沙量預(yù)報(bào)進(jìn)行簡(jiǎn)要介紹,詳細(xì)流程可參考相關(guān)鏈接[15]。

(1)選擇數(shù)據(jù)資產(chǎn),即導(dǎo)入數(shù)據(jù),可以采用4種方式將數(shù)據(jù)導(dǎo)入到實(shí)驗(yàn)中:①?gòu)谋镜匚募?dǎo)入;②從數(shù)據(jù)存儲(chǔ)導(dǎo)入;③從Web文件導(dǎo)入;④從開放數(shù)據(jù)集導(dǎo)入。本次研究采用從本地文件導(dǎo)入數(shù)據(jù)的方式,數(shù)據(jù)格式必須預(yù)先處理為CSV格式。在數(shù)據(jù)導(dǎo)入過程中,可以對(duì)數(shù)據(jù)的表頭與字段等進(jìn)行設(shè)置,并通過數(shù)據(jù)預(yù)覽功能確認(rèn)上傳數(shù)據(jù)的正確性。

(2) 配置作業(yè),從云平臺(tái)中選取不同的計(jì)算實(shí)例或計(jì)算集群運(yùn)用到本次機(jī)器學(xué)習(xí)模型的構(gòu)建中。算力越高,模型建模越快,收費(fèi)也相應(yīng)增加。在此步驟中,需選取用于執(zhí)行機(jī)器學(xué)習(xí)模型預(yù)測(cè)的目標(biāo)列,即本次研究中的清溪場(chǎng)站含沙量。

(3) 選擇任務(wù)和設(shè)置,為實(shí)驗(yàn)選擇機(jī)器學(xué)習(xí)任務(wù)類型,并配置機(jī)器學(xué)習(xí)任務(wù)的控制參數(shù)(見圖3)。在本次研究中,由輸入因子預(yù)測(cè)清溪場(chǎng)站含沙量屬于回歸問題(預(yù)測(cè)連續(xù)數(shù)值)。

進(jìn)一步在查看其他配置設(shè)置選項(xiàng)中,可以進(jìn)行個(gè)性化設(shè)置,如選擇對(duì)模型進(jìn)行評(píng)分的主要指標(biāo)標(biāo)準(zhǔn)均方根誤差、平均絕對(duì)誤差、相關(guān)系數(shù)R2等,用來更好地控制訓(xùn)練作業(yè)。已阻止的模型選項(xiàng)可以主動(dòng)排除Azure AutoML中內(nèi)置的部分模型,以加快整體的計(jì)算過程。退出條件為滿足設(shè)置中的任一條件,則會(huì)提前停止訓(xùn)練作業(yè)。

(4)驗(yàn)證和測(cè)試,選取不同數(shù)據(jù)的比例用于模型構(gòu)建、調(diào)整。精度分析(測(cè)試)樣本在模型構(gòu)建過程中不會(huì)使用,可作為全新樣本資料,用于分析精度指標(biāo)。

1.3 Azure AutoML內(nèi)置模型介紹

Azure AutoML中內(nèi)置了大量不同的機(jī)器學(xué)習(xí)算法。其中,部分模型的算法名稱相同,如表3中出現(xiàn)了多次StandardScalerWrapper,ElasticNet,由于算法超參數(shù)設(shè)置有差異,可將其視作不同模型。現(xiàn)將部分算法簡(jiǎn)要介紹如下,詳細(xì)說明可參考相關(guān)鏈接[16-17]。

(1) VotingEnsemble算法。該算法是一個(gè)集合算法,它包含多個(gè)基本回歸模型,并對(duì)這些模型結(jié)果進(jìn)行加權(quán)平均,以形成最終預(yù)測(cè)。

(2) MaxAbsScaler,ElasticNet算法。MaxAbsScaler(絕對(duì)值最大標(biāo)準(zhǔn)化)將輸入數(shù)據(jù)除以最大值,縮放至[-1,1]。以本次研究為例,即將原始的21個(gè)水文要素除以其各自的最大值后,作為ElasticNet算法的輸入。ElasticNet算法是一種線性模型,又叫彈性網(wǎng)絡(luò)回歸,它在目標(biāo)函數(shù)里同時(shí)使用L1、L2懲罰項(xiàng)。

(3) StackEnsemble算法。此算法是一種簡(jiǎn)單的集成學(xué)習(xí)算法,首先構(gòu)建多個(gè)不同類型的一級(jí)學(xué)習(xí)器,并使用它們來得到一級(jí)預(yù)測(cè)結(jié)果,然后基于這些一級(jí)預(yù)測(cè)結(jié)果構(gòu)建一個(gè)二級(jí)學(xué)習(xí)器,來得到最終的預(yù)測(cè)結(jié)果。Stacking的動(dòng)機(jī)可以描述為:如果某個(gè)一級(jí)學(xué)習(xí)器錯(cuò)誤地學(xué)習(xí)了特征空間的某個(gè)區(qū)域,那么二級(jí)學(xué)習(xí)器通過結(jié)合其他一級(jí)學(xué)習(xí)器的學(xué)習(xí)行為,可以適當(dāng)糾正這種錯(cuò)誤。

(4) StandardScalerWrapper,ElasticNet算法。StandardScalerWrapper是一個(gè)用來將數(shù)據(jù)進(jìn)行歸一化和標(biāo)準(zhǔn)化的方法,將輸入數(shù)據(jù)刪除平均值和縮放到單位方差來標(biāo)準(zhǔn)化特征。得到的結(jié)果是新的輸入數(shù)據(jù)集方差為1,均值為0,隨后輸入到ElasticNet算法中。

(5) RobustScaler,ElasticNet算法。

RobustScaler利用中位數(shù)和四分位距縮放特征,對(duì)于給定的特征,每個(gè)觀測(cè)值先減去中位數(shù),再除以四分位距,能夠在某種程度上抵消異常值的影響,隨后輸入到ElasticNet算法中。

2 結(jié)果分析

在寸灘、清溪場(chǎng)、萬縣、黃陵廟站泥沙預(yù)報(bào)模型構(gòu)建過程中,選取的主要指標(biāo)為R2,退出條件設(shè)置為訓(xùn)練作業(yè)時(shí)間0.5 h。

研究中選定了2010~2021年的數(shù)據(jù)作為數(shù)據(jù)源。將數(shù)據(jù)系列分為兩大部分:2010~2019年樣本資料作為模型構(gòu)建樣本(供訓(xùn)練和驗(yàn)證過程使用),2020~2021年的資料作為模型精度分析樣本(供測(cè)試過程使用)。在模型構(gòu)建過程中不會(huì)使用精度分析樣本,可將其作為全新樣本資料,用于分析精度指標(biāo)。

2.1 模型構(gòu)建與評(píng)估

以清溪場(chǎng)站為例,Azure AutoML利用2010~2019年樣本資料建立了3種不同預(yù)見期模型,對(duì)應(yīng)效果較好的算法與R2如表3所列??梢园l(fā)現(xiàn):3種預(yù)見期下效果最好的算法均為VotingEnsemble,筆者對(duì)該算法在2010~2019年、2020~2021年兩時(shí)期的詳細(xì)指標(biāo)進(jìn)行分析(見表4),值得注意的是這些指標(biāo)均由Azure AutoML系統(tǒng)自動(dòng)計(jì)算,無需額外設(shè)置。指標(biāo)的具體說明可參考相關(guān)鏈接[18],如解釋方差是(explained_variance)衡量模型對(duì)目標(biāo)變量變化的解釋程度,它是原始數(shù)據(jù)方差與誤差方差之間的遞減百分比。

由表4中數(shù)據(jù)可以發(fā)現(xiàn):模型1在兩個(gè)時(shí)期均能得到較好的結(jié)果;而模型2在進(jìn)行模型構(gòu)建的2010~2019年可以取得不錯(cuò)的結(jié)果,但在進(jìn)行測(cè)試的2020~2021年效果稍差,兩時(shí)期具有一定的性能差異;模型3則在兩時(shí)期的效果均較差。此結(jié)果表明,預(yù)見期是影響清溪場(chǎng)站泥沙預(yù)報(bào)精度的重要因素,模型在1~2 d預(yù)見期下能取得較好的結(jié)果,證實(shí)了已有研究對(duì)寸灘、清溪場(chǎng)站間輸沙規(guī)律的探索[19],寸灘站到清溪場(chǎng)站沙峰時(shí)間傳播約為1 d,考慮到含沙量資料為日均數(shù)據(jù),實(shí)際寸灘站到清溪場(chǎng)站沙峰時(shí)間小于2 d。

完成余下寸灘、萬縣、黃陵廟站的預(yù)報(bào)模型構(gòu)建后,選擇各站點(diǎn)效果最好的算法為研究對(duì)象(如清溪場(chǎng)站的VotingEnsemble算法),表5給出了這些站點(diǎn)的模型R2的對(duì)比情況??梢园l(fā)現(xiàn)寸灘、清溪場(chǎng)站模型的性能受預(yù)見期的影響較大,尤其是模型3,而萬縣與黃陵廟站模型的性能衰減幅度相對(duì)較小。

2.2 2020年和2021年預(yù)報(bào)精度分析

圖4展示了研究各站點(diǎn)含沙量整編值(可反映實(shí)測(cè)情況)與3種不同預(yù)見期的模型模擬值(可反映模型的預(yù)報(bào)性能)在2020,2021年的對(duì)比情況,可以發(fā)現(xiàn)如下特點(diǎn):

(1) 2020年,本文研究的4個(gè)站點(diǎn)在8月中下旬出現(xiàn)了兩次較大的沙峰,所有模型均能一定程度上判斷沙峰的變化趨勢(shì),尤其針對(duì)沙峰消退階段和輸沙率偏小的穩(wěn)定階段。但寸灘、清溪場(chǎng)站的模型3對(duì)第二次沙峰預(yù)報(bào)值明顯偏小,無法對(duì)沙峰的量級(jí)開展較為準(zhǔn)確的預(yù)報(bào)。

(2) 2021年,沙峰出現(xiàn)次數(shù)較2020年更為頻繁,對(duì)于本文研究的4個(gè)站點(diǎn),模型3的效果較差,無法對(duì)快速變化的含沙量波動(dòng)做出有效反饋,寸灘、清溪場(chǎng)、萬縣站沙峰量級(jí)的預(yù)報(bào)值均有較大的誤差。但對(duì)于沙峰消退階段(如清溪場(chǎng)站7月下旬至8月上旬、萬縣站7月下旬至8月上旬、黃陵廟站8月上中旬),模型3同樣可以得到較好的結(jié)果。

模型1與模型2可對(duì)大多數(shù)沙峰的量級(jí)開展較為準(zhǔn)確的預(yù)報(bào),而對(duì)寸灘站7月10日左右發(fā)生快速漲落的沙峰(1.4 kg/m3),預(yù)報(bào)誤差則相對(duì)較大。

2.3 輸入因子重要性分析

此外,Azure AutoML在構(gòu)建模型的過程中,能提供量化的輸入變量間相對(duì)重要性,通過觀察輸入變量的使用次數(shù)對(duì)模型性能的影響來衡量其重要性,可以幫助建模者對(duì)輸入變量更好地進(jìn)行評(píng)估,其原理詳見相關(guān)鏈接[20-21]。

表6利用該功能統(tǒng)計(jì)了4個(gè)站點(diǎn)在不同預(yù)見期3個(gè)模型的前4個(gè)重要變量。從表6中可以發(fā)現(xiàn)規(guī)律如下:

(1) 萬縣和黃陵廟站的含沙量自相關(guān)性較強(qiáng)(見表中帶下劃線的變量)。而寸灘、清溪場(chǎng)站則主要受到上游來沙的影響,排名前二的重要性因子均為上游干流的含沙量、輸沙率。

(2) 僅清溪場(chǎng)站的模型1和萬縣站的模型1,2具有3個(gè)前一天的變量(見表中加粗的變量),即對(duì)它們進(jìn)行預(yù)報(bào)模型構(gòu)建時(shí),主要依據(jù)的是過去的信息。在泥沙預(yù)報(bào)的工作實(shí)踐中,可操作性較強(qiáng),余下的模型輸入以當(dāng)天的信息為主,受到信息獲取時(shí)效性的影響較大。從表5中也可以發(fā)現(xiàn),4個(gè)站中僅有萬縣站的模型2其預(yù)報(bào)性能要好于模型1。故針對(duì)萬縣站而言,對(duì)其進(jìn)行泥沙預(yù)報(bào)模型的構(gòu)建相對(duì)較易,模型受預(yù)見期的影響較小。

3 結(jié) 論

本次研究基于微軟的Azure AutoML技術(shù),進(jìn)行了泥沙預(yù)報(bào)模型構(gòu)建與應(yīng)用的探索,以三峽水庫(kù)入庫(kù)、出庫(kù)沙量重要控制站——寸灘、清溪場(chǎng)、萬縣、黃陵廟站為例,構(gòu)建了各站的含沙量預(yù)報(bào)模型,并從模型構(gòu)建與評(píng)估、預(yù)報(bào)精度、輸入因子重要性等角度開展了分析,結(jié)論如下:

(1) 微軟Azure AutoML技術(shù)可便捷地進(jìn)行自動(dòng)化機(jī)器學(xué)習(xí)模型的構(gòu)建,其具有網(wǎng)絡(luò)易于訪問、低代碼(Low-Code)的特點(diǎn),可極大降低機(jī)器學(xué)習(xí)建模的門檻,適用于泥沙預(yù)報(bào)模型的構(gòu)建。

(2) 以2020,2021年的7~9月為例,預(yù)見期1~3 d的模型針對(duì)沙峰消退階段和輸沙率偏小的穩(wěn)定階段預(yù)報(bào)效果較好。對(duì)于沙峰,預(yù)見期為1~2 d的模型可以對(duì)大多數(shù)沙峰的量級(jí)開展較為準(zhǔn)確的預(yù)報(bào),而預(yù)見期3 d的模型效果較差。

(3) 模型輸入因子重要性分析結(jié)果表明,寸灘、清溪場(chǎng)站含沙量主要受到上游來沙的影響,而萬縣、黃陵廟站的含沙量自相關(guān)性較強(qiáng),萬縣站的泥沙預(yù)報(bào)模型性能受預(yù)見期的影響較小。

參考文獻(xiàn):

[1]陳桂亞,董炳江,姜利玲,等.2018長(zhǎng)江2號(hào)洪水期間三峽水庫(kù)沙峰排沙調(diào)度[J].人民長(zhǎng)江,2018,49(19):6-10.

[2]董炳江,陳顯維,許全喜.三峽水庫(kù)沙峰調(diào)度試驗(yàn)研究與思考[J].人民長(zhǎng)江,2014,45(19):1-5.

[3]陶冶,劉天成.基于一維水沙模型的三峽庫(kù)區(qū)泥沙預(yù)報(bào)初探[J].人民長(zhǎng)江,2011,42(6):65-68.

[4]閆金波,代水平,劉天成,等.三峽水庫(kù)泥沙作業(yè)預(yù)報(bào)方案研究[J].水利水電快報(bào),2012,33(7):71-74.

[5]王世平,王渺林,許全喜,等.三峽入庫(kù)站含沙量預(yù)報(bào)方法初探與試預(yù)報(bào)[J].水利水電快報(bào),2015,36(5):11-14.

[6]苑希民,劉樹坤,陳浩.基于人工神經(jīng)網(wǎng)絡(luò)的多泥沙洪水預(yù)報(bào)[J].水科學(xué)進(jìn)展,1999,10(4):393-398.

[7]李義天,李榮,黃偉.基于神經(jīng)網(wǎng)絡(luò)的水沙運(yùn)動(dòng)預(yù)報(bào)模型與回歸模型比較及應(yīng)用[J].泥沙研究,2001,26(1):30-37.

[8]陳雨強(qiáng).可降低AI應(yīng)用門檻的自動(dòng)機(jī)器學(xué)習(xí)技術(shù)[J].人工智能,2018(5):48-55.

[9]郭生練,何紹坤,陳柯兵,等.長(zhǎng)江上游巨型水庫(kù)群聯(lián)合蓄水調(diào)度研究[J].人民長(zhǎng)江,2020,51(1):6-10.

[10]陳柯兵,郭生練,王俊,等.長(zhǎng)江上游ECMWF降水和徑流預(yù)報(bào)產(chǎn)品評(píng)估[J].人民長(zhǎng)江,2020,51(3):73-80.

[11]周銀軍,王軍,金中武,等.三峽水庫(kù)來沙的地區(qū)組成變化分析[J].泥沙研究,2020,45(4):21-26.

[12]楊成剛,許全喜,董炳江,等.三峽水庫(kù)泥沙實(shí)時(shí)預(yù)報(bào)關(guān)鍵技術(shù)研究及應(yīng)用:以2020年汛期為例[J].人民長(zhǎng)江,2020,51(12):82-87.

[13]熊甜,鄭松,徐哲壯,等.基于Azure機(jī)器學(xué)習(xí)平臺(tái)的大學(xué)校園用電分析與預(yù)測(cè)[J].電氣技術(shù),2018,19(5):5-9.

[14]易植.Windows Azure新服務(wù),讓機(jī)器學(xué)習(xí)觸手可及[J].英才,2014(9):101.

[15]MICROSOFT.教程:AutoML-訓(xùn)練無代碼分類模型-Azure Machine Learning | Microsoft Learn[EB/OL].[2022-10-17].https:∥learn.microsoft.com/zh-cn/azure/machine-learning/tutorial-first-experiment-automated-ml.

[16]MICROSOFT.使用Python (v2)設(shè)置AutoML-Azure Machine Learning | Microsoft Learn[EB/OL].[2022-10-17].https:∥learn.microsoft.com/zh-cn/azure/machine-learning/how-to-configure-auto-train.

[17]MICROSOFT.使用自動(dòng)化機(jī)器學(xué)習(xí)進(jìn)行特征化-Azure Machine Learning | Microsoft Learn[EB/OL].[2022-10-17].https:∥learn.microsoft.com/zh-cn/azure/machine-learning/how-to-configure-auto-features.

[18]MICROSOFT.評(píng)估 AutoML 試驗(yàn)結(jié)果-Azure Machine Learning | Microsoft Learn[EB/OL].[2022-10-17].https:∥learn.microsoft.com/zh-cn/azure/machine-learning/how-to-understand-automated-ml.

[19]張地繼,董炳江,楊霞,等.三峽水庫(kù)庫(kù)區(qū)沙峰輸移特性研究[J].人民長(zhǎng)江,2018,49(2):23-28.

[20]MICROSOFT.使用 Azure 機(jī)器學(xué)習(xí)工作室中的負(fù)責(zé)任 AI 儀表板(預(yù)覽版)-Azure Machine Learning | Microsoft Learn[EB/OL].[2022-10-17].https:∥learn.microsoft.com/zh-cn/azure/machine-learning/how-to-responsible-ai-dashboard#feature-importances-model-explanations.

[21]MICROSOFT.使用 Python 解釋和說明模型(預(yù)覽版)-Azure Machine Learning | Microsoft Learn[EB/OL].[2022-10-17].https:∥learn.microsoft.com/zh-cn/azure/machine-learning/how-to-machine-learning-interpretability-aml.

(編輯:胡旭東)

Construction and application of sediment forecast model based on Azure AutoML

CAO Hui1,2,CHEN Kebing3,DONG Bingjiang3

(1.State Key Laboratory of Hydraulics and Mountain River Engineering,Sichuan University,Chengdu 610065,China; 2.Water Resources Research Center,China Yangtze Power Company Limited,Yichang 443002,China; 3.Bureau of Hydrology,Changjiang Water Resources Commission,Wuhan 430010,China)

Abstract:

Sediment forecast is the premise of real-time operation of reservoir sediment,and the complexity of water-sediment action mechanism and evolution law makes it difficult to carry out efficient and accurate sediment forecast.Based on the Azure AutoML automatic machine learning technology released by Microsoft in 2018,the construction and application of sediment prediction model were explored.The important sediment control stations along the Three Gorges Reservoir,Cuntan,Qingxichang,Wanxian and Huanglingmiao Station were selected to construct a sediment concentration prediction model,and the analysis was carried out from the perspectives of model construction and evaluation,prediction accuracy and importance of input factors.The results showed that the Azure AutoML technology can be used to construct the automatic machine learning model conveniently.The model constructed by this technology with a forecast period of 1~3 days has better prediction effect for the sediment peak regression stage and the small sediment concentration stage.While the proposed model with a forecast period of 1~2 days can carry out more accurate prediction of sediment peaks.The sediment concentration of Cuntan Station and Qingxichang Station is mainly affected by the upstream sand,while the sediment concentration of Wanxian and Huanglingmiao stations has strong autocorrelation.

Key words: sediment forecast;sediment peak spreading;sediment concentration;Azure AutoML;automatic machine learning;Three Gorges Reservoir

收稿日期:2022-07-28

基金項(xiàng)目:國(guó)家自然科學(xué)基金聯(lián)合基金項(xiàng)目(U2040218);三峽后續(xù)工作項(xiàng)目“三峽水庫(kù)區(qū)間支流水沙變化”(21303);國(guó)家重點(diǎn)研發(fā)計(jì)劃項(xiàng)目(2019YFC0409000)

作者簡(jiǎn)介:曹 輝,男,高級(jí)工程師,博士研究生,主要從事水文及河流動(dòng)力學(xué)相關(guān)研究。E-mail:cao_hui@ctg.com.cn

通信作者:陳柯兵,男,工程師,博士,主要從事水資源規(guī)劃與管理研究。E-mail:chenkb@cjh.com.cn

猜你喜歡
黃陵清溪含沙量
麗江清溪水庫(kù)
壹讀(2023年7期)2023-06-16 05:11:51
陜煤集團(tuán)黃陵礦業(yè)公司一號(hào)煤礦
“圍繞”在百姓四周——黃陵“代辦領(lǐng)辦”拓展為民服務(wù)
0.6 H 層含沙量與垂線平均含沙量代表性探討
《清溪雅集》
黃陵祭
碧玉清溪織彩綢
民族音樂(2018年1期)2018-04-18 03:38:07
陜西煤化黃陵礦業(yè)集團(tuán)有限責(zé)任公司
羅源灣海洋傾倒區(qū)拋泥過程含沙量增量數(shù)值模擬
懸移質(zhì)含沙量垂線分布
水道港口(2014年1期)2014-04-27 14:14:35
盱眙县| 张家界市| 拜泉县| 蓬安县| 宁陵县| 鹤壁市| 井研县| 边坝县| 嘉兴市| 乌苏市| 和平区| 余江县| 甘泉县| 德惠市| 资兴市| 宜宾县| 巴塘县| 青铜峡市| 阜阳市| 克拉玛依市| 梓潼县| 武胜县| 江门市| 丹巴县| 新昌县| 望都县| 云南省| 古田县| 沅陵县| 巴东县| 安平县| 恩施市| 滦平县| 蓝山县| 西乌| 赣州市| 简阳市| 昌宁县| 蒲江县| 武山县| 崇州市|