国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

不同輸入方案對徑流預測精度的影響研究

2021-08-11 04:35:23劉振男周靖楠陸之洋徐桂弘
人民黃河 2021年7期
關鍵詞:主成分分析法

劉振男 周靖楠 陸之洋 徐桂弘

摘 要:徑流預測對合理利用有限的水資源至關重要?;诔梢蚍治龇?、主成分分析法(PCA法)、核主成分分析法(KPCA法)分別構建3種不同的模型輸入方案,并采用自適應模糊推論系統(tǒng)(ANFIS模型)對河南省北汝河汝州水文站月徑流量進行預測,依據均方根誤差與相關系數(shù)對預測精度進行評價,從而明晰不同變量選擇方法在徑流預測當中的應用效果。結果表明:ANFIS模型適用于研究區(qū)的徑流預測。PCA法、KPCA法分別構建的模型輸入方案與成因分析法得到的方案相比,不但變量數(shù)目大幅減少,而且徑流預測精度亦有大幅度的提高。與此同時,PCA法較KPCA法更適合重建研究區(qū)的徑流預測變量方案。另外發(fā)現(xiàn),模型運行時間與輸入方案中的變量個數(shù)關系緊密,即變量個數(shù)越少,運行時間越短。

關鍵詞:徑流預測;主成分分析法;核主成分分析法;自適應模糊推論系統(tǒng);預測因子

中圖分類號:TP391.9 文獻標志碼:A

doi:10.3969/j.issn.1000-1379.2021.07.008

引用格式:劉振男,周靖楠,陸之洋,等.不同輸入方案對徑流預測精度的影響研究[J].人民黃河,2021,43(7):41-44.

Abstract: Runoff prediction is very important for rational utilization of limited water resources. Based on the cause analysis method, PCA, KPCA and ANFIS model, the monthly runoff of RuzhouHydrology Station on the Beiru River in Henan Province was predicted. By means of root-mean-square error and correlation coefficient, the influence of different input schemes selected by different variable selection methods on runoff prediction accuracy was studied. The results show that the ANFIS model is suitable for runoff prediction in the study area. Compared with the schemes obtained by cause analysis, the input schemes constructed by PCA and KPCA respectively not only have a sharp decrease in the number of variables, but also greatly improve the accuracy of runoff prediction. Meanwhile, PCA is more suitable to reconstruct the runoff prediction variable scheme than that of KPCA. In addition, it is found that the running time of the model is closely related to the number of variables in the input scheme, that is, the smaller the number of variables, the shorter the running time.

Key words: runoff forecast; PCA; KPCA; ANFIS; forecasting factor

隨著我國經濟快速發(fā)展,各行各業(yè)對水資源的需求量越來越大,因此合理有效地利用水資源至關重要,而徑流的準確預測對于高效地分配有限的水資源具有重要的現(xiàn)實意義[1]。眾所周知,大量不確定因素會對徑流量的多少產生影響,給徑流預測工作帶來諸多挑戰(zhàn),如何有效地提高徑流預測精度已成為水文預報研究領域的熱點。傳統(tǒng)的預測方法主要是根據河川徑流自身存在的連續(xù)性、周期性等特點進行預測,如成因分析法、數(shù)理統(tǒng)計法以及時間序列法[2]。上述方法雖然能夠較好地完成徑流預測任務,但對資料質量要求較高且需要進行較為深入的物理成因分析,增加了徑流預測的工作量。為了簡化徑流預測工作流程、提高預測精度,模糊數(shù)學法、混沌理論以及人工神經網絡等方法被廣泛應用[3]。實踐證明,以上新興方法不但能夠提高徑流預測精度,而且不用過多地進行物理成因分析,從而達到簡化徑流預測工作流程的目的。王佳等[4]基于集合經驗模態(tài)分解法與人工神經網絡法提出了一種新的預測模型(EEMD-ANN),并成功應用于黃河龍羊峽水庫的月徑流預測當中;張瀟等[5]基于奇異譜分析和ARIMA模型對青弋江西河鎮(zhèn)站月徑流進行了預測,較單一的ARIMA模型精度有了大幅度提高;張敬平等[6]基于經驗模態(tài)分解與徑向基函數(shù)神經網絡提出了一種預測模型,且完成了徑流預測任務。綜上可知,研究人員主要將精力集中在預測模型的改進工作中,往往忽略了客觀存在的事實,即模型的輸入方案亦會對預測精度產生顯著影響。優(yōu)選高效的變量作為模型輸入,不但能夠提升模型運行效率,而且對提高模型預測精度亦為關鍵。

目前,常用的模型輸入變量篩選方法主要有以下兩種:一是成因分析法,即借助氣象學、水文學等理論知識,從徑流形成的物理機制入手,深入研究相關氣象、下墊面等因素對徑流形成的直接作用,從而篩選出對徑流具有顯著影響的因素作為預測因子,該方法的優(yōu)勢在于能夠給出徑流量多少的合理解釋,但其內在規(guī)律很難被完全揭示;二是數(shù)理統(tǒng)計法,即運用統(tǒng)計學等理論知識,基于數(shù)據挖掘理念,以相關分析等方法為手段,篩選與徑流存在顯著統(tǒng)計關系的因素作為預測因子。為了進一步簡化模型輸入方案、提高預測精度,在相關分析的基礎上,主成分分析法能夠有效地對預測變量進行降維,進而達到減少模型輸入因子數(shù)量的目的,但是該方法主要是對原有預測變量進行線性降維,而徑流與其影響因素間或多或少摻雜著非線性關系,顯然需要一種能夠處理非線性關系的降維方法,核主成分分析法就是典型代表方法之一。

主成分分析法與核主成分分析法在徑流預測因子篩選中的應用研究還鮮有報道,因此有必要系統(tǒng)地展開相關研究。筆者以北汝河的水文數(shù)據為基礎,基于自適應模糊推論系統(tǒng),就主成分分析法與核主成分分析法選擇的不同輸入變量對徑流(月均流量)預測精度的影響展開研究,既可以完成研究區(qū)的徑流預測工作,又可以探明適用于研究區(qū)的徑流預測輸入變量選擇方法,以期為當?shù)氐乃Y源合理規(guī)劃提供參考。

1 研究方法

1.1 主成分分析法

主成分分析法(Principal Component Analysis,PCA)是一種數(shù)學降維方法,即將大量的具有一定線性相關性的變量重新組合,形成一組具有較少個數(shù)的互不相關的新變量并取代原有變量,詳細原理可以參見文獻[7]。具體計算步驟可簡述如下:①計算原變量的相關系數(shù)矩陣;②求出相關系數(shù)矩陣的特征值以及相應的正交化單位特征向量;③選擇主成分;④計算主成分得分;⑤確定最終新變量。

1.2 核主成分分析法

核主成分分析法(Kernel Principal Component Analysis,KPCA)是一種經典的多元統(tǒng)計方法,是在PCA的基礎上改進而來的一種能夠處理非線性關系的降維方法,其改進思想為將原有的多個變量通過核方法(非線性)映射到高維特征空間,從而在高維空間上進行主成分分析以達到數(shù)據降維的目的,最終確定能夠取代原有變量的少數(shù)新變量,詳細原理可以參見文獻[8]。具體計算步驟可簡述如下:①計算原變量的核矩陣;②執(zhí)行核矩陣中心化操作;③計算核矩陣的特征值和特征向量;④數(shù)據重建;⑤確定最終新變量。

1.3 自適應模糊推論系統(tǒng)

自適應模糊推論系統(tǒng)(Adaptive Network-Based Fuzzy Inference System,ANFIS)是由Jang于1993年提出來的一種耦合模型[9],該模型集成了模糊邏輯與神經網絡的優(yōu)點,采用反向傳播算法與最小二乘法對初始參數(shù)進行優(yōu)化調整,從而自動產生If-Then規(guī)則。事實上,ANFIS是一種基于Takagi-Sugeno(T-S)模型的模糊推理系統(tǒng),一階T-S模糊推論系統(tǒng)的ANFIS模型流程如圖1所示。其中:x與y為輸入;A1、A2、B1、B2為模糊集合;λ與k為ANFIS的前件參數(shù),是調整隸屬度函數(shù)的關鍵參數(shù);∏代表模糊規(guī)則;N代表歸一化規(guī)則;w1與w2為模糊規(guī)則的可信度;1與2為可信度的歸一化形式;h1 與h2為規(guī)則結論;h為最終輸出。

顯然,ANFIS是一個多層前饋網絡模型。其中:第1層為輸入的隸屬函數(shù)層,第2層為規(guī)則的強度釋放層,第3層為規(guī)則強度的歸一化層,第4層為自適應節(jié)點層,第5層為計算輸出層。

2 徑流預測及影響分析

2.1 研究區(qū)概述

北汝河位于河南省境內,是潁河水系的主要支流,干流長約250 km,流域面積約5 670 km2。該流域屬大陸性季風氣候區(qū),多年平均氣溫約14 ℃,多年平均水面蒸發(fā)量1 000 mm,多年平均降水量750 mm,春冬兩季干燥少雨,夏季炎熱多雨,降水時空分布不均,年際、年內變化較大,汛期降水約占總降水量的62%,受季風影響易出現(xiàn)特大暴雨。由于北汝河支流較多,干流上無控制性水利工程,流域洪水主要由暴雨導致,中上游河道坡度較大,匯流速度較快,易發(fā)生突發(fā)性洪澇災害,因此對北汝河開展徑流預測研究對當?shù)胤篮闇p災工作具有重要的現(xiàn)實意義。

2.2 數(shù)據處理

研究所用資料為1985—2016年汝州水文站逐月降水量、土壤含水量、蒸發(fā)量以及徑流量數(shù)據,數(shù)據來源可靠。由產匯流理論可知,徑流量與前期降水量、土壤含水量以及蒸發(fā)量之間存在一定的物理成因關系,因此前期降水量、土壤含水量以及蒸發(fā)量對徑流量的影響作用具有一定的滯后性。基于降水量、土壤含水量以及蒸發(fā)量,選用12個月為最大提前期,初步建立了含有36(12×3)個變量的徑流預測待選因子集。預測待選因子具體描述如下:降水預測因子為P(t-i)(t代表時間),土壤含水量因子為S(t-i),蒸發(fā)量因子為E(t-i)。其中,i(i=1,2,…,12)表示提前期,例如P(t-1)代表提前一個月的降水量數(shù)據,其余的依此類推。

2.3 輸入方案的確定

為了全方位比較不同方法確定的模型輸入方案對預測精度產生的影響,基于成因分析法、PCA法與KPCA法設計了3種不同的模型輸入方案。

(1)由成因分析法可知,含有36個待選預測變量的因子集中的每個因子均與徑流存在一定的關系,因此第1種模型輸入方案為待選預測因子集中的全部變量,即輸入方案1含有36個變量。

(2)應用PCA法對變量進行降維之前需要對變量間的相關性進行分析。若變量間的相關性較強,則有必要運用PCA法對原有變量進行主成分提取;否則,不存在使用PCA法對原有變量進行降維的基礎。為此,計算得到了36個待選變量間的相關系數(shù)矩陣,其表明,大多數(shù)變量間存在顯著的線性相關性,除了自相關以外,正相關系數(shù)最大值為0.667 7,負相關系數(shù)最小值為-0.499 1。顯然,可用PCA法對36個變量進行降維操作,故采用MATLAB軟件編程對上述變量執(zhí)行PCA操作,累計貢獻率設置為0.9,最終形成含有7個變量的模型輸入方案2。

(3)在36個變量的基礎上直接運用KPCA法執(zhí)行降維操作,同樣借助MATLAB軟件編程,累計貢獻率同樣設置為0.9,最終重組形成含有8個變量的模型輸入方案3。

為了提高模型運行效率,對3種輸入方案中的預測變量以及徑流數(shù)據按照式(1)統(tǒng)一進行了歸一化處理。

式(1)為正向變量(降水量、土壤含水量)的歸一化公式,需補充反向變量(蒸發(fā)量)的歸一化公式?

式中:xnor為歸一化數(shù)據;x為原始數(shù)據;xmax與xmin分別為原始數(shù)據中的最大值與最小值。

通過上述歸一化方法,可將原始數(shù)據控制在[-1,1]之間。模型計算后,再將輸出結果進行反歸一化處理,得到最終預測結果。

2.4 模型構建

根據ANFIS模型原理,應用MATLAB軟件編程。其中,采用genfis3函數(shù)生成ANFIS的初始結構,模型迭代代數(shù)為300,隸屬函數(shù)為高斯函數(shù),其數(shù)目設置為10。模型訓練期為1985—2012年,測試期為2013—2016年。預測效果的評價指標采用均方根誤差(RMSE)和相關系數(shù)(CORR)。RMSE的值越接近0且CORR的值越接近1,說明預測精度越高。

式中:pi為預測值;qi為實測值;為預測平均值;為實測平均值。

考慮到模型運行的不穩(wěn)定性,3種輸入方案結合ANFIS分別運行10次,最終計算RMSE與CORR的平均值對徑流預測精度進行評價。

2.5 結果分析

基于輸入方案1~3,結合ANFIS模型對北汝河的徑流情況進行預測,精度評價情況見表1。由表1可知,ANFIS模型具有良好的泛化能力,即模型訓練期的評價指標RMSE與CORR優(yōu)于測試期的,且ANFIS模型適用于研究區(qū)的徑流預測,預測結果具有較高的可靠性。同時發(fā)現(xiàn),模型運行時間與模型輸入方案中變量數(shù)目有關,即輸入方案中變量數(shù)目越大,模型運行時間越長。應用不同輸入方案時,模型的運行時間從長到短的順序為:方案1(36個變量)>方案3(8個變量)>方案2(7個變量)。預測精度由高到低的順序為:方案2>方案3>方案1。

為了評價不同輸入方案對預測模型運行穩(wěn)定性的影響,采用箱線圖進行評價,圖中箱體越短表示預測模型運行的穩(wěn)定性越高。ANFIS模型基于3種不同輸入方案分別運行了10次,因此分別繪制了ANFIS模型基于不同輸入方案運行結果的箱線圖,如圖2所示。整體上來看,RMSE表現(xiàn)出來的穩(wěn)定性不及CORR。測試期,3種方案的穩(wěn)定性能大體一致;訓練期,由PCA法與KPCA法構建的方案2與方案3的運行穩(wěn)定性明顯優(yōu)于未進行任何改進的方案1的運行穩(wěn)定性。

為了直觀地比較ANFIS模型結合不同輸入方案所得預測結果的精度,圖3給出了基于不同輸入方案所得預測結果與實測值的對比。顯然,ANFIS模型結合方案2與方案3所得的預測結果較結合方案1所得的預測結果更加接近實測值。

以上結果說明:由PCA法與KPCA法重建的模型輸入方案不但能夠有效提高徑流預測精度,而且還有助于提高模型運行的穩(wěn)定性。與此同時,由于原始預測變量間存在較為顯著的線性相關關系,因此由PCA法重建的方案2的徑流預測精度又高于由KPCA法重建的方案3的。

3 結 論

以北汝河水文數(shù)據為研究基礎,基于PCA法與KPCA法重建了徑流預測模型輸入方案,結合預測模型ANFIS,分析了不同輸入方案對徑流預測精度產生的影響。結果表明:ANFIS模型適用于研究區(qū)的徑流預測工作,由成因分析法、PCA法及KPCA法組建的3種模型輸入方案均能得到較為滿意的徑流預測結果。其中,由PCA法與KPCA法組建的輸入方案的預測精度較成因分析法組建的輸入方案的預測精度有大幅度提高,模型運行時間也有了相應的縮短。與此同時,由于原始預測變量間存在較為顯著的線性相關性,因此PCA法較KPCA法更適合重建研究區(qū)的徑流預測因子。

參考文獻:

[1] 張金萍,李紅賓,肖宏林,等.基于誤差修正模型的黃河源區(qū)年徑流預測[J].人民黃河,2020,42(7):5-8.

[2] 王文,馬駿.若干水文預報方法綜述[J].水利水電科技進展,2005,25(1):56-60.

[3] 桑宇婷,趙雪花,祝雪萍,等.基于CEEMD-BP模型的汾河上游月徑流預測[J].人民黃河,2019,41(8):1-5.

[4] 王佳,王旭,王浩,等.基于EEMD與ANN混合方法的水庫月徑流預測[J].人民黃河,2019,41(5):47-50.

[5] 張瀟,夏自強,黃峰,等.基于SSA-ARIMA模型的青弋江干流徑流預測[J].中國農村水利水電,2015(3):6-9.

[6] 張敬平,黃強,趙雪花.經驗模態(tài)分解和RBF網絡在徑流預測中的應用[J].干旱區(qū)資源與環(huán)境,2014(6):118-123.

[7] WOLD S, ESBENSEN K, GELADI P. Principal Component Analysis[J].Chemometrics and Intelligent Laboratory Systems,1987,2(1-3):37-52.

[8] SCHOLKOPF B, SMOLA A, MULLER K R. Kernel Principal Component Analysis[C]//International Conference on Artificial Neural Networks. Heidelberg, Berlin: Springer, 1997:583-588.

[9] JANG J S R. ANFIS: Adaptive-Network-Based Fuzzy Inference System[J].IEEE Transactions on Systems, Man, and Cybernetics,1993,23(3):665-685.

【責任編輯 張 帥】

猜你喜歡
主成分分析法
山東省旅游產業(yè)競爭力評價研究
中國裝備制造業(yè)階段競爭力研究
陜西省各地區(qū)人力資本水平綜合評價與分析
基于主成分分析的煤層氣賦存影響因素分析
科技視界(2016年23期)2016-11-04 23:08:10
成都市中心城區(qū)商服用地基準地價空間演變規(guī)律研究
商(2016年29期)2016-10-29 13:39:08
基于企業(yè)核心競爭能力的家電行業(yè)上市公司績效評價指標體系研究
基于主成分分析法的高校財務風險評價指標體系構建
商(2016年27期)2016-10-17 04:41:37
太原市土地可持續(xù)利用研究
商(2016年26期)2016-08-10 14:11:18
基于主成分分析法的成都市房地產泡沫程度評價
商(2016年6期)2016-04-20 18:36:52
考察我國各省市自治區(qū)社會發(fā)展綜合狀況
商(2016年6期)2016-04-20 10:19:35
黄平县| 车致| 沈丘县| 潼南县| 聂拉木县| 隆安县| 永康市| 江北区| 罗江县| 股票| 阜宁县| 柯坪县| 远安县| 石河子市| 天峨县| 黔西县| 裕民县| 香港 | 大埔区| 合肥市| 汽车| 德江县| 许昌县| 芜湖市| 海原县| 晴隆县| 安徽省| 陇川县| 红安县| 石林| 梁山县| 原平市| 柘城县| 新龙县| 玉门市| 富平县| 宜川县| 涪陵区| 嵊州市| 开远市| 襄城县|