国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

MGF模型和SVM回歸法在甘河加格達(dá)奇站年最大流量長期預(yù)報中的應(yīng)用

2020-06-19 09:59劉文斌于成剛
水資源開發(fā)與管理 2020年5期
關(guān)鍵詞:極值合格率流量

劉文斌 于成剛

(1.黑龍江省水文水資源中心,黑龍江 哈爾濱 150001;2.大興安嶺水文水資源中心,黑龍江 加格達(dá)奇 165000)

分析預(yù)測年最大流量的主要意義在于定量描述預(yù)測年份的洪水量級,為防洪決策提供支撐,但年最大流量的變化受江河前期底水,預(yù)見期內(nèi)降水、蒸發(fā)、氣溫,水利工程、人類活動等諸多因素影響,具有很大不確定性。常用的時間系列分析技術(shù)和預(yù)測方法(如:多元線性回歸),對系列數(shù)據(jù)的極值和趨勢預(yù)測,不能體現(xiàn)年最大流量因受大氣環(huán)流變化而具有的與預(yù)報因子之間的非線性關(guān)系,存在精度不高的問題?,F(xiàn)有的時間序列預(yù)測模型中,自回歸(AR)、自回歸滑動(ARMA)和門限自回歸(TAR)模型在進(jìn)行多步預(yù)測時,預(yù)測值會趨于平均值,對極值的擬合效果欠佳。指數(shù)平滑模型和灰色模型等進(jìn)行多步預(yù)測時,表示的是一種指數(shù)增長,不適用于預(yù)測起伏變化大的年最大流量。

針對時間系列預(yù)測模型對于轉(zhuǎn)折性變化預(yù)測能力較差的問題,依據(jù)氣候時間序列蘊(yùn)涵不同時間尺度振蕩的特征,魏鳳英[1]拓展了數(shù)理統(tǒng)計(jì)中算術(shù)平均值的概念,定義了時間序列的均生函數(shù),提出了視均生函數(shù)為原序列生成的、體現(xiàn)各種長度周期性的基函數(shù)的新構(gòu)思。均生函數(shù)預(yù)測模型既可以作多步預(yù)測,又可較好地預(yù)測極值,為長期預(yù)報和短期氣候預(yù)測開辟了一條新途徑[3]。采用均生函數(shù)作多步預(yù)測,可以改善其他時間序列模型的不足,改善對序列極值的擬合與預(yù)測效果。

支持向量機(jī)(Support Vector Machines,SVM)以統(tǒng)計(jì)理論為基礎(chǔ),能較好地解決小樣本、非線性、高維數(shù)和局部極小點(diǎn)等問題,是一種新穎有效的處理非線性分類和回歸的方法。本文即以均生函數(shù)構(gòu)成的周期性函數(shù),結(jié)合支持向量機(jī)方法建立了甘河的加格達(dá)奇站年最大流量預(yù)測模型,有機(jī)地結(jié)合兩種方法的優(yōu)點(diǎn),克服了傳統(tǒng)時間系列預(yù)測方法對極值模擬精度較低和長期預(yù)測中存在的趨勢性預(yù)測的問題。在加格達(dá)奇站年最大流量預(yù)測的應(yīng)用結(jié)果顯示,本文建立的模型預(yù)測結(jié)果既實(shí)現(xiàn)了數(shù)量和趨勢同步預(yù)測,也實(shí)現(xiàn)了該年最大流量系列非線性變化的預(yù)測,大大提高了預(yù)報精度。

1 研究資料和方法

1.1 資料

甘河發(fā)源于大興安嶺東坡伊勒呼里阿侖山脈的南支英吉奇山,由西北流向東南,匯入嫩江干流,全長446km,流域面積19549km2,流域內(nèi)森林覆蓋率高,沒有過多人為活動影響,下墊面條件變化不大。加格達(dá)奇水文站為甘河中游控制站,多年平均降水量531mm,年際變化大,年內(nèi)分布主要集中在6—9月,該站洪水為典型山溪性洪水,暴漲暴落,漲水期間水位、流量變化劇烈。

本文所用的資料為加格達(dá)奇站1952—2019年共68年的年內(nèi)最大流量序列資料。

1.2 均生函數(shù)模型

均生函數(shù)(Mean Generating Function,MGF)是時間序列均值生成函數(shù)的簡稱,是由時間序列按不同時間間隔計(jì)算均值,生成的一組周期函數(shù)[7],將此函數(shù)進(jìn)行周期性延拓,即在定義域上延拓到整個數(shù)軸,可構(gòu)造出均生函數(shù)延拓矩陣。魏鳳英[1]將均生函數(shù)的概念推廣到回歸分析中,給出相應(yīng)的建模方案,使回歸模型的擬合效果更為理想。

利用加格達(dá)奇站年最大流量系列構(gòu)造最大流量周期性均生函數(shù),采用CSC[1]雙向評分準(zhǔn)則,選擇最優(yōu)因子,利用SVM的K-CV統(tǒng)計(jì)分析方法學(xué)習(xí)訓(xùn)練樣本,通過逐漸改變參數(shù)的取值,獲取最佳的參數(shù)組合,而后建立回歸模型進(jìn)行擬合。計(jì)算1952—2001年的擬合值。根據(jù)模型對2002—2019年最大流量進(jìn)行預(yù)測,最后與2002—2019年實(shí)測資料進(jìn)行對比分析。

設(shè)時間序列為X(t)(t=1,2,…,n),構(gòu)造均生函數(shù):

(1)

(2)

(mod表示同余)

(3)

F=(fij)n×m,fij=fl(t)

(4)

(5)

fl(t)為均生函數(shù)延拓序列,是一種周期性基函數(shù)。均生函數(shù)延拓矩陣中第1列記為f1,第2列記為f2,……,第m列記為fm。從f1、f2、…、fm中挑選出m個與原始序列密切相關(guān)的序列作為預(yù)報因子,建立模型進(jìn)行模擬和預(yù)測。

1.3 支持向量機(jī)(SupportVector,SVM)回歸方法

支持向量機(jī)(SupportVector,SVM)是一種基于統(tǒng)計(jì)理論的算法,屬于有監(jiān)督的學(xué)習(xí)方法,已知訓(xùn)練點(diǎn)的類別,可學(xué)習(xí)求得訓(xùn)練點(diǎn)和類別之間的對應(yīng)關(guān)系,以便將訓(xùn)練集按照類別分開,或者預(yù)測新的訓(xùn)練點(diǎn)所對應(yīng)的類別。

用線性回歸函數(shù)f(x)=ωx+b擬合數(shù)據(jù){xi,yi},(i=1,2,…,n,xi∈Rd),yi∈R的問題,根據(jù)SVM理論,若采用線性ε不敏感損失函數(shù)

(6)

(7)

下,最小化目標(biāo)函數(shù)

(8)

常數(shù)c>0控制對超出誤差ε的樣本的懲罰程度。采用優(yōu)化方法可以得到其對偶問題,即在約束條件

(9)

(10)

從而得回歸模型

(11)

(12)

式(5)、(6)中的b*,取在邊界上的一點(diǎn),即可確定。有關(guān)非線性核函數(shù)的種類較多,常用的有多項(xiàng)式核函數(shù)、徑向基核函數(shù)、柯西核函數(shù)等多種形式。本文采用徑向基核函數(shù)

K(x,xj)=exp(-(γ‖x-xi‖2),λ>0)(13)

1.4 年最大流量延拓均生函數(shù)

選取通過置信度0.01~0.05檢驗(yàn)的函數(shù)因子作為預(yù)報因子。所選取的周期性基函數(shù)因子為5個。這5個周期性基函數(shù)分別為5年、11年、16年、18年、19年的函數(shù),其中11年、18年的基函數(shù)因子通過了0.01的檢驗(yàn)。這樣有效避免函數(shù)因子之間的復(fù)相關(guān),確保各個因子間的獨(dú)立性。

2 周期檢驗(yàn)和突變檢驗(yàn)

2.1 周期檢驗(yàn)

周期性檢驗(yàn)采用小波分析法,該方法最早提出于20世紀(jì)80年代初,具有時-頻多分辨功能,能清晰地揭示出隱藏在時間序列中的多種變化周期。本文計(jì)算所用年最大流量系列包含“多時間尺度”變化特征且這種變化是連續(xù)的,所以選用連續(xù)復(fù)小波變換來分析該流量序列的多時間尺度特征,結(jié)果見圖1,結(jié)果顯示該系列存在11年、34年左右明顯的周期。

因此,加格達(dá)奇站流量隨時間出現(xiàn)周期性變化,具有一定起伏性,適合用MGF和SVM來解決極值預(yù)報的問題。

2.2 突變檢驗(yàn)

流量系列的突變檢驗(yàn),采用滑動t檢驗(yàn)(MMT)的方法。兩子系列長度n1=n2=11。給定顯著性水平a=0.01,t分布自由度ν=n1+n2-2=20,t0.01=±2.85,為了提高更嚴(yán)格的顯著水平,給定t0.01=±3.20。將計(jì)算出的t統(tǒng)計(jì)量序列和t0.01=±3.20繪成圖2。圖2顯示,流量系列自1952年以來,t統(tǒng)計(jì)量有一處超過0.01顯著水平,且為正值,說明年最大流量在20世紀(jì)70年代經(jīng)歷了一次由大到小的突變。該次突變包含在過去的變化中,后期系列未出現(xiàn)突變,因此,可以依據(jù)率定的模型進(jìn)行多步預(yù)測。

3 年最大流量預(yù)測模型

3.1 SVM回歸預(yù)測模型的建立

為了避免挑選出的周期性基函數(shù)因子之間的量級差異,消除各個因子由于量綱和單位不同造成的影響,首先對每個預(yù)報因子進(jìn)行歸一化處理:

(14)

式中:xmax、xmin為原始數(shù)據(jù)x的最大值和最小值;ymax、ymin為映射范圍的參數(shù),在這里取值為2和1。

圖3 加格達(dá)奇站年最大流量歸一化后逐年數(shù)據(jù)曲線

建模時,將經(jīng)過處理的預(yù)測因子(優(yōu)選后的周期性基函數(shù))作為輸入,年最大實(shí)測洪峰流量作為輸出,取前50年(1952—2001年)為檢驗(yàn)樣本集,用于SVM進(jìn)行學(xué)習(xí)訓(xùn)練和驗(yàn)證,后18年(2002—2019年)為預(yù)測檢驗(yàn)樣本,歸一化后逐年數(shù)據(jù)曲線見圖3。選取線性ξ不敏感損失函數(shù),采用徑向基核函數(shù)進(jìn)行SVM建模,由于所選的參數(shù)值不同,函數(shù)形態(tài)會發(fā)生較大變化,進(jìn)而引起SVM模型的變化。因此,在建模中利用K-CV[8]統(tǒng)計(jì)分析方法學(xué)習(xí)訓(xùn)練樣本,通過逐漸改變參數(shù)的取值,以獲取最佳的參數(shù)組合,使建立的模型預(yù)測效果最好。經(jīng)過多次交叉驗(yàn)證學(xué)習(xí)和訓(xùn)練,最終建立用于年最大洪峰流量預(yù)報的SVM回歸模型,經(jīng)過計(jì)算其校正模型參數(shù)c為11.31,g為0.35,MSE為0.013。其參數(shù)計(jì)算結(jié)果見圖4、圖5。

3.2 SVM回歸模型預(yù)測效果分析

依據(jù)《水文情報預(yù)報規(guī)范》(GB/T 22482—2008)對中長期預(yù)報的精度評定的要求,流量數(shù)值預(yù)報誤差精度采用多年變幅的10%,而趨勢(定性)評分采用合格和不合格[4]。

SVM模型模擬和檢驗(yàn)結(jié)果顯示:模擬和檢驗(yàn)效果較好,精度較高,50個模擬數(shù)據(jù)符合誤差要求的共42個,合格率達(dá)84.0%;46個數(shù)據(jù)趨勢模擬正確,合格率達(dá)到92.0%。18個檢驗(yàn)數(shù)據(jù)符合誤差要求的共13個,合格率為72.2%;14個數(shù)據(jù)趨勢模擬正確,合格率達(dá)到77.8%。極值的模擬結(jié)果較好,模擬數(shù)據(jù)的極值數(shù)據(jù)均符合誤差要求,預(yù)測值和實(shí)際觀測值對比曲線見圖6。

圖6 加格達(dá)奇年最大流量SVM預(yù)測值和實(shí)際觀測值對比曲線

3.3 逐步回歸預(yù)測模型

為了比較SVM回歸與逐步回歸方法的預(yù)測能力,本文同樣利用上述19個周期性基函數(shù)作為預(yù)報因子,選取不同F(xiàn)值引入不同的預(yù)報因子,采用逐步回歸方法建立加格達(dá)奇站年最大流量預(yù)測模型。依據(jù)模型的預(yù)測誤差最小原則,數(shù)學(xué)方程為

+0.547x19-1889.905

(15)

對檢驗(yàn)樣本和預(yù)測樣本年最大流量數(shù)據(jù)進(jìn)行了預(yù)測模擬,其回歸結(jié)果和實(shí)際觀測值對比見圖7。

圖7 加格達(dá)奇站年最大洪峰流量多元逐步回歸預(yù)測值和實(shí)際觀測值對比曲線

3.4 逐步回歸模型預(yù)測效果分析

采用上述預(yù)報誤差精度進(jìn)行評定,模擬和檢驗(yàn)效果都不好,50個模擬數(shù)據(jù)符合誤差要求的共30個,合格率為60.0%;44個數(shù)據(jù)趨勢模擬正確,合格率達(dá)到88.0%。18個檢驗(yàn)數(shù)據(jù)符合誤差要求的共10個,合格率為55.6%;9個數(shù)據(jù)趨勢模擬正確,合格率為50.0%。極值的模擬結(jié)果也不好,從圖7可以看出有2個極值的模擬數(shù)據(jù)差距都很大。

3.5 兩種模型對比分析結(jié)果

根據(jù)兩種方法的模擬結(jié)果,逐步回歸模型的數(shù)值預(yù)測合格率為60.0%,SVM回歸方法構(gòu)建的模型合格率為84.0%,兩者相差達(dá)到24.0%。趨勢上逐步回歸模型合格率為88.0%,SVM方法構(gòu)建的回歸模型合格率達(dá)到92.0%,兩者相差4.0%,但是逐步回歸在2個極值的模擬上都出現(xiàn)了較大差距,而SVM方法構(gòu)建的回歸模型3個極值都模擬預(yù)測的很好。18年的檢驗(yàn)結(jié)果中,逐步回歸模型的數(shù)值預(yù)測合格率為55.6%,趨勢模擬合格率為50.0%,而SVM回歸方法構(gòu)建的模型合格率為72.2%;趨勢模擬合格率達(dá)到78.8%。

4 結(jié) 論

a.通過對加格達(dá)奇站年最大流量系列進(jìn)行小波分析和滑動t檢驗(yàn),發(fā)現(xiàn)數(shù)據(jù)系列存在11年、34年左右周期,而在20世紀(jì)70年代存在一個由高到低的突變,說明該系列存在著明顯的非線性變化。按常規(guī)長期預(yù)報方法需提取周期、濾波趨勢,以及構(gòu)建隨機(jī)過程的模型來進(jìn)行外延預(yù)報。但如前文所述,常規(guī)預(yù)報方法并不能較好處理非線性數(shù)據(jù)系列,對極值和趨勢變化的預(yù)測能力尚有改善空間。本文即采用均生函數(shù)(MGF)、支持向量機(jī)(SVM)相組合的方法來提高預(yù)測能力。分析預(yù)報結(jié)果顯示,無論是極值還是趨勢預(yù)報,合格率均較高。

b.采用均生函數(shù) (MGF)構(gòu)建時間序列的周期性基函數(shù),并對均生矩陣進(jìn)行周期外延得到延拓矩陣,有效地實(shí)現(xiàn)了對時間系列數(shù)據(jù)的重構(gòu),一定程度上避免了單數(shù)據(jù)系列對預(yù)報結(jié)果的負(fù)面影響;而因子選取上采用CSC雙評分準(zhǔn)則,提高了模型在數(shù)據(jù)趨勢預(yù)測上的能力,從而實(shí)現(xiàn)了數(shù)量和趨勢的雙預(yù)測。

c.運(yùn)用SVM方法中的K-CV統(tǒng)計(jì)分析方法學(xué)習(xí)訓(xùn)練樣本并優(yōu)化參數(shù)。經(jīng)過多次交叉驗(yàn)證學(xué)習(xí)和訓(xùn)練,最終計(jì)算其校正模型參數(shù)c為1,g為0.353,MSE為0.0081。交叉驗(yàn)證提高了SVM類別識別最優(yōu)參數(shù)集,間接提高了SVM回歸模型的精度。

d.通過均生函數(shù)(MGF)生成30個周期性基函數(shù),采用CSC雙評分準(zhǔn)則,篩選部分周期性基函數(shù)作為預(yù)測對象的影響因子,運(yùn)用SVM中的K-CV統(tǒng)計(jì)分析方法學(xué)習(xí)訓(xùn)練樣本、優(yōu)化參數(shù),最終建立年最大流量預(yù)測模型。模型預(yù)測結(jié)果顯示,無論模擬還是檢驗(yàn),本文所構(gòu)建的模型均表現(xiàn)出明顯優(yōu)勢,尤其在趨勢和極值的預(yù)測上克服了AR、ARMA等時間預(yù)測模型的極值均值化的問題。

e.對比采用均生函數(shù)(MGF)、多元逐步回歸相組合傳統(tǒng)預(yù)測方法,本文所構(gòu)建模型的預(yù)測結(jié)果無論是極值還是趨勢預(yù)測都遠(yuǎn)遠(yuǎn)優(yōu)于傳統(tǒng)預(yù)測方法,尤其在系列極值的預(yù)測能力上表現(xiàn)更為明顯。結(jié)果表明,新構(gòu)建模型在處理年最大流量非線性變化方面有一定程度的改善。

根據(jù)目前水文行業(yè)開展年最大流量預(yù)報的實(shí)際情況,傳統(tǒng)中長期預(yù)報方法存在細(xì)節(jié)處理不細(xì)致、預(yù)測精度有待提高等問題,尤其針對極端洪水或干旱年份,極值預(yù)報誤差較大。本文主要針對數(shù)據(jù)系列的非線性變化和存在極值問題,利用均生函數(shù)(MGF)并結(jié)合支持向量機(jī)(SVM)構(gòu)建年最大流量預(yù)測模型。通過在甘河加格達(dá)奇站的實(shí)際應(yīng)用并與逐步回歸預(yù)測方法對比,本文所構(gòu)建模型在模擬和檢驗(yàn)中的預(yù)報結(jié)果均呈現(xiàn)明顯優(yōu)勢,應(yīng)用于工作實(shí)際是可行的。從水文領(lǐng)域的應(yīng)用來看,該模型不僅提高了年最大流量非線性及極值預(yù)報能力,也實(shí)現(xiàn)了數(shù)量和趨勢雙預(yù)報,可更好應(yīng)用于中長期預(yù)報。

猜你喜歡
極值合格率流量
冰墩墩背后的流量密碼
極值(最值)中的分類討論
極值點(diǎn)帶你去“漂移”
2020年畜禽產(chǎn)品獸藥殘留抽檢樣品合格率99.49%
2020年農(nóng)產(chǎn)品質(zhì)量安全例行監(jiān)測合格率達(dá)97.8%
張曉明:流量決定勝負(fù)!三大流量高地裂變無限可能!
極值(最值)中的分類討論
尋找書業(yè)新流量
極值點(diǎn)偏移問題的解法
提高鋁電解電容器合格率的多元化工藝技術(shù)
黄龙县| 泸西县| 平舆县| 子长县| 勐海县| 中西区| 龙里县| 池州市| 抚远县| 开远市| 宁化县| 曲麻莱县| 竹山县| 金阳县| 娱乐| 金门县| 镇远县| 嘉义市| 天峻县| 孟连| 聂拉木县| 临江市| 黔南| 白银市| 阜新| 茶陵县| 云梦县| 九台市| 塔城市| 宽城| 九寨沟县| 壤塘县| 仙居县| 万山特区| 宿松县| 湘西| 宁津县| 门头沟区| 安新县| 涡阳县| 新乡县|