張 穎, 李 梅, 高 倩 倩, 施 佳
( 上海海事大學(xué) 信息工程學(xué)院, 上海 201306 )
?
過程建模與控制
基于ELMR-SVMR的海水水質(zhì)預(yù)警模型研究
張 穎*, 李 梅, 高 倩 倩, 施 佳
( 上海海事大學(xué) 信息工程學(xué)院, 上海 201306 )
海水水質(zhì)預(yù)警對海洋環(huán)境監(jiān)控和保護(hù)有著重要的意義.極限學(xué)習(xí)機(jī)回歸和支持向量機(jī)回歸(extreme learning machine regression-support vector machine regression,ELMR-SVMR)集成預(yù)警模型采用預(yù)測與評價(jià)相結(jié)合的方式,實(shí)現(xiàn)對未來海水富營養(yǎng)化狀況綜合預(yù)警的目的.其中SVMR方法用于構(gòu)建海水富營養(yǎng)化評價(jià)模型;ELMR用于對未來一段時(shí)間的水質(zhì)狀況進(jìn)行綜合預(yù)測,ELMR的預(yù)測結(jié)果作為評價(jià)模型的輸入變量.集成模型的可靠性直接影響預(yù)警的有效性,ELMR-SVMR的可靠性通過分析ELMR預(yù)測誤差對SVMR評價(jià)模型的靈敏度得到.將各參變量的預(yù)測誤差結(jié)果作為評價(jià)模型的靈敏度影響參量,通過靈敏度計(jì)算可獲得對ELMR-SVMR模型的靈敏度評價(jià).通過與其他方法的實(shí)驗(yàn)對比及分析,驗(yàn)證了該區(qū)域范圍內(nèi)所建ELMR-SVMR預(yù)警模型的有效性,為探索建立有效的海水水質(zhì)預(yù)警模型提供了一種新途徑.
集成預(yù)警模型;極限學(xué)習(xí)機(jī);支持向量機(jī);海水富營養(yǎng)化;靈敏度分析
2014年3月21日,國家海洋局發(fā)布的《2013年中國海洋環(huán)境狀況公報(bào)》顯示,我國近岸海域頻繁發(fā)生水污染、生態(tài)受損、赤潮等環(huán)境問題.研究發(fā)現(xiàn),正在進(jìn)行監(jiān)測的近岸河口及海灣等海洋生態(tài)系統(tǒng)多達(dá)81%受到了不同程度的污染.正如聯(lián)合國海洋污染科學(xué)問題專家組(GESAMP)在2001年報(bào)告中所指出的,“無論是從影響范圍還是破壞結(jié)果來看,海水富營養(yǎng)化無疑是目前人類影響海洋的最大環(huán)境問題”.水環(huán)境的監(jiān)測與治理是國際上研究的重點(diǎn)與難點(diǎn),實(shí)現(xiàn)水環(huán)境監(jiān)測的重點(diǎn)是水質(zhì)預(yù)測模型的建立.海水富營養(yǎng)化是海水中營養(yǎng)物質(zhì)過剩引起生態(tài)惡化的改變過程,是由多種因素引起的一系列反應(yīng).因此,海水富營養(yǎng)化綜合水質(zhì)預(yù)警模型的研究,對近岸海域赤潮災(zāi)害防治具有重要的科學(xué)價(jià)值和實(shí)際意義[1].
近海海水水質(zhì)富營養(yǎng)化趨勢預(yù)測預(yù)警其實(shí)質(zhì)是基于對影響水質(zhì)富營養(yǎng)化的主要環(huán)境理化因子的分析預(yù)測,通過水質(zhì)評價(jià)模型獲得對水質(zhì)評價(jià)等級的預(yù)測,進(jìn)而起到對水質(zhì)富營養(yǎng)化變化預(yù)警的目的.針對海洋環(huán)境進(jìn)行評價(jià)研究的基于數(shù)據(jù)驅(qū)動(dòng)的方法主要有人工神經(jīng)網(wǎng)絡(luò)方法、模糊綜合評判法、機(jī)器學(xué)習(xí)法等.支持向量機(jī)(SVM)方法近來被較多地應(yīng)用于環(huán)境理化因子的軟測量及評價(jià)[2-3].支持向量機(jī)是通過核函數(shù)來處理數(shù)據(jù)的,具有很強(qiáng)的非線性數(shù)據(jù)處理能力;同時(shí)它引入軟邊緣,具有很好的泛化能力.因此支持向量機(jī)方法可用于構(gòu)建基于數(shù)據(jù)驅(qū)動(dòng)的海水富營養(yǎng)化評價(jià)模型.極限學(xué)習(xí)機(jī)(ELM)方法近來受到廣泛的關(guān)注,緣于其模型結(jié)構(gòu)簡單、訓(xùn)練速度快、泛化性能較好,且具有較好的實(shí)時(shí)性,適合用來對未來一段時(shí)間的水質(zhì)狀況進(jìn)行實(shí)時(shí)綜合預(yù)測.選取極限學(xué)習(xí)機(jī)的預(yù)測結(jié)果作為評價(jià)模型的輸入變量,通過模型集成實(shí)現(xiàn)海水富營養(yǎng)化綜合預(yù)警的目的.
影響海水富營養(yǎng)化評價(jià)模型預(yù)警結(jié)果的因素主要來自于預(yù)測誤差的不確定性[4].海水富營養(yǎng)化預(yù)警模型的影響因素不僅眾多,而且用來表征這一狀況的實(shí)驗(yàn)數(shù)據(jù)也相對較少,另外,集成模型誤差累積情況對預(yù)警的影響程度也不確定.對集成模型靈敏程度進(jìn)行分析的主要目的在于獲得該模型預(yù)測誤差結(jié)果對預(yù)警結(jié)果的影響程度大小,來為集成預(yù)警模型的可靠性提供科學(xué)依據(jù).參數(shù)靈敏度分析已在大氣科學(xué)、經(jīng)濟(jì)學(xué)和生態(tài)學(xué)等領(lǐng)域得到了廣泛的應(yīng)用[5].其在該類模型中的作用不斷增強(qiáng),并且已成為模型行為分析和參數(shù)優(yōu)化的重要方法和分析生態(tài)系統(tǒng)對環(huán)境影響的重要手段之一[6];分析方法也從比較單一的局部靈敏度分析進(jìn)而發(fā)展到全局靈敏度分析等多種方法[7].本文以海水富營養(yǎng)化集成預(yù)警模型為研究對象,對集成模型中預(yù)測誤差對預(yù)警結(jié)果的影響進(jìn)行參數(shù)靈敏度分析,為集成模型的驗(yàn)證及后續(xù)研究奠定基礎(chǔ).
1.1 極限學(xué)習(xí)機(jī)回歸(ELMR)
極限學(xué)習(xí)機(jī)方法是建立在單隱含層前饋神經(jīng)網(wǎng)絡(luò)SLFN上的一種較為重要的算法,較強(qiáng)的逼近能力是前饋神經(jīng)網(wǎng)絡(luò)的優(yōu)良特性,但是它的輸入權(quán)值和隱含層神經(jīng)元閾值的設(shè)置并不容易;除此之外,它的學(xué)習(xí)方法在處理非線性數(shù)據(jù)時(shí)會(huì)使得收斂速度變慢,進(jìn)而影響模型的訓(xùn)練.極限學(xué)習(xí)機(jī)的優(yōu)勢在于通過隱含層的激活函數(shù)為無限可微函數(shù)來隨機(jī)選擇和調(diào)整節(jié)點(diǎn)的參數(shù),進(jìn)而將SLFN從非線性系統(tǒng)變?yōu)榫€性系統(tǒng),使得傳統(tǒng)神經(jīng)網(wǎng)絡(luò)訓(xùn)練時(shí)間較長和參數(shù)難以確定等問題得到很好的解決.
本算法中采用極限學(xué)習(xí)機(jī)回歸是為了找到預(yù)測曲線的擬合誤差最小函數(shù),也即找到自變量x和因變量y的函數(shù)關(guān)系式.
設(shè)有n個(gè)變量m組樣本,輸入層第i個(gè)變量與隱含層各節(jié)點(diǎn)間的連接權(quán)值wi=(wi1wi2…wim)T;設(shè)隱含層神經(jīng)元的閾值b=(b1b2…ba)T,隱含層節(jié)點(diǎn)與輸出變量的連接權(quán)值βk=(β1β2…βa)T,隱含層神經(jīng)元節(jié)點(diǎn)的激活函數(shù)為g(x).則具有a個(gè)隱含層節(jié)點(diǎn)的ELMR模型的決策函數(shù)可以用下式表示:
(1)
此式還可以表示為Hβ=T′.H為隱含層的輸出矩陣,具體形式如下式所示:
H(w1…wab1…bax1…xn)=
(2)
Huang等提出的SLFN定理表明了ELMR模型中的輸入權(quán)重w和隱含層神經(jīng)元的閾值b可以為任意值,其相應(yīng)的數(shù)學(xué)分析如下所示:
假設(shè)將隨機(jī)輸入變量輸入權(quán)重w和隱含層節(jié)點(diǎn)閾值b用向量e表示,H是e的函數(shù).輸入變量為n維的子空間,對應(yīng)向量e屬于n-1維的子空間,且存在向量β與這個(gè)子空間正交,如下式所示:
(β,(e(bi)-e(c)))=0
(3)
其中wk·xi≠wk·xi′,c=wk·xi,由式(3)展開,可得出下式:
?β1·g(bi+c1)+β2·g(bi+c2)+…+
βn·g(bi+cn)-y=0
γp=βp/βn,p=1,2,…,n-1
(4)
當(dāng)g(x)無限可微時(shí),對上式方程求一階導(dǎo)數(shù),如下式所示:
l=1,2,…,n,n+1,…
(5)
式(4)共有n-1個(gè)系數(shù):γ1,γ2,…,γn-1,式(5)因激勵(lì)函數(shù)無限可微可以派生出更多方程.因此,向量e不屬于任意一個(gè)小于n-1維的向量空間,也就是說H滿秩且存在唯一解.這也證明了H是存在且唯一的,它與w和b的取值都無關(guān),從而求得Moore-Penrose廣義逆H?,得到預(yù)測模型的決策函數(shù).
當(dāng)激活函數(shù)g(x)無限可微時(shí),ELMR的參數(shù)(輸入連接權(quán)值和隱含層節(jié)點(diǎn)閾值)可以隨機(jī)選擇,無須全部調(diào)整,在訓(xùn)練過程中雖然不會(huì)改變大小,但是需要在訓(xùn)練之前先設(shè)置好隱含層節(jié)點(diǎn)個(gè)數(shù)和激活函數(shù).H?為H的廣義逆矩陣.通過解線性方程組的最小二乘解就可以得出隱含層節(jié)點(diǎn)與輸出節(jié)點(diǎn)的連接權(quán)值β,β的值是唯一的,因此具有比較好的泛化性能,并且誤差降低到最?。?/p>
(6)
其中ELMR模型需要考慮的是隱含層參數(shù)的確定問題,由上述極限學(xué)習(xí)機(jī)原理的分析可知,當(dāng)模型的隱含層神經(jīng)元個(gè)數(shù)K小于樣本個(gè)數(shù)時(shí),對于任意的輸入權(quán)值和閾值,依然存在一個(gè)K值,使得訓(xùn)練誤差無限逼近于一個(gè)任意大于零的ε.因此,當(dāng)樣本數(shù)過多時(shí),選取少于樣本數(shù)的隱含層神經(jīng)元個(gè)數(shù)即可.又因?yàn)殡[含層神經(jīng)元節(jié)點(diǎn)個(gè)數(shù)對預(yù)測結(jié)果的影響并不靈敏,因此可以推斷,具有相同復(fù)雜度和樣本個(gè)數(shù)的數(shù)據(jù)所需設(shè)置的隱含層個(gè)數(shù)基本相同.所以,可以通過800組數(shù)據(jù)進(jìn)行樣本訓(xùn)練來提前確定隱含層的個(gè)數(shù).
1.2 支持向量機(jī)回歸(SVMR)
SVMR算法的主要思想是通過采用適當(dāng)?shù)暮撕瘮?shù),把低維空間的非線性樣本數(shù)據(jù)映射到高維空間,實(shí)現(xiàn)非線性數(shù)據(jù)的線性輸出[8-9].另外,SVMR算法在學(xué)習(xí)過程中主要采用折中考慮的方法(結(jié)構(gòu)風(fēng)險(xiǎn)最小化原理),縮小置信區(qū)間(結(jié)構(gòu)復(fù)雜度造成的風(fēng)險(xiǎn))和降低樣本的經(jīng)驗(yàn)風(fēng)險(xiǎn)(訓(xùn)練誤差).SVMR算法通過學(xué)習(xí)過程來找到一個(gè)函數(shù)f(x)的值可以近似為y(x),也就是對獨(dú)立同分布的數(shù)據(jù)進(jìn)行處理以達(dá)到線性回歸的目的.ε表示可接受的誤差值,即lε=|y(x)-f(x)|ε=max(0,|y(x)-f(x)|ε-ε).
上述優(yōu)化問題可以最終歸為解下面二次規(guī)劃問題:
s.t.yi-〈w,Φ(xi)〉-b≤ε+ξi
(7)
式中:〈w,Ф(xi)〉表示輸入權(quán)重與核函數(shù)的向量積,k(x,xi)=Ф(x)·Ф(xi),常數(shù)C(C>0)為懲罰因子,用來平衡經(jīng)驗(yàn)風(fēng)險(xiǎn)和置信范圍的比例.目標(biāo)函數(shù)如下式所示:
(8)
(9)
(10)
其中采用的核函數(shù)為徑向基函數(shù)(RBF).如式(11)所示,xi為核中心,σ主要用于控制函數(shù)的徑向作用范圍,即函數(shù)的寬度參數(shù).
(11)
懲罰系數(shù)C和核參數(shù)σ是SVMR(核函數(shù)為RBF)的兩個(gè)最為重要的參數(shù)[10-11].其中,懲罰系數(shù)C為對錯(cuò)誤分類的懲罰指數(shù)(C>0),C不宜過大或過小,太大會(huì)導(dǎo)致回歸準(zhǔn)確率在訓(xùn)練過程中很高而在測試過程中很低,太小則回歸準(zhǔn)確率不可靠,模型無效;核參數(shù)σ(σ>0)對特征空間的分割結(jié)果有較大的影響,對回歸結(jié)果也很重要,核參數(shù)的值同樣不宜過大或過小,太大會(huì)導(dǎo)致過擬合,太小會(huì)導(dǎo)致欠擬合.
SVMR模型采用混沌布谷鳥算法對SVM的懲罰系數(shù)C和核參數(shù)σ進(jìn)行尋優(yōu),提高預(yù)警性能.優(yōu)化初期先利用混沌動(dòng)力學(xué)進(jìn)行全局遍歷性“粗搜索”,然后退出混沌進(jìn)入下一階段“細(xì)搜索”優(yōu)化,這樣能夠有效地避免陷入局部極小點(diǎn).
2.1 海水富營養(yǎng)化的定義
海洋富營養(yǎng)化是指“海水中的營養(yǎng)物質(zhì)過度增加,并導(dǎo)致生態(tài)系統(tǒng)有機(jī)質(zhì)增多、低氧形成、藻華爆發(fā)等一些異常改變的過程”.現(xiàn)代富營養(yǎng)化模型[12]的關(guān)鍵理化因子主要以營養(yǎng)鹽負(fù)荷信號為主,綜合考慮浮游植物生物量等直接響應(yīng)和營養(yǎng)鹽循環(huán)、食物網(wǎng)絡(luò)結(jié)構(gòu)等間接響應(yīng),進(jìn)一步發(fā)展了早期富營養(yǎng)化概念模型,能夠更好地反映海水富營養(yǎng)化的特點(diǎn).現(xiàn)代時(shí)空富營養(yǎng)化概念模型如圖1所示.
圖1 現(xiàn)代時(shí)空富營養(yǎng)化概念模型
雖然導(dǎo)致沿海海洋富營養(yǎng)化過程的因素是復(fù)雜的,但是,是否需要將所有的因素都進(jìn)行評估是值得探究的問題.根據(jù)海水富營養(yǎng)化的定義,考慮以下兩方面:(1)選取合適的海洋環(huán)境監(jiān)測參數(shù),參數(shù)應(yīng)具有以下特點(diǎn):易于監(jiān)測,且保存有長期監(jiān)測數(shù)據(jù);能夠進(jìn)行空間規(guī)模的富營養(yǎng)化描述;被大量研究證實(shí)能夠有效建立預(yù)測模型的參量.(2)以生物群落結(jié)構(gòu)信息量化富營養(yǎng)化的變化趨勢.這種方法有助于理解具有物種多樣性的生態(tài)系統(tǒng)功能及相關(guān)的影響參量.
2.2 樣本的來源及選取
(12)
貢獻(xiàn)率的大小與包含原始主成分信息的多少成正比.通常情況下,取累計(jì)貢獻(xiàn)率達(dá)85%以上的λ1,λ2,…,λk所對應(yīng)的前k(k≤m)個(gè)主成分作為主要的影響因子.主成分篩選結(jié)果如表1所示.
表1 主成分分析表
從表1分析看出,排前6的主成分的累計(jì)貢獻(xiàn)率達(dá)到84.571%,基本上可以保留原來11個(gè)變量所表征的信息,提取這6個(gè)主成分作為系統(tǒng)主要的輸入變量.
如圖2所示,計(jì)算出各個(gè)影響因子在前6個(gè)主成分中所對應(yīng)的權(quán)重值,計(jì)算公式為Fj=ej1x1+ej2x2+…+ejmxm.
圖2 各影響因子在前6個(gè)主成分中所占的權(quán)重
結(jié)合表1和圖2可得水體富營養(yǎng)化影響因子的前6個(gè)主成分,從圖2中可以看出溫度、渾濁度、酸堿度、溶解氧、硝酸鹽濃度、葉綠素-a濃度、光照強(qiáng)度(深、淺)為主要變量,但光照強(qiáng)度與其他變量均有關(guān)聯(lián),為了避免變量冗余,不將光照強(qiáng)度納入評價(jià)參量中.
2.3 綜合水質(zhì)評價(jià)標(biāo)準(zhǔn)
近海水域富營養(yǎng)化評價(jià)等級劃分如表2所示.表中各參數(shù)評價(jià)標(biāo)準(zhǔn)的確定主要參考了國家海水水質(zhì)標(biāo)準(zhǔn)(GB 3097—1997)、海水水域富營養(yǎng)化各指標(biāo)評價(jià)閾值以及中國近海海域水化學(xué)要素質(zhì)量評價(jià)指數(shù)[13].
表2 近海水域富營養(yǎng)化評價(jià)等級劃分
通過前面的分析可以看出海水富營養(yǎng)化的影響因子眾多,模型輸入數(shù)據(jù)的隨機(jī)誤差及模型本身受到各種干擾等引起的輸出誤差的不確定性等都可能造成集成模型評價(jià)結(jié)果的不確定性,并可能使得預(yù)警結(jié)果失效.驗(yàn)證模型的可靠性是模型分析的必要環(huán)節(jié),靈敏度的大小反映了所建模型的風(fēng)險(xiǎn)程度,是模型可靠性的一種衡量標(biāo)準(zhǔn),通過分析預(yù)測誤差對集成模型的靈敏度,可實(shí)現(xiàn)對預(yù)警模型的可靠性驗(yàn)證.
某個(gè)因素的變化會(huì)對一些關(guān)鍵指標(biāo)產(chǎn)生不同的影響,敏感性分析就是對這類不確定性的影響程度進(jìn)行定量分析的技術(shù)[14].敏感系數(shù)度量是敏感性分析的一種重要方法,主要通過相關(guān)變量的改變對關(guān)鍵指標(biāo)的影響程度進(jìn)行分析,得出關(guān)鍵指標(biāo)受這些因素變化影響的規(guī)律.敏感系數(shù)=關(guān)鍵指標(biāo)浮動(dòng)百分比/相關(guān)變量浮動(dòng)百分比.敏感系數(shù)越大,表明該因素對關(guān)鍵指標(biāo)的影響越大,即對輸出結(jié)果的影響越大;反之,敏感系數(shù)越小,則該因素對關(guān)鍵指標(biāo)或輸出結(jié)果的影響就越?。?/p>
參數(shù)靈敏度是通過分析擾動(dòng)輸入變量并利用統(tǒng)計(jì)學(xué)方法定量或定性地評估預(yù)測誤差對仿真結(jié)果的影響,靈敏度=狀態(tài)變量變化百分比/誤差變化百分比.狀態(tài)變量(y)對第j個(gè)變量誤差值(xj)的靈敏度如下式所示:
(13)
式中:Δy表示相應(yīng)狀態(tài)變量的變化量,Δxj表示第j個(gè)變量的誤差值變化量.本文的靈敏度等級劃分標(biāo)準(zhǔn)為|S|≤0.1:該參數(shù)不靈敏;0.1<|S|≤0.5:該參數(shù)較靈敏;0.5<|S|≤1:該參數(shù)靈敏;1<|S|:該參數(shù)非常靈敏.該模型的靈敏度分析表征了預(yù)警模型的風(fēng)險(xiǎn)程度,誤差靈敏度越大,說明此誤差對模型的影響程度越大,即模型的風(fēng)險(xiǎn)性較大.
根據(jù)式(13)中介紹的靈敏度等級計(jì)算方法可得到ELMR-SVMR模型的水質(zhì)等級預(yù)測的靈敏度為 0.1,處于對輸出誤差不確定性的不太靈敏狀態(tài),說明該模型的預(yù)測誤差對集成模型的靈敏度處于不太靈敏狀態(tài),預(yù)警模型可靠性具有一定保證,說明該集成預(yù)警模型具有適用性.
基于ELMR-SVMR集成模型的海水富營養(yǎng)化綜合預(yù)警建模分為兩部分.首先,根據(jù)評價(jià)標(biāo)準(zhǔn)建立SVMR綜合水質(zhì)評價(jià)標(biāo)準(zhǔn)模型;其次,將ELMR的單因子預(yù)測結(jié)果作為標(biāo)準(zhǔn)模型的輸入變量進(jìn)行綜合水質(zhì)預(yù)警.關(guān)鍵環(huán)節(jié)的結(jié)果分析如下所述.
4.1 海水富營養(yǎng)化預(yù)測與評價(jià)結(jié)果的比較
根據(jù)等級判定標(biāo)準(zhǔn)和樣本各指標(biāo)值,采用等間隔均勻分布方式,內(nèi)插水質(zhì)指標(biāo)標(biāo)準(zhǔn)數(shù)據(jù),生成訓(xùn)練樣本,經(jīng)過網(wǎng)絡(luò)反復(fù)訓(xùn)練,得出海水富營養(yǎng)化評價(jià)標(biāo)準(zhǔn)模型[15].建模說明如下:
(1)訓(xùn)練樣本生成.本文內(nèi)插水質(zhì)指標(biāo)共生成350組數(shù)據(jù),每組數(shù)據(jù)有6個(gè)輸入指標(biāo)(溫度、渾濁度、酸堿度、溶解氧、硝酸鹽濃度、葉綠素-a濃度),輸出為綜合水質(zhì)指標(biāo).選取前300組數(shù)據(jù)樣本作為訓(xùn)練集.
(2)參數(shù)優(yōu)化.對SVMR參數(shù)進(jìn)行初始化,設(shè)定C、σ的初始解空間均為(0,10),設(shè)定鳥窩的個(gè)數(shù)為20,即將解空間(0,10)分成符合高斯分布的20個(gè)區(qū)域,為后續(xù)的尋優(yōu)做準(zhǔn)備.尋優(yōu)過程中,最大迭代次數(shù)設(shè)為50,淘汰率設(shè)為0.25.
(3)對800組數(shù)據(jù)在不同隱含層神經(jīng)元個(gè)數(shù)的情況下進(jìn)行樣本訓(xùn)練,通過比較來確定極限學(xué)習(xí)機(jī)隱含層的個(gè)數(shù),訓(xùn)練結(jié)果如圖3所示.
圖3 隱含層神經(jīng)元個(gè)數(shù)對ELMR性能的影響
圖3顯示,在ELMR模型的隱含層神經(jīng)元個(gè)數(shù)取120~140時(shí),誤差變化曲線趨于平坦,趨近于0.故ELMR模型的隱含層神經(jīng)元節(jié)點(diǎn)設(shè)置為140個(gè).
(4)海水富營養(yǎng)化的綜合水質(zhì)評價(jià).選取800組采集樣本中的300組數(shù)據(jù)作為已建好的綜合水質(zhì)評價(jià)模型的輸入樣本,通過模型評價(jià),得到采集區(qū)域的海水富營養(yǎng)化的綜合水質(zhì)等級.
BP神經(jīng)網(wǎng)絡(luò)及T-S模糊神經(jīng)網(wǎng)絡(luò)也常被用來構(gòu)建綜合水質(zhì)等級評價(jià)模型,ELMR-SVMR與這兩種模型針對綜合水質(zhì)等級評價(jià)的對比結(jié)果如表3所示.
表3 綜合水質(zhì)等級評價(jià)結(jié)果對比
從表3中容易看出,3種模型都擁有一定的泛化能力和預(yù)測精度,表明所建的模型是有效的.通過3種模型的數(shù)據(jù)對比可以發(fā)現(xiàn),T-S模糊神經(jīng)網(wǎng)絡(luò)模型和ELMR-SVMR模型在各種指標(biāo)上都要比BP神經(jīng)網(wǎng)絡(luò)模型好很多.另外,T-S模糊神經(jīng)網(wǎng)絡(luò)模型的各項(xiàng)誤差指標(biāo)值都比ELMR-SVMR模型大,說明ELMR-SVMR模型在預(yù)測精度和泛化能力方面均比T-S模糊神經(jīng)網(wǎng)絡(luò)模型要好.
為了驗(yàn)證ELMR-SVMR模型在水質(zhì)等級預(yù)測方面的性能,在相同的實(shí)驗(yàn)條件下,分別對具有較好評價(jià)效果的T-S模糊神經(jīng)網(wǎng)絡(luò)模型、ELMR-SVMR模型進(jìn)行海水等級預(yù)測結(jié)果對比,仿真結(jié)果分別如圖4和5所示.
圖4 T-S模糊神經(jīng)網(wǎng)絡(luò)訓(xùn)練與預(yù)測效果
圖5 ELMR-SVMR訓(xùn)練與預(yù)測效果
從圖4、5的水質(zhì)等級預(yù)測及誤差曲線可以看出,ELMR-SVMR評價(jià)模型的總體預(yù)測誤差要略小于T-S模糊神經(jīng)網(wǎng)絡(luò)模型,尤其是第27個(gè)樣本之后,其誤差波動(dòng)比T-S模糊神經(jīng)網(wǎng)絡(luò)模型要小,說明ELMR-SVMR模型的海水等級預(yù)測的綜合性能優(yōu)于T-S模糊神經(jīng)網(wǎng)絡(luò)模型.
4.2 ELMR-SVMR綜合水質(zhì)預(yù)警結(jié)果及分析
針對杭州灣東部某近海海域2009年第4季度的部分水質(zhì)因子監(jiān)測數(shù)據(jù),基于ELMR-SVMR集成模型的海水水質(zhì)綜合預(yù)警仿真結(jié)果如圖6所示.
圖6 ELMR-SVMR綜合水質(zhì)預(yù)警結(jié)果
根據(jù)2009年中國環(huán)境狀況公報(bào),東海近岸海域?yàn)橹卸任廴荆伤|(zhì)評價(jià)結(jié)果可以看出,基于支持向量機(jī)評價(jià)模型的綜合水質(zhì)評價(jià)結(jié)果中,綜合水質(zhì)等級整體呈動(dòng)態(tài)變化狀態(tài),數(shù)據(jù)變化較為齊整,能夠較好地表現(xiàn)綜合水質(zhì)的動(dòng)態(tài)變化趨勢;從水質(zhì)等級上分析,水質(zhì)處于由良好向中度污染過渡的狀態(tài)趨勢,基本與2009年中國環(huán)境狀況公報(bào)顯示的結(jié)果一致.
在本文中,通過一段時(shí)期內(nèi)從杭州灣某監(jiān)測海域獲得的800組歷史數(shù)據(jù)的分析及基于數(shù)據(jù)驅(qū)動(dòng)的學(xué)習(xí)建模,獲得一種具有水質(zhì)預(yù)測及評價(jià)功能的集成預(yù)警模型.在集成模型中,支持向量機(jī)回歸用于構(gòu)建海水水質(zhì)評價(jià)模型,極限學(xué)習(xí)機(jī)回歸用來對未來一段時(shí)間的水質(zhì)狀況進(jìn)行綜合預(yù)測,極限學(xué)習(xí)機(jī)回歸的預(yù)測結(jié)果被作為評價(jià)模型的輸入變量,最終實(shí)現(xiàn)海水富營養(yǎng)化綜合預(yù)警的目的.通過對集成模型靈敏程度的分析,可獲得該模型預(yù)測誤差結(jié)果對預(yù)警結(jié)果的影響程度,為集成預(yù)警模型的可靠性提供依據(jù).該模型能夠?qū)υ搮^(qū)域內(nèi)的海水水質(zhì)狀況做出基本正確的預(yù)測及評價(jià),在趨勢預(yù)測上具有一定的準(zhǔn)確性,在該區(qū)域具有一定的適用性.應(yīng)該看到,不同地理環(huán)境下的海域特征還是具有一定差異性的,在起主要影響的海水理化因子的選擇上會(huì)有所不同,一種環(huán)境下建立起來的模型不可能適應(yīng)所有的地理環(huán)境.但是,該類模型的創(chuàng)建機(jī)理還是值得借鑒的,其針對這類問題的模型構(gòu)造方法具有一定的適用性.
本文首先對海水富營養(yǎng)化的時(shí)空概念模型進(jìn)行分析,揭示了海水富營養(yǎng)化的成因及其演化過程,并從描述性分析和統(tǒng)計(jì)學(xué)分析這兩方面對導(dǎo)致海水富營養(yǎng)化的多種因素進(jìn)行篩選,選取出影響海水富營養(yǎng)化的主要因素,以準(zhǔn)確地反映海水富營養(yǎng)化的整體狀況.針對海水環(huán)境中各水質(zhì)理化因子狀態(tài)變化的非線性和不確定性等特性,采用SVMR方法建立綜合水質(zhì)評價(jià)模型,通過布谷鳥算法對SVMR參數(shù)進(jìn)行尋優(yōu).將極限學(xué)習(xí)機(jī)預(yù)測結(jié)果作為該評價(jià)模型的輸入變量進(jìn)行海水富營養(yǎng)化的綜合水質(zhì)預(yù)警評價(jià).通過與其他方法的對比分析,驗(yàn)證了ELMR-SVMR集成模型的有效性.
[1] 俞志明,沈志良. 長江口水域富營養(yǎng)化[M]. 北京:科學(xué)出版社, 2011.
YU Zhi-ming, SHEN Zhi-liang. Eutrophication in Changjiang Estuary and Its Adjacent Waters [M]. Beijing:Science Press, 2011. (in Chinese)
[2] LIU Zai-wen, WANG Xiao-yi, CUI Li-fen,etal. Research on water bloom prediction based on least squares support vector machine [C] // 2009 WRI World Congress on Computer Science and Information Engineering, CSIE 2009. Piscataway:IEEE Computer Society, 2009:764-768.
[3] Wu Q. Hybrid wavelet v-support vector machine and chaotic particle swarm optimization for regression estimation [J]. Expert Systems with Applications, 2011, 38(12):14624-14632.
[4] CHEN Fa-fa, TANG Bao-ping, SONG Tao,etal. Multi-fault diagnosis study on roller bearing based on multi-kernel support vector machine with chaotic particle swarm optimization [J]. Measurement:Journal of the International Measurement Confederation, 2014, 47(1):576-590.
[5] Pinto U, Maheshwari B, Shrestha S,etal. Modelling eutrophication and microbial risks in peri-urban river systems using discriminant function analysis [J]. Water Research, 2012, 46(19):6476-6488.
[6] 李新艷,楊麗標(biāo),晏維金. 長江輸出溶解態(tài)無機(jī)磷的通量模型靈敏度分析及情景預(yù)測[J]. 湖泊科學(xué), 2011, 23(2):163-173.
LI Xin-yan, YANG Li-biao, YAN Wei-jin. Scenario prediction and sensitivity of modeling dissolved inorganic phosphorus export from the Yangtze River [J]. Journal of Lake Science, 2011, 23(2):163-173. (in Chinese)
[7] Eccles S R, Subbe C, Hancock D,etal. CREWS:Improving specificity whilst maintaining sensitivity of the national early warning score in patients with chronic hypoxaemia [J]. Resuscitation, 2014, 85(1):109-111.
[8] Rivas-Perea P, Cota-Ruiz J. An algorithm for training a large scale support vector machine for regression based on linear programming and decomposition methods [J]. Pattern Recognition Letters, 2013, 34(4):439-451.
[9] Patil S G, Mandal S, Hegde A V. Genetic algorithm based support vector machine regression in predicting wave transmission of horizontally interlaced multi-layer moored floating pipe breakwater [J]. Advances in Engineering Software, 2012, 45(1):203-212.
[10] Wu Q, Law R, Wu E,etal. A hybrid-forecasting model reducing Gaussian noise based on the Gaussian support vector regression machine and chaotic particle swarm optimization [J]. Information Sciences, 2013, 238:96-110.
[11] Ju Fuh-yuh, Hong Wei-chiang. Application of seasonal SVR with chaotic gravitational search algorithm in electricity forecasting [J]. Applied Mathematical Modelling, 2013, 37(23):9643-9651.
[12] Lovato T, Ciavatta S, Brigolin D,etal. Modelling dissolved oxygen and benthic algae dynamics in a coastal ecosystem by exploiting real-time monitoring data [J]. Estuarine, Coastal and Shelf Science, 2013, 119:17-30.
[13] 暨衛(wèi)東. 中國近海海洋環(huán)境質(zhì)量現(xiàn)狀與背景值研究[M]. 北京:海洋出版社, 2011.
JI Wei-dong. China Offshore Marine Environment Quality Present Situation and the Background Research [M]. Beijing:China Ocean Press, 2011. (in Chinese)
[14] Niero M, Pizzol M, Bruun H G,etal. Comparative life cycle assessment of wastewater treatment in Denmark including sensitivity and uncertainty analysis [J]. Journal of Cleaner Production, 2014, 68:25-35.
[15] SHEN Ping-ping, LI Gang, HUANG Liang-min,etal. Spatiotemporal variability of phytoplankton assemblages in the pearl river estuary with special reference to the influence of turbidity and temperature [J]. Continental Shelf Research, 2011, 31:1672-1681.
Research on forewarning model of seawater quality based on ELMR-SVMR
ZHANG Ying*, LI Mei, GAO Qian-qian, SHI Jia
( College of Information Engineering, Shanghai Maritime University, Shanghai 201306, China )
Forewarning of seawater quality has important significance for monitoring and protecting of marine environment. ELMR-SVMR (extreme learning machine regression-support vector machine regression) integrated model takes the ways of combining the prediction and evaluation to achieve the purpose of comprehensive forewarning for the state of seawater eutrophication. Therein SVMR method is used to establish the evaluation model, ELMR method is used to comprehensively predict the seawater quality state for a future time, and the result of the prediction by ELMR is used as the input variable of the evaluation model. The reliability of integrated model directly affects the effectiveness of the forewarning. The reliability of ELMR-SVMR model can be obtained by analyzing the sensitivity regarding the prediction error of ELMR to the evaluation model of SVMR. The prediction errors of all the parameters can be selected as the influence parameters of sensitivity of the evaluation model. The sensitivity evaluation of ELMR-SVMR model can be achieved by the sensitivity calculation. Compared with other methods by experiment and analysis, the effectiveness of the forewarning model of ELMR-SVMR is validated in this scope of sea area. It provides a pathway to establish the forewarning model of seawater quality effectively.
integrated forewarning model; extreme learning machine; support vector machine; seawater eutrophication; sensitivity analysis
1000-8608(2016)02-0185-08
2015-10-28;
2016-01-10.
國家自然科學(xué)基金資助項(xiàng)目(61273068); 上海市科學(xué)技術(shù)委員會(huì)國際學(xué)術(shù)交流合作資助項(xiàng)目(15220721800); 上海市教育委員會(huì)科研創(chuàng)新資助項(xiàng)目(13YZ084).
張 穎*(1968-),男,博士,副教授,E-mail:yingzhang@shmtu.edu.cn.
TP391
A
10.7511/dllgxb201602012