鄭 震
(福州市環(huán)境科學(xué)研究院,福州 350000)
【研究意義】富營(yíng)養(yǎng)化是指水體中氮、磷等植物生長(zhǎng)所必要的元素大量增加,使得水體生態(tài)系統(tǒng)生產(chǎn)力(光合作用效率)增加的現(xiàn)象[1]。自然狀態(tài)下,湖泊等水體的水生態(tài)系統(tǒng)處于相對(duì)平衡的狀態(tài),富營(yíng)養(yǎng)化進(jìn)程往往需要百年甚至更久。相反,受到人類(lèi)活動(dòng)影響的湖庫(kù)等水體,存在大量外源性營(yíng)養(yǎng)鹽(N、P等)的輸入及人為影響水體流域下墊面及水體本身水動(dòng)力特性的現(xiàn)象,從而加速了湖庫(kù)富營(yíng)養(yǎng)化轉(zhuǎn)變的進(jìn)程[2]。湖庫(kù)作為重要的淡水資源,承擔(dān)著生活用水、工業(yè)需水、農(nóng)業(yè)灌溉用水、水產(chǎn)養(yǎng)殖用水等很多重要的水體功能[3-4],其富營(yíng)養(yǎng)化問(wèn)題引起藻類(lèi)大量繁殖,大量消耗水體溶解氧,經(jīng)常造成區(qū)域水體“死區(qū)”,引起水體發(fā)臭,破壞固有的生態(tài)系統(tǒng)。因此,如何科學(xué)評(píng)估及防治湖庫(kù)富營(yíng)養(yǎng)化問(wèn)題尤為重要?!狙芯窟M(jìn)展】國(guó)內(nèi)外學(xué)者對(duì)湖庫(kù)富營(yíng)養(yǎng)化水平評(píng)估、營(yíng)養(yǎng)鹽影響機(jī)制、時(shí)空分布、水生態(tài)系統(tǒng)N、P、C 等元素循環(huán)、富營(yíng)養(yǎng)化數(shù)值模型等方面做了大量研究工作[5],其中,將湖庫(kù)富營(yíng)養(yǎng)化水平的合理評(píng)估作為治理的基礎(chǔ)尤為重要。1977 年,卡爾森[6]首先提出以透明度為參考基準(zhǔn)的富營(yíng)養(yǎng)化指數(shù)(TSI)用以評(píng)估水體富營(yíng)養(yǎng)化狀態(tài),隨后,不同學(xué)者在此基礎(chǔ)上提出了不同類(lèi)型的評(píng)估體系,如修正的卡爾森指數(shù)法、評(píng)分法、生物指標(biāo)法及綜合營(yíng)養(yǎng)指數(shù)法等[7]?!厩腥朦c(diǎn)】雖然評(píng)估方法多,但大都是一種確定性評(píng)估指標(biāo)體系,如營(yíng)養(yǎng)指數(shù)法,其本質(zhì)是以透明度或葉綠素為基準(zhǔn)評(píng)價(jià)因子,其他評(píng)價(jià)因子則通過(guò)與基準(zhǔn)評(píng)價(jià)因子間尋求線(xiàn)性關(guān)系構(gòu)建的確定性數(shù)理方程。這些方法雖然可以簡(jiǎn)單快速計(jì)算出富營(yíng)養(yǎng)化相關(guān)指標(biāo)的評(píng)估值,但每個(gè)湖庫(kù)有其自身的富營(yíng)養(yǎng)機(jī)制特性,且評(píng)估的富營(yíng)養(yǎng)相關(guān)評(píng)價(jià)因子之間在實(shí)際分析中不一定會(huì)存在相關(guān)性[8]。故單純定義某個(gè)確定性評(píng)估數(shù)值去判斷水體富營(yíng)養(yǎng)化狀態(tài)難免會(huì)出現(xiàn)“誤判”,確定性指標(biāo)計(jì)算出的貧營(yíng)養(yǎng)狀態(tài)下也有可能會(huì)引發(fā)水華現(xiàn)象。【擬解決的關(guān)鍵問(wèn)題】故提出將水體富營(yíng)養(yǎng)化視為一個(gè)多參數(shù)輸入、以葉綠素質(zhì)量濃度作為表征水體富營(yíng)養(yǎng)化輸出的概念模型。采取處理復(fù)雜系統(tǒng)的BP 神經(jīng)網(wǎng)絡(luò)進(jìn)行構(gòu)建富營(yíng)養(yǎng)模型,利用基于貝葉斯理論的“GLUE”方法,通過(guò)其模型參數(shù)的不確定性分析得出模型參數(shù)的富營(yíng)養(yǎng)化范圍及不同參數(shù)的富營(yíng)養(yǎng)化敏感性。從而為湖庫(kù)富營(yíng)養(yǎng)化管理給出不同富營(yíng)養(yǎng)化相關(guān)水質(zhì)指標(biāo)的調(diào)控范圍,有利于對(duì)湖庫(kù)富營(yíng)養(yǎng)化進(jìn)行監(jiān)控預(yù)警、分類(lèi)防治。
山仔水庫(kù)位于敖江中游,下墊面為山地丘陵,經(jīng)緯度坐標(biāo)為26°17'51″N、119°21'35″E,水庫(kù)控制流域面積1 646 km2,調(diào)節(jié)庫(kù)容1.064 億m3,多年平均來(lái)水量18.59 億m3,多年平均氣溫為19 ℃。庫(kù)區(qū)形態(tài)為入庫(kù)河流狹長(zhǎng)中間寬深的不規(guī)則水庫(kù),多年平均水深約30 m,流速分布差別較大,庫(kù)區(qū)狹長(zhǎng)水道流速較快,庫(kù)區(qū)中心較慢。流域內(nèi)污染源包括居民生活污染源、農(nóng)業(yè)種植及零散畜禽養(yǎng)殖等。庫(kù)區(qū)藻類(lèi)分布以藍(lán)藻為主,自2000 年起,山仔庫(kù)區(qū)部分區(qū)域出現(xiàn)“水華”現(xiàn)象[9]。
福州市環(huán)境監(jiān)測(cè)中心站于2011 年6 月—2015 年12 月在山仔水庫(kù)庫(kù)區(qū)均勻布設(shè)5 個(gè)監(jiān)測(cè)點(diǎn)(皇帝洞、七里進(jìn)口、庫(kù)心、日溪進(jìn)口、壩下;圖1)監(jiān)測(cè)庫(kù)區(qū)水質(zhì),頻率為每月上下旬各1 次。
圖1 研究區(qū)概況 Fig.1 Study area
對(duì)數(shù)據(jù)整理后得到190 組監(jiān)測(cè)數(shù)據(jù)開(kāi)展后續(xù)研究,水質(zhì)指標(biāo)包括水溫(T)、pH、溶解氧(DO)、透明度(SD)、高錳酸鹽指數(shù)(CODMn)、總氮(TN)、總磷(TP)、葉綠素a(Chl-a)。
1.3.1 BP 神經(jīng)網(wǎng)絡(luò)
BP 神經(jīng)網(wǎng)絡(luò)是基于生物神經(jīng)元傳遞信息的原理,將信息傳遞過(guò)程劃分為輸入層、隱含層及輸出層3 部分[10]。通過(guò)輸入一定數(shù)量樣本的訓(xùn)練組,對(duì)訓(xùn)練結(jié)果與實(shí)際輸出值直接的總體誤差函數(shù)反向?qū)訉忧髮?dǎo),逐步逼近總體誤差最小值,在給定的訓(xùn)練次數(shù)下,最終得出符合誤差訓(xùn)練閾值的特定神經(jīng)網(wǎng)絡(luò)。
BP 神經(jīng)網(wǎng)絡(luò)基于生物神經(jīng)傳播,機(jī)理較為清晰,但關(guān)于隱含層層數(shù)及隱含層節(jié)點(diǎn)個(gè)數(shù)準(zhǔn)確確定上仍存在較大爭(zhēng)議。太少的隱含層節(jié)點(diǎn)數(shù)不足以區(qū)分較為復(fù)雜的輸入—輸出結(jié)構(gòu),而太多節(jié)點(diǎn)數(shù)則容易造成“過(guò)擬合”現(xiàn)象,訓(xùn)練集表現(xiàn)很好,而驗(yàn)證集則表現(xiàn)很差。目前較為認(rèn)可的方法是根據(jù)經(jīng)驗(yàn)公式n1=√n+m+a(n1為隱含層節(jié)點(diǎn)數(shù);n為輸入層節(jié)點(diǎn)數(shù);m為輸出層節(jié)點(diǎn)數(shù);a為1~10 的整數(shù))得到的范圍進(jìn)行試算,以得到最佳節(jié)點(diǎn)數(shù)[11]。本文構(gòu)建的BP 神經(jīng)網(wǎng)絡(luò)富營(yíng)養(yǎng)化模型中8 個(gè)水質(zhì)參數(shù)作為輸入層,葉綠素濃度作為1 個(gè)輸出層。根據(jù)經(jīng)驗(yàn)公式,隱含層的節(jié)點(diǎn)范圍區(qū)間為[4,13],利用“窮舉法”得出區(qū)間內(nèi)最優(yōu)訓(xùn)練方案的節(jié)點(diǎn)數(shù),得出最優(yōu)模型。
1.3.2 GLUE 方法
作為Bayes 統(tǒng)計(jì)推理的一種方法,GLUE 方法的特點(diǎn)是放寬了似然函數(shù)的統(tǒng)計(jì)學(xué)條件[12]。其認(rèn)為某個(gè)模型結(jié)果是基于模型本身多個(gè)參數(shù)的共同驅(qū)動(dòng),而不是單個(gè)參數(shù)?;舅悸窞椋捍_定似然函數(shù)并設(shè)定似然閾值,得到有效參數(shù)值,然后對(duì)參數(shù)進(jìn)行數(shù)據(jù)統(tǒng)計(jì)分析,似然函數(shù)的確定主要依據(jù)2 個(gè)原則:①具備判別模型的好壞程度的能力。②單調(diào)遞增函數(shù)(即似然值越大,表示模型越能表達(dá)模擬效果)[13]。本文將水體富營(yíng)養(yǎng)化考慮為多參數(shù)(水溫、pH、溶解氧、透明度、總氮、總磷、當(dāng)前葉綠素a 質(zhì)量濃度等)的評(píng)估未來(lái)葉綠素質(zhì)量濃度變化的預(yù)測(cè)模型。假設(shè)以水體富營(yíng)養(yǎng)化程度爆發(fā)水華風(fēng)險(xiǎn)的可能性作為評(píng)價(jià)模型好壞的標(biāo)準(zhǔn)。選取BP 神經(jīng)網(wǎng)絡(luò)富營(yíng)養(yǎng)化模型中8 個(gè)水質(zhì)參數(shù),利用Matlab 均勻分布生成器,隨機(jī)生成10 000組8 維向量組,通過(guò)BP 神經(jīng)網(wǎng)絡(luò)模型做出預(yù)測(cè)。
葉綠素質(zhì)量濃度與富營(yíng)養(yǎng)化(水華風(fēng)險(xiǎn)性)程度有著極強(qiáng)的指示性。采用以葉綠素質(zhì)量濃度為基準(zhǔn)的卡爾森指數(shù)表達(dá)水體富營(yíng)養(yǎng)化程度具有較大的可靠性[14],故本文采用葉綠素卡爾森營(yíng)養(yǎng)指數(shù)(TSI)作為似然函數(shù)進(jìn)行評(píng)價(jià)。為遵從似然函數(shù)的2 個(gè)原則,對(duì)基于卡爾森營(yíng)養(yǎng)指數(shù)做進(jìn)一步標(biāo)準(zhǔn)化,使得得到的似然函數(shù)值處于[0,1]區(qū)間,越接近1,表示預(yù)測(cè)的葉綠素質(zhì)量濃度越高,爆發(fā)水華的風(fēng)險(xiǎn)可能性越大。計(jì)算似然函數(shù)見(jiàn)式(1)、式(2)。
式中:Chl-a 為葉綠素a 質(zhì)量濃度(μg/L);TSI為葉綠素卡爾森綜合指數(shù);Tindex為標(biāo)準(zhǔn)化似然數(shù),范圍為[0,1];TSImin為卡爾森營(yíng)養(yǎng)指數(shù)評(píng)估指數(shù)下限值(基于待評(píng)估湖庫(kù)專(zhuān)家經(jīng)驗(yàn)的人為指定值,小于此值表示產(chǎn)生水華風(fēng)險(xiǎn)性);TSImax為卡爾森營(yíng)養(yǎng)指數(shù)評(píng)估指數(shù)上限值(基于待評(píng)估湖庫(kù)專(zhuān)家經(jīng)驗(yàn)的人為指定值,大于此值表示產(chǎn)生水華風(fēng)險(xiǎn)性)。
本文基于庫(kù)區(qū)多年監(jiān)測(cè)評(píng)估,參考中國(guó)環(huán)境科學(xué)研究院霍守亮[15]提出的山區(qū)湖庫(kù)分級(jí)標(biāo)準(zhǔn),?、艏?jí)中度富營(yíng)養(yǎng)中葉綠素質(zhì)量濃度均值112 μg/L,定義為庫(kù)區(qū)水華風(fēng)險(xiǎn)富營(yíng)養(yǎng)模型上限值,即似然值為1,認(rèn)為必然爆發(fā)水華。?、蠹?jí)輕度富營(yíng)養(yǎng)中葉綠素質(zhì)量濃度均值18 μg/L 作為發(fā)生水華風(fēng)險(xiǎn)的下限值,即似然值為0,認(rèn)為葉綠素高于此質(zhì)量濃度時(shí),開(kāi)始具有水華爆發(fā)的風(fēng)險(xiǎn)。
本文基于GLUE 方法的具體研究步驟為[16]:①均勻取樣10 000 組參數(shù)組,通過(guò)BP 神經(jīng)網(wǎng)絡(luò)計(jì)算葉綠素質(zhì)量濃度為基準(zhǔn)的卡爾森指數(shù)。一般數(shù)學(xué)模型不確定性的分析研究中,由于參數(shù)的未知性,其先驗(yàn)分布多假設(shè)為某一合理分布區(qū)間內(nèi)的均勻分布。②篩選似然值大于0.3 的參數(shù)組(認(rèn)為0.3 以上即存在較大水華風(fēng)險(xiǎn))作為有效參數(shù)組進(jìn)行評(píng)估。③根據(jù)本文提出的標(biāo)準(zhǔn)化似然函數(shù)公式計(jì)算參數(shù)組的似然函數(shù)值。④將各參數(shù)似然函數(shù)值進(jìn)行歸一化,確??偤蜑?,得到各參數(shù)概率密度分布函數(shù)及累計(jì)概率分布函數(shù),并得出水華發(fā)生較高風(fēng)險(xiǎn)的參數(shù)評(píng)估置信區(qū)間(本文取90%置信水平)。
表1 葉綠素a 標(biāo)準(zhǔn)分級(jí) Table 1 Chlorophyll-a standard classification
表2 參數(shù)初始值范圍 Table 2 Parameter initial value range
通過(guò)Matlab 軟件中的BP 神經(jīng)網(wǎng)絡(luò)工具箱,輸入190 組實(shí)測(cè)數(shù)據(jù)集,以自動(dòng)訓(xùn)練生成net 模型,為了進(jìn)一步驗(yàn)證評(píng)估模型的適用性與穩(wěn)定性,隨機(jī)取3 組[100,90]數(shù)據(jù)集(100 組為驗(yàn)證集,90 組作為校核集),計(jì)算納什(NSE)系數(shù)及均方根誤差(RMSE)指標(biāo)對(duì)模型進(jìn)行評(píng)估,同時(shí)試算最優(yōu)隱含層節(jié)點(diǎn)數(shù)與隱含層數(shù),最終確定BP 模型構(gòu)型為8-8-5-1(輸入層為8;隱含層2 層,分別8 個(gè)神經(jīng)元、5 個(gè)神經(jīng)元,輸出層為1),詳細(xì)結(jié)果見(jiàn)表2。由表2 可知,模型驗(yàn)證集NSE系數(shù)均值為0.66,RMSE為7.56;校核集均值為0.63,RMSE為7.09。NSE系數(shù)越接近1,表示模型模擬表現(xiàn)越好,一般水文水質(zhì)模型預(yù)測(cè)中,由于人類(lèi)本身對(duì)自然現(xiàn)象模擬認(rèn)知的模糊性及自然界水文水質(zhì)現(xiàn)象普遍存在“噪聲”干擾(如人為監(jiān)測(cè)數(shù)據(jù)的誤差、各種自然界中無(wú)法估計(jì)的偶發(fā)性等),很難得到一個(gè)很準(zhǔn)確的模擬,參考相關(guān)研究文獻(xiàn)[17],一般認(rèn)為0.5~0.65 之間即可認(rèn)為可以接受。RMSE精度需根據(jù)統(tǒng)計(jì)數(shù)據(jù)的量級(jí)進(jìn)行判斷是否合理,通過(guò)190 組數(shù)據(jù)集訓(xùn)練得到的BP 神經(jīng)網(wǎng)絡(luò)模型,模擬得到的葉綠素濃度在基本上在100 以?xún)?nèi),均方根誤差在10 以?xún)?nèi),即存在低于10%的誤差,在可接受范圍。故構(gòu)建模型適用性較好,可用來(lái)進(jìn)行數(shù)值實(shí)驗(yàn),分析各參數(shù)的不確定性。
表3 模型評(píng)估 Table 3 Model evaluation
根據(jù)本文給出的似然函數(shù)公式計(jì)算出參數(shù)組的似然值,篩選得出各個(gè)水質(zhì)參數(shù)大于0.3 的似然值,并繪制成相應(yīng)的散點(diǎn)圖,見(jiàn)圖2。點(diǎn)狀圖是參數(shù)值相對(duì)于似然值的散點(diǎn)圖。每個(gè)點(diǎn)代表使用許多隨機(jī)選擇不同的參數(shù)值的蒙特卡羅實(shí)驗(yàn)?zāi)P偷? 次運(yùn)行??梢钥闯霾煌|(zhì)參數(shù)的不同區(qū)域分布特征,它們本質(zhì)上表示采樣點(diǎn)從擬合響應(yīng)面到單個(gè)參數(shù)維度上的投影,投影特征代表了每個(gè)水質(zhì)參數(shù)發(fā)生水華風(fēng)險(xiǎn)時(shí)候的偏好范圍。對(duì)于每個(gè)參數(shù),其較高風(fēng)險(xiǎn)(靠近頂部)或較低風(fēng)險(xiǎn)(靠近底部)的點(diǎn)的分布可以覆蓋到整個(gè)參數(shù)采樣范圍。同樣的,不同的參數(shù)存在不同的風(fēng)險(xiǎn)特征區(qū)間,例如pH 值、CODMn、TN、TP、Chl-a、SSD 的高、低風(fēng)險(xiǎn)特征在區(qū)間內(nèi)表現(xiàn)較為明顯;T、DO 的風(fēng)險(xiǎn)特征則不明顯。
pH 值、DO、CODMn、TN、TP、Chl-a 與水華風(fēng)險(xiǎn)有著較為明顯的正相關(guān)趨勢(shì),SSD 則存在負(fù)相關(guān)趨勢(shì),T集合風(fēng)險(xiǎn)分布較為均勻。符合實(shí)際情景下,葉綠素質(zhì)量濃度越高、透明度越低,藻類(lèi)越多;營(yíng)養(yǎng)鹽、氮、磷作為供給藻類(lèi)生長(zhǎng)的“食物”,可促進(jìn)藻類(lèi)生長(zhǎng),提高發(fā)生水華的風(fēng)險(xiǎn)。對(duì)仔水庫(kù)的研究表明,TP為其限制性營(yíng)養(yǎng)鹽,TN 為非限制性營(yíng)養(yǎng)鹽[18],此次TP 散點(diǎn)圖并未能很好地反映非限制性營(yíng)養(yǎng)鹽的區(qū)間特征,即TN 對(duì)藻類(lèi)的影響在一定的范圍內(nèi),超過(guò)影響范圍后,TN 對(duì)藻類(lèi)的影響不會(huì)發(fā)生太大變化??赡苡捎诳偟≈祬^(qū)間(右)值太小,并未覆蓋到影響失效的范圍或BP 模型比較依賴(lài)訓(xùn)練集,對(duì)超出訓(xùn)練集范圍的參數(shù)集合,不能很好地反映。
一個(gè)模型給出的風(fēng)險(xiǎn)好壞并不僅由單個(gè)參數(shù)決定,而是整個(gè)參數(shù)集合參數(shù)之間相互作用的結(jié)果[19]。點(diǎn)狀圖作為響應(yīng)曲面的投影,不能完整地反映反映曲面形狀的復(fù)雜參數(shù)相互作用的結(jié)構(gòu)。某種意義上,本研究主要關(guān)心風(fēng)險(xiǎn)高的參數(shù)集合是什么,故對(duì)篩選后的有效參數(shù)組分別計(jì)算其概率密度函數(shù)及累計(jì)函數(shù),得出不同水質(zhì)指標(biāo)參數(shù)90%置信區(qū)間,具體結(jié)果參見(jiàn)表3。即當(dāng)水質(zhì)參數(shù)落在此分布區(qū)間內(nèi),即存在較高的水華風(fēng)險(xiǎn),需要管理部門(mén)警覺(jué)。
圖2 參數(shù)似然值散點(diǎn)圖 Fig.2 The prior distribution histogram and probability cumulative curve of test parameters
表4 模型評(píng)估區(qū)間 Table 4 Model evaluation interval
由于水文、水質(zhì)模擬存在較大的復(fù)雜性、模糊性及隨機(jī)性,模擬精度尚需進(jìn)一步提升,如比較常用水質(zhì)模型上AnnAGNPS、SWAT、HSPF 等[20],而B(niǎo)P神經(jīng)網(wǎng)絡(luò)模型在預(yù)測(cè)精度上也并沒(méi)有較為明顯的改善,故在評(píng)估水華風(fēng)險(xiǎn)上仍需要展望未來(lái)水文、水質(zhì)模型的研究中提出更好的模型架構(gòu)與數(shù)值方法,以期預(yù)測(cè)精度可以有明顯提升,進(jìn)而進(jìn)一步提升水華風(fēng)險(xiǎn)評(píng)估精度。另一方面,采樣方法上本文采取的簡(jiǎn)單均勻取樣操作簡(jiǎn)單,但必須依靠大量樣本,才能保證高維分布取樣的有效性[21]。目前MCMC、超拉丁取樣方法在估計(jì)多參數(shù)的后驗(yàn)分布方面優(yōu)勢(shì)較為明顯,即與GLUE 方法相比,其利用比較小的樣本集合即可得到模型參數(shù)的后驗(yàn)分布過(guò)程[22]。此外,人為判斷的水華風(fēng)險(xiǎn)的“有效似然值”判斷標(biāo)準(zhǔn)并不統(tǒng)一,依賴(lài)不同地區(qū)不同人的經(jīng)驗(yàn)判斷,帶有一定的主觀(guān)性[23],故未來(lái)需要進(jìn)一步嘗試與探索。
1)在給定足夠多樣本訓(xùn)練下,可基于多參數(shù)響應(yīng)機(jī)制和BP 神經(jīng)網(wǎng)絡(luò)建立水庫(kù)藻類(lèi)及其他類(lèi)似復(fù)雜機(jī)制系統(tǒng)的模擬。
2)評(píng)估得到發(fā)生水華風(fēng)險(xiǎn)的模型參數(shù)90%置信區(qū)間,可作為庫(kù)區(qū)水華風(fēng)險(xiǎn)管理的預(yù)警控制區(qū)。