孫世舉 徐浩 吳艷蘭 吳鵬海 楊輝
摘要:葉綠素a是反映水生態(tài)環(huán)境污染狀況的重要指標(biāo),定量反演葉綠素a濃度有助于及時(shí)監(jiān)測(cè)水體營(yíng)養(yǎng)狀態(tài)變化,對(duì)富營(yíng)養(yǎng)化水體治理具有重要意義。以巢湖及南淝河支流下游為研究區(qū)域,利用Sentinel-2衛(wèi)星遙感數(shù)據(jù)源,構(gòu)建其葉綠素a濃度反演模型,探究葉綠素a濃度的時(shí)空變化規(guī)律。結(jié)果顯示,構(gòu)建的深度神經(jīng)網(wǎng)絡(luò)(DNN)模型反演精度較高(R2=0.96,MRE=31.62%,RMSE=24.4 μg/L)。通過(guò)分析減少訓(xùn)練樣本量對(duì)DNN模型精度的影響,發(fā)現(xiàn)訓(xùn)練樣本較少時(shí),模型仍具有較高的精度;根據(jù)其精度的敏感模型訓(xùn)練樣本個(gè)數(shù),將訓(xùn)練集按組等分,模型呈現(xiàn)較好的穩(wěn)定性并具有一定的適用性。分析表明,研究區(qū)葉綠素a濃度在時(shí)間上呈現(xiàn)夏秋季上升、春冬季下降的規(guī)律,在空間上呈現(xiàn)湖區(qū)西高東低、局部近岸區(qū)分布較高的特點(diǎn)。
關(guān)鍵詞:葉綠素a;衛(wèi)星遙感;濃度反演;巢湖;南淝河
中圖分類(lèi)號(hào):X835? ? ? ? 文獻(xiàn)標(biāo)志碼:A? ? ? ? 文章編號(hào):1674-3075(2023)04-0058-09
近年來(lái),淡水湖泊富營(yíng)養(yǎng)化造成的藻類(lèi)水華暴發(fā)問(wèn)題日趨嚴(yán)重(錢(qián)瑞等,2022)。葉綠素a作為湖泊藻類(lèi)中含量最多的色素,可直觀反映出湖泊營(yíng)養(yǎng)狀態(tài),是湖泊水質(zhì)監(jiān)測(cè)的重要指標(biāo)之一(高玉蓉等,2012)。水色遙感技術(shù)是通過(guò)分析遙感反射率與水色要素(如CODMn、Chl-a、Tss等)之間的關(guān)系,從而計(jì)算研究區(qū)域水色參數(shù)濃度(馬榮華等,2009)。就水體藻類(lèi)群落而言,其葉綠素a濃度會(huì)隨著季節(jié)與水環(huán)境等因素的變化呈現(xiàn)出較大差異,但目前葉綠素a濃度反演模型在不同季節(jié)及不同水環(huán)境的適用性仍有待探討(王波等,2022)。
在數(shù)據(jù)源方面,常規(guī)葉綠素a遙感反演數(shù)據(jù)源主要包括Landsat-5及Landsat-8系列衛(wèi)星(Yong et al,2018; Mamun et al,2021)、Sentinel系列衛(wèi)星(Jiang et al,2017)、高分一號(hào)系列衛(wèi)星(徐鵬飛等,2020)、環(huán)境一號(hào)系列衛(wèi)星(徐逸等,2019)、MODIS系列衛(wèi)星(馬榮華等,2009)、MERIS影像數(shù)據(jù)(Mishra et al,2011)、Hyperion影像數(shù)據(jù)(杜聰?shù)龋?009)、SeaWiFs系列衛(wèi)星(Hu et al,2011)及無(wú)人機(jī)高光譜影像數(shù)據(jù)(黃宇等,2020)。盡管上述數(shù)據(jù)源都可以針對(duì)區(qū)域葉綠素a濃度進(jìn)行反演,但其時(shí)間及空間分辨率存在較大差異。相比之下,Sentinel-2系列衛(wèi)星除擁有良好的空間分辨率外,還具有5日一次的重放周期,并且其在紅光范圍擁有3個(gè)波段數(shù)據(jù),是探究水體葉綠素a反演的理想數(shù)據(jù)源(王行行等,2020;Silveira et al,2020)。
在遙感反演方面,傳統(tǒng)經(jīng)驗(yàn)方法是通過(guò)建立遙感數(shù)據(jù)與地面監(jiān)測(cè)水質(zhì)參數(shù)值之間的統(tǒng)計(jì)關(guān)系外推水質(zhì)參數(shù),缺少生物光學(xué)理論依據(jù),對(duì)渾濁水體估算精度較差(安如等,2013;Zhang et al,2017)。半經(jīng)驗(yàn)方法是將已知的水質(zhì)參數(shù)光譜特征與統(tǒng)計(jì)模型相結(jié)合,選擇最佳波段或波段組合作為相關(guān)變量估算水質(zhì)參數(shù)值,而半分析方法主要以生物光學(xué)模型為基礎(chǔ),提高模型的反演能力(畢順等,2018)。機(jī)器學(xué)習(xí)算法的引入,為遙感水質(zhì)反演更深一步的研究提供了參考方向(Motoaki et al,2001;Naeini & Prindle,2018;David et al,2020)。但雨生等(2020)利用BP神經(jīng)網(wǎng)絡(luò)對(duì)平寨水庫(kù)葉綠素a濃度進(jìn)行了估算,其BP神經(jīng)網(wǎng)絡(luò)模型精度較高,但仍存在需添加采樣點(diǎn)個(gè)數(shù)及模型局限性的問(wèn)題;Jia等(2020)采用多種機(jī)器學(xué)習(xí)共同構(gòu)建研究區(qū)葉綠素a濃度反演模型,采用疊加回歸法,避免了單一模型的不足,證明了基于聚類(lèi)方法的可行性,但其預(yù)測(cè)數(shù)據(jù)與真實(shí)值存在一定差距,模型性能仍需進(jìn)一步提升。Cao等(2020)研究表明,基于高寬波段數(shù)據(jù)反演湖泊中葉綠素a濃度的機(jī)器學(xué)習(xí)方法,為進(jìn)一步提高模型反演能力提供了更高的參考價(jià)值。
巢湖是中國(guó)五大淡水湖之一,目前有關(guān)其葉綠素a濃度反演研究存在實(shí)地采樣數(shù)據(jù)時(shí)間單一、數(shù)據(jù)量較少、構(gòu)建模型精度不夠高、不具備較強(qiáng)普適性等問(wèn)題(荀尚培等,2011;陶慜等,2015;劉文雅等,2019;羅婕純一等,2021),故針對(duì)巢湖需要更多的跨季或跨年實(shí)測(cè)數(shù)據(jù)以及更加精準(zhǔn)、高效的算法模型對(duì)葉綠素a濃度進(jìn)行反演。本文以巢湖及南淝河支流下游段為研究區(qū)域,基于5次不同時(shí)期的遙感影像數(shù)據(jù)和地面準(zhǔn)同步實(shí)測(cè)葉綠素a濃度數(shù)據(jù),嘗試采用深度神經(jīng)網(wǎng)絡(luò)(DNN)學(xué)習(xí)算法,構(gòu)建葉綠素a濃度反演模型;通過(guò)減少訓(xùn)練樣本,探究其對(duì)模型精度的影響以及模型的穩(wěn)定性和適用性,得到適合其反演的最佳模型,以期為巢湖流域水環(huán)境營(yíng)養(yǎng)狀態(tài)的智能化動(dòng)態(tài)監(jiān)測(cè)提供科學(xué)依據(jù)。
1? ?材料與方法
1.1? ?研究區(qū)及數(shù)據(jù)
1.1.1? ?區(qū)域概況? ?巢湖流域位于安徽省中部,處于長(zhǎng)江和淮河兩大水系中間,屬于長(zhǎng)江下游左岸水系(圖1)。巢湖湖區(qū)(30.42°~31.72°N,117.28°~117.86°E)位于合肥市城區(qū)以南15 km。南淝河水系位于巢湖西端北部,流域面積1 700 km2,源頭位于肥西縣將軍嶺等丘陵地帶,長(zhǎng)70 km,其主要支流有店埠河、四里河等。
1.1.2? ?野外數(shù)據(jù)采集? ?野外采樣信息如表1所示。分別于2018年8月2號(hào)、2019年12月27號(hào)、2020年6月25號(hào)、2020年11月2號(hào)以及2020年11月13號(hào)分5次對(duì)研究區(qū)水體進(jìn)行采樣,共采集有效點(diǎn)138個(gè)(圖1),選擇天氣晴朗、湖面平靜時(shí)采樣,2018年7月31號(hào)及2020年6月25號(hào)兩景影像在巢湖西部有云層遮擋,其余天氣均無(wú)云。
采用分光光度法對(duì)水體葉綠素a濃度進(jìn)行測(cè)量(Pyo et al,2017)。將一定量樣品用濾膜過(guò)濾截留藻類(lèi),研磨破碎藻類(lèi)細(xì)胞,用丙酮溶液提取葉綠素,離心分離后分別用于750、664、647、630 nm波長(zhǎng)處測(cè)定提取液吸光度,根據(jù)以下公式計(jì)算水中葉綠素a濃度:
P1=11.85(A664-A750)-1.54(A647-A750)-0.08(A630-A750) ①
Chl-a = P1V1/V ②
式中:P1為試樣中葉綠素a濃度,A630、A647、A664、A750分別為試樣在630、647、664、750 nm波長(zhǎng)的吸光值度,Chl-a為樣品中葉綠素a濃度,V1為試樣定容體積,V為取樣體積。
1.1.3? ?遙感數(shù)據(jù)及預(yù)處理? ?針對(duì)采樣時(shí)間跨度較大及南淝河下游河道較窄問(wèn)題,選擇Sentinel-2系列衛(wèi)星作為本研究影像數(shù)據(jù),該衛(wèi)星遙感影像數(shù)據(jù)通過(guò)歐空局官網(wǎng)下載(https://scihub.copernicu.eu/),是多光譜成像衛(wèi)星,攜帶1枚多光譜成像儀(MSI),由同時(shí)運(yùn)作的2A和2B衛(wèi)星組成,使其重訪周期縮短至5 d,具有較高的時(shí)間分辨率。其多光譜成像儀覆蓋了13個(gè)譜段(443~2 190 nm),4個(gè)可見(jiàn)光譜段和1個(gè)近紅外譜段的空間分辨率達(dá)到了10 m,6個(gè)紅光邊緣譜段和短波紅外譜段的空間分辨率達(dá)到了20 m,同時(shí)滿足了高空間分辨率衛(wèi)星影像的需求(刁瑞翔等,2021)。本文所選取的Sentinel-2A衛(wèi)星遙感影像共24景,均保證天氣條件較好、云層覆蓋率小。將已下載的遙感影像使用SNAP軟件的鄰近像元法進(jìn)行重采樣至10 m,遙感影像的預(yù)處理通過(guò)ACOLITE軟件包進(jìn)行(http://odnature.naturalsciences.be/remsem/acolite/)。ACOLITE軟件包中嵌入了暗光譜擬合算法進(jìn)行大氣校正,并得出Rrs(水像元的遙感反射率)的算法(Li et al,2019)。為盡量消減鄰近效應(yīng)對(duì)本研究的影響,采用掩膜處理方法對(duì)離岸2個(gè)像元以內(nèi)的區(qū)域加以裁剪,但不參與后續(xù)反演建模(畢順等,2018)。
1.2? ?敏感波段分析
目前的水質(zhì)參數(shù)反演一般選擇Chl-a濃度敏感性較強(qiáng)的波段用于模型構(gòu)建(Dall'Olmo,2006)。本研究的敏感因子采用代表性的單波段和雙波段組合(孫昊和周林飛,2019;孫宏亮,2020),提取預(yù)處理之后影像各采樣點(diǎn)的波段信息并加以組合,與實(shí)測(cè)葉綠素a濃度進(jìn)行Pearson相關(guān)性分析,結(jié)果如圖2。
采用B8A/B4、B6/B4、B8/B4、B7/B2、B8A/B2以及B6/B2共計(jì)6個(gè)Pearson相關(guān)性系數(shù)高于0.85的波段組合,作為DNN模型及其他機(jī)器學(xué)習(xí)模型的輸入。
1.3? ?DNN網(wǎng)絡(luò)模型
神經(jīng)網(wǎng)絡(luò)是計(jì)算機(jī)科學(xué)領(lǐng)域中人工智能的一個(gè)分支。從生物學(xué)角度來(lái)說(shuō),人工神經(jīng)網(wǎng)絡(luò)(Artificial neural network,ANN)是模擬人類(lèi)大腦中神經(jīng)網(wǎng)絡(luò)的激活和信息傳遞模式,深度神經(jīng)網(wǎng)絡(luò)(Deepneural networks,DNN)是由ANN發(fā)展變化而來(lái)(Hinton & Salakhutdinov,2006)。本文以DNN為主體構(gòu)建深度學(xué)習(xí)網(wǎng)絡(luò)模型,將波段組合數(shù)據(jù)與實(shí)測(cè)數(shù)據(jù)合并后導(dǎo)入網(wǎng)絡(luò),最后輸出到樣本標(biāo)記空間,實(shí)現(xiàn)模型的最終分類(lèi);該網(wǎng)絡(luò)能分析波段數(shù)據(jù)與葉綠素a實(shí)測(cè)數(shù)據(jù)的特征關(guān)系,有效提升輸入數(shù)據(jù)的復(fù)雜度,提高模型非線性擬合能力,進(jìn)一步提升網(wǎng)絡(luò)性能。將結(jié)果與預(yù)測(cè)值進(jìn)行相對(duì)誤差分析,作為反演葉綠素a濃度精度的評(píng)價(jià)標(biāo)準(zhǔn)(逄淑娜等,2019)。
從總樣本中隨機(jī)選取80%的采樣點(diǎn)(110個(gè))作為訓(xùn)練,剩余20%的采樣點(diǎn)(28個(gè))作為測(cè)試,提取出采樣點(diǎn)的光譜反射率,采用相關(guān)性系數(shù)高于0.85的6種波段組合,結(jié)合實(shí)測(cè)水質(zhì)數(shù)據(jù)作為模型的訓(xùn)練樣本。由于網(wǎng)絡(luò)層數(shù)過(guò)少不能很好地捕捉數(shù)據(jù)特征,因此本文通過(guò)增加隱藏層數(shù)來(lái)容納更多的神經(jīng)元,通過(guò)對(duì)每一層的輸出增加一個(gè)激活函數(shù)來(lái)解決復(fù)雜的非線性問(wèn)題,提高模型的特征提取能力。
本文基于Keras框架經(jīng)過(guò)大量實(shí)驗(yàn)并結(jié)合具體數(shù)據(jù)量,搭建4層結(jié)構(gòu)的深度神經(jīng)網(wǎng)絡(luò),如圖3所示。其中隱藏層的節(jié)點(diǎn)數(shù)分別為256、128和32,輸出層的節(jié)點(diǎn)數(shù)為1,圖中Xtrain為DNN網(wǎng)絡(luò)的輸入,Xtrain = [x1, x2, x3, …, xn]即n緯的列向量。網(wǎng)絡(luò)通過(guò)在輸入層對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,數(shù)據(jù)輸入進(jìn)行層間權(quán)重參量與閾值參量的計(jì)算既(wn,bn),通過(guò)Xtrain及Ytrain計(jì)算wn、bn。在本文的DNN網(wǎng)絡(luò)中,每個(gè)隱藏層從前一層獲得輸入數(shù)據(jù),經(jīng)隱藏層提取特征,并利用Relu激活函數(shù)實(shí)現(xiàn)非線性表達(dá),逐層依次迭代,確定學(xué)習(xí)率設(shè)置為0.001,損失函數(shù)使用mse,優(yōu)化器使用adam,迭代次數(shù)設(shè)置為50次,最后導(dǎo)入回歸評(píng)價(jià)指標(biāo),實(shí)現(xiàn)模型的訓(xùn)練。
1.4? ?模型評(píng)價(jià)指標(biāo)
本文利用模型相關(guān)性系數(shù)(Coefficient of determination,R2)、平均相對(duì)誤差 (Mean relative error,MRE)和均方根誤差(Root mean square error,RMSE)對(duì)水質(zhì)參數(shù)反演模型進(jìn)行精度評(píng)價(jià)。R2是判斷回歸模型擬合程度高低最常用的指標(biāo),其表達(dá)公式如下:
式中:n為數(shù)據(jù)的總個(gè)數(shù),[R'i]為反演模型估測(cè)的葉綠素值,[R i]為實(shí)測(cè)的葉綠素值,[R] 為實(shí)測(cè)葉綠素平均值。
2? ?結(jié)果與分析
2.1? ?DNN模型精度
使用20%的測(cè)試數(shù)據(jù)用于進(jìn)行模型精度評(píng)價(jià),以驗(yàn)證模型的精度。本次研究采用深度神經(jīng)網(wǎng)絡(luò)(DNN)方法建立葉綠素a反演模型的預(yù)測(cè)值與實(shí)測(cè)值對(duì)比結(jié)果見(jiàn)圖4。
2.2? ?方法對(duì)比
為了驗(yàn)證DNN模型的有效性,分別采用支持向量機(jī)(SVM)、隨機(jī)森林(Random forest regressor)、梯度提升(Gradient boosting regressor)、極端隨機(jī)樹(shù)(Extra trees regressor)、XGBoost(eXtreme Gradient boosting)、K近鄰(K Neighbros regressor)、AdaBoost回歸(AdaBoost regressor)、Bagging回歸(Bagging regressor)共8種機(jī)器學(xué)習(xí)算法,構(gòu)建巢湖及南淝河下游葉綠素a濃度反演模型,并進(jìn)行上述模型對(duì)比與分析。
機(jī)器學(xué)習(xí)模型的構(gòu)建選取與DNN模型相同的波段組合輸入,采用8種機(jī)器學(xué)習(xí)方法建立葉綠素a反演模型的預(yù)測(cè)值與實(shí)測(cè)值對(duì)比,每個(gè)模型在反復(fù)進(jìn)行參數(shù)調(diào)整測(cè)試后,結(jié)果如圖5所示。通過(guò)多種不同機(jī)器學(xué)習(xí)模型發(fā)現(xiàn),利用DNN及機(jī)器學(xué)習(xí)算法所構(gòu)建的模型均擁有較好的性能,而DNN方法所構(gòu)建的模型,具有最高的模型相關(guān)性系數(shù)、最低的平均相對(duì)誤差及均方根誤差。
綜上,DNN算法應(yīng)為最優(yōu)算法。為避免模型存在偶然性的問(wèn)題,針對(duì)DNN模型及各種機(jī)器學(xué)習(xí)模型進(jìn)行穩(wěn)定性分析。
2.3? ?訓(xùn)練樣本量對(duì)模型精度影響
樣本量過(guò)少會(huì)影響深度學(xué)習(xí)效果(馬崠奡等,2021;王子儒和李振民,2021)。為了驗(yàn)證DNN模型的穩(wěn)定性,在保證測(cè)試集不變的情況下,分析樣本個(gè)數(shù)對(duì)模型精度的影響,以訓(xùn)練集中的每5個(gè)數(shù)據(jù)為1個(gè)單位,每次減少1個(gè)單位,并同時(shí)采用上述8種機(jī)器學(xué)習(xí)模型進(jìn)行共同實(shí)驗(yàn),結(jié)果如圖6所示。
隨著訓(xùn)練集個(gè)數(shù)的不斷減少,9種模型的R2均呈現(xiàn)持續(xù)下降趨勢(shì),其中DNN模型下降幅度最小,R2始終要高于其他機(jī)器學(xué)習(xí)模型。訓(xùn)練集數(shù)在110~30個(gè)時(shí),DNN模型R2保持在0.90以上;訓(xùn)練集數(shù)在25個(gè)時(shí),R2下降至0.88;樣本數(shù)為15個(gè)時(shí),R2為0.81。故DNN模型整體精度較高,具有良好的穩(wěn)定性。
2.4? ?模型適用性
基于2.3中訓(xùn)練樣本量對(duì)模型精度的影響分析,分別采用30、25、15個(gè)采樣點(diǎn)進(jìn)行訓(xùn)練時(shí),模型精度下降較大(約8%),確定影響其精度的敏感模型訓(xùn)練樣本個(gè)數(shù)并進(jìn)行實(shí)驗(yàn)。在保證測(cè)試集不變的情況下,將訓(xùn)練集按30個(gè)/組、25個(gè)/組、15個(gè)/組分別分為3組、4組、6組,如圖7所示;且測(cè)試點(diǎn)隨機(jī)覆蓋研究區(qū),結(jié)果如表2所示。
每30個(gè)采樣點(diǎn)為一組進(jìn)行模型構(gòu)建,R2均值(0.8893)與每25個(gè)為一組的R2均值(0.8762)相差不大。每15個(gè)采樣點(diǎn)為一組的R2均值(0.7993)相較前2組的下降幅度較大,但仍有較高的精度。故該模型可根據(jù)自身實(shí)際情況,為今后開(kāi)展巢湖葉綠素a濃度采樣時(shí),所需人工采樣點(diǎn)個(gè)數(shù)的把控及巢湖葉綠素a濃度的宏觀觀測(cè)提供參考依據(jù)。
2.5? ?葉綠素a濃度的時(shí)空分布反演
本研究采用2018-2020年春夏秋冬四季成像的Sentinel-2 MSI 影像各一景,共12景,使用DNN模型對(duì)巢湖及南淝河下游的葉綠素a進(jìn)行反演和時(shí)空變化分析,結(jié)果如圖8所示。
按照顏色由淺綠向深綠過(guò)渡,顏色越深,表示反演結(jié)果中葉綠素a濃度越高,灰色部分代表水域被云層覆蓋。根據(jù)實(shí)際反演情況,將葉綠素a濃度分為0、100、150、200、300 μg/L和大于300 μg/L共6個(gè)不同的濃度等級(jí)。
2.5.1? ?時(shí)間變化? ?根據(jù)巢湖及南淝河下游葉綠素a濃度3年四季的反演結(jié)果,不同葉綠素a的等級(jí)分布及濃度均值見(jiàn)圖9。
圖8反演結(jié)果表明,2018-2020年春季,研究區(qū)大部分的葉綠素a濃度在100~200 μg/L,其濃度較低;2018-2020年夏季,大部分區(qū)域葉綠素a濃度在150~300 μg/L,其濃度適中;2018-2020年秋季,大部分區(qū)域葉綠素a濃度在100~200 μg/L,其濃度適中;而2019年秋季巢湖流域大面積葉綠素a濃度則處于200~300 μg/L,其濃度較高;2018-2020年冬季,大部分區(qū)域葉綠素a濃度在100~150 μg/L,其濃度較低。由圖9可以看出,每年夏秋季巢湖及南淝河下游的葉綠素a濃度要明顯高于春冬季,春、夏、秋、冬四季均值在141~168、175~195、172~218、143~164 μg/L。由上可知,研究區(qū)葉綠素a濃度在夏秋季偏高,春冬季偏低,這主要與溫度降低、藻類(lèi)植物繁殖變慢有關(guān)(荀尚培,2011)。
2.5.2? ?空間變化? ?圖8反演結(jié)果表明,巢湖葉綠素a濃度在空間上呈現(xiàn)出一定的差異。首先,巢湖西半湖的葉綠素a濃度要高于東半湖,這主要與巢湖西北部的十五里河和南淝河將合肥產(chǎn)生的城市污水導(dǎo)入巢湖西半湖以及巢湖姥山島旅游景點(diǎn)位于西半湖有關(guān)(Zhang et al,2020)。本研究對(duì)南淝河下游葉綠素a濃度進(jìn)行反演時(shí)發(fā)現(xiàn),其葉綠素a濃度一直處于中等標(biāo)準(zhǔn),這與河流流速也有一定關(guān)系。流速快的水體很少出現(xiàn)富營(yíng)養(yǎng)化情況,然而其注入巢湖后,由于巢湖閘、裕溪閘等的修建,使巢湖逐漸成為半封閉水域,湖內(nèi)水流緩慢,導(dǎo)致浮游植物富集,湖區(qū)葉綠素a濃度增高(陶慜等,2015);其次,巢湖局部近岸區(qū)葉綠素a濃度較高,這與近岸區(qū)域的人類(lèi)、生物活動(dòng)及陸地環(huán)境有關(guān)。2019年及2020年冬季,湖心偏東部及偏南部湖區(qū)呈現(xiàn)出葉綠素a濃度較高的現(xiàn)象,經(jīng)查閱天氣信息,得知這兩日風(fēng)向均屬于偏東南風(fēng),是湖面葉綠素隨風(fēng)向移動(dòng)所致(李亞春等,2016;胡旻琪等,2018)。
3? ?小結(jié)
(1)采用B8A/B4、B6/B4、B8/B4等Pearson相關(guān)性系數(shù)高的波段組合作為DNN模型的輸入因子,該模型具有較高的相關(guān)性系數(shù)(R2=0.96)、較低的均方根誤差(RMSE= 24.4 μg/L)及相對(duì)平均誤差(MRE=31.62%)。
(2)DNN 模型訓(xùn)練樣本大于30個(gè)時(shí),R2始終大于0.90;訓(xùn)練樣本為25個(gè)時(shí),R2=0.88;訓(xùn)練樣本為15個(gè)時(shí),R2=0.80。DNN模型具有良好的穩(wěn)定性。將訓(xùn)練集等分為3組、4組及6組,R2下降約9%。
(3)基于DNN模型對(duì)研究區(qū)葉綠素a濃度進(jìn)行反演,夏秋兩季巢湖及南淝河下游葉綠素a濃度較春冬兩季普遍偏高,主要與溫度、藻類(lèi)代謝有關(guān);巢湖西半湖污染更為嚴(yán)重,主要受人文活動(dòng)影響;巢湖局部靠岸區(qū)域的葉綠素a濃度較高,冬季會(huì)受到風(fēng)向影響。
參考文獻(xiàn)
安如,劉影影,曲春梅,等,2013. NDCI法Ⅱ類(lèi)水體葉綠素a濃度高光譜遙感數(shù)據(jù)估算[J]. 湖泊科學(xué), 25(3):437-444.
畢順,李云梅,呂恒,等,2018. 基于OLCI數(shù)據(jù)的洱海葉綠素a濃度估算[J]. 湖泊科學(xué), 30(3):701-712.
但雨生,周忠發(fā),李韶慧,等,2020. 基于Sentinel-2的平寨水庫(kù)葉綠素a濃度反演[J]. 環(huán)境工程, 38(3):180-185,127.
刁瑞翔, 青松,越亞嫘,等,2021. 北方半干旱區(qū)典型湖泊——岱海透明度遙感反演(2013-2020年)[J]. 湖泊科學(xué), 33(4):1072-1087.
杜聰,王世新,周藝,等,2009. 利用Hyperion高光譜數(shù)據(jù)的三波段法反演太湖葉綠素a濃度[J].環(huán)境科學(xué), 30(10):2904-2910.
高玉蓉,劉明亮,吳志旭,等,2012. 應(yīng)用實(shí)測(cè)光譜估算千島湖夏季葉綠素a濃度[J]. 湖泊科學(xué), 24(4):553-561.
胡旻琪,張玉超,馬榮華,等,2018. 巢湖2016年藍(lán)藻水華時(shí)空分布及環(huán)境驅(qū)動(dòng)力分析[J]. 環(huán)境科學(xué), 39(11):4925-4937.
黃宇,陳興海,劉業(yè)林,等,2020. 基于無(wú)人機(jī)高光譜成像技術(shù)的河湖水質(zhì)參數(shù)反演[J]. 人民長(zhǎng)江, 51(3):205-212.
李亞春,謝小萍,杭鑫,等,2016. 結(jié)合衛(wèi)星遙感技術(shù)的太湖藍(lán)藻水華形成風(fēng)場(chǎng)特征[J]. 中國(guó)環(huán)境科學(xué), 36(2):525-533.
劉文雅,鄧孺孺,梁業(yè)恒,等,2019. 基于輻射傳輸模型的巢湖葉綠素a濃度反演[J]. 國(guó)土資源遙感, 31(2):102-110.
羅婕純一,秦龍君,毛鵬,等,2021 . 水質(zhì)遙感監(jiān)測(cè)的關(guān)鍵要素葉綠素a的反演算法研究進(jìn)展[J].遙感技術(shù)與應(yīng)用, 36(3):473-488.
馬崠奡,唐娉,趙理君,等,2021. 深度學(xué)習(xí)圖像數(shù)據(jù)增廣方法研究綜述[J]. 中國(guó)圖象圖形學(xué)報(bào), 26(3):487-502.
馬榮華,孔維娟,段洪濤,等,2009.基于MODIS影像估測(cè)太湖藍(lán)藻暴發(fā)期藻藍(lán)素含量[J]. 中國(guó)環(huán)境科學(xué), 29(3):254-260.
逄淑娜, 朱渭寧,陳江,等,2019. Landsat-8的舟山近岸海域總懸浮物遙感反演與時(shí)空變異研究[J]. 光譜學(xué)與光譜分析, 39(12):3826-3832.
錢(qián)瑞,彭福利,薛坤,等,2022. 大型湖庫(kù)濱岸帶藍(lán)藻水華堆積風(fēng)險(xiǎn)評(píng)估——以巢湖為例[J]. 湖泊科學(xué), 34(1):49-60.
孫昊,周林飛,2019. 石佛寺水庫(kù)葉綠素a濃度高光譜遙感反演[J]. 節(jié)水灌溉, 28(3):67-70.
孫宏亮,何宏昌,付波霖,等,2020. 香港近海海域葉綠素a定量反演及時(shí)空變化分析[J]. 中國(guó)環(huán)境科學(xué), 40(5):2222-2229.
陶慜,段洪濤,齊琳,等,2015. 一種基于MODIS影像可業(yè)務(wù)化運(yùn)行的巢湖水體葉綠素a估算算法[J]. 湖泊科學(xué), 27(6):1140-1150.
王波,黃津輝,郭宏偉,等,2022. 基于遙感的內(nèi)陸水體水質(zhì)監(jiān)測(cè)研究進(jìn)展[J]. 水資源保護(hù), 38(3):117-124.
王行行, 王杰,崔玉環(huán),2020. 基于Sentinel-2 MSI影像的河湖系統(tǒng)水體懸浮物空間分異遙感監(jiān)測(cè)——以安徽省升金湖與連接長(zhǎng)江段為例[J]. 環(huán)境科學(xué), 41(3):1207-1216.
王子儒,李振民,2021. 融合數(shù)據(jù)增強(qiáng)的遷移字典學(xué)習(xí)[J]. 計(jì)算機(jī)工程與應(yīng)用, 27(23):193-199.
徐鵬飛,毛峰,金平斌,等,2020. 基于GF1_WFV的千島湖水體葉綠素a濃度時(shí)空變化[J]. 中國(guó)環(huán)境科學(xué), 40(10):4580-4588.
徐逸,董軒妍,王俊杰,2019. 4種機(jī)器學(xué)習(xí)模型反演太湖葉綠素a濃度的比較[J]. 水生態(tài)學(xué)雜志, 40(4):48-57.
荀尚培,楊元建,何彬方,等,2011. 春季巢湖水溫和水體葉綠素a濃度的變化關(guān)系[J]. 湖泊科學(xué), 23(5):767-772.
Cao Z G, Ma R H, Duan H T, et al, 2020. A machine learning approach to estimate chlorophyll-a from Landsat-8 measurements in inland lakes[J]. Remote Sensing of Environment, 248(10):111974-11989.
Dall'Olmo G, 2006. Isolation of optical signatures of phytoplankton pigments in turbid productive waters Remote assessment of chlorophyll-a[J]. In ProQuest Dissertations and Theses, 34(4):547-559.
David V L, Marisse M, Charlie B, et al, 2020. Machine Learning to Support Hemodynamic Intervention in the Neonatal Intensive Care Unit[J]. Clinics in Perinatology, 47(3):14-28.
Hinton E, Salakhutdinov R R, 2006. Reducing the Dimensionality of Data with Neural Networks[J]. Science, 313(7):504-507.
Hu C, Lee Z, Franz B, 2011. Chlorophyll a algorithms for oligotrophic oceans: A novel approach based on three-band reflectance difference[J]. Journal of Geophysical Research Oceans, 117(11):1011-1026.
Jia W J, Cheng J, Hu H Z, 2020. A Cluster-stacking-based Approach to Forecasting Seasonal Chlorophyll-a Concentration in Coastal Waters[J]. IEEE Access, 99(8):99934-99947.
Jiang C, Zhu W, Tian Y Q, et al, 2017. Remote estimation of colored dissolved organic matter and chlorophyll-a in Lake Huron using Sentinel-2 measurements[J]. Journal of Applied Remote Sensing, 11(3): 36007-36023
Li P, Ke Y, Bai J, et al, 2019. Spatiotemporal dynamics of suspended particulate matter in the Yellow River Estuary, China during the past two decades based on time-series Landsat and Sentinel-2 data[J]. Marine Pollution Bulletin, 149(12):1-15
Mamun M, Ferdous J, An K, 2021. Empirical estimation of nutrient, organic matter and algal chlorophyll in a drinking water reservoir using landsat 5 tm data[J]. Remote Sensing, 13(12):2256-2271.
Mishra S, Mishra D R, 2011. Normalized difference chlorophyll index: A novel model for remote estimation of chlorophyll-a concentration in turbid productive waters[J]. Remote Sensing of Environment, 117(2):394-406.
Motoaki K, Akihiko T, Tomohiko O, et al, 2001. Temporal and spatial variability of chlorophyll a, suspended solids, and yellow substance in the Yellow Sea and East China Sea using ocean color sensor[J]. Physica A: Statistical Mechanics and its Applications, 4154:179-187.
Naeini E Z, Prindle K, 2018. Machine learning and learning from machines[J]. The Leading Edge, 37(12):886-893.
Pyo J C, Pachepsky Y, Baek S S, et al, 2017. Optimizing the bio-optical algorithm for estimating Chlorophyll-a and Phycocyanin concentrations in inland waters in Korea[J]. Remote Sensing, 9(6):542-559.
Silveira K, Thomassim G, Eniuce M, et al, 2020. A Method for Chlorophyll-a and Suspended Solids Prediction through Remote Sensing and Machine Learning[J]. Sensors (Basel, Switzerland), 20(7):2125-2131.
Yong S K, Seung H B, Young K L, et al, 2018. Monitoring Coastal Chlorophyll-a Concentrations in Coastal Areas Using Machine Learning Models[J]. Water, 10(8):1020-1037.
Zhang D, Lavender S, Muller J P, et al, 2017. Determination of phytoplankton abundances (Chlorophyll-a) in the optically complex inland water-The Baltic Sea[J]. Science of The Total Environment, 601/602:1060-1074.
Zhang W, Li H, Xiao Q, et al, 2020. Urban rivers are hotspots of riverine greenhouse gas (N2O, CH4, CO2) emissions in the mixed-landscape Chaohu Lake Basin[J]. Water Research, 20:31159-31177.
(責(zé)任編輯? ?萬(wàn)月華)
Estimation of Chlorophyll-a Concentration in Chaohu Lake and Nanfei River
Based on Sentinel-2 Satellite Remote Sensing Imagery
SUN Shi‐ju1, XU Hao2, WU Yan‐lan1,3,4, WU Peng‐hai1,3, YANG Hui5
(1. School of Resources and Environmental Engineering, Anhui University, Hefei? ?230601, P.R. China;
2. Institute of Spacecraft System Engineering, Beijing? ?100094, P.R. China;
3. Anhui Geographic Information Intelligent Technology Engineering Research Center, Hefei? ?230601, P.R. China;
4. Anhui Laboratory of Information Materials and Intelligent Perception, Hefei? ?230601, P.R. China;
5. Information Materials and Intelligent Sensing Laboratory of Anhui Province, Institutes of Physical Science
and Information Technology, Anhui University, Hefei? ?230601, P.R. China)
Abstract: Chlorophyll-a concentration is an important water quality parameter, reflecting the pollution status of aquatic ecosystems. Quantitative inversion of chlorophyll-a concentration is useful for following water eutrophication status over time and is crucial for developing plans to improve eutrophic water bodies. In this study, Chaohu Lake and the lower reaches of Nanfei River and tributaries were selected for investigation. The temporal and spatial variation of chlorophyll-a concentration in the study area was analyzed using a chlorophyll-a concentration inversion model. It aimed to provide scientific evidence for intelligent and dynamic monitoring of the nutrient status of water in the Chaohu Lake basin. First, a depth neural network (DNN) model was constructed based on Sentinel-2 satellite remote sensing data from August 2 in 2018, December 27 in 2019, June 25 in 2020, November 2 in 2020 and November 13 in 2020, as well as field measurement data of chlorophyll-a concentration. The stability and applicability of the model was tested by reducing the training sets. The depth neural network (DNN) model constructed for this study had high inversion accuracy (R2=0.96, MRE=31.62%, RMSE=24.4 μg/L). Analysis of the impact of reducing the training sample sets on DNN model accuracy shows that the model maintained accuracy with fewer training samples. Based on the number of sensitive model training samples, the training sets were divided into equal parts. To summarize, the model developed in this study displayed good stability and conditional applicability. After developing and testing the model, it was used to estimate chlorophyll-a concentrations in the study area and the average chlorophyll-a concentration ranges for spring, summer, autumn and winter were, respectively, 141-168, 175-195, 172-218 and 143-164 μg/L. The concentration of chlorophyll-a increased in summer and autumn and decreased in spring and winter. Spatially, chlorophyll-a concentrations were higher in the western lake and some nearshore areas, and lower in the eastern lake.
Key words:chlorophyll-a; satellite remote sensing; concentration inversion; Chaohu Lake; Nanfei River
收稿日期:2021-09-17? ? ? 修回日期:2023-02-14
基金項(xiàng)目:國(guó)家自然科學(xué)基金(43971311);安徽省科技重大專(zhuān)項(xiàng)(201903a07020014)。
作者簡(jiǎn)介:孫世舉,1997年生,男,碩士研究生,研究方向?yàn)榄h(huán)境生態(tài)與資源管理。E-mail:2226093845@qq.com
通信作者:楊輝,1987年生,男,博士研究生,研究方向?yàn)樯疃葘W(xué)習(xí)遙感信息提取。E-mail:yanghui@ahu.edu.cn