趙海陽,沈芳*,孫雪融,魏小島
( 1. 華東師范大學(xué) 河口海岸學(xué)國家重點(diǎn)實(shí)驗(yàn)室,上海 200241;2. 華東師范大學(xué) 崇明生態(tài)研究院,上海 202162)
浮游植物在生物地球化學(xué)循環(huán)中扮演著十分重要的角色。研究表明,盡管浮游植物的生物量只有陸地植物生物量的1%,但貢獻(xiàn)了全球大約50%的初級生產(chǎn)力[1-2]。由于形態(tài)和生理特征的差異,不同浮游植物在生物地球化學(xué)過程和海洋生態(tài)系統(tǒng)中的作用有所差別[3]。如硅藻貢獻(xiàn)了海洋初級生產(chǎn)力的40%,同時也是全球硅循環(huán)的重要驅(qū)動因素[4];甲藻在生長代謝過程中產(chǎn)生的二甲基硫,能夠形成硫酸鹽氣溶膠,進(jìn)而維持全球輻射平衡[5]。
因此,為了更加全面地認(rèn)識浮游植物在全球生態(tài)系統(tǒng)中所起的作用,需要對浮游植物的生物量、空間分布、類群和種群組成等信息進(jìn)行有效觀測。其中,遙感技術(shù)的發(fā)展,有效彌補(bǔ)了傳統(tǒng)調(diào)查方式較難進(jìn)行大范圍、連續(xù)觀測的不足,同時使得對地觀測變得更加經(jīng)濟(jì)高效。葉綠素a(Chlorophylla,Chla)濃度常被用來指示浮游植物生物量[6],其衛(wèi)星反演一直以來是水色遙感領(lǐng)域的重要研究內(nèi)容[7]。但近年來隨著人們對海洋生態(tài)系統(tǒng)、生物地球化學(xué)循環(huán)、氣候變化等研究的逐步深入,大量研究顯示,Chla濃度已無法滿足人們對浮游植物類群進(jìn)行深入了解的迫切需求[8-10],使得發(fā)展浮游植物類群遙感反演方法變得十分必要。
目前,浮游植物類群遙感反演方法主要分為3種:基于浮游植物豐度法、基于生態(tài)環(huán)境因子法、基于光學(xué)輻射法[9,11]。不同浮游植物因大小、形狀、外部和內(nèi)部結(jié)構(gòu)以及色素成分上的差異會改變光學(xué)輻射信號,同時衛(wèi)星影像經(jīng)過大氣校正,首先得到水體的遙感反射率(Remote Sensing Reflectance,Rrs)。因此,利用遙感反射率反演浮游植物類群是最為直接的方法[11]。然而,對于水體光學(xué)性質(zhì)復(fù)雜的中國東部海域,使用遙感反射率反演浮游植物類群的研究仍相對較少[12-13]。
已有研究表明,基于波段組合的Chla濃度反演模型簡單高效,被廣泛使用[14-15]。因此,可以通過尋找與浮游植物類群Chla濃度相關(guān)性最高的波段組合,建立反演模型。此外,基于遙感反射率數(shù)據(jù)以及其他表觀光學(xué)變量的奇異值分解法,在大洋一類水體估算浮游植物類群Chla濃度時取得了較好的結(jié)果[16-17]。上述的研究方法主要是基于相對簡單的線性回歸模型,而機(jī)器學(xué)習(xí)算法,特別是極端梯度提升算法(eXtreme Gradient Boosting,XGBoost),因其高效的可擴(kuò)展性和靈活性以及快速準(zhǔn)確的特點(diǎn),近年來在水色遙感領(lǐng)域中得到了不斷的發(fā)展和應(yīng)用[18-19]。基于大量實(shí)測數(shù)據(jù),本研究使用了3種建模方法究構(gòu)建浮游植物類群反演模型,即基于波段組合法、基于奇異值分解的多元線性回歸法、基于奇異值分解的XGBoost回歸法,并對比驗(yàn)證了不同模型的估算精度。
Sentinel-3/OLCI(Ocean and Land Colour Instrument)傳感器作為新一代的水色傳感器,其在波段設(shè)置方面繼 承 了Envisat/MERIS(Medium Resolution Imaging Spectrometer)傳感器的參數(shù),并針對水色遙感探測進(jìn)行了優(yōu)化[20]。為了獲得較高精度的遙感反射率產(chǎn)品,本研究利用實(shí)測的遙感反射率數(shù)據(jù)對OLCI 3種大氣校正算法(C2RCC(Case 2 Regional Coast Color)、POLYMER(POLYnomial-based algorithm applied to MERIS)、MUMM(Management Unit of Mathematical Models))進(jìn)行了評估。
綜上,本研究以中國東部海域?yàn)檠芯繀^(qū),構(gòu)建并對比了3種浮游植物類群遙感反演模型,驗(yàn)證了針對OLCI傳感器的3種大氣校正算法,并評估了大氣校正對浮游植物類群反演模型的影響。將精度較高的硅藻Chla濃度反演模型(基于奇異值分解的多元線性回歸法)應(yīng)用至使用C2RCC大氣校正算法計(jì)算得到的OLCI遙感反射率數(shù)據(jù),估算中國東部海域硅藻Chla濃度。
本研究的實(shí)測原位數(shù)據(jù)來自于中國東部海域(圖1)。中國東部海域包括渤海、黃海和東海,總面積約為1×106km2[21]。中國東部海域也是我國重要的碳匯,年固碳量達(dá)222×106t[22]。受到黑潮、臺灣暖流、浙閩沿岸流等多種流系[23]以及河流輸入泥沙和營養(yǎng)鹽的影響,該區(qū)域的浮游植物類群存在較大的時空變化[24]。
圖1 研究區(qū)位置以及采樣站位Fig. 1 Location of the study area and sampling stations
本研究共采集獲取了2015-2020年8個航次的228條遙感反射率數(shù)據(jù)(圖1)。該數(shù)據(jù)由Sea-Bird Scientific公司的海面高光譜測量儀(HyperSAS)測定,波段范圍為349 ~ 856 nm,分辨率為1 nm。數(shù)據(jù)測定和處理參考文獻(xiàn)[25]。根據(jù)OLCI的波譜響應(yīng)函數(shù),利用式(1)將實(shí)測的遙感反射率卷積計(jì)算為OLCI等效波長測得的遙感反射率[26]。卷積完成后得到16個等效波段,即400 nm、412.5 nm、442.5 nm、490 nm、510 nm、560 nm、620 nm、665 nm、673.75 nm、681.25 nm、708.75 nm、753.75 nm、761.25 nm、764.375 nm、767.5 nm、778.75 nm。由于受到水汽吸收作用的影響,761.25 nm、764.375 nm、767.5 nm波段不參與大氣校正,因此,之后的研究只使用了經(jīng)過大氣校正的13個波段。
式中,Rrs為 傳感器測量的等效遙感反射率; λ1、 λ2為波段范圍內(nèi)的下限和上限;S(λi) 為波長 λi處傳感器的光譜響應(yīng)函數(shù);Rrs(λi)為 λi處實(shí)測的遙感反射率。
不同的浮游植物含有特定的特征色素,在原位測量中,常通過測定特征色素來確定浮游植物類群[27]。本研究采用來自2015-2020年9個航次共511個站位(圖1)的海水表層特征色素濃度數(shù)據(jù)(航次及采樣信息詳見文獻(xiàn)[28-29])。在野外采集特征色素時,將水樣過濾富集到孔徑為0.7 μm,直徑為25 mm的Whatman GF/F玻璃纖維濾膜上,然后放入-40℃的冰箱中冷凍避光保存。返回實(shí)驗(yàn)室后通過高效液相色譜(High Performance Liquid Chromatography, HPLC)測定色素濃度。
CHEMTAX是根據(jù)浮游植物特征色素濃度估算不同浮游植物類群Chla濃度的程序[30]。程序通過最速下降法不斷迭代,調(diào)整特征色素比率矩陣,定量確定浮游植物類群組成。本研究參考Sun等[31]在中國東部海域給出的初始特征色素比率矩陣,使用實(shí)測的多甲藻黃素、19’-丁酰氧基-巖藻黃素、巖藻黃素、19’-己酰氧基-巖藻黃素、新黃素、青綠藻黃素、紫黃素、別藻黃素、葉黃素(Lutein)、玉米黃素度、葉綠素b、葉綠素a的濃度,計(jì)算得到青綠藻(Prasinophytes)、甲藻(Dinoflagellates)、隱藻(Cryptophytes)、綠藻(Chlorophytes)、藍(lán)藻(Cyanobacteria)、硅藻(Diatoms)、金藻(Chrysophytes)、定鞭藻(Prymnesiophytes)的Chla濃度。
OLCI傳感器是歐洲空間局(The European Space Agency,ESA)Sentinel-3A(2016年2月16日發(fā)射)和Sentinel-3B(2018年4月25日發(fā)射)衛(wèi)星上的有效載荷之一。OLCI的波段范圍為400~1 020 nm,包括21個波段。兩顆衛(wèi)星在同一軌道運(yùn)行,于當(dāng)?shù)靥枙r10點(diǎn)過境。OLCI傳感器的L1B(傳感器接收到的天頂輻亮度)產(chǎn)品包括了兩種空間分辨率的產(chǎn)品,分別是300 m分辨率(Full Resolution,F(xiàn)R)和1.2 km分辨率(Reduce Resolution,RR)[32]。本研究使用的是300 m分辨率的L1B數(shù)據(jù)(https://scihub.copernicus.eu/dhus)。
C2RCC大氣校正算法通過大量的實(shí)測數(shù)據(jù),利用水體光學(xué)傳輸模型和大氣傳輸模型,模擬了不同情況下的天頂輻亮度和離水反射數(shù)據(jù)集,再利用模擬的數(shù)據(jù)集構(gòu)建神經(jīng)網(wǎng)絡(luò)模型,完成天頂輻亮度和離水反射之間的計(jì)算。在構(gòu)建離水反射數(shù)據(jù)集時,使用了從世界各地光學(xué)復(fù)雜水體采集的光學(xué)參數(shù),因此能夠適用于光學(xué)二類水體[33-34]。
POLYMER大氣校正算法利用從藍(lán)光到近紅外光的整個光譜范圍,將大氣和水體的信號解耦,完成大氣校正。該方法依賴于兩個基本模型,一個是關(guān)于大氣的估計(jì)模型,該大氣模型使用全光譜建立多項(xiàng)式擬合大氣貢獻(xiàn),使得最終的模型可以適用于有太陽耀光污染的區(qū)域;另一個是離水反射模型,該模型使用Chla濃度和后向散射系數(shù)模擬離水反射。其中后向散射系數(shù)的引入使得模型能夠適用于光學(xué)二類水體[35-36]。
MUMM大氣校正算法是對標(biāo)準(zhǔn)SeaWiFS大氣校正算法的擴(kuò)展。SeaWiFS標(biāo)準(zhǔn)大氣校正算法假設(shè)水體在近紅外波段的離水反射為0,衛(wèi)星近紅外波段接收到的信號都是由氣溶膠反射貢獻(xiàn),通過將氣溶膠貢獻(xiàn)從近紅外波段推算至短波波段,完成大氣校正[37]。然而,這一假設(shè)多適用于水色組分相對簡單的一類水體。針對渾濁水體,Ruddick 等[38]將近紅外波段離水反射為0的假設(shè)替換為在興趣區(qū)內(nèi)765 nm和865 nm波段離水反射比和氣溶膠散射比為定值的假設(shè),從而推算氣溶膠散射,完成大氣校正。
在使用實(shí)測數(shù)據(jù)進(jìn)行大氣校正結(jié)果驗(yàn)證時,本研究選擇在采樣站位前后3 h過境的衛(wèi)星影像上,以采樣點(diǎn)為中心,空間上3×3窗口平均值,作為該站位衛(wèi)星探測的遙感反射率。
2.6.1 波段組合法
波段組合法(Band Combination,BC)是建立遙感反射率波段組合值與不同浮游植物類群Chla濃度之間經(jīng)驗(yàn)關(guān)系的方法。利用相關(guān)系數(shù),選擇與各浮游植物類群Chla濃度相關(guān)性最高的遙感反射率波段組合(表1)。在找到各浮游植物類群最優(yōu)波段組合后,分別使用一次函數(shù)、二次函數(shù)、三次函數(shù)、冪函數(shù)和指數(shù)函數(shù)將波段組合值與浮游植物Chla濃度進(jìn)行擬合,確定最優(yōu)的建模方式。
表1 本研究采用的波段組合形式Table 1 The band combinations used in this study
2.6.2 基于奇異值分解的多元線性回歸法
在構(gòu)建基于奇異值分解的多元線性回歸法(SVD(Singular Value Decomposition)+MLR(Multiple Linear Regression))模型時,首先對建模數(shù)據(jù)集的遙感反射率進(jìn)行標(biāo)準(zhǔn)化,將標(biāo)準(zhǔn)化后的遙感反射率矩陣(Rrsstandardized,矩陣大小為M×N,M為光譜數(shù)量,N為波段數(shù)量)進(jìn)行奇異值分解,如下所示,
式中,正交矩陣U(M×M)的列向量為左奇異向量,代表建模數(shù)據(jù)的主成分; Λ(M×N)為矩陣Rrsstandardized的奇異值矩陣,是一個對角陣,奇異值由大到小在矩陣對角線排列;正交矩陣V(N×N)的列向量為右奇異向量。計(jì)算過程中,當(dāng)?shù)趎+1個主成分代表的方差小于第一個主成分代表方差的0.000 1倍時,該主成分被當(dāng)作是無意義的而被舍棄[16]。最終,將前n個主成分與浮游植物Chla濃度的對數(shù)( lgCp)進(jìn)行多元線性回歸,公式為
式中,a和b1,b2,···,bn為方程的回歸系數(shù);Cp為浮游植物Chla濃度;u1,u2,···,un為前n個主成分。
當(dāng)將該方法應(yīng)用至遙感影像進(jìn)行浮游植物類群Chla濃度估算時,首先將影像的遙感反射率矩陣進(jìn)行標(biāo)準(zhǔn)化隨后將數(shù)據(jù)投影到建模數(shù)據(jù)奇異值分解后的特征空間上得到Uapplication矩陣(式(4)),通過使用Uapplication矩陣的列向量和建模時擬合的回歸系數(shù)來估算各浮游植物類群Chla濃度的對數(shù)該方法流程如圖2所示。
2.6.3 基于奇異值分解的XGBoost回歸法
XGBoost是一種基于梯度提升樹的機(jī)器學(xué)習(xí)方法[39]。其將多個弱學(xué)習(xí)器結(jié)合成為一個強(qiáng)的學(xué)習(xí)器,通過不斷地向集成模型中添加預(yù)測模型,且每一個新添加的預(yù)測模型都對前一個模型的預(yù)測殘差進(jìn)行擬合,以完成最后的模型構(gòu)建?;谄娈愔捣纸獾腦GBoost(記為SVD+XGBoost)的浮游植物類群Chla濃度反演算法的流程與SVD+MLR 法一致,僅將多元線性回歸模型替換為XGBoost回歸模型(圖2)。
圖2 基于奇異值分解的浮游植物類群Chl a濃度反演算法流程Fig. 2 Flow chart of Chl a concentration inversion algorithm of phytoplankton groups based on singular value decomposition
為評估建立的各類群浮游植物Chla濃度反演模型的精度,以及3種大氣校正算法的精度,研究使用了決定系數(shù)(R2)、均方根誤差(Root Mean Square Error,RMSE)、平均絕對誤差(Mean Absolute Error,MAE)、中值絕對百分比誤差(Median Absolute Percentage Error,MAPE)作為評價指標(biāo)。各指標(biāo)公式為
式中,E代表模型預(yù)測值;M代表實(shí)測值;N代表實(shí)測值與預(yù)測值匹配到的數(shù)量。
利用實(shí)測的色素濃度數(shù)據(jù)和CHEMTAX軟件計(jì)算得到的8類浮游植物的Chla濃度的統(tǒng)計(jì)結(jié)果如表2所示。為避免Chla濃度較低所帶來的不確定性[16],研究將浮游植物類群Chla濃度的閾值設(shè)為0.001 mg/m3,即當(dāng)某一類群Chla濃度小于該閾值時,樣本被剔除。由于8類浮游植物并不是在每個站位都出現(xiàn),因此,各浮游植物類群Chla濃度的樣本數(shù)量并不相同,其中觀測到藍(lán)藻的站位個數(shù)最多(465個),觀測到綠藻的站位個數(shù)最少(216個)。不同浮游植物類群的平均Chla濃度也有較大差別,其中硅藻的Chla濃度平均值在8類浮游植物中最高(1.13 mg/m3),甲藻次之(0.29 mg/m3),定鞭藻的Chla濃度平均值(0.08 mg/m3)最低。在實(shí)測數(shù)據(jù)中,8個站位的硅藻Chla濃度大于10 mg/m3,而甲藻Chla濃度大于10 mg/m3的站位僅有1個。青綠藻、隱藻、金藻、定鞭藻的Chla濃度相對較低,僅有較少的站位大于1 mg/m3,分別為4個、5個、7個、3個。雖然綠藻Chla濃度大于1 mg/m3的站位有10個,但大多數(shù)站位的濃度低于0.3 mg/m3。
表2 8類浮游植物葉綠素a濃度統(tǒng)計(jì)特征Table 2 Statistical characteristics of Chl a concentration of eight phytoplankton groups
將各浮游植物類群Chla濃度與對應(yīng)站位的實(shí)測遙感反射率進(jìn)行匹配,8類浮游植物匹配到的點(diǎn)對數(shù)量為:青綠藻119對、甲藻90對、隱藻107對、綠藻73對、藍(lán)藻128對、硅藻116對、金藻92對、定鞭藻128對。按照4∶1的比例將上述匹配數(shù)據(jù)隨機(jī)分成建模數(shù)據(jù)集和驗(yàn)證數(shù)據(jù)集。
將影像大氣校正后得到的遙感反射率與匹配的實(shí)測值進(jìn)行比較,對3種大氣校正方法進(jìn)行驗(yàn)證,結(jié)果見表3。由于有些大氣校正算法會產(chǎn)生無效值,因此,不同大氣校正算法得到的匹配點(diǎn)數(shù)量不同。經(jīng)C2RCC校正后的影像具有最多的匹配點(diǎn)(48個),經(jīng)POLYMER校正后的影像具有46個匹配點(diǎn),而經(jīng)MUMM校正后的影像只包含27個匹配點(diǎn)。在400 nm、412.5 nm、442.5 nm、490 nm波段,C2RCC大氣校正效果優(yōu)于另外兩種算法,MUMM效果最差。在其余波段,POLYMER相比于另外兩種大氣校正算法效果最差(RMSE≥0.003 2 sr-1)。如圖3所示,3種大氣校正方法在紅光和近紅外波段,即665 nm、673.75 nm、681.25 nm、708.75 nm、753.75 nm、778.75 nm波段處易低估遙感反射率。經(jīng)MUMM算法校正后的遙感反射率在400 nm、412.5 nm、445.5 nm易出現(xiàn)高估現(xiàn)象,且與實(shí)測值之間差別較大(MAPE≥140%)。除少數(shù)點(diǎn)外,POLYMER大氣校正后的各波段遙感反射率均比對應(yīng)的實(shí)測值低,且在708.75 nm、753.75 nm、778.75 nm波段處,POLYMER大氣校正后的數(shù)據(jù)存在負(fù)值。
圖3 3種大氣校正方法獲得的遙感反射率與實(shí)測遙感反射率驗(yàn)證結(jié)果Fig. 3 Validation of remote sensing reflectance obtained by three atmospheric correction methods with in-situ remote sensing reflectance
表3 3種大氣校正算法的精度評價Table 3 Accuracy evaluation of three atmospheric correction algorithms
受陸源和人類活動的影響,中國東部沿海上空存在多種氣溶膠類型,其中城市型氣溶膠和混合型氣溶膠是該區(qū)域主要的氣溶膠類型[40]。C2RCC和MUMM大氣校正算法中的氣溶膠模型在建立過程中,很少考慮到中國東部沿海氣溶膠的光學(xué)特性[41-42],因而造成對氣溶膠信號貢獻(xiàn)的錯誤估計(jì)[43-44]。此外,MUMM大氣校正算法遵循興趣區(qū)內(nèi)765 nm和865 nm波段離水反射比為定值的假設(shè),而已有研究表明,在渾濁水域兩個波段的離水反射存在明顯的變化[45]。POLYMER大氣校正中的離水反射模型僅考慮Chla濃度和后向散射系數(shù),對于渾濁水域的其他水色組分,模型假設(shè)有色可溶有機(jī)物隨Chla濃度變化,且未考慮非藻類顆粒物的吸收,而該假設(shè)并不適用于水色組分復(fù)雜的中國東部海域。
利用建模數(shù)據(jù)集,即由CHEMTAX計(jì)算得到的8類浮游植物Chla濃度及其對應(yīng)的實(shí)測遙感反射率,采用3種方法(2.6節(jié)所述)構(gòu)建浮游植物類群遙感反演模型,并利用驗(yàn)證數(shù)據(jù)集進(jìn)行模型精度驗(yàn)證。由于本研究中Chla濃度的數(shù)值跨越多個量級,因此在回歸建模以及之后的精度評價中,全部采用Chla濃度對數(shù)(以10為底)形式。
采用波段組合法進(jìn)行回歸建模時,對于各浮游植物類群選擇的最優(yōu)波段組合及對應(yīng)的回歸方程見表4。硅藻Chla濃度對數(shù)與對應(yīng)的遙感反射率波段組合值的相關(guān)性為0.76,使用波段組合法建立的反演模型相比于其他類群浮游植物在驗(yàn)證集上的精度較高,R2為0.55(表5)。青綠藻、甲藻和隱藻的Chla濃度對數(shù)與其對應(yīng)的遙感反射率波段組合值的相關(guān)性大于0.5,基于波段組合法的反演模型在實(shí)測數(shù)據(jù)組成的驗(yàn)證集上的R2分別為:0.29、0.31、0.31。對于綠藻、藍(lán)藻、金藻和定鞭藻,根據(jù)對應(yīng)的波段組合建立的模型反演精度較差(R2<0.2),可能與Chla濃度的對數(shù)和其相關(guān)性最高的波段組合值相關(guān)性較低有關(guān)(相關(guān)系數(shù)小于0.42)。
表4 8類浮游植物葉綠素a濃度反演模型使用的波段組合形式及回歸方程Table 4 Band combinations form and regression equations used in Chl a concentration inversion model of eight phytoplankton groups
表5列出了3種方法建立的遙感反演模型在估算8類浮游植物Chla濃度的精度評價結(jié)果。對于各浮游植物類群,使用SVD+XGBoost方法建立的模型精度均為最優(yōu),其中甲藻、硅藻Chla濃度反演模型的R2大于0.7,青綠藻、隱藻、定鞭藻的Chla濃度反演模型的R2大于0.47;相比于波段組合法和SVD+MLR建立的綠藻、藍(lán)藻和金藻Chla濃度遙感反演模型,使用SVD+XGBoost建立的反演模型的精度有顯著提高。說明SVD+XGBoost回歸模型具有一定的優(yōu)勢。
表5 8類浮游植物葉綠素a濃度遙感反演模型的精度評價Table 5 Accuracy of inversion model for Chl a concentration of eight phytoplankton groups
對比3種建模方法、8類浮游植物,硅藻的估算精度均較好(R2≥0.55),可能是因?yàn)橄鄬τ谄渌∮沃参?,其Chla濃度較高,光學(xué)信號更容易捕捉。相比之下,綠藻的估算精度在3種建模方法建立的模型中均表現(xiàn)較差(R2≤0.32),特別是基于SVD+MLR法的綠藻Chla濃度反演模型,驗(yàn)證結(jié)果R2小于0。波段組合法和SVD+MLR法建立的綠藻、藍(lán)藻和金藻Chla濃度反演模型的驗(yàn)證結(jié)果R2≤0.2,說明波段組合法和SVD+MLR法可能不適合綠藻、藍(lán)藻、金藻Chla濃度反演。
由圖4至圖6的散點(diǎn)圖可以看出,硅藻和青綠藻的驗(yàn)證結(jié)果在實(shí)測Chla濃度低于0.01 mg/m3時均存在一個高估的樣本點(diǎn),且基于3種建模方法的反演模型對該樣本點(diǎn)的預(yù)測值與實(shí)測值差別均較大,這可能是由于本研究所采集的青綠藻和硅藻的Chla濃度小于0.01 mg/m3的樣本點(diǎn)較少,使得模型在構(gòu)建過程中無法很好地覆蓋到Chla濃度小于0.01 mg/m3的情況。
圖4 基于波段組合法建立的8類浮游植物葉綠素a濃度反演模型的驗(yàn)證結(jié)果(葉綠素a濃度單位:mg/m3)Fig. 4 Validation results of Chl a concentration inversion model of eight phytoplankton groups based on band combination method (the unit of Chl a concentration is mg/m3)
圖6 基于SVD+XGBoost建立的8類浮游植物葉綠素a濃度反演模型的驗(yàn)證結(jié)果(葉綠素a濃度單位:mg/m3)Fig. 6 Validation results of Chl a concentration inversion model of eight phytoplankton groups based on SVD+XGBoost method (the unit of Chl a concentration is mg/m3)
由3.2節(jié)大氣校正算法驗(yàn)證結(jié)果可知,C2RCC大氣校正方法在精度上具有一定的優(yōu)勢,本研究選擇經(jīng)C2RCC大氣校正后的影像進(jìn)行進(jìn)一步研究。3.3節(jié)結(jié)果顯示,利用3種建模方法建立的反演模型在估算甲藻、隱藻、硅藻Chla濃度時精度較高,而其他類群浮游植物Chla濃度的反演模型仍有待進(jìn)一步提高,因此,本研究僅選取甲藻、隱藻、硅藻Chla濃度反演模型進(jìn)行衛(wèi)星應(yīng)用驗(yàn)證。選擇完全獨(dú)立于建模數(shù)據(jù)集的實(shí)測浮游植物類群Chla濃度,在經(jīng)大氣校正后的影像上取對應(yīng)站位的遙感反射率(時空匹配算法仍按照在時間上選擇衛(wèi)星過境前后3 h,空間上選擇3×3的窗口平均值),利用獲取到的遙感反射率和建立的反演模型估算3類浮游植物Chla濃度。
由圖7至圖9可以看出,當(dāng)將3種建模方法建立的反演模型應(yīng)用到影像上時,各浮游植物類群Chla濃度的反演精度都有所下降。特別是甲藻與隱藻,基于3種方法建立的甲藻Chla濃度反演模型精度的決定系數(shù)均小于0?;诓ǘ谓M合法建立的甲藻Chla濃度反演模型,雖然有部分預(yù)測值和實(shí)測值處于1∶1線上,但是部分樣本點(diǎn)存在嚴(yán)重高估的現(xiàn)象。對于隱藻,3種建模方法得到的反演值大部分都低于實(shí)測值。對于硅藻,基于SVD+MLR法建立的模型的反演精度最高(R2=0.56,MAPE=45%),使用波段組合法建立的模型反演精度也相對較好(R2=0.44,MAPE=58%)。
圖7 基于波段組合法的浮游植物類群葉綠素a濃度衛(wèi)星反演驗(yàn)證(葉綠素a濃度單位:mg/m3)Fig. 7 Validation of satellite inversion results of phytoplankton group Chl a concentration based on band combination method (the unit of Chl a concentration is mg/m3)
圖9 基于SVD+XGBoost的浮游植物類群葉綠素a濃度衛(wèi)星反演驗(yàn)證(葉綠素a濃度單位:mg/m3)Fig. 9 Validation of satellite inversion results of phytoplankton group Chl a concentration based on SVD+XGBoost method (the unit of Chl a concentration is mg/m3)
實(shí)測驗(yàn)證數(shù)據(jù)集上的結(jié)果顯示,基于多個波段進(jìn)行奇異值分解后建立的反演模型都有較高的反演精度,但是將模型應(yīng)用到衛(wèi)星影像上時,精度下降明顯,特別是基于SVD+XGBoost法建立的反演模型。這可能是由于衛(wèi)星大氣校正后得到的遙感反射率和真實(shí)值存在差距,大氣校正的準(zhǔn)確性對使用多個波段進(jìn)行奇異值分解后建立的反演模型的估算精度的影響較大。
將在影像上表現(xiàn)較好,基于SVD+MLR法構(gòu)建的硅藻Chla濃度反演模型應(yīng)用到2020年5月和2020年8月過境中國東部海域所有OLCI影像上(包括Sentinel-3A和Sentinel-3B),得到2020年5月和2020年8月的月平均硅藻Chla濃度空間分布,如圖10所示。硅藻Chla濃度的高值區(qū)域集中在近岸海域,低值區(qū)域主要分布在黃海中部和東海外海以及長江口、杭州灣、蘇北沿岸等懸浮泥沙含量較多的渾濁水域。在渤海南部,2020年8月的硅藻Chla濃度存在一定的高值。據(jù)《2020中國海洋災(zāi)害公報》[46]顯示,該區(qū)域在2020年8月份暴發(fā)過以硅藻浮游植物為主導(dǎo)的赤潮災(zāi)害事件。在蘇北沿岸區(qū)域,由于受到高濃度懸浮泥沙的影響,導(dǎo)致離岸較近區(qū)域硅藻Chla濃度較低,相比于2020年8月,2020年5月的低值范圍更大。在長江口外部海域,由于長江徑流帶來的豐富營養(yǎng)鹽,該區(qū)域相較于東海其他區(qū)域硅藻Chla濃度較高。由于海表溫度的上升,2020年5月的硅藻Chla濃度月均值要高于2020年8月。從時空分布來看,上述結(jié)果與已有研究中針對中國東部海域Chla濃度時空變化規(guī)律的研究結(jié)果相一致[47-49]。
圖10 2020年5月和2020年8月中國東部海域硅藻葉綠素a濃度空間分布Fig. 10 The spatial distribution of diatom Chl a concentration in the eastern China seas in May 2020 and August 2020
本研究利用實(shí)測的遙感反射率和8類浮游植物Chla濃度,對比了3種建模方法建立的遙感反演模型的精度;評估了3種大氣校正方法在中國東部海域的適用性以及對各類群浮游植物Chla濃度反演模型的影響。主要研究結(jié)論如下:
(1)相比于傳統(tǒng)的回歸模型構(gòu)建方法,SVD+XGBoost方法具有一定的優(yōu)勢。實(shí)測數(shù)據(jù)的驗(yàn)證結(jié)果顯示,基于SVD+XGBoost法的8類浮游植物Chla濃度反演模型的精度高于其他兩種建模方法。特別是對于硅藻和甲藻浮游植物,基于SVD+XGBoost法的反演模型在驗(yàn)證集上具有較好的精度(R2>0.70),而其他6類浮游植物Chla濃度反演模型精度相對較低(R2≤0.51),仍有待進(jìn)一步研究。本研究中的浮游植物類群Chla濃度反演算法是經(jīng)驗(yàn)性的,今后將考慮從光學(xué)機(jī)理出發(fā),深入探究不同浮游植物類群對遙感反射率貢獻(xiàn)的差異。
圖5 基于SVD+MLR建立的8類浮游植物葉綠素a濃度反演模型的驗(yàn)證結(jié)果(葉綠素a濃度單位:mg/m3)Fig. 5 Validation results of Chl a concentration inversion model of eight phytoplankton groups based on SVD+MLR method (the unit of Chl a concentration is mg/m3)
(2)在各波段,C2RCC相對于其他兩種大氣校正算法(MUMM、POLYMER)有較好的表現(xiàn)(RMSE均小于0.004 8 sr-1),且能獲得更多的有效值,但與實(shí)測值之間仍有差距,需要繼續(xù)發(fā)展適用于中國東部海域的高精度的大氣校正算法。
圖8 基于SVD+MLR的浮游植物類群葉綠素a濃度衛(wèi)星反演驗(yàn)證 (葉綠素a濃度單位:mg/m3)Fig. 8 Validation of satellite inversion results of phytoplankton group Chl a concentration based on SVD+MLR method (the unit of Chl a concentration is mg/m3)
(3)受大氣校正精度的影響,將浮游植物類群Chla濃度反演模型應(yīng)用到OLCI影像上時,模型估算精度有所下降,特別是基于SVD+XGBoost建立的反演模型,衛(wèi)星反演驗(yàn)證結(jié)果R2均小于0.2。相比之下,利用波段組合法、SVD+MLR法建立的硅藻Chla濃度反演模型在應(yīng)用到衛(wèi)星影像上時仍保持一定的精度(R2分別為0.44、0.56),具有一定的魯棒性。