蔣錦剛,馮慧云,張亞國,何賢強
(1.南方海洋科學(xué)與工程廣東省實驗室(湛江),廣東 湛江 524006;2.中國科學(xué)院 合肥物質(zhì)科學(xué)研究院 智能機械研究所,安徽 合肥 230031; 3.自然資源部 第二海洋研究所,浙江 杭州 310012)
海洋遙感衛(wèi)星是一種利用所搭載的遙感器對海面進行光學(xué)或微波探測來獲取有關(guān)海洋水色和海洋動力環(huán)境信息的衛(wèi)星,海洋衛(wèi)星有效彌補了傳統(tǒng)海洋觀測手段的不足[1]。海洋要素遙感反演產(chǎn)品則是海洋生態(tài)環(huán)境研究和全球氣候變化研究的重要數(shù)據(jù)來源,由于海洋水體的高動態(tài)變化以及近海二類水體的復(fù)雜光學(xué)特征,使得海洋遙感產(chǎn)品的精度與不確定性驗證和評估充滿了困難與挑戰(zhàn)。國際海洋衛(wèi)星遙感學(xué)界一直重視遙感產(chǎn)品的真實性檢驗工作,以提高遙感數(shù)據(jù)產(chǎn)品的質(zhì)量和產(chǎn)品應(yīng)用的可靠性。早在20世紀80年代,國際地球觀測衛(wèi)星委員會(Committee on Earth Observation Satellites, CEOS)就成立了定標和真實性檢驗工作組,來協(xié)調(diào)各國遙感衛(wèi)星真實性檢驗的具體工作[2]。美國國家航空航天局(National Aeronautics and Space Administration, NASA)海洋生物學(xué)處理小組(Ocean Biology Processing Group, OBPG)也利用全球范圍的數(shù)據(jù)在衛(wèi)星生命周期內(nèi)開展了持續(xù)的真實性檢驗工作,并在水色產(chǎn)品精度評估、衛(wèi)星測量長期穩(wěn)定性評估、衛(wèi)星在軌定標精度檢驗等方面取得了許多有益的成果,相關(guān)研究成果也被國際海洋生物光學(xué)檔案與存儲系統(tǒng)(SeaWiFS Bio-optical Archive and Storage System,SeaBASS)網(wǎng)站進行采納和應(yīng)用[3-4]。
衛(wèi)星遙感產(chǎn)品和現(xiàn)場實測數(shù)據(jù)具有不同的時空采樣特性,需要根據(jù)衛(wèi)星產(chǎn)品的空間分辨率,以及水體的時空變化與均勻性來確定合理的時空窗口,國際上通用的時空窗口標準是:空間窗口為3×3或5×5像元,時間窗口為±3 h[4]。由于海洋水體存在時空動態(tài)變化的特性,使得基于現(xiàn)場實測數(shù)據(jù)的遙感產(chǎn)品驗證存在諸多不確定性問題。為了科學(xué)準確地評估遙感產(chǎn)品的精度和不確定性,MOORE et al[5]在驗證誤差和遙感反射率模糊統(tǒng)計分類的基礎(chǔ)上,提出了MODIS全球葉綠素a遙感產(chǎn)品不確定制圖方法。CUI et al[6]在中國黃東海區(qū)域水色遙感產(chǎn)品的驗證評估的研究中指出,對于黃東海渾濁水體的海域,采用改進的大氣校正算法和區(qū)域反演模型,相比于標準算法得到產(chǎn)品數(shù)據(jù),其結(jié)果的不確定度會有效降低20%~30%,在其后期的研究中,進一步討論了水體時空變異的格局對葉綠素a遙感反演算法的影響,發(fā)展了應(yīng)用于復(fù)雜光學(xué)水體的光學(xué)分類最優(yōu)檢索算法[7]。PEREIRA et al[8]采用MODIS葉綠素反演算法對南極半島北部渾濁水體進行了評價,也提出了采用改進的NIR-SWIR大氣校正算法[9]和區(qū)域3波段反演模型會明顯優(yōu)于MODIS全球葉綠素a反演標準算法。葉小敏 等[10]在對水色水溫遙感產(chǎn)品真實性檢驗誤差分析的研究中指出,在進行水色水溫遙感產(chǎn)品真實性檢驗之前,需要對遙感反演要素的均值及其標準偏差的分布規(guī)律進行分析,從而進一步確定是否采用平均相對誤差(Mean Relative Error,MRE)作為檢驗的統(tǒng)計量。蔣錦剛 等[11]在海表面溫度時空變異特征及對驗證誤差影響的研究中,證明了時空變異是造成誤差的直接原因之一,觀測要素顯著的時空變異,在驗證過程中會引入很大的驗證誤差,提出了基于時空變異區(qū)間等級區(qū)劃模型,并應(yīng)用于精度驗證數(shù)據(jù)集的代表性評價和驗證結(jié)果的可信度評價。李豪 等[12]在春季遼東灣靜止軌道海洋水色遙感產(chǎn)品的真實性檢驗的研究中指出,不同區(qū)域、不同算法的結(jié)果差異較大,有必要開展針對不同海區(qū)的精度檢驗。
海洋葉綠素a質(zhì)量濃度遙感產(chǎn)品是海洋初級生產(chǎn)力與海洋生態(tài)系統(tǒng)固碳能力研究的重要數(shù)據(jù)源,葉綠素a質(zhì)量濃度遙感產(chǎn)品反演算法主要是通過現(xiàn)場原位測量的葉綠素a質(zhì)量濃度與遙感數(shù)據(jù)可見光譜藍綠波段的遙感反射率(Rrs)進行經(jīng)驗建模計算得出,傳感器的波段范圍主要選擇440~670 nm。目前葉綠素a遙感反演的算法包括標準的波段比值算法(OCx)[13-14]和基于CI和OC4算法改進的OCI算法[15-16]。本文以葉綠素a質(zhì)量濃度遙感反演產(chǎn)品數(shù)據(jù)的精度驗證為研究對象,根據(jù)不同空間變異下實測-遙感數(shù)據(jù)的統(tǒng)計結(jié)果,分析了空間變異對海洋葉綠素a遙感產(chǎn)品驗證誤差的影響,并討論了葉綠素a遙感產(chǎn)品誤差產(chǎn)生的原因,為海洋葉綠素a遙感產(chǎn)品的驗證及遙感產(chǎn)品誤差源解析提供重要的科學(xué)依據(jù)。
海洋水體的高動態(tài)變化和遙感像元的空間分辨率尺度等問題是遙感驗證誤差產(chǎn)生的原因之一。像元是水面采集信息單元離散化形成的網(wǎng)格數(shù)據(jù),是像元尺寸范圍內(nèi)不同水體光學(xué)活性要素的混合平均值,而實際的水面信息單元,水體葉綠素a質(zhì)量濃度在空間上是連續(xù)分布的。在驗證過程中,對于均一的水面信息單元區(qū)域,采集的實測數(shù)據(jù)分布較為集中,而對于空間變異較大的區(qū)域,實測數(shù)據(jù)則較為離散,這些不同離散程度的實測數(shù)據(jù)與遙感像元的匹配驗證結(jié)果,是產(chǎn)生不同誤差統(tǒng)計結(jié)果的主要原因。圖1展示了空間變異造成驗證誤差的基本原理:實際葉綠素a質(zhì)量濃度在空間上是連續(xù)分布的(圖1a);而在遙感成像像元網(wǎng)格中,原有的連續(xù)空間分布產(chǎn)生了離散化(圖1b)。從實測數(shù)據(jù)和遙感數(shù)據(jù)散點圖中可以看出,對于空間變異性不同的區(qū)域(S1區(qū)域內(nèi)葉綠素a質(zhì)量濃度空間變異最小,S2區(qū)域內(nèi)葉綠素a質(zhì)量濃度空間變異最大),散點圖中的統(tǒng)計分布產(chǎn)生明顯的差異(圖1d):在高變異區(qū)域,驗證誤差統(tǒng)計分布的峰寬(峰曲線拐點上的切線在基線上的截距)更寬,峰值更低,驗證結(jié)果的精度表現(xiàn)較差;在低變異區(qū)域,驗證誤差統(tǒng)計分布的峰寬更窄,峰值更高,驗證結(jié)果的精度表現(xiàn)較好。在實際數(shù)據(jù)分析過程中,遙感像元內(nèi)部的空間變異在沒有同步高分辨率遙感數(shù)據(jù)的基礎(chǔ)上,無法統(tǒng)計像元內(nèi)部的屬性空間變異,因此需要假設(shè)遙感像元內(nèi)部的空間變異與像元周圍的空間變異是呈正相關(guān)的[17-18],這樣就可以通過計算空間窗口(如5×5 窗口)內(nèi)的變異系數(shù)進行分析。
圖1 空間變異與遙感產(chǎn)品驗證誤差關(guān)系示意圖Fig.1 The schematic diagram of the spatial variability influences remote sensing product validation errors(a:葉綠素a連續(xù)空間分布示意圖; b:遙感網(wǎng)格像元示意圖; c:實測數(shù)據(jù)和遙感數(shù)據(jù)匹配散點圖; d:遙感像元內(nèi)的實測數(shù)據(jù)統(tǒng)計分布)(a: schematic diagram of actual spatial distribution of chlorophyll-a; b: schematic diagram of remote sensing grid pixels;c: the scatter plots matching in situ data vs. remote sensing data; d: statistical distribution of in situ data in grid pixels)
本文所用數(shù)據(jù)為葉綠素a質(zhì)量濃度實測數(shù)據(jù)和遙感反演產(chǎn)品數(shù)據(jù),其中實測數(shù)據(jù)來自SeaBASS網(wǎng)站收集的資料(https://seabass.gsfc.nasa.gov/),主要由美國宇航局海洋生物處理小組(NASA OBPG)和國際合作者提供,還包括SeaBASS工作人員收集的外部實測數(shù)據(jù)以及來自AERONET-OC的測量數(shù)據(jù)等[19]。遙感數(shù)據(jù)主要包括MODIS-Aqua、MODIS-Terra、MERIS、SeaWiFS傳感器提供的葉綠素遙感產(chǎn)品。實測-遙感數(shù)據(jù)的時空匹配采用BAILEY et al[4]提出的原則和方法,實測-遙感數(shù)據(jù)的時空匹配參數(shù)設(shè)置如下:窗口有效像元數(shù)≥50%,以保證統(tǒng)計數(shù)據(jù)的有效性,從而獲取準確的平均值、標準差和變異系數(shù);根據(jù)SeaWiFS衛(wèi)星遙感數(shù)據(jù)大氣校正算法需要的閾值條件,設(shè)定太陽天頂角≤75°,衛(wèi)星天頂角≤60°;考慮在衛(wèi)星和實測數(shù)據(jù)同步的情況下,以獲取足夠的匹配驗證數(shù)據(jù),設(shè)定時間窗口≤±3 h;對于空間變異系數(shù)這個參數(shù)的設(shè)置,BAILEY et al[4]給出的推薦值是0.15,本文為了深入分析驗證誤差與變異系數(shù)的關(guān)系,將變異系數(shù)的值設(shè)定為0.3。實測-遙感數(shù)據(jù)的時空匹配過程由SeaBASS搜索引擎實現(xiàn)(網(wǎng)址為https://seabass.gsfc.nasa.gov/search#val),圖2為不同衛(wèi)星遙感數(shù)據(jù)與實測數(shù)據(jù)時空匹配后的空間分布圖。
圖2 不同葉綠素a質(zhì)量濃度遙感產(chǎn)品與實測數(shù)據(jù)時空匹配結(jié)果空間分布圖Fig.2 Spatial distribution map of validation matching results of different chlorophyll-aconcentration remote sensing products vs. in situ data
變異系數(shù)(Coefficient Variations:CV)定義為標準偏差與均值的比值,是描述遙感產(chǎn)品統(tǒng)計窗口內(nèi)數(shù)據(jù)變異特征的重要參數(shù),其物理內(nèi)涵是觀測屬性在特定的時間、空間范圍內(nèi)的變化大小。以空間統(tǒng)計窗口5×5為例,其計算公式如下
(1)
精度評價的指標參數(shù)有多種,本文主要選取平均絕對誤差(Mean Absolute Error:MAE)、平均絕對百分比誤差(Mean Absolute Percentage Errors:MAPE)、平均偏差(Mean Bias Error:MBE)、均方根誤差(Root Mean Square Error:RMSE)、標準差(Standard Deviation:SD)等5個精度評價參數(shù),各參數(shù)的計算公式如下。
MAE定義為誤差絕對值的平均值,反映遙感產(chǎn)品與實際觀測值之間的絕對誤差水平:
(2)
MAPE定義為絕對誤差與實際觀測值比值的平均值,代表遙感產(chǎn)品與實際觀測值相對誤差的程度:
(3)
MBE定義為誤差的平均值,代表遙感產(chǎn)品與實際觀測值之間的系統(tǒng)性偏差:
(4)
RMSE定義為遙感產(chǎn)品與現(xiàn)場觀測值的均方誤差,也代表了兩者之間的總體誤差水平:
(5)
ESD用于表述遙感產(chǎn)品誤差的離散程度:
(6)
為定量分析不同空間變異強度對驗證誤差的影響,將變異系數(shù)的范圍分成[0,0.10]、(0.10,0.15]、(0.15,0.20]、(0.20,0.30]四個區(qū)間進行分析,時間窗口范圍統(tǒng)一為±3 h。根據(jù)前文精度評價指標參數(shù)的選擇與分析,ESD用于表征遙感產(chǎn)品誤差的離散程度,不同傳感器各CV區(qū)間段ESD計算結(jié)果如表1所示。可以看出,ESD最大的是MODIS-Terra在 0.20
表1 不同衛(wèi)星傳感器在不同變異區(qū)間的匹配數(shù)據(jù)ESD指標計算結(jié)果Tab.1 ESD calculation results of different satellite sensor matching data in different CV interval
圖3 不同葉綠素a質(zhì)量濃度遙感產(chǎn)品與實測數(shù)據(jù)在不同空間變異區(qū)間內(nèi)的散點圖Fig.3 Scatter plot of different chlorophyll-a concentration remote sensing products and in situdata in different spatial variations interval
空間變異對海洋葉綠素a遙感產(chǎn)品驗證誤差評價指標影響的結(jié)果如圖4所示,從圖中看出,隨著變異系數(shù)CV的增加,MAE、MAPE、MBE、RMSE、ESD等指標值的結(jié)果總體上都在增加,表明空間變異是影響遙感產(chǎn)品驗證誤差的因素之一。從各個區(qū)間的數(shù)據(jù)結(jié)果來看,隨著變異系數(shù)的增加,驗證誤差也隨之逐漸增加,其中在區(qū)間0.2 圖4 不同葉綠素a質(zhì)量濃度遙感產(chǎn)品在不同空間變異區(qū)間的驗證誤差評價指標直方圖Fig.4 Statistical histogram of error evaluation indexes for validation of different chlorophyll-aconcentration remote sensing products in different spatial variations interval(a系列圖表示變異區(qū)間分開統(tǒng)計, b系列圖表示變異區(qū)間綜合統(tǒng)計。)(Series a figures show the independent statistics of variation ranges. Series b figures show the comprehensive statistics of variation ranges.) 同樣的結(jié)果也可以通過不同葉綠素a遙感產(chǎn)品誤差(遙感值和實測值的差值)的統(tǒng)計直方圖及其正態(tài)分布擬合結(jié)果(圖5)中看出:精度較好的遙感產(chǎn)品誤差正態(tài)分布擬合結(jié)果的峰寬更窄、峰值更高(如SeaWiFS,圖5d);而精度較差的遙感產(chǎn)品誤差正態(tài)分布擬合結(jié)果的峰寬更寬,峰值更低(如MODIS-Terra,圖5b),這一關(guān)系也驗證了前文關(guān)于誤差產(chǎn)生的機理解釋。 圖5 不同葉綠素a質(zhì)量濃度遙感產(chǎn)品誤差統(tǒng)計直方圖Fig.5 Statistical histogram of error for different chlorophyll-a concentration remote sensing products 在前文數(shù)據(jù)統(tǒng)計結(jié)果的基礎(chǔ)上,我們進一步探討誤差分布與空間變異系數(shù)的相關(guān)關(guān)系,并統(tǒng)計、建立模型。以MAPE為例,MAPE和CV的關(guān)系如圖6a所示,對圖中散點數(shù)據(jù)進行統(tǒng)計,計算CV統(tǒng)計間隔區(qū)間 0.015 內(nèi)的MAPE和CV平均值,最后通過模型擬合得出MAPE和CV的對應(yīng)變化關(guān)系(圖6b)。最優(yōu)擬合模型符合冪指數(shù)關(guān)系,表示隨著CV的增加,驗證誤差不斷增加,但誤差增加的幅度逐漸變緩(在CV<0.05時,MAPE隨CV的增加明顯,在CV>0.15后趨于平緩)。此外,CV從0.1增長至0.3,MERIS和SeaWiFS的誤增長差約20%,MODIS-Terra增長約50%,MODIS-Aqua則增長約120%。因此,對于CV值的閾值選擇需要根據(jù)不同的衛(wèi)星傳感器有所調(diào)整:對于MERIS和SeaWiFS產(chǎn)品數(shù)據(jù),CV≤0.15是較為合理的;但對于MODIS-Aqua和-Terra產(chǎn)品數(shù)據(jù),則應(yīng)該使用更嚴格的閾值,如CV≤0.1。 圖6 MAPE和CV關(guān)系散點圖(a)和模型擬合圖(b)Fig.6 Scatter plot between MAPE and CV (a) and model fitting curve(b)(b圖為以0.015為統(tǒng)計區(qū)間間隔的MAPE平均值及其擬合曲線。)(Fig.b shows that the mean value of MAPE and its fitting curve with 0.015 CV value as statistical interval.) 時空變異作為遙感產(chǎn)品驗證誤差和不確定性的主要來源之一,其中的空間變異對海洋葉綠素a遙感產(chǎn)品驗證誤差的影響,前文已經(jīng)進行了深入分析,蔣錦剛 等[11]在對SST時空變異特征及對驗證誤差影響的研究中,指出了SST的日循環(huán)變化引入的驗證誤差不容忽視。而海水中藻類的形成和消亡過程,受到光照、溫度、營養(yǎng)鹽和洋流的共同影響,其葉綠素a質(zhì)量濃度時間變異特征較SST的日循環(huán)變化更為復(fù)雜。為了定量分析時間變異對驗證誤差的影響,以0 圖7 不同葉綠素a質(zhì)量濃度遙感產(chǎn)品在不同時間變異區(qū)間的驗證誤差評價指標直方圖Tab.7 Statistical histogram of error evaluation indexes for validation of different chlorophyll-aconcentration remote sensing products in different temporal variations interval 由于不同衛(wèi)星傳感器波段的中心波長、帶寬和光學(xué)定標精度、不同的大氣校正算法都存在差異,這是遙感反演產(chǎn)品誤差和不確定性產(chǎn)生的首要原因。同時,葉綠素a質(zhì)量濃度遙感產(chǎn)品反演算法主要是通過現(xiàn)場原位測量的葉綠素a質(zhì)量濃度與遙感數(shù)據(jù)可見光譜藍綠波段的遙感反射率進行經(jīng)驗建模計算得出,傳感器的波段范圍主要選擇440~670 nm。不同的葉綠素a遙感反演算法也是遙感產(chǎn)品誤差和不確定性產(chǎn)生的原因之一,如CI算法在葉綠素a低值區(qū)域具有更好的擬合精度,并對儀器噪聲和有缺陷的大氣校正算法引起的各種誤差的敏感性要低得多[16]。 由于海水中藻類的生長受光照、營養(yǎng)鹽與洋流等諸多因素的影響,葉綠素a的含量在夏季會出現(xiàn)明顯的分層現(xiàn)象[20]和周日波動[21]。而實測數(shù)據(jù)通常是通過走航、浮標和按基站通過實驗室分析或在線儀器自動獲取,不同實測數(shù)據(jù)的獲取、分析測量形式以及采集水層的差異性也是遙感反演產(chǎn)品驗證誤差產(chǎn)生的原因之一。從前文的驗證結(jié)果可以看出,驗證參數(shù)平均偏差(MBE)的值在多種驗證情景下都處于負值,即衛(wèi)星遙感值高于實測數(shù)據(jù),這與Set al[22]的研究結(jié)果一致,葉綠素a在水柱中的不均勻分布是誤差產(chǎn)生的主要原因之一。 隨著海洋遙感技術(shù)的不斷發(fā)展,考慮時空關(guān)系的葉綠素a遙感反演新模型不斷被提出[23],人工智能的代表性機器學(xué)習(xí)技術(shù)也不斷向遙感領(lǐng)域滲透[24-25],海量歷史遙感數(shù)據(jù)的信息挖掘、時間序列結(jié)構(gòu)特征分析[26]以及不同衛(wèi)星遙感產(chǎn)品一致性融合的新算法與新技術(shù)也不斷被發(fā)展[14]。然而,遙感反演算法與遙感產(chǎn)品的精度仍然是不能回避的重要參數(shù)指標,科學(xué)驗證方法與誤差源解析,是發(fā)展新的反演算法、提高遙感產(chǎn)品精度、降低遙感產(chǎn)品不確定度的重要研究內(nèi)容。 本文以葉綠素a為研究對象,選擇MODIS-Aqua、MODIS-Terra、MERIS、SeaWiFS傳感器提供的葉綠素a質(zhì)量濃度遙感產(chǎn)品,定量分析了空間變異與驗證精度的關(guān)系,文章數(shù)據(jù)結(jié)果支持如下結(jié)論: (1)空間變異與驗證精度的統(tǒng)計分析結(jié)果證明了空間變異是造成驗證誤差的直接原因之一,以MERIS葉綠素a遙感產(chǎn)品的ESD結(jié)果為例,由于空間變異的存在,處于不同空間變異系數(shù)下的ESD值不同,當 0 (2)相比于空間變異而言,在時間窗口±3 h下,本文實驗數(shù)據(jù)結(jié)果并不能有效支撐時間變異是產(chǎn)生驗證誤差的原因,因此在葉綠素a遙感產(chǎn)品驗證中,空間搜索窗口的選擇仍然值得深入研究。 (3)不同衛(wèi)星傳感器葉綠素a遙感產(chǎn)品的精度特征是SeaWiFS精度最高,MERIS次之,MODIS-Terra精度最低。3 討論
3.1 時間變異影響分析
3.2 遙感產(chǎn)品與實測數(shù)據(jù)誤差成因討論
4 結(jié)論