王葉天鑒,胡昌華*
(1.廣州市城市規(guī)劃勘測設(shè)計研究院,廣東 廣州 510060)
云是由大氣中的水蒸氣遇冷液化成的小水滴或凝華成的小冰晶混合組成的漂浮在空中的可見聚合物,會造成特定時間段遙感數(shù)據(jù)的缺失或扭曲,不利于測繪產(chǎn)品的生產(chǎn)[1]。檢測和處理遙感數(shù)據(jù)中的云層有助于排除或減輕云的干擾,提高遙感數(shù)據(jù)質(zhì)量和測繪產(chǎn)品生產(chǎn)效率[2-3]。20 世紀(jì)70 年代以來,國內(nèi)外學(xué)者針對遙感數(shù)據(jù)中云層的檢測和處理展開了大量研究,早期主要針對中低分辨率的單幅多光譜遙感影像,運用的特征和方法較簡單[4];21 世紀(jì)以來,隨著傳感器技術(shù)的進步和以Landsat 系列為代表的遙感數(shù)據(jù)的逐步開源化[5],針對高分辨率、多源、多時相遙感數(shù)據(jù)的云層檢測和處理研究不斷發(fā)展,同時計算機領(lǐng)域的成果被不斷引入,大幅提高了云層檢測和處理的效率。
云層檢測和處理要求提取遙感數(shù)據(jù)具有代表性的特征。地物的輻射特征是被最早、最廣泛運用的特征[6]。隨著數(shù)據(jù)量的增加和理論研究的深入,空間特征和時間序列特征也得到了研究與應(yīng)用[7],積雪數(shù)據(jù)、數(shù)字高程模型、地表溫度數(shù)據(jù)等非遙感數(shù)據(jù)的引入進一步提高了檢測和處理效率[8]。多種特征的綜合運用提高了檢測和處理的效率,但不可避免地增加了云層檢測和處理方法的復(fù)雜度,且使云層檢測和處理逐漸成為兩個獨立的過程。云層檢測和處理緊密相關(guān)但并不相同,前者為了發(fā)現(xiàn)遙感數(shù)據(jù)中存在的云層,后者為了排除遙感數(shù)據(jù)中云層的干擾并盡可能還原被云層遮蔽地物的特征。目前,不少學(xué)者對云層檢測的方法進行了整理[9],但對云層處理方法的整理歸納尚未獲得足夠重視。本文基于現(xiàn)有文獻,按照“檢測—處理—評定”的順序,首先介紹特征的選擇;再分析和整理現(xiàn)有云層檢測和處理算法,并對它們的應(yīng)用情況進行簡要介紹;然后介紹現(xiàn)有主流的效果評定方法;最后歸納現(xiàn)有算法的不足之處,展望將來研究方向。
云層檢測要求對遙感數(shù)據(jù)進行分析處理,通過特定方法提取云層的獨特特征,以區(qū)分云層和其他地類目標(biāo)。云層檢測方法可大致劃分為基于物理機制、基于序列和基于機器學(xué)習(xí)3大類。
該類方法從云層的形成機制出發(fā),利用影響云層生成的重要因素和云層本身的物理特征進行建模,實現(xiàn)對云層和/或云層陰影的檢測;通常要求從遙感數(shù)據(jù)中獲取能有效區(qū)分云層和其他地物的特征,以確定一個或一組閾值,用于從遙感數(shù)據(jù)中分割出云層和/或云層陰影。常用的特征包括紋理特征、亮度特征、溫度特征、光譜特征[10-11]以及包括1.38 μm紅外波段在內(nèi)的針對高空云層的輻射特征[12]。該方法在云層檢測中得到了廣泛應(yīng)用,并被用于權(quán)威的遙感影像云層數(shù)據(jù)獲取。Fmask是其典型代表,針對Landsat系列衛(wèi)星的數(shù)據(jù)特點設(shè)計,以Landsat 的大氣表觀反射率和亮度溫度為輸入,建模區(qū)分潛在的云層和無云區(qū)域,并結(jié)合歸一化的溫度、光譜特異性和明度的概率分布模型進一步探測云層;同時利用云層陰影在近紅外波段的輻射特征,結(jié)合傳感器的空間姿態(tài)等信息,探測云層陰影[13]。針對Fmask 的改進和拓展使其在其他類型遙感數(shù)據(jù)中也得到了應(yīng)用[14-15],常用的同類方法包括SPOTCASM[16]、SAFNWC[17]、XBAER-CM[18]等。
該類方法通過定位多時相遙感數(shù)據(jù)中的明顯變化,判斷是否為云層造成的變化,并定位云層或無云區(qū)域。這種明顯變化可以是像素灰度值的變化,也可以是擬合的遙感時間序列數(shù)據(jù)模型的變化。該類方法需要一定數(shù)量且質(zhì)量滿足要求的無云數(shù)據(jù)作為基準(zhǔn)數(shù)據(jù),相較于傳統(tǒng)方法,對薄云、高層云和云層陰影擁有更好的探測效果,并能有效排除水面、人工建筑等造成的干擾[19],從20 世紀(jì)90 年代的ISCCP 計劃開始,便逐漸引起了科研工作者的注意[20]。MACSP[21]、BCT等早期算法[7]需要使用多時相遙感數(shù)據(jù)進行影像合成,對時間序列特征應(yīng)用不充分。隨著遙感數(shù)據(jù)量的增加和研究的深入,后續(xù)算法可直接處理多時相遙感數(shù)據(jù)構(gòu)成的時間序列[22-23]。Tmask是其典型代表[23],基于Landsat7 的數(shù)據(jù)設(shè)計,首先通過Fmask 分別處理多時相遙感數(shù)據(jù)中的每一份數(shù)據(jù);然后結(jié)合多時相遙感數(shù)據(jù)的時空信息,利用一種改進的迭代加權(quán)法分析Landsat7 的波段2(綠波段)、波段4(近紅外)和波段5(中紅外),逐像素構(gòu)建時間序列模型;最后與原始波段數(shù)據(jù)進行對比,以有效探測云層和云層陰影。與Fmask 相似,Tmask 也得到了改進和拓展,并顯著影響了后續(xù)云層檢測算法的設(shè)計[24-26]。
前兩類方法需對云層的先驗知識進行選擇,該類方法則將云層檢測視為一種特殊分類問題,對先驗知識的要求較低,根據(jù)訓(xùn)練數(shù)據(jù)構(gòu)建分類器,將遙感數(shù)據(jù)輸入分類器,獲取分類結(jié)果,再根據(jù)分類結(jié)果提取云層和/或云層陰影。貝葉斯網(wǎng)絡(luò)、支持向量機、神經(jīng)網(wǎng)絡(luò)、小波分析等傳統(tǒng)方法作為前兩類方法的輔助,在云層檢測中已得到廣泛應(yīng)用[27-30]。近10 年來,深度學(xué)習(xí)作為機器學(xué)習(xí)的進一步發(fā)展,被引入遙感領(lǐng)域[31]。深度學(xué)習(xí)方法基于數(shù)據(jù)本身,進一步獨立于物理模型等先驗知識,且能有效應(yīng)對大量的復(fù)雜數(shù)據(jù)和場景。卷積神經(jīng)網(wǎng)絡(luò)作為深度學(xué)習(xí)的經(jīng)典算法,在不同類型的遙感數(shù)據(jù)云層提取中得到了應(yīng)用[32-33],并被不斷改進和完善[34-35]。循環(huán)神經(jīng)網(wǎng)絡(luò)[36]以及DABNet、GeoInfoNet等包含物理機制信息和序列信息的針對地理數(shù)據(jù)的深度學(xué)習(xí)方法也被引入云層檢測的研究中[37-38]。
云層檢測結(jié)果本身就是一種地理數(shù)據(jù)產(chǎn)品[39];但在更復(fù)雜的應(yīng)用場合,單獨的云層檢測并不能滿足實際需求。這些應(yīng)用場合要求進一步排除云層對遙感數(shù)據(jù)的干擾,還原被云層干擾的地物信息,以提升遙感數(shù)據(jù)質(zhì)量,增加可用的遙感數(shù)據(jù)總量。因此,云層處理逐漸從云層檢測中獨立出來,并得到廣泛重視。針對不同種類的云層,提出了不同的方法,大致可分為針對厚云層的處理和針對薄云層的處理。
厚云層往往嚴(yán)重甚至完全遮蔽下方的地物目標(biāo),造成其幾何、輻射和紋理等特征嚴(yán)重扭曲甚至完全丟失。傳統(tǒng)針對厚云層的處理可概括為“剔除—置換”,即直接刪除云層檢測方法提取的待處理遙感數(shù)據(jù)上有厚云層的部分,再利用另一份作為參考的無云層數(shù)據(jù)進行置換。這類方法中,小波變換法和圖像修復(fù)法對云層分布和大小的要求較苛刻[40-41],而同態(tài)濾波法、影像融合法則對紋理等特征要求較苛刻[42]。以Landsat為代表的多時相遙感影像方法可有效解決上述問題。該類方法一些基于“剔除—置換”邏輯,以多時相遙感數(shù)據(jù)合成作為參考的無云數(shù)據(jù),以彌補傳統(tǒng)方法的不足[43];另一些則直接利用多時態(tài)的遙感數(shù)據(jù)建模,再利用構(gòu)建的時間序列模型推測被云層遮擋部分的原始數(shù)據(jù),不僅有效提高了遙感影像的數(shù)據(jù)質(zhì)量,而且增加了可判讀和解譯的遙感數(shù)據(jù)總量。參考文獻[44]將字典學(xué)習(xí)引入厚云層處理,并針對多時態(tài)遙感數(shù)據(jù)的時間相關(guān)性,對字典學(xué)習(xí)中的K-SVD和貝葉斯網(wǎng)絡(luò)部分進行拓展,對時間相關(guān)性進行建模,以實現(xiàn)對厚云層嚴(yán)重遮蔽目標(biāo)的定量數(shù)據(jù)恢復(fù)。參考文獻[45]提出了STWR 方法,避免了對無云基準(zhǔn)數(shù)據(jù)的過度依賴,使存在云層的數(shù)據(jù)也可參與時間序列模型的構(gòu)建。同時,深度學(xué)習(xí)的引入進一步改進了多時態(tài)遙感數(shù)據(jù)的建模,提高了模型的強健性[46-47]和還原數(shù)據(jù)的準(zhǔn)確性。
薄云層部分遮蔽下方的地物目標(biāo),這些地物目標(biāo)的幾何、輻射和紋理特征被扭曲,但可通過特定的算法還原。相對厚云層處理,薄云層處理更重視對被部分遮蔽地物目標(biāo)信息的還原。對薄云層進行處理且不破壞被部分遮蔽的地物目標(biāo)信息是一個挑戰(zhàn)。一些薄云層處理方法與厚云層處理方法類似,同樣按照“剔除—置換”流程進行[48],在特定場合也可用于厚云層處理。另一些方法則直接基于云層形成的物理機制進行建模,通過大氣校正同時完成云層檢測和處理,還原地物目標(biāo)的原始數(shù)據(jù)[49]。更多方法則致力于利用機器學(xué)習(xí)方法還原被部分遮蔽的地物目標(biāo)信息。同態(tài)濾波、自適應(yīng)濾波、模糊聚類、紋理分析等方法得到了廣泛應(yīng)用[50-53]。隨著以Landsat為代表的多時相遙感影像數(shù)據(jù)的逐步開源以及深度學(xué)習(xí)研究和應(yīng)用的不斷深入,基于多時相遙感影像的薄云層處理研究也廣泛展開[54-56]。這些方法不適用于厚云層處理。
不同應(yīng)用場合對云層檢測和處理效果的評定要求存在顯著差異,部分僅要求區(qū)分有云無云,部分需定量評估云層處理的效果[57-59]。整體精度和由其衍生得到的平均用戶精度作為常用的分類精度指標(biāo),被廣泛應(yīng)用于云層檢測的效果評估[13,16,23,26,37]。查全率、F1-score和交并比等指標(biāo)同樣得到了廣泛應(yīng)用[34,38]。云層的處理涉及對地物目標(biāo)還原效果的定性或定量評價,常用的評定指標(biāo)包括平均絕對誤差[44]、平均相對誤差[44]、均方根誤差[45]、平均結(jié)構(gòu)相似性[47,55-56]、平均峰值信噪比[55]、峰值信噪比和色度變化[56]等,僅部分場合使用云層檢測的評定指標(biāo)[48]。實際研究中,由于待處理數(shù)據(jù)類型、硬件性能、應(yīng)用場景等不同,不同方法使用的效果評定指標(biāo)往往存在明顯差異,不利于相互之間的效果比較。
云層檢測和處理的效果評定要求有可靠的參考數(shù)據(jù)進行對比。參考數(shù)據(jù)來源可分為人工標(biāo)記分類的遙感地物目標(biāo)庫[37-38,60-61]、激光點云和SAR 等非光學(xué)成像的遙感數(shù)據(jù)[62-63]和權(quán)威的云層觀測數(shù)據(jù)產(chǎn)品[6,64-65],這3 類參考數(shù)據(jù)互有側(cè)重,適用于不同場合。權(quán)威的云層觀測數(shù)據(jù)產(chǎn)品主要應(yīng)用于評定多光譜/高光譜單幅/多時相遙感數(shù)據(jù)的云層檢測和處理[66-67];人工標(biāo)記分類的遙感地物目標(biāo)庫普適性強,可應(yīng)用于評定各類遙感影像的云層檢測和處理;而激光點云和SAR等非光學(xué)成像的遙感數(shù)據(jù)則更多是作為光學(xué)遙感數(shù)據(jù)的輔助[68-69]。在部分場合,地面觀測數(shù)據(jù)也可作為參考數(shù)據(jù)[70]。
遙感影像上云層的檢測和處理研究取得了豐碩成果,獲取的測繪產(chǎn)品也在實際生產(chǎn)生活中得到了廣泛應(yīng)用。然而,目前的主流算法依然存在一些問題:首先當(dāng)?shù)乇泶嬖诖罅克颉⒈┗虺鞘薪ǔ蓞^(qū)或明顯的霧/霾時,對薄云的檢測和處理效果將受到嚴(yán)重干擾,且云層陰影檢測和處理算法效果明顯不如對云層本身的算法;其次目前的云層檢測和處理算法在基于物理機制的模型和基于機器學(xué)習(xí)的模型的應(yīng)用上,還不能對兩種模型進行有效結(jié)合;最后多源遙感數(shù)據(jù)在云層檢測和處理中仍以相同種類不同傳感器遙感數(shù)據(jù)的綜合應(yīng)用為主,不同種類傳感器數(shù)據(jù)的綜合應(yīng)用還停留在較初級的階段。
為解決上述問題,將來云層檢測和處理研究應(yīng)進一步引入深度學(xué)習(xí)的研究成果,并發(fā)展云端的基于統(tǒng)一框架的算法平臺,實現(xiàn)對多源遙感數(shù)據(jù)和多時相遙感數(shù)據(jù)的綜合應(yīng)用,以及對基于物理機制的模型和基于機器學(xué)習(xí)的模型的有機結(jié)合,從而實現(xiàn)對遙感影像上云層更準(zhǔn)確高效地檢測和處理。