張龍,王志勇,葉凱樂,常棟
(1.山東科技大學(xué) 測(cè)繪與空間信息學(xué)院,山東 青島 266590;2.中國測(cè)繪科學(xué)研究院,北京 100036)
海岸線是確定海岸帶管理范圍的重要依據(jù),然而,海岸線的侵蝕與增長已成為全世界廣為關(guān)注的問題之一[1]。黃河三角洲是中國乃至世界各大河三角洲中海陸變遷最活躍的地區(qū)[2],自1855年以來,由于受自然變化和人工干預(yù)影響,黃河經(jīng)歷了多次改道,黃河三角洲不斷向渤海延伸。在淤進(jìn)造陸[3]的同時(shí),三角洲也受到海洋動(dòng)力的侵蝕,在二者的雙重作用下,海岸線淤進(jìn)蝕退交替演變迅速。因此快速準(zhǔn)確了解和掌握海岸線的動(dòng)態(tài)變化特征,提取海岸線分布,對(duì)于海岸帶資源使用、管理、保護(hù)規(guī)劃及災(zāi)害的預(yù)防具有重要意義。
相比于光學(xué)傳感器,合成孔徑雷達(dá)(synthetic aperture radar,SAR)傳感器可以在不受時(shí)間和天氣的限制下連續(xù)工作,因此SAR數(shù)據(jù)更適合作為海岸線監(jiān)測(cè)的原始數(shù)據(jù)?;赟AR影像進(jìn)行海岸線的提取已經(jīng)成為現(xiàn)今重要的研究方向[4]。
目前,利用SAR影像提取海岸線的方法主要可分為三類:基于邊緣、基于區(qū)域和基于閾值的方法[5-6]?;谶吘壏椒ㄆ湓硎抢煤j戇吘壴谟跋裆纤从吵龅幕叶瓤臻g突變來尋找邊緣像素點(diǎn)[7],但其受SAR影像斑點(diǎn)噪聲影響較大且很容易出現(xiàn)內(nèi)陸地區(qū)虛檢測(cè)情況,這增加了海岸線提取工作的復(fù)雜性?;趨^(qū)域的方法是以圖像的全局或者局部同質(zhì)區(qū)域?yàn)閷?duì)象,相比基于邊緣的方法,具有抗噪性強(qiáng)、檢測(cè)邊緣連續(xù)的優(yōu)點(diǎn)[8],又可細(xì)分為面向?qū)ο蠓ê椭鲃?dòng)輪廓模型法。鄧瀅等[9]基于面向?qū)ο蟮乃枷?,提出一種高精度、低虛警率的SAR影像水體提取方法,其分割技術(shù)能夠保持完整的水陸邊界,但無法充分利用SAR影像中隱含的信息,使得提取精度降低。Liu 等[10]利用基于區(qū)域的幾何輪廓演化方法,其海岸線檢測(cè)結(jié)果更加準(zhǔn)確快速,但該方法需要給出初始輪廓,對(duì)于不同影像要進(jìn)行多次實(shí)驗(yàn)以取得最優(yōu)化的初始輪廓,需進(jìn)一步研究得以廣泛應(yīng)用?;陂撝捣椒ㄊ浅S玫暮j懛指罘椒?,因其實(shí)現(xiàn)簡單、計(jì)算量小而成為海岸線提取的一種常用方法[11],但其分割效果對(duì)確定閾值的依賴性強(qiáng),如很多學(xué)者應(yīng)用經(jīng)典OTSU閾值分割方法進(jìn)行海陸分割[12-13],但該算法并非針對(duì)分割水陸而設(shè)計(jì),因此所獲得的閾值并非最佳閾值。Nunziata等[14]對(duì)多極化SAR圖像提取海岸線進(jìn)行了一系列的研究,建立極化SAR物理模型以獲得海陸分割閾值對(duì)影像二值化以提取海岸線,但其仍受不同統(tǒng)計(jì)分布限制,無法適用于任意場(chǎng)景。
影像分類的方法進(jìn)行海岸線提取原理與基于閾值方法相同,區(qū)別在于以不同步驟獲得海陸二值圖像,以此來獲得海岸線的位置。全極化SAR包含了HH、HV、VH、VV 4種極化方式,可以展示不同模式下的圖像信息,描述的地面信息更加豐富,更大限度地揭示了地物的散射差別,更有利于將各類地物進(jìn)行區(qū)分[15]。本文針對(duì)目前利用SAR數(shù)據(jù)提取海岸線方法的各自局限性及閾值分割方法中最優(yōu)分割閾值較難確定的缺點(diǎn),考慮全極化SAR影像分類的巨大潛力及可行性,提出了一種結(jié)合SAR影像的極化及紋理特征,利用隨機(jī)森林分類獲得海陸分割閾值并進(jìn)行海岸線自動(dòng)提取的方法。利用多極化SAR數(shù)據(jù)的多特征性來增強(qiáng)海陸對(duì)比從而進(jìn)行分割,是基于多極化SAR數(shù)據(jù)影像方法提取海岸線的優(yōu)越性。
由于海岸線無時(shí)無刻不在發(fā)生著變化,且受海岸線類型等諸多原因影響,真正海岸線的位置難以確定,因此,本文將衛(wèi)星過境時(shí)的瞬時(shí)水邊線認(rèn)定為海岸線進(jìn)行實(shí)驗(yàn),該定義方法也是一種國內(nèi)外較為認(rèn)可的海岸線確定方法[16]。
針對(duì)黃河三角洲復(fù)雜的背景條件,基于高分三號(hào)全極化SAR數(shù)據(jù),提出了一種結(jié)合多特征選擇和隨機(jī)森林分類算法的海岸線提取方法,通過極化分解提取極化特征、灰度共生矩陣提取紋理特征,并進(jìn)行特征的優(yōu)化選擇,得到最優(yōu)特征參數(shù)組合,對(duì)最優(yōu)特征組合進(jìn)行分類、水陸分割及海岸線的提取。將海岸線提取結(jié)果與閾值分割算法海岸線提取結(jié)果做精度對(duì)比。
目標(biāo)極化分解提取的特征是與物理散射相關(guān)的極化特征,直接與物理意義相聯(lián)系,如奇次散射、偶次散射、體散射等。利用SAR影像上水體的散射特征相對(duì)其他地物差異較大的特點(diǎn),將極化分解的分量組合構(gòu)建特征向量,發(fā)揮各自的特征優(yōu)勢(shì),能提高分類效果[17],更有效地區(qū)分水體與其他地物類型。本文選擇了3種極化分解方法:Pauli分解[18]、Krogager分解[19]和H/α/A分解[20]。
水體與其他地物在SAR圖像上表現(xiàn)為不同的紋理特征,且紋理作為區(qū)域統(tǒng)計(jì)量,減弱了噪聲對(duì)區(qū)域特征的影響,穩(wěn)定性更強(qiáng)。因此,有必要將紋理特征作為分類參數(shù)的一種,提高分類的精度。由Haralick[21]于1973年提出的基于灰度級(jí)共現(xiàn)矩陣(gray level co-occurrence matrix,GLCM)的特征被廣泛應(yīng)用于紋理分割中,是目前最常見、應(yīng)用最廣泛、效果最好的一種紋理統(tǒng)計(jì)分析方法。GLCM的構(gòu)造依賴于兩個(gè)參數(shù),即相對(duì)距離(d)和方向(φ),在像素對(duì)之間,d以像素?cái)?shù)來度量,φ通常從4個(gè)方向(水平-0°、對(duì)角線-45°、垂直-90°和反對(duì)角線-135°)度量。GLCM的計(jì)算公式參見文獻(xiàn)[21]。
在極化SAR影像分類中,利用多特征更準(zhǔn)確地反映出地物差異,有效地改善分類結(jié)果精度。特征的組合不是固定的,較多的特征參數(shù)會(huì)造成數(shù)據(jù)的冗余,增加計(jì)算量的同時(shí)影響了分類效率[22];較少的特征參數(shù)不能準(zhǔn)確地表達(dá)地物特點(diǎn),從而降低分類精度,因此需要對(duì)所提取的特征進(jìn)行降維選擇[23]。本文所遵循的原則是特征之間低相關(guān)性及特征本身信息豐富性,并以此選擇出最優(yōu)特征組合。
隨機(jī)森林(random forest)算法是Breiman[24]于2001年提出的一種基于決策樹的集成算法,它的基本單元是決策樹。每棵決策樹都是一個(gè)分類器,那么N棵樹會(huì)有N個(gè)分類結(jié)果。這些決策樹組成的集合構(gòu)成隨機(jī)森林,最后取所有決策樹的預(yù)測(cè)平均值作為最終預(yù)測(cè)結(jié)果。隨機(jī)森林集成了所有的分類投票結(jié)果,將投票次數(shù)最多的類別指定為最終輸出,它可以很方便地并行訓(xùn)練。
圖像二值化后,總會(huì)存在一些異質(zhì)斑塊,因此利用孔洞填充算法去除這些異質(zhì)區(qū)域,孔洞填充算法[25]的基本思想是:從圖像的多邊形區(qū)域的一個(gè)內(nèi)點(diǎn)開始,該點(diǎn)即被稱為種子點(diǎn),由內(nèi)向外用給定的顏色填充直到邊界為止。種子填充算法常用的方法有四向聯(lián)通填充方法和八向聯(lián)通填充方法。
算法流程如圖1所示,填充由內(nèi)部像素點(diǎn)所組成的多邊形區(qū)域,取種子像素是(4,3)。具體的填充流程從種子像素出發(fā),沿線段路徑填充,當(dāng)周圍像素均為所給出像素值,則該填充流程完畢。
圖1 種子填充算法流程圖
本文聯(lián)合極化特征和紋理特征的隨機(jī)森林分類算法對(duì)黃河三角洲地區(qū)海岸線提取的具體步驟如下,提取流程如圖2所示。
1)高分三號(hào)數(shù)據(jù)進(jìn)行預(yù)處理。預(yù)處理過程包括輻射定標(biāo)、極化矩陣轉(zhuǎn)換得到極化矩陣T3、ReLee濾波及地理編碼等處理。
2)極化特征提取。對(duì)極化矩陣T3進(jìn)行極化目標(biāo)分解,基于Pauli分解、H/α/A分解和Krogager分解,提取9個(gè)極化特征。
3)紋理特征提取。本文沒有直接計(jì)算高分三號(hào)極化影像的紋理,而是基于其HV極化和HH極化,利用雷達(dá)水體指數(shù)模型最大化水陸差異,計(jì)算模型結(jié)果的灰度共生矩陣來提取圖像的紋理特征。
4)特征優(yōu)選。利用特征選擇模型,在所獲得的極化紋理特征中進(jìn)行篩選,選擇9個(gè)特征構(gòu)建特征向量并進(jìn)行分類。
5)確定分類的類別數(shù),選擇訓(xùn)練樣本,訓(xùn)練隨機(jī)森林分類器。特征向量作為輸入數(shù)據(jù),應(yīng)用訓(xùn)練好的隨機(jī)森林分類器,獲得分類結(jié)果圖像。
6)分類結(jié)果進(jìn)行類別合并獲得海陸二值圖像,利用孔洞填充算法去除二值圖像中的艦船、近岸養(yǎng)殖池等有干擾性質(zhì)的斑塊區(qū)域,對(duì)優(yōu)化后的二值圖像利用邊緣檢測(cè)算法提取獲得最終的海岸線。
7)參照編碼后的SAR影像和天地圖影像通過人工勾繪方式獲得實(shí)驗(yàn)區(qū)域的參考海岸線,對(duì)本文方法提取的海岸線進(jìn)行精度分析。
圖2 實(shí)驗(yàn)流程圖
實(shí)驗(yàn)區(qū)為山東省東營市東北部的黃河三角洲部分地區(qū),北鄰渤海,東接萊州灣。黃河三角洲地處中緯度,位于暖溫帶,背陸面海,受歐亞大陸和太平洋的共同影響,屬于暖溫帶半濕潤大陸性季風(fēng)氣候區(qū),冬寒夏熱,四季分明[26]。黃河所攜帶的大量泥沙,導(dǎo)致黃河三角洲正不斷向海洋延伸,成為世界上最年輕的陸地之一[27]。選擇兩景位于黃河三角洲的GF-3全極化條帶1(QPS1)模式的Level 1A級(jí)(即單視復(fù)影像,SLC)圖像進(jìn)行海岸線提取實(shí)驗(yàn)。兩景GF-3影像的成像時(shí)間分別為2018年11月5日和2019年3月13日,空間分辨率均為8 m。實(shí)驗(yàn)數(shù)據(jù)極化假彩色合成圖如圖3所示。
圖3 實(shí)驗(yàn)區(qū)域Pauli假彩色合成圖
對(duì)極化矩陣T3進(jìn)行極化分解,基于Pauli分解、H/α/A分解和Krogager分解獲得以下極化特征:Pauli分解體散射分量PVOL、Pauli分解奇次散射分量PODD、Pauli分解偶次散射分量PDBL、Krogager分解球散射體分量Ks、Krogager分解螺旋體分量Kh、Krogager分解二面角散射體分量Kd、H/α/A分解極化散射熵H、H/α/A分解反熵A、H/α/A分解平均散射角α。極化分解合成結(jié)果如圖4所示。
圖4 極化分解合成圖
基于灰度共生矩陣提取以下紋理特征:均值、方差、同質(zhì)性、反差、差異性、熵、角二階矩相關(guān)性。所獲得的初始特征集包括9個(gè)極化特征和8個(gè)紋理特征。將所提取的17個(gè)特征進(jìn)行特征優(yōu)選,所選擇的最優(yōu)特征參數(shù)組合中各個(gè)特征的詳細(xì)信息如表1所示,利用優(yōu)擇的特征參數(shù)構(gòu)建特征向量并分類。
表1 篩選后的特征參數(shù)
由于黃河三角洲地區(qū)地物類型錯(cuò)綜復(fù)雜,僅選擇水陸兩類樣本其分類誤差大且耗時(shí)長,為獲得較好分類結(jié)果及保證分類效率,本文確定類別數(shù)量為4類(水體、植被、潮間帶、其他)。利用兩幅影像數(shù)據(jù)以相同的訓(xùn)練樣本進(jìn)行分類實(shí)驗(yàn),其初始分類結(jié)果如圖5所示。
圖5 初始分類結(jié)果
根據(jù)初始分類結(jié)果,首先進(jìn)行類別的合并獲得初始海陸二值圖像,二值圖像如圖6(a)所示??煽闯?,在白色的陸地區(qū)域存在黑色的池塘、水田、河道等白色水體區(qū)域,在黑色的海面區(qū)域內(nèi)存在的大量的白色雜散點(diǎn),為提高提取精度及減少人工工作量,利用孔洞填充算法來填充這些斑塊區(qū)域,進(jìn)行海陸二值圖像的優(yōu)化,優(yōu)化結(jié)果如圖6(b)所示。
最后利用Canny二值圖像邊緣檢測(cè)算子提取海陸邊界線,獲得矢量的瞬時(shí)海岸線。本文方法和OTSU法的兩幅影像海岸線提取結(jié)果如圖7和圖8所示,在圖8(c)中可看出閾值方法提取的結(jié)果存在著一些誤分區(qū)域。
圖6 海陸二值圖
圖8 OTSU閾值法海岸線提取結(jié)果
真實(shí)的參考海岸線難以獲取,以人工勾繪的海岸線作為參考海岸線,對(duì)本文方法的海岸線提取結(jié)果精度進(jìn)行分析,并與OTSU閾值分割方法得到的海岸線提取結(jié)果作對(duì)比。為定量分析提取方法的精度,本文基于ROC[28]曲線匹配原則,選擇緩沖區(qū)分析方法[29]為評(píng)價(jià)方法,其主要思想是計(jì)算驗(yàn)證海岸線落在參考海岸線緩沖區(qū)的像素點(diǎn)個(gè)數(shù),實(shí)現(xiàn)對(duì)提取結(jié)果的定量分析,其示意圖如圖9所示。
圖9 緩沖區(qū)分析示意圖
評(píng)價(jià)步驟為:首先以人工提取的參考海岸線為匹配標(biāo)準(zhǔn),建立緩沖區(qū),緩沖區(qū)寬度r為20 m和40 m,并以各個(gè)岸線提取結(jié)果的長度為權(quán)Pi,在提取的海岸線上取NPi個(gè)點(diǎn),判斷點(diǎn)相對(duì)于緩存區(qū)的位置,判定點(diǎn)位于緩沖區(qū)內(nèi)的點(diǎn)個(gè)數(shù)記為TP1(true positive),緩沖區(qū)外地點(diǎn)個(gè)數(shù)記為FP(false positive);然后建立提取海岸線的緩沖區(qū),并在參考海岸線上取點(diǎn),如果點(diǎn)落入該緩沖區(qū),認(rèn)為其同提取的海岸線相匹配,點(diǎn)的個(gè)數(shù)記為TP2,否則定義為不匹配,個(gè)數(shù)即為FN(false negative)。定義correct、complete、quality 3個(gè)參數(shù)指標(biāo)[30],分別表示海岸線提取結(jié)果的正確程度、完整程度和提取質(zhì)量。海岸線提取結(jié)果的精度對(duì)比如表2所示。
表2 海岸線提取結(jié)果精度對(duì)比
由表可以看出無論哪種緩沖區(qū)半徑,本文方法精度都要優(yōu)于OTSU閾值分割方法;且當(dāng)緩沖區(qū)半徑增加,兩幅影像的海岸線提取結(jié)果各項(xiàng)精度指標(biāo)有明顯提升,當(dāng)緩沖區(qū)半徑為40 m時(shí),其提取結(jié)果的完整性、正確度及提取質(zhì)量都在90%以上,提取結(jié)果的可靠性高。
紋理提取過程中,不同計(jì)算參數(shù)對(duì)結(jié)果紋理的豐富度存在較大影響。本文紋理提取參數(shù)選擇如下:比較自己所選擇的實(shí)驗(yàn)數(shù)據(jù),影像紋理信息在對(duì)角方向上比較多,因此確定窗口滑動(dòng)方向?yàn)橛蚁?5°?;瑒?dòng)步長選擇為1,即滑動(dòng)窗口每個(gè)中心像素均與鄰近像素進(jìn)行比較,不易丟失紋理信息。紋理分析中,過小的窗口不能很好表示紋理信息,過大的窗口會(huì)掩蓋紋理間的差異。變異系數(shù)可以用來衡量紋理濾波窗口的大小合適與否,變異系數(shù)大,說明變異幅度大,整齊性較差,穩(wěn)定性?。环粗?,變異系數(shù)小,說明變異幅度小,整齊性較好,穩(wěn)定性大,變異系數(shù)計(jì)算方法見文獻(xiàn)[31]。
選擇同質(zhì)性、反差、差異性、角二階矩和相關(guān)性來計(jì)算各個(gè)特征變異系數(shù),分析其變化情況結(jié)果,如圖10所示,并根據(jù)圖中變異系數(shù)曲線變化來確定紋理提取窗口的大小。
圖10 變異系數(shù)隨窗口增大變化曲線
從圖10可以看出,隨著窗口大小的逐漸增加,從7×7窗口大小開始,不同紋理統(tǒng)計(jì)量的變異系數(shù)也趨于穩(wěn)定,因此,在窗口大小的選擇上,7×7的滑動(dòng)窗口最為合適。綜上,本實(shí)驗(yàn)進(jìn)行紋理特征提取的參數(shù)如下:矩形窗口大小為7×7,方向?yàn)?5°,步長為1,灰度量化級(jí)為32。
本文在分類方法的選擇上做了一些工作,利用相同的訓(xùn)練樣本及輸入特征,采用最大似然比分類、隨機(jī)森林分類、神經(jīng)網(wǎng)絡(luò)分類、支持向量機(jī)分類4種方法,對(duì)兩幅研究區(qū)影像數(shù)據(jù)(影像數(shù)據(jù)1、影像數(shù)據(jù)2)的特征選擇結(jié)果進(jìn)行分類,比較分類結(jié)果的精度,選擇較好的分類方法。針對(duì)兩幅影像數(shù)據(jù),4種分類方法的分類精度如表3所示。
表3 分類方法精度對(duì)比
由表3可以看出,最大似然分類方法和神經(jīng)網(wǎng)絡(luò)分類方法在面對(duì)兩種不同影像數(shù)據(jù)時(shí)其分類結(jié)果表現(xiàn)得不夠穩(wěn)定,而隨機(jī)森林分類方法和支持向量機(jī)分類方法則都有較好的穩(wěn)定性,且隨機(jī)森林方法的精度最優(yōu),因此選擇隨機(jī)森林分類方法為本文的分類方法。
本文利用極化分解及灰度共生矩陣分別提取了共計(jì)9種極化特征及8種紋理特征,并進(jìn)行特征優(yōu)選,選擇9個(gè)特征組成最優(yōu)特征組合進(jìn)行隨機(jī)森林分類獲得水陸二值圖像,孔洞填充算法對(duì)二值圖像優(yōu)化后,利用邊緣檢測(cè)算子追蹤二值圖像邊緣得到研究區(qū)域的海岸線。
為避免單幅影像出現(xiàn)提取結(jié)果精度偶然性的影響,選擇了兩景全極化SAR影像數(shù)據(jù)進(jìn)行實(shí)驗(yàn)。相比于利用閾值分割法或是邊緣檢測(cè)法直接提取SAR影像中的海岸線,全極化SAR影像進(jìn)行大范圍的海岸線提取能有效利用多極化信息的豐富性提高海陸辨識(shí)度,具有提取精度高、海岸線連續(xù)的優(yōu)點(diǎn),在40 m分析精度情況下,兩幅影像提取質(zhì)量均達(dá)到了90%以上,方法結(jié)果穩(wěn)定可靠。
本文方法從精度上來看,可以代替人工目視解譯的方法從極化SAR數(shù)據(jù)中提取海岸線,但仍存在著一些不足,如提取的海岸線為獲取數(shù)據(jù)時(shí)刻的瞬時(shí)海岸線等問題,后續(xù)的工作還要針對(duì)這些方面進(jìn)行研究,并針對(duì)海岸線提取的自動(dòng)化和提取精度作進(jìn)一步提高。