丁澤剛 孫 濤 王 震* 趙 健 史一鵬 陳浩龍 陳之洲 王 巖 曾 濤
①(北京理工大學(xué)信息與電子學(xué)院雷達技術(shù)研究所 北京 100081)
②(衛(wèi)星導(dǎo)航電子信息技術(shù)教育部重點實驗室(北京理工大學(xué)) 北京 100081)
③(北京理工大學(xué)重慶創(chuàng)新中心 重慶 401120)
干涉合成孔徑雷達[1,2](Interferometric Synthetic Aperture Radar,InSAR)測量是一種強大的微波遙感技術(shù),可通過兩(或多)幅存在空間基線的SAR圖像來獲取干涉相位,并基于相位信息解算目標(biāo)高程,實現(xiàn)數(shù)字高程模型(Digital Elevation Model,DEM)的獲取。
相位解纏(Phase Unwrapping,PU)是InSAR處理的核心環(huán)節(jié),解纏質(zhì)量將直接影響DEM產(chǎn)品的精度。就單通道(單頻、單基線)相位解纏而言,其本質(zhì)是一個病態(tài)問題。在單通道InSAR觀測構(gòu)型下,僅可獲取目標(biāo)場景的單一通道的干涉圖,相位解纏需基于相鄰像素的相位梯度積分進行。這一處理方式將嚴(yán)格受限于Itoh假設(shè)[3],該假設(shè)要求相鄰像素間的真實干涉相位差位于 (-π,π]區(qū)間,約束了相鄰像素間的高程差。當(dāng)目標(biāo)場景的高程變化劇烈時,將出現(xiàn)相位欠采樣問題,導(dǎo)致單通道相位解纏失敗[4]。
近年來,以多頻[5,6]、多基線[7]觀測構(gòu)型為代表的多通道InSAR技術(shù)迅速發(fā)展[8],為上述問題的解決提供了有效途徑。不同于單通道相位解纏的相位梯度積分處理,多通道InSAR可借助干涉通道自由度的提升,利用不同通道間的高程模糊度差異直接獲取目標(biāo)點的解纏相位,突破了Itoh假設(shè)的限制,有效提升了InSAR技術(shù)在測繪困難區(qū)域的適應(yīng)性[9,10]。
目前,單通道相位解纏算法已較為成熟,主要包括路徑積分類、最小二乘類、網(wǎng)絡(luò)規(guī)劃類等。隨著多頻、多基線InSAR系統(tǒng)的快速發(fā)展,多通道相位解纏算法也已經(jīng)過了大量系統(tǒng)的驗證,主要包括:基于干涉相位統(tǒng)計模型的最大似然估計(Maximum Likelihood Estimation,MLE)算法[11]、最大后驗(Maximum a Posteriori,MAP)估計算法[12]等;基于干涉相位算數(shù)性質(zhì)的中國余數(shù)定理(Chinese Remainder Theorem,CRT)算法[13]、聚類(Cluster Analysis,CA)算法[14]等;以及由單通道相位解纏思路拓展而來的基于MLE的相位梯度積分算法[15]、基于鄰點集的相位梯度積分算法[16,17]、兩級規(guī)劃(Two-Stage Programming Approach,TSPA)算法[18]等。隨著上述算法的迭代更新,相位解纏技術(shù)正向著高時效、高精度和強適應(yīng)的方向發(fā)展。
隨著高分辨、大幅寬InSAR系統(tǒng)的不斷推出,大規(guī)模干涉圖的高效解纏成為當(dāng)前InSAR技術(shù)發(fā)展的瓶頸。因此,在處理效率方面具有突出優(yōu)勢的深度學(xué)習(xí)技術(shù)成為當(dāng)前相位解纏方法研究的熱點領(lǐng)域。目前的研究已經(jīng)發(fā)展出部分可用于相位解纏的深度神經(jīng)網(wǎng)絡(luò),如基于枝切法的深度學(xué)習(xí)解纏方法[19]、PGNet[20]及DLPU[21]等。但上述所提到的基于深度學(xué)習(xí)的解纏方法均基于單通道解纏思路,在噪聲抑制及地形適應(yīng)性方面仍有不足。在基于深度學(xué)習(xí)的多通道聯(lián)合相位解纏網(wǎng)絡(luò)方面,目前的研究較為有限,已有研究成果的典型代表為CANet[22]。該方法由CA算法拓展而來,通過深度卷積神經(jīng)網(wǎng)絡(luò)(Deep Convolutional Neural Network,DCNN)完成像素簇聚類處理,為基于深度學(xué)習(xí)的多通道聯(lián)合相位解纏技術(shù)的可行性提供了例證。在該方法的處理中,并非將神經(jīng)網(wǎng)絡(luò)直接用于獲取解纏相位或相位模糊數(shù),而是用于完成聚類處理這一關(guān)鍵步驟。這一處理方式有效提升了聚類質(zhì)量及效率,聚類結(jié)果則作為后續(xù)處理的輸入,以便結(jié)合較為成熟的相位梯度積分類算法獲取解纏相位。
作為多通道相位解纏與深度學(xué)習(xí)技術(shù)的另一種嘗試,本文的研究則聚焦于基于多通道干涉相位直接獲取相位模糊數(shù),利用多通道相位間的相互約束進行解纏誤差抑制,并采用盡量簡單的后處理完成相位解纏。本文所提出的網(wǎng)絡(luò)為多通道聯(lián)合InSAR相位解纏網(wǎng)絡(luò)(Multi-Channel-Joint-UNet,MCJUNet),其構(gòu)建的核心思路如下:首先,該網(wǎng)絡(luò)聚焦模糊數(shù)估計這一相位解纏中的核心環(huán)節(jié),將相位解纏問題轉(zhuǎn)換為語義分割問題,并采用多輸出UNet網(wǎng)絡(luò)[23]完成對多通道模糊數(shù)的估計;其次,在網(wǎng)絡(luò)各解碼路徑的輸入和編碼路徑的輸出之間,引入擠壓激勵模塊(Squeeze-and-Excitation,SE)[24]動態(tài)調(diào)整特征信息權(quán)重,增強不同輸出通道對其所需信息的感知能力;最后,利用多通道相位關(guān)系和網(wǎng)絡(luò)輸出模糊數(shù)概率的特點,構(gòu)建了多通道聯(lián)合約束下的相位殘差優(yōu)化損失函數(shù),以增強網(wǎng)絡(luò)對多通道相位特性的學(xué)習(xí)能力。此外,為避免語義分割結(jié)果在邊緣區(qū)域的細(xì)節(jié)誤差對解纏效果的影響,本文還提出一種基于多通道聯(lián)合約束的解纏誤差自修正方法,以保證解纏質(zhì)量。
此外,需要說明的是,由于雙通道與多通道聯(lián)合相位解纏的機理及處理方法一致,本文針對MCJ-UNet的網(wǎng)絡(luò)構(gòu)建原理解釋、網(wǎng)絡(luò)架構(gòu)描述以及實驗驗證等均是在典型的雙通道(雙頻、雙基線)構(gòu)型下進行的。針對雙通道向多通道相位解纏網(wǎng)絡(luò)的拓展,本文也在相應(yīng)部分進行了說明。
通過存在空間基線的兩部SAR天線同時(或單部SAR天線重軌)觀測,可獲取同一場景的兩幅SAR圖像,并在此基礎(chǔ)上提取干涉相位。InSAR處理的核心即為對干涉相位的處理,其本質(zhì)是通過干涉相位重構(gòu)精確的觀測幾何,并通過幾何信息解算高程。其中,相位解纏是InSAR處理的關(guān)鍵環(huán)節(jié),解纏相位與目標(biāo)高程間的關(guān)系如式(1)所示:
其中,h為觀測目標(biāo)高程,φ為解纏相位,Hamb為高程模糊度,該參數(shù)代表相位每變化 2π所對應(yīng)的高程變化量,也是衡量InSAR系統(tǒng)的測高靈敏度的重要參考。在不考慮基線、波長等變化引入的空間去相干的前提下,高程模糊度越小,InSAR系統(tǒng)對目標(biāo)高程變化的感知越敏銳,對應(yīng)的干涉條紋也將越密集。高程模糊度的計算如式(2)所示:
其中,λ=c/f,λ為雷達系統(tǒng)波長,c為光速,r為斜距,θ為入射角,P代表不同的工作模式,單發(fā)雙收(雙天線)模式下P=1,自發(fā)自收(重軌)模式下P=2,B為垂直基線。結(jié)合式(1)及式(2)可知,基于系統(tǒng)參數(shù)及觀測幾何信息,通過解纏相位φ即可獲取目標(biāo)高程h。
由式(2)可知,高程模糊度與頻率、基線都呈反比,InSAR系統(tǒng)的工作頻率越高,或基線越長,對應(yīng)的高程模糊度越小,越容易獲取高精度的高程信息。然而,較高的頻率或者較長的基線均會導(dǎo)致空間相干性的降低,加劇相位噪聲,導(dǎo)致高程測量誤差。所以,傳統(tǒng)單通道InSAR常存在高程模糊度與空間相干性間的矛盾。
面向目標(biāo)高程的有效提取,相位解纏成為In-SAR處理的核心環(huán)節(jié)。其中,纏繞相位φ與解纏相位φ之間存在如式(3)的關(guān)系:
其中,纏繞相位φ在 (-π,π]區(qū)間內(nèi),k為整數(shù)(即為模糊數(shù))。相位解纏的目的即為通過纏繞相位φ求取與高程呈比例關(guān)系的解纏相位φ。然而,式(3)中存在k和φ兩個未知量,其解并不唯一,故其本質(zhì)是一個不適定問題(病態(tài)問題)。
為實現(xiàn)單通道相位解纏,需采用鄰域聯(lián)合處理,并通過Itoh假設(shè)對該問題加以約束,即要求相位滿足連續(xù)性,相鄰像素間的真實相位差需位于(-π,π]區(qū)間。在該約束下,相位解纏可通過相鄰像素點間的相位梯度積分實現(xiàn)。
然而,在實際地形中,劇烈高程起伏將導(dǎo)致干涉相位無法滿足Itoh假設(shè),使得單通道解纏失效。如圖1所示,A,B,C為相鄰的3個分辨單元,ΔφBA及 ΔφCB分別為B與A、C與B間的真實相位差,ΔφBA及 ΔφCB分別為B與A、C與B間的纏繞相位差,且 ΔφBA=ΔφBA,ΔφCB=ΔφCB。若已獲取A點的解纏相位,則基于 ΔφBA(相位差),通過路徑積分方式即可獲取B點的解纏相位。但是B,C兩點之間的高程存在劇烈的起伏,導(dǎo)致相位欠采樣,使得 ΔφCB超過 π。此時通過纏繞相位估計所得的相位梯度 ΔφCB將存在模糊,無法基于路徑積分方式獲取C點的解纏相位,導(dǎo)致解纏誤差積累,并最終引入高程反演誤差。因此,傳統(tǒng)單通道InSAR相位解纏方法難以適應(yīng)高程起伏劇烈區(qū)域的處理。
圖1 相位解纏示意Fig.1 Schematic diagram of phase unwrapping
為解決單通道相位解纏技術(shù)在地形劇烈起伏區(qū)域的適應(yīng)性不足的問題,多通道InSAR系統(tǒng)及多通道相位解纏技術(shù)應(yīng)運而生。其中,多通道InSAR有兩類主要的實現(xiàn)方式:多頻InSAR及多基線InSAR。就系統(tǒng)構(gòu)建而言,多頻InSAR系統(tǒng)需要在單一搭載平臺上同時部署兩(或多)部頻率差較大的SAR載荷(如中國測繪科學(xué)研究院的CASMSAR[25]、中國科學(xué)院空天信息創(chuàng)新研究院的MSJosSAR[26]等),且各部載荷需同時工作,使得系統(tǒng)的硬件成本較高,實現(xiàn)也較為困難;而多基線InSAR系統(tǒng)則需在單一搭載平臺部署多部SAR天線(如中國科學(xué)院空天信息創(chuàng)新研究院的Array InSAR[27]系統(tǒng)、MV3DSAR[28]系統(tǒng)等),硬件成本將有所降低。此外,多基線InSAR也可通過單部SAR天線的多次重軌觀測實現(xiàn),可通過時間代價進一步壓縮硬件成本,成為目前主流的多通道InSAR觀測模式。
無論采用多頻還是多基線InSAR觀測模式,其進行相位解纏處理的本質(zhì)不變,均是通過頻率或基線的改變獲取目標(biāo)區(qū)域在不同高程模糊度下的干涉圖,借助干涉通道自由度的提升規(guī)避相位解纏中的路徑積分問題,從而突破Itoh假設(shè)的限制,實現(xiàn)穩(wěn)健的相位解纏。此處以雙通道InSAR為例,通過已獲取的不同高程模糊度對應(yīng)的干涉相位,可以給出如式(4)的約束關(guān)系:
其中,Hamb1及Hamb2分別為通道1和通道2的高程模糊度,φ1及φ2分別為對應(yīng)的解纏相位。將式(3)代入式(4)可得
其中,k1及k2分別為通道1和通道2的模糊數(shù)。在同一目標(biāo)點的高程固定不變的前提下,模糊數(shù)及其對應(yīng)的高程解算可視為解“同余方程”的問題,通過CRT算法即可求解[13]。此外,基于干涉相位的概率統(tǒng)計特性同樣可推導(dǎo)多通道相位間的約束關(guān)系,并由此推出了MLE算法(此處不再贅述)。為了實現(xiàn)相位解纏中的噪聲抑制,引入鄰域聯(lián)合處理或先驗統(tǒng)計模型的改進算法也被相繼推出,如閉合形式的CRT算法[29]、基于線性約束的MLE算法[11]、MAP算法等[12]。
然而,上述處理算法或涉及逐像素估計、逐窗口估計、逐窗口超參數(shù)迭代等處理,運算量較大,難以滿足大規(guī)模干涉圖的高效解纏需求。因此,本文考慮使用深度學(xué)習(xí)結(jié)合的方法,在保證精度的同時實現(xiàn)高效的解纏。
在相位解纏中,用于解纏處理的干涉圖呈條紋狀形式,干涉條紋(去除平地相位后)的密集程度由地形起伏形式及高程模糊度共同決定。地形起伏越劇烈,高程模糊度越小,對應(yīng)的干涉條紋越密集,相位解纏也越困難。當(dāng)干涉條紋過于密集,直至發(fā)生相位欠采樣時,單通道相位解纏隨之失效。
在多通道InSAR處理中,相位解纏可轉(zhuǎn)化為適定問題,其核心是在各通道的相互約束下獲取纏繞相位對應(yīng)的模糊數(shù)k,并在此基礎(chǔ)上解算解纏相位,從而依據(jù)式(1)反演高程。
針對多通道干涉圖,其模糊數(shù)具有聚類特性,并主要表現(xiàn)為以下特點:每個干涉條紋對應(yīng)一個模糊周期,該條紋內(nèi)的所有像素具有相同的模糊數(shù)。圖2即示意了雙通道干涉圖及其模糊數(shù)的對比。其中,圖2(a)對應(yīng)較大的高程模糊度,圖2(b)對應(yīng)較小的高程模糊度,圖2(c)、圖2(d)分別對應(yīng)圖2(a)、圖2(b)的模糊數(shù)。由對比可見,不同高程模糊度的干涉圖均呈現(xiàn)聚類現(xiàn)象,但聚類形式存在差異。具有較小高程模糊度(對應(yīng)高頻點或短基線)干涉圖的干涉條紋更為密集,解纏相位及對應(yīng)的模糊數(shù)跨度更大,使得模糊數(shù)聚類結(jié)果中的類別更多。
圖2 模糊數(shù)聚類示意Fig.2 Schematic diagram of the ambiguity number clustering
根據(jù)同一干涉條紋中所有像素都對應(yīng)相同模糊數(shù)的特點,可以將模糊數(shù)k的求取轉(zhuǎn)化為語義分割問題[30],即:對應(yīng)相同模糊數(shù)的像素點可歸入到同一個像素簇中,將此模糊數(shù)的值賦為這個像素簇的語義,根據(jù)語義的不同對像素進行分類。在這個過程中,可以采用深度學(xué)習(xí)方法,將圖2(c)、圖2(d)作為標(biāo)簽用以訓(xùn)練神經(jīng)網(wǎng)絡(luò),即可利用神經(jīng)網(wǎng)絡(luò)完成對干涉圖模糊數(shù)的語義分割,實現(xiàn)每個像素的模糊數(shù)估計,從而獲取解纏相位。
基于3.1節(jié)的分析,相位解纏可轉(zhuǎn)化為語義分割處理。在可用于語義分割的深度神經(jīng)網(wǎng)絡(luò)中,UNet網(wǎng)絡(luò)具有突出的輕量化和高性能優(yōu)勢,可廣泛應(yīng)用于各種場景[31]。所以,本文利用UNet神經(jīng)網(wǎng)絡(luò)完成模糊數(shù)估計,實現(xiàn)相位解纏。針對UNet神經(jīng)網(wǎng)絡(luò)而言,其網(wǎng)絡(luò)結(jié)構(gòu)呈現(xiàn)為“U”形,可將淺層特征和深層特征緊密融合在一起。其中淺層特征主要用于捕捉圖像的邊緣輪廓等細(xì)節(jié)信息,有助于網(wǎng)絡(luò)學(xué)習(xí)纏繞相位跳變區(qū)域的特征。而深層特征則更專注于表達圖像的語義信息,可助力網(wǎng)絡(luò)學(xué)習(xí)相位與其鄰域像素相位的關(guān)系。通過充分融合鄰域像素的信息,UNet網(wǎng)絡(luò)能夠準(zhǔn)確高效地進行模糊數(shù)的估計,從而為大規(guī)模干涉相位解纏提供有力支撐。
在多通道相位解纏中,為了獲得不同通道纏繞相位所對應(yīng)的模糊數(shù),此處采用了多輸出UNet神經(jīng)網(wǎng)絡(luò),并將所提出的網(wǎng)絡(luò)命名為MCJ-UNet,用以實現(xiàn)多通道干涉相位的聯(lián)合處理,并通過改進網(wǎng)絡(luò)結(jié)構(gòu)及損失函數(shù)來保證解纏效果。圖3即為雙通道解纏網(wǎng)絡(luò)的結(jié)構(gòu)示意。其中,纏繞相位φn1,φn2以及對應(yīng)的高程模糊度比例(尺度縮放因子)是網(wǎng)絡(luò)的輸入,經(jīng)過編碼路徑和兩個解碼路徑的處理,可完成對兩幅干涉圖的模糊數(shù)估計。
圖3 MCJ-UNet網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.3 The structure of MCJ-UNet network
為了描述清晰,此處將網(wǎng)絡(luò)的輸入順序規(guī)定為通道1干涉相位、通道2干涉相位以及尺度縮放因子。通道1的高程模糊度較大(對應(yīng)短基線或低頻點),而通道2的高程模糊度較小(對應(yīng)長基線或高頻點),即:Hamb1>Hamb2。尺度縮放因子(高程模糊度比例)的計算如式(6),并有α ∈(0,1)。
根據(jù)高程模糊度的定義,可以分別得到在多頻和多基線觀測構(gòu)型下的尺度縮放因子,如式(7)和式(8)所示:
所構(gòu)建的MCJ-UNet網(wǎng)絡(luò)的整體結(jié)構(gòu)如圖3所示,該網(wǎng)絡(luò)采用了兩條相同的解碼路徑,并共享一條編碼路徑的輸出。編碼路徑主要負(fù)責(zé)對多通道干涉相位的特征進行提取,由5個子模塊組成,由淺入深的逐層提取干涉圖的特征信息,每個子模塊包括兩次卷積和一次池化過程。兩條相同構(gòu)造的解碼路徑也包括5個子模塊,分別為上采樣反卷積,全尺度跳躍連接以及兩次卷積。
考慮到每條解碼路徑需要輸出不同的模糊數(shù)信息,因此需要的特征信息也各有側(cè)重,有鑒于此,在編碼路徑提取的特征信息和兩條解碼路徑間加入了SE通道注意力模塊,旨在增強網(wǎng)絡(luò)對不同特征通道的感知能力,SE模塊的構(gòu)建原理如圖4所示。其核心功能是對每個特征通道進行自適應(yīng)權(quán)重調(diào)整,通過學(xué)習(xí)每個特征通道的重要性來增強可用信息并減弱無關(guān)信息。在MCJ-UNet中,編碼路徑提取到的特征信息同時包含通道1和通道2的干涉相位,而對于各通道的解碼路徑,SE模塊的加入減弱了其他通道的干涉條紋輪廓等信息的權(quán)重,使得解碼路徑可以更加專注于對本通道的模糊數(shù)估計所需信息的提取,從而提高模型整體的表現(xiàn)能力。同時,相較于簡單的增加網(wǎng)絡(luò)的深度或?qū)挾?,SE不需要大幅增加網(wǎng)絡(luò)的參數(shù)量,可以用較小的計算代價實現(xiàn)更好的性能。
圖4 SE模塊Fig.4 SE module
為了在相位解纏中充分利用不同通道間的干涉相位特性差異,提升信息獲取維度,MCJ-UNet對訓(xùn)練過程中的損失函數(shù)進行了優(yōu)化,在損失函數(shù)構(gòu)建中引入了基于多通道聯(lián)合約束的相位殘差項。
圖5示意了網(wǎng)絡(luò)訓(xùn)練過程。將UNet網(wǎng)絡(luò)用于語義分割任務(wù)時,網(wǎng)絡(luò)輸出的特征通道數(shù)等于像素分類的類別數(shù)。因此,在相位解纏處理中,需要考慮纏繞相位對應(yīng)的模糊數(shù)(類別數(shù))范圍,這將決定網(wǎng)絡(luò)輸出通道的數(shù)量。對于MCJ-UNet而言,每個解碼路徑的輸出特征通道數(shù)與數(shù)據(jù)集中的模糊數(shù)范圍相關(guān)聯(lián)。具體來說,假如數(shù)據(jù)集中所有纏繞相位對應(yīng)的模糊數(shù)滿足k1∈(m1,m2),k2∈(n1,n2),則網(wǎng)絡(luò)兩條解碼途徑對應(yīng)的輸出特征通道數(shù)應(yīng)分別設(shè)置為M=m2-m1+1,N=n2-n1+1,以確保網(wǎng)絡(luò)能夠為每個可能的模糊數(shù)提供適當(dāng)?shù)念A(yù)測,從而保證模型能夠有效地學(xué)習(xí)和解釋不同模糊數(shù)對應(yīng)的纏繞相位信息。
圖5 網(wǎng)絡(luò)訓(xùn)練流程圖Fig.5 Flowchart of network training
損失函數(shù)對于網(wǎng)絡(luò)的優(yōu)化至關(guān)重要。在訓(xùn)練MCJ-UNet的過程中,計算損失函數(shù)所用的標(biāo)簽包括:多通道相位對應(yīng)的模糊數(shù)k1,k2以及真實纏繞相位φ1,φ2。所用損失函數(shù)包括3個部分:LossCE1,LossCE2以 及 LossF(x)。其 中,LossCE1和 LossCE2表示網(wǎng)絡(luò)兩條解碼路徑的輸出與真實模糊數(shù)標(biāo)簽之間構(gòu)成的交叉熵?fù)p失[32],它可以度量模型輸出的模糊數(shù)概率分布和真實模糊數(shù)標(biāo)簽之間的差異。交叉熵?fù)p失如式(9)所示:
其中,M為模糊數(shù)類別的總數(shù),pi為網(wǎng)絡(luò)預(yù)測輸出,表示第i個特征通道對應(yīng)的模糊數(shù)為真實模糊數(shù)的概率,yi為符號函數(shù),當(dāng)像素對應(yīng)的真實模糊數(shù)為第r個類別的模糊數(shù)時,有
多通道相位殘差優(yōu)化損失 LossF(x)是根據(jù)多通道相位之間的相互約束關(guān)系所建立的損失函數(shù),旨在使網(wǎng)絡(luò)在估計模糊數(shù)的過程中結(jié)合多通道的相位關(guān)系,進行更加準(zhǔn)確的模糊數(shù)預(yù)測。其具體的構(gòu)成如式(11)所示:
其中,M1和M2為兩條解碼路徑的輸出特征通道數(shù),對應(yīng)于數(shù)據(jù)集中雙通道模糊數(shù)的類別數(shù)目。pi和pj分別為兩條解碼路徑對每個模糊數(shù)的預(yù)測概率,k1i為第1條解碼路徑的第i個特征通道對應(yīng)的模糊數(shù)標(biāo)簽值,k2j為第2條解碼路徑的第j個特征通道對應(yīng)的模糊數(shù)標(biāo)簽值,φ1,φ2為真實纏繞相位。相位殘差F(x)的表達式為
式(11)結(jié)合了多通道相位間的相互約束關(guān)系與語義分割網(wǎng)絡(luò)輸出不同類別的概率這一特點。在優(yōu)化網(wǎng)絡(luò)模型的過程中,該損失函數(shù)會首先遍歷兩個輸出特征通道對應(yīng)的模糊數(shù)組合,當(dāng)遍歷到的模糊數(shù)組合為真實模糊數(shù)時,相位殘差F(x)的值會置為0,其他情況下,將相位殘差F(x)置為1。因此,為了最小化損失,當(dāng)遍歷到的模糊數(shù)組合 (k1,k2)不是(或不全是)真實模糊數(shù)時,需要降低相位殘差前的概率乘積pi×pj的值,當(dāng)遍歷到模糊數(shù)組合為真實模糊數(shù)時,需相應(yīng)提高相位殘差前的概率乘積pi×pj。隨著相位殘差損失 LossF(x)的不斷下降,網(wǎng)絡(luò)會自適應(yīng)學(xué)習(xí)多通道相位間的關(guān)系,提高真實模糊數(shù)的輸出概率。
根據(jù)3個部分的損失函數(shù),總體損失函數(shù)可以表示為
式(13)中的γ和η為超參數(shù),可以通過調(diào)整該值來控制每部分損失函數(shù)在總體損失函數(shù)中所占的比重。由于 LossCE1和 LossCE2對應(yīng)不同的分類數(shù),且LossF(x)與前兩者的計算方法也不同,因此對于同一網(wǎng)絡(luò)輸出的損失函數(shù)計算中,每部分損失函數(shù)的尺度也不同。因此,需要通過超參數(shù)的設(shè)置將每部分損失函數(shù)的值調(diào)整至同一尺度,以均衡各部分損失函數(shù)對網(wǎng)絡(luò)優(yōu)化的貢獻,避免某個損失函數(shù)主導(dǎo)整個訓(xùn)練過程。此處給出一種通過預(yù)訓(xùn)練來確定超參數(shù)的方法,其目的在于通過預(yù)訓(xùn)練的方式,觀察在模型能夠基本完成模糊數(shù)預(yù)測的情況下各部分損失函數(shù)比值。首先僅使用交叉熵?fù)p失LossCE1與LossCE2的和作為總體損失函數(shù)進行預(yù)訓(xùn)練,即預(yù)訓(xùn)練過程中損失函數(shù)的大小為LossCE1+LossCE2,當(dāng)網(wǎng)絡(luò)基本收斂時,計算此時一個訓(xùn)練輪次中三部分損失均值的比值,根據(jù)比值確定超參數(shù),使得三部分損失函數(shù)可以調(diào)整至同一水平。
由于MCJ-UNet可同時輸出不同通道對應(yīng)的模糊數(shù),基于單通道模糊數(shù)及對應(yīng)的纏繞相位即可實現(xiàn)相位解纏。在不考慮相干性損失的前提下,高程模糊度越小,理論高程精度越高。因此,在基于所提出的網(wǎng)絡(luò)完成模糊數(shù)的估計后,可選擇高程模糊度較小的干涉通道(此處以通道2為例)進行模糊數(shù)補償,從而獲取解纏相位
MCJ-UNet的本質(zhì)為語義分割網(wǎng)絡(luò),分割結(jié)果中的不同像素簇的語義即為模糊數(shù),分割邊緣為相位跳變位置。但是受相位噪聲的影響,語義分割邊緣難以保證完全精確,該類邊緣將出現(xiàn)部分像素的語義估計錯誤,從而導(dǎo)致相位解纏錯誤。相位跳變現(xiàn)象主要有兩種情況:平緩地形下相位 +π和-π間的跳變和陡峭地形引起的相位欠采樣。針對平緩地形區(qū)域,相鄰像素間的微小高程變化也可能會導(dǎo)致對應(yīng)的纏繞相位在 +π和 -π間跳變。此時,該相鄰像素將對應(yīng)不同的模糊數(shù)(即該像素間將存在語義分割的邊緣),邊緣語義分割誤差將導(dǎo)致解纏誤差。但是,語義分割的邊緣由模糊數(shù)的分布形式?jīng)Q定,該分布形式由高程模糊度及地形共同決定。由于不同通道間的高程模糊度不同,對應(yīng)的語義分割邊緣將存在差異,即:在某通道存在邊緣誤差的區(qū)域,其他通道極有可能不存在該問題(如圖2(c)及圖2(d)所示),因此可以考慮利用這一特性和不同通道間的相位關(guān)系對此類誤差進行修正。而針對陡峭地形引起的相位跳變現(xiàn)象,可通過多通道相位間是否有差異來判斷該跳變是否由地形引入,針對均發(fā)生跳變的情況不進行誤差自修正的處理,以保證陡峭地形的邊緣細(xì)節(jié)。
針對上述問題,本節(jié)提出一種基于多通道聯(lián)合約束的解纏誤差自修正方法。該方法的核心思路為:以參考通道的解纏結(jié)果為基準(zhǔn),利用不同通道間的相位關(guān)系檢測存在解纏誤差的像素,并基于不同通道語義分割結(jié)果邊緣位置的差異,結(jié)合其余通道的解纏結(jié)果完成修正。由于實際地形中極少出現(xiàn)孤立像素形式的陡峭地形,某像素的解纏相位(或高程)將與鄰域若干像素相接近。所以,此處判斷是否采信某一通道解纏結(jié)果的標(biāo)準(zhǔn)即為解纏相位的鄰域梯度,該梯度越小,則表明該像素與鄰域像素越相似,其解纏相位的可靠性越高。
該方法的具體操作步驟如下:
步驟1 標(biāo)記點提?。菏紫雀鶕?jù)式(4),基于通道1獲取的解纏相位以及尺度縮放因子α,可獲得對應(yīng)的通道2的參考解纏相位:
針對該相位差,其理論值應(yīng)為0(無論是否為陡峭地形),即表示同一目標(biāo)的不同通道的解纏結(jié)果一致。但實際處理中將受到相位噪聲的影響,若該數(shù)值較小,則可視為相位濾波等處理過程對某一通道的干涉相位造成細(xì)微損失,從而導(dǎo)致雙通道解纏結(jié)果的微小差異;若該數(shù)值較大,則表示某一通道的解纏結(jié)果存在誤差,需進行誤差修正。
此處以閾值φd為參考,標(biāo)記干涉圖中所有|Δφ|>φd的位置,即可獲取所有可能解纏出錯的位置,并記為標(biāo)記點。
步驟2 梯度計算:完成誤差標(biāo)記后,需通過鄰域聯(lián)合處理來判斷所采信的通道。此處需計算不同通道的解纏相位中,各個標(biāo)記點與周圍像素點均值之間的梯度,并記作δ1和δ2。
步驟3 誤差修正:首先設(shè)置替換閾值δd,若同時滿足 |δ1|<δd,|δ2|<δd,則比較δ1和δ2的 大小,并將 |δ1|<|δ2|位置上的相位值替換為通道1獲取的通道2參考解纏相位φ2cal。當(dāng)δ1和δ2同時大于替換閾值δd時,視為兩個相位梯度都由(陡峭)地形引入,不做替換。
通過上述處理,即可完成基于多通道聯(lián)合約束的解纏誤差自修正。上述描述以雙通道為例,當(dāng)相位解纏擴展到更多通道時,可以選擇標(biāo)記點對應(yīng)的梯度最小的通道的解纏相位值進行替換,以獲取更為準(zhǔn)確的解纏相位。
上述分析均基于雙通道相位解纏,此處對MCJUNet解纏推廣至多通道進行分析,并假設(shè)通道數(shù)量為n。
首先,需要對網(wǎng)絡(luò)模型進行調(diào)整,將網(wǎng)絡(luò)輸出通道數(shù)與解纏通道數(shù)對應(yīng),即網(wǎng)絡(luò)由1條解碼路徑與n條編碼路徑構(gòu)成,每條編碼路徑負(fù)責(zé)1個通道的模糊數(shù)輸出。
其次,需要調(diào)整損失函數(shù),多通道解纏網(wǎng)絡(luò)的總體損失函數(shù)由n+1項組成,前n項為n個輸出通道的輸出與真實模糊數(shù)計算所得的交叉熵?fù)p失,第n+1項為各通道與參考通道的相位殘差損失函數(shù)之和。對于各部分損失函數(shù)對應(yīng)超參數(shù)的確定,可首先由各通道交叉熵?fù)p失函數(shù)之和對網(wǎng)絡(luò)進行預(yù)訓(xùn)練,當(dāng)網(wǎng)絡(luò)基本達到收斂時,計算一個訓(xùn)練輪次中各部分損失均值的比值,根據(jù)該比值即可確定每一部分損失函數(shù)對應(yīng)的超參數(shù)的值。
最后,需要對多通道聯(lián)合約束的解纏誤差自修正方法進行調(diào)整,即基于參考通道與其他所有通道的解纏相位分別完成標(biāo)記點提取及梯度計算,并以梯度最小的通道為參考完成誤差修正,獲取多通道聯(lián)合解纏相位。
將MCJ-UNet中的雙通道相位解纏推廣至多通道時,網(wǎng)絡(luò)模型將增大,對應(yīng)的損失函數(shù)計算量也將增加,使得網(wǎng)絡(luò)訓(xùn)練需要耗費更長的時間。但是更多的通道數(shù)會為網(wǎng)絡(luò)提供更多的特征信息進行學(xué)習(xí),且多通道的解纏信息也有助于多通道聯(lián)合約束下的解纏誤差自修正處理,以保證相位解纏的精度。
為了對所提出的MCJ-UNet網(wǎng)絡(luò)進行訓(xùn)練,此處盡可能模擬不同類型的復(fù)雜地形[33],并構(gòu)建了對應(yīng)的多通道干涉圖及標(biāo)簽數(shù)據(jù)。圖6-圖8示意了數(shù)據(jù)集的構(gòu)造過程,具體步驟如下:
圖6 仿真地形構(gòu)造示意Fig.6 Schematic diagram of simulated terrain construction
(a) 構(gòu)建初始隨機地形:首先創(chuàng)建一個尺寸為L×L的初始矩陣,并對每個位置隨機賦高度值,其中L ∈[3,25],如圖6(a)所示。隨后,將初始矩陣插值擴展到 512×512,完成初始地形的構(gòu)造,如圖6(b)所示。其中初始矩陣的邊長L的大小可以控制地形的復(fù)雜程度,L越大則構(gòu)造的地形越復(fù)雜。
(b) 增添地形紋理:為了盡可能模擬真實地形,可在步驟(a)生成的光滑仿真地形上增添不規(guī)則的紋理。紋理的構(gòu)造方式和地形構(gòu)造類似,區(qū)別在于將初始矩陣的邊長L增大至 256×384的尺寸,但所賦高度值將降低,生成紋理后可將其增添到所構(gòu)造的地形上。
(c) 生成多通道干涉圖:首先設(shè)置大小隨機的兩個高程模糊度Hamb1>Hamb2,并計算尺度縮放因子α?;陔S機生成的高程模糊度及所構(gòu)建的地形高程,可獲取絕對相位,將絕對相位纏繞至(-π,π],即得到多通道干涉圖,如圖7(b)及圖7(e)(其局部放大圖如圖7(c)及圖7(f))所示,細(xì)節(jié)紋理的添加可使得訓(xùn)練數(shù)據(jù)更接近實際地形下所獲取的干涉圖。
圖7 增添紋理前后纏繞相位對比Fig.7 Comparison of wrapped phase before and after adding texture
(d) 完成數(shù)據(jù)集構(gòu)造:為盡可能模擬實際情況下所獲取的干涉相位,對獲取的纏繞相位增加隨機強度的高斯復(fù)噪聲,添加的相位噪聲信噪比均勻分布在-1~10 dB,添加噪聲后的干涉圖如圖8(a)及圖8(b)所示,該圖即可作為網(wǎng)絡(luò)輸入,每幅干涉圖對應(yīng)的模糊數(shù)作為網(wǎng)絡(luò)標(biāo)簽,如圖8(c)及圖8(d)所示。
圖8 多通道纏繞相位及標(biāo)簽Fig.8 Multi-channel wrapped phase and label
為突出網(wǎng)絡(luò)多通道相位解纏的優(yōu)勢,在數(shù)據(jù)集的構(gòu)建過程中還增加了一些陡峭地形,以形成相位欠采樣數(shù)據(jù):在步驟(a)中,可選擇初始矩陣的一部分?jǐn)?shù)據(jù)進行插值擴展,另一部分不做插值只做擴展,后續(xù)步驟則不變。未做插值的部分將生成陡峭地形,供MCJ-UNet學(xué)習(xí)相位欠采樣情況下的多通道相位特性。
為驗證所提出的MCJ-UNet網(wǎng)絡(luò)的有效性,此處分別開展了模擬地形仿真驗證、真實地形仿真驗證以及實測數(shù)據(jù)驗證。其中,模擬地形同時包含平緩及陡峭地形,以驗證所提MCJ-UNet在自然及人工場景下的解纏效果;真實地形仿真實驗采用了多頻(多基線)相位解纏實驗中常用的陡峭山地數(shù)據(jù):Isolation峰地形數(shù)據(jù),以驗證所提MCJ-UNet在真實陡峭地形下的解纏效果;實測數(shù)據(jù)驗證選用了TerraSAR-X重軌多基線干涉數(shù)據(jù),該數(shù)據(jù)的尺寸較大,以驗證所提出的MCJ-UNet的相位解纏效率。
所提出的MCJ-UNet基于Pytorch 1.13.0及Python 3.9搭建,在NVIDIA Tesla A100 GPU上實現(xiàn),GPU數(shù)量為2。網(wǎng)絡(luò)共包含2個干涉通道,干涉通道1的輸出特征通道數(shù)目設(shè)置為15,干涉通道2的輸出特征通道數(shù)目設(shè)置為25。訓(xùn)練數(shù)據(jù)集采用第4節(jié)所述方法生成,共包含9000組訓(xùn)練數(shù)據(jù)及1000組測試數(shù)據(jù)。訓(xùn)練過程中,使用Adam優(yōu)化算法[34]進行損失函數(shù)最小化,采用余弦退火學(xué)習(xí)策略[35],學(xué)習(xí)率最大值為10-4,最小值為10-6,batch size設(shè)置為8,訓(xùn)練輪次為50次。網(wǎng)絡(luò)預(yù)訓(xùn)練用時9587.39 s,根據(jù)預(yù)訓(xùn)練結(jié)果將超參數(shù)設(shè)置為γ=0.8,η=0.1,網(wǎng)絡(luò)訓(xùn)練耗時15236.20 s。
模擬地形仿真實驗采用雙頻InSAR構(gòu)型,主要仿真參數(shù)如表1所示,兩個干涉通道的頻點分別為5.25 GHz及11.50 GHz,對應(yīng)的尺度縮放因子為0.46。仿真所采用的DEM如圖9(a)所示,并在此基礎(chǔ)上增添了紋理細(xì)節(jié),以逼近真實地形。模擬地形中同時包含平緩(左側(cè))及陡峭(右側(cè))區(qū)域,陡峭區(qū)域的邊緣已出現(xiàn)相位欠采樣問題。
表1 模擬地形仿真參數(shù)Tab.1 Simulation parameters of simulated terrain
圖9 仿真DEM及信噪比分布情況Fig.9 Simulated DEM and SNR distribution
根據(jù)仿真DEM所生成的頻點1、頻點2的參考解纏相位如圖10(a)、圖10(b)所示,生成的含噪聲干涉圖如圖11(a)、圖11(b)所示,其中所添加的信噪比隨相位空間分布的不同而變化,平緩(左側(cè))區(qū)域上半部分添加噪聲信噪比為2 dB,下半部分添加噪聲信噪比為4 dB,陡峭(右側(cè))區(qū)域添加噪聲信噪比(Signal-to-Noise Ratio,SNR)為5 dB,如圖9(b)所示。
圖10 雙頻點參考相位
圖11 雙頻點(含噪聲)干涉圖Fig.11 The interferograms of dual-frequency channels
首先,將濾波前的雙頻點干涉圖及對應(yīng)的尺度縮放因子輸入訓(xùn)練完成的MCJ-UNet,所獲得模糊數(shù)估計結(jié)果如圖12(a)、圖12(b)所示。之后,利用模糊數(shù)估計結(jié)果及濾波后干涉圖可獲取雙通道相位解纏結(jié)果,如圖12(c)、圖12(d)所示。最后,基于多通道聯(lián)合約束的解纏誤差自修正方法,即可獲取MCJ-UNet最終解纏結(jié)果。其余實驗的MCJ-UNet結(jié)果均根據(jù)上述步驟獲取,將不再贅述。其中,網(wǎng)絡(luò)的輸入采用的是濾波前的干涉圖,這是由于在網(wǎng)絡(luò)訓(xùn)練階段已輸入不同水平噪聲的干涉圖作為訓(xùn)練數(shù)據(jù),神經(jīng)網(wǎng)絡(luò)已經(jīng)學(xué)習(xí)噪聲特征,使用濾波前的含噪聲干涉圖不會影響網(wǎng)絡(luò)的預(yù)測結(jié)果,反而可以盡量避免濾波處理對細(xì)節(jié)特征的損失,以保證網(wǎng)絡(luò)的輸出提供更細(xì)致的地形信息,便于解纏處理。
圖12 基于MCJ-UNet所獲取的模糊數(shù)估計結(jié)果Fig.12 Ambiguity number estimation results obtained based on MCJ-UNet
為了對比驗證所提出的MCJ-UNet的相位解纏效率及噪聲抑制效果,分別采用4種不同方法進行了處理,包括:傳統(tǒng)MLE算法、TSPA算法、CANet算法以及所提MCJ-UNet算法。在所涉及的針對干涉圖濾波的處理中,4種處理方法均采用Goldstein濾波算法[36],并在隨后的實驗中保持一致。為維持噪聲水平的一致性,同一組實驗選用相同大小的濾波參數(shù)。
4種方法的解纏結(jié)果如圖13所示,其中圖13(b)、圖13(d)、圖13(f)、圖13(h)分別為圖13(a)、圖13(c)、圖13(e)、圖13(g)相對于高頻點參考解纏相位(圖10(b))的解纏誤差。為了進行定量比較,表2列出了各解纏結(jié)果的主要評估指標(biāo):解纏相位均方根誤差(Root Mean Squared Error,RMSE)以及運行時間。其中,RMSE評估中的參考數(shù)據(jù)為仿真DEM對應(yīng)的參考解纏相位,運行時間分為網(wǎng)絡(luò)運行時間及后處理所用時間,由于MLE和TSPA方法不涉及網(wǎng)絡(luò)處理,其后處理時間即為處理總時間(下述實驗相同)。
表2 各方法所獲取的仿真地形解纏相位評估結(jié)果Tab.2 Evaluation results of the unwrapped phase of simulated terrain obtained by different methods
圖13 仿真數(shù)據(jù)各方法解纏結(jié)果對比Fig.13 Comparison of results for different methods on simulated data
由圖13(b)可見,MLE算法由于噪聲抑制能力有限,解纏結(jié)果中存在明顯的相位跳變,出現(xiàn)了大量解纏誤差,且由于添加噪聲隨空間分布不同,解纏結(jié)果左側(cè)上半部分出現(xiàn)誤差的像素點明顯多于下半部分。基于TSPA獲取的解纏結(jié)果在圖中右下角正方形中出現(xiàn)了整體區(qū)域的解纏錯誤,這是由于TSPA方法在第一階段需要計算相鄰像素相位的梯度,而由于濾波原因?qū)е麓藚^(qū)域邊緣原有梯度信息遭到破壞,錯誤的梯度信息將正方形區(qū)域“包圍”。路徑積分處理會導(dǎo)致誤差的積累,從而使得TSPA在該區(qū)域的解纏出現(xiàn)誤差?;贑ANet和MCJ-UNet的方法均有效完成了干涉圖解纏,不同空間分布的噪聲并未造成解纏失效問題。且解纏誤差主要位于仿真地形的邊緣區(qū)域(如平緩與陡峭地形交界處),該誤差主要由濾波處理導(dǎo)致的細(xì)節(jié)損失引入。
表2所示4種方法的RMSE也與上述分析相符,TSPA由于部分區(qū)域的解纏失敗,因此解纏誤差較大,CANet和MCJ-UNet解纏精度相近,驗證了兩種方法在不同強度和不同空間分布的噪聲下的有效性。CANet的網(wǎng)絡(luò)處理時間及解纏精度略優(yōu)于MCJUNet,而得益于更簡單的后處理步驟,MCJ-UNet的總體運行時間要優(yōu)于CANet,在保證解纏精度的同時也具有高效性。
真實地形仿真實驗采用美國Colorado州Isolation山峰區(qū)域的真實高程進行,其地形變化形式較為復(fù)雜,是多頻、多基線相位解纏算法驗證中較為經(jīng)典的實驗數(shù)據(jù)[18,22],可以有效驗證所提方法在自然陡峭地形下的解纏效果。仿真參數(shù)如表3所示,真實地形參考高程如圖14(a)所示,圖14(b)、圖14(c)為根據(jù)仿真參數(shù)生成的含噪聲雙頻干涉圖,圖14(d)、圖14(e)為對應(yīng)的濾波結(jié)果。圖15(a)為頻點2對應(yīng)的參考解纏相位,圖15(b)、圖15(c)、圖15(d)、圖15(e)分別對應(yīng)MLE,TSPA,CANet及MCJ-UNet這4種方法的解纏結(jié)果,圖15(f)、圖15(g)、圖15(h)、圖15(i)展示了4種方法解纏結(jié)果相對于參考相位的解纏誤差。表4列出了各方法解纏精度和處理時間的評估結(jié)果,以進行定量比較。
表3 真實地形仿真參數(shù)Tab.3 Simulation parameters of real terrain
表4 各方法所獲取真實地形仿真相位解纏評估結(jié)果Tab.4 Evaluation results of real terrain simulation phase unwrapping obtained by different methods
圖14 地形參考高程及多頻干涉圖Fig.14 Reference terrain height and multi-frequency interferograms
圖15 參考相位及各方法解纏結(jié)果對比Fig.15 Reference phase and comparison of unwrapped phase obtained by different methods
由圖15以及表4對比可知,基于逐像素處理的MLE方法噪聲魯棒性較差,解纏精度較低?;赥SPA方法和CANet方法獲取的解纏結(jié)果在圖中上部的陡峭區(qū)域均出現(xiàn)錯誤。針對本文所提出的MCJUNet方法,其單通道(通道1及通道2)的解纏精度均低于CANet方法,這是由于單通道解纏結(jié)果未進行誤差自修正處理,模糊數(shù)跳變區(qū)域的部分邊緣像素的分類誤差導(dǎo)致解纏錯誤。此外,精度評估采用通道2的參考解纏相位,由于通道1的高程模糊度較大,相比于通道2,其解纏相位經(jīng)尺度縮放后對應(yīng)的解纏誤差也越明顯,故解纏精度略低。雖然MCJUNet的單通道解纏結(jié)果精度低于CANet方法,但是在進行多通道聯(lián)合解纏誤差自修正后,其解纏精度明顯提升,已略優(yōu)于CANet的解纏精度。
對上述處理結(jié)果進行詳細(xì)分析可知,在陡峭地形區(qū)域的左側(cè),頻點1的含噪聲干涉圖中可見相位跳變現(xiàn)象(如圖14(b)白框及其局部放大所示)。由于MCJ-UNet采用濾波前的干涉圖作為網(wǎng)絡(luò)輸入,并且引入跳躍連接的U-Net神經(jīng)網(wǎng)絡(luò)對此類輪廓信息較為敏感,因此在該區(qū)域內(nèi)部獲得了正確的模糊數(shù)估計結(jié)果,僅在邊緣跳變區(qū)域出現(xiàn)了解纏誤差。TSPA和CANet方法均采用濾波后干涉圖作為輸入,并涉及梯度積分處理,存在誤差積累及細(xì)節(jié)損失。MCJ-UNet在陡峭邊緣區(qū)域的誤差是由于頻點1和頻點2的模糊數(shù)在該邊緣同時發(fā)生跳變,當(dāng)邊緣位置的某些像素處的雙通道解纏相位均存在誤差時,所提出的解纏誤差自修正方法難以判別準(zhǔn)確的解纏相位,部分像素的解纏誤差無法被有效修正。
對于真實地形下的仿真實驗,表4的評估結(jié)果顯示,MCJ-UNet的解纏精度優(yōu)于其他3種方法,且處理時間較低。MCJ-UNet方法在真實地形仿真實驗與模擬地形仿真實驗的運行時間并未與像素點的數(shù)量呈正比,這是由于網(wǎng)絡(luò)運行時間包含了模型加載時間,當(dāng)干涉圖尺寸較小時,模型加載時間在網(wǎng)絡(luò)運行時間的占比較高,干涉圖尺寸的影響不明顯。當(dāng)MCJ-UNet用于更大規(guī)模干涉圖的相位解纏時,模型加載時間所占網(wǎng)絡(luò)運行時間比重將降低,處理時間將有所增加,但其解纏高效性的優(yōu)勢將進一步突出。
實測數(shù)據(jù)驗證采用TerraSAR-X重軌多基線數(shù)據(jù),觀測區(qū)域為中國山西太原東北部的系舟山山區(qū)。該區(qū)域?qū)儆谔猩矫}中段分支,地形起伏明顯,可以充分驗證所提方法在實際處理中的應(yīng)用效果。數(shù)據(jù)尺寸為4096×4096,覆蓋面積達到7 km×8 km,可有效評估所提方法在大尺寸干涉圖上的解纏效率。該數(shù)據(jù)主要參數(shù)如表5所示,圖16(a)為目標(biāo)區(qū)域SAR圖像,圖16(b)為該區(qū)域的光學(xué)圖像。圖16(e)、圖16(f)分別為雙基線原始干涉圖,圖16(g)、圖16(h)為對應(yīng)的去平地并濾波后的干涉圖,兩幅干涉圖對應(yīng)的全圖平均相干系數(shù)分別為0.62(基線1)和0.58(基線2),圖16(d)即為基線2對應(yīng)的相干系數(shù)圖。圖16(c)為基線2對應(yīng)的該區(qū)域參考解纏相位,該相位以ALOS-DEM[37]高程數(shù)據(jù)為參考獲取,其網(wǎng)格尺寸為12.5 m,高程精度可達3~9 m[38],可以為不同方法的解纏精度評估提供有效參考。此外,通過該高程數(shù)據(jù)計算得到的該區(qū)域的最大地形坡度接近50°,屬于較陡峭地形。
表5 多基線InSAR實測數(shù)據(jù)主要參數(shù)Tab.5 Main parameters of multi-baseline InSAR real data
圖16 多基線InSAR實測數(shù)據(jù)Fig.16 Real InSAR data of multi-baseline
實測數(shù)據(jù)驗證采用前文所述4種方法進行比較,圖17(a)-圖17(d)對應(yīng)4種方法的解纏結(jié)果,圖17(e)-圖17(h)為4種解纏結(jié)果相對于目標(biāo)區(qū)域參考相位(圖16(c))的解纏誤差,表6展示了各方法解纏結(jié)果的評估指標(biāo)。
表6 各方法所獲取實測數(shù)據(jù)解纏相位評估結(jié)果Tab.6 Evaluation results of unwrapped phase of real data obtained by different methods
圖17 實測數(shù)據(jù)各方法解纏結(jié)果對比Fig.17 Comparison of unwrapped phase obtained by different methods for real data
由于噪聲抑制能力有限,基于MLE方法獲取的解纏結(jié)果存在大量散點誤差。基于TSPA方法獲取的解纏結(jié)果在圖像右上角相干性較低且地形變化較為復(fù)雜的區(qū)域出現(xiàn)部分解纏錯誤,且由于干涉圖尺寸較大,TSPA解纏處理的時間成本明顯高于其他3種方法。CANet方法和本文所提MCJ-UNet方法解纏結(jié)果均未出現(xiàn)大面積誤差,解纏精度相當(dāng)。MCJ-UNet的解纏誤差主要位于雙基線干涉圖模糊數(shù)跳變邊緣重合的位置,此處在進行多通道聯(lián)合解纏誤差自修正后仍存在少量像素的誤差殘留。但是,MCJ-UNet的雙通道相位解纏精度相比于單通道具有明顯提升,驗證了基于不同通道的模糊數(shù)分類邊緣的差異進行解纏誤差自修正的處理方法的有效性。此外,與5.3節(jié)的分析結(jié)論一致,由于精度評估采用通道2的解纏相位為參考,通道1的基線長度較短,對應(yīng)的高程模糊度較大,所以在經(jīng)過尺度縮放后,其相比通道2的解纏精度更低。
在針對解纏效率的詳細(xì)對比中,雖然CANet與MCJ-UNet的網(wǎng)絡(luò)運行時間相當(dāng),但MCJ-UNet的后處理時間具有明顯優(yōu)勢,處理時間不足CANet后處理時間的5%,有效降低了大規(guī)模干涉圖解纏的時間成本。因此雖然MCJ-UNet解纏方法在解纏精度上和CANet方法相當(dāng),但是在處理效率方面表現(xiàn)更為突出,這意味著大規(guī)模干涉圖解纏或?qū)崟r性要求較高的場景下,MCJ-UNet方法將更具優(yōu)勢。
為驗證所提網(wǎng)絡(luò)優(yōu)化方法以及相位殘差損失函數(shù)的有效性,本節(jié)進行了消融實驗,對比在相同訓(xùn)練條件下(如5.1節(jié)所述),各種方法在測試集上的模糊數(shù)分類準(zhǔn)確率以及相應(yīng)的訓(xùn)練時間。對比方法分為網(wǎng)絡(luò)結(jié)構(gòu)有無SE模塊以及損失函數(shù)有無多通道相位殘差項,實驗結(jié)果如表7所示,其中,方法4為本文所提方法。由表7數(shù)據(jù)可知,4種方法中通道1的模糊數(shù)分類準(zhǔn)確率要優(yōu)于通道2,這是由于通道1的分類數(shù)少于通道2,相應(yīng)的分類難度較為簡單。對比方法1和方法3以及方法2和方法4,SE模塊的加入略微增加了網(wǎng)絡(luò)的訓(xùn)練時間,但顯著提升了各通道模糊數(shù)的分類準(zhǔn)確率,證明了其在網(wǎng)絡(luò)優(yōu)化過程中的有效性。對比方法1和方法2以及方法3和方法4,多通道相位殘差優(yōu)化損失的加入提高了網(wǎng)絡(luò)分類的準(zhǔn)確率,同時對通道2的提升更加明顯,使得不同通道的分類準(zhǔn)確率差距變小,證明了相位殘差損失結(jié)合多通道相位關(guān)系的有效性。由于損失函數(shù)計算量的增加,網(wǎng)絡(luò)訓(xùn)練時長也相應(yīng)增加,但是不會增加網(wǎng)絡(luò)結(jié)構(gòu)的復(fù)雜度,也不會影響網(wǎng)絡(luò)處理時間,因此相較于準(zhǔn)確率的提升,此處的網(wǎng)絡(luò)訓(xùn)練時間的增加在可接受的范圍內(nèi)。
表7 各對比方法的分類準(zhǔn)確率及訓(xùn)練時間Tab.7 Classification accuracy and training time of each comparison method
面向InSAR相位解纏技術(shù)的高效應(yīng)用,本文提出一種基于深度學(xué)習(xí)的多通道聯(lián)合相位解纏網(wǎng)絡(luò):MCJ-UNet。該方法結(jié)合了多通道相位解纏思路和神經(jīng)網(wǎng)絡(luò)模型,將相位解纏中的模糊數(shù)估計問題轉(zhuǎn)化為了語義分割問題,采用多輸出UNet完成處理。在網(wǎng)絡(luò)優(yōu)化過程中,該方法引入了SE模塊以增強不同輸出通道對所需特征信息的感知能力,并引入了多基線相位殘差損失以增強網(wǎng)絡(luò)對多基線干涉相位間約束關(guān)系的學(xué)習(xí)。此外,為進一步抑制相位解纏誤差,該方法引入了基于多通道聯(lián)合約束的解纏誤差自修正處理,借助不同通道間的模糊數(shù)分類邊緣的差異進行解纏誤差的檢測及修正,實現(xiàn)了各通道解纏相位的有效融合,保證了相位解纏質(zhì)量。
基于所提出的MCJ-UNet方法完成了模擬地形仿真、真實地形仿真及TerraSAR-X實測數(shù)據(jù)驗證。實驗結(jié)果表明,MCJ-UNet可有效實現(xiàn)多通道聯(lián)合相位解纏,在平緩及陡峭地形下均具有較強的適用性。就解纏精度而言,該方法優(yōu)于MLE方法和TSPA方法,與同為基于深度學(xué)習(xí)的多通道相位解纏的方法CANet的精度相當(dāng)。就解纏效率而言,由于采用直接估計模糊數(shù)的解纏方式,該方法的處理效率具有明顯優(yōu)勢,將更適用于大尺寸干涉圖的解纏處理,也為基于深度學(xué)習(xí)的相位解纏提供了一種新的思路。
此處需要說明的是,由于網(wǎng)絡(luò)化處理中需要進行卷積操作,所輸入的數(shù)據(jù)尺寸需為32的倍數(shù),針對于尺寸非32整數(shù)倍的數(shù)據(jù),可以在邊緣進行補0操作。對于極大尺寸的數(shù)據(jù)(如數(shù)據(jù)尺寸超出處理平臺的并行處理能力),也可通過分割處理進行分別解纏。另外,需要注意的是,在網(wǎng)絡(luò)訓(xùn)練過程中,需要數(shù)據(jù)集的模糊數(shù)分類范圍涵蓋解纏數(shù)據(jù)對應(yīng)的范圍,所以在訓(xùn)練時需要盡量生成較大模糊數(shù)區(qū)間的數(shù)據(jù),或依據(jù)特定數(shù)據(jù)的模糊數(shù)范圍選擇對應(yīng)區(qū)間的網(wǎng)絡(luò)進行處理,以保證解纏網(wǎng)絡(luò)的適用性。
未來的研究將繼續(xù)拓展所提出的網(wǎng)絡(luò)模型,以適應(yīng)更為復(fù)雜的觀測地形,并聚焦強噪聲環(huán)境下的相位濾波處理,構(gòu)建基于深度學(xué)習(xí)網(wǎng)絡(luò)的相位濾波及相位解纏一體化處理框架,以支撐InSAR技術(shù)的大規(guī)模高效應(yīng)用。
利益沖突所有作者均聲明不存在利益沖突
Conflict of InterestsThe authors declare that there is no conflict of interests