張勝國, 任超,2*, 王子彥, 閆志恒, 劉桃林, 郭玥, 張旭東
(1.桂林理工大學測繪地理信息學院, 桂林 541006; 2.廣西空間信息與測繪重點實驗室, 桂林 541006)
遙感影像中包含了豐富的地物紋理信息,對遙感影像的解譯分析已被廣泛應用于土地利用、城市規(guī)劃及環(huán)境監(jiān)測等各個領域[1]。但由于傳感器本身存在的缺陷及周圍環(huán)境因素的影響,遙感影像在獲取和傳輸過程中會受到噪聲干擾而導致影像質(zhì)量下降,影響影像后續(xù)的使用與研究[2-3],因此,如何提高影像質(zhì)量,有效去除影像中的噪聲并且盡可能多的保留原始影像的邊緣細節(jié)及紋理特征一直是遙感影像預處理領域的重點。
目前對遙感影像的處理主要考慮高斯噪聲及椒鹽噪聲[4-5]。近年來,為了降低噪聲對影像的干擾,提升影像質(zhì)量,許多去噪方法、模型相繼被提出。Chang等[6]將全變分模型和稀疏表示結合進行遙感影像去噪。徐冬等[7]提出結合主成分分析法與復小波變換的遙感影像去噪方法,該方法首先利用噪聲調(diào)整的主成分分析法提取特征,再利用復小波變換對低能量成分進行去噪處理。夏琴等[8]將K-奇異值分解(K-singular value decomposition,K-SVD)稀疏表示理論應用于衛(wèi)星遙感影像去噪。張從梅等[9]針對遙感影像中存在非局部自相似性和稀疏性,提出一種基于非局部自相似性的遙感圖像稀疏去噪算法。Dabov等[10]提出了塊匹配協(xié)同3D過濾(block-matching and 3D filtering,BM3D)的去噪算法,這是一種利用“組塊”之間的相關性,通過聯(lián)合三維濾波實現(xiàn)影像去噪的方法。上述方法都能夠有效去除影像中的高斯噪聲,但是對椒鹽噪聲去除效果不佳,并且由于復雜的優(yōu)化問題,往往在運行效率方面需要大量的時間和計算成本。隨著深度學習的快速發(fā)展,Zhang等[11]提出了去噪卷積神經(jīng)網(wǎng)絡(denoising convolutional neural networks,DnCNN)模型,該模型對于傳統(tǒng)自然圖像的高斯降噪取得了不錯的效果,但是對于地物紋理豐富的遙感影像降噪仍然存在一些不足,去噪結果容易出現(xiàn)邊緣紋理模糊的現(xiàn)象。吳從中等[12]利用殘差編解碼網(wǎng)絡結合邊緣增強來實現(xiàn)遙感圖像去噪,雖然能夠有效去除影像中的高斯噪聲,但是同樣對椒鹽噪聲去除效果不佳。
然而,在實際生產(chǎn)中,遙感影像所含噪聲并非是單一的,大多為同時包含高斯噪聲與椒鹽噪聲的混合噪聲,單一的傳統(tǒng)去噪方法在處理含有混合噪聲的遙感圖像時效果不理想。因此,朱建軍等[13]提出了一種三層組合濾波方法,將Bayes小波閾值濾波、自適應Wiener濾波和自適應中值濾波相結合,達到去除混合噪聲的目的。鄧開元等[14]提出了將三維塊匹配算法和自適應中值濾波相結合的組合濾波去噪方法。趙洪臣等[2]結合BM3D算法對高斯噪聲的有效去除能力,提出一種集成BM3D方法,用于去除遙感影像的混合噪聲。任超等[15]提出了將BM3D和多級非線性加權平均中值濾波相結合的去噪方法對遙感影像中的混合噪聲進行去除。盡管組合濾波能夠達到去除混合噪聲的目的,但由于不同維度濾波之間的相互影響,最終都會殘留部分噪聲。
因此,在深度學習和空間域濾波去噪的基礎上,現(xiàn)提出一種遙感影像混合噪聲二階去除方法。第一階段,在DnCNN去噪模型的基礎上引入擴張卷積,以增加網(wǎng)絡的感受野,便于在地物復雜的遙感影像中提取更多的特征信息,同時在網(wǎng)絡的深卷積層后引入DropoutLayer層,防止網(wǎng)絡出現(xiàn)過擬合,簡化網(wǎng)絡訓練難度,并且以航攝影像作為數(shù)據(jù)驅(qū)動訓練去噪模型,然后使用該模型對影像進行初步降噪;第二階段,在自適應中值濾波的基礎上采用最近鄰域像素加權中值替換原濾波窗口中值,對初步降噪結果進行二次處理,以提高初步降噪結果的影像質(zhì)量,有效去除混合噪聲中的椒鹽噪聲,保留更多的影像邊緣細節(jié)及紋理特征。
DnCNN模型在卷積神經(jīng)網(wǎng)絡(convolutional neural network,CNN)的基礎上使用殘差學習、正則化及批量歸一化等一系列方法來提高模型的去噪性能,能夠有效去除圖像中含有的高斯噪聲。DnCNN算法網(wǎng)絡架構主要由三大部分組成:第一部分為第1層,由Conv+ReLU組成,Conv是大小為3×3×C的卷積核,總共有64個,步長為1×1,C用于區(qū)分灰度圖像和彩色圖像,如果輸入圖像為灰度圖,則C=1,如果輸入圖像為彩色圖,則C=3;第二部分為第2至(d-1)層,每一層均由Conv+BN+ReLU組成,Conv是大小為3×3×64的卷積核,每一層的卷積核個數(shù)均為64、步長為1×1,BN為64個通道的批量歸一化層,ReLU為激活函數(shù)。第三部分為最后一層,由Conv組成,該部分使用C個3×3×64的濾波器對處理后的圖像進行重構輸出。
擴大網(wǎng)絡的感受野是卷積神經(jīng)網(wǎng)絡中獲取更多上下文信息的一種常用方法。目前來說,擴大感受野的常用方法主要有增加網(wǎng)絡深度、擴大濾波器尺寸及使用擴張卷積,然而,增加網(wǎng)絡深度會導致網(wǎng)絡性能下降,擴大濾波器尺寸會引入更多的參數(shù)數(shù)量和增加網(wǎng)絡的計算量,而擴張卷積可以在不增加網(wǎng)絡計算量的同時擴大感受野[16]。擴張卷積的原理是在標準的卷積核中注入空洞,以此來增加網(wǎng)絡的感受野,所以又將其稱為空洞卷積或者膨脹卷積。例如,對于一個卷積核大小為3×3,擴張因子為2,步長為1,層數(shù)為n的擴張卷積,其網(wǎng)絡感受野大小可以表示為(4n+1)×(4n+1);而對于一個卷積核大小為3×3,步長為1,層數(shù)為n的普通卷積,其網(wǎng)絡感受野大小表示為(2n+1)×(2n+1)。
Dropout層是一種能夠提升網(wǎng)絡模型泛化能力、解決深度學習中網(wǎng)絡過擬合問題的方法。其原理是對每一個隱含單元的權值設置一個服從Bernoulli分布的約束條件,如果這個約束條件被激活,則該單元將暫時以P概率從網(wǎng)絡中丟棄,這樣舍棄了部分特征,提高網(wǎng)絡的泛化能力,達到解決網(wǎng)絡過擬合的目的[17]。
傳統(tǒng)的自適應中值濾波(adaptive median filter,AMF)是一種非線性濾波,不僅能夠有效地去除噪聲,而且在一定程度上能夠保留邊緣紋理細節(jié)。該方法在去噪過程中主要分為兩個進程,可以定義為進程A與進程B。設X(i,j)為中心像素點(i,j)在進行濾波時對應的窗口(窗口允許的最大尺寸為Mmax),Zmin為窗口X(i,j)中灰度值的最小值,Zmax為窗口X(i,j)中灰度值的最大值,Imed為窗口X(i,j)中灰度值的中值,Z(i,j)為圖像像素點(i,j)位置上的灰度值。令
ZA1=Imed-Zmin
(1)
ZA2=Zmax-Imed
(2)
ZB1=Z(i,j)-Zmin
(3)
ZB2=Zmax-Z(i,j)
(4)
濾波具體算法流程如下。
(1)進程A:如果ZA1>0且ZA2>0時,轉(zhuǎn)入進程B;否則,增大窗口X(i,j)尺寸。如果窗口尺寸等于或小于最大窗口尺寸Mmax,則重復進程A,否則輸出該像素點灰度值Z(i,j)。
(2)進程B:如果ZB1>0且ZB2>0時,輸出該像素點灰度值Z(i,j),否則,輸出中值Imed。
雖然DnCNN降噪模型對于自然圖像的高斯降噪具有較好的效果,但是對于地形地物復雜的遙感影像,去噪效果一般,尤其是對于含有混合噪聲的影像,去噪結果仍然會存在較多的噪聲,并且邊緣細節(jié)及紋理信息不夠清晰。因此,在DnCNN模型與自適應中值濾波的基礎上,提出一種遙感影像混合噪聲二階去除方法。
在第一階段,以DnCNN網(wǎng)絡結構作為基礎框架搭建一階降噪模型DP-DnCNN,將網(wǎng)絡深度設置為20層,在1~19層中的偶數(shù)層中,采用擴張因子為2的擴張卷積(DilatedConv),以增加網(wǎng)絡的感受野,提升遙感影像特征提取能力,奇數(shù)層及第20層則采用普通卷積(Conv),并且在第19層的ReLU層后加入一層概率為0.5的DropoutLayer層,防止網(wǎng)絡出現(xiàn)過擬合,提升模型的泛化能力。網(wǎng)絡結構主要分為5個部分,第1部分為輸入層,由一個ImageinputLayer構成;第2部分為第1層,由Conv+ReLU組成;第3部分為第2~19層,由Conv+BN+ReLU和DilatedConv+BN+ReLU和Conv+BN+ReLU+DropoutLayer組成;第4部分為第20層,由一個Conv組成;第5部分為回歸輸出層,由一個RegressionLayer構成。網(wǎng)絡輸入層輸入的影像大小為50×50×1,第1層的輸入通道為1,卷積核大小為3×3,輸出通道為64。第2~19層的輸入通道為64,卷積核為3×3,輸出通道為64。第20層的輸入通道為64,卷積核大小為3×3,輸出通道為1。
在第二階段,由于傳統(tǒng)的自適應中值濾波是以其濾波窗口內(nèi)的中值替換噪聲點像素進行輸出的,因此窗口內(nèi)中值的大小將直接影響去噪的效果及影像清晰度,當中值像素點距離待替換噪聲點較遠時,會導致圖像失真,出現(xiàn)模糊現(xiàn)象。因此,本文對傳統(tǒng)的自適應中值濾波進行改進,提出自適應最近鄰域權值中值濾波(RW-IAMF)。具體改進方式如下,對于進程B的中值輸出,采用最近鄰域像素加權中值替換原濾波窗口中值,使得輸出的像素中值更接近原圖像素,提升算法的去噪性能和邊緣細節(jié)、紋理特征的保留能力。圖1為最近鄰域像素示意圖,其中Z(i-1,j)、Z(i,j-1)、Z(i+1,j)、Z(i,j+1)4個像素點表示點Z(i,j)的最近鄰域像素點。
圖1 最近鄰域像素示意圖Fig.1 Schematic diagram of the nearest neighbor pixel
首先在當前濾波窗口內(nèi)選取噪點的最近鄰域像素值集合W[f(i,j)],進而對選取的最近鄰域像素值進行噪聲檢測判斷:如果fn(i,j)=0或255,則將fn(i,j)判定為噪聲像素,予以剔除,其中fn(i,j)最近鄰域像素集合內(nèi)的某個像素值;對檢測后的最近鄰域像素值集合取中值Med(W[f(i,j)]),然后以這個中值為基礎,參考文獻[18]中的加權計算方法,采用式(5)和式(6)計算集合內(nèi)每一個像素點的加權系數(shù),再采用式(7)將檢測后最近鄰域像素集合內(nèi)剩余的像素點與求得的對應的加權系數(shù)進行加權求和,最后將計算結果作為濾波輸出。
(5)
(6)
(7)
式中:Med{W[f(i,j)]}為最近鄰域像素值集合;fn(i,j)為最近鄰域像素集合內(nèi)的某個像素值;N為檢測后最近鄰域像素集合W[f(i,j)]內(nèi)剩余的像素點總個數(shù),wn(i,j)為求得的某個像素點的加權系數(shù)大?。籪(i,j)為濾波輸出結果。
圖2 本文算法框架流程圖Fig.2 Flowchart of the algorithm framework of this paper
本文算法將第一階段訓練好的降噪模型與第二階段改進的自適應中值濾波相結合,在有效去除混合噪聲的同時提升影像邊緣細節(jié)及紋理特征的保護能力。算法首先采用第一階段的降噪模型DP-DnCNN對含混合噪聲的影像進行初步降噪,然后利用RW-IAMF對輸出影像進行二次修正,提高算法對于混合噪聲中椒鹽噪聲的去除能力。算法具體框架流程如圖2所示。
對于DP-DnCNN網(wǎng)絡模型的訓練,本文采用University of Twente Research Information提供的ITCVD航拍影像數(shù)據(jù)集作為訓練集,其中包括135張像素為5 616×3 744×3的航拍影像,分辨率為0.1 m。為方便訓練,在影像中隨機添加均值為0,方差為[0.001,0.01]范圍內(nèi)的高斯噪聲,并且將每張影像都隨機裁剪成512個50×50的小子塊,最終共訓練69 120個小子塊。網(wǎng)絡訓練輸入的影像大小為50×50,網(wǎng)絡訓練求解器使用的是帶有動量的隨機梯度下降(SGDM)優(yōu)化器,初始學習率設置為0.01且每迭代10個周期學習率下降為原來的1/10,小批量影像塊數(shù)量大小設置為128。為了防止梯度爆炸,使用梯度裁剪法穩(wěn)定訓練,并將梯度閾值設置為0.005,指定梯度閾值法使用梯度的絕對值。將L2正則化因子參數(shù)設置為0.000 1,減少網(wǎng)絡過擬合。網(wǎng)絡訓練是基于Matlab編程進行的,硬件配置為64位Windows10系統(tǒng),11th Gen Intel(R) Core(TM) i7-11700@2.50 GHz,NVIDIA GeForce RTx 3060。
為驗證本文算法的可行性,利用高分2號衛(wèi)星拍攝的影像作為實驗數(shù)據(jù)進行遙感影像去噪實驗,截取影像數(shù)據(jù)大小為400×400像素,同時對截取的影像分別添加0.001/0.003、0.003/0.005、0.005/0.008(前者是均值為0的高斯噪聲方差,后者是椒鹽噪聲密度)3種不同濃度的噪聲,便于對去噪結果進行定量、定性分析。采用均方誤差(MSE)[19]、峰值信噪比(PSNR)[20]、平均結構相似度(MSSIM)[21]作為去噪效果評價指標,將本文算法與DnCNN算法、BM3D算法、DP-DnCNN與自適應中值濾波結合算法(DPIA)、DnCNN與RW-IAMF結合算法(DNRW)、DnCNN與自適應中值濾波結合算法(DNIA)、文獻[14]方法(BMIA)、文獻[15]方法(BMDJ)的去噪效果進行比較,實驗結果如表1~表3所示,其中MSE越小、PSNR越大表示去噪質(zhì)量越好,MSSIM更接近人眼的視覺評價,其值越大表示去噪后得到的影像結構越完整、保留的邊緣細節(jié)及紋理信息越多。通過表1~表3中的數(shù)據(jù)對比可以看出,對于遙感影像中的混合噪聲,本文算法降噪后得到的均方誤差和峰值信噪比均優(yōu)于其他對比算法,說明本文所提算法針對遙感影像的混合噪聲降噪效果明顯優(yōu)于其他算法。對于平均結構相似度這一指標,本文算法降噪后得到的MSSIM結果也均優(yōu)于其他對比算法,說明本文所提算法相對于其他降噪算法來說,降噪后得到的影像結構更完整,能夠保留更多的影像邊緣細節(jié)及紋理特征。
本文除了從MSE、PSNR和MSSIM 3個指標進行定性、定量評估之外,還在視覺層面對比了各算法的影像去噪效果。圖3為各算法在混合噪聲濃度為0.003/0.005下的去噪效果圖,分析圖3可以看出,本文算法不僅能夠有效去除影像中含有的混合噪聲,而且能夠更完整地保留影像結構、影像邊緣細節(jié)及紋理特征,得到更清晰的影像。進一步分析各算法去噪結果局部放大圖(圖4)可知,相比組合算法,單一的DnCNN算法和BM3D算法能夠有效去除影像中的高斯噪聲,但是都對影像中含有的椒鹽噪聲去噪效果不佳,導致殘余噪聲較多,并且BM3D算法在影像平滑區(qū)域仍然存在邊緣細節(jié)丟失,紋理區(qū)域模糊的問題;DNIA算法、BMIA算法與DNRW算法能夠有效去除影像中的混合噪聲,但是仍然殘留有部分噪聲點,相比DNIA與BMIA算法,DNRW算法受最近鄰域像素加權中值的影響,殘留的噪聲點相對較少;BMDJ算法能夠更徹底的去除影像中的混合噪聲,但是影像去噪結果的邊緣細節(jié)存在丟失問題,并且影像紋理平滑的區(qū)域在視覺上產(chǎn)生了一定的模糊效果;DPIA算法較前幾種算法得到的影像去噪結果更清晰,保留的影像結構比較完整,但是仍然存在殘余噪聲點;比較以上算法的影像去噪結果,本文算法得到的去噪結果均優(yōu)于以上幾種方法,具有更接近于真實影像的視覺效果,不僅能夠有效去除影像中的混合噪聲,得到更清晰的
表1 各方法影像去噪結果的均方誤差(MSE)對比
表2 各方法影像去噪結果的峰值信噪比(PSNR)對比
表3 各方法影像去噪結果的平均結構相似度(MSSIM)對比
圖3 各算法去噪效果圖Fig.3 Denoising effect diagram of each algorithm
圖4 各算法去噪效果局部放大圖Fig.4 Partial enlarged view of denoising effect of each algorithm
影像,而且能夠保留更多的影像邊緣細節(jié)及紋理信息,得到更完整的影像結構。
圖5 各算法去噪影像邊緣檢測結果圖Fig.5 Image edge detection results of denoising images by each algorithm
為了更直觀地說明本文算法對于影像邊緣細節(jié)信息的保留能力,采用canny算子對各算法去噪結果進行邊緣檢測,檢測結果如圖5所示。從圖5中可以看出,對比原始影像和本文算法的檢測結果,BMIA、BMDJ兩種算法去噪后的影像輪廓線條較為稀疏,視覺效果不佳,尤其是BMDJ算法得到的結果,說明原始影像中的一些邊緣細節(jié)信息在去噪過程中被當作噪聲濾除,不能很好地保留影像的邊緣細節(jié)信息,而BM3D算法檢測結果中存在部分雜亂不連續(xù)的線條,說明這種方法去噪后的影像仍然存在部分噪聲;DnCNN算法去噪后的影像相比原始影像邊緣檢測結果來看,存在較多雜亂的輪廓線條,說明受椒鹽噪聲的影響,去噪后的影像仍然殘留有較多的噪聲,并且從圖中還可以看出影像的部分細節(jié)信息也被當作噪聲濾除;DPIA、DNRW、DNIA 3種算法去噪后影像邊緣檢測結果相比原始影像與本文算法的邊緣檢測結果,仍然存在少量不連續(xù)的線條,并且存在部分地物輪廓丟失的現(xiàn)象,說明3種算法去噪后結果仍然存在少量噪聲且不能很好地保留影像的邊緣細節(jié)信息;相比上述方法,本文算法去噪后影像得到的邊緣輪廓線條較為連續(xù),與原始影像的邊緣檢測結果較為相似,能夠恢復影像中地物的大致輪廓信息,說明本文算法不僅能夠有效去除影像中的混合噪聲,而且可以保留更多的影像邊緣細節(jié),便于后期影像的分類、識別應用。
遙感影像噪聲會對影像后續(xù)的使用和研究產(chǎn)生較大的影響,因此去噪是遙感影像處理中必不可少的環(huán)節(jié)。針對影像中存在的混合噪聲,將航攝影像作為訓練數(shù)據(jù)驅(qū)動,在DnCNN去噪模型的基礎上引入擴張卷積及DropoutLayer層訓練第一階段的高斯降噪模型,并且與第二階段的自適應最近鄰域權值中值濾波結合,提出了一種遙感影像混合噪聲二階去除方法。分析遙感影像去噪實驗結果及去噪影像邊緣檢測結果,無論從主觀視覺效果還是從客觀質(zhì)量評價來看,本文方法都具有較好的去噪性能,且去噪效果優(yōu)于傳統(tǒng)去噪方法,能夠有效去除影像中的高斯、椒鹽混合噪聲,較好地保留影像邊緣細節(jié)及紋理特征,獲得更清晰的影像結果,可應用于實際的遙感影像去噪處理。