孫 偉孫鵬翔黃 恒劉思奧
(遼寧工程技術大學測繪與地理科學學院,遼寧阜新123000)
從上世紀80年代起,學者們的目光就開始投向于遙感影像建筑物的提取方向,對其展開了理論研究并進行了大量的實驗,針對于遙感影像的建筑物信息提取是指在遙感數據中通過相關算法[1-5],根據既定的流程在眾多圖像信息中準確找到建筑物的位置、屬性、形狀等信息[6-9]。2009年Ren K檢測到遙感圖像中的建筑物陰影,用盒子搜索來確定建筑物的外界輪廓信息。2010年陳杰在面向對象分類方法的基礎上與空間聚變和分水嶺變化相結合,他還加入了Gabor小波段用來提取Quick Bird信息,利用結合后的新方法進行分割,最后分析對象之間的空間拓撲關系來確定類別性質,該方法可提升影像分類的自動化能力,能有效利用對象各大特征。2017年林雨準等人將多尺度分割和形態(tài)學相結合提出了陰影檢測方法,利用均值漂移法和分割影像,對影像進行多尺度分割后生成陰影指數矢量,對高分二號和Google Earth影像進行實驗,結果表明該方法有一定抗干擾能力。高分辨率影像會存在同物異譜或者異物同譜現象,僅靠單一的技術不可避免地無法準確獲取信息,基于多特征多方法結合的方法比單一的方法效果好,相對地算法流程會比單一的復雜。隨著計算機發(fā)展的越來也成熟、人工智能的興起以及多學科相互交叉[10-11],該方法在以后一定會不斷突破,成為建筑物提取的主要方法。影像分割[12-14]是面向對象信息提取算法的關鍵,目前較為常見的多尺度分割算法在最優(yōu)尺度確定好的前提下可以精確的分割影像對象,但是該方法主要應用于商業(yè)型軟件中,在實際的項目中使用成本過高。論文嘗試通過滑動窗口的方式對窗口內的影像對象特征進行提取與訓練,在多尺度分割實驗中探究最優(yōu)尺度選擇的問題,在滑動窗口實驗中構建面向對象建筑物信息提取方案。
灰度共生矩陣(Gray-Level Co-occurrence Matrix,GLCM)[15]是紋理特征提取的基礎,通過計算灰度圖像的空間分布得到共生矩陣,根據其相關特征值代表圖像紋理特征的一種統(tǒng)計分析方法,即通過統(tǒng)計某一特定的灰度值在空間中反復出現的次數,以此描述紋理特征。可用兩個位置像素的聯合概率密度來定義共生矩陣。
通過設二維圖像水平方向與垂直方向分別有Nx、Ny個像元,定義灰度級數為k,則灰度級集合K={0,1,2,…,k-1}。取圖像中任意一點記為(x,y)以及偏離它的另一點記為(x+Δx,y+Δy),設這一組點對的灰度值為(m1,m2)。將(x,y)點在圖像域Nx×Ny中任意移動,則會出現k2種(m1,m2)的組合。在整個圖像域中統(tǒng)計每一種(m1,m2)出現的個數,排成方陣,再用(m1,m2)出現的總次數將其歸一化為概率P(m1,m2),此方陣記為灰度共生矩陣:
差分值(Δx,Δy)每更新一次數值,就會得到一個新的聯合概率矩陣,(Δx,Δy)取值要根據紋理特征周期分布的特性來選擇,對于較細的紋理,要選取較小的差分值。為了減少計算量,通常選取0°、45°、90°和135°四個方向對圖像域進行掃描。當圖像各位置的灰度值差異不大時,灰度共生矩陣中的各元素會集中在主對角線附近分布,當圖像各位置的灰度值差異很大時,灰度共生矩陣中的各元素會較為分散。
主成分分析法主要根據正交變換原理將原始空間轉化至主成分空間,把具有相關型的變量數目減少,減少數據冗余,實現數據降維。如圖1所示,二維空間的黑色數據點沿M軸的方差最大,因此將其投影到M軸,將二維數據降至一維,降維后的各個主成分之間相互獨立,能代表原始數據中絕大部分信息。
圖1 主成分分析降維示意圖
論文將GF1影像中的四個波段數據作為4個變量,構造協方差矩陣進行降維,并提取主成分第一分量,在多特征基礎上增加第一分量特征來增加類別間的差異性,提高分類精度。
根據如圖2所示主成分分析流程可得:
圖2 主成分分析流程圖
①圖像矩陣零均值化。將圖像排成矩陣X,其中一行代表一個像元,一列代表一個波段,p個波段(x1x2…xp),n個像元的圖像矩陣X的結構如式(2)。
式中:xi=(xi1xi2…xip),xj=(x1jx2j…xnj)T,i=1,2,…,n,j=1,2,…,p。
將X進行零均值化處理:
②計算協方差矩陣C,即各波段之間的相關系數矩陣,求解過程如式(4)與式(5)。
③求解特征方程|λE-C|=0,計算協方差矩陣對應的特征值并按式(6)由大到小排列。
④逐個計算每個特征值對應的特征向量ki=(ki1ki2…kip),i=1,2,…,p,并排成矩陣,其中,‖ki‖=1。
⑤計算貢獻率和累計貢獻率。特征方程的每個特征根貢獻率θ計算公式如式(7):
論文選取貢獻率最高的主成分第一分量進行特征組合分析,實現數據降維,并將得到的單波段影像作為區(qū)別不同地類差異性的評價標準之一。
絕大多數高分辨率遙感影像都有多個波段,攜帶著大量的信息,并且每個波段所攜帶的信息都不可以隨意丟棄,為了將數據損失降低到最小,論文采取主成分分析的方法將研究區(qū)的GF1_WFV1影像降維,提取主成分第一分量得到灰度圖像。預處理后的影像以及主成分分析后的影像如圖3所示。
圖3 預處理后的影像與降維影像
圖4 為單波段的主成分第一分量、第二分量和第三分量。在獲取主成分第一分量后,為減少計算量來提高算法效率,對影像進行灰度級調整至0~15之間,取整保留16個灰度級。進行灰度級縮放時將影像進行直方圖均衡化處理,來增加影像的全局對比度。
圖4 單波段各主成分分量
如圖5所示,滑動窗口參數主要包括窗口大小與步長。其中,窗口大小設置為5×5、步長設置為1。窗口從影像左上角開始水平滑動,先進行列遍歷,滑動完整行后,行加1繼續(xù)滑動,每滑動一次窗口就計算一次窗口內的紋理特征與光譜均值特征,直至整幅影像全部遍歷完成,滑動停止。通過擬合的分類算法模型來預測每個窗口內的地物類別信息。
圖5 滑動窗口示意圖
GLCM雖然可以描述紋理,但是不可以對紋理進行深層次分析,因此Haralick等人相繼用灰度共生矩陣提出了14種統(tǒng)計函數,即為灰度共生矩陣特征值。其中多個統(tǒng)計函數之間存在數據冗余,為了簡化計算,用四個應用最廣泛的特征值來提取影像對象的紋理特征。
①角二階矩(Angular Second Moment,ASM)又稱為能量,是圖像灰度分布均勻程度和紋理粗細的一個度量,反映圖像灰度分布均勻程度和紋理粗細度。當圖像紋理均一規(guī)則時,能量值較大;反之灰度共生矩陣的元素值相近,能量值較小。
②熵(Entropy,ENT)度量了圖像包含信息量的隨機性,表現了圖像的復雜程度。當共生矩陣中所有值均相等或者像素值表現出最大的隨機性時,熵最大。
③對比度(Contrast,CON)反應圖像的清晰度和紋理的溝紋深淺。紋理越清晰反差越大對比度也就越大。
④反差分矩陣(Inverse Differential Moment,IDM)反映紋理的清晰程度和規(guī)則程度,紋理清晰、規(guī)律性較強、易于描述的,值較大。
由于灰度共生矩陣的計算全部以矩陣為單位,因此計算影像對象紋理特征時所需要的計算量非常大,計算中產生的冗余會大量消耗電腦內存,因此在研究區(qū)選擇時,截取預處理后的內蒙古自治區(qū)GF1_WFV1影像中的一小塊區(qū)域進行信息提取研究。GF1_WFV相機為多光譜相機空間分辨率為16 m,分辨率較低,同時研究區(qū)域有大量林地、耕地,非建筑物較多,地物相對簡單數據處理量小,以便快速得出實驗結果。預處理后的研究區(qū)影像如圖6所示。
圖6 研究區(qū)影像參數信息
分別采用多尺度分割和滑動窗口算法對建筑物信息的提取,并在算法使用成本、準確度兩個方面進行比對分析。
表1 精度評價
在算法使用成本方面,多尺度分割的建筑物信息提取結果在易康商業(yè)遙感軟件中操作得出,圖7(a)中十字絲為樣本點的選取位置。由于選取的影像是分辨率16 m的GF-1影像,不同地物邊界較為模糊,所以使得多尺度分割在不同地物的邊緣區(qū)域分割的過于細碎,依賴于分割后的人工后處理操作,將影像對象進行人為勾畫與修改,人力成本過高。此外,易康軟件缺乏影像預處理操作,與此商業(yè)機構合作困難,因此在實際項目中的使用成本較高;反之滑動窗口的應用場景要廣泛得多,圖8中滑動窗口的提取過程通過Python語言實現,只需要配置GDAL,OpenCV,Scikit-learn模塊即可在終端中運行,此外算法可以進行封裝,在信息提取的系統(tǒng)中調用,在實際項目中使用成本較低。
圖7 多尺度分割提取結果
圖8 滑動窗口提取結果
在準確度方面,根據表的精度評價結果顯示,多尺度分割方法的總體精度為84.73%,Kappa系數為0.698 1;滑動窗口方法的總體精度為85.67%,Kappa系數為0.698 1,兩種方法的建筑物提取結果均有極高的一致性。其中滑動窗口提取結果的總體精度比多尺度分割提取結果的總體分類精度高出0.94%,Kappa系數高出0.012 5,因此在準確度方面兩種方法的提取精度較為相似。
綜合算法使用成本和準確度兩個方面的分析,在后續(xù)的建筑物信息提取實驗中,將運用滑動窗口方法進行面向對象的建筑物信息提取。
通過主成分分析進行數據降維,獲取主成分第一分量,縮放第一分量灰度級,為滑動窗口紋理特征的計算提供數據輸入;通過灰度共生矩陣計算單窗口內特征值,計算四個最常見的紋理特征;利用紋理特征結合光譜均值特征構建面向對象的建筑物信息提取的實現方案,得出滑動窗口的建筑物提取結果,并與多尺度分割的提取結果進行評價參數對比,在算法使用成本和準確度兩個方面進行分析;結合影像對象的光譜特征和紋理特征,設計基于多尺度分割和滑動窗口的面向對象建筑物信息提取實驗。實驗結果表明,滑動窗口的建筑物提取方法精度略高于多尺度分割,且對于商業(yè)性軟件無依賴性,使用成本低。