黃玉芬
(遼寧科技學院 曙光大數據學院,遼寧 本溪117004)
隨著遙感技術的不斷發(fā)展,它在地理數據獲取、地質勘測、環(huán)境監(jiān)測等領域發(fā)揮著重要的作用。能夠準確、迅速地獲得遙感信息遙感圖像是關鍵,而遙感圖像的分類是對遙感圖像處理重要組成部分。傳統(tǒng)的遙感圖像分類算法有監(jiān)督分類和無監(jiān)督分類兩種。監(jiān)督分類方法如最大似然法、 平行多面體等分類方法存在人為主觀因素較強等問題;無監(jiān)督分類如 K-Means方法會因某地會存在“同物異譜”和“異物同譜”等問題使模型的泛化能力不強,分類效果不理想。文章采用基于卷積神經網絡(Convolutional Neural Networks)處理遙感圖像分類。卷積神經網絡相對于一般的人工神經網絡,通過添加卷積層和池化層使模型對圖像進行局部感知;通過參數共享機制降低模型復雜程度,提高模型訓練效率。而遙感圖像經過數字化處理后是多維數組,卷積神經網絡通過卷積層對圖像進行特征提取,輸入圖像和訓練網絡的拓撲結構能很好地吻合[1],相較以統(tǒng)計學為基礎的傳統(tǒng)的遙感圖像分類算法,卷積神經網絡有更強的自主學習能力和容錯能力。
卷積神經網絡中的核心部分是卷積層,它的作用是對圖像在像素值的水平上進一步的特征提取,提取的方法是在大小為n×n的特征圖上用卷積核大小為m×m(通常取5×5)的濾波器(Filter)以步長(stride)為1進行移動,卷積核與特征圖的圖像像素值做卷積操作,生成 一個大小為(m-n+1)×(m-n+1)新特征圖作為下一層的輸入層。
卷積操作公式為:
訓練神經網絡的過程實際上是在訓練一個卷積層的卷積核,使這些卷積核能檢測到圖像的特定特征[2]。
通常在卷積層后增加激活函數,如果沒有對上一層網絡的計算結果進行非線性處理,那么層與層之間都是線性關系,即輸出結果為輸入結果的線性組合,模型的表達能力有很大的局限性?,F實生活中大部分問題也并不是簡單的線性關系,激活函數可以使模型具有更強的學習能力,也可以增大整個網絡的稀疏性,加快模型收斂速度。文章采用Relu函數作為激活函數,其表達式為f(x)=max(x,0),以Relu函數作為層與層之間的過渡層[3]。
從卷積層到增加激活函數再到后來的 Droupout 層,構建整個網絡的過程中,通過去除一些不重要的信息,控制模型的冗余性,減小后期訓練過程出現過度擬合的問題。在卷積層基礎上,引入池化層的目的是可以在保持大部分信息的同時,減小特征圖的尺寸, 通過最大池化或者平均池化,減少輸入的維度和參數的數量,進而減小計算量,提高算法的效率。
文章采用的深度學習框架為 TensorFlow1.14.0,系統(tǒng)為 Windows10位,處理器為酷睿i5-8265U 1.60 GHz,內存為8G,四類遙感圖像,每類圖像700張,模型迭代次數為 5 000 次。
在將圖像數據讀入到神經網絡之前需要做好數據的預處理工作,需要把所有圖像的大小統(tǒng)一,這里采用雙線性插值把圖像尺寸改為64×64,然后對每張圖片像素坐標進行歸一化,將像素值轉化到0~1之間,減小模型的運算量[4]。
把有標簽的各類遙感圖片整合在一起構成其圖像數據集DateSet[image1,image2,……,imagen],同時保存每張圖片所屬的標簽Labels[label1,label2,……,labeln],然后對整個數據集進行隨機打亂,按照訓練集和測試集比例為75∶25進行劃分。
整個模型中,前三層是卷積層用Convi表示,每一層卷積層包含池化層用Poolingi表示, 其中卷積層Conv1,Conv2和Conv3包含卷積核的個數分別有 64、32 和 16,三層卷積核尺寸均為3×3,滑動步長為 1,激活函數采用 Relu 。池化層Poolingi的池化窗口大小為2×2,池化方式采用最大池化進行特征圖下采樣。然后增加兩層全連接層,并引入Dropout 隨機剔除掉30%的神經元,可以有效減少過擬合。最后輸出層通過 Softmax邏輯回歸分類器得出最大概率對應的標簽[5](如圖1)。
圖1 模型結構圖
在訓練集中隨機選出8張遙感圖像進行預測,圖2為識別結果,都能準確識別出各類遙圖像所屬的類別。
圖2 預測結果
通過tensorboard可查看詳細的模型訓練情況,最終模型的準確率在91.7%左右,loss值最終穩(wěn)定在0.16,(如圖3、圖4)。
圖3 模型在訓練過程準確率
圖4 模型損失值
因為本問題屬于多分類任務, 準確率不能完全反映分類器的性能, 宏平均 (Macroaveraging) 和微平均(Micro-averaging)是評價多分類分類器的性能優(yōu)劣的兩種常用方法,宏平均是指所有類別的每一個統(tǒng)計指標值的算數平均值,即宏精確率,宏召回率和F值[6]。
宏精確率Pmacro計算公式為:
宏召回率Rmacro計算公式為:
宏F值Fmacro計算公式為:
文章基于CNN卷積神經網絡實現了遙感圖像的分類,現有遙感圖像數據集中分類效果表現良好,最后用宏平均對模型進行全面的評估。該方法分類效果優(yōu)于傳統(tǒng)的遙感圖像方法,模型具有良好的泛化性。