劉瑞航 張佳瑜 馬彩虹
(寧夏大學 地理科學與規(guī)劃學院,寧夏 銀川 750021)
遙感影像地物分類作為遙感技術的一個重要領域,一直倍受研究人員的關注。近年來,隨著遙感技術的不斷發(fā)展,衛(wèi)星傳感器獲取的遙感影像空間分辨率也在不斷提高,遙感圖像分類已經成為獲取地物信息的有效手段[1-5]。然而,由于遙感影像自身空間分辨率的差別以及地物在遙感影像中的“同物異譜”和“同譜異物”的特點[6-8],傳統(tǒng)的監(jiān)督分類在進行地物分類時容易出現(xiàn)“錯分”“漏分”的現(xiàn)象,導致分類精度不高[9-10]。
為解決傳統(tǒng)監(jiān)督分類存在的問題,許多學者引進了不同的方法。Vapnik等[11]提出了支持向量機方法在解決小樣本、非線性問題上的優(yōu)勢,其適用于復雜地理條件下的地物分類;王佃來等[12]基于輔助前饋(back propagation,BP)算法結合K近鄰(K-Nearest Neighbor,KNN)模型,較好地解決了山體陰影和水體之間的誤分問題;曹兆偉等[13]實驗證明了BP神經網絡算法在海島地物分類中是一種行之有效且精確度更高的分類方法;梁玉劍等[14]基于BP神經網絡對遙感影像地物分類的方法進行研究,發(fā)現(xiàn)BP神經網絡的分類精度明顯優(yōu)于其他監(jiān)督分類算法;王威等[15]基于圖像分割及神經網絡提出了一種能夠顯著提高道路提取效率的方法。其中,BP神經網絡的較強學習能力、輸入參數(shù)靈活自由等特點能夠很好地結合遙感影像的光譜特征、高程、坡度、坡向等信息,對土地覆蓋類別進行較為準確的識別。
大量的研究結果表明,BP神經網絡具有收斂速度快、識別精度高等特點,適用于遙感影像的土地覆蓋分類。本文利用矩陣工廠(matrix laboratory,MATLAB)軟件的模式識別工具箱,以最佳指數(shù)法(optimum index factor,OIF)選取研究區(qū)的最佳波段組合和歸一化植被指數(shù)(normalized difference vegetation index,NDVI)為BP神經網絡的輸入,研究區(qū)的土地覆蓋類型為BP神經網絡的輸出,依據(jù)訓練數(shù)據(jù)構建BP神經網絡模型,通過模式識別的方法實現(xiàn)對銀川市三區(qū)遙感影像的像素點進行分類,進而實現(xiàn)土地覆蓋分類,并采用混淆矩陣的方法對分類結果進行精度評定,驗證此識別模型在銀川市三區(qū)土地覆蓋分類中的合理性和可靠性。
銀川市地處中國西北地區(qū)寧夏平原中部(37°29′~38°53′N,105°49′~106°53′E),是寧夏回族自治區(qū)的首府,是自治區(qū)政治、經濟、文化科研、交通和金融中心。研究區(qū)包括銀川市三區(qū)(西夏區(qū)、金鳳區(qū)、興慶區(qū)),西倚賀蘭山、東臨黃河,地貌類型多樣,自西向東分為賀蘭山地、洪積扇前傾斜平原、洪積沖積平原、河漫灘地等。
本次研究使用的數(shù)據(jù)是在地理空間數(shù)據(jù)云(https://www.gscloud.cn)中下載獲取美國陸地衛(wèi)星8號陸地成像儀(land satellite 8 operational land imager,Landsat8 OLI)遙感影像數(shù)據(jù),其獲取時間是2020年7月28日,數(shù)據(jù)含云量<5%,質量較好,對影像進行輻射定標、大氣校正、影像融合、裁剪等預處理。
多光譜遙感影像數(shù)據(jù)提供了豐富的地物光譜特征,但是地物在各波段的輻射強度存在一定的相關性,而相關性大的波段組合所包含的信息量會出現(xiàn)大量的冗余。查維茨提出的OIF的概念可以用來選擇信息量大且相關性小的波段組合,即
(1)
式中,Y為各個波段組合OIF值;Si為第i個波段的標準差;Rij為i、j兩波段之間的相關系數(shù)。對n波段圖像數(shù)據(jù),先計算其每個波段的標準差及相關系數(shù)矩陣,然后分別求出所有可能三組波段對應的OIF值。
BP神經網絡的基本思想是把學習過程分為信息的正向傳播和誤差的反向傳播兩個過程。它是一種單向傳播的多層前饋網絡,其結構包括輸入層、中間層和輸出層(圖1)。當學習樣本數(shù)據(jù)輸入網絡后,經過隱藏層的處理后得到對應輸出模式,完成了一次學習的正向傳播。當?shù)玫降妮敵瞿J脚c預期模式不符時,則開始進行誤差的反向傳播階段,誤差在反向傳播過程中按照梯度下降的模式對各層結點的連接權重進行調整,最后返回到輸入層。通過不斷正向學習和誤差反向傳播,使得網絡結構達到最佳、輸出誤差減少到可以接受的范圍。
圖1 神經網絡的拓撲結構
(1)輸入層和輸出層節(jié)點數(shù)。BP神經網絡輸入層和輸出層節(jié)點數(shù)要根據(jù)實際情況來確定。研究使用經OIF確定的最佳波段組合,同時,為了更好地區(qū)分植被與其他地物,加入NDVI作為輸入參數(shù)之一,可確定輸入層的節(jié)點數(shù);研究區(qū)遙感影像地物分類數(shù),就是輸出層節(jié)點數(shù)。
(2)隱藏層節(jié)點數(shù)。網絡隱藏層的節(jié)點數(shù)對訓練結果有很大的影響。過少的節(jié)點數(shù)使得網絡不能充分地訓練,導致訓練的精度不高;過多的節(jié)點數(shù)使得網絡計算量增加、訓練時間過長、容錯率低,不利于得到精度較高的結果。然而,目前對于隱藏層節(jié)點數(shù)的計算并沒有一個確切的數(shù)學公式來求解,只能根據(jù)實際訓練情況不斷調整。本研究根據(jù)式(2)[12]進行初步確定。
(2)
式中,N為隱藏層節(jié)點數(shù);A為分類數(shù)量;B為特征向量維數(shù)。經多次實驗,本研究的隱含層節(jié)點數(shù)為10。
(3)訓練參數(shù)設置。神經網絡創(chuàng)建函數(shù)為patternnet,網絡訓練函數(shù)采用trainscg,輸入層和輸出層的激活函數(shù)如式(3)所示,訓練期望誤差為0.01,最大迭代次數(shù)為1 000次。
(3)
式中,zi為第i個節(jié)點的輸出值;C為輸出節(jié)點的個數(shù)。
利用遙感影像處理平臺(the environment for visualizing images,ENVI)5.3得到研究區(qū)OLI各波段統(tǒng)計數(shù)據(jù)及相關系數(shù)矩陣。發(fā)現(xiàn)影像各波段標準差的大小順序為Band5>Band6>Band7>Band4>Band3>Band2>Band1。其中,Band5信息量最為豐富,Band6也較為豐富。Band1、Band2、Band3這三個波段相關性顯著,相關系數(shù)在0.981 2~0.996 4,而其與其他波段相關性相對較小;近紅外Band5與可見光Band1、Band2、Band3、Band4相關性較小;中紅外Bnad6、Band7之間相關性較顯著,見表1。
表1 波段組合及對應的OIF值
OIF值越大,則相應組合圖像的信息量越大,對OIF進行升序排列,OIF最大的波段組合即為最優(yōu)波段組合。根據(jù)上述計算得到各波段的標準差以及各波段之間的相關系數(shù),利用OIF計算公式,在MATLAB中計算所有可能的波段組合及對應的OIF值(表1)??芍?Band4、Band5、Band6波段組合的OIF值最大,選擇為最佳波段組合。
應用ENVI5.3得到各ROI的4個參數(shù),經歸一化、去除異常值等數(shù)據(jù)預處理后,作為神經網絡訓練的最終輸入參數(shù)。輸出的目標矩陣為6行n列的單位矩陣,每一行對應一類地物,其形式為:
T=[000 001%耕地
000 010%林地
000 100%草地
001 000%水域
010 000%建設用地
100 000%未利用地]
神經網絡在訓練到105代達到最佳,誤差為0.024 6(圖2)。其中橫坐標為迭代次數(shù),縱坐標為交叉熵值。
圖2 BP神經網絡收斂過程
待分類的遙感影像數(shù)據(jù)不能直接輸入到網絡中仿真,在MATLAB中采用imread函數(shù)可以將待分類的遙感影像分解成若干灰度向量。本研究采用Landsat8 OLI多波段影像,故被分解成7個灰度向量。選取基于OIF得到的Band4、Band5、Band6以及NDVI作為BP神經網絡的輸入參數(shù),進行仿真得到分類圖(圖3)。
圖3 OIF輔助BP神經網絡分類結果
為了驗證改進的BP神經網絡分類的有效性,將其分類結果與最大似然法的分類結果(圖4)、支持向量機(support vector machine,SVM)分類結果(圖5)進行精度對比。為保證分析結果具有可比性,采用變量一致性原則,各分類方法使用相同的訓練樣本及測試樣本,見表3。
圖4 最大似然法分類結果
圖5 SVM分類結果
表3 三種分類方法的混淆矩陣
從以上3類分類算法的混淆矩陣及精度評定(表4)可以看出,OIF輔助BP神經網絡的模式識別方法在總精度(86.95%)和Kappa系數(shù)(0.843 5)方面均具優(yōu)勢;從生產者精度來看,該方法在林地、草地、水域和未利用地的分類中優(yōu)勢明顯,精度都超過了90.00%,但在建設用地的分類中精度較低只有70.73%。OIF輔助BP神經網絡的模式識別方法在耕地分類上精度為81.44%,略高于最大似然法的81.06%和SVM分類法的80.68%,三者相差不大;在林地分類上,精度明顯優(yōu)于最大似然法和SVM分類法,達到了92.49%,高于最大似然法的77.47%、SVM分類法的77.08%;在草地的分類中,精度達到了93.45%,相較于最大似然法精度(77.82%)和SVM分類法精度(74.55%),具有明顯的優(yōu)勢;在未利用地的分類上,精度為92.38%,遠高于最大似然法的63.81%和SVM分類法的46.19%;在水域的分類上,精度為93.61%,遠高于最大似然法的60.15%,略低于SVM分類法的95.11%;對于建設用地的分類該方法不具優(yōu)勢,精度為70.73%,低于最大似然法的97.21%和SVM分類法的72.47%。
表4 三種分類方法Kappa系數(shù)與總體精度對比
本研究以Landsat8 OLI遙感影像為數(shù)據(jù)源,構建了OIF輔助BP神經網絡模式識別模型,與最大似然法分類法、SVM分類法比較,其強大的非線性映射能力和靈活的網絡結構能夠對海量數(shù)據(jù)進行高效地處理,顯著提高了分類總體精度,現(xiàn)研究結論如下:①OIF輔助的BP神經網絡的模式識別模型的輸入參數(shù)靈活,可用于地表覆蓋種類多樣的地區(qū),可以精準高效地對銀川市三區(qū)土地覆蓋進行分類;②OIF輔助BP神經網絡模式識別的總精度為86.95%,Kappa系數(shù)為0.843 5,優(yōu)于SVM分類法和與最大似然法;③OIF輔助的BP神經網絡的模式識別對林地、草地、未利用地的識別精度遠高于最大似然法分類精度;耕地分類依然存在著錯分與漏分問題,但相較于最大似然法和SVM分類算法,精度有了提高;對于建設用地的識別精度較低,與最大似然法有一定差距。
研究存在一些不足:受數(shù)據(jù)源空間分辨率的限制,并未對研究區(qū)進行更精細的分類;在構建分類模型時研究僅對輸入參數(shù)進行了調整;對建設用地的識別精度較低。在后續(xù)研究中,可以采用更高空間分辨率的影像,對神經網絡輸入參數(shù)和隱藏層結構進行優(yōu)化改進,以及探究不同的激活函數(shù)對分類結果的影響;也可嘗試引入面向對象的思想,構建卷積神經網絡,進一步完善土地覆蓋分類的方法。