熊 敏
(福建省地質(zhì)測(cè)繪院,福建 福州 350011)
隨著國(guó)家的快速發(fā)展,我國(guó)各個(gè)領(lǐng)域各個(gè)行業(yè)的發(fā)展也是日新月異,對(duì)于測(cè)繪工程來說,區(qū)別于傳統(tǒng)的大地測(cè)量,遙感技術(shù)、GPS 技術(shù)、地理信息系統(tǒng)以及攝影測(cè)量技術(shù)的發(fā)展與進(jìn)步,改變了測(cè)繪界一直以來基于傳統(tǒng)測(cè)量的局面,有效地提高了測(cè)量的效率與精度。而其中遙感技術(shù)是必不可少的組成部分。本文首先對(duì)最初的遙感影像進(jìn)行預(yù)處理操作,然后使用不同的分類方法進(jìn)行分類,最后評(píng)價(jià)分析分類的結(jié)果,通過這種方法對(duì)土地覆蓋現(xiàn)狀進(jìn)行調(diào)查,有利于我們更好地管理利用土地,減少國(guó)土資源的浪費(fèi)和破壞。
本文研究所選地區(qū)為安徽省馬鞍山市,位于長(zhǎng)江下游長(zhǎng)三角區(qū),土地總面積約40.49 萬hm2,其中,耕地面積14.79 萬hm2,林地面積7.37 萬hm2,交通用地0.94 萬hm2,水域10.61 萬hm2,其他用地6.67 萬hm2,市區(qū)年平均降水量1060 mm,降水總量約2.9 億m3。
本文所采用的數(shù)據(jù)下載自官方網(wǎng)站地理空間數(shù)據(jù)云,行編號(hào)與列編號(hào)分別為120,38 的某地區(qū)Landsat 8 衛(wèi)星影像數(shù)據(jù)。Landsat 8 衛(wèi)星上攜帶有OLI 和TIRS 兩個(gè)主要的傳感器,本次研究所用數(shù)據(jù)即由地理空間數(shù)據(jù)云下載的云量遮擋少、能見度高的衛(wèi)星影像數(shù)據(jù)。我們將下載的Landsat 8 衛(wèi)星影像數(shù)據(jù)在所選用的軟件平臺(tái)ENVI 4.7 進(jìn)行初步地裁剪、大氣校正輻射定標(biāo)影像融合等處理后,通過監(jiān)督分類、非監(jiān)督分類以及構(gòu)建決策樹的方法對(duì)影像數(shù)據(jù)進(jìn)行分類比較,分析其分類精度和效果。
本文實(shí)驗(yàn)用的影像數(shù)據(jù)經(jīng)過篩選后下載,該影像畫面清晰,云量較少,圖像質(zhì)量總體較好,以下為預(yù)處理操作過程以及原理作簡(jiǎn)單地介紹。
1.3.1 試驗(yàn)區(qū)裁剪
所謂影像裁剪就是裁剪出本次研究所需區(qū)域,依據(jù)行政區(qū)邊界或者自身研究所需的區(qū)域大小的自然邊界進(jìn)行裁剪,裁剪時(shí)可以根據(jù)行政區(qū)的邊界大小使用ArcGIS 軟件進(jìn)行手動(dòng)摳圖裁剪。
1.3.2 影像融合
本文研究所作的圖像融合是在基于ENVI 4.7軟件系統(tǒng)的支持下將低空間分辨率的多光譜影像和高光譜數(shù)據(jù)與高空間分辨率的單波段影像重采樣生成高分辨率的多光譜影像,使得處理過后的遙感影像在具有高空間分辨率的同時(shí)又比單波段影像具有多光譜的特征。
1.3.3 輻射定標(biāo)
輻射定標(biāo),通俗來講就是把記錄的原始的數(shù)字量化值DN 轉(zhuǎn)化為大氣外層表面反射率或者輻射亮度值等,目的是消除傳感器本身產(chǎn)生的誤差,從而確保傳感器接收的輻射值準(zhǔn)確,這也是進(jìn)行大氣校正的前期準(zhǔn)備[1]。
1.3.4 大氣校正
利用遙感技術(shù)獲取地物信息時(shí),是用傳感器來接收觀測(cè)目標(biāo)所發(fā)出的電磁能量。大氣校正有多種方法和模型,這里我們使用的ENVI 的FLAASH 模塊,直接使用atmospheric correction 工具進(jìn)行大氣校正。
2.1.1 K-Means
K-Means 是非監(jiān)督的聚類算法,使用的是聚類分析的方法。聚類分析就是在給定的一些數(shù)據(jù)中查找發(fā)現(xiàn)數(shù)據(jù)與數(shù)據(jù)之間的關(guān)系,并以此為依據(jù)將數(shù)據(jù)進(jìn)行分組,同組內(nèi)的對(duì)象之間相似度越高、不同組間的差別就越大,那么就代表著該聚類分析的聚類效果越好。
聚類算法時(shí)如果希望提高分類精度,可以嘗試適當(dāng)提高迭代次數(shù),分類的操作步驟大致如下:首先打開需要分類的影像數(shù)據(jù),在K-Means 分類器的參數(shù)設(shè)置界面K-Means Paramenters 上我們可以設(shè)置分類數(shù)目Number of Classes 和最大迭代次數(shù)Maximum Iteration,迭代次數(shù)越多,分類效果和精度越好[2]。
圖1 K-Means 分類圖
2.1.2 IsoData
IsoData 中文名稱就是重復(fù)自組織數(shù)據(jù)分析技術(shù)。IsoData 和K-Means 算法是ENVI 非監(jiān)督分類的2 種分類器,從算法的角度比較,IsoData 算法是通過選擇初始值,包括聚類中心(也稱質(zhì)心)等指標(biāo),然后計(jì)算數(shù)據(jù)空間中均勻分布的類均值,按照距離中心的最短距離進(jìn)行分類,然后用最小距離技術(shù)將剩余像元進(jìn)行迭代聚合,計(jì)算出距離函數(shù)等指標(biāo),重新迭代計(jì)算后都計(jì)算出一個(gè)新的均值,按照給定的要求使用新計(jì)算出的各項(xiàng)指標(biāo),對(duì)之前獲得的聚類像元進(jìn)行合并或分裂處理再分類,從而獲得新的聚類中心,聚類中心的個(gè)數(shù)也會(huì)隨之改變。
圖2 IsoData 分類圖
2.2.1 最大似然法
ENVI4.7 軟件中的監(jiān)督分類一共有兩類9 種分類器,其中,最大似然法是一種基于傳統(tǒng)統(tǒng)計(jì)分析學(xué)的統(tǒng)計(jì)方法,其特點(diǎn)是事先知道地物類別的特征信息,即類別的先驗(yàn)知識(shí)。分類的步驟大致如下,首先本文對(duì)影像的土地利用分類定義了5 個(gè)類別,植被、水體、農(nóng)田、居民區(qū)和道路,在主頁窗口中點(diǎn)擊Region Of Interest 選擇Roi Tool 工具欄定義分類名稱和顏色繪制多邊形選擇訓(xùn)練樣本。選擇最大似然分類器在參數(shù)設(shè)置界面根據(jù)需要更改參數(shù)。
一般默認(rèn)參數(shù),選擇文件輸出保存路徑后,對(duì)影像進(jìn)行分類顯示,經(jīng)過最大似然分類后的影像結(jié)果,如圖3 所示。
圖3 最大似然分類圖
圖4 最小距離分類圖
圖5 決策樹分類圖
2.2.2 最小距離法
最小距離法(Minimum Distance)屬于遙感影像監(jiān)督分類這個(gè)模塊,通俗來說,最小距離法就是經(jīng)過計(jì)算影像中所有像元到選取的樣本點(diǎn)的距離,統(tǒng)計(jì)后進(jìn)行對(duì)比分析,然后根據(jù)距離的大小來將其規(guī)劃進(jìn)某一類別中。最小距離法的原理大致如下:假設(shè)將數(shù)據(jù)庫n分成A、B、C 和D 等幾種類別,通過距離算法求出像元到各個(gè)類別中心X的距離S,通過比較選擇出最小的距離S,將該像元?jiǎng)澐值阶钚【嚯x的類別中。
監(jiān)督分類和非監(jiān)督分類是比較傳統(tǒng)簡(jiǎn)單的分類方法,隨著測(cè)繪學(xué)科范圍不斷擴(kuò)大,遙感技術(shù)日新月異快速發(fā)展,許多新的分類方法不斷誕生,其中決策樹分類計(jì)數(shù)發(fā)展較為成熟應(yīng)用較多。決策樹顧名思義是一種樹的結(jié)構(gòu),并且是一個(gè)二叉樹或者多叉樹,樹的分叉處是結(jié)點(diǎn)包括葉結(jié)點(diǎn)和根節(jié)點(diǎn),葉結(jié)點(diǎn)表示一個(gè)類,根結(jié)點(diǎn)是二叉樹上面那個(gè)結(jié)點(diǎn)。本次研究使用決策樹分類是基于CART 算法下的,通過CART 算法來獲取規(guī)則,并基于此規(guī)則對(duì)影像數(shù)據(jù)分類[3],以下是基于該算法決策樹分類的總體技術(shù)流程:
1)數(shù)據(jù)預(yù)處理;
2)構(gòu)建多源數(shù)據(jù)。這里需要構(gòu)建一個(gè)混合波段,這個(gè)合成波段包括紅、綠、藍(lán)和近紅4 個(gè)波段,NDVI 數(shù)據(jù),裁減過后的該試驗(yàn)區(qū)DEM 矢量數(shù)據(jù)以及經(jīng)過IsoData 分的類數(shù)據(jù)共7 個(gè)波段;
3)獲取規(guī)則。與監(jiān)督分類方法相同使用Roi Tool 工具選擇選練樣本,樣本選取后,在Decision Tree 下選擇Classifier 計(jì)算,得到?jīng)Q策樹;
4)在打開的決策樹面板點(diǎn)擊菜單欄的Options選擇execute 執(zhí)行決策樹,得出分類結(jié)果。
本次研究使用的決策樹分類是基于CART 算法的,但是在ENVI 4.7 軟件中需要在網(wǎng)上自行下載CART 插件,安裝到ENVI 下。
對(duì)遙感數(shù)據(jù)分類后,需要評(píng)價(jià)分析分類的結(jié)果,判定分類的精度。這是非常重要的一個(gè)步驟,精度評(píng)價(jià)不僅可以判定分類結(jié)果的錯(cuò)誤率是否對(duì)分類結(jié)果造成較大影響,而且還能夠鑒別每個(gè)分類方法的精確度。沒有精度說明的分類數(shù)據(jù)是沒有利用價(jià)值和使用意義的。對(duì)結(jié)果進(jìn)行精度驗(yàn)證最核心和關(guān)鍵的要素就是作為驗(yàn)證樣本的數(shù)據(jù),該樣本數(shù)據(jù)的來源可以是親自進(jìn)行野外調(diào)查后得到的數(shù)據(jù),也可以從高分辨率的數(shù)據(jù)源獲取。本次實(shí)驗(yàn)所用的樣本來自Google Earth,主要步驟如下:
1)獲取高分辨率的數(shù)據(jù)樣本。
通過Google Earth 軟件,將該地區(qū)根據(jù)之前分類方法中的分類類別,對(duì)每種類別選擇幾處繪制多變形保存。由于Google Earth 上的文件保存類型是Kml 和Kmz 形式,在ENVI 中無法直接打開,因此需要在ArcGIS 中將圖層轉(zhuǎn)換為shp 文件。然后將獲取的樣本數(shù)據(jù),加載進(jìn)ENVI 影像中,通過操作軟件將多變形數(shù)據(jù)轉(zhuǎn)成訓(xùn)練樣本。
2)選擇分類器進(jìn)行圖像分類。
3)精度驗(yàn)證。在ENVI 主菜單欄Classifiation單擊Post Classifiation 選擇精度驗(yàn)證方法對(duì)分類結(jié)果驗(yàn)證,獲取精度評(píng)價(jià)結(jié)果。本次精度驗(yàn)證方法選擇的是混淆矩陣驗(yàn)證,混淆矩陣的另一個(gè)名稱是誤差矩陣[4]。
表1 IsoData 分類方法精度驗(yàn)證結(jié)果
表2 K-Mean 分類精度驗(yàn)證結(jié)果
表3 最小距離精度驗(yàn)證結(jié)果
表4 最大似然法精度驗(yàn)證結(jié)果
表5 決策樹精度驗(yàn)證結(jié)果
總體分類精度與Kappa 系數(shù)的驗(yàn)證結(jié)果:
通過對(duì)每一種的分類結(jié)果進(jìn)行混淆矩陣精度評(píng)價(jià)后,將Kappa 系數(shù)與總分類精度值的數(shù)據(jù)列出,為了讓分類的結(jié)果有一個(gè)明顯對(duì)比,同時(shí)通過對(duì)比表6 中的Kappa 系數(shù)值的來確定精度的范圍級(jí)別。
表6 結(jié)果對(duì)比
通過對(duì)比分析可以得出非監(jiān)督分類方法IsoData 和K-Means 兩種分類方法的Kappa 系數(shù)分別為0.34 和0.48,通過對(duì)照表7 中的分類精度,IsoData 分類法的分類精度處于一般精度,K-Means分類法的分類精度為良好。對(duì)于監(jiān)督分類,最小距離與最大似然法的總分類精度高于監(jiān)督分類的兩種方法,且最小距離與最大分類方法的Kappa 系數(shù)值分別是0.64 和0.66,分類精度較好。相比于前4種分類方法決策樹分類法的分類結(jié)果顯示其總體分類精度和Kappa 系數(shù)值明顯高于其他4 種分類方法,分類精度較好且高于其他分類法。因此結(jié)合精度分類的結(jié)果數(shù)據(jù)對(duì)比分析,包括總分類精度和Kappa 系數(shù)等,得出對(duì)于該地區(qū)的土地利用分類方法的選擇,決策樹分類更加適合。
本文以某地區(qū)為研究區(qū)域,使用ENVI 軟件遙感分類方法對(duì)該地區(qū)的衛(wèi)星影像數(shù)據(jù)處理分類,分類方法使用了5 類,得到以下一些結(jié)論:
1)利用遙感影像進(jìn)行實(shí)驗(yàn)研究時(shí),需要對(duì)原始的遙感影像進(jìn)行處理,未經(jīng)處理的遙感影像清晰度和準(zhǔn)確度不高,可能會(huì)對(duì)研究結(jié)果造成偏差,因此只有合理地對(duì)數(shù)據(jù)加以處理才能獲取較為滿意的結(jié)果。
2)對(duì)特定的地區(qū)地物進(jìn)行分類時(shí),需要大量數(shù)據(jù)支持,除了研究所需要的地區(qū)原始影像,精度驗(yàn)證時(shí)使用的標(biāo)準(zhǔn)數(shù)據(jù)也是非常關(guān)鍵,若是檢驗(yàn)數(shù)據(jù)的精度達(dá)不到要求,就無法對(duì)以上分類的結(jié)果作出準(zhǔn)確和權(quán)威的精度評(píng)價(jià)。
3)就本次研究而言,該地區(qū)最優(yōu)的分類方法是基于CART 算法的決策樹分類,相較于其他分類方法而言,決策樹分類的優(yōu)勢(shì)在于根據(jù)分類樣本生成可被理解的決策樹,該算法簡(jiǎn)單易行,運(yùn)行的效率較高。