張志勛,常永青,王 春,朱理想
(1.如皋市勘測院,江蘇 南通 226500;2南京市規(guī)劃局,江蘇 南京 210029;3滁州學(xué)院,安徽 滁州 239000;4.南京市測繪勘察研究院股份有限公司,江蘇 南京 210019)
隨著高分遙感技術(shù)的發(fā)展,國內(nèi)外學(xué)者使用高分影像數(shù)據(jù)進(jìn)行了廣泛的研究[1-3]。目前國外主要的高分衛(wèi)星影像數(shù)據(jù)主要有IKONOS、QuickBird、World View等。高分一號(GF-1)衛(wèi)星是我國發(fā)射的第一顆高分辨率衛(wèi)星,已經(jīng)運(yùn)行超過4 a時(shí)間,其獲取的影像主要包括地面分辨率優(yōu)于2 m的全色影像和地面分辨率優(yōu)于8 m的多光譜影像,其中多光譜影像主要包括4個(gè)波段,分別為藍(lán)光波段(0.45~0.52μm)、綠光波段(0.52~0.59μm)、紅光波段(0.63~0.69μm)和近紅外波段(0.77~0.89μm)。目前,高分一號數(shù)據(jù)被廣泛應(yīng)用于土地利用、城市發(fā)展及農(nóng)業(yè)生產(chǎn)等多個(gè)領(lǐng)域[4-6],取得了較好的成果。
在影像數(shù)據(jù)應(yīng)用過程中,常涉及到影像的分類問題,而分類精度決定分類結(jié)果是否可用。常用的傳統(tǒng)分類方法主要是目視解譯和基于統(tǒng)計(jì)分析的分類方法[7],其中基于統(tǒng)計(jì)分析的分類方法主要分為監(jiān)督分類和非監(jiān)督分類,采用不同的分類方法得到的結(jié)果精度也有所差別。目前,在監(jiān)督分類中,最大似然法(maximum likelihood,ML)[8-9]和支持向量機(jī)法(support vector machine,SVM)[10-11]應(yīng)用最為廣泛。傳統(tǒng)分類方法算法成熟,在軟件中操作簡便。將不同分類方法應(yīng)用在我國高分影像的分類中,對我國高分影像的影像分類問題的研究具有參考價(jià)值。本文采用監(jiān)督分類和非監(jiān)督分類對GF-1影像數(shù)據(jù)進(jìn)行分類,并對分類結(jié)果進(jìn)行精度驗(yàn)證,以探討各分類方法在GF-1影像分類中的適用性,尋找最佳分類方法。
本研究采用的是國產(chǎn)高分衛(wèi)星GF-1號遙感數(shù)據(jù),影像獲取時(shí)間為2014-04-27。影像中心坐標(biāo)為115°55′47″E、40°30′52″N,主要包括北京西北部區(qū)域和河北部分區(qū)域,選取的實(shí)驗(yàn)區(qū)位于北京市延慶區(qū)西北部龍慶峽風(fēng)景區(qū)東南部區(qū)域,該區(qū)域?yàn)闇貛Ъ撅L(fēng)氣候,以暖溫帶落葉闊葉林為主,其中夾有部分針葉林,耕地主要是旱地。研究區(qū)域內(nèi)影像云量為0,主要地類包括了林地、草地、耕地、水域和建設(shè)用地,土地類型相對齊全。
圖1 研究區(qū)融合影像
由于多光譜影像與全色波段影像存在空間位置誤差,因此需要對影像進(jìn)行幾何校正,參照多光譜影像,對全色波段影像進(jìn)行校準(zhǔn)。采用高斯-克呂格投影和二項(xiàng)式校正方式,校準(zhǔn)精度小于0.5 個(gè)像元。裁剪實(shí)驗(yàn)區(qū)域影像數(shù)據(jù),采用Gram-Schmidt Spectral Sharpening(GS)融合方法進(jìn)行影像融合[12],使用標(biāo)準(zhǔn)假彩色(Band4 Band 3 Band 2)顯示(圖1)。
為尋找到較好的影像分類方法,選取ENVI軟件監(jiān)督分類方法中的Maximum Likelihood(ML)、Mahalanobis Distance(MsD)、Minimum Distance(MD)和Support Vector Machine(SVM)以及非監(jiān)督分類方法中的ISODATA和K-Means等分類方法進(jìn)行影像分類。
2.1.1 ML法
最大似然法是根據(jù)像元?dú)w屬概率進(jìn)行類別劃分的分類方法,其使用的是一個(gè)概率模型,分類時(shí)假定各類分布函數(shù)呈正態(tài)分布,因此對選擇的訓(xùn)練樣本要求較高。分類器公式如下[13]:
式中,Pg表示第g類樣本的概率;Ug表示第g類樣本的總體均值向量(下同);∑g表示第g類總體協(xié)方差矩陣(下同);表示∑g的逆矩陣(下同);X表示像元特征向量,T表示向量轉(zhuǎn)置(下同)。
2.1.2 MsD法
馬氏距離法根據(jù)數(shù)據(jù)協(xié)方差距離,判別影像像元與各地類訓(xùn)練樣本之間的相似度,進(jìn)而進(jìn)行影像分類。馬氏距離公式為[14]:
式中,xg表示第g類樣本的m維向量;xg=(x1,x2,……,xm)T。
2.1.3 MD法
最小距離法根據(jù)各地類均值向量和標(biāo)準(zhǔn)差向量計(jì)算像元到各地類中心的距離,以最小距離為依據(jù)進(jìn)行類別劃分,常采用歐幾里得距離公式[15]:
式中,N表示波段數(shù);xi表示像元的第i個(gè)波段像元值;Mij表示在第i個(gè)波段第j類的像元均值。越小說明該像元越接近第j類地類,歸為值最小的那一地類。
2.1.4 SVM法
支持向量機(jī)是能夠基于有限樣本進(jìn)行統(tǒng)計(jì)學(xué)習(xí)的算法,應(yīng)用范圍非常廣泛。支持向量機(jī)包括了線性和非線性兩種,在圖像分類中對訓(xùn)練樣本的要求較低。支持向量機(jī)分類訓(xùn)練形式如下[16]:
式中,K(xi·xj)=Φ(xi)TΦ(xj)是核函數(shù);一般有線性核、多項(xiàng)式核、RBF核和Sigmoid核等形式。
2.1.5 ISODATA法
迭代自組織數(shù)據(jù)分析算法是一種典型的非監(jiān)督分類方法,是一種應(yīng)用聚類分析思想對像元進(jìn)行類別劃分的方法。根據(jù)不同類別聚類中心的距離判斷進(jìn)行多次合并與分類,最終得到相對優(yōu)化的聚類結(jié)果。ISODATA算法的詳細(xì)步驟參見參考文獻(xiàn)[17]。
2.1.6 K-Means法
K-Means算法也是一種常見的非監(jiān)督分類方法,采用的是聚類思想,其分類標(biāo)準(zhǔn)是誤差平方和的大小,具體形式如下[18]:
式中,mi表示樣本像元均值;Ni表示第i個(gè)聚類wi中的樣本數(shù);Je表示樣本集y和類別集Ω的誤差平方和準(zhǔn)則函數(shù)。然后進(jìn)行聚類中心修改,并重新計(jì)算Je值,直到其不再發(fā)生新值變化。
監(jiān)督分類需要選擇合適的訓(xùn)練樣本,一般在樣本選擇時(shí)應(yīng)盡量保證各地類樣本均呈正態(tài)分布,同時(shí)不同樣本之間應(yīng)避免重復(fù)像元。因此參照Google Earth衛(wèi)星地圖選擇訓(xùn)練樣本,在實(shí)驗(yàn)影像上根據(jù)研究區(qū)實(shí)際情況,共分為林草地、耕地、水域和建設(shè)用地四大類,每個(gè)地類的訓(xùn)練樣本都不少于100個(gè)像元,并對訓(xùn)練樣本進(jìn)行可分離性檢驗(yàn),可分離系數(shù)大于1.9的表示可分離性較好,小于1. 8的需要重新選擇訓(xùn)練樣本或者進(jìn)行地類合并。本研究中,除耕地–建設(shè)用地可分離系數(shù)為1.899外,其他各地類組合類型的可分離系數(shù)均大于1.99,訓(xùn)練樣本滿足要求。非監(jiān)督分類ISODATA分類中,分類數(shù)設(shè)置為5~10,最大迭代次數(shù)設(shè)置為20次,非監(jiān)督分類K-Means分類中分類數(shù)設(shè)置為10。
分類精度驗(yàn)證主要包括分類面積精度驗(yàn)證和分類結(jié)果空間位置精度(即像元精度)驗(yàn)證。本研究采用面積統(tǒng)計(jì)對分類結(jié)果進(jìn)行面積精度驗(yàn)證,分別采用基于真實(shí)地表感興趣區(qū)和目視解譯影像的混淆矩陣,對分類結(jié)果進(jìn)行像元精度驗(yàn)證。真實(shí)地表感興趣區(qū)參照Google Earth衛(wèi)星地圖在研究區(qū)影像上進(jìn)行選擇,由于研究區(qū)域范圍較小,因此采用點(diǎn)選式,各地類分別均勻地選取了120個(gè)點(diǎn)。目視解譯結(jié)果由于可以參考的信息較多,一般與實(shí)際地物分布十分接近,可以看成是實(shí)際地物分布結(jié)果,特別是高分影像,由于地面分辨率較高,其目視解譯的結(jié)果與實(shí)際地物分布能夠有較高的吻合度。因此參考Google Earth衛(wèi)星地圖,使用ArcGIS軟件對研究區(qū)處理后的影像進(jìn)行目視解譯,解譯地類與分類地類相同,并在ENVI軟件中將矢量文件轉(zhuǎn)換為分類影像文件,以目視解譯結(jié)果作為真實(shí)地類分布。
分別采用監(jiān)督分類和非監(jiān)督分類共6種分類方法進(jìn)行影像分類,并對研究區(qū)影像進(jìn)行目視解譯,最終結(jié)果見圖2。由圖2可以看出,6種分類結(jié)果差異較為明顯,尤其是建設(shè)用地和耕地的結(jié)果,ML、MsD和SVM3種方法的分類結(jié)果一致性較好,與目視解譯結(jié)果吻合度較高,MD和K-Means分類結(jié)果的斑塊完整性較差,斑塊明顯破碎。除K-Means分類外,各分類結(jié)果的水域分布總體一致。從目視解譯結(jié)果可以看出,研究區(qū)內(nèi),林地和耕地面積分布最廣,林地、耕地和建設(shè)用地之間的交叉區(qū)域較多,水域較為集中且與其他地類之間分割明顯。
圖2 分類結(jié)果
3.2.1 面積精度
在ENVI軟件中使用統(tǒng)計(jì)工具,對各地類的像元數(shù)進(jìn)行統(tǒng)計(jì);在Excel表格中計(jì)算各地類的面積,統(tǒng)計(jì)面積占比,并計(jì)算其相對于目視解譯結(jié)果的分類方法的標(biāo)準(zhǔn)誤差和地類標(biāo)準(zhǔn)誤差(表1)。
表1 分類結(jié)果面積占比統(tǒng)計(jì)及標(biāo)準(zhǔn)誤差/%
由表1可知,ML 和MsD分類結(jié)果中林草地面積占比明顯多于其他分類方法的分類結(jié)果,MD、 SVM和ISODATA分類結(jié)果中耕地面積占比最大。從面積占比上看,K-Means分類結(jié)果與目視解譯結(jié)果最為接近,標(biāo)準(zhǔn)誤差最小,為3.24%,精度最高,其次是ML分類方法,MD和SVM分類結(jié)果的面積精度較低。各地類中,水域面積占比標(biāo)準(zhǔn)誤差為1.05,分類精度最高,說明各種分類方法都能夠很好地將水域與其他地類區(qū)分開;誤差最大的是耕地,由于耕地類型具有較為復(fù)雜的光譜信息,與其他地類存在較多異物同譜的現(xiàn)象,其中作物生長較好的耕地易與林地同譜,土質(zhì)較硬或沙石較多且處于休耕期的耕地易被分為裸地或建設(shè)用地;北方耕地多為旱地,因此與水域不會(huì)存在異物同譜現(xiàn)象。
3.2.2 基于地表真實(shí)感興趣區(qū)的像元精度
使用ENVI軟件,依據(jù)實(shí)際地類新建一組感興趣區(qū)文件,與各分類方法的分類結(jié)果進(jìn)行混淆矩陣分析,統(tǒng)計(jì)各分類結(jié)果的總體精度、Kappa系數(shù),并計(jì)算各地類用戶精度的平均值。計(jì)算平均用戶精度是為了避免因某一地類占比過大而導(dǎo)致總體精度和Kappa系數(shù)失真的問題,統(tǒng)計(jì)結(jié)果見表2。
表2 分類精度結(jié)果
由表2可知,各分類方法中基于地表真實(shí)感興趣區(qū)的總體像元精度均高于80%,分類結(jié)果較好。其中ML的分類結(jié)果總體精度最高,為93.54%,Kappa系數(shù)為0.91;其次是SVM分類,總體精度為91.04%,Kappa系數(shù)為0.88。監(jiān)督分類結(jié)果明顯好于非監(jiān)督分類,非監(jiān)督分類中ISODATA分類結(jié)果的精度較好,分類總體精度僅次于ML分類和SVM分類,而K-Means分類結(jié)果較差,整體精度在各分類方法中最小。平均用戶精度與總體精度接近,且整體上略高于總體精度,與總體精度相差較?。黄渲?,相差最大的是MD分類,差值為2.36%,說明本研究結(jié)果的總體精度受較大地類的影響不明顯,總體精度的結(jié)果較為可靠。
3.2.3 基于目視解譯的像元精度
將目視解譯結(jié)果作為真實(shí)地類影像結(jié)果,與各分類方法的分類結(jié)果進(jìn)行混淆矩陣分析,統(tǒng)計(jì)各分類結(jié)果的總體精度、Kappa系數(shù),并計(jì)算各地類用戶精度的平均值,結(jié)果見表3。
表3 分類精度結(jié)果
由表3可知,各分類方法中基于目視解譯的總體像元精度在72.57~80.17%之間,與基于地表真實(shí)感興趣區(qū)的像元精度相比較低。其中,總體精度最高的是ML分類,為80.17%,其Kappa系數(shù)為0.68;其次是SVM分類,總體精度為78.94%,Kappa系數(shù)為0.66。與基于地表真實(shí)感興趣區(qū)的像元精度驗(yàn)證結(jié)果類似,基于目視解譯像元精度驗(yàn)證中用戶平均精度整體略高于總體精度,總體精度的結(jié)果較為可靠,監(jiān)督分類結(jié)果優(yōu)于非監(jiān)督分類。
本研究基于GF-1號影像數(shù)據(jù),通過比較監(jiān)督分類和非監(jiān)督分類共6種分類方法的分類精度,得到如下結(jié)論:6種分類結(jié)果差異較為明顯,但是ML、MsD和SVM 3種方法的分類結(jié)果一致性較好;與目視解譯結(jié)果相對比,各類分類方法中K-Means分類面積誤差最小,精度最高,其次是ML分類方法;基于地表真實(shí)感興趣區(qū)和基于目視解譯的像元精度結(jié)果趨同,總體精度最高的均為ML分類,監(jiān)督分類結(jié)果整體上優(yōu)于非監(jiān)督分類,非監(jiān)督分類中ISODATA分類結(jié)果最好,甚至優(yōu)于部分監(jiān)督分類的分類結(jié)果。
面積精度最高的K-Means分類的兩種基于像元精度驗(yàn)證的總體精度分別為83.33%和72.57%,均為精度最低。說明面積精度并不能真實(shí)反映分類結(jié)果的精度情況,因?yàn)榉诸愔写嬖阱e(cuò)分地物面積相互抵消的情況,這就使得像元精度較低的分類結(jié)果可能會(huì)有較高的面積精度。因此,在驗(yàn)證分類結(jié)果時(shí),不宜采用面積精度,而應(yīng)該使用像元精度。
結(jié)合兩種基于像元分類精度結(jié)果來看,基于地表真實(shí)感興趣區(qū)的各種分類的總體精度普遍比基于目視解譯的高出11個(gè)百分點(diǎn)左右。為驗(yàn)證地表真實(shí)感興趣區(qū)與目視解譯結(jié)果的一致性,將地表真實(shí)感興趣區(qū)與目視解譯數(shù)據(jù)進(jìn)行混淆矩陣分析,結(jié)果顯示,二者的總體精度為98.33%,說明地表真實(shí)感興趣區(qū)的選擇與目視解譯結(jié)果基本一致,二者可以相互驗(yàn)證。在實(shí)際工作中,我們大多數(shù)情況下無法使用目視解譯數(shù)據(jù)進(jìn)行精度驗(yàn)證,更多的是采用基于地表真實(shí)感興趣區(qū)的混淆矩陣來驗(yàn)證分類結(jié)果。通過本研究發(fā)現(xiàn),基于地表真實(shí)感興趣區(qū)和基于目視解譯的驗(yàn)證結(jié)果趨勢相同,因此基于地表真實(shí)感興趣區(qū)的混淆矩陣可以很好地代替目視解譯結(jié)果來進(jìn)行精度驗(yàn)證。但是在驗(yàn)證時(shí),應(yīng)該扣除一個(gè)經(jīng)驗(yàn)值以更加接近實(shí)際的精度值,本研究中,這個(gè)經(jīng)驗(yàn)值約為11%。
本研究中采用的分類方法是常用的監(jiān)督分類和非監(jiān)督分類方法,主要存在同物異譜和異物同譜的問題,影響分類精度,而目前面向?qū)ο蟮姆诸惙椒ㄝ^好地解決了這一問題,在影像分類中得到了廣泛的應(yīng)用。因此,比較面向?qū)ο蟮姆诸惙椒ㄅc傳統(tǒng)監(jiān)督和非監(jiān)督分類方法的分類精度將是下一步研究的重點(diǎn)。本文中選取的研究區(qū)域較小,而且僅基于一個(gè)時(shí)期的一景影像中的部分區(qū)域進(jìn)行研究,數(shù)據(jù)豐富度較低,在后續(xù)的研究中將增加不同時(shí)期、不同區(qū)域的數(shù)據(jù)進(jìn)行比較研究,以提高數(shù)據(jù)豐富度,增加研究結(jié)果的可信度。