張成才,李 飛,王艷梅,羅蔚然
(鄭州大學 水利與環(huán)境學院,河南 鄭州 450001)
遙感影像分類是提取地物信息的重要手段,被廣泛應用在專題制圖、專題信息提取、動態(tài)變化監(jiān)測和地理空間數(shù)據(jù)庫建設中[1-3]。其中,分類算法是遙感影像研究的重點內容,選擇合適的分類算法能夠有效地提高分類精度。模糊聚類算法是聚類分析研究的主要算法之一,其中模糊C均值聚類(fuzzyC-means, FCM)算法的應用最為廣泛[4-5]。傳統(tǒng)的FCM算法存在很多不足,為此研究學者對其進行改進使其適用于遙感影像分類。郝玉等[6]利用直方圖選取聚類中心和聚類數(shù)并使用叉熵距離代替歐式距離,克服了傳統(tǒng)FCM算法選樣時的隨機性和依賴球狀分布的缺點,從而提高了遙感影像分類的精度。謝福鼎等[7]通過改進FCM算法的目標函數(shù)和迭代過程,充分發(fā)揮了有標簽樣本點在迭代過程中的作用,實驗結果表明,樣本點越多,分類精度也越高。但這些改進的FCM算法在對遙感影像進行分類時并沒有體現(xiàn)像元間具有相關性、相鄰像元間具有相似特征值的依賴關系,只是簡單地依據(jù)像元特征向量的維數(shù)構成特征空間進而對影像進行分類[8]。在這樣的特征空間中,像元間的空間特性使得表示不同地物的像元通常是線性不可分的,從而降低了遙感影像的分類精度。為了彌補FCM算法在這方面的不足,史云松等[9]將單個核函數(shù)引入到FCM算法對遙感影像進行分類。該算法通過非線性變化關系將像元的特征向量映射到高維空間中,提高了異物像元在特征空間中的線性可分性,從而改善了影像的分類精度。但當遙感數(shù)據(jù)特征含有異構信息并且在高維特征空間中分布不平坦時,使用單個核函數(shù)進行映射處理就不合理了[10-12]。
綜上所述,多光譜遙感影像中的像元記錄了不同波段的波譜響應強度,在分類時這些波段值組成了像元的特征向量。由于相鄰像元間具有相關性,使得相鄰異物像元的特征向量在特征空間中常常是線性不可分的。FCM算法進行分類時僅考慮了像元的特征向量,忽略了相鄰像元間具有空間關系的特性。引入單個核函數(shù)時增加了數(shù)據(jù)的線性可分性,但單個核函數(shù)并不能很好地對具有多個特征的數(shù)據(jù)進行映射。為了使FCM算法更加適合遙感影像的分類,筆者將多個核函數(shù)與FCM算法融合,構建多核模糊C均值算法(multiple kernel fuzzyC-mean, MKFCM)。為了檢驗MKFCM算法對不同分辨率影像的分類結果,選取鄭州市區(qū)中高分辨率Landsat8 OLI影像和鄭州大學新校區(qū)的高分辨率的Pleiades衛(wèi)星影像對地物進行分類,并與FCM算法、KFCM算法的分類結果進行了對比分析。
FCM算法被研究人員廣泛地應用在遙感影像分類中[13-14],它把n個向量xi(i=1,2, 3,…,n)分為c個模糊組,分別計算出每個模糊組的聚類中心,然后利用迭代法使得非相似性指標的價值函數(shù)達到最小。代價函數(shù)的表達式為:
(1)
式中:uij為隸屬度矩陣;指數(shù)m為平滑因子,間接影響著聚類的效果;dij=‖xj-vi‖為向量xj與聚類中心vi的距離[15]。
利用拉格朗日乘子法對方程(1)進行求解,得到更新公式為:
(2)
(3)
目前大多數(shù)改進的FCM算法在對遙感影像進行分類時并沒有考慮到異物相鄰像元間具有特殊的空間相關性關系。因此,筆者在FCM算法基礎上引入多個核函數(shù)建立MKFCM算法,其優(yōu)點是多核函數(shù)通過非線性映射關系將原始數(shù)據(jù)映射到新的特征空間中。這樣不僅可以增強數(shù)據(jù)的線性可分性,而且也可以將數(shù)據(jù)的多種特征用不同的核函數(shù)進行描述,并能根據(jù)數(shù)據(jù)的分布特點,自動選取最佳權重進行核函數(shù)間的組合。本文MKFCM的目標函數(shù)為:
(φ(xi)-Vj);
(4)
φ(x)=ω1φ1(x)+ω2φ2(x)+…+ωMφM(x),
(5)
式中:φM為第M個特征映射;M為特征映射的個數(shù)及核函數(shù)的個數(shù);ωM為第M個核函數(shù)的權重值;U為隸屬度矩陣;V為聚類中心矩陣。使用拉格朗日乘子法對方程進行求解,得到更新公式為:
(6)
(7)
其中,
(8)
(9)
在核函數(shù)的選擇方面,筆者使用高斯函數(shù)進行實驗,該函數(shù)屬于魯棒徑向基核。該徑向基核對數(shù)據(jù)有很好的抗噪作用,并且高斯核函數(shù)的取值是0~1,有效地簡化了計算過程[16]。
以鄭州市區(qū)和鄭州大學新校區(qū)作為研究區(qū)域,鄭州包括鄭州市區(qū)和登封、鞏義、新密、滎陽、新鄭5市和中牟縣,總面積達7 446 km2,其中鄭州市區(qū)面積占1 010.3 km2。鄭州大學新校區(qū)位于鄭州市,校區(qū)南北長約2.1 km,東西寬約1.1 km,占地面積約2.31 km2。選取鄭州市區(qū)2017年12月8日的Landsat8 OLI影像作為地物分類的數(shù)據(jù)源,如圖1(a)所示。為對比不同影像的分類結果,又選取鄭州大學新校區(qū)2014年5月15日的Pleiades影像融合產(chǎn)品作為地物分類的數(shù)據(jù)源,如圖1(b)所示。
圖1 研究區(qū)影像圖Figure 1 Image of study area
對于Landsat8 OLI影像數(shù)據(jù)源,選擇影像的前6個波段進行實驗,分別為藍波段(0.450~0.515 μm)、綠波段(0.525~0.600 μm)、紅波段(0.630~0.680 μm)、近紅外波段(0.845~0.885 μm)、短波紅外1波段(1.560~1.660 μm)和短波紅外2波段(2.100~2.300 μm),空間分辨率30 m×30 m。為了提高影像的質量,需要對研究區(qū)的影像進行預處理,主要操作包括輻射定標和大氣校正。輻射定標使用ENVI中的Radiometric Calibration工具,大氣校正使用Flash工具。由于Landsat8數(shù)據(jù)在發(fā)布前做過基于地形數(shù)據(jù)的幾何校正,因此本研究中不再對研究區(qū)域的Landsat8數(shù)據(jù)進行幾何校正操作。Pleiades影像數(shù)據(jù)源屬于SPOT衛(wèi)星家族的后續(xù)衛(wèi)星,由兩顆完全相同的衛(wèi)星Pleiades 1和Pleiades 2組成,具有0.5 m的超高分辨率,幅寬可達20 km×20 km[17]。選擇Pleiades融合影像的3個波段進行實驗,分別為藍波段(0.430~0.550 μm)、綠波段(0.500~0.620 μm)、紅波段(0.590~0.710 μm)。
使用FCM、KFCM與MKFCM 3種算法分別對Landsat8影像和Pleiades影像進行分類,分類結果如圖2、3所示。
圖2 Landsat8影像分類結果Figure 2 Landsat8 image classification results
圖3 Pleiades影像分類結果Figure 3 Pleiades image classification results
通過對精度的分析可以有效地評價分類結果的好壞,所以精度評價是遙感分類過程中必不可少的一部分。在驗證Landsat8影像的分類結果時,利用高分辨率影像驗證低分辨遙感數(shù)據(jù)的方法[18],選用谷歌高分辨率遙感數(shù)據(jù)作為驗證影像。谷歌影像是目前全球最大的免費影像數(shù)據(jù)庫,可以方便快捷地獲取不同時期各個地區(qū)的影像數(shù)據(jù),在一定程度上給遙感、地信工作者帶來許多便利[19]。本研究選取2018年2月22日第18級的影像作為驗證影像,該級影像分辨率為0.5 m×0.5 m。該影像包括0~19級,共20級,共選取1 629個驗證像元,其中道路323個像元,建筑用地352個像元,水體620個像元,植被127個像元,裸地207個像元。對Pleiades影像分類結果的驗證則通過實地勘察測量的方式,在鄭州大學新校區(qū)中選取2 515個驗證像元進行精度檢驗,其中建筑用地628個像元,水體770個像元,植被644個像元,道路473個像元。
混淆矩陣能夠直觀展示出每類地物的分類正確率以及該類地物錯分為其他地物的情況。對采用不同算法處理不同影像數(shù)據(jù)得到的分類結果建立混淆矩陣,如表1和表2所示。由于遙感影像上水體與建筑陰影和植被陰影有著相似的光譜特征,道路與建筑用地也有著相似的光譜特征,因此相互之間錯分的可能性較高。通過表1的混淆矩陣可知,F(xiàn)CM和KFCM算法對建筑、植被、水體、裸地和道路錯分比較嚴重,特別是與水體光譜特征相似的建筑物的陰影存在大量的錯分;MKFCM算法能清晰地將道路、建筑和水體提取出來,并能夠正確地區(qū)分建筑物的陰影區(qū)域,分類效果明顯優(yōu)于FCM算法。而對于表2的混淆矩陣可知,3種算法都能將建筑用地比較明顯地提取出來,但FCM與KFCM算法對與水體光譜特征相似的陰面植被存在嚴重錯分的現(xiàn)象,MFKCM算法能將二者正確地區(qū)分開來。
表1 鄭州市區(qū)Landsat8 OLI影像分類的混淆矩陣Table 1 Confusion matrix of Landsat8 OLI image classification in Zhengzhou urban area
表2 鄭州大學新校區(qū)Pleiades影像分類的混淆矩陣Table 2 Confusion matrix of Pleiades image classification in new campus of Zhengzhou university
為了對分類結果進行精度評價,采用用戶精度、生產(chǎn)者精度、總體分類精度和Kappa系數(shù)4個評價指標[20]。用戶精度和生產(chǎn)者精度評價特定類別的分類精度如圖4和圖5所示,其中同比增長是指與FCM相比,KFCM、MKFCM分類精度的增長值。采用總體分類精度和Kappa系數(shù)評價整體分類結果的精度,如圖6所示。
圖4 Landsat8影像中MKFCM的用戶精度、生產(chǎn)者精度及其同比增長Figure 4 User accuracy,producer accuracy and growth rate of MKFCM in Landsat8 images
圖5 Pleiades影像中MKFCM的用戶精度、生產(chǎn)者精度及其同比增長Figure 5 User accuracy, producer accuracy and growth rate of MKFCM in Pleiades images
圖6 總體分類精度及Kappa系數(shù)對比圖Figure 6 Comparison chart of overall classification accuracy and Kappa coefficient
由圖4和圖5可知,MKFCM算法對兩種影像單個地物的分類,無論用戶精度還是生產(chǎn)者精度其百分比都很高,且與FCM與KFCM算法的分類結果相比有明顯提升。在Landsat8影像中,與其他兩種算法相比,MKFCM算法對建筑的分類精度同比增長最多; Pleiades影像中對建筑和道路的分類精度同比增長的最多。這是因為建筑中存在的建筑陰影與水體有著相似的像元特征值,而建筑又與道路有著類似的像元特征值。FCM算法并不能很好地區(qū)分具有相似特征值的異物像元,KFCM中只有單個核函數(shù)不能對具有多個特征值的像元進行區(qū)分,而MKFCM算法不僅能將像元的特征向量通過核函數(shù)映射到高維空間中,還能依據(jù)多個核函數(shù)對不同的特征值進行映射,從而提高了異物像元間的可分性。
由圖6可知,在對Landsat8影像分類時,MKFCM比FCM算法總體分類精度提高了11.5%,Kappa系數(shù)提高了0.089;與KFCM算法相比,MKFCM算法在總體精度上提高了9.31%,Kappa系數(shù)提高了0.049。在對Pleiades影像進行分類時,MKFCM比FCM算法總體精度提高了6.6%,Kappa系數(shù)提高了0.15;與KFCM算法相比,MKFCM算法在總體精度上提高了3.64%,Kappa系數(shù)提高了0.13。相比之下,MKFCM算法在兩種影像的分類上無論是總體分類精度還是Kappa系數(shù)都是最佳的。
綜上所述,MKFCM算法能通過核函數(shù)將原始特征向量映射到高維特征空間中,并根據(jù)特征向量在空間中的分布特點自動對核函數(shù)進行最優(yōu)化組合,提高不同類型數(shù)據(jù)間的線性可分性,從而能區(qū)分相似光譜特征的異類地物,尤其是對道路、建筑和植被的分類精度明顯提高。
將多個核函數(shù)與FCM算法融合構建MKFCM算法,不僅能提高遙感影像在特征空間中的線性可分性,而且還能將像元具有的不同特征分量分別輸入到對應的核函數(shù)進行映射,使像元在組合的特征空間中得到更好地表達,進而提高遙感影像的分類精度。筆者采用FCM、KFCM和MKFCM算法分別對中高分辨率(Landsat8)和高分辨率(Pleiades)遙感影像進行分類,并使用混淆矩陣和4個評價指標對分類精度進行評價。結果表明,MKFCM算法對兩種影像的分類結果,無論是單個類別的精度還是整體的分類精度都高于FCM與KFCM算法,尤其對具有相似光譜的像元具有很好的區(qū)分效果,提高了土地覆蓋信息提取的準確度。