王肖霞, 楊風(fēng)暴, 梁若飛, 馮裴裴
(中北大學(xué)信息與通信工程學(xué)院,山西 太原 030051)
基于分割區(qū)域及特征相似度的玉米田遙感圖像分類方法
王肖霞, 楊風(fēng)暴, 梁若飛, 馮裴裴
(中北大學(xué)信息與通信工程學(xué)院,山西 太原 030051)
針對遙感圖像中玉米田目標(biāo)光譜復(fù)雜,同物異譜現(xiàn)象嚴(yán)重導(dǎo)致分類結(jié)果差的問題,提出一種基于分割區(qū)域及特征相似度的玉米田遙感圖像分類方法。首先利用主成分分析法(PCA)對多光譜和高分辨全色融合圖像進(jìn)行第一主成分提取,以獲得包含豐富圖像信息的單色圖像I;對I進(jìn)行分水嶺分割,得到一幅過分割目標(biāo)區(qū)域圖;構(gòu)建由紋理、亮度及輪廓特征相似度組成的特征組;最后基于隨機(jī)森林原理,利用構(gòu)建的特征組對玉米目標(biāo)進(jìn)行提取。用高分一號衛(wèi)星數(shù)據(jù)進(jìn)行實(shí)驗(yàn),并與支持向量機(jī)方法(SVM)、神經(jīng)網(wǎng)絡(luò)算法和最大似然算法進(jìn)行了比較分析,實(shí)驗(yàn)表明,該方法的分類精度優(yōu)于其他算法。
同物異譜;分割區(qū)域;特征相似度
遙感技術(shù)由于具有宏觀、迅速的大范圍監(jiān)測能力,成為農(nóng)作物種植面積監(jiān)測不可或缺的技術(shù)手段,受到各國政府和專家學(xué)者的重視。但由于農(nóng)作物類別的復(fù)雜性以及遙感信息的綜合性,利用遙感進(jìn)行農(nóng)作物分類的精度仍難以達(dá)到運(yùn)行化所需精度,兼顧精度和運(yùn)算速度更加困難,且在沒有地面數(shù)據(jù)支持的情況下,精度更難保證。因此,結(jié)合實(shí)際,深入研究農(nóng)作物遙感分類方法中的一些關(guān)鍵技術(shù),對于促進(jìn)農(nóng)業(yè)遙感監(jiān)測技術(shù)的發(fā)展具有重要意義。
伴隨著空間分辨率的提高,地物的幾何信息得到加強(qiáng),“同物異譜”現(xiàn)象嚴(yán)重,不解決該問題,可能降低分類精度。為了更加有效利用高分辨率衛(wèi)星遙感數(shù)據(jù)的空間特征,結(jié)合紋理與光譜等信息的面向?qū)ο蟮姆诸惙椒ǖ脧V泛應(yīng)用。在現(xiàn)有研究中,F(xiàn)ranklin和Peddle[1]發(fā)現(xiàn)SPOT-HRV數(shù)據(jù)的光譜特征與紋理特征相結(jié)合的方法大大改善了總體分類精度。Shaban和Dikshit[2]比較了GLCM、灰度差異直方圖(grey-level difference histogram,GLDH)和總和與差異直方圖(sum and difference histogram,SADH)提取紋理信息的方法,發(fā)現(xiàn)紋理和光譜特征的結(jié)合使用可以對分類精度有效的提高。Ren和Malik[3]提出基于分割對象的紋理特征進(jìn)行分析來進(jìn)行面向?qū)ο蟮姆诸?,并取得了?yōu)于傳統(tǒng)基于像元的分類精度。但是,對于一個(gè)特定的研究,確定合適的紋理、光譜等特征通常是困難,因?yàn)槠潆S著研究地物和遙感影像的變化而變化。
本文通過分析高分一號衛(wèi)星數(shù)據(jù),結(jié)合實(shí)際地物分布特征,構(gòu)建了包含相似度的紋理、光譜和輪廓特征,在面向?qū)ο蠓诸惣夹g(shù)的基礎(chǔ)上,結(jié)合隨機(jī)森林原理,針對玉米田遙感目標(biāo)提出了一種基于分割區(qū)域及特征相似度的玉米田遙感圖像分類方法,用以進(jìn)行遙感圖像玉米田的提取。經(jīng)實(shí)驗(yàn)比較,本文方法在進(jìn)行大面積玉米種植區(qū)的目標(biāo)分類時(shí),不僅能夠有效區(qū)分不同地物,同時(shí)減少了玉米田復(fù)雜光譜信息對分類的影響,有效提高了玉米目標(biāo)提取精度。
本文算法的具體實(shí)施步驟:①將GF-1遙感圖像的8 m多光譜與2 m全色數(shù)據(jù)進(jìn)行融合處理;②利用主成分分析法(principal component analysis,PCA)對①的結(jié)果圖像處理獲得第一主成分單色圖I;③利用分水嶺[4]方法對I作分割處理,獲得超像素對象;④構(gòu)建由紋理、亮度及輪廓特征相似度組成的特征組;⑤基于隨機(jī)森林原理,利用構(gòu)建的特征組對玉米目標(biāo)進(jìn)行提?。虎迣?shí)驗(yàn)分析。算法流程如圖1所示。
圖1 本文方法流程圖
1.1 圖像分割處理
引入“超像素”的概念,即分割出的每個(gè)圖像塊對象是由若干個(gè)像素組合而成。這些小區(qū)域?qū)ο髢?nèi)部各像元的亮度、紋理等信息有較好的一致性,且較好地保留了目標(biāo)的邊緣信息。
利用以數(shù)學(xué)形態(tài)學(xué)為基礎(chǔ)的分水嶺分割算法來獲取超像素對象。此分割方法能很好地獲得連續(xù)且封閉的目標(biāo)邊緣信息,并對微弱邊緣也有較好的響應(yīng)。
為了量化分割近似的程度,本文用基于輪廓的測量來證明超像素與人工分割結(jié)果的一致性,計(jì)算人工標(biāo)記的邊界有多少像素被超像素邊界覆蓋。通過設(shè)定分割參數(shù)得到,當(dāng)閾值T=3,結(jié)果最佳。
如圖 2所示,人工分割邊界與超像素邊界比為240:160,此時(shí)結(jié)果最佳。顯而易見,隨著超像素?cái)?shù)目k的增多,這個(gè)比率在增大,但處理數(shù)據(jù)也會(huì)增多,影響處理效率。本文實(shí)驗(yàn)圖像在k=1273時(shí)最有效。
圖2 超像素個(gè)數(shù)與邊緣比例間的關(guān)系曲線
1.2 構(gòu)建特征集
對人工分割結(jié)果的樣本區(qū)域構(gòu)建特征集并評估這些特征的有效性,對每一個(gè)人工分割區(qū)域定義特征集Fj(j表示人工分割結(jié)果中的分割區(qū)域),特征包括:
(1) 紋理相似度。計(jì)算分割出的兩個(gè)超像素區(qū)域的直方圖的卡方距離(Chi-square measure,2χ距離)來表示區(qū)域間的紋理相似度,即:
其中,s表示人工分割結(jié)果的區(qū)域;q表示每個(gè)超像素對象;dT(q, s)為超像素q和人工分割結(jié)果s二者紋理直方圖的 χ2距離;Psame(·)表示超像素在人工分割的玉米類區(qū)域內(nèi); Pdiff(·)表示超像素不在人工分割的玉米類區(qū)域內(nèi)。
定義.①所有包含在人工分割出的玉米目標(biāo)區(qū)域的超像素的紋理相似度和為:T內(nèi)(s)=;②所有不包含在人工分割目標(biāo)但和目標(biāo)邊緣有重合的超像素與人工分割目標(biāo)的紋理相似度為:。如果某個(gè)超像素有多個(gè)外鄰近的分割目標(biāo),取相似度的均值。
(2) 亮度相似度。每個(gè)區(qū)域的亮度描述算子是其亮度值的直方圖。求區(qū)域直方圖的 χ2距離,并取對數(shù)將其歸一化。同樣與(1)中紋理相似度計(jì)算一樣,獲得:①所有包含在人工分割出的玉米目標(biāo)區(qū)域的超像素的亮度相似度和為B內(nèi)(s);②所有不包含在人工分割目標(biāo)但和目標(biāo)邊緣有重合的超像素與人工分割目標(biāo)的紋理相似度為B外鄰(s)。
(3) 輪廓能量。其計(jì)算在像素級進(jìn)行。為了減少陰影漸變圖像區(qū)域?qū)^(qū)域邊界的界定影響,本文利用方向能量來更準(zhǔn)確地檢測和確定這種復(fù)雜的邊界。
可計(jì)算每個(gè)像素的方向能量OEθ:
其中,*表示卷積運(yùn)算。θ =0°的時(shí)候,輪廓下最大響應(yīng)為OE0o。通過旋轉(zhuǎn)兩個(gè)濾波核f1和f2可以在多個(gè)方向上篩選出復(fù)雜邊緣對比度。本文的f1為高斯求導(dǎo)[5-6], f2為 f1的Hilbert變換。
如果OEθ大于或等于相鄰所有像素在同一方向尺度下的值,則其最大值作為該像素的方向能量,否則用OE0o來表示。
經(jīng)過非線性變換,轉(zhuǎn)變?yōu)?到1之間的一個(gè)可能性數(shù)值:
σ與噪聲帶來的圖像能量響應(yīng)有關(guān),本文根據(jù)圖像目標(biāo)及噪聲類型選取 σ= 0.02。
與(1)、(2)類似,定義:①人工分割的目標(biāo)區(qū)域邊緣上所有像素的Pcon(x)的和為E外邊緣;②人工分割的目標(biāo)區(qū)域內(nèi)所有超像素邊界像素的Pcon(x)的和為E內(nèi)。
1.3 目標(biāo)分類方法
本文將玉米作物的提取問題歸結(jié)為兩類目標(biāo)分類的問題(即玉米目標(biāo)與非玉米目標(biāo))。這在統(tǒng)計(jì)學(xué)習(xí)中是最好的解決問題的方法。本文基于隨機(jī)森林原理對GF-1號衛(wèi)星圖像中的玉米田進(jìn)行樣本訓(xùn)練與提取處理。
隨機(jī)森林分類[7]是通過構(gòu)建多棵決策樹來完成目標(biāo)分類的方法,其主要的思想是用拔靴法(bagging)從原始數(shù)據(jù)集中生成多個(gè)有差異的訓(xùn)練樣本集,并在特征值隨機(jī)選擇的基礎(chǔ)上完成對分類樹的構(gòu)建,最后對每棵樹的決策結(jié)果進(jìn)行投票得出最終的類別判定。本文的訓(xùn)練與分類過程如下:
步驟1. 利用bagging從超像素集合中有放回的每次取一個(gè),本文根據(jù)超像素個(gè)數(shù)k抽取N= 800次,得到一個(gè)包含800個(gè)超像素的訓(xùn)練集;重復(fù)以上過程生成ntree個(gè)訓(xùn)練集(訓(xùn)練集中每個(gè)超像素是否屬于玉米類時(shí)確定的)。
從理論上講分類結(jié)果的準(zhǔn)確率會(huì)隨著ntree的個(gè)數(shù)增多而增加,但相應(yīng)的處理數(shù)據(jù)量也隨之增加,根據(jù)圖像的大小本文選取ntree=100以平衡二者關(guān)系。
步驟2. 每個(gè)訓(xùn)練集會(huì)生成一個(gè)決策樹。
(2) 分裂節(jié)點(diǎn)特征屬性的選取原則:分裂成的兩類數(shù)據(jù)集合的基尼不純度[8]最小則利用該特征分裂節(jié)點(diǎn)。
步驟3. 對所有的ntree個(gè)訓(xùn)練集重復(fù)步驟1~2,生成ntree棵分類樹,構(gòu)成分類森林。
步驟4. 在對未知類別的超像素進(jìn)行分類時(shí),其輸出的類別標(biāo)簽通是過對分類森林中樹進(jìn)行多數(shù)投票完成的。
在利用bagging從原始數(shù)據(jù)集中生成多個(gè)有差異的訓(xùn)練樣本時(shí),每次大約抽取 62%的原樣本數(shù)據(jù),其余的稱之為袋外樣本(out of bag,OOB)。通過對OOB樣本進(jìn)行相關(guān)分析來對分類精度及特征重要性進(jìn)行評估。
通過對OOB樣本分類,分析去除某一單個(gè)特征f前后隨機(jī)森林的分類準(zhǔn)確性,對某一特征f的重要性進(jìn)行評估。特征f對每棵決策樹t的重要程度表示為:
其中,ΦB表示OOB數(shù)據(jù)集合,, (xi, li)表示樣本與樣本所對應(yīng)的類別,表示特征f去除前后對樣本xi類別的判定,N(·)為計(jì)數(shù)函數(shù)。特征分類測度由式(5)對所有決策樹的重要性程度求平均可得:
對特征重要性的計(jì)算既可以表示特征對分類精度的影響,同時(shí)可以表示和其他特征的相關(guān)性程度,某一特征的重要性計(jì)算結(jié)果越大,則表示此特征對分類精度的影響越大,且與其他特征的相關(guān)性較弱。
1.4 特征相關(guān)性分析
為了驗(yàn)證構(gòu)建的特征內(nèi)兩相似度值對分類結(jié)果的重要性,本文利用每個(gè)特征內(nèi)的不同特征值分別對分割目標(biāo)進(jìn)行提取,并與單個(gè)特征內(nèi)兩特征值聯(lián)合結(jié)果進(jìn)行精度比較,如表1~2所示。
表1 單個(gè)特征值玉米目標(biāo)提取結(jié)果
表2 每個(gè)特征類別兩特征值聯(lián)合應(yīng)用的目標(biāo)提取結(jié)果
2.1 實(shí)驗(yàn)數(shù)據(jù)
本文對GF-1圖像數(shù)據(jù)進(jìn)行實(shí)驗(yàn),研究區(qū)域?yàn)殛兾魇∷{(lán)田縣影像數(shù)據(jù)。該圖像包括 4個(gè)多光譜波段:藍(lán)(0.45~0.52 μm)、綠(0.52~0.59 μm)、紅(0.63~0.69 μm)和近紅外(0.77~0.89 μm)波段,分辨率均為8 m(圖3(a));1個(gè)全色波段(0.45~0.90 μm),分辨率為2 m(圖3(b))。該區(qū)域地勢平整,為玉米種植區(qū),對進(jìn)行玉米與其他背景目標(biāo)的分類較適宜。
圖3(c)是本文GF-1衛(wèi)星遙感影像實(shí)驗(yàn)數(shù)據(jù),其是由分辨率 2 m的全色圖像(圖 3(b))和分辨率8 m的多光譜圖像(圖3(a))融合[9]得到的,可見融合后的圖像為更清晰的多光譜信息。圖 4為融合結(jié)果經(jīng)過PCA法獲得的第一主成分單色圖顯示。提取的第一主成分包含了目標(biāo)的主要信息,后期對其單色圖處理,減少了處理的數(shù)據(jù),提高了分類的效率。
圖3 2 m全色與8 m多光譜圖像融合結(jié)果
圖4 PCA法獲得的第一主成分單色圖
2.2 實(shí)驗(yàn)與分析
通過選擇與目標(biāo)圖中最小目標(biāo)尺寸的分水嶺分割閾值T=3,得到圖5的過分割結(jié)果,包含超像素個(gè)數(shù)k=1273。從圖中可以觀察到,“超像素”在尺寸和形狀上大致保持內(nèi)部一致性。一些人工分割中考慮的結(jié)構(gòu)特征會(huì)丟失,但是這些信息是次要的,比起目標(biāo)信息還是占少量的。
圖5 分水嶺分割結(jié)果
圖 6(a)為本文方法的玉米提取結(jié)果(白色代表玉米作物,黑色代表非玉類),通過與人工解譯的目標(biāo)區(qū)域樣本圖 6(c)(人工解譯目標(biāo)圖像中標(biāo)記區(qū)域代表玉米區(qū)域)進(jìn)行比較,可以看出二者主觀評價(jià)結(jié)果較好,并與人工分割的邊界圖6(b)進(jìn)行比對分析,本文玉米提取結(jié)果較好。
圖6 玉米提取結(jié)果
人工分割玉米標(biāo)記數(shù)據(jù)是由專業(yè)人員結(jié)合影像目視解譯與光譜特征分析獲取的。首先利用GPS對部分樣本玉米田進(jìn)行邊界打點(diǎn),將坐標(biāo)信息投射到GF-1號衛(wèi)星圖像上作為解譯參考;再對整個(gè)樣本區(qū)域進(jìn)行人工解譯;最后對解譯結(jié)果進(jìn)行野外調(diào)查,獲得最終的參考樣本數(shù)據(jù)。經(jīng)表 3比較可以看出,本文玉米提取結(jié)果,面積誤差率為5.95%,比較符合實(shí)際玉米田的面積統(tǒng)計(jì)。
表3 分類結(jié)果面積統(tǒng)計(jì)對比
將本文方法的實(shí)驗(yàn)玉米提取精度結(jié)果與支持向量機(jī)[10](support vector machine,SVM)方法、神經(jīng)網(wǎng)絡(luò)[11]方法和最大似然[12-13]方法精度對比,對比結(jié)果見表4,可以看出,本文方法在玉米提取精度上優(yōu)于SVM、神經(jīng)網(wǎng)絡(luò)和最大似然3種方法。
表4 不同分類方法結(jié)果對比(%)
本文提出的基于分割區(qū)域及特征相似度的玉米田遙感圖像分類方法,在對大面積玉米種植區(qū)目標(biāo)進(jìn)行分類時(shí),不僅可有效區(qū)分不同地物,而且減少了“同物異譜”現(xiàn)象對分類結(jié)果的影響,對玉米目標(biāo)的提取有較好的結(jié)果。為玉米田面積統(tǒng)計(jì)提供了有效幫助。
(1) 本文將目標(biāo)圖像進(jìn)行過分割,過分割得到的超像素具有區(qū)域一致性,同時(shí)保持分割目標(biāo)的結(jié)構(gòu)特征。對獲得的超像素進(jìn)行處理,減少了處理的數(shù)據(jù)量,為快速、有效的進(jìn)行目標(biāo)提取提供了基礎(chǔ)。
(2) 通過對玉米目標(biāo)構(gòu)建有效的紋理、亮度及輪廓的相似度特征,能有效對邊緣相似區(qū)域進(jìn)行判別,減少了“同物異譜”現(xiàn)象對分類的影響,使玉米提取更加準(zhǔn)確。
(致謝:山西省農(nóng)業(yè)遙感研究中心為本文提供了遙感圖像,并在樣本采集和人工解譯方面給予了大力支持,在此表示衷心的感謝!)
[1] Franklin S E, Peddle D R. Classification of SPOT HRV imagery and texture features [J]. International Journal of Remote Sensing, 1990, 11(3): 551-556.
[2] Shaban M A, Dikshit O. Land use classification for urban areas using spatial properties [J]. Geoscience and Remote Sensing Symposium, 1999, (2): 1140-1142.
[3] Ren X F, Malik J. Learning a classification model for segmentation [J]. Computer Science Division, 2003, (1): 10-17.
[4] 郭 洪, 張清志. 增強(qiáng)圖像細(xì)節(jié)和去噪能力的改進(jìn)形態(tài)學(xué)分水嶺算法[J]. 圖學(xué)學(xué)報(bào), 2013, 34(3): 7-13.
[5] Malik J, Belongie S, Leung T, et al. Contour and texture analysis for image segmentation [J]. International Journal of Computer Vision, 2001, 43(1): 7-27.
[6] Makkeasorn A, Chang N B, Li J H. Seasonal change detection of riparian zones with remote sensing images and genetic programm ing in a sem i-arid watershed [J], Journal of Environmental Management, 2009, 90(2): 1069-1080.
[7] 孫 杰, 賴祖龍. 利用隨機(jī)森林的城區(qū)機(jī)載LIDAR數(shù)據(jù)特征選擇與分類[J]. 武漢大學(xué)學(xué)報(bào): 信息科學(xué)版, 2014, 39(11): 1310-1313.
[8] Ren X F, Malik J. A probabilistic multi-scale model for contour completion based on image statistics [C]//Computer Science Division Conferenceon. London: Springer-Verlag, 2002: 312-327.
[9] 楊風(fēng)暴. 紅外物理與技術(shù)[M]. 北京: 電子工業(yè)出版社, 2014: 180-245.
[10] 吳 軍, 劉 榮, 郭 寧, 等. SVM 加權(quán)學(xué)習(xí)下的機(jī)載LIDAR數(shù)據(jù)多元分類研究[J]. 武漢大學(xué)學(xué)報(bào): 科學(xué)信息版, 2013, 38(1): 1-5.
[11] Sziranyi T, Shadaydeh M. Improved segmentation of a series of remote sensing images by using a fusion MRF model [J]. Content-Based Multimedia Indexing (CBM I), 2013, (11): 137-142.
[12] Bencherif M A, Bazi Y, Guessoum A, et al. Fusion of extreme learning machine and graph-based optim ization methods for active classification of remote sensing images [J]. Geoscience and Romeote Sensing Letters, 2015, 12(3): 527-532.
[13] 宋瑞霞, 王也娜, 孫紅磊, 等. 基于 V-矩的圖像分類算法[J]. 圖學(xué)學(xué)報(bào), 2015, 27(3): 52-58.
A Corn Field of Remote Sensing Image Classification Method Based on Segmentation-Derived Regions and Feature Likeness
Wang Xiaoxia, Yang Fengbao, Liang Ruofei, Feng Peipei
(Information and Communication Engineering College, North University of China, Taiyuan Shanxi 030051, China)
Corn field remote sensing images have a mass of endmember spectral variability and complexity, that results in the bad classification of planting area. A corn field of remote sensing image classification method based on segmentation-derived regions and feature likeness is proposed. First, principal component analysis (PCA) is used to extract the first principal component from the fusion image which is fused by the panchromatic and multi-spectral image, to acquire the monochromatic image I which contains rich information. Then, do a Watershed segmentation to I, we can get a graph of a split target area. Then build characteristic group which is composed of texture, brightness and contour feature likeness. At last Based on the principle of random forests, extract the corn target using the characteristic group. With the testing using GF-1 satellite remote sensing data and the results comparison analysis of the support vector machine (SVM), neural network algorithm and maximum likelihood algorithm, it shows that the classification accuracy of this method is superior to other algorithms.
endmember spectral; segmentation-derived regions; feature likeness
TP 751.1
10.11996/JG.j.2095-302X.2016030428
A
2095-302X(2016)03-0428-06
2016-02-25;定稿日期:2016-03-28
王肖霞(1980–),女,河北石家莊人,講師,博士。主要研究方向?yàn)椴淮_定性信息處理、遙感圖像處理、系統(tǒng)的可靠性分析等。
E-mail:wangxiaoxia@nuc.edu.cn