王艷梅,李金雨,馮海霞
(1.安徽三聯(lián)學院 交通工程學院,安徽 合肥 230601;2.山東交通學院 交通與物流工程學院,山東 濟南 250357)
隨著空間技術(shù)的不斷發(fā)展,遙感影像的分辨率越來越高,為更準確地提取地物信息提供了更好的數(shù)據(jù)基礎(chǔ)。道路是高分辨率遙感影像中一種很重要的地物信息,如何從高分辨率遙感影像中精確地提取出道路信息,成為國內(nèi)外眾多學者研究的熱點,因此也提出了各種各樣的算法[1-5]。雖然高分辨率遙感影像中道路信息的幾何特征和紋理特征都非常明顯,但是由于同物異譜和同譜異物現(xiàn)象的存在,使得道路信息提取的精度受到一定限制,給提取算法的設(shè)計帶來一定難度。
支持向量機(support vector machine,SVM)是國內(nèi)外眾多學者研究的熱點[6-11]。汪閩等[12-13]設(shè)計了一種使用非線性映射SVM從高分辨率遙感影像中提取道路信息的方法。SONG M等[14]對于遙感影像中被遮擋的道路使用區(qū)域增長法進行提取,然后使用SVM將遙感影像分為道路和非道路兩大類。GHULE S A等[15]提出,借助紋理特征和顏色特征分析遙感影像中道路信息,然后采用SVM提取道路網(wǎng)信息。但是,這些算法存在提取的道路位置不準確、像素錯分等問題,導致道路信息提取的整體精度不高。本文提出了一種改進的SVM算法。該方法首先使用K均值聚類算法(K-means clustering algorithm)對遙感影像進行聚類分析,抓住關(guān)鍵樣本,剔除沉冗樣本,然后使用SVM提取道路信息,可以降低誤判率。
該算法首先將樣本聚類為K個簇,然后計算每個對象到各聚類中心的距離,把每個對象分配給距離它最近的聚類中心。
(1)隨機選擇K個對象作為原始的聚類中心;
(2)計算每個樣本點到聚類中心的距離,將每個樣本點歸類到距離該點最近的聚類中心;
(3)計算每個聚類中所有點的質(zhì)心(坐標平均值);
(4)如果簇的質(zhì)心不變,則返回到劃分結(jié)果,否則轉(zhuǎn)到步驟(2)。
隨機選擇k個聚類中心μ1,μ2,…,μk∈R。然后對各個樣本進行分類計算:
ci=argminxi-μj2
(1)
對于每一個類j,重新計算該類的質(zhì)心
(2)
式(1)—式(2)中ci表示的是樣本i與各類k中距離最近的類,質(zhì)心μj則代表用戶對屬于同一個類的樣本中心點的猜測。分好類后,用戶要重新計算它的質(zhì)心然后重復迭代直至質(zhì)心不變。
(1)構(gòu)造n個二值分類器,fk(x),k=[1,n]。將第k類的訓練樣本和其他訓練樣本集分開。若樣本xi屬于第k類,則有sgnfk(xi)=1,否則sgnfk(xi)=-1。
(2)尋找函數(shù)fk(xi),k=[1,n]中最大值所對應的類別即為xi的類別,yi=argmaxf1(xi),f2(xi),…,fn(xi)。
本文選擇具有線性核函數(shù)的SVM將原始影像分為道路和非道路兩大類,主要過程是先將原始遙感影像經(jīng)過K均值聚類,然后通過SVM提取道路信息。最后,將K均值+SVM提取道路信息結(jié)果與直接使用SVM提取道路信息結(jié)果進行精度比較。
本次選用的實驗數(shù)據(jù)是由高分二號衛(wèi)星采集的合肥市城區(qū)的部分道路影像,分辨率為4 m的多光譜數(shù)據(jù)。選取的合肥城區(qū)實驗數(shù)據(jù)原始影像見圖1,影像中包含了道路、房屋、植被、水體等地物信息。
圖1 原始影像數(shù)據(jù)
實驗在matlab環(huán)境下實現(xiàn),實驗1是選擇線性核函數(shù)的SVM直接提取道路信息,提取結(jié)果見圖2。實驗2是先將遙感影像經(jīng)過K均值聚類,然后通過SVM提取道路信息,提取結(jié)果見圖3。通過視覺分析,從提取結(jié)果可以看出,SVM算法提取結(jié)果噪聲較大,而K均值+SVM提取結(jié)果噪聲較小,提取結(jié)果相對更準確一些。
圖2 直接使用SVM提取道路信息結(jié)果
圖3 K均值+SVM提取道路信息結(jié)果
通過實驗可以看出,兩種方法提取的道路信息完全不同,直接使用SVM提取道路的噪聲較大,而使用K均值+SVM提取道路信息的噪聲較小。為了更精確地評估兩種方法提取道路的精度,可以采用數(shù)據(jù)分析的方法評估道路提取的精度??筛鶕?jù)所提取道路的幾何長度,使用準確度、冗余誤差和遺漏誤差對提取道路結(jié)果進行評估。
(3)
(4)
(5)
根據(jù)實驗中所提取的道路信息結(jié)果,表1列出了實驗1和實驗2中提取道路信息的準確度、冗余誤差和遺漏誤差。從表1中可以看出,直接使用SVM提取道路信息的準確度、冗余誤差和遺漏誤差分別為81.29%、0.85%和12.24%,使用K均值+SVM的準確度、冗余誤差和遺漏誤差分別為92.15%、0.19和5.31。通過K均值+SVM算法提取道路信息比直接使用SVM算法提取道路信息精度更好。
表1 道路目標提取結(jié)果的精度統(tǒng)計
高空間分辨率遙感影像中道路信息的紋理特征和幾何特征都非常豐富。本文基于高分二號遙感影像數(shù)據(jù)采用K均值與SVM相結(jié)合的方法提取道路信息,通過算法精度分析,該方法提取道路信息精度比直接使用SVM提取道路信息效果更好。但是,使用K均值與SVM相結(jié)合的方法提取道路信息時,仍存在道路信息丟失及自動化程度不高等問題,需要進一步深入研究。