国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于XGBoost的遙感圖像中道路網(wǎng)絡(luò)的提取

2017-12-29 06:15:32
關(guān)鍵詞:決策樹像素點(diǎn)分類器

楊 燦

(福州大學(xué) 物理與信息工程學(xué)院,福建 福州 350116)

基于XGBoost的遙感圖像中道路網(wǎng)絡(luò)的提取

楊 燦

(福州大學(xué) 物理與信息工程學(xué)院,福建 福州350116)

傳統(tǒng)的機(jī)器學(xué)習(xí)分類算法在處理道路提取問(wèn)題過(guò)程中存在準(zhǔn)確度低、速度慢的缺點(diǎn)。通過(guò)利用XGBoost算法提取遙感圖像中的道路部分,以圖像中的顏色特征以及像素點(diǎn)的局部特征作為特征輸入,對(duì)圖像中的每個(gè)像素點(diǎn)進(jìn)行分類后,提取出道路。實(shí)驗(yàn)結(jié)果表明,該算法提取道路的準(zhǔn)確性高,能夠清晰繪出圖像中的道路網(wǎng)絡(luò),且該算法具有較好的魯棒性。

道路提??;XGBoost算法;分類

0 引言

道路是國(guó)家的重要交通設(shè)施,國(guó)家在交通設(shè)施上的投資力度逐年增加,道路里程數(shù)不斷增長(zhǎng)。因此,道路網(wǎng)絡(luò)的實(shí)時(shí)更新對(duì)于交通管理、車輛導(dǎo)航有著重要作用。遙感圖像能夠提供區(qū)域的高分辨率圖像,高分率圖像能夠提供豐富的顏色、紋理、結(jié)構(gòu)特征,使得從遙感圖像中提取道路網(wǎng)絡(luò)成為可能。

從遙感圖像中提取道路網(wǎng)絡(luò)的問(wèn)題可以轉(zhuǎn)換為將圖像中的每個(gè)點(diǎn)劃分到兩個(gè)類中,即道路區(qū)域和非道路區(qū)域。文獻(xiàn)[1]提出了一種基于SVM的算法用于提取道路網(wǎng)絡(luò),該算法的主要思想是通過(guò)提取圖像中地理統(tǒng)計(jì)學(xué)的紋理特征,利用SVM分類算法來(lái)提取道路網(wǎng)絡(luò)。文獻(xiàn)[2]提出了一種基于K均值和改進(jìn)區(qū)域生長(zhǎng)的算法來(lái)提取道路網(wǎng)絡(luò),該算法首先利用K均值算法將圖像中每個(gè)像素點(diǎn)劃分到不同的類中去,然后利用改進(jìn)的區(qū)域生長(zhǎng)算法以及形態(tài)學(xué)方法對(duì)聚類后的圖像進(jìn)行后處理,得到道路網(wǎng)絡(luò)。文獻(xiàn)[3]提出了一種基于SVM和FCM的算法,該算法首先利用FCM對(duì)圖像進(jìn)行聚類,將圖像中每個(gè)像素點(diǎn)劃分到各自的類中,然后利用SVM對(duì)聚類后的像素點(diǎn)進(jìn)行分類后得到道路網(wǎng)絡(luò)。文獻(xiàn)[4]提出了一種基于改進(jìn)的高斯混合模型,從高分辨率遙感圖像提取道路的方法。通過(guò)Gabor濾波器計(jì)算影像一維紋理描述值,將其作為分割道路的特征值對(duì)影像進(jìn)行預(yù)處理,再利用基于兩層高斯混合模型的新分類方式對(duì)高分辨率遙感影像進(jìn)行分類。文獻(xiàn)[5]提出了一種基于均值漂移的道路網(wǎng)絡(luò)提取方法,該方法的優(yōu)勢(shì)在于不需要任何先驗(yàn)知識(shí),具有高效率和穩(wěn)定性,特別是對(duì)于遙感圖像的檢測(cè)。文獻(xiàn)[6]提出了一種基于神經(jīng)網(wǎng)絡(luò)的反饋傳播算法,該算法能夠快速有效地提取道路網(wǎng)絡(luò)。文獻(xiàn)[7]提出了一種基于bagging和boosting的方法,將多個(gè)分類器融合用于提取道路網(wǎng)絡(luò)。

在本文中,同樣是利用機(jī)器學(xué)習(xí)算法來(lái)對(duì)圖像中的像素點(diǎn)進(jìn)行分類,不同之處在于,本文所用的方法對(duì)于事先提取的特征的要求不高,僅需提取圖像中每個(gè)樣本點(diǎn)的顏色特征和局部特征,且特征提取的難度較低。此外,本文提出了一種基于XGBoost(eXtreme Gradient Boosting)[8]的分類算法用于提取道路網(wǎng)絡(luò),在利用相同的特征作為模型輸入時(shí),該算法能夠提高道路提取的準(zhǔn)確性,文中對(duì)不同的機(jī)器學(xué)習(xí)算法進(jìn)行了比較,并給出實(shí)驗(yàn)數(shù)據(jù)。對(duì)于分類后的結(jié)果,本文方法不需要對(duì)結(jié)果進(jìn)行過(guò)多處理,即能得到較好的效果。實(shí)驗(yàn)結(jié)果表明,該算法提取的道路具有很好的可辨認(rèn)性,并且魯棒性很好。

1 特征提取

圖像的特征有很多種,顏色特征、紋理特征、形狀特征等,特征的構(gòu)建對(duì)于分類結(jié)果的影響顯著。本文主要利用圖像的顏色特征以及圖像中每個(gè)像素點(diǎn)的局部特征作為特征輸入。

1.1 顏色特征

遙感圖像中每個(gè)像素點(diǎn)是由RGB三通道構(gòu)成的,對(duì)于圖像中每個(gè)像素,由于道路區(qū)域的像素點(diǎn)的顏色明顯有別于非道路區(qū)域,因此,顏色特征可作為一個(gè)特征輸入。

1.2 局部特征

雖然圖像中的道路區(qū)域和非道路區(qū)域顏色具有區(qū)分度,但是,由于遙感圖像的分辨率很高,圖像的細(xì)節(jié)比較多。因此,圖像中存在以下幾種異常情況:一是非道路區(qū)域存在某些像素點(diǎn)的顏色特征和道路區(qū)域的顏色特征相同;二是遙感圖像在拍攝過(guò)程中,由于各種因素干擾,例如,道路旁的樹的陰影、道路上的汽車、房屋陰影等,會(huì)造成這些像素點(diǎn)的顏色特征與道路區(qū)域的顏色特征不同;三是道路區(qū)域的顏色不是始終不變的,在某些區(qū)域,道路的顏色會(huì)加深或變淺。所以,僅僅依靠顏色特征用于分類,得到的分類結(jié)果并不是很理想。

圖1 鄰近局部特征

本文通過(guò)構(gòu)造像素點(diǎn)的局部特征作為特征輸入。局部特征的構(gòu)造如圖1所示。圖1(a)中c點(diǎn)即為圖像中當(dāng)前像素點(diǎn)。上節(jié)中提取的是該點(diǎn)的顏色特征。由于從圖像的角度來(lái)看,當(dāng)前像素點(diǎn)和其周圍像素點(diǎn)一般具有高度相似性,這些像素點(diǎn)的值應(yīng)該相似。通過(guò)構(gòu)造這類特征,可以很好解決單一顏色特征用于分類時(shí)無(wú)法解決的問(wèn)題。并且,提取鄰近像素點(diǎn)的值時(shí),僅需提取鄰近像素點(diǎn)的灰度值,這樣可以降低特征的維數(shù),相較于提取鄰近像素點(diǎn)的RGB三通道值,特征維數(shù)下降為原來(lái)的1/3。本文通過(guò)實(shí)驗(yàn)驗(yàn)證后發(fā)現(xiàn),使用的是距離當(dāng)前像素點(diǎn)3個(gè)單位范圍內(nèi)的像素作為用于分類時(shí)的特征效果最佳,如圖1(b)所示。

2 分類建模

2.1 XGBoost算法

對(duì)于一個(gè)復(fù)雜的分類任務(wù),給定一組訓(xùn)練樣本集后,求比較粗糙的分類規(guī)則(弱分類器)要比求精確的分類規(guī)則(強(qiáng)分類器)容易得多。提升算法就是從弱分類學(xué)習(xí)算法出發(fā),反復(fù)學(xué)習(xí),得到一系列弱分類器(稱為基本分類器),然后組合這些弱分類器,構(gòu)成強(qiáng)分類器。大多數(shù)的提升方法都是改變訓(xùn)練數(shù)據(jù)的概率分布,針對(duì)不同的訓(xùn)練數(shù)據(jù)分布調(diào)用弱學(xué)習(xí)算法學(xué)習(xí)一系列弱分類器。因此,提升算法實(shí)際上就是采用加法模型(即基函數(shù)的線性組合)與前向分布算法將多個(gè)弱分類器按不同的比例組合成一個(gè)強(qiáng)分類器[9]。

當(dāng)提升算法在學(xué)習(xí)弱分類器時(shí),如果弱分類器采用決策樹為基函數(shù),由此得到的強(qiáng)分類器的算法稱為提升樹算法。提升樹模型可以表示為決策樹的加法模型:

(1)

其中,T(x;Θm)表示決策樹;Θm表示決策樹的參數(shù);M為樹的個(gè)數(shù)。

提升樹算法采用前向分布算法。首先確定初始提升樹f0(x)=0,第m步的模型是:

fm(x)=fm-1(x)+T(x;Θm)

(2)

其中,fm-1(x)是當(dāng)前模型,通過(guò)經(jīng)驗(yàn)風(fēng)險(xiǎn)極小化確定下一棵決策樹的參數(shù)Θm:

(3)

其中,L()表示損失函數(shù),由于提升樹算法利用加法模型與前向分布算法實(shí)現(xiàn)學(xué)習(xí)的優(yōu)化過(guò)程,當(dāng)損失函數(shù)是平方損失和指數(shù)損失函數(shù)時(shí),每一步優(yōu)化是很簡(jiǎn)單的。但對(duì)于其他損失函數(shù),往往每一步的優(yōu)化并不容易。針對(duì)這一問(wèn)題,F(xiàn)rediman提出了梯度提升(Gradient Boosting)算法。這是利用梯度下降法的近似方法,其關(guān)鍵是利用損失函數(shù)的負(fù)梯度在當(dāng)前模型的值,即:

(4)

XGBoost算法對(duì)GBDT算法的改進(jìn)在于,一是求解優(yōu)化函數(shù)過(guò)程中,GBDT采用一階導(dǎo)數(shù),而XGBoost算法計(jì)算目標(biāo)函數(shù)的二階導(dǎo)數(shù);二是XGBoost算法在目標(biāo)函數(shù)中加入了正則項(xiàng),有利于防止算法在訓(xùn)練過(guò)程中產(chǎn)生過(guò)擬合現(xiàn)象,導(dǎo)致訓(xùn)練的得到模型泛化能力變差;三是XGBoost算法在訓(xùn)練過(guò)程中借鑒了隨機(jī)森林的思想,每次迭代過(guò)程中不使用全部樣本,并且不使用每個(gè)樣本的所有特征,而是對(duì)樣本進(jìn)行抽樣,采用部分樣本的部分特征去訓(xùn)練,有效提高了模型的泛化能力;四是XGBoost算法支持并行計(jì)算,提高了運(yùn)行速度。首先定義目標(biāo)函數(shù):

obj(θ)=L(θ)+Ω(θ)

(5)

其中L(θ)是損失函數(shù),常見的損失函數(shù)有平方損失、Hinge損失、交叉信息熵?fù)p失等。Ω(θ)是正則項(xiàng),常見的正則項(xiàng)有L1和L2,正則項(xiàng)的作用是防止模型在訓(xùn)練時(shí)發(fā)生過(guò)擬合現(xiàn)象,導(dǎo)致模型的泛化能力變差。

由于XGBoost算法采用決策樹作為基分類器,因此正則項(xiàng)表示為:

(6)

其中,T表示為當(dāng)前決策樹的葉子節(jié)點(diǎn)數(shù),ω是每個(gè)葉子節(jié)點(diǎn)的權(quán)重。由于模型預(yù)測(cè)的結(jié)果可以表示為所有決策樹預(yù)測(cè)結(jié)果的加權(quán)和:

(7)

其中,F(xiàn)表示決策樹空間,即所有決策樹的集合。因此,目標(biāo)函數(shù)可表示為:

(8)

對(duì)于第t輪迭代,目標(biāo)函數(shù)表示為:

(9)

即對(duì)xi的預(yù)測(cè)值是第t棵樹的預(yù)測(cè)值和前t-1棵樹預(yù)測(cè)值的和。對(duì)式(9)求一階導(dǎo)數(shù)和二階導(dǎo)數(shù)并移除常數(shù)項(xiàng)可得:

(10)

(11)

(12)

其中g(shù)i是一階導(dǎo)數(shù)值,hi是二階導(dǎo)數(shù)值,ωj是決策樹上葉子節(jié)點(diǎn)的權(quán)重,T是決策樹的葉子數(shù)目,γ是懲罰值。

2.2 其他分類方法

為了便于比較,采用另外幾種分類算法進(jìn)行對(duì)比。GBDT算法作為Boosting算法的最初實(shí)現(xiàn)版本,在實(shí)際應(yīng)用中有著較好的表現(xiàn)。SVM算法以及邏輯斯蒂回歸算法作為基本的分類的算法,由于這兩個(gè)算法僅僅是一個(gè)分類算法,而不是集成算法,所以同等條件下,這兩個(gè)算法的分類結(jié)果不是很好。通過(guò)對(duì)四種不同分類進(jìn)行實(shí)驗(yàn),得出實(shí)驗(yàn)結(jié)果。

2.3 評(píng)價(jià)指標(biāo)

由于圖像中只有道路區(qū)域和非道路區(qū)域兩部分,因此,對(duì)于分類的結(jié)果,不僅僅使得道路區(qū)域被準(zhǔn)確識(shí)別,還要求非道路區(qū)域盡量不要被誤劃分到道路區(qū)域。因此采用如下兩個(gè)指標(biāo):

(13)

(14)

n1表示道路區(qū)域被正確預(yù)測(cè)的數(shù)目,n2表示道路區(qū)域被預(yù)測(cè)為非道路區(qū)域的數(shù)目,road_precision的結(jié)果越大,說(shuō)明道路區(qū)域被正確劃分的區(qū)域多。r1表示非道路區(qū)域被預(yù)測(cè)為非道路區(qū)域的數(shù)目,r2表示非道路區(qū)域被預(yù)測(cè)為道路區(qū)域的數(shù)目,non_road_precision的結(jié)果要盡可能大,說(shuō)明越大,說(shuō)明非道路區(qū)域被錯(cuò)劃分到道路區(qū)域的數(shù)目越小。

3 實(shí)驗(yàn)分析

本實(shí)驗(yàn)中,選取的測(cè)試圖片來(lái)源于QuickBird衛(wèi)星所拍攝的西班牙羅塔島地區(qū),該衛(wèi)星拍攝的圖像的分辨率是0.61 m。實(shí)驗(yàn)結(jié)果如圖2所示。

圖2 算法分類效果圖

從圖2效果可知,XGBoost算法提取出的的道路網(wǎng)絡(luò)清晰可見,對(duì)于非道路區(qū)域的分辨能力也比其他三種算法好。圖中道路的材質(zhì)有兩種,圖中左上角的道路材質(zhì)和其他地方道路的材質(zhì)不同,XGBoost算法同樣能夠提取出清晰的道路網(wǎng)絡(luò)。對(duì)于圖中的非道路區(qū)域的干擾,XGBoost算法同樣能夠做到區(qū)分。

從表1的數(shù)據(jù)可知,XGBoost算法無(wú)論是road_precision還是non_road_precision都比其他三種算法高。這個(gè)結(jié)果與圖2中的效果具有一致性。從表中還可以看出,雖然SVM算法在道路區(qū)域提取的準(zhǔn)確度上能夠接近XGBoost算法,但是SVM對(duì)于非道路區(qū)域干擾以及不同材質(zhì)道路的提取方面明顯存在差距。Logistic算法是效果最差的,無(wú)論是對(duì)于道路區(qū)域的提取,還是對(duì)于非道路區(qū)域的剔除,該算法都不能得到較好的效果。由于XGBoost算法是GBDT算法的改進(jìn),可以看出,GBDT算法處理結(jié)果和XGBoost算法接近,但是GBDT算法對(duì)于非道路區(qū)域的剔除沒有XGBoost算法的效果好。

表1 算法分類結(jié)果

4 結(jié)論

本文利用圖像的顏色特征以及圖像中每個(gè)像素點(diǎn)的局部特征作為XGBoost算法的特征輸入,在訓(xùn)練得到模型后,對(duì)圖像中每個(gè)像素點(diǎn)進(jìn)行分類。并將XGBoost算法與GBDT、SVM、Logistic算法進(jìn)行比較后發(fā)現(xiàn),XGBoost算法對(duì)圖像的分類效果最佳。對(duì)于圖像中存在不同材質(zhì)道路以及非道路區(qū)域的干擾,能夠表現(xiàn)出良好的性能,算法的可靠性高。并且,本文提取的特征簡(jiǎn)單,避免了在處理圖像分類過(guò)程中需要事先對(duì)圖像進(jìn)行理解并構(gòu)建獨(dú)有特征的困擾。通過(guò)結(jié)合本文的特征與XGBoost算法,能夠很好地提取道路網(wǎng)絡(luò)。本文方法為其他圖像分類工作提供了一個(gè)參考。

[1] 張曦.基于時(shí)頻特征和支持向量機(jī)的高分辨率遙感影像道路提取[D].合肥:安徽大學(xué),2016.

[2] 胡永祥,李建飛,文志強(qiáng),等.基于K均值和區(qū)域生長(zhǎng)的高分辨率遙感影像道路網(wǎng)提取[C].第二屆高分辨率對(duì)地觀測(cè)學(xué)術(shù)年會(huì)論文集,2013:1-13.

[3] ZHU D M,WEN X,LING C L. 2011. Road extraction based on the algorithms of MRF and hybrid model of SVM and FCM[C]. International Symposium on Image and Data Fusion,Tengchong,2011.

[4] 向晶,周紹光,陳超,等.基于改進(jìn)高斯混合模型的遙感影像道路提取[J].測(cè)繪工程,2014,23(3):42-45.

[5] Miao Zelang,Wang Bin,Shi Wenzhong,et al. A semi-automatic method for road centerline extraction from VHR images[C]. IEEE Geoscienceand Remote Sensing Letters,2014,11(11):1856-1860.

[6] HEERMANN P D,KHAZENIE N. Classification of multispectral remote sensing data using a back-propagation neural network[J]. IEEE Transactions on Geoscience and Remote Sensing,1992,30(1): 81-88.

[7] UNSALAN C,SIRMACEK B. Road network detection using probabilistic and graph theoretical methods[C]. IEEE Transactions on Geoscience and Remote Sensing,2012,50(11): 4441-4453.

[8] Chen Tianqi,GUESTRIN C. Xgboost: a scalable tree boosting system[C]. Proceedings of the 22Nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining,2016:785-794.

[9] 李航.統(tǒng)計(jì)學(xué)習(xí)方法[M].北京:清華大學(xué)出版社,2012.

Road network extraction from remote sensing images based on XGBoost

Yang Can

(School of Physics and Information Engineering,Fuzhou University,Fuzhou 350116,China)

The traditional machine learning classification algorithm has the shortcomings of low accuracy and slow speed in dealing with the problem of road extraction. In this paper,we use the XGBoost algorithm to extract the road part in the remote sensing image,and take the color feature in the image and the local feature of the pixel as the feature inputs to classify each pixel in the image and extract the road. The experimental results show that the proposed algorithm has high accuracy and can clearly draw the road network in the image,and the algorithm has better robustness.

road extraction; XGBoost algorithm; classification

TP75

A

10.19358/j.issn.1674-7720.2017.24.009

楊燦.基于XGBoost的遙感圖像中道路網(wǎng)絡(luò)的提取J.微型機(jī)與應(yīng)用,2017,36(24):28-31.

2017-06-23)

楊燦(1992-),男,碩士研究生,主要研究方向:數(shù)字圖像處理。

猜你喜歡
決策樹像素點(diǎn)分類器
一種針對(duì)不均衡數(shù)據(jù)集的SVM決策樹算法
決策樹和隨機(jī)森林方法在管理決策中的應(yīng)用
電子制作(2018年16期)2018-09-26 03:27:06
BP-GA光照分類器在車道線識(shí)別中的應(yīng)用
基于canvas的前端數(shù)據(jù)加密
基于逐像素點(diǎn)深度卷積網(wǎng)絡(luò)分割模型的上皮和間質(zhì)組織分割
加權(quán)空-譜與最近鄰分類器相結(jié)合的高光譜圖像分類
結(jié)合模糊(C+P)均值聚類和SP-V-支持向量機(jī)的TSK分類器
基于決策樹的出租車乘客出行目的識(shí)別
基于肺癌CT的決策樹模型在肺癌診斷中的應(yīng)用
基于肺癌CT的決策樹模型在肺癌診斷中的應(yīng)用
理塘县| 新龙县| 滁州市| 安康市| 黔江区| 南雄市| 监利县| 连山| 霍邱县| 广安市| 武威市| 长宁县| 馆陶县| 七台河市| 天等县| 遂宁市| 织金县| 绿春县| 八宿县| 开平市| 确山县| 临泉县| 宁安市| 奎屯市| 灌阳县| 西平县| 遂昌县| 丰宁| 罗定市| 化德县| 美姑县| 肇源县| 勐海县| 法库县| 桂东县| 峨山| 佳木斯市| 福贡县| 留坝县| 酒泉市| 稻城县|