魏 清,艾玲梅,葉雪娜
(1.陜西省交通規(guī)劃設(shè)計(jì)研究院,陜西 西安 710065;2.陜西師范大學(xué) 計(jì)算機(jī)科學(xué)學(xué)院,陜西 西安 710119)
目前,獲取高分辨率遙感圖像數(shù)據(jù)已不再是難題,如何快速、智能地獲取遙感圖像目標(biāo)信息是當(dāng)今遙感界迫切需要解決的問(wèn)題,它關(guān)系到遙感技術(shù)的利用價(jià)值及應(yīng)用的普及程度[1]。道路作為重要的基礎(chǔ)地理信息,是遙感圖像目標(biāo)提取研究的關(guān)鍵內(nèi)容。遙感圖像道路提取方法可分為自動(dòng)和半自動(dòng)提取兩類[2]。熊立偉等[3]基于Snake模型進(jìn)行道路提取。該方法優(yōu)化改進(jìn)了傳統(tǒng)Snake模型初始條件,又采用了Williams[4]提出的快速貪婪算法作為收斂方法,能夠很好地提取道路輪廓,且不受噪聲、陰影等因素的影響,但是其通用性較低。譚仁龍等[3]提出基于圓形模板匹配的方法進(jìn)行道路提取。該方法保留了模板匹配算法的優(yōu)勢(shì),舍去了矩形模板的旋轉(zhuǎn)角度計(jì)算,又結(jié)合圖像灰度、形態(tài)學(xué)梯度、道路中心點(diǎn)之間的夾角信息,使用迭代內(nèi)插的方法搜索加密道路中心點(diǎn),對(duì)于提取曲線道路的效果較好。Anil等[5]利用統(tǒng)計(jì)區(qū)域合并(statistical region merging,SRM)算法進(jìn)行圖像分割,然后采用離散曲線演化的骨架修剪方法提取道路網(wǎng)。SRM[6]是一種基于自適應(yīng)統(tǒng)計(jì)閾值合并的區(qū)域增長(zhǎng)分割算法,算法快速簡(jiǎn)單,但對(duì)于提取有樹(shù)木、房屋等陰影遮擋的道路效果一般。李琳等[7]以圖像分割和線特征提取為基礎(chǔ),充分利用道路面狀特征、線狀特征的特點(diǎn),依據(jù)一定的判斷原則來(lái)剔除非道路對(duì)象,提取道路信息。該方法適用于提取遙感圖像鄉(xiāng)村道路和具有較多面狀區(qū)域的城區(qū)道路。
目前,半自動(dòng)道路提取方法得到了廣泛的應(yīng)用,但隨著圖像場(chǎng)景復(fù)雜度的不斷提升,該方法對(duì)人機(jī)交互操作的依賴性逐漸提高,影響了其實(shí)用性。自動(dòng)道路提取是高分辨率遙感影像道路提取的終極目標(biāo),如何更好地去除非道路對(duì)象,又盡可能保證道路信息的準(zhǔn)確完整,對(duì)道路的自動(dòng)提取非常重要。深度神經(jīng)網(wǎng)絡(luò)因其分類精度高和特征提取準(zhǔn)確等優(yōu)點(diǎn),受到了廣泛的關(guān)注,特別是卷積神經(jīng)網(wǎng)絡(luò)(convolution neural network,CNN),能夠自動(dòng)提取目標(biāo)特征,在圖像分類和目標(biāo)識(shí)別等方面應(yīng)用廣泛[8]。數(shù)學(xué)形態(tài)學(xué)[9-11]因其算法簡(jiǎn)單、速度快等特點(diǎn)在圖像處理與模式識(shí)別領(lǐng)域得到了廣泛應(yīng)用。
基于以上研究,文中提出一種結(jié)合卷積神經(jīng)網(wǎng)絡(luò)和數(shù)學(xué)形態(tài)學(xué)算法的道路自動(dòng)提取方法。算法流程如圖1所示。首先利用改進(jìn)的CNN進(jìn)行遙感圖像分類,
圖1 道路提取流程
初步提取出道路類特征,然后通過(guò)形狀特征分析來(lái)剔除非道路類的小面積噪聲,最后采用數(shù)學(xué)形態(tài)學(xué)方法進(jìn)行道路孔洞填充、細(xì)化等,得到最終道路結(jié)果。
圖2 卷積網(wǎng)絡(luò)結(jié)構(gòu)
圖2中C和S分別表示卷積層和降采樣層,該CNN結(jié)構(gòu)中2個(gè)卷積層和2個(gè)降采樣層交替連接。卷積層又稱為特征提取層,每層中神經(jīng)元的輸入與局部感受野相連,提取局部特征。C1層有三個(gè)特征圖,是由輸入圖像和三個(gè)不同的卷積核通過(guò)卷積得到的,而同一個(gè)特征圖使用相同的卷積核,即同一個(gè)特征圖共享權(quán)重和偏置。對(duì)于不同的降采樣層又稱為特征映射層,通過(guò)選取前一層特征圖局部區(qū)域統(tǒng)計(jì)后的值代替原局部區(qū)域值作為輸出,一般以局部區(qū)域的平均值、最大值作為統(tǒng)計(jì)值,既保留了特征的顯著性,又減少了參數(shù)數(shù)量,該過(guò)程具有對(duì)平移、形變、旋轉(zhuǎn)的縮變不變性。S2即為對(duì)C1進(jìn)行子抽樣得到的降采樣層,再通過(guò)卷積得到C3層,該層采用同S2一樣的方法得到S4。在CNN末層一般會(huì)加上若干全連接層和一個(gè)分類器,最后的輸出節(jié)點(diǎn)數(shù)對(duì)應(yīng)分類個(gè)數(shù)。CNN中采用共享卷積核的方法大大降低了參數(shù)規(guī)模,防止網(wǎng)絡(luò)模型過(guò)于復(fù)雜,而卷積操作記錄了圖像的空間信息,有利于對(duì)圖像信息的表達(dá)。
圖3為文中道路提取的CNN結(jié)構(gòu)。
圖3 道路提取CNN結(jié)構(gòu)
CNN訓(xùn)練時(shí)需要計(jì)算大量的參數(shù),直到訓(xùn)練出來(lái)的CNN模型在圖像目標(biāo)檢測(cè)與分類上表現(xiàn)出期望的效果。選用邏輯回歸(logistic regression,LR)分類法將CNN提取出來(lái)的特征分成道路類和非道路類,LR模型為非線性的sigmoid函數(shù):
g(X)=1/(1+e-θTX)
(1)
選取LR模型的損失函數(shù)(loss function)時(shí),要避免損失函數(shù)為非凸函數(shù),從而更有利于參數(shù)的求解。選用交叉熵?fù)p失函數(shù)來(lái)衡量LR分類器的準(zhǔn)確度。函數(shù)公式為:
(1-yi)log(1-gθ(xi))]
以上海典型的軌道交通車站為例,設(shè)定所有被疏散人員均按標(biāo)志方向疏散,對(duì)該車站進(jìn)行疏散仿真計(jì)算[4],得到以下結(jié)論:
(2)
批量隨機(jī)梯度下降算法(mini-batch gradient descent,MBGD)是常用的一種訓(xùn)練算法,是對(duì)隨機(jī)梯度下降算法(stochastic gradient descent,SGD)算法的一種改進(jìn),具有更強(qiáng)的學(xué)習(xí)能力。其關(guān)鍵點(diǎn)是學(xué)習(xí)率大小的設(shè)定,因?yàn)閷W(xué)習(xí)率的取值影響網(wǎng)絡(luò)整個(gè)訓(xùn)練過(guò)程的訓(xùn)練速度。若學(xué)習(xí)率取值太小,則會(huì)導(dǎo)致代價(jià)函數(shù)尋優(yōu)過(guò)程緩慢,且容易求取局部最優(yōu)解,難以獲得全局最優(yōu)解;若學(xué)習(xí)率取值過(guò)大,網(wǎng)絡(luò)訓(xùn)練過(guò)程可以很快地獲取最優(yōu)解,但極易出現(xiàn)震蕩現(xiàn)象,導(dǎo)致網(wǎng)絡(luò)訓(xùn)練過(guò)程中的代價(jià)函數(shù)值持續(xù)在最優(yōu)解的附近波動(dòng)。
學(xué)習(xí)率有固定學(xué)習(xí)率和可變學(xué)習(xí)率兩種,固定學(xué)習(xí)率的取值設(shè)定較難,需要依據(jù)頻繁試驗(yàn)或者基于前人的經(jīng)驗(yàn)來(lái)確定合適的取值。文中利用黃金分割法來(lái)自適應(yīng)調(diào)整學(xué)習(xí)率大小,緩解由學(xué)習(xí)率設(shè)置不合適帶來(lái)的問(wèn)題。
采用改進(jìn)的CNN對(duì)圖像進(jìn)行像素級(jí)分類,基本能提取所有道路,但房屋等非道路地物也被提取出來(lái)。高分遙感圖像中道路一般為長(zhǎng)條狀,其長(zhǎng)度遠(yuǎn)大于寬度,房屋則較多為規(guī)則的四邊形。除此之外,道路的面積一般較大,有直線也有曲線。基于二者的特征即能實(shí)現(xiàn)對(duì)道路的進(jìn)一步提取。
(1)面積S。計(jì)算圖中各連通區(qū)域的面積,選定合適的閾值濾除面積較小的區(qū)域。
(2)圓形度C[12]。由文獻(xiàn)[12]可知,道路長(zhǎng)寬比的計(jì)算有一定的難度,特別是對(duì)于長(zhǎng)寬比不均勻的曲線道路。然而不論直線道路還是曲線道路圓形度都比較大,因?yàn)閳A形度的計(jì)算是多邊形周長(zhǎng)的平方與其面積的比值,即:
(3)
其中,P和A分別為道路的周長(zhǎng)和面積。
利用形狀特征剔除非道路特征后,道路周圈的樹(shù)木可能在道路上形成影子,得到的道路會(huì)有孔洞,且道路有所膨脹。因此,需要采用形態(tài)學(xué)運(yùn)算來(lái)進(jìn)一步優(yōu)化道路提取效果。
文中選取西安市臨潼區(qū)的兩幅全色高分辨率遙感圖像進(jìn)行實(shí)驗(yàn),兩次實(shí)驗(yàn)采用的圖像大小分別為309×274和378×266,結(jié)果分別如圖4和圖5所示。這里所用的訓(xùn)練樣本數(shù)目為8 506,樣本大小為32*32,測(cè)試樣本的數(shù)目為3 000。由圖4(b)顯示得到了比較完整的道路區(qū)域,但仍有非道路區(qū)域被提取出來(lái),而且道路發(fā)生了膨脹,因此利用形態(tài)學(xué)算法進(jìn)行優(yōu)化,優(yōu)化結(jié)果如圖4(c)所示。剔除S小于100的區(qū)域,因?yàn)榈缆返膱A形度比較大,所以C的值設(shè)為300,將C值小于300的區(qū)域剔除,最后運(yùn)用形態(tài)學(xué)閉運(yùn)算和細(xì)化算法來(lái)進(jìn)一步優(yōu)化道路效果,如圖4(d)所示為道路提取的最終結(jié)果。
對(duì)于另一張圖片,應(yīng)用文中方法提取道路。設(shè)定S和C的值分別為35和350,最后采用形態(tài)學(xué)閉運(yùn)算和細(xì)化算法進(jìn)一步優(yōu)化道路提取,如圖5所示。
圖4(a)中有兩條道路,左邊的道路與右邊的南北方向道路相交。由圖4(b)可知,道路區(qū)域均能較為完整地提取出來(lái)。圖5(a)上僅有一條道路,但道路彎曲度較大。由圖5(b)可知,彎曲的道路被較完整地提取出來(lái)。圖4(b)和圖5(b)提取出來(lái)的道路都發(fā)生了一定的膨脹,而且都存在小面積的非道路類噪聲。結(jié)合形狀特征分析和數(shù)學(xué)形態(tài)算法來(lái)進(jìn)一步優(yōu)化道路初步提取結(jié)果。實(shí)驗(yàn)1中,去除S小于100的區(qū)域,去除C值小于300的區(qū)域,最后運(yùn)用半徑為3的圓盤形結(jié)構(gòu)元素進(jìn)行形態(tài)學(xué)閉運(yùn)算和細(xì)化操作。實(shí)驗(yàn)2中,設(shè)定S和C的值分別為35和350, 最后采用半徑為2的圓
圖4 實(shí)驗(yàn)1道路提取結(jié)果
圖5 實(shí)驗(yàn)2道路提取結(jié)果
盤形結(jié)構(gòu)元素進(jìn)行形態(tài)學(xué)閉運(yùn)算和細(xì)化操作。如圖4(c)和圖5(c)所示,經(jīng)形狀特征分析后,非道路類小面積噪聲都被剔除。接著,采用形態(tài)學(xué)算法來(lái)細(xì)化道路并填充道路表面的孔洞,道路提取最終結(jié)果如圖4(d)和圖5(d)所示。將提取的道路疊加到原圖上,結(jié)果如圖4(e)和5(e)所示,最終的道路信息能夠很好地與原灰度圖道路吻合。
進(jìn)一步采用定量分析的方法來(lái)評(píng)價(jià)道路提取精度。參照文獻(xiàn)[13]中所用的評(píng)價(jià)方法,即從準(zhǔn)確度、遺漏誤差和冗余誤差三個(gè)指標(biāo)來(lái)進(jìn)行評(píng)價(jià),計(jì)算公式分別如下:
(4)
(5)
(6)
其中,遺漏線性目標(biāo)長(zhǎng)度即將道路作為噪聲剔除的道路長(zhǎng)度,多余的線性目標(biāo)長(zhǎng)度即把噪聲當(dāng)成道路提取出來(lái)的長(zhǎng)度。指標(biāo)評(píng)價(jià)結(jié)果如表1所示。
表1 道路提取結(jié)果精確度評(píng)價(jià)
由表1可知,利用文中方法提取的道路結(jié)果中,遺漏誤差、冗余誤差和準(zhǔn)確度的平均值分別為6.84、0.41、91.565,說(shuō)明該方法能夠很好地進(jìn)行道路提取。
提出一種結(jié)合CNN模型和數(shù)學(xué)形態(tài)學(xué)算法自動(dòng)提取高分辨率遙感圖像道路的方法。首先利用改進(jìn)的MBGD訓(xùn)練CNN模型對(duì)遙感圖像分類提取道路類信息,然后結(jié)合形狀特征分析和形態(tài)學(xué)算法進(jìn)一步優(yōu)化道路提取效果,得到比較完整的道路。與傳統(tǒng)的道路提取方法相比,該方法利用CNN深度學(xué)習(xí)方法,能夠有效、自動(dòng)、智能地識(shí)別道路區(qū)域,符合現(xiàn)今對(duì)獲取道路方法研究的發(fā)展要求。但該方法也存在諸多不足,如沒(méi)有總結(jié)出可靠的搭建CNN結(jié)構(gòu)的方法,使其應(yīng)用具有一定的局限性,這些都有待進(jìn)一步的改進(jìn)。