姬曉飛,石宇辰
(沈陽航空航天大學(xué) 自動(dòng)化學(xué)院,遼寧 沈陽 110136)
光學(xué)遙感圖像的目標(biāo)檢測(cè)與識(shí)別一直是遙感圖像處理與分析的關(guān)鍵技術(shù)[1]。光學(xué)遙感圖像目標(biāo)檢測(cè)與識(shí)別技術(shù)可分為基于單目標(biāo)和基于多目標(biāo)2個(gè)方向。文獻(xiàn)[2]提出將深度學(xué)習(xí)技術(shù)應(yīng)用在飛機(jī)檢測(cè)中,該方法主要是通過建立深度信念網(wǎng)絡(luò)及卷積神經(jīng)網(wǎng)絡(luò)對(duì)飛機(jī)結(jié)構(gòu)模型進(jìn)行檢測(cè)。文獻(xiàn)[3]提出一種基于自組織特征映射(self-organizing feature map,SOFM)網(wǎng)絡(luò)模型的紋理特征方法,該方法通過提取光學(xué)遙感圖像中局部的紋理特征來表示圖像整體灰度分布特性,對(duì)單一的飛機(jī)、橋梁目標(biāo)的識(shí)別率較高,但適用范圍較小。文獻(xiàn)[4]提出了一種圓周頻率濾波法,利用了飛機(jī)在光學(xué)遙感圖像的形狀特征與灰度特征,用圓周頻率濾波器對(duì)圖像進(jìn)行預(yù)處理,并保留濾波后幅值大的點(diǎn)為飛機(jī)中心,再使用區(qū)域生長(zhǎng)式聚類確定飛機(jī)位置。經(jīng)實(shí)驗(yàn)總共65架飛機(jī)正確識(shí)別59架,該算法僅對(duì)飛機(jī)取得了較好的識(shí)別效果。文獻(xiàn)[5]設(shè)計(jì)了一種復(fù)雜背景下光學(xué)遙感圖像船艦?zāi)繕?biāo)檢測(cè)方法,該方法借鑒了人眼視覺注意機(jī)制的特征,結(jié)合雜波率系數(shù),并且通過模擬人眼視覺感知的Gabor濾波器,實(shí)現(xiàn)了在復(fù)雜背景下對(duì)船艦的檢測(cè),但耗時(shí)較長(zhǎng),通用性不強(qiáng)。以上研究表明,在單一目標(biāo)檢測(cè)識(shí)別的過程中,某一特征通常只對(duì)特定目標(biāo)識(shí)別能力較強(qiáng),而將同一特征應(yīng)用在不同待識(shí)別目標(biāo)的過程中,通常會(huì)出現(xiàn)特征信息丟失以及識(shí)別效果不佳的情況。如將單一特征應(yīng)用在多類目標(biāo)識(shí)別上容易使某一類別目標(biāo)識(shí)別準(zhǔn)確性降低。因此在多目標(biāo)識(shí)別分類的過程中采用多特征融合方案可以有效提高識(shí)別率。
在多目標(biāo)檢測(cè)與識(shí)別領(lǐng)域中,文獻(xiàn)[6]以三種飛機(jī)模型作為待識(shí)別目標(biāo),采用級(jí)聯(lián)神經(jīng)網(wǎng)絡(luò)對(duì)真實(shí)場(chǎng)景中的多目標(biāo)進(jìn)行分類,實(shí)驗(yàn)對(duì)于三種類型的飛機(jī)有很好的識(shí)別效果,但對(duì)其他類別目標(biāo)識(shí)別的準(zhǔn)確性不高。文獻(xiàn)[7]設(shè)計(jì)了一種基于多特征的光學(xué)遙感圖像多目標(biāo)識(shí)別算法,首先提取了三種具有平移、旋轉(zhuǎn)和尺度不變性的特征,分別用支持向量機(jī)進(jìn)行識(shí)別并且將識(shí)別概率進(jìn)行決策融合。該算法可實(shí)現(xiàn)4種目標(biāo)的識(shí)別。由于不同分類器與不同特征的適應(yīng)性存在差異,只用一種分類器進(jìn)行分類融合的準(zhǔn)確率難以進(jìn)一步提高。
綜上所述,文中提出一種多特征多分類器決策級(jí)融合的多目標(biāo)識(shí)別算法,在特征提取過程中提取了2種具有較強(qiáng)平移、縮放不變性的Hog特征[8]和Zernike特征[9],并分別用BP神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)(SVM)、隨機(jī)森林(RF)三種分類器進(jìn)行分類,并在決策級(jí)進(jìn)行概率融合。經(jīng)多次實(shí)驗(yàn)該方法對(duì)多目標(biāo)的識(shí)別實(shí)現(xiàn)簡(jiǎn)單,并且取得了令人滿意的識(shí)別結(jié)果。
該算法的整體框架如圖1所示。
圖1 算法流程
算法步驟如下:
(1)特征提取。將進(jìn)行實(shí)驗(yàn)的4類光學(xué)遙感圖像分為訓(xùn)練集和測(cè)試集,分別提取經(jīng)過旋轉(zhuǎn)校正后的Hog特征和Zernike特征,使提取的兩種特征具有目標(biāo)的平移、縮放和旋轉(zhuǎn)的不變性:
(2)訓(xùn)練分類器:2種特征分別與3種適應(yīng)性較好的分類器進(jìn)行交叉訓(xùn)練。
(3)將測(cè)試集的特征分別送入已經(jīng)訓(xùn)練好的分類器得到單一特征的輸出概率,進(jìn)行決策級(jí)的線性概率融合,得到融合結(jié)果。
特征提取是目標(biāo)分類識(shí)別中最為重要的一步,特征提取效果的好壞將在很大程度上決定實(shí)驗(yàn)效果。文中選擇能夠適應(yīng)光學(xué)遙感圖像目標(biāo)識(shí)別的平移、縮放不變性的2種特征:Hog特征和Zernike特征。
由于遙感圖像目標(biāo)通常存在方向、尺度、旋轉(zhuǎn)、平移等差異性較大的問題,且在外界環(huán)境中還存在背景復(fù)雜程度不同、光照強(qiáng)度不同等因素的干擾,因此對(duì)特征選擇提出了較高的要求。方向梯度直方圖(Hog)特征,是目前計(jì)算機(jī)視覺、模式識(shí)別領(lǐng)域很常用的特征。Hog能夠較好地捕捉遙感圖像中的局部形狀信息,對(duì)縮放、平移以及光照強(qiáng)度變換都有很好的不變性。
首先針對(duì)Hog特征不具有旋轉(zhuǎn)不變性的問題,對(duì)數(shù)據(jù)庫中的圖像都按照主軸方向進(jìn)行旋轉(zhuǎn),將處理后的圖像進(jìn)行Hog特征的提取,就得到了方向統(tǒng)一的Hog特征。整個(gè)特征提取的過程如下:
(1)將數(shù)據(jù)庫中的圖像進(jìn)行灰度化、二值化等預(yù)處理,然后將處理過的圖像進(jìn)行PCA求出主軸方向,再將原圖像進(jìn)行主軸方向旋轉(zhuǎn),這樣就得到了主方向旋轉(zhuǎn)后的數(shù)據(jù)圖像。整體旋轉(zhuǎn)過程如圖2所示。
圖2 PCA提取圖像主軸方向并旋轉(zhuǎn)
(2)計(jì)算圖像梯度。
首先用[1,0,1]梯度算子對(duì)原圖像做卷積,得到水平方向梯度分量,再用[1,0,-1]梯度算子對(duì)原圖像做卷積,得到豎直方向梯度分量,再分別計(jì)算圖像橫坐標(biāo)和縱坐標(biāo)的方向梯度,計(jì)算梯度方向的值。圖像中像素點(diǎn)(x,y)的梯度為:
(1)
其中,Gx(x,y),Gy(x,y),H(x,y)分別表示像素點(diǎn)(x,y)處的水平方向梯度與垂直方向梯度和像素值。像素點(diǎn)(x,y)處的梯度幅值和梯度方向分別為:
(2)
(3)為每個(gè)細(xì)胞單元建立其梯度方向直方圖。
先將圖像分割為若干個(gè)單元格cell,然后采用不同的bin的直方圖來統(tǒng)計(jì)每個(gè)單元格的梯度信息,其中上一步所求的梯度大小信息作為投影的權(quán)值。然后把每個(gè)細(xì)胞組合成大的塊(block),目的是對(duì)梯度強(qiáng)度做歸一化處理,歸一化處理能進(jìn)一步對(duì)光照、陰影和邊緣信息進(jìn)行壓縮。
經(jīng)過上述步驟就可以得到Hog描述子。生成的Hog描述子,樣本總數(shù)為m,目標(biāo)的像素大小為100*100。由于采樣過程中每個(gè)字區(qū)域的大小、梯度直方圖劃分角度的個(gè)數(shù)(bin)不同,都會(huì)對(duì)提取特征的效果有不同影響。此次實(shí)驗(yàn)每個(gè)block大小設(shè)置為8*8,cell大小為8*8,1個(gè)cell的梯度直方圖化成12個(gè)方向(bin),計(jì)算每個(gè)cell中單個(gè)像素的梯度并統(tǒng)計(jì)每個(gè)cell的梯度直方圖,這樣對(duì)每幅圖片就形成了一個(gè)768維的Hog特征描述子。
Zernike矩可以構(gòu)造任意高階矩,其中低階矩能夠體現(xiàn)全局特征,高階矩更能突出細(xì)節(jié)特征。由于其具有旋轉(zhuǎn)不變性,且對(duì)圖像平移、縮放也有良好的適應(yīng)性,因此廣泛應(yīng)用于光學(xué)遙感圖像特征提取中。Zernike多項(xiàng)式有奇數(shù)和偶數(shù)之分,若為奇數(shù),則:
(3)
若為偶數(shù),則:
(4)
徑向多項(xiàng)式為:
其中,m、n為非負(fù)整數(shù)且m>n;φ為方位角;ρ(0≤ρ≤1)為半徑。Zernike收斂于[-1,1]之間。
Zernike特征提取過程大體如下:
(1)選擇參數(shù)時(shí),需要確定參數(shù)n,m大小。選擇的(n,m)分別為:(1,-1),(1,1),(2,-2),(2,0),(2,2),(3,-3),(3,-1),(3,1),(3,3),(4,-4),(4,-2),(4,0),(4,2),(4,4),(5,-5),(5,-3),(5,-1),(5,1),(5,3),(5,5)。得到的Zernike矩為復(fù)數(shù),因此提取兩個(gè)特征即幅值特征和相位特征,因此共40個(gè)特征。
(2)考慮到特征維數(shù)較高,對(duì)其進(jìn)行PCA降維,降維后為17個(gè)主要特征,即提取了一個(gè)17維的Zernike特征。
支持向量機(jī)[10-11]在解決非線性及高維特征特別是在解決小樣本的問題中表現(xiàn)出很多優(yōu)勢(shì)。它是一種分類器模型,原理是尋找一個(gè)超平面對(duì)樣本進(jìn)行分割,分割的原則是間隔最大化,并最終轉(zhuǎn)化為一個(gè)凸二次規(guī)劃問題來求解,具有通用性、魯棒性、有效性,計(jì)算簡(jiǎn)單且理論完善等優(yōu)點(diǎn)。
通常支持向量機(jī)應(yīng)用在二分類問題的判別中,文中采用一對(duì)一分類法,該方法是兩種不同類別圖像使用一個(gè)分類器,即將訓(xùn)練集構(gòu)造成為T=p(p-1)/2個(gè)分類器(p個(gè)不同類別),最終求得T個(gè)判別函數(shù)。根據(jù)判別函數(shù),對(duì)待分類目標(biāo)進(jìn)行投票,最終得票最多的類別即作為判別結(jié)果。當(dāng)?shù)闷毕嗤瑫r(shí),按照標(biāo)簽較小的一類作為判別結(jié)果。圖3為四類樣本使用一對(duì)一分類法的構(gòu)造示意圖。當(dāng)對(duì)未知數(shù)據(jù)進(jìn)行實(shí)驗(yàn)時(shí),得票最多的類別即為輸出的識(shí)別結(jié)果。
在圖像處理與模式識(shí)別領(lǐng)域,神經(jīng)網(wǎng)絡(luò)[12-13]是應(yīng)用最為廣泛的算法之一。神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)模仿生物神經(jīng)網(wǎng)絡(luò),其中誤差逆?zhèn)鞑ニ惴?error back propagation)是神經(jīng)網(wǎng)絡(luò)最有代表性的算法。
圖3 一對(duì)一分類法結(jié)構(gòu)示意
BP神經(jīng)網(wǎng)絡(luò)算法的主要思想是從后向前(反向)逐層傳播輸出層的誤差,以間接算出隱層誤差。算法主要分為兩個(gè)階段:第一階段(正向過程)輸入信息從輸入層經(jīng)隱層逐層計(jì)算各單元的輸出值;第二階段(反向傳播過程)輸出誤差逐層向前算出隱層各單元的誤差,并用此誤差修正前層權(quán)值。在反向傳播(BP)算法中通常采用梯度法修正權(quán)值,文中采用三層神經(jīng)網(wǎng)絡(luò),Sigmoid函數(shù)作為輸出函數(shù),輸入層節(jié)點(diǎn)個(gè)數(shù)為17,隱含層節(jié)點(diǎn)個(gè)數(shù)為8,輸出層節(jié)點(diǎn)個(gè)數(shù)為4。
隨機(jī)森林[14-15]是一種半監(jiān)督的集成學(xué)習(xí)分類器,利用boot-shrap重抽樣法對(duì)訓(xùn)練集數(shù)據(jù)進(jìn)行抽樣,并對(duì)每個(gè)boost-strap樣本進(jìn)行建模,得到一組決策樹分類器組合進(jìn)行投票預(yù)測(cè)。隨機(jī)森林的核心是基于Bagging的集成學(xué)習(xí)方法,廣泛應(yīng)用于分類、回歸等問題,具有準(zhǔn)確率高、抗噪能力強(qiáng)、訓(xùn)練速度快等優(yōu)點(diǎn)。且由于訓(xùn)練樣本具有隨機(jī)性,這就使得隨機(jī)森林分類器不容易出現(xiàn)過擬合的情況。處理數(shù)據(jù)可以是高維數(shù)據(jù),也可以是離散型數(shù)據(jù),數(shù)據(jù)集無需標(biāo)準(zhǔn)化,應(yīng)用范圍非常廣泛。隨機(jī)森林算法中基底分類器的訓(xùn)練過程可描述為:
(1)設(shè)定訓(xùn)練樣本數(shù)M,從中有放回地重復(fù)選取M個(gè)樣本構(gòu)成新的訓(xùn)練集。
(2)隨機(jī)選擇特征對(duì)回歸樹的節(jié)點(diǎn)進(jìn)行分裂:假設(shè)共有N個(gè)特征,隨機(jī)選擇n個(gè)特征(n數(shù)目遠(yuǎn)遠(yuǎn)小于N),每棵決策樹上每個(gè)節(jié)點(diǎn)的決定都是基于這些特征確定的,且在整個(gè)分類生長(zhǎng)的過程中,n的值保持不變,每棵樹都會(huì)完整成長(zhǎng)而不進(jìn)行剪枝。
由于文中提取的2種特征維度相差很大,且特征級(jí)融合存在對(duì)異構(gòu)特征適應(yīng)性不好等缺點(diǎn),因此使用決策級(jí)融合策略。該策略通過對(duì)訓(xùn)練集使用3種不同分類器進(jìn)行訓(xùn)練,可以得到不同分類器對(duì)應(yīng)不同特征的識(shí)別概率,決策級(jí)概率融合由以下三步實(shí)現(xiàn):
(1)對(duì)所有樣本提取2種適用于遙感圖像的特征,并且對(duì)訓(xùn)練樣本分別用3種不同分類器進(jìn)行訓(xùn)練;
(2)使用訓(xùn)練好的3種分類器對(duì)測(cè)試樣本進(jìn)行測(cè)試,得出中間識(shí)別概率并進(jìn)行線性概率融合,得出每種特征概率融合后的結(jié)果;
(3)統(tǒng)計(jì)2種不同特征融合后的概率并再次進(jìn)行線性融合,得出多特征多分類器對(duì)應(yīng)每一類別總的判別概率,將輸出結(jié)果最大的一類作為最終的判別結(jié)果。
文中使用自行建立的遙感圖像庫對(duì)提出的算法進(jìn)行測(cè)試。數(shù)據(jù)庫總體分為四個(gè)類別,分別包含飛機(jī)、汽車、油罐、船艦,每類共有74幅圖像,總共包含288(74*4)張圖像,部分圖例如圖4所示。
圖4 數(shù)據(jù)庫的部分目標(biāo)樣本圖像
將數(shù)據(jù)庫分為訓(xùn)練集和測(cè)試集兩部分,訓(xùn)練集每類47幅圖像,共188(47*4)幅圖像,測(cè)試集為每類27幅圖像,共108(27*4)幅圖像。提取Hog特征為8個(gè)cell,8個(gè)block,12個(gè)bin的768維特征。提取的Zernike特征取PCA降維前95%能量為17維度。Zernike與Hog特征對(duì)應(yīng)3種分類器的識(shí)別結(jié)果如表1、表2所示。從表1可以看出,特征為Zernike時(shí),BP神經(jīng)網(wǎng)絡(luò)對(duì)飛機(jī)的識(shí)別率達(dá)到96.30,高于其他3類,而對(duì)汽車的識(shí)別率最低。SVM分類器對(duì)船艦與汽車的識(shí)別率較高,達(dá)到96.30,但是對(duì)飛機(jī)的分類效果卻不是很高。BP神經(jīng)網(wǎng)絡(luò)與SVM分類器存在互補(bǔ)性。隨機(jī)森林分類器的分類效果最好。
表1 Zernike特征3種分類器識(shí)別結(jié)果 %
從表2可以看到,選取Hog特征的三種分類器的識(shí)別率普遍高于Zernike特征,且對(duì)油罐的識(shí)別正確率能達(dá)到百分之百,對(duì)于飛機(jī)類別的識(shí)別準(zhǔn)確率不高。對(duì)比表1和表2可以看出,Zernike特征對(duì)飛機(jī)的識(shí)別率要高于Hog特征,對(duì)油罐的識(shí)別率低于Hog特征,這表明兩種識(shí)別方法存在互補(bǔ)性。
表2 Hog特征3種分類器識(shí)別結(jié)果 %
經(jīng)多次實(shí)驗(yàn),分別測(cè)試了兩種特征在三種分類器識(shí)別的總正確率,如表3所示。
最后將兩種特征分別在三種分類器總體的識(shí)別概率進(jìn)行融合,融合后的識(shí)別結(jié)果如表4所示。
表4 概率融合后識(shí)別率 %
從實(shí)驗(yàn)可以看出,經(jīng)過決策級(jí)融合后的識(shí)別正確率達(dá)到了95.37%,無論是對(duì)單類目標(biāo)的識(shí)別正確率還是總體多類目標(biāo)的識(shí)別正確率都優(yōu)于單特征單分類器的識(shí)別效果,并且對(duì)飛機(jī)等具有較大旋轉(zhuǎn)性目標(biāo)的識(shí)別率達(dá)到100%,大大提高了遙感圖像多類目標(biāo)識(shí)別的準(zhǔn)確性。
提出的多特征多分類器融合的遙感圖像多目標(biāo)識(shí)別方法,從分類器決策級(jí)融合的角度出發(fā),采用概率線性融合的方法,很好地解決了對(duì)不同特征不同分類器適應(yīng)性不同的問題。該算法實(shí)現(xiàn)簡(jiǎn)單,在光學(xué)遙感圖像目標(biāo)分類問題中具有較好的應(yīng)用背景。目前實(shí)驗(yàn)結(jié)果還存在一定誤差,下一步的研究重點(diǎn)將放在決策級(jí)融合的融合方法上,以進(jìn)一步提高目標(biāo)識(shí)別分類的準(zhǔn)確率。