多分類器融合的光學(xué)遙感圖像目標(biāo)識(shí)別算法

2019-11-18 05:22姬曉飛石宇辰

計(jì)算機(jī)技術(shù)與發(fā)展 2019年11期

姬曉飛，石宇辰

(沈陽航空航天大學(xué) 自動(dòng)化學(xué)院，遼寧沈陽 110136)

1 概述

光學(xué)遙感圖像的目標(biāo)檢測(cè)與識(shí)別一直是遙感圖像處理與分析的關(guān)鍵技術(shù)[1]。光學(xué)遙感圖像目標(biāo)檢測(cè)與識(shí)別技術(shù)可分為基于單目標(biāo)和基于多目標(biāo)2個(gè)方向。文獻(xiàn)[2]提出將深度學(xué)習(xí)技術(shù)應(yīng)用在飛機(jī)檢測(cè)中，該方法主要是通過建立深度信念網(wǎng)絡(luò)及卷積神經(jīng)網(wǎng)絡(luò)對(duì)飛機(jī)結(jié)構(gòu)模型進(jìn)行檢測(cè)。文獻(xiàn)[3]提出一種基于自組織特征映射(self-organizing feature map，SOFM)網(wǎng)絡(luò)模型的紋理特征方法，該方法通過提取光學(xué)遙感圖像中局部的紋理特征來表示圖像整體灰度分布特性，對(duì)單一的飛機(jī)、橋梁目標(biāo)的識(shí)別率較高，但適用范圍較小。文獻(xiàn)[4]提出了一種圓周頻率濾波法，利用了飛機(jī)在光學(xué)遙感圖像的形狀特征與灰度特征，用圓周頻率濾波器對(duì)圖像進(jìn)行預(yù)處理，并保留濾波后幅值大的點(diǎn)為飛機(jī)中心，再使用區(qū)域生長(zhǎng)式聚類確定飛機(jī)位置。經(jīng)實(shí)驗(yàn)總共65架飛機(jī)正確識(shí)別59架，該算法僅對(duì)飛機(jī)取得了較好的識(shí)別效果。文獻(xiàn)[5]設(shè)計(jì)了一種復(fù)雜背景下光學(xué)遙感圖像船艦?zāi)繕?biāo)檢測(cè)方法，該方法借鑒了人眼視覺注意機(jī)制的特征，結(jié)合雜波率系數(shù)，并且通過模擬人眼視覺感知的Gabor濾波器，實(shí)現(xiàn)了在復(fù)雜背景下對(duì)船艦的檢測(cè)，但耗時(shí)較長(zhǎng)，通用性不強(qiáng)。以上研究表明，在單一目標(biāo)檢測(cè)識(shí)別的過程中，某一特征通常只對(duì)特定目標(biāo)識(shí)別能力較強(qiáng)，而將同一特征應(yīng)用在不同待識(shí)別目標(biāo)的過程中，通常會(huì)出現(xiàn)特征信息丟失以及識(shí)別效果不佳的情況。如將單一特征應(yīng)用在多類目標(biāo)識(shí)別上容易使某一類別目標(biāo)識(shí)別準(zhǔn)確性降低。因此在多目標(biāo)識(shí)別分類的過程中采用多特征融合方案可以有效提高識(shí)別率。

在多目標(biāo)檢測(cè)與識(shí)別領(lǐng)域中，文獻(xiàn)[6]以三種飛機(jī)模型作為待識(shí)別目標(biāo)，采用級(jí)聯(lián)神經(jīng)網(wǎng)絡(luò)對(duì)真實(shí)場(chǎng)景中的多目標(biāo)進(jìn)行分類，實(shí)驗(yàn)對(duì)于三種類型的飛機(jī)有很好的識(shí)別效果，但對(duì)其他類別目標(biāo)識(shí)別的準(zhǔn)確性不高。文獻(xiàn)[7]設(shè)計(jì)了一種基于多特征的光學(xué)遙感圖像多目標(biāo)識(shí)別算法，首先提取了三種具有平移、旋轉(zhuǎn)和尺度不變性的特征，分別用支持向量機(jī)進(jìn)行識(shí)別并且將識(shí)別概率進(jìn)行決策融合。該算法可實(shí)現(xiàn)4種目標(biāo)的識(shí)別。由于不同分類器與不同特征的適應(yīng)性存在差異，只用一種分類器進(jìn)行分類融合的準(zhǔn)確率難以進(jìn)一步提高。

綜上所述，文中提出一種多特征多分類器決策級(jí)融合的多目標(biāo)識(shí)別算法，在特征提取過程中提取了2種具有較強(qiáng)平移、縮放不變性的Hog特征[8]和Zernike特征[9]，并分別用BP神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)(SVM)、隨機(jī)森林(RF)三種分類器進(jìn)行分類，并在決策級(jí)進(jìn)行概率融合。經(jīng)多次實(shí)驗(yàn)該方法對(duì)多目標(biāo)的識(shí)別實(shí)現(xiàn)簡(jiǎn)單，并且取得了令人滿意的識(shí)別結(jié)果。

該算法的整體框架如圖1所示。

圖1 算法流程

算法步驟如下：

(1)特征提取。將進(jìn)行實(shí)驗(yàn)的4類光學(xué)遙感圖像分為訓(xùn)練集和測(cè)試集，分別提取經(jīng)過旋轉(zhuǎn)校正后的Hog特征和Zernike特征，使提取的兩種特征具有目標(biāo)的平移、縮放和旋轉(zhuǎn)的不變性：

(2)訓(xùn)練分類器：2種特征分別與3種適應(yīng)性較好的分類器進(jìn)行交叉訓(xùn)練。

(3)將測(cè)試集的特征分別送入已經(jīng)訓(xùn)練好的分類器得到單一特征的輸出概率，進(jìn)行決策級(jí)的線性概率融合，得到融合結(jié)果。

2 多特征提取

特征提取是目標(biāo)分類識(shí)別中最為重要的一步，特征提取效果的好壞將在很大程度上決定實(shí)驗(yàn)效果。文中選擇能夠適應(yīng)光學(xué)遙感圖像目標(biāo)識(shí)別的平移、縮放不變性的2種特征:Hog特征和Zernike特征。

2.1 Hog特征

由于遙感圖像目標(biāo)通常存在方向、尺度、旋轉(zhuǎn)、平移等差異性較大的問題，且在外界環(huán)境中還存在背景復(fù)雜程度不同、光照強(qiáng)度不同等因素的干擾，因此對(duì)特征選擇提出了較高的要求。方向梯度直方圖(Hog)特征，是目前計(jì)算機(jī)視覺、模式識(shí)別領(lǐng)域很常用的特征。Hog能夠較好地捕捉遙感圖像中的局部形狀信息，對(duì)縮放、平移以及光照強(qiáng)度變換都有很好的不變性。

首先針對(duì)Hog特征不具有旋轉(zhuǎn)不變性的問題，對(duì)數(shù)據(jù)庫中的圖像都按照主軸方向進(jìn)行旋轉(zhuǎn)，將處理后的圖像進(jìn)行Hog特征的提取，就得到了方向統(tǒng)一的Hog特征。整個(gè)特征提取的過程如下:

(1)將數(shù)據(jù)庫中的圖像進(jìn)行灰度化、二值化等預(yù)處理，然后將處理過的圖像進(jìn)行PCA求出主軸方向，再將原圖像進(jìn)行主軸方向旋轉(zhuǎn)，這樣就得到了主方向旋轉(zhuǎn)后的數(shù)據(jù)圖像。整體旋轉(zhuǎn)過程如圖2所示。

圖2 PCA提取圖像主軸方向并旋轉(zhuǎn)

(2)計(jì)算圖像梯度。

首先用[1,0,1]梯度算子對(duì)原圖像做卷積，得到水平方向梯度分量，再用[1,0,-1]梯度算子對(duì)原圖像做卷積，得到豎直方向梯度分量，再分別計(jì)算圖像橫坐標(biāo)和縱坐標(biāo)的方向梯度，計(jì)算梯度方向的值。圖像中像素點(diǎn)(x,y)的梯度為：

(1)

其中，Gx(x,y)，Gy(x,y)，H(x,y)分別表示像素點(diǎn)(x,y)處的水平方向梯度與垂直方向梯度和像素值。像素點(diǎn)(x,y)處的梯度幅值和梯度方向分別為：

(2)

(3)為每個(gè)細(xì)胞單元建立其梯度方向直方圖。

先將圖像分割為若干個(gè)單元格cell，然后采用不同的bin的直方圖來統(tǒng)計(jì)每個(gè)單元格的梯度信息，其中上一步所求的梯度大小信息作為投影的權(quán)值。然后把每個(gè)細(xì)胞組合成大的塊(block),目的是對(duì)梯度強(qiáng)度做歸一化處理，歸一化處理能進(jìn)一步對(duì)光照、陰影和邊緣信息進(jìn)行壓縮。

經(jīng)過上述步驟就可以得到Hog描述子。生成的Hog描述子，樣本總數(shù)為m,目標(biāo)的像素大小為100*100。由于采樣過程中每個(gè)字區(qū)域的大小、梯度直方圖劃分角度的個(gè)數(shù)(bin)不同，都會(huì)對(duì)提取特征的效果有不同影響。此次實(shí)驗(yàn)每個(gè)block大小設(shè)置為8*8，cell大小為8*8,1個(gè)cell的梯度直方圖化成12個(gè)方向(bin),計(jì)算每個(gè)cell中單個(gè)像素的梯度并統(tǒng)計(jì)每個(gè)cell的梯度直方圖，這樣對(duì)每幅圖片就形成了一個(gè)768維的Hog特征描述子。

2.2 Zernike矩特征

Zernike矩可以構(gòu)造任意高階矩，其中低階矩能夠體現(xiàn)全局特征，高階矩更能突出細(xì)節(jié)特征。由于其具有旋轉(zhuǎn)不變性，且對(duì)圖像平移、縮放也有良好的適應(yīng)性，因此廣泛應(yīng)用于光學(xué)遙感圖像特征提取中。Zernike多項(xiàng)式有奇數(shù)和偶數(shù)之分，若為奇數(shù)，則：

(3)

若為偶數(shù)，則：

(4)

徑向多項(xiàng)式為：

其中，m、n為非負(fù)整數(shù)且m>n；φ為方位角；ρ(0≤ρ≤1)為半徑。Zernike收斂于[-1,1]之間。

Zernike特征提取過程大體如下：

(1)選擇參數(shù)時(shí)，需要確定參數(shù)n,m大小。選擇的(n，m)分別為:(1，-1),(1，1)，(2，-2)，(2，0)，(2，2),(3，-3)，(3，-1)，(3，1)，(3，3)，(4，-4)，(4，-2)，(4，0)，(4，2)，(4，4)，(5，-5)，(5，-3)，(5，-1)，(5，1)，(5，3)，(5，5)。得到的Zernike矩為復(fù)數(shù)，因此提取兩個(gè)特征即幅值特征和相位特征，因此共40個(gè)特征。

(2)考慮到特征維數(shù)較高，對(duì)其進(jìn)行PCA降維，降維后為17個(gè)主要特征，即提取了一個(gè)17維的Zernike特征。

3 識(shí)別算法

3.1 支持向量機(jī)

支持向量機(jī)[10-11]在解決非線性及高維特征特別是在解決小樣本的問題中表現(xiàn)出很多優(yōu)勢(shì)。它是一種分類器模型，原理是尋找一個(gè)超平面對(duì)樣本進(jìn)行分割，分割的原則是間隔最大化，并最終轉(zhuǎn)化為一個(gè)凸二次規(guī)劃問題來求解，具有通用性、魯棒性、有效性，計(jì)算簡(jiǎn)單且理論完善等優(yōu)點(diǎn)。

通常支持向量機(jī)應(yīng)用在二分類問題的判別中，文中采用一對(duì)一分類法，該方法是兩種不同類別圖像使用一個(gè)分類器，即將訓(xùn)練集構(gòu)造成為T=p(p-1)/2個(gè)分類器(p個(gè)不同類別)，最終求得T個(gè)判別函數(shù)。根據(jù)判別函數(shù)，對(duì)待分類目標(biāo)進(jìn)行投票，最終得票最多的類別即作為判別結(jié)果。當(dāng)?shù)闷毕嗤瑫r(shí)，按照標(biāo)簽較小的一類作為判別結(jié)果。圖3為四類樣本使用一對(duì)一分類法的構(gòu)造示意圖。當(dāng)對(duì)未知數(shù)據(jù)進(jìn)行實(shí)驗(yàn)時(shí)，得票最多的類別即為輸出的識(shí)別結(jié)果。

3.2 BP神經(jīng)網(wǎng)絡(luò)

在圖像處理與模式識(shí)別領(lǐng)域，神經(jīng)網(wǎng)絡(luò)[12-13]是應(yīng)用最為廣泛的算法之一。神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)模仿生物神經(jīng)網(wǎng)絡(luò)，其中誤差逆?zhèn)鞑ニ惴?error back propagation)是神經(jīng)網(wǎng)絡(luò)最有代表性的算法。

圖3 一對(duì)一分類法結(jié)構(gòu)示意

BP神經(jīng)網(wǎng)絡(luò)算法的主要思想是從后向前(反向)逐層傳播輸出層的誤差，以間接算出隱層誤差。算法主要分為兩個(gè)階段:第一階段(正向過程)輸入信息從輸入層經(jīng)隱層逐層計(jì)算各單元的輸出值;第二階段(反向傳播過程)輸出誤差逐層向前算出隱層各單元的誤差，并用此誤差修正前層權(quán)值。在反向傳播(BP)算法中通常采用梯度法修正權(quán)值，文中采用三層神經(jīng)網(wǎng)絡(luò)，Sigmoid函數(shù)作為輸出函數(shù)，輸入層節(jié)點(diǎn)個(gè)數(shù)為17，隱含層節(jié)點(diǎn)個(gè)數(shù)為8，輸出層節(jié)點(diǎn)個(gè)數(shù)為4。

3.3 隨機(jī)森林分類器

隨機(jī)森林[14-15]是一種半監(jiān)督的集成學(xué)習(xí)分類器，利用boot-shrap重抽樣法對(duì)訓(xùn)練集數(shù)據(jù)進(jìn)行抽樣，并對(duì)每個(gè)boost-strap樣本進(jìn)行建模，得到一組決策樹分類器組合進(jìn)行投票預(yù)測(cè)。隨機(jī)森林的核心是基于Bagging的集成學(xué)習(xí)方法，廣泛應(yīng)用于分類、回歸等問題，具有準(zhǔn)確率高、抗噪能力強(qiáng)、訓(xùn)練速度快等優(yōu)點(diǎn)。且由于訓(xùn)練樣本具有隨機(jī)性，這就使得隨機(jī)森林分類器不容易出現(xiàn)過擬合的情況。處理數(shù)據(jù)可以是高維數(shù)據(jù)，也可以是離散型數(shù)據(jù)，數(shù)據(jù)集無需標(biāo)準(zhǔn)化，應(yīng)用范圍非常廣泛。隨機(jī)森林算法中基底分類器的訓(xùn)練過程可描述為：

(1)設(shè)定訓(xùn)練樣本數(shù)M，從中有放回地重復(fù)選取M個(gè)樣本構(gòu)成新的訓(xùn)練集。

(2)隨機(jī)選擇特征對(duì)回歸樹的節(jié)點(diǎn)進(jìn)行分裂:假設(shè)共有N個(gè)特征，隨機(jī)選擇n個(gè)特征(n數(shù)目遠(yuǎn)遠(yuǎn)小于N)，每棵決策樹上每個(gè)節(jié)點(diǎn)的決定都是基于這些特征確定的，且在整個(gè)分類生長(zhǎng)的過程中，n的值保持不變,每棵樹都會(huì)完整成長(zhǎng)而不進(jìn)行剪枝。

3.4決策級(jí)融合

由于文中提取的2種特征維度相差很大，且特征級(jí)融合存在對(duì)異構(gòu)特征適應(yīng)性不好等缺點(diǎn)，因此使用決策級(jí)融合策略。該策略通過對(duì)訓(xùn)練集使用3種不同分類器進(jìn)行訓(xùn)練，可以得到不同分類器對(duì)應(yīng)不同特征的識(shí)別概率，決策級(jí)概率融合由以下三步實(shí)現(xiàn)：

(1)對(duì)所有樣本提取2種適用于遙感圖像的特征，并且對(duì)訓(xùn)練樣本分別用3種不同分類器進(jìn)行訓(xùn)練；

(2)使用訓(xùn)練好的3種分類器對(duì)測(cè)試樣本進(jìn)行測(cè)試，得出中間識(shí)別概率并進(jìn)行線性概率融合，得出每種特征概率融合后的結(jié)果;

(3)統(tǒng)計(jì)2種不同特征融合后的概率并再次進(jìn)行線性融合，得出多特征多分類器對(duì)應(yīng)每一類別總的判別概率，將輸出結(jié)果最大的一類作為最終的判別結(jié)果。

4 實(shí)驗(yàn)結(jié)果

文中使用自行建立的遙感圖像庫對(duì)提出的算法進(jìn)行測(cè)試。數(shù)據(jù)庫總體分為四個(gè)類別，分別包含飛機(jī)、汽車、油罐、船艦，每類共有74幅圖像，總共包含288(74*4)張圖像，部分圖例如圖4所示。

圖4 數(shù)據(jù)庫的部分目標(biāo)樣本圖像

4.1 3種分類器對(duì)應(yīng)2種特征測(cè)試結(jié)果

將數(shù)據(jù)庫分為訓(xùn)練集和測(cè)試集兩部分，訓(xùn)練集每類47幅圖像，共188(47*4)幅圖像，測(cè)試集為每類27幅圖像，共108(27*4)幅圖像。提取Hog特征為8個(gè)cell，8個(gè)block，12個(gè)bin的768維特征。提取的Zernike特征取PCA降維前95%能量為17維度。Zernike與Hog特征對(duì)應(yīng)3種分類器的識(shí)別結(jié)果如表1、表2所示。從表1可以看出，特征為Zernike時(shí)，BP神經(jīng)網(wǎng)絡(luò)對(duì)飛機(jī)的識(shí)別率達(dá)到96.30，高于其他3類，而對(duì)汽車的識(shí)別率最低。SVM分類器對(duì)船艦與汽車的識(shí)別率較高，達(dá)到96.30，但是對(duì)飛機(jī)的分類效果卻不是很高。BP神經(jīng)網(wǎng)絡(luò)與SVM分類器存在互補(bǔ)性。隨機(jī)森林分類器的分類效果最好。

表1 Zernike特征3種分類器識(shí)別結(jié)果 %

從表2可以看到，選取Hog特征的三種分類器的識(shí)別率普遍高于Zernike特征，且對(duì)油罐的識(shí)別正確率能達(dá)到百分之百，對(duì)于飛機(jī)類別的識(shí)別準(zhǔn)確率不高。對(duì)比表1和表2可以看出，Zernike特征對(duì)飛機(jī)的識(shí)別率要高于Hog特征，對(duì)油罐的識(shí)別率低于Hog特征，這表明兩種識(shí)別方法存在互補(bǔ)性。

表2 Hog特征3種分類器識(shí)別結(jié)果 %

4.2 多分類器決策級(jí)融合結(jié)果

經(jīng)多次實(shí)驗(yàn)，分別測(cè)試了兩種特征在三種分類器識(shí)別的總正確率,如表3所示。

最后將兩種特征分別在三種分類器總體的識(shí)別概率進(jìn)行融合，融合后的識(shí)別結(jié)果如表4所示。

表4 概率融合后識(shí)別率 %

從實(shí)驗(yàn)可以看出，經(jīng)過決策級(jí)融合后的識(shí)別正確率達(dá)到了95.37%，無論是對(duì)單類目標(biāo)的識(shí)別正確率還是總體多類目標(biāo)的識(shí)別正確率都優(yōu)于單特征單分類器的識(shí)別效果，并且對(duì)飛機(jī)等具有較大旋轉(zhuǎn)性目標(biāo)的識(shí)別率達(dá)到100%，大大提高了遙感圖像多類目標(biāo)識(shí)別的準(zhǔn)確性。

5 結(jié)束語

提出的多特征多分類器融合的遙感圖像多目標(biāo)識(shí)別方法，從分類器決策級(jí)融合的角度出發(fā)，采用概率線性融合的方法，很好地解決了對(duì)不同特征不同分類器適應(yīng)性不同的問題。該算法實(shí)現(xiàn)簡(jiǎn)單，在光學(xué)遙感圖像目標(biāo)分類問題中具有較好的應(yīng)用背景。目前實(shí)驗(yàn)結(jié)果還存在一定誤差，下一步的研究重點(diǎn)將放在決策級(jí)融合的融合方法上，以進(jìn)一步提高目標(biāo)識(shí)別分類的準(zhǔn)確率。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡