国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于特征分組融合的可識別分析

2019-11-29 05:14云紅全明德烈
計算機與數(shù)字工程 2019年11期
關(guān)鍵詞:識別率直方圖決策樹

黃 霄 云紅全 徐 力 鞠 雯 明德烈

(1.華中科技大學(xué)自動化學(xué)院多譜信息處理技術(shù)國家級重點實驗室 武漢 430074)(2.宇航智能控制技術(shù)國家級重點實驗室 北京 100854)(3.北京航天自動控制研究所 北京 100854)

1 引言

在高分辨率遙感圖像中,目標(biāo)擁有豐富的特征信息,這為基于遙感圖像的目標(biāo)可識別性分析提供了可能。一般而言,遙感圖像的目標(biāo)主要分為線性目標(biāo)、復(fù)雜結(jié)構(gòu)目標(biāo)和團塊目標(biāo)[1]。由于不同的目標(biāo)類型以及對目標(biāo)描述方法的不同,其所得到的特征在識別性能上也有很大的差異。為了克服單一特征在識別性能上的片面性和局限性,文獻[2]將形狀和顏色兩種特征進行了組合應(yīng)用;文獻[3]融合了顏色、紋理以及GIST 等特征,這些改進都在一定程度上提高了算法的性能。

為綜合各類型特征的優(yōu)勢,實驗以分組融合的方式同時應(yīng)用Gabor、LPQ、HSV、LBP、GIST、HOG 6種特征,并進行特征層面和分類器層面的融合以提高可識別性分析的性能??紤]到高分辨率遙感圖像各類目標(biāo)之間差異較大,本文將主要對遙感圖像中的團塊目標(biāo)(飛機、車輛、船舶等)的可識別性展開研究。

2 特征融合

2.1 基本特征提取

1)HSV顏色直方圖

HSV顏色特征可以比較直觀地描述圖像內(nèi)容,是遙感圖像的一個重要認(rèn)識特征,有著眾多的實踐與證明[4]。HSV 顏色空間是一種基于感知的顏色模型,它把圖像顏色信息分為三個屬性:色調(diào)、飽和度和亮度。為實現(xiàn)HSV 顏色直方圖特征的提取,需將圖像從RGB 轉(zhuǎn)換到HSV。對三個分量執(zhí)行非等間隔的量化:根據(jù)人類視覺的辨別能力,將色調(diào)空間分為8 區(qū)間,飽和度和亮度均分為3 區(qū)間。然后根據(jù)色彩的不同范圍和主觀色彩感知執(zhí)行非等間隔的量化,最后統(tǒng)計其的直方圖分布,完成HSV顏色直方圖特征的提取。

2)Gabor紋理特征

Gabor小波核函數(shù)具有與人類大腦皮層簡單細(xì)胞的二維反射區(qū)相同的特性,它能夠捕捉對應(yīng)空間尺度、空間位置及方向選擇性等局部結(jié)構(gòu)信息,在計算機視覺和圖像分析領(lǐng)域得到廣泛的應(yīng)用[5]。Gabor 濾波器[6]是一個由二維高斯函數(shù)衍生出的復(fù)數(shù)域正弦曲線函數(shù),相當(dāng)于一組帶通濾波器,由其獲得的Gabor 紋理特征是一種不依賴于顏色或亮度的視覺特征,具體提取方法如下:使用5個尺度8個方向的Gabor 濾波器對原始圖像進行Gabor 變換,可以形成40幅圖像紋理表示,再計算這40幅圖像的均值和方差從而得到一個80維的特征向量。

3)LBP紋理特征

LBP(Local Binary Pattern,局部二值模式)是一種用來描述圖像局部紋理特征的算子,它具有旋轉(zhuǎn)不變性和灰度不變性等顯著的優(yōu)點,在遙感圖像的也有著各種應(yīng)用[7]。原始的LBP 算子[8]定義為在3*3 的窗口內(nèi),以窗口中心像素為閾值,將相鄰的8個像素的灰度值與其進行比較,若周圍像素值大于中心像素值,則該像素點的位置被標(biāo)記為1,否則為0。這樣,3*3 鄰域內(nèi)的8 個點經(jīng)比較可產(chǎn)生8 位二進制數(shù),其十進制值即為該像素點的LBP值。特征描述中,以直方圖的形式統(tǒng)計出每個像素點的LBP 數(shù)值,并將其作為整幅圖的LBP 紋理特征向量。

4)LPQ紋理特征

LPQ 算子是一種具有模糊不變性的紋理特征描述算子。對于圖像f(x),M×M 領(lǐng)域Nx采用離散的短時傅立葉變換[9],如式(1)所示:

其中u表示頻率。

局部傅立葉系數(shù)通過4 個頻點u1=[a,0]T,u2=[0,a]T,u3=[a,a]T,u4=[a,-a]T來計算,a 表示很小范圍,a=1/M.對于每個像素位置,通過向量表示。

傅立葉系數(shù)相位可以通過每個部分的實數(shù)和虛數(shù)的符號來表示。

其中g(shù)j是向量G( x )=[Re{ F ( x )},Im{F(x)}]的第j個部分。然后qj對其進行二進制編碼,如式(4)所示:

經(jīng)過LPQ 算子運算后形成LPQ 圖像,然后轉(zhuǎn)化成LPQ直方圖,將其作為特征的表達(dá)。

5)HOG形狀特征

方向梯度直方圖(Histogram of Oriented Gradient,HOG)特征[10]是一種在計算機視覺和圖像處理中用來進行物體檢測的特征描述子。它通過計算和統(tǒng)計圖像局部區(qū)域的梯度方向直方圖來構(gòu)成特征。HOG 特征的主要思想是,在一副圖像中,局部目標(biāo)的表象和形狀能夠被梯度或邊緣的方向密度分布很好地描述,而梯度主要存在于邊緣的地方。HOG 特征的提取主要由四個步驟組成:(1)顏色空間歸一化;(2)梯度計算;(3)梯度方向直方圖;(4)重疊塊直方圖歸一化,最后獲得HOG特征。

6)GIST視覺特征

GIST 特征[11]用以實現(xiàn)對該信息的客觀描述。該特征模擬人的視覺,形成對外部世界的一種空間表示,捕獲圖像中的上下文信息。GIST 特征的實現(xiàn)過程如下:(1)通過多尺度多方向Gabor 濾波器組對場景圖像進行濾波;(2)將濾波后的圖像劃分為n×n 的網(wǎng)格;(3)各個網(wǎng)格采用離散傅里葉變換和窗口傅里葉變換提取GIST 特征;(4)將第(3)步中每個網(wǎng)格中產(chǎn)生的特征值級聯(lián)起來,就得到了整幅圖像的GIST特征。

2.2 基于優(yōu)勢互補的特征分組

1)Gabor_LPQ

Gabor 紋理特征和LPQ 紋理特征都是對圖像紋理的描述。Gabor 紋理特征,在提取目標(biāo)的局部空間和頻率域信息方面具有良好的特性,但存在全局表征能力弱以及特征數(shù)據(jù)維數(shù)冗余的問題。LPQ 紋理特征,可對整個圖像的輪廓進行描述,具有良好的識別結(jié)果。

考慮到Gabor 濾波器的局部優(yōu)勢及LPQ 算子的整體能力,因此聯(lián)合Gabor 紋理特征和LPQ 紋理特征實現(xiàn)互補,完成目標(biāo)可識別性分析[12]。如圖1所示。

圖1 Gabor_LPQ特征處理

2)LBP_HSV

LBP 特征是基于灰度空間的圖像局部紋理特征描述算子,它不隨灰度尺度的變化而變化,在不同光照的影響下魯棒性好,具有良好的灰度不變性和旋轉(zhuǎn)不變性等優(yōu)點。

HSV 顏色直方圖是基于HSV 空間的全局特征,特別適用于難以進行自動分割的圖像,與LBP特征相比具有全局性的特點。

3)HOG_GIST

HOG 提取的是圖像局部輪廓特征,由于它在圖像的局部細(xì)胞單元上進行操作,所以它對圖像幾何形變和光學(xué)形變能保持良好的不變形,這能很好地應(yīng)用到對于物體的檢測。GIST 提取的是圖像的全局特征,二者有一定的互補。

圖2 HSV_LBP特征處理

3 特征分組融合算法

3.1 分類器算法

1)Adaboost分類器

AdaBoost 是一種迭代算法,它被評為數(shù)據(jù)挖掘十大算法之一[13],其核心思想是針對同一個訓(xùn)練集訓(xùn)練不同的分類器,即弱分類器,然后把這些弱分類器集合起來,構(gòu)造一個更強的最終分類器[14]。

算法本身是改變數(shù)據(jù)分布實現(xiàn)的,它根據(jù)每次訓(xùn)練集之中的每個樣本的分類是否正確,以及上次的總體分類的準(zhǔn)確率,來確定每個樣本的權(quán)值。將修改權(quán)值的新數(shù)據(jù)送給下層分類器進行訓(xùn)練,然后將每次訓(xùn)練得到的分類器融合起來,作為最后的決策分類器。

2)決策樹算法

決策樹(decision tree)是一種基本的分類與回歸方法。決策樹模型呈樹形結(jié)構(gòu),在分類問題中,表示基于特征對實例進行分類的過程。它可以認(rèn)為是if-then規(guī)則的集合,也可以認(rèn)為是定義在特征空間與類空間上的條件概率分布。其主要優(yōu)點是模型具有可讀性,分類速度快。學(xué)習(xí)時,利用訓(xùn)練數(shù)據(jù),根據(jù)損失函數(shù)最小化的原則建立決策樹模型。預(yù)測時,對新的數(shù)據(jù),利用決策樹模型進行分類。決策樹學(xué)習(xí)通常包括3 個步驟:特征選擇、決策樹的生成和決策樹的修剪。

決策樹算法很多,例如:ID3 算法[15]、C4.5 算法、CART 算法等。這些算法均采用自上而下的貪婪算法,每個內(nèi)部節(jié)點選擇分類效果最好的屬性來分裂節(jié)點,可以分成兩個或者更多的子節(jié)點,繼續(xù)此過程直到這棵決策樹能夠?qū)⑷康挠?xùn)練數(shù)據(jù)準(zhǔn)確的分類,或所有屬性都被用到為止。

3.2 算法步驟

特征分組融合的可識別性分析實驗主要包括學(xué)習(xí)階段和預(yù)測階段,其主要步驟如下:

1)學(xué)習(xí)階段

(1)選定正負(fù)樣本:選取具有飛機、車輛以及船舶等團塊目標(biāo)的圖片作為訓(xùn)練的正樣本,選取無團塊目標(biāo)的隨機圖像作為訓(xùn)練的負(fù)樣本。正樣本數(shù)為2400個,負(fù)樣本數(shù)為2400個,并以此作為訓(xùn)練集數(shù)據(jù);

(2)針對訓(xùn)練集分別提取Gabor、LPQ、HSV、LBP、GIST、HOG等特征,訓(xùn)練并獲取相應(yīng)的特征組Adaboost分類器;

(3)將分類器模型應(yīng)用于測試數(shù)據(jù),計算并保存其預(yù)測模型中間值,每個測試數(shù)據(jù)對應(yīng)三個分類器的中間值P1,P2,P3,并以此作為其屬性描述;

(4)將分類器的預(yù)測中間值P1,P2,P3作為決策樹算法的輸入屬性進行訓(xùn)練,獲得Gabor_LPQ、HSV_LBP、GIST_HOG三個分類器的融合規(guī)則。

2)預(yù)測流程

(1)提取待分析圖像的Gabor_LPQ 特征、HSV_LBP特征、GIST_HOG特征;

(2)針對不同的特征使用相應(yīng)的Adaboost分類器計算預(yù)測中間值;

(3)將獲得的預(yù)測中間值運用Gabor_LPQ、HSV_LBP、GIST_HOG 三個分類器的融合規(guī)則進行預(yù)測,獲得對應(yīng)的結(jié)果。

圖4 訓(xùn)練流程圖

圖5 預(yù)測流程圖

4 實驗結(jié)果及分析

識別率是正確識別樣本數(shù)與樣本總數(shù)的比值,是衡量識別算法性能的最重要指標(biāo)。實驗通過分別提取Gabor、LPQ、HSV、LBP、GIST、HOG 等6 種特征,并將其得到的識別率與Gabor_LPQ、HSV_LBP、GIST_HOG 等3 種融合特征的識別率進行對比,分析特征融合對識別率的影響。然后,在此基礎(chǔ)上,將三種融合特征分類器的分析結(jié)果與三種分類器融合的結(jié)果進行對照分析,得到分類器融合對識別率的提升效果。

利用單個特征進行Adaboost 學(xué)習(xí)和分類預(yù)測的結(jié)果如下圖所示,其中橫軸表示迭代的輪數(shù),縱軸表示當(dāng)前分類器在測試集上的識別正確率,實驗過程中用到了三種Adaboost 方法,分別為Gentle Adaboost、Modest Adaboost以及Real Adaboost。

圖6 Gabor adaboost迭代提升圖

圖7 LPQ adaboost迭代提升圖

圖8 HSV Adaboost迭代提升圖

圖9 LBP Adaboost迭代提升圖

圖10 GIST Adaboost迭代提升圖

圖11 HOG Adaboost迭代提升圖

通過分析可知,Gentle Adaboost 和Real Adaboost 的適應(yīng)能力較強,性能比Modest Adaboost 更穩(wěn)定,以下對比實驗將僅使用Real Adaboost方法進行。

為了進一步分析特征組合對識別率的影響,分別將Gabor 和LPQ 特征,HSV 和LBP 特征,GIST 和HOG 特征進行融合,然后選用Real Adaboost 方法實現(xiàn)訓(xùn)練學(xué)習(xí)。如圖12~14 所示,分別為Gabor_LPQ、HSV_LBP、GIST_HOG 融合特征迭代訓(xùn)練提升圖。

圖12 Gabor_LPQ融合特征迭代訓(xùn)練提升圖

圖13 HSV_LBP融合特征迭代訓(xùn)練提升圖

圖14 GIST_HOG融合特征迭代訓(xùn)練提升圖

通過分析可知,三組融合特征得到的識別率均高于利用單一特征進行學(xué)習(xí)的識別率,即得到結(jié)論:基于優(yōu)勢互補的特征融合有利于提高Adaboost算法的識別率。

最后,使用CART 決策樹算法將Gabor_LPQ、HSV_LBP、GIST_HOG 三個分類器進行融合,并把得到的分析結(jié)果與上述實驗進行對比。表1 記錄了6 個單特征和3 組分組融合特征使用Real Adaboost方法時,第200輪以及迭代過程中最高的識別率。最后一行的數(shù)據(jù)為已得的三個分類器進行CART融合時在同一測試集上的識別率。

表1 單個、分組以及分類器融合識別率對比表

5 結(jié)語

實驗結(jié)果表明,基于多特征分組融合的可識別算法的識別率高于單特征或組合特征判別算法,該算法能夠同時綜合Gabor_LPQ、HSV_LBP、GIST_HOG 特征的優(yōu)點,將目標(biāo)識別率提高到97%以上。

猜你喜歡
識別率直方圖決策樹
ADC直方圖分析在頸部淋巴結(jié)轉(zhuǎn)移性鱗癌鑒別診斷中的價值
基于差分隱私的高精度直方圖發(fā)布方法
簡述一種基于C4.5的隨機決策樹集成分類算法設(shè)計
檔案數(shù)字化過程中OCR技術(shù)的應(yīng)用分析
例析頻率分布直方圖
中考頻數(shù)分布直方圖題型展示
決策樹學(xué)習(xí)的剪枝方法
基于PCA與MLP感知器的人臉圖像辨識技術(shù)
科技文檔中數(shù)學(xué)表達(dá)式的結(jié)構(gòu)分析與識別
人工智能現(xiàn)狀和發(fā)展