吳嘯天
(西北農(nóng)林科技大學(xué)林學(xué)院,陜西 楊凌 712100)
基于多特征提取和SVM分類器的木材顯微識(shí)別
吳嘯天
(西北農(nóng)林科技大學(xué)林學(xué)院,陜西 楊凌 712100)
將多種不同木材的顯微細(xì)胞圖片進(jìn)行識(shí)別,對(duì)進(jìn)行木材分類研究具有重大意義。通過(guò)利用支持向量機(jī)(SVM),結(jié)合圖像的圖像梯度方向直方圖(HOG)、局部二值模式(LBP)特征以及圖像均值方差,對(duì)小規(guī)模的木材細(xì)胞圖像的識(shí)別分類效果進(jìn)行了實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,SVM分類器結(jié)合多特征融合適的特征向量會(huì)有較好的識(shí)別效果,平均最高識(shí)別率達(dá)到了98.11%。
多特征提取; 支持向量機(jī); 小規(guī)模數(shù)據(jù); 識(shí)別分類; 木材顯微細(xì)胞
木材作為一種天然的、重要的材料,被廣泛地用在家具與家居、樂(lè)器、交通、藝術(shù)品、建筑等行業(yè)。不同樹種的木材性能差異很大,而市場(chǎng)上木材商品種類繁多,很難分辨。傳統(tǒng)的人工識(shí)別方法主要依靠人們的經(jīng)驗(yàn),即根據(jù)細(xì)胞有無(wú)導(dǎo)管,將其分為針葉材(無(wú)導(dǎo)管)和闊葉材(具有導(dǎo)管);然后根據(jù)細(xì)胞上軸向管胞、軸向薄壁組織、樹脂道等特征再將木材進(jìn)行具體分類,對(duì)于闊葉材還要結(jié)合其導(dǎo)管的特征等。這種方式較為感性,往往會(huì)出現(xiàn)誤判和不能識(shí)別的現(xiàn)象[1]。
在圖像分類方面,將圖像的不同特征融合在一起,會(huì)產(chǎn)生更好的分類效果[2]。支持向量機(jī)作為一種有效的分類和統(tǒng)計(jì)學(xué)習(xí)方法,有著有著較為廣泛地研究和利用[3]。唐銀鳳等人通過(guò)融合多特征紋理分類生成紋理查找表并結(jié)合SVM(support vector machine)分類器對(duì)光學(xué)紋理圖像進(jìn)行了分類[4],陳維華運(yùn)用支持向量機(jī)(SVM)實(shí)現(xiàn)了對(duì)音樂(lè)的情感分類[5]。為實(shí)現(xiàn)利用木材顯微圖像及其特征對(duì)不同樹種木材種類的識(shí)別,我們進(jìn)行了探索,報(bào)告如下。
本實(shí)驗(yàn)選用鵝耳櫪(Carpinusturczaninowii)、銀白楊(Populusalba)、元寶槭(Acertruncatum)、冷杉(Abiesfabri)、落葉松(Larixgmelinii)等5種我國(guó)北方常見樹種,顯微照片利用西北農(nóng)林科技大學(xué)木材標(biāo)本實(shí)驗(yàn)室切片拍照,圖像放大40倍(圖1-5);每種木材50幅圖像,其中每種選取40幅作訓(xùn)練樣本,10幅作測(cè)試樣本,每個(gè)樣本像素256×256。
圖1 供試樹種木材纖維顯微照片
不同樹種木材纖維的細(xì)胞上軸向管胞、軸向薄壁組織、樹脂道等顯微特征不同,據(jù)此利用其顯微照片和圖像特征分析技術(shù)進(jìn)行不同樹種木材纖維區(qū)分。
1.2.1 圖像特征指標(biāo)
(1)HOG指標(biāo)
方向梯度直方圖(HOG)最初由Dalal等[6]人提出,反映了圖像不同點(diǎn)位之間像素的梯度,將整個(gè)圖像細(xì)分為多個(gè)小的細(xì)胞單元(cell)進(jìn)行特征提取[7],不從圖像的整體考察特征,而是因此,HOG得到的描述子對(duì)圖像的光學(xué)和幾何形變都保持了很好的不變性。
在HOG特征提取時(shí),首先將圖像經(jīng)行灰度化,然后對(duì)輸入圖像進(jìn)行顏色,計(jì)算每個(gè)像素的梯度,將圖像劃分為小的胞元(cell),計(jì)算每個(gè)cell的梯度直方圖,然后將每幾個(gè)cell組成一個(gè)塊,串聯(lián)所有塊內(nèi)特征即為整幅圖像的特征向量。
本實(shí)驗(yàn)所采用的HOG參數(shù)有歸一化圖像大小為256×256像素,胞元大小為32×32像素,塊大小為64×64像素,采用Sobel算子得到梯度,每個(gè)像素點(diǎn)的梯度在0°~360°內(nèi)分為18級(jí),最終得到的特征維數(shù)為3528維。
(2)LBP指標(biāo)
基本LBP算子是定義在一定區(qū)域內(nèi),中心像素值和其它像素值進(jìn)行比較,結(jié)果標(biāo)記為1或0,這樣就能表征該鄰域的LBP值。Ojala等人[10]對(duì)該算法進(jìn)行了改進(jìn),即令 LBP算子的半徑和像素點(diǎn)個(gè)數(shù)可以為任意的;LBP特征具有灰度不變性和旋轉(zhuǎn)不變性等顯著優(yōu)點(diǎn)[8],并且其計(jì)算簡(jiǎn)單、效果較好,且能結(jié)合圖像的整體特征。
基本LBP算子定義如式(1)所示:
LBPN,R=∑N-1i=0s(gi-gc)2i,s(x)
={1,x≥0,0,xlt;0}
(1)
其中g(shù)i表示第i個(gè)像素的灰度值,gc表示中心像素的灰度值,N為采樣點(diǎn)數(shù),R為區(qū)域半徑。
本實(shí)驗(yàn)中LBP算子運(yùn)算步驟是將歸一化的256×256像素的圖像進(jìn)行分塊,每個(gè)塊大小為32×32像素,在每個(gè)塊內(nèi)再將局部區(qū)域進(jìn)行閾值化處理得到一個(gè)8位二進(jìn)制數(shù),將每一位數(shù)與對(duì)應(yīng)的權(quán)重相乘然后進(jìn)行求和,將結(jié)果進(jìn)行歸一化處理,即可得到該區(qū)域的LBP值,將一個(gè)塊內(nèi)局部區(qū)域的LBP值串聯(lián)起來(lái)即可得到該塊的LBP值,最后所有塊的LBP值串聯(lián)起來(lái)就可以得到整幅圖像的特征向量。
(3)圖像均值和方差
圖像對(duì)比度是指圖像的明亮差異程度,其本質(zhì)是不同像素點(diǎn)之間的差值;方差表征圖像的對(duì)比度,均值表征圖像的整體亮度。本實(shí)驗(yàn)為了排除圖像自身對(duì)比度和亮度的影響,在提取的特征向量中均附加了圖像的均值方差。
1.2.2 圖像整體特征區(qū)分 采用支持向量機(jī)(SVM)方法表征,SVM是由Cortes和Vapnik提出[11],在解決小樣本、非線性及高維數(shù)方面有很大的優(yōu)勢(shì)。SVM求取最優(yōu)分類面的優(yōu)化函數(shù)定義如下:
(2)
式中,x為樣本,n為樣本的個(gè)數(shù),y是類別編號(hào),λi(i=1,2,…,n)是函數(shù)優(yōu)化時(shí)的language系數(shù),相應(yīng)的判別函數(shù)為:
(3)
式中b*是分類的閾值。對(duì)于非線性判別問(wèn)題,可做適當(dāng)?shù)淖儞Q,即將式(2)的優(yōu)化函數(shù)變?yōu)椋?/p>
(4)
(5)
內(nèi)積(Kxi·xj)被稱為核函數(shù)。本實(shí)驗(yàn)使用的是徑向核函數(shù)(radial basis function,RBF)[12]:
(6)
SVM算法有很多改進(jìn)的版本。
采用林智仁(Lin Chih-Jen)等人研發(fā)的LIBSVM軟件進(jìn)行支持向量機(jī)(SVM)計(jì)算。
實(shí)驗(yàn)的環(huán)境是Visual Studio 2013語(yǔ)言編程環(huán)境,使用計(jì)算機(jī)處理器是Inter(R) Core(TM) i5-4200M CPU G410,處理速度為2.50GHz,內(nèi)存為4G。
利用LBP特征對(duì)供試樹種木材顯微的識(shí)別率分別為鵝耳櫟81.81%、元寶槭54.55%、銀白楊90.0%、落葉松90.0%、冷杉100%,其中元寶槭的識(shí)別率最低,冷杉的識(shí)別率最高,其原因可能是部分元寶槭細(xì)胞導(dǎo)管的排列方式與銀白楊相似,提取的圖像特征和銀白楊接近所致;而其它四種識(shí)別率均在80%以上,并且冷杉全部識(shí)別出來(lái),這意味著冷杉顯微圖像的紋理特征明顯。
利用HOG特征對(duì)供試樹種木材顯微的識(shí)別率分別為鵝耳櫟100%、元寶槭81.82%、銀白楊100%、落葉松100%、冷杉100%,元寶槭識(shí)別率最低。和LBP特征相比,利用HOG特征進(jìn)行識(shí)別的效果有了明顯的提高。這說(shuō)明這幾種木材顯微圖像的邊緣和梯度特征很強(qiáng),另外由于HOG特征表征了圖像局部形狀變化,在一定程度上消除了因圖像的平移和旋轉(zhuǎn)帶來(lái)的誤差影響。
利用LBP+HOG特征對(duì)供試5個(gè)樹種木材顯微的識(shí)別率除元寶槭為90.91%外,其余都是100%;元寶槭的識(shí)別率盡管未達(dá)到100%,單分別高于LBP特征識(shí)別率和HOG特征識(shí)別率,說(shuō)明對(duì)于每種木材而言,LBP+HOG特征識(shí)別效果要比單一特征好;由于兩種特征所攜帶的信息量互不相同,因而將二者串聯(lián)起來(lái)可以起到互補(bǔ)的作用,從而提高了每種木材圖像的識(shí)別率。盡管利用混合特征的訓(xùn)練時(shí)間要比單一特征長(zhǎng),但這并不影響實(shí)際使用,因?yàn)槟P椭恍枰?xùn)練一次即可。
表1 不同特征類別的整體識(shí)別率和訓(xùn)練時(shí)間
本研究利用LBP特征對(duì)木材樹種的識(shí)別率平均為83.02%,HOG對(duì)木材樹種的識(shí)別率平均為96.23%,HOG+LBP特征對(duì)木材樹種的識(shí)別率平均為98.11%,將LBP特征和HOG特征融合在一起作為特征向量的效果最佳。本文利用數(shù)字圖像處理技術(shù),提出了一種識(shí)別木材顯微圖像的方法,通過(guò)提取樣本圖像的一些特征如LBP特征[14],HOG特征以及均值方差等,結(jié)合SVM支持向量機(jī)分類器[15],達(dá)到了較好的識(shí)別效果。
圖2 不同樹種識(shí)別率
[1] 汪杭軍. 基于紋理的木材圖像識(shí)別方法研究[D].合肥:中國(guó)科學(xué)技術(shù)大學(xué),2013.
[2] 張斌,高鑫. 一種基于Gabor濾波器組和LBP的多特征聯(lián)合SAR紋理圖像分類方法[J]. 科學(xué)技術(shù)與工程,2010,10(17):4196-4201.
[3] 紀(jì)凱,韓棟. SVM支持向量機(jī)在遙感圖像中的應(yīng)用研究[J]. 湖南城市學(xué)院學(xué)報(bào)(自然科學(xué)版),2016,25(3):114-116.
[4] 唐銀鳳,黃志明,黃榮娟,等.基于多特征提取和SVM分類器的紋理圖像分類[J]. 計(jì)算機(jī)應(yīng)用與軟件,2011,28(6):22-25,46.
[5] 陳維華. 基于支持向量機(jī)(SVM)的音樂(lè)情感分類[J]. 軟件工程,2016,19(12):20-23.
[6] Dalal N, Triggs B. Histograms of oriented gradients for human detection[C]// Computer Vision and Pattern Recognition, 2005. CVPR 2005. IEEE Computer Society Conference on. IEEE, 2005:886-893.
[7] 姚遠(yuǎn),姜志國(guó),張浩鵬. 基于層次化分類器的遙感圖像飛機(jī)目標(biāo)檢測(cè)[J]. 航天返回與遙感,2014,35(5):88-94.
[8] 李嘉頔,陳振學(xué),劉成云. 分塊CS-LBP和加權(quán)PCA的低分辨率人臉識(shí)別[J]. 光電子·激光,2016,27(2):210-216.
[9] Ahonen T, Hadid A, Pietikinen M. Face Recognition with Local Binary Patterns[M]. IEEE Computer Society, 2006.
[11] L(x, λ). A Short SVM (Support Vector Machine) Tutorial. - JP Lewis[J]. 2015.
[12] 劉海偉. 圖像分類與變化檢測(cè)方法的研究與實(shí)現(xiàn)[D]. 北京:北方工業(yè)大學(xué), 2013.
[13] 羅成石. 基于LIBSVM的糧食水分?jǐn)?shù)據(jù)融合研究[J]. 科學(xué)技術(shù)與工程,2012,12(2):292-295.
[14] 多化豫,孫梟雄,袁云梅. 基于圖像處理提高木材識(shí)別準(zhǔn)確性的新方法[J].西北林學(xué)院學(xué)報(bào),2017,32(1):244-247.
[15] 周熊,多化瓊,王振柱,等. 基于圖像處理和SVM探索木材與樹皮的新識(shí)別參數(shù)[J].西北林學(xué)院學(xué)報(bào),2014,29(5):199-202.
WoodMicroscopicRecognitionBasedonFeatureExtractionandSVMClassifiers
WU Xiao-tian
(CollegeofForestry,NorthwestAamp;FUniversity,Yangling,Shaanxi712100)
It is of great significance to study the microscopic cell images of many different woods. By using the support vector machine (SVM), the image gradient direction histogram (HOG), the local binary model (LBP) feature and the image mean variance were applied to the experiment with classification of small-scale wood cell images. The experimental results showed that the SVM classifier has a good recognition effect with the feature vector of multi-feature fusion, and the highest recognition rate at 98.11%.
Multi-feature extraction; SVM; small-scale data; identify and classification; wood cells
S781.1
A
1001-2117(2017)05-0011-04
2017-07-18
吳嘯天(1995-),男,在校本科生。