謝林波,余紹軍,周國英,李 虹
(中南林業(yè)科技大學(xué),湖南 長沙 410004)
基于BoW模型的油茶害蟲圖像分類
謝林波,余紹軍,周國英,李 虹
(中南林業(yè)科技大學(xué),湖南 長沙 410004)
針對目前圖像識別在油茶害蟲這個領(lǐng)域的應(yīng)用中存在的問題,提出一種基于BoW模型的油茶害蟲圖像識別的方法。首先對油茶害蟲圖像進行SIFT特征提取,然后通過BoW模型來描述各幅圖像,針對每類油茶害蟲,利用支持向量機(SVM) 訓(xùn)練,進而從圖像中識別出油茶害蟲的種類。實驗結(jié)果表明:該方法用在油茶害蟲圖像模式分類問題上取得了較好的識別率,其平均識別率達到了83.3%,由此表明BoW 模型用于油茶害蟲圖像分類的有效性。
油茶害蟲;圖像識別;特征提??;BoW模型;支持向量機;圖像分類
油茶作為世界四大木本食用油料植物之一,具有很高的綜合利用價值。目前,種植油茶已成為我國南方山區(qū)經(jīng)濟和山區(qū)農(nóng)民脫貧致富奔小康的支柱產(chǎn)業(yè)之一,同時油茶在我國實施退耕還林和調(diào)整種植業(yè)結(jié)構(gòu)中發(fā)揮著十分重要的作用[1]。我國油茶的種植面積約有300萬hm2,但其畝產(chǎn)量并不高,其中油茶害蟲是影響其畝產(chǎn)量低的一個很重要的因素。因此開展針對油茶害蟲的模式分類問題研究,將有利于油茶林區(qū)蟲害實施遠程監(jiān)測預(yù)報,對推動地方經(jīng)濟發(fā)展具有重要的現(xiàn)實意義。
近年來,計算機圖形圖像、自動檢測、人工智能等技術(shù)的迅速發(fā)展使得圖像分類技術(shù)得到很大的發(fā)展。如何快速、準確地對大量的圖像信息進行分類,提取其中有用的信息,逐漸成為了人們研究的熱點之一。Bag of words (BoW)模型最開始應(yīng)用于文檔分類領(lǐng)域,由于其簡單有效的優(yōu)點得到了廣泛的應(yīng)用。目前很多的研究者將這樣的思想應(yīng)用到圖像分類領(lǐng)域。本研究就是將 BoW 模型應(yīng)用于油茶害蟲圖像分類,由于油茶害蟲圖像分類識別在本質(zhì)上是一個復(fù)雜的多類判別問題,針對每類油茶害蟲采集大量的圖像樣本,但相對于其維數(shù)而言,害蟲的樣本數(shù)是一個小樣本問題[2]。支持向量機是為解決小樣本問題學(xué)習(xí)和分類提出的具有很強的非線性分類能力[3]。
本研究將BoW模型應(yīng)用于圖像識別,可以先把圖像看作為一個文檔,而圖像中的關(guān)鍵特征被看作為“單詞”。對于油茶害蟲圖像構(gòu)造BoW的過程主要有4個步驟,如下所示:
(1)特征檢測:采用Ostu圖像分割[4]的方法對油茶害蟲圖像進行分割來獲取圖像的興趣點,比如圖像的邊緣、角點、斑塊等,獲得的圖像塊在后面圖像的識別過程中會起到至關(guān)重要的作用。
(2)特征表示:油茶害蟲內(nèi)容通過采用圖像的局部特征描述子來表示。在特征檢測之后,把獲得的局部塊狀小區(qū)域用一個特征向量來表示,提取出的特征向量就稱為特征描述子。本研究采用的是SIFT特征描述子。
(3)生成視覺直方圖:在特征表示后,將局部特征描述子表示的油茶害蟲內(nèi)容生成蟲子視覺單詞。然后通過聚類的方法將特征描述子所表示的油茶害蟲圖像進行聚類,即可獲得多個聚類中心,每個聚類中心即為一個視覺詞,把全部的中心聚集一起就構(gòu)成了BoW模型的視覺詞典,再通過聚類中心映射得到視覺詞直方圖。
(4)SIFI特征提?。和ㄟ^以上幾個步驟生成BoW后,再使用K-means聚類算法[5],訓(xùn)練油茶害蟲圖像集提取的SIFT特征。K-means算法因其收斂速度快成為一種經(jīng)典的聚類算法得到廣泛的應(yīng)用。K-means算法的思路是把參與聚類的特征數(shù)據(jù)存入到內(nèi)存中,然后進行不斷的迭代。其迭代過程如下:任意選擇K個對象作為初始化的聚類中心,定義的對象為c1,c2,c3,…,ck,然后針對剩下的對象xi(i=1,2,3,…,n),計算各個簇中心與對象的距離,得到其中最小的距離,再把這個對象賦給這個簇。整個賦值過程如下:
其中1≤l≤m。m是特征向量的維數(shù)。
然后把重新計算的每個簇的平均值作為下一次迭代的聚類中心:
其中Ni為第j個簇sj中的對象數(shù)目。
K-means 算法全過程包括初始化、分配和更新類中心,其后兩個過程需要不斷重復(fù),直到所有的聚類中心都不再變化,最終得到的類中心就是 BoW模型所需要的視覺詞[6]。然后把每幅油茶害蟲圖像中的每個 SIFT 描述子都映射到某個視覺詞,得到的就是該圖像的視覺詞直方圖。為了生成視覺詞直方圖,在映射過程中需要計算每個視覺詞與每個SIFT特征向量也就是聚類中心的距離,取其中最小的值,并把當前SIFT特征歸類到該視覺詞下,直到把所有的SIFT描述子都分配完畢后,得到一個直方圖,再把直方圖表示為數(shù)值向量,并進行歸一化,就可以用分類器進行訓(xùn)練,進而為后面的圖像識別做好準備。
將 BoW 模型應(yīng)用于圖像分類和識別領(lǐng)域時,首先要對圖像進行特征的提取和描述,這就需要合適的選擇特征提取方法以及描述子,使提取的特征在對圖像能最大限度地進行精確描述,提供它的關(guān)鍵信息,并盡可能地降低其實現(xiàn)的復(fù)雜度。本文中采用SIFT (Scale Invariant Feature Transform)描述子來提取油茶害蟲特征[7]。下面是SIFT特征提取的四個步驟:
(1)檢測在尺度空間的極值點。
(2)生成關(guān)鍵點的描述子,精確定位特征點的位置。
(3)確定每個關(guān)鍵點的主方向。
(4)關(guān)鍵點SIFT描述子的生成。
首先提取油茶害蟲圖像的SIFT特征作為圖像中的視覺詞匯,把所有的視覺詞匯集合一起,即可用一個特征向量集合描述每幅害蟲圖像。
然后,采用K-Means聚類算法來構(gòu)造視覺詞匯表[8]。SIFT提取的視覺詞匯向量之間根據(jù)距離的遠近,可以利用算法將詞義相近的詞匯合并,得到K個聚類中心作為視覺單詞,生成單詞表中的基礎(chǔ)詞匯,再由視覺單詞構(gòu)成視覺詞匯表,進而利用單詞表中的詞匯表示害蟲圖像。
最后,利用SIFT算法,可以從每幅油茶害蟲圖像中提取多個特征點,這些特征點都可以用單詞表中的單詞近似代替,通過統(tǒng)計單詞表中每個單詞在圖像中出現(xiàn)的次數(shù),可以將圖像表示成為一個K維數(shù)值向量[9]。對每幅害蟲圖像中的每個向量計算N個最近鄰視覺單詞,然后計算第k個的視覺單詞的質(zhì)量:
式(3)中:Mi表示與視覺單詞tK第i接近的特征維數(shù);s(fi,tK)表示視覺單詞tK與特征向量fi之間的相似度。本文中采用歐氏距離進行度量,對每個視覺單詞計算其質(zhì)量,如果滿足
就保留,不然則舍去。式(4)中的h為視覺單詞的質(zhì)量閾值。在滿足實時性要求的同時要保證識別率,本文取N=3,h=0.8。
支持向量機(Support Vector Machine)是在1995年由Cortes和Vapnik第一次提出。SVM相比于傳統(tǒng)的基于經(jīng)驗風險最小化理論的學(xué)習(xí)方法,它的泛化能力更強,因為它是一種基于結(jié)構(gòu)風險最小化理論的學(xué)習(xí)方法[10]。SVM在解決小樣本問題上具有比較大的優(yōu)勢,在工、農(nóng)業(yè)等領(lǐng)域的分類和識別問題中得到比較廣泛的應(yīng)用。
SVM方法在采集的樣本數(shù)目較有限的情況下可以獲得較好的分類效果,利用SVM進行油茶害蟲圖像識別分為兩部分——訓(xùn)練和測試。在訓(xùn)練階段,可以獲取油茶害蟲圖像不同的SIFT特征、不同的視覺詞匯本和不同的BoW 模型,將這些不同的BoW 模型可以訓(xùn)練得到不一樣的SVM 分類器;在測試階段,將訓(xùn)練得到的不同分類器分別對測試樣本進行分類,進而就可以得到不同的分類結(jié)果,即可獲得測試訓(xùn)練出來的分類器的識別率。SVM分類器進行識別的流程見圖1。
圖1 油茶害蟲圖像識別流程Fig.1 Flow of oil-tea pest image recognition
對未知數(shù)據(jù)進行測試時的分類能力是SVM的泛化能力。用支持向量機方法進行模式識別及分類時需選擇一個合適的核函數(shù),核函數(shù)是SVM模型中很重要的一個參數(shù)[8]。選擇不同的核函數(shù),關(guān)系到識別的準確率。但是如何選擇最優(yōu)的核函數(shù),還仍是一個有待解決的問題,目前大多是通過試驗來選擇,因此,接下來將對不同核函數(shù)下的分類效果進行比較。最常用的核函數(shù)主要有三類。
多項式核函數(shù)(Poly):
徑向基核函數(shù)(RBF):
多層感知器核函數(shù)(Sigmoid函數(shù)):
步驟1:將尺度無關(guān)特征轉(zhuǎn)變成SIFT提取圖像特征;
步驟2:對SIFT特征進行K-means聚類生成所需的視覺詞匯本;
步驟3:將所有詞匯本和圖像的SIFT特征進行比較,統(tǒng)計視覺單詞出現(xiàn)的頻率,從而構(gòu)建圖像的BoW模型描述;
步驟4:利用油茶害蟲圖像的BoW模型描述訓(xùn)練得到SVM分類器;
步驟5:利用步驟4得到的SVM分類器對測試樣本進行分類,得到不同害蟲圖像的分類結(jié)果。
本文中基于BoW和SVM分類器的油茶害蟲圖像分類算法進行了仿真實驗。實驗的硬件平臺是:CPU,Intel Core i5-3450(四核、2.8GHz);內(nèi)存,4G。采用國立臺灣大學(xué)林智仁的LibSVM工具箱。從油茶害蟲圖像樣本庫選擇3種油茶害蟲(毒蛾、葉峰、尺蠖),每種蟲子40幅圖片,每種蟲子選取60%的圖像作為訓(xùn)練樣本,另外40%的圖像作為測試樣本。用Matlab進行實驗。
基于Bow模型的油茶害蟲圖像分類,主要涉及兩個方面的工作。一方面是基于 BoW 模型油茶害蟲圖像的表達,另一方面則是基于 SVM 的油茶害蟲圖像分類。基于SVM的分類實驗,在已經(jīng)提取出 BoW 特征之后,主要是參數(shù)選擇的問題。利用構(gòu)建的視覺詞直方圖表示的圖像頻次,將其歸一化后,分別采用多項式核函數(shù)(Poly)、徑向基核函數(shù)(RBF)以及多層感知器核函數(shù)(Sigmoid函數(shù))對圖像進行訓(xùn)練,得到各類害蟲的識別結(jié)果(如表1所示)。
表1 不同核函數(shù)的各類害蟲的識別結(jié)果對比Table 1 Different kernel functions of all kinds of insect pests recognition results
從各類害蟲圖像的識別率中可以發(fā)現(xiàn),采用不同的核函數(shù)分類結(jié)果有一定的差別。其中,RBF核函數(shù)對油茶害蟲圖像的分類效果是最好的,它的分類平均正確率最高。
為了驗證BoW模型的有效性,在相同實驗條件下,將SIFT特征單獨作為輸入變量,代入支持向量機進行訓(xùn)練和分類,根據(jù)上個實驗的經(jīng)驗,直接選用RBF核函數(shù)進行測試,實驗的分類結(jié)果如表2所示。
表2 基于不同特征的的油茶害蟲圖像識別結(jié)果Table 2 Based on the different characteristics of camellia pest image recognition results
從實驗結(jié)果中可以看到,相比于單獨使用SIFT特征,由SIFT特征構(gòu)建的BoW模型在識別率上有了較大的提高,由此表明 BoW 模型用于油茶害蟲圖像分類的有效性,并取得了較好的分類精度。與此同時,這個結(jié)果表明目前這種方法還有待于進一步提高,尤其是在特征提取方面需要繼續(xù)尋找新的可能性,以提高識別的準確率。
[1]高 超,袁德義,鄒 鋒.論油茶在南方丘陵區(qū)退耕還林工程中的應(yīng)用[J].中南林業(yè)科技大學(xué)學(xué)報,2011,31(7):205-208.
[2]李 密,鄒佳慧,何 振,等.湖南油茶林害蟲群落組成及其物種多樣性[J].中南林業(yè)科技大學(xué)報,2013,33(5):11-15.
[3]Chunhui Gu, Lim J J, Arbelaez P,et al. Recognition using regions[M]. IEEE Conference on Computer Vision and Pattern Recognition, 2009: 1030-1037.
[4]劉健莊.灰度圖像的二維 Otsu 自動閾值分割法[D].沈陽:東北大學(xué),2011.
[5]張雪鳳,張桂珍,劉 鵬.基于聚類準則函數(shù)的改進K-means算法[J].計算機工程與應(yīng)用,2011,47( 11) : 123-124.
[6]陳 凱,肖國強,潘 珍,等.單尺度詞袋模型圖像分類方法[J].計算機應(yīng)用研究,2011,28(10):3986-3988.
[7]張秋余,王道東,張墨逸,等.基于特征包支持向量機的手勢識別[J].計算機應(yīng)用,2012,32(12):3392-3396.
[8]astanlar Y, Temizel A, Yardimci Y. Improved SIFT matching for image pairs with scale difference[J]. Electronics Letters, 2010,46(5): 107-108.
[9]Zhang R, Wang W J, Bai X F. SVM color image segmentation based on automatic selection of training samples[J]. Computer Science, 2012,39(11): 967-971.
[10]Chih-Chung Chang, Chih-Jen Lin. LIBSVM3.11: a library for support vectormachines[M]. ACM Transactions on Intelligent Systems and Technology,2011.
Classi fication research of oil-tea pest images based on BoW model
XIE Lin-bo, YU Shao-jun, ZHOU Guo-ying, LI Hong
(Central South University of Forestry and Technology, Changsha 410004, Hunan, China)
For the existing problem of image recognition applying in the field ofCamelliapests, aCamelliapest image recognition method was put forward based on BoW model. Firstly, the SIFT features of oil-tea pest image were extracted, and then by using BoW model the images were described, and last the species of oil-tea pests were identi fied through support vector machine (SVM) training.The experimental results show that the method used in oil-tea pest image pattern classi fication had a better recognition rate, with an average recognition rate of 83.3%.
Camelliapests; image recognition; feature extraction; BoW model; support vector machine (SVM); image classi fication
S781.39
A
1673-923X(2015)05-0070-04
10.14067/j.cnki.1673-923x.2015.05.012
2014-05-10
“十二五”國家科技計劃課題(2012BAD19B0803);湖南省科技廳科技計劃項目(2014NK3057)
謝林波,碩士研究生
余紹軍,教授; E-mail:1071599402@qq.com
謝林波,余紹軍,周國英,等. 基于BoW模型的油茶害蟲圖像分類[J].中南林業(yè)科技大學(xué)學(xué)報,2015,35(5):70-73.
[本文編校:謝榮秀]