張廣群, 李英杰, 汪杭軍
(1.浙江農(nóng)林大學(xué) 信息工程學(xué)院, 浙江 臨安311300;2.浙江農(nóng)林大學(xué) 浙江省林業(yè)智能監(jiān)測與信息技術(shù)研究重點(diǎn)實(shí)驗(yàn)室,浙江 臨安 311300;3.浙江農(nóng)林大學(xué) 暨陽學(xué)院,浙江 諸暨311800)
基于詞袋模型的林業(yè)業(yè)務(wù)圖像分類
張廣群1,2, 李英杰3, 汪杭軍3
(1.浙江農(nóng)林大學(xué) 信息工程學(xué)院, 浙江 臨安311300;2.浙江農(nóng)林大學(xué) 浙江省林業(yè)智能監(jiān)測與信息技術(shù)研究重點(diǎn)實(shí)驗(yàn)室,浙江 臨安 311300;3.浙江農(nóng)林大學(xué) 暨陽學(xué)院,浙江 諸暨311800)
針對林業(yè)業(yè)務(wù)圖像的特點(diǎn),提出了一種基于稠密尺度不變特征轉(zhuǎn)換(Dense SIFT)特征的詞袋(BoW)模型,并聯(lián)合直方圖正交核的支持向量機(jī)(SVM)對圖像自動分類。首先采用Dense SIFT提取林業(yè)業(yè)務(wù)圖像特征,然后使用BoW模型描述各業(yè)務(wù)圖像,最后利用SVM進(jìn)行分類識別。實(shí)驗(yàn)結(jié)果表明:采用Dense SIFT特征比SIFT特征訓(xùn)練時(shí)間和識別時(shí)間更短,并有更高的識別率,更適應(yīng)實(shí)時(shí)性較高的場合;SVM采用多項(xiàng)式核函數(shù)(Poly),徑向基核函數(shù)(RBF),多層感知器核函數(shù)(Sigmoid)以及直方圖交叉核對3類林業(yè)業(yè)務(wù)圖像分類時(shí),直方圖正交核取得的平均識別率最高;綜合Dense SIFT在局部特征上的優(yōu)勢,加上BoW模型和直方圖交叉核SVM分類器,平均識別率達(dá)到了86.7%,有較好的識別效果。圖4表3參18
森林計(jì)測學(xué);林業(yè)業(yè)務(wù)圖像;圖像分類;特征提??;BoW模型;支持向量機(jī)
Abstract:For characteristics of forestry images,an image classification method was put forward based on Dense SIFT and the BoW Model with support vector machine(SVM)using a histogram intersection kernel in order to improving to meet the need of the forest resources management.First,using the BoW Model,the Dense SIFT features of forestry images were extracted to describe the image.Then SVM was used for classification to identify the category of the images.Different kinds of kernel functions like Poly,RBF,Sigmoid,and the histogram intersection kernel were used to find the best recognition rate.Experimental results showed that using Dense SIFT had a shorter detection time (t=60.143 s)and a higher recognition rate (r=86.7%) than SIFT (t=95.567 s and r=83.3%respectively),and it was suited for high real-time applications.Also the histogram intersection kernel had a higher average recognition (r=86.7%).Combining Dense SIFT and the BoW Model with SVM and using the histogram intersection kernel,algorithms used with three kinds of forestry images had a better average recognition (r=86.7%). [Ch,4 fig.3 tab.18 ref.]
Key words:forest measurement;forestry images;image classification;feature extraction;BoW Model;support vector machine
森林具有巨大的生態(tài)、經(jīng)濟(jì)和社會功能,是應(yīng)對經(jīng)濟(jì)全球化發(fā)展過程中造成的生態(tài)危機(jī)和氣候變化問題的有效資源。森林資源清查和森林生態(tài)保護(hù)一直都是各級政府建設(shè)的重要內(nèi)容。實(shí)際工作中,護(hù)林員通過手機(jī)拍攝到的林業(yè)現(xiàn)場數(shù)據(jù)傳輸回服務(wù)器后,可根據(jù)林業(yè)業(yè)務(wù)需求快速分類;其分類結(jié)果發(fā)送到相關(guān)管理部門,就可完成對相關(guān)事件及時(shí)有效的處理。這種森林資源監(jiān)管模式避免了傳統(tǒng)管理手段無法準(zhǔn)確及時(shí)了解森林現(xiàn)狀及動態(tài)的問題。要使林業(yè)各個(gè)管理部門全面配合、相互協(xié)調(diào),增強(qiáng)決策支持和加快應(yīng)急處理,其核心是實(shí)現(xiàn)林業(yè)業(yè)務(wù)圖像迅速、準(zhǔn)確的分類。陳錦標(biāo)等[1]使用.NET提出了基于分類的林業(yè)圖像管理信息系統(tǒng),解決林業(yè)圖像管理分散、分類混亂、查找困難問題。劉義華等[2]針對林業(yè)圖像數(shù)據(jù)的特點(diǎn),提出了海量數(shù)據(jù)服務(wù)器架設(shè)方式和需要解決的關(guān)鍵問題。這些研究的基礎(chǔ)是對林業(yè)圖像進(jìn)行標(biāo)注,系統(tǒng)代價(jià)高,人工成本也高。本研究中林業(yè)業(yè)務(wù)圖像自動分類的理論基礎(chǔ)是場景圖像分類。場景圖像分類是在20世紀(jì)90年代末開始興起的一個(gè)研究領(lǐng)域,2006年麻省理工學(xué)院首次召開場景理解研討會后成為了新的研究熱點(diǎn)。2005年之前,場景圖像分類主要采用基于底層特征(low level features)的方法和基于場景結(jié)構(gòu)的方法;之后則采用基于圖像視覺詞匯的方法,該類方法由SIVIC等[3]提出視覺詞匯的概念,將文本分類中的詞袋方法(bag of words,BoW)應(yīng)用到圖像分類中來。之后,由于視覺詞匯在圖像分類中具有特征表達(dá)能力強(qiáng)和簡單有效的優(yōu)點(diǎn)[4],被研究者應(yīng)用在計(jì)算機(jī)視覺的圖像分類領(lǐng)域[5-12]。詞袋方法的核心是提取圖像特征構(gòu)建視覺詞匯本。近年來,多采用局部特征用于圖像分類,例如,LOWE[13]提出的高效區(qū)域檢測算法SIFT(scale invariant feature transform)具有圖像旋轉(zhuǎn)、尺度縮放、平移保持不變性,該方法在2004年得到完善[14];Dense SIFT即密集SIFT,是在SIFT基礎(chǔ)上發(fā)展而來的一種算法,相比傳統(tǒng)SIFT特征后者具有實(shí)時(shí)性好、表達(dá)能力強(qiáng)的優(yōu)點(diǎn)。本研究針對林業(yè)業(yè)務(wù)圖像數(shù)據(jù)的特點(diǎn),利用Dense SIFT提取圖像中的業(yè)務(wù)信息,構(gòu)建合理的視覺詞匯本,描述林業(yè)業(yè)務(wù)圖像;根據(jù)林業(yè)業(yè)務(wù)管理需求,聯(lián)合直方圖正交核的支持向量機(jī)對圖像自動分類,并將各類信息傳遞至各職能管理,從而實(shí)現(xiàn)快速、及時(shí)、準(zhǔn)確、有效的管理。
將BoW模型應(yīng)用于圖像分類時(shí),可將圖像看作為一個(gè)文檔,提取的與位置信息無關(guān)的關(guān)鍵特征看作為文本中的單詞,稱作 “視覺詞匯”;視覺詞匯的集合稱為 “視覺詞匯本”。利用 “視覺詞匯本”表示每幅圖像即可完成分類?;静襟E可分為3步。①特征提?。菏褂肈ense SIFT算法提取林業(yè)業(yè)務(wù)圖像的特征,用128維向量表示。②生成視覺詞匯本:所有的特征向量利用 K-means聚類算法構(gòu)造視覺詞匯本[4],統(tǒng)計(jì)視覺詞匯本的詞匯在圖像中出現(xiàn)的次數(shù),用1個(gè)k維直方圖向量表示圖像。③分類器設(shè)計(jì):以圖像的直方圖向量和相應(yīng)的類別標(biāo)簽作為訓(xùn)練數(shù)據(jù),訓(xùn)練 SVM分類器。④分類:對需要分類的圖像先利用視覺詞匯本的詞匯表示為直方圖向量,然后利用訓(xùn)練好的SVM分類器進(jìn)行預(yù)測,輸出結(jié)果。整體算法流程如圖1所示。
圖1 應(yīng)用于圖像分類的BoW模型算法流程Figure 1 Block graph of BoW model
LOWE提出的SIFT算法在數(shù)字圖像的特征描述上應(yīng)用廣泛且成效明顯?;赟IFT進(jìn)行圖像特征的提取一般分為4步組成。
1.1.1 建立尺度空間并檢測極值點(diǎn) 圖像的尺度空間表示是圖像在所有尺度下的描述,高斯卷積是表現(xiàn)尺度空間的一種形式。設(shè)圖像I(x,y),其尺度空間函數(shù)為L(x,y,σ),則有:
式(1)中:G為尺度σ下的二維空間高斯函數(shù),其表達(dá)式為:
尺度空間建立之后,可用高斯差分函數(shù)D(x,y,σ)為關(guān)鍵點(diǎn)的定位,其表達(dá)式為:
式(3)中:k表示層級,是一個(gè)常量。
1.1.2 確定關(guān)鍵點(diǎn)位置 關(guān)鍵點(diǎn)存在于圖像邊緣的高斯差分極值點(diǎn)處,因此,關(guān)鍵點(diǎn)確定的主要問題就是對滿足要求的高斯差分函數(shù)極值點(diǎn)的計(jì)算。為了尋找尺度空間的極值點(diǎn),每個(gè)像素點(diǎn)和所有的相鄰點(diǎn)進(jìn)行比較,當(dāng)大于(或小于)圖像空間和尺度空間的所有相鄰點(diǎn)時(shí),為極值點(diǎn)。對尺度空間函數(shù)L進(jìn)行曲線擬合以精確確定關(guān)鍵點(diǎn)的位置和尺度,同時(shí)去除低對比度的關(guān)鍵點(diǎn)和不穩(wěn)定的邊緣響應(yīng)點(diǎn),增強(qiáng)匹配穩(wěn)定性,提高抗噪聲性能。
1.1.3 確定關(guān)鍵點(diǎn)方向 關(guān)鍵點(diǎn)方向可利用關(guān)鍵點(diǎn)鄰域像素的梯度直方圖的分布特性進(jìn)行賦值。首先,計(jì)算每個(gè)關(guān)鍵點(diǎn)的梯度幅值m(x,y)和方向θ(x,y):
式(4)和式(5)中:L為尺度空間函數(shù)。然后,生成梯度直方圖,其橫軸是梯度方向角,縱軸是梯度方向角對應(yīng)的梯度幅值累加,直方圖的峰值即為該關(guān)鍵點(diǎn)鄰域梯度的主方向。
1.1.4 確定關(guān)鍵點(diǎn)描述子 以特征點(diǎn)為中心,將坐標(biāo)軸旋轉(zhuǎn)為關(guān)鍵點(diǎn)的主方向。在關(guān)鍵點(diǎn)周圍取16×16的鄰域像素,并劃分為4×4的子區(qū)域,計(jì)算每個(gè)子區(qū)域的梯度直方圖。梯度直方圖橫軸為8個(gè)方向區(qū)間,縱軸是每個(gè)方向梯度的幅值累加,形成一個(gè)具有8個(gè)方向梯度強(qiáng)度信息的種子點(diǎn)。每個(gè)關(guān)鍵點(diǎn)采用4×4個(gè)種子點(diǎn),形成128維的特征向量。此時(shí)SIFT特征向量具有尺度、旋轉(zhuǎn)不變性,將特征向量進(jìn)行歸一化,去除光照變化的影響。以數(shù)據(jù)庫中森林火災(zāi)類圖像為例,圖2A為原圖,圖2B為SIFT提取的特征效果圖,圖2C為Dense SIFT提取的特征效果圖。
圖2 森林火災(zāi)原圖(A)、SIFT效果圖(B)和Dense SIFT效果圖(C)Figure 2 Original forest fire image(A) and its SIFT effect image(B) and its Dense SIFT effect image (C)
Dense SIFT在SIFT基礎(chǔ)上進(jìn)行了改進(jìn),在目標(biāo)分類和場景分類有重要的應(yīng)用。Dense SIFT的原理是將目標(biāo)區(qū)域先劃分成大小相同的矩形區(qū),分別計(jì)算每一塊矩形區(qū)的SIFT特征,再對各矩形區(qū)的Dense SIFT特征中心釆樣并建模,度量不同矩形區(qū)間的差異。對圖像集的Dense SIFT特征的提取步驟為①在圖像上設(shè)定密集采樣網(wǎng)格,網(wǎng)格上的交叉點(diǎn)作為特征提取點(diǎn),以16×16像素大小的窗口進(jìn)行固定采樣;②以8像素的步長自左向右、從上到下在圖像上提取SIFT特征描述子。
通過以上特征提取算法提取到圖像庫中訓(xùn)練圖像的局部特征,并把所有特征向量集合在一起,構(gòu)成特征庫。利用K-means聚類將特征庫中距離相近的劃分到同一個(gè)聚類類別,聚類數(shù)目K∈[200,1 000],這些聚類中心即為視覺詞匯本。所有特征點(diǎn)根據(jù)聚攏程度分布到128維坐標(biāo)系上,分成M類,其中每一個(gè)點(diǎn)絕對包含在其中一類中。再以每一類的重心點(diǎn)(或均值點(diǎn))C為代表點(diǎn),得到M(C1,C2,…,CK),生成詞匯本。計(jì)算Dense SIFT特征向量與聚類中心(視覺詞匯)的距離,找出距離它最近的聚類中心,然后做詞頻統(tǒng)計(jì),即統(tǒng)計(jì)每個(gè)視覺詞匯在圖像的出現(xiàn)次數(shù)。用視覺詞匯的直方圖向量(K維的向量)表示圖像,即為BoW描述向量。圖3給出的是圖2中森林火災(zāi)類的一幅圖像的直方圖。
圖3 森林火災(zāi)類圖像的直方圖Figure 3 Histogram of an forest fire image
支持向量機(jī)(SVM,support vector machine)是由CORTES和VAPNIK在1995年首先提出的,被廣泛應(yīng)用于模式識別、分類等領(lǐng)域,能夠比較好地解決高維向量、非線性等問題[15-16],在解決小樣本問題上也有比較好的優(yōu)勢。本研究以BoW模型的描述向量數(shù)據(jù)為訓(xùn)練樣本,并賦予相應(yīng)的標(biāo)簽后訓(xùn)練SVM分類器。
SVM中選擇不同的核函數(shù)得到不同的支持向量機(jī)算法。本研究采用3類核函數(shù)。多項(xiàng)式核函數(shù)(Poly):
徑向基核函數(shù)(RBF):
多層感知器核函數(shù)(Sigmoid):
由于林業(yè)業(yè)務(wù)圖像分類多為非線性分類,因此使用直方圖正交核函數(shù)(histogram intersection kernel,又稱pyramid match kernel)[17],用來對特征構(gòu)成的直方圖進(jìn)行相似度匹配。
假設(shè) 2 個(gè)直方圖為 x=[x(1),x(2),…,x(n)], y=[y(1),y(2),…,y(n)], 則直方圖正交核可定義為:
并且存在一個(gè)映射φ,能夠?qū)⑷我庵狈綀Dx映射為一個(gè)在高維特征空間φ中的向量φ(x):
通過這個(gè)非線性映射φ,直方圖近似等價(jià)于特征空間φ中的內(nèi)積。
我們就Dense SIFT特征提取BoW模型和SVM分類器的林業(yè)業(yè)務(wù)圖像分類算法進(jìn)行了仿真實(shí)驗(yàn)。實(shí)驗(yàn)的硬件平臺如下:IntelR Core(TM), i3-3240 CPU@3.40GHz。 SVM 采用臺灣大學(xué) CHANG 等[18]的 Lib-SVM工具箱。為了驗(yàn)證效果,我們建立了林業(yè)業(yè)務(wù)圖像數(shù)據(jù)集,目前收錄了3類林業(yè)業(yè)務(wù)圖像:森林火災(zāi)、非法采伐和森林病蟲害,分別由森林防火指揮部、森林公安和林業(yè)有害生物防治檢疫局處理。具體實(shí)驗(yàn)中,選取60幅·種-1,共計(jì)180幅圖像作為研究對象;以40幅·種-1作訓(xùn)練樣本,20幅·種-1作測試樣本。將得到的林業(yè)業(yè)務(wù)原始圖像按比例尺截取子區(qū)域,縮放至240×240像素統(tǒng)一大小。圖4給出了3類林業(yè)業(yè)務(wù)圖像的部分樣本。
構(gòu)建視覺直方圖后,可以用它表示圖像中視覺詞匯出現(xiàn)的頻次了。首先,將訓(xùn)練圖像按照BoW描述向量和相應(yīng)的類別標(biāo)簽通過支持向量機(jī)SVM分類器進(jìn)行訓(xùn)練。然后,將待分類圖像使用相同的方法進(jìn)行Dense SIFT特征提取后用BoW模型進(jìn)行描述,并采用訓(xùn)練好的分類器進(jìn)行分類。SVM采用的核函數(shù)分別采用上述多項(xiàng)式核函數(shù)(Poly),徑向基核函數(shù)(RBF),多層感知器核函數(shù)(Sigmoid)以及直方圖交叉核,最后得到各類林業(yè)業(yè)務(wù)圖像的分類結(jié)果(表1)。
圖4 3類林業(yè)業(yè)務(wù)圖像數(shù)據(jù)集樣本演示Figure 4 Data set sample demo of three kinds of forest image
由表1可知:對于此3類林業(yè)業(yè)務(wù),不同的核函數(shù)對數(shù)據(jù)映射的維度不同,盡管結(jié)果有一定的差別,但是平均識別率趨勢表現(xiàn)為 “非法采伐”> “森林火災(zāi)”> “森林病蟲害”。該結(jié)果與3類業(yè)務(wù)圖像的數(shù)據(jù)特征一致,分析原因認(rèn)為 “非法采伐”含有大量的被砍伐的樹木,特征較為明顯,識別率高;“森林火災(zāi)”由于火災(zāi)現(xiàn)場往往含有火或煙霧等特征,但同時(shí)一些圖像也含有綠葉樹木,其識別率次之;“森林病蟲害”識別率低是因?yàn)椴∠x害的種類和數(shù)量較多,病因與害蟲特征表現(xiàn)差異也較大。除Sigmoid核函數(shù)內(nèi)核外,其余的內(nèi)核平均識別率都達(dá)到80%以上,特別是使用直方圖正交核進(jìn)行分類所得到的平均識別率最高,達(dá)到了86.7%。由于采用直方圖正交核對于直方圖的比較問題具有較好的效果,因此使用詞袋模型的直方圖形式描述圖像特征,在直方圖正交核上得到了最佳識別效果。
表1 3類林業(yè)圖像在不同核函數(shù)下的分類結(jié)果Table 1 Recognition comparison results of three kinds of forestry image with different kernel functions
為了獲得SIFT特征和Dense SIFT特征在林業(yè)業(yè)務(wù)圖像上的分類效果,我們在相同實(shí)驗(yàn)條件下分別采用SIFT和Dense SIFT特征后得到的分類結(jié)果進(jìn)行比較。其中,選用直方圖交叉核函數(shù)作為SVM內(nèi)核,分類識別時(shí)間包括訓(xùn)練時(shí)間和所有測試圖像的分類時(shí)間,得到結(jié)果如表2所示。
由表2可知:在訓(xùn)練數(shù)據(jù)庫和詞袋大小相同時(shí),Dense SIFT特征比SIFT有更高的識別率;采用Dense SIFT作特征提取時(shí)訓(xùn)練時(shí)間和識別時(shí)間更短,更適應(yīng)實(shí)時(shí)性較高的場合。林業(yè)業(yè)務(wù)圖像往往由多個(gè)物體類別組合而成,以森林火災(zāi)為例,其圖像可能會包含樹木、天空、火、煙等多種對象,要求描述這類圖像的特征應(yīng)該有豐富的局部信息。選用SIFT特征提取法僅僅提取圖像中的關(guān)鍵點(diǎn),即圖像變化較為突出的區(qū)域,難以兼顧圖像局部和細(xì)節(jié)信息;使用Dense SIFT特征提取方法會更優(yōu),因?yàn)橛肈ense SIFT對整幅圖片進(jìn)行劃分不同的子區(qū)域,進(jìn)而對局部特征有了完整的提取,即使對某些文理、色彩等變化比較平緩的區(qū)域,也能求出其局部特征。這表明Dense SIFT生成興趣點(diǎn)的方法在林業(yè)業(yè)務(wù)圖像分類領(lǐng)域可以取得比SIFT興趣點(diǎn)檢測方法更好的性能。
表2 BoW中不同特征識別性能比較Table 2 Recognition comparison with different feature in BoW
為驗(yàn)證BoW模型的有效性,在相同實(shí)驗(yàn)條件下,將SIFT或Dense SIFT提取的特征數(shù)據(jù)作為變量輸入,選用直方圖交叉核函數(shù)作為SVM內(nèi)核,經(jīng)支持向量機(jī)訓(xùn)練和測試分類。得到結(jié)果如表3所示。
從表3可知:Dense SIFT特征提取法的識別率要略高于SIFT特征,這與上一個(gè)實(shí)驗(yàn)結(jié)果所得到的結(jié)論是一致的,說明Dense SIFT在局部特征的完整提取上有優(yōu)勢;但是單獨(dú)使用SIFT或Dense SIFT作為特征進(jìn)行分類的平均識別率均比采用BoW模型方法要低很多,基于SIFT或Dense SIFT特征提取法的BoW模型能將特征根據(jù)林業(yè)業(yè)務(wù)圖像類進(jìn)行重新組合,生成更加能反映業(yè)務(wù)本身特點(diǎn)的直方圖特征,可以大大提高圖像識別率。
表3 基于不同特征的林業(yè)業(yè)務(wù)圖像識別結(jié)果Table 3 Forestry image recognition performance based on different feature
本研究提出了一種基于Dense SIFT特征的BoW模型,聯(lián)合直方圖正交核的支持向量機(jī)對林業(yè)業(yè)務(wù)圖像進(jìn)行自動分類。以收集到的林業(yè)業(yè)務(wù)圖像數(shù)據(jù)集為對象進(jìn)行實(shí)驗(yàn),結(jié)論如下:①本研究以3類林業(yè)業(yè)務(wù)圖像的識別為例,驗(yàn)證發(fā)現(xiàn)BoW模型應(yīng)用于林業(yè)業(yè)務(wù)圖像分類可以取得比較好的識別效果。增加新的業(yè)務(wù)類別時(shí),只要選擇足夠數(shù)量的新增類別的訓(xùn)練樣本,重新建立 “視覺詞匯本”即可。②SIFT和Dense SIFT都能有效地提取到林業(yè)業(yè)務(wù)圖像的識別特征;就對圖像局部特征完整提取的效果而言,Dense SIFT特征提取法比SIFT在對林業(yè)業(yè)務(wù)圖像分類上更有優(yōu)勢。利用BoW模型對特征進(jìn)行組合,產(chǎn)生的直方圖特征更能反映林業(yè)業(yè)務(wù)本身特點(diǎn),因而識別的準(zhǔn)確率得到了極大提高。③采用SVM對林業(yè)業(yè)務(wù)圖像進(jìn)行分類時(shí),應(yīng)用不同的核函數(shù)對最后的識別率會產(chǎn)生較大的影響。由于BoW模型使用直方圖描述圖像的特征,直方圖正交核能更好地處理直方圖的比較問題,故能取得最佳的識別效果。
綜上所述,基于Dense SIFT的BoW模型方法為林業(yè)業(yè)務(wù)圖像自動識別研究提供了一種重要思路。該問題的研究與應(yīng)用有助于中國對森林資源監(jiān)管模式的創(chuàng)新與實(shí)踐,有利于加強(qiáng)林業(yè)各個(gè)管理部門配合,相互協(xié)調(diào),增強(qiáng)決策支持和應(yīng)急處理能力,進(jìn)而為實(shí)現(xiàn)森林的快速、有效、及時(shí)的現(xiàn)代化管理打下基礎(chǔ)。
[1] 陳錦標(biāo),張春花.基于分類的林業(yè)圖片管理信息系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].中南林業(yè)調(diào)查規(guī)劃,2010,29(2):30-33.CHEN Jinbiao,ZHANG Chunhua.Design and implementation of forestry picture management information system based on classification [J].Cent South For Invent Plann,2010,29(2):30 - 33.
[2] 劉義華,李媛媛.海量林業(yè)圖像數(shù)據(jù)的分布式體系分析[J].林業(yè)調(diào)查規(guī)劃,2010,35(4):10-14.LIU Yihua,LI Yuanyuan.Distributed systematic analysis for massive data of forestry image [J].For Invent Plann,2010,35(4):10 - 14.
[3] SIVIC J,ZISSERMAN A.Video Google:a text retrieval approach to object matching in videos [J].IEEE Int Conf Comput Vis,2003,2:1470-1478.
[4] WU Lei,HOI S C H,YU Nenghai.Semantics-preserving bag-of-words models and applications [J].IEEE Trans Image Proc,2010,19(7):1908 - 1920.
[5] UIJLINGS J R R,SMEULDERS A W M,SCHA R J H.Real-time visual concept classification [J].IEEE Trans Multimedia,2010,12(7):665 - 681.
[6] 趙春暉,王瑩, KANEKO M.一種基于詞袋模型的圖像優(yōu)化分類方法[J].電子與信息學(xué)報(bào),2012,34(9):2064-2070.ZHAO Chunhui,WANG Ying,KANEKO M.An optimized method for image classification based on bag of words model[J].J Electron Inf Technol,2012,34(9):2064 - 2070.
[7] 艾浩軍,張敏,方禹,等.視覺詞匯的主成分線性編碼方法[J].軟件學(xué)報(bào),2013,24(增刊2):42-49.AI Haojun,ZHANG Min,FANG Yu,et al.Principal component linear coding for visual words [J].J Software,2013,24(supp 2):42 - 49.
[8] 朱映映,朱艷艷,文振焜.基于類型標(biāo)志鏡頭與詞袋模型的體育視頻分類[J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),2013, 25(9): 1375 - 1383.ZHU Yingying,ZHU Yanyan,WEN Zhenkun.Sports video classification based on marked genre shots and bag of words model[J].J Comput-Aid Des Comput Graph,2013,25(9):1375 - 1383.
[9] LI Zhen,YAP K H.An efficient approach for scene categorization based on discriminative codebook learning in bagof-words framework [J].Image Vision Comput,2013,31(10):748 - 755.
[10] MUMTAZ A,COVIELLO E,LANCKRIET G R,et al.A scalable and accurate descriptor for dynamic textures using bag of system trees [J].IEEE Trans Pattern Anal Mach Intell,2015,37(4):697 - 712.
[11] 生海迪.視覺詞袋模型的改進(jìn)及其在圖像分類中的應(yīng)用研究[D].濟(jì)南:山東師范大學(xué),2015.SHENG Haidi.The Improvement of Bag-of-Visual-Words Model and Its Application Research in Images Classification [D].Ji’nan:Shandong Normal University,2015.
[12] 王濤.基于詞袋模型的人臉表情識別研究[D].武漢:華中科技大學(xué),2013.WANG Tao.Research on Bag of Words Model-Based Facial Expression Recognition [D].Wuhan:Huazhong University of Science and Technology,2013.
[13] LOWE D G.Object recognition from local scale-invariant features [J].IEEE Int Conf Comput Vision,1999,2:1150-1157.
[14] LOWE D G.Distinctive image features from scale-invariant keypoints [J].Int J Computr Vision,2004,60(2):91 -110.
[15] MATHUR A,FOODY G M.Multiclass and binary SVM classification:implications for training and classification users [J].IEEE Trans Geosci Remote Sens Letter,2008,5(2):241 - 245.
[16] KALYANI S,SWARUP K S.Classification and assessment of power system security using multiclass SVM [J].IEEE Trans Syst Man Cybern Part C Appl Rev,2011,41(5):753 - 758.
[17] GRAUMAN K, DARRELL T.The pyramid match kernel:discriminative classification with sets of image features[C]//Proceedings of the IEEE International Conference on Computer Vision.Beijing:IEEE Computer Society,2005:1458-1465.
[18] CHANG C C,LIN C J.LIBSVM:a library for support vector machines [J].ACM Trans Intell Syst Technol,2007,2(3):389 - 396.
Classification of forestry images based on the BoW Model
ZHANG Guangqun1,2,LI Yingjie3,WANG Hangjun3
(1.School of Information Engineering,Zhejiang A&F University,Lin’an 311300,Zhejiang,China;2.Zhejiang Provincial Key Laboratory of Forestry Intelligent Monitoring and Information Technology,Zhejiang A&F University,Lin’an 311300,Zhejiang,China;3.Jiyang College,Zhejiang A&F University,Zhuji 311800,Zhejiang,China)
S758;TP391
A
2095-0756(2017)05-0791-07
2016-09-19;
2016-11-30
浙江省自然科學(xué)基金資助項(xiàng)目(LY16C160007);浙江農(nóng)林大學(xué)科研發(fā)展基金人才啟動項(xiàng)目(2013FR059)
張廣群,副教授,從事圖像處理等研究。E-mail:gloria@zafu.edu.cn。通信作者:汪杭軍,教授,博士,從事林業(yè)圖像處理和模式識別研究。E-mail:whj@zafu.edu.cn