鄧 瑩,金愛武,,朱強根,方 婷
(1.浙江農(nóng)林大學省部共建亞熱帶森林培育國家重點實驗室,浙江杭州 311300;2.麗水學院 生態(tài)學院,浙江 麗水 323000)
中國是竹類資源極為豐富的國家之一,已知有37 屬、500 余種[1]。許多竹種為我國特有,但是由于目前仍然沒有一個統(tǒng)一、權(quán)威的分類系統(tǒng),竹子分類仍是竹類資源研究領(lǐng)域的重要問題之一[2]。除傳統(tǒng)解剖學意義下的竹子分類,如稈、葉、地下莖、根等,分類專家們在胚胎學、細胞學、化學、分子生物學等領(lǐng)域也有深入研究[3]。近年來,在計算機領(lǐng)域,基于植物葉片圖像的植物分類等研究不斷取得新進展。葉片是竹子中的重要營養(yǎng)器官之一,不同種類竹類葉片的形狀、顏色、幾何等具有一定差異,在機器視覺下,提取葉片的紋理、顏色、幾何等多種特征,在設(shè)計的分類器中進行分類識別,能高效方便地應用于植物分類。已有不少國內(nèi)外學者將此應用于植物葉片分類上,為本研究挑選數(shù)據(jù)特征提供了參考。王勇等[4]通過對棉花不同部分顏色數(shù)據(jù)的分析,建立了基于色差信息的識別模型,利用形狀特征建立動態(tài)Freeman 編碼方法去除噪聲,棉桃識別率達85%;楊福增等[5]在基于顏色和形狀特征的識別方法下有效分辨出了茶葉嫩芽,識別準確率為94%;葉萍[6]提取植物葉片的不變矩、傅里葉描繪子和分形維數(shù)等幾何特征,采用BP 神經(jīng)網(wǎng)絡(luò)訓練對植物進行分類識別,正確率可達92%;高良等[7]通過計算基于幾何特征、紋理特征和角點距離矩陣的綜合相似度對葉片進行精確識別,對Flavia 數(shù)據(jù)集的識別率可達97.50%;Sumathi 等[8]通過提取葉片輪廓參數(shù)及Gabor 特征,對197 個自收集樣本數(shù)據(jù)集的識別率達95.89%。以上文獻研究均基于研究對象選擇葉片合適的數(shù)據(jù)特征,得到了較好的識別精度,因此在葉片特征選擇上要根據(jù)研究對象及實際實驗效果確定。經(jīng)過多次試驗對比,本文選擇11 種不同種類竹子葉片的紋理特征、幾何特征、顏色特征,并將其3 種特征相組合[9],采用圖像處理方法,在機器視覺下對竹類葉片進行識別。
本實驗樣本為2019 年10 月18 日—2019 年10 月20 日在浙江農(nóng)林大學翠竹園采集的11 種竹類葉片,每種40 張共計440 幅葉片圖像,其中竹種有白紋女竹、大節(jié)竹、菲黃竹、南平倭竹、羅漢竹、菲白竹、金鑲玉竹、黃桿烏哺雞竹、桂竹、花毛竹、積古丹竹,如圖1 所示。在采集過程中每個竹種的采集均選擇長勢均一、發(fā)育良好的成熟葉片,以避免由于同類葉片自身生長產(chǎn)生的幾何差異性,為保持葉片完整性,均選擇顏色鮮艷、斑點較少、表面光滑未受損的葉片,將新鮮葉片樣本裝入含少量水的樣品袋保鮮,采樣完畢后立即送至實驗室進行拍攝。葉片葉柄部分的可用信息量低,可能對識別精度產(chǎn)生干擾,因此拍攝前人為地去除了竹子葉柄。
Fig.1 Leaf images of 11 bamboo species圖1 11 種竹類葉片圖像
由于葉片的幾何特征、紋理特征和顏色特征會不同程度地受光照、拍攝方法、成像聚焦程度等因素的影響,且竹類葉片圖像是本研究進行圖像處理和分析的重要數(shù)據(jù)來源,因此實驗嚴格控制拍攝條件,葉片均采用自制光箱拍攝,如圖2 所示。實驗所用光箱尺寸為60mm*40mm*50mm,拍攝臺采用500mm*300mm*2mm 的LED 導光板,4條LED 燈水平均勻放置在光箱底部,導光板與光箱底部保持1 200mm 的距離。
Fig.2 Self made light box圖2 自制拍攝光箱
拍攝采用FUJIFILM X-T100 相機,圖片輸出格式為PNG 無損壓縮格式,4 000*6 000 分辨率,拍攝時將相機固定在俯拍支架,經(jīng)反復試驗,固定設(shè)置為:與拍攝臺保持5 300mm 的高度,鏡頭焦距調(diào)整為18mm,白平衡設(shè)為自動,閃光燈強制關(guān)閉,快門速度值為1/30s,光圈F 值為5.6,感光度ISO 值為200,此條件下能獲得清晰準確的圖像。
為了避免操作機頂快門鍵時機身產(chǎn)生微小抖動帶來的圖像模糊問題,拍攝時采用藍牙遙控器拍攝,葉片方向水平,葉柄朝向右,葉片正面朝上。本實驗光箱采用下光源拍攝,經(jīng)試驗發(fā)現(xiàn)采用此拍攝方法在圖片顯示上竹子的細小紋理更清晰,更能減少拍攝時出現(xiàn)的反光和陰影,可在一定程度上消除噪點,減少操作不當造成拍攝板留下的臟點、刮痕等問題。
預處理主要是為了提高圖像質(zhì)量,可采取人為或者通過機器方式提供更有用的信息[10]。試驗中雖然在前期圖像采集和拍攝上一定程度地減少了圖像噪聲、不清晰、背景干擾等問題,但葉片圖像并未達到理想狀態(tài),因此在Microsoft Windows10 操作系統(tǒng)上試驗,使用MATLAB 2018b編程環(huán)境進行預處理,算法總體步驟如圖3 所示。
Fig.3 Pretreatment process圖3 預處理流程
數(shù)碼相機鏡頭拍攝的圖片會因為鏡頭模型選擇產(chǎn)生鏡頭幾何畸變[11],影響后續(xù)試驗數(shù)據(jù)的準確性,因此首先在MATLAB 中的Camera Calibrator 工具箱中進行相機標定,選用30 張正友棋盤格標定板進行標定,得到重投影誤差小于0.5(實際0.4)的相機參數(shù)對原始圖像進行矯正,如圖3(a)所示,矯正后的圖像用于顏色特征提取。
再將矯正過的彩色圖像利用加權(quán)平均值法轉(zhuǎn)化為灰度圖像,加權(quán)平均值法是將彩色圖像中的三分量R(紅色)、G(綠色)、B(藍色)以不同的權(quán)值進行加權(quán)和平均,該平均值即該圖像的灰度值,實現(xiàn)將RGB 值轉(zhuǎn)換成灰度值[12]。人眼對于G(綠色)的視覺敏感度更高,對B(藍色)的視覺敏感度更低,因此,按照式(1)對三分量R(紅色)、G(綠色)、B(藍色)進行加權(quán)平均,這樣得到的灰度圖像更加合理,更符合人類的視覺感受[13]。
轉(zhuǎn)化后的灰度圖像由于圖片質(zhì)量較暗沉,光線分布不均,紋理不明顯,后續(xù)采用伽馬矯正,通過非線性變換調(diào)整像素值,進而改善圖像整體亮度[14]。該算法主要步驟如下:
首先,將輸入圖像的所有像素值進行歸一化,使其值域分布在[0,1]區(qū)間;其次,通過給定的γ 值對像素值進行非線性映射,其計算過程如式(2)所示。
其中,I 為輸入圖像的像素值,(fI)為輸出的非線性映射值,γ 為非線性映射參數(shù)。需要指出,不同的γ 值對圖像亮度質(zhì)量的改善效果不盡相同。當γ<1 時,圖像的灰度值增大,整體亮度提高且對比度增強;而當γ>1 時,圖像灰度值減小,整體亮度降低,但也能在一定程度上增強圖像對比度。最后,對所得像素值進行反歸一化,使得像素值的值域擴大到[0,255],從而獲得伽馬校正后的圖像[15]。根據(jù)最終實驗效果,選取參數(shù)值γ=0.45 進行校準,如圖4(b)所示,伽馬矯正后的圖片用于紋理特征提取。
用大津閾值法將伽馬矯正后的灰度圖像轉(zhuǎn)化為二值圖像,實現(xiàn)圖像分割,突出葉片邊緣部分,葉片圖像基本無噪點。再使用開運算和閉運算相結(jié)合的方法對葉片圖像進行形態(tài)學處理,能更好地填充內(nèi)部空洞和圖像凹角點、消除離散點和“毛刺”,如圖4(c)所示,最終得到的二值圖像用于幾何特征提取。
Fig.4 Pretreatment results of Phyllostachys heterophylla圖4 菲白竹預處理結(jié)果
1.4.1 顏色特征
顏色特征是葉片圖像的重要特征,每種植物葉片可能存在不同的顏色分布,本文采用RGB 三階顏色矩提取顏色特征,可以有效地表示顏色分布情況,顏色信息主要分布在低階矩中,其中有一階矩(均值)、二階矩(方差)、三階矩(斜度skewness)[16],一階矩表示每個顏色分量的平均強度,二階矩表示顏色區(qū)域內(nèi)的不均勻性,三階矩表示顏色的不對稱性,數(shù)學計算如式(3)—式(5)所示,可通過Matlab 中的mean2()函數(shù)、std()函數(shù)、skewness()函數(shù)實現(xiàn)計算。
其中,M是像素數(shù)量,Pij是第j個像素的第i個顏色分量。RGB 彩色圖像的顏色矩一共有9 個分量,每個顏色通道均有3 個低階矩,因此每張圖像有9 個顏色特征。提取的顏色特征參數(shù)值如表1 所示。
1.4.2 紋理特征
紋理灰度分布是在空間位置上反復出現(xiàn)而形成,且在圖像灰度的空間特性中有一定距離的兩個像素之間存在一定灰度關(guān)系?;叶裙采仃囀且环N通過研究這種空間特性上的灰度關(guān)系描述紋理的常用方法。因此,本文采用灰度共生矩陣[17]的紋理特征統(tǒng)計值有以下幾種:
(1)能量。灰度共生矩陣元素值的平方和,顯示圖像灰度分布的均等程度和紋理粗細程度。若共生矩陣的所有值均相等,則能量值??;相反,如果其中一些值大而一些值小,則能量值大。當元素集中分布在共生矩陣時,能量值大,則是一種平均規(guī)律變化的紋理模式。如式(6)所示。
Table 1 Color characteristic parameters of different bamboo species表1 不同竹子種類顏色特征參數(shù)
(2)對比度。體現(xiàn)了圖像的清晰程度和紋理深度。紋理越深,對比度越大,視覺感受越明顯;反之,對比度越小,溝紋越淺,視覺效果越模糊?;叶炔畋硎緦Ρ榷却蟮南袼貙υ蕉啵瑢Ρ榷戎翟酱?。灰度公共矩陣中遠離對角線的元素值越大,對比度越大。如式(7)所示。
(3)相關(guān)。顯示空間灰度共生矩陣元素在行或列方向上的相似性,因此相關(guān)值的大小表示圖像的局部灰度相關(guān)性。當矩陣的元素值均等時,相關(guān)值越大;反之,矩陣的元素值相差越大,則相關(guān)值越小。如果圖像中有水平方向上的紋理,則水平方向上的矩陣相關(guān)值大于其余矩陣的相關(guān)值。如式(8)所示。
其中,M 為灰度級數(shù)。
(4)熵。它是圖像所具有的信息量的度量,紋理信息也是圖像信息,并且是隨機性的度量,當共生矩陣中所有元素具有最大的隨機性,且空間共生矩陣中所有值幾乎相等,共生矩陣中元素分散分布時,熵較大,這體現(xiàn)了圖像中紋理的不均勻性或復雜度。如式(9)所示。
(5)均勻度。反映圖像紋理的粗糙程度,較粗的紋理,均勻度較大,細紋理的均勻度較小。如式(10)所示。
此外用到了Matlab 工具箱里的一個求灰度共生矩陣的graycoprops()函數(shù)。提取的紋理特征參數(shù)值如表2 所示。
Table 2 Texture characteristic parameters of different bamboo species表2 不同竹子種類紋理特征參數(shù)
1.4.3 幾何特征
幾何特征提取葉片的長軸、短軸、面積、周長4 個絕對性幾何指標,以及形狀參數(shù)、狹長度、7 個不變矩9 個相對性幾何指標,一共13 個幾何特征。
(1)葉片長軸。目標區(qū)域上距離最大的兩個像素點之間的連線段。
(2)葉片短軸。與長軸垂直相對并且距離最遠的兩個像素點之間的連線段。
(3)葉片面積。葉片目標區(qū)域內(nèi)部所包含的像素數(shù)目。
(4)葉片周長。其值為葉片目標區(qū)域邊界的像素數(shù)之和。
(5)圓形度。為葉片面積參數(shù)和周長參數(shù)的計算值,如式(11),能夠反映葉片是接近圓形還是扁長形。
式中,Sleaf為葉片的面積,Lleaf為葉片的長。
(6)狹長度。它是葉片長和寬的比值,如式(12),可以用于描述葉片的狹窄程度。
式中,Wleaf為葉片的寬,Lleaf為葉片的長。
(7)Hu 不變矩(7 階不變矩)。同一圖像旋轉(zhuǎn)、收縮或鏡像后的圖像其7 階矩基本保持不變,也即其具有比例、平移、尺度等特性的不變特征[18],這一特性可用于圖像識別領(lǐng)域。
圖像f(x,y)的(p+q)階幾何矩定義為式(13)。
零階矩如式(14)。
一階矩如式(15)、式(16)。
一階矩(m10,m01)用于確定圖像質(zhì)心(xc,yc),計算如式(17)。
若將坐標原點移至xc和yc處,就得到了對于圖像位移不變的中心矩,如式(18)。
為了得到矩的不變特性,定義歸一化的中心矩如式(19)。
式(19)中,標準化因子r=,p+q=2,3,4…
利用歸一化的中心矩統(tǒng)計量,Hu 在上述公式的基礎(chǔ)上提出了7 個幾何矩的不變量,這些不變量滿足圖像平移、伸縮和旋轉(zhuǎn)不變,用來描述葉片圖像的幾何特征,如式(20)—式(26)。
在提取到包含11 種竹類葉片顏色、紋理、形狀特征的27 維特征值后,由于這3 類特征數(shù)據(jù)的量綱不同,將數(shù)據(jù)標準化后的特征參數(shù)作為分類方法的輸入向量,用于植物葉片分類。本文選擇MATLAB APP 中的Classification Learner進行分類。Classification Learner 可以應用訓練模型對數(shù)據(jù)進行分類,并包含了查看數(shù)據(jù)、選擇特性、指定驗證方案、訓練模型,以及評估結(jié)果等功能選擇,也可以執(zhí)行自動訓練以搜索最佳分類模型,模型包括決策樹、判別分析、支持向量機、邏輯回歸、集成學習等。本文選擇了集成學習方法中的Bagging 算法,Bagging 算法主要通過隨機有放回抽樣方法形成子數(shù)據(jù)集,然后生成差異化的子訓練集,再將這些訓練子集獲得的子分類器組合成集成分類器集合[19]。其核心思想就是融合了許多弱分類器的結(jié)果,形成一個高質(zhì)量高效率的集成模型,以達到最優(yōu)分類效果[20],在特征數(shù)據(jù)集無需歸一化的條件下,也能處理較高維的數(shù)據(jù),且具有很高的準確率,不容易過度擬合。訓練前,采用系統(tǒng)默認的5 倍交叉驗證方法,樣本總?cè)萘繛?40,并隨機將數(shù)據(jù)集的70%用作訓練集,30%用作驗證集。
實驗中,選取白紋女竹、大節(jié)竹、菲黃竹、南平倭竹、羅漢竹、菲白竹、金鑲玉竹、黃桿烏哺雞竹、桂竹、花毛竹、積古丹竹共11 種不同的竹類葉片。為確保分類精度的可靠性,對不同的方法進行20 次驗證集試驗,計算其分類平均準確度,標準差為偏差;實驗分類結(jié)果如表3 所示。從表3的實驗分類結(jié)果數(shù)據(jù)可以得出,在葉片種類識別中,對于單種特征的分類準確率,葉片的顏色特征對準確率貢獻最大,平均準確率可達90.96%,而紋理特征準確率貢獻最低,平均準確率為72.88%;在兩種特征組合中,顏色特征分別與幾何、紋理特征組合的方法其平均分類準確率也在90%以上,分別為92.84%、92.57%;而3 種特征組合的平均準確率最高為94.02%??梢钥闯?,組合特征的準確率大體高于單種特征的平均分類準確率。
為進一步觀測本文組合方法的有效性,選取平均準確率最高的前3 種組合方法作比較,其20 次試驗的準確率如圖5 所示。
可以看出,3 種特征組合(紋理特征+幾何特征+顏色特征)的準確率為93.2%~94.5%,兩種特征組合的準確率分別為91.8%~93.4%(紋理特征+顏色特征)、91.1%~93.4%(顏色特征+幾何特征)。通過比較可得3 種特征組合的準確率最高,因此,本文取其中一次試驗的分類結(jié)果計算出混淆矩陣如圖6 所示,將11 種竹類標號為1,2,…,11,竹子類別1 實際有40 個樣本,沒有被錯誤分類到其他類別的樣本,分類準確率為100%,竹子類別2 實際有40 個樣本,其中有39個樣本被正確分類到類別2,有1 個樣本被錯誤分類到類別9,分類準確率為98%,類別3,4,…,11 的分類準確率分別為93%、100%、80%、90%、93%、93%、95%、100%、98%,平均準確率為94.3%。
Table 3 Experimental classification results表3 實驗分類結(jié)果
Fig.5 Classification accuracy of different combination methods for bamboo leaf images圖5 不同組合方法對竹類葉片圖像的分類準確率
Fig.6 Confusion matrix of the method in this research圖6 本實驗研究方法的混淆矩陣
本文在嚴格控制提取竹類葉片多種特征條件的基礎(chǔ)上,如采集方法、拍攝方式、特征提取算法等,在機器視覺下探究了多種特征相互組合的方法進行分類試驗,通過不同組合方式的比較結(jié)果表明,在機器視覺下紋理特征、顏色特征、幾何特征3 種特征組合的方法平均分類準確率較高,為94.02%,最高準確率可達94.5%,為研究竹子分類提供了一種在計算機領(lǐng)域?qū)崿F(xiàn)的可能性,解決了一些較為常見竹種的分類問題。雖然該方法取得了較好的分類結(jié)果,但是也有一些問題需要解決,比如:①竹類葉片大都相似,在自然狀態(tài)下不易區(qū)分,本文也是在有限數(shù)量的竹子種類中進行分類研究,一個竹種僅靠葉片部位確定類別往往具有局限性,未來可能需要探究機器視覺下竹子其他部位特征與竹子葉片特征組合的分類方式;②本文著重于分類方法研究,在優(yōu)化分類器算法方面并未深入研究,因此分類準確率還有很大提升空間;③在后續(xù)研究中,應設(shè)計人性化可視化操作界面,在用戶的手機客戶端實現(xiàn)竹子分類,推進其實際應用。