陳妙婷 楊廣蕾 秦鵬濤
摘? 要:針對名優(yōu)茶嫩芽自動采摘問題,采用SVM學習算法實現(xiàn)對名優(yōu)茶嫩芽圖像自動分割。通過提取嫩芽像素點與背景像素點的RGB及(R-B)特征,將4個特征按重要性組合為3個特征組,分別是RGB特征組、RGB+(R-B)特征組和G+(R-B)特征組,利用3個特征組分別構(gòu)建SVM嫩芽分割模型。在收集的多幅圖像上的實驗表明G+(R-B)特征組構(gòu)建的分割模型分割得到的嫩芽圖像較為完整,且用時均低于0.5 s,滿足名優(yōu)茶嫩芽自動采摘的要求。
關(guān)鍵詞:自動采摘;SVM;圖像分割
中圖分類號:TP391? ? ? ?文獻標識碼:A 文章編號:2096-4706(2021)02-0089-04
Abstract:Aiming at the problem of automatic picking of famous tea buds,the SVM learning algorithm is used to realize the automatic segmentation of the image of famous tea buds. By extracting the RGB and(R-B)features of the bud pixels and the background pixels,the four features are combined into three feature groups according to their importance. They are RGB feature group,RGB+(R-B)feature group and G+(R-B)feature group. Three feature groups were used to construct SVM buds segmentation models. Experiments on several collected images show that the segmentation model constructed by G+(R-B)feature group can obtain relatively complete bud images,and the segmentation time is less than 0.5 s,which meets the requirements of automatic picking of famous tea buds.
Keywords:automatic picking;SVM;image segmentation
0? 引? 言
圖像分割是機器視覺處理與分析的首要一步也是較為關(guān)鍵的一步,準確的圖像分割對后續(xù)的圖像及行為識別尤為重要。目前主流的圖像分割算法主要有兩類:一是基于邊緣檢測的分割方法,圖像最基本的特征是邊緣,邊緣檢測的原理是利用圖像一階導數(shù)的極值或二階導數(shù)的過零點信息為判斷邊緣點提供基本依據(jù);二是基于區(qū)域的分割方法,種子生長法是最典型的基于區(qū)域的分割方法,其原理是根據(jù)目標像素灰度級與背景像素灰度級的不同,將物體從背景中較好地分割出來[1,2]。隨著人工智能和機器學習的不斷發(fā)展,圖像分割也不再僅僅依賴于單純的數(shù)字圖像處理技術(shù),越來越多的學習方法[3]開始應(yīng)用于圖像的分割與識別當中。
名優(yōu)茶嫩芽自動采摘中,視覺系統(tǒng)最終要輸出的是采摘點的三維坐標,但求取準確的三維坐標的前提是獲得完整的茶葉嫩芽輪廓圖像。茶葉就其自身生長特性,嫩芽和老葉的區(qū)分界限并不是很明顯,加之嫩芽區(qū)域小且多,這些都為嫩芽圖像的分割增加了難度。韋波[4]對茶葉圖像RGB顏色空間中的G分量進行閾值處理并對嫩芽進行輪廓提取,最終得到粗略的分割結(jié)果,但整體輪廓并不完整。唐仙等[5]對茶葉圖像RGB顏色空間中的色差(R-B)利用Ostu法和迭代閾值法進行分割,能夠?qū)崿F(xiàn)嫩芽的完整提取,但是噪聲較多。汪建[6]采用HIS顏色空間,減少光照的影響,對圖像采用區(qū)域生長法來提取嫩葉輪廓。以上算法都能實現(xiàn)圖像的分割,但對圖像畫質(zhì)的要求較高,處理后有噪聲,且局限性較大。
本文借助機器學習的方法來實現(xiàn)名優(yōu)茶嫩芽圖像的自動分割。對于嫩芽圖像的分割,本質(zhì)是嫩芽像素點與背景像素點的分類問題。目前應(yīng)用較廣的分類學習算法有邏輯回歸算法和SVM(support vector machine)算法等??紤]到SVM算法在解決小樣本二分類問題上的優(yōu)勢[7,8],因此本文利用SVM算法對名優(yōu)茶圖像進行分割。首先提取合適的樣本點用于SVM模型的訓練,然后對比3個特征組對分割結(jié)果和處理時間的影響。
1? 名優(yōu)茶嫩芽分割過程
1.1? 整體分割流程
本文利用SVM算法進行名優(yōu)茶嫩芽圖像分割的總體實現(xiàn)流程如下。
1.1.1? 樣本預處理
要訓練SVM模型,首先要對訓練樣本進行預處理。預處理包括圖像降噪和樣本選?。?/p>
(1)圖像降噪:拍攝到的圖像往往因為外界影響產(chǎn)生各種噪聲,所以在進行訓練前要對圖像進行平滑處理,去除有影響的噪聲,使后續(xù)分割結(jié)果更加準確。
(2)樣本選取:在去噪后的圖像中選出具有代表性的嫩芽樣本點與背景樣本點。
1.1.2? 生成訓練模型
訓練SVM模型主要是提取樣本中對實驗有益的特征以及訓練模型所需的核函數(shù),這兩方面都對最后的分割結(jié)果產(chǎn)生很大的影響。特征是對圖像進行分割的主要依據(jù),特征選取的準確不僅能使分割結(jié)果更加準確,分割消耗的時間也會大大降低;模型所需的核函數(shù)是制約分割計算量的關(guān)鍵,這需要根據(jù)實際的分割要求進行權(quán)衡。
1.1.3? 分類器測試
對測試圖像進行同等的圖像降噪處理后,利用生成的分類器對圖像進行分割,觀察分割結(jié)果。若分割結(jié)果不滿足要求,則對模型中的參數(shù)進行適當調(diào)整。
圖1給出了整體的分割流程總框圖。
1.2? 特征提取
名優(yōu)茶嫩芽與老葉的區(qū)別主要是顏色的差異,所以提取特征主要是像素的RGB值。其中綠色的信息最有價值,所以G值為最主要的特征??紤]到(R-B)值[9]對于以綠色為主調(diào)的圖像區(qū)分度最明顯,所以也將該特征值加以訓練。圖2為測試圖像原圖與其(R-B)單通道圖的對比。但是過多的特征使分割處理時間增加,影響工作效率。因此本實驗采取3組對照實驗,分別是以RGB組成的特征組、以RGB和(R-B)組成的特征組以及以G和(R-B)組成的特征組,通過實驗比較分割結(jié)果和處理時間。
1.3? 訓練與測試
SVM分類算法的基本思想[10-12]是在樣本空間里尋找使兩類樣本最小間隔最大化的最優(yōu)超平面,數(shù)學表達式如式(1)所示:
其中ω為超平面法向量,b為閾值,C為懲罰因子,它控制對錯分樣本的懲罰程度,ζi為松弛變量,表示訓練時允許出現(xiàn)一些錯分類的點。
式(1)是典型的凸優(yōu)化問題,可以利用Lagrange乘子法將其轉(zhuǎn)化為對偶問題再進行求解,如式(2)所示:
其中αi、αi為Lagrange乘子,K(x,xi)為核函數(shù)。假定求解得到的最優(yōu)Lagrange乘子為α*,進而反求得最優(yōu)超平面的ω*和b*,從而最終的決策函數(shù)如式(3)所示:
在SVM模型訓練過程中,重要的是核函數(shù)和懲罰因子的選擇[13],但目前學術(shù)界對其并沒有具體的選擇原則,只能憑研究領(lǐng)域的經(jīng)驗和多次實驗挑選合適的參數(shù)。
茶葉采摘要求的是高效率和高質(zhì)量,所以對于嫩芽圖像分割既要求分割完整又要求處理迅速。經(jīng)多次實驗,綜合考慮多方面要求最終選定多項式核函數(shù),該核函數(shù)公式如式(4)所示:
利用該多項式核函數(shù)訓練模型時,分割得到的嫩芽完整,用時短。d為多項式核函數(shù)的冪次,d越大,算法越復雜運行時間越長,綜合考慮處理精度和運行時間最終對d取3。對于懲罰因子C的選擇,考慮到后續(xù)還要對圖像進行濾波和形態(tài)學處理等操作,所以可以在節(jié)省時間的前提下舍棄部分錯分類點,所以對C取0.8。
2? 實驗結(jié)果與分析
2.1? 實驗數(shù)據(jù)采集
本實驗樣本是在上午十點陽光適中時在嶗山地區(qū)拍攝的一組茶葉圖像,共計挑選出合適測驗的圖像50張,從中選出3張背景內(nèi)容較豐富的圖像用于點選訓練樣本集。
2.2? 實驗設(shè)置
2.2.1? 樣本集的選取
在挑選出的3張背景內(nèi)容豐富的圖像中,每張選取40個嫩芽像素點和40個背景點,圖3為1張樣本圖像中選取的樣本點,其中星狀點為背景樣本點,圓形點為嫩芽樣本點。分別求取每個像素點的R、G、B和(R-B)值,剔除重復的數(shù)據(jù)和無效的數(shù)據(jù),依據(jù)所分定的特征組形成3組特征矩陣,用于后續(xù)的訓練和測試。其中特征組1為RGB特征組,特征組2為RGB+(R-B)特征組,特征組3為G+(R-B)特征組。
2.2.2? SVM模型訓練
用3組特征矩陣進行SVM模型訓練后,先嘗試對這3張樣本圖像進行分割,如果分割準確率達90%以上,則認為特征矩陣選取正確;如果分割準確率低于90%,則根據(jù)錯分割部分的像素信息在特征矩陣中進行增加或刪減,直至分割準確率達到90%以上。
2.3? 實驗結(jié)果分析
本實驗使用3組特征組對所有拍攝的茶葉圖像進行分割,圖4為使用3組特征組對五幅測試圖像的分割圖像結(jié)果,每行的圖從左往右依次為待分割原圖、特征組1分割結(jié)果、特征組2分割結(jié)果和特征組3分割結(jié)果。表1為3個特征值組對5幅測試圖像的分割時間。
由圖4可以看出3個特征組都可以將茶葉嫩芽分割出來,但比較相應(yīng)的分割結(jié)果可知,利用RGB+(R-B)特征組得到的嫩芽圖像更完整,其他兩種特征組分割的圖像嫩芽內(nèi)部孔洞較多,而且周圍噪聲也相對多一些。對比表1中的數(shù)據(jù)可知使用G+(R-B)特征組得到的分割圖像處理時間最短,使用RGB+(R-B)特征組得到的嫩芽圖像次之。由此可知圖像中的G值和(R-B)值是區(qū)分茶葉嫩芽與背景的最主要信息,單純利用這兩個信息進行茶葉圖像的分割可以得到基本令人滿意的結(jié)果。如果將分割速度作為首要指標,可以直接使用這兩個特征;如果要求較高質(zhì)量的分割結(jié)果,可以將這四個特征均列入處理當中。
實驗結(jié)果表明,將G值和(R-B)值組合作為特征進行茶葉嫩芽的分割可以同時滿足分割速度快和分割準確率高的要求,分割得到的嫩芽輪廓進行些許的圖像處理后便可用于嫩芽采摘點的求取。
要想進一步提高分割的準確率和降低分割處理時間,主要的方法一是不斷精化樣本點,使支持向量所占比例盡可能多;二是尋找使嫩芽與老葉區(qū)分度比較高的特征,減少影響較小的特征,這樣既可以減少計算量,同時也能減少冗余,提高計算準確率。對于部分未完整分割的圖像,主要原因是拍攝時光照使得部分葉片的顏色發(fā)生變化,從而使分割的結(jié)果出現(xiàn)較大的偏差。后續(xù)研究中拍攝圖像時會進行拍攝角度的調(diào)節(jié)或者增加遮光設(shè)備以減少原圖像對分割結(jié)果的影響。
3? 結(jié)? 論
本文針對名優(yōu)茶嫩芽圖像分割,通過得到準確的嫩芽圖像,為進一步得到準確的采摘點的位置做好鋪墊。在利用SVM算法對名優(yōu)茶嫩芽進行分割的過程中,首先選取嫩芽與背景區(qū)分度大的樣本點,在樣本點中提取RGB和(R-B)值組成3個特征組,分別為RGB特征組、RGB+(R-B)特征組和G+(R-B)特征組,利用3個特征組分別訓練模型,再利用訓練好的模型進行測試圖像分割,通過對比最后分割結(jié)果以及分割時間,分析得出僅使用G+(R-B)值分割圖像時所用時間最短,分割準確率也相對較好,并將此作為最終使用的分割方法。與此同時本方法也為其他綠色圖像分割處理提供參考。
參考文獻:
[1] 章毓晉.圖像分割 [M].北京:科學出版社,2001:78-90.
[2] GONZALEZ R C. Digital Image Processing [M].3rd ed. Upper Saddle River:Prentice Hall,2008.
[3] 周莉莉,姜楓.圖像分割方法綜述研究 [J].計算機應(yīng)用研究,2017,34(7):1921-1928.
[4] 韋波.基于顏色和形狀的茶葉計算機識別研究 [J].福建茶葉,2016,38(3):16-17.
[5] 唐仙,吳雪梅,張富貴,等.基于閾值分割法的茶葉嫩芽識別研究 [J].農(nóng)業(yè)裝備技術(shù),2013,39(6):10-14.
[6] 汪建.結(jié)合顏色和區(qū)域生長的茶葉圖像分割算法研究 [J].茶葉科學,2011,31(1):72-77.
[7] 薛志東,王燕,李利軍.SVM圖像分割方法的研究 [J].微計算機信息,2007(24):306-308.
[8] 胡濤,胡軍,郭杭.基于SVM鄰域?qū)W習的視頻目標檢測方法 [J].現(xiàn)代電子技術(shù),2017,40(14):95-98.
[9] 韋佳佳.名優(yōu)茶機械化采摘中嫩芽識別方法的研究 [D].南京:南京林業(yè)大學,2012.
[10] 鄧乃揚,田英杰.支持向量機:理論算法與拓展 [M].北京:科學出版社,2009:10-35.
[11] BURGES C J C.A Tutorial on Support Vector Machines for Pattern Recognition [J].Data Mining and Knowledge Discovery,1998,2:121-167.
[12] 袁志華,楊百龍,趙文強,等.基于支持向量機的NSCT域自適應(yīng)圖像水印算法 [J].計算機應(yīng)用研究,2018,35(6):1793- 1796.
[13] CHANG C C,LIN C J. LIBSVM:A library for support vector machines [J/OL].ACM Transactions on Intelligent Systems and Technology,2011,2(3):[2020-11-12].https://doi.org/10.1145/19611 89.1961199.
作者簡介:陳妙婷(1993—),女,漢族,河北衡水人,助教,碩士,研究方向:人工智能與圖像處理;通訊作者:楊廣蕾(1993—),女,漢族,山東淄博人,助教,碩士,研究方向:超硬磨料釬焊。