曾 磊,曾芳艷,馮午陽,張書真,宋海龍
(吉首大學信息科學與工程學院,湖南 吉首 416000)
目前,椪柑主要依靠果農(nóng)或冷機械進行手工分級,存在速度慢、精度低和人為影響因素多等缺點,因此椪柑自動分級得到了廣泛關注.國內(nèi)外專家對水果的自動分級處理提出了一些有效的算法,如李國進等[1]針對芒果的外觀品質(zhì)提出了一種基于芒果面積、等效橢圓長短軸之比、H分量均值和缺陷面積所占百分比的多特征參數(shù)分級方法;王樹文等[2]通過提取缺陷等3個特征進行了番茄損傷自動檢測與分類;以哈密瓜、枸杞、紅棗等為對象的無損檢測與分級算法也獲得了廣泛研究[3-5].筆者以湘西椪柑為研究對象,根據(jù)四川省出臺的《柑橘等級規(guī)格》標準[6],擬設計一種基于顏色與缺陷檢測的椪柑分級算法,為椪柑分級提供科學依據(jù).
本設計中椪柑分級算法主要由圖像預處理、特征提取和決策樹判定3個基本模塊構(gòu)成.圖像預處理包括椪柑目標區(qū)域的分割;特征提取涉及色澤、缺陷面積等特征參數(shù)的提取;決策樹判定是采用決策樹對色澤和缺陷面積2個特征參數(shù)進行融合及分級判定.整個算法的流程如圖1所示.
圖1 算法流程Fig. 1 Flowchart of the Proposed Algorithm
分級系統(tǒng)對圖像中椪柑的外部特征進行識別檢測.為了辨識和分析目標,需要提取椪柑目標區(qū)域,以便進一步分級.在工業(yè)化的椪柑分級過程中,系統(tǒng)傳送裝置構(gòu)成圖像的背景,在背景與椪柑圖像的交界處灰度值有較大突變,因此筆者考慮采用閾值分割法對椪柑目標區(qū)域進行提取.
(1)閾值分割.閾值分割是一種對原圖像的像素集合進行劃分的方法,將原圖像視作擁有不同灰度級范圍的2類區(qū)域的組合,即椪柑區(qū)域與背景的組合.分割前,首先將彩色椪柑圖像轉(zhuǎn)換為灰度圖像.設椪柑灰度圖像的像素點為p(x,y),其中(x,y)表示像素點坐標.根據(jù)灰度直方圖得到椪柑區(qū)域的灰度范圍[Kmin,Kmax],進而將圖像分割為2個區(qū)域.定義分割后的圖像為
(1)
(1)式中通常取b0=1,b1=0.多張椪柑圖像的平均灰度直方圖如圖2所示.
從圖2可以看出,有2個相距較遠的峰值區(qū)域,第1個峰值區(qū)域?qū)獥崭虆^(qū)域,第2個峰值區(qū)域?qū)尘皡^(qū)域,明確的目標區(qū)域灰度范圍為[108,221].根據(jù)(1)式對椪柑灰度圖像進行閾值分割,分割后的圖像中椪柑區(qū)域為白色,背景區(qū)域為黑色(圖3).
圖2 多張椪柑圖像的平均灰度直方圖Fig. 2 Average Gray Histogram of Ponkan Images
圖3 閾值分割前后對比Fig. 3 Contrast Diagrams Before and After Threshold Segmentation
(2)填充孔洞.閾值分割后得到的椪柑圖像其表面可能存在孔洞,這對后續(xù)的椪柑彩色圖像區(qū)域的提取造成影響.形態(tài)學的閉運算能較好地處理連通區(qū)域中的孔洞問題,圖像t通過結(jié)構(gòu)元素b進行閉運算,該操作可以表示為
t·b=(t⊕b)?b.
(2)
圖4 孔洞填充后的圖像Fig. 4 Result Diagram After Filling Holes
(2)式表明,圖像t先由b進行膨脹,再由b進行腐蝕.圖像經(jīng)閉運算可以去除較小的暗色細節(jié),達到填充孔洞的目的.圖3中目標椪柑區(qū)域的黑色像素點為孔洞,孔洞填充后的圖像如圖4所示.
(3)彩色圖像中椪柑目標區(qū)域的提取.原圖像經(jīng)過閾值分割和孔洞填充后,實際上已獲得椪柑目標區(qū)域.后續(xù)的特征參數(shù)提取是在顏色空間中完成,因此需要提取原彩色圖像中的椪柑目標區(qū)域.具體處理如下:將已獲得的二值圖像與原椪柑彩色圖像的R,G,B分量分別進行與運算,再合成運算后的3幅圖像,即可得到椪柑彩色圖像的目標區(qū)域.椪柑彩色圖像的目標區(qū)域提取過程如圖5所示.
圖5 椪柑彩色圖像的目標區(qū)域提取過程Fig. 5 AND Operation Diagrams of Color Component and Diagram of the Extracted Target Region
椪柑的主要外觀特征有果形、顏色和表面缺陷等,影響椪柑品質(zhì)的因素包括表面缺陷面積大、果皮顏色青澀和果皮顏色分布不均等.基于此,筆者采用色澤和缺陷面積2個特征作為椪柑分級的依據(jù).
2.2.1 色澤參數(shù) 果皮表面顏色與內(nèi)在品質(zhì)和成熟度有著密切的關系,色澤特征的提取將在RGB顏色空間中進行.RGB空間是最常見的一種顏色空間,根據(jù)三基色原理,在RGB顏色空間,任意的顏色都可以用R,G,B三基色分量按照不同比例混合而成.由三基色原理可知:藍色分量為0時,等量的紅色分量和綠色分量合成黃色;當紅色分量大于綠色分量時,接近黃橙色.在實際的檢測中發(fā)現(xiàn),椪柑目標區(qū)域的藍色分量不為0,特等品椪柑圖像中的椪柑區(qū)域,其藍色分量都小于某一個固定小值,且對椪柑顏色的影響很小.因此,在色澤參數(shù)提取過程中可以不考慮藍色分量的影響.本研究中色澤參數(shù)直接體現(xiàn)在椪柑區(qū)域黃色像素的占比上,像素是否判為黃色是色澤特征提取的關鍵.根據(jù)上述分析,像素是否判為黃色與像素中紅色分量的取值有關,為此筆者提出如下的色澤參數(shù)提取方法:
Setp 1 設圖像中椪柑目標區(qū)域的綠色像素數(shù)目Gt=0,黃色像素數(shù)目Yt=0;令任意某個像素的坐標為(x,y),判定像素是否為黃色的經(jīng)驗閾值為I.
Step 2 分別提取目標區(qū)域像素點的R分量r(x,y)、G分量g(x,y)、B分量b(x,y).
Step 3 若r(x,y)>I,則執(zhí)行下一步;否則,判定該像素點為綠色像素,Gt加1.
Step 4 比較r(x,y)和g(x,y)的大小.若r(x,y)>g(x,y),則判定該像素點為黃色像素,Yt加1,否則,該像素點為綠色像素,Gt加1.
Step 5 遍歷椪柑目標區(qū)域所有的像素點,統(tǒng)計該區(qū)域中黃色像素的總數(shù)目Yt,綠色像素的總數(shù)目Gt.
Step 6 計算Yt/(Yt+Gt),得到椪柑區(qū)域的黃色像素占比,即椪柑區(qū)域的色澤參數(shù).
圖6 椪柑缺陷標記前后的對比圖像Fig. 6 Contrast Diagrams Before and After Marking
2.2.2 缺陷面積參數(shù) 受自然環(huán)境、采摘、運輸和存儲等因素的影響,椪柑的表皮不可避免地存在一些缺陷,如刺傷、裂果、蟲孔、腐爛和干疤等,椪柑缺陷面積的大小是椪柑分級的重要依據(jù).由于好表皮的顏色都為黃橙色,而缺陷處表皮的顏色普遍偏灰黑色(顏色更暗,與黃橙色的區(qū)別比較明顯),因此本算法將從果皮表面顏色來判斷是否為缺陷,然后以缺陷面積的大小確定椪柑的品級.從色澤參數(shù)提取過程可知,R,G分量的合成顏色對椪柑黃色影響最大,故對目標區(qū)域的各像素用R,G分量來判斷是否為缺陷像素.分析不同等級椪柑圖像的R,G分量,最終將116和66分別作為R,G分量的閾值.當椪柑區(qū)域中某個像素點的R,G分量都小于其閾值時,將該像素點標記為缺陷像素,并在實驗中遍歷椪柑目標區(qū)域像素點以統(tǒng)計缺陷像素點的總數(shù)目.
為了計算缺陷面積,采集椪柑圖像時,在處于同一距離、同一水平高度的位置設置一參照物,參照物圖像同樣進入采集攝像系統(tǒng).在包含參照物的圖像中統(tǒng)計參照物像素點個數(shù),由此可知每個像素點的實際物理值,即椪柑缺陷面積.缺陷標記前后的對比圖像如圖6所示.
圖7 決策樹判定模型Fig. 7 Decision Tree Model
根據(jù)四川省出臺的《柑橘等級規(guī)格》標準,筆者將關于色澤和缺陷的描述轉(zhuǎn)換為椪柑分級中色澤參數(shù)和缺陷面積參數(shù)的量化指標,并根據(jù)這些指標來構(gòu)造決策樹判定模型,對椪柑樣本進行分級判定.決策樹判定模型如圖7所示,其中C表示目標區(qū)域黃色像素占比,S表示目標區(qū)域缺陷面積大小(單位mm2).
在主頻1.8 GHz,內(nèi)存4 GB,處理器型號AMD A8-7100Radeon R5的計算機上,以湘西椪柑為實驗對象,利用MATLAB R2014a仿真軟件進行仿真實驗.根據(jù)四川省出臺的《柑橘等級規(guī)格》標準,將椪柑分為3個等級.從不同等級中各選取20個椪柑作為測試樣本,分別利用基于色澤的分級算法、基于缺陷面積的分級算法和新算法對椪柑測試樣本進行自動分級,實驗結(jié)果列于表1.
表1 不同算法的椪柑分級結(jié)果比較Tabel 1 Comparison of Ponkan Grading Results by Different Algorithms
由表1可知:采用基于單一特征的2種分級算法對一等品和二等品椪柑進行分級時,誤判率較大;采用新算法進行椪柑分級時,分級結(jié)果的正確率總體較高,二等品的準確率高達100%.在基于色澤參數(shù)進行分級時,造成一等品和二等品被誤判為特等品的主要原因是有些缺陷面積的顏色接近于正常黃色.在基于缺陷面積分級時,椪柑分級正確率較低,這表明單獨采用缺陷面積進行分級處理并不適應于實際應用場景.雖然基于新算法的椪柑分級正確率高,但是因為難以實現(xiàn)椪柑表面照明的絕對均勻,所以椪柑邊緣可能會被誤判為缺陷區(qū)域.有些缺陷區(qū)域(如干疤等)因R,G分量滿足色澤參數(shù)的條件而被誤判為黃色,這導致黃色像素占比增加,從而會將一些一等品椪柑判定為特等品.這些原因均降低了分級的正確率.
針對湘西椪柑人工分級存在速度慢、精度低、人為影響因素多、自動化程度低等不足,提出了基于多特征融合的椪柑自動分級算法.該算法在椪柑圖像預處理的基礎上,引入色澤和缺陷面積2個特征參數(shù),使用決策樹對椪柑進行分級.實驗結(jié)果表明,與基于單一特征的椪柑分級結(jié)果相比,所提算法利用特征之間的互補實現(xiàn)了更高性能的分級.光照不均對分級的魯棒性影響較大,如果能進行光照補償預處理,椪柑的分級正確率就有望進一步提升.