張婧婧 程蕓濤 達新民
(新疆農(nóng)業(yè)大學(xué)計算機與信息工程學(xué)院 烏魯木齊 830052)
K-means聚類是一種迭代求解的聚類分析算法,它根據(jù)樣本距離(相似性)將樣本聚成一類,使得同一簇內(nèi)的樣本相似度高,反之則差異性大。該算法以其易于實現(xiàn)、收斂速度快且聚類效果好的優(yōu)勢運用于圖像缺陷檢測[1]、遙感信息監(jiān)測[2]、等值建模[3]、物流中心選址[4]、案件預(yù)測[5]甚至腫瘤基因變異[6]等領(lǐng)域。本設(shè)計中針對紅富士蘋果分級過程中各類指標的處理要求,采用K-means聚類算法進行蘋果圖像分割及缺陷檢測,旨在為其它果類的自動分級設(shè)計提供參考。
《新疆阿克蘇蘋果質(zhì)量標準體系》中,紅富士蘋果分級主要針對紅色著色比、表面缺陷、果徑大小指標進行篩選。目前靜態(tài)的蘋果檢測方法雖較為精準[7~9],但難以滿足實時性要求。采用神經(jīng)網(wǎng)絡(luò)的方法建立蘋果等級模型,仍面臨學(xué)習(xí)速度慢、訓(xùn)練成本高、分級效率低的風(fēng)險[10]。此外,不同的機器學(xué)習(xí)方法中訓(xùn)練參數(shù)較為固定,不易根據(jù)不同種類蘋果而靈活改變評價標準。本設(shè)計基于K-means聚類算法對蘋果圖像進行分類,結(jié)合Gamma變換、OTSU算法,對蘋果大小、顏色、缺陷等特征建立模型,重點探討果類分級的快速方法與高效策略。
蘋果分級的主要指標為紅色著色比、表面缺陷、果徑大小,這三項指標的分級篩選在蘋果圖像處理過程中都需要進行果體區(qū)域與背景的分割,之后建立相應(yīng)的模型,由此產(chǎn)生了本設(shè)計中蘋果的快速分級策略,如圖1所示。
圖1 蘋果分級系統(tǒng)的設(shè)計
K-means聚類是一種較為經(jīng)典的類別劃分算法,在大規(guī)模數(shù)據(jù)進行聚類時廣泛采用。K-means算法以k為參數(shù),把n個對象分為k簇,使簇內(nèi)具有較高的相似度,而簇間的相似度較低。
K-means算法的具體實現(xiàn)流程為
設(shè)輸入樣本集為D={x1,x2,…,xm},聚類的簇樹k,最大迭代次數(shù)N,輸出是簇劃分C={C1,C2,…,Ck};
1)從數(shù)據(jù)集D中隨機選擇k個樣本作為初始的k個質(zhì)心向量:{μ1,μ2,…,μk}
2)對于n=1,2,…,N:
(1)將簇劃分為C,初始化Ct=φ,t=1,2…k;
(4)如果所有的k個質(zhì)心向量都沒有發(fā)生變化,則轉(zhuǎn)到步驟3);
3)輸出簇劃分C={C1,C2,…Ck}。
K-means聚類法主要用于數(shù)據(jù)集的類別劃分,實驗中采用K-means聚類首先完成了蘋果輪廓與背景的分割[11]。如圖2(a)所示,將蘋果原圖轉(zhuǎn)換到Y(jié)CbCr顏色空間?;赮CbCr圖片使用K-means算法進行聚類,設(shè)簇數(shù)為2,通過OTSU最大類間方差法得到最優(yōu)分閾值,將灰度圖轉(zhuǎn)換為二值圖,并使其黑白色顛倒,如圖2(b)。使用大小為10的模版對圖片做閉預(yù)算,并填充內(nèi)部小孔洞,得到的白色區(qū)域即為檢測得到的果實區(qū)域,蘋果面積為該區(qū)域的像素數(shù),實驗測得其像素值為62307,如圖2(c),將原圖點乘圖(c),得到去除背景后的實際果實區(qū)域如圖2(d)所示。
圖2 蘋果的輪廓分割
Gamma變換主要針對輸入圖像灰度值進行非線性操作[12],使輸出圖像灰度值與輸入圖像灰度值呈指數(shù)關(guān)系:
其中指數(shù)即為Gamma,圖像變換原理如圖3所示。
圖3 灰度變換示意圖
在圖3中,將原圖像f灰度變換到新圖像fN,f中灰度值低于low_in的像素點在fN中灰度值被賦值為low_out。同理,f中灰度值高于high_in的像素點變換到fN時其灰度值也被賦值為high_out。對于參數(shù)Gamma,當(dāng)Gamma<1時,灰度圖像靠近low_in的灰度值被升高,其灰度變化范圍被拉伸,灰度圖像靠近high_in的一端其值被壓縮,圖像對比度增強,實驗中采用此變換旨在加強顏色的閾值分割效果。
蘋果顏色分級實驗基于HIS顏色空間,利用色度值H(Hue色調(diào))分量提取蘋果表面紅顏色,并在H域?qū)麑崊^(qū)域做灰度變換,使得圖片果體變得更明亮,如圖4(b)所示;再通過Gamma變換將圖像中灰度值區(qū)間拉伸[13],得到更大的H域?qū)?yīng)分割閾值,顏色分級后的效果如圖4(c)所示。
圖4 顏色提取方法的測試效果
統(tǒng)計圖4中白色區(qū)域占整個蘋果區(qū)域的像素數(shù)占比,得到蘋果的紅色著色比為65.537%。
在顏色分級效果測試中,為了驗證HIS空間顏色提取、分級的優(yōu)勢,筆者將HIS空間的顏色提取與另一種超紅超綠算法[14]進行了對比分析。與本設(shè)計相區(qū)別,超紅超綠算法基于RGB顏色空間,對比效果如圖5所示。
圖5 顏色特征提取方法的對比效果
據(jù)實驗數(shù)據(jù)對比,就同一個蘋果圖片而言,超紅色-超綠色提取與HIS空間提取的差異很明顯。如圖5中全紅蘋果的著色比計算結(jié)果為超紅色-超綠色提取68.467%,HIS空間提取99.359%;條紋蘋果的著色比計算結(jié)果為前者32.187%,后者8.623%,實驗結(jié)果表明提取蘋果圖像中紅色特征分量時,超紅色-超綠色提取比HIS空間提取對光照更為敏感。
蘋果表面缺陷包括疤痕、腐爛、蟲咬、裂傷、碰壓傷等,呈現(xiàn)不規(guī)則形狀的缺陷類型,就圖像缺陷的灰度差異而言,無法設(shè)定一個固定的閾值完成分割。實驗中采用K-means方法在YCbCr顏色空間聚類,簇數(shù)設(shè)為3時缺陷檢測效果較好,如圖6所示。
圖6 蘋果缺陷的聚類效果
圖6(b)為YCbCr空間簇數(shù)為3的聚類效果,圖6(c)、(d)分別呈現(xiàn)G空間簇數(shù)為2,及B空間簇數(shù)為2的聚類對比實驗結(jié)果,不難看出,圖6(b)將蘋果正常果體和缺陷區(qū)域以及背景較好區(qū)分,隨后使用OTSU法得到轉(zhuǎn)換為二值圖的閾值,再將其轉(zhuǎn)換為黑白二值圖,使用大小為7的碟型結(jié)構(gòu)元素對圖片做開運算,填充空洞連接小物體,面積大小無明顯改變,如圖7所示。
圖7 圖片的開運算測試
去除較小的孤立區(qū)域,對連通域進行標記,獲取區(qū)域像素面積,并畫出BoundingBox圖,如圖8所示。
圖8 蘋果圖像的缺陷區(qū)域測試
計算上圖的輸出缺陷區(qū)域面積、蘋果總面積以及缺陷占比為缺陷區(qū)域面積:93956,蘋果面積:4443045,比率:2.115%。
基于蘋果的俯視圖,蘋果果徑大小測量只需先將果體與背景進行聚類分割,然后繪制其最小外接圓,即可計算其直徑,實驗中得到果徑像素為708.94,如圖9所示。
圖9 蘋果的果徑測量
基于Matlab-GUI工具,筆者進行了可視化系統(tǒng)的集成實驗,其界面設(shè)計如圖10所示。以某紅富士蘋果的三張樣本圖:左視圖、右視圖、俯視圖為例,分別設(shè)計了缺陷檢測、顏色分級與果徑測量的實驗環(huán)節(jié),最終以《新疆阿克蘇蘋果質(zhì)量標準體系》的紅富士分級標準,檢驗該蘋果的等級為“D”,即質(zhì)量沒有達到一、二、三級果的指標要求,符合實際檢驗結(jié)果。
與此同時,為了驗證系統(tǒng)能否符合流水線的實時作業(yè)標準,筆者對像素為278*288的蘋果圖像進行了分級運算的時間測試,其中30次的運算時間如表1所示。
表1 分級時間測試
綜上,蘋果圖像的分級測試效果較好。采用K-means聚類算法部分在于蘋果的果體輪廓、表面缺陷在圖像分級中的區(qū)分度較大,且噪聲的干擾較??;K-means聚類過程中調(diào)節(jié)k參數(shù)即可修正聚類標準,方式靈活;與簇數(shù)為2的K-means聚類相比,簇數(shù)為3的K-means聚類方法更適于果皮的缺陷檢測。此外,采用Gamma變換能夠?qū)⒐w的灰度變化范圍拉伸,閾值分割效果增強。同時,分級系統(tǒng)運算時間大致在0.7s~1.0s之間,適當(dāng)調(diào)整果體間距(建議為1.2m~1.5m),將符合一般的流水線作業(yè)速度。進一步地,如果靈活調(diào)整技術(shù)參數(shù),上述圖像處理方法也能夠完整呈現(xiàn)其它果實類圖像的自動分級過程。