陳亞峰,張曉明,黃亞鴻,徐日華
(1.北京化工大學(xué)信息科學(xué)與技術(shù)學(xué)院,北京 100029;2.北京石油化工學(xué)院計算機系,北京 102617;3.北京石油化工學(xué)院自動化系,北京 102617)
基于靜態(tài)背景差分的閾值算法在果實識別中的應(yīng)用
陳亞峰1,2,張曉明2,黃亞鴻3,徐日華1,2
(1.北京化工大學(xué)信息科學(xué)與技術(shù)學(xué)院,北京 100029;2.北京石油化工學(xué)院計算機系,北京 102617;3.北京石油化工學(xué)院自動化系,北京 102617)
圖像識別是當前人工智能發(fā)展的1個熱點。針對農(nóng)業(yè)果園采集圖像光照不均勻,背景復(fù)雜多樣等特點,提出了一種基于靜態(tài)背景差分的最大類間方差改進算法用于果園復(fù)雜背景圖像的分割。通過調(diào)節(jié)參數(shù)γ達到不同對比度下果實與背景環(huán)境的最佳分割。 然后利用距離變換和分水嶺算法進行粘連果實的分離,實現(xiàn)果實圖像的識別,并且通過實驗分析和計算確定了最佳參數(shù)γ范圍在0.2~0.3之間。實驗驗證表明,圖像識別效果良好,能夠為果園品質(zhì)在線檢測提供很好的技術(shù)基礎(chǔ)。
圖像識別;大津閾值;靜態(tài)背景差分;分水嶺算法
隨著物聯(lián)網(wǎng)與大數(shù)據(jù)技術(shù)的發(fā)展和成熟,數(shù)據(jù)的處理已經(jīng)不再局限于數(shù)字和文字,對圖像數(shù)據(jù)的處理成為適應(yīng)當前新興技術(shù)發(fā)展的迫切需要。工業(yè)領(lǐng)域可以通過對大量現(xiàn)場圖像進行識別實現(xiàn)產(chǎn)品計數(shù)、質(zhì)量檢測[1];農(nóng)業(yè)領(lǐng)域也可以通過圖像識別達到病蟲害監(jiān)測和產(chǎn)量預(yù)估[2];醫(yī)療領(lǐng)域甚至通過圖像識別技術(shù)進行病灶定位和病變分析[3]。農(nóng)業(yè)果園中的圖像采集,一方面由于戶外環(huán)境復(fù)雜,容易受到光照強度、照射方向等自然因素的影響,另一方面待識別的果實也存在識別目標粘連、被遮擋等問題,所以國內(nèi)外科研人員對此展開了研究。北京林業(yè)大學(xué)的張春龍等設(shè)計了支持向量機和超綠算子的混合分類器用于分割基于夜間圖像的綠色蘋果[8],雖然效果很好,但是依賴于嚴格的夜間高質(zhì)量圖片,實現(xiàn)難度較高;中國農(nóng)業(yè)大學(xué)的司永勝等提出了基于遺傳算法形狀特征的蘋果識別方法[5],對于一些因為部分遮擋而形狀變得不完整的果實識別效果較差;西北農(nóng)林科技大學(xué)的崔永杰等研究了基于橢圓形Hough變換的獼猴桃輪廓識別[11],同樣存在對識別形狀要求較高和圖像對比度要求嚴格的局限。
筆者在傳統(tǒng)的最大類間方差(OTSU)算法的基礎(chǔ)上,利用靜態(tài)背景差分進行了相關(guān)優(yōu)化,通過調(diào)節(jié)浮動參數(shù)γ來適應(yīng)不同背景對比度下果實圖像分割。在此基礎(chǔ)之上,利用距離變換和分水嶺算法進行粘連果實分離標記和識別,能夠解決部分遮擋果實的識別問題。以某果園臍橙圖像為目標進行相關(guān)試驗研究,以驗證相關(guān)算法的有效性。
針對農(nóng)業(yè)果園中采集的圖像,特征量的選擇往往受到現(xiàn)場環(huán)境、生長狀態(tài)等多種因素的影響。首先要對待識別果實圖像進行特征量提取,實現(xiàn)果實與背景的分割。然后利用距離變換和分水嶺算法解決果實粘連的問題,具體流程如圖1所示。
在識別之前,預(yù)處理部分必不可少。由于實驗獲取的彩色圖像受到各種外界干擾和條件限制往往并不能用來直接使用,需要進行相關(guān)的圖像處理操作,主要的預(yù)處理步驟如下。
1.1 RGB空間R分量提取
彩色信息量巨大,處理起來耗費資源,對于一般的成熟果實圖像,在RGB空間模型的R坐標軸上更能顯示良好的圖像區(qū)分性。
1.2 去噪和濾波
傳統(tǒng)的圖像在成像、傳輸、存儲、轉(zhuǎn)換等過程中容易受到隨機噪聲的干擾,會造成圖像失真特征淹沒等問題。因此,采用中值濾波的方法盡量保持圖像的真實性,降低噪聲干擾。
1.3 圖像二值化處理
由于獲取的果樹圖像背景復(fù)雜,采用處理后的灰度圖并不能實現(xiàn)前景和背景的有效區(qū)分,不利于特征量的提取。因此,加入一步圖像的二值化操作。用算法確定最佳閾值T,進行灰度劃分來實現(xiàn)圖像的二值化。
1.4 形態(tài)學(xué)處理
數(shù)學(xué)形態(tài)學(xué)是由一組形態(tài)學(xué)的代數(shù)運算子組成,其基本運算有膨脹(或擴張)、腐蝕(或侵蝕)、開啟和閉合。主要用具有一定形態(tài)的結(jié)構(gòu)元素去度量和提取圖像中的對應(yīng)形狀以達到對圖像分析和識別的目的,具有過濾噪聲,保留圖像原始信息的優(yōu)點。
上述預(yù)處理過程中發(fā)現(xiàn),在利用最大類間方差對圖像進行二值化操作時,由于受到果園圖像背景復(fù)雜、光照不均勻等多種因素的影響,往往并不能夠提取出有效的前景目標,從而影響整個圖像識別的流程操作。筆者將通過改進最大類間方差算法來解決這一問題。
2.1 最大類間方差法
最大類間方差法由日本學(xué)者大津(Nobuyuki Otsu)于1979年提出,是一種自適應(yīng)的閾值確定的方法,又叫大津法,簡稱OTSU。該方法是基于整幅圖像的統(tǒng)計特性實現(xiàn)閾值的自動選取,是全局二值化最杰出的代表[6]。
他是按圖像的灰度特性將圖像分成背景和目標。背景和目標之間的類間方差越大,說明構(gòu)成圖像的兩部分的差別越大,當部分目標錯分為背景或部分背景錯分為目標都會導(dǎo)致兩部分差別變小。因此,使類間方差最大的分割意味著錯分概率最小。
2.2 靜態(tài)背景差分
背景差分也叫背景減法(Background Subtraction), 背景差分法是目前運動檢測中最常用的一種方法,他是利用當前圖像與背景圖像的差分來檢測出運動區(qū)域的一種技術(shù)[3]。一般能夠提供最完全的特征數(shù)據(jù),但對于動態(tài)場景的變化,如光照和外來無關(guān)事件的干擾等特別敏感。靜態(tài)背景差分可理解為背景圖像不變,目標在沒有發(fā)生運動的情況下,灰度、亮度、顏色或者形狀發(fā)生了變化。通過變化后的圖像和背景圖像相減進行背景消去,可以成功捕捉到變化目標。
2.3 基于靜態(tài)背景差分改進的閾值求解算法
考慮到復(fù)雜背景環(huán)境對圖像分割的影響,單純的最大類間方差算法并不能有效地區(qū)分復(fù)雜的背景和目標,而靜態(tài)背景差分能夠消除背景對目標的影響。筆者提出一種基于靜態(tài)背景差分改進的大津閾值算法。
首先利用最大類間方差法計算待識別灰度圖像I(i,j)閾值T,計算歸一化閾值水平level:
(1)
自然界中某一顏色分布水平大致上服從高斯分布,在進行大津閾值分割時,許多相鄰或相近的像素會發(fā)生錯分的情況。基于這樣的考慮在level的基礎(chǔ)上加入浮動因子γ。這樣計算的level就從1個值變成了1個滑動窗口:
(2)
(3)
參數(shù)level在歸一化之后取值范圍在[0,1]之間。在加入?yún)?shù)γ之后level+、level-的變化范圍也必須同時滿足在[0,1]之間。考慮正常情況下,變化范圍一般在[0,0.5]之間。
然后得到優(yōu)化后的背景圖像I′(i,j):
(4)
(5)
(6)
利用背景差分算法進行背景消去,獲得優(yōu)化后目標灰度圖C(i,j):
(7)
再次利用最大類間方差法計算處理后灰度圖像C(i,j)閾值T′。算法流程如圖2所示。
對于參數(shù)γ的取值理論上和目標與背景的對比度有關(guān)。由此定義灰度圖中每一個灰度值i出現(xiàn)的概率為pi=ni/N。其中N表示圖像像素總數(shù),ni表示灰度值為i的像素的個數(shù)。則:
(8)
其中:u0、u1分別為目標的平均像素值和背景的平均像素值;t為灰度圖像的初始閾值。接著定義1個目標與背景之間的差值指標β,用來表征目標與背景像素之間的對比度關(guān)系:
(9)
不同對比度的圖像如圖3所示,分別計算其差值指標β和到達最佳分割的浮動因子γ,結(jié)果如表1所示。
圖像序號u0u1βγ圖3(e)236.73.00.9160.10圖3(d)221.87.60.840.15圖3(c)208.213.20.760.22圖3(b)197.419.60.690.24圖3(a)188.131.50.610.30
由表1可以看出,對比度β和浮動因子γ之間存在近似線性的關(guān)系,如圖4所示。
以某果園臍橙為例,利用傳統(tǒng)的最大類間方差算法進行閾值選取和圖像分割,用基于靜態(tài)圖像差分的大津閾值改進算法進行計算,結(jié)果分別如圖5、圖6所示。
由圖5和圖6可以看出,基于靜態(tài)背景差分的改進OTSU算法相比于傳統(tǒng)的大津閾值算法能夠有效減少復(fù)雜背景對識別目標的影響。
3.1 果實圖像的識別
果實圖像識別對于查看果樹生產(chǎn)狀況和預(yù)估果樹產(chǎn)量等具有十分重要的作用。以臍橙為例,圖像中存在樹葉遮擋果實、果實重疊等情況,所以對于特征值的選取不能以形狀為目標,應(yīng)該以顏色作為圖像分割的線索,采用合理的閾值分割相關(guān)圖像。得到處理之后的二值圖像,結(jié)果如圖7所示,識別效果如圖8所示。
從圖7、圖8可以看出,對于處理之后圖像的單個果實能夠很好識別,但是對于具有粘連關(guān)系的果實識別效果并不好。
3.2 果實圖像二次識別
對于重疊的果實圖像,由于每個待識別個體之間顏色相近,基于區(qū)域顏色的圖像分割效果并不良好。筆者采用歐式距離變換和分水嶺算法相結(jié)合的方法進行圖像的二次識別[8-10]。
3.2.1 歐式距離變換
圖像進行距離變換之后的新圖像中,圖像的每個輸出像素表示成該點到最近的零像素之間的距離。所以圖像中前景目標中的像素點距離背景越遠,那么距離就越大,如果用這個距離值替換像素值,那么新生成的圖像中這個點越亮。具體的應(yīng)用就是找前景目標的中心,對于1個經(jīng)過預(yù)處理之后的二值圖像Q(m,n)。設(shè)前景目標點為Q(i,j)=0,背景點為Q(i,j)=255,設(shè)背景點的集合為M,目標點距離為D(i,j),則對所有目標點的距離變換計算公式為:
(10)
將圖7進行距離變換之后的效果如圖9所示。
經(jīng)過距離變換后,能夠清楚地顯示每1個目標到背景的遠近關(guān)系,但是還是無法完成分離,需再結(jié)合之后的分水嶺算法進行操作。
3.2.2 分水嶺算法
分水嶺分割方法是一種較為成熟的數(shù)學(xué)形態(tài)學(xué)的分割方法,其基本思想是把圖像看作是測地學(xué)上的拓撲地貌,圖像中每1點像素的灰度值表示該點的海拔高度,每1個局部極小值及其影響區(qū)域稱為集水盆,而集水盆的邊界則形成分水嶺。采用模擬浸水法對粘連圖像進行分割,并且標記每個分割區(qū)域,如圖10所示。
識別效果如圖11所示。由圖11可以看出,粘連區(qū)域得到了有效的分離。但是對一些被樹葉遮擋過于嚴重的臍橙果實仍然無法進行有效的識別,系統(tǒng)識別的整體效果良好。
為了驗證基于改進的靜態(tài)圖像差分閾值算法在農(nóng)業(yè)果園水果識別中的良好適用性。隨機選用8張某果園臍橙圖片,總計297個臍橙,進行人工分析,樣本圖片考慮到了不同背景和對比度對果樹識別率的影響。識別效果如表2所示。
表2 不同類型果實識別效果
由表2可以看出,個體完整的果實識別率較高,基本能夠?qū)崿F(xiàn)遮擋果實的識別,但是對于部分嚴重遮擋的臍橙果實,由于圖像較暗不能提取相關(guān)顏色特征或提取特征亮斑過小被當作噪聲濾去,存在著不能識別的現(xiàn)象。對于粘連果實的分離和識別,由于粘連區(qū)域輪廓并不明顯,也存在著小部分漏分、誤識的現(xiàn)象。
在針對不同光照背景的果園圖像取樣識別時,最佳參數(shù)γ是在一定范圍內(nèi)浮動的,并沒有變化很大。為了研究在果園臍橙圖像識別中參數(shù)γ的最佳范圍,引入識別率及誤識別率:
(11)
(12)
選取不同場景下的臍橙圖片進行分析,結(jié)果如圖12所示。
由圖12可以看出,基于靜態(tài)背景差分的閾值算法中,目標的識別率隨著參數(shù)γ的減小而增大,與此同時也會增加其把背景中的其他因素當作目標進行識別的概率。通過分析發(fā)現(xiàn),參數(shù)γ在0.2~0.3之間兩者達到最優(yōu),識別率較高,誤識別率較小。
(1)采用靜態(tài)背景差分的閾值算法對待識別圖像進行二值化處理,相較于傳統(tǒng)的大津算法能夠解決識別目標背景復(fù)雜,光照不均勻,對比度變化的問題。
(2)通過改變靜態(tài)背景差分閾值算法中參數(shù)γ可以有效適應(yīng)不同光照程度和復(fù)雜程度的樣本圖像。參數(shù)γ隨著目標與背景的像素對比度β線性變化。
(3)該算法能夠有效應(yīng)用在農(nóng)業(yè)果園果實識別的場合,為了同時能夠達到識別率高,誤識別率小的效果,參數(shù)γ的指標確定在0.2~0.3之間。
[1] 秦學(xué)文,黃金國,皮積敏,等.基于樣本集提取的現(xiàn)場鋼材計數(shù)研究[J].計算機應(yīng)用軟件,2014,31(3):211-213.
[2] 王克如.基于圖像識別的作物病蟲草害診斷研究[D].北京:中國農(nóng)業(yè)科學(xué)院作物科學(xué)研究所,2005.
[3] Chen Jingjing, Zhao Dechun, Peng Chenglin, et al. Comparative study on automatic lung paren-chyma segmentation of CT data using improved OTSU and FCM methods[J]. Space Medicine & Medical Engineering, 2014,27(6):448-452.
[4] 司永勝,喬軍,劉剛,等.基于機器視覺的蘋果識別和形狀特征提取[J].農(nóng)業(yè)機械學(xué)報,2009,40(8):161-165.
[5] OTSU N. A threshold selection method from gray-level histograms[J]. IEEE Transactions on Systems, Man, and Cybernetics, 1979,9(1):62-66.
[6] 張毅剛,曹 陽,項學(xué)智.靜態(tài)背景差分運動目標檢測研究[J].電子測量與儀器學(xué)報,2010,24(5):494-499.
[7] 張春龍,張楫,張俊雄,等.近色背景中樹上綠色蘋果識別方法[J].農(nóng)業(yè)機械學(xué)報,2014,45(10):277-281.
[8] 苗中華,沈一籌,王小華,等.自然環(huán)境下重疊果實圖像識別算法與試驗[J/OL].農(nóng)業(yè)機械學(xué)報,2016(06) http://www.cnki.net/kcms/detail/11.1964.S.20160317.1049.030.html./*.
[9] 彭衛(wèi)繪,談樂斌.基于MATLAB粘連小球球徑提取方法[J].計算機系統(tǒng)應(yīng)用,2012,21(6):191-194.
[10] 呂強,蔡健榮,趙杰文,等.自然場景下樹上柑橘自動識別技術(shù)[J].農(nóng)業(yè)機械報,2010,41(6):185-188.
[11] 崔永杰,蘇帥,王霞霞,等.基于計算機視覺的自然環(huán)境中獼猴桃識別與特征提取[J].農(nóng)業(yè)機械學(xué)報,2013,44(5):247-252.
The Application of Static Background Subtraction in OTSU for Fruit Recognition
CHEN Ya-feng1,2, ZHANG Xiao-ming2, HUANG Ya-hong3, XU Ri-hua1,2
(1.College of Information Science and Technology, Beijing University of Chemical Technology, Beijing 10029, China; 2.Department of Computer Science, Beijing Institute of Petrochemical Technology, Beijing 102617, China; 3.Department of Automation, Beijing Institute of Petrochemical Technology, Beijing 102617, China)
Image recognition is a hotspot in the development of artificial intelligence. Due to theuneven illumination and complex background of imagescollected from orchard agriculture, this paper proposed a new improved OTSU which is based on static background subtraction algorithm. By adjusting the parametersγto achieve optimal segmented fruit under different contrast with the background environment, the researchers use the distance transform watershed algorithm to separate adhesions fruit, and determine the optimum parameterγrange between 0.2 to 0.3 viaexperimental analysis and calculations. Results show that the image recognition works well, whichcan provide a good foundation for the technical quality of the orchard online testing.
image recognition; Otsu; static background subtraction; watershed algorithm
2016-07-09
北京石油化工學(xué)院優(yōu)秀責任教授資助項目(BIPTPOPME-2015);2016年北京市大學(xué)生科研訓(xùn)練項目(2016J00087)。
陳亞峰(1972—),男,碩士生,研究方向為大數(shù)據(jù)與云計算,E-mail:chenyfjs@163.com。
TP 391.4
A