杜俊波,李文正
(江西理工大學 電氣工程與自動化學院,江西 贛州 341000)
隨著計算機技術的發(fā)展,圖像識別技術被應用到各大領域[1]。在農業(yè)領域中,圖像識別技術的應用也較為廣泛。例如,農作物蟲害圖像識別,農產品自動分揀及品質分級等等。我國是水果大國,對于水果圖像識別的研究尤為重要。水果圖像識別能對不同水果進行識別分類,有利于水果的自動分揀及水果品質分級。在西方的發(fā)達國家,已經開始對水果行業(yè)智能化、規(guī)模化,在選果包裝車間中,已經普遍采用無損傷檢測手段。因此,水果圖像識別技術具有很大的效益潛力。
20世紀80年代初,國內外學者開始對水果識別分類進行研究,包括研究水果的計算機自動識別分類等。但是傳統(tǒng)的水果識別僅僅基于水果的輪廓曲線特征或者顏色特征,識別精度不高,分類效果較差。近年來,隨著計算機技術的提升和新型算法的提出,出現(xiàn)了一些基于模式識別算法的較新方法,比如基于卷積神經網絡的水果識別系統(tǒng)和基于深度學習的水果圖像識別系統(tǒng)[2-3]。
最初,深度學習是為了解決圖像識別問題而提出的;如今,深度學習已經在圖像、語音等方面取得了重大突破。目前,深度學習技術已經廣泛應用到圖像識別中,主要應用于圖像的分類識別、圖像的目標檢測、圖像修復和圖像分割等領域[4]。
鑒于圖像識別技術的發(fā)展及國內外研究現(xiàn)狀,本文提出一種基于閾值分類器的水果識別系統(tǒng)。水果圖像識別的研究將有利于水果分揀實現(xiàn)智能化,同時,也給其他圖像識別領域提供了一定的參考。
一個基本的圖像識別系統(tǒng)主要由圖像采集、圖像預處理、圖像特征提取、圖像識別算法等步驟組成。每一步驟都會對圖像識別的精度起著至關重要的作用,但是根據研究的不同,可以適當的側重其中一個流程。本文水果系統(tǒng)識別流程如圖1所示。
圖1 水果識別流程
在分析和使用圖像之前,需要對圖像進行預處理,包括水果圖像二值化、形態(tài)學處理,水果圖像填充和水果圖像邊緣檢測。
水果圖像二值化處理一般采用OTSU算法[5]。水果圖像經二值化處理后仍然有一些獨立的小白點,而且邊緣有許多毛刺,整體二值化圖像不圓潤,不是很光滑,于是對二值化的圖像進行形態(tài)學處理,并對二值化圖像進行開運算[6]。開運算處理之后,再對圖像進行邊緣檢測、水果圖像填充。實驗結果如圖2所示。
圖2 水果圖像預處理
特征是一個對物體進行描述的量,任何識別算法都需要選取一個好的特征,這是確保算法有效的關鍵。為了識別不同種類的水果,采集到的水果圖像經預處理后,還需要進行特征提取。水果較為明顯的特征包括:顏色特征、形狀特征及紋理[7]。就本研究而言,主要考慮的是水果的形狀特征。水果形狀特征是識別水果種類的要重依據,水果形狀特征比較多,主要包括水果的大小、水果的周長、水果的面積、水果的圓度、水果的離心率等等。
在水果識別中,桃子和蘋果的形狀更加圓滑,也更加接近圓形;香蕉形狀比較長,它是屬于條形的;而像菠蘿則類似一個矩形。對水果整體區(qū)域進行填充時,可以通過圖像像素的個數求出的水果面積S,也可以根據邊緣檢測求出水果的周長L。用圓度t來表示與圓形的近似程度,則有:
式中:π是圓周率;S是圖像面積;L是圖像的周長。
水果識別中,先求出圓度t,圓度越趨近于1,說明水果形狀越近似為圓形,圓度越趨近于0,說明水果形狀偏離圓形。除了圓度t,還設置了其他形狀參數,比如離心率e,長軸和短軸之比f等。本文選擇不同水果圖像,對其形狀特征參數進行比對,見表1所列。通過表1可以看出,水果的種類不同,其形狀特征參數差別比較大,就圓度而言,桃子的圓度接近為1,故其形狀與圓相近;菠蘿的圓度最小,接近為0,其形狀與圓形差別比較大,與實際情況大致相符。
表1 形狀特征比對
圖像的精準識別是一個比較困難的研究課題,圖像識別技術是模式識別技術的一個重要分支。基于圖像的模式識別流程如圖3所示。
圖3 模式識別流程
從圖3可以看出,模式識別主要包括訓練和測試兩個方面,其中,圖像的訓練尤為重要。在訓練數據時,訓練算法起至關重要的作用。識別分類算法即對提取的特征進行訓練測試,是水果識別系統(tǒng)核心。
本次研究中選取了8種常見水果,在形狀特征參數中,只考慮了3個特征參數,分別是長短軸之比f,離心率e和圓度t。在此訓練每種水果圖像30張,并訓練同種水果圖像3個形狀參數的閾值,見表2所列。
表2 形狀特征閾值參數
定義好水果形狀閾值之后,在新的圖像中提取3個形狀參數。如果3個形狀參數同時滿足閾值中的數據,就會輸出相應的水果識別結果;否則,就不能正確輸出識別結果。
水果識別的性能測試主要是測試水果識別的適用范圍和水果識別的精度。本研究中主要包含了8種不同的水果,每種水果又選擇多張不同的圖像進行調試,其背景都是白色??梢匀我膺x擇一張水果圖片進行識別。
對于待識別的圖像,主要對比3個形狀參數,包括圓度、離心率和長軸與短軸之比。調試界面如圖4所示。
圖4 水果識別調試結果
通過訓練每種水果30張圖像,得出水果的形狀參數的閾值。通過閾值分類器測試每種水果圖像多張,得出基于閾值分類器水果識別系統(tǒng)的精度,如圖5所示。
圖5 水果識別精度
本文設計了一種基于閾值分類器的水果識別系統(tǒng),實驗結果表明,水果識別系統(tǒng)能夠識別一些常見的水果,并且水果識別率約為90%。該系統(tǒng)為水果識別分類提供了一定的借鑒作用,但是也存在著一些局限性,如不能直接對農場中的水果進行識別分類。這個不足可以通過大量訓練水果的圖像加以解決。此外,為了方便識別各種水果種類,可制作APP或微信小程序,當遇到不認識的水果時,通過掃一掃,便可得到該種水果的信息,如水果等級和品質等,甚至能夠精準識別水果盤中所呈現(xiàn)水果的種類。