左衛(wèi)剛,高 洋
(1.山西管理職業(yè)學院, 山西 臨汾 041000; 2.山西省農(nóng)業(yè)科學院農(nóng)業(yè)資源與經(jīng)濟研究所,太原 030000)
隨著人口的增長,小麥種植量和消費量日益增加。面包、通心粉和蛋糕等食品所用面粉的質(zhì)量取決于小麥的加工品質(zhì),影響小麥加工品質(zhì)最重要的因素是蛋白質(zhì)含量。硬粒小麥(四倍體小麥)比面包小麥(六倍體)的蛋白質(zhì)含量高,面包小麥籽粒與硬粒小麥混合常會導致面粉蛋白質(zhì)含量降低。在實際生產(chǎn)中,面包小麥和硬粒小麥田間常出現(xiàn)混生的現(xiàn)象,造成收獲的籽粒中常有一定的雜粒。因此如何準確、快速地分離面包小麥和硬粒小麥的混合粒具有重要意義。
高精度的快速無人計算機輔助系統(tǒng)對顆粒進行分類已用于評估農(nóng)產(chǎn)品的質(zhì)量。該系統(tǒng)基于計算機視覺,采用從圖像處理技術(shù)(IPT)[1]中獲得的谷物或產(chǎn)品視覺屬性,與人工智能 (AI) 相結(jié)合,從而提供自動質(zhì)量評估。人工智能在分類器建模中應用最廣泛的技術(shù)有人工神經(jīng)網(wǎng)絡 (ANN)、自適應神經(jīng)模糊推理系統(tǒng) (ANFIS)、支持向量機 (SVM)、決策樹 (DT)、K最近鄰分類算法 (KNN)、樸素貝葉斯 (NB) 和判別分析 (DA)等。目前,國內(nèi)外已有學者對各種農(nóng)產(chǎn)品的分類器進行了研究。Jamuna等[2]根據(jù)DT和多層感知器(MLP)對棉籽的分類效率對分類器進行了評價,Berman等[3]利用近紅外高光譜圖像分析對谷物籽粒進行分類;這些結(jié)果證明了自動分析系統(tǒng)在雜粒選擇上的應用潛力。通過分類器所采用的不同技術(shù),根據(jù)小麥特性和分類精度研發(fā)新的識別體系,開發(fā)高分類精度和準確性的小麥雜粒識別體系具有重要的應用價值。本研究設計了一種根據(jù)小麥籽粒的視覺特征,由計算機視覺支持的高精度簡化分類器的12個主要視覺特征, 并從這12個主要特征中復制出21個視覺特征, 利用CfsSubsetEval算法簡化分類器可準確分辨面包或硬粒小麥。
對圖像進行采集,IPT獲取與小麥籽粒視覺特征相關(guān)的數(shù)據(jù)建立FFBP-ANN模型,流程如圖1所示。
圖1 獲取圖像和特征數(shù)據(jù)采集流程圖
為了獲得圖像,使用的計算機擁有Intel i 7處理器和16 G系統(tǒng)內(nèi)存;相機采用佳能EOS 5 D,具備1 280萬有效像素全畫幅CMOS圖像感應器。將相機固定在距離盒子底部40 cm高度,內(nèi)部覆蓋黑色背景,并用LED照明。防止畫面抖動,使用單反無線遙控器控制快門拍攝。
獲取圖像以后,使用Matlab軟件獲取特征數(shù)據(jù)[4,5]。將RGB圖像(圖2)轉(zhuǎn)換為灰度格式(圖3),最后利用最大類間方差法(OTSU)將灰度圖像轉(zhuǎn)換為只包含黑色或白色的二值圖像(圖4)。OTSU將灰度圖像按照閾值轉(zhuǎn)換為二值圖像[6]。每個像素的灰度級別從0~255,標準化為0~1,當灰度值高于閾值,每個像素設置為白色(1),否則設置為黑色(0)。利用形態(tài)學方法消除每個圖像的噪聲后對每個顆粒的位置進行定位,并根據(jù)位置進行分割標記。
圖4 籽粒的二值圖像(黑色或白色)
注:(a)面包小麥;(b)硬粒小麥。圖2 籽粒的RGB圖像
注:(a)面包小麥;(b)硬粒小麥(最初如圖2所示)。下同。圖3 籽粒的灰度圖
通過圖像處理技術(shù),獲取每個顆粒的尺寸、顏色、紋理等視覺特征[7-11],形成如表1所示的數(shù)據(jù)集。
表1 從主要特征復制的主要特征和數(shù)據(jù)集
從二值圖像中提取每個顆粒的長度(L)、寬度(W)、周長(P)和面積(A)。為了保證分類器的魯棒性,我們從這些參數(shù)中提取了一些與尺寸相關(guān)的特征,通過公式(1)計算豐滿度(F)。
然后從RGB圖像中提取每個顆粒的R、G、B值,并且計算每個顆粒的R、G、B均值。同樣,關(guān)于顏色的幾個特征如公式(2)所示:
R/TRGB G/TRGB B/TRGB R-G G-B R-B
(2 A) (2 B) (2 C) (2 D) (2 E) (2 F)
……(2)
以上系列公式中,TRGB為R+G+B級的總和。利用灰度共生矩陣(GLCM)從圖3圖像中提取出對比度(C)、相關(guān)性(COR)、能量(E)、同源性(H)、熵(ENT)等紋理特征。
人工神經(jīng)網(wǎng)絡由不同層次的神經(jīng)元組成,這些具有非線性功能的神經(jīng)元通過突觸權(quán)重相互連接。在訓練過程中,通過權(quán)重的變化,使輸出更接近神經(jīng)網(wǎng)絡的目標。根據(jù)視覺特征,基于MLP的FFBP-ANN模型將小麥籽粒分為面包小麥或硬粒小麥(圖5)。
圖5 將小麥籽粒分類為面包小麥或硬粒小麥的ANN模型
ANN模型由3層構(gòu)成:輸入層、4個神經(jīng)元的隱藏層和1個神經(jīng)元的輸出層。輸入層的神經(jīng)元數(shù)量與輸入?yún)?shù)的數(shù)量相同,輸入層和隱藏層使用“Sigmoid”函數(shù),而輸出層使用“Purelin”函數(shù)。利用Levenberg Marquardt(LM)算法訓練神經(jīng)網(wǎng)絡模型作為學習算法。LM是高斯牛頓算法和最速下降法(反向傳播)的組合,在保證高斯牛頓法精度的前提下,采用最速下降法進行收斂。因此,對于高非線性問題,LM模型通常能獲得較成功的結(jié)果。與其他學習算法相比,該算法具有更快的學習速度和更好的收斂性,MATLAB編碼參數(shù)設置見表2。
表2 ANN模型參數(shù)設置
表3為包含100粒面包籽粒和100粒硬質(zhì)小麥籽粒視覺特征的數(shù)據(jù)集和數(shù)據(jù)子集。根據(jù)表1中的數(shù)據(jù)對子集進行重組,重新生成新的子集來研究相關(guān)性,從而檢測特征對分類結(jié)果的影響。200粒小麥籽粒中180粒用于訓練,其余20粒用于模型測試,將數(shù)據(jù)集作為訓練和測試ANN模型的輸入?yún)?shù)。
2.2 訓練和測試ANN模型
人工神經(jīng)網(wǎng)絡模型建立后,需要對其進行訓練和測試,具體流程如圖6所示。
圖6 人工神經(jīng)網(wǎng)絡模型的訓練和測試流程圖
這一過程主要由6個步驟組成:算法啟動后,首先分別加載表3中的訓練和測試數(shù)據(jù)集。神經(jīng)網(wǎng)絡的訓練從一個隨機的種子值開始,通過250個周期的加載數(shù)據(jù)進行訓練,這一步中返回循環(huán)次數(shù)。種子值是一個固定網(wǎng)絡權(quán)重的因素,用于在每次運行中獲得相同的結(jié)果。訓練后的神經(jīng)網(wǎng)絡用加載的數(shù)據(jù)計算測試結(jié)果。在訓練和測試ANN模型后,如果根據(jù)如下公式(3)對訓練和測試進行評價的MAE分別小于0.001和0.005的目標值,則種子值將被保存,以供隨后運行的ANN獲得相同的結(jié)果。否則,訓練和測試步驟將以新的隨機種子值重復,最后一步得到訓練和測試結(jié)果。
表3 100個面包小麥籽粒和100個硬質(zhì)小麥籽粒的視覺特征
將表3給出的與小麥籽粒視覺特征的相關(guān)輸入數(shù)據(jù),根據(jù)訓練后的ANN模型進行分類。MAE和準確率的結(jié)果如表4所示:
表4 神經(jīng)網(wǎng)絡測試數(shù)據(jù)的MAE和準確性
結(jié)果表明,數(shù)據(jù)子集1中僅含7個維度特征的人工神經(jīng)網(wǎng)絡模型對小麥籽粒的分類精度最高。另一方面,使用與紋理特征相關(guān)的數(shù)據(jù)子集3獲得的準確率最差。值得注意的是,雖然數(shù)據(jù)子集1的7個特征數(shù)量遠遠低于所有特征數(shù)據(jù)集的21個特征數(shù)量,但數(shù)據(jù)子集1對小麥籽粒分類的結(jié)果更為有效。為了簡化ANN模型,分析了卡方法、增益比法、信息增益法、對稱不確定性法、CfsSubsetEval等算法,這些算法中,只有CfsSubsetEval給出了最相關(guān)的特征,其他算法是根據(jù)分類結(jié)果的相關(guān)性對所有屬性進行排序,在分類上獲得了理想的結(jié)果。因此,選擇CfsSubsetEval進行特征選擇,具有7個特征的選定數(shù)據(jù)的ANN結(jié)果獲得了最準確的結(jié)果(表4)。
用于測試的20粒(10粒面包小麥和10粒硬粒小麥)籽粒的7個視覺特征及其測試結(jié)果如表5所示,當“2”被指定為面包粒時,“1”被指定為硬粒小麥。由表5可知,10粒面包小麥籽粒的L、L/W、G、B、G/TRGB、均質(zhì)性和熵參數(shù)的平均值分別為67.113 43、1.861 56、0.545 78、0.473 82、0.349 66、0.797 37和6.903 95。10粒硬粒小麥的平均值分別為81.872 9、2.601 01、0.454 82、0.360 39、0.353 68、0.822 67和6.666 36。
表5 神經(jīng)網(wǎng)絡模型對所選數(shù)據(jù)分類試驗結(jié)果
面包小麥和硬粒小麥之間的區(qū)別證明了根據(jù)視覺特征可用于對谷物進行分類。通過神經(jīng)網(wǎng)絡模型對19個籽粒進行了精確的零誤差分類,1個籽粒的絕對誤差為1.95×10-4。因此,20粒小麥的分類誤差為MAE9.8×10-6,可忽略不計?;谟嬎銠C視覺的人工神經(jīng)網(wǎng)絡分類器可以準確的實現(xiàn)小麥品種的自動分類。
本研究提出了一種基于計算機視覺的人工神經(jīng)網(wǎng)絡技術(shù),用于將小麥籽粒精確分類為面包小麥或硬粒小麥。為此,設計了基于3層MLP的FFBP-ANN模型。利用IPT獲得了100個面包小麥和100個硬粒小麥的12個主要視覺特征。采用人工神經(jīng)網(wǎng)絡對180粒小麥進行訓練,并通過20粒小麥數(shù)據(jù)進行精度測試。從12個主要特征中復制21個視覺特征,使種群數(shù)據(jù)多樣化。此外,為了簡化模型的輸入,還研究了對結(jié)果更有效的視覺特征。利用特征選擇算法CfsSubsetEval,建立了具有7個輸入的神經(jīng)網(wǎng)絡模型。神經(jīng)網(wǎng)絡模型對所選數(shù)據(jù)分類試驗結(jié)果的MAE為9.8×10-6。該方法易于集成到工業(yè)中,可以實現(xiàn)對農(nóng)業(yè)生產(chǎn)中不同小麥籽粒的自動分類。