任 銳 張淑娟 趙華民 孫海霞 李成吉 廉孟茹
(山西農(nóng)業(yè)大學(xué)工學(xué)院,山西 晉中 030800)
辣椒是世界最大的調(diào)味品作物,主要以果實為食,營養(yǎng)豐富,維生素C含量在蔬菜中占首位。辣椒市場價值主要受其外觀質(zhì)量的影響,依據(jù)NY/T 944—2006標(biāo)準(zhǔn),正常辣椒形狀均勻,色澤油亮光潔呈紅色,部分辣椒出現(xiàn)黑斑、蟲蝕和花皮等缺陷,需分選出來。
目前的分選主要靠人工分選,效率低、主觀性強(qiáng)且工作量大,機(jī)器視覺利用計算機(jī)技術(shù)代替人眼獲取圖像的信息,具有無損、檢測精度高、節(jié)省勞動力等優(yōu)點,科研人員在機(jī)器視覺方面對農(nóng)產(chǎn)品做了大量的研究,取得較大的發(fā)展。畢智健等[1]利用番茄表面的顏色特征對不同成熟度的番茄進(jìn)行判別分類,完熟番茄訓(xùn)練集與驗證集最高均為90%。解博等[2]通過機(jī)器視覺對杏核紋理特征進(jìn)行識別,雜質(zhì)杏核識別率可達(dá)94%。項輝宇等[3]采用基于Halcon的圖像處理方法,依據(jù)RGB顏色模型,采用模板匹配的方法,對蘋果品質(zhì)的大小、缺陷、顏色檢測判別蘋果是否合格。Xu[4]提出利用最小核值相似區(qū)和脈沖耦合神經(jīng)網(wǎng)絡(luò)識別蘋果果實,在測試的50幅圖像中,識別率為93%。Arakeri[5]利用計算機(jī)視覺技術(shù),運用圖像處理技術(shù)分析番茄的缺陷和成熟度,對番茄的質(zhì)量評估的準(zhǔn)確率達(dá)到96.47%。Habib[6]利用圖像提取木瓜色彩特征,解決木瓜病害識別,通過支持向量機(jī)對疾病特征分類,準(zhǔn)確率達(dá)到90.15%。綜上所述,機(jī)器視覺研究主要利用顏色特征、紋理特征、形態(tài)特征和直接利用圖像進(jìn)行判別,其他學(xué)者的研究大都采取單一特證判別。
研究擬利用機(jī)器視覺檢測辣椒外部品質(zhì),通過機(jī)器視覺系統(tǒng)進(jìn)行圖像采集,圖像增強(qiáng),將提取顏色特征、紋理特征和形態(tài)特征作為特征值。通過回歸系數(shù)法和連續(xù)投影法優(yōu)選特征值,利用偏最小二乘回歸法和最小二乘支持向量機(jī)建模分析,驗證研究中選擇特征值和模型的有效性,為今后的辣椒在線檢測提供參考和技術(shù)支持。
試驗所采用的干辣椒購買自山西省襄汾縣趙雄村的三櫻椒。利用K-S(Kennard-Stone)算法[7]按3∶1劃分訓(xùn)練集和預(yù)測集,其中正常樣本訓(xùn)練集225組,預(yù)測集75組;缺陷樣本訓(xùn)練集225組,預(yù)測集75組。
機(jī)器視覺系統(tǒng)包括暗箱(440 mm×335 mm×425 mm)內(nèi)壁使用黑色拷貝紙進(jìn)行貼壁處理,屏蔽外界自然光;將相機(jī)(尼康D3300)和鏡頭(尼康尼克爾鏡頭焦段:18~140 m,光圈:f/3.5-5.6G ED VR)安裝于暗箱頂部,采集辣椒圖像信息;暗箱頂部布置環(huán)形熒光燈(YH327200KE)提供光源,暗箱下部安裝可調(diào)節(jié)載物臺,載物臺頂部位于鏡頭正下方24 cm處。通過存儲卡(SDSQUNC-032G-ZN6MA)將圖像傳入計算機(jī)(處理器:Y50Pi5-4210H,CPU:2.90 HZ,顯卡:NVIDIA GTX 960M)中,采用MATLAB R2010b軟件進(jìn)行圖像處理。
圖像增強(qiáng)是為了去除噪聲,提高處理圖像的質(zhì)量和速度。中值濾波法為線性濾波器,可以減少噪聲,保護(hù)圖像邊緣不受影響。對圖像進(jìn)行裁剪和灰度處理,利用中值濾波去噪,達(dá)到增強(qiáng)圖像的目的,為后續(xù)提取特征值作準(zhǔn)備,圖像增強(qiáng)結(jié)果如圖1所示。
圖1 圖像增強(qiáng)Figure 1 Image enhancement
2.2.1 顏色特征值提取 顏色特征描述圖像區(qū)域所對應(yīng)的目標(biāo)物的表面性質(zhì)[8]。RGB顏色空間是最基礎(chǔ)的模型;HSI顏色空間接近于人眼視覺特性;HSV顏色空間由色調(diào)、飽和度和亮度組成;Lab顏色空間是范圍最大的色彩模式。從RGB、HSV、HSI、Lab顏色空間中分別提取R、G、B、H、S、V、H、S、I、L、a、b顏色特征值的最大值、最小值、均值和方差,提取樣本各顏色特征值如表1所示。
2.2.2 紋理特征值提取 紋理特征描述圖像或圖像區(qū)域所對應(yīng)的表面性質(zhì)。主要從灰度差分統(tǒng)計法和灰度共生矩陣來提取能量、熵、慣性矩、相關(guān)性、逆差距的4個方向(0°,45°,90°,135°)的特征值的均值[9],提取結(jié)果如表2所示。
表1 樣本各顏色特征值Table 1 Sample color eigenvalue
表2 樣本紋理特征值均值Table 2 Mean of texture feature values of sample
2.2.3 形態(tài)特征值提取 圖像形態(tài)特征是在物體從圖像中分割出來后進(jìn)行分析,在機(jī)器視覺中起著十分重要的作用[10]。通過計算缺陷面積比值和歐拉數(shù)確定辣椒類別。利用Otsu算法閾值分割,二值化分別提取模板圖像和缺陷圖像,如圖2、3所示。
(1)
式中:
S——面積比;
s1——模板圖像像素面積;
s2——缺陷圖像像素面積。
EUL=C-H,
(2)
式中:
EUL——歐拉數(shù);
C——代表對象總數(shù);
H——孔洞數(shù)。
研究中,通過提取出600組圖像,每幅圖像46個特征值。由于特征值提取數(shù)據(jù)量大,每一組特征值對辣椒檢測影響不同,因此需要提取影響效果顯著的特征值建模檢測。
2.3.1 RC方法優(yōu)選特征值 回歸系數(shù)法(RC)通過建立偏最小二乘回歸法(PLS)模型的回歸系數(shù)中的局部極值進(jìn)行提取,其表達(dá)了PLS方法建模中每個特征值對此次建模相關(guān)性的情況。RC方法優(yōu)選特征值如圖4所示,優(yōu)選出21個特征值,分別為5(0°方向的熵),6(45°方向的熵),7(90°方向的熵),8(135°方向的熵),9(0°方向的慣性矩),11(90°方向的慣性矩),20(135°方向的逆差距),21(比值),24(RGB中R值方差),25(RGB中G值均值),26(RGB中G值方差),27(RGB中B值均值),29(HSV中H值均值),30(HSV中H值方差),31(HSV中S值均值),35(HSV中H值均值),36(HSV中H值方差),37(HSV中S值均值),41(Lab中L值均值),42(Lab中L值方差),44(Lab中a值方差)。
圖2 提取模板圖像Figure 2 Extraction of template image
圖3 提取缺陷圖像Figure 3 Extraction of defect image
2.3.2 SPA方法優(yōu)選特征值 連續(xù)投影法(SPA)是一種研究系統(tǒng)確定性與不確定性相互作用的分析理論[11]。SPA方法優(yōu)選特征值如圖5所示,可得14個優(yōu)選特征值最優(yōu)解依次排列為42(Lab中L值方差),26(RGB中G值方差),34(HSV中V值方差),21(比值),18(45°方向的逆差距),5(0°方向的熵),6(45°方向的熵),17(0°方向的逆差距),8(135°方向的熵),32(HSV中S值方差),45(Lab中b值均值),46(Lab中b值方差),7(90°方向的熵),30(HSV中H值方差)。
偏最小二乘回歸法(PLS)是一種多元統(tǒng)計數(shù)據(jù)分析方法[12]。利用PLS方法與RC方法優(yōu)選特征值和SPA方法優(yōu)選特征值分別建模檢測,判別結(jié)果如表3所示。
最小二乘支持向量機(jī)(LS-SVM)是支持向量機(jī)(SVM)的一種擴(kuò)展,解決問題的線性性能。利用LS-SVM方法與RC方法優(yōu)選特征值和SPA方法優(yōu)選特征值分別建模檢測,判別結(jié)果如表3所示。
由于模型預(yù)測出的結(jié)果非整數(shù)型,因此將0.5作為最大偏離值,預(yù)測類別值和假設(shè)類別值相差小于0.5的判定為此類樣本[13]。由表3可知,利用PLS方法和LS-SVM方法分別結(jié)合RC方法和SPA方法優(yōu)選特征值分別建模分析,RC-PLS模型判別率為95.33%,SPA-PLS模型和RC-PLS模型判別率為96.67%,PLS模型判別率為97.33%,LS-SVM模型和SPA-LS-SVM模型判別率為98.67%,6種方法檢測結(jié)果都達(dá)到了90%以上。顯然LS-SVM模型和SPA-LS-SVM模型檢測結(jié)果最好,SPA-LS-SVM方法可以通過SPA方法優(yōu)選特征值簡化模型,提高檢測精度和效率,因此選用LS-SVM方法建模結(jié)合SPA方法優(yōu)選特征值檢測模型最優(yōu)。
圖4 RC曲線Figure 4 RC curve
圖5 SPA優(yōu)選特征值Figure 5 Preferred eigenvalues by SPA
表3 檢測模型判別結(jié)果分析Table 3 Analysis of detection model discrimination results
研究主要利用機(jī)器視覺系統(tǒng)進(jìn)行圖像采集,利用中值濾波增強(qiáng)圖像,減少噪聲;通過提取RGB、HSV、HSI、Lab 4種顏色空間各顏色特征值的均值和方差,提取紋理特征的能量、熵、慣性矩、相關(guān)性、逆差距的4個方向(0°,45°,90°,135°)的特征值,利用Otsu算法閾值分割圖像,提取形態(tài)特征缺陷比值和歐拉數(shù)作為特征值,共提取46個特征值。結(jié)果表明,選用連續(xù)投影法優(yōu)選14個特征值,結(jié)合最小二乘支持向量機(jī)法進(jìn)行建模,所得模型的檢測準(zhǔn)確率為98.67%,模型最優(yōu)。