鄭曉玲
福建泉州安溪縣系“中國烏龍茶之鄉(xiāng)”,茶產(chǎn)業(yè)已經(jīng)成為區(qū)域經(jīng)濟的一個重要特色產(chǎn)業(yè).茶葉品質(zhì)的分類可以讓不同的客戶類型根據(jù)他們自己的喜好以及經(jīng)濟條件選擇相應(yīng)的茶品類,因此它在茶葉市場中有著非常重要的作用.目前在茶產(chǎn)業(yè)中,茶品質(zhì)檢測主要是由“品茶者”通過視覺、嗅覺和味覺感官來進行的,這種方法會受到“品茶者”心理(如心理狀態(tài))、生理(如年齡、性別等)因素的影響,因此,檢測結(jié)果是主觀的,有時會產(chǎn)生不可靠的結(jié)果[1].儀器分析方法檢測茶葉品質(zhì)[2]準確、可靠、可重復(fù)性好,但是設(shè)備昂貴,操作繁瑣,設(shè)備生產(chǎn)時間長.因此尋找一種低成本、客觀的茶葉品質(zhì)自動檢測方法尤為重要.
計算機視覺系統(tǒng)以其成本效益高、一致性好、速度快、精度高等優(yōu)點,在質(zhì)量檢測領(lǐng)域有廣泛應(yīng)用.在茶葉的質(zhì)量檢測方面,GAGANDEEP S G等[3]概述各種基于計算機視覺的顏色和紋理分析算法,對茶葉的監(jiān)控和分級進行介紹.ARVIND K等[4]提出一種基于直方圖顏色匹配技術(shù)的基于L*a*b*顏色模型的茶飲料圖像分析系統(tǒng).HSIAO H Y等[5]利用機器視覺技術(shù)來定量評價茶葉的外觀品質(zhì),探討不同的光源對視覺系統(tǒng)檢測結(jié)果的影響.馬建紅等[6]提出多智能體的茶葉圖像等級鑒定技術(shù),可對茶葉模糊圖像等級有效鑒定.目前對茶葉品質(zhì)分類的研究主要集中在對不同種類名優(yōu)茶的分類,對同種茶葉的系統(tǒng)研究較少.因此,本文提出利用機器視覺技術(shù)自動檢測同品種茶葉品質(zhì)的新方法.
茶葉樣品圖像的采集系統(tǒng)由光箱、CCD相機、LED燈構(gòu)成,實驗所用光源為維視數(shù)字圖像技術(shù)有限公司的LED環(huán)形光源,垂直照射在待測茶葉樣品上,光源距離測試樣品高25 cm,茶葉樣品圖像由分辨率為1 300像素×1 024像素的攝像頭采集,采用USB 2.0接口,終端數(shù)據(jù)處理單元為華碩計算機,處理器操作系統(tǒng)為Window 2010,采集的茶葉彩色圖像由Matlab 2017a軟件進行處理分析,采集系統(tǒng)如圖1所示.
圖1 茶葉圖像采集系統(tǒng)
顏色特征對圖像來說是一種很重要的視覺特征,是人識別圖像最直觀的感知特征之一.HSI是由MUNSEU H A在1915年提出的一種顏色模型,該模型采用H、S和I三種基本特征量描述顏色.常見的描述顏色的RBG模型中的R、G和B分別代表圖像中的紅色、綠色和藍色分量值[7],HSI與RGB顏色模型對比的優(yōu)點主要在于:RGB顏色模型容易受環(huán)境光線變化的影響,HSI顏色模型基本上不受環(huán)境光線變化的影響,更與人的視覺對顏色的感知相近似[8].本文將采集到的以RGB形式表征的茶葉原始圖像轉(zhuǎn)換到HSI空間,計算圖像H分量、S分量、I分量的平均值和方差.因樣本數(shù)量較大,本文無法羅列出所有特征值,故只列出特征值的數(shù)值分布范圍如表1所示.可以看出,茶葉樣品良品與次品的顏色特征分布范圍有一定的差異性,尤其是S分量平均值、H分量方差、I分量方差,良品與次品的特征值分布在無交集的數(shù)值區(qū)間內(nèi).
紋理特征在自然圖像中廣泛存在,其能夠給人以明確的視覺效果,但由于紋理的復(fù)雜性,很難對其進行準確的描述.20世紀60年代,JULESZ等對紋理特征展開系統(tǒng)的研究[9].灰度共生矩陣方法是建立在估計圖像的二階組合條件概率密度函數(shù)基礎(chǔ)上的一種紋理特征分析方法.本文根據(jù)茶葉樣本圖像的紋理特點,選取灰度共生矩中的能量、對比度、同質(zhì)性、相關(guān)性等4個特征用以提取茶葉圖像的紋理特征,然后利用Matlab 2017a分別提取每幅茶樣圖像能量、慣性矩、同質(zhì)性和相關(guān)性的4個方向上(0°,45°,90°,135°)共計16個紋理特征參數(shù).提取的特征值分布范圍如表2所示.可以看出,茶葉樣品良品與次品圖像的紋理特征分布范圍有一定的差異性,可將紋理特征作為自動檢測茶葉品質(zhì)的特征.
表1 茶葉外形圖像的顏色特征變量值的分布范圍
表2 茶葉外形圖像的紋理特征變量值的分布范圍
主成分分析法是統(tǒng)計學中進行數(shù)據(jù)分析的一種有效方法,利用統(tǒng)計方差,去除統(tǒng)計變量之間的相關(guān)性,使數(shù)據(jù)得到降維和壓縮,并保留全部或絕大部分的信息.
本文對提取出來的茶葉樣本圖像的特征進行降維處理,見圖2.可以看出,前3項的貢獻率累計超過90%,表明選取這三種特征可以反映不同品質(zhì)茶葉的區(qū)別,實現(xiàn)茶葉品質(zhì)的自動識別,所以樣本特征矢量壓縮為3個不相關(guān)的主分量.這樣,降維率達到了3/22=13.6%,而信息保持率為90%.
圖2 試驗樣本特征矢量對區(qū)分整個樣本的貢獻率
對于任意、復(fù)雜和非線性的輸入-輸出映射,使用多層感知器的人工神經(jīng)網(wǎng)絡(luò)(ANN)分類方法的性能常常超過其他分類方法,本文考慮以下幾種人工神經(jīng)網(wǎng)絡(luò)框架.
BP-MLP模型具有輸入層、輸出層和一個隱藏層.輸入層連接了圖像特征(3個輸入節(jié)點),輸出層輸出茶葉品質(zhì)等級.在試驗中觀察到隱藏層的神經(jīng)元個數(shù)為35的時候準確率最高,本文的研究中考慮了隱藏層的學習率為0.5,并且使用“TANSIG”作為隱藏層out put上的激活函數(shù).“PURELIN”用作輸出層的激活函數(shù),輸出層的學習速率為1,迭代次數(shù)為1 500次.
GRNN是一種基于監(jiān)督學習過程的前饋神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu).他有四層——輸入層、模式(高斯函數(shù))層、求和層和輸出層.輸入層接收輸入信號并將其傳遞給模式層進行進一步處理.模式層計算輸入向量與訓(xùn)練向量之間的歐氏距離,并將該值傳遞給求和層作為激活函數(shù)(該函數(shù)為高斯函數(shù)).求和層有分子、分母兩個神經(jīng)元.分子神經(jīng)元計算與訓(xùn)練樣本輸出相對應(yīng)的加權(quán)和,分母神經(jīng)元計算模式層輸出的非加權(quán)和.輸出層通過分子除以分母來計算輸出.在我們的例子中,GRNN有3個輸入節(jié)點,對應(yīng)于3個圖像特征.由于本文的研究是函數(shù)逼近問題,輸出層只有一個節(jié)點,傳播常數(shù)的值為1.0.
RBFN由輸入層、隱藏層和輸出層組成.隱藏層中被稱為徑向中心的隱藏節(jié)點,實現(xiàn)徑向基函數(shù)即高斯函數(shù),輸出層則實現(xiàn)線性求和函數(shù).在訓(xùn)練過程中,將隱藏層的權(quán)值更新到輸出層并最終確定.RBFNN在徑向基網(wǎng)絡(luò)的隱藏層中不斷增加神經(jīng)元,通過最小化平均平方誤差達到可接受的精度.對于基于RBF的人工神經(jīng)網(wǎng)絡(luò)的開發(fā),考慮了由30個神經(jīng)元組成的輸入層和單神經(jīng)元的輸出層.
在標準的實驗室條件下,使用開發(fā)的圖像采集視覺系統(tǒng)對36個茶葉樣品(18個良品,18個次品)進行實驗.每個樣品取不同角度的圖像5次.因此,采集了180幅圖像,使用圖像分析程序?qū)D像進行初步處理,然后進行特征提取.數(shù)據(jù)集的30%作為訓(xùn)練集,70%作為測試集.應(yīng)用K-階(在本例中為K=10)交叉驗證技術(shù)來驗證神經(jīng)網(wǎng)絡(luò)模型.
本研究使用以上三種類型的神經(jīng)網(wǎng)絡(luò).因此,為了比較BPMLP、RBF和GRNN的性能,考慮MPPA(預(yù)測精度平均百分比)、MinPE(預(yù)測誤差最小值)、SDPE(預(yù)測誤差的標準差)、MSPE(預(yù)測誤差均方差)、MaxPE(預(yù)測誤差的最大值)5個性能參數(shù).
這些性能參數(shù)是在執(zhí)行10階交叉驗證后得到的結(jié)果.其中最重要的性能指示參數(shù)依次為MPPA、MSPE和MaxPE.MPPA表示神經(jīng)網(wǎng)絡(luò)模型的預(yù)測精度,MSPE表示神經(jīng)網(wǎng)絡(luò)模型的預(yù)測最優(yōu)表現(xiàn),MaxPE表示神經(jīng)網(wǎng)絡(luò)模型的預(yù)測精度的下限.SDPE和MSPE則能反映神經(jīng)網(wǎng)絡(luò)模型預(yù)測茶葉品質(zhì)的魯棒性.
表3 10階交叉驗證預(yù)測茶葉品質(zhì)分級平均準確率(%)
使用180張茶葉樣品的圖像對所提出的茶葉品質(zhì)自動檢測技術(shù)進行測試.利用10階交叉驗證技術(shù)對整個數(shù)據(jù)集進行了三種模型的驗證.表3分別用BPMLP、RBFN和GRNN預(yù)測茶葉品質(zhì)等級,給出了10階交叉驗證后的結(jié)果.
神經(jīng)網(wǎng)絡(luò)模型(BPMLP、RBFN和GRNN)預(yù)測茶葉品質(zhì)等級的性能總結(jié)如表4所示.以看出,三種模型都能獲得較高的識別率,預(yù)測精度平均百分比MPPA的數(shù)值都能在90%左右.另一方面,BP-MLP和GRNN的預(yù)測誤差最大值(MaxPE)分別為17.06%和12.99%,低于RBNF的9.12%,表示RBNF的預(yù)測精度下限高于GRNN和BP-ML.BP-MLP和GRNN標準差分別為2.23和2.08,方差分別為4.95和4.34,RBNF的標準差為1.33,方差為1.76,均低于其他兩種模型,表示RBNF的檢測穩(wěn)定性高于其他兩者.因此,對于茶葉品質(zhì)的自動檢測可以清楚地觀察到RBFN的性能優(yōu)于BP-MLP和GRNN,故選用RBFN作為檢測系統(tǒng)的神經(jīng)網(wǎng)絡(luò)模型.
表4 三種神經(jīng)網(wǎng)絡(luò)模型預(yù)測茶葉品質(zhì)等級的性能總結(jié)
本文提出一種利用低成本工業(yè)相機和光照條件建立的計算機視覺系統(tǒng)來自動檢測茶葉品質(zhì).10倍交叉驗證結(jié)果顯示三種神經(jīng)網(wǎng)絡(luò)模型都能得到90%左右的識別準確率,RBFN算法性能要優(yōu)于其他神經(jīng)網(wǎng)絡(luò)算法,而且性能更好,預(yù)測精度的下限較高.機器視覺技術(shù)可以用來自動檢測茶葉的品質(zhì),能夠得到準確、穩(wěn)定的茶葉品質(zhì)分級結(jié)果,實際應(yīng)用價值較高.目前茶葉分類只有2類,對茶葉品質(zhì)檢測率尚未達到100%,未來可以通過優(yōu)化神經(jīng)網(wǎng)絡(luò)模型和增加特征參數(shù)等來提高檢測準確率,并對茶葉的等級分級進行細化.