黃鋒華,燕紅文,苗榮慧
(山西農(nóng)業(yè)大學(xué) 信息科學(xué)與工程學(xué)院,山西 太谷 030801)
油桃具有極高的營養(yǎng)價值,口感較好,經(jīng)濟(jì)效益可觀,深受消費(fèi)者青睞[1],研究油桃品種分類對提高油桃的品質(zhì)及市場競爭力具有重要意義。高光譜成像技術(shù)檢測精度高,實(shí)時性強(qiáng),是果蔬分類應(yīng)用研究的常用技術(shù)[2]。趙旭婷等[3]選用CARS 和ELM 對油桃品種進(jìn)行了判別,谷靜思[4]對油桃的內(nèi)部品質(zhì)與品種通過近紅外光譜與介電頻譜進(jìn)行檢測研究,在品質(zhì)預(yù)測時近紅外光譜預(yù)測性能均優(yōu)于介電頻譜,在進(jìn)行品種判別時二者均可快速鑒別。本研究采用420~1 700 nm 波段高光譜成像技術(shù),選用PLS、LS-SVM 和ELM 模型對同產(chǎn)地的“曙光”“中油4號”“中油5號”“中油9號”進(jìn)行分類研究,以期得出最優(yōu)模型。
為保證研究的可靠性,采摘時以形狀相近、成熟度統(tǒng)一、果質(zhì)量均勻?yàn)檫x取樣本的根本原則,采集地點(diǎn)位于山西省運(yùn)城市某果園。樣本劃分及各品種數(shù)目見表1。圖1 為在可見近紅外波段下油桃品種樣本圖,圖2 為近紅外波段下油桃品種樣本圖。
表1 油桃品種樣本數(shù)Tab.1 The number of nectarine varieties
圖1 420~1 000 nm波段不同油桃品種圖Fig.1 The different nectarine varieties in 420~1 000 nm band
圖2 900~1 700 nm波段不同油桃品種樣本圖Fig.2 The samples of different nectarine varieties in the 900~1 700 nm band
由圖2可知,在近紅外波段下的油桃圖像是偽彩色的,無法顯示樣本表面的顏色及紋理信息,可分辨性較低。但相對圖1,該波段具有較強(qiáng)穿透性,可獲得更多的果皮和果肉信息,而不同品種間油桃樣本的組成成分存在明顯的差異,因此可選用該波段對不同油桃進(jìn)行判別分類。
紋理是表征圖像特征的重要參數(shù),紋理特征的有效提取是圖像分類與分割的重要過程[5],因此本研究采用紋理特征描述不同品種油桃之間的差異?;叶裙采仃嚕℅ray Level Co-occurrence Matrix,GLCM)可表示圖像灰度方向、間距、幅度等相關(guān)變化信息,適應(yīng)性強(qiáng),可有效的表征紋理[6]。其統(tǒng)計(jì)了圖像灰度為i、j距離為d 的像元同時出現(xiàn)的頻度,公式如(1)所示:
式中:θ——GLCM的生成方向,文中θ取0°。
表征紋理采用以下6個參數(shù),如公式(2)~(7)所示[7]:
均值:
對比度:
相關(guān)性:
P(i,j)——GLCM,且i、j代表2 個像素點(diǎn)的灰度級;μx、σx——相應(yīng)行灰度均值及標(biāo)準(zhǔn)差;μy、σy——相應(yīng)列灰度均值及標(biāo)準(zhǔn)差。
能量:
同質(zhì)性:
熵值:
本試驗(yàn)選用PLS、LS-SVM、ELM 3 種模型對油桃進(jìn)行分類,對其評價使用標(biāo)準(zhǔn)差(RMSEC)和相關(guān)系數(shù)(R2),目標(biāo)模型的R2高而RMSEC低。
偏最小二乘(PLS)將輸入數(shù)據(jù)進(jìn)行區(qū)分并按權(quán)重線性組合后重新表征輸入數(shù)據(jù),模型具有較強(qiáng)的預(yù)測能力[8];最小二乘支持向量機(jī)(LS-SVM)使用核函數(shù)將二次規(guī)劃問題轉(zhuǎn)化為線性方程組的求解[9];極限學(xué)習(xí)機(jī)(ELM)的基礎(chǔ)網(wǎng)絡(luò)為SLFN,SLFN 訓(xùn)練難度大,ELM 則克服了上述缺點(diǎn),具有泛化誤差小、訓(xùn)練高效的優(yōu)勢[10]。
模型對4 種油桃判別時,使用數(shù)值代表其類別:1 代表“曙光”,2 代表“中油4 號”,3 代表“中油5 號”,4 代表“中油9號”,誤差為0.5。模型判別出的代表油桃類別的值分別在[0.5~1.5)、[1.5~2.5)、[2.5~3.5)、[3.5~4.5)之間,預(yù)測類別值不在以上區(qū)間的為異類樣本。
在ENVI 環(huán)境中提取不同油桃的目標(biāo)區(qū)域,本試驗(yàn)中選取油桃圖像中部50×50 像素的目標(biāo)區(qū)域,對該區(qū)域采用1.2中的6個評價指標(biāo)對其紋理特征進(jìn)行處理,結(jié)果如表2所示。
由表2 可知,不同品種油桃樣本在可見/近紅外波段下提取得到的圖像紋理特征值具有較為明顯的差異;而在近紅外波段下提取得到的圖像紋理特征值差異不明顯,6 項(xiàng)紋理指標(biāo)值在4類品種間的差異不顯著,數(shù)據(jù)非常接近。因此,不可使用近紅外波段下的紋理指標(biāo)值對該4類油桃樣本進(jìn)行品種間的區(qū)分。
表2 4類樣本的GLCM紋理特征值Tab.2 The GLCM texture characteristic values of four types of samples
2.2.1 PLS建模
使用可見/近紅外波段下的圖像紋理特征值建立多品種油桃樣本的PLS品種分類判別,預(yù)測集判別結(jié)果,見圖3。
圖3 PLS模型判別結(jié)果Fig.3 The PLS model discrimination results
由圖3 可知,在該集合中,14 個“曙光”樣本被判別為“中油4 號”,2 個“曙光”樣本被判別為異類樣本;“中油4 號”中有8個被錯判為“曙光”,有1個判別為“中油5號”。
“中油5 號”中有1 個樣本被判為“中油4 號”,5 個被判為“中油9 號”;11 個“中油9 號”樣本被判為“中油5 號”樣本,2個“中油9 號”樣本被判為異類樣本;該模型在預(yù)測集取得78.95%準(zhǔn)確率。
2.2.2 LS-SVM 建模
使用可見/近紅外波段下的圖像紋理特征值建立多品種油桃樣本的LS-SVM品種分類判別,預(yù)測集判別結(jié)果見圖4。
圖4 LS-SVM模型判別結(jié)果Fig.4 The LS-SVM model discrimination results
由圖4 可知,在預(yù)測集樣本中,17 個“曙光”樣本被誤判,其中15 個樣本被誤判為“中油4 號”樣本,2 個樣本被誤判為異類樣本;8 個“中油4 號”樣本被判為“曙光”,1 個“中油4號”樣本被判為“中油5 號”;2 個“中油5 號”樣本被判為“中油4號”,5個“中油5號”樣本被判為“中油9號”;11個“中油9號”樣本被判為“中油5 號”,1 個樣本被誤判為異類樣本;由此計(jì)算其預(yù)測集準(zhǔn)確率分別為78.47%。
2.2.3 ELM建模
使用可見/近紅外波段下的圖像紋理特征值建立多品種油桃樣本的ELM品種分類判別,預(yù)測集判別結(jié)果,見圖5。
圖5 ELM模型判別結(jié)果Fig.5 The discrimination result of ELM model
由圖5 可見,在預(yù)測集樣本中,17 個“曙光”樣本被誤判,其中13 個樣本被歸類為“中油4 號”,4 個樣本被劃分為異類樣本;8 個“中油4 號”樣本判別為“曙光”,4 個“中油4 號”樣本判別為“中油5 號”;5 個“中油5 號”樣本預(yù)測為“中油4號”,2 個“中油5 號”預(yù)測為“中油9 號”;9 個“中油9 號”樣本被誤判為“中油5 號”樣本,4 個樣本被誤判為異類樣本;ELM的準(zhǔn)確率達(dá)到76.56%。
2.2.4 多種建模方式比較
本試驗(yàn)基于GLCM 選用3 種模型對4 種油桃的紋理特征進(jìn)行分析并據(jù)此對其品種進(jìn)行了預(yù)測,試驗(yàn)結(jié)果,見表3。
表3 各模型對油桃品種分類結(jié)果Tab.3 The classification results of nectarine varieties by various models
由表3可知,PLS對油桃品種判別效果最優(yōu):校正集模型精度R2 和RMSEC 分別達(dá)到0.839 和0.437,校正集與預(yù)測集判別正確率分別為84.02%、78.95%,平均判別準(zhǔn)確率為81.49%。
本研究基于GLCM 選用3 種模型對采收期同產(chǎn)地4 種油桃品種進(jìn)行了分類判別研究,結(jié)果如下:不同品種油桃樣本在可見/近紅外波段下提取得到的圖像紋理特征值具有較為明顯的差異;對于可見/近紅外波段下的圖像紋理特征值采用PLS 模型建立的判別精度最高,其整體模型的判別正確率達(dá)到81.49%;為了提高判別精度與可靠性,在后續(xù)的研究中可采用光譜主成分和圖像紋理數(shù)據(jù)進(jìn)行融合從而實(shí)現(xiàn)對油桃品種的判別研究。