高 升,王巧華,2*
(1. 華中農(nóng)業(yè)大學(xué) 工學(xué)院,湖北 武漢 430070;2. 農(nóng)業(yè)農(nóng)村部長(zhǎng)江中下游農(nóng)業(yè)裝備重點(diǎn)實(shí)驗(yàn)室,湖北 武漢 430070)
葡萄被譽(yù)為四大水果之首,2017年我國(guó)的葡萄總產(chǎn)量高達(dá)1308.0萬(wàn)噸[1]。紅提葡萄顆粒飽滿、果肉堅(jiān)實(shí)、香甜可口、富含較多的營(yíng)養(yǎng)物質(zhì),受到人們的廣泛喜愛(ài)。糖度(可溶性固形物)是水果的重要品質(zhì)之一,決定了果實(shí)的風(fēng)味,是消費(fèi)者進(jìn)行購(gòu)買時(shí)的重要參考,也是反映水果成熟度的重要指標(biāo)[2-3]。
水果糖度(可溶性固形物)的傳統(tǒng)檢測(cè)方法為進(jìn)行破壞試驗(yàn),擠出汁液利用折射法進(jìn)行測(cè)定[4],因檢測(cè)方法繁瑣費(fèi)時(shí),且只能進(jìn)行抽樣檢測(cè),檢測(cè)范圍較小,檢測(cè)完的實(shí)驗(yàn)樣本已完全損壞,無(wú)法銷售,造成較大的浪費(fèi)。光譜技術(shù)具有檢測(cè)時(shí)間短、操作簡(jiǎn)單、能保證果實(shí)的完整性和安全性等優(yōu)點(diǎn)[5-7]。高光譜技術(shù)是近些年發(fā)展起來(lái)的新技術(shù),它涵蓋了光譜技術(shù)和圖像技術(shù)兩種檢測(cè)方法,被廣泛應(yīng)用在蘋果[8]、哈密瓜、梨、臍橙[9]等水果和蔬菜的內(nèi)部品質(zhì)的無(wú)損檢測(cè)[10-11]。金瑞等[12]針對(duì)隨機(jī)放置的馬鈴薯缺陷多項(xiàng)指標(biāo)難以同時(shí)檢測(cè)的問(wèn)題,提出了一種基于高光譜信息融合的流形學(xué)習(xí)降維算法,結(jié)果表明高光譜信息融合技術(shù)結(jié)合流形學(xué)習(xí)降維算法可同時(shí)識(shí)別隨機(jī)放置馬鈴薯的多種缺陷指標(biāo)。Dong等[13]利用高光譜成像技術(shù)研究了在不同地方生長(zhǎng)的‘富士’蘋果的可溶性固形物含量(SSC)的無(wú)損測(cè)定,使用連續(xù)投影算法(SPA)和無(wú)信息變量消除(UVE)方法從全光譜中選擇有效波長(zhǎng)并分別建立偏最小二乘法回歸(PLSR)、最小二乘支持向量機(jī)(LSSVM)和極端學(xué)習(xí)機(jī)(ELM)模型,最終確定了最優(yōu)SSC預(yù)測(cè)模型是基于SPA選擇的有效波段所建立的LSSVM模型,模型預(yù)測(cè)集的相關(guān)系數(shù)和均方根誤差分別為0.878和0.908°Brix。Guo等[14]通過(guò)近紅外(NIR)高光譜成像確定“Xixuan”和“Huayou”品種的完整獼猴桃的可溶性固形物含量(SSC),并確定了“Xixuan”和“Huayou”品種及兩種品種結(jié)合的最佳SSC模型分別為SPA-LSSVM、FS-LSSVM和FS-LSSVM,預(yù)測(cè)集的相關(guān)系數(shù)分別為0.766,0.971,0.911,且預(yù)測(cè)集的均方誤差分別為0.968,0.589,1.137。該研究證明了使用近紅外高光譜成像技術(shù)作為預(yù)測(cè)獼猴桃SSC方法的可行性。目前,國(guó)內(nèi)外在葡萄品質(zhì)檢測(cè)方面有較多研究,Julio等[15]以高光譜成像方法檢測(cè)葡萄皮多酚含量、果肉汁的糖度酸度來(lái)確定成熟期間白葡萄的成熟度。Arana等[16]采用漫反射光譜對(duì)白葡萄的成熟度、品種、產(chǎn)地進(jìn)行檢測(cè)。Baiano等[17]利用高光譜技術(shù)測(cè)定7個(gè)品種的鮮食葡萄的內(nèi)部品質(zhì)指標(biāo),可溶性固形物含量的相關(guān)系數(shù)分別為0.94和0.93,但模型的穩(wěn)定性及預(yù)測(cè)準(zhǔn)確性可進(jìn)一步提高。然而,已有研究中大都只利用光譜信息建立葡萄糖度的模型,模型的預(yù)測(cè)性能不高,利用高光譜技術(shù)融合圖像信息的紅提糖度無(wú)損檢測(cè)研究還未見(jiàn)報(bào)道。
本文通過(guò)高光譜成像技術(shù),采集紅提的高光譜圖像信息和光譜信息,分別對(duì)比分析了基于光譜特征、圖像顏色形態(tài)特征、光譜信息與圖像信息融合,三種模式下所建立的紅提糖度PLSR和LSSVM模型的優(yōu)劣,提出了一種結(jié)合高光譜圖像信息和光譜信息建立穩(wěn)定的紅提糖度預(yù)測(cè)模型,為紅提糖度的無(wú)損檢測(cè)提供了可靠的檢測(cè)模型及方法。
實(shí)驗(yàn)材料為新鮮的紅提,在每穗紅提的穗外部、穗中部、穗頂部、穗尖分別挑選大小相近、顏色差異較大、完好無(wú)損的紅提果粒作為實(shí)驗(yàn)樣本,建模樣本總數(shù)為260粒。將樣本編號(hào)并放入恒溫恒濕箱中保存12 h,恒溫箱溫度設(shè)置為(22±1) ℃,相對(duì)濕度為65%。
申光WAY(2WAJ) 阿貝爾折射儀,上海儀電物理光學(xué)儀器有限公司;恒溫恒濕箱,上海新苗醫(yī)療器械制造有限公司;Zolix Hyper SIS-VNIR-CL高光譜成像系統(tǒng),美國(guó)海洋光學(xué)公司,該系統(tǒng)主要由高光譜成像光譜儀(芬蘭Spectral Imaging Ltd.公司)、CCD相機(jī)(日本Hamamatsu公司)、4個(gè)50 W的鹵素?zé)?北京卓立漢光儀器有限公司)、1臺(tái)絲桿式位移控制平臺(tái)(北京卓立漢光儀器有限公司)等主要部件組成。該系統(tǒng)采集的光譜波長(zhǎng)范圍為391~1 043 nm(含有520個(gè)波長(zhǎng)),分辨率為2.8 nm,整個(gè)采集系統(tǒng)置于暗箱內(nèi)。
2.3.1 高光譜圖像信息采集
高光譜成像系統(tǒng)預(yù)熱半小時(shí)后進(jìn)行實(shí)驗(yàn)。由于暗電流及CCD相機(jī)芯片不穩(wěn)定的影響,圖像會(huì)產(chǎn)生一定的噪聲,因此在樣本采集前需要對(duì)高光譜圖像進(jìn)行黑白校正。將標(biāo)準(zhǔn)白板(聚四氟乙烯長(zhǎng)方形白板)放在采集平臺(tái)上,獲得白板數(shù)據(jù)IW;蓋上相機(jī)蓋,獲得全黑標(biāo)定圖像ID;將紅提放在采集平臺(tái)上獲得原始高光譜漫反射圖像IR;根據(jù)公式(1)得到校正后紅提的圖像R[9]:
(1)
實(shí)驗(yàn)時(shí),在平臺(tái)上放置自制的帶孔載物平板。高光譜成像系統(tǒng)的參數(shù)設(shè)置為:相機(jī)曝光時(shí)間為0.15 s,平臺(tái)移動(dòng)速度為1.7 mm/s,移動(dòng)范圍為0~245 mm,樣本平臺(tái)與鏡頭的距離為420 mm。高光譜圖像采集系統(tǒng)如圖1所示。
圖1 高光譜圖像采集系統(tǒng)
2.3.2 光譜數(shù)據(jù)采集
試樣制備:光譜采集完的紅提樣本,按照國(guó)家鮮葡萄行業(yè)標(biāo)準(zhǔn)GH/T 1022-2000,分別對(duì)紅提果粒壓成汁,并用玻璃棒攪勻,并立即進(jìn)行糖度的測(cè)定。
糖度測(cè)定:用一次性滴管將取出的汁液滴到折射儀上,糖度測(cè)定參照NY/T 2637-2014《水果、蔬菜制品可溶性固形物含量的測(cè)定——折射儀法》[4],并記錄數(shù)據(jù)。
2.3.3 感興趣區(qū)域的提取及光譜數(shù)據(jù)處理
本研究把單粒圖像作為感興趣區(qū)域進(jìn)行光譜信息的提取,需要將單粒紅提從帶有背景的高光譜圖像中進(jìn)行分割。在Matlab R2016a軟件上對(duì)高光譜圖像進(jìn)行處理,選擇圖像中整粒紅提的圖像作為RIO(感興趣區(qū)域),提取RIO的平均光譜作為原始光譜信息。分析時(shí)去除兩端噪聲較大的波長(zhǎng),本文選取450~1 000 nm(含有439個(gè)波長(zhǎng))的波長(zhǎng)進(jìn)行建模。在進(jìn)行RIO提取時(shí),由圖2中背景與紅提果粒區(qū)域的反射率可知,在600~900 nm范圍內(nèi)背景的反射率較低而紅提果粒反射率較高,在726.6 nm時(shí)兩者反射率的差值最大。因此選取726.6 nm處的灰度圖像進(jìn)行果粒區(qū)域的提取,如圖3(a)所示。首先將灰度圖像采用Otsu閾值分割方法獲得二值圖像,灰度圖像如圖3(b),然后利用中值濾波和腐蝕運(yùn)算,得到背景區(qū)域?yàn)?、果粒區(qū)域?yàn)?的二值圖像,并將得到的二值圖像作為掩膜模板,如圖3(c)所示。最后依次將每個(gè)果粒分割出來(lái),并提取高光譜圖像中單個(gè)樣本紅提果粒區(qū)域的光譜信息進(jìn)行建模,掩膜后紅提區(qū)域圖像如圖3(d)所示。
圖2 高光譜圖像中背景與紅提區(qū)域的反射率
Fig.2 Reflectivity of background and red-lifted areas in hyperspectral images
圖3 光譜信息提取過(guò)程。(a)高光譜原始圖像;(b)灰度圖像;(c)掩膜模板圖像;(d)掩膜后紅提圖像。
Fig.3 Spectral information extraction process. (a) Hyperspectral image. (b) Grayscale image. (c) Mask template image. (d) Red globe grape image after mask.
2.3.4 圖像特征參數(shù)的提取
灰度共生矩陣(Gray level co-occurrrence matrix,GLCM)具有適應(yīng)性強(qiáng)、魯棒性好的特點(diǎn),經(jīng)常應(yīng)用于圖像紋理特征的提取[18]。由于紋理是灰度分布在空間位置上重復(fù)出現(xiàn)的結(jié)果,故在灰度圖像上,任意2個(gè)像素點(diǎn)之間存在一定的灰度關(guān)聯(lián)性質(zhì),GLCM可以表示出圖像灰度的改變方向、變化幅度、相隔間距等的綜合紋理信息?;叶裙采仃嚨挠?jì)算公式為:
P(i,j,d,θ)=
[(x,y)(x+D,y+D)|{f(x,y)=i;
f(x+D,y+D)=j}],
(2)
其中,P為灰度共生矩陣;(x,y)為原圖形中任意點(diǎn)的像素坐標(biāo);i是位于(x,y)處像素點(diǎn)的灰度;j是位于(x+D,y+D)處像素點(diǎn)灰度;θ、D為(x+D,y+D)和(x,y)像素點(diǎn)之間偏移的角度和距離;f(x,y)是圖像中坐標(biāo)為(x,y)的灰度;d為灰度共生矩陣的步長(zhǎng),取值為1。
其中角度一般采用0°、45°、90°、135°,為保證實(shí)際計(jì)算中參數(shù)的旋轉(zhuǎn)不變性,將4個(gè)角度所計(jì)算出的特征值取平均值[18]。
彩色圖像有RGB、HSV、Lab三種色彩空間,且每種色彩空間都具有明顯的特征信息,本研究共提取9個(gè)通道(R、G、B、H、S、V、L、a、b等9個(gè)顏色通道)信息作為圖像的顏色特征參數(shù)。紋理信息可以較好地描述物體表面的特征,本文采集紅提灰度圖像的均值、對(duì)比度、相關(guān)性、能量、同質(zhì)性、熵、灰度標(biāo)準(zhǔn)差、平滑度、三階矩、一致性共10個(gè)作為圖像的紋理特征信息,總共組合得到紅提圖像的19個(gè)圖像特征。
首先將高光譜原始圖像3(a)轉(zhuǎn)換為灰度圖像,按照光譜提取的方法依次將每個(gè)果粒分割出來(lái),根據(jù)圖像特征參數(shù)的提取方法,分別提取單個(gè)果粒的19個(gè)圖像特征。
2.3.5 模型建立及評(píng)價(jià)方法
本文分別基于光譜信息和圖像信息融合建立紅提糖度的線性PLSR、非線性LSSVM模型。
對(duì)比分析原始光譜及光譜預(yù)處理后所建模型的優(yōu)劣,確定了最優(yōu)的光譜預(yù)處理方式,并在最優(yōu)光譜預(yù)處理下,分別采用一次降維(GA、CARS、IRIV)算法和組合降維算法(CARS-SPA、IRIV-SPA、GA-SPA)六種降維方法對(duì)光譜信息進(jìn)行特征變量提取;分別結(jié)合偏最小二乘回歸算法(Partial least squares regression,PLSR)與最小二乘支持向量機(jī)(Least squares support vector machine,LSSVM)進(jìn)行模型的建立,對(duì)比分析模型的優(yōu)劣。
PLSR是一種經(jīng)典的通過(guò)最小化偏差平方和對(duì)曲線進(jìn)行線性擬合的方法,結(jié)合了多元線性回歸、相關(guān)分析和主成分的優(yōu)點(diǎn)。最小二乘支持向量機(jī)(LSSVM)通過(guò)求解一次線性組來(lái)代替支持向量機(jī)中復(fù)雜二次優(yōu)化問(wèn)題,有效地簡(jiǎn)化了模型,提高了模型的運(yùn)算速度。
模型的準(zhǔn)確性和穩(wěn)定性由校正集相關(guān)系數(shù)(Rc)及均方根誤差(RMSEC)、預(yù)測(cè)集相關(guān)系數(shù)(Rp)及均方根誤差(RMSEP)、殘差預(yù)測(cè)偏差(Residual predictive deviation,RPD)ΔRPD進(jìn)行模型性能的評(píng)價(jià)。相關(guān)系數(shù)越接近1,均方根誤差越接近0,模型的預(yù)測(cè)性能及穩(wěn)定性越好。ΔRPD的評(píng)價(jià)指標(biāo):ΔRPD的值小于1.5表示預(yù)測(cè)性能較差;1.5~2.0之間表示模型可以預(yù)測(cè)低值和高值;2.0~2.5之間表示可以進(jìn)行粗略的定量預(yù)測(cè);2.5~3.0或更高的值表示具有良好的預(yù)測(cè)精度[19]。
(5)
(6)
ΔRPD=Δstdp/RMSEP,
(7)
其中,ypi為預(yù)測(cè)集或校正集中的第i個(gè)樣本的預(yù)測(cè)值及其實(shí)際測(cè)量值;ymi為校正集中的第i個(gè)樣本的預(yù)測(cè)值及其實(shí)際測(cè)量值;ymean表示對(duì)應(yīng)所有nc個(gè)校正集樣本或np個(gè)預(yù)測(cè)集樣本實(shí)際測(cè)量值的平均值;Δstdp為預(yù)測(cè)集的標(biāo)準(zhǔn)差。
KS(Kennard-Stone,KS)法[20]的優(yōu)點(diǎn)是能夠有效地選取光譜數(shù)據(jù)差異較大的樣本作為校正集,剩余的樣本劃分為預(yù)測(cè)集,提高模型的穩(wěn)定性和預(yù)測(cè)精度。實(shí)驗(yàn)中共采集了260份紅提樣本,按照3∶1比例利用KS算法劃分為195個(gè)校正集樣本,65個(gè)預(yù)測(cè)集樣本(表1)。從表2中可以看出,糖度分布范圍為(15.500~22.000)°Brix,校正集和預(yù)測(cè)集的標(biāo)準(zhǔn)差值分別為1.068和1.099。
表1 利用KS算法劃分樣本集的數(shù)據(jù)統(tǒng)計(jì)
表2 采用不同預(yù)處理方法的全波長(zhǎng)PLSR預(yù)測(cè)模型
從圖4中可以得出,所有紅提樣本的光譜都呈現(xiàn)出相同的變化趨勢(shì),在450~550 nm區(qū)間內(nèi)曲線平滑,吸光度變化較小,550 nm之后反射強(qiáng)度快速升高,波峰為640,963 nm,波谷為675,955,970 nm。
進(jìn)行光譜預(yù)處理能有效地消除由于儀器噪音、暗電流等因素的影響,因此本研究采用標(biāo)準(zhǔn)正態(tài)變量變換(Standard normal variate transformation,SNV)、Savitzky-Golay卷積平滑處理法(SavitZky-Golay,S-G)、多元散射校正(Multivariate scatter correction,MSC)、移動(dòng)窗口平滑(Moving-average method,MA)等預(yù)處理方法。由圖2可知,原始光譜所建模型效果最好,下文中選擇原始光譜進(jìn)行特征波長(zhǎng)的提取。
圖4 原始光譜信息
由于實(shí)驗(yàn)采集的高光譜反射圖像包含較多的波段,且波段之間存在較大的相關(guān)性及冗余信息,為提高模型的預(yù)測(cè)速度和精度,進(jìn)行光譜特征波長(zhǎng)的提取。
3.3.1 GA提取特征波長(zhǎng)
GA算法使用現(xiàn)則、交叉和變異三類遺傳算子把復(fù)雜的模型用繁殖機(jī)制結(jié)合簡(jiǎn)單的編碼技術(shù)表現(xiàn),并不斷地進(jìn)行迭代、優(yōu)化來(lái)進(jìn)行優(yōu)勝劣汰,得到最優(yōu)解。
以對(duì)原始光譜利用GA算法提取特征波長(zhǎng)為例,在GA算法中設(shè)定初始群體為30,交叉率為50%,變異率為1%,迭代次數(shù)為100,以最小的RMSECV值作為評(píng)價(jià)標(biāo)準(zhǔn),篩選出在迭代過(guò)程中出現(xiàn)頻次較多的波長(zhǎng)點(diǎn)作為最優(yōu)提取的特征波長(zhǎng);經(jīng)過(guò)20次隨機(jī)搜索后,最終提取的特征波長(zhǎng)點(diǎn)數(shù)目為72,占原始光譜信息16.40%的特征波長(zhǎng)如圖5所示。
圖5 紅提糖度的GA特征波長(zhǎng)選取圖
Fig.5 GA characteristic wavelength selection map of red globe grape sugar content
3.3.2 連續(xù)投影算法
連續(xù)投影算法(Successive projection algorithm,SPA)是一種可有效消除變量共線性的算法。對(duì)經(jīng)過(guò)IRIV特征波長(zhǎng)提取后的光譜信息利用SPA算法提取特征波長(zhǎng),設(shè)定波長(zhǎng)選擇變量數(shù)范圍為5~35,選擇步長(zhǎng)為1,根據(jù)RMSEC的變化確定選擇特征變量個(gè)數(shù),最終提取的特征波長(zhǎng)點(diǎn)數(shù)目為23,如圖6(a)所示;在原始光譜中所選特征波長(zhǎng)位置如圖6(b)所示。
圖6 紅提糖度的SPA特征波長(zhǎng)選取圖
Fig.6 SPA characteristic wavelength selection map of red globe grape sugar content
3.3.3 CARS提取特征波長(zhǎng)
對(duì)原始光譜利用競(jìng)爭(zhēng)性自適應(yīng)加權(quán)算法(Competitive adaptive reweighted sampling,CARS)提取特征波長(zhǎng),本研究設(shè)定蒙特卡羅采樣為50次,采用5折交叉驗(yàn)證法。由圖7可知,取采樣50次所建立的PLSR模型中所對(duì)應(yīng)的最小RMSECV作為最優(yōu)結(jié)果。由圖7(b)可知,當(dāng)RMSECV值達(dá)到最小值時(shí),各變量的回歸系數(shù)位于圖7(c)中豎直線位置,采樣運(yùn)行24次,最終提取的特征波長(zhǎng)點(diǎn)數(shù)目為35。
圖7 紅提糖度的CARS特征波長(zhǎng)選取圖。(a)采樣變量數(shù);(b)RESECV;(c)回歸系數(shù)路徑。
Fig.7 CARS characteristic wavelength selection map of red globe grape sugar content. (a) Number of sampled variables. (b) RESECV. (c) Regression coefficients path.
3.3.4 IRIV提取特征波長(zhǎng)
迭代保留信息變量法(Iteratively retains informative variables,IRIV)是一種新型變量選擇算法。該算法假設(shè)所有變量被采樣的幾率相同,充分考慮波長(zhǎng)變量間的聯(lián)合效應(yīng),根據(jù)對(duì)模型的有益程度將變量分為強(qiáng)信息變量、弱信息變量、無(wú)信息變量和干擾信息變量。在特征變量選擇過(guò)程中,移除無(wú)信息變量和干擾信息變量,保留有益的強(qiáng)信息變量和弱信息變量[21],并利用反向消除策略對(duì)剩余變量進(jìn)行消除,得到特征變量。對(duì)原始光譜利用CARS算法提取特征波長(zhǎng),設(shè)定IRIV算法的最大主成分為10,交叉驗(yàn)證次數(shù)為5,最終提取的特征波長(zhǎng)點(diǎn)數(shù)目為42。經(jīng)過(guò)IRIV提取的特征波長(zhǎng)如圖8所示。
圖8 紅提糖度的IRIV特征波長(zhǎng)選取圖
Fig.8 IRIV characteristic wavelength selection map of red globe grape sugar content
獲得紅提高光譜圖像信息灰度共生矩陣的紋理信息,結(jié)合圖像的顏色信息(R、G、B、H、S、V、L、a、b),組成19個(gè)圖像特征參數(shù),采用主成分分析(Principal component analysis,PCA)算法[22]對(duì)圖像信息進(jìn)行降維。PCA算法的原理是沿著協(xié)方差最大的方向由高維數(shù)據(jù)空間向低維數(shù)據(jù)進(jìn)行空間投影,獲得相互獨(dú)立的主成分分量。該算法既可以去除原始數(shù)據(jù)中的大量冗余信息,又可以最大限度表征原始信息。
由于提取的圖像特征量綱的不同,在進(jìn)行PCA降維前,先進(jìn)行歸一化運(yùn)算。由圖9可知,對(duì)提取的19個(gè)圖像特征進(jìn)行PCA降維后提取的前5個(gè)主成分的累積貢獻(xiàn)率已經(jīng)達(dá)到99.992%,完全達(dá)到了建模的要求,為簡(jiǎn)化模型的運(yùn)算速度和可靠性,對(duì)PCA降維提取的前5個(gè)主成分進(jìn)行建模研究。
圖9 基于主成分分析算法的圖像特征提取
Fig.9 Image feature extraction based on principal component analysis algorithm
3.5.1 光譜模型建立
基于特征波長(zhǎng)建立的紅提糖度PLSR預(yù)測(cè)模型和LSSVM預(yù)測(cè)模型如表3、4所示。由表3、4可知,對(duì)于建立的PLSR模型和LSSVM模型,一次降維和組合算法特征波長(zhǎng)提取后兩種模型的校正集和預(yù)測(cè)集的相關(guān)系數(shù)相近,都有效地提高了模型的穩(wěn)定性。在一次降維特征波長(zhǎng)提取后進(jìn)行SPA后的組合算法有效地提高了各個(gè)一次降維所建模型的相關(guān)系數(shù)和殘差預(yù)測(cè)偏差,均方根誤差減小,說(shuō)明模型的預(yù)測(cè)精度提高,模型穩(wěn)定性增強(qiáng)。進(jìn)行組合算法可有效地剔除冗余信息,提取有效信息,大大簡(jiǎn)化模型。
表3 基于特征波長(zhǎng)建立的紅提糖度PLSR預(yù)測(cè)模型
表4 基于特征波長(zhǎng)建立的紅提糖度LSSVM預(yù)測(cè)模型
高光譜采集后利用光譜信息,通過(guò)IRIV-SPA特征波長(zhǎng)提取后,挑選出了有用的光譜特征信息,簡(jiǎn)化了模型。紅提糖度最優(yōu)模型特征波點(diǎn)如表5所示。
表5 糖度最優(yōu)模型特征波點(diǎn)列表
3.5.2 圖像模型建立
基于圖像信息建立的紅提糖度PLSR和LSSVM預(yù)測(cè)模型如表6所示,利用提取的19個(gè)圖像特征分別建立PLSR模型和LSSVM模型,模型的相關(guān)系數(shù)低于0.65,模型的預(yù)測(cè)性能不佳。LSSVM模型的相關(guān)系數(shù)和殘差預(yù)測(cè)偏差大于PLSR模型,效果要好于PLSR模型。
表6 基于圖像信息建立的紅提糖度PLSR和LSSVM預(yù)測(cè)模型
3.5.3 光譜特征和圖像特征融合建模
基于光譜信息融合圖像信息建立的紅提糖度PLSR和LSSVM預(yù)測(cè)模型如表7所示。由表7可知,通過(guò)PCA算法提取圖像特征后建立模型的相關(guān)系數(shù)與19個(gè)原始圖像特征相比,模型的相關(guān)系數(shù)增大,模型性能有所提高。利用光譜特征建立模型的相關(guān)系數(shù)大于圖像特征所建模型,光譜信息與圖像信息相比,能更好地預(yù)測(cè)紅提糖度。圖像光譜融合后所建模型最好,模型的穩(wěn)定性最好,所建的LSSVM模型效果好于PLSR所建模型的效果。
表7 基于光譜信息融合圖像信息建立的紅提糖度PLSR和LSSVM預(yù)測(cè)模型
Tab.7 Prediction model of red globe grape sugar content PLSR and LSSVM based on spectral information fusion image information
特征(數(shù)量)PLSR模型LSSVM模型RcRMSECRpRMSEPΔRPDRcRMSECRpRMSEPΔRPD圖像特征(5)0.6270.9650.6010.9081.2100.6510.9390.6320.8641.272光譜特征(23)0.9170.4310.9150.4482.4540.9260.4090.9210.4172.636圖像光譜融合(28)0.9430.3670.9410.3613.0450.9540.3290.9520.3323.311
3.5.4 最優(yōu)模型結(jié)果比較
分別利用圖像光譜融合建立紅提糖度的PLSR及LSSVM模型,校正集和預(yù)測(cè)集樣本的預(yù)測(cè)值和化學(xué)測(cè)量值之間的散點(diǎn)圖如圖10~11所示。
由圖10、11可知,校正集和預(yù)測(cè)集的數(shù)據(jù)都比較集中,模型的預(yù)測(cè)效果較好;所建立的紅提糖度的最優(yōu)PLSR模型的校正集和預(yù)測(cè)集的相關(guān)系數(shù)分別為0.943和0.941,所建立的紅提糖度的最優(yōu)LSSVM模型的校正集和預(yù)測(cè)集的相關(guān)系數(shù)分別為0.954和0.952,LSSVM模型可以更好地預(yù)測(cè)紅提的糖度。
圖10 基于IRIV-SPA-PLSR紅提糖度最優(yōu)PLSR模型
Fig.10 Optimal PLSR model based on IRIV-SPA-PLSR red globe grape sugar content
圖11 基于IRIV-SPA-LSSVM紅提糖度最優(yōu)LSSVM模型
Fig.11 Optimal PLSR model based on IRIV-SPA-LSSVM red globe grape sugar content
本文利用光譜信息進(jìn)行建模分析,IRIV-SPA組合降維算法可有效地提取紅提糖度光譜信息的特征波長(zhǎng);只利用圖像信息進(jìn)行建模分析,模型的預(yù)測(cè)性能不佳;將IRIV-SPA特征波段提取后的光譜和經(jīng)PCA降維后的圖像信息進(jìn)行融合所建模型的效果最好,并將融合信息分別建立PLSR和LSSVM模型,紅提糖度的最優(yōu)PLSR模型的校正集和預(yù)測(cè)集相關(guān)系數(shù)分別為0.943和0.941;紅提糖度的最優(yōu)LSSVM模型的校正集和預(yù)測(cè)集相關(guān)系數(shù)分別為0.954和0.952;同時(shí)有效地提高了紅提糖度預(yù)測(cè)性能,為紅提糖度的檢測(cè)找到了一種新的方法。
非線性LSSVM模型的效果好于線性PLSR模型,且模型更加穩(wěn)定,但模型的運(yùn)算時(shí)間較長(zhǎng)。