張喜喜 徐 璇 董晨輝 蔣 飛 (上海市柑桔研究所,上海市崇明區(qū)09;浙江財(cái)經(jīng)大學(xué)經(jīng)濟(jì)與管理實(shí)驗(yàn)中心,浙江省杭州市 008;上海市崇明區(qū)長(zhǎng)興鎮(zhèn)農(nóng)業(yè)綜合技術(shù)推廣服務(wù)中心 09)
近年來(lái),隨著人們消費(fèi)水平的提高,消費(fèi)者在選購(gòu)柑橘時(shí)不僅注重大小、顏色、外觀等外部品質(zhì),對(duì)諸如糖度、口感、酸度、維生素含量等內(nèi)部品質(zhì)也越來(lái)越關(guān)注。其中,可溶性固形物含量是評(píng)價(jià)柑橘內(nèi)部品質(zhì)的重要指標(biāo)之一[1],它對(duì)柑橘口感的影響很大。隨著光譜檢測(cè)技術(shù)的發(fā)展,近紅外光譜檢測(cè)技術(shù)在南豐蜜桔、不知火雜柑、臍橙、蘋(píng)果、梨、櫻桃等水果的品質(zhì)檢測(cè)中得以廣泛應(yīng)用[1-4],且隨著近紅外光譜檢測(cè)薄皮水果內(nèi)部品質(zhì)研究的不斷推進(jìn),相關(guān)設(shè)備也開(kāi)始在實(shí)際生產(chǎn)上得到應(yīng)用[5-6]。但在儀器的實(shí)際使用過(guò)程中,儀器對(duì)果肉的可溶性固形物的檢測(cè)會(huì)受到儀器初始糾偏的顯著影響,若采用普通校正,會(huì)導(dǎo)致整體檢測(cè)值存在較大偏差;同時(shí),筆者通過(guò)查閱資料以及與儀器廠家技術(shù)人員進(jìn)行溝通發(fā)現(xiàn),在實(shí)際應(yīng)用近紅外光譜檢測(cè)水果內(nèi)部品質(zhì)的過(guò)程中,需建立更加精確的計(jì)算模型。因此,在實(shí)際應(yīng)用近紅外光譜大規(guī)模檢測(cè)同一產(chǎn)地的水果時(shí),應(yīng)直接建立可溶性固形物濃度與近紅外光譜數(shù)據(jù)之間的關(guān)系,經(jīng)過(guò)不同光譜預(yù)處理方法和變量篩選方法對(duì)光譜數(shù)據(jù)進(jìn)行處理,才能提高模型的預(yù)測(cè)能力,進(jìn)而建立最優(yōu)的預(yù)測(cè)模型[7],以便更精確地對(duì)可溶性固形物含量進(jìn)行預(yù)測(cè)。
“宮川”豐產(chǎn)、優(yōu)質(zhì),是我國(guó)近幾年發(fā)展的早熟溫州蜜柑品種之一,更是上海地區(qū)主栽柑橘品種。對(duì)溫州蜜柑進(jìn)行品質(zhì)無(wú)損檢測(cè),不僅能提升產(chǎn)區(qū)產(chǎn)品品質(zhì),還能滿(mǎn)足消費(fèi)者日益多元化的需求。因此,筆者以溫州蜜柑品種“宮川”為試驗(yàn)材料,對(duì)適合溫州蜜柑可溶性固形物無(wú)損檢測(cè)的近紅外光譜進(jìn)行研究,即篩選出可溶性固形物的顯著特征波段,并采用間隔偏最小二乘法建立溫州蜜柑可溶性固形物近紅外光譜模型,進(jìn)而提升對(duì)溫州蜜柑內(nèi)部品質(zhì)無(wú)損檢測(cè)的精準(zhǔn)度?,F(xiàn)將相關(guān)研究結(jié)果報(bào)道如下。
近紅外光譜檢測(cè)技術(shù)(Near Infrared Spectroscopy,簡(jiǎn)稱(chēng)NIRS)是近些年發(fā)展起來(lái)的一種高新分析技術(shù),可直接透過(guò)水果樣品內(nèi)部,利用水果對(duì)近外紅光的吸收、散射、反射和透射來(lái)確定水果成分含量。該技術(shù)具有測(cè)試成本低、樣品無(wú)需預(yù)處理、不會(huì)破壞樣品、無(wú)需化學(xué)藥劑等優(yōu)點(diǎn),故在水果品質(zhì)檢測(cè)中得到了越來(lái)越廣泛的應(yīng)用[8]。
試驗(yàn)樣品為溫州蜜柑“宮川”,于2019年11月5日采自上海前衛(wèi)柑桔有限公司基地,采用隨機(jī)采樣方法,選擇形狀、大小等基本相近的溫州蜜柑。在采集光譜前,清除樣品表面灰塵和污染,剔除有損傷和缺陷的樣品[8],用清水清潔外表后,對(duì)柑橘進(jìn)行編號(hào)標(biāo)記,最終得到140個(gè)樣品。將140個(gè)樣品按不同種植地塊分成6組進(jìn)行分析,其中A、B、C、D、E組均為20個(gè)樣品,F(xiàn)組為40個(gè)樣品。然后,抽取每20個(gè)樣品中的17個(gè)樣品作為建模樣品集,3個(gè)樣品作為預(yù)測(cè)樣品集,即建模樣品集為119個(gè)樣品,預(yù)測(cè)建模集為21個(gè)樣品,以評(píng)估模型的預(yù)測(cè)能力和穩(wěn)健性。
將經(jīng)過(guò)光譜檢測(cè)后的柑橘沿縱徑切成a和b兩半,榨汁,用愛(ài)拓ATAGO PR-32a糖度計(jì)實(shí)測(cè)榨汁液的可溶性固形物含量,并記錄。見(jiàn)表1。
表1 建模和預(yù)測(cè)樣品集可溶性固形物含量真實(shí)值分布
利用韓國(guó)Sunforest公司生產(chǎn)、型號(hào)為H-100C的水果糖度無(wú)損檢測(cè)儀,將采集部緊貼柑橘的a面或者b面,通過(guò)儀器內(nèi)置鹵素?zé)舭l(fā)出的光,經(jīng)過(guò)柑橘內(nèi)部發(fā)生漫反射,接收器識(shí)別射出的光,與空白對(duì)照相比較,在電腦上利用儀器自帶光譜吸收率采集軟件得出分波段光譜吸收率。
由于柑橘形狀、大小、表面粗糙程度、果實(shí)部位不同,其可溶性固形物含量也不同[9],另外電噪聲、雜散光、環(huán)境差異等也會(huì)影響采集的光譜信息[10],故筆者采用移動(dòng)平均、平滑處理、高斯濾波、中值濾波等方法對(duì)光譜數(shù)據(jù)進(jìn)行預(yù)處理,盡可能剔除與樣品自身無(wú)關(guān)的信息,以提高模型的預(yù)測(cè)能力和穩(wěn)定性[10]。
雖然H-100C水果糖度無(wú)損檢測(cè)儀也有檢測(cè)可溶性固形物含量的自帶模型,但它僅能粗略判斷樣品的可溶性固形物含量,誤差較大,且不夠準(zhǔn)確;同時(shí),在利用該儀器進(jìn)行柑橘可溶性固形物含量檢測(cè)前,必須進(jìn)行初始校正,且校正過(guò)程很容易受到其他因素的干擾,如光照、濕度、成熟度等。因此,亟需建立更加精確的模型。筆者針對(duì)不同的可溶性固形物含量對(duì)應(yīng)的波段吸收率不同,篩選出可溶性固形物的顯著特征波段,采用間隔偏最小二乘法和偏最小二乘法建立數(shù)學(xué)模型,并調(diào)整相關(guān)參數(shù),以便更精確地預(yù)測(cè)可溶性固形物的含量。模型中可溶性固形物特征波段的選擇和各個(gè)波段的最小二乘模型均采用matlab2019b編寫(xiě)程序建模計(jì)算仿真,并采用外部驗(yàn)證法對(duì)其性能進(jìn)行評(píng)價(jià)。
對(duì)原光譜和處理后的數(shù)據(jù)進(jìn)行偏最小二乘建模分析,根據(jù)最小交互驗(yàn)證均方根誤差確定建模的最佳主成分因子數(shù)[11],利用最佳主成分因子數(shù)結(jié)合最小二乘模型,得到模型的擬合優(yōu)度和交互驗(yàn)證均方根誤差。由表2可知,高斯濾波將原始光譜的相關(guān)系數(shù)從0.808 0提高到0.818 6,交互驗(yàn)證的均方根誤差從0.916 4°Birx降低到0.907 2°Birx;平滑處理將光譜相關(guān)系數(shù)從0.808 0提高到0.819 0,交互驗(yàn)證的均方根誤差從0.916 4°Birx降到0.906 2°Birx;其他幾種處理均無(wú)明顯改善。相關(guān)系數(shù)越大,模型的擬合優(yōu)度越高,預(yù)測(cè)的均方根誤差和交叉驗(yàn)證的均方根誤差越小,模型的預(yù)測(cè)能力越優(yōu)[12],故高斯濾波和平滑處理可消除部分噪聲影響,提高模型的預(yù)測(cè)能力。
表2 不同光譜預(yù)處理方法的偏最小二乘交互驗(yàn)證結(jié)果
選擇650~950 nm的波段,并分為10個(gè)光譜波段,在每個(gè)光譜波段中,分別利用偏最小二乘法建立可溶性固形物定量校正模型。如果某個(gè)波段的交互驗(yàn)證均方根小于全光譜建模的交互驗(yàn)證均方根誤差,則判定這波段為特征波段[12]。由表3可知,波段7(830~858 nm)和波段9(890~918 nm)的交互驗(yàn)證均方根誤差小于全波段,波段1(650~688 nm)、波段8(860~888 nm)的交互驗(yàn)證均方根誤差與全波段很接近,但波段7(830~858 nm)的相關(guān)系數(shù)較小,僅為0.606 7。由此確定,溫州蜜柑可溶性固形物含量的特征波段為波段9(890~918 nm),以波段 7(830~858 nm)、波段 1(650~688 nm)、波段8(860~888 nm)為備選特征波段。
采用21個(gè)未建模樣品來(lái)評(píng)價(jià)所建模型的性能,由表4可知,在單個(gè)波段的情況下,以波段9的建模效果最好,但考慮到波段7(830~858 nm)、波段8(860~888 nm)、波段9(890~918 nm)相鄰,合并這3個(gè)波段后建模,相關(guān)系數(shù)從0.810 3提高到0.9134,交互驗(yàn)證均方根誤差從0.908 3°Birx降到0.543 9°Birx,明顯優(yōu)于單個(gè)波段建模;另外,組合波段1(650~688)和波段7~波段9(830~918)后進(jìn)行建模,相關(guān)系數(shù)提升到0.904 0,交互驗(yàn)證均方根誤差降到0.504 6°Birx,也能得到較好的預(yù)測(cè)結(jié)果。
表3 分段光譜波段偏最小二乘法的評(píng)價(jià)指標(biāo)
表4 不同波段建模預(yù)測(cè)性能
以溫州蜜柑“宮川”為試驗(yàn)樣品,筆者對(duì)適合溫州蜜柑可溶性固形物無(wú)損檢測(cè)的近紅外光譜進(jìn)行了研究,即篩選出可溶性固形物的顯著特征波段,采用間隔偏最小二乘法建立溫州蜜柑可溶性固形物近紅外光譜模型,來(lái)預(yù)測(cè)溫州蜜柑的可溶性固形物含量。結(jié)果表明,在波段650~950 nm的范圍內(nèi),利用高斯濾波和平滑處理,可以在一定程度上消除噪聲影響,提高模型的精確性,但效果并不如間隔偏最小二乘的方法,結(jié)果與前人的相關(guān)研究一致[1、7、12]。經(jīng)分析,溫州蜜柑可溶性固形物特征波段為波段9(890~918 nm),備選特征波段為波段7(830~858 nm)、波段8(860~888 nm)、波段1(650~688 nm);組合這些波段后建模,可以大大提高模型預(yù)測(cè)的準(zhǔn)確性,模型的擬合優(yōu)度高達(dá)0.904 0,交互驗(yàn)證均方根誤差降到0.504 6°Birx。綜上,利用近紅外光譜技術(shù),結(jié)合間隔最小二乘特征波段選擇方法建立模型,可提高溫州蜜柑可溶性固形物檢測(cè)的預(yù)測(cè)能力和穩(wěn)健性。