国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于高光譜成像技術的鮮蓮直鏈淀粉含量檢測*

2022-05-05 00:59鄒金平李佳育
南方農(nóng)機 2022年9期
關鍵詞:直鏈蓮子校正

高 勝,黃 亮,鄒金平,李佳育,魏 萱,2,3

(1.福建農(nóng)林大學機電工程學院,福建 福州 350100;2.福建農(nóng)林大學食品科學學院,福建 福州 350002;3.福建省農(nóng)業(yè)信息感知技術重點實驗室,福建 福州 350100)

0 引言

隨著生活水平的提高,人們對蓮子的口味和營養(yǎng)方面的要求也越來越高。蓮子作為藥材的同時也是一種滋補品,其直鏈淀粉的含量直接影響著蓮子的品質(zhì)和口感。作為一種高淀粉含量的食品,蓮子的直鏈淀粉含量會影響蓮子的吸水性、膨脹性、固體物質(zhì)溶解性、顏色、光澤、黏性和柔軟性[1]。不同品種蓮子的直鏈淀粉含量差別較大,因此檢測蓮子的直鏈淀粉含量對后續(xù)加工有重要意義。傳統(tǒng)的直鏈淀粉檢測一般是利用碘比色法、碘親和力滴定法以及橫切侵染法,這些方法費時費力,且容易受實驗條件的影響[2]。

高光譜成像技術是一種能獲取豐富光譜和圖像信息的無損檢測技術,相較于化學檢測方法,具有省時、省力、環(huán)境友好的優(yōu)點[2]。現(xiàn)已有很多基于高光譜成像技術的農(nóng)產(chǎn)品內(nèi)部品質(zhì)的研究。在直鏈淀粉含量研究方面,利用反射光譜來預測谷類籽粒的粗蛋白和直鏈淀粉含量的可行性得到了初步驗證[3],如李亨[4]建立了基于高光譜成像技術的馬鈴薯淀粉含量定量檢測模型,相關系數(shù)(rp)達到0.925,效果比較好。王麗平[5]建立了基于近紅外光譜技術的水稻直鏈淀粉含量檢測模型,其中對非糯性水稻的預測結果比較好。如劉蕓等[6]比較了直鏈淀粉、粗淀粉、粗蛋白三者光譜間的差異性,并分析其高光譜特征,分別建立了相關預測模型(r>0.7)。結果表明,基于高光譜成像技術可以很好地預測小麥、大米內(nèi)部的直鏈淀粉的含量,但是目前還缺乏基于高光譜成像技術的鮮蓮內(nèi)部直鏈淀粉含量檢測的研究。

課題組采用高光譜成像技術對鮮蓮直鏈淀粉進行檢測研究,并采用波長優(yōu)選方法篩選對直鏈淀粉敏感的特征波段,從而建立鮮蓮直鏈淀粉檢測模型,以期為鮮蓮加工過程中的直鏈淀粉含量在線檢測提供解決方案。

1 材料和方法

1.1 試驗材料

試驗樣本來源于福建省三明縣蓮科所,選用宣蓮、廣昌蓮、建選36號、滿天星、太空蓮和湘蓮等品種。在成熟期采摘后,將新鮮蓮蓬置于液氮中保存,運輸至福建農(nóng)林大學實驗室,在溫度為4 ℃冰箱中冷藏保存12個小時。

1.2 高光譜圖像采集與校正

高光譜成像系統(tǒng)主要包含的部件有高光譜成像儀(ImSpector V10E, SPECIM, Spectral Imaging Ltd.Oulu, Finland)、光源、載物臺、黑箱以及高光譜數(shù)據(jù)采集軟件等。整套系統(tǒng)由臺灣五鈴光學提供,可采集光譜范圍為400 nm~1 000 nm,光譜分辨率為2.8 nm。高光譜成像系統(tǒng)如圖1所示,載物平臺的移動速度設置為3.5 mm/s,曝光時間為30 ms。鏡頭距離移動平臺40 cm,且垂直向下。調(diào)節(jié)高光譜儀相機的焦距對系統(tǒng)進行黑白校正。校正公式如下:

圖1 高光譜成像系統(tǒng)示意圖

其中,M——校正后的高光譜圖像數(shù)據(jù);M0——原始高光譜圖像數(shù)據(jù);A——黑暗背景下高光譜圖像數(shù)據(jù);N——標準反射白板的高光譜數(shù)據(jù)。

1.3 蓮子直鏈淀粉含量的測定

采集高光譜圖像后,采用直鏈淀粉含量測試盒(蘇州科銘生物技術有限公司生產(chǎn))測試直鏈淀粉含量。稱取0.01 g的烘干樣本于研缽中研碎,經(jīng)過勻漿、提取、離心等步驟,取20 μL上清液置于96孔板中依次加入顯色劑,測定620 nm處吸光值,再通過96孔板的計算公式測定蓮子直鏈淀粉的含量。多次測量取平均值,利用吸光值測定直鏈淀粉的公式如下:

1.4 數(shù)據(jù)處理

采用ENVI 4.7(ITT Visual Information Solution,America)、Matlab 2017(MathWorks, America)和The Unscrambler 10.1(CAMO, America)等分析軟件處理數(shù)據(jù)。

1.4.1 光譜預處理

采用ENVI 4.7對蓮子的光譜圖像進行感興趣區(qū)域(ROI)的平均光譜提取,為了消除噪聲、外部雜光等的影響,對比一階導數(shù)、二階導數(shù)、SG平滑(S-G smoothing)、多元散射校正(MSC)、標準正態(tài)變量轉(zhuǎn)換(standard normal variate transformation, SNV)等預處理方法建模效果[7],選取最佳的預處理方法。

1.4.2 樣本集劃分

建立光譜和化學值之間的分析模型,采集大量樣本的光譜數(shù)據(jù)和化學值,在這大量的樣本數(shù)據(jù)中挑選出具有該樣本特性的數(shù)據(jù),并將獲得的樣本集劃分為校正集和預測集,選擇具有強樣本特性的校正集樣本可以使得建模時計算量減少,并且還可以提高預測模型的準確度[8]。本試驗采用的是SPXY法(sample set partitioning based on joint x-y distances)。SPXY法的優(yōu)點:使用SPXY法對樣本集進行劃分時,可以在考慮樣本集光譜變量的同時兼顧到化學值[9],SPXY法的具體計算公式如下:

計算公式中,dxy(m,n)指的是計算樣本m和樣本n之間的歐式距離,dx(m,n)指的是基于樣本中光譜變量x來計算樣本中的歐式距離,dy(m,n)指的是以化學值來計算樣本之間的歐氏距離。n指的是總的樣本集個數(shù),m指的是樣本集光譜曲線波長的數(shù)目,為了使獲得的樣本集在兩個不同的空間上有相同大小的權重,所以對樣本集的光譜數(shù)據(jù)和化學值分別進行標準化處理。

為了使樣本在兩個空間具有相同的權重,分別除以各個空間的最大值進行標準化處理。

1.4.3 特征波長提取方法

連續(xù)投影算法(SPA)是一種去除樣本集光譜數(shù)據(jù)之間線性影響的算法[10]。SPA算法的原理是在所有樣本集的光譜數(shù)據(jù)之間進行循環(huán)投影計算,以便于找到冗余數(shù)據(jù)信息變量最少的組合,這樣使得各個樣本集數(shù)據(jù)之間共線性最小,使得建模不僅快而且還擁有更好的建模精度[11]。算法原理如下:

令xj為校正集光譜第j列,令xj=pxj,再令n=n+1,如此循環(huán)進行計算。

回歸系數(shù)法(RC)是通過因變量和若干個自變量之間的定量表達式獲得的,即回歸方程通過控制可控變量的數(shù)值[12],從影響變量變化的自變量中區(qū)分出重要因素和次要因素,表達式如式(7)所示:

其中A0,A1分別為回歸常數(shù)和回歸系數(shù),M為隨機誤差。

1.4.4 建模方法

本文采用偏最小二乘回歸(PLSR)方法建立直鏈淀粉檢測模型,PLSR同時具有主成分分析和多元線性回歸分析的優(yōu)點[13]。在建模過程中,通過計算自變量和因變量之間的方差來提高模型的預測精度,所以建立PLSR模型的關鍵是確立主因子數(shù)目或者是隱含變量(LV)的數(shù)目。假如主因子數(shù)目量太少,則無法表達出被測樣本光譜數(shù)據(jù)的變化。如果主因子數(shù)目過多,則會使得一些噪聲的數(shù)據(jù)加入到模型中,導致建立的模型預測能力變差[14]。

1.4.5 模型評價

以相關系數(shù)(R)、校正集均方根誤差(RMSEC)、預測集均方根誤差(RMSEP)作為衡量直鏈淀粉預測效果的主要指標,并另外選用相對分析誤差(RPD)對預測精度再次進行評價[15],通過式(8)獲得。如果RPD≥2,則表明模型預測效果良好,可進一步用于實際檢測研究;如果1.4≤RPD<2,則表明模型可進行定量分析,由于RPD值較小,所以預測精度還有待提高[16];如果RPD<1.4,則表明模型預測能力較差,難以進行定量分析[17]。RPD的表達式如下:

式中,SD為標準差,SEP為標準預測誤差。

2 結果與分析

2.1 感興趣區(qū)域平均光譜

本文將單個樣本感興趣區(qū)域(region of interest,ROI)中每個像素點的光譜曲線用于后續(xù)處理,去除首尾噪聲后(400 nm~971 nm)的平均光譜圖如圖2所示。從圖中可以看出不同樣本的光譜數(shù)值變化趨勢比較一致,波段在460 nm~570 nm有明顯的上升偏移,可能是由于水分波段發(fā)生偏移所致,波段在500 nm~920 nm處存在較為明顯的吸收,可能與直鏈淀粉分子中的C-H基團的四級倍頻、O-H二級倍頻、O-H一級倍頻有關。

圖2 感興趣區(qū)域平均光譜圖

2.2 蓮子的直鏈淀粉含量

采用SPXY法所劃分的校正集和預測集直鏈淀粉含量結果如表1所示。從表中可以看出鮮蓮的直鏈淀粉含量差異較大,校正集蓮子直鏈淀粉的含量最大值為227.90 mg/g,最小值為100.82 mg/g,標準差為44.73 mg/g。預測樣本的直鏈淀粉含量在校正集樣本的范圍內(nèi),故樣本劃分合理。

表1 蓮子直鏈淀粉含量化學值統(tǒng)計值

2.3 光譜分析與預處理

在高光譜圖像的采集過程中可能會受到暗電流、外部雜光和外部環(huán)境噪聲等設備環(huán)境的影響,而這些無關的信息會影響光譜數(shù)據(jù)的準確性,故需要對光譜數(shù)據(jù)進行預處理。將不同預處理的光譜作為模型輸入,建立直鏈淀粉含量檢測PLSR回歸預測模型,結果如表2所示。從表中可以看出,經(jīng)過MSC和一階導數(shù)的復合預處理方法最優(yōu),所建PLSR模型的校正集相關系數(shù)(Rc)為0.803,校正集均方根誤差(RMSEC)為1.855,預測集相關系數(shù)(Rp)為0.836,預測集均方根誤差(RMSEP)為2.072,相對分析誤差(RPD)為1.623,結果表明使用該方法進行蓮子直鏈淀粉含量檢測具有一定可行性。

表2 采用不同預處理光譜建立的鮮蓮直鏈淀粉含量檢測PLSR模型結果

2.4 特征波長的提取

采用回歸系數(shù)法(regression coefficient, RC)和連續(xù)投影算法(SPA)提取預處理后的光譜特征波長,然后建立PLSR預測模型。在RC方法中,選擇如圖3中所示的波峰波谷位置所對應的波段作為特征波段,提取的特征波段有418.5 nm、425.7 nm、463.4 nm、509.0 nm、543.8 nm、584.0 nm、683.4 nm、795.8 nm、879.1 nm、919.5 nm和974.2 nm共計11個波段。

圖3 基于回歸系數(shù)法特征波段提取圖

圖4為SPA選取的波長數(shù)對應的交叉驗證均方根誤差。SPA方法選擇特征波長變量時,根據(jù)RMSEC確定最佳的特征波長數(shù),最佳的特征波長數(shù)對應于最小的RMSEC。由圖4可知,當特征提取的波長數(shù)為9時,建立的PLSR模型有最小的RMSEC值,其值為1.802。因此,SPA選擇了449.5 nm、464.1 nm、500.6 nm、582.7 nm、644.3 nm、756.1 nm、812.4 nm、872.3 nm、977.6 nm共9個特征波段,特征波段數(shù)約占全光譜的2%,極大地減少光譜波長變量,加快建模速度。

圖4 變量篩選圖

由表3可知,經(jīng)過連續(xù)投影算法(SPA)提取特征波長后所建立的模型效果最好,偏最小二乘模型的校正集的相關系數(shù)均在0.835左右。如圖5和圖6所示,利用SPA提取的特征波段建立的PLSR模型定量評價指標都有提升,通過直線擬合可以發(fā)現(xiàn)校正集和預測集的直鏈淀粉測量值分別與相應的預測值有良好的線性關系。

圖5 校正集的預測值和真實值相關系數(shù)圖

圖6 預測集的預測值和真實值相關系數(shù)圖

表3 基于不同特征波長的直鏈淀粉檢測PLSR模型

SPA-PLSR模型的相對分析誤差(RPD)為1.944。這說明SPA能夠有效地提取特征波段,提高建模效率,但RPD值略小于2,說明所建立的檢測模型精度仍然有待提高。在試驗過程中,可能由于模型的單一性以及樣本數(shù)量少等原因?qū)е履P偷木炔桓?,后期可通過增加試驗樣品數(shù)量和建立多種預測模型對比以獲得更高檢測精度的模型。

3 結論

本文采用高光譜成像技術對直鏈淀粉含量進行快速檢測。結果表明,采用一階導數(shù)和多元散射校正(MSC)預處理后的建模效果最好。然后采用SPA提取了9個特征波段,所建PLSR預測模型的校正集相關系數(shù)(Rc)為0.835,校正集均方根誤差(RMSEC)為1.802,預測集相關系數(shù)(Rp)為0.856,預測集均方根誤差(RMSEP)為1.752,相對分析誤差(RPD)為1.944。經(jīng)過RC法所建立的PLSR預測模型的預測集相關系數(shù)(Rp)為0.838,預測集均方根誤差(RMSEP)為1.897,相對分析誤差(RPD)為1.761。本研究為進一步開發(fā)直鏈淀粉含量在線檢測儀器提供了思路,并奠定了良好的基礎。

猜你喜歡
直鏈蓮子校正
高直鏈淀粉材料改性及應用研究進展
米粉稻籽粒直鏈淀粉積累特性
劉光第《南旋記》校正
溫水抽提法制取大米直鏈淀粉的工藝技術研究
建立在校正系統(tǒng)上的強大實力Sonance所能士i12
陳年蓮子,過早加糖難煮爛!
陳年蓮子,過早加糖難煮爛!
蓮子飛上天
在Lightroom中校正鏡頭與透視畸變
機內(nèi)校正