姜北晨 郝志勇
(遼寧工程技術(shù)大學機械學院,遼寧 阜新 123000)
水果是人們?nèi)粘I钪兄匾氖澄?。水果質(zhì)量是人們在消費過程中關(guān)注的重點。對于水果品質(zhì)的檢驗分為外在檢測和內(nèi)在檢測。外部檢測包括顏色、大小和缺陷,內(nèi)部檢測包括味道、甜度和水分。
外部質(zhì)量可以通過肉眼觀察,而對于內(nèi)部質(zhì)量檢測來說,通常通過有損檢測和無損檢測來檢測內(nèi)部質(zhì)量。有損檢測技術(shù)可以準確確認果實的內(nèi)在品質(zhì),但會破壞果實,即經(jīng)過檢測后水果就不能食用了。不同的無損性技術(shù)(例如聲學、核磁共振和近紅外光譜(NIRS))均為在無損條件下測定水果品質(zhì)的有效途徑。該文主要探討近紅外光譜(NIRS)的實驗表現(xiàn)和實用價值。
水果糖分在近紅外光譜波段的光下有特殊的吸收光譜[1],并可以通過儀器接收相應(yīng)的光電信號。我國是蘋果種植大國[2],對蘋果質(zhì)量的甄選分級可以提高我國產(chǎn)出果品的國際競爭力。
近紅外光是指波長介于可見光和中紅外光之間的電磁波。美國材料試驗協(xié)會(ASTM)將近紅外光譜區(qū)定義為780 nm~2 526 nm,并將近紅外波段分為2 個部分:近紅外短波(780 nm~1 100 nm)和近紅外長波(1 100 nm~2 526 nm)[3]。
在近紅外區(qū)域的吸收帶內(nèi),測量信息主要是分子內(nèi)部含氫基團(OH-、NH-以及CH-官能團)的倍頻吸收及其伸縮振動、晚期振動合頻的吸收信息[4]。
近紅外光譜屬于紅外光譜,該譜區(qū)的信息主要由幾種基頻的倍頻以及組合頻率共同構(gòu)成,具有以下特點:1) 近紅外光譜是記錄分子振動基頻的倍頻和合頻的光譜區(qū),被采集的信息主要為OH-、NH-和CH-官能團的倍頻吸收,及其伸縮振動、彎曲振動合頻的吸收信息?,F(xiàn)代近紅外光譜是把光譜測量技術(shù)、化學計量學和計算機技術(shù)融為一體的間接分析技術(shù),一般會建立校正模型,以實現(xiàn)定性或定量分析未知樣本的目標。2) 信息量大。近紅外光譜區(qū)域除了具有不同程度的倍頻吸收外,還包括多種組合頻率干擾,因此光譜波段復(fù)雜。3) 信息強度弱。近紅外區(qū)域吸收強度低,該特性會影響近紅外分析的檢出限。4) 譜峰重疊。因為分子吸收倍頻的形式很多,特別是結(jié)合頻率。所以不同分子或同一分子的基團會在同一光譜區(qū)域內(nèi)產(chǎn)生倍頻吸收。近紅外區(qū)域的光譜帶寬較大、光譜波段重疊嚴重,因此,傳統(tǒng)的光譜分析方法難以對其進行分析。紅外吸收帶的波長位置和吸收帶的強度反映了分子結(jié)構(gòu)的特征,可以用來識別未知物質(zhì)的結(jié)構(gòu)組成或確定其化學基團。吸收帶的吸收強度與分子組成或化學基團的含量有關(guān),可用于定量分析和純度鑒定。但由于上述近紅外特性,因此在近紅外檢測的應(yīng)用中,檢測對象主要是僅包括H 基團的有機物,例如農(nóng)產(chǎn)品、食品等。在光譜分析中,必須利用化學計量學對信息進行提取和發(fā)掘。由于紅外光譜分析的強特性,因此可以對液體和固體進行檢測,且具有用量少、分析速度快以及對樣品無損傷等特點。該方法和其他許多分析方法一樣,都可以對物品進行定性、定量分析。
傳統(tǒng)的近紅外光譜分析技術(shù)包括透射光譜和漫反射光譜。
其中,近紅外漫反射光譜(NIRDRS)是根據(jù)反射光強與入射光強的比例關(guān)系來獲取物質(zhì)在近紅外區(qū)域的吸收光譜。
近紅外透射光譜(NITS)是根據(jù)透射光強與入射光強的比例關(guān)系來獲取物質(zhì)在近紅外區(qū)域的吸收光譜。一般來說,越均勻、越透明的液體就會使用透射光譜學。漫反射模式一般用于長波近紅外區(qū)域,透射模式也可用于短波近紅外區(qū)域。
近紅外分析具有以下7 個優(yōu)點:1) 試驗簡單。2) 測試速度快,測試過程可在1 min 內(nèi)完成。3) 測試效率提高,對測試人員沒有專業(yè)要求,單人即可完成多項化學指標測試。4) 檢測過程無污染,檢測成本低。5) 隨著模型中優(yōu)秀數(shù)據(jù)的積累,模型逐漸優(yōu)化且可重現(xiàn)。6) 適合的樣品的范圍較大,可通過相應(yīng)的樣品測量裝置直接測量樣品,且光譜測量方便。7) 近紅外光在普通光纖中具有良好的傳輸特性,便于在線分析。
近紅外光譜也存在以下2 個缺點:1) 近紅外區(qū)域吸收和靈敏度低。2) 因為每個模型建模和分析后只能適應(yīng)一定的時間和空間范圍,所以要持續(xù)維護模型,用戶的技術(shù)水平會影響模型的使用[5]。
近紅外光譜的理論基礎(chǔ):比爾-朗伯吸收定律(Bill Lambert’s Law)[6]為近紅外光譜的定量分析奠定了基礎(chǔ)(樣品組分的濃度與儀器測量得到的光譜響應(yīng)值之間存在一定的相關(guān)性),如公式(1)所示。
Aλ=ελcl(1)
式中:Aλ為樣品在特定波長(或頻率)處的吸光度;ελ為樣品各組分在特定波長處的吸收率;l為光程,即光通過樣品的行程;c為樣品組分的濃度。
比爾-朗伯吸收定律可以表示為對于一定波長的單色光,物質(zhì)的吸光度Aλ與光程l、濃度c成正比,比例常數(shù)為吸收率,吸收率與濃度單位有關(guān)。當使用摩爾濃度單位時,ελ的比例常數(shù)稱為摩爾吸收率。吸光度與樣品的性質(zhì)和波長λ有關(guān)。單波長點的吸光度信息小,可用于已知成分的定量分析。由每個波長點的吸光度組成的光譜具有大量的信息,如公式(2)所示。
Aλ=∑Kλci(2)
式中:c為樣品組分(即吸光成分)的濃度;K為吸收系數(shù)。
Aλ是一個多元函數(shù),可以通過所識別的ελ得到A-c(即樣品在特定波長(或頻率)處的吸光度與樣品組分的濃度)的線性關(guān)系,即定量分析的工作曲線;確定的l與c、A-λ之間的關(guān)系是組分的一維吸收光譜,可用于定性分析。
影響B(tài)ill 法律偏差的主要因素有2 個:1) 非單色光。理論上,比爾定律只適用于單色光,但在實踐中不可能得到真正的單色光,只能得到波長范圍較窄的光譜帶。因此,對于非單波長的入射光,A和c確實可以是線性的,從而產(chǎn)生比爾定律的偏差。2) 雜散光。已經(jīng)證明雜散光是引起比爾定律偏離的主要因素,因為吸收材料中包括許多粒子,所以這些粒子會使入射光散射,隨著濃度的增加,這些散射光的強度將進一步增強,從而降低透射光的強度,并造成偏差。儀器本身的光學系統(tǒng)(光柵)會產(chǎn)生雜散光,從而降低分析測試的吸光度,進而產(chǎn)生偏差。
雖然短波近紅外區(qū)域的信息量和信息量遠小于長波近紅外區(qū)域,但是該光譜區(qū)域的一些關(guān)鍵器件(例如光源和探測器)相對便宜且容易獲得,適合開發(fā)價格低廉的專用便攜式儀器。因此,對這段光譜區(qū)域的研究和應(yīng)用也成為熱點。當吸收800 nm~1 100 nm 的短波近紅外光時,樣品的吸收相對較弱。近紅外光可以直接穿透某些固定樣品,以獲取樣品的深層信息。因此,一些固體樣品也適用于短波近紅外波段的透射分析,特別是蘋果、梨等大尺寸樣品。但也存在以下3 個問題:1) 只能測量光輻照的部分。2) 內(nèi)部信息僅在果皮附近,難以獲取深部信息。3) 內(nèi)部漫反射光會受表面反射光的影響。因此,該技術(shù)對水果的測定僅限于對薄果皮的測定,例如桃、梨以及蘋果等,而對果皮較厚的柑橘的測定會存在較大的誤差。
該試驗分為破壞性試驗和非破壞性試驗。
以陜西富士蘋果為實驗樣本(10 個蘋果,試驗為每日測量)。實驗前對每個蘋果進行編號,在蘋果赤道上均勻取10個圓作為采樣點,并對采樣點進行編號。
無損檢測技術(shù)尚不成熟,該試驗采用ATAGO 公司設(shè)計的無損測糖儀和實驗室研制的測糖儀進行檢測。ATAGO 開發(fā)的測糖儀是蘋果專用測糖儀,不能用于其他水果,應(yīng)用范圍有限、檢測誤差大且售價較高。
實驗室研制的測糖儀在理論上適用于大多數(shù)水果,應(yīng)用潛力很大。但是仍需要進一步試驗,并對試驗數(shù)據(jù)進行分析。
試驗步驟如下:1) 將蘋果樣品放置在實驗室開發(fā)的測糖儀上,將采樣點指向測糖儀的接收器,同時按下示波器和測糖儀的開關(guān)。將測得的擴散近紅外吸收信號傳輸?shù)接嬎銠C上顯示,并記錄數(shù)據(jù)供后續(xù)分析。2) 將蘋果樣品放在ATAGO探測器上,采樣點對準ATAGO 探測器的接收器,連續(xù)監(jiān)測5 次,并記錄數(shù)據(jù)。3) 重復(fù)以上步驟,每個蘋果記錄10 個采樣點的數(shù)據(jù)。
有損試驗采用成熟的技術(shù),將其作為真值,為有損數(shù)據(jù)提供對比和參考。該試驗采用3 種有損探測器(ATAGO 公司的儀器(電子儀器)、陸恒生物公司的儀器(電子儀器)以及光學儀器。)進行測試,可以進一步提高實驗數(shù)據(jù)的真實性和可靠性。
試驗步驟如下:1) 在試驗臺上將蘋果切開,在取樣點2、5、8 和10 取果肉榨汁。2) 在3 個探測器上測試取樣點2、5、8 和10 的果汁是否含糖,并記錄數(shù)據(jù),包括在2 個電子儀器上顯示的溫度。3) 重復(fù)以上步驟,每個蘋果選取4個采樣點記錄相關(guān)數(shù)據(jù)。
3.1.1 線性回歸原理
線性回歸利用線性回歸方程的最小二乘函數(shù)來模擬1個或多個自變量與因變量之間的關(guān)系。這個函數(shù)是1 個或多個模型參數(shù)的線性組合,稱為回歸系數(shù)。該試驗選取多元線性回歸進行建模和擬合[7]。在該試驗中,給出變量y(破壞性實驗測得的糖含量)和一些變量x1~x12(實驗室研制的設(shè)備采集到的光電信號),這些變量可能與y有關(guān),線性回歸分析可以量化y與xj(j=1,2,3...,12)的相關(guān)性強度,評估與y無關(guān)的xj,識別xj的哪些子集包括關(guān)于y的冗余信息。
擬合的基本模型如公式(3)所示。
y=n1x1+n2x2+…+n12x12+b(3)
式中:nj為該擬合的主要目標參數(shù)xj的系數(shù);b為常數(shù)項,即曲線截距。
3.1.2 數(shù)據(jù)集構(gòu)造
該模型利用實際試驗中獲得的數(shù)據(jù)構(gòu)建1 個數(shù)據(jù)集,該數(shù)據(jù)集分為訓練集和測試集。
首先,將模型擬合到訓練集上。在實踐中,訓練集通常是由1 個輸入向量(標量)和1 個輸出向量(標量)組成的數(shù)據(jù)對。輸出向量(標量)稱為目標或標量。其次,在訓練過程中,利用當前模型對訓練集中的每個樣本進行預(yù)測,并將預(yù)測結(jié)果與目標進行比較。根據(jù)比較結(jié)果,學習算法更新模型的參數(shù)。模型擬合的過程包括特征選擇和參數(shù)估計。最后,使用測試集為最終模型提供1 個相對精確的評價。在該建模過程中,使用2021 年1—3 月收集的實驗數(shù)據(jù)。
1 月和2 月陜西蘋果數(shù)據(jù)為第一組,3 月陜西蘋果數(shù)據(jù)為第二組。將3 個月的陜西蘋果數(shù)據(jù)合并為第三組,將1—3 月的其他蘋果數(shù)據(jù)合并為第四組。每組的訓練集與測試集的比率為1:1。
3.1.3 數(shù)據(jù)分析標準
均方根誤差(RMSE)[8]是測量值之間差值的常用度量方法,其值通常是模型預(yù)測的量或觀測到的估計量。均方根偏差表示預(yù)測值與觀測值差的樣本標準差。計算樣本時通常將其稱為預(yù)測誤差。
均方根偏移量主要用來匯總預(yù)測中誤差的大小,通常是在不同的時間,用1 個值來表示其預(yù)測能力。RMSE 的絕對值越小,模型誤差越小。
統(tǒng)計上使用決定系數(shù)(表示為R2或r2)[9]來衡量自變量解釋部分在因變量的變異量中所占的比例,從而判斷回歸模型中y與x的相關(guān)性。
R2的取值范圍一般為0~1。該值越接近1,相關(guān)性越高,0.25 可以認為是相關(guān)的。
3.1.4 分析平臺
建模可以通過安裝scikit-klrearn、pandas、matplotlib、Numpy 以及seaborn 等Python 平臺來完成。
擬合結(jié)果見表1。
表1 各組實驗數(shù)據(jù)
一般來說,當R2≥0.25 時,可以認為數(shù)據(jù)是相關(guān)的。從3 組數(shù)據(jù)的分析結(jié)果來看,除第四組數(shù)據(jù)外,該擬合得到的R2均大于0.25,可以判斷數(shù)據(jù)是相關(guān)的。雖然目前還沒有可靠的模型,但是仍然初步證實了紅外光與蘋果糖含量之間存在聯(lián)系,為今后進一步試驗探索奠定了基礎(chǔ)。
R2降低的原因:1) 實驗設(shè)備仍需要進行改進和升級。通過實驗室自制設(shè)備選取的12 波長近紅外光,根據(jù)建模結(jié)果推測,所選取的部分波長與果糖含量的相關(guān)性很小,因此會產(chǎn)生干擾。在未來的試驗中,需要篩選近紅外光波長,通過試驗篩選出與果糖含量相關(guān)性較高的波長。2) 實驗設(shè)備本身的工程結(jié)構(gòu)也需要升級,例如還需要進一步對遮陽部分進行加工。3) 蘋果類型的選擇。該試驗前三組實驗樣品品種均為陜西富士蘋果,種類相對單一。因此,要使用品種差異較大的蘋果,但由于品種間差異較大,因此第四組數(shù)據(jù)并不理想。在以后的試驗中,還需要進一步探索試驗樣本的選擇方法。
近紅外光譜技術(shù)已成為很有潛力的無損檢測和監(jiān)測水果品質(zhì)的技術(shù)。該技術(shù)與化學計量學技術(shù)相結(jié)合,具有多種優(yōu)點,可作為破壞性分析的替代方法。因此,通過該技術(shù)可以根據(jù)檢測參數(shù)挑選水果。設(shè)備以果實的糖含量為檢測指標,用近紅外光在不同波長光源,在檢測過程中,建立了定量的數(shù)學模型,利用多元線性回歸方法分析了光譜數(shù)據(jù)的擬合和果實糖濃度,以判斷果實品質(zhì)。
該試驗雖然未能構(gòu)建成熟的模型,但是在一定程度上完成了基本的檢測,提供了基本的判斷指標,基本滿足試驗?zāi)繕?。通過試驗和數(shù)據(jù)分析,初步驗證了近紅外光檢測果糖的可行性,并證明了近紅外光光譜與果糖濃度之間的相關(guān)性。通過該試驗,在一定程度上可以幫助科學家改進檢測設(shè)備,例如提高精度、減輕重量,從而實現(xiàn)面向消費者的、輕便的檢測設(shè)備。但是,該試驗也暴露了一些問題:1) 試驗數(shù)據(jù)容易受到試驗條件的影響(例如室內(nèi)光線),即使是同一品種的蘋果,其品質(zhì)也不同,這意味有太多的變量會影響試驗中的數(shù)據(jù)結(jié)果,不僅影響試驗數(shù)據(jù)的收集,而且也會給分析造成了很大的障礙。2) 需要進一步升級檢測設(shè)備。該試驗對光電信號采集環(huán)境的要求較高。因此,提高光電采集過程中器件的緊密度是該試驗的重要內(nèi)容。