孫彥華,范永濤*
1.中國(guó)科學(xué)院上海光學(xué)精密機(jī)械研究所微納光電子功能材料實(shí)驗(yàn)室,強(qiáng)激光材料重點(diǎn)實(shí)驗(yàn)室,上海 201800 2.中國(guó)科學(xué)院大學(xué)材料與光電研究中心,北京 100049
近紅外光譜分析由于具有快速、無(wú)損、高效檢測(cè)的優(yōu)點(diǎn),被廣泛應(yīng)用于各個(gè)領(lǐng)域[1-4]。隨著科學(xué)家對(duì)于近紅外光譜儀研究的深入,出現(xiàn)了許多新型近紅外光譜儀,并大大拓展了近紅外光譜儀的應(yīng)用場(chǎng)景,已經(jīng)由實(shí)驗(yàn)室檢測(cè)走向現(xiàn)場(chǎng)檢測(cè)[5-6]。
由于近紅外光譜屬于分子振動(dòng)光譜,溫度改變時(shí),樣品內(nèi)分子的振動(dòng)加劇或減弱,分子間的作用力發(fā)生變化,進(jìn)而影響到分子振動(dòng)或轉(zhuǎn)動(dòng)狀態(tài)在不同能級(jí)之間的躍遷,從而影響分子的振動(dòng)光譜[7],所以當(dāng)近紅外光譜儀由溫度精確的實(shí)驗(yàn)室環(huán)境進(jìn)入到現(xiàn)場(chǎng)檢測(cè)環(huán)境時(shí),檢測(cè)結(jié)果易受溫度變化的影響。本課題研究發(fā)現(xiàn),當(dāng)溫度在0~25 ℃的范圍內(nèi)變化時(shí),粗蛋白含量為6.04%的樣品的預(yù)測(cè)值與實(shí)測(cè)值之間的最大偏差為1.12%。已有報(bào)道的研究工作也表明樣品溫度的不同會(huì)對(duì)檢測(cè)結(jié)果產(chǎn)生影響,如王冬[8]等研究了樣品溫度對(duì)復(fù)配乳油的近紅外光譜定量分析模型的影響;Li[9]等對(duì)不同溫度下的花生油、豆油、玉米油的混合物的吸光度光譜進(jìn)行分析,結(jié)果發(fā)現(xiàn),溫度對(duì)光譜的影響隨著體積比的增加越來(lái)越明顯。因此溫度對(duì)吸光度光譜的影響不容忽視,在檢測(cè)過(guò)程中需要去除溫度的影響。
常用的溫度修正方法有化學(xué)計(jì)量學(xué)方法、全局隱含或顯式溫度補(bǔ)償[8]、去除對(duì)溫度敏感的波長(zhǎng)[10]等。化學(xué)計(jì)量學(xué)方法適用于含水量較大的樣品,具有局限性;全局隱含或溫度補(bǔ)償方法在建模時(shí)需要測(cè)量不同溫度下的光譜及樣品實(shí)測(cè)值,加大了工作量;去除對(duì)溫度敏感的波長(zhǎng)會(huì)降低模型的精度。以上方法雖然在特定的條件下可以對(duì)溫度產(chǎn)生的影響進(jìn)行修正,但都存在一定的缺陷;為了解決溫度產(chǎn)生的影響,本課題探究了溫度與光譜之間的關(guān)系,提出了溫度修正理論,從近紅外光譜分析的本質(zhì)上對(duì)溫度產(chǎn)生的影響進(jìn)行了修正,有效提高了模型的預(yù)測(cè)結(jié)果。
玉米樣品來(lái)自上海嘉定區(qū)某飼料廠(chǎng),不同品牌、不同產(chǎn)地、籽粒大小均勻、表面無(wú)霉斑的玉米樣品總計(jì)97個(gè)。其中63個(gè)樣品作為建模用。將樣品使用粉碎機(jī)粉碎,過(guò)40目篩子篩選后,每個(gè)樣品一分為二,分別裝入密封的自封袋中進(jìn)行保存,做好標(biāo)記。將其中一份自封袋中樣品放在室溫環(huán)境(24 ℃)內(nèi)一晚,另一份的樣品放置在冰箱冷凍室內(nèi)使樣品的溫度達(dá)到-5 ℃,保障玉米樣品的溫度保持一致,以備用;另外34個(gè)樣品用作驗(yàn)證本溫度修正理論的正確性,對(duì)其作與建模樣品相同的處理。
近紅外光譜采集系統(tǒng)為本課題組自行研發(fā)的手持式近紅外光譜儀,該手持式近紅外光譜儀形狀區(qū)別于目前市場(chǎng)上存在的“手槍狀”手持式近紅外光譜儀[11],為“萬(wàn)用表”操作模式,儀器整體結(jié)構(gòu)如圖1所示,儀器整體大小與手持式萬(wàn)用表相當(dāng),可單手操作,非常方便攜帶。此檢測(cè)儀采用直接從透明樣品杯底部采集光譜的方法,采樣過(guò)程中樣品與檢測(cè)儀的位置、角度始終保持一致,完全不受使用者操作方式的影響,大幅提高了檢測(cè)儀的采樣精度,并降低了使用難度,解決了現(xiàn)有手持式近紅外光譜儀測(cè)量結(jié)果易受其光學(xué)窗口與樣品角度及貼合度的細(xì)微差別的影響。
圖1 手持式近紅外光譜儀Fig.1 Handheld near infrared spectrometer
該手持式近紅外光譜儀的波長(zhǎng)范圍在900~1 700 nm,波長(zhǎng)分辨率為16 nm,積分時(shí)間設(shè)置為80 ms,平均次數(shù)為10次。該儀器自帶溫度傳感器,可以在采集光譜的同時(shí)測(cè)量該條光譜相對(duì)應(yīng)的樣品溫度。
粗蛋白理化值測(cè)量使用凱氏定氮法[12-13],將玉米樣品與硫酸和催化劑一同放入消化爐(HYP-340,上海纖檢儀器有限公司)內(nèi)加熱消化,使粗蛋白分解,然后將消化后的樣品使用定氮儀(KDN818,上海纖檢儀器有限公司)進(jìn)行測(cè)量,在測(cè)量的過(guò)程中每個(gè)樣品做了3個(gè)平行樣,取3次測(cè)量的平均值作為每個(gè)樣品的實(shí)測(cè)值,該方法通過(guò)理化分析含氮量來(lái)確定樣品的粗蛋白含量,耗時(shí)相對(duì)較長(zhǎng),但精度較高,玉米粗蛋白含量測(cè)定結(jié)果如表1所示。
表1 玉米粗蛋白的測(cè)定結(jié)果Table 1 Statistics results of corn crude protein content measurement
將手持式近紅外光譜儀預(yù)熱10 min,先進(jìn)行暗光譜和參考光譜的采集,然后將常溫下的樣品裝入樣品杯,放置在光譜儀上,每次旋轉(zhuǎn)30°,測(cè)量6次,6次測(cè)量光譜的平均光譜代表樣品真實(shí)光譜。
采集不同溫度下的樣品光譜時(shí),將樣品依次快速?gòu)谋渲腥〕鲞M(jìn)行裝樣,然后在樣品溫度上升的過(guò)程中連續(xù)進(jìn)行光譜的掃描并把各個(gè)光譜的相應(yīng)溫度使用儀器自帶的溫度傳感器記錄下來(lái)。
對(duì)預(yù)測(cè)集樣品進(jìn)行光譜采集時(shí),早上8點(diǎn)將樣品放置在室外,然后在下午13點(diǎn)至14點(diǎn)之間進(jìn)行光譜的采集。
將63個(gè)樣本按照2∶1的比例分為校正集和驗(yàn)證集,使用室溫(24 ℃)下采集的樣品的光譜建立偏最小二乘回歸(partial least squares regression,PLS)模型,該模型校正集和驗(yàn)證集的相關(guān)系數(shù)(coefficient of determination,R)分別為0.988 2和0.993 0,校正集標(biāo)準(zhǔn)差(root mean square error of calibration,RMSEC)為0.144,驗(yàn)證集標(biāo)準(zhǔn)差(root mean square error of prediction,RMSEP)為0.213。
不同于臺(tái)式設(shè)備,手持設(shè)備經(jīng)常在戶(hù)外使用,氣溫波動(dòng)范圍一般達(dá)到-10~35 ℃,若不加處理,將對(duì)測(cè)量精度產(chǎn)生嚴(yán)重影響。待測(cè)樣品的反射光譜受環(huán)境溫度影響劇烈,我們將不同溫度下的同一樣品的吸光度光譜進(jìn)行預(yù)處理,排除噪聲及光程差帶來(lái)的光譜變化,只考慮溫度對(duì)吸光度光譜的影響,試驗(yàn)結(jié)果如圖2(a)所示。圖2(b)為同一樣品相同溫度下的光譜,由圖2(a)和圖2(b)對(duì)比可知,溫度對(duì)光譜的影響十分明顯。
選取粗蛋白含量為6.04%的樣品,溫度從0 ℃變化至24 ℃過(guò)程中一共采集了23條光譜,將這23條不同溫度下的光譜依次代入建立好的模型中進(jìn)行預(yù)測(cè),預(yù)測(cè)結(jié)果如圖3所示。從圖中可以看出樣品溫度與建模溫度相差越大時(shí)預(yù)測(cè)結(jié)果與實(shí)測(cè)值之間的誤差也越大,預(yù)測(cè)值與實(shí)測(cè)值之間最大的偏差為1.12%,已超出國(guó)標(biāo)所允許范圍[14]。
圖2 溫度對(duì)樣品光譜的影響(a):不同溫度下同一樣品的光譜;(b):相同溫度下同一樣品的光譜Fig.2 The effect of temperature on sample spectrum(a):Spectra of the same sample at different temperatures;(b):Spectra of the same sample at the same temperature
圖3 粗蛋白含量為6.04%的樣品不同溫度下的光譜得到的預(yù)測(cè)值Fig.3 Predicted values of spectra at different temperatures for samples with a crude protein content of 6.04%
該溫度修正原理是基于吸光度的校正,宏觀(guān)上,溫度對(duì)樣品的吸光度的影響是一個(gè)小量;通過(guò)試驗(yàn)對(duì)溫度和光譜之間的關(guān)系進(jìn)行探究,試驗(yàn)結(jié)果如圖4所示。
圖4 溫度與吸光度的關(guān)系Fig.4 The relationship between temperature and absorbance
由圖4可知,溫度與吸光度在一定范圍內(nèi)滿(mǎn)足線(xiàn)性關(guān)系?;诖耍瑢⑼徊ㄩL(zhǎng)點(diǎn)處不同溫度下的吸光度值A(chǔ)λiTi與溫度Ti進(jìn)行一元線(xiàn)性回歸
AλiTi=bλj0+Tibλj1
(1)
式中,AλjTi為同一樣品同一波長(zhǎng)點(diǎn)處不同溫度下的吸光度值,Ti為不同的溫度,λj為不同的波長(zhǎng),bλj1為線(xiàn)性回歸系數(shù),bλj0為線(xiàn)性回歸常數(shù)項(xiàng),表示除自變量以外其他因素對(duì)因變量的平均影響量。其最小二乘解為
(2)
以建立模型時(shí)樣品的溫度為基準(zhǔn),求取要預(yù)測(cè)樣品的溫度與基準(zhǔn)溫度的差值ΔTi,代入式(1)求得由于溫度的影響,吸光度的改變值ΔAλj。校正之后的吸光度與原始吸光度存在式(3)關(guān)系
Aλj1=Aλj0-ΔAλj
(3)
通過(guò)以上操作,不同溫度下的樣品吸光度Aλj0將會(huì)被修正為統(tǒng)一溫度下樣品的吸光度Aλj1,以Aλj1代入模型進(jìn)行計(jì)算,一定程度上可以消除環(huán)境溫度對(duì)樣品吸光度的影響。
利用提出的溫度修正理論,以該樣品的建模溫度為基準(zhǔn),將不同溫度下的光譜分別進(jìn)行修正,修正后的光譜圖如圖5所示,從圖中可以看出,不同溫度下的樣品的光譜之間的差異和未修正時(shí)相比已經(jīng)有了顯著改善。
為了驗(yàn)證溫度修正理論的正確性,還需要將修正后的光譜代入室溫(24 ℃)下已建立好的的模型進(jìn)行預(yù)測(cè),預(yù)測(cè)結(jié)果如圖6所示。通過(guò)比較光譜修正前后各個(gè)溫度下的預(yù)測(cè)結(jié)果,對(duì)溫度修正理論的效果進(jìn)行評(píng)價(jià)。
圖中實(shí)橫線(xiàn)為樣品的實(shí)測(cè)值,兩條虛線(xiàn)為國(guó)家標(biāo)準(zhǔn)允許的誤差范圍的臨界值,預(yù)測(cè)值越接近實(shí)橫線(xiàn)說(shuō)明模型預(yù)測(cè)效果越好,在兩條虛線(xiàn)之間的預(yù)測(cè)值可以滿(mǎn)足國(guó)家標(biāo)準(zhǔn)的要求。由圖6可知,樣品不同溫度下的近紅外光譜經(jīng)過(guò)溫度修正后的預(yù)測(cè)結(jié)果大部分都已符合國(guó)家標(biāo)準(zhǔn)所要求的誤差范圍,對(duì)比圖3和圖6發(fā)現(xiàn),粗蛋白含量為6.04%的樣品的預(yù)測(cè)值與實(shí)測(cè)值的誤差范圍從未修正前的±1.12%下降為±0.5%,由此可以看出,此溫度修正理論可以很好地修正溫度對(duì)近紅外光譜產(chǎn)生的影響。
圖5 經(jīng)過(guò)溫度修正理論修正后的光譜圖Fig.5 Spectra obtained by temperature correction theory
為驗(yàn)證本文中提出的溫度修正模型的正確性,將采集得到的34個(gè)不同含量的預(yù)測(cè)集樣品的未經(jīng)過(guò)溫度理論修正的光譜和經(jīng)過(guò)溫度理論修正后的光譜分別代入已建立好的模型進(jìn)行預(yù)測(cè),分別與利用標(biāo)準(zhǔn)方法測(cè)定的理化值進(jìn)行比較分析。
圖6 經(jīng)過(guò)溫度修正理論修正后的不同溫度下的預(yù)測(cè)值Fig.6 Predicted values at different temperatures obtained by temperature correction theory
如圖7所示,玉米樣品粗蛋白含量的模型預(yù)測(cè)值與標(biāo)準(zhǔn)理化值決定系數(shù)分別為0.910和0.982,均方根誤差分別為0.558和0.172,最大相對(duì)誤差(maximum relative error,MRA) 分別為15.21%和5.01%,平均相對(duì)誤差(average relative error,ARE)分別為6.05%和1.75%?;谔岢龅臏囟刃拚碚摽梢院芎玫南郎囟葘?duì)預(yù)測(cè)結(jié)果產(chǎn)生的影響,可以實(shí)現(xiàn)手持式近紅外光譜儀現(xiàn)場(chǎng)檢測(cè)的需求。
圖7 溫度修正前后玉米外部驗(yàn)證模型效果(a):光譜未進(jìn)行修正的預(yù)測(cè)模型; (b):光譜經(jīng)過(guò)溫度修正之后的預(yù)測(cè)模型Fig.7 Effect of the external validation model of corn before and after temperature correction(a):A prediction model in which the spectrum is not corrected; (b):A prediction model after the spectra corrected by this proposed method
利用自主研制的手持式近紅外光譜儀采集玉米樣品的近紅外光譜,研究樣品溫度變化對(duì)模型預(yù)測(cè)結(jié)果的影響。通過(guò)分析發(fā)現(xiàn)樣品吸光度光譜與溫度之間存在線(xiàn)性關(guān)系,利用這一關(guān)系提出了溫度修正理論,試驗(yàn)結(jié)果證明,該溫度修正理論可以對(duì)光譜進(jìn)行修正,修正后的光譜代入已建立好的模型預(yù)測(cè)結(jié)果有了很大的改善。最后,使用34個(gè)樣本對(duì)溫度修正理論進(jìn)行了檢驗(yàn),光譜修正前后粗蛋白的模型預(yù)測(cè)值與標(biāo)準(zhǔn)理化值決定系數(shù)分別為0.910和0.982,均方根誤差分別為0.558和0.172,平均相對(duì)誤差分別為6.05%和1.75%。表明,溫度修正理論可以很好的修正溫度對(duì)樣品光譜產(chǎn)生的影響,可以實(shí)現(xiàn)樣品的快速無(wú)損檢測(cè)。由于該溫度修正理論簡(jiǎn)單易懂并從近紅外光譜分析的本質(zhì)上對(duì)溫度進(jìn)行了修正,所以方法穩(wěn)定可靠。該方法不僅可以為修正其他樣品溫度對(duì)模型預(yù)測(cè)結(jié)果的影響提供重要的參考,而且也可以推動(dòng)手持式近紅外光譜儀的發(fā)展。