王 玨,李彥杰,陳益存,高 暝,趙耘霄,吳立文,黃世清,張永志,朱康爍,汪陽東,*
(1.浙江農(nóng)林大學(xué)林業(yè)與生物技術(shù)學(xué)院,浙江 杭州 311300;2. 中國(guó)林業(yè)科學(xué)研究院亞熱帶林業(yè)研究所,浙江 杭州 311400;3. 安吉縣龍山林場(chǎng),浙江 安吉 313306)
林木表型通常指林木基因型與環(huán)境互作的外在與內(nèi)在性狀的總和。表型性狀評(píng)估在林木種質(zhì)資源評(píng)價(jià)、品質(zhì)區(qū)分、遺傳選擇和樹種鑒別等方面是不可或缺的重要步驟[1]。然而,受林木多年生特性、林地環(huán)境等客觀因素的影響,林木表型分析方法通常步驟繁瑣、價(jià)格相對(duì)高昂,且可能對(duì)樣品造成不可逆的破壞。對(duì)于大量樣本或某些直接、間接性狀的檢測(cè),許多經(jīng)典測(cè)試方法不夠?qū)嵱谩A謽I(yè)生產(chǎn)上常見需要對(duì)大量樣品進(jìn)行無損檢測(cè)的場(chǎng)合,而許多樣品具有唯一性。因此,高通量的快速無損檢測(cè)技術(shù)逐漸被關(guān)注。采用近紅外光譜可以通過小巧靈活的光纖探針傳感器進(jìn)行遠(yuǎn)程操作、儀器更簡(jiǎn)易且價(jià)格低廉,有足夠化學(xué)敏感度,可以對(duì)樣品進(jìn)行大批量快速無損檢測(cè),受到林業(yè)工作者的青睞。
據(jù)美國(guó)試驗(yàn)和材料協(xié)會(huì)(ASTM)的定義,近紅外光(near-infrared,NIR)的波長(zhǎng)范圍為780~2 526 nm,是介于可見光波段和中紅外波段的電磁波[3]。近紅外光譜的早期應(yīng)用集中在農(nóng)業(yè)以及遙感等領(lǐng)域[4],近幾十年來,近紅外光譜已成為發(fā)展最快的光譜技術(shù)之一[5],廣泛應(yīng)用于化工業(yè)[6]、輕工業(yè)、醫(yī)學(xué)[7]、食品工業(yè)[8]、物理學(xué)等領(lǐng)域。20世紀(jì)90年代起出現(xiàn)近紅外光譜在林業(yè)上的使用[9]。
近紅外光譜技術(shù)能夠?qū)悠愤M(jìn)行快速無損檢測(cè)的優(yōu)點(diǎn)大大提高了林業(yè)樣品的檢測(cè)效率。隨著儀器的不斷發(fā)展,近紅外光譜技術(shù)在林業(yè)領(lǐng)域的應(yīng)用逐漸向林間實(shí)時(shí)實(shí)地檢測(cè)的方向發(fā)展,它可以迅速反饋林產(chǎn)品品質(zhì)狀態(tài)及林木生理生化指標(biāo)等,實(shí)現(xiàn)了技術(shù)和效率的革命,對(duì)促進(jìn)林業(yè)的發(fā)展有重大意義。
近紅外光譜記錄的分子化學(xué)鍵基頻振動(dòng)的倍頻和合頻信息,主要是含氫原子團(tuán)伸縮振動(dòng)的倍頻吸收,如C—H、O—H、N—H等,可涵蓋絕大多數(shù)有機(jī)分子的組成和結(jié)構(gòu)信息,乃至無機(jī)離子通過影響與其相關(guān)的物質(zhì)引起的光譜變化[10]。同時(shí),近紅外光譜記錄的是出現(xiàn)在中紅外吸收帶的泛音和合頻,比基頻弱1~3個(gè)數(shù)量級(jí)[2],因此,近紅外光的穿透能力強(qiáng)于其他紅外波段,成為輻射的高透過窗口,且與其他紅外光波段光譜有明顯區(qū)別[11]。這種高透明度為近紅外光譜提供了極大的采樣優(yōu)勢(shì),也因此導(dǎo)致吸收帶重疊。近紅外光譜并非直接對(duì)檢測(cè)內(nèi)容進(jìn)行闡釋,需要借助數(shù)學(xué)及化學(xué)計(jì)量學(xué)方法對(duì)光譜數(shù)據(jù)進(jìn)行更深入的分析,是一種二次分析方法[6]。
目前被應(yīng)用于高通量快速無損檢測(cè)的技術(shù)主要有近紅外光譜、高光譜成像、紅外光譜、衰減全反射(attenuated total reflection, ATR)紅外光譜、拉曼(Raman)光譜等(表1)。高光譜成像技術(shù)結(jié)合了光譜檢測(cè)技術(shù)和成像技術(shù),既可以反映樣品的外觀特征,又可以反映其分子組成。與近紅外光譜技術(shù)相比,高光譜成像技術(shù)數(shù)據(jù)更豐富,數(shù)據(jù)量更大,圖像的獲取、處理和分析是頗具挑戰(zhàn)性的課題,因而高光譜成像技術(shù)在數(shù)據(jù)處理方面不如近紅外光譜技術(shù)快速[12]。雖然近紅外光譜技術(shù)有局限性,但在林業(yè)領(lǐng)域來看,其特性和應(yīng)用潛力在一應(yīng)光譜技術(shù)中仍占據(jù)特殊的地位,難以被替代(表1)。
表1 近紅外光譜技術(shù)與幾種相關(guān)技術(shù)的對(duì)比
近紅外光譜是一種強(qiáng)大的原位分析方法,檢測(cè)過程中無需對(duì)樣品進(jìn)行破壞,或進(jìn)行前處理,因而也無需使用會(huì)造成污染的化學(xué)試劑,支持對(duì)鮮葉、鮮果等樣品進(jìn)行檢測(cè)分析。衰減全反射紅外光譜雖然也可用于紅外光譜無損分析,但對(duì)于完整樣品的測(cè)量,近紅外光譜還是更勝一籌[11]。Li等[13]的研究指出,衰減全反射紅外光譜與NIR光譜在心材內(nèi)含物的測(cè)量上建模精度不同,如在硬木的心材內(nèi)含物檢測(cè)中,無論采用何種預(yù)處理方法,基于NIR光譜的偏最小二乘回歸模型(PLSR)表現(xiàn)更好。
由于近紅外光波段覆蓋了光纖通信的波長(zhǎng)范圍(850~1 550 nm),因此檢測(cè)數(shù)據(jù)可通過光纖通信實(shí)現(xiàn)遠(yuǎn)距離測(cè)量,且數(shù)秒即可完成1次光譜采集,得到包含樣品多項(xiàng)指標(biāo)信息的近紅外光譜[11]。若配合便攜式設(shè)備,在林地環(huán)境也能快速采集傳輸并分析數(shù)據(jù)??梢娊t外光譜技術(shù)有對(duì)不同環(huán)境的高度適應(yīng)性以及進(jìn)行在線分析和遙測(cè)的優(yōu)勢(shì),十分適用于林地現(xiàn)場(chǎng)測(cè)量或?qū)崿F(xiàn)高通量快速測(cè)量。
近紅外光譜雖然在許多方面顯示出卓越的通用性,應(yīng)用領(lǐng)域廣泛及適用環(huán)境多樣,對(duì)材料的要求低,對(duì)未經(jīng)處理的生長(zhǎng)錐、木圓盤、葉片、果實(shí)、種子等樣品都有良好的檢測(cè)適應(yīng)性,在水溶液和生物樣本的檢測(cè)中更是展現(xiàn)出優(yōu)越的性能[14]。但近紅外光譜的準(zhǔn)確性受限。雖然近紅外光譜檢測(cè)能夠覆蓋大多數(shù)物質(zhì)的信息,但其靈敏度并不是很好,對(duì)物質(zhì)含量有一定要求,如在固體中各成分的檢出限為0.1%(質(zhì)量分?jǐn)?shù)),在乙腈溶液中水的檢出限為0.005%~0.010%[15]。隨著儀器和光譜技術(shù)的發(fā)展,此檢出限極有被突破的可能。近紅外光譜的建模精度很大程度上決定了預(yù)測(cè)的準(zhǔn)確性,而建模數(shù)據(jù)來自近紅外光譜數(shù)據(jù)以及化學(xué)分析數(shù)據(jù)。預(yù)測(cè)準(zhǔn)確性還受限于樣本數(shù)量及廣度,以及化學(xué)計(jì)量學(xué)手段,因此化學(xué)分析法的準(zhǔn)確性成為了近紅外光譜預(yù)測(cè)準(zhǔn)確性的上限,近紅外光譜預(yù)測(cè)的準(zhǔn)確性尚無法優(yōu)于化學(xué)分析法[6]。
采集樣品后,依次進(jìn)行近紅外光譜采集和目標(biāo)數(shù)據(jù)測(cè)量,使兩種數(shù)據(jù)根據(jù)樣本一一對(duì)應(yīng)。選擇性地對(duì)數(shù)據(jù)進(jìn)行特征波長(zhǎng)選擇和預(yù)處理,不同預(yù)處理效果需要結(jié)合建模方式進(jìn)行分析。將經(jīng)過預(yù)處理的數(shù)據(jù)劃分成不同數(shù)據(jù)集后進(jìn)行建模,并比較分析不同預(yù)處理組合的效果,選擇合適的預(yù)處理與建模組合,得到最終模型,用于之后的預(yù)測(cè)(圖1)。
圖1 近紅外光譜技術(shù)的應(yīng)用流程Fig.1 Application processes of near-infrared spectroscopy technology
1990年,近紅外光譜技術(shù)就已被應(yīng)用于預(yù)測(cè)木材化學(xué)成分以及紙漿產(chǎn)量,隨后被應(yīng)用于木材物理力學(xué)性能的檢測(cè)[16-18]。木材主要化學(xué)成分有纖維素、半纖維素、木質(zhì)素等,其中木質(zhì)素主要影響木材制漿性能和紙漿質(zhì)量,是制漿材質(zhì)量的重要判斷依據(jù)[19-21]。丁麗等[19]利用近紅外光譜技術(shù)結(jié)合BP神經(jīng)網(wǎng)絡(luò)定量預(yù)測(cè)日本柳杉(Cryptomeriajaponica)中總纖維素和木質(zhì)素的含量,得到的預(yù)測(cè)模型相關(guān)系數(shù)分別為0.91和0.90,預(yù)測(cè)值和實(shí)測(cè)值之間有良好的相關(guān)性。除此之外,一些木材的耐用性特征也被廣泛關(guān)注,木材耐用性主要取決于心材內(nèi)含物的含量。Li等[22]開發(fā)了用于心材內(nèi)含物測(cè)定的跨樹種近紅外光譜校準(zhǔn),以區(qū)分混合林中的桉樹樹種并預(yù)測(cè)其心材內(nèi)含物含量。預(yù)測(cè)模型的偏最小二乘回歸模型回歸系數(shù)為0.95,預(yù)測(cè)均方根誤差為0.90,能夠區(qū)分混合樣本并有望用于快速耐久性預(yù)測(cè)。
近紅外光譜也被用于評(píng)估木材物理性質(zhì)。Zhang等[23]利用近紅外光譜結(jié)合支持向量機(jī)建立了落葉松(Larixgmelinii)木材密度預(yù)測(cè)模型,結(jié)果表明使用支持向量機(jī)模型可顯著提高模型預(yù)測(cè)木材密度的性能。譚念等[24]提出了結(jié)合灰狼算法支持向量機(jī)(GWO-SVM)的木材密度近紅外光譜預(yù)測(cè)模型,決定系數(shù)為0.92,均方誤差為0.000 18,預(yù)測(cè)精度較多元線性回歸和支持向量機(jī)回歸更優(yōu)。木材近紅外光譜模型的超參數(shù)中隱含了木材特征與其力學(xué)性能之間的相互關(guān)系,木材抗彎強(qiáng)度(MOR)與抗彎彈性模量(MOE)等力學(xué)性能受到木材成分組成、微觀結(jié)構(gòu)、物理性質(zhì)及環(huán)境的共同影響,并非木材的直接特征,而是與木材特性屬于非線性關(guān)系?;谄钚《?PLS)回歸模型預(yù)測(cè)機(jī)械性能的精確度仍低于其他物理和化學(xué)性能?;诖?Yu等[25]使用徑向和切向表面平均光譜建立基于相關(guān)局部嵌入(CLE)的偏最小二乘(PLS)模型以適應(yīng)NIR光譜與MOE及MOR之間的非線性關(guān)系。Yu等[1]測(cè)量了來自杉木、桉樹和楊樹的438個(gè)無疵木材樣品的近紅外光譜和MOE、MOR,使用偏最小二乘法建立模型,得出除楊樹樣品的MOR外,近紅外光譜與力學(xué)性能的相關(guān)性非常強(qiáng),訓(xùn)練和預(yù)測(cè)模型相關(guān)系數(shù)均在0.80以上。微纖絲角也是評(píng)估木材各項(xiàng)性質(zhì)的重要因子之一,與木材化學(xué)性質(zhì)、物理性質(zhì)及力學(xué)性質(zhì)密切相關(guān),可以用于木材性質(zhì)的早期預(yù)測(cè)。Ma 等[26]通過近紅外高光譜成像技術(shù)獲得日本柳杉木材光譜數(shù)據(jù),以X射線衍射法獲得微纖絲角數(shù)據(jù),并通過偏最小二乘法建立模型,其校準(zhǔn)模型的相關(guān)系數(shù)為0.77,能夠有效預(yù)測(cè)和評(píng)估日本柳杉微纖絲角及其分布規(guī)律。
近紅外光譜技術(shù)不但能評(píng)估木材的化學(xué)性質(zhì),且能對(duì)其物理力學(xué)性質(zhì)進(jìn)行評(píng)估,并實(shí)時(shí)反饋,有望應(yīng)用于用材樹種的遺傳育種和基因工程,提高優(yōu)質(zhì)木材定向培育的效率,提高人工林木材質(zhì)量。同時(shí),其在木材質(zhì)量檢測(cè)領(lǐng)域也有較大潛力,能夠快速無損地預(yù)測(cè)大量木材樣品的性質(zhì),對(duì)木材產(chǎn)品進(jìn)行初步篩選分級(jí),節(jié)約了人力和檢測(cè)成本。
各類經(jīng)濟(jì)林產(chǎn)品如堅(jiān)果、油料種子、工業(yè)原料及藥材等在我國(guó)林業(yè)產(chǎn)業(yè)總產(chǎn)值中占比較大,2018年,我國(guó)各類經(jīng)濟(jì)林產(chǎn)品產(chǎn)量達(dá)1.57億t,林產(chǎn)品進(jìn)出口貿(mào)易額達(dá)1 600億美元[27]。由于近紅外光譜可進(jìn)行快速無損檢測(cè)的特性,能夠快速了解經(jīng)濟(jì)林產(chǎn)品的化學(xué)成分含量及種子活性等性狀,以及重要商品特征如口感,成熟度等[28]。在產(chǎn)物品質(zhì)方面,Araújo 等[29]結(jié)合偏最小二乘法對(duì)咖啡豆(Coffeaarabica)的pH和酸度進(jìn)行預(yù)測(cè),模型的相關(guān)系數(shù)為0.78和0.92,剩余預(yù)測(cè)誤差為2.061和2.966,預(yù)測(cè)值和實(shí)驗(yàn)值之間的平均誤差低于7%,可以對(duì)樣品進(jìn)行快速在線評(píng)估。王丹等[30]建立了可見和近紅外漫反射(VIS/NIR)光譜與甜柿(Diospyroskaki)硬度的修正偏最小二乘模型,展現(xiàn)了較好的預(yù)測(cè)性能,給確定甜柿最佳采收時(shí)期提供了一種高通量且無損的解法。
除間接特征外,近紅外光譜在經(jīng)濟(jì)林產(chǎn)品品質(zhì)方面的應(yīng)用更多在于檢測(cè)產(chǎn)物化學(xué)成分含量[31]。Rébufa 等[32]對(duì)辣木(Moringaoleifera)葉片進(jìn)行了近紅外光譜檢測(cè),建立了辣木葉片礦物質(zhì)、蛋白質(zhì)的預(yù)測(cè)模型,對(duì)氮和蛋白質(zhì)含量建立的模型性能最佳,校準(zhǔn)模型相關(guān)系數(shù)達(dá)0.96。李水芳等[33]分別采用偏最小二乘法及徑向基神經(jīng)網(wǎng)絡(luò)法(RBFNN)建立油桐(Verniciafordii)、油茶(Camelliaoleifera)、核桃(Juglansregia)的各類混合樣本集含油率的近紅外光譜通用模型。模型的相關(guān)系數(shù)基本可達(dá)0.9,該通用性檢測(cè)模型具有可行性。León等[34]利用近紅外光譜技術(shù)(NIRS)研究了親本和收獲年份對(duì)完整橄欖(Oleaeuropaea)果實(shí)中油、水分、油酸和亞油酸含量測(cè)定的影響,在橄欖育種計(jì)劃中發(fā)揮了效用。Tigabu等[35]構(gòu)建了區(qū)分展松(Pinuspatula)活種子和空種子的透射和反射近紅外光譜模型,經(jīng)波長(zhǎng)選擇后,區(qū)分率皆達(dá)到100%,為開發(fā)自動(dòng)化快速分選設(shè)備做好了技術(shù)準(zhǔn)備。
近紅外光譜對(duì)含氫離子團(tuán)倍頻吸收的敏感性使得其能夠檢測(cè)到大多數(shù)有機(jī)物質(zhì)及無機(jī)離子,這為經(jīng)濟(jì)林產(chǎn)物品質(zhì)檢測(cè)提供了絕佳的條件,也由此為林木遺傳育種提供了嶄新的思路和方案??梢娊t外光譜技術(shù)在經(jīng)濟(jì)林產(chǎn)品品質(zhì)乃至林木遺傳育種的研究中有著巨大的潛力。
近紅外光譜數(shù)據(jù)的全面性使得其不僅能夠被應(yīng)用于直接特征的檢測(cè),還能將各種特征進(jìn)行綜合分析,在定性測(cè)量方面發(fā)揮作用?;诮t外光譜的方法可以識(shí)別樹木的雜交群體[36]或地理起源[37],也能進(jìn)行樹種鑒別[38]。從實(shí)木樣品中獲得的近紅外光譜可用于物種識(shí)別。汪紫陽等[39]建立了東北地區(qū)常見的14個(gè)樹種可見/近紅外光譜模型,以識(shí)別這些樹種,識(shí)別準(zhǔn)確率達(dá)98.21%。楊金勇等[40]利用主成分分析與Fisher判別模型建立了大葉桉(Eucalyptusrobusta)和馬尾松(P.massoniana)、落葉松(L.gmelinii)、樟子松(P.sylvestrisvar.mongolica)的木材近紅外光譜模型,在3類松樹間的識(shí)別率可達(dá)98.02%,加入大葉桉的數(shù)據(jù)后,識(shí)別率為100%。針對(duì)同一物種,用近紅外光譜也能夠通過檢測(cè)化學(xué)成分等特征的細(xì)微差異將它們根據(jù)種源進(jìn)行區(qū)別。Nisgoski 等[37]對(duì)不同種源的日本柳杉進(jìn)行了近紅外光譜建模,對(duì)4 000~6 000 cm-1的光譜波段進(jìn)行分析,成功將6個(gè)種源的日本柳杉區(qū)別開來。
常用的紅木鑒別技術(shù)受限于檢測(cè)人員的專業(yè)素養(yǎng),以及對(duì)樣品的代表性有一定要求,為簡(jiǎn)化流程、提升精度,在紅木鑒別領(lǐng)域引入了近紅外光譜技術(shù)。楊忠等[41]根據(jù)8類紅木標(biāo)準(zhǔn)樣本的近紅外光譜數(shù)據(jù)和紅木色度學(xué)參數(shù)建立了鑒別模型,發(fā)現(xiàn)二者有極高的相關(guān)性,使得近紅外光譜技術(shù)在紅木乃至珍貴木材樹種鑒別領(lǐng)域有很高的商業(yè)應(yīng)用價(jià)值。結(jié)合成像技術(shù)后,近紅外光譜還能夠反映樹齡等隱藏在木材表觀特征中的信息,如Ruano 等[42]通過近紅外高光譜成像技術(shù)成功確定了歐洲赤松幼齡木和成熟木的界限,并區(qū)分早晚材。
利用近紅外光譜鑒別林業(yè)樣品是否受病蟲為害,主要是根據(jù)病原微生物或昆蟲侵染后對(duì)樣品是否造成物質(zhì)含量或種類的改變。Lucas等[43]通過可見和近紅外反射光譜有效區(qū)分了橡膠(Heveabrasiliensis)的病葉和正常葉。Xu等[44]利用激光誘導(dǎo)擊穿光譜(LIBS)和近紅外光譜對(duì)甜橙(Citrussinensis)黃龍病進(jìn)行診斷,發(fā)現(xiàn)激光誘導(dǎo)擊穿光譜聯(lián)合近紅外光譜對(duì)柑橘黃龍病的診斷準(zhǔn)確率最高,訓(xùn)練集和測(cè)試集準(zhǔn)確率分別為89.5%和95.7%。在林木蟲害研究方面,Tigabu等[35]根據(jù)近紅外光譜反映的種子含水量的變化鑒別飽滿種子和受病蟲害侵染的種子,區(qū)分率達(dá)100%。國(guó)內(nèi)外松林受松材線蟲為害已久,王震等[45]、黃明祥等[46]、馬躍等[47]的研究共同說明,是否感染松材線蟲的松樹在近紅外區(qū)域的光譜反射率存在極顯著差異,近紅外波段對(duì)于松材線蟲病乃至林木病害的光譜研究有很大意義。這個(gè)結(jié)果有望被應(yīng)用于快速生物安全檢測(cè),降低外來林木病原進(jìn)入的風(fēng)險(xiǎn)。
為研究森林生態(tài)系統(tǒng)中的礦物循環(huán),了解凋落物的分解速率至關(guān)重要,有關(guān)森林凋落物的研究開展較早。Gillon等[48]用共10種不同物種的落葉,通過近紅外光譜測(cè)試分解速率,證明近紅外光譜可以預(yù)測(cè)凋落物的分解速度。此外,近紅外光譜法對(duì)落葉層組分也有較強(qiáng)的預(yù)測(cè)能力。Chodak等[49]記錄了406份云杉、山毛櫸和云杉-山毛櫸混交林落葉層的可見-近紅外光譜數(shù)據(jù),很好地預(yù)測(cè)了C、N、P及一些金屬元素的含量。
落葉層元素含量間接影響了森林植物的生產(chǎn)力,同時(shí)林下土壤的質(zhì)量也值得研究。Conforti等[50]用可見-近紅外光譜評(píng)估了意大利南部一些代表性林區(qū)不同質(zhì)地土壤的有機(jī)碳、總氮、pH,其中有機(jī)碳和總氮的模型預(yù)測(cè)結(jié)果較好,pH的預(yù)測(cè)模型有中等預(yù)測(cè)能力。Vendrame等[51]建立了高嶺石、三水鋁石及赤鐵礦等土壤礦物的預(yù)測(cè)模型以分析土壤特性,預(yù)測(cè)結(jié)果均較為理想。確定林下土壤的元素含量和礦物組成對(duì)土壤學(xué)表征很重要,能夠在一定程度上預(yù)測(cè)林木未來生長(zhǎng)狀態(tài)。配合近紅外光譜技術(shù),可以建立一定區(qū)域的土壤光譜庫,有助于森林土壤資源的可持續(xù)監(jiān)測(cè)和管理。
不同的物種、檢測(cè)內(nèi)容和建模條件下的近紅外光譜數(shù)據(jù)對(duì)各種預(yù)處理方法和建模方法有不同的適應(yīng)性,部分近紅外光譜建模的優(yōu)良方案見表2。
表2 近紅外光譜技術(shù)在林業(yè)領(lǐng)域的具體應(yīng)用
1)樣品含水量影響近紅外光譜分析。近紅外光譜主要記錄含氫原子團(tuán)的倍頻吸收信息,對(duì)樣品中的水分尤為敏感,具有O—H鍵的水在NIR光譜中有1 414和1 916~1 980 nm兩個(gè)重要的吸收區(qū)域,可能會(huì)與近紅外光譜中的其他特征信息重疊而導(dǎo)致預(yù)測(cè)模型精度下降[52]。因此在進(jìn)行無損檢測(cè)時(shí),最好需要對(duì)樣本進(jìn)行脫水干燥處理,在木材的近紅外光譜檢測(cè)中,木材樣本通常要達(dá)到一定干燥度;在某些干燥后會(huì)影響所測(cè)成分含量的樣品,如用于提取揮發(fā)性成分的部分時(shí),至少也需要所檢測(cè)樣品表面干燥[53]。
2)樣品的狀態(tài)如顆粒大小[54]、表面光滑程度[55]等都與近紅外光譜分析結(jié)果密切相關(guān)。將木材樣品研磨成木粉能夠使近紅外光譜模型具有更高的精度,木粉顆粒的大小對(duì)近紅外光譜建模的精度也有影響。然而木粉研磨和顆粒大小控制是較為耗時(shí)的,在實(shí)際測(cè)量中,應(yīng)用實(shí)木進(jìn)行光譜測(cè)量更為經(jīng)濟(jì)。實(shí)木木材的近紅外光譜往往從實(shí)木樣品的木材三切面獲得,但從3個(gè)切面獲得的近紅外光譜又有所不同。趙榮軍等[56]認(rèn)為對(duì)粗皮桉(E.pellita)木材力學(xué)性質(zhì)模型預(yù)測(cè)效果最好的是徑切面和弦切面的平均光譜值;余雁等[57]在研究毛竹(Phyllostachysedulis)氣密性的實(shí)驗(yàn)中探究了不同采譜方式對(duì)建模精度的影響,發(fā)現(xiàn)平均竹材內(nèi)外表面光譜后得到的模型預(yù)測(cè)精度顯著提高。雖然近紅外波段的穿透能力強(qiáng)于其他紅外波段,但穿透能力有限,至多深入樣品3~5 mm[58]。若果皮過厚而需測(cè)量種子內(nèi)成分,則仍需去除部分果皮。另外,樣品本身材質(zhì)及形狀對(duì)光線的敏感度也是影響建模精度的要素之一。
3)樣本量和樣本間差異影響近紅外光譜分析。建立模型的過程中需要檢測(cè)大量樣品以得到一個(gè)穩(wěn)定準(zhǔn)確的校準(zhǔn)模型。模型建立后也并非一勞永逸,還需要時(shí)時(shí)進(jìn)行維護(hù),使模型保持良好穩(wěn)定的狀態(tài),以適應(yīng)更多樣本。在所有樣本中,樣本差異越大,則模型的泛化效果越好,預(yù)測(cè)的準(zhǔn)確度就更高。Shi 等[59]對(duì)14種硬木橫截面進(jìn)行近紅外光譜掃描后通過人工神經(jīng)網(wǎng)絡(luò)完成模型的建立,結(jié)果表明使用多物種近紅外光譜數(shù)據(jù)集預(yù)測(cè)硬木的機(jī)械強(qiáng)度將提高模型的泛化能力并提高準(zhǔn)確性。而為了保證得到模型的精確度,需要一定量的近紅外光譜數(shù)據(jù),以確保在不同建模方式中都為模型的構(gòu)建、訓(xùn)練、驗(yàn)證留有余裕,樣本量通常需大于100。
4)采譜狀態(tài)影響近紅外光譜分析。樣品發(fā)育過程影響著其不同部分的化學(xué)成分及含量,因此,樣品(尤其是果實(shí))的擺放方向,一定程度上影響著最終模型的精度[60]。測(cè)量時(shí)的環(huán)境條件如溫度、濕度對(duì)樣品的影響也會(huì)影響近紅外光譜的采集和分析。
近紅外光譜涵蓋了樣品較為完備的信息,但同時(shí)也囊括了許多泛音和合頻,光譜模式復(fù)雜,信噪比較低,且不同于紅外光譜可以明確指出某種基團(tuán)的吸收峰,近紅外光譜很難進(jìn)行精確的波段分配,需要借助計(jì)算機(jī)技術(shù)以及化學(xué)計(jì)量學(xué)手段對(duì)光譜數(shù)據(jù)進(jìn)行分析,獲得低背景干擾和高信噪比的高質(zhì)量光譜數(shù)據(jù)。
1)預(yù)處理和波長(zhǎng)選擇方式影響近紅外光譜分析。對(duì)于不同的樣品,不同的預(yù)處理方式和組合可能產(chǎn)生不同的結(jié)果。常見的預(yù)處理方式有Savitzky-Golay卷積平滑算法、導(dǎo)數(shù)變換、標(biāo)準(zhǔn)正態(tài)變換(standard normal variate stransformation, SNV)、多元散射校正(multiplicative scatter correction, MSC)等。Savitzky-Golay卷積平滑算法可對(duì)數(shù)據(jù)進(jìn)行多項(xiàng)式最小二乘擬合,以消除噪聲、提高信噪比,較移動(dòng)平均平滑損失的信息少。導(dǎo)數(shù)光譜消除的是基線和背景干擾,區(qū)分重疊條帶,但可能會(huì)引入噪聲[61],其中二階導(dǎo)數(shù)要求較高信噪比和較低水汽峰。SNV用于消除樣品顆粒大小、表面散射及光程變化帶來的影響[62]。MSC與SNV的處理有相似之處,但對(duì)于組間異質(zhì)性大的樣品效果較差。
2)波長(zhǎng)選擇的方式有競(jìng)爭(zhēng)性自適應(yīng)重加權(quán)(competitive adaptive reweighteds ampling, CARS)、迭代保留信息變量(iteratively reserved information variables, IRIV)、連續(xù)投影(successive projections algorithm, SPA)等。Li 等[63]用實(shí)木樣品建立NIR-PLS回歸模型預(yù)測(cè)香椿(Toonasinensis)心材內(nèi)含物的研究表明,通過sMC篩選特征波長(zhǎng)的方法選擇特征波數(shù)減少了木紋角度對(duì)香椿心材內(nèi)含物近紅外光譜的影響。但并非所有情況下數(shù)據(jù)預(yù)處理與波長(zhǎng)選擇都能產(chǎn)生正面影響。不同的樣本集與預(yù)處理方式、波長(zhǎng)選擇方式及建模方式的適應(yīng)性不同。預(yù)處理及波長(zhǎng)選擇只是提高模型預(yù)測(cè)精度的手段,有時(shí)過分追求建模精度會(huì)導(dǎo)致過擬合,使得模型泛化效果不佳。如Kelley 等[64]在火炬松(P.taeda)木材化學(xué)、力學(xué)性質(zhì)的近紅外光譜預(yù)測(cè)的研究中,沒有對(duì)光譜采用任何預(yù)處理,認(rèn)為經(jīng)這些算法處理后,光譜數(shù)據(jù)的化學(xué)解析會(huì)變得更加復(fù)雜,或是改變一些重要信息。
3)建模方式影響近紅外光譜分析。隨著計(jì)算機(jī)技術(shù)與生物技術(shù)的深入交流,機(jī)器學(xué)習(xí)在生物科學(xué)領(lǐng)域得到了廣泛應(yīng)用,除常見的偏最小二乘法,人工神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)也越來越多地被用于近紅外光譜分析,近紅外光譜分析技術(shù)得到了長(zhǎng)足的進(jìn)步。
4)硬件系統(tǒng)影響近紅外光譜分析。光譜儀、檢測(cè)器、光纖等硬件技術(shù)的發(fā)展一定程度上影響了近紅外光譜技術(shù)的發(fā)展,使得到的光譜數(shù)據(jù)更加精確。
國(guó)內(nèi)外大量實(shí)踐研究表明近紅外光譜具有許多獨(dú)特的優(yōu)勢(shì),在木材物理化學(xué)性質(zhì)檢測(cè)、林木遺傳育種、產(chǎn)物品質(zhì)檢測(cè)、種質(zhì)資源鑒定、病蟲害檢測(cè)等方面有著較高的應(yīng)用價(jià)值。近紅外光譜技術(shù)與氣象色譜質(zhì)譜聯(lián)用(GC-MS)結(jié)合,能夠在一次檢測(cè)中同時(shí)得到多種內(nèi)含物含量建模預(yù)測(cè)所需的數(shù)據(jù),大大節(jié)約了成本。在林業(yè)上使用近紅外光譜時(shí),還有一些值得關(guān)注的問題。
1)建模精度的提高不應(yīng)完全依賴于數(shù)據(jù)處理。建模精度與預(yù)測(cè)準(zhǔn)確性固然是值得深入探討的內(nèi)容,但多元數(shù)據(jù)分析依賴于樣本的化學(xué)分析結(jié)果。因此,在光譜數(shù)據(jù)處理之外,也應(yīng)關(guān)注更準(zhǔn)確的化學(xué)分析結(jié)果,同時(shí)注意控制環(huán)境條件,及時(shí)剔除異常樣品與異常光譜,以獲得質(zhì)量良好的近紅外光譜數(shù)據(jù)。
2)盡管近紅外光的探測(cè)深度在競(jìng)爭(zhēng)技術(shù)中名列前茅,但對(duì)于形態(tài)多樣的林業(yè)樣品來說仍顯不足。譬如,欲對(duì)樹皮較厚的活立木或果皮及種皮較厚的果實(shí)、種子進(jìn)行無損檢測(cè),可能獲取的光譜信息不足以建立穩(wěn)定精確的模型,仍需取用生長(zhǎng)錐或進(jìn)行前處理。未來需要配合硬件技術(shù)的發(fā)展,如微創(chuàng)探針等,以拓展近紅外光譜的泛用性。
3)建立林業(yè)領(lǐng)域近紅外光譜法相關(guān)標(biāo)準(zhǔn),對(duì)技術(shù)進(jìn)行熟化推廣。林業(yè)領(lǐng)域中,近紅外光譜法的引入稍晚但在林業(yè)上的應(yīng)用迅速,因此缺乏一定的標(biāo)準(zhǔn)與規(guī)范,相關(guān)規(guī)定滯后,標(biāo)準(zhǔn)化程度不如在化工業(yè)、食品行業(yè)成熟[65]。為使近紅外光譜技術(shù)在林業(yè)上有更大的應(yīng)用前景,亟須進(jìn)一步將其規(guī)范化,制定相關(guān)標(biāo)準(zhǔn)與指南。其次要加大預(yù)測(cè)模型在生產(chǎn)實(shí)踐中的應(yīng)用力度,如開發(fā)快速預(yù)測(cè)軟件降低技術(shù)運(yùn)(應(yīng))用門檻或在手持式光譜儀系統(tǒng)中搭載預(yù)測(cè)模型在獲取樣品光譜的同時(shí)快速獲得預(yù)測(cè)結(jié)果,以促進(jìn)成果轉(zhuǎn)化,達(dá)到對(duì)現(xiàn)有技術(shù)進(jìn)一步熟化推廣的目的,在實(shí)踐中進(jìn)行檢驗(yàn)。
在對(duì)活立木進(jìn)行的研究中,大多以取生長(zhǎng)錐的方式進(jìn)行近紅外光譜檢測(cè),這可能與近紅外光的透射深度有關(guān),有待結(jié)合硬件設(shè)施的更新發(fā)展及更泛用的檢測(cè)模式,以增強(qiáng)近紅外光譜技術(shù)在林地現(xiàn)場(chǎng)測(cè)量中的實(shí)用性與易用性。近紅外光譜技術(shù)結(jié)合遙感或成像技術(shù)檢測(cè)林木病蟲害的方法已經(jīng)趨于成熟,從生物安全方面看,也有很大的的應(yīng)用前景,可將其應(yīng)用于林木進(jìn)出口快速檢疫或產(chǎn)物自動(dòng)化分選,開拓近紅外光譜的實(shí)際應(yīng)用領(lǐng)域。此外,近紅外光譜對(duì)林業(yè)產(chǎn)物品質(zhì)的檢測(cè)實(shí)際上是對(duì)產(chǎn)物成分組成、成分含量及生理生化表征的檢測(cè),與林木遺傳育種與良種選育的要求契合,可以在常規(guī)檢測(cè)中積累近紅外光譜檢測(cè)數(shù)據(jù),建立一定范圍的近紅外光譜數(shù)據(jù)庫,在得到穩(wěn)定準(zhǔn)確的模型后應(yīng)用于育種規(guī)劃和實(shí)踐工作。