尹世逵,馮國紅,李春旭,趙婧含,孟永斌,王 晨,李耀翔
(東北林業(yè)大學(xué) 工程技術(shù)學(xué)院,黑龍江 哈爾濱 150040)
中國東北林區(qū)作為重點國有林區(qū),曾因人類對森林過度索取,森林資源已變得相對貧乏,因此最大限度地合理利用現(xiàn)有森林資源顯得尤為重要。木材性質(zhì)是評定木材質(zhì)量等級、確定木材最佳用途的重要依據(jù)。木材基本密度作為木材質(zhì)量等級評定的重要參數(shù)之一,在木材材性研究、森林培育和林木育種等方面也具有重要應(yīng)用。落葉松、紅松、云杉、冷杉作為東北林區(qū)主要的針葉樹種,用途廣泛,是具有高經(jīng)濟價值的優(yōu)良樹種,在東北林區(qū)針葉樹種中具有重要地位。
隨著科技的不斷發(fā)展,近紅外光譜分析技術(shù)作為一種新型的無損檢測技術(shù),已被國內(nèi)外學(xué)者廣泛應(yīng)用到檢測木材密度、含水率、強度等木材性質(zhì)的研究中[1-7]。Mauricio 等基于近紅外光譜技術(shù),結(jié)合偏最小二乘法利用近紅外光譜全波段建模,對花旗松削片樣品密度進行快速預(yù)測,為進一步準(zhǔn)確評估花旗松實時密度研究提供理論依據(jù)[8]。Valentina 等利用近紅外光譜分析技術(shù),選取不同的近紅外光譜波段建模,對葡萄樹葉片水分狀況快速測定,得到校正和驗證相關(guān)系數(shù)分別在在0.77~0.85 范圍內(nèi)和0.67~0.77 范圍內(nèi),模型預(yù)測效果較之全波段光譜有所提升[9]。
江澤慧等利用近紅外光譜分析技術(shù)對杉木、毛竹、落葉松等密度、纖維素結(jié)晶度、木質(zhì)素、強度等進行研究,結(jié)果表明,近紅外光譜技術(shù)可以實現(xiàn)木材性質(zhì)的快速預(yù)測[3,4,11]。張慧娟等研究近紅外光譜建模波段的不同對木材含水率的模型精度影響,將全光譜波段分割成連續(xù)的幾個波段分別參與建模,最終選取最優(yōu)的建模近紅外波段實現(xiàn)對木材含水率的精準(zhǔn)預(yù)測[11]。熊雅婷等采用不同的波段變量篩選方法對白酒酒醅成分性質(zhì)建模分析,結(jié)果表明采用波段變量優(yōu)選方法使模型精度更高,模型更簡化[12]。陳玥洋等對眼房水葡萄糖濃度的近紅外光譜波段,采用不同的波段變量篩選方法,使得模型的效果提升[13]。
由于近紅外光譜波段區(qū)域存在與木材基本密度相關(guān)性較小或不相關(guān)的特征,在構(gòu)建模型時會引入冗余的信息,使得偏最小二乘模型的預(yù)測誤差增大,模型效果變差。近紅外光譜數(shù)據(jù)波段優(yōu)選方法對模型的預(yù)測精度和擬合效果有重要影響。由于目前尚未見到相關(guān)資料報道記載,究竟哪種近紅外光譜波段優(yōu)選方法會使得木材基本密度模型效果最好,因此本研究對比分析不同近紅外光譜波段優(yōu)選方法對針葉木材基本密度模型建模精度的影響,以此確定最優(yōu)的波段優(yōu)選方法,進而對針葉木材基本密度實現(xiàn)高精度的估測。
傳統(tǒng)的木材取樣方式具有一定的破壞性,例如張怡卓等將樹木伐倒后,切割成圓盤截取標(biāo)準(zhǔn)式樣,結(jié)合近紅外光譜對木材基本密度建模研究[14]。而取完樣品之后,樹木將被完全破壞。本研究采用破壞性最小的樹木生長錐取樣方式進行密度研究,這種方式具有野外作業(yè)取樣方便、測定快速、成本低等優(yōu)點,對目標(biāo)樹種取樣后,不影響樹木正常生長發(fā)育,結(jié)合近紅外光譜分析技術(shù)對樹木密度進行動態(tài)監(jiān)測,實現(xiàn)真正意義上的無損檢測。
江澤慧等以杉木為例,研究了含水率對木材近紅外光譜的影響。研究表明近紅外光譜的吸光度會隨著木材樣品含水率增大而提高,樣品近紅外波形趨勢大致相同,可以在不同含水率下預(yù)測木材樣品的氣干密度[4]。周竹等研究表明針葉木材樣品缺陷位置的近紅外光譜的吸光度數(shù)值比正常位置低,整體波形趨勢大致相同[15]。江澤慧等研究表明木材樣品橫切面、徑切面、弦切面部位的近紅外光譜數(shù)據(jù)存在一定的差異,但均可用于模型構(gòu)建進行木材密度預(yù)測,且模型效果較好[3]。本研究選用健康木沒有缺陷的木材樣品參與實驗研究。
本研究以東北林區(qū)落葉松、紅松、云冷杉為研究對象,利用近紅外光譜分析技術(shù),進行波段優(yōu)選,將篩選好的特征波長點對應(yīng)的數(shù)據(jù)作為建模變量,構(gòu)建三種針葉木材基本密度通用模型,為木材基本密度的批量快速測定提供技術(shù)支持,同時也為后續(xù)樹種研究、針葉木材加工利用和林木剩余物估算[16]等方面提供理論依據(jù)。
研究所用的針葉木材樣品采集于黑龍江省哈爾濱市方正縣星火林場,地理坐標(biāo)為128°13′41″~ 129°33′20″E、45°32′46″~46°09′00″N。方正縣屬丘陵低山地區(qū),海拔一般在300~700 m 之間。星火林場的氣候?qū)儆诤疁貛Т箨懶约撅L(fēng)氣候。林場雨量充沛,年平均降水量579.7 mm,屬于中緯度地區(qū)???cè)照諘r數(shù)為1 178 h,日照百分比為54%,平均日照時間為8 h,土壤類型為暗棕壤森林土。
實驗樣品采自星火林場15 塊立地條件相似的樣地(20 m×20 m)。每塊樣地隨機選取紅松、落葉松、云冷杉針葉樹種的標(biāo)準(zhǔn)木各3 棵,在胸徑處由南向北采用生長錐穿過樹心鉆孔取樣,取樣深度大約為樹木胸徑的2/3,樣品直徑約為5.15 mm, 樣品長度100~350 mm 不等,本次實驗獲取紅松、落葉松、云冷杉生長錐樣品各45個,共計135個針葉木材樣品。在樣品采集完成后,采用活性黏土填堵取樣留下的孔洞,幫助樹木自我治愈,并防止昆蟲對敏感樹種的侵害,以免對樹木后期生長發(fā)育造成影響。
由于實驗獲取的木材生長錐樣品長度不一,因此采用排水法獲取木材的基本密度,按照《木材密度測定方法》(GB/T 1933—2009)的標(biāo)準(zhǔn)進行。為了得到較穩(wěn)定的模型,每個木材樣品均在橫斷面處采用80 目的砂紙打磨5 次,使其表面粗糙度參數(shù)Ra 基本接近12.5 μm。在實驗室將生長錐樣品進行時長為48 h 的浸水處理,由于水在標(biāo)準(zhǔn)狀況下的密度為1 g/cm3,樣品浸入水后排出水的體積等同于樣品的體積。測定時,將燒杯盛水至適當(dāng)深度放置于電子天平上,記錄此時電子天平的示數(shù),將針葉木材樣品固定于鐵針上,而后將鐵針浸入水下1~2 cm 后,待其穩(wěn)定后,記錄此時的天平示數(shù),前后兩次示數(shù)之差即為木材樣品體積,通過計算即可得到樣品的基本密度。木材基本密度測定結(jié)果見表1。
所測樣品的基本密度范圍為0.259 1~ 0.534 1 g/cm3,平均值為0.403 0 g/cm3。在本次實驗中,將所采集的135個針葉木材樣品按照2:1 的比例隨機分成校正集90個和驗證集45個(表2)。
表1 針葉木材樣品基本密度統(tǒng)計Table 1 Basic density statistics of coniferous wood samples
表2 實驗樣品驗證集與校正集密度統(tǒng)計表Table 2 Experimental sample verification set and calibration set density statistics table
利用美國ASD 公司生產(chǎn)的LabSpec? Pro FR/A114260 便攜式快速掃描光譜儀獲取4 種針葉木材生長錐樣品的近紅外光譜信息,儀器的波長區(qū)域為350~2 500 nm,光譜分辨率為3 nm@700 nm, 10 nm@1 400 nm 和2 100 nm。
實驗在室溫20 ℃、空氣濕度為50%的條件下進行。為保證數(shù)據(jù)準(zhǔn)確,避免木材樣品中水分子的含氫基團對于近紅外光譜吸收的影響,將針葉木材樣品放入烘干箱,在105 ℃下進行烘干處理,直到針葉木材樣品完全干燥并冷卻至室溫20 ℃,采用二分光纖探頭采集木材樣品的近紅外光譜。將近紅外光譜儀光纖探頭對準(zhǔn)白板進行空白校準(zhǔn)(校準(zhǔn)白板由聚四氟乙烯材質(zhì)制成)后采集木材樣品近紅外光譜。
江澤慧等研究表明,木材樣品的3 種切面的近紅外光譜包含的信息均能表征木材樣品,且信息含量較為豐富[12]。因此本研究應(yīng)用光譜儀二分光纖探頭采集樣品橫斷面近紅外光譜(即木材樣品弦切面光譜),對針葉木材樣品相對的兩個端面各采集3 次近紅外光譜。近紅外光譜儀會在1.5 s 內(nèi)對針葉木材樣品連續(xù)掃描30 次,取其平均近紅外光譜作為最終的輸出光譜,采集間隔為1 nm,記錄近紅外光譜區(qū)波長范圍為350~2 500 nm(圖1)。
圖1 135個木材樣品全波段近紅外光譜圖Fig.1 Full-band near-infrared spectrum of 135 wood samples
近紅外光譜的波長范圍為780~2 500 nm,每一個波長點對應(yīng)一個近紅外光譜數(shù)據(jù),近紅外光譜全波段一共包含了1 700個數(shù)據(jù)點,在這些波長點中可能包含了背景噪音等冗雜信息,不可避免的會存在共線性問題,這都會對模型的預(yù)測精度和擬合效果產(chǎn)生影響,因此對近紅外光譜波段進行優(yōu)化與變量選擇有重要意義。常見的波段優(yōu)選方法有競爭性自適應(yīng)重加權(quán)法(Competitive adaptive reweighted sampling,CARS)、無信息變量消除法(Uniformative variable elimination,UVE)和間隔偏最小二乘法(Interval partial least square,iPLS)等。
競爭性自適應(yīng)重加權(quán)法(CARS)是模仿達爾文進化理論中適者生存的原則,每次通過自適應(yīng)重加權(quán)采樣[17](Adaptive reweighted sampling,ARS)技術(shù)在偏最小二乘(PLS)模型中篩選具有大回歸系數(shù)絕對值的波長點,并去除具有小權(quán)重和較低信息含量的波長點。最后,通過交互檢驗選擇具有最低交叉驗證標(biāo)準(zhǔn)偏差(RMSEC)的子集,并且有效地選擇與測量屬性相關(guān)的最佳波長組合[18]。
無信息變量消除法(UVE)是由Centner 等提出,并用于近紅外光譜數(shù)據(jù)處理,其目的是減少最終PLS 模型中包含的變量數(shù)量,降低模型的復(fù)雜性,提高PLS 模型的預(yù)測效果[9]。UVE 法用作PLS 回歸系數(shù)的變量篩選方法,基本思想是使用回歸系數(shù)作為波長重要性的度量指標(biāo),通過引入系統(tǒng)噪音變量,有效去除系統(tǒng)噪音,最終保留有用波段的信息變量。
間隔偏最小二乘法(iPLS)將測量的光譜劃分為N個等寬的波段區(qū)間,將每個波段區(qū)間中連續(xù)的M個波長點作為窗口,選取最大主成分?jǐn)?shù),并使用PLS 為每個窗口建立預(yù)測模型,根據(jù)模型評估系數(shù),找到與每個波段間隔對應(yīng)的最優(yōu)主成分?jǐn)?shù),最后比較每個窗口的最佳預(yù)測模型,確定目標(biāo)光譜信息含量最多的建模區(qū)間[19]。
在近紅外光譜分析建模方法中,偏最小二乘法(PLS)可以有效解決近紅外光譜信息量多的問題,采用逐步增加新信息的方法,在一定的程度上可以消除由外界噪音所帶來的影響,提高數(shù)據(jù)精度,并且將自變量與因變量矩陣的關(guān)系關(guān)聯(lián)起來,以此獲得最佳的模型。偏最小二乘回歸法又是多元線性回歸法和主成分回歸法的有效結(jié)合體,因此基于以上特性,本研究采用偏最小二乘法對實驗樣品進行建模分析。
將所采集的實驗樣品近紅外光譜數(shù)據(jù)導(dǎo)入ViewSpecPro 軟件中,進行近紅外光譜篩選,取樣品近紅外光譜數(shù)據(jù)的平均值作為所測樣品的近紅外光譜數(shù)據(jù),導(dǎo)入化學(xué)計量學(xué)軟件unscrambler9.7進行處理。為消除高頻噪聲、基線漂移、光散射等影響,將近紅外光譜數(shù)據(jù)轉(zhuǎn)換成吸收度值后,利用卷積平滑處理的預(yù)處理方式對近紅外光譜進行預(yù)處理。然后采用CARS、UVE 和iPLS 方法對近紅外光譜波段進行特征變量優(yōu)選,最后建立偏最小二乘法的針葉木材基本密度近紅外模型,上述采用的CARS、UVE、iPLS 等算法程序均在軟件MATLAB 2012a 中進行。
評價模型的質(zhì)量主要采用相關(guān)系數(shù)R、校正均方根誤差和預(yù)測均方根誤差(RMSE)等參數(shù)指標(biāo),其公式如下:
式中:n是建模所用樣品數(shù),si是實測值,是實測值的平均值,是預(yù)測值。
相關(guān)系數(shù)越大說明模型的擬合效果越好,校正均方根誤差越小表明模型的擬合性越好,預(yù)測均方根誤差越小,模型擬合預(yù)測效果越好,并通過完全交互驗證(Full cross validation)方法檢驗?zāi)P?,評價模型效果,確定最佳的模型優(yōu)化方法,得出最優(yōu)針葉木材基本密度近紅外模型。
如圖2a 所示,以紅松木材樣品為例,橫坐標(biāo)為近紅外光譜的波長,縱坐標(biāo)是近紅外光譜的吸收度,A、B、C 分別代表對應(yīng)基本密度為最小值、接近平均值、最大值的3個紅松木材樣品的近紅外光譜曲線,其數(shù)值分別為0.283 3、0.372 5、 0.508 0 g/cm3。
由圖2a 可知,隨著紅松木材樣品密度的增大,
圖2 針葉木材近紅外原始光譜圖Fig.2 Near-infrared original spectrum of coniferous wood
4.2.1 競爭性自適應(yīng)重加權(quán)法(CARS)
利用CARS 法對實驗樣品基本密度近紅外光譜進行關(guān)鍵變量的篩選,篩選結(jié)果見圖3。圖3 中a、b 和c 分別表示在1 次CARS 算法運行中隨著采樣次數(shù)(本次采樣次數(shù)設(shè)定為50 次)的增加,變量數(shù)量和十字交叉驗證RMSECV 數(shù)值以及每個變量回歸系數(shù)的變化。
圖3a 表示由于指數(shù)衰減函數(shù)的作用,隨著蒙特卡洛(Monte Carlo)運行次數(shù)的增多針葉木材樣品變量數(shù)目由快至慢地遞減,即在采樣次數(shù)較少的時候,變量數(shù)目在快速地減少,而隨著采樣次數(shù)的變多,變量數(shù)目減少的速率降低。表明該算法在數(shù)據(jù)篩選過程中,精準(zhǔn)的對變量進行“粗略選取”和“精細(xì)選取”。
圖3b 表示交叉驗證RMSECV 數(shù)值變化趨勢圖,反映對關(guān)鍵變量的篩選過程。即隨著采樣次數(shù)的變多,單個PLS 模型的交叉驗證RMSECV 數(shù)值呈現(xiàn)從大變小,再從小變大的變化過程。當(dāng)采樣的次數(shù)為35 時RMSECV 達到最小值(在圖3c 中“*”垂線表示),表明在第1~34 次的模型采樣運算過程中,在近紅外光譜數(shù)據(jù)中和估測木材樣品基本密度值無關(guān)的變量信息被大量去除。同時可以看到采樣次數(shù)達到35 次以后RMSECV 數(shù)值明顯呈現(xiàn)上升趨勢,這表明一些關(guān)鍵的變量信息被剔除,致使模型的整體性能變差。
圖3c 反映了針葉木材樣品變量在每次采樣中回歸系數(shù)的變化路徑,圖中的符號“*”表示此刻對應(yīng)著殘差值的最低點,與圖3a、圖3b 的結(jié)果相互對應(yīng),表明此時運行蒙特卡洛次數(shù)到35 次時,獲得的變量子集所建立的偏最小二乘模型的交叉驗證RMSECV 數(shù)值最小,因此可以確定該子集是與估測針葉木材樣品基本密度相關(guān)較高的關(guān)鍵變量子集,此時變量篩選的結(jié)果最佳,共計得到含有17個變量的關(guān)鍵變量子集。
圖3 基于CARS 的木材近紅外光譜關(guān)鍵變量篩選結(jié)果Fig.3 Screening results of key variables in wood near-infrared spectroscopy based on CARS
利用CARS 法篩選所得到的特征波長點,如表3 所示。以木材基本密度為針葉木材樣品數(shù)據(jù)真值,在近紅外光譜波長為350~2 500 nm 的范圍之間,消除大部分的無關(guān)信息變量,最終選取17個近紅外光譜特征波長點的所對應(yīng)的吸收度數(shù)值作為特征變量值參與針葉木材基本密度PLS 模型的構(gòu)建。
表3 CARS 篩選結(jié)果Table 3 CARS screening results
4.2.2 無信息變量消除法(UVE)
UVE 作為一種基于回歸系數(shù)穩(wěn)定性分析的變量選擇方法,采用該方法在近紅外光譜波長為350~2 500 nm 的范圍內(nèi)進行變量優(yōu)選,進行變量穩(wěn)定性分析。運行計算得到結(jié)果(圖4),在圖正中位置的一條豎直實線作為分界線,分界線左側(cè)為波長變量數(shù)據(jù),右側(cè)為隨機引入的系統(tǒng)噪音變量數(shù)據(jù),在圖中上下兩條與橫坐標(biāo)軸平行的實線為變量穩(wěn)定性的上下閾值線。通過設(shè)定初始閾值,確定變量選擇范圍。依據(jù)UVE 算法工作原理,可以認(rèn)定處于兩條閾值線之間的變量是無關(guān)信息變量,超出閾值的部分為有用信息波長變量,同時用符號“*”標(biāo)記,因此本研究選取閾值線上下兩側(cè)的近紅外光譜波段作為特征波長點構(gòu)建針葉木材基本密度模型。
通過無信息變量消除法計算篩選,統(tǒng)計最終篩選得出符合要求的特征變量點的數(shù)量為930個,將其作為數(shù)據(jù)輸入?yún)⑴c針葉木材基本密度模型的構(gòu)建。
4.2.3 間隔偏最小二乘法(iPLS)
基于iPLS 算法原理,將近紅外光譜全波段分割成20個等距波段進行PLS 計算,并在交互驗證后,得到其波段篩選結(jié)果(圖5)。圖中縱坐標(biāo)表示各波段交互驗證均方根誤差(RMSECV),圖中的虛線表明近紅外全光譜區(qū)(350~2 500 nm)建模的交互驗證均方差值。
由于驗證均方根誤差值越小的特征變量波段越好,故本研究選取虛線以下的RMSECV 數(shù)值相對較低的特征變量波段進行數(shù)據(jù)建模,結(jié)合圖5 最終選 取5、6、7、9、10、11、12、14、15、16、17號波段為建模波段。根據(jù)相對應(yīng)的近紅外光譜波段,得出對應(yīng)的光譜數(shù)據(jù)值,將特征波長點映射到近紅外全光譜波段(350~2 500 nm)中,并篩選特征變量參與針葉木材基本密度模型的構(gòu)建。
在利用變量篩選方法選出近紅外光譜特征變量后,結(jié)合偏最小二乘法對針葉木材基本密度數(shù)值,分別建立近紅外全光譜結(jié)合偏最小二乘法(全光譜-PLS)、競爭性自適應(yīng)重加權(quán)法法結(jié)合偏最小二乘法(CARS-PLS)、無信息變量消除法結(jié)合偏最小二乘法(UVE-PLS)、間隔偏最小二乘法結(jié)合偏最小二乘法(iPLS-PLS)這4個針葉木材基本密度模型,得到主成分貢獻率(圖6)。
圖4 UVE 近紅外光譜波段篩選結(jié)果Fig.4 UVE near-infrared spectral band screening results
圖5 iPLS 近紅外光譜波段篩選結(jié)果Fig.5 iPLS near-infrared spectral band screening results
由圖6 可得出各針葉木材基本密度模型校正集和驗證集的主成分?jǐn)?shù)貢獻率,在隨著主成分?jǐn)?shù)的增加的同時,校正集模型的貢獻率呈現(xiàn)不斷上升的趨勢,當(dāng)校正集貢獻率達到最大值時,此時對應(yīng)的主成分?jǐn)?shù)即最佳主成分?jǐn)?shù),在選取最佳主成分?jǐn)?shù)下構(gòu)建針葉木材基本密度模型將使得模型的擬合效果達到最佳。因而在確定最佳主成分?jǐn)?shù)后,構(gòu)建模型得到不同波段優(yōu)選方法處理后,得到針葉木材基本密度模型相關(guān)系數(shù)和均方根誤差值等模型結(jié)果(表3)。
由表3 可知,全光譜-PLS 模型的驗證集相關(guān)系數(shù)和均方根誤差分別為0.794 0 和0.036 6,最佳主成分?jǐn)?shù)分別為2,由于模型的波段較長,包含了大量的背景噪音等一些其他的無關(guān)信息變量,而有用信息變量不明顯,故模型選取的最佳主成分?jǐn)?shù)較低,模型的精度不高。而CARS-PLS 模型的驗證集相關(guān)系數(shù)和均方根誤差分別為0.842 7 和0.031 4,最佳主成分為3,由于選取的變量數(shù)較少,導(dǎo)致參與建模的部分有用信息量精簡,使得最佳主成分?jǐn)?shù)提升不明顯,但整體模型的精度有所提升。
圖6 4 種模型主成分貢獻率Fig.6 Four components of the main component contribution rate map
表3 不同波段優(yōu)選處理建模結(jié)果Table 3 Different bands preferred processing modeling results
而UVE-PLS 模型的驗證集相關(guān)系數(shù)和均方根誤差分別為0.856 7 和0.029 7,最佳主成分?jǐn)?shù)分別為9,表明在進行變量選擇時,去掉了大量的背景噪音等無用的信息量,使得有用信息量明顯突出,因而建模時的最佳主成分?jǐn)?shù)明顯增加的同時,也在保留關(guān)鍵特征變量數(shù)較多的情況下優(yōu)化模型,使得模型復(fù)雜程度降低,提升模型運算速度。
在這3 種波段優(yōu)選的方法中,利用iPLS-PLS方法得到的針葉木材基本密度模型結(jié)果最好,得到校正相關(guān)系數(shù)為0.938 0,校正均方根誤差為0.021 8,驗證相關(guān)系數(shù)為0.895 9,驗證均方根誤差為0.028 0,模型的最佳主成分?jǐn)?shù)數(shù)值最大為10,幾個評價模型的參數(shù)均表明在3 種模型中iPLS-PLS 模型的穩(wěn)定性和精度最佳。
通過研究可以得出,在經(jīng)過近紅外光譜波段選擇后,近紅外光譜變量的數(shù)量明顯減少,針葉木材基本密度模型的運算速度提升,波段優(yōu)選的模型相關(guān)系數(shù)較全光譜模型均有所提高,說明模型的擬合效果提升。同時波段優(yōu)選模型的校正和驗證均方根誤差相對全光譜模型均減小,模型的擬合性變好,表明通過波段篩選可以有效地優(yōu)化針葉木材基本密度模型,提升模型精度和擬合效果。
針葉木材作為天然高分子混合物,其內(nèi)部結(jié)構(gòu)復(fù)雜而且組織成分信息多變,為針葉木材基本密度模型的構(gòu)建帶來一定困難,但采用iPLS 法進行篩選出關(guān)鍵變量,可以有效達到優(yōu)化模型的效果。iPLS-PLS 波段篩選法適合針葉木材基本密度預(yù)測的變量篩選法,可以做到有效篩選近紅外光譜波段變量,使參與建模的變量數(shù)量減少、模型簡化、提高模型運算速度,并提升針葉木材基本密度模型的擬合效果和精度。
采用iPLS 法篩選波段并利用偏最小二乘法優(yōu)化建模后,將未參與建模的針葉木材樣品近紅外光譜數(shù)據(jù)作為輸入,得到針葉木材基本密度數(shù)值結(jié)果,如圖7 所示。橫坐標(biāo)表示針葉木材樣品基本密度測定值,縱坐標(biāo)表示針葉木材基本密度預(yù)測值。
圖7 iPLS-PLS 針葉木材基本密度模型預(yù)測結(jié)果Fig.7 iPLS-PLS conifer wood basic density model prediction results
由圖7 可見所建立基本密度實測值與預(yù)測值的回歸趨勢線基本與1:1 理想趨勢線重合,針葉木材基本密度模型模擬線偏離1:1 線越少,模型預(yù)測的效果越好[22]。而模型預(yù)測相關(guān)系數(shù)為0.88,由于數(shù)值大于0.80,表明模型預(yù)測效果較好[23]。校正集和驗證集檢驗參數(shù)表明所建立模型精度較高,達到完全交互驗證的模型檢驗要求,結(jié)果確定基于iPLS-PLS 的針葉木材基本密度模型可以實現(xiàn)對針葉木材基本密度的準(zhǔn)確快速估測。
本研究運用近紅外光譜分析技術(shù)結(jié)合偏最小二乘法構(gòu)建針葉木材基本密度模型,對比分析針葉木材樣品分別在CARS、UVE、iPLS 波段優(yōu)選方法下,構(gòu)建的針葉木材基本密度模型的擬合效果,根據(jù)模型評價參數(shù)確定針葉木材基本密度最優(yōu)估測模型。
對比分析針葉木材基本密度模型結(jié)果得出,通過波段篩選可以有效地簡化模型,提升模型預(yù)測精度、擬合效果以及穩(wěn)定性。在3 種變量優(yōu)選方法后所建立的模型中,利用iPLS-PLS 方法篩選變量得到的模型結(jié)果最好,針葉木材基本密度模型校正相關(guān)系數(shù)為0.938 0,校正均方根誤差為0.021 8,驗證相關(guān)系數(shù)為0.895 9,驗證均方根誤差為0.028 0。
本研究得出采用iPLS 方法對近紅外光譜波段進行篩選時,保留關(guān)鍵有效信息的特征波段,又去掉大部分無用的信息波段,可以實現(xiàn)對波長的快速選擇。確定iPLS 方法優(yōu)化的針葉木材基本密度模型為最優(yōu)模型,其模型精度最高,可以更快速、便捷地進行針葉木材樹種基本密度預(yù)測。同時結(jié)合針葉木材的其他基本性質(zhì)評定木材的質(zhì)量等級,確定針葉木材最佳用途,獲取最大的經(jīng)濟效益,也為后續(xù)針葉木材其他方面的性質(zhì)研究提供依據(jù)。
本研究針葉木材基本密度近紅外估測模型是建立在東北林區(qū)紅松、落葉松、云冷杉三種針葉木材樣品的基礎(chǔ)上,對于其他針葉木材的基本密度估測的可靠性有待進一步研究驗證,在后續(xù)研究中可以通過采集多種不同的針葉樹種木材樣品,參與基本密度估測模型的優(yōu)化驗證及模型校正,以擴大針葉木材基本密度估測模型的應(yīng)用范圍。將本研究的木材基本密度估測模型應(yīng)用于檢測針葉木材的基本密度,在后續(xù)研究中會應(yīng)用近紅外光譜技術(shù)對取樣前的活立木基本密度真值進行測定與計算,以便與優(yōu)化后的模型進行對比分析,綜合評價現(xiàn)有模型的不足,并調(diào)整模型增強模型的實用性。
本研究采用針葉木材樣品絕干狀態(tài)下的光譜數(shù)據(jù)構(gòu)建基本密度估測模型,考慮到后續(xù)模型遷移時實驗測定的溫度、濕度等實驗條件的影響,在后續(xù)研究中會進行多批次采樣,模擬不同的溫度、濕度等應(yīng)用場景,依據(jù)不同條件下的光譜數(shù)據(jù)對基本密度估測模型的參數(shù)進行調(diào)優(yōu),以反映最真實的木材基本密度信息,增強模型的泛化能力。