楊子鐸,李新建,朱光玉,劉洪娜
(1.中南林業(yè)科技大學(xué) 林學(xué)院,湖南 長沙 410004;2.國家林業(yè)和草原局中南林業(yè)調(diào)查規(guī)劃設(shè)計院,湖南 長沙 410014)
在森林調(diào)查體系中,樹高作為最重要的測樹因子之一,是反映林木生長狀況的重要指標(biāo),也是劃分林層和反映立地質(zhì)量高低的重要依據(jù),也是編制森林經(jīng)營數(shù)表、評估森林生產(chǎn)力的重要參數(shù)[1]。在立地質(zhì)量評價中,林分平均高和優(yōu)勢木平均高是評估林木生長狀況的重要指標(biāo)[2-3]。在人工林或未受人為干擾的林分中,其林分平均高和優(yōu)勢木平均高兩者之間的關(guān)系極為密切[4]。在營林工作和林分生長研究過程中,有時候需要利用林分平均高和優(yōu)勢木平均高之間的關(guān)系互相推算。在森林調(diào)查工作中,通過兩者之間的關(guān)系互相推算,能夠節(jié)省大量的人力、物力和財力[5]。
目前,對于林分平均高和優(yōu)勢木平均高相關(guān)關(guān)系的研究較少[6]。根據(jù)以往學(xué)者的研究,一般認為,在純林中,兩者之間存在良好的線性關(guān)系[7-9]。然而以往對于兩者相關(guān)關(guān)系的研究只停留在簡單線性與非線性模型階段,未能考慮到林分平均高與優(yōu)勢木平均高會受到林分年齡、經(jīng)營措施、立地條件、氣候條件、林分密度等多種因素的協(xié)同影響與制約[10-12],因此兩者之間的相關(guān)關(guān)系也可能存在差異。隨著近年來數(shù)學(xué)建模方法的發(fā)展,符利勇等學(xué)者通過構(gòu)建混合效應(yīng)模型有效地解決了傳統(tǒng)的建模方法無法反映不同水平或林分因子對樹木生長的隨機影響,從而導(dǎo)致精度低的問題[13]。混合效應(yīng)模型由固定效應(yīng)和隨機效應(yīng)組成,固定效應(yīng)可以反映整體變化規(guī)律,隨機效應(yīng)與總體中不同個體的變化規(guī)律有關(guān)[14-15]。混合模型的發(fā)展與應(yīng)用,為隨機分級數(shù)據(jù)的擬合提供了可靠的方法,在森林生長與生產(chǎn)收獲模型的研究中得到了廣泛的應(yīng)用,取得了較好的擬合效果[16-20]。
杉木作為湖南重要的鄉(xiāng)土樹種之一,具備速生豐產(chǎn)、經(jīng)濟價值高、材質(zhì)好等顯著優(yōu)勢,是重要的用材樹種[21-22]。杉木也是湖南林業(yè)生產(chǎn)的重點利用對象,杉木人工林的經(jīng)營狀況直接關(guān)系到地區(qū)林業(yè)產(chǎn)業(yè)經(jīng)濟發(fā)展,在近幾十年湖南人工林的產(chǎn)業(yè)發(fā)展中發(fā)揮了重要作用[23]。通過建立基于混合效應(yīng)的林分優(yōu)勢木平均高和平均高相關(guān)關(guān)系模型,可以獲得更加精確且符合實際林分優(yōu)勢木平均高和林分平均高數(shù)據(jù)來評估林地立地質(zhì)量,對提升杉木人工林的經(jīng)營水平及林地產(chǎn)量具有十分積極的促進作用。
湖南省地處長江中游,三面環(huán)山,與多個省份交界。全省年日照時長1 500 h 左右,多年平均降水量在1 450 mm,富含各種資源。土壤主要以紅壤和黃壤為主。森林面積1 053 萬hm2,活立木蓄積4.61 億m3,森林覆蓋率49.69%,植物種類十分豐富,有水杉Metasequoia glyptostroboides、銀杉Cathaya argyrophylla、單性木蘭Kmeria septentrionalis、珙桐Davidia involucrata、伯樂樹Bretschneidera sinensis等國家重點保護植物。
數(shù)據(jù)來源于湖南省常德、零陵、衡陽、郴州、益陽等五個地區(qū)所設(shè)置的512 塊杉木人工林臨時樣地。樣地大小為20 m×20 m,對于胸徑不小于5 cm 的林木進行每木檢尺。樣地調(diào)查內(nèi)容包括如樹高、胸徑等基本測樹因子和海拔、坡位、坡向、坡形、土壤類型、土層厚度、土壤松緊度等立地因子。對每一塊樣地的數(shù)據(jù)進行預(yù)處理,求得每個樣地的株數(shù)密度及樣地內(nèi)林木的平均胸徑、林分平均高,找出每個樣地平均標(biāo)準(zhǔn)木,通過生長錐鉆取標(biāo)準(zhǔn)木,得到林分的平均年齡(Age),每塊樣地選取3~5 株最高優(yōu)勢木,求得林分優(yōu)勢木平均高(HT)。將所調(diào)查的512 塊杉木人工林樣地數(shù)據(jù)按照4∶1 的比例分為建模數(shù)據(jù)和檢驗數(shù)據(jù),分別用于檢驗和建立平均高-優(yōu)勢木平均高模型。將各樣地林分平均高、林分優(yōu)勢木平均高以及調(diào)查因子數(shù)據(jù)匯總列表。
2.2.1 林分調(diào)查因子分級方法
為了更方便劃分立地類型和構(gòu)建模型,將海拔、坡形、坡向、坡位、坡度、土壤厚度、土壤類型和土壤松緊度等立地因子和株數(shù)密度、林分年齡進行分級處理,以《中國森林立地》[24]為標(biāo)準(zhǔn),具體標(biāo)準(zhǔn)如下:
表2 調(diào)查因子等級劃分Table 2 The division of investigation factors
2.2.2 顯著性因子篩選
數(shù)量化方法Ⅰ是指在自變量中同時包含定量化因子和定性因子的“回歸”模型。表達式如下:
由于立地因子和測樹因子對林分平均高與林分優(yōu)勢木平均高的影響程度不同,故本研究將林分優(yōu)勢木平均高和林分平均高之比定義為高比值,以高比值為因變量,運用ForStat 統(tǒng)計之林軟件進行數(shù)量化方法Ⅰ分析,篩選出對高比值影響顯著的因子。
2.2.3 立地類型的劃分
為了簡化線性混合效應(yīng)模型的構(gòu)建及進一步提高模型的模擬精度,通過使用Forstat 篩選所得到的顯著性因子為對象,根據(jù)《中國森林立地》可得到顯著性因子等級值(每個等級值代表一個水平值),最后通過對顯著性因子的等級值進行組合劃分,得到立地類型(Site type,簡稱ST)。
2.2.4 基礎(chǔ)模型的確定
目前已有較多研究顯示林分優(yōu)勢木平均高和林分平均高之間存在顯著的線性關(guān)系[7-9]。根據(jù)調(diào)查數(shù)據(jù)繪制的平均高-優(yōu)勢木平均高關(guān)系散點圖見圖1。由圖1可以看出兩者之間呈線性分布,綜合以上,故采用固定線性模型作為本次研究的基礎(chǔ)模型。該基礎(chǔ)模型表達式如下:
圖1 利用建模數(shù)據(jù)(A)和檢驗數(shù)據(jù)(B)得到的優(yōu)勢木平均高-平均高關(guān)系Fig.1 The HT-HD plot of calibration (A) and validation (B) subsets
其中,HTi為第i塊樣地林分優(yōu)勢木平均高,作為模型的因變量,HDi為第i塊樣地林分平均高,作為模型的自變量;a和b為該基礎(chǔ)模型的待估參數(shù),e是誤差項。
2.2.5 線性混合模型
根據(jù)隨機效應(yīng)因子的數(shù)量,線性混合效應(yīng)模型(LME)分為兩種基本形式:單水平和多水平。本研究即是基于單水平線性模型即僅包含一個隨機效應(yīng)因子來構(gòu)建平均高-優(yōu)勢木平均高關(guān)系模型,其一般表達式為[25]:
式中:y是觀察值向量,β是固定效應(yīng)參數(shù)向量,α是隨機效應(yīng)參數(shù)向量,矩陣X和Z是設(shè)計矩陣,分別對應(yīng)著固定效應(yīng)和隨機效應(yīng),ε是誤差向量。
在構(gòu)建線性混合模型時,首先要進行混合效應(yīng)因子的選取:將篩選出的影響顯著的立地因子進行分級組合,構(gòu)成立地類型(ST);再將立地類型(ST)通過k-means 聚類成立地類型組(STG);然后將立地類型(ST)、立地類型組(STG)與其他影響顯著的因子分別作為固定效應(yīng)或隨機效應(yīng)加入到基礎(chǔ)模型中,構(gòu)建混合效應(yīng)模型。
2.2.6 模型評價與檢驗
為了準(zhǔn)確評價模型的擬合效果,本研究利用赤池信息準(zhǔn)則(AIC)、貝葉斯信息準(zhǔn)則(BIC)、平均絕對誤差(MAE)、確定系數(shù)(R2)、均方根誤差(RMSE)對模型進行檢驗與評價。
式中:yi為第i個樣本實測值,為第i個樣本估計值,為平均實測值,n為樣本數(shù),k為模型參數(shù)個數(shù),L表示模型極大似然函數(shù)值。其中:AIC和BIC 的值越小,則表示模型的擬合效果越好,MAE 和RMSE 的值越接近0,R2的值越接近1,則表示模型的精度越高[26]。
基于建模數(shù)據(jù),利用R 軟件對基礎(chǔ)模型(2)進行擬合,其擬合結(jié)果見表3:
由表3可知基礎(chǔ)模型具體形式為:
表3 基礎(chǔ)模型擬合結(jié)果Table 3 Fitting results of basic model of average breast diameters
由數(shù)量化方法Ⅰ篩選對高比值(林分優(yōu)勢木平均高和林分平均高之比)影響顯著的因子。以高比值為因變量,以測樹因子和立地因子為自變量,對影響高比值的因子進行篩選。顯著性分析結(jié)果見表4。根據(jù)方差分析表中的“P>F”值,對立地因子進行篩選,當(dāng)“P>F”的值大于0.05即可認為該因子對高比值影響不顯著,否則影響顯著,從而確認主要影響因子。
表4 調(diào)查因子的顯著性檢驗?Table 4 Significance test of investigation factors
由表可知坡位(SP)、坡形(SS)、土壤類型(TL)、土壤厚度(TH)、林分密度(N)和土壤松緊度(SC)對高比值的影響顯著。其中影響顯著的立地因子通過組合可將512 個樣本劃分為322 個立地類型(ST)。
3.3.1 添加立地類型作為隨機效應(yīng)
考慮不同立地條件下,林分樹高生長可能存在差異,平均高和優(yōu)勢木平均高相關(guān)關(guān)系也可能存在差異?;诨A(chǔ)平均高-優(yōu)勢木平均高模型(2),對模型參數(shù)a、b的不同組合位置引入立地類型(ST)作為隨機效應(yīng);引入之后對模型進行擬合,并將結(jié)果匯總于表5、6。
根據(jù)表5、6 中的評價指標(biāo)可以得知,將隨機效應(yīng)立地類型(ST)加入到基礎(chǔ)模型中后,模型的精度有所提高,赤池信息量(AIC)、貝葉斯信息量(BIC)都有所減小。將隨機效應(yīng)放在參數(shù)b上時,確定系數(shù)R2由0.790 1 提高到0.914 3,精度提高了15.72%,平均絕對誤差(MAE)和均方根誤差(RMSE)均有下降,其中MAE 由0.8347下降到0.544 0,降低了34.82%,RMSE 由1.062 1下降到0.685 9,降低了35.41%;將隨機效應(yīng)同時放到參數(shù)a和b上時,R2由0.7901 提高到0.836 7,精度提高了5.89%,MAE 和RMSE 均有下降,其中MAE 由0.834 7 下降到0.745 4,降低了10.69%,RMSE 由1.062 1 下降到0.938 4,降低了11.64%,這說明基于立地類型(ST)的混合效應(yīng)模型明顯優(yōu)于基礎(chǔ)模型。因此確定的模型形式如下:
表5 基于立地類型的線性混合效應(yīng)模型參數(shù)估計?Table 5 Parameter estimation of the linear mixed effect model based on site type
式中:HTi為第i個立地類型(ST)的林分優(yōu)勢木平均高,HDi為第i個立地類型(ST)的林分平均高,bi為立地類型(ST)效應(yīng)的隨機效應(yīng)參數(shù),且bi~N(0,Ψ1),Ψ1為立地類型(ST)隨機效應(yīng)參數(shù)的設(shè)計矩陣;εi為第i個立地類型(ST)的誤差項。
表6 混合模型的評價與檢驗統(tǒng)計Table 6 Statistics of fitting and validation for the mixed model
3.3.2 添加立地類型組作為隨機效應(yīng)
1)立地類型組合聚類
立地類型(ST)過多則不便于混合模型的實際應(yīng)用,為了簡化立地類型(ST)組合數(shù),將混合模型(10)擬合的隨機效應(yīng)參數(shù)值利用R 軟件進行k-means 聚類。聚類精度的標(biāo)準(zhǔn)是確定系數(shù)≥0.99,及聚類后的因子信息要包含合并前的因子信息的99%。將隨機效應(yīng)得分值相近的立地類型(ST)合并成立立地類型組(STG)。結(jié)果見表7。
由表7可知,當(dāng)聚為14 類時,聚類精度達到99.0%,達到聚類精度標(biāo)準(zhǔn)。
表7 立地類型聚類結(jié)果Table 7 The clustering results of site types
2)基于立地類型組(STG)的線性混合效應(yīng)模型擬合
根據(jù)表8、9 的結(jié)果可知:基于立地類型組(STG)的線性混合效應(yīng)模型的AIC、BIC 相對基礎(chǔ)模型及基于立地類型(ST)的線性混合效應(yīng)模型均有所降低,R2大幅提高。其中,立地類型組(STG)作為隨機效應(yīng)加在參數(shù)b上面的混合效應(yīng)模型R2最高,相對于立地類型(ST)作為隨機效應(yīng)加在參數(shù)b上面的混合效應(yīng)模型(10),R2由0.914 3 提高到0.943 5,精度提升了3.19%,MAE 和RMSE 均有所下降,其中MAE 由0.544 0下降到0.384 9,降低了29.25%,RMSE 由0.685 9下降到0.551 1,降低了19.67%;相對于基礎(chǔ)線性模型(2),確定系數(shù)R2由0.790 1 提高到0.943 5,精度提升了19.41%,MAE 和RMSE 均有所下降,其中MAE 由0.834 7 下降到0.384 9,降低了53.89%,RMSE 由1.062 0 下降到0.551 1,降低了48.11%。由此可以看出立地類型組合聚類后,一方面簡化了模型的應(yīng)用,也提高了模型精度。由此確定的模型形式如下:
表8 基于立地類型組合的線性混合效應(yīng)模型參數(shù)估計Table 8 Parameter estimation of the linear mixed effect model based on site type combination
式中:HTj為第j個立地類型組合(STG)的林分優(yōu)勢木平均高,HDj為第j個立地類型組合(STG)的林分平均高,bj為立地類型組合(STG)效應(yīng)的隨機效應(yīng)參數(shù),且bj~N(0,Ψ1),Ψ1為立地類型組合(STG)隨機效應(yīng)參數(shù)的設(shè)計矩陣;εj為第j個立地類型組合(STG)的誤差項。
表9 混合模型的評價與檢驗統(tǒng)計Table 9 Statistics of fitting and validation for the mixed model
3.3.3 添加林分密度和林分年齡作為固定效應(yīng)
將立地類型組(STG)作為隨機效應(yīng)添加到模型中使模型精度顯著提升,為了探究密度效應(yīng)以及能否進一步提升模型精度,在模型(11)的基礎(chǔ)上添加林分密度(N)作為固定效應(yīng),為了探究不同年齡的林分中兩者的相關(guān)關(guān)系是否存在差異,我們也將林分年齡(a)作為固定效應(yīng)加到模型上。考慮固定效應(yīng)間的交互作用,共有6 種模型形式,結(jié)果見表10。
表1 林分調(diào)查因子統(tǒng)計Table 1 Statistics of the stand investigation factors
根據(jù)表10結(jié)果可以看出,在混合效應(yīng)模型(11)基礎(chǔ)上添加了固定效應(yīng)后,模型的R2僅有微小的提高,其中,同時考慮了林分密度(N)、林分年齡(a)及固定效應(yīng)間交互作用的模型R2(0.944 7)最高,相對于模型(11)R2由0.943 5 提高到0.944 7,精度提升了0.13%,MAE 和RMSE 無明顯變化,AIC、BIC 均有變高,說明含固定效應(yīng)的混合效應(yīng)模型相對于只含隨機效應(yīng)的模型(11)精度并無明顯提升,也說明株數(shù)密度和林分年齡對林分平均高和優(yōu)勢木平均高的相關(guān)關(guān)系無明顯影響。為了簡化模型和實際應(yīng)用考慮,選擇模型(11)為最優(yōu)模型。
表10 含固定效應(yīng)的模型評價指標(biāo)?Table 10 Model evaluation indexes with the fixed effect
為了更加直觀地觀察基礎(chǔ)模型與混合模型的擬合效果,以建模數(shù)據(jù)和檢驗數(shù)據(jù)分別建立優(yōu)勢木平均高殘差分布圖以及林分優(yōu)勢木平均高預(yù)測值與實測值的相關(guān)關(guān)系圖,如圖2~3 所示。
圖2 基于建模數(shù)據(jù)的基礎(chǔ)模型與混合效應(yīng)模型實測值與預(yù)測值的相關(guān)關(guān)系及殘差比較Fig.2 Correlation and residual comparison between the measured and predicted values of the basic model and the mixed effect model based on the modeling data
圖3 基于檢驗數(shù)據(jù)的基礎(chǔ)模型與混合效應(yīng)模型實測值與預(yù)測值的相關(guān)關(guān)系及殘差比較Fig.3 Correlation and residual comparison between the measured and predicted values of the basic model and the mixed effect model based on the test data
由圖2~3 可知,相對于基礎(chǔ)模型,混合模型的優(yōu)勢木平均高預(yù)測值及實測值離散程度更小,且混合模型的殘差更加集中地分布在X 軸兩側(cè)。
綜上所述:基于立地類型組隨機效應(yīng)的模型可以極大地提高模型精度,同時利用K-means 聚類劃分立地類型組(STG)的方法,可以進一步提高模型模擬精度且解決了復(fù)雜立地條件下的模型使用問題。
4.1.1 立地條件、林分密度和林分年齡對林分平均高和優(yōu)勢木平均高相關(guān)關(guān)系的影響
立地條件、林分年齡和林分密度是影響杉木生長發(fā)育的重要因子,在同一樹種的前提下,林分平均高和優(yōu)勢木平均高生長模型的預(yù)測結(jié)果隨立地條件、林分密度和林分年齡的不同而出現(xiàn)了明顯的差異性[10-12],因此林分平均高和優(yōu)勢木平均高相關(guān)關(guān)系也可能不同。
本研究以高比值作為因變量,利用數(shù)量化方法I 對可能影響高比值的因子進行篩選。研究結(jié)果表明,坡位(SP)、坡形(SS)、土壤類型(TL)、土壤厚度(TH)、土壤松緊度(SC)和林分密度(N)對高比值有著顯著的影響。這與王忠誠等的研究結(jié)果部分一致,都認為立地因子會對高比值產(chǎn)生顯著影響,合理考慮立地因子可以提高模型精度[6]。但以往的研究未能考慮到林分密度和林分年齡對林分平均高和優(yōu)勢木平均高相關(guān)關(guān)系的影響,本研究嘗試性地以林分密度(N)和林分年齡(a)為固定效應(yīng)、以立地類型組(STG)為隨機效應(yīng)構(gòu)建線性混合模型,通過AIC、BIC、MAE和RMSE 等檢驗指標(biāo)可知含林分密度(N)和林分年齡(a)的混合模型相對于只含立地類型組(STG)的混合模型精度并無明顯提高,這也說明在不同密度、不同年齡的杉木林分中,林分平均高和優(yōu)勢木平均高相關(guān)關(guān)系是相對穩(wěn)定的,林分密度(N)和林分年齡(a)對林分平均高和優(yōu)勢木平均高相關(guān)關(guān)系無顯著影響。
由于本研究只采用了湖南省內(nèi)的杉木樣地數(shù)據(jù),所以模型的適用范圍有限。后續(xù)研究中,希望通過增加樣本量來提高說服力。另外本研究只考慮了立地類型、林分年齡和競爭對高比值的影響,林分的高生長可能還受其他因素的影響,如氣候因子、土壤因子、林分空間結(jié)構(gòu)、林分類型等。所以,還可以進一步探討其他因素的影響,進一步優(yōu)化模型。
4.1.2 線性混合模型對構(gòu)建林分平均高和優(yōu)勢木平均高相關(guān)關(guān)系模型的影響
構(gòu)建線性混合效應(yīng)模型可以有效地解決傳統(tǒng)的建模方法無法反映不同水平或林分因子對樹木生長的隨機影響的問題[27]。在確定基礎(chǔ)模型之后,構(gòu)建線性混合模型,期望能得到湖南省杉木林分平均高和優(yōu)勢木平均高的相關(guān)關(guān)系。通過比較其AIC、BIC、R2、MAE 和RMSE 等評價指標(biāo),AIC、BIC、MAE 和RMSE 值越小、R2值越大,則模型擬合效果越好[27]。研究結(jié)果表明:基于立地類型組(STG)的線性混合模型(11)相對于基礎(chǔ)模型(2),R2大幅提高,AIC、BIC、MAE 和RMSE 等均有明顯降低,這說明基于立地效應(yīng)的線性混合模型明顯優(yōu)于基礎(chǔ)模型。線性混合模型不僅能反映總體優(yōu)勢木平均高估計,也可以通過方差協(xié)方差結(jié)構(gòu)校正隨機效應(yīng)參數(shù),以此來反映樣地立地條件之間的差異,所建立的混合模型能對優(yōu)勢木平均高數(shù)據(jù)進行更準(zhǔn)確的估計。
4.1.3 k-means 聚類對構(gòu)建林分平均高和優(yōu)勢木平均高相關(guān)關(guān)系模型生長模型的影響
本研究結(jié)果表明,依據(jù)立地類型這一主導(dǎo)因子,可將湖南杉木人工林劃分為14 個立地類型組合,由于初始立地類型組合類型數(shù)過多,不利于混合模型的有效應(yīng)用。為了簡化,本文將初始立地類型(ST)應(yīng)用到模型(10)擬合的隨機效應(yīng)參數(shù)值進行k-means 聚類。以聚類精度≥99%為標(biāo)準(zhǔn),將322 個立地類型(ST)聚成14 個立地類型組(STG)。構(gòu)建基于聚類的線性混合效應(yīng)模型,利用AIC、BIC、R2、MAE 和RMSE 等5 個評價指標(biāo)進行模型評價,并與基礎(chǔ)模型、初始立地類型擬合結(jié)果進行比較分析。結(jié)果表明,聚類后的線性混合效應(yīng)模型精度明顯提升。充分說明構(gòu)建基于聚類的線性混合效應(yīng)模型可以提高線性混合效應(yīng)模型的實用性。
本研究采用數(shù)量化方法Ⅰ、線性混合效應(yīng)模型、k-means 聚類等方法首次構(gòu)建含立地效應(yīng)的湖南杉木人工林林分優(yōu)勢木平均高-林分平均高模型。得出如下結(jié)論:1)坡位(SP)、坡形(SS)、土壤類型(TL)、土壤厚度(TH)和土壤松緊度(SC)是影響高比值(林分平均高與優(yōu)勢高均高之比)的顯著性因子。2)構(gòu)建混合效應(yīng)模型可以顯著提高建模精度,其確定系數(shù)(R2)從0.790 158 提高0.914 348。3)構(gòu)建基于聚類的線性混合效應(yīng)模型可以進一步提高建模精度,其確定系數(shù)(R2)從0.914 348 提高到0.943 512 8。4)添加林分密度(N)和林分年齡(a)作為固定效應(yīng)對模型精度提升不明顯。本研究首次提出了含立地效應(yīng)的林分平均高和優(yōu)勢木平均高混合模型,從模型的角度客觀地解釋了立地條件對杉木人工林平均高和優(yōu)勢木平均高相關(guān)關(guān)系的影響規(guī)律,為湖南杉木人工林的可持續(xù)經(jīng)營與立地質(zhì)量評價提供了理論支撐。