陳文燦 張偉東 申屠惠良 鄭春茂(國(guó)家林業(yè)局華東林業(yè)調(diào)查規(guī)劃設(shè)計(jì)院 浙江杭州 310019)
摘要:采集生物量建模數(shù)據(jù)過(guò)程中,因季節(jié)、天氣變化、立地條件,以及外業(yè)調(diào)查人員對(duì)數(shù)據(jù)采集過(guò)程的把握,諸多因素均會(huì)對(duì)采集到的數(shù)據(jù)產(chǎn)生影響,導(dǎo)致部分?jǐn)?shù)據(jù)異常。異常數(shù)據(jù)稱為擾動(dòng)數(shù)據(jù),若參與建模,會(huì)引起建模結(jié)果的異常,應(yīng)該剔除。從殘差分析的角度,對(duì)如何從眾多數(shù)據(jù)中過(guò)濾出擾動(dòng)數(shù)據(jù)提出了解決方案。關(guān)鍵詞:擾動(dòng)數(shù)據(jù);殘差分析;三倍標(biāo)準(zhǔn)差中圖分類號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼: B 文章編號(hào):1004-7743(2012)01-0061-04
生物量建模過(guò)程中剔除擾動(dòng)數(shù)據(jù)方法探討
陳文燦 張偉東 申屠惠良 鄭春茂
(國(guó)家林業(yè)局華東林業(yè)調(diào)查規(guī)劃設(shè)計(jì)院 浙江杭州 310019)
摘要:采集生物量建模數(shù)據(jù)過(guò)程中,因季節(jié)、天氣變化、立地條件,以及外業(yè)調(diào)查人員對(duì)數(shù)據(jù)采集過(guò)程的把握,諸多因素均會(huì)對(duì)采集到的數(shù)據(jù)產(chǎn)生影響,導(dǎo)致部分?jǐn)?shù)據(jù)異常。異常數(shù)據(jù)稱為擾動(dòng)數(shù)據(jù),若參與建模,會(huì)引起建模結(jié)果的異常,應(yīng)該剔除。從殘差分析的角度,對(duì)如何從眾多數(shù)據(jù)中過(guò)濾出擾動(dòng)數(shù)據(jù)提出了解決方案。
關(guān)鍵詞:擾動(dòng)數(shù)據(jù);殘差分析;三倍標(biāo)準(zhǔn)差
中圖分類號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼: B 文章編號(hào):1004-7743(2012)01-0061-04
生物量建模數(shù)據(jù)的準(zhǔn)備分為外業(yè)數(shù)據(jù)采集和內(nèi)業(yè)數(shù)據(jù)處理兩個(gè)階段。外業(yè)數(shù)據(jù)采集階段,按樹根、樹干、樹枝、樹葉四個(gè)部位,采集樣木的鮮重?cái)?shù)據(jù),以及樣木各部位樣品的鮮重?cái)?shù)據(jù)。內(nèi)業(yè)數(shù)據(jù)處理階段,主要是測(cè)定樣木各部位樣品干重與含水率,根據(jù)樣木鮮重、樣品鮮重與樣品干重,計(jì)算樣木整體干重,即生物量。
此處,樣木指調(diào)查主體;樣品指樣木的一部分,用來(lái)測(cè)定生物量。生物量的具體計(jì)算過(guò)程如下:
其中M為樣木總體生物量;iW為樣木各部位鮮重;iw為樣木各部位樣品鮮重;iz為樣木各部位樣品干重。
經(jīng)過(guò)外業(yè)調(diào)查和內(nèi)業(yè)數(shù)據(jù)處理,獲得某個(gè)樹種的生物量總體建模數(shù)據(jù),實(shí)際樣木數(shù)量51株,各樣本平均值、最大值、最小值的特征數(shù)據(jù)見(jiàn)表1。
選擇生物量模型形式:M =a(D2H)bV,其中a、b為模型參常數(shù);D 為樣木胸徑;H為樣木樹高;V為樣木材積。
表1 生物量建模樣木特征數(shù)據(jù)
2.1 建立回歸方程
使用普通最小二乘法(OLS),對(duì)生物量建模樣木數(shù)據(jù)進(jìn)行多元非線性回歸計(jì)算,獲得模型的參數(shù)a、b,由此建立回歸方程,根據(jù)此回歸方程,計(jì)算模型估計(jì)值。
2.2 殘差分析
生物量建模數(shù)據(jù)中,樣木實(shí)測(cè)生物量稱為觀察值,根據(jù)回歸模型計(jì)算的生物量稱為估計(jì)值,觀察值和估計(jì)值之差,稱為殘差。為了消除負(fù)數(shù)對(duì)分析過(guò)程的影響,將殘差的平方作為統(tǒng)計(jì)量。
殘差平方的方差:
其中:n為樣木總數(shù)。
2.3 擾動(dòng)數(shù)據(jù)剔除依據(jù)
根據(jù)《國(guó)家森林資源連續(xù)清查技術(shù)規(guī)定》,正常樣木的估計(jì)區(qū)間為。在生物量建模過(guò)程中,可以引用此標(biāo)準(zhǔn),其中為殘差平方的平均數(shù),若殘差的平方超過(guò)樣本估計(jì)區(qū)間范圍的樣木,即為擾動(dòng)數(shù)據(jù),不能參與回歸方程的計(jì)算。
以上述生物量調(diào)查數(shù)據(jù)為例,使用普通最小二乘法(OLS)對(duì)生物量樣木數(shù)據(jù)進(jìn)行多元非線性回歸計(jì)算,結(jié)果見(jiàn)表2。
表2 生物量建模結(jié)果
按此分析方法,確定的異常樣木雖然只有1株,剔除這株樣木以后,可以看出,模型參數(shù)趨向穩(wěn)定,確定系數(shù)從0.9586到0.9697,有明顯的提高;復(fù)相關(guān)系數(shù)從98.50到98.86,也有所改善;因樣木建模數(shù)據(jù)本身的復(fù)相關(guān)系數(shù)較高,所以預(yù)估精度沒(méi)有變化。由附表二可以看出,按此方法,對(duì)建模數(shù)據(jù)進(jìn)行分析,剔除擾動(dòng)數(shù)據(jù)后,明顯提高了模型的質(zhì)量。
[1] 國(guó)家林業(yè)局.國(guó)家森林資源連續(xù)清查技術(shù)規(guī)定. 2004.
[2] 張會(huì)儒,唐守正,胥輝. 關(guān)于生物量模型中異方差問(wèn)題. 林業(yè)資源管理,1999,01.
2012-01-21