侯志康 曾松偉 莫路鋒 周宇峰
(1.浙江農(nóng)林大學(xué)信息工程學(xué)院 杭州 311300; 2.浙江農(nóng)林大學(xué)環(huán)境與資源學(xué)院 杭州 311300)
全球森林覆蓋率為32%,森林碳儲(chǔ)量占全球陸地生態(tài)系統(tǒng)碳總量的77%。森林生態(tài)系統(tǒng)通過同化作用吸收CO2,再以生物量的形式將CO2固定在植被和土壤中,使其成為陸地上最重要的碳匯或碳庫(Attrietal., 2018; 劉平奇等, 2020; 王興昌等, 2015)。森林生態(tài)系統(tǒng)通過物理化學(xué)的反應(yīng)過程與大氣進(jìn)行物質(zhì)和能量交換,進(jìn)而對全球氣候變化產(chǎn)生影響,開展森林碳循環(huán)監(jiān)測研究有助于評價(jià)未來氣候變化趨勢(Leeetal., 2018; Sasaietal., 2007)。森林碳通量觀測研究已成為當(dāng)前研究熱點(diǎn)(劉敏等, 2014; 李國棟等, 2013; 陳曉峰等, 2016)。
目前,森林碳通量的觀測方法主要包括微氣象學(xué)法、土壤碳儲(chǔ)量清單調(diào)查、衛(wèi)星遙感、大氣CO2濃度反演和建立生態(tài)系統(tǒng)模型等(于貴瑞等, 2014; 韋志剛等, 2016; Wilsonetal., 2001)。微氣象學(xué)的代表方法是渦度相關(guān)法,渦度相關(guān)技術(shù)也是唯一能直接測定生態(tài)系統(tǒng)與大氣間物質(zhì)能量交換的標(biāo)準(zhǔn)方法,已成為國際碳通量觀測(網(wǎng)絡(luò))的主流技術(shù)(張鑫等, 2011)。Ishtiaq 等(2015)通過研究美國落葉林冠層CO2通量與氣候環(huán)境變量的相關(guān)性后,提出利用環(huán)境因素建立碳通量的數(shù)據(jù)模型,該模型省去了傳統(tǒng)搭建生態(tài)系統(tǒng)模型反演碳通量的復(fù)雜過程; 王海波等(2014)通過氣象觀測系統(tǒng)研究青藏高原草甸生態(tài)系統(tǒng)的碳通量變化特征及其影響因素,認(rèn)為CO2的濃度與氣象因素具有相關(guān)性。搭建環(huán)境數(shù)據(jù)反演碳通量模型是目前最簡便、高效的碳通量研究方法,無需考慮生物量對試驗(yàn)結(jié)果的影響,僅關(guān)注于環(huán)境數(shù)據(jù)與反演結(jié)果之間的相關(guān)性。因此,結(jié)合氣象因子和人工神經(jīng)網(wǎng)絡(luò)對碳通量進(jìn)行反演是可行的。王怡鷗等(2016)利用三元回聲狀態(tài)網(wǎng)絡(luò)算法對區(qū)域CO2濃度進(jìn)行預(yù)測,提高了預(yù)測結(jié)果的精度,但其弊端在于模擬計(jì)算耗時(shí)較長; 汪雪等(2017)通過貝葉斯改進(jìn)人工神經(jīng)網(wǎng)絡(luò)對竹林碳通量進(jìn)行估算,取得了較好效果。神經(jīng)網(wǎng)絡(luò)的初始權(quán)值是隨機(jī)分配,因此收斂性能存在不穩(wěn)定性,并且模型的參數(shù)選擇也會(huì)對反演結(jié)果產(chǎn)生影響(姚仲敏等, 2015; 張宏等, 2014; 王新普等, 2016)。本研究將相關(guān)氣象因子作為輸入,引入遺傳分類神經(jīng)網(wǎng)絡(luò)(GA-BP)和參數(shù)試湊法對CO2濃度反演進(jìn)行建模,以克服上述缺點(diǎn)。
本研究以浙江省杭州市臨安區(qū)太湖源鎮(zhèn)雷竹(Phyllostachyspraecox)林作為研究對象,研發(fā)基于嵌入式的竹林氣象因子實(shí)時(shí)采集系統(tǒng),并分析竹林CO2濃度與溫濕度等氣象因子之間的關(guān)系,探討基于GA-BP神經(jīng)網(wǎng)絡(luò)的雷竹林CO2濃度反演模型(簡稱GA-BP模型),以期為竹林碳儲(chǔ)量、竹林增匯、竹林固碳能力等研究提供基礎(chǔ)數(shù)據(jù)。
研究區(qū)位于浙江省杭州市臨安區(qū)太湖源鎮(zhèn)(119°34′104″E,30°18′169″N)國家級(jí)自然保護(hù)區(qū)天目山東麓,其地形為中低山丘陵。氣候類型屬亞熱帶季風(fēng)氣候: 全年溫暖濕潤,雨熱同期,氣候溫和,雨量充沛。春季以陰雨天為主,夏季濕熱伴有梅雨期,秋季干爽,冬季干冷。全年降水量1 600 mm,年蒸散量800~850 mm,年均空氣相對濕度在80%以上,年均氣溫16 ℃,全年日照時(shí)長1 900 h。研究區(qū)土壤以紅壤為主,海拔185 m,坡度為東西方向2.5°、南北方向12.5°。
雷竹林群落高7~11 m,胸徑4~6 cm,以2、3年生竹為主,總覆蓋度達(dá)80%,立竹密度為22 500株·hm2,竹林林冠郁閉度>0.7,林下灌木草本少,有竹葉及竹筍保溫材料覆蓋,竹林地勢平坦。
采用渦度相關(guān)技術(shù)可直接測得生態(tài)系統(tǒng)的環(huán)境變量,有助于定量理解水、熱和CO2在生態(tài)系統(tǒng)中的交換過程,可更深層地理解氣候變化與生態(tài)系統(tǒng)之間的相互影響(劉晨峰等, 2009)。本研究基于渦度相關(guān)法設(shè)計(jì)了一套基于嵌入式的森林碳通量數(shù)據(jù)遠(yuǎn)程實(shí)時(shí)監(jiān)測系統(tǒng),該系統(tǒng)主要由嵌入式主控模塊、CO2傳感器(B530)、三位超聲風(fēng)速儀(Windmater)、大氣溫濕度傳感器(DHT11)、Zigbee通信模塊、GPRS(GTM-900)、數(shù)據(jù)存儲(chǔ)模塊(AT24C02)、太陽能充電模塊等組成。
監(jiān)測點(diǎn)實(shí)時(shí)采集氣象因子數(shù)據(jù),通過Zigbee無線傳輸經(jīng)過無線分組業(yè)務(wù),再通過GPRS模塊將數(shù)據(jù)無線傳輸至后臺(tái)服務(wù)器,服務(wù)器再將數(shù)據(jù)存儲(chǔ)在后臺(tái)數(shù)據(jù)庫,并在Web網(wǎng)頁上實(shí)時(shí)顯示,用戶通過平臺(tái)查詢和下載數(shù)據(jù)。碳通量數(shù)據(jù)監(jiān)測系統(tǒng)框架如圖1所示。系統(tǒng)主要監(jiān)測的數(shù)據(jù)有:CO2濃度、大氣溫濕度、風(fēng)速和風(fēng)向等。
圖1 氣象因子數(shù)據(jù)采集系統(tǒng)框架圖
本研究所用的原始數(shù)據(jù)來自4個(gè)監(jiān)測點(diǎn)(均布施在通量塔周圍,林冠層蓋度>0.7,監(jiān)測點(diǎn)位于近地面1.5 m處,同時(shí)林地品種單一,下墊面覆蓋有凋零的竹葉及竹筍保溫材料,本試驗(yàn)排除光照強(qiáng)度及其他植物種生物量等因素的影響),采集時(shí)間為2019年10—11月(此時(shí)當(dāng)年生新竹已經(jīng)成熟,光合速率和呼吸速率穩(wěn)定)。因電源斷電及儀器短期故障等因素而導(dǎo)致的某個(gè)時(shí)間段內(nèi)丟失的部分氣象數(shù)據(jù),采用高斯模糊插值法恢復(fù)。試驗(yàn)選取每5 min采集的CO2濃度及溫濕度等氣象數(shù)據(jù)平均值作為建模所用的數(shù)據(jù)集。試驗(yàn)數(shù)據(jù)分為4組,每組1 200個(gè)數(shù)據(jù)樣本,其中80%作為訓(xùn)練集, 20%作為測試集。
一般而言,確定某個(gè)事象概念需要訴諸邏輯學(xué)中演繹、歸納等方法。一個(gè)概念的完整界定分為內(nèi)涵和外延。前者是指某個(gè)概念所含括的思維對象的特有屬性總和;后者是指該概念所含括的思維對象的數(shù)量或范圍。二者的關(guān)系為,內(nèi)涵越大越豐富,相應(yīng)的外延則越小,反之亦然。人們在對世界的認(rèn)識(shí)中,將事物、事件或事實(shí)劃分成類和屬,并確定它們之間的包含關(guān)系和排斥關(guān)系。根據(jù)邏輯學(xué)中“類層級(jí)結(jié)構(gòu)”思維:任何事物都是世界事物結(jié)構(gòu)中某一層級(jí)某一類中的一個(gè)單體。人腦在按照內(nèi)涵、外延的“親和性”層級(jí)歸屬進(jìn)行分類建構(gòu)的同時(shí),還要依據(jù)它們之間歷史運(yùn)動(dòng)的關(guān)系。
森林生態(tài)系統(tǒng)碳通量表示生態(tài)系統(tǒng)中單位時(shí)間單位面積上碳增減的數(shù)量(PgC·a-1)。森林生態(tài)系統(tǒng)碳循環(huán)過程由兩部分組成: 光合作用將CO2固定進(jìn)入生態(tài)系統(tǒng);自養(yǎng)呼吸將CO2釋放進(jìn)入大氣。在森林生態(tài)系統(tǒng)中,地面與大氣間的碳通量成分由空氣中的微量成分CO2和痕量成分CO、CH4等組成,在測量的過程中發(fā)現(xiàn)痕量成分CO、CH4等與CO2存在數(shù)量級(jí)上的差距,且大氣中痕量成分的含量是默認(rèn)不變的。因此,本研究以CO2濃度作為碳通量的研究對象,將痕量成分忽略。
影響CO2濃度的環(huán)境因素很多。研究環(huán)境參數(shù)與CO2濃度的相關(guān)性有利于模型參數(shù)的選取分析。本研究首先對CO2濃度與各環(huán)境參數(shù)進(jìn)行了相關(guān)性分析。
本研究將基于傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)和基于GA-BP神經(jīng)網(wǎng)絡(luò)的CO2濃度反演方法進(jìn)行對比分析。GA-BP模型克服了傳統(tǒng)基于BP神經(jīng)網(wǎng)絡(luò)反演CO2濃度模型(簡稱BP模型)的一些不足,其通過種群初始化、計(jì)算適應(yīng)度、選擇、交叉、變異、搜索等操作得到最優(yōu)的初始化權(quán)值和閾值傳遞給BP神經(jīng)網(wǎng)絡(luò),從而糾正神經(jīng)網(wǎng)絡(luò)易陷入局部極小值和網(wǎng)絡(luò)收斂速度慢的缺點(diǎn),同時(shí)可以提高模型的精確度。
GA-BP神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)分為輸入層、隱含層和輸出層。輸入層的節(jié)點(diǎn)數(shù)量取決于輸入?yún)?shù)的種類。隱含層的節(jié)點(diǎn)數(shù)量決定了神經(jīng)網(wǎng)絡(luò)的訓(xùn)練時(shí)間和預(yù)測精度,其節(jié)點(diǎn)數(shù)的選取首先根據(jù)公式(1)~(3)確定范圍,再利用試湊法進(jìn)一步選擇,最后確定最佳的節(jié)點(diǎn)個(gè)數(shù)。
l (1) (2) l=log2n。 (3) 式中:n為輸入層節(jié)點(diǎn)數(shù);l為隱含層節(jié)點(diǎn)數(shù);m為輸出層節(jié)點(diǎn)數(shù); a為0~10之間的常數(shù)。 通過遺傳算法的選擇、交叉和變異操作,在神經(jīng)網(wǎng)絡(luò)的初始權(quán)值和閾值種群中進(jìn)行全局搜索,找到適應(yīng)度最優(yōu)的權(quán)值和閾值傳遞給BP神經(jīng)網(wǎng)絡(luò),最終通過BP神經(jīng)網(wǎng)絡(luò)算法局部尋優(yōu)計(jì)算得到最優(yōu)解。算法流程如下。 1) 種群初始化: 將輸入?yún)?shù)的原始數(shù)據(jù)轉(zhuǎn)換成二進(jìn)制編碼,隨機(jī)組成初始種群。 2) 適應(yīng)度尋優(yōu): 根據(jù)個(gè)體得到BP神經(jīng)網(wǎng)絡(luò)的初始權(quán)值和閾值,傳遞進(jìn)入BP神經(jīng)網(wǎng)絡(luò)進(jìn)行模型訓(xùn)練,按誤差絕對值大小尋找最優(yōu)適應(yīng)度的函數(shù)值。 3) 訓(xùn)練: 經(jīng)過適應(yīng)度尋優(yōu)、選擇、交叉、變異的多次迭代,最終滿足程序終止條件,模型訓(xùn)練完成。 4) 數(shù)據(jù)輸出: 將輸入?yún)?shù)帶入模型,輸出具有最大適應(yīng)度的反演數(shù)據(jù)作為結(jié)果。 建模時(shí),每組試驗(yàn)在相同條件下重復(fù)10次,試驗(yàn)結(jié)果取平均值。另外,由于影響碳通量的各環(huán)境參數(shù)之間的數(shù)值范圍和單位相差很大,這對模型訓(xùn)練和預(yù)測效果會(huì)產(chǎn)生顯著影響。因此,在試驗(yàn)前對數(shù)據(jù)進(jìn)行歸一化處理。 為了驗(yàn)證模型的穩(wěn)定性和精度,本研究采用決定系數(shù)(R2)、平均絕對誤差(mean absolute error,MAE)、均方根誤差(root mean square error,RMSE)、平均百分比誤差(mean absolute percentage error,MAPE)和標(biāo)準(zhǔn)偏差(standard deviation,StdDev)這5個(gè)指標(biāo)對模型進(jìn)行評價(jià)。模型的決定系數(shù)R2越大,MAE、MAPE和RMSE值越小,模型StdDev與實(shí)測值的StdDev越接近,說明模型的反演準(zhǔn)確度越高。相關(guān)公式如下: (4) (5) (6) (7) (8) 所采集的氣象因子中,溫度和濕度對CO2濃度具有明顯的強(qiáng)相關(guān)性,同時(shí)濕度與CO2濃度之間的相關(guān)性略強(qiáng)于溫度與CO2濃度之間的相關(guān)性。溫度、濕度與CO2濃度間的相關(guān)性分析結(jié)果見表1。 溫度與 CO2濃度之間呈負(fù)相關(guān),相關(guān)系數(shù)r為-0.82,決定系數(shù)R2為0.67; 濕度與 CO2濃度之間呈正相關(guān),r為0.83,R2為0.69; 溫度和濕度之間呈強(qiáng)負(fù)相關(guān),r達(dá)到-0.99,R2為0.98。 表1 溫度、濕度和CO2濃度間的相關(guān)性 由圖2可知,BP模型能夠有效反演CO2濃度,BP模型的反演值與實(shí)測值變化趨勢基本相符,但兩者間的某些樣本數(shù)據(jù)存在明顯誤差。相較于前者,基于GA-BP模型的反演結(jié)果與實(shí)測數(shù)據(jù)的誤差明顯減小。 2種反演模型的比較結(jié)果見表2,實(shí)測值的標(biāo)準(zhǔn)偏差為26.99 mg·m-3,BP模型反演結(jié)果的標(biāo)準(zhǔn)偏差是24.71 mg·m-3,而GA-BP模型反演結(jié)果的標(biāo)準(zhǔn)偏差為26.51 mg·m-3,GA-BP模型反演結(jié)果的標(biāo)準(zhǔn)偏差與實(shí)測值的誤差更小。綜上所述,GA-BP模型反演結(jié)果與實(shí)測值的離散程度更接近。 圖2 2種模型反演值與實(shí)測值對比 對BP模型和GA-BP模型的反演結(jié)果進(jìn)行交叉驗(yàn)證,結(jié)果如圖3所示。BP模型的R2為0.79,表明BP模型對CO2濃度的反演結(jié)果可靠,反演結(jié)果能整體上表現(xiàn)出CO2濃度的變化趨勢。但是,其反演結(jié)果與實(shí)測值之間存在較大誤差,BP模型反演結(jié)果的不穩(wěn)定。而GA-BP模型的R2相較于BP模型有顯著提高,R2從0.79上升到0.86,較優(yōu)化前提高了6%。GA-BP模型的擬合效果更好,反演值與實(shí)測值的相關(guān)性更強(qiáng),利用GA-BP模型對CO2濃度反演的結(jié)果更接近實(shí)測結(jié)果。 表2 CO2濃度實(shí)測值及BP模型和GA-BP模型反演結(jié)果 圖3 BP模型和GA-BP模型的交叉驗(yàn)證結(jié)果 BP模型和GA-BP模型反演驗(yàn)證結(jié)果如表3所示: GA-BP模型反演結(jié)果的MAE為8.12 mg·m-3,較BP模型反演結(jié)果的10.91 mg·m-3低2.79 mg·m-3; 前者的MEAP為0.84%,而后者的MAPE為1.17%; 同時(shí),前者將RMSE從14.22 mg·m-3優(yōu)化到10.82 mg·m-3,這表明GA-BP模型的反演值與實(shí)測值之間的偏差范圍小于BP模型,GA-BP模型反演結(jié)果的準(zhǔn)確性更高。通過比較模型的5種評價(jià)指標(biāo)發(fā)現(xiàn),GA-BP模型相較BP模型在CO2濃度反演上具有更優(yōu)的表現(xiàn)。 表3 BP模型和GA-BP模型反演結(jié)果驗(yàn)證 影響CO2濃度反演結(jié)果的因素主要有2個(gè): 一是算法本身導(dǎo)致的誤差,主要是建模時(shí)數(shù)據(jù)采集不完整或模型參數(shù)選擇不當(dāng)產(chǎn)生的誤差(王曉輝等, 2021); 二是相關(guān)氣象因子選擇的遺漏導(dǎo)致的誤差(范德成等, 2021)。本研究提出基于GA-BP的CO2濃度反演模型首先通過GA優(yōu)化得到最優(yōu)的網(wǎng)絡(luò)初始權(quán)值和閾值,再利用試湊法確定最優(yōu)的網(wǎng)絡(luò)節(jié)點(diǎn)數(shù),有效提高了反演模型的精度,減少了誤差。在控制樣本選擇誤差方面,與王楷等(2014)利用草原環(huán)境因子對碳含量進(jìn)行預(yù)測相比,本研究選取10—11月份的成熟雷竹林作為研究對象,充分利用了竹林生態(tài)環(huán)境的穩(wěn)定性,滿足GA-BP模型需要穩(wěn)定可靠的氣象因子作為輸入的建模條件,減少了可能存在的選擇誤差。本試驗(yàn)結(jié)果表明,實(shí)測值與反演值的百分比誤差為0.84%,說明GA-BP模型的CO2濃度反演效果優(yōu)良。 本研究提出GA-BP神經(jīng)網(wǎng)絡(luò)反演算法不僅適用于CO2濃度的反演,根據(jù)其模型特點(diǎn)也可以推廣至生態(tài)環(huán)境監(jiān)測領(lǐng)域其他環(huán)境參數(shù)的反演,這既可以簡化系統(tǒng)也可以降低相關(guān)監(jiān)測系統(tǒng)的硬件成本。但本研究依然存在一些局限性,如受到試驗(yàn)環(huán)境、儀器精度和時(shí)間等限制,也未考慮到其他碳匯相關(guān)因子的影響,在后續(xù)研究中,還需考慮時(shí)空、研究區(qū)內(nèi)灌木和草本的生物量等因素的影響。 利用竹林氣象因子采集系統(tǒng)可獲取相關(guān)氣象數(shù)據(jù);基于CO2濃度與溫濕度等氣象因子之間的相關(guān)性,本研究提出的基于GA-BP神經(jīng)網(wǎng)絡(luò)的CO2濃度反演模型能夠有效反演該研究區(qū)的CO2濃度。2.4 模型評價(jià)指標(biāo)
3 結(jié)果與分析
3.1 環(huán)境因子與CO2濃度相關(guān)性分析
3.2 GA-BP反演結(jié)果分析
3.3 模型評價(jià)分析
4 討論
5 結(jié)論