梁小林,秦 歡,陳敏茹,許 奇,梁 曌
(長沙理工大學(xué) 數(shù)學(xué)與統(tǒng)計學(xué)院,湖南 長沙 410114)
大量研究表明氣候變暖的主要原因是全球溫室氣體的排放,尤其是二氧化碳氣體的排放,積極采取應(yīng)對措施全面控制和減少二氧化碳氣體排放迫在眉睫.改革開放以來,中國經(jīng)濟快速發(fā)展,中國成為世界第一大碳排放國,其碳排放的未來發(fā)展趨勢也成為世界關(guān)注的焦點.在第21屆聯(lián)合國氣候變化會議協(xié)議中,中國提交的國家自主貢獻目標(biāo)為:到2030 年單位 GDP 的二氧化碳排放量比 2005 年下降 60%~65%.為了實現(xiàn)這一目標(biāo),需要對未來碳排放走勢進行分析與預(yù)測,并在此基礎(chǔ)上,制定合理減排措施.
目前,有關(guān)碳排放研究的相關(guān)文獻大致可分為兩部分,一部分是基于碳排量的研究,另一部分是基于碳排放強度的研究.在碳排放量方面,朱勤等[1]基于改進的Kaya恒等式建立因素分解模型,應(yīng)用LMDI分解方法分析中國1980-2007年的能源消費碳排放,其研究結(jié)果為國家產(chǎn)業(yè)結(jié)構(gòu)調(diào)整提供了理論依據(jù);Wei[2]采用投入產(chǎn)出分析法,計算了北京工業(yè)能源相關(guān)的 CO2排放量,并且從技術(shù)、部門關(guān)聯(lián)、經(jīng)濟結(jié)構(gòu)和經(jīng)濟規(guī)模等方面對驅(qū)動因素進行了結(jié)構(gòu)分解分析(SDA);宋杰鯤[3]使用偏最小二乘回歸方法選取多項因素建立中國碳排放預(yù)測的STIRPAT模型,分析各個因素對碳排放的解釋作用,明確了碳減排應(yīng)為重點關(guān)注的因素.Sun 和 Xu[4]提出了基于改進粒子群算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)模型,對1978-2012年中國河北省的二氧化碳排放及其影響因素進行了實證分析, 通過與其他兩種方法的結(jié)果比較證明該模型的擬合和預(yù)測精度較高.梁一鳴等[5]利用STIRPAT模型分析中部六省 2000-2012 年碳排放量及其影響因素之間的關(guān)系,并且運用灰色 GM(1,1)模型,預(yù)測中部六省 2015 年、2020 年碳排放量.從上述文獻可以看出對于碳排放的研究大多是基于碳排放影響因素分析,并且側(cè)重于應(yīng)用因素分解法.在碳排放強度研究方面,“碳強度”這一概念并不如碳排放一樣普及,自我國使用碳排放強度指標(biāo)制定減排目標(biāo)以來,有關(guān)碳強度的研究日趨增多.林伯強等[6]研究了如何在保障經(jīng)濟增長條件下實現(xiàn)碳排放強度目標(biāo).寇靜等[7]建立Arima模型,研究我國碳排放強度時間序列數(shù)據(jù),對其長期變動趨勢預(yù)測,發(fā)現(xiàn)仍呈下降趨勢,但下降幅度與政府的期望存在一定差距.趙成柏等[8]將碳排放強度的時間序列的數(shù)據(jù)結(jié)構(gòu)分解為線性和非線性殘差部分之后,利用BP神經(jīng)網(wǎng)絡(luò)與Arima組合模型預(yù)測碳排放強度變化趨勢.王鋒等[9]運用協(xié)整分析和馬爾可夫鏈方法對碳排放強度進行預(yù)測,并分析了能源結(jié)構(gòu)優(yōu)化對降低碳排放強度的作用.王彩飛[10]在分析確定碳強度的影響因素后提出了基于改進粒子群優(yōu)化的極限學(xué)習(xí)機算法,對全國及9個典型省市的碳強度進行實證預(yù)測,預(yù)測結(jié)果顯示該模型具有良好的擬合性能.目前,由于碳排放強度和碳排放的關(guān)聯(lián)性,關(guān)于碳強度的研究基本上還是沿襲碳排放的研究方式.
上述文獻分別使用不同方法從不同角度研究了我國碳排放量以及碳排放強度,但較少文獻使用機器學(xué)習(xí)方法,本文提出Adaboost-SVR模型預(yù)測碳排放強度,支持向量機是基于統(tǒng)計學(xué)習(xí)理論和結(jié)構(gòu)風(fēng)險最小化原理的算法,在解決回歸問題上效果很好[11,12],通常用于處理非線性問題,也擅長處理小樣本數(shù)據(jù)集,對小樣本有較好的擬合作用[13,14],適用于目前年碳排放量數(shù)據(jù)較少的現(xiàn)狀.但是支持向量回歸不足之處在于預(yù)測效果依賴于所選擇的核函數(shù)和核參數(shù),且目前沒有很好的關(guān)于參數(shù)選擇的理論支持.Adaboost算法可以提升任意弱學(xué)習(xí)器的性能,通過多次迭代降低預(yù)測結(jié)果的偏差,在訓(xùn)練過程中也不易發(fā)生過擬合[15],將Adaboost算法與支持向量回歸結(jié)合,既可以對支持向量回歸訓(xùn)練的學(xué)習(xí)器進一步提升,也可以降低參數(shù)選擇帶來的誤差,在保證模型精度的前提下進一步提升模型的泛化能力.
支持向量機(Support Vector Machine,以下簡稱SVM),作為傳統(tǒng)機器學(xué)習(xí)的一個非常重要的算法,由Cortes和Vapink于1995年提出.支持向量機(SVM)本身是針對分類問題提出的,而支持向量回歸(Support Vector Regression Machine, 以下簡稱SVR)是支持向量機原理在回歸預(yù)測領(lǐng)域的運用[16-18],其相關(guān)原理如下.
設(shè)樣本(xi,yi),i=1,2,…,n,xi∈Rn為輸入量,yi∈R為輸出量,SVR要求構(gòu)建非線性映射φ(x),將原始數(shù)據(jù)映射至高維甚至是無窮維的特征空間中,然后在高維空間中建立樣本的線性回歸函數(shù)為
f(x)=wTφ(x)+b.
(1)
為避免過擬合,由式(1)可以得到式(2)的代價函數(shù):
(2)
式中,C被稱為懲罰函數(shù),決定函數(shù)對于數(shù)據(jù)的擬合程度,|yi-f(xi)|為實際數(shù)據(jù)與預(yù)測數(shù)據(jù)的偏差.引入不敏感損失函數(shù)ε,只有當(dāng)|yi-f(xi)|>ε時才計算損失,則式(2)的代價函數(shù)轉(zhuǎn)化為式(3)和式(4)形式的目標(biāo)函數(shù).
(3)
(4)
其中,K(xi,xj)=φ(xi)φ(xj)為核函數(shù),其作用為將高維空間的內(nèi)積運算轉(zhuǎn)換為低維空間的核函數(shù)運算.最終得到的支持向量回歸函數(shù)為:
(5)
Adaboost算法[19]是Boosting提升算法中最具代表性的一種算法,由Yoav Freund和Robert Schapire在1995年提出.該算法的核心思想是:對于指定的樣本集數(shù)據(jù),通過多次迭代反復(fù)修改樣本權(quán)重分布訓(xùn)練一系列的基學(xué)習(xí)器,最終將各個基學(xué)習(xí)器組合建立一個強學(xué)習(xí)器.在每次迭代過程中,根據(jù)訓(xùn)練集中各個樣本是否被正確學(xué)習(xí)以及上一次訓(xùn)練過程中樣本權(quán)重來更新權(quán)重.對于正確被學(xué)習(xí)的樣本,降低其權(quán)重,而錯誤學(xué)習(xí)的樣本則要增大權(quán)重,之后根據(jù)新的樣本權(quán)值分布再次迭代,這使得在下次迭代過程中,更加凸顯錯誤學(xué)習(xí)的樣本,如此重復(fù)進行,直到基學(xué)習(xí)器數(shù)達到事先指定的數(shù)目,最終將這T個基學(xué)習(xí)器通過各自權(quán)重進行整合,最終得到理想學(xué)習(xí)器.
支持向量回歸的預(yù)測精度很好,但是其性能在很大程度上依賴于核函數(shù)以及其他參數(shù)的選擇.一般懲罰系數(shù)C,不應(yīng)過大也不應(yīng)過小,過小會造成欠擬合,過大則過擬合.而在樣本數(shù)量較少的條件下,懲罰系數(shù)C的取值不應(yīng)過大,保證模型在樣本外的泛化能力.針對任意的弱學(xué)習(xí)器,Adaboost算法可以提升其性能,使用SVR作為Adaboost的基學(xué)習(xí)器,既可以在一定程度上提高模型的預(yù)測精度,又可以降低參數(shù)選擇帶來的影響.
Adaboost-SVR算法的步驟為:
輸入:m個樣本數(shù)據(jù)訓(xùn)練集{Xi,yi}(i=1,2,…,m),迭代次數(shù)T
Step2訓(xùn)練SVR基學(xué)習(xí)器:對于迭代次數(shù)t=1,2,…,T;根據(jù)樣本權(quán)重分布Dt(x)訓(xùn)練第t(x)個SVR基學(xué)習(xí)器Ht(x);計算訓(xùn)練集上的最大誤差Et、每個樣本的相對誤差eti、以及學(xué)習(xí)器的回歸誤差率et.
Et=max|yi-Ht(xi)|,i=1,2,…,m.
計算基學(xué)習(xí)器的權(quán)重需要的αt,
更新訓(xùn)練數(shù)據(jù)集的權(quán)值分布:
D(t+1)=(wt+1,m,wt+2,m,…,wt+1,m);
輸出:最終學(xué)習(xí)器H(x)=Ht*(x).
由于不同研究機構(gòu)的統(tǒng)計口徑不同以及某些年份的碳排放量數(shù)據(jù)未公布,考慮可獲得的碳排放量數(shù)據(jù)完整性,本文中碳排放量數(shù)據(jù)采用美國橡樹嶺國家實驗室CO2信息分析中心[20]公布的數(shù)據(jù),GDP數(shù)據(jù)來源于世界銀行,能源消耗總量和人口數(shù)據(jù)來源于國家統(tǒng)計年鑒.
碳排放強度是指每單位國民生產(chǎn)總值的增長所帶來的二氧化碳排放量,該指標(biāo)主要是用來衡量一個國家經(jīng)濟發(fā)展同碳排放量之間的關(guān)系,反映了經(jīng)濟增長過程中的能源消耗情況.若國家在經(jīng)濟增長的同時,單位國民生產(chǎn)總值所排放的二氧化碳在下降,則說明該國實現(xiàn)了低碳發(fā)展模式.根據(jù)1960-2017年期間我國每年的二氧化碳排放總量以及1960-2017年國內(nèi)生產(chǎn)總值,二者相除,可以計算1960-2017年碳排放強度,其結(jié)果如圖1所示.由圖1可知我國碳排放強度的趨勢是階段性變化的,第一階段為1960-1967年,碳排放強度急劇下降,從1960年的130.44 t/萬美元下降至1967年的59.30 t/萬美元.第二階段為1968-1978年,此階段為緩慢上升階段,碳排放強度從66.0 t/萬美元,上升至97.31 t/萬美元,雖然在1971年開始出現(xiàn)急劇下降,但僅在三年后又極速攀升,在這10年間碳排放強度上升31.31 t/萬美元.第三階段為1979-2002年,碳排放強度呈現(xiàn)穩(wěn)步下降趨勢,從1979年83.42 t/萬美元的下降至2002年的25.71 t/萬美元,其中1979-1993年的下降速度低于1993-2002年.第四階段為2003年至今,該階段前期碳排放強度出現(xiàn)了輕微的反彈,上升到26.82 t/萬美元,隨后便繼續(xù)逐漸下降.雖然在不同時期存在波動,但長期來看,我國碳排放強度呈現(xiàn)逐步下降趨勢.
年份/年
3.2.1 平穩(wěn)性檢驗
在對時間序列數(shù)據(jù)建模時,模型要求時間序列數(shù)據(jù)具有平穩(wěn)性.從圖1可以看出該序列具有明顯的長期趨勢,是非平穩(wěn)時間序列,因此在建立模型之前需要對原數(shù)據(jù)差分使其平穩(wěn).
若將原始時間序列記為{xt,t=1,2,…,n},其中xt為每個時刻的序列觀察值,則相距一期的兩個序列值之間的減法運算稱為1階差分運算.記xt為xt的1階差分:xt=xt-xt-1,通常1階差分可以使時間序列平穩(wěn).
本文采用單位根檢驗,結(jié)果見表1,根據(jù)ADF值以及P值均可以看出原變量經(jīng)過一次差分后,ADF檢驗值為-6.485,低于各顯著水平下的臨界值,且P值近似為0,可以拒絕原假設(shè),差分后時間序列已經(jīng)平穩(wěn).
表1 單位根檢驗
3.2.2 數(shù)據(jù)形式轉(zhuǎn)換
在使用Adaboost-SVR對時間序列數(shù)據(jù)進行預(yù)測時,需要將數(shù)據(jù)轉(zhuǎn)化為監(jiān)督學(xué)習(xí)所需要的數(shù)據(jù)形式,通常采用滑動窗口法將數(shù)據(jù){xt,t=1,2,…,n}轉(zhuǎn)換為矩陣形式,構(gòu)造樣本{Xt,Yt},其中Xt={xt-m,xt-m-1,…,xt-1},Yt={xt},m為滑動窗口的大小,代表著用前m個數(shù)據(jù)預(yù)測第m+1個數(shù)據(jù)[21].在本文中通過對模型反復(fù)實驗比較,取m=2,即用前兩年的碳排放強度預(yù)測第三年的碳排放強度.
根據(jù)已有的1960-2017年碳排放強度數(shù)據(jù),經(jīng)過數(shù)據(jù)預(yù)處理后,劃分訓(xùn)練集和測試集,1960-2000年的數(shù)據(jù)集用于訓(xùn)練模型,2001-2017年的數(shù)據(jù)用做測試,做連續(xù)滾動預(yù)測檢驗?zāi)P托阅?為了比較模型Adaboost-SVR的預(yù)測能力,同時也用相同數(shù)據(jù)訓(xùn)練了SVR、Adaboost-DT以及BP神經(jīng)網(wǎng)絡(luò)作對比分析,其中Adaboost-DT是以決策樹回歸[22,23]作為基學(xué)習(xí)器訓(xùn)練得到的模型.
本文選用均方根誤差(RMSE),平均絕對誤差(MAE)、平均絕對百分比誤差(MAPE)、MSE(均方誤差)4類指標(biāo)作為評價準(zhǔn)則對誤差進行度量,計算方式如式(6)~(9).
(6)
(7)
(8)
(9)
表2列出了各個模型的評價指標(biāo)值,根據(jù)RMSE,MAPE,MAE和MSE的值大小來看,Adaboost-SVR模型的RMSE,MAPE,MAE和MSE均低其他3種方法,預(yù)測效果明顯優(yōu)于其他3種方法.若單從RMSE來看模型預(yù)測性能,Adaboost-SVR與Adaboost-DT相比性能提升了44%;與SVR相比提升了29%;與BP相比提升了45%.
表2 不同模型比較結(jié)果
圖2給出了不同方法下對碳排放強度的預(yù)測結(jié)果.實際的碳排放強度值用紅色線表示.從這個比較中可以看出,Adaboost-SVR明顯優(yōu)于Adaboost-DT;與BP相比,雖然在2002年和2003年BP的預(yù)測值更加貼合實際值,但總體來說Adaboost-SVR預(yù)測效果更好;與SVR相比,雖然SVR模型也較好地擬合出了碳排放強度的下降趨勢,但預(yù)測精度低于Adaboost-SVR,說明Adaboost算法確實提升了SVR的預(yù)測精度.
年份/年
綜上所述,本文提出的Adaboost-SVR模型總體來說優(yōu)于其他模型,可以很好地預(yù)測我國碳排放強度,在預(yù)測精度上較BP、Adaboost-DT和SVR模型有顯著提高,說明了該預(yù)測模型是切實有效的,可以通過預(yù)測結(jié)果調(diào)整國家宏觀政策,進而在2030之前實現(xiàn)我國提出的 “自主貢獻”目標(biāo).
利用Adaboost-SVR模型對我國未來幾年的碳排放強度進行預(yù)測,預(yù)測結(jié)果見表3.
表3 未來幾年碳排放強度預(yù)測值
根據(jù)預(yù)測結(jié)果顯示,2018年碳排放強度為7.268 t/萬美元,2022年預(yù)測值則降至5.488 t/萬美元,相對于2017年下降了2.614 t/萬美元.總體來看,未來幾年我國碳排放強度仍保持平緩下降趨勢.
當(dāng)前我國經(jīng)濟進入轉(zhuǎn)型期,處于后城市化和后工業(yè)化階段,因此經(jīng)濟發(fā)展仍然需要消耗大量化石能源,進而導(dǎo)致碳排放量增加.雖然根據(jù)圖1可以看出我國的碳排放強度下降趨勢,但從圖3可以明顯看出國內(nèi)生產(chǎn)總值增長曲線明顯比碳排放量曲線陡峭,因此碳排放強度下降主要原因在于我國經(jīng)濟發(fā)展迅速,使得二氧化碳排放量的增長速度小于經(jīng)濟增長速度.為了確保實現(xiàn)國家自主貢獻目標(biāo),即到2030 年單位 GDP 二氧化碳排放量比 2005 年下降 60%~65%,必須采取措施降低碳排放量.
年份/年
3.4.1 碳排放量驅(qū)動因素分析
根據(jù)LMDI模型,本文將我國每年碳排放變化量分解為四種效應(yīng)[24],即人口規(guī)模效應(yīng)、能源結(jié)構(gòu)效應(yīng)、能源消費強度效應(yīng)以及經(jīng)濟發(fā)展效應(yīng),這4種效應(yīng)代表著影響我國碳排放的4種驅(qū)動因素.
根據(jù)圖4可以看出,4種碳排放驅(qū)動因素中,能源消費強度效應(yīng)為負(fù)效應(yīng),是使碳排放量減少的關(guān)鍵因素,通過提高可再生能源的技術(shù)開發(fā)將有效降低碳排放量問題.在能源結(jié)構(gòu)效應(yīng)、經(jīng)濟效應(yīng)、人口效應(yīng)3種效應(yīng)中,經(jīng)濟發(fā)展效應(yīng)影響最大,表明我國要發(fā)展經(jīng)濟能源需求極大;能源結(jié)構(gòu)效應(yīng)分解值時正時負(fù),說明我國的產(chǎn)業(yè)調(diào)整力度還不夠大,煤炭在化石燃料中仍占較大比重,如果不對產(chǎn)業(yè)結(jié)構(gòu)進行調(diào)整,碳排放量將持續(xù)上升,從2012年開始,能源結(jié)構(gòu)效應(yīng)出現(xiàn)了負(fù)值,說明能源結(jié)構(gòu)有望成為抑制碳排放的強力因素;人口規(guī)模對碳排放有正向驅(qū)動作用,主要是因為人口增加導(dǎo)致的能源消耗增加,而且城市化導(dǎo)致大規(guī)模建造城市道路等基礎(chǔ)設(shè)施的水泥需求增長,這些都會直接產(chǎn)生碳排放.
年份/年
3.4.2 相關(guān)政策建議
從能源結(jié)構(gòu)層面來說,我國應(yīng)調(diào)整能源產(chǎn)業(yè)結(jié)構(gòu),鼓勵低碳經(jīng)濟發(fā)展.政府部門應(yīng)該從宏觀上調(diào)控政策,制定相應(yīng)的碳管制措施,我國現(xiàn)有三大產(chǎn)業(yè),第二產(chǎn)業(yè)帶來的污染最多,應(yīng)盡快將我國產(chǎn)業(yè)結(jié)構(gòu)從第二產(chǎn)業(yè)向第三產(chǎn)業(yè)轉(zhuǎn)變,強化人們的低碳理念,合理消費、綠色消費,不斷發(fā)展綠色農(nóng)業(yè),減少高含碳量生產(chǎn)資料的使用,減少以煤炭為主的能源消耗,大力實施“煤改電、煤改氣”政策.
從能源消費強度層面來講,應(yīng)大力提高對可再生能源的技術(shù)開發(fā),大力發(fā)展資源節(jié)約型新型能源,加大技術(shù)投資力度,我國技術(shù)型人才應(yīng)積極參與低碳開發(fā),國家應(yīng)根據(jù)其貢獻給予相應(yīng)獎勵,刺激高技術(shù)企業(yè)發(fā)展,其次可以引進其他國家的先進技術(shù),與我國的實際情況相結(jié)合,構(gòu)建屬于我們國家的低碳經(jīng)濟發(fā)展技術(shù).
從經(jīng)濟發(fā)展來看,經(jīng)濟發(fā)展勢必導(dǎo)致能源消耗,可以尋找合適的能源替代品,國家一級企業(yè)應(yīng)考慮在不減緩經(jīng)濟發(fā)展的前提下,最大程度減少碳排放,應(yīng)促進天然氣應(yīng)用,促進可再生能源利用,減少對化石能源的依賴.
自從我國提出以碳排放強度作為節(jié)能減排目標(biāo)以來,有關(guān)于碳排放強度的研究已經(jīng)成為熱點問題,本文對碳排放強度時間序列的研究轉(zhuǎn)化為監(jiān)督學(xué)習(xí),采用Adaboost-SVR模型預(yù)測長期趨勢,既保證了小樣本情況下的模型預(yù)測精度,又用Adaboost算法進一步提升了模型的泛化能力,MAPE,RMSE,MAE和MSE四個評價指標(biāo)從多個角度表明組合模型優(yōu)于Adaboost-DT模型、SVR模型、BP神經(jīng)網(wǎng)絡(luò)模型,可以用來預(yù)測我國未來的碳排放強度.而在如何制定減排措施方面,從我國碳排放量的LMDI分解結(jié)果看,能源消費強度效應(yīng)抑制碳排放量增長,而能源結(jié)構(gòu)效應(yīng)、經(jīng)濟效應(yīng)、人口效應(yīng)是導(dǎo)致碳排放量增加的原因,應(yīng)該據(jù)此實施合理高效的減排方案,例如調(diào)整產(chǎn)業(yè)結(jié)構(gòu),推動低碳工業(yè)發(fā)展,轉(zhuǎn)變能源利用結(jié)構(gòu),提高能源使用效率等具體減排措施.