包永迪,楊一帆,王旭強,周佳禾
(國網(wǎng)天津市電力公司信息通信公司 數(shù)據(jù)管理服務(wù)中心,天津 300010)
地區(qū)經(jīng)濟與行業(yè)發(fā)展存在著密切的聯(lián)系。以細分行業(yè)為立足點,并結(jié)合相關(guān)發(fā)展數(shù)據(jù)和政府政策,可以分析地區(qū)經(jīng)濟的產(chǎn)業(yè)結(jié)構(gòu),梳理區(qū)域內(nèi)行業(yè)間的上下游關(guān)系,這對公司、政府等主體進行宏觀戰(zhàn)略制定具有重要意義。
目前,一些研究探討了電力消費結(jié)構(gòu)與經(jīng)濟增長、行業(yè)發(fā)展的關(guān)系[1-2],其結(jié)論表明電力消費結(jié)構(gòu)與經(jīng)濟和行業(yè)的發(fā)展存在明顯的相關(guān)性,而電力發(fā)展的趨勢也能反映經(jīng)濟和行業(yè)發(fā)展的態(tài)勢。一些研究從商品鏈、企業(yè)或產(chǎn)業(yè)鏈的視角分析其上下游對其自身的影響[3-4],通過分析上下游關(guān)系來為其自身提供決策支持。然而,缺乏將這兩種視角結(jié)合起來的研究,即從電力消費結(jié)構(gòu)的角度,探討相應(yīng)層次的上下游關(guān)系。
本文提出了一種關(guān)聯(lián)性分析模型,利用天津市區(qū)域級、行業(yè)級的電力消費數(shù)據(jù),從宏觀上分析區(qū)域內(nèi)的行業(yè)上下游關(guān)系。除此以外,還對區(qū)域內(nèi)的行業(yè)進行了用電量建模,從而預測行業(yè)在滯后時段內(nèi)的用電量。
電力消費結(jié)構(gòu)與地區(qū)經(jīng)濟中的產(chǎn)業(yè)結(jié)構(gòu)有著密切的聯(lián)系。基于一定的技術(shù)關(guān)聯(lián),在產(chǎn)業(yè)結(jié)構(gòu)內(nèi)部客觀上存在著具有時空布局關(guān)系的鏈條式關(guān)聯(lián)形態(tài),鏈條上的每一個節(jié)點都可以由一個細分行業(yè)來替代,因此這種關(guān)聯(lián)實際上揭示了行業(yè)間的上下游關(guān)系[5]。行業(yè)上下游關(guān)系反映了整個產(chǎn)業(yè)結(jié)構(gòu)背后的價值、企業(yè)、供需、空間關(guān)系。國內(nèi)外學者對行業(yè)上下游關(guān)系及產(chǎn)業(yè)結(jié)構(gòu)做了一些相關(guān)的研究。然而,這些研究在揭示行業(yè)上下游關(guān)系時,往往具有特定的限制,缺乏適應(yīng)性強的方法,還有一些研究則是基于主觀上的定性分析,而非利用定量的方法反映客觀狀況。因此,本文提出了一種定量分析的具有較強適應(yīng)性的方法,即通過研究電力消費結(jié)構(gòu)來揭示行業(yè)的上下游關(guān)系。
研究行業(yè)上下游之間的時間周期、關(guān)聯(lián)程度可以抽象為對多個時間序列進行滯后周期的分析和驗證。有很多方法可以分析時間序列間的動態(tài)關(guān)系,其中最被廣泛使用的方法就是向量自回歸模型(VAR)。向量自回歸模型是一種計量經(jīng)濟學方法,可以在不帶有任何約束條件的前提下,估計聯(lián)合內(nèi)生變量的動態(tài)關(guān)系。另外,在判定行業(yè)上下游關(guān)系時,依靠經(jīng)驗和相關(guān)查證仍然不夠客觀。因此本文利用格蘭杰因果檢驗方法對變量間進行雙向因果檢驗。
本文使用的電力數(shù)據(jù)來自于天津市國家電網(wǎng)電力系統(tǒng)內(nèi)部獲取的天津市不同行業(yè)用電量數(shù)據(jù),行業(yè)按三大產(chǎn)業(yè)分為3個大類,數(shù)據(jù)為按行業(yè)分類的2012年1月—2019年9月的月度用電量。
上下游行業(yè)用電關(guān)聯(lián)性分析模型是用來預測某一區(qū)域內(nèi)行業(yè)上下游關(guān)系的模型。首先需要搜集相關(guān)的月度電力數(shù)據(jù),并按照行業(yè)進行整理,然后將數(shù)據(jù)進行歸一化等預處理操作。模型主要從時間序列分析出發(fā),利用格蘭杰因果關(guān)系檢驗驗證行業(yè)之間是否會互相影響,在此基礎(chǔ)上構(gòu)建向量自回歸模型找出存在的線性關(guān)系。
搜集的數(shù)據(jù)主要以月度電力數(shù)據(jù)為主,為了使模型結(jié)果具有可信度,必須搜集具有足夠跨度的電力月度數(shù)據(jù),本文利用了共計93個月月度電力數(shù)據(jù),然后將電力數(shù)據(jù)以CSV形式進行存儲。
為了方便處理,統(tǒng)一量度,本文將整理好的電力數(shù)據(jù)利用歸一化方法完成了預處理。這里使用離差標準化方法即:
向量自回歸模型描述了一組聯(lián)合內(nèi)生變量隨時間演變的關(guān)系,并且可以通過將一組變量建模為由其過去值組成的線性函數(shù)。根據(jù)過去時間段數(shù)量上的不同,VAR模型可以有相應(yīng)的變體,通常情況下,一個p階的VAR模型指的是考量過去p個時間段的VAR模型,并可以表示成如下矩陣形式:
其中,yt-1表示相比于yt提前了i個時間周期的向量,c則是作為模型偏移常數(shù)的k維向量,A是維k×k的非時變矩陣,et則是用作誤差項的k維向量。
格蘭杰因果關(guān)系檢驗是用于分析變量間因果關(guān)系的一種方法。給定兩個變量X和Y的時間序列,則可以定義格蘭杰因果關(guān)系:若單獨由Y的過去信息對Y進行預測的效果,不及同時利用變量X和Y的過去信息對Y進行預測的效果,則可以認為變量X有利于解釋變量Y發(fā)生的變化,這時就可以認為變量X是導致變量Y的格蘭杰原因。
在進行格蘭杰因果關(guān)系檢驗前,必須具備的一個條件是變量的時間序列必須具有平穩(wěn)性,否則可能會出現(xiàn)虛假回歸問題。
整個建模過程可以分為6個步驟。
(1)平穩(wěn)性檢驗。利用單位根檢驗法可以進行平穩(wěn)性檢驗。若存在單位根則時間序列不平穩(wěn),當變量不平穩(wěn)時,需要進行進一步差分,一般一階差分后時間序列達到平穩(wěn),可繼續(xù)進行協(xié)整檢驗。
(2)協(xié)整檢驗。針對非平穩(wěn)的單個序列,但它們的線性組合可能是平穩(wěn)的,若平穩(wěn)性檢驗后為一階單整的,且為非平穩(wěn)時間序列,則各變量之間可能存在協(xié)整關(guān)系,如果某組要對所選擇的內(nèi)生變量進行VAR模型的構(gòu)建,需要驗證兩者之間是否具有相同的趨勢,所以要進行協(xié)整檢驗,以判斷各個變量之間是否存在長期穩(wěn)定的協(xié)整關(guān)系,處理各變量之間的是否存在偽回歸問題。
圖1 農(nóng)業(yè)、農(nóng)副產(chǎn)品加工業(yè)用電量趨勢
(3)確定滯后階數(shù)。兩個時間序列回歸存在一定的滯后階數(shù),其代表在幾個時間點內(nèi)的數(shù)據(jù)是較為相關(guān)的。通過AIC或HQ等不同信息準則選擇出合適的結(jié)果。
(4)格蘭杰因果關(guān)系檢驗。利用上一步選擇的滯后階數(shù)進行雙變量的雙向格蘭杰因果關(guān)系檢驗,判斷兩變量是否對對方具有顯著影響。在當前應(yīng)用場景下,主要思想就是先利用目標行業(yè)自身時間序列進行AR模型的構(gòu)建,即用前幾個月的用電量對下個月回歸,然后在此基礎(chǔ)上加入另一行業(yè)前幾個月的電量數(shù)據(jù),同樣對目標行業(yè)進行回歸,若此時得到的回歸模型好于之前,則說明此行業(yè)對目標行業(yè)有顯著影響。
(5)擬合VAR模型。同樣使用滯后階數(shù)以及回歸的方法,計算VAR模型的系數(shù),得到相應(yīng)階數(shù)的方程。
(6)脈沖響應(yīng)分析以及預測。利用上一步得到的VAR模型衡量脈沖響應(yīng)值,并進行分析和預測。脈沖響應(yīng)值即衡量在外部波動后存在的影響強度,正值代表正向影響,負值表示負向影響,絕對值越大,影響越強。
本文實驗的硬件平臺為Intel(R)Core(TM)i7-9750H CPU@2.60 GHz、16 GB內(nèi)存、1 TB大小的SSD硬盤以及Windows10操作系統(tǒng),軟件環(huán)境為R及RStudio。
依靠經(jīng)驗和相關(guān)查證可以預想,農(nóng)業(yè)與農(nóng)副產(chǎn)品加工業(yè)存在一定的上下游關(guān)系。
首先進行兩個行業(yè)的時間序列圖對比,如圖1所示,可以看見趨勢具有相似性,符合猜想預期。
經(jīng)檢驗后兩序列平穩(wěn),無須進行協(xié)整檢驗,這里選取的滯后階數(shù)為3。
進行格蘭杰因果關(guān)系檢驗,結(jié)果如圖2所示。
兩者P值均遠小于0.01,可認為互相之間均存在顯著的影響。
圖2 農(nóng)業(yè)、農(nóng)副產(chǎn)品加工業(yè)格蘭杰因果關(guān)系檢驗
進一步進行VAR模型擬合,結(jié)果如圖3所示,農(nóng)業(yè)主要與1、3月前的用電量和1、2月前的農(nóng)副產(chǎn)品加工業(yè)用電量顯著相關(guān),而農(nóng)副產(chǎn)品與1、2、3月前的農(nóng)業(yè)用電量顯著相關(guān)。
圖3 農(nóng)業(yè)、農(nóng)副產(chǎn)品加工業(yè)VAR模型擬合結(jié)果
由VAR模型得到的農(nóng)業(yè)脈沖響應(yīng)圖如圖4所示。在一個時間點對農(nóng)業(yè)施加一個沖擊,對自己的影響隨時間逐漸減弱,到7月后消失,對農(nóng)副產(chǎn)品加工業(yè)同樣具有相似的影響。
圖4 農(nóng)業(yè)脈沖響應(yīng)
圖5 農(nóng)業(yè)預測與實際電量對比(2012.3—2019.9)
利用VAR模型可以對后續(xù)電量進行預測,為檢驗預測結(jié)果的準確性,利用模型對每個月都進行擬合,農(nóng)業(yè)預測與實際值對比如圖5所示。
農(nóng)業(yè)的預測值與實際十分接近,而農(nóng)副產(chǎn)品并不能完全吻合,但總體趨勢一致,這意味著VAR模型的有效性。因此,利用這種方法,可以對滯后時間段內(nèi)用電量進行預測。
本文利用關(guān)聯(lián)性分析方法,對區(qū)域內(nèi)行業(yè)用電量進行建模,挖掘不同行業(yè)間的上下游關(guān)系。整個建模過程包括平穩(wěn)性檢驗、協(xié)整檢驗、確定滯后階數(shù)、格蘭杰因果關(guān)系檢驗、擬合VAR模型、脈沖響應(yīng)分析以及預測。實驗結(jié)果表明,使用關(guān)聯(lián)性分析建模,可以揭示行業(yè)上下游關(guān)系,預測滯后時間段內(nèi)該行業(yè)未來的用電量,這意味著關(guān)聯(lián)性分析模型的有效性。除此以外,本文僅僅分析了兩個變量,若選擇更多的行業(yè)進行關(guān)聯(lián)分析,則可以得到更加準確的VAR模型和預測結(jié)果。