郄慧娟,張權(quán),王珂
(齊齊哈爾大學(xué) 理學(xué)院,黑龍江 齊齊哈爾 161006)
國(guó)外從石油價(jià)格、消耗量及石油對(duì)經(jīng)濟(jì)的影響等方面研究。UCHE[1]運(yùn)用ARDL 技術(shù)對(duì)一些歐洲的國(guó)家在石油價(jià)格、收入變化和匯率方面的非對(duì)稱性進(jìn)行了評(píng)估。WANG 等[2]通過分析美國(guó)石油消費(fèi)的模擬值與真實(shí)值之間的差異,發(fā)現(xiàn)疫情對(duì)美國(guó)石油消費(fèi)的影響在2020 年4~5 月和2021 年1~2 月較為明顯。ZHU 等[3]通過GARCHSK-mix Copula-CoVaR-Network 方法探究了疫情期間原油、美國(guó)和中國(guó)股市之間的多維風(fēng)險(xiǎn)溢出。國(guó)內(nèi)對(duì)能源的研究大致可分為分解法和構(gòu)建STIRPAT 模型和其他方法,王麗麗等[4]在關(guān)于碳排放的問題上,利用結(jié)構(gòu)分解法進(jìn)行研究,陳慶等[5]構(gòu)建STIRPAT 來研究對(duì)武漢市的環(huán)境影響因素。對(duì)于能源的預(yù)測(cè),王婷[6]對(duì)中俄東線天然氣管道地質(zhì)災(zāi)害進(jìn)行了安全風(fēng)險(xiǎn)評(píng)價(jià)分析,WU 等[7]采用參數(shù)優(yōu)化及分?jǐn)?shù)累積的方法對(duì)能源進(jìn)行了預(yù)測(cè),謝乃明等[8]利用二次規(guī)劃灰色模型的馬爾可夫方法,對(duì)能源的消耗及生產(chǎn)進(jìn)行預(yù)測(cè),馬新[9]利用時(shí)滯多項(xiàng)式的灰色預(yù)測(cè)模型預(yù)測(cè)我國(guó)天然氣的消費(fèi)量,丁松等[10]用非線性的自適應(yīng)灰色系統(tǒng)對(duì)我國(guó)天然氣的需求量進(jìn)行了預(yù)測(cè)。
本文就石油的影響因素和石油消耗量的預(yù)測(cè)進(jìn)行研究,對(duì)石油消耗量影響因素進(jìn)行因子分析,用灰色模型和灰色馬爾可夫組合模型對(duì)石油消耗量進(jìn)行預(yù)測(cè),并用平均相對(duì)誤差和模型精度來對(duì)比預(yù)測(cè)效果。最后,根據(jù)上文的分析得出結(jié)論,為我國(guó)未來石油資源的發(fā)展利用提出合理的建議。
因子分析是統(tǒng)計(jì)學(xué)的一種典型方法,在所有變量中提取出共性因素,根據(jù)各個(gè)變量之間隱藏的某種相關(guān)性,推斷其中是否存在某種共性因子可以代表本質(zhì)相同的因子,可以有效地減少變量的數(shù)量,同時(shí)盡最大可能保存原有信息。
因子分析的數(shù)學(xué)模型:設(shè)有p個(gè)可觀測(cè)的指標(biāo)(標(biāo)準(zhǔn)化后):
因子模型記為X=Ap×mF+ε,其中,X= (X1,X2, …,Xp)′是可觀測(cè)的隨機(jī)向量F= (F1,F2, …,Fm)′是不可觀測(cè)的變量,ε= (ε1,ε2, …,εp)′與F不相關(guān)。aij是第i個(gè)變量與第j個(gè)公共因子的相關(guān)系數(shù)aij=ρij= cov(X i,Fj)。
因子分析的指標(biāo)體系構(gòu)建需要滿足以下原則:
(1)科學(xué)性。構(gòu)建一個(gè)合適的指標(biāo)體系首先需要滿足科學(xué)性,選取的指標(biāo)要有科學(xué)依據(jù)支撐,并且滿足實(shí)踐意義,理論及實(shí)踐都滿足科學(xué)性,才能夠到達(dá)科學(xué)性的要求。
(2)系統(tǒng)性。石油的影響因素是一個(gè)復(fù)雜的系統(tǒng),選取影響指標(biāo)時(shí)需充分考慮到系統(tǒng)性,將各個(gè)指標(biāo)的系統(tǒng)性與科學(xué)性相結(jié)合,構(gòu)建出完整的指標(biāo)體系。
(3)重點(diǎn)性。選取的指標(biāo)應(yīng)具有側(cè)重點(diǎn),石油的消耗量多余各種行業(yè)的發(fā)展以及經(jīng)濟(jì)因素有關(guān),因此指標(biāo)選取時(shí)的側(cè)重點(diǎn)要有所傾斜。
(4)可操作性。選取的指標(biāo),應(yīng)盡量使數(shù)據(jù)來自于相關(guān)部門的專業(yè)數(shù)據(jù),更具有說服性和專業(yè)性,分析結(jié)果更具可靠性。
背景值優(yōu)化的灰色模型能夠反映預(yù)測(cè)的整體趨勢(shì),但不能反映出數(shù)據(jù)的波動(dòng)性,馬爾科夫鏈恰好彌補(bǔ)了灰色模型的缺點(diǎn),因此背景值優(yōu)化的灰色馬爾可夫模型可以降低模型的預(yù)測(cè)誤差,提高預(yù)測(cè)精度。
1.2.1 背景值優(yōu)化的灰色模型
灰色預(yù)測(cè)通過鑒別系統(tǒng)因素間的發(fā)展趨勢(shì)的關(guān)聯(lián)程度,對(duì)原始數(shù)據(jù)生成有較強(qiáng)規(guī)律性的數(shù)據(jù)序列,然后建立相應(yīng)的微分方程模型預(yù)測(cè)事物未來的發(fā)展趨勢(shì)。
(1)建模過程。為了保證GM(1,1)模型的可行性,需要對(duì)已知的數(shù)據(jù)進(jìn)行級(jí)比檢驗(yàn)。設(shè)原始數(shù)據(jù)的序列為
其中,x(0)(k) > 0,k= 1,2, … ,n。
①數(shù)列的級(jí)比:
②對(duì)X(0)累計(jì)相加,生成1 -AGO序列:
③由序列X(1)建立GM(1,1)模型的白化方程為
④GM(1,1)模型的灰色微分方程為
優(yōu)化的背景值序列[11]為
其中,a和b為模型的待估參數(shù),
⑤通過計(jì)算一階線性微分方程的解,可得GM(1,1)的模型的響應(yīng)函數(shù)為
其中,x?(0)(k+ 1) =x?(1)(k+ 1) -x?(1)(k),k= 1,2, … ,n。
(2)精度檢驗(yàn)。在實(shí)際問題中,需要通過檢驗(yàn)去判定灰色模型的合理性和適用性。模型的精度越高,預(yù)測(cè)的數(shù)據(jù)越準(zhǔn)確?;疑P涂赏ㄟ^相對(duì)誤差、均方差比值和關(guān)聯(lián)度3 種方法來判斷模型的精度。
殘差序列為相對(duì)誤差序列為:
1.2.2 灰色-馬爾可夫模型
灰色馬爾可夫模型利用馬爾可夫確定狀態(tài)的轉(zhuǎn)移概率及概率矩陣,修正灰色模型的相對(duì)誤差,使模型的精度更高,從而使預(yù)測(cè)效果更好。
第一步:劃分狀態(tài)。以灰色預(yù)測(cè)模型中優(yōu)化后的背景值序列和原始非負(fù)序列之間的相對(duì)誤差序列作為預(yù)測(cè)模型的觀測(cè)數(shù)據(jù),將相對(duì)誤差進(jìn)行排序,并劃分為r個(gè)不同的狀態(tài)Ei= (E1,E2, … ,Er),任意狀態(tài)表示為Ei= [ai,bi],i= 1,2, … ,r,其中ai,bi為適當(dāng)?shù)某?shù)。
第三步:狀態(tài)轉(zhuǎn)移概率矩陣。根據(jù)相對(duì)誤差序列 Δ= {γ( 1),γ( 2), … ,γ(k)},可知處于Ei狀態(tài)的觀測(cè)值有Mi個(gè),因此,從狀態(tài)Ei到Ej的一步轉(zhuǎn)移概率pij為
因?yàn)椴恢雷詈笠粋€(gè)觀測(cè)值的狀態(tài)轉(zhuǎn)移情況,所以不參加計(jì)算,即 ΣMij=n-1。
一步~四步狀態(tài)轉(zhuǎn)移概率矩陣分別為Pij,Fi j=Pij*Pij,Gi j=Fi j*Pij和H ij=Gi j*Pij。
第四步:馬氏檢驗(yàn)。選定置信水平α,如果χ2>((n- 1)2),則該模型通過檢驗(yàn),可用于實(shí)際預(yù)測(cè)。
第五步:建立預(yù)測(cè)狀態(tài)轉(zhuǎn)移矩陣。根據(jù)狀態(tài)的個(gè)數(shù)選擇距預(yù)測(cè)值最近的r個(gè)觀測(cè)值,建立新的動(dòng)態(tài)預(yù)測(cè)狀態(tài)轉(zhuǎn)移矩陣Li j,i=1,2, …,r,j=1,2, … ,r,計(jì)算矩陣Lij的各列之和,最大值表示預(yù)測(cè)值未來狀態(tài)轉(zhuǎn)移的最大可能性。
第六步:預(yù)測(cè)。通過馬爾可夫鏈的修正,可得灰色預(yù)測(cè)區(qū)間x~(0)(k),一般取預(yù)測(cè)區(qū)間的中間值作預(yù)測(cè)值,即:
本文數(shù)據(jù)來源于RESSET 數(shù)據(jù)庫(kù),選取1994~2021 年石油的相關(guān)數(shù)據(jù),用SPSS26 對(duì)石油消耗量的影響因素進(jìn)行因子分析。再利用MATLAB 和R 軟件對(duì)1980~2019 年石油消耗量的數(shù)據(jù)進(jìn)行模擬,2019~2021 年的數(shù)據(jù)驗(yàn)證模型預(yù)測(cè)的精確度,從而預(yù)測(cè)2022 年到2024 年石油的消耗量。具體指標(biāo)[12]如表1 所示。
表1 指標(biāo)名稱、符號(hào)及單位
將構(gòu)建的18 個(gè)指標(biāo)的數(shù)據(jù)集導(dǎo)入SPSS,利用主成分分析法提取因子。主要步驟如下:
(1)用巴特利特球形檢驗(yàn)和KMO 檢驗(yàn)判斷是否可以進(jìn)行因子分析。
表2 巴特利特球度檢驗(yàn)統(tǒng)計(jì)量為2 231.049,概率P值近似為零,若顯著性水平為0.05,則應(yīng)拒絕相關(guān)系數(shù)矩陣與單位矩陣無顯著差異的假設(shè),同時(shí),KMO 值為0.832,根據(jù)Kaiser 給出的KMO 度量標(biāo)準(zhǔn)可知,原始變量適合進(jìn)行因子分析。
表2 KMO 和Bartlett 的檢驗(yàn)
(2)提取公共因子。主成分分析通過坐標(biāo)變換能夠?yàn)橐蜃臃治鎏峁┏跏冀?,將原有?8 個(gè)相關(guān)變量做線性組合,轉(zhuǎn)換成一組不相關(guān)的變量。通過SPSS 得到如表3。
表3 因子分析中的變量共同度
由表3 可以看出,經(jīng)過因子分析,對(duì)原始變量的信息提取量均大于50%,因此表明該因子分析得到的因子可以涵蓋原始信息。
由表4 和圖1,可知18 個(gè)變量總方差解釋在提取兩個(gè)因子時(shí)貢獻(xiàn)率達(dá)到97.643%,共形成了2 個(gè)因子,經(jīng)過旋轉(zhuǎn)后,第一成分的占比為58.645%,第二成分的占比為38.997%??梢姡ㄟ^主成分提取的前兩個(gè)因子已經(jīng)可以概括原問題中的大部分信息,所以,本文提取這兩個(gè)因子合適(表5)。
表4 總方差解釋
表5 旋轉(zhuǎn)后的成分矩陣
圖1 碎石圖
用回歸法估計(jì)因子得分系數(shù),并通過軟件輸出,得到因子得分系數(shù)矩陣,見表6。根據(jù)表6,可以得到因子得分函數(shù):
表6 成分得分系數(shù)矩陣表
根據(jù)各個(gè)公因子方差貢獻(xiàn)率,構(gòu)造我國(guó)石油消耗量的綜合評(píng)價(jià)模型為
(3)結(jié)果分析。因子分析結(jié)果顯示提取為兩個(gè)主成分,分別命名為經(jīng)濟(jì)因子和社會(huì)因子,其中經(jīng)濟(jì)因子包括工業(yè)生產(chǎn)總值、原油產(chǎn)量、一次能源生產(chǎn)量、原油進(jìn)口量、總?cè)丝跀?shù)、GDP、人均GDP、第三產(chǎn)業(yè)占比、石油生產(chǎn)量、人均原油產(chǎn)量、民用汽車保有量、能源消費(fèi)總量、石油消費(fèi)量、天然氣消費(fèi)量、煤炭消耗量、城鎮(zhèn)家庭平均每人可支配收入,社會(huì)因子包括人民幣兌美元匯率和第二產(chǎn)業(yè)占比。其中經(jīng)濟(jì)因子占比87.470%,社會(huì)因子占比10.173%。
2.2.1 灰色預(yù)測(cè)
(1)1980~2018 年的石油消耗量的原始數(shù)據(jù)為
通過級(jí)比檢驗(yàn),可知可容覆蓋區(qū)間為λ(k) = (0.9512,1.0513),原數(shù)據(jù)未通過檢驗(yàn),因此,做平移變換可得,C=936543613,級(jí)比序列
可進(jìn)行GM(1,1)建模和預(yù)測(cè)。對(duì)Y(0)累積相加,生成AGO 序列X(1):
(2)用改進(jìn)的背景值代替緊鄰均值構(gòu)造的背景值序列為
GM(1,1)的預(yù)測(cè)公式為
1980~2021 年中國(guó)石油消耗量的實(shí)際值與預(yù)測(cè)值的變化如圖2。
圖2 1980~2021年中國(guó)石油消耗量變化情況
根據(jù)模型檢驗(yàn)公式可得:
平均相對(duì)誤差:err= 0.1572;精度:1 -=84.27%;相對(duì)關(guān)聯(lián)度:r1= 0.617 8;均方差比值及小誤差概率:C1= 0.174 8,P= 1。
2.2.2 灰色馬爾可夫
根據(jù)均值-標(biāo)準(zhǔn)差法可將相對(duì)誤差序列劃分為4 個(gè)狀態(tài),即
由狀態(tài)i轉(zhuǎn)移到狀態(tài)j的頻數(shù)矩陣為一步、兩步、三步和四步轉(zhuǎn)移矩陣分別為
邊際概率:P.j= ( 0.1627907 0.1860465 0.2790698 0.1627907)。
用2019~2021 年的數(shù)據(jù)驗(yàn)證模型準(zhǔn)確度,2019 年的狀態(tài)轉(zhuǎn)移預(yù)測(cè)如表7。
根據(jù)表7 可知,處于E2狀態(tài)的概率最大為2.109,因此,2019 年石油消耗量相對(duì)誤差的預(yù)測(cè)值狀態(tài)的最大概率為 2E。同理,可計(jì)算2020 年和2021 年石油消耗量的相對(duì)誤差的預(yù)測(cè)值狀態(tài)的最大概率也為E2。
表7 2019 年石油消耗量概率預(yù)測(cè)表
通過以上數(shù)據(jù)分析,狀態(tài)1 到4 出現(xiàn)的概率分別為:0.205 128 2, 0.256 410 3, 0.282 051 3, 0.256 410 3。因此,2022 年出現(xiàn)狀態(tài)3 的概率最大,其消耗量的區(qū)間為(757 901 685, 991 688 497)。
根據(jù)式(13)相對(duì)誤差序列所處的狀態(tài)及預(yù)測(cè),可得表8。將灰色預(yù)測(cè)區(qū)間的中間值作為馬爾可夫鏈修正的灰色模型的預(yù)測(cè)值,部分預(yù)測(cè)結(jié)果及模擬情況如圖3 所示。
表8 1980~2019 年部分預(yù)測(cè)結(jié)果
根據(jù)模型的檢驗(yàn)公式,灰色馬爾可夫組合模型的平均相對(duì)誤差為0.098 481 672,模型精度為90.15%。
通過圖2 和圖3 及以上兩個(gè)模型的預(yù)測(cè),可知灰色馬爾可夫組合模型的平均相對(duì)誤差更小,模型的精度更高。因此,灰色馬爾可夫的預(yù)測(cè)效果優(yōu)于背景值優(yōu)化的灰色模型。
圖3 1980~2021 年中國(guó)石油實(shí)際及預(yù)測(cè)消耗量
通過因子分析可知,經(jīng)濟(jì)因子對(duì)石油消耗量的貢獻(xiàn)率較大,影響較深,社會(huì)因子貢獻(xiàn)率相對(duì)于經(jīng)濟(jì)因子貢獻(xiàn)率較低,因此主要對(duì)經(jīng)濟(jì)因子所帶來的影響提出相應(yīng)的對(duì)策。背景值優(yōu)化的灰色模型和灰色馬爾可夫模型進(jìn)行預(yù)測(cè)的結(jié)果表明,灰色馬爾可夫模型的預(yù)測(cè)效果更好,2022 年石油消耗量將達(dá)到757 901 685~991 688 497 t。
根據(jù)上文的分析提出以下建議:
(1)加大開采力度。在現(xiàn)今的世界大背景下,石油消耗量不斷上升且我國(guó)的現(xiàn)有石油資源儲(chǔ)量相對(duì)豐富,可以適度的加大開采。
(2)調(diào)整能源結(jié)構(gòu)。國(guó)家可以開發(fā)相應(yīng)的環(huán)境清潔技術(shù),以減少煤炭帶來的空氣污染,另外,水、風(fēng)和太陽(yáng)能資源也可以緩解石油供需矛盾。
(3)提高利用率。新技術(shù)、新能源的開發(fā)與利用都需要花費(fèi)大量的時(shí)間,因此對(duì)石油生產(chǎn)技術(shù)、利用技術(shù)進(jìn)行改進(jìn),不僅可以提高石油的利用率,還可以促進(jìn)經(jīng)濟(jì)的發(fā)展。