張秀華, 馬佳杰, 徐 雷, 張國(guó)棟, 田 旭
(1.浙江滬杭甬高速公路股份有限公司, 杭州 310020; 2.浙江數(shù)智交院科技股份有限公司, 杭州 310030)
高速公路的建設(shè)與區(qū)域的經(jīng)濟(jì)發(fā)展水平密切相關(guān),區(qū)域經(jīng)濟(jì)的良好發(fā)展推動(dòng)高速路網(wǎng)的有序擴(kuò)張,高速路網(wǎng)的平穩(wěn)運(yùn)行反哺區(qū)域的社會(huì)和諧與經(jīng)濟(jì)繁榮。國(guó)內(nèi)生產(chǎn)總值(gross domestic product,GDP)可以反映一個(gè)國(guó)家或者一個(gè)地區(qū)的經(jīng)濟(jì)發(fā)展水平和人民的生活狀況,也可以衡量和評(píng)價(jià)國(guó)家和地區(qū)未來(lái)的發(fā)展趨勢(shì)。實(shí)際上,地區(qū)的GDP發(fā)展?fàn)顩r也常常成為高速公路路線走向設(shè)計(jì)的重要參考依據(jù)。因此,對(duì)于GDP預(yù)測(cè)研究顯得尤為重要,它不僅可以評(píng)估某個(gè)區(qū)域未來(lái)總體的經(jīng)濟(jì)水平變化情況,而且可以提供某個(gè)區(qū)域高速路網(wǎng)規(guī)劃的數(shù)據(jù)支撐。
浙江省既是21世紀(jì)海上絲綢之路圈定的五省之一,又是長(zhǎng)江經(jīng)濟(jì)帶三極之一長(zhǎng)江三角洲城市群的重要組成部分,也是環(huán)杭州灣發(fā)達(dá)城市集中區(qū)域。落實(shí)“一帶一路”、長(zhǎng)江經(jīng)濟(jì)帶發(fā)展和大灣區(qū)建設(shè),必然會(huì)對(duì)區(qū)域內(nèi)外交通運(yùn)輸系統(tǒng)的時(shí)效性、便捷性和安全性提出更新、更高的要求。因此,及時(shí)準(zhǔn)確地掌握浙江省GDP發(fā)展趨勢(shì),對(duì)于推進(jìn)現(xiàn)代交通“五大建設(shè)”、打造“暢通浙江”和完善區(qū)域高速公路網(wǎng)具有十分重要的意義。
歷史的GDP數(shù)據(jù)是一組帶有時(shí)間標(biāo)簽的數(shù)值,數(shù)值的大小隨著時(shí)間而變化。對(duì)于時(shí)間序列的研究是GDP預(yù)測(cè)過(guò)程中必不可少的一部分。如果將GDP數(shù)據(jù)作為時(shí)間序列進(jìn)行建模,需要考慮其自身包含的線性關(guān)系和非線性關(guān)系。首先,本文分別構(gòu)建ARIMA模型和BP神經(jīng)網(wǎng)絡(luò)模型對(duì)浙江省GDP進(jìn)行預(yù)測(cè),并得到模型評(píng)價(jià)結(jié)果;其次,在ARIMA模型基礎(chǔ)上,挖掘出殘差序列的非線性關(guān)系,并設(shè)置合適的BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu);最后,優(yōu)化ARIMA和BP神經(jīng)網(wǎng)絡(luò)組合模型,并比較3種模型的預(yù)測(cè)結(jié)果。
時(shí)間序列經(jīng)過(guò)變換后,能夠以3項(xiàng)相加的形式進(jìn)行表示。時(shí)間序列分析的目的就是從一個(gè)時(shí)間序列提取并分解出趨勢(shì)項(xiàng)、周期項(xiàng)和隨機(jī)誤差項(xiàng)[1]。經(jīng)典回歸通常不足以解釋時(shí)間序列的所有特性。因此,Peter Whittle在1951年提出了自回歸(autoregressive,AR)和自回歸移動(dòng)平均(autoregressive moving average,ARMA)[2]。1970年,Box和Jenkins首次提出了差分自回歸移動(dòng)平均(autoregressive integrated moving average,ARIMA),標(biāo)志著時(shí)間序列分析進(jìn)入了新的應(yīng)用階段[3]。該模型基于歷史數(shù)據(jù)的相關(guān)性分析,得出當(dāng)前期與滯后期之間的相關(guān)系數(shù),并利用最小二乘法建立時(shí)間序列中當(dāng)前項(xiàng)和滯后項(xiàng)之間的線性關(guān)系。ARIMA模型以優(yōu)越的短期預(yù)測(cè)效率在不同學(xué)科領(lǐng)域得到廣泛應(yīng)用,特別是在經(jīng)濟(jì)和金融領(lǐng)域的研究。王鄂等通過(guò)構(gòu)建ARIMA(1,1,2)最優(yōu)模型對(duì)湖南省GDP進(jìn)行預(yù)測(cè)研究,發(fā)現(xiàn)湖南省將在2020年達(dá)成全面建成小康社會(huì)的目標(biāo),并且人均GDP將超過(guò)一萬(wàn)美元[4]。鄭夢(mèng)琪等基于浙江省1978—2018年的全省GDP數(shù)據(jù),結(jié)合一階差分、AIC和BIC原則,建立ARIMA(5,1,5)模型,并預(yù)測(cè)浙江省未來(lái)3年的GDP數(shù)據(jù),為區(qū)域發(fā)展戰(zhàn)略規(guī)劃提供依據(jù)[5]?;诎不帐v年的GDP數(shù)據(jù),游文倩等分別建立ARIMA(0,1,1)模型、Holt-Winters模型和組合預(yù)測(cè)模型(ARIMA-holt-winters,無(wú)季節(jié)性模型),結(jié)果發(fā)現(xiàn)組合預(yù)測(cè)模型能夠更加準(zhǔn)確地得到短期預(yù)測(cè)結(jié)果[6]。
傳統(tǒng)的時(shí)間序列預(yù)測(cè)模型是通過(guò)分析某一學(xué)科領(lǐng)域的機(jī)理,將各類(lèi)影響因素與目標(biāo)結(jié)果之間建立數(shù)學(xué)關(guān)系,從而實(shí)現(xiàn)時(shí)間序列的預(yù)測(cè)。除此以外,基于機(jī)器學(xué)習(xí)技術(shù)的時(shí)間序列預(yù)測(cè)模型是對(duì)大量時(shí)間序列數(shù)據(jù)進(jìn)行反復(fù)學(xué)習(xí)和優(yōu)化,從而獲得數(shù)據(jù)預(yù)測(cè)能力[7]。人工神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN)是機(jī)器學(xué)習(xí)領(lǐng)域熱門(mén)的研究理論,通過(guò)構(gòu)建多樣的網(wǎng)絡(luò)結(jié)構(gòu)處理復(fù)雜的關(guān)聯(lián)關(guān)系。BP(back propagation)神經(jīng)網(wǎng)絡(luò)是人工神經(jīng)網(wǎng)絡(luò)的一個(gè)分支,是由Rumelhart和McClelland在1986年提出的一種誤差反向傳播學(xué)習(xí)機(jī)制,經(jīng)過(guò)不斷改進(jìn)和完善,目前已經(jīng)廣泛應(yīng)用,如函數(shù)逼近、模式識(shí)別、造價(jià)預(yù)測(cè)等[8]。劉莉等利用BP神經(jīng)網(wǎng)絡(luò)對(duì)宿遷市降水量數(shù)據(jù)的剩余平穩(wěn)序列成分進(jìn)行模擬,并構(gòu)建時(shí)間序列預(yù)測(cè)模型,結(jié)果表明基于BP神經(jīng)網(wǎng)絡(luò)的時(shí)間序列預(yù)測(cè)模型具有較高的精度和穩(wěn)定性,預(yù)測(cè)結(jié)果優(yōu)于傳統(tǒng)的時(shí)間序列加法模型[9]。孟毅選取ARIMA時(shí)間序列、BP神經(jīng)網(wǎng)絡(luò)和BP-ARIMA組合模型3種方法對(duì)中國(guó)的月度CPI數(shù)據(jù)進(jìn)行建模和預(yù)測(cè),結(jié)果表明BP-ARIMA組合模型預(yù)測(cè)效果最優(yōu)[10]。張建輝將趨勢(shì)模型的殘差時(shí)序數(shù)據(jù)作為BP神經(jīng)網(wǎng)絡(luò)的輸入數(shù)據(jù),訓(xùn)練能夠捕捉時(shí)序細(xì)微震蕩特征的殘差神經(jīng)網(wǎng)絡(luò),結(jié)合時(shí)序趨勢(shì)模型和殘差神經(jīng)網(wǎng)絡(luò),實(shí)現(xiàn)更為精準(zhǔn)的時(shí)間序列預(yù)測(cè)[11]。
博克斯-詹金斯(Box-Jenkins)提出的時(shí)間序列分析方法主要是用來(lái)解決數(shù)據(jù)中潛在的隨機(jī)性、平穩(wěn)性和季節(jié)性問(wèn)題。該方法基本的表現(xiàn)形式包括自回歸模型(AR)、移動(dòng)平均模型(MA)、自回歸移動(dòng)平均模型(ARMA)、整合移動(dòng)平均自回歸模型(ARIMA)。AR、MA和ARMA主要是針對(duì)平穩(wěn)序列數(shù)據(jù),然而本文研究GDP數(shù)據(jù)屬于非平穩(wěn)時(shí)間序列,其方差、均值將隨時(shí)間的變化而變化。由于非平穩(wěn)序列的不確定性較高,難以借助已知信息完成預(yù)測(cè),因此考慮使用ARIMA模型先對(duì)非平穩(wěn)序列進(jìn)行差分處理,將其轉(zhuǎn)化為平穩(wěn)序列之后,再進(jìn)行分析和預(yù)測(cè)。假設(shè)時(shí)間序列{Xt,t∈T}為非平穩(wěn)序列,{?dXt}表示經(jīng)過(guò)d階差分運(yùn)算后的平穩(wěn)序列,那么ARIMA(p,d,q)模型的表達(dá)式為
(1)
式中:B為延遲算子,BkXt=Xt-k;Φ(B)為自回歸系數(shù)多項(xiàng)式,Φ(B)=1+φ1B+φ2B2+…+φpBp;Θ(B)為移動(dòng)平均多項(xiàng)式,Θ(B)=1+θ1B+θ2B2+…+θqBq;εt為零均值的白噪聲序列。
ARIMA模型中參數(shù)p、d、q分別代表滯后期階數(shù)、差分階數(shù)和滯后隨機(jī)波動(dòng)項(xiàng)的階數(shù)。當(dāng)d=0時(shí),ARIMA(p,d,q)模型就是ARMA(p,q)模型;當(dāng)d=q=0時(shí),ARIMA(p,d,q)模型就是AR模型;當(dāng)d=p=0時(shí),ARIMA模型就是MA模型;當(dāng)d=q=p=0時(shí),ARIMA(0,0,0)就是白噪聲序列函數(shù)。ARIMA(p,d,q)模型中自回歸階數(shù)p和移動(dòng)平均階數(shù)q是通過(guò)自相關(guān)系數(shù)(ACF)和偏自相關(guān)系數(shù)(PACF)進(jìn)行確定。
ACF的公式為
ρt,s=Corr(Xt,Xs),t、s=0,±1,±2,…
(2)
PACF的公式為
φk=ρXt,Xt-k|Xt-1,…,Xt-k+1=
(3)
偏自相關(guān)系數(shù)只計(jì)算當(dāng)前期與k階滯后期的相關(guān)性:φk接近于±1時(shí),表示相關(guān)性增強(qiáng);φk接近于0時(shí),表示相關(guān)性減弱;φk=0時(shí),表示當(dāng)前期與k階滯后期不相關(guān)。
BP神經(jīng)網(wǎng)絡(luò)的基本思想是通過(guò)訓(xùn)練誤差反向傳播進(jìn)行參數(shù)修正,以梯度下降的方法尋找網(wǎng)絡(luò)結(jié)構(gòu)的輸出值與實(shí)際值之間的最小均方誤差[12]。Hecht-Nielsen的研究表明BP神經(jīng)網(wǎng)絡(luò)可以逼近任何一個(gè)非線性函數(shù)[13]。良好的擬合效果和簡(jiǎn)單的操作過(guò)程使BP神經(jīng)網(wǎng)絡(luò)得到不斷推廣和應(yīng)用。
BP神經(jīng)網(wǎng)絡(luò)主要由輸入層、隱藏層和輸出層3部分組成,其中輸入層和輸出層均為單層結(jié)構(gòu),而隱藏層可為多層結(jié)構(gòu)。BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過(guò)程主要分為兩個(gè)部分:①信息前向傳播,是指信息從輸入層傳入,經(jīng)過(guò)隱藏層神經(jīng)元的非線性映射,傳入輸出層輸出結(jié)果;②誤差向后傳播,是指通過(guò)比較輸出值與實(shí)際值的誤差,若超出預(yù)先設(shè)置的誤差閾值,則誤差信息逐步向后傳回,同時(shí)調(diào)整每一個(gè)隱藏層的權(quán)重,直到誤差在控制范圍之內(nèi)。
在解決預(yù)測(cè)問(wèn)題時(shí),BP神經(jīng)網(wǎng)絡(luò)主要有兩種應(yīng)用方式,一種是基于多因素的預(yù)測(cè),另一種是基于時(shí)間序列的預(yù)測(cè)。本文重點(diǎn)研究BP神經(jīng)網(wǎng)絡(luò)在時(shí)間序列方面預(yù)測(cè)應(yīng)用。例如:存在時(shí)間序列Xt,Xt+1,Xt+2,…,Xt+m,若要預(yù)測(cè)該序列之后t+m+k(k>0)時(shí)刻的值Xt+m+k,那么可以將Xt,Xt+1,Xt+2,…,Xt+m整體作為輸入變量,構(gòu)建Xt+m+k與過(guò)去m個(gè)值的函數(shù)關(guān)系。
BP神經(jīng)網(wǎng)絡(luò)的建模過(guò)程如下:
1)數(shù)據(jù)歸一化。BP神經(jīng)網(wǎng)絡(luò)模型對(duì)數(shù)據(jù)的量綱較為敏感,通常將原始數(shù)據(jù)進(jìn)行歸一化處理,使數(shù)據(jù)大小落在[0,1]范圍內(nèi),歸一化公式為
(4)
(5)
2)網(wǎng)絡(luò)結(jié)構(gòu)的確定。包括神經(jīng)網(wǎng)絡(luò)層數(shù)的確定,輸入層、隱藏層和輸出層節(jié)點(diǎn)數(shù)的確定,以及激活函數(shù)的選擇。
3)初始化各連接的權(quán)重和閾值。
4)輸入歸一化后的數(shù)據(jù),經(jīng)由神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)正向傳播。
5)觀察模型誤差是否在預(yù)設(shè)的范圍內(nèi)。若是,則建模過(guò)程結(jié)束;若否,則進(jìn)行反向傳播,重新計(jì)算各連接的權(quán)重和閾值,并返回上一步,直到模型的最小均方誤差小于設(shè)置的誤差要求。
6)利用訓(xùn)練后的模型進(jìn)行時(shí)間序列的預(yù)測(cè)。
組合模型的預(yù)測(cè)精度往往優(yōu)于單一模型??紤]到浙江省GDP的增長(zhǎng)趨勢(shì)受到不同因素的影響,是非平穩(wěn)序列。序列中既存在線性特征,也存在非線性特征。因此,本文將ARIMA模型和BP神經(jīng)網(wǎng)絡(luò)模型進(jìn)行組合,構(gòu)建預(yù)測(cè)模型,以期提升預(yù)測(cè)效果。組合模型的建立過(guò)程如下:
1)ARIMA模型預(yù)測(cè)浙江省GDP的線性部分。ARIMA模型的實(shí)質(zhì)是建立當(dāng)前期數(shù)據(jù)和滯后期數(shù)據(jù)之間的線性回歸,因此將ARIMA模型的預(yù)測(cè)結(jié)果作為組合模型的線性部分。此外,ARIMA模型預(yù)測(cè)結(jié)果中的殘差,即白噪聲,在序列的線性部分之外,不再適用于線性預(yù)測(cè)模式,需要通過(guò)非線性的預(yù)測(cè)方法提取潛在的價(jià)值信息。
2)BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)浙江省GDP的非線性部分。先對(duì)ARIMA模型預(yù)測(cè)所得的殘差序列進(jìn)行矩陣變換和歸一化處理,再通過(guò)訓(xùn)練的BP神經(jīng)網(wǎng)絡(luò)模型得到浙江省GDP時(shí)間序列非線性部分的預(yù)測(cè)值,最后將ARIMA模型的線性擬合值和BP神經(jīng)網(wǎng)絡(luò)模型的殘差預(yù)測(cè)值相加,即為組合模型的預(yù)測(cè)結(jié)果。
選取浙江省1978—2019年的全省GDP數(shù)據(jù)作為研究對(duì)象。將數(shù)據(jù)劃分為訓(xùn)練集和測(cè)試集兩部分,1978—2016年的39個(gè)GDP數(shù)據(jù)作為模型的訓(xùn)練集,2017—2019年的3個(gè)GDP數(shù)據(jù)作為模型的測(cè)試集。1978—2019年浙江省GDP數(shù)據(jù)見(jiàn)表1。
表1 1978—2019年浙江省GDP數(shù)據(jù)
觀察1978—2019年浙江省的GDP時(shí)間序列(圖1),發(fā)現(xiàn)GDP數(shù)值隨著時(shí)間的變化呈現(xiàn)上升的趨勢(shì),因此是一個(gè)非平穩(wěn)序列,需要進(jìn)行差分處理將其轉(zhuǎn)化為平穩(wěn)序列。
圖1 1978—2019年浙江省的GDP時(shí)間序列
為了消除浙江省GDP時(shí)間序列中的遞增趨勢(shì),對(duì)其進(jìn)行一階差分運(yùn)算和二階差分運(yùn)算,具體結(jié)果如圖2所示??梢园l(fā)現(xiàn),一階差分處理后的GDP時(shí)間序列仍然存在單調(diào)上升的趨勢(shì),是非平穩(wěn)序列;二階差分處理后,時(shí)序折線圍繞0值上下波動(dòng),符合平穩(wěn)序列的特征。
圖4 二階差分GDP時(shí)間序列的自相關(guān)函數(shù)和偏自相關(guān)函數(shù)
圖2 差分處理后的浙江省GDP時(shí)間序列
進(jìn)一步利用R語(yǔ)言tseries包中的adf.test函數(shù)對(duì)二階差分運(yùn)算后的GDP時(shí)間序列作ADF檢驗(yàn)(augmented dickey-fuller test),檢驗(yàn)結(jié)果如圖3所示。結(jié)果顯示ADF檢驗(yàn)的p值小于0.01,即拒絕序列存在單位ADF根的原假設(shè),說(shuō)明二階差分的浙江省GDP時(shí)間序列是靜止的,已經(jīng)成為平穩(wěn)序列。
圖3 ADF檢驗(yàn)結(jié)果
通過(guò)觀察自相關(guān)函數(shù)ACF和偏自相關(guān)函數(shù)PACF(圖4),確定ARIMA模型中的p和q兩個(gè)參數(shù),即滯后波動(dòng)項(xiàng)的階數(shù)和滯后項(xiàng)的階數(shù)。二階差分GDP時(shí)間序列在2階延遲位置的自相關(guān)性最大(2階截尾),偏自相關(guān)性同樣在延遲階數(shù)為2時(shí)達(dá)到最大(2階截尾),這表明可以構(gòu)建ARIMA(2,2,2)模型。但是,僅僅通過(guò)圖像確定的p值和q值可能有失偏頗,因此本文考慮以ACF圖和PACF圖為參考,利用赤池信息量準(zhǔn)則(akaike information criterion,AIC)檢驗(yàn)多對(duì)不同的模型參數(shù),從而選取使得模型結(jié)果最優(yōu)的階數(shù)。
從二階差分GDP時(shí)間序列的ACF圖和PACF圖中選取若干可能的參數(shù)對(duì),擬合模型并計(jì)算AIC值,具體結(jié)果見(jiàn)表2。AIC的值越小,模型的擬合效果越好。結(jié)果表明,AIC值最小的是ARIMA(2,2,0),因此本文確定其為擬合浙江省GDP時(shí)間序列的最優(yōu)模型。
表2 不同ARIMA模型所對(duì)應(yīng)的AIC值
通過(guò)觀察模型殘差序列的ACF圖(圖5),發(fā)現(xiàn)自相關(guān)系數(shù)全部落于置信區(qū)間內(nèi),說(shuō)明殘差序列中不存在自相關(guān)性。此外,利用R語(yǔ)言中Box.test函數(shù)對(duì)殘差序列進(jìn)行Ljung-Box檢驗(yàn),如圖6所示;結(jié)果顯示P值為0.529,遠(yuǎn)遠(yuǎn)大于0.05,即接受序列平穩(wěn)的原假設(shè),證明模型的殘差序列為白噪聲序列。
圖5 殘差序列ACF圖
圖6 Ljung-Box檢驗(yàn)結(jié)果
運(yùn)用訓(xùn)練數(shù)據(jù)所確定的ARIMA(2,2,0)模型,預(yù)測(cè)2017—2019年3年的浙江省GDP,預(yù)測(cè)結(jié)果如圖7所示。
圖7 ARIMA(2,2,0)模型預(yù)測(cè)結(jié)果
基于絕對(duì)誤差和相對(duì)誤差比較浙江省GDP的預(yù)測(cè)值和真實(shí)值,以評(píng)估模型的預(yù)測(cè)效果。絕對(duì)誤差等于真實(shí)值減去預(yù)測(cè)值,相對(duì)誤差等于絕對(duì)誤差的絕對(duì)值除以真實(shí)值。模型預(yù)測(cè)結(jié)果見(jiàn)表3。
一般而言,相對(duì)誤差在10%以內(nèi)時(shí),可以認(rèn)為模型預(yù)測(cè)是有效的[14]。由表3可知,模型預(yù)測(cè)結(jié)果的平均相對(duì)誤差為6.30%。因此,根據(jù)時(shí)間序列預(yù)測(cè)方法所構(gòu)建的ARIMA(2,2,0)模型,可以有效地預(yù)測(cè)浙江省GDP。
表3 ARIMA模型預(yù)測(cè)結(jié)果分析
1)確定模型的網(wǎng)絡(luò)層數(shù)。BP神經(jīng)網(wǎng)絡(luò)的層數(shù)過(guò)多,會(huì)導(dǎo)致訓(xùn)練過(guò)程復(fù)雜,出現(xiàn)數(shù)據(jù)過(guò)擬合的情況;網(wǎng)絡(luò)層數(shù)過(guò)少,則無(wú)法充分挖掘數(shù)據(jù)價(jià)值,導(dǎo)致模型預(yù)測(cè)能力不足。以往研究表明,三層BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)能夠準(zhǔn)確擬合任何非線性的連續(xù)函數(shù)[15]。因此,本文采用包含1個(gè)隱藏層的三層BP神經(jīng)網(wǎng)絡(luò)模型進(jìn)行浙江省GDP預(yù)測(cè)。
2)確定輸入層的神經(jīng)元節(jié)點(diǎn)數(shù)。利用BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)浙江省GDP時(shí)間序列,需要將時(shí)序值通過(guò)移動(dòng)窗口的方式建立一個(gè)輸入矩陣。輸入節(jié)點(diǎn)數(shù)過(guò)多,會(huì)減小模型運(yùn)行速度;輸入節(jié)點(diǎn)數(shù)太少,會(huì)降低模型預(yù)測(cè)精度。因此,本文依次選取GDP時(shí)序的5個(gè)數(shù)據(jù)作為輸入向量,之后的1個(gè)數(shù)據(jù)作為輸出向量,建立前5個(gè)數(shù)據(jù)和之后1個(gè)數(shù)據(jù)的映射關(guān)系。39個(gè)浙江省GDP時(shí)序值可以產(chǎn)生34個(gè)輸入樣本,見(jiàn)表4。表4中的前34行數(shù)據(jù)為訓(xùn)練集輸入樣本,第35行數(shù)據(jù)為測(cè)試集輸入樣本。根據(jù)BP神經(jīng)網(wǎng)絡(luò)對(duì)于輸入數(shù)據(jù)的要求,需要將原始數(shù)據(jù)集進(jìn)行歸一化處理。
通過(guò)Kolmogorov定理可以得到最佳的隱藏層神經(jīng)元節(jié)點(diǎn)數(shù)目,然后在理論的最佳節(jié)點(diǎn)數(shù)目附近選取若干值進(jìn)行程序試驗(yàn),最終確定使得模型誤差最小的隱藏層神經(jīng)元節(jié)點(diǎn)數(shù)。Kolmogorov定理的公式為
n2=2n1+1
(6)
式中:n1為輸入層神經(jīng)元;n2為隱藏層神經(jīng)元。
3)選取合適的激活函數(shù)。根據(jù)以往的經(jīng)驗(yàn)和研究,本文選取具有良好的非線性映射能力的tan-sigmoid函數(shù)作為激活函數(shù),同時(shí)選取線性函數(shù)purelin作為輸出層的函數(shù)。
通過(guò)數(shù)據(jù)預(yù)處理和確定的網(wǎng)絡(luò)結(jié)構(gòu),借助R語(yǔ)言中的AMORE包構(gòu)建BP神經(jīng)網(wǎng)絡(luò)模型,并且實(shí)現(xiàn)浙江省GDP時(shí)間序列的預(yù)測(cè)。將表4中第35行數(shù)據(jù)作為測(cè)試樣本輸入訓(xùn)練后的模型,計(jì)算得到第一個(gè)預(yù)測(cè)值;測(cè)試樣本向后滑動(dòng),依次計(jì)算得到剩余兩個(gè)預(yù)測(cè)值,見(jiàn)表5。
為了得到最終的GDP預(yù)測(cè)值,需要將模型輸出的直接結(jié)果進(jìn)行逆歸一化處理。通過(guò)計(jì)算絕對(duì)誤差和相對(duì)誤差,分析模型的預(yù)測(cè)效果,見(jiàn)表6。
表4 BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練集樣本
表5 BP神經(jīng)網(wǎng)絡(luò)測(cè)試樣本
表6 BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)結(jié)果分析
基于BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)浙江省2017—2019年的GDP數(shù)值。模型預(yù)測(cè)結(jié)果的平均相對(duì)誤差為13.10%,說(shuō)明模型的有效性不充分。此外,模型的相對(duì)誤差隨著預(yù)測(cè)年份的增大而增大,說(shuō)明模型的預(yù)測(cè)效果不穩(wěn)定。由此可見(jiàn),單一的BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)效果不夠理想。
選擇ARIMA(2,2,0)模型擬合浙江省GDP時(shí)間序列,并得到模型的39個(gè)殘差值,見(jiàn)表7。
神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)確定為3層,經(jīng)過(guò)比較和驗(yàn)證,輸入層設(shè)置3個(gè)神經(jīng)元,輸出層設(shè)置1個(gè)神經(jīng)元,所以39個(gè)殘差值滑動(dòng)生成36個(gè)訓(xùn)練數(shù)據(jù),其中第37行數(shù)據(jù)作為測(cè)試樣本。經(jīng)過(guò)歸一化處理后的殘差序列可以作為BP神經(jīng)網(wǎng)絡(luò)模型輸入矩陣,見(jiàn)表8。
由Kolmogorov定理可知,模型隱藏層最佳的神經(jīng)元節(jié)點(diǎn)個(gè)數(shù)為7。隱藏層選擇tan-sigmoid函數(shù),輸出層選擇purelin函數(shù)。借助R語(yǔ)言中的AMORE包構(gòu)建BP神經(jīng)網(wǎng)絡(luò)模型,設(shè)置網(wǎng)絡(luò)結(jié)構(gòu)參數(shù),并將36個(gè)殘差訓(xùn)練數(shù)據(jù)導(dǎo)入模型。利用訓(xùn)練完的模型擬合測(cè)試樣本的Y值,然后依次滑動(dòng)擬合得到其他兩個(gè)殘差序列的預(yù)測(cè)值。最后,將預(yù)測(cè)的3個(gè)殘差值進(jìn)行逆歸一化處理,并與ARIMA模型擬合的GDP預(yù)測(cè)值相加,得到組合模型的預(yù)測(cè)結(jié)果,見(jiàn)表9。
表7 ARIMA(2,2,0)模型預(yù)測(cè)殘差序列
表8 殘差序列樣本集
表9 組合模型預(yù)測(cè)結(jié)果分析
基于組合模型預(yù)測(cè)浙江省2017—2019年的GDP值,模型結(jié)果的平均相對(duì)誤差是6.08%,優(yōu)于ARIMA(2,2,0)模型和單一的BP神經(jīng)網(wǎng)絡(luò)模型。因此,通過(guò)將ARIMA模型和BP神經(jīng)網(wǎng)絡(luò)進(jìn)行組合,可以得到更為準(zhǔn)確的GDP預(yù)測(cè)結(jié)果。
區(qū)域經(jīng)濟(jì)的發(fā)展和高速公路的建設(shè)緊密聯(lián)系。經(jīng)濟(jì)發(fā)展態(tài)勢(shì)好、增速快,有利于推進(jìn)高速公路的建設(shè),促進(jìn)產(chǎn)業(yè)結(jié)構(gòu)的轉(zhuǎn)型升級(jí);高速路網(wǎng)密度高、布局優(yōu),有利于帶動(dòng)區(qū)域經(jīng)濟(jì)的發(fā)展,加強(qiáng)生產(chǎn)生活的穩(wěn)定有序。GDP是衡量區(qū)域經(jīng)濟(jì)發(fā)展水平的一個(gè)基本指標(biāo)。及時(shí)準(zhǔn)確地了解GDP的變化趨勢(shì),可以更加科學(xué)合理地規(guī)劃高速路網(wǎng)。
基于浙江省1978—2019年的GDP數(shù)據(jù),分別構(gòu)建3個(gè)預(yù)測(cè)模型,分析GDP的未來(lái)走勢(shì)。①ARIMA模型:先將非平穩(wěn)的時(shí)間序列進(jìn)行差分處理轉(zhuǎn)為平穩(wěn)時(shí)序,再通過(guò)ACF圖、PACF圖以及AIC值確定模型參數(shù),最后建立ARIMA(2,2,0)模型進(jìn)行預(yù)測(cè)分析。②BP神經(jīng)網(wǎng)絡(luò)模型:先將GDP時(shí)序值以移動(dòng)窗口的方式生成訓(xùn)練集和測(cè)試集,再確定BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)、激活函數(shù)和各層的神經(jīng)元節(jié)點(diǎn)數(shù),最后用訓(xùn)練數(shù)據(jù)建立預(yù)測(cè)模型,并用測(cè)試數(shù)據(jù)評(píng)估模型預(yù)測(cè)效果。③組合模型:先利用ARIMA(2,2,0)模型得到GDP時(shí)間序列的預(yù)測(cè)值,再利用BP神經(jīng)網(wǎng)絡(luò)模型得到GDP時(shí)序的殘差預(yù)測(cè)值,最后將兩個(gè)預(yù)測(cè)值相加得到組合模型的預(yù)測(cè)結(jié)果。通過(guò)計(jì)算3個(gè)模型的相對(duì)誤差并進(jìn)行比較,發(fā)現(xiàn)組合模型的預(yù)測(cè)準(zhǔn)確度最高。