擺倩倩 吳薇薇 陸燕楠 魏文斌 張 潔
(南京航空航天大學(xué)民航學(xué)院 南京 210016)
目前國內(nèi)民航機場運營收入的主要來源仍為航空性業(yè)務(wù)收入,多數(shù)機場尤其欠發(fā)達地區(qū)的支線機場仍處于依靠客貨吞吐量增長帶動收入增長的初級發(fā)展階段[1],客流量的大小直接影響民航機場航空性收入的多少.客流預(yù)測一直是民航業(yè)備受關(guān)注的研究領(lǐng)域,國內(nèi)外學(xué)者對機場客流量預(yù)測的研究成果大致分為線性和非線性理論的預(yù)測方法.基于線性理論的預(yù)測方法有時間序列模型、灰色模型等[2]雖取得了較高的預(yù)測精度,但普遍存在無法反映非線性部分變化規(guī)律的問題.非線性預(yù)測方法主要有神經(jīng)網(wǎng)絡(luò)、支持向量機等,多數(shù)從機場客流歷史數(shù)據(jù)本身挖掘有效信息.
近年國內(nèi)支線機場建設(shè)的大發(fā)展加劇了多機場環(huán)境下鄰近機場間的客流競爭態(tài)勢[3],單純的線性回歸模型已經(jīng)無法對復(fù)雜因素影響下的機場客流量做出準確的預(yù)測.神經(jīng)網(wǎng)絡(luò)具有較強的非線性映射能力[4],本文選取GDP、全年接待游客數(shù)量及鄰近樞紐機場的旅客吞吐量為自變量[5],構(gòu)造Elman神經(jīng)網(wǎng)絡(luò)與多元線性回歸[6-7]的串聯(lián)組合預(yù)測模型,對支線機場的客流量進行預(yù)測.以江蘇地區(qū)支線機場——常州奔牛機場(以下簡稱常州機場)的客流預(yù)測為例驗證模型的有效性.結(jié)果表明,Elman神經(jīng)網(wǎng)絡(luò)在多指標同步預(yù)測方面的穩(wěn)定性較好,模型整體性能優(yōu)于傳統(tǒng)的計量經(jīng)濟模型,取得了較好的預(yù)測結(jié)果.
本文結(jié)合《常州市國民經(jīng)濟和社會發(fā)展統(tǒng)計公報》與《南京市國民經(jīng)濟和社會發(fā)展統(tǒng)計公報》中2001—2015年的相關(guān)數(shù)據(jù),選取常州市GDP(x1)、常州市全年接待游客數(shù)量(x2)、南京祿口機場旅客吞吐量(x3)為自變量對常州機場旅客吞吐量(y)進行預(yù)測[8].
(1)
(2)
運用SPSS進行相關(guān)性分析,結(jié)果見表2.
由表2可知,各指標與因變量間的相關(guān)系數(shù)均大于90%,存在顯著的相關(guān)關(guān)系.
表1 常州機場旅客吞吐量及相關(guān)指標的歷史數(shù)據(jù)
表2 指標相關(guān)性分析
1.3.1Elman神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)
Elman神經(jīng)網(wǎng)絡(luò)是一種具有局部記憶和局部反饋連接功能的遞歸神經(jīng)網(wǎng)絡(luò),通過在BP神經(jīng)網(wǎng)絡(luò)基本結(jié)構(gòu)的基礎(chǔ)上加入一個承接層,將隱含層的輸出進行延遲與存儲,并自聯(lián)到隱含層的輸入.這種自聯(lián)方式在增強網(wǎng)絡(luò)對歷史數(shù)據(jù)敏感性的同時更好的實現(xiàn)了數(shù)據(jù)的動態(tài)映射,適用于時間序列問題的動態(tài)建模.
設(shè)網(wǎng)絡(luò)的輸入層包含r個節(jié)點,隱含層和承接層均包含n個節(jié)點,輸出層包含m個節(jié)點.則輸入向量I(k)∈Rr,輸出向量O(k)∈Rm,隱含層輸出向量x(k)∈Rn*n,承接層輸出向量xc(k)∈Rn*n.f,g分別為輸出層、隱含層的傳遞函數(shù).
網(wǎng)絡(luò)的數(shù)學(xué)模型為
xk=f(wCxc(k)+wHI(k-1))
(3)
xc(k)=x(k-1)
(4)
o(k)=g(wOx(k))
(5)
式中:wH,wC,wO分別為輸入層與隱含層、隱含層與承接層、隱含層與輸出層之間的連接權(quán)陣,wH∈Rn×r,wC∈Rn×n,wO∈Rn×m.
1.3.2Elman神經(jīng)網(wǎng)絡(luò)權(quán)值修正的學(xué)習算法
設(shè)訓(xùn)練集為(I(k),Od(k)),網(wǎng)絡(luò)實際輸出為{O(k)},k=1,2,…,N.其中:
I(k)={I1(k),I2(k),…,Ir(k)}T,Od(k)=
{Od1(k),Od2(k),…,Odm(k)}T,O(k)=
{O1(k),O2(k),…,Om(k)}T
設(shè)網(wǎng)絡(luò)各層神經(jīng)元的輸入輸出分別為μ、O,如隱含層第i個神經(jīng)元在k時刻的輸入、輸出分別為μi(k),Oi(k);輸出層第j個神經(jīng)元的輸入、輸出分別為μj(k),Oj(k).
Oi(k)=g(μi(k))
(6)
Oj(k)=f(μj(k))
(7)
由于動態(tài)遞歸網(wǎng)絡(luò)的輸出與當前及過去時刻的輸入信號均有關(guān),因而必須采用動態(tài)學(xué)習規(guī)則.本文對遞歸網(wǎng)絡(luò)學(xué)習算法的研究采用有序鏈式法則.
令ej(k)為第j個輸出節(jié)點在k時刻期望輸出與實際輸出值之間的誤差,即
ej(k)=Odj(k)-Oj(k)
(8)
定義k時刻網(wǎng)絡(luò)權(quán)值調(diào)整的誤差函數(shù)為
(9)
修正后的權(quán)值計算公式為
w(k+1)=Δw(k)+w(k)
(10)
下面以隱含層與輸出層的之間的權(quán)值調(diào)整為例,分析逐層反向調(diào)整網(wǎng)絡(luò)權(quán)值的具體步驟:
(11)
根據(jù)微分鏈式法則
-ej(k)f′(μj(k))Oi(k)
(12)
權(quán)值修正量為
(13)
引入局部梯度的定義
ej(k)f′(μj(k))
(14)
則式(13)更新為
(15)
采用上述有序鏈式法則對圖1中的權(quán)值進行調(diào)整.
(16)
同理,隱含層的權(quán)值為
(17)
關(guān)聯(lián)層的權(quán)值為
(18)
1) Elman神經(jīng)網(wǎng)絡(luò)預(yù)測的樣本數(shù)據(jù)劃分 以常州機場2001-2013年(下文分別以1~13表示)的指標數(shù)據(jù)為基礎(chǔ),構(gòu)造訓(xùn)練樣本矩陣:
pk=(x1k,x2k,x3k),k=1,2…,13
(19)
式中:k為指標數(shù)據(jù)取自的年份.
令P1=p1:p4,P2=p2:p5,…,P10=p10:p13則訓(xùn)練樣本矩陣T為
T=[P1,P2…,P10]=
(20)
以P1為例:p1:p3為模型輸入,p4為模型的目標輸出,依此類推,相當于一個時間序列問題,可以通過Elman神經(jīng)網(wǎng)絡(luò)進行預(yù)測.其映射函數(shù)表示為
pk=f(pk-1,pk-2,pk-3),k=4,5…,13
(21)
2) 神經(jīng)網(wǎng)絡(luò)的參數(shù)設(shè)置 反復(fù)訓(xùn)練并不斷調(diào)整神經(jīng)網(wǎng)絡(luò)的參數(shù)設(shè)置,對比發(fā)現(xiàn),當隱含層節(jié)點數(shù)為9,學(xué)習速率為0.05,最大訓(xùn)練次數(shù)為10 000時,網(wǎng)絡(luò)的預(yù)測誤差最小且預(yù)測性能穩(wěn)定.
Elman神經(jīng)網(wǎng)絡(luò)測試樣本輸出數(shù)據(jù)反歸一化處理后的結(jié)果見表3,預(yù)測誤差率圖見圖1.
表3 Elman神經(jīng)網(wǎng)絡(luò)測試樣本指標輸出結(jié)果
圖1 Elman神經(jīng)網(wǎng)絡(luò)預(yù)測誤差率圖
由于支線機場客流量大小還受到外來流動人口數(shù)量、旅客出行時間成本、地面交通可達性等隨地區(qū)經(jīng)濟、發(fā)展現(xiàn)狀等快速變化且不易量化因素的影響,本文僅選取近三年的客流量數(shù)據(jù)進行模型驗證.驗證結(jié)果顯示,模型對13,14,15年指標預(yù)測值的平均誤差率分別為1.53%,3%,7.5%,雖呈現(xiàn)一定的誤差累積趨勢,但仍小于10%,說明該神經(jīng)網(wǎng)絡(luò)對多指標預(yù)測的效果較好.模型訓(xùn)練過程的誤差下降曲線見圖2.
圖2 Elman神經(jīng)網(wǎng)絡(luò)訓(xùn)練誤差下降曲線圖
用訓(xùn)練好的網(wǎng)絡(luò)對2016-2018年指標值進行預(yù)測,結(jié)果見表4.
表4 Elman神經(jīng)網(wǎng)絡(luò)指標預(yù)測結(jié)果
本節(jié)仍以表1所示歷史數(shù)據(jù)為基礎(chǔ),常州機場年旅客吞吐量作為被解釋變量,常州GDP、常州全年游客量、南京機場旅客吞吐量作為解釋變量,構(gòu)建多元線性回歸模型,表達式為
(22)
式中:k=1,2,…,12;α0,α1,α2,α3為模型中各影響因素的回歸系數(shù).
運用Matlab對上述指標數(shù)據(jù)進行多元線性回歸分析,結(jié)果見表5.
表5 回歸模型系數(shù)、系數(shù)置信區(qū)間與統(tǒng)計量
由圖3可知,樣本殘差均勻分布在合理的區(qū)間范圍內(nèi),未出現(xiàn)異常的數(shù)據(jù)觀測點.R2=0.982 8,接近于1,表明模型擬合程度較好.F=152.120 5,p=0<0.05,說明模型的線性關(guān)系在95%的置信水平下顯著成立.
圖3 殘差杠桿圖
回歸模型為
y=-0.005 5+0.564 5x1+
0.622 1x2-0.392 8x3
(23)
分別將2013—2015年的指標實際值與Elman神經(jīng)網(wǎng)絡(luò)輸出的指標預(yù)測值帶入式(23),對常州機場客流量進行預(yù)測并將結(jié)果反歸一化處理,分析比較不同模型的預(yù)測精度,結(jié)果見表6.
表6 常州機場旅客吞吐量預(yù)測結(jié)果對比
由表6可知,單純的多元線性回歸模型預(yù)測誤差率均大于15%,結(jié)合Elman神經(jīng)網(wǎng)絡(luò)指標預(yù)測的多元線性回歸模型的平均誤差率為8%.其中2014年的預(yù)測誤差明顯大于其他年份.
2014年南京機場啟用T2航站樓,與新航站樓配套的停車場、地鐵機場線、長途大巴等公共交通設(shè)施齊全,大大提高了機場的服務(wù)能力.數(shù)據(jù)顯示,2015年南京祿口機場旅客增量為往年的3倍,可視為指標數(shù)據(jù)增長的異常值,導(dǎo)致常州機場2014年的吞吐量預(yù)測結(jié)果出現(xiàn)較大誤差,符合實際情況.
對常州機場2016-2018年的旅客吞吐量預(yù)測結(jié)果見表7.
表7 常州機場2016-2018年旅客吞吐量預(yù)測結(jié)果
Elman神經(jīng)網(wǎng)絡(luò)因結(jié)構(gòu)中包含特殊的延時算子而具備記憶隱含層神經(jīng)元前一時刻輸出值的特性.模型通過修正前饋連接部分的連接權(quán)矯正并提高了預(yù)測精度,憑借神經(jīng)網(wǎng)絡(luò)良好的學(xué)習能力實現(xiàn)了多個指標的同步預(yù)測,避免了傳統(tǒng)指標預(yù)測方法造成的誤差累積,在此基礎(chǔ)上結(jié)合多元線性回歸模型取得了誤差相對較小的預(yù)測結(jié)果;然而目前的研究成果仍存在缺點和不足:由于部分指標數(shù)據(jù)的獲取受到限制,本文僅考慮鄰近機場對客流的競爭,而地面交通(尤其高鐵)亦對民航旅客存在明顯的分流作用,對于民航與地面交通運輸方式間的客流競爭關(guān)系,有待進一步研究.