邢志偉,唐云霄,羅 謙
(1.中國(guó)民航大學(xué) 電子信息與自動(dòng)化學(xué)院,天津 300300; 2.中國(guó)民航局第二研究所 信息技術(shù)分公司,成都 610041)
(*通信作者電子郵箱534342497@qq.com)
基于貝葉斯網(wǎng)絡(luò)的航班保障服務(wù)時(shí)間動(dòng)態(tài)估計(jì)
邢志偉1*,唐云霄1,羅 謙2
(1.中國(guó)民航大學(xué) 電子信息與自動(dòng)化學(xué)院,天津 300300; 2.中國(guó)民航局第二研究所 信息技術(shù)分公司,成都 610041)
(*通信作者電子郵箱534342497@qq.com)
針對(duì)航班保障服務(wù)時(shí)間估計(jì)的問(wèn)題,考慮到航班保障服務(wù)流程的特殊性、復(fù)雜性以及影響因素的不確定性,提出了一種基于貝葉斯網(wǎng)絡(luò)(BN)的航班保障服務(wù)時(shí)間估計(jì)模型。該模型把航空領(lǐng)域的專家知識(shí)與歷史數(shù)據(jù)的機(jī)器學(xué)習(xí)相結(jié)合,使用貝葉斯網(wǎng)絡(luò)的增量學(xué)習(xí)特性動(dòng)態(tài)地調(diào)整BN模型,使其適應(yīng)新的變化,進(jìn)而不斷更新航班保障服務(wù)時(shí)間的估計(jì)值。使用國(guó)內(nèi)某大型樞紐機(jī)場(chǎng)信息系統(tǒng)內(nèi)提取的數(shù)據(jù),通過(guò)期望最大化(EM)方法對(duì)模型進(jìn)行訓(xùn)練,得到了測(cè)試結(jié)果。實(shí)驗(yàn)結(jié)果分析與模型評(píng)價(jià)表明,所提方法能有效估計(jì)航班保障服務(wù)時(shí)間且具有較高的準(zhǔn)確度。敏感性分析表明,航班到達(dá)時(shí)段的航班密度對(duì)航班保障服務(wù)時(shí)間影響最強(qiáng)。
航班保障服務(wù);機(jī)器學(xué)習(xí);貝葉斯網(wǎng)絡(luò);增量學(xué)習(xí);期望最大化;敏感性分析
航班延誤一直是困擾民航發(fā)展的瓶頸問(wèn)題。據(jù)統(tǒng)計(jì),航班保障服務(wù)是影響航班延誤的主要因素,對(duì)于航班保障服務(wù)環(huán)節(jié), 目前國(guó)內(nèi)外的研究成果大多集中在仿真分析、調(diào)度優(yōu)化或者流程優(yōu)化, 而對(duì)航班保障服務(wù)時(shí)間估計(jì)的研究極少涉及。Garcia等[1]提出了基于Agent的航班地面保障服務(wù)調(diào)度分布式控制方法,優(yōu)化了其調(diào)度過(guò)程。Andreatta等[2]提出了一種快速啟發(fā)式方法對(duì)航班保障設(shè)備和人員進(jìn)行優(yōu)化分配,提高了保障服務(wù)的效率。郝靜麒等[3]用改進(jìn)的離散事件仿真策略與動(dòng)態(tài)分配法研究平臺(tái)車資源分配問(wèn)題。黃鸝詩(shī)[4]對(duì)機(jī)坪車輛進(jìn)行仿真研究,使用SIMIO 軟件實(shí)現(xiàn)了保障設(shè)備的仿真,但是其研究未考慮車輛的損壞率。Cheung等[5]提出了航班過(guò)站保障設(shè)備調(diào)度的遺傳算法并用此算法優(yōu)化了清水車與拖車的調(diào)度,但此算法未考慮保障設(shè)備的容量約束。在仿真平臺(tái)Service model上實(shí)現(xiàn)了平臺(tái)車資源的貨物裝卸流程仿真,孫瑞山等[6]用關(guān)鍵路徑法(Critical Path Method, CPM)研究航班保障服務(wù)工作,找出了對(duì)保障服務(wù)有較大影響的幾種服務(wù)項(xiàng)目并提出三點(diǎn)建議。為保障服務(wù)正常進(jìn)行提供了參考,但其定量分析有待豐富。丁建立等[7]選取航班過(guò)站實(shí)際運(yùn)行的歷史數(shù)據(jù),采用最大似然估計(jì)進(jìn)行貝葉斯網(wǎng)參數(shù)學(xué)習(xí)來(lái)估計(jì)航班過(guò)站時(shí)間,取得了較好的效果,但此方式僅對(duì)完備數(shù)據(jù)集效果明顯,處理缺失或稀疏數(shù)據(jù)時(shí)會(huì)產(chǎn)生較大偏差。
基于以上分析,本文著眼于航班保障服務(wù)時(shí)間估計(jì)這一國(guó)內(nèi)外學(xué)者極少涉及但又具有實(shí)際研究意義的課題,以更小的尺度對(duì)航班過(guò)站的細(xì)節(jié)進(jìn)行研究,以提高航班保障效率,減少因航班保障引起的延誤。鑒于航班保障服務(wù)過(guò)程的特殊性、復(fù)雜性以及影響因素的不確定性,在研究方法上本文基于貝葉斯網(wǎng)絡(luò)(Bayesian Network, BN)重點(diǎn)研究對(duì)航班保障服務(wù)時(shí)間的動(dòng)態(tài)估計(jì)。貝葉斯網(wǎng)絡(luò)具有對(duì)歷史信息要求低、可以進(jìn)行信息不完全或不確定情況下的推理、可理解性和邏輯性良好、推理結(jié)果說(shuō)服力強(qiáng)等優(yōu)點(diǎn),通過(guò)構(gòu)建航班保障服務(wù)時(shí)間BN模型,不斷地對(duì)歷史數(shù)據(jù)進(jìn)行機(jī)器學(xué)習(xí),動(dòng)態(tài)調(diào)整BN模型來(lái)估計(jì)航班保障服務(wù)時(shí)間。實(shí)驗(yàn)結(jié)果分析和模型評(píng)價(jià)表明本方法能有效估計(jì)航班保障服務(wù)時(shí)間。為機(jī)場(chǎng)及其相關(guān)部門的應(yīng)急指揮管理提供及時(shí)的預(yù)警信息,從而減少因保障環(huán)節(jié)引起的負(fù)面影響,降低旅客極端事件的發(fā)生率。
1.1 航班保障服務(wù)流程分析
單個(gè)航班保障服務(wù)作業(yè)流程可以大致抽象為圖1所示,根據(jù)對(duì)作業(yè)流程的分析,可以將保障作業(yè)分為航食服務(wù)、客艙清潔服務(wù)、貨艙服務(wù)、加油服務(wù)、機(jī)務(wù)巡檢5個(gè)并行工作流程,某些并行工作流中又包含串行子工作流。各項(xiàng)服務(wù)工作間不僅有一定的先后關(guān)系而且還存在邏輯次序,共同構(gòu)成了航班保障服務(wù)作業(yè)流程。在航班保障服務(wù)過(guò)程中,保障服務(wù)車輛都應(yīng)該及時(shí)到位且按規(guī)定次序進(jìn)行服務(wù)作業(yè),如果某種特種車輛到位不及時(shí),將造成某項(xiàng)服務(wù)的延誤,進(jìn)而波及后續(xù)服務(wù)作業(yè),產(chǎn)生延誤波及效應(yīng)[8]。保障調(diào)度人員在進(jìn)行調(diào)度特種設(shè)備時(shí),需要考慮飛機(jī)對(duì)機(jī)場(chǎng)特種設(shè)備占用的排它性和航班過(guò)站時(shí)間的約束性。參與服務(wù)的特種車輛需要考慮航班時(shí)刻、機(jī)型、數(shù)量數(shù)以及保障服務(wù)車輛的行駛路徑等因素,因此,航班保障服務(wù)作業(yè)會(huì)受到資源數(shù)量的限制。總之,航班保障服務(wù)作業(yè)一個(gè)多種設(shè)備動(dòng)態(tài)協(xié)作、服務(wù)流程串行與并行共存、對(duì)資源的時(shí)間與空間要求嚴(yán)格的問(wèn)題。其他方式建模時(shí),不僅數(shù)學(xué)語(yǔ)言表達(dá)或者量化這些復(fù)雜關(guān)系比較困難,而且往往很難得到準(zhǔn)確值。貝葉斯網(wǎng)絡(luò)的優(yōu)越性恰能彌補(bǔ)它們的不足,實(shí)現(xiàn)對(duì)航班保障服務(wù)時(shí)間的動(dòng)態(tài)估計(jì)。
圖1 航班保障服務(wù)作業(yè)流程
1.2 航班保障服務(wù)時(shí)間影響因素分析
根據(jù)機(jī)場(chǎng)實(shí)際運(yùn)行數(shù)據(jù),本文采用因子分析(Factor Analysis)法[9]對(duì)影響航班保障服務(wù)時(shí)間的各種因素進(jìn)行了初步篩選,從中得到5個(gè)能產(chǎn)生較大影響的因素。
1) 前項(xiàng)服務(wù)延誤時(shí)間。由航班保障服務(wù)流程特性分析可知,航班保障服務(wù)包含大大小小幾十種服務(wù)項(xiàng)目,各項(xiàng)服務(wù)之間先后關(guān)系與邏輯關(guān)系并存,串聯(lián)流程與并聯(lián)流程共存。它們井然有序的進(jìn)行是航班保障服務(wù)順利完成的前提,但如果種種因素導(dǎo)致某項(xiàng)服務(wù)未按規(guī)定完成,將導(dǎo)致后續(xù)服務(wù)無(wú)法正常進(jìn)行,最終導(dǎo)致航班延誤,并且服務(wù)延誤發(fā)生越早,對(duì)整個(gè)保障過(guò)程的影響越嚴(yán)重。
2) 保障資源量。機(jī)場(chǎng)在投入使用之前,會(huì)按預(yù)計(jì)吞吐量和起降航班數(shù)量對(duì)保障設(shè)備數(shù)量進(jìn)行估計(jì),尋求一個(gè)既能滿足民航局文件規(guī)定的保障服務(wù)時(shí)限又能節(jié)約資源經(jīng)費(fèi)的設(shè)備量最優(yōu)值。在實(shí)際運(yùn)行過(guò)程中,設(shè)備的損壞、更新以及增添都將直接影響保障服務(wù)時(shí)間,增添和更新設(shè)備利于保障服務(wù),設(shè)備損壞則易使保障服務(wù)無(wú)法按時(shí)完成。
3) 航班密度。機(jī)場(chǎng)每天的航班密度明顯存在波動(dòng)。高密度情況下,有限的保障設(shè)備將連續(xù)提供服務(wù),服務(wù)項(xiàng)目產(chǎn)生延誤的幾率也隨之升高。反之,低密度時(shí)保障設(shè)備充足,可以滿足保障服務(wù)需求,保障服務(wù)就可能提前完成。
4) 機(jī)型差異。民航局制定的《機(jī)場(chǎng)航班運(yùn)行保障標(biāo)準(zhǔn)》按飛機(jī)座位數(shù)將機(jī)型分類,E類:351座以上;D類:251~350座;C類:151~250座;B類:61~150座;A類:60座以下。座位數(shù)越多的機(jī)型保障服務(wù)占用的時(shí)間越久,因此,集中到港的大機(jī)型將長(zhǎng)時(shí)間占用保障設(shè)備,致使其他航班等待某項(xiàng)服務(wù)的時(shí)間延長(zhǎng),從而保障服務(wù)時(shí)間延長(zhǎng)。
5) 旅客因素。按照標(biāo)準(zhǔn),航班停放近機(jī)位時(shí),登機(jī)口關(guān)閉時(shí)間不應(yīng)晚于航班計(jì)劃關(guān)艙門時(shí)間/預(yù)計(jì)關(guān)艙門時(shí)間前5 min。航班停放遠(yuǎn)機(jī)位時(shí),不應(yīng)晚于航班計(jì)劃關(guān)艙門時(shí)間/預(yù)計(jì)關(guān)艙門時(shí)間前10 min。因此,晚到的旅客即使能夠在順利登機(jī),也會(huì)使得關(guān)艙門時(shí)間推遲。
其他因素產(chǎn)生的影響可由機(jī)場(chǎng)、航空公司、空管等部門的協(xié)作解決,故本文將此部分因素忽略不計(jì)。
2.1 貝葉斯網(wǎng)絡(luò)概述
貝葉斯網(wǎng)絡(luò)(BN),又稱有向無(wú)環(huán)圖模型,是一種概率圖模型。有向無(wú)環(huán)圖(Directed Acyclic Graph, DAG)中節(jié)點(diǎn)集X={X1,X2,…,Xi}表示一組隨機(jī)變量,節(jié)點(diǎn)間的有向邊(弧)代表了節(jié)點(diǎn)間的互相關(guān)系。條件概率分布(Conditional Probability Distributions, CPD)表示隨機(jī)變量之間的關(guān)聯(lián)強(qiáng)度。一個(gè)BN可由B(G,P)表示,其中G=〈X,A〉表示由個(gè)節(jié)點(diǎn)組成的DAG,A表示有向邊(弧)的集合,P={P(Xi|parent(Xi))}表示任意節(jié)點(diǎn)的CPD,parent(Xi)表示X中所有父節(jié)點(diǎn)的集合。此外,條件獨(dú)立性假設(shè)描述如下: 有節(jié)點(diǎn)X1、X2和X3,若P(X1|X2X3)=P(X1|X2),則稱X1和X3在X2條件下獨(dú)立、X1在X2條件下獨(dú)立于X3,或X1和X3關(guān)于X2獨(dú)立?!皸l件獨(dú)立” 是BN中隱含的斷言(assertion)和假設(shè)(assumption),BN結(jié)構(gòu)決定于式(1)所示的條件獨(dú)立性假設(shè):
P(Xi|X1,X2,…,Xi-1)={P(Xi|parent(Xi))}
(1)
由概率的鏈?zhǔn)椒ê蜅l件獨(dú)立性假設(shè)則可知其聯(lián)合概率分布的表示形式如式(2)所示:
(2)
2.2 航班保障服務(wù)時(shí)間BN模型
構(gòu)建BN的方法大致有以下幾種:1)數(shù)據(jù)學(xué)習(xí):通過(guò)大量樣本數(shù)據(jù)的機(jī)器學(xué)習(xí),實(shí)現(xiàn)貝葉斯網(wǎng)絡(luò)的結(jié)構(gòu)和參數(shù)學(xué)習(xí)。2)專家知識(shí):基于領(lǐng)域?qū)<颐鞔_各個(gè)變量之間的依賴關(guān)系,從而確定BN結(jié)構(gòu)并指定其分布。3)綜合方法:結(jié)合專家知識(shí)與數(shù)據(jù)學(xué)習(xí)兩種方法,先由相關(guān)領(lǐng)域?qū)<抑R(shí)指定網(wǎng)絡(luò)結(jié)構(gòu),再由機(jī)器學(xué)習(xí)方法從大量樣本數(shù)據(jù)中學(xué)習(xí)網(wǎng)絡(luò)參數(shù)。
方法1)要求大量樣本作為訓(xùn)練數(shù)據(jù),這在缺少樣本或樣本量較少情況下不適用。方法2)在缺乏樣本數(shù)據(jù)且專家定性知識(shí)寶貴的情況下較為適用,但其主觀性強(qiáng),容易產(chǎn)生大的誤差。方法3)是前兩種方法的有機(jī)結(jié)合,可以提高學(xué)習(xí)的效率。由本文1.2節(jié)分析可知,航班保障服務(wù)樣本數(shù)據(jù)變量之間有明顯的依賴關(guān)系。故為了提高學(xué)習(xí)效率、減小誤差,本文采用方法3)進(jìn)行BN構(gòu)建。通過(guò)對(duì)中國(guó)民航領(lǐng)域相關(guān)專家進(jìn)行走訪和調(diào)研,確定了航班保障所需各類節(jié)點(diǎn)及其狀態(tài)、節(jié)點(diǎn)間的獨(dú)立或者依賴關(guān)系。先驗(yàn)的BN拓?fù)浣Y(jié)構(gòu)如圖2所示。
圖2 航班保障服務(wù)時(shí)間BN拓?fù)浣Y(jié)構(gòu)
變量集為X={X1,X2,X3,X4,X5,X6},其中X1~X6分別表示機(jī)型影響、前一項(xiàng)服務(wù)延誤時(shí)間(單位為min)、保障設(shè)備、旅客因素、航班密度、航班保障服務(wù)時(shí)間(單位為min)。各變量含義為:
X1={A,B,C,D,E},其中A、B、C、D、E表示飛機(jī)類型。
X2={<2,[2,4),[4,6),[6,8),[8,10),[10,12],>12}。
X3={Eq1,Eq2,Eq3,Eq4,Eq5,Eq6,Eq7,Eq8,Eq9},其中Eq1~Eq9分別表示客梯車、清水車、污水車、清潔車、食品車、加油車、傳送帶車、擺渡車、行李車。
X4={ontime,delay},表示旅客是否準(zhǔn)點(diǎn)到達(dá)。
X5={density1,density2,density3,density4},density1~density4分別表示非常稀疏、一般稀疏、一般密集、非常密集。
X6={<20,[20,30),[30,40),[40,50),[50,60),[60,70),[70,80),[80,90],>90}。
2.3 參數(shù)學(xué)習(xí)
參數(shù)學(xué)習(xí)指已知網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),需要明確網(wǎng)絡(luò)參數(shù)的過(guò)程。多種算法可以實(shí)現(xiàn)參數(shù)學(xué)習(xí),常用算法包含極大似然估計(jì)(MaximumLikelihoodEstimation,MLE)、期望最大化(ExpectationMaximization,EM)方法、貝葉斯估計(jì)(BayesianEstimation)和梯度下降(GradientDescent,GD)法等[10-13]。對(duì)于樣本所使用的學(xué)習(xí)算法性能優(yōu)劣,主要根據(jù)其學(xué)習(xí)精度和速度判斷。其中極大似然估計(jì)主要應(yīng)用于完備數(shù)據(jù)集,而期望最大化方法主要應(yīng)用于不完備數(shù)據(jù)集的參數(shù)學(xué)習(xí)且算法穩(wěn)定,實(shí)現(xiàn)簡(jiǎn)單。由于航班保障服務(wù)過(guò)程復(fù)雜,所涉及的保障車輛種類繁多,因此,在各方面或多或少的因素制約下,航班保障服務(wù)過(guò)程中會(huì)不可避免地產(chǎn)生部分?jǐn)?shù)據(jù)缺失的情形,從而使得對(duì)數(shù)據(jù)觀測(cè)后形成不完備數(shù)據(jù)集,所以本文使用EM方法來(lái)對(duì)訓(xùn)練樣本進(jìn)行參數(shù)學(xué)習(xí)。圖3給出不完備數(shù)據(jù)處理流程。
圖3 不完備數(shù)據(jù)處理流程
假設(shè)D={D1,D2,…,Dn}表示一組缺值樣本數(shù)據(jù)集;Z={Z1,Z2,…,Zn}表示隱藏?cái)?shù)據(jù)集;Xi表示Di中缺值樣本;θi表示參數(shù)θ的當(dāng)前估計(jì),定義基于Di的θ對(duì)數(shù)似然函數(shù)如式(3)所示:
(3)
式中P(Xi=xi|Di,θi)表示當(dāng)Xi=?時(shí),假定P(Xi=xi|Di,θi)為1。因?yàn)镈i由D和θi決定,故l(θ|Di)常用l(θ|D,θi)表示,含義為參數(shù)θ的基于D的期望對(duì)數(shù)似然函數(shù)(Expected Loglikelihood Function, ELF)。在EM方法的循環(huán)迭代中,樣本集D不變,所以l(θ|D,θi)也常由Q(θ|θi)表示。
EM方法使用迭代方式循環(huán)交替地執(zhí)行E步和M步:E步基于當(dāng)前的參數(shù)估計(jì),計(jì)算它的期望值;M步基于E步參數(shù)的期望值,最大化當(dāng)前的參數(shù)估計(jì)。第i+1次迭代時(shí)E步:
(4)
M步:
Q(θi+1|θi,D)=maxQ(θ|θi,D)
(5)
式中P(θ|D)、P(θ|D,Z)、P(Z|θi,D)分別為參數(shù)θ的基于D的后驗(yàn)分布密度,增加隱藏?cái)?shù)據(jù)后的后驗(yàn)分布密度,在給定θ和D時(shí)Z的條件分布密度。循環(huán)迭代至‖θi+1-θi‖足夠小為止。
2.4 航班保障服務(wù)時(shí)間動(dòng)態(tài)估計(jì)
隨著時(shí)間的增加,航班保障服務(wù)相關(guān)數(shù)據(jù)逐漸積累,若要使動(dòng)態(tài)估計(jì)更加準(zhǔn)確,需要將新數(shù)據(jù)不斷地加入到訓(xùn)練集中,動(dòng)態(tài)調(diào)整BN模型,從而產(chǎn)生新的先驗(yàn)知識(shí)。由領(lǐng)域?qū)<乙约皵?shù)據(jù)結(jié)構(gòu)學(xué)習(xí)獲得的先驗(yàn)知識(shí)結(jié)合參數(shù)學(xué)習(xí)形成BN模型,此過(guò)程又稱為知識(shí)獲取。圖4給出航班保障服務(wù)時(shí)間動(dòng)態(tài)估計(jì)流程。
由圖4可知由模型產(chǎn)生的新知識(shí)又將作為先驗(yàn)知識(shí)為BN學(xué)習(xí)提供參考。此過(guò)程可由貝葉斯法則實(shí)現(xiàn),式(6)[14]為其數(shù)學(xué)表達(dá):
(6)
其中:D表示訓(xùn)練樣本數(shù)據(jù)集;h表示某種假設(shè)。P(h)表示h的先驗(yàn)概率,P(D) 表示樣本數(shù)據(jù)集D的先驗(yàn)概率,P(D|h)表示假設(shè)h成立時(shí)D的概率。P(h|D)表示給定D時(shí)h成立的概率, 也稱h的后驗(yàn)概率。應(yīng)當(dāng)明確的是:先驗(yàn)概率P(h)獨(dú)立于D而后驗(yàn)概率P(h|D)反映了D的影響。
圖4 航班保障服務(wù)時(shí)間動(dòng)態(tài)估計(jì)流程
這就使得BN模型可以連續(xù)調(diào)整,從而適應(yīng)新的變化。這種通過(guò)BN學(xué)習(xí)動(dòng)態(tài)修正模型的方式可以動(dòng)態(tài)估計(jì)航班保障服務(wù)時(shí)間。
3.1 實(shí)驗(yàn)結(jié)果及分析
實(shí)驗(yàn)數(shù)據(jù)來(lái)源于國(guó)內(nèi)某大型樞紐機(jī)場(chǎng)信息系統(tǒng)數(shù)據(jù)庫(kù),提取了該機(jī)場(chǎng)2015年5月至2015年10月的航班保障服務(wù)相關(guān)數(shù)據(jù),共計(jì)36萬(wàn)多個(gè),經(jīng)過(guò)初步處理篩選出對(duì)航班保障服務(wù)有影響的數(shù)據(jù)。數(shù)據(jù)包括航班班次信息、工作任務(wù)及相關(guān)時(shí)間特性三大類。其中班次信息數(shù)據(jù)包含航班號(hào)、所停機(jī)位號(hào),工作任務(wù)包括客艙清潔、開(kāi)關(guān)客艙門、航油加注、機(jī)務(wù)巡檢、裝卸貨郵、航食配送、放撤輪擋、上下乘客,相關(guān)時(shí)間特性包括參與保障作業(yè)的特種車輛或人員的到位時(shí)刻、等待時(shí)間、作業(yè)時(shí)間、結(jié)束時(shí)刻。
數(shù)據(jù)不可避免地存在小部分缺失或者稀疏情況,因此對(duì)這些不完備數(shù)據(jù)按圖3所示流程進(jìn)行處理。然后用2015年5月至2015年9月期間處理完成后的20萬(wàn)多個(gè)數(shù)據(jù)作為學(xué)習(xí)的樣本數(shù)據(jù)。參數(shù)估計(jì)采用加拿大Norsys軟件公司的NeticaTutorial工具的參數(shù)學(xué)習(xí)功能完成。Netica軟件對(duì)于貝葉斯網(wǎng)絡(luò)和影響圖功能強(qiáng)大,操作簡(jiǎn)單,具有直觀且流暢的用戶界面用于繪制網(wǎng)絡(luò),一旦網(wǎng)絡(luò)被創(chuàng)建,Netica可以使用網(wǎng)絡(luò)來(lái)執(zhí)行最快、最現(xiàn)代化的算法進(jìn)行各種推理,發(fā)現(xiàn)所有的未知變量的相應(yīng)值或概率。Netica的參數(shù)學(xué)習(xí)采用服從狄氏共軛先驗(yàn)分布的多項(xiàng)式隨機(jī)變量。使用步驟簡(jiǎn)述如下:1)搭建貝葉斯網(wǎng)絡(luò);2)導(dǎo)入數(shù)據(jù)文件;3)選擇訓(xùn)練算法(期望最大化方法);4)發(fā)現(xiàn)未知變量相應(yīng)值或概率。進(jìn)行網(wǎng)絡(luò)學(xué)習(xí)前通過(guò)專家知識(shí)直接給定先驗(yàn)概率,使用EM方法進(jìn)行數(shù)據(jù)學(xué)習(xí)之后得到其后驗(yàn)概率,修正先驗(yàn)概率分布,以此產(chǎn)生條件概率表CPT,得到如圖5所示的學(xué)習(xí)結(jié)果。根據(jù)航班保障服務(wù)時(shí)間動(dòng)態(tài)估計(jì)流程,2015年5月至9月BN學(xué)習(xí)結(jié)果屬于新知識(shí),將其視為先驗(yàn)知識(shí)后,再用2015年10月數(shù)據(jù)對(duì)BN模型增量學(xué)習(xí),圖6給出增量學(xué)習(xí)結(jié)果。
圖5 2015年5月至9月數(shù)據(jù)學(xué)習(xí)結(jié)果
圖6 2015年10月數(shù)據(jù)增量學(xué)習(xí)結(jié)果
從圖5可看出,前一項(xiàng)服務(wù)延誤兩分鐘以內(nèi)所占比重較高,達(dá)到85.7%,說(shuō)明航班的大部分保障服務(wù)項(xiàng)目都會(huì)按時(shí)完成。航班保障服務(wù)的各種設(shè)備的占比均衡,使用頻率高的設(shè)備(Eq7:傳送帶車)占比稍高于使用頻率低的設(shè)備(Eq8:擺渡車)。航班密度在density3:一般密集時(shí)影響最大,機(jī)型C占比也達(dá)到51.6%。對(duì)比圖5和圖6可知各變量的概率分布存在微小變化。隨著航班保障服務(wù)相關(guān)數(shù)據(jù)不斷更新,按照?qǐng)D4所示的航班保障服務(wù)時(shí)間動(dòng)態(tài)估計(jì)流程,BN模型可以被連續(xù)地調(diào)整,從而適應(yīng)新的變化。令E(t)表示其他條件確定下的航班保障服務(wù)時(shí)間期望值;Ti表示第i個(gè) 航班保障服務(wù)時(shí)間值域的中值;P(i)表示航班保障服務(wù)時(shí)間落在第i個(gè)值域中的概率,則由式(7)的計(jì)算方法可以求得確切的航班保障服務(wù)時(shí)間期望值,此值可被視為航班保障服務(wù)時(shí)間的估計(jì)值。
E(t)=∑P(i)×Ti
(7)
表1給出了部分航班在模型動(dòng)態(tài)調(diào)整前后結(jié)合BN學(xué)習(xí)和式(7)得到的航班保障服務(wù)時(shí)間估計(jì)值。為了更直觀地顯示估計(jì)效果,方便分析,圖7給出部分航班保障服務(wù)時(shí)間估計(jì)值與實(shí)際值對(duì)比圖。
表1 部分航班保障服務(wù)時(shí)間估計(jì)值與實(shí)際值比較
圖7 部分航班保障服務(wù)時(shí)間估計(jì)值與實(shí)際值對(duì)比
表2為《機(jī)場(chǎng)航班運(yùn)行保障標(biāo)準(zhǔn)》規(guī)定的各類機(jī)型保障作業(yè)時(shí)間要求。本文保障服務(wù)時(shí)間指輪擋時(shí)間,假如航班保障服務(wù)過(guò)程耗時(shí)不超過(guò)標(biāo)準(zhǔn)服務(wù)時(shí)間,就不會(huì)發(fā)生因保障服務(wù)作業(yè)而引起的航班延誤。
表2 各類機(jī)型保障作業(yè)時(shí)間要求
結(jié)合表1~2發(fā)現(xiàn)1、3、8號(hào)航班機(jī)型相同,但是到達(dá)時(shí)段的航班密度不同,保障服務(wù)時(shí)間也存在差異,航班密度越大,保障服務(wù)耗時(shí)越長(zhǎng)并導(dǎo)致8號(hào)航班未能在按時(shí)完成保障服務(wù)。這是因?yàn)榇竺芏惹樾蜗卤U显O(shè)備來(lái)不及準(zhǔn)時(shí)到位。2、3號(hào)航班同一時(shí)段到達(dá),但機(jī)型不同,保障服務(wù)耗時(shí)也有差異。由圖7可知估計(jì)值與實(shí)際值趨于一致,并且經(jīng)過(guò)貝葉斯網(wǎng)絡(luò)學(xué)習(xí)調(diào)整后的BN模型估計(jì)值與真實(shí)值更接近。將在后文模型評(píng)價(jià)中量化估計(jì)值與真實(shí)值的誤差。
3.2 敏感性分析與模型評(píng)價(jià)
在航班保障服務(wù)時(shí)間的影響因素中,各種因素的影響程度是不同的。本文通過(guò)對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行敏感性分析(SensitivityAnalysis,SA)[15]來(lái)度量各個(gè)因素對(duì)航班保障服務(wù)時(shí)間的影響程度。敏感性分析基于兩變量間的互信息(MutualInformation,MI),由互信息比重來(lái)判定影響程度強(qiáng)弱,式(8)給出互信息的定義。
(8)
式中:X表示航班保障服務(wù)時(shí)間,Y表示其他各種影響因素;x和y分別表示航班保障服務(wù)時(shí)間及其他各種影響因素的狀態(tài);H(X)表示觀測(cè)X后的信息量,H(X|Y)表示知道Y時(shí)信息量;通過(guò)I(X;Y)能夠判定變量之間的相關(guān)性,I(X;Y)≥0,且等號(hào)成立的充要條件是X和Y相互獨(dú)立。I(X;Y)比重越大則表示變量之間相關(guān)性越明顯,換言之,即某影響因素對(duì)航班保障服務(wù)時(shí)間的影響程度更大。表3給出各種因素相對(duì)于航班保障服務(wù)時(shí)間的敏感性分析結(jié)果。
表3 各因素相對(duì)航班保障服務(wù)時(shí)間的敏感性分析結(jié)果
從表3中可知各種影響因素與航班保障服務(wù)時(shí)間互信息占比從大到小分別為是航班密度、保障設(shè)備、機(jī)型影響、前一項(xiàng)服務(wù)延誤時(shí)間、旅客因素,因此可得航班到達(dá)時(shí)段的密度對(duì)航班保障服務(wù)時(shí)間影響最強(qiáng),旅客因素相對(duì)于所列其他因素影響最弱。
最后對(duì)本文所建的BN模型進(jìn)行評(píng)價(jià)。分別將2015年5月至9月以及2015年10月數(shù)據(jù)當(dāng)作學(xué)習(xí)樣本,2015年11月數(shù)據(jù)用來(lái)測(cè)試,航班保障服務(wù)時(shí)間節(jié)點(diǎn)作為測(cè)試節(jié)點(diǎn)。通過(guò)2015年5月至9月的數(shù)據(jù)學(xué)習(xí)及2015年10月的增量學(xué)習(xí),得到航班保障服務(wù)時(shí)間節(jié)點(diǎn)的條件概率分布, 計(jì)算部分航班的保障服務(wù)時(shí)間如表1所示,將模型調(diào)整前后的估計(jì)值分別與實(shí)際值對(duì)比, 進(jìn)而評(píng)價(jià)模型估計(jì)的準(zhǔn)確性。評(píng)價(jià)的度量標(biāo)準(zhǔn)選用均方根誤差(RootMeanSquareError,RMSE)、平均絕對(duì)誤差(MeanAbsoluteError,MAE)和希爾不等系數(shù)(TheilInequalityCoefficient,TIC)[16]。
(9)
(10)
(11)
RMSE對(duì)極大或極小誤差異常敏感,因此RMSE能夠很好地反映估計(jì)的精密度。MAE由于離差被絕對(duì)值化,不會(huì)出現(xiàn)正負(fù)相抵消的情況,因而,MAE能更好地反映預(yù)測(cè)值誤差的實(shí)際情況。TIC總是介于0至1之間,數(shù)值越小則估計(jì)值和真實(shí)值之間的差異越小,估計(jì)精度越高。表4給出部分航班在BN模型調(diào)整前后航班保障服務(wù)時(shí)間估計(jì)值的誤差統(tǒng)計(jì)。
表4 BN模型調(diào)整前后估計(jì)值的誤差統(tǒng)計(jì)
從表4可知,由2015年5月至9月數(shù)據(jù)進(jìn)行貝葉斯網(wǎng)絡(luò)學(xué)習(xí)建立的BN模型(調(diào)整前)得到的估計(jì)值誤差均大于更新先驗(yàn)知識(shí)后2015年10月增量學(xué)習(xí)建立的BN模型(調(diào)整后)的估計(jì)值誤差。本文認(rèn)為這是由于調(diào)整后的BN模型更新了先驗(yàn)知識(shí)、學(xué)習(xí)了最新數(shù)據(jù),因此對(duì)近期航班保障服務(wù)反映能力更強(qiáng)。從各種誤差分析方法得到的誤差值可以看出,BN模型調(diào)整前后均能對(duì)航班保障服務(wù)進(jìn)行有效估計(jì)且有較高的準(zhǔn)確度,說(shuō)明使用貝葉斯網(wǎng)絡(luò)對(duì)歷史數(shù)據(jù)不斷學(xué)習(xí)進(jìn)而動(dòng)態(tài)調(diào)整BN模型的方式來(lái)估計(jì)航班保障服務(wù)時(shí)間可行。
本文將貝葉斯網(wǎng)絡(luò)應(yīng)用于解決航班保障服務(wù)時(shí)間估計(jì)的問(wèn)題。建立了其BN模型,闡述了參數(shù)學(xué)習(xí)方法,將數(shù)據(jù)集導(dǎo)入到軟件平臺(tái)進(jìn)行訓(xùn)練得到了學(xué)習(xí)結(jié)果。實(shí)驗(yàn)結(jié)果分析及模型評(píng)價(jià)表明,所提模型能夠?qū)崿F(xiàn)對(duì)航班保障服務(wù)時(shí)間的動(dòng)態(tài)估計(jì)并具有較高的準(zhǔn)確度。敏感性分析發(fā)現(xiàn),航班到達(dá)時(shí)段的密度對(duì)航班保障服務(wù)時(shí)間影響最強(qiáng),旅客因素相對(duì)于所列其他因素影響最弱。由于本文未考慮冬季除冰雪保障環(huán)節(jié),因此應(yīng)用時(shí)會(huì)存在季節(jié)局限性。進(jìn)一步研究方向包括進(jìn)一步研究方向包括考慮航班提前或者延誤到港情況,提高航班保障時(shí)間估計(jì)準(zhǔn)確度。
)
[1]GARCIAAP,GARCIAHA,OTAMENDIFJ,etal.Agent-baseddistributedcontrolforimprovingcomplexresourcescheduling:applicationtoairportgroundhandlingoperations[J].IEEESystemsJournal, 2014, 8(4): 1145-1157.
[2]ANDREATTAG,DEGIOVANNIL,MONACIM.Afastheuristicforairportground-serviceequipment-and-staffallocation[J].Procedia—SocialandBehavioralSciences, 2014(108): 26-36.
[3] 郝靜麒,楊文東,唐小衛(wèi).樞紐機(jī)場(chǎng)停機(jī)坪平臺(tái)車資源分配仿真研究[J].武漢理工大學(xué)學(xué)報(bào),2013,35(12):85-91.(HAOJQ,YANGWD,TANGXW.Simulationforplatformtruckresourceallocationinhubairportapron[J].JournalofWuhanUniversityofTechnology, 2013, 35(12): 85-91.)
[4] 黃鸝詩(shī).基于SIMIO的機(jī)坪車輛調(diào)度仿真研究[D].南京:南京航空航天大學(xué),2013:11-14.(HUANGLS.SimulationstudyofvehicleschedulingonrampbasedonSIMIO[D].Nanjing:NanjingUniversityofAeronauticsandAstronautics, 2013: 11-14.)
[5]CHEUNGA,IPWH,LUD,etal.Anaircraftserviceschedulingmodelusinggeneticalgorithms[J].JournalofManufacturingTechnologyManagement, 2004, 16(1): 109-119.
[6] 孫瑞山,張子仝.基于CPM的停機(jī)坪航班保障工作方法研究[J].中國(guó)民航大學(xué)學(xué)報(bào),2011,29(5):23-26.(SUNRS,ZHANGZT.StudyonapronflightserviceworkmethodbasedonCPM[J].JournalofCivilAviationUniversityofChina, 2011, 29(5): 23-26.)
[7] 丁建立,趙鍵濤,曹衛(wèi)東.基于貝葉斯網(wǎng)的航班過(guò)站時(shí)間動(dòng)態(tài)估計(jì)[J].南京航空航天大學(xué)學(xué)報(bào),2015,47(4):517-524.(DINGJL,ZHAOJT,CAOWD.DynamicestimationaboutturnaroundtimeofflightbasedonBayesiannetwork[J].JournalofNanjingUniversityofAeronautics&Astronautics, 2015, 47(4): 517-524.)
[8]XIACY,WANGL,SUNSW,etal.AnSIRmodelwithinfectiondelayandpropagationvectorincomplexnetworks[J].NonlinearDynamics, 2012, 69(3): 927-934.
[9]GREATOREXM.FactorAnalysis[M].Hoboken,NJ:JohnWiley&Sons, 2015: 27-29.
[10] 李碩豪,張軍.貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)綜述[J].計(jì)算機(jī)應(yīng)用研究,2015,32(3):641-646.(LISH,ZHANGJ.ReviewofBayesiannetworksstructurelearning[J].ApplicationResearchofComputers, 2015, 32(3): 641-646.)
[11]MASEGOSAAR,MORALS.Newskeleton-basedapproachesforBayesianstructurelearningofBayesiannetworks[J].AppliedSoftComputing, 2013, 13(2): 1110-1120.
[12]JIJZ,WEIHK,LIUCN.AnartificialbeecolonyalgorithmforlearningBayesiannetworks[J].SoftComputing, 2013, 17(6): 983-994.
[13]BOUCHAALAL,MASMOUDIA,GARGOURIF,etal.ImprovingalgorithmsforstructurelearninginBayesiannetworksusinganewimplicitscore[J].ExpertSystemswithApplications, 2010, 37(7): 5470-5475.
[14]PEARLJ.Onevidentialreasoninginahierarchyofhypotheses[J].ArtificialIntelligence, 1986, 28(1): 9-15.
[15]CASTILLOE,GUTIERREZJM,HADIAS.SensitivityanalysisindiscreteBayesiannetworks[J].IEEETransactionsonSystems,Man,andCybernetics—PartA:SystemsandHumans, 1997, 27(4): 412-423.
[16] 高陽(yáng),張碧玲,毛京麗,等.基于機(jī)器學(xué)習(xí)的自適應(yīng)光伏超短期出力預(yù)測(cè)模型[J].電網(wǎng)技術(shù),2015,39(2):307-311.(GAOY,ZHANGBL,MAOJL,etal.Machinelearning-basedadaptivevery-short-termforecastmodelforphotovoltaicpower[J].PowerSystemTechnology, 2015, 39(2): 307-311.)
ThisworkispartiallysupportedbytheJointFundsoftheNationalNaturalScienceFoundationofChinaandCivilAviationAdministrationofChina(U1533203),theFundamentalResearchFundsfortheCentralUniversities(3122014P003).
XING Zhiwei, born in 1970, Ph.D., professor.His research interests include equipment and system of civil aviation, information and control of airport traffic.
TANG Yunxiao, born in 1989, M.S.candidate.His research interests include equipment and system of civil aviation, information and control of airport traffic.
LUO Qian, born in 1975, Ph.D., senior engineer.His research interests include airport operation management, data mining.
Dynamic estimation about service time of flight support based on Bayesian network
XING Zhiwei1*, TANG Yunxiao1, LUO Qian2
(1.CollegeofElectronicInformationandAutomation,CivilAviationUniversityofChina,Tianjin300300,China;2.InformationFiliale,TheSecondResearchInstituteofCivilAviationAdministrationofChina,ChengduSichuan610041,China)
Concerning the problems of estimating the service time of airport flight support, and the particularity, complexity, and influence factors’ uncertainty of flight support service process, an estimation model of flight support service time based on Bayesian Network (BN) was proposed.The knowledge of aviation experts and the machine learning of historical data were combined by the proposed model, and the incremental learning characteristic of BN was used to adjust the BN model dynamically, so as to make itself adapt to new conditions and constantly update the service time estimates of flight support.By using the data selected from a large domestic hub airport information system, the proposed BN model was trained via the Expectation Maximization (EM) algorithm to obtain the test results.The analysis of experimental results and model evaluation show that the proposed method can effectively estimate the service time of flight support and has higher accuracy.In addition, the sensitivity analysis demonstrates that the flight density during flight arrival time has the strongest influence on flight support service time.
flight support service; machine learning; Bayesian Network (BN); incremental learning; Expectation Maximization (EM); sensitivity analysis
2016-07-08;
2016-09-05。 基金項(xiàng)目:國(guó)家自然科學(xué)基金委員會(huì)-中國(guó)民用航空局聯(lián)合研究基金資助項(xiàng)目(U1533203);中央高?;究蒲袠I(yè)務(wù)費(fèi)基金資助項(xiàng)目(3122014P003)。
邢志偉(1970—),男,遼寧沈陽(yáng)人,教授,博士,主要研究方向:民航裝備與系統(tǒng)、機(jī)場(chǎng)交通信息與控制; 唐云霄(1989—),男,安徽阜陽(yáng)人,碩士研究生,主要研究方向:民航裝備與系統(tǒng)、機(jī)場(chǎng)交通信息與控制; 羅謙(1975—),男,四川綿陽(yáng)人,高級(jí)工程師,博士,主要研究方向:機(jī)場(chǎng)運(yùn)營(yíng)管理、數(shù)據(jù)挖掘。
1001-9081(2017)01-0299-06
10.11772/j.issn.1001-9081.2017.01.0299
TP181
A