国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于時序數(shù)據(jù)挖掘的航班延誤預(yù)測分析

2014-12-18 18:22:35羅鳳娥張成偉
現(xiàn)代電子技術(shù) 2014年24期
關(guān)鍵詞:決策支持數(shù)據(jù)挖掘

羅鳳娥+張成偉

摘 ?要: 航班延誤一直作為國際國內(nèi)民航業(yè)的一個熱點(diǎn)問題。通過對航班延誤的相關(guān)概念進(jìn)行簡要介紹,建立時間序列預(yù)測模型,將數(shù)據(jù)挖掘中隱馬爾可夫模型和指數(shù)平滑預(yù)測方法應(yīng)用于航班延誤預(yù)測分析中。通過與所采集時間點(diǎn)的實(shí)際航班延誤數(shù)對比分析來評估預(yù)測模型,得到較為理想的預(yù)測結(jié)果。該分析為航空公司運(yùn)行指揮中心提供決策支持和理論依據(jù),對保障航班正常運(yùn)行有著重要的實(shí)際意義。

關(guān)鍵詞: 航班延誤; 數(shù)據(jù)挖掘; 時間序列模型; 決策支持

中圖分類號: TN911?34; V352 ? ? ? ? ? ? ? ?文獻(xiàn)標(biāo)識碼: A ? ? ? ? ? ? ? ? ? ? ?文章編號: 1004?373X(2014)24?0052?04

Forecasting analysis of flight delay based on time?sequence data mining

LUO Feng?e, ZHANG Cheng?wei

(College of Air Traffic Management, Civil Aviation Flight University of China, Guanghan 618307, China)

Abstract: Flight delay has been a hot issue existing in the civil aviation industries at home and abroad. The related concepts of flight delays are introduced briefly. A time?series prediction model was established to apply hidden Markov model (HMM) in data mining and exponential smoothing prediction method into the flight delay prediction analysis. The forecasting model is evaluated through comparative analysis of the actual flight delay quantity. A more satisfactory prediction result was obtained. The model provided a decision support for airport operations control center. It has important practical significance to guarantee the normal take?off and landing of flights.

Keywords: flight delay; data mining; time?series model; decision support

0 ?引 ?言

隨著航空運(yùn)輸市場需求量的不斷增長,國內(nèi)各大航空公司均相應(yīng)增大了運(yùn)力的投入,特別是在航班流量比較大的機(jī)場,延誤情況尤為突出。一旦發(fā)生大面積的航班延誤,如果沒有良好的應(yīng)對機(jī)制不僅會產(chǎn)生旅客群體性事件,還會帶來一系列延誤所造成的波及效應(yīng)。根據(jù)中國民用航空總局發(fā)布的《民航航班正常統(tǒng)計辦法》所列航班延誤原因就多達(dá)五大類:天氣原因;空中交通原因;機(jī)場保障原因;旅客自身原因;航空公司原因等。因此解決好航班延誤問題已成為民航運(yùn)輸業(yè)快速發(fā)展的重要決定性因素[1]。

在國外Paul等研究人員建立了一種分析模型用來顯示空間容量、流量需求和航線規(guī)劃之間的相互作用關(guān)系,并可以將延誤的可控制因素隨機(jī)分離出來;而我國針對航班延誤問題的研究起步較晚,而且大部分研究主要都集中于流量管控方面。對比于國外航空運(yùn)輸業(yè)的情況來看,我國有很多不同于國外的現(xiàn)實(shí)狀況,國內(nèi)三大航空集團(tuán)在運(yùn)作中也是各自劃分成分子公司獨(dú)立運(yùn)行的。

針對航班整體運(yùn)行效率偏低這一實(shí)際情況,本文主要依據(jù)數(shù)據(jù)挖掘分類當(dāng)中的預(yù)測方法,從航班延誤數(shù)量的角度建立航班延誤時間序列模型,進(jìn)而進(jìn)行時序數(shù)據(jù)挖掘。隱馬爾可夫模型 (Hidden Markov Model) 是一種統(tǒng)計模型,用來描述一個含有隱含未知參數(shù)的馬爾可夫過程,在統(tǒng)計學(xué)領(lǐng)域中不斷的被學(xué)者所認(rèn)可并得到廣泛的應(yīng)用;指數(shù)平滑法預(yù)測在實(shí)際生產(chǎn)預(yù)測中是被經(jīng)常采納的一種預(yù)測方法。

本文基于隱馬爾科夫統(tǒng)計模型并結(jié)合指數(shù)平滑預(yù)測方法構(gòu)建時間序列預(yù)測模型,數(shù)據(jù)項(xiàng)預(yù)處理的重點(diǎn)在于從已放行的航班信息表中統(tǒng)計出隨機(jī)采樣的進(jìn)、離港航班延誤數(shù)量。以我院航空運(yùn)行控制實(shí)驗(yàn)室中的FOC系統(tǒng)數(shù)據(jù)庫2012年的航班進(jìn)離港信息表為原始數(shù)據(jù),計算出每個航班的延誤時間,進(jìn)而累計出單位時段的延誤架次。

1 ?航班延誤

嚴(yán)格意義上講,按照航班計劃準(zhǔn)時執(zhí)行的航班才能叫做正常航班,否則叫做不正常航班。在航空運(yùn)輸背景下所使用的延誤和正點(diǎn)的概念有多種定義[2]。

圖1闡述了延誤的不同定義的使用情況。鑒于延誤成本對航空公司來說影響很大,這里將延誤定義為一架航空器的撤輪檔/放輪檔時間相對于航空公司公布的航班時刻表時間之間的差別。此概念的標(biāo)準(zhǔn)相對最為清晰,并與航空運(yùn)輸系統(tǒng)的最終用戶,即乘客的聯(lián)系最為直接。在本文中所使用的延誤定義如圖1右側(cè)所示。

根據(jù)中國民航總局規(guī)定,機(jī)票上標(biāo)明的時間與航空公司在航班時刻表上公布的時間是一致的,這一時間的準(zhǔn)確表述為“離港時間”,即“飛機(jī)關(guān)艙門時間”,“進(jìn)港時間”,即“飛機(jī)打開艙門時間”。

圖1 延誤的相對概念

根據(jù)表1航班延誤判斷標(biāo)準(zhǔn)的說明,飛機(jī)按機(jī)票上標(biāo)明的時間關(guān)閉艙門,并在15 min,20 min,25 min或30 min內(nèi)起飛,屬于正常起飛航班。

表1 航班延誤的判斷標(biāo)準(zhǔn)

2 ?航班延誤時序事件模型

2.1 ?航班原始數(shù)據(jù)分析

本文從航班延誤數(shù)量的角度建立時間序列預(yù)測模型,從現(xiàn)有航班信息表中統(tǒng)計出不同時段的進(jìn)、離港航班延誤數(shù)量來進(jìn)行數(shù)據(jù)項(xiàng)預(yù)處理。以我院航空運(yùn)行控制實(shí)驗(yàn)室中的FOC系統(tǒng)數(shù)據(jù)庫2012年的航班信息表為原始樣本數(shù)據(jù)。該表按時間順序記錄了進(jìn)、離港航班的計劃起降時間、實(shí)際起降時間、開/關(guān)艙門時間等相關(guān)信息。依據(jù)信息表中各項(xiàng)信息進(jìn)一步計算出每個航班的延誤時間,累計出單位時段的航班延誤量。航班信息如表2所示。

表2 航班信息表

2.2 ?模型結(jié)構(gòu)

時序數(shù)據(jù)挖掘包括許多常規(guī)的數(shù)據(jù)挖掘方法[3],可以基于相似性對時間序列數(shù)據(jù)進(jìn)行聚類,也可以對未來值進(jìn)行預(yù)測。一個時序數(shù)據(jù)庫(Temporal Database)中,保存的不是一個時間點(diǎn)的數(shù)據(jù),而是大量時間點(diǎn)上的數(shù)據(jù)。本文主要研究對未來值進(jìn)行預(yù)測的方法中針對時序事件序列建模方式的一種:隱馬爾可夫模型(Hidden Markov Model,HMM)。首先介紹隱馬爾可夫模型定義如下:

隱馬爾可夫模型[4]是一個有向圖,頂點(diǎn)V={v1,v2,…,vn}代表狀態(tài),弧A={|vi,vj∈V}代表狀態(tài)之間的轉(zhuǎn)移。每條弧用從vi到vj的轉(zhuǎn)移概率pij來表示。任意時刻t,一個狀態(tài)被設(shè)為當(dāng)前狀態(tài)vt,任何將要進(jìn)行的轉(zhuǎn)移只依賴于vt而不依賴于t之前的其他狀態(tài)。圖2所示為一個隱馬爾可夫模型的例子。

圖2 簡單的隱馬爾可夫模型

圖2所示模型和馬爾可夫模型之間的一個最明顯的區(qū)別是附加概率的出現(xiàn)。注意一個含有N個狀態(tài)的一階過程有N2個狀態(tài)轉(zhuǎn)移。每一個轉(zhuǎn)移的概率叫做狀態(tài)轉(zhuǎn)移概率,就是從一個狀態(tài)轉(zhuǎn)移到另一個狀態(tài)的概率。這所有的N2個概率可以用一個狀態(tài)轉(zhuǎn)移矩陣來表示,其表示形式如下:

[A=a11a12…a1j…a1Na21a22…a2j…a2N??…?…?ai1ai2…aij…aiN??????aN1aN2…aNJ…aNN,aij=P(qt=jqt-1=i), ? ?1≤i,j≤N] ? ? (1)

對該矩陣有如下約束條件:[aij≥0,?i,j] ? ?[j=1Naij=1,?i]。如下為基于式(1)的航班延誤實(shí)例的狀態(tài)轉(zhuǎn)移矩陣(主要選取三大類延誤影響因素):

[ ? ? ? ? Todayα ? ? ? ? ? β ? ? ? ? ? ?γ]

[Yesterdayαβγ0.500.3750.1250.250.1250.6250.250.3750.375] (2)

式中:α表示天氣原因?qū)е碌暮桨嘌诱`;β表示空中交通原因?qū)е碌暮桨嘌诱`;γ表示機(jī)場保障原因?qū)е碌暮桨嘌诱`。式(2)表示,如果昨天是天氣原因?qū)е碌难诱`,那么今天有50%的可能還是天氣原因?qū)е拢?7.5%的概率是空中交通原因?qū)е卵诱`,12.5%的概率是機(jī)場保障原因?qū)е碌难诱`,可以看出矩陣中每一行的和都是1,為了初始化這樣一個系統(tǒng)需要一個初始的概率向量為:(1.0,0.0,0.0)。

每個隱馬爾可夫模型有以下附加部分:

(1) 初始狀態(tài)分布,它用于確定0時刻的初始狀態(tài)v0。

(2) 每條弧用一個從vi到vj的轉(zhuǎn)移概率pij來標(biāo)記,這個值是固定的。

(3) 給定一組可能的觀測值O{o1,o2,…,ok},每個狀態(tài)vi都包含一組分別對應(yīng)各個觀察值的觀測概率{pi1,pi2,…,pik}。給定一個隱馬爾可夫模型,可以用如下算法生成一個觀測序列。在算法中設(shè)產(chǎn)生的觀測序列包括m個觀測值,變量t表示時間。

輸入:H ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?//隱馬爾可夫模型

輸出:

S= ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?//輸出序列

隱馬爾可夫模型觀測序列算法:

t=0

Based on initial state distribution,determine vt;

repeat

Output ?st ?based on observation probabilities { pt1,pt2,…,ptk };

Choose ?vt+1 ?based on transition probabilities at ?vt ;

t=t+1;

until ? t=k ;

2.3 ?時間序列預(yù)測分析

時間序列[5]是一個具有n個值的集合{,,…}。這里假定有n個時間值,每個時間值與一個屬性A的值相互關(guān)聯(lián)。通常情況下,這些值由一些經(jīng)過明確定義的時間點(diǎn)來標(biāo)識,可以認(rèn)為這些取值是一個向量。

本文采用常用的數(shù)據(jù)挖掘預(yù)測方法,針對時間序列的典型數(shù)據(jù)挖掘應(yīng)用中的一種,給定一個具有一組已知值的時間序列,預(yù)測屬性未來值。2012年4月1日—4月15日,連續(xù)預(yù)測15天,每天取15個預(yù)測點(diǎn),共計225個預(yù)測點(diǎn),數(shù)據(jù)挖掘所使用的數(shù)據(jù)訓(xùn)練集合從2012年1月1日—2012年3月31日,所采用預(yù)測方法和相應(yīng)結(jié)果如下:平滑(smoothing)就是一種去除時間序列中非系統(tǒng)化行為的方法。指數(shù)平滑[6]的原理為:當(dāng)利用過去觀測值的加權(quán)平均來預(yù)測未來的觀測值時,離得越近的觀測值要給予更大的權(quán)。指數(shù)平滑法通過對權(quán)數(shù)加以改進(jìn),能提供良好的短期預(yù)測精度,因而實(shí)際應(yīng)用較為廣泛。本文采用一次指數(shù)平滑法的基本思想來解決航班延誤預(yù)測模型的分析。如果用Yt表示在t時間平滑后的數(shù)據(jù)(或預(yù)測值),而用X1,X2,…,Xt表示原始時間序列,那么一次指數(shù)平滑模型為:

[Yt=?Xt+(1-?)Yt-1, ? ?0<?<1]

或:

[Yt=?k=0t-1(1-?)kXt-k] (3)

這里的系數(shù)為幾何級數(shù),一次指數(shù)平滑模型用于預(yù)測的公式為:

[Yt+1=?Xt+(1-?)Yt] (4)

需要注意的是對距離預(yù)測期較近的觀察值賦予相對較大的權(quán)重,對距離預(yù)測值比較遠(yuǎn)的觀察值賦予較小的權(quán)重,權(quán)數(shù)由近及遠(yuǎn)按指數(shù)規(guī)律遞減。指數(shù)平滑法主要任務(wù)就是要利用已知的航班延誤觀測值來確定[?]的值,合理確定[?]的取值方法十分重要。一般來說,當(dāng)時間序列波動很大,長期趨勢變化幅度較大,呈現(xiàn)明顯且迅速的上升或下降趨勢時,宜選擇較大的[?]值,如可在0.6~0.8間選對應(yīng)的權(quán)值,達(dá)到預(yù)測模型精度高的目的,以便于能迅速跟上數(shù)據(jù)變化的趨勢。根據(jù)式(3)、式(4)和統(tǒng)計出的航班延誤量數(shù)據(jù),本文中[?]取值為0.7從而得到預(yù)測模型,然后利用該模型進(jìn)行航班延誤預(yù)測。圖3給出了預(yù)測結(jié)果。通過指數(shù)平滑法的預(yù)測曲線圖以及預(yù)測結(jié)果對比可以看出,預(yù)測結(jié)果較為理想,趨勢基本和實(shí)際情況保持一致。

3 ?模型評估

在模型評估階段,對所建立的預(yù)測模型進(jìn)行評價必須基于一定的評價指標(biāo)[7],本文選擇如下統(tǒng)計量檢驗(yàn)預(yù)測效果:

(1) 均方根誤差(Root Mean Square Error):

[RMSE=1ni=1n(yi-yi)2] ?(5)

(2) 平均絕對百分比誤差(Mean Absolute Percentage Error):

[MAPE=1ni=1nyi-yiyi] (6)

(3) 平均絕對誤差(Mean Absolute Error):

[MAE=1ni=1nyi-yi] ?(7)

式中:[yi]為實(shí)際值;[yi]為預(yù)測值。由式(5)~式(7)經(jīng)對航班延誤數(shù)據(jù)的預(yù)測值和實(shí)際值進(jìn)行統(tǒng)計分析得出模型評估結(jié)果如表3所示。

表3 方差分析

由表3分析得出組內(nèi)方差和均方差SS=MS=0.011 059,F(xiàn)檢驗(yàn)結(jié)果F=0.000 35說明使用指數(shù)平滑法對航班延誤預(yù)測模型的分析試驗(yàn)精度較高,有較為理想的效果。

4 ?結(jié) ?語

(1) 本文以航班信息表作為主要研究對象,針對航班延誤問題建立了時間序列預(yù)測模型,使用指數(shù)平滑預(yù)測方法實(shí)現(xiàn)對航班延誤預(yù)測分析取得了較好的預(yù)測結(jié)果,證明了所建立的模型和算法的可行性。

(2) 一次指數(shù)平滑法有其局限性,短期預(yù)測效果精確度較高但不適合在中長期預(yù)測中使用,由于預(yù)測值是采取的歷史數(shù)據(jù)平均值,故與實(shí)際序列的變化相比有滯后現(xiàn)象。這一問題將在今后的學(xué)習(xí)中作進(jìn)一步研究。

圖3 指數(shù)平滑法的預(yù)測結(jié)果

參考文獻(xiàn)

[1] 朱金福.航空運(yùn)輸規(guī)劃[M].西安:西北工業(yè)大學(xué)出版社,2009.

[2] 中國民用航空總局.大型飛機(jī)公共航空運(yùn)輸承運(yùn)人運(yùn)行合格審定規(guī)則[EB/OL]. [2010?01?04].http://www.caac.gov.cn/B1/B6/201003/t20100319_31073.html.

[3] DUNHAM M H.數(shù)據(jù)挖掘教程[M].郭崇慧,田鳳占,譯.北京:清華大學(xué)出版社,2005.

[4] KANTARDZIC Mehmed.數(shù)據(jù)挖掘概念模型和算法[M].王曉海,吳志剛,譯.北京:清華大學(xué)出版社,2013.

[5] 毛國君,段立娟,王實(shí),等.數(shù)據(jù)挖掘原理與算法[M].北京:清華大學(xué)出版社,2005.

[6] 羅鳳娥,賈振振.基于模糊綜合評價法的航空公司延誤控制水平分析[J].科技創(chuàng)新報,2013(6):88?89.

[7] 呂曉玲,謝邦昌.數(shù)據(jù)挖掘方法與應(yīng)用[M].北京:中國人民大學(xué)出版社,2009.

本文采用常用的數(shù)據(jù)挖掘預(yù)測方法,針對時間序列的典型數(shù)據(jù)挖掘應(yīng)用中的一種,給定一個具有一組已知值的時間序列,預(yù)測屬性未來值。2012年4月1日—4月15日,連續(xù)預(yù)測15天,每天取15個預(yù)測點(diǎn),共計225個預(yù)測點(diǎn),數(shù)據(jù)挖掘所使用的數(shù)據(jù)訓(xùn)練集合從2012年1月1日—2012年3月31日,所采用預(yù)測方法和相應(yīng)結(jié)果如下:平滑(smoothing)就是一種去除時間序列中非系統(tǒng)化行為的方法。指數(shù)平滑[6]的原理為:當(dāng)利用過去觀測值的加權(quán)平均來預(yù)測未來的觀測值時,離得越近的觀測值要給予更大的權(quán)。指數(shù)平滑法通過對權(quán)數(shù)加以改進(jìn),能提供良好的短期預(yù)測精度,因而實(shí)際應(yīng)用較為廣泛。本文采用一次指數(shù)平滑法的基本思想來解決航班延誤預(yù)測模型的分析。如果用Yt表示在t時間平滑后的數(shù)據(jù)(或預(yù)測值),而用X1,X2,…,Xt表示原始時間序列,那么一次指數(shù)平滑模型為:

[Yt=?Xt+(1-?)Yt-1, ? ?0<?<1]

或:

[Yt=?k=0t-1(1-?)kXt-k] (3)

這里的系數(shù)為幾何級數(shù),一次指數(shù)平滑模型用于預(yù)測的公式為:

[Yt+1=?Xt+(1-?)Yt] (4)

需要注意的是對距離預(yù)測期較近的觀察值賦予相對較大的權(quán)重,對距離預(yù)測值比較遠(yuǎn)的觀察值賦予較小的權(quán)重,權(quán)數(shù)由近及遠(yuǎn)按指數(shù)規(guī)律遞減。指數(shù)平滑法主要任務(wù)就是要利用已知的航班延誤觀測值來確定[?]的值,合理確定[?]的取值方法十分重要。一般來說,當(dāng)時間序列波動很大,長期趨勢變化幅度較大,呈現(xiàn)明顯且迅速的上升或下降趨勢時,宜選擇較大的[?]值,如可在0.6~0.8間選對應(yīng)的權(quán)值,達(dá)到預(yù)測模型精度高的目的,以便于能迅速跟上數(shù)據(jù)變化的趨勢。根據(jù)式(3)、式(4)和統(tǒng)計出的航班延誤量數(shù)據(jù),本文中[?]取值為0.7從而得到預(yù)測模型,然后利用該模型進(jìn)行航班延誤預(yù)測。圖3給出了預(yù)測結(jié)果。通過指數(shù)平滑法的預(yù)測曲線圖以及預(yù)測結(jié)果對比可以看出,預(yù)測結(jié)果較為理想,趨勢基本和實(shí)際情況保持一致。

3 ?模型評估

在模型評估階段,對所建立的預(yù)測模型進(jìn)行評價必須基于一定的評價指標(biāo)[7],本文選擇如下統(tǒng)計量檢驗(yàn)預(yù)測效果:

(1) 均方根誤差(Root Mean Square Error):

[RMSE=1ni=1n(yi-yi)2] ?(5)

(2) 平均絕對百分比誤差(Mean Absolute Percentage Error):

[MAPE=1ni=1nyi-yiyi] (6)

(3) 平均絕對誤差(Mean Absolute Error):

[MAE=1ni=1nyi-yi] ?(7)

式中:[yi]為實(shí)際值;[yi]為預(yù)測值。由式(5)~式(7)經(jīng)對航班延誤數(shù)據(jù)的預(yù)測值和實(shí)際值進(jìn)行統(tǒng)計分析得出模型評估結(jié)果如表3所示。

表3 方差分析

由表3分析得出組內(nèi)方差和均方差SS=MS=0.011 059,F(xiàn)檢驗(yàn)結(jié)果F=0.000 35說明使用指數(shù)平滑法對航班延誤預(yù)測模型的分析試驗(yàn)精度較高,有較為理想的效果。

4 ?結(jié) ?語

(1) 本文以航班信息表作為主要研究對象,針對航班延誤問題建立了時間序列預(yù)測模型,使用指數(shù)平滑預(yù)測方法實(shí)現(xiàn)對航班延誤預(yù)測分析取得了較好的預(yù)測結(jié)果,證明了所建立的模型和算法的可行性。

(2) 一次指數(shù)平滑法有其局限性,短期預(yù)測效果精確度較高但不適合在中長期預(yù)測中使用,由于預(yù)測值是采取的歷史數(shù)據(jù)平均值,故與實(shí)際序列的變化相比有滯后現(xiàn)象。這一問題將在今后的學(xué)習(xí)中作進(jìn)一步研究。

圖3 指數(shù)平滑法的預(yù)測結(jié)果

參考文獻(xiàn)

[1] 朱金福.航空運(yùn)輸規(guī)劃[M].西安:西北工業(yè)大學(xué)出版社,2009.

[2] 中國民用航空總局.大型飛機(jī)公共航空運(yùn)輸承運(yùn)人運(yùn)行合格審定規(guī)則[EB/OL]. [2010?01?04].http://www.caac.gov.cn/B1/B6/201003/t20100319_31073.html.

[3] DUNHAM M H.數(shù)據(jù)挖掘教程[M].郭崇慧,田鳳占,譯.北京:清華大學(xué)出版社,2005.

[4] KANTARDZIC Mehmed.數(shù)據(jù)挖掘概念模型和算法[M].王曉海,吳志剛,譯.北京:清華大學(xué)出版社,2013.

[5] 毛國君,段立娟,王實(shí),等.數(shù)據(jù)挖掘原理與算法[M].北京:清華大學(xué)出版社,2005.

[6] 羅鳳娥,賈振振.基于模糊綜合評價法的航空公司延誤控制水平分析[J].科技創(chuàng)新報,2013(6):88?89.

[7] 呂曉玲,謝邦昌.數(shù)據(jù)挖掘方法與應(yīng)用[M].北京:中國人民大學(xué)出版社,2009.

本文采用常用的數(shù)據(jù)挖掘預(yù)測方法,針對時間序列的典型數(shù)據(jù)挖掘應(yīng)用中的一種,給定一個具有一組已知值的時間序列,預(yù)測屬性未來值。2012年4月1日—4月15日,連續(xù)預(yù)測15天,每天取15個預(yù)測點(diǎn),共計225個預(yù)測點(diǎn),數(shù)據(jù)挖掘所使用的數(shù)據(jù)訓(xùn)練集合從2012年1月1日—2012年3月31日,所采用預(yù)測方法和相應(yīng)結(jié)果如下:平滑(smoothing)就是一種去除時間序列中非系統(tǒng)化行為的方法。指數(shù)平滑[6]的原理為:當(dāng)利用過去觀測值的加權(quán)平均來預(yù)測未來的觀測值時,離得越近的觀測值要給予更大的權(quán)。指數(shù)平滑法通過對權(quán)數(shù)加以改進(jìn),能提供良好的短期預(yù)測精度,因而實(shí)際應(yīng)用較為廣泛。本文采用一次指數(shù)平滑法的基本思想來解決航班延誤預(yù)測模型的分析。如果用Yt表示在t時間平滑后的數(shù)據(jù)(或預(yù)測值),而用X1,X2,…,Xt表示原始時間序列,那么一次指數(shù)平滑模型為:

[Yt=?Xt+(1-?)Yt-1, ? ?0<?<1]

或:

[Yt=?k=0t-1(1-?)kXt-k] (3)

這里的系數(shù)為幾何級數(shù),一次指數(shù)平滑模型用于預(yù)測的公式為:

[Yt+1=?Xt+(1-?)Yt] (4)

需要注意的是對距離預(yù)測期較近的觀察值賦予相對較大的權(quán)重,對距離預(yù)測值比較遠(yuǎn)的觀察值賦予較小的權(quán)重,權(quán)數(shù)由近及遠(yuǎn)按指數(shù)規(guī)律遞減。指數(shù)平滑法主要任務(wù)就是要利用已知的航班延誤觀測值來確定[?]的值,合理確定[?]的取值方法十分重要。一般來說,當(dāng)時間序列波動很大,長期趨勢變化幅度較大,呈現(xiàn)明顯且迅速的上升或下降趨勢時,宜選擇較大的[?]值,如可在0.6~0.8間選對應(yīng)的權(quán)值,達(dá)到預(yù)測模型精度高的目的,以便于能迅速跟上數(shù)據(jù)變化的趨勢。根據(jù)式(3)、式(4)和統(tǒng)計出的航班延誤量數(shù)據(jù),本文中[?]取值為0.7從而得到預(yù)測模型,然后利用該模型進(jìn)行航班延誤預(yù)測。圖3給出了預(yù)測結(jié)果。通過指數(shù)平滑法的預(yù)測曲線圖以及預(yù)測結(jié)果對比可以看出,預(yù)測結(jié)果較為理想,趨勢基本和實(shí)際情況保持一致。

3 ?模型評估

在模型評估階段,對所建立的預(yù)測模型進(jìn)行評價必須基于一定的評價指標(biāo)[7],本文選擇如下統(tǒng)計量檢驗(yàn)預(yù)測效果:

(1) 均方根誤差(Root Mean Square Error):

[RMSE=1ni=1n(yi-yi)2] ?(5)

(2) 平均絕對百分比誤差(Mean Absolute Percentage Error):

[MAPE=1ni=1nyi-yiyi] (6)

(3) 平均絕對誤差(Mean Absolute Error):

[MAE=1ni=1nyi-yi] ?(7)

式中:[yi]為實(shí)際值;[yi]為預(yù)測值。由式(5)~式(7)經(jīng)對航班延誤數(shù)據(jù)的預(yù)測值和實(shí)際值進(jìn)行統(tǒng)計分析得出模型評估結(jié)果如表3所示。

表3 方差分析

由表3分析得出組內(nèi)方差和均方差SS=MS=0.011 059,F(xiàn)檢驗(yàn)結(jié)果F=0.000 35說明使用指數(shù)平滑法對航班延誤預(yù)測模型的分析試驗(yàn)精度較高,有較為理想的效果。

4 ?結(jié) ?語

(1) 本文以航班信息表作為主要研究對象,針對航班延誤問題建立了時間序列預(yù)測模型,使用指數(shù)平滑預(yù)測方法實(shí)現(xiàn)對航班延誤預(yù)測分析取得了較好的預(yù)測結(jié)果,證明了所建立的模型和算法的可行性。

(2) 一次指數(shù)平滑法有其局限性,短期預(yù)測效果精確度較高但不適合在中長期預(yù)測中使用,由于預(yù)測值是采取的歷史數(shù)據(jù)平均值,故與實(shí)際序列的變化相比有滯后現(xiàn)象。這一問題將在今后的學(xué)習(xí)中作進(jìn)一步研究。

圖3 指數(shù)平滑法的預(yù)測結(jié)果

參考文獻(xiàn)

[1] 朱金福.航空運(yùn)輸規(guī)劃[M].西安:西北工業(yè)大學(xué)出版社,2009.

[2] 中國民用航空總局.大型飛機(jī)公共航空運(yùn)輸承運(yùn)人運(yùn)行合格審定規(guī)則[EB/OL]. [2010?01?04].http://www.caac.gov.cn/B1/B6/201003/t20100319_31073.html.

[3] DUNHAM M H.數(shù)據(jù)挖掘教程[M].郭崇慧,田鳳占,譯.北京:清華大學(xué)出版社,2005.

[4] KANTARDZIC Mehmed.數(shù)據(jù)挖掘概念模型和算法[M].王曉海,吳志剛,譯.北京:清華大學(xué)出版社,2013.

[5] 毛國君,段立娟,王實(shí),等.數(shù)據(jù)挖掘原理與算法[M].北京:清華大學(xué)出版社,2005.

[6] 羅鳳娥,賈振振.基于模糊綜合評價法的航空公司延誤控制水平分析[J].科技創(chuàng)新報,2013(6):88?89.

[7] 呂曉玲,謝邦昌.數(shù)據(jù)挖掘方法與應(yīng)用[M].北京:中國人民大學(xué)出版社,2009.

猜你喜歡
決策支持數(shù)據(jù)挖掘
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
管理會計在我國高校財務(wù)管理中的應(yīng)用探析
數(shù)據(jù)挖掘技術(shù)在中醫(yī)診療數(shù)據(jù)分析中的應(yīng)用
商業(yè)智能分析模式在醫(yī)保病人住院化管理當(dāng)中的應(yīng)用研究
關(guān)聯(lián)規(guī)則在網(wǎng)絡(luò)學(xué)習(xí)平臺中的應(yīng)用研究
建立跨區(qū)域、多維度、品種一體化預(yù)算管控體系
秦山核電應(yīng)急決策支持系統(tǒng)開發(fā)與研究
科技視界(2016年15期)2016-06-30 00:32:07
基于RFID的汽車零件銷售策略支持模型
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
卢氏县| 莫力| 保德县| 襄城县| 辽阳市| 青铜峡市| 蕉岭县| 日土县| 普宁市| 陇西县| 安泽县| 兴化市| 菏泽市| 礼泉县| 库尔勒市| 太和县| 蒙山县| 凯里市| 筠连县| 永宁县| 桦川县| 霍林郭勒市| 东阿县| 嘉鱼县| 临城县| 库伦旗| 盐津县| 崇州市| 巨野县| 祁连县| 赤壁市| 高雄市| 全椒县| 阿克陶县| 屯昌县| 汾阳市| 仁寿县| 松原市| 合肥市| 大余县| 遂昌县|