苗競文 羅貝妮 鄭曉峰吉林財(cái)經(jīng)大學(xué)
?
航班延誤問題的研究
苗競文 羅貝妮 鄭曉峰
吉林財(cái)經(jīng)大學(xué)
摘要:香港南華早報(bào)網(wǎng)根據(jù)flightstats.com 的統(tǒng)計(jì)稱:中國的航班延誤最嚴(yán)重,國際上航班延誤最嚴(yán)重的10個機(jī)場中,中國占了7個。其中包括上海浦東、上海虹橋、北京國際、杭州蕭山、廣州白云、深圳寶安、成都雙流等機(jī)場.本文主要研究我國是否存在航班延誤問題及航班延誤的原因。本文運(yùn)用統(tǒng)計(jì)學(xué)上假設(shè)檢驗(yàn)的方法判斷我國是否存在航班延誤的問題;采用了多元線性回歸的方法,定量分析航班延誤的原因。為判斷是否存在航班延誤問題,本文利用香港南華早報(bào)中所采用的flightstats. com網(wǎng)站公布的《2014年的全球機(jī)場準(zhǔn)點(diǎn)率排名》上的數(shù)據(jù),對上海浦東、上海虹橋、北京國際、杭州蕭山、廣州白云、深圳寶安、成都雙流等7個機(jī)場各隨機(jī)抽取150個班次作為樣本,進(jìn)行航班延誤時(shí)間的統(tǒng)計(jì).運(yùn)用統(tǒng)計(jì)學(xué)中的假設(shè)檢驗(yàn)的方法,對flightstats.com中數(shù)據(jù)的真?zhèn)涡赃M(jìn)行檢驗(yàn)。為定量分析航班延誤原因,建立了多元線性回歸模型,分析可能導(dǎo)致航班延誤的原因及其與航班延誤的相關(guān)關(guān)系.通過查閱大量資料本文確定了一些影響航班延誤的因素,并以這些因素為基礎(chǔ)進(jìn)行回歸分析,進(jìn)而剔除對航班延誤影響不顯著的因素,得出航班延誤的主要原因,利用Eviews軟件進(jìn)行求解。
關(guān)鍵字:假設(shè)檢驗(yàn) 多元線性回歸模型 Eviews軟件
(1)本文中航班延誤指的是實(shí)際起飛時(shí)間比計(jì)劃起飛時(shí)間晚15分鐘以上(不包括15分鐘);
(2)顯著性水平α=0.05α=0.05;
i: 上海浦東、上海虹橋、北京國際、杭州蕭山、廣州白云、深圳寶安、成都雙流這七個機(jī)場分別標(biāo)號1、2、3、4、5、6、7;
θi:第i個機(jī)場樣本的正點(diǎn)率;
ni:第i個機(jī)場的樣本數(shù)( ni-150);
?:各個致因因素出現(xiàn)頻數(shù)的矩陣;
3.1問題的進(jìn)一步分析
為判斷是否存在航班延誤問題,把上海浦東、上海虹橋、北京國際、杭州蕭山、廣州白云、深圳寶安、成都雙流分別作為出發(fā)地,在2014年的數(shù)據(jù)中各隨機(jī)抽取150次航班,分別統(tǒng)計(jì)延誤時(shí)間,對香港南華早報(bào)中所采用的flight stats.com發(fā)布的《2014年的全球機(jī)場準(zhǔn)點(diǎn)率排名》中各個機(jī)場的正點(diǎn)率進(jìn)行假設(shè)檢驗(yàn),以此來驗(yàn)證flight stats.com數(shù)據(jù)的真實(shí)性,進(jìn)而判斷我國是否存在航班延誤的問題.
3.2 數(shù)據(jù)處理
flight stats.com公布的《2014年的全球機(jī)場準(zhǔn)點(diǎn)率排名》中2014年中國機(jī)場的正點(diǎn)率如下:上海浦東機(jī)場正點(diǎn)率為37.26%、上海虹橋機(jī)場正點(diǎn)率為37.17%、北京國際機(jī)場正點(diǎn)率為52.64%、杭州蕭山機(jī)場正點(diǎn)率為36.74%、廣州白云機(jī)場正點(diǎn)率為49.56%、深圳寶安機(jī)場正點(diǎn)率為49.42%、成都雙流機(jī)場正點(diǎn)率為57.61%.
抽樣調(diào)查的中國上海浦東、上海虹橋、北京國際、杭州蕭山、廣州白云、深圳寶安、成都雙流這七個機(jī)場的延誤情況,計(jì)算這七個機(jī)場抽樣航班的正點(diǎn)率:
計(jì)算結(jié)果如下:上海浦東機(jī)場正點(diǎn)率為10%、上海虹橋機(jī)場正點(diǎn)率為15.33%、北京國際機(jī)場正點(diǎn)率為16%、杭州蕭山機(jī)場正點(diǎn)率為12.67%、廣州白云機(jī)場正點(diǎn)率為11.33%、深圳寶安機(jī)場正點(diǎn)率為15.33%、成都雙流機(jī)場正點(diǎn)率為48%.
3.3 模型建立
為驗(yàn)證我國是否存在航班延誤問題,利用統(tǒng)計(jì)學(xué)上假設(shè)檢驗(yàn)的方法,建立的數(shù)學(xué)模型如下:
依據(jù)香港南華早報(bào)中所采用的flight stats.com發(fā)布的《2014年的全球機(jī)場準(zhǔn)點(diǎn)率排名》里2014年中國7個機(jī)場正點(diǎn)率和抽樣調(diào)查得出的2014年中國7個機(jī)場正點(diǎn)率,提出如下假設(shè):
在H0成立時(shí),
3.4 模型求解
根據(jù)樣本觀察值計(jì)算得:
1 2 3 4 5 6 7 ? -6.905 -5.535 -8.987 -6.115 -9.364 -8.351 -2.382
因?yàn)閦i<-1.645全部成立,則都接受H1,故以0.05的顯著性水平證實(shí)了備擇假設(shè)成立.
3.5結(jié)果分析
假設(shè)檢驗(yàn)結(jié)果顯示,我國7個主要機(jī)場的正點(diǎn)率低于flightstats.com發(fā)布的《2014年的全球機(jī)場準(zhǔn)點(diǎn)率排名》中的正點(diǎn)率.flightstats.com統(tǒng)計(jì)的數(shù)據(jù)已經(jīng)說明我國的航班延誤十分嚴(yán)重,而我們抽樣調(diào)查的數(shù)據(jù)顯示我國7個主要機(jī)場的正點(diǎn)率比flightstats.com統(tǒng)計(jì)的正點(diǎn)率還低,這充分證明了我國的航班延誤十分嚴(yán)重這一結(jié)論的正確性.
4.1問題的進(jìn)一步分析
通過查閱大量資料,我們確定了一些影響航班延誤的因素,其中有天氣、公司、流量控制、機(jī)場、聯(lián)檢、油料、離港系統(tǒng)、旅客、軍事活動、公共安全這10個原因.對這10個原因進(jìn)行線性回歸分析,研究這10個原因與航班延誤之間的相關(guān)關(guān)系。
4.2數(shù)據(jù)處理
我們統(tǒng)計(jì)了1996年—2012年天氣、公司、流量控制、機(jī)場、聯(lián)檢、油料、離港系統(tǒng)、旅客、軍事活動、公共安全這10個因素分別導(dǎo)致的航空延誤的班次。
對延誤航班次數(shù)和導(dǎo)致航班延誤的各個原因的次數(shù)繪制線性統(tǒng)計(jì)圖,可以大致看出因變量(不正常班次)與自變量(各個原因?qū)е碌暮桨嘌诱`次數(shù))呈線性關(guān)系,所以可以建立線性回歸的數(shù)學(xué)模型來分析因變量與自變量之間的相關(guān)關(guān)系。
4.3模型建立
4.4 模型求解
利用Eviews軟件得到估計(jì)方程的輸出結(jié)果,得模型估計(jì)結(jié)果為:
根據(jù)p值判斷,給定0.05的顯著性水平,回歸系數(shù)的估計(jì)值只有具有顯著性.而模型的擬合優(yōu)度(R2)很高,F(xiàn)值很高,說明解釋變量間可能存在多重共線性.
下面用Klein判別法來檢驗(yàn)?zāi)P椭械亩嘀毓簿€性,利用相關(guān)系數(shù)矩陣來查看解釋變量之間的簡單相關(guān)系數(shù).
根據(jù)變量之間的簡單相關(guān)系數(shù),可以看到解釋變量之間是高度相關(guān)的,即模型存在著多重共線性問題.
為優(yōu)化模型,我們用逐步回歸法克服多重共線性,首先用解釋變量對每一個解釋變量做簡單回歸,以此建立Y關(guān)于
x10的回歸式,這10個回歸式按可決系數(shù)大小排列.
將第一個回歸式作為基本的回歸方程,按解釋變量重要性從大到小的順序逐個引入其余的解釋變量.
首先,引入x3,對Y 關(guān)于x1和x3作回歸分析,得出回歸方程為:.
可以看出,加入x3后,改進(jìn)了R2,且回歸參數(shù)的t檢驗(yàn)在統(tǒng)計(jì)上也是顯著的,所以在模型中保留x3.
的系數(shù)不能通過t檢驗(yàn),認(rèn)為這些變量是多余的,應(yīng)該舍棄.
綜上所述,我們求解出的線性回歸方程為:
4.5結(jié)果分析
根據(jù)對天氣、公司、流量控制、機(jī)場、聯(lián)檢、油料、離港系統(tǒng)、旅客、軍事活動、公共安全這10個原因的線性回歸分析,我們發(fā)現(xiàn)天氣、公司、流量控制、旅客、軍事活動這5個原因?qū)桨嘌诱`有顯著影響,機(jī)場、聯(lián)檢、油料、離港系統(tǒng)、公共安全對航班延誤的影響不夠顯著,可以忽略不計(jì).
本文建立了兩個模型。首先通過假設(shè)檢驗(yàn)的方法判斷我國是否存在航班延誤這一問題,從結(jié)果可以看出我國航班延誤十分嚴(yán)重。進(jìn)而通過查閱資料得到天氣、公司、流量控制、機(jī)場、聯(lián)檢、油料、離港系統(tǒng)、旅客、軍事活動、公共安全這10個影響航班運(yùn)行的因素,并結(jié)合我國數(shù)據(jù)進(jìn)行相關(guān)回歸分析,以確定導(dǎo)致我過航班延誤的主要原因,建立了線性回歸方程,得出天氣、公司、流量控制、旅客和軍事活動這5個因素是導(dǎo)致我國航班延誤的主要原因,為進(jìn)一步建立航班延誤預(yù)警機(jī)制以及有針對的解決航班延誤問題提供了理論基礎(chǔ).
6.1模型的優(yōu)點(diǎn)
模型一:假設(shè)檢驗(yàn)?zāi)軌蛴脴颖局笜?biāo)估計(jì)總體指標(biāo),依據(jù)一定的概率原則,以較小的風(fēng)險(xiǎn)來判斷估計(jì)數(shù)值與總體數(shù)值是否存在顯著差距,本文以flightstats.com網(wǎng)站公布的《2014年的全球機(jī)場準(zhǔn)點(diǎn)率排名》上的數(shù)據(jù)為估計(jì)數(shù)值,發(fā)現(xiàn)總體數(shù)值并未與之有顯著差異,即我國航班延誤問題確實(shí)十分嚴(yán)重.
模型二:線性回歸分析可以準(zhǔn)確的計(jì)量各個因素之間的相關(guān)程度與回歸擬合程度的高低.簡潔明了,得到的因素權(quán)重可信度比較高.本文通過線性回歸分析找出了影響我國航班延誤的因素,分別是天氣、公司、流量控制、旅客和軍事活動這5個因素。
6.2模型的缺點(diǎn)和改進(jìn)
引進(jìn)變量時(shí),我們尚未考慮實(shí)際問題的一些因素以及事件具有隨機(jī)性,把問題理想化構(gòu)造模型,這與解決實(shí)際問題有一定距離,而且因素具有不確定性。
參考文獻(xiàn)
[1]馬敏娜,王靜敏.統(tǒng)計(jì)學(xué).高等教育出版社.2011
[2]易丹輝.數(shù)據(jù)分析與EViews應(yīng)用.中國人民大學(xué)出版社.2008
[3]攸頻,張曉峒.Eviews6實(shí)用教程.中國財(cái)政經(jīng)濟(jì)出版社.2008
[4]中國民用航天局發(fā)展計(jì)劃司.從統(tǒng)計(jì)看民航(1997-2013).中國民航出版社.1997-2013