国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于SARIMA模型的短期機(jī)票價(jià)格預(yù)測(cè)

2024-09-19 00:00:00高棟溫建波張凱倫于嘉璐張思琪
現(xiàn)代信息科技 2024年13期

摘 要:為研究不同城市機(jī)場(chǎng)間短期機(jī)票價(jià)格預(yù)測(cè)的問題,文章將機(jī)票數(shù)據(jù)按照OD、座艙類型、購(gòu)票時(shí)間進(jìn)行分類,并分場(chǎng)景構(gòu)建SARIMA模型。采用當(dāng)前時(shí)序的數(shù)據(jù)標(biāo)定模型的參數(shù),預(yù)測(cè)下一時(shí)序的機(jī)票價(jià)格。以2023年7月北京—上海的機(jī)票價(jià)格數(shù)據(jù)為例,通過4組實(shí)驗(yàn)場(chǎng)景和改進(jìn)的北京首都—上海虹橋?qū)嶒?yàn)場(chǎng)景發(fā)現(xiàn),分場(chǎng)景的SARIMA模型可以較為準(zhǔn)確地預(yù)測(cè)短期機(jī)票價(jià)格。

關(guān)鍵詞:航空運(yùn)輸;票價(jià)預(yù)測(cè);時(shí)間序列;短期機(jī)票價(jià)格預(yù)測(cè)

中圖分類號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2096-4706(2024)13-0136-05

Short-term Airfare Prediction Based on SARIMA Model

GAO Dong, WEN Jianbo, ZHANG Kailun, YU Jialu, ZHANG Siqi

(Travelsky Mobile Technology Limited, Beijing 100041, China)

Abstract: In order to study the problem of short-term airfare prediction among airports in different cities, this paper classifies ticket data by OD, cabin type, and ticket purchase time, and constructs a SARIMA model based on different scenarios. It uses the data from the current time series to calibrate the parameters of the model, predict the ticket price for the next time series. Taking the airfare data from Beijing to Shanghai in July 2023 as an example, through four experimental scenarios and an improved Beijing Capital—Shanghai Hongqiao experimental scenario, it is found that the SARIMA model with different scenarios can accurately predict short-term airfare.

Keywords: air transportation; airfare prediction; time series; short-term airfare prediction

0 引 言

隨著旅客出行需求的不斷增加,航空運(yùn)輸作為一種快捷、高效的出行方式備受廣大旅客的歡迎。在航空運(yùn)輸業(yè)不斷發(fā)展的新格局下,越來越多的旅客希望在合適的時(shí)間以較低的價(jià)格購(gòu)買到滿意的機(jī)票,以便合理安排出行計(jì)劃,降低出行成本,提高出行體驗(yàn)。然而,由于機(jī)票價(jià)格具有實(shí)時(shí)波動(dòng)性,購(gòu)票問題是一個(gè)較為復(fù)雜的問題。旅客往往需要花費(fèi)大量的時(shí)間和精力去追蹤機(jī)票價(jià)格并選取最優(yōu)惠的機(jī)票,這極大地浪費(fèi)了旅客的時(shí)間和精力。機(jī)票價(jià)格預(yù)測(cè)可以有效解決這個(gè)問題并更好地幫助旅客安排出行計(jì)劃。因此研究這個(gè)問題具有重要的理論意義和實(shí)用價(jià)值。

在機(jī)票價(jià)格預(yù)測(cè)的研究中,機(jī)器學(xué)習(xí)模型成為熱門的研究方向,通過對(duì)歷史數(shù)據(jù)進(jìn)行分析和建模,能夠預(yù)測(cè)未來機(jī)票價(jià)格的趨勢(shì)。常用的機(jī)器學(xué)習(xí)模型包括線性回歸、決策樹、支持向量機(jī)和神經(jīng)網(wǎng)絡(luò)等。近年來,隨著深度學(xué)習(xí)技術(shù)的發(fā)展,基于深度學(xué)習(xí)的機(jī)票價(jià)格預(yù)測(cè)方法也受到越來越多的關(guān)注。這些方法通過構(gòu)建神經(jīng)網(wǎng)絡(luò)模型,能夠自動(dòng)地從海量數(shù)據(jù)中提取到對(duì)機(jī)票價(jià)格產(chǎn)生影響的季節(jié)、時(shí)間、航班、艙位、城市間的交通狀況等特征,并進(jìn)行預(yù)測(cè)。通過構(gòu)建復(fù)雜的神經(jīng)網(wǎng)絡(luò)模型,可以將機(jī)票價(jià)格與這些特征進(jìn)行關(guān)聯(lián),從而提高預(yù)測(cè)的準(zhǔn)確性,為航空公司和旅客提供重要的決策依據(jù),為更好地規(guī)劃行程和控制成本奠定基礎(chǔ)。

關(guān)于不同城市間航班的機(jī)票價(jià)格預(yù)測(cè)問題,目前國(guó)內(nèi)外有較多研究。Wang等[1]通過多目標(biāo)優(yōu)化方法選擇機(jī)票數(shù)據(jù)集的最佳特征子集,利用最優(yōu)子集找到匹配度最高的最佳預(yù)測(cè)方法并構(gòu)建動(dòng)態(tài)自適應(yīng)模型。Kalampokas等[2]考慮了3個(gè)不同領(lǐng)域的人工智能模型,包括機(jī)器學(xué)習(xí)、深度學(xué)習(xí)的6個(gè)CNN模型和量子機(jī)器學(xué)習(xí)的2個(gè)CNN模型,以解決機(jī)票價(jià)格預(yù)測(cè)問題。Zhao等[3]提出了一種創(chuàng)新性的民航票價(jià)預(yù)測(cè)系統(tǒng),該系統(tǒng)具有多屬性雙階段關(guān)注(MADA)機(jī)制,可以整合從同一維度提取的不同類型數(shù)據(jù)。Prasath等[4]采用KNN技術(shù),利用機(jī)器學(xué)習(xí)回歸方法估算特定時(shí)間的機(jī)票價(jià)格。顧兆軍等[5]建立了一個(gè)先序移動(dòng)平均數(shù)模型,并根據(jù)基于時(shí)間序列的機(jī)票預(yù)測(cè)算法來求解模型。華逸群等[6]將模糊時(shí)間序列引入機(jī)票價(jià)格預(yù)測(cè)問題中,將預(yù)測(cè)結(jié)果與傳統(tǒng)的時(shí)間序列AR模型、移動(dòng)平均和指數(shù)平滑比較來驗(yàn)證模糊時(shí)間序列模型的高效性。林友芳等[7]設(shè)計(jì)了以卷積神經(jīng)網(wǎng)絡(luò)為核心的兩階段機(jī)票價(jià)格預(yù)測(cè)模型,對(duì)未來機(jī)票最低價(jià)格進(jìn)行了預(yù)測(cè),并通過實(shí)例分析驗(yàn)證了本文所采用的模型相較于4種常用基準(zhǔn)模型的突出優(yōu)勢(shì)。單文煜等[8]分別使用隨機(jī)森林和XGBoost算法建立預(yù)測(cè)模型,并在經(jīng)典機(jī)器學(xué)習(xí)模型基礎(chǔ)上做一定改進(jìn)。姚悅[9]利用時(shí)間序列模型對(duì)票價(jià)進(jìn)行初步預(yù)測(cè),再使用隨機(jī)森林模型對(duì)時(shí)間序列的殘差值進(jìn)行調(diào)整,提出了SARIMA-RF串聯(lián)組合模型。王雙等[10]以歷史機(jī)票數(shù)據(jù)作為研究對(duì)象,運(yùn)用線性回歸模型、梯度提升模型、隨機(jī)森林模型、CART決策樹模型、K近鄰模型和MLP模型評(píng)估不同數(shù)據(jù)子集預(yù)測(cè)結(jié)果的優(yōu)劣。結(jié)果表明,MLP模型應(yīng)用于5個(gè)子集的預(yù)測(cè)效果均表現(xiàn)良好。

上述文獻(xiàn)從多個(gè)角度探討了機(jī)票價(jià)格預(yù)測(cè)問題。其中,一些研究采用了機(jī)器學(xué)習(xí)和深度學(xué)習(xí)模型來預(yù)測(cè)機(jī)票價(jià)格,如線性回歸、決策樹、支持向量機(jī)、卷積神經(jīng)網(wǎng)絡(luò)、隨機(jī)森林、XGBoost等模型;另外一些研究則考慮了特定領(lǐng)域的人工智能模型,包括量子機(jī)器學(xué)習(xí)和模糊時(shí)間序列等模型。這些模型都可以從歷史數(shù)據(jù)中自動(dòng)提取特征,并對(duì)未來機(jī)票價(jià)格趨勢(shì)進(jìn)行預(yù)測(cè)。此外,還有一些研究提出了創(chuàng)新性的預(yù)測(cè)系統(tǒng)或算法,如多屬性雙階段關(guān)注(MADA)機(jī)制、先序移動(dòng)平均數(shù)模型等。這些研究結(jié)果均表明,利用機(jī)器學(xué)習(xí)和深度學(xué)習(xí)模型可以有效地預(yù)測(cè)不同城市間航班的機(jī)票價(jià)格,并且在實(shí)際應(yīng)用中具有很高的準(zhǔn)確性和實(shí)用性。

1 問題描述與建模

1.1 受時(shí)間變化影響的機(jī)票價(jià)格預(yù)測(cè)

機(jī)票價(jià)格分析是一個(gè)較為復(fù)雜的動(dòng)態(tài)變化分析,受到購(gòu)票時(shí)間、淡旺季、打折活動(dòng)、航司決策等因素的影響。常用的機(jī)票價(jià)格預(yù)測(cè)方法主要分為基于票價(jià)時(shí)間發(fā)展規(guī)律的時(shí)間序列方法和基于票價(jià)影響因素的機(jī)器學(xué)習(xí)方法。由于機(jī)票實(shí)時(shí)價(jià)格的影響因素較多,本文從簡(jiǎn)化問題的角度出發(fā),主要采用基于票價(jià)時(shí)間發(fā)展規(guī)律的時(shí)間序列方法來預(yù)測(cè)機(jī)票。

機(jī)票價(jià)格從時(shí)間發(fā)展上具有趨勢(shì)性、隨機(jī)性和波動(dòng)性的特點(diǎn),因此季節(jié)性的時(shí)間序列模型可以較好地反映價(jià)格的分布規(guī)律。采用時(shí)間序列的方法來預(yù)測(cè)機(jī)票價(jià)格時(shí),選擇一個(gè)可以快速衡量機(jī)票數(shù)據(jù)變化特征的模型尤為重要。實(shí)際生活中純季節(jié)性模型很少見,更常見的是混合季節(jié)性模型SARIMA。本文采用SARIMA模型來合理分解時(shí)間序列并進(jìn)行機(jī)票價(jià)格的預(yù)測(cè),可以較為準(zhǔn)確的分析機(jī)票價(jià)格隨航班起飛時(shí)間、提前購(gòu)票天數(shù)的變化規(guī)律。

1.2 短期預(yù)測(cè)模型SARIMA

SARIMA模型可以表示為如式(1)所示的形式。該模型的季節(jié)周期為s,對(duì)應(yīng)時(shí)間序列xt的季節(jié)差分表示為?sxt,?sxt的計(jì)算過程如式(2)所示:

非平穩(wěn)時(shí)間序列xt經(jīng)過d階差分和D階季節(jié)差分后變成平穩(wěn)時(shí)間序列yt,記作式(3):

若yt滿足季節(jié)周期為s的ARMA(p,q)×(P,Q)S模型,那么xt滿足非季節(jié)階數(shù)為(p,d,q),季節(jié)階數(shù)為(P,D,Q),季節(jié)周期為s的非平穩(wěn)乘積季節(jié)ARIMA模型,即式(1)所示的模型。同時(shí),其自回歸和移動(dòng)平均函數(shù)定義為式(4):

式中:(P,D,Q)為模型中季節(jié)性的部分,(p,d,q)為模型中非季節(jié)性的部分。δ為常數(shù)項(xiàng),φ(L)和θ(L)為一般自回歸和移動(dòng)平均成分,?(L)和?(L)為季節(jié)自回歸和移動(dòng)平均成分,常差分和季節(jié)差分為?d = (1-L)d和 。

1.3 初始機(jī)票數(shù)據(jù)分析及時(shí)間序列劃分

由于7月、8月的機(jī)票價(jià)格均受到暑期客流出行的影響,變化規(guī)律具有相似性,因此本文僅對(duì)提前購(gòu)票時(shí)間在1個(gè)月內(nèi)的機(jī)票價(jià)格進(jìn)行預(yù)測(cè)。2023年7月北京—上海不同機(jī)場(chǎng)間共有108個(gè)直飛航班,其中,每天均起飛的航班共60個(gè),如MU5104、HO1254、MU5183。這些航班在一個(gè)月內(nèi)的頭等艙購(gòu)票人數(shù)不超過28人,公務(wù)艙、經(jīng)濟(jì)艙的購(gòu)票人數(shù)約為1:2.5。因此,在分解時(shí)間序列時(shí),本文主要研究經(jīng)濟(jì)艙價(jià)格的變化規(guī)律。本文以2023年7月31日60個(gè)航班為例,展示了提前一個(gè)月內(nèi)購(gòu)票的經(jīng)濟(jì)艙機(jī)票價(jià)格,如圖1所示。

根據(jù)圖1,旅客集中選擇在飛機(jī)起飛的一周內(nèi)來購(gòu)票。同時(shí),受到不同航司機(jī)票打折活動(dòng)的影響,每周內(nèi)有幾天機(jī)票價(jià)格會(huì)有短暫的下降。因此,本文選擇進(jìn)一步分解時(shí)間序列,將一周內(nèi)的時(shí)間分為前半周、后半周來分析。

2 模擬計(jì)算

將2023年7月乘客在北京—上海不同機(jī)場(chǎng)間一周內(nèi)購(gòu)票的機(jī)票數(shù)據(jù)作為研究對(duì)象,OD分為北京首都—上海虹橋、北京首都—上海浦東、北京大興—上海虹橋、北京大興—上海浦東4種類型,座艙分為公務(wù)艙、頭等艙、經(jīng)濟(jì)艙3種類型。對(duì)于經(jīng)濟(jì)艙,提前購(gòu)票時(shí)間分為提前購(gòu)票0~4天(前半周)、提前購(gòu)票5~7天(后半周)兩個(gè)范圍。本文分別對(duì)4種OD的3種座艙類型兩種購(gòu)票范圍的機(jī)票價(jià)格進(jìn)行預(yù)測(cè),如圖2所示。

首先,我們利用ADF檢驗(yàn)、白噪聲檢驗(yàn)來檢查原始機(jī)票數(shù)據(jù)的平穩(wěn)性,如表1所示。本文對(duì)初始非平穩(wěn)的數(shù)據(jù)進(jìn)行后續(xù)的差分處理,從而通過網(wǎng)絡(luò)搜索法確定每個(gè)ARIMA模型的參數(shù)。

由SARIMA模型是通過我們之前討論的ARIMA模型多項(xiàng)式中引入了季節(jié)性的項(xiàng)得到的,因此該模型的各個(gè)參數(shù)由ARIMA模型的參數(shù)來確定,如表2所示。

通過不同需求場(chǎng)景的機(jī)票數(shù)據(jù)建立SARIMA模型后,需要對(duì)模型的有效性和參數(shù)的顯著性進(jìn)行檢驗(yàn),如圖3所示。

檢驗(yàn)指標(biāo)包括均方誤差MSE、均方根誤差RMSE,本文以靜態(tài)預(yù)測(cè)為例,對(duì)不同OD經(jīng)濟(jì)艙的檢驗(yàn)指標(biāo)進(jìn)行展示和分析。此外,我們需要對(duì)當(dāng)前不同情景的預(yù)測(cè)效果進(jìn)行量化分析,本文選用大部分研究采用的絕對(duì)平均誤差MAPE評(píng)價(jià)預(yù)測(cè)的準(zhǔn)確度。上述指標(biāo)如表3所示。

3 結(jié)果分析

將8月機(jī)票價(jià)格預(yù)測(cè)值和實(shí)際值進(jìn)行比較,如圖4所示。

通過表3和圖4可知,4種場(chǎng)景的絕對(duì)平均誤差MAPE的值整體低于18%,SARIMA模型在分類場(chǎng)景中具有較好的適用性。北京首都—上海虹橋在當(dāng)前時(shí)序的擬合誤差較大,但是對(duì)未來發(fā)展趨勢(shì)的預(yù)測(cè)效果較好。北京首都—上海浦東、北京大興—上海虹橋、北京大興—上海浦東在當(dāng)前時(shí)序的擬合誤差較小,但是對(duì)未來發(fā)展趨勢(shì)的預(yù)測(cè)效果一般。在參數(shù)檢驗(yàn)的基礎(chǔ)上,為了進(jìn)一步優(yōu)化模型,本文主要對(duì)北京首都—上海虹橋不同座艙類型一周內(nèi)購(gòu)買的機(jī)票的提前購(gòu)票天數(shù)進(jìn)行重新劃分,按照新的時(shí)間序列進(jìn)行重新預(yù)測(cè)。

在新的預(yù)測(cè)階段,通過反復(fù)實(shí)驗(yàn)發(fā)現(xiàn)當(dāng)一周內(nèi)的提前購(gòu)票天數(shù)按照0~3天、4~7天進(jìn)行劃分的時(shí)候,北京首都—上海虹橋不同座艙類型的機(jī)票價(jià)格預(yù)測(cè)的精度明顯提高,分別如表4、圖5所示。

此時(shí),不同座艙的時(shí)間序列模型分別為SARIMA(1,1,2)(2,1,2,5)、SARIMA(0,1,0)(2,1,0,11)、SARIMA(2,1,2)(0,1,2,5)、SARIMA(1,1,0)(2,1,0,9)。

通過表4和圖5可知,改進(jìn)時(shí)間序列后的優(yōu)化模型中北京首都—上海虹橋的誤差值整體降低,對(duì)8月同期機(jī)票價(jià)格的預(yù)測(cè)效果明顯改善。其中,絕對(duì)平均誤差MAPE的值下降了0.28%~2.96%。

4 結(jié) 論

本文得到的主要結(jié)論如下:

1)根據(jù)不同機(jī)場(chǎng)OD、不同座艙類型、不同購(gòu)票時(shí)間構(gòu)建的機(jī)票價(jià)格預(yù)測(cè)SARIMA模型綜合了季節(jié)性時(shí)間序列與ARIMA模型的雙重優(yōu)勢(shì):絕對(duì)平均誤差MAPE的值整體低于18%,這說明SARIMA模型在分類場(chǎng)景中具有較好的適用性。

2)通過不同場(chǎng)景SARIMA模型對(duì)機(jī)票價(jià)格進(jìn)行預(yù)測(cè)并與實(shí)際值對(duì)比的實(shí)驗(yàn)可知:改進(jìn)時(shí)間序列的優(yōu)化模型中北京首都—上海虹橋的誤差值整體降低,對(duì)8月同期機(jī)票價(jià)格的預(yù)測(cè)效果明顯改善,反映了改進(jìn)時(shí)間序列劃分方式對(duì)提高模型預(yù)測(cè)精度的積極作用。

參考文獻(xiàn):

[1] WANG S,LIUT T,DING L. Airline Ticket Price-Prediction Model Based on Integrated Feature Extraction [J].Journal of Computational Methods in Sciences and Engineering,2022,22(4):1053-1068.

[2] KALAMPOKAS T,TZIRIDIS K,KALAMPOKAS N,et al. A Holistic Approach on Airfare Price Prediction Using Machine Learning Techniques [J].IEEE Access,2023,11:46627-46643.

[3] ZHAO Z C,YOU J G,GAN G Y,et al. Civil Airline Fare Prediction with a Multi-Attribute Dual-Stage Attention Mechanism [J].Applied Intelligence,2022,52(5):5047-5062.

[4] PRASATH S N,KUMAR M S,ELIYAS S,et al. A Prediction of Flight Fare Using K-Nearest Neighbors [C]//2022 2nd International Conference on Advance Computing and Innovative Technologies in Engineering (ICACITE).Greater Noida:IEEE,2022:1347-1351.

[5] 顧兆軍,王雙,趙億.基于時(shí)間序列的機(jī)票價(jià)格預(yù)測(cè)模型 [J].中國(guó)民航大學(xué)學(xué)報(bào),2013,31(2):80-84.

[6] 華逸群,曹健.機(jī)票價(jià)格預(yù)測(cè)的模糊時(shí)間序列方法 [J].小型微型計(jì)算機(jī)系統(tǒng),2016,37(11):2547-2551.

[7] 林友芳,蔣鵬,郭晟楠,等.基于卷積神經(jīng)網(wǎng)絡(luò)的機(jī)票低價(jià)預(yù)測(cè) [J].北京交通大學(xué)學(xué)報(bào),2019,43(5):1-9.

[8] 單文煜,吳垠,陳鵬.基于機(jī)器學(xué)習(xí)的機(jī)票價(jià)格預(yù)測(cè)研究 [J].現(xiàn)代計(jì)算機(jī),2020(22):35-38.

[9] 姚悅.基于多預(yù)測(cè)模型的機(jī)票價(jià)格預(yù)測(cè) [D].南京:東南大學(xué),2021.

[10] 王雙,徐瑤,韓建云,等.基于機(jī)器學(xué)習(xí)算法的機(jī)票價(jià)格預(yù)測(cè)研究 [J].民航學(xué)報(bào),2022,6(5):16-20.

作者簡(jiǎn)介:高棟(1982—),男,漢族,浙江紹興人,高級(jí)工程師,碩士研究生,研究方向:系統(tǒng)工程、機(jī)器學(xué)習(xí);溫建波(1990—),男,漢族,河北張家口人,工程師,本科,研究方向:系統(tǒng)工程、機(jī)器學(xué)習(xí);張凱倫(1991—),女,漢族,河北唐山人,工程師,碩士研究生,研究方向:數(shù)據(jù)分析、數(shù)據(jù)倉(cāng)庫(kù);于嘉璐(1998—),女,漢族,河南洛陽(yáng)人,初級(jí)工程師,碩士研究生,研究方向:數(shù)據(jù)分析、數(shù)據(jù)倉(cāng)庫(kù);張思琪(1990—),女,蒙古族,遼寧朝陽(yáng)人,工程師,碩士研究生,研究方向:數(shù)據(jù)分析、數(shù)據(jù)倉(cāng)庫(kù)。

威远县| 津市市| 阿图什市| 缙云县| 昌黎县| 开江县| 蓝山县| 彰化市| 色达县| 临武县| 大竹县| 高雄市| 德安县| 高州市| 张掖市| 贵溪市| 昌邑市| 定远县| 莲花县| 太和县| 克什克腾旗| 靖安县| 嘉禾县| 寻乌县| 石泉县| 云霄县| 西藏| 沾益县| 赤壁市| 唐海县| 黄梅县| 乌苏市| 邛崃市| 庆安县| 桂林市| 南通市| 广元市| 府谷县| 田东县| 洞口县| 扶绥县|