付蓮蓮 方青 袁冬宇 滕佳敏
摘要:針對生豬價格波動過于劇烈難以預(yù)測的問題,提出基于奇異譜分解的LSTM-ARIMA組合模型對生豬價格進行預(yù)測。以2000年1月—2021年12月的月度價格數(shù)據(jù)作為樣本,利用奇異譜分析對生豬價格數(shù)據(jù)進行分解,得到趨勢項和波動項,選用累計貢獻率達前70%的構(gòu)建趨勢項,剩下的30%構(gòu)造波動項。趨勢項非平穩(wěn)且具有長記憶性,對其建立LSTM模型;波動項平穩(wěn),對其建立ARIMA模型,最后將兩部分預(yù)測結(jié)果重組作為生豬價格的預(yù)測值,構(gòu)建LSTM-ARIMA組合預(yù)測模型。將預(yù)測值和生豬真實價格進行對比,結(jié)果表明:預(yù)測值與真實值之間的均方根誤差RMSE為2.75,平均絕對百分比誤差MAPE為10.81%,平均絕對誤差MAE為2.27,方向?qū)ΨQ性DS為81.81;此組合模型能很好地預(yù)測生豬價格走勢,對我國生豬價格預(yù)測具有更高地適用性與參考。
關(guān)鍵詞:生豬價格預(yù)測;奇異譜分析;組合模型;LSTM;ARIMA
中圖分類號:F323.7
文獻標識碼:A
文章編號:2095-5553 (2024) 05-0176-07
收稿日期:2022年6月12日? 修回日期:2022年8月10日*基金項目:國家自然科學(xué)基金(72363019)
第一作者:付蓮蓮,女,1981年生,江西九江人,博士,教授,碩導(dǎo);研究方向為生豬價格波動與預(yù)測。E-mail:? fulianhappy@163.com
Forecasting of pig price fluctuation based on SSA and LSTM-ARIMA combination model
Fu Lianlian, Fang Qing, Yuan Dongyu, Teng Jiamin
(School of Computer and Information Engineering, Jiangxi Agricultural University, Nanchang, 330045, China)
Abstract:
Aiming at the problem that the fluctuation of pig price is too violent and difficult to predict, a LSTM-ARIMA combination model based on singular spectrum decomposition is proposed to predict pig price. Taking the monthly price data from January 2000 to December 2021 as a sample, the pig price data is decomposed by singular spectrum analysis to obtain the trend term and fluctuation term. The trend term with the cumulative contribution rate of the first 70% is selected to construct the trend term, and the remaining 30% is used to construct the fluctuation term. The trend item is non-stationary and has long memory, and the LSTM model is established. The fluctuation term is stable, and the ARIMA model is established. Finally, the prediction results of the two parts are recombined as the prediction value of pig price, and the LSTM-ARIMA combined prediction model is constructed. The results show that the RMSE between the predicted value and the real value is 2.75, MAPE is 10.81%, MAE is 2.27 and DS is 81.81. This combined model can well predict the price trend of newborn pigs, and has higher applicability and reference value for the prediction of pig prices in China.
Keywords:
forecast of pig price; singular spectrum analysis; combination model; LSTM; ARIMA
0 引言
中國是世界上最大的豬肉生產(chǎn)國和消費國,豬肉消費在我國肉類消費中占據(jù)了居民消費總量的60%以上。2021年以來,豬肉價格在新冠肺炎疫情和非洲豬瘟的雙重影響下,又經(jīng)歷了一次“過山車”似的波動。2021年全國平均生豬價格為20.78元/kg,同比下降38.58%[1]。對生豬價格進行準確預(yù)測可以給農(nóng)戶未來的生產(chǎn)養(yǎng)殖提供參考,方便生豬產(chǎn)業(yè)鏈上各主體及時采取措施盡可能地減少波動帶來的損失。
目前,國內(nèi)外對生豬價格的預(yù)測方法較為多樣,從多元線性回歸、向量自回歸模型到ARIMA時間序列和SVM、神經(jīng)網(wǎng)絡(luò)等機器學(xué)習(xí)模型,再到現(xiàn)在趨于復(fù)雜的組合模型[2]。Kurumatani[3]用遞歸的神經(jīng)網(wǎng)絡(luò)模型對農(nóng)產(chǎn)品價格進行了預(yù)測,精度較高,方法的優(yōu)點是訓(xùn)練所需的時間序列長度足夠短。劉怡然等[4]采用螢火蟲算法對長短時記憶神經(jīng)網(wǎng)絡(luò)進行參數(shù)優(yōu)化,解決了生豬價格序列在時間軸上的遲滯問題。王澤鵬等[5]將改進網(wǎng)絡(luò)結(jié)構(gòu)的時間卷積網(wǎng)絡(luò)(TCN)模型方法和RFR、XGBoost、LightGBM三種機器學(xué)習(xí)模型對比,對西南地區(qū)某省的生豬價格進行預(yù)測,結(jié)果顯示TCN模型預(yù)測結(jié)果更為精確。
國內(nèi)學(xué)者以BP神經(jīng)網(wǎng)絡(luò)、LSTM和ARIMA等模型為基礎(chǔ)構(gòu)建組合模型來進行預(yù)測[6],得出LSTM在故障時間序列預(yù)測中具有很強的適應(yīng)性和更高的準確性[7, 8]。在預(yù)測時間序列數(shù)據(jù)時ARIMA模型被較多使用,已經(jīng)用在新鮮蔬菜、糧食等農(nóng)產(chǎn)品價格預(yù)測上[9-11]。對于時間序列數(shù)據(jù)上下波動過于劇烈時難以預(yù)測的問題沒有得到很好的解決[12],主要原因在于時間序列數(shù)據(jù)有波動、趨勢和不規(guī)則成分,不進行分解而直接進行預(yù)測,則會影響預(yù)測精度。引發(fā)本文的思考:是否可以將原始序列分解,再與其他模型重構(gòu)組合的方法對生豬價格進行預(yù)測以此增加結(jié)果的精確性。
奇異譜分析(SSA)是一種處理非線性時間序列數(shù)據(jù)的方法,它能夠從原始時間序列中分解出趨勢、振蕩分量和噪聲等幾個獨立的、具有某種規(guī)律的子序列,然后根據(jù)子序列建立對應(yīng)的模型,以此來降低模型的復(fù)雜度并提高模型的預(yù)測精確度[13-16],有學(xué)者將奇異譜分析法(SSA)與長短時記憶網(wǎng)絡(luò)(LSTM)組合,證實了分解后的組合模型精度較高[17]。
生豬價格受季節(jié)、周期、貨幣、外部沖擊等多種因素的影響,具有顯著的趨勢性、隨機性和周期性[18]。在趨勢、隨機和波動特征明顯的時間序列數(shù)據(jù)的預(yù)測研究上,需要運用合適的分解方法分解出價格的不同成分,對各成分進行預(yù)測,之后再整合成最終的預(yù)測結(jié)果。僅僅運用單一模型對其進行預(yù)測,對存在趨勢、隨機和周期性的生豬價格預(yù)測存在較大的局限性。鑒于此,首先進行奇異譜分析,根據(jù)累計貢獻率將生豬價格數(shù)據(jù)分解為趨勢項和波動項構(gòu)造出新的時間序列,再對這兩個子序列根據(jù)序列特征分別采用合適的模型進行預(yù)測,最后,將兩部分預(yù)測結(jié)果重組,完成對生豬價格的LSTM-ARIMA預(yù)測。
1 研究方法
1.1 奇異譜分析
奇異譜分析(SSA)方法是Colebrook在1978年提出的,它基于構(gòu)造在時間序列上的特定矩陣的奇異值分解(SVD),可以從一個時間序列中分解出趨勢、振蕩分量和噪聲。它具有廣泛的適用性,分析時間序列時,既不用假設(shè)參數(shù)模型,也不需要假設(shè)平穩(wěn)性條件。俞肇元等[15]證明了奇異譜分析是提取不同周期分量最有效方法之一。
對于生豬價格時間序列{y1,y2,…,yT},首先選擇合適的窗口長度K,將其進行滯后排列,如式(1)所示。
3 結(jié)論
由于生豬價格具有非線性、非平穩(wěn)特征,本文利用奇異譜分析的分解能力,根據(jù)特定的累計貢獻率將生豬價格數(shù)據(jù)分解成波動項與趨勢項。利用LSTM模型適合預(yù)測平滑與具有長記憶性的數(shù)據(jù)的特性對趨勢項進行建模,利用ARIMA模型適合預(yù)測平穩(wěn)時間序列的數(shù)據(jù)的特性對波動項進行建模,最后將兩組模型的預(yù)測值相加得出最終預(yù)測值。
1)? 預(yù)測值與真實值對比顯示,除6月、7月和11月、12月的價格波動趨勢存在不同,其余月份均與實際趨勢一致,說明該組合模型對波動突然劇烈變大的時間序列預(yù)測可以得出較為有效的結(jié)果。
2)? 選定RMSE、MAPE、MAE和DS四個指標對模型的性能進行檢測,與真實值對比顯示,12個月的RMSE為2.75,MAPE為10.81%,MAE為2.27,組合模型的預(yù)測精度較好。
3)? 12個月的DS值為81.81,說明組合模型預(yù)測實際數(shù)據(jù)的走勢方向精度很高,基于奇異譜分析的LSTM-ARIMA模型對生豬價格的預(yù)測效果較好。
與國內(nèi)大部分研究不同的是,本文并沒有直接對原始時間序列直接進行總體的預(yù)測,而是使用奇異譜分析將原序列分解,再根據(jù)子序列的特征選取合適的模型進行預(yù)測分析,得出精度更優(yōu)的預(yù)測結(jié)果,驗證奇異譜分析與LSMT模型和ARIMA模型的組合在價格預(yù)測中的適用性,拓寬奇異譜分析的運用領(lǐng)域。但需要指出的是,采用奇異譜分析得出結(jié)果時可將累計貢獻率的分配進行調(diào)整,選擇預(yù)測結(jié)果更好的貢獻率累計來進行模型組合。數(shù)據(jù)合理分配有利于得出更好的結(jié)果。LSTM模型參數(shù)眾多,參數(shù)的選擇會直接影響模型的預(yù)測結(jié)果,因此,下一步對LSTM模型的運行機制和參數(shù)運用數(shù)學(xué)優(yōu)化算法進行優(yōu)化。
參 考 文 獻
[1] 楊侗瑨, 王祖力, 劉小紅, 等. 2021年中國生豬產(chǎn)業(yè)發(fā)展情況及2022年趨勢[J]. 中國豬業(yè), 2022, 17(1): 19-24.
[2] 丁琳琳, 孟軍. 兩種模型對中國生豬價格預(yù)測效果的比較[J]. 統(tǒng)計與決策, 2012(4): 74-76.
[3] Kurumatani K. Time series forecasting of agricultural product prices based on recurrent neural networks and its evaluation method [J]. SN Applied Sciences, 2020, 2(8): 1434.
[4] 劉怡然, 王東杰, 鄧雪峰, 等. 基于長短時記憶神經(jīng)網(wǎng)絡(luò)的生豬價格預(yù)測模型[J]. 江蘇大學(xué)學(xué)報(自然科學(xué)版), 2021, 42 (2): 190-197.
Liu Yiran, Wang Dongjie, Deng Xuefeng, et al. Prediction method of hog price based on long short term memory network model [J]. Journal of Jiangsu University (Natural Science Edition), 2021, 42(2): 190-197.
[5] 王澤鵬, 陳曉燕, 龐濤, 等. 一種基于改進時間卷積網(wǎng)絡(luò)的生豬價格預(yù)測方法[J]. 中國農(nóng)業(yè)大學(xué)學(xué)報, 2021, 26(12): 137-144.
Wang Zepeng, Chen Xiaoyan, Pang Tao, et al. A hog price prediction method based on improved temporal convolutional network [J]. Journal of China Agricultural University, 2021, 26(12): 137-144.
[6] 王鑫, 吳際, 劉超, 等. 基于LSTM循環(huán)神經(jīng)網(wǎng)絡(luò)的故障時間序列預(yù)測[J]. 北京航空航天大學(xué)學(xué)報, 2018, 44(4): 772-784.
Wang Xin, Wu Ji, Liu Chao, et al. Exploring LSTM based recurrent neural network for failure time series prediction [J]. Journal of Beijing University of Aeronautics and Astronautics, 2018, 44(4): 772-784.
[7] 李靜, 徐路路. 基于機器學(xué)習(xí)算法的研究熱點趨勢預(yù)測模型對比與分析——BP神經(jīng)網(wǎng)絡(luò)、支持向量機與LSTM模型[J]. 現(xiàn)代情報, 2019, 39(4): 23-33.
Li Jing, Xu Lulu. Comparison and analysis of research trend prediction models based on machine learning algorithm: BP neural network, support vector machine and LSTM model [J]. Journal of Modern Information, 2019, 39(4): 23-33.
[8] 胡劍波, 羅志鵬, 李峰. “碳達峰”目標下中國碳排放強度預(yù)測——基于LSTM和ARIMA-BP模型的分析[J]. 財經(jīng)科學(xué), 2022(2): 89-101.
Hu Jianbo, Luo Zhipeng, Li Feng. Prediction of Chinas carbon emission intensity under the goal of carbon peak: Analysis based on LSTM and ARIMA-BP model [J]. Finance & Economics, 2022(2): 89-101.
[9] 劉峰, 王儒敬, 李傳席. ARIMA模型在農(nóng)產(chǎn)品價格預(yù)測中的應(yīng)用[J]. 計算機工程與應(yīng)用, 2009, 45(25): 238-239.
Liu Feng, Wang Rujing, Li Chuanxi. Application of ARIMA model in forecasting agricultural product price [J]. Computer Engineering and Applications, 2009, 45(25): 238-239.
[10] 翟靜, 曹俊. 基于時間序列ARIMA與BP神經(jīng)網(wǎng)絡(luò)的組合預(yù)測模型[J]. 統(tǒng)計與決策, 2016(4): 29-32.
[11] 彭紅星, 鄭楷航, 黃國彬, 等. 基于BP、LSTM和ARIMA模型的蔬菜價格預(yù)測[J]. 中國農(nóng)機化學(xué)報, 2020, 41(4): 193-199.
Peng Hongxing, Zheng Kaihang, Huang Guobin, et al. Vegetable price prediction based on BP, LSTM and ARIMA models [J]. Journal of Chinese Agricultural Mechanization, 2020, 41(4): 193-199.
[12] Jannah M, Sadik K, Afendi F M. Study of forecasting method for agricultural products using hybrid ANN-GARCH approach [J]. Journal of Physics: Conference Series, 2021, 1863(1): 12052-12056.
[13] 梁小珍, 郭戰(zhàn)坤, 張倩文, 等. 基于奇異譜分析的航空客運需求分析與分解集成預(yù)測模型[J]. 系統(tǒng)工程理論與實踐, 2020, 40(7): 1844-1855.
Liang Xiaozhen, Guo Zhankun, Zhang Qianwen, et al. An analysis and decomposition ensemble prediction model for air passenger demand based on singular spectrum analysis [J]. Systems Engineering Theory & Practice, 2020, 40(7): 1844-1855.
[14] 王勇, 劉瑩, 張娜. 基于奇異譜分析的旅游人數(shù)集成預(yù)測模型的研究與應(yīng)用: 以中國為例[J]. 系統(tǒng)科學(xué)與數(shù)學(xué), 2020, 40(9): 1628-1643.
Wang Yong, Liu Ying, Zhang Na. Research and application of integrated forecast model for number of tourists based on singular spectrum analysis: A case study of China [J]. Journal of Systems Science and Mathematical Sciences, 2020, 40(9): 1628-1643.
[15] 俞肇元, 袁林旺, 謝志仁, 等. 基于時間序列分解的海面變化預(yù)測[J]. 南京師大學(xué)報(自然科學(xué)版), 2007(1): 117-121.
Yu Zhaoyuan, Yuan Linwang, Xie Zhiren, et al. Sea level prediction based on time series model [j]. Journal of Nanjing Normal University (Natural Science Edition), 2007(1): 117-121.
[16] 肖白, 肖志峰, 姜卓, 等. 基于降噪自編碼器、奇異譜分析和長短期記憶神經(jīng)網(wǎng)絡(luò)的空間電力負荷態(tài)勢感知[J]. 中國電機工程學(xué)報, 2021, 41(14): 4858-4867.
Xiao Bai, Xiao Zhifeng, Jiang Zhuo, et al. Spatial load situation awareness based on denoising autoencoder, singular spectrum analysis and long short-term memory neural networks [J]. Proceedings of the CSEE, 2021, 41(14): 4858-4867.
[17] 李麗敏, 張明岳, 溫宗周, 等. 基于奇異譜分析法和長短時記憶網(wǎng)絡(luò)組合模型的滑坡位移預(yù)測[J]. 信息與控制, 2021, 50(4): 459-469.
Li Limin, Zhang Mingyue, Wen Zongzhou, et al. Landslide displacement prediction based on singular spectrum analysis and a combined long short-term memory neural network model [J]. Information and Control, 2021, 50(4): 459-469.
[18] 付蓮蓮, 羅千峰. 生豬價格波動特征及形成機理的異質(zhì)性——基于M-K檢驗和協(xié)方差分析[J]. 中國農(nóng)業(yè)大學(xué)學(xué)報, 2018, 23(11): 196-205.
Fu Lianlian, Luo Qianfeng. Heterogeneity of the characteristics and formation mechanism of hog prices volatility: Based on M-K test and covariance analysis [J]. Journal of China Agricultural University, 2018, 23(11): 196-205.
[19] 雷可為, 陳瑛. 基于BP神經(jīng)網(wǎng)絡(luò)和ARIMA組合模型的中國入境游客量預(yù)測[J]. 旅游學(xué)刊, 2007(4): 20-25.
Lei Kewei, Chen Ying. Forecast of inbound tourists to China based on BP neural network and ARIMA combined model [J]. Tourism Tribune, 2007(4): 20-25.