基金項目:2023年度山東省教育科學研究院的大學生科研項目“基于指數(shù)平滑法的山東省大蔥產(chǎn)量預測研究”(項目編號:23SSR076);2023年度山東省創(chuàng)新訓練項目“基于時間序列模型的章丘大蔥產(chǎn)量預測研究”(項目編號:S202313320247)
摘 要:為更好地提高山東大蔥產(chǎn)量,本項目針對山東大蔥2003—2023年產(chǎn)量數(shù)據(jù)進行研究與分析,預測出2024—2030年的山東大蔥的產(chǎn)量。首先,利用Python編碼對數(shù)據(jù)進行平穩(wěn)化處理,繪制出原始數(shù)據(jù)與1階差分后的ACF圖與PACF圖;其次,利用ARIMA模型對山東大蔥的產(chǎn)量進行預測,并對其模型進行檢驗與殘差白噪聲檢驗,以評估模型的準確性和可信度;最后,得出未來7年山東大蔥的產(chǎn)量,并為提高大蔥產(chǎn)量提供相應的對策建議。
關鍵詞:山東大蔥產(chǎn)量;數(shù)據(jù)平穩(wěn)化處理;ARIMA模型
一、引言
農(nóng)業(yè)是最基本、最重要的產(chǎn)業(yè)之一,為人們提供糧食和其他農(nóng)產(chǎn)品,維系著人們的生存和發(fā)展。山東省作為中國農(nóng)業(yè)大省,以其豐富的農(nóng)業(yè)資源和高質(zhì)量的農(nóng)產(chǎn)品而聞名,其農(nóng)產(chǎn)品的品牌效應突出,被譽為“中國的菜籃子”。本文旨在預測山東省大蔥在2024—2030年的產(chǎn)量情況。通過對過去數(shù)據(jù)的研究和分析,借助ARIMA模型進行預測,得出未來幾年山東大蔥產(chǎn)量的預測結(jié)果。這將有助于農(nóng)業(yè)生產(chǎn)者和決策者了解未來幾年山東大蔥產(chǎn)量的趨勢和變化,為農(nóng)業(yè)發(fā)展提供建議。同時,這也將促進山東省農(nóng)業(yè)產(chǎn)業(yè)的健康發(fā)展,進一步提升山東省農(nóng)產(chǎn)品的品牌影響力。
二、研究方法
1.數(shù)據(jù)來源
本文綜合利用布瑞克農(nóng)業(yè)數(shù)據(jù)終端、《中國統(tǒng)計年鑒》《山東統(tǒng)計年鑒》以及山東省農(nóng)業(yè)農(nóng)村廳等信息來源,收集整理了2003—2023年山東省大蔥的年產(chǎn)量數(shù)據(jù)。鑒于大蔥產(chǎn)量數(shù)據(jù)的局限性,本文運用插補法對搜集數(shù)據(jù)的缺失值和異常值進行處理。
2.模型建立
(1) 數(shù)據(jù)平穩(wěn)化
通過觀察分析時間序列圖、ACF和PACF情況,判斷序列的平穩(wěn)性和趨勢性,當序列為非平穩(wěn)序列時需要對其進行差分處理使其平穩(wěn)化,一般差分階數(shù)不超過2階。
(2) ARIMA模型的建立
將得到的p、d、q值附近值也進行選取并調(diào)整,建立多個ARIMA模型,以保證得到對山東省大蔥產(chǎn)量的預測效果更加準確。
利用ARIMA模型進行預測時,首先使用AR自回歸模型對產(chǎn)量進行預測。p階自回歸過程的公式為:
yt是預測值,μ是常數(shù)項,p是階數(shù),γi是自相關系數(shù),εt是誤差。
進行預測時,自回歸效果不明顯,數(shù)據(jù)平穩(wěn)性不高。因此,將原始需求量數(shù)據(jù)進行1階差分后,再次進行預測。將預測模型公式展開為:
由以上公式可以看出,預測值是通過歷史值預測,p是自回歸模型中的一個階數(shù)。
(3) ARIMA模型的檢驗
運用決定系數(shù)(R2)、歸一化貝葉斯信息準則(BIC)、均方根誤差(RMSE)、平均絕對誤差百分比(MAPE)和平均絕對誤差(MAE)等具有權威判斷意義的參數(shù)對所建立的模型的擬合優(yōu)度進行比較并確定統(tǒng)計學意義。最優(yōu)質(zhì)的模型應該擁有較高的R2,還擁有較低的歸一化BIC、RMSE、MAPR、MAE。
R2中yi第i個數(shù)據(jù)點代表要進行回歸預測的目標變量(y)的值。
BIC中L為似然函數(shù),n為樣本大小,k為參數(shù)數(shù)量。
RMSE中假設存在n個誤差為e的樣本
MAPE和MAE中的xi為在i點的時刻的實際值,xi為i時刻的預測值,其中N為樣本的個數(shù)。
(4) 殘差白噪聲檢驗
我們可以使用Durbin-Watson檢驗來檢驗最終模型的殘差是否符合白噪聲序列的要求。在進行模型診斷時,還需綜合考慮其他統(tǒng)計量和圖形方法。
(5) 模型的預測
根據(jù)最優(yōu)的參數(shù)組合模型,對未來七年山東大蔥的產(chǎn)量進行一個簡單的預測分析。
三、結(jié)果
1.總體情況
由原始數(shù)據(jù)的時間序列圖(見圖1)可以看出,2003—2019年山東大蔥產(chǎn)量在410萬噸上下波動,由于疫情影響,山東大蔥產(chǎn)量在2020年出現(xiàn)驟減現(xiàn)象,隨著疫情的散去,產(chǎn)量在2021—2023年出現(xiàn)回升現(xiàn)象。
2.序列平穩(wěn)化分析
為了確保時間序列分析的可靠性和有效性,對山東大蔥2003—2023年的產(chǎn)量數(shù)據(jù)進行平穩(wěn)性檢驗,結(jié)果如圖2和圖3所示。
平穩(wěn)數(shù)據(jù)的時間序列圖應當為一條圍繞一定均值不斷波動的曲線,結(jié)合原始數(shù)據(jù)的時間序列圖(圖1)可知,山東大蔥的產(chǎn)量為非平穩(wěn)時間序列,需要用進一步的差分消除非隨機結(jié)構。
3.ARIMA模型建立
為了使序列平穩(wěn),對其進行1階差分,1階差分后的ACF和PACF情況見圖4和圖5。
由圖4和圖5可知,序列存在小幅波動趨勢性,ACF和PACF圖在2階后落入置信區(qū)間,說明1階差分后的序列趨于平穩(wěn)。ACF系數(shù)為1階截尾,PACF系數(shù)為1階拖尾,故p、q的可能取值為1,模型采用ARIMA(1,1,2)。
為了得到擬合效果更好的模型,同時還建立了ARIMA(1,0,1)、ARIMA(0,1,1)、ARIMA(0,1,0)、ARIMA(1,1,1)、ARIMA(2,1,2)、ARIMA(1,1,2)、ARIMA(2,1,1)、ARIMA(1,2,1)、ARIMA(1,1,0)和ARIMA(2,2,2)模型進行比較。
4.模型檢驗
模型檢驗參數(shù)見表1,R2的值越大表示模型越優(yōu)良,其他參數(shù)則越小表示模型越優(yōu)良。在差分階數(shù)d為1的模型中,綜合全部檢驗參數(shù)選出的最優(yōu)模型為ARIMA(1,1,2),其BIC、AIC、RMSE均排在前三,分別為195.890、192.112、38.668。MAPE和MAE則分別為31.945和7.002。
5.殘差白噪聲檢驗
殘差的白噪聲檢驗是為了檢驗模型是否已經(jīng)充分利用了原始數(shù)據(jù)的有效信息,如果最終得到的殘差為白噪聲,說明模型已經(jīng)充分提取了可以利用的有效信息,剩余信息為無法預測和使用的隨機擾動。?殘差的Durbin-Watson檢驗的統(tǒng)計量取值范圍為0至4,?當統(tǒng)計量接近2時,?表示殘差不存在自相關性;?當統(tǒng)計量接近0或4時,?表示殘差存在正向或負向的自相關性。已知該模型?殘差的Durbin-Watson檢驗的統(tǒng)計量為1.395,與0、4相比更接近于2,則殘差不存在自相關性,殘差為白噪聲。
6.預測結(jié)果
將山東大蔥產(chǎn)量進行1階差分后建立時間序列模型ARIMA(1,1,2),并對未來7年(2024—2030年)山東大蔥產(chǎn)量數(shù)進行了預測。預測結(jié)果與原始數(shù)據(jù)的曲線較為連貫,預測值的趨勢整體相對平穩(wěn),但山東大蔥產(chǎn)量數(shù)仍存在小幅度下降。未來7年每年山東大蔥產(chǎn)量數(shù)最小值為364.38萬噸、最大值為378.22萬噸(見表3)。
四、對策建議
1.加強氣象檢測,提供政策支持
提供及時準確的氣象信息,政府可以加強氣象監(jiān)測和預報服務,提供準確的天氣數(shù)據(jù)和農(nóng)業(yè)氣象預報,幫助農(nóng)民更好地了解天氣變化,合理安排種植計劃;建立防疫措施和支持政策,政府可以制定并執(zhí)行有效的防疫措施,保障農(nóng)民的安全和健康,同時為受疫情影響的農(nóng)民提供相應的補貼和支持政策。
2.構建農(nóng)業(yè)技術支持系統(tǒng),提高現(xiàn)代化設備應用
建立農(nóng)業(yè)技術支持平臺,提供大蔥種植的技術指導、病蟲害防治等方面的支持,幫助農(nóng)民解決種植過程中的問題,提高產(chǎn)量和質(zhì)量;推廣現(xiàn)代農(nóng)業(yè)技術,引導農(nóng)民采用現(xiàn)代化的農(nóng)業(yè)技術和設備,如溫室種植、水肥一體化管理等,提高大蔥的生產(chǎn)效率和質(zhì)量。
3.注重農(nóng)業(yè)技術,提高農(nóng)民專業(yè)知識水平
學習農(nóng)業(yè)知識和技術,農(nóng)民可以積極學習相關的農(nóng)業(yè)知識和技術,了解大蔥的種植要點和管理技巧,提高自身的專業(yè)素養(yǎng);合理調(diào)整種植結(jié)構,根據(jù)市場需求和氣候條件,合理選擇種植品種和數(shù)量,避免過度種植導致產(chǎn)量浪費或滯銷;在加強合作與交流方面,農(nóng)民可以加強與農(nóng)業(yè)合作社、農(nóng)技專家和其他農(nóng)民的合作與交流,提高生產(chǎn)效益。
參考文獻:
[1]歐陽澤龍,李錦瓊,汪官曌,等.基于時間序列模型的全球猴痘周新增病例預測[J/OL].中國動物傳染病學報,[2023-9-8].
[2]馬小菁.基于時間序列分析的山東大蔥價格預測研究[D].煙臺:煙臺大學,2021.
[3]包志安,韓雅慧,黃漢超.基于ARIMA模型的渦軸發(fā)動機排氣溫度預測[J].直升機技術,2023,(4):37-43.
[4]楊洋,田定勝,張寶安,等.基于ARIMA模型的城市經(jīng)濟與人口預測研究[J].綜合運輸,2023,45(11):79-85+97.
[5]王嘉龍,王秀云.山東大蔥栽培技術和常見病蟲害的防治技術[J].農(nóng)家參謀,2021(4):70-71.
作者簡介:吳亞寧(2003— ),女,山東菏澤人,青島黃海學院,本科在讀,主要研究方向:經(jīng)濟統(tǒng)計;孟祥雨(2004— ),女,山東德州人,青島黃海學院,本科在讀,主要研究方向:經(jīng)濟統(tǒng)計;施富民(2003— ),男,山東泰安人,青島黃海學院,本科在讀,主要研究方向:數(shù)據(jù)挖掘。