屠星月 于輝輝 郭承坤等
摘要:基于傳統(tǒng)計量經(jīng)濟預(yù)測方法無法解決非線性、小樣本的價格預(yù)測的問題,建立了基于EMD(經(jīng)驗?zāi)B(tài)分解)-SVM(支持向量機)的農(nóng)產(chǎn)品市場價格短期預(yù)測模型,以1997-2011年中國農(nóng)產(chǎn)品集貿(mào)市場小麥月度價格序列為例對其進行方法應(yīng)用。結(jié)果表明,與常用傳統(tǒng)計量經(jīng)濟預(yù)測方法和智能化模型比較,基于EMD-SVM的農(nóng)產(chǎn)品市場價格預(yù)測模型精度有明顯提高,提供了適用于中國農(nóng)產(chǎn)品波動規(guī)律的農(nóng)產(chǎn)品價格短期預(yù)測的新方法和借鑒。
關(guān)鍵詞:時間序列;經(jīng)驗?zāi)B(tài)分解;支持向量機;農(nóng)產(chǎn)品價格預(yù)測
中圖分類號:F323.7;O141.4;S-9 文獻標(biāo)識碼:A 文章編號:0439-8114(2015)19-4903-05
DOI:10.14088/j.cnki.issn0439-8114.2015.19.063
Abstract: The prediction method of traditional econometric is still unsolvable for nonlinear and small scale price prediction,based on the problem, the EMD-SVM prediction model for market price of agricultural product was build. Taking the monthly time series of wheat price in Chinese terminal market in 1997-2011 as example, the method application of the model was conducted to test its accuracy. Results showed that, compared with common econometric prediction models and intelligent models, the accuracy of SVC was obviously improved by combining with EMD. Therefore, a new method and reference for short-term price prediction applicable to the regular fluctuation Chinese agricultural product was put forward.
Key words: time series;EMD;SVM;price prediction of agricultural product
農(nóng)產(chǎn)品市場價格預(yù)測,是政府管理決策、農(nóng)業(yè)人員生產(chǎn)經(jīng)營管理的重要依據(jù)。近年來,中國農(nóng)產(chǎn)品市場價格波動頻率快,波動幅度大,并呈現(xiàn)出非平穩(wěn)、非線性等不規(guī)律波動特征,增加了農(nóng)民生產(chǎn)安排、管理部門市場調(diào)控、政府管理決策的難度。因此科學(xué)準(zhǔn)確地開展農(nóng)產(chǎn)品價格預(yù)測,能夠為社會提供具有前瞻性的市場信息服務(wù),對有效指導(dǎo)農(nóng)業(yè)生產(chǎn)經(jīng)營管理具有重要意義[1]。
傳統(tǒng)計量經(jīng)濟學(xué)基于價格時間序列進行統(tǒng)計分析與預(yù)測,是目前廣泛應(yīng)用的農(nóng)產(chǎn)品價格預(yù)測方法,例如ARIMA、Holt-Winters、CensusX12季節(jié)調(diào)整法、ARCH模型等。王川等[2]依據(jù)時間序列數(shù)據(jù)特征篩選出雙指數(shù)平滑模型、Holt-Winters乘法模型和ARIMA(1,1,4)模型進行加權(quán)組合實現(xiàn)了中國蘋果市場價格短期預(yù)測;李干瓊等[3]綜合利用季節(jié)虛擬變量法、Census X12法、移動平均比率法、Holt-Winters季節(jié)指數(shù)平滑法、SARIMA法等建立了組合短期預(yù)測模型,結(jié)果表明組合模型預(yù)測的精度高于單項時間序列模型。然而隨著市場價格波段逐漸向復(fù)雜化、非線性化、不規(guī)則化發(fā)展,該類方法反映出一定局限性。因此,基于智能化模型如支持向量機(Support vector machine, SVM)、神經(jīng)網(wǎng)絡(luò)、混沌時間序列的預(yù)測方法逐漸成為農(nóng)產(chǎn)品市場價格預(yù)測的熱點[4-6]。其中,建立在統(tǒng)計學(xué)理論基礎(chǔ)上的SVM方法在時間序列預(yù)測方面具有可以有效縮小泛化誤差區(qū)間、降低模型的結(jié)構(gòu)風(fēng)險、同時又保證樣本預(yù)測誤差最小的優(yōu)點[7]。近年來,一些學(xué)者針對近期農(nóng)產(chǎn)品市場價格的不規(guī)則、非線性波動特點,探索研究了SVM方法對農(nóng)產(chǎn)品價格預(yù)測的應(yīng)用。陳兆榮等[8]用SVM模型對ARIMA模型的預(yù)測誤差進行預(yù)測,實現(xiàn)了兼顧時間序列線性特征和非線性特征的ARIMA-SVM農(nóng)產(chǎn)品價格預(yù)測組合模型,預(yù)測結(jié)果顯示組合模型比單個ARIMA、SVM 模型預(yù)測精度高。趙辰陽等[4]利用?;嬎愕乃枷雽⑥r(nóng)產(chǎn)品市場價格序列提升到上層粒度序列,通過SVM對新形成的?;蛄羞M行預(yù)測形成預(yù)測區(qū)間,最后根據(jù)實測值與預(yù)測值的對比結(jié)果判斷預(yù)測方法的優(yōu)劣,提出了基于FIG-SVM 的農(nóng)產(chǎn)品價格趨勢預(yù)測方法,結(jié)果表明,該方法預(yù)測精度較高,能夠應(yīng)用于實際場景。韓延杰[9]將原始價格數(shù)據(jù)進行模糊信息粒化,然后利用支持向量機對?;蟮膬r格數(shù)據(jù)做出預(yù)測,為提高預(yù)測精度,利用遺傳算法對支持向量機的參數(shù)進行優(yōu)化,結(jié)果表明,該方法能對農(nóng)產(chǎn)品價格的變化范圍進行有效地預(yù)測。然而SVM方法單獨應(yīng)用于農(nóng)產(chǎn)品時間序列價格預(yù)測時,容易出現(xiàn)預(yù)測滯后和拐點處誤差較大的問題,現(xiàn)今基于EMD的智能化模型預(yù)測已逐漸應(yīng)用于氣象、工業(yè)、金融等領(lǐng)域,并驗證了該方法的可行性和有效性[10-14]。
本研究引入了經(jīng)驗?zāi)B(tài)分解(Empirical mode decomposition,簡稱EMD)將價格序列分解為具有不同尺度特征的模態(tài)分量的疊加,并將這些具有平穩(wěn)性、周期波動性的分量作為SVM的輸入變量分別進行預(yù)測,并將預(yù)測結(jié)果疊加,從而獲得農(nóng)產(chǎn)品價格。選取1997-2011年中國農(nóng)產(chǎn)品集貿(mào)市場小麥月度價格序列為例對EMD-SVM模型進行方法應(yīng)用,并將結(jié)果與常用計量經(jīng)濟預(yù)測方法及SVM方法預(yù)測結(jié)果進行對比分析,驗證了該方法的可行性和精確性。
1 研究方法
1.1 EMD方法原理
EMD是由美國國家宇航局N. E. Huang等于1998年提出的一種新型自適應(yīng)信號時頻處理方法,該方法依據(jù)數(shù)據(jù)自身的時間尺度特征進行信號分解,分解結(jié)果為一系列具有不同尺度、平穩(wěn)性和周期波動性特征的本征模函數(shù)(Intrinsic mode function,IMF)和一個代表原始信號總體趨勢的剩余分量,其中每個IMF必須滿足如下兩個條件:①在整個信號序列上,極值點的個數(shù)和過零點的個數(shù)相差不大于1;②在任意點處,上下包絡(luò)的均值為0,其分解結(jié)果能夠反映真實的物理過程,因此適用于處理非平穩(wěn)、非線性的信號[15]。
EMD方法基于以下3個假設(shè)進行運算和分解:①任何信號都是由若干本征模態(tài)函數(shù)組成的; ②各個本征模態(tài)函數(shù)即可是線性的,也可是非線性的,各本征模態(tài)函數(shù)的局部零點數(shù)和極值點數(shù)相同,同時上下包絡(luò)關(guān)于時間軸局部對稱; ③在任何時候,一個信號都可以包含若干本征模態(tài)函數(shù),若各模態(tài)函數(shù)之間相互混疊,則組成復(fù)合信號。
1.2 SVM回歸方法原理
SVM是由C C等[16]于1995年提出的基于統(tǒng)計理論、VC維(Vapnik-Chervonenkis dimension)和結(jié)構(gòu)風(fēng)險最小化模型算法設(shè)計的機器學(xué)習(xí)算法。該方法的基本思想是將低維不可分的數(shù)據(jù)轉(zhuǎn)化到高維空間進行處理,即通過核函數(shù)定義的非線性映射將低維輸入空間轉(zhuǎn)化到高維空間使其線性可分,在高維空間中利用線性的方法分析輸入變量和輸出變量之間的非線性關(guān)系。該方法由于以機構(gòu)風(fēng)險最小化為基礎(chǔ),因此對推廣錯誤的上界進行約束和減少,推廣性能優(yōu)越,不存在神經(jīng)網(wǎng)絡(luò)等算法的過度適應(yīng)問題,實現(xiàn)了低維數(shù)據(jù)到高維數(shù)據(jù)的映射及在高維空間使用線性函數(shù)實現(xiàn)分類,核函數(shù)的使用解決了以往存在的維數(shù)災(zāi)難問題。
1.3 EMD-SVM模型設(shè)計
現(xiàn)今研究中基于SVM的價格時間序列預(yù)測,一般利用若干期時間序列滯后的序列值作為SVM的輸入樣本,該過程中,隨著時間序列的復(fù)雜性增加,不平穩(wěn)性增加,SVM所需的滯后輸入樣本也會增加,EMD分解能夠獲得平穩(wěn)的IMF分量和體現(xiàn)序列整體趨勢的余量,減少了隱含信息的干涉和耦合,并可依據(jù)不同IMF分量的特點分別選擇不同核函數(shù)進行SVM預(yù)測,從而提高精度。因此本研究建立了EMD-SVM預(yù)測模型,利用EMD對原始價格序列進行分解,利用EMD分解獲得的具有平穩(wěn)性、周期波動的若干價格序列分量為輸入樣本分別進行SVM預(yù)測,并將各分量的預(yù)測結(jié)果疊加從而獲取價格預(yù)測值,具體如下。
首先,利用EMD對原始價格時間序列P(t)進行分解,獲得m個imfi(t)為本征模態(tài)函數(shù)IMF分量,和rm(t)為趨勢分量。
2 EMD-SVM預(yù)測模型應(yīng)用實例
2.1 數(shù)據(jù)樣本選擇
本研究所用實驗數(shù)據(jù)為中國知網(wǎng)2012、2008、2007、2004年統(tǒng)計年鑒中全國農(nóng)產(chǎn)品集貿(mào)市場小麥月度價格走勢數(shù)據(jù),考慮樣本的可獲得性和連續(xù)性,最終選擇數(shù)據(jù)周期為1997年3月至2011年12月共178個數(shù)據(jù)樣本(圖1),該數(shù)據(jù)為等間隔價格時間序列數(shù)據(jù),該序列隨時間呈不穩(wěn)定、不規(guī)則波動,后期波動中具有一定周期性。
實驗研究中利用1997年3月至2010年12月的166個樣本作為訓(xùn)練樣本、2011年12個月的樣本作為測試樣本進行預(yù)測模型應(yīng)用與驗證。
2.2 評價標(biāo)準(zhǔn)
2.3 EMD-SVM預(yù)測模型應(yīng)用
由圖2可見,文中小麥價格時間序列具有不穩(wěn)定、非線性的特征,因此可利用EMD方法對小麥價格時間序列進行分解,利用Matlab R2014a調(diào)用EMD工具箱編寫程序?qū)ζ溥M行分解獲取4個IMF分量及1個線性趨勢余量。分解結(jié)果如圖2所示,圖中前4個為IMF分量,最后1個為余量,可發(fā)現(xiàn)IMF1與IMF2分量波動劇烈但整體平穩(wěn),IMF3、IMF4分量變化逐漸緩慢且規(guī)律性較強,r5即余量,與原價格序列整體趨勢一致,反映了價格序列的線性趨勢。
常用的核函數(shù)有多項式核函數(shù)、徑向基(RBF)核函數(shù)、多層感知器核函數(shù)等。依據(jù)EMD各分量及余量的波動特征,選擇不同核函數(shù)進行SVM預(yù)測,其中對IMF1和IMF2采用RBF核函數(shù)進行預(yù)測,對IMF3、IMF4采用多項式核函數(shù)進行預(yù)測,對余量r5采用線性核函數(shù)進行預(yù)測,預(yù)測中滯后期數(shù)的選擇依據(jù)價格序列中滯后期與當(dāng)期的相關(guān)性系數(shù)進行確定,具體如表1所示,可見隨著延遲時間增長,相關(guān)性遞減。因此選用相關(guān)系數(shù)大于0.95的滯后數(shù)據(jù)進行預(yù)測,即選用滯后1期到滯后7期的數(shù)據(jù)進行SVM預(yù)測,預(yù)測結(jié)果評價如表2所示,發(fā)現(xiàn)對高頻IMF分量的SVM預(yù)測效果不是很理想,隨著頻率降低,預(yù)測精度逐漸升高,但高頻分量的幅值較小,因此對最終的預(yù)測結(jié)果影響較小。
最后對EMD分量及余量的SVM預(yù)測結(jié)果進行疊加,獲得最終預(yù)測結(jié)果。
2.4 預(yù)測結(jié)果評價與分析
為對EMD-SVM的預(yù)測精度進行進一步對比分析,采用了常用的計量經(jīng)濟模型Holt-Winters、常用的智能分析方法神經(jīng)網(wǎng)絡(luò)、SVM方法對該時間序列進行預(yù)測,預(yù)測結(jié)果評價如表3所示,觀察各方法的預(yù)測結(jié)果折線圖(圖3),發(fā)現(xiàn)結(jié)合EMD分解方法的SVM預(yù)測精度顯著高于單獨運用SVM方法預(yù)測,同時EMD-SVM不僅整體預(yù)測精度高于其他常用方法,且在時序拐點(如圖3中的2011年11月)部分的預(yù)測結(jié)果顯著優(yōu)于其他方法,因此驗證了該方法的可行性和有效性。
3 結(jié)論與展望
針對傳統(tǒng)計量經(jīng)濟預(yù)測方法難以預(yù)測非線性不規(guī)則價格時間序列、SVM方法在序列拐點預(yù)測效果較差的問題,建立了EMD-SVM價格序列預(yù)測模型。通過EMD方法對時間序列進行分解,將分解后獲得的IMF分量和余量R進行SVM預(yù)測,將預(yù)測后的分量和余量進行疊加獲得預(yù)測價格,并選用中國農(nóng)產(chǎn)品集貿(mào)市場小麥月度價格序列進行實例驗證和分析。預(yù)測結(jié)果表明:①引入EMD方法對時間序列進行分解,可依據(jù)各分量和余量的波動特征分別選擇不同SVM核函數(shù)進行預(yù)測,削弱了預(yù)測中相鄰頻帶的相互干擾,增加了SVM預(yù)測的靈活性,依據(jù)預(yù)測結(jié)果評價可發(fā)現(xiàn)EMD-SVM模型的預(yù)測結(jié)果精度高于單獨應(yīng)用SVM方法,且改善了SVM方法在時序拐點預(yù)測中誤差較大的問題。②EMD-SVM模型預(yù)測結(jié)果與常用計量經(jīng)濟預(yù)測模型、神經(jīng)網(wǎng)絡(luò)模型相比預(yù)測精度較高,因此證明了該方法的優(yōu)勢。③預(yù)測中SVM模型預(yù)測中的估計參數(shù)依靠交叉驗證確定,而該方法耗時較長,且精度不高,因此在今后的研究中,如何確定各分量、余量、SVM預(yù)測中的估計參數(shù)有待探索驗證。由于數(shù)據(jù)獲取的限制,本研究中僅利用價格時間序列進行預(yù)測,今后研究中可考慮利用多影響因素的農(nóng)產(chǎn)品價格預(yù)測。
參考文獻:
[1] 任偉宏.農(nóng)產(chǎn)品市場價格預(yù)測方法探析[J].中國農(nóng)學(xué)通報,2011(26):209-212.
[2] 王 川,趙俊曄,趙友森.組合預(yù)測模型在農(nóng)產(chǎn)品價格短期預(yù)測中的應(yīng)用——以蘋果為例的實證分析[J].系統(tǒng)科學(xué)與數(shù)學(xué),2013(01):89-96.
[3] 李干瓊,許世衛(wèi),李哲敏,等.農(nóng)產(chǎn)品市場價格短期預(yù)測方法與模型研究——基于時間序列模型的預(yù)測[J].中國農(nóng)業(yè)大學(xué)學(xué)報,2011(02):172-178.
[4] 趙辰陽,徐 明.基于FIG-SVM的農(nóng)產(chǎn)品價格趨勢預(yù)測[J].江蘇農(nóng)業(yè)科學(xué),2014(05):385-388.
[5] 彭 琳,林 明.基于NARX神經(jīng)網(wǎng)絡(luò)的農(nóng)產(chǎn)品價格時間序列預(yù)測方法研究[J].農(nóng)機化研究,2013(11):18-21.
[6] 魏明樺,鄭金貴.基于改進BP神經(jīng)算法的農(nóng)產(chǎn)品價格預(yù)測模型的構(gòu)建與實現(xiàn)[J].唐山師范學(xué)院學(xué)報,2014(02):66-68.
[7] V,V.The nature of statistical learning theory[M]. New York: Springer,1999:78-82.
[8] 陳兆榮,雷勛平,王 亮,等.基于ARIMA-SVM組合模型的我國農(nóng)產(chǎn)品價格預(yù)測研究[J].財經(jīng)理論研究,2013(02):103-107.
[9] 韓延杰.一種基于模糊信息?;虶A-SVM的農(nóng)產(chǎn)品價格預(yù)測方法[J].農(nóng)業(yè)網(wǎng)絡(luò)信息,2012(11):16-20.
[10] 尹東陽,盛義發(fā),李永勝.基于EMD和RBFNN的短期風(fēng)速預(yù)測[J].電氣技術(shù),2014(06):44-47.
[11] 郝 瓊,劉毅敏.EMD-SVM組合模型在帶鋼張力預(yù)測中的應(yīng)用[J].計算機測量與控制,2014(04):1279-1281,1284.
[12] 葉 林,劉 鵬.基于經(jīng)驗?zāi)B(tài)分解和支持向量機的短期風(fēng)電功率組合預(yù)測模型[J].中國電機工程學(xué)報,2011(31):102-108.
[13] 王義康.EMD-SVM非線性組合模型對高爐鐵水含硅量的預(yù)測[J].中國計量學(xué)院學(xué)報,2008(04):355-359.
[14] 朱倩雨,覃錫忠,賈振紅.融合EMD與全局版人工魚群LS-SVM的網(wǎng)絡(luò)流量預(yù)測[J].激光雜志,2014(05):42-46.
[15] HUANGN N E,SHEN Z,LONG S R.The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-stationary time series analysis[J].Proceedings of the Royal Society,1998,454(1971):903-955.
[16] C C,V V.Support-vector networks[J].Machine Learning, 1995(3):273-297.