王新武 ,靳佩蕓
(甘肅醫(yī)學(xué)院 a.公共課教學(xué)部;b.藥學(xué)系,甘肅 平?jīng)?744000)
農(nóng)業(yè)、農(nóng)村、農(nóng)民問題的解決事關(guān)老百姓的切身利益,乃至整個(gè)國(guó)民經(jīng)濟(jì)的持續(xù)穩(wěn)定發(fā)展[1]。伴隨著現(xiàn)代農(nóng)業(yè)發(fā)展和供求態(tài)勢(shì)的變化,區(qū)域農(nóng)產(chǎn)品市場(chǎng)競(jìng)爭(zhēng)日益激烈,農(nóng)產(chǎn)品價(jià)格已完全由市場(chǎng)供需關(guān)系決定,而農(nóng)產(chǎn)品市場(chǎng)風(fēng)險(xiǎn)的不斷涌現(xiàn)深刻影響著農(nóng)產(chǎn)品的供給,進(jìn)而影響到農(nóng)產(chǎn)品的市場(chǎng)價(jià)格呈現(xiàn)波動(dòng)變化,有時(shí)其變化甚至是躍變的[2]。因此,農(nóng)產(chǎn)品價(jià)格的準(zhǔn)確預(yù)測(cè)是農(nóng)產(chǎn)品市場(chǎng)風(fēng)險(xiǎn)管理和供求宏觀調(diào)控的前提。
由于農(nóng)產(chǎn)品價(jià)格時(shí)間序列呈現(xiàn)出非線性、隨機(jī)性及多重周期性的復(fù)雜特征,傳統(tǒng)的基于時(shí)間序列的模型如ARIMA、ARCH、多變量回歸等[3],通常是在時(shí)間序列具有線性變化的前提下構(gòu)建模型?,F(xiàn)實(shí)中,影響農(nóng)產(chǎn)品市場(chǎng)價(jià)格的因素眾多,農(nóng)產(chǎn)品市場(chǎng)價(jià)格呈現(xiàn)出非線性的特征,傳統(tǒng)的時(shí)間序列模型只能部分的模擬其變化趨勢(shì),且預(yù)測(cè)精度不高。
近年來,由于機(jī)器學(xué)習(xí)模型能夠通過訓(xùn)練和測(cè)試,很好的實(shí)現(xiàn)具有復(fù)雜特征的時(shí)間序列的準(zhǔn)確擬合[4]。相對(duì)于傳統(tǒng)的時(shí)間序列模型,機(jī)器學(xué)習(xí)模型具有更好的魯棒性和預(yù)測(cè)性能。 由于傳統(tǒng)的機(jī)器學(xué)習(xí)預(yù)測(cè)模型多是基于原始時(shí)間序列,沒有充分考慮到時(shí)間序列中的高頻噪聲,使得機(jī)器學(xué)習(xí)模型在訓(xùn)練過程中難以收斂,因此,選取恰當(dāng)?shù)臄?shù)據(jù)預(yù)處理技術(shù)實(shí)現(xiàn)對(duì)農(nóng)產(chǎn)品價(jià)格時(shí)間序列主要特征的提取,進(jìn)而實(shí)現(xiàn)農(nóng)產(chǎn)品價(jià)格的準(zhǔn)確模擬就顯得尤為重要。集合經(jīng)驗(yàn)?zāi)B(tài)分解(Ensemble Empirical Mode Decomposition ,簡(jiǎn)稱EEMD)具有穩(wěn)健的自主分解能力,能夠有效地去除時(shí)間序列中混合的噪聲,與離散小波變換相比,具有非常明顯的優(yōu)勢(shì)[5]。因此,基于已有的農(nóng)產(chǎn)品價(jià)格時(shí)間序列,構(gòu)建基于數(shù)據(jù)預(yù)處理和神經(jīng)網(wǎng)絡(luò)模型相結(jié)合的混合模型,以期實(shí)現(xiàn)農(nóng)產(chǎn)品價(jià)格的準(zhǔn)確預(yù)測(cè)仍然是一個(gè)研究熱點(diǎn)[6]。
基于2020~2021年隴東主要農(nóng)作物小麥的價(jià)格時(shí)間序列,采用EEMD對(duì)收集到的隴東地區(qū)主要農(nóng)產(chǎn)品小麥的價(jià)格時(shí)間序列進(jìn)行數(shù)據(jù)預(yù)處理,借助于NAR神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)農(nóng)產(chǎn)品價(jià)格預(yù)測(cè),最后,采用多個(gè)評(píng)價(jià)指標(biāo)對(duì)混合預(yù)測(cè)模型的精度進(jìn)行評(píng)價(jià)。數(shù)值模擬實(shí)驗(yàn)表明,構(gòu)建混預(yù)測(cè)模型EEMD-NAR能夠準(zhǔn)確實(shí)現(xiàn)隴東基礎(chǔ)農(nóng)作物小麥的價(jià)格預(yù)測(cè)。
基于EEMD的數(shù)據(jù)預(yù)處理過程如下:
1) 預(yù)先設(shè)定平均次數(shù)以及添加的白噪聲的幅度。
2) 在原始時(shí)間序列X(t)中加入幅度為K的白噪聲,即
x(t)=X(t)+w(t).
(1)
3) 將新得到的時(shí)間序列x(t)通過EMD分解為若干個(gè)本征模函數(shù)gi(t),i=1,2,…,n與一個(gè)殘余項(xiàng)Rn(t)的和,即
(2)
4) 重復(fù)步驟2)和3),得到不同頻率的IMF構(gòu)成的集合。
5) 由于IMF1包含了高頻分量,因此將其去除,將其余IMF分量求和得到最終的數(shù)據(jù)預(yù)處理結(jié)果。
NAR神經(jīng)網(wǎng)絡(luò)模型是一種采用靜態(tài)神經(jīng)元和各層網(wǎng)絡(luò)的輸出反饋的動(dòng)態(tài)網(wǎng)絡(luò),通過其自回歸特性將網(wǎng)絡(luò)的輸出結(jié)果再次輸入到NAR網(wǎng)絡(luò)中實(shí)現(xiàn)時(shí)間序列的模擬。設(shè)xi代表NAR的輸入,輸入層與隱含層的連接權(quán)重為ωij,閾值為aj,則NAR神經(jīng)網(wǎng)絡(luò)第j個(gè)神經(jīng)元的輸出為Hj,即
(3)
式中:i表示輸入數(shù)據(jù)的維數(shù);f是激活函數(shù)。將第j個(gè)神經(jīng)元的輸出Hj重新輸入NAR網(wǎng)絡(luò)中,得到整個(gè)網(wǎng)絡(luò)輸出值O,即
(4)
式中:wj為隱藏層中第j個(gè)神經(jīng)元與輸出層神經(jīng)元相連的權(quán)重;b為閾值。NAR的預(yù)測(cè)誤差為
(5)
構(gòu)建的混合預(yù)測(cè)模型流程如圖1所示,具體步驟如下:
1) 采用EEMD對(duì)收集到的小麥價(jià)格時(shí)間序列進(jìn)行分解。
圖1 EEMD-NAR混合預(yù)測(cè)模型結(jié)構(gòu)
2) 將EEMD生成的新的時(shí)間序列劃分為訓(xùn)練集和測(cè)試集,輸入NAR進(jìn)行預(yù)測(cè)。
3) 采用納什效率系數(shù) (NSCE)、相對(duì)平均誤差 (MAPE)及均方根誤差(RMSE)對(duì)混合模型EEMD-NAR和單個(gè)的NAR、BPNN、ELM預(yù)測(cè)效果進(jìn)行評(píng)價(jià)。
我國(guó)隴東地區(qū)以種植業(yè)為主,小麥?zhǔn)请]東地區(qū)的基礎(chǔ)農(nóng)作物,小麥價(jià)格時(shí)間序列來源于金投網(wǎng)(2020-06-25—2021-05-26共336個(gè)數(shù)據(jù))。整體上,小麥價(jià)格具有不穩(wěn)定、不規(guī)則波動(dòng)特征。受新冠疫情的影響,小麥價(jià)格在2020-10-26—2020-10-28出現(xiàn)了暴漲,但很快趨于平穩(wěn)。實(shí)驗(yàn)過程中,選擇2020-06-25—2021-04-08的288個(gè)樣本作為訓(xùn)練集,2021-04-09—2021-05-26的48個(gè)樣本作為測(cè)試集,以驗(yàn)證所構(gòu)建的EEMD-NAR混合預(yù)測(cè)模型的預(yù)測(cè)效果。
文中采用NSCE、MAPE及RMSE等評(píng)價(jià)模型的預(yù)測(cè)精度,各評(píng)價(jià)指標(biāo)的計(jì)算如式(6)~(8)所示:
(6)
(7)
(8)
從收集到的隴東地區(qū)主要農(nóng)產(chǎn)品小麥的價(jià)格時(shí)間序列變化圖中可以看出,收集到的時(shí)間序列蘊(yùn)含著隨機(jī)性和非線性的變化特征。為了獲得更好的預(yù)測(cè)效果,采用EEMD對(duì)收集到的小麥價(jià)格時(shí)間序列進(jìn)行分解,共得到8個(gè)本征模態(tài)函數(shù)分量,結(jié)果如圖2所示。
(a) 小麥價(jià)格序列
(b) EEMO分解圖2 小麥價(jià)格序列及EEMD分解結(jié)果
從圖2可以看出,IMF1和IMF2具有變化頻繁和短周期的特征,而IMF3至IMF7具有波動(dòng)周期長(zhǎng)和變化比較平緩的特點(diǎn),殘余量IMF8反映了農(nóng)產(chǎn)品價(jià)格時(shí)間序列的總體變化趨勢(shì)。從IMF8的變化趨勢(shì)來看,整體上小麥價(jià)格序列具有下降趨勢(shì)。
用NAR分別對(duì)分解出來的8個(gè)IMF序列進(jìn)行預(yù)測(cè)。神經(jīng)網(wǎng)絡(luò)的輸入層為3,即使用當(dāng)前3天的價(jià)格數(shù)據(jù)來提前一步預(yù)測(cè),選擇RMSE作為適應(yīng)度函數(shù)。對(duì)模型輸出結(jié)果反歸一化處理,并將所有IMF序列的預(yù)測(cè)結(jié)果相加,作為最終的預(yù)測(cè)結(jié)果。
為了比較所構(gòu)建的混合EEMD-NAR模型的預(yù)測(cè)精度,基于原始的觀測(cè)數(shù)據(jù),分別采用ELM、NAR、 BPNN等多個(gè)神經(jīng)網(wǎng)絡(luò)模型進(jìn)行預(yù)測(cè)。所有模型的預(yù)測(cè)結(jié)果如圖3所示,各模型預(yù)測(cè)精度評(píng)價(jià)指標(biāo)結(jié)果如表1所示。
圖3 不同模型預(yù)測(cè)結(jié)果比較
表1 不同模型的預(yù)測(cè)精度
從圖3和表1可以看出,與單個(gè)的BPNN、ELM及NAR相比,EEMD-NAR混合模型的預(yù)測(cè)精度有了較大的提高,這是由于原始的農(nóng)產(chǎn)品價(jià)格序列經(jīng)過EEMD分解后所得到的各主要IMF分量(IMF2-IMF8)的變化呈現(xiàn)出了強(qiáng)烈的規(guī)律性,從而減少了NAR預(yù)測(cè)的復(fù)雜度。從各個(gè)模型的預(yù)測(cè)精度評(píng)價(jià)指標(biāo)看,BPNN、ELM及NAR均能夠很好的實(shí)現(xiàn)隴東地區(qū)基礎(chǔ)農(nóng)作物小麥價(jià)格的準(zhǔn)確預(yù)測(cè),這3個(gè)單個(gè)的預(yù)測(cè)模型中,NAR的預(yù)測(cè)精度最高,ELM次之,BPNN的預(yù)測(cè)效果最差,但NAR的預(yù)測(cè)精度仍然有待提高。EEMD-NAR混合預(yù)測(cè)模型的NSCE為0.957 2,RMSE為0.025 6, MAPE 為1.35%,而單一的BPNN、ELM、NAR的NSCE、RMSE、MAPE與EEMO-NAR相比,EEMD-NAR混合預(yù)測(cè)模型的正向指標(biāo)NSCE 最大,BPNN的最小;負(fù)向指標(biāo)值RMSE和MAPE顯示,EEMD-NAR的RMSE和MAPE均小于單一的BPNN、ELM及NAR預(yù)測(cè)模型。
相對(duì)于單一的預(yù)測(cè)模型,EEMD-NAR 混合預(yù)測(cè)模型有著更為突出的優(yōu)勢(shì),這是由于采用BPNN、ELM及NAR進(jìn)行預(yù)測(cè)時(shí),未對(duì)時(shí)間序列進(jìn)行有效的數(shù)據(jù)預(yù)處理,從而導(dǎo)致預(yù)測(cè)結(jié)果誤差較大。因此,采用神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)農(nóng)產(chǎn)品價(jià)格時(shí),需要對(duì)收集到的時(shí)間序列采用必要的數(shù)據(jù)預(yù)處理,從而提取出蘊(yùn)含在價(jià)格時(shí)間序列中的波動(dòng)頻率,降低時(shí)間序列的波動(dòng)幅度,對(duì)于獲得準(zhǔn)確的預(yù)測(cè)結(jié)果至關(guān)重要。
針對(duì)隴東地區(qū)基礎(chǔ)農(nóng)作物小麥價(jià)格時(shí)間序列的變化特征,采用了先進(jìn)的數(shù)據(jù)預(yù)處理技術(shù),實(shí)現(xiàn)了原始農(nóng)產(chǎn)品價(jià)格序列中不同特征分量的提取,并構(gòu)建了EEMD-NAR混合預(yù)測(cè)模型,對(duì)小麥價(jià)格時(shí)間序列進(jìn)行了模擬。模擬數(shù)值結(jié)果表明,構(gòu)建的混合EEMD-NAR模型較之BPNN、ELM及NAR等單個(gè)模型具有更高的預(yù)測(cè)精度,為基于時(shí)間序列建模的農(nóng)產(chǎn)品價(jià)格預(yù)測(cè)提供了一種新的思路和新的建模方法,為有效實(shí)現(xiàn)農(nóng)產(chǎn)品市場(chǎng)的風(fēng)險(xiǎn)管理和縮短農(nóng)產(chǎn)品供求宏觀調(diào)控時(shí)滯提供了必要的依據(jù)。
蘭州工業(yè)學(xué)院學(xué)報(bào)2022年4期