余永松,龐正武,周葉寧,鐘文峰,何龍飛,王愛勤
(1.廣西大學(xué)農(nóng)學(xué)院,廣西 南寧 530004;2.廣西大學(xué)計(jì)算機(jī)與電子信息學(xué)院,廣西 南寧 530004;3.華中科技大學(xué)管理學(xué)院,湖北 武漢 430074)
廣西地處我國(guó)華南地區(qū),為亞熱帶、熱帶季風(fēng)氣候,熱量充足,降水豐富,年均氣溫在16.5~23.1℃之間,降水量1 070 mm以上,年均無霜期284~365 d,非常適合蔬菜種植,且蔬菜品種資源非常豐富,其中秋冬季蔬菜大量遠(yuǎn)銷國(guó)內(nèi)東部及北方地區(qū)和東盟市場(chǎng)[1]。
全國(guó)蔬菜產(chǎn)業(yè)發(fā)展規(guī)劃(2011~2020年)中,將廣西26個(gè)縣(區(qū))列為全國(guó)蔬菜產(chǎn)業(yè)重點(diǎn)縣,以確保元旦、春節(jié)期間全國(guó)蔬菜的供應(yīng)[2],被譽(yù)為北方地區(qū)“冬季菜籃子”。同時(shí),近年來,由于珠三角地區(qū)城市化快速發(fā)展,農(nóng)用地逐漸減少,蔬菜種植成本高昂,以及土地污染嚴(yán)重等問題,廣西也成為了珠三角全年蔬菜供應(yīng)的重要基地[3],“廣西蔬菜之鄉(xiāng)”賀州市更是被譽(yù)為珠三角的“后菜園”[4],廣西蔬菜產(chǎn)業(yè)可持續(xù)發(fā)展具有重要的戰(zhàn)略意義。加強(qiáng)對(duì)廣西蔬菜產(chǎn)量的科學(xué)預(yù)測(cè),對(duì)指導(dǎo)廣西蔬菜產(chǎn)業(yè)生產(chǎn)、儲(chǔ)存與加工十分必要[5]。
1981年,華中理工大學(xué)鄧聚龍教授在上海中-美控制系統(tǒng)學(xué)術(shù)會(huì)議上首次提出“灰色系統(tǒng)”和灰色模型(Grey Model,GM)。由于灰色系統(tǒng)模型的建立不需要大量的樣本數(shù)據(jù)及樣本有規(guī)律的分布,同時(shí)計(jì)算工作量較小,可用于近期、短期以及中長(zhǎng)期的系統(tǒng)預(yù)測(cè),且預(yù)測(cè)精度比較高,逐漸被廣泛應(yīng)用[6]。匯總利用灰色系統(tǒng)對(duì)2014—2017年全國(guó)糧食產(chǎn)量進(jìn)行的預(yù)測(cè)研究,結(jié)合國(guó)家統(tǒng)計(jì)局公布的各省以及全國(guó)歷年的糧食實(shí)際產(chǎn)量,發(fā)現(xiàn)其準(zhǔn)確率高達(dá)95%以上,是一種比較可靠的糧食產(chǎn)量預(yù)測(cè)模型。
目前,國(guó)內(nèi)外利用灰色預(yù)測(cè)模型進(jìn)行的產(chǎn)量預(yù)測(cè)多集中在糧食產(chǎn)量領(lǐng)域,關(guān)于蔬菜產(chǎn)量預(yù)測(cè)的較少。魯珊珊等[7]利用灰色預(yù)測(cè)模型對(duì)上海市2013—2017年的蔬菜產(chǎn)量進(jìn)行了預(yù)測(cè)研究。王潔等[8]利用最小二乘法GM(1,1)模型對(duì)2017—2019年我國(guó)蔬菜產(chǎn)量進(jìn)行了預(yù)測(cè)研究。張賽麗[9]利用灰色模型、Quadratic模型和BP神經(jīng)網(wǎng)絡(luò)模型對(duì)海南1980—2020年間的瓜類產(chǎn)量進(jìn)行了預(yù)測(cè)研究,結(jié)果顯示3個(gè)模型之間的預(yù)測(cè)數(shù)據(jù)偏差較大。
基于灰色預(yù)測(cè)模型對(duì)廣西蔬菜產(chǎn)量進(jìn)行預(yù)測(cè)的研究尚未見報(bào)道。本研究根據(jù)廣西壯族自治區(qū)統(tǒng)計(jì)局公布的2008—2014年廣西蔬菜產(chǎn)量數(shù)據(jù),采用灰色系統(tǒng)理論的方法構(gòu)建數(shù)學(xué)預(yù)測(cè)模型,并進(jìn)行相對(duì)誤差、關(guān)聯(lián)度、后驗(yàn)差精度檢驗(yàn)以及模型實(shí)際檢驗(yàn),在此基礎(chǔ)上對(duì)2017—2019年廣西蔬菜產(chǎn)量進(jìn)行預(yù)測(cè)。
2008—2016年廣西蔬菜(包含菌類)產(chǎn)量數(shù)據(jù)來源于《廣西統(tǒng)計(jì)年鑒》。
灰色模型是基于一階常微分方程建立的,故稱為一階一元灰色模型,記為GM(1,1)[12]。根據(jù)灰色系統(tǒng)理論,建立蔬菜灰色模型的數(shù)據(jù)選取2008—2014年廣西蔬菜產(chǎn)量作為輸出因子,首先通過數(shù)據(jù)序列級(jí)比和可容覆蓋計(jì)算,確定原始數(shù)據(jù)序列X(0){X(0)=X(0)(1),X(0)(2),…X(0)(n)}是否能直接用于建模,其次運(yùn)用累加生成和累減生成方法對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,得到新序列,建立起廣西蔬菜產(chǎn)量數(shù)據(jù)時(shí)間模型,得到關(guān)于蔬菜產(chǎn)量的原始數(shù)據(jù)序列,建立灰色預(yù)測(cè)模型[12]。
模型檢驗(yàn)是建模工作必不可少的一部分,為準(zhǔn)確對(duì)實(shí)際情況進(jìn)行預(yù)測(cè),在進(jìn)行數(shù)學(xué)建模時(shí)必須要對(duì)模型的有效性進(jìn)行評(píng)估,參照文獻(xiàn)[10]-[11]中4種檢驗(yàn)方法對(duì)1.2構(gòu)建的模型進(jìn)行準(zhǔn)確度檢驗(yàn)。
1.3.1 殘差檢驗(yàn) 殘差的計(jì)算公式為:
相對(duì)誤差計(jì)算公式為:
則平均相對(duì)誤差計(jì)算公式為:
1.3.2 關(guān)聯(lián)度檢驗(yàn) 先計(jì)算出預(yù)測(cè)序列與預(yù)測(cè)因素之間的關(guān)聯(lián)系數(shù)r,關(guān)聯(lián)系數(shù)再計(jì)算關(guān)聯(lián)度:
式中,ρ為分辨率,0<ρ<1,一般取ρ=0.5,其中k=2,3,…n。
1.3.3 后驗(yàn)差檢驗(yàn) 根據(jù)下列公式計(jì)算后驗(yàn)差比值C和小誤差概率P,再根據(jù)預(yù)測(cè)精度等級(jí)標(biāo)準(zhǔn)(表1),判斷該模型預(yù)測(cè)精度等級(jí)。
表1 預(yù)測(cè)精度等級(jí)標(biāo)準(zhǔn)
1.3.4 模型實(shí)際檢測(cè) 對(duì)符合殘差、關(guān)聯(lián)度以及后驗(yàn)差檢驗(yàn)的模型進(jìn)行實(shí)際產(chǎn)量預(yù)測(cè),求出2015—2016年廣西蔬菜產(chǎn)量,并與當(dāng)年實(shí)際值對(duì)比,檢驗(yàn)準(zhǔn)確率如何。根據(jù)已知擬合模型為:x(0)(i)-0.046864Zt(i)=1902.815305,且模型的白化響應(yīng)式為求出2015—2016年廣西蔬菜產(chǎn)量的預(yù)測(cè)數(shù)據(jù)。
基于2008—2014年廣西蔬菜產(chǎn)量歷史數(shù)據(jù),建立起的灰色預(yù)測(cè)GM(1,1)模型,通過了殘差檢驗(yàn)、關(guān)聯(lián)度檢驗(yàn)、后驗(yàn)差精度檢驗(yàn)以及實(shí)際檢測(cè),檢驗(yàn)結(jié)果證明該模型可以使用。在此基礎(chǔ)上,基于建模中利用的原始數(shù)據(jù)越多,利用的數(shù)據(jù)在時(shí)間上越貼近,建立的預(yù)測(cè)模型越準(zhǔn)確,所以我們基于2008—2016年共9年的廣西蔬菜產(chǎn)量歷史數(shù)據(jù),以及灰色預(yù)測(cè)系統(tǒng)原理建立新的GM(1,1)模型,對(duì)廣西未來3年的蔬菜產(chǎn)量進(jìn)行預(yù)測(cè)。
為保證蔬菜產(chǎn)量出現(xiàn)預(yù)期的結(jié)果,我們對(duì)影響蔬菜產(chǎn)量的相關(guān)性因素進(jìn)行分析。根據(jù)Elisabeth Simclton等學(xué)者對(duì)蔬菜產(chǎn)量的相關(guān)性進(jìn)行研究,結(jié)合實(shí)際情況,將影響廣西蔬菜產(chǎn)量的因素選擇為蔬菜種植面積、蔬菜消費(fèi)量以及農(nóng)業(yè)財(cái)政支出(包括農(nóng)業(yè)基礎(chǔ)設(shè)施建設(shè)、農(nóng)業(yè)技術(shù)、農(nóng)業(yè)補(bǔ)貼等支出)。根據(jù)《廣西統(tǒng)計(jì)年鑒》、國(guó)家統(tǒng)計(jì)局、農(nóng)業(yè)局公布的2008—2016年廣西蔬菜種植面積、廣西財(cái)政支農(nóng)支出及全國(guó)蔬菜消費(fèi)量數(shù)據(jù)(表2),以廣西蔬菜產(chǎn)量為因變量,其他3個(gè)變量均為自變量,并利用SPSS對(duì)這4個(gè)因素進(jìn)行復(fù)相關(guān)關(guān)系分析。相關(guān)系數(shù)計(jì)算公式如下:
相關(guān)系數(shù)r的一般標(biāo)準(zhǔn)為:|r|<0.3時(shí),兩個(gè)現(xiàn)象之間沒有關(guān)系;0.3≤|r|<0.5時(shí),低度相關(guān);0.5≤|r|<0.8時(shí),顯著相關(guān)或稱中度相關(guān); |r|≥0.8時(shí), 高度相關(guān)。
表2 2008—2016年廣西蔬菜種植面積、廣西財(cái)政支農(nóng)支出及全國(guó)蔬菜消費(fèi)量
從表3可以看出,自2008年以來,廣西蔬菜產(chǎn)量逐年上升。2007年廣西蔬菜產(chǎn)量2 352.1萬t,由于受到春季寒潮以及雪災(zāi)的影響,2008年蔬菜產(chǎn)量?jī)H有2 015.20萬t,2009—2016年連續(xù)8年保持著平均4.80%的增長(zhǎng)速度,蔬菜播種面積也總體增加。
表3 2008—2016年廣西蔬菜種植面積及產(chǎn)量
其一階常微分方程為:X(0)={X(0)(1),X(0)(2), …X(0)(7)}={2015.20,2063.07,2129.44,2246.40,2356.72,2435.62,2610.08}。
由于不確定該數(shù)據(jù)序列是否可以用于建模,所以需要計(jì)算該數(shù)據(jù)序列的級(jí)比,并做級(jí)比判斷:
其中,可容覆蓋區(qū)間為:
顯然,所有的λk均在可容覆蓋區(qū)間內(nèi),因此不需要對(duì)原始數(shù)列X(0)進(jìn)行弱化緩沖算子處理,故可以用原始數(shù)據(jù)序列X(0)進(jìn)行GM(1,1)建模,對(duì)數(shù)據(jù)序列進(jìn)行進(jìn)一步的預(yù)處理:
原始數(shù)據(jù)序列:X(0)={2015.20,2063.07,2129.44,2246.40,2356.72,2435.62,2610.08}
由原始序列X(0)經(jīng)一次累加得新序列為:
X(1)={2015.20,4078.27,6201.71,8454.11,10810.83,13246.45,15856.53}
接著建立GM(1,1)預(yù)測(cè)模型,設(shè)X(1)滿足一階常微分方程:
式中,a、u為常數(shù),a為發(fā)展灰數(shù);u為內(nèi)生控制灰數(shù),是對(duì)系統(tǒng)的常定輸入。
灰色建模的途徑是一次累加序列通過最小二乘法來估計(jì)常數(shù)a與u。因X(1)(1)留作初值用,故將X(1)(2),X(1)(3),…X(1)(n) (n=7)分別代入方程用差分代替微分,又因等間隔取樣Δt=(t+1)-t=1,得:
則類似有:
得表達(dá)式(a):
生成緊鄰均值為:Z(t)=(3046.735,5139.99, 7327.91, 9632.47, 12028.64, 14551.49)
所以,可以將上式表達(dá)式(a)寫為矩陣表達(dá)式(b)為:
于是得到:
用GM(1,1)建模:
解得時(shí)間響應(yīng)序列為:
據(jù)此模型求得數(shù)據(jù)還原值,即根據(jù)此模型預(yù)測(cè)計(jì)算得出的2008—2014年廣西蔬菜產(chǎn)量為:2245.71,2353.46,2466.37,2584.71}。
2.3.1 殘差檢驗(yàn)結(jié)果 原始數(shù)列的殘差、相對(duì)誤差見表4。
表4 GM(1,1)模型檢驗(yàn)結(jié)果統(tǒng)計(jì)
根據(jù)灰色模型預(yù)測(cè)精度檢驗(yàn)等級(jí)標(biāo)準(zhǔn)(表5),判斷該模型預(yù)測(cè)精度達(dá)到一級(jí),可以使用[13]。
表5 灰色預(yù)測(cè)精度檢驗(yàn)等級(jí)標(biāo)準(zhǔn)
2.3.2 關(guān)聯(lián)度檢驗(yàn)結(jié)果 根據(jù)關(guān)聯(lián)度的計(jì)算公式,η(k)=(0.47734,0.55694,1.00000,0.86209,0.34807,0.39428) 。
則關(guān)聯(lián)度r=0.60645>0.6,根據(jù)經(jīng)驗(yàn)判斷,該模型可以使用[13]。
2.3.3 后驗(yàn)差檢驗(yàn)結(jié)果 根據(jù)均值和方差計(jì)算公式分別得:
顯然,所有的 ?(k)<134.53577,則P=1>0.95。
根據(jù)預(yù)測(cè)精度等級(jí)對(duì)照(表5),該模型預(yù)測(cè)精度等級(jí)為一級(jí),可以使用[14]。
2.3.4 模型實(shí)際檢測(cè)結(jié)果 利用該模型對(duì)2015、2016年廣西蔬菜產(chǎn)量的預(yù)測(cè)結(jié)果分別為2 708.739萬、2 838.704萬t(表6)。與廣西蔬菜產(chǎn)量實(shí)際數(shù)據(jù)誤差絕對(duì)值分別為2.79%、3.08%,正確率均在96%以上,且平均誤差絕對(duì)值為2.935%,說明該模型預(yù)測(cè)精度比較高,可以用于預(yù)測(cè)2017—2019年廣西蔬菜產(chǎn)量。
表6 2015—2016年廣西蔬菜產(chǎn)量灰色預(yù)測(cè)實(shí)際對(duì)照(萬t)
基于2008—2016年9年的廣西蔬菜產(chǎn)量歷史數(shù)據(jù),以及灰色預(yù)測(cè)系統(tǒng)原理建立新的GM(1,1)模型:
得到新的原始數(shù)列的殘差、相對(duì)誤差(表7)。根據(jù)表7中新建GM(1,1)模型中2015、2016年的模擬值和相對(duì)誤差(0.891>2.79,0.705<3.08)表明,利用更多和最新的數(shù)據(jù)建立的模型比之前建立的灰色預(yù)測(cè)模型更有效。
表7 誤差檢驗(yàn)
利用新模型預(yù)測(cè)2017—2019年的廣西蔬菜產(chǎn)量以及發(fā)展趨勢(shì),結(jié)果表明,2017、2018、2019年廣西蔬菜預(yù)測(cè)產(chǎn)值分別為3 062.58萬、3 225.20萬、3 396.45萬t。未來3年,廣西蔬菜產(chǎn)量將持續(xù)穩(wěn)定增長(zhǎng),平均年增長(zhǎng)155.88萬t,年均增長(zhǎng)率在5%左右(表8)。
表8 2017—2019年廣西蔬菜產(chǎn)量預(yù)測(cè)值(萬t)
在置信水平為0.01的情況下,采用t檢驗(yàn)的方法進(jìn)行雙側(cè)檢驗(yàn),種植面積、消費(fèi)量、財(cái)政支農(nóng)支出與蔬菜產(chǎn)量的相關(guān)系數(shù)分別為0.974、0.990、0.974。由此可知,廣西蔬菜的種植面積、我國(guó)蔬菜消費(fèi)量以及廣西財(cái)政支農(nóng)支出與蔬菜產(chǎn)量存在高度依存的關(guān)系[15]。
目前應(yīng)用于農(nóng)業(yè)領(lǐng)域的產(chǎn)量預(yù)測(cè)模型主要有神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)法、遙感預(yù)測(cè)模型、多元回歸模型以及灰色預(yù)測(cè)模型。神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)法產(chǎn)生于機(jī)器智能的背景下,具有自學(xué)習(xí)、分布式處理、大規(guī)模并行以及自組織的優(yōu)點(diǎn)。利用神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)法對(duì)馬鈴薯、廣西糧食產(chǎn)量進(jìn)行預(yù)測(cè),預(yù)報(bào)精度和擬合精度平均相對(duì)誤差達(dá)到4.48%,部分誤差值達(dá)到5%以上[16-17]。神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)法比傳統(tǒng)的回歸模型更有優(yōu)勢(shì),但是神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)法需要反復(fù)測(cè)試,對(duì)于樣本依賴性比較強(qiáng),在早期數(shù)據(jù)缺失以及統(tǒng)計(jì)失當(dāng)?shù)那闆r下,預(yù)測(cè)精度誤差較大[16]。
遙感技術(shù)于20世紀(jì)70年代引入我國(guó),經(jīng)過40年的發(fā)展,已在社會(huì)各個(gè)行業(yè)大量應(yīng)用[15-16]。但利用遙感技術(shù)對(duì)產(chǎn)量預(yù)測(cè)精確度仍有待提高,與其他預(yù)測(cè)方法相比,遙感預(yù)測(cè)法成本比較大,專業(yè)性也比較強(qiáng)[18-19]。
利用回歸模型進(jìn)行產(chǎn)量預(yù)測(cè)的研究已經(jīng)比較成熟,如王春輝等[20]利用回歸模型對(duì)江蘇省糧食產(chǎn)量進(jìn)行了預(yù)測(cè),易淳等[21]利用線性回歸和灰色預(yù)測(cè)模型對(duì)四川省涼山州冕寧縣煙葉產(chǎn)量進(jìn)行了預(yù)測(cè);但利用回歸模型需要與其他模型相組合,才能提高預(yù)測(cè)的精度以及可信度,而且需要樣本數(shù)據(jù)較多,一般不少于20個(gè)。同時(shí),預(yù)測(cè)對(duì)象與影響因素之間必須存在因果聯(lián)系。
與線性回歸模型、神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)法、遙感預(yù)測(cè)模型等預(yù)測(cè)模型相比,灰色預(yù)測(cè)模型在理論、方法以及預(yù)測(cè)上都有需要的數(shù)據(jù)少、數(shù)據(jù)不需要有一定的規(guī)律、定量分析結(jié)果與定性分析結(jié)果比較一致、計(jì)算工作量小、預(yù)測(cè)精度高的特點(diǎn)。本研究利用灰色理論和2008—2014年區(qū)統(tǒng)計(jì)局官方公布的廣西蔬菜產(chǎn)量7年數(shù)據(jù),構(gòu)建的模型預(yù)測(cè)2015—2016年廣西蔬菜產(chǎn)量,結(jié)果與區(qū)統(tǒng)計(jì)局官方公布結(jié)果精度達(dá)到96%,平均誤差僅為2.9%,進(jìn)一步說明灰色理論預(yù)測(cè)模型更適合于農(nóng)業(yè)產(chǎn)量類預(yù)測(cè)。
作為一種數(shù)學(xué)模型,與多元回歸預(yù)測(cè)模型、神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型、遙感預(yù)測(cè)模型一樣,也有自己的應(yīng)用背景與前提,也會(huì)存在著不足之處。以本文研究為例,利用灰色模型對(duì)廣西未來3年的蔬菜產(chǎn)量預(yù)測(cè)是基于廣西2008—2016年的蔬菜種植環(huán)境,這種環(huán)境因素包括蔬菜種植面積、財(cái)政支農(nóng)支出、重大氣候變化及氣象災(zāi)害、市場(chǎng)需求等因素,而大部分因素是不可控的,導(dǎo)致實(shí)際值會(huì)與預(yù)測(cè)值有較大差距。因此,也需要加強(qiáng)灰色模型影響因素的研究,提高模型的精確度。
根據(jù)相關(guān)性分析結(jié)果,廣西蔬菜產(chǎn)量的提高與種植面積、消費(fèi)量、財(cái)政支農(nóng)支出等密切相關(guān),說明廣西蔬菜產(chǎn)量穩(wěn)定增長(zhǎng),與政府的支持力度、消費(fèi)者需求拉動(dòng)和蔬菜種植面積增加密切相關(guān),在政府支持和種植面積有限的條件下,如何拉動(dòng)消費(fèi)者需求是確保廣西蔬菜產(chǎn)業(yè)健康穩(wěn)步增長(zhǎng)的關(guān)鍵。政府增加蔬菜行業(yè)新品種選育研究與推廣、提升抗擊意外災(zāi)害能力的基礎(chǔ)設(shè)施建設(shè)和加強(qiáng)對(duì)蔬菜市場(chǎng)的監(jiān)測(cè)等方面增加投入,根據(jù)市場(chǎng)需求來布局和指導(dǎo)蔬菜種植,更有利于拉動(dòng)消費(fèi)者需求,確保廣西蔬菜產(chǎn)業(yè)的可持續(xù)、穩(wěn)步增長(zhǎng)。蔬菜產(chǎn)量極其容易受到天氣變化影響,2008年初由于不可控的寒潮以及雪災(zāi)的影響,廣西蔬菜產(chǎn)量從2007年的2 352.1萬t跌至 2008年的2 015.2萬t,直到2012年才恢復(fù)到2007年的產(chǎn)量水平,對(duì)于廣西的農(nóng)業(yè)發(fā)展以及農(nóng)民收入來說是巨大損失。從這個(gè)角度來說,維護(hù)蔬菜產(chǎn)量的穩(wěn)定增長(zhǎng)具有重要的意義。除此之外,蔬菜也是一種對(duì)市場(chǎng)價(jià)格波動(dòng)敏感的作物,中央和地方政策也會(huì)影響蔬菜種植面積。保持廣西蔬菜產(chǎn)量持續(xù)穩(wěn)定增長(zhǎng),需要國(guó)家、地方政府以及種植戶共同努力,減少外部因素的影響,避免蔬菜產(chǎn)量出現(xiàn)大幅度“跳水”情況。