和 文 超,師 學(xué) 義,景 明,孫 靜 靜,劉 偉 瑋
晉城市糧食產(chǎn)量預(yù)測(cè)方法比較研究
和 文 超,師 學(xué) 義*,景 明,孫 靜 靜,劉 偉 瑋
(中國(guó)地質(zhì)大學(xué)(北京),北京 100083)
提高糧食產(chǎn)量預(yù)測(cè)精度是科學(xué)編制土地利用總體規(guī)劃的重要課題。該文首先運(yùn)用灰色關(guān)聯(lián)分析方法對(duì)影響糧食產(chǎn)量的因素做出關(guān)聯(lián)因子排序,分析表明糧食單產(chǎn)對(duì)糧食總產(chǎn)量的影響最大,糧食作物播種面積次之。其次在灰色關(guān)聯(lián)分析的基礎(chǔ)上選取主要影響因子,通過(guò)比較線性回歸模型、灰色GM(1,1)模型和灰色多元線性回歸組合模型的預(yù)測(cè)結(jié)果,得到灰色多元線性回歸組合模型預(yù)測(cè)結(jié)果最佳。
灰色關(guān)聯(lián)分析;多元線性回歸;糧食產(chǎn)量預(yù)測(cè);GM(1,1)
科學(xué)、準(zhǔn)確地預(yù)測(cè)糧食產(chǎn)量是政府制定人口和資源利用政策的重要依據(jù),也是科學(xué)編制土地利用總體規(guī)劃并確定耕地保有量的重要課題。許多學(xué)者利用不同的方法對(duì)糧食需求量進(jìn)行了預(yù)測(cè),其中回歸分析模型和灰色GM(1,1)模型是常用的兩種方法?;貧w分析模型對(duì)樣本中的異常數(shù)據(jù)非常敏感,會(huì)直接影響預(yù)測(cè)精度;灰色預(yù)測(cè)模型對(duì)于波動(dòng)性和隨機(jī)性較大的曲線進(jìn)行擬合時(shí)誤差較小[1,2]。使用單一的預(yù)測(cè)方法會(huì)漏掉一些關(guān)鍵信息,從而降低糧食產(chǎn)量的預(yù)測(cè)精度,組合模型能有效集合更多的重要信息。李林等利用多元線性回歸與GM(1,1)模型耦合預(yù)測(cè)城市用水量[3],丁倩等討論了灰色多元線性回歸方法在房地產(chǎn)中的應(yīng)用[4]。為了克服單獨(dú)使用回歸分析模型和灰色GM(1,1)模型的缺點(diǎn),并提高糧食產(chǎn)量的預(yù)測(cè)精度,本文嘗試將灰色模型與多元線性回歸模型耦合,建立灰色多元線性回歸組合模型并應(yīng)用于晉城市糧食產(chǎn)量的預(yù)測(cè)。
根據(jù)X、Y的現(xiàn)有數(shù)據(jù),將X、Y作為已知數(shù),依據(jù)回歸方程Y=aX+b尋求合理的a、b,確定回歸曲線,再將a、b作為已知數(shù),確定X、Y的未來(lái)演變。1)確定回歸直線。一元線性回歸方程:Y=aX+b,通常用最小二乘法確定參數(shù),a=ˉY-bˉx,b=Lxy/Lxx。2)相關(guān)性檢驗(yàn)。近1,說(shuō)明線性相關(guān)性越高。
本研究所用數(shù)據(jù)來(lái)源于《1988-2005年晉城市統(tǒng)計(jì)年鑒》。為了便于預(yù)測(cè)和比較,采用分段預(yù)測(cè)的方法,分別以1988-2002年和1993-2002年的糧食總產(chǎn)量預(yù)測(cè)2003-2005年的糧食總產(chǎn)量。預(yù)測(cè)結(jié)果如表1、表2所示。
表1 基于1988-2002年數(shù)據(jù)預(yù)測(cè)2003-2005年的糧食產(chǎn)量及其誤差Table 1 Grain yield prediction value and residue error of 2003-2005 based on the data of 1988-2002 萬(wàn)hm2
表2 基于1993-2002年數(shù)據(jù)預(yù)測(cè)2003-2005年的糧食產(chǎn)量及其誤差Table 2 Grain yield prediction value and residue error of 2003-2005 based on the data of 1993-2002 萬(wàn)hm2
利用SPSS軟件建立晉城市糧食總產(chǎn)量時(shí)間序列模型。以顯著性水平α=0.05檢驗(yàn)證明Y(糧食總產(chǎn)量)與X(年份)間有線性關(guān)系,說(shuō)明該模型可用來(lái)預(yù)測(cè)晉城市糧食總產(chǎn)量。
GM(1,1)模型的實(shí)質(zhì)是對(duì)原始序列作一次累加,使生成的序列呈一定規(guī)律,然后建立一階線性微分方程模型,求得擬合曲線對(duì)系統(tǒng)進(jìn)行預(yù)測(cè)[6,7]?;疑獹M(1,1)模型通過(guò)累加生成灰色模型,濾去原始數(shù)據(jù)中的隨機(jī)量或其他噪聲,從上下波動(dòng)的時(shí)間數(shù)列中尋找某種隱含規(guī)律。
根據(jù)晉城市糧食產(chǎn)量數(shù)據(jù),按照時(shí)間順序,每6年為一個(gè)單元,每單元的前5年用作建模計(jì)算。由SPSS及MATLAB軟件計(jì)算得出晉城市糧食產(chǎn)量的灰色預(yù)測(cè)模型。表1、表2中,后驗(yàn)差比值C、小誤差概率P均滿足一級(jí)要求,即C≤0.35,P≥0.95,說(shuō)明模型擬合精度較好。
該模型的主要步驟是:1)在灰色關(guān)聯(lián)分析的基礎(chǔ)上利用灰色GM(1,1)模型得到影響糧食產(chǎn)量的主要因素的預(yù)測(cè)值;2)利用原始樣本數(shù)據(jù)建立多元線性回歸模型;3)將灰色GM(1,1)模型的預(yù)測(cè)結(jié)果作為多元線性回歸預(yù)測(cè)方程的輸入值,在較全面考慮各影響因素的基礎(chǔ)上,實(shí)現(xiàn)灰色預(yù)測(cè)模型與多元線性回歸方程的有機(jī)結(jié)合,得到灰色多元線性回歸組合模型。
根據(jù)研究區(qū)具體的自然條件和社會(huì)經(jīng)濟(jì)條件,選取對(duì)糧食生產(chǎn)有直接影響的5類(lèi)因素[8]:自然因素、勞動(dòng)力因素、農(nóng)用水利設(shè)施因素、化肥施用因素和農(nóng)機(jī)電因素。根據(jù)對(duì)晉城市糧食產(chǎn)量影響因素的定性分析及現(xiàn)有糧食生產(chǎn)資料情況,采用1988-2005年序列資料作為研究基礎(chǔ),從中選取10個(gè)影響糧食總產(chǎn)量的主要因子,用其年數(shù)據(jù)作為樣本,根據(jù)灰色關(guān)聯(lián)度的分析方法[9-12],得出影響晉城市糧食總產(chǎn)量的10個(gè)主要因素的動(dòng)態(tài)關(guān)聯(lián)度結(jié)果(表3)。按關(guān)聯(lián)度的大小進(jìn)行排序:糧食單產(chǎn)>糧食作物播種面積>化肥施用量>農(nóng)業(yè)總投入>農(nóng)業(yè)勞動(dòng)力>有效灌溉面積>降雨量>耕地面積>農(nóng)村用電量>農(nóng)業(yè)機(jī)械總動(dòng)力。由此可知,對(duì)晉城市糧食總產(chǎn)量影響最大的因素是糧食單產(chǎn),其關(guān)聯(lián)度高達(dá)0. 9241;其次是糧食作物播種面積和化肥施用量。
表3 糧食總產(chǎn)量影響因素灰色關(guān)聯(lián)系數(shù)Table 3 Grey incidence coefficient of grain yield factors
在晉城市糧食產(chǎn)量影響因素灰色關(guān)聯(lián)分析的基礎(chǔ)上,考慮到關(guān)聯(lián)度的大小,本文引入糧食單產(chǎn)、糧食作物播種面積兩個(gè)主要因素預(yù)測(cè)晉城市糧食總產(chǎn)量。首先根據(jù)1988-2002年和1993-2002年的糧食單產(chǎn)和糧食作物播種面積數(shù)據(jù),利用灰色GM(1,1)模型預(yù)測(cè)2003-2005年的糧食單產(chǎn)和糧食作物播種面積。其次以糧食單產(chǎn)、糧食作物播種面積這兩個(gè)主要因素作為自變量,糧食總產(chǎn)量作為因變量,用SPSS軟件分別對(duì)晉城市1988-2002年和1993-2002年糧食總產(chǎn)量、糧食單產(chǎn)和糧食作物播種面積建立多元線性回歸模型。表1中R2為0.898,調(diào)整后R2為0.943,模型擬合較好;表2中R2為0.852,調(diào)整后R2為0.912,模型擬合較好。用sig=0.05進(jìn)行顯著性檢驗(yàn),模型可以用來(lái)預(yù)測(cè)晉城市糧食總產(chǎn)量。再將2003-2005年糧食單產(chǎn)和糧食作物播種面積的預(yù)測(cè)結(jié)果分別代入多元回歸模型中,得到2003-2005年糧食總產(chǎn)量的預(yù)測(cè)值。
(1)線性回歸模型。由表1、表2可知,線性回歸模型預(yù)測(cè)糧食總產(chǎn)量的誤差在3種方法中相對(duì)最大。雖然模型的擬合度較高,但預(yù)測(cè)結(jié)果精度較低(表4)。結(jié)合R2和數(shù)據(jù)的長(zhǎng)度分析可知,R2值越大,已知數(shù)據(jù)的線性關(guān)系越好,預(yù)測(cè)誤差越低;歷史數(shù)據(jù)越充分(表4),預(yù)測(cè)結(jié)果越準(zhǔn)確。由于線性回歸方法適用于線性關(guān)系較好且歷史數(shù)據(jù)較充分的數(shù)據(jù),而本文數(shù)據(jù)在1998年和2001年發(fā)生突變,使得整段數(shù)據(jù)的直線型關(guān)系降低,從而影響了模型預(yù)測(cè)精度。由此得出,在使用線性回歸法時(shí),原始數(shù)據(jù)具有良好的直線線性關(guān)系,才能保證預(yù)測(cè)結(jié)果具有較高的準(zhǔn)確性。
表4 3種預(yù)測(cè)方法的比較Table 4 Comparative analysis of prediction methods
(2)灰色 GM(1,1)模型。由表1、表2、表4可知,灰色GM(1,1)模型預(yù)測(cè)值的精度較高,擬合一致性較好。這是由于GM(1,1)模型是根據(jù)隨機(jī)誤差原理建立的,并從數(shù)據(jù)的上下波動(dòng)中尋找隱含的規(guī)律,本文數(shù)據(jù)波動(dòng)性及隨機(jī)性較大,模型的優(yōu)勢(shì)得以發(fā)揮,使得灰色GM(1,1)模型的預(yù)測(cè)結(jié)果比線性回歸模型的預(yù)測(cè)結(jié)果更準(zhǔn)確。由此可知,當(dāng)已有數(shù)據(jù)波動(dòng)性及隨機(jī)性較大且數(shù)據(jù)量不多時(shí),使用GM(1,1)模型的預(yù)測(cè)結(jié)果較為準(zhǔn)確。
(3)灰色多元線性回歸組合模型。由表1、表2可知,灰色多元線性回歸組合模型的預(yù)測(cè)誤差在3種方法中最小,預(yù)測(cè)精度也最高(表4)。這是因?yàn)椋没疑嘣€性回歸組合模型有效地利用了各種信息,充分結(jié)合了數(shù)據(jù)波動(dòng)性和直線性的特點(diǎn),比單純利用灰色GM(1,1)模型或線性回歸模型預(yù)測(cè)結(jié)果的精度更高。
實(shí)踐中應(yīng)結(jié)合數(shù)據(jù)本身的特點(diǎn)選擇不同的預(yù)測(cè)模型。線性回歸模型適用于直線關(guān)系較好的數(shù)據(jù),灰色GM(1,1)模型適用于數(shù)據(jù)波動(dòng)性和隨機(jī)性較大的數(shù)據(jù)?;疑嘣€性回歸組合模型既充分體現(xiàn)了灰色系統(tǒng)能及時(shí)跟蹤響應(yīng)變量的動(dòng)態(tài)變化的特點(diǎn),又綜合了多元線性回歸模型充分考慮影響因素作用的優(yōu)點(diǎn),從而可以更好地指導(dǎo)晉城市糧食產(chǎn)量的預(yù)測(cè),進(jìn)而更好地促進(jìn)土地利用總體規(guī)劃的科學(xué)編制。這種糧食產(chǎn)量預(yù)測(cè)方法也可以推廣到全國(guó)各地的糧食產(chǎn)量預(yù)測(cè),具有廣泛的應(yīng)用前景。
當(dāng)然,由于糧食生產(chǎn)是一個(gè)復(fù)雜的系統(tǒng)過(guò)程,糧食產(chǎn)量還受各種自然因素和政策因素等方面的影響,同時(shí),糧食生產(chǎn)的影響因素隨著時(shí)間的變化也在不斷發(fā)生變化,這就決定了由過(guò)去的糧食產(chǎn)量預(yù)測(cè)未來(lái)的產(chǎn)量難免存在偏差。只有根據(jù)諸多因素的變化對(duì)糧食產(chǎn)量的預(yù)測(cè)模型不斷進(jìn)行調(diào)整,才能減小預(yù)測(cè)誤差,以實(shí)現(xiàn)更準(zhǔn)確的預(yù)測(cè)。
[1]巫錫柱,晏路明.糧食生產(chǎn)灰色關(guān)聯(lián)動(dòng)態(tài)分析和預(yù)測(cè)[J].農(nóng)業(yè)系統(tǒng)科學(xué)與綜合研究,2005,11(4):244-251.
[2]劉亞,崔春紅.糧食產(chǎn)量灰色模型預(yù)測(cè)[J].安徽農(nóng)業(yè)科學(xué),2008,36(9):3485-3490.
[3]李林,劉坤.多元線性回歸與GM(1,1)模型耦合預(yù)測(cè)城市用水量[J].水資源與水工程學(xué)報(bào),2008,2(3):63-64.
[4]丁倩,干曉蓉.灰色多元線性回歸分析及其在房地產(chǎn)中的應(yīng)用[J].云南師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2009,5(3):21-29.
[5]湯江龍,趙小敏.土地利用規(guī)劃中人口預(yù)測(cè)模型的比較研究[J].中國(guó)土地科學(xué),2005,19(2):14-20.
[6]韓中庚.數(shù)學(xué)建模方法及其應(yīng)用[M].北京:高等教育出版社,2005.143-153.
[7]李軍成,陳國(guó)華,石小芳.基于灰色多元線性回歸的糧食產(chǎn)量預(yù)測(cè)[J].安徽農(nóng)業(yè)科學(xué),2010,38(16):8281-8282.
[8]王渝陵.影響糧食綜合生產(chǎn)能力的相關(guān)要素[J].渝州大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),1999(4):22-25.
[9]徐建華.現(xiàn)代地理學(xué)中的數(shù)學(xué)方法(第二版)[M].北京:高等教育出版社,2004.47-68.
[10]何曉群.現(xiàn)代統(tǒng)計(jì)分析方法與應(yīng)用[M].北京:中國(guó)人民大學(xué)出版社,2001.102-129.
[11]周介銘,彭文甫.影響四川省糧食生產(chǎn)因素的灰色分析與糧食產(chǎn)量預(yù)測(cè)[J].四川師范大學(xué)學(xué)報(bào),2005,28(3):350-351.
[12]王學(xué)萌,張繼忠,王榮.灰色系統(tǒng)分析及實(shí)用計(jì)算程序[M].武漢:華中科技大學(xué)出版社,2001.
A Comparison on the Grain Yield Prediction Methods for Jincheng City
HE Wen-chao,SHI Xue-yi,JING Ming,SUN Jing-jing,LIU Wei-wei
(ChinaUniversityofGeosciences,Beijing100083,China)
Improving the forecast accuracy of grain yield is the important subject of compiling general land use planning.In this paper,grey correlativity analysis is used to analyze key factors of grain production.The result shows that the production of per land area has the greatest influence on grain,followed by cultivated area.Then based on the grey correlativity analysis,the author selects the main factors.The result shows that grey-multiple linear regression model has the highest prediction accuracy by comparing the linear regression model,grey GM(1,1)model and grey-multiple linear regression model.
grey incidence analysis;multiple linear regression;forecast of grain yield;GM(1,1)
F301
A
1672-0504(2011)05-0079-03
2011-05- 11;
2011-07-17
國(guó)家自然科學(xué)基金項(xiàng)目(70673055)
和文超(1986-),女,碩士研究生,研究方向?yàn)橥恋乩靡?guī)劃。*通訊作者E-mail:shixueyi60@163.com