劉 東,白雪峰,孟 軍
(1.東北農(nóng)業(yè)大學水利與建筑學院,哈爾濱 150030;2.東北農(nóng)業(yè)大學農(nóng)林經(jīng)濟管理博士后科研流動站,哈爾濱 150030;3.東北農(nóng)業(yè)大學理學院,哈爾濱 150030)
目前,預測糧食產(chǎn)量常用的方法有支持向量機、粗糙集理論、馬爾柯夫模型、組合模型、模糊回歸等方法[1-6],但這些方法有的精度不高,有的原理復雜。多元線性回歸是一種簡單實用的多元統(tǒng)計分析方法,已經(jīng)廣泛應用于社會、金融、醫(yī)學以及水質(zhì)預測等眾多自然科學領(lǐng)域中[7-10]。由于區(qū)域糧食總產(chǎn)量受到糧食單產(chǎn)、糧食播種面積等眾多復雜因素的制約[11-12],因此,本文嘗試采用多元回歸分析方法建立我國中長期糧食總產(chǎn)量多元線性回歸預測模型,為保障我國糧食安全提供決策依據(jù)。
糧食總產(chǎn)受到多種因素的影響,其中糧食單產(chǎn)、糧食播種面積、化肥施用量、有效灌溉面積、農(nóng)機總動力及農(nóng)田成災面積是最為重要的6個影響因子?,F(xiàn)選取前述6個影響因子1983~2006年序列資料(見圖1、2)進行分析預測,結(jié)果見表1。
圖1 我國化肥施用量與農(nóng)機總動力變化曲線(1983~2006)Fig.1 Variation curve of Chinese fertilizer application rate and total power of agricultural machinery from 1983 to 2006
圖2 我國糧食單產(chǎn)、糧食播種面積、有效灌溉面積及農(nóng)田成災面積變化曲線(1983~2006)Fig.2 Variation curve of Chinese food yield per unit area,food planting area,effective irrigation area and destroyed farmland area from 1983 to 2006
表1 我國糧食總產(chǎn)影響因子變化趨勢Table 1 Variation trend of food yield increase influence factors of China
取我國未來糧食總產(chǎn)量(Y)作為因變量,與我國糧食增產(chǎn)密切相關(guān)的糧食單產(chǎn)(X1)、糧食播種面積(X2)、化肥施用量(X3)、有效灌溉面積(X4)、農(nóng)機總動力(X5)、農(nóng)田成災面積(X6)作為自變量,采用EXCEL軟件中的數(shù)值分析工具進行多元線性回歸分析。
根據(jù)我國1983~2006年因變量及各自變量數(shù)據(jù),采用Excel軟件進行回歸分析,得到我國糧食總產(chǎn)量數(shù)學模型:
該模型R2=0.9998。
對模型進行F檢驗。F=13 120.74,當α=0.05時,F(xiàn)0.05=2.70,F(xiàn)>F0.05,說明回歸效果非常顯著。
對各回歸系數(shù)進行t檢驗,結(jié)果見表2。
表2 回歸系數(shù)t檢驗結(jié)果Table 2 Inspection results of regression coefficient t
采用向前選擇變量法對自變量集合進行調(diào)整[15]。
首先,計算糧食總產(chǎn)量Y與6個潛在自變量之間的簡單相關(guān)系數(shù),結(jié)果見表3。
選擇相關(guān)系數(shù)最大的X1首先進入模型:Y=7 544.5287+9.0888X1,R2=0.8519
F 檢驗:F=126.54 ,F(xiàn)0.05(1,22)=4.30,F(xiàn)>F0.05,說明回歸效果非常顯著。
t 檢 驗 : t0=2.2711, t1=11.2489,t0.025(22)=2.0739,t0、t1均大于t0.025(22),說明各回歸系數(shù)估計值通過t檢驗。
除X1外,還有5個潛在自變量在模型外。現(xiàn)以 X1與 Y為減模型,以 X1、Y與 X2、X3、X4、X5、X6中的任意一個作為全模型,依次進行偏F檢驗。在通過偏F檢驗的變量中,選擇Fj最大者進入模型,其余依此類推,計算結(jié)果見表4。
根據(jù)上述變量選擇結(jié)果,以糧食總產(chǎn)量(Y)作為因變量,糧食單產(chǎn)(X1)、糧食播種面積(X2)、化肥施用量(X3)、農(nóng)田成災面積(X6)作為自變量,采用1983~2002年自變量和因變量序列資料(n=20)進行多元線性回歸分析,得到最終模型為:
表3 Y與X1~X6的簡單相關(guān)系數(shù)Table 3 Simple related coefficients between Y and independent variables(from X1to X6)
表4 向前選擇變量法計算結(jié)果Table 4 Calculation results of forward selection variables method
續(xù) 表
該模型R2=0.9998。F檢驗:F=18 363.43,F(xiàn)0.05(4,15)=3.06,F(xiàn)>F0.05,說明回歸效果非常顯著。t檢驗:t0=-57.2746,t1=45.9726,t2=50.2722,t3=-3.4242,t4=3.5443,t0.025(15)=2.1315,均大于t0.025(15),說明各回歸系數(shù)估計值通過t檢驗。
采用建立的我國糧食總產(chǎn)量多元線性回歸方程對1983~2002年我國糧食總產(chǎn)量進行擬合,見圖3。
圖3 我國糧食總產(chǎn)量擬合曲線(1983~2002)Fig.3 Fitting curve of total food yield of China from 1983 to 2002
經(jīng)過計算,擬合準確率為100%(相對誤差e<20%為合格[13-14])。從圖1可以看出,所建糧食總產(chǎn)量多元線性回歸模型擬合效果良好。
采用式(2)計算出2003~2006年我國糧食總產(chǎn)量的預測值,然后采用未參加建模的2003~2006年我國糧食總產(chǎn)量的原始數(shù)據(jù)進行后驗預測檢驗,見表5。
經(jīng)過計算,預測檢驗合格率為100%(相對誤差e<20%為合格),達到1級標準。因此,所建的我國糧食總產(chǎn)量多元線性回歸模型可靠性和預測精度較高,可用于預測我國未來糧食總產(chǎn)量。
預測結(jié)果見表5。
表5 2003~2006年我國糧食總產(chǎn)量后驗預測誤差Table 5 Total food yield posterior forecasting error of China from 2003 to 2006
將表1中糧食單產(chǎn)(X1)、糧食播種面積(X2)、化肥施用量(X3)、農(nóng)田成災面積(X6)2010年、2020年、2030年的預測值代入式(2),得到2010年、2020年、2030年我國糧食總產(chǎn)量的預測值:
Y2010=50 065 萬t,Y2020=60 268 萬 t,Y2030=71 613萬t
本文預測結(jié)果與丁晨芳的預測結(jié)果51 369.6萬t(2010年)[5]和王海全[15]的預測結(jié)果60 267~64 975萬t(2020年)、69 351~73 019萬t(2030年)[18]基本一致。
a.采用多元線性回歸分析方法構(gòu)建了我國中長期糧食總產(chǎn)量預測模型。經(jīng)過計算,2007~2010年、2011~2020年、2021~2030年我國糧食總產(chǎn)量年平均增長率分別為0.16%、2.04%、1.88%。計算結(jié)果表明,只要措施得當,未來我國完全可以在耕地資源不可逆轉(zhuǎn)減少的前提下實現(xiàn)糧食總產(chǎn)量的持續(xù)增長。
b.由上述建模過程可以看出,糧食單產(chǎn)、糧食播種面積、化肥施用量及農(nóng)田成災面積是我國糧食總產(chǎn)量的關(guān)鍵制約因素,因此,加大科技投入、提高糧食單產(chǎn)、提高復種指數(shù)、擴大糧食種植面積、合理增加化肥施用量以及加強水利投入、控制農(nóng)田成災面積實現(xiàn)我國糧食增產(chǎn)的根本措施。
c.需要指出的是,雖然所建多元線性回歸模型通過了精度檢驗,但式(2)中自變量化肥施用量(X3)和農(nóng)田成災面積(X6)的回歸系數(shù)出現(xiàn)了與生活常識相反的符號,對因變量糧食總產(chǎn)量(Y)的解釋作用不強,這主要是由于各變量間存在較嚴重多重相關(guān)性所導致的,有待于今后進一步進行研究。
[1]李曉東,席升陽,潘立.基于最小二乘支持向量機的中國糧食產(chǎn)量預測模型研究[J].水土保持研究,2007,14(6):322-324.
[2]尹宗成.運用粗糙集理論對我國糧食產(chǎn)量的預測[J].統(tǒng)計與決策,2008(6):46-48.
[3]賀福利,胡勇,陳淳.用灰色馬爾柯夫鏈預測模型對我國糧食產(chǎn)量的預測[J].數(shù)學的實踐與認識,2003,33(12):45-47.
[4]Singh R,Ibrahim A E.Use of spectral data in Markov chain model for crop yield forecasting[J].Journal of the Indian Society of Remote Sensing,1996,24(3):145-152.
[5]丁晨芳.組合模型分析方法在我國糧食產(chǎn)量預測中的應用[J].農(nóng)業(yè)現(xiàn)代化研究,2007,28(1):101-103.
[6]Kandala V M,Prajneshu.Fuzzy regression methodology for crop yield forecasting using remotely sensed data[J].Journal of the Indian Society of Remote Sensing,2002,30(4):191-195.
[7]王惠文,孟潔.多元線性回歸的預測建模方法[J].北京航空航天大學學報,2007,33(4):500-504.
[8]苗菁,吳小花.聚類回歸與多元線性回歸的對比研究[J].現(xiàn)代預防醫(yī)學,2006,33(4):491-493.
[9]羅婭妮,郭永潔.試論多元線性回歸模型在股票定價中的運用[J].財會通訊:理財版,2008(9):26-28.
[10]吳宏斌.地下水水質(zhì)預測的多元線性回歸分析模型研究[J].山西建筑,2007,33(32):201-202.
[11]劉晶,王世新,周藝.我國糧食生產(chǎn)主要影響因子的灰色關(guān)聯(lián)動態(tài)分析[J].國土與自然資源研究,2007(1):54-55.
[12]付強.數(shù)據(jù)處理方法及其農(nóng)業(yè)應用[M].北京:科學出版社,2006.
[13]張欣莉,丁晶,金菊良.基于遺傳算法的參數(shù)投影尋蹤回歸及其在洪水預報中的應用[J].水利學報,2000(6):45-48.
[14]金雙彥,秦毅,李雪梅,等.黃河下游夾河灘站洪水最大含沙量預報研究[J].泥沙研究,2008(2):58-61.
[15]王海全.我國糧食生產(chǎn)增長潛力及激勵措施究[J].湖北經(jīng)濟學院學報,2006,4(3):83-89.