◎ 謝玉瑩
(西安財(cái)經(jīng)大學(xué) 統(tǒng)計(jì)學(xué)院,陜西 西安 710100)
糧食不僅影響區(qū)域農(nóng)業(yè)經(jīng)濟(jì)的發(fā)展,而且與國(guó)計(jì)民生息息相關(guān)。在每年的政府報(bào)告中,國(guó)家對(duì)不同區(qū)域的糧食產(chǎn)量都有明確的要求,在2022 年的中央一號(hào)文件中更是把確保我國(guó)糧食安全作為底線任務(wù)之一。從生產(chǎn)的角度來(lái)看,糧食供給是基礎(chǔ),糧食產(chǎn)量則是保障供給的前提。陜西省作為西北地區(qū)經(jīng)濟(jì)中心,隨著經(jīng)濟(jì)的快速增長(zhǎng),常住人口數(shù)量逐年增加,而糧食產(chǎn)量的增長(zhǎng)卻不容樂(lè)觀。因此,對(duì)陜西省糧食產(chǎn)量的預(yù)測(cè)研究能為陜西省糧食安全問(wèn)題提供數(shù)據(jù)支持,進(jìn)而保障陜西省區(qū)域糧食產(chǎn)量安全,從而更好地滿足人們生活的基本需求。
目前,有部分學(xué)者基于單一預(yù)測(cè)模型對(duì)糧食產(chǎn)量進(jìn)行預(yù)測(cè)研究,如胡雪冰等[1]通過(guò)灰色模型對(duì)四川糧食產(chǎn)量和消費(fèi)進(jìn)行了預(yù)測(cè),并根據(jù)產(chǎn)需平衡狀況對(duì)四川省糧食安全進(jìn)行了相應(yīng)分析。周永生等[2]建立了多元回歸模型,對(duì)廣西壯族自治區(qū)糧食產(chǎn)量進(jìn)行擬合預(yù)測(cè)并提出了相關(guān)建議,以確保廣西壯族自治區(qū)未來(lái)糧食產(chǎn)量的穩(wěn)定發(fā)展。還有一些學(xué)者,基于組合模型對(duì)糧食產(chǎn)量進(jìn)行預(yù)測(cè),如姚作芳等[3]將灰色預(yù)測(cè)模型、灰色馬爾科夫預(yù)測(cè)模型及邏輯斯蒂預(yù)測(cè)模型加以組合,采用最優(yōu)加權(quán)方法確定權(quán)重,建立了東北地區(qū)糧食產(chǎn)量預(yù)測(cè)模型。游文倩等[4]基于IOWA 算子將ARIMA模型、三參數(shù)指數(shù)平滑法和多元線性回歸模型進(jìn)行組合,利用誤差平方和最小法確定權(quán)重,建立了我國(guó)糧食產(chǎn)量預(yù)測(cè)模型。通過(guò)對(duì)上述文獻(xiàn)分析可知,鮮有學(xué)者從博弈論的角度對(duì)糧食產(chǎn)量進(jìn)行組合預(yù)測(cè)。因此,本文從博弈論的角度,采用合作博弈論Shapley 值利益分配理論,并依據(jù)GM(1,1)模型、主成分回歸模型和Holt兩參數(shù)指數(shù)平滑法模型的預(yù)測(cè)平均誤差平方和建立線性組合模型對(duì)陜西省糧食產(chǎn)量進(jìn)行擬合預(yù)測(cè)。
本文從自然條件、科學(xué)技術(shù)、農(nóng)業(yè)投入和社會(huì)經(jīng)濟(jì)方面對(duì)糧食產(chǎn)量進(jìn)行研究。研究所使用的糧食產(chǎn)量、糧食播種面積、成災(zāi)面積、農(nóng)村用電量、農(nóng)業(yè)機(jī)械總動(dòng)力、農(nóng)用化肥使用量、農(nóng)用柴油使用量、農(nóng)用塑料薄膜使用量、農(nóng)業(yè)生產(chǎn)資料價(jià)格指數(shù)和有效灌溉面積等數(shù)據(jù)來(lái)源于2001—2020 年《陜西統(tǒng)計(jì)年鑒》[5]。
為避免與糧食產(chǎn)量相關(guān)性較小的影響因素在預(yù)測(cè)時(shí)對(duì)結(jié)果產(chǎn)生干擾,導(dǎo)致預(yù)測(cè)精度下降。本文采用灰色關(guān)聯(lián)度法對(duì)影響因素進(jìn)行分析,并以此為依據(jù)對(duì)影響因素進(jìn)行篩選,剔除關(guān)聯(lián)度較低的因素,主要步驟如下。①確定比較序列和參考序列。本文以陜西省糧食產(chǎn)量Y為參考序列,糧食播種面積和成災(zāi)面積等相關(guān)影響因素X為比較序列。②采用初值法對(duì)數(shù)據(jù)進(jìn)行無(wú)量綱化處理。③計(jì)算差序列。④計(jì)算極差。⑤計(jì)算灰色關(guān)聯(lián)系數(shù)。其中,ρ是分辨系數(shù),本文取為0.5。⑥計(jì)算灰色關(guān)聯(lián)度。詳細(xì)步驟與胡雪冰等[1]相同。
根據(jù)計(jì)算結(jié)果得出2001—2020 年糧食產(chǎn)量及相關(guān)影響因素的灰色關(guān)聯(lián)度。由于灰色關(guān)聯(lián)度越大,相關(guān)影響因素對(duì)糧食產(chǎn)量影響也會(huì)越大。因此,依據(jù)灰色關(guān)聯(lián)度可得相關(guān)影響因素對(duì)糧食產(chǎn)量的影響強(qiáng)弱,具體排序?yàn)檗r(nóng)業(yè)生產(chǎn)資料價(jià)格指數(shù)>有效灌溉面積>農(nóng)用化肥使用量>糧食播種面積>農(nóng)用塑料薄膜使用量>農(nóng)用柴油使用量>農(nóng)業(yè)機(jī)械總動(dòng)力>農(nóng)村用電量>成災(zāi)面積。剔除掉對(duì)糧食產(chǎn)量影響程度較小的影響因素,選取農(nóng)業(yè)生產(chǎn)資料價(jià)格指數(shù)、有效灌溉面積、農(nóng)用化肥使用量、糧食播種面積、農(nóng)用塑料薄膜使用量和農(nóng)用柴油使用量作為預(yù)測(cè)糧食產(chǎn)量的自變量,設(shè)為X01-X06。
灰色系統(tǒng)理論是1982 年由中國(guó)學(xué)者鄧聚龍教授創(chuàng)立的,以“小數(shù)據(jù),貧信息”為特點(diǎn)的不確定性系統(tǒng)為研究對(duì)象。通常未經(jīng)處理的數(shù)據(jù)具有很強(qiáng)的隨機(jī)性?;疑A(yù)測(cè)是灰色理論中重要分支,具有樣本需求量小等優(yōu)點(diǎn)。其中,GM(1,1)是常見(jiàn)的單變量灰色預(yù)測(cè)模型,可以對(duì)中長(zhǎng)期且平穩(wěn)的數(shù)據(jù)進(jìn)行有效預(yù)測(cè)。主要步驟如下。①根據(jù)2001—2020 年陜西省糧食產(chǎn)量數(shù)據(jù),建立原始序列數(shù)據(jù)再進(jìn)行累加,從而建立累加序列并進(jìn)行鄰均值序列生成。②根據(jù)上述生成的原始序列和鄰均值序列建立基本方程,并通過(guò)最小二乘法求解出發(fā)展灰數(shù)a和內(nèi)生控制灰數(shù)b。③建立白化微分方程。④代入a和b解出預(yù)測(cè)方程。詳細(xì)步驟與姚作芳等[3]相同。
根據(jù)2001—2020 年陜西省糧食產(chǎn)量數(shù)據(jù),通過(guò)matlab 軟件得解出發(fā)展灰數(shù)a=-0.013 0 和內(nèi)生控制灰數(shù)b=1 001.7,得出預(yù)測(cè)模型為
同時(shí),得出模型的后驗(yàn)差c=殘差序列標(biāo)準(zhǔn)差/原始序列標(biāo)準(zhǔn)差=0.399 3,小誤差概率p=p{|e(k)-e-|< 0.674 5×原始序列標(biāo)準(zhǔn)差}=0.9,并對(duì)比精度檢驗(yàn)表 (表1),證明了構(gòu)建的灰色預(yù)測(cè)模型精度較高,適合對(duì)陜西省糧食產(chǎn)量進(jìn)行擬合預(yù)測(cè)。
表1 精度檢驗(yàn)表
在預(yù)測(cè)分析時(shí),如果影響因素與預(yù)測(cè)對(duì)象之間相關(guān)關(guān)系大致呈線性且通過(guò)多重共線性診斷,VIF>10(即存在嚴(yán)重共線性),可以先采用主成分分析對(duì)數(shù)據(jù)進(jìn)行降維,把原本互有關(guān)系的指標(biāo)通過(guò)正交變換的辦法,化為互不相關(guān)的幾個(gè)綜合指標(biāo),然后再進(jìn)行回歸分析和預(yù)測(cè)。主要步驟如下。①將2001—2020 年陜西省糧食總產(chǎn)量及篩選后的相關(guān)影響因素的數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化并進(jìn)行多重共線性檢驗(yàn),本文中多項(xiàng)指標(biāo)VIF>10,存在顯著的共線性。②通過(guò)主成分分析進(jìn)行降維,先進(jìn)行適用度檢驗(yàn)。通過(guò)適應(yīng)度檢驗(yàn)后,計(jì)算主成分,得出主因子。其中,適用度檢驗(yàn)是指Bartlett 球形度檢驗(yàn)的顯著性水平小于0.001,KMO大于0.5,本文的顯著性水平小于0.001,且KMO為0.687,因此適合進(jìn)行主成分分析。主成分是依據(jù)特征值大于1 和累計(jì)貢獻(xiàn)率達(dá)到80%以上的原則進(jìn)行選擇。根據(jù)SPSS 軟件計(jì)算結(jié)果,本文選擇兩個(gè)主成分。第一個(gè)主成分的特征值為3.913,第二個(gè)特征值為1.013,兩者累計(jì)貢獻(xiàn)率為82.097%,符合選取原則。③將主因子帶入回歸模型并進(jìn)行逆標(biāo)準(zhǔn)化還原,得出主成分回歸預(yù)測(cè)模型。詳細(xì)步驟與董京銘等[6]相同。使用SPSS軟件通過(guò)帶入2001 年到2020 年陜西省糧食總產(chǎn)量及篩選后的相關(guān)影響因素得出回歸方程:
指數(shù)平滑法是基于統(tǒng)計(jì)學(xué)家Warren Persons 因素分解思想衍生出的一種時(shí)間序列預(yù)測(cè)模型,其基本思想是通過(guò)計(jì)算原始數(shù)據(jù)的平滑值,進(jìn)而通過(guò)建立預(yù)測(cè)模型對(duì)數(shù)據(jù)進(jìn)行預(yù)測(cè)。根據(jù)序列的發(fā)展變化趨勢(shì),一般可將指數(shù)平滑法模型分為3 類。①無(wú)長(zhǎng)期趨勢(shì)、無(wú)季節(jié)效應(yīng)使用簡(jiǎn)單指數(shù)平滑法。②有長(zhǎng)期趨勢(shì)、無(wú)季節(jié)效應(yīng)使Holt 兩參數(shù)指數(shù)平滑法。③長(zhǎng)期趨勢(shì)可有可無(wú),但一定有季節(jié)效應(yīng)使用Holt-Winters 三參數(shù)指數(shù)平滑法。經(jīng)過(guò)對(duì)2001—2020 年陜西省糧食產(chǎn)量的發(fā)展變化分析,得出陜西省糧食產(chǎn)量是屬于有趨勢(shì)、無(wú)明顯季節(jié)效應(yīng)。因此,本文采用Holt 兩參數(shù)指數(shù)平滑法,通過(guò)不同參數(shù),直接對(duì)趨勢(shì)進(jìn)行平滑處理。公式為
式中:Pt是調(diào)整后的平滑值;α和β是調(diào)整模型的兩個(gè)參數(shù);是l期后的預(yù)測(cè)值。
根據(jù)2001 年到2020 年陜西省糧食產(chǎn)量數(shù)據(jù),通過(guò)R軟件計(jì)算調(diào)整模型的參數(shù),α=0.668 357和β=0.124 461 4,得出預(yù)測(cè)模型=1 264.889 72+13.413 21×l。
Shapley 值法是一種用來(lái)解決多人合作對(duì)策問(wèn)題的數(shù)學(xué)方法。通過(guò)計(jì)算Shapley 值可以得出在團(tuán)隊(duì)合作中每個(gè)成員對(duì)主體的邊際貢獻(xiàn)率,并根據(jù)邊際貢獻(xiàn)率完成利益分配。其分配結(jié)果易于被各利益相關(guān)者接受且視為公平。因此,本文通過(guò)Shapley 值理論對(duì)各模型賦予權(quán)重,建立線性組合模型對(duì)陜西省糧食產(chǎn)量進(jìn)行預(yù)測(cè)。在建立線性組合模型時(shí),將總誤差比作總收益,采用Shapley 值分配總誤差的方法,計(jì)算各個(gè)模型的權(quán)重。具體步驟如下。
(2)計(jì)算第i種方法的邊際貢獻(xiàn)為
(3)計(jì)算第i種方法所分?jǐn)偟恼`差為
式中:n為n種方法,本文采用3 個(gè)單一模型進(jìn)行組合,因此n=3。s為n種方法集合的任意子集,E(s)為其組合誤差。W(|s|)為第i種方法的邊際貢獻(xiàn),E(s)-E(s/i)為第i種方法加入后對(duì)誤差的影響,Ei*為第i種方法所分?jǐn)偟恼`差,|s|為s子集個(gè)數(shù),s/i為子集除去i。Ei為第i種預(yù)測(cè)方法平均誤差平方和,Ei*≤Ei。
根據(jù)Shapley 值理論,計(jì)算各單項(xiàng)模型的權(quán)重及組合預(yù)測(cè)模型:m1=0.522 7,m2=0.328 6,m3=0.148 7。
式中:為Holt 兩參數(shù)指數(shù)平滑法的預(yù)測(cè)值;為GM(1,1)的預(yù)測(cè)值;為主成分回歸預(yù)測(cè)值。
選取2001—2020 年陜西省糧食產(chǎn)量的年度數(shù)據(jù),并根據(jù)已構(gòu)建GM(1,1)、主成分回歸及Holt 兩參數(shù)指數(shù)平滑法模型3 個(gè)單一模型和基于Shapley 值的組合模型計(jì)算出預(yù)測(cè)值。將預(yù)測(cè)值和實(shí)際值相比較,并計(jì)算出相對(duì)誤差如表2 所示。
通過(guò)分析表2 的預(yù)測(cè)值及相對(duì)誤差,可以得出基于Shapley 值的組合模型對(duì)陜西省2001—2020 年糧食產(chǎn)量預(yù)測(cè)的相對(duì)誤差百分比平均值為2.557%,Holt兩參數(shù)指數(shù)平滑法模型為2.574%,GM(1,1)模型為2.981%,主成分回歸模型為3.178%。由此可得,Shapley值的組合模型預(yù)測(cè)MAPE 最小,預(yù)測(cè)誤差最小,模型精度最高。通過(guò)對(duì)模型預(yù)測(cè)MAPE 的描述性統(tǒng)計(jì)分析可得,組合預(yù)測(cè)模型MAPE 的平均標(biāo)準(zhǔn)差最小,即相對(duì)預(yù)測(cè)誤差波動(dòng)最小且更加穩(wěn)定。
表2 模型預(yù)測(cè)值及相對(duì)誤差表
本文先從線性回歸、時(shí)間序列和灰色模型這3 個(gè)角度對(duì)2001—2020 年陜西省糧食產(chǎn)量進(jìn)行擬合預(yù)測(cè),然后采用Shapley 值法建立組合模型。通過(guò)研究得出結(jié)論如下。
(1)經(jīng)過(guò)單一預(yù)測(cè)模型和組合模型的平均相對(duì)誤差對(duì)比分析,組合模型較單一預(yù)測(cè)模型的預(yù)測(cè)精度高,平均相對(duì)誤差僅為2.557%。同時(shí),通過(guò)描述性分析也可以得出組合模型的相對(duì)誤差的平均標(biāo)準(zhǔn)差小于單項(xiàng)模型,表明組合模型誤差值波動(dòng)較小。因此,在實(shí)際應(yīng)用中,通過(guò)組合模型對(duì)未來(lái)預(yù)測(cè)時(shí),預(yù)測(cè)誤差更小且更穩(wěn)定。
(2)通過(guò)灰色關(guān)聯(lián)度分析,與糧食產(chǎn)量最相關(guān)的是農(nóng)業(yè)生產(chǎn)資料價(jià)格指數(shù),其次是有效灌溉面積、農(nóng)用化肥使用量、糧食播種面積和農(nóng)用塑料薄膜使用 量等。
為了更好地促進(jìn)陜西省糧食生產(chǎn),提高糧食產(chǎn)量,要堅(jiān)持“兩藏”戰(zhàn)略。①“藏糧于地”,就是堅(jiān)決遏制耕地“非農(nóng)化”和防止耕地“非糧化”。嚴(yán)格區(qū)分經(jīng)濟(jì)作物與糧食作物的生產(chǎn)區(qū)域,控制耕地轉(zhuǎn)化為其他農(nóng)用地,防止耕地“非糧化”。禁止非法占用耕地,例如堆放固體廢棄物和城鎮(zhèn)化占用耕地等行為造成耕地“非農(nóng)化”。②“藏糧于技”,就是向科技要單產(chǎn),堅(jiān)持農(nóng)業(yè)科技自強(qiáng)。不僅要增加生物降解地膜、農(nóng)用機(jī)械、育種、病蟲害防治藥物及監(jiān)測(cè)系統(tǒng)等農(nóng)業(yè)技術(shù)的研發(fā)投入,而且要加強(qiáng)培育高素質(zhì)農(nóng)業(yè)科技人才,增加農(nóng)業(yè)院校及科研機(jī)構(gòu)的資金投入,加強(qiáng)對(duì)農(nóng)業(yè)生產(chǎn)者關(guān)于農(nóng)業(yè)生產(chǎn)的技術(shù)培訓(xùn)及相關(guān)知識(shí)普及。