□耿 娟,聶文倩
(河北經(jīng)貿(mào)大學數(shù)學與統(tǒng)計學學院,河北 石家莊 050062)
“民以食為天,國以糧為本”,糧食對于國家發(fā)展至關(guān)重要。河南省是糧食生產(chǎn)大省,保證國家糧食安全是一項重大的政治任務(wù)。河南省地處平原,有大片耕地,以農(nóng)業(yè)為主,其糧食產(chǎn)量關(guān)系到整個國家的命運,因此,需充分發(fā)揮區(qū)位優(yōu)勢,大力發(fā)展農(nóng)業(yè),保證國家糧食安全。研究河南省糧食生產(chǎn)的主要影響因素對提高糧食生產(chǎn)水平、保證糧食安全具有十分重要的現(xiàn)實意義。
河南省是我國小麥生產(chǎn)第一大省,是我國的糧食生產(chǎn)核心區(qū)。歷年來,學者們運用多種方法對河南省糧食產(chǎn)量的影響因素進行分析。劉忠廣(2019)[1]利用SPSS 軟件和通徑分析法分析了河南省糧食產(chǎn)量的影響因素,結(jié)果表明,影響因素對糧食產(chǎn)量影響程度從大到小依次是糧食作物單位面積產(chǎn)量、糧食作物播種面積、農(nóng)村用電量、化肥施用量、有效灌溉面積、農(nóng)村機械總動力、農(nóng)村從業(yè)人口數(shù),說明增加糧食作物單位面積產(chǎn)量、擴大播種面積、增加農(nóng)村用電量等可以顯著提高糧食產(chǎn)量。張貞等(2017)[2]運用Pearson 相關(guān)分析法和灰色關(guān)聯(lián)熵法進行分析,結(jié)果表明,影響糧食產(chǎn)量的因素排名從前往后依次是農(nóng)田有效灌溉面積、耕地面積、糧食作物播種面積、平均氣溫、日照時數(shù)、年降水總量、化肥、農(nóng)藥以及受災(zāi)面積。楊娟等(2017)[3]運用主成分分析法分析河南省1978—2014 年的數(shù)據(jù),探索建立計量經(jīng)濟模型對該期間影響河南省糧食產(chǎn)量波動的因素進行分析,結(jié)果表明,經(jīng)濟發(fā)展與農(nóng)業(yè)資本投入、勞動與土地投入、成本—收益對糧食產(chǎn)量的影響排在前三名。李炳軍等(2021)運用BP神經(jīng)網(wǎng)絡(luò)對河南省糧食產(chǎn)量進行預測,發(fā)現(xiàn)河南省糧食生產(chǎn)增速放緩,糧食生產(chǎn)重心北移。張淑華等(2022)用SD-GM 方法對河南省糧食生產(chǎn)科技創(chuàng)新進行分析,提出“科技蓄糧”的建議。
為研究河南省糧食產(chǎn)量的影響因素,文章主要運用河南省2002—2021 年的數(shù)據(jù)。為保證數(shù)據(jù)來源的可靠性,所有數(shù)據(jù)均來自《河南省統(tǒng)計年鑒》。根據(jù)已有研究,取河南省糧食產(chǎn)量(萬t)為被解釋變量Y,播種面積(千hm2)、灌溉面積(千hm2)、農(nóng)業(yè)機械總動力(萬kW)、化肥施用折純量(萬t)分別為解釋變量X1、X2、X3、X4,構(gòu)造多元統(tǒng)計模型如下。
式中:β0是常數(shù)項,β1~β4是被解釋變量的系數(shù),ε是隨機擾動項,且ε服從均值為0、方差為σ2的正態(tài)分布。各變量數(shù)據(jù)描述性統(tǒng)計如表1 所示。
表1 2002—2021 年各變量數(shù)據(jù)描述性統(tǒng)計
用SPSS 軟件對數(shù)據(jù)進行多重共線性檢驗,檢驗結(jié)果如表2 所示。
由表2 可知,有4 個條件指數(shù)大于10,所以有充足的理由認為變量間具有嚴重的多重共線性,此時不適合使用普通最小二乘法估計。因此,使用可以處理多重共線性問題的嶺回歸和LASSO 回歸分析。
嶺回歸和LASSO 回歸可以解決多重共線性問題,考慮到變量量綱不同,進行嶺回歸和LASSO 回歸之前,對數(shù)據(jù)進行無量綱化處理,主要采用標準化處理。根據(jù)嶺回歸原理分析,運用嶺回歸求解回歸系數(shù)可表示為如下。
式中:lambda 是嶺回歸參數(shù),之后用R軟件實現(xiàn)嶺回歸。制訂嶺參數(shù)lambda 的取值范圍是0~1,繪制嶺跡圖如圖1 所示。
圖1 嶺跡圖
從嶺跡圖中可以看出,當lambda=0 時,圖像不穩(wěn)定。因此可以說明變量間存在多重共線性。用R 軟件中的select 函數(shù)查看k值并篩選,選擇最小的k值(即lambda)為0.120 511 5,之后使用lambda 值進行嶺回歸分析,具體結(jié)果如表3 所示。
表3 嶺回歸結(jié)果
由表3 可知,標準化后β1、β2、β3、β4的系數(shù)分別為1.136 0、1.642 0、0.577 4、1.085 0,并且都在0.05顯著性水平下通過檢驗,標準化后的嶺回歸方程可以表示為如下。
4 個自變量的回歸系數(shù)全部為正,說明河南省糧食種植面積、有效灌溉面積、農(nóng)業(yè)機械總動力和化肥施用折純量與糧食產(chǎn)量呈現(xiàn)正相關(guān),河南省糧食種植面積、有效灌溉面積、農(nóng)業(yè)機械總動力和化肥施用折純量增加會導致糧食產(chǎn)量增加,這與現(xiàn)實情況相符。解釋變量值越大,對被解釋變量影響越大。
進一步分析可知,因為β2>β1>β4>β3,所以對河南省糧食產(chǎn)量影響比較大的解釋變量依次是有效灌溉面積、糧食種植面積、化肥施用折純量和農(nóng)業(yè)機械總動力。
LASSO 回歸也可以解決多重共線性問題。文章選取常用的Cp統(tǒng)計量法進行系數(shù)選擇,R 語言中有多個包可以實現(xiàn)LASSO 回歸,運用R 軟件中Lars 算法進行LASSO 回歸,得到相應(yīng)的回歸結(jié)果[4]。
圖2 中的豎線個數(shù)對應(yīng)LASSO 中迭代的次數(shù),對應(yīng)的系數(shù)值不為0 的自變量即為選入模型的解釋變量。圖2 中共有五條豎線,所以一共進行五次迭代,具體迭代情況如表4 所示。
圖2 迭代次數(shù)
表4 LASSO求解中值的變化
表4 反映了LASSO 求解中值的變化情況,其中Step 表示步數(shù),RSS 表示殘差平方和,找到使統(tǒng)計量Cp達到最小值的步數(shù),輸出所對應(yīng)解釋變量的系數(shù),從中篩選出系數(shù)不為0 的變量??梢钥闯?,當變量選取到第4 步時,Cp值取得最小值4.060 4。
圖3 反映了變量篩選結(jié)果,顯然篩選之后只剩下種植面積、有效灌溉面積和化肥施用折純量三個解釋變量,這與嶺回歸分析結(jié)果保持一致,LASSO 回歸分析結(jié)果如表5 所示。
圖3 變量篩選結(jié)果
表5 LASSO回歸結(jié)果
表5 中種植面積、有效灌溉面積和化肥施用折純量三個解釋變量的系數(shù)分別為0.244 4、0.437 8、0.376 1,LASSO 回歸方程如下。
各解釋變量與被解釋變量依然存在正相關(guān)關(guān)系,以上分析結(jié)果依然適用。
當前,中國人不僅有能力解決自己的吃飯問題,還能幫助世界人民解決吃飯問題,但這并不意味著我國的糧食安全穩(wěn)如磐石,保障糧食安全是一條永無止境的路。文章運用嶺回歸和LASSO 回歸對具有多重共線性的數(shù)據(jù)進行分析,得出以下結(jié)論。河南省糧食產(chǎn)量與種植面積、有效灌溉面積、農(nóng)業(yè)機械總動力和化肥施用折純量呈現(xiàn)正相關(guān)關(guān)系;對河南省糧食產(chǎn)量影響比較大的解釋變量依次是有效灌溉面積、糧食種植面積、化肥施用折純量和農(nóng)業(yè)機械總動力??梢?,糧食種植面積會影響糧食產(chǎn)量,相關(guān)部門要堅決守住耕地這條不可逾越的紅線,鼓勵糧食生產(chǎn)向多元化規(guī)模經(jīng)營方向發(fā)展,提高糧食生產(chǎn)效率和質(zhì)量,發(fā)揮金融對糧食產(chǎn)量的保駕護航作用,暢通糧食生產(chǎn)和流通的各個環(huán)節(jié)。