張怡
摘? 要: 本文主要運用了2013年我國31個主要城市的農(nóng)林牧副漁業(yè)的各產(chǎn)值155個樣本橫截面數(shù)據(jù),本次采用技術路線是用聚類分析將全國31個省份農(nóng)林牧副漁業(yè)發(fā)展相似的個體歸為一類;其次運用主成分分析來判斷在這些城市中農(nóng)林牧副漁業(yè)這五個因素利用聚分析方法將性質(zhì)相似的個體歸為一類;然后用主成分析方法,借助統(tǒng)計軟件SPSS,提取出對各省市經(jīng)濟發(fā)展影響的主要因素,然后構造主要因素與可控因素之間的線性方程及綜合得分函數(shù)[1],通過Excel計算出各個因素的綜合得分,對統(tǒng)計結果做出合理解釋并進行相關總結。
關鍵詞: 農(nóng)林牧副漁業(yè);聚類分析;農(nóng)業(yè)發(fā)展;主成分分析
中圖分類號: S-01? ? 文獻標識碼: A? ? DOI:10.3969/j.issn.1003-6970.2019.01.034
【Abstract】: This paper mainly uses the cross-sectional data of 155 samples of the output value of agriculture, forestry, animal husbandry and fishery in 31 major cities of China in 2013. This technical route adopts the cluster analysis to compare the individuals Followed by the use of principal component analysis to determine these five factors in the city of agriculture, forestry, animal husbandry, fishery, animal husbandry, fisheries, animal husbandry and fisheries by using the method of poly-analysis of similar nature of individuals classified as a category; Then the main factors that affect the economic development of provinces and cities are constructed. Then, the linear equation and comprehensive score function between the main factors and controllable factors are constructed. The comprehensive scores of each factor are calculated by Excel. The statistical results are reasonably explained and summarized.
【Key words】: Agriculture, forestry; Animal husbandry and fishery; Cluster analysis; Agricultural development; Principal component analysis
0? 引言
由于農(nóng)業(yè)受自然條件影響較大,有明顯的區(qū)域性和季節(jié)性。我國土地面積遼闊,氣候具有多樣性導致農(nóng)業(yè)的生產(chǎn)也出現(xiàn)了多樣性[2-3]。所以認識到通過適當調(diào)整自然資源來促進農(nóng)業(yè)可持續(xù)發(fā)展的重要性和緊迫性。本文采用2013年的全國31個省份農(nóng)林牧副漁業(yè)相關數(shù)據(jù),同時結合國家統(tǒng)計局部分權威指標,歸納指標如下:X1:農(nóng)業(yè)總產(chǎn)值(億元)、
X2:林業(yè)總產(chǎn)值(億元)、X3:牧業(yè)總產(chǎn)值(億元)、X4: 漁業(yè)總產(chǎn)值(億元)、X5:副業(yè)(農(nóng)林牧漁服務業(yè)總產(chǎn)值)總產(chǎn)值(億元)這五個方面。
3.2.2? 結果分析
由譜系圖結果可以將我國31個省、市、自治區(qū)根據(jù)農(nóng)林牧副漁產(chǎn)值作如下分類。
第一類:山東省、河南省;
第二類:河北省、四川省、黑龍江省、湖北省、湖南省、江蘇省、廣東省;
第三類:重慶市、貴州省、山西省、甘肅省、北京市、青海省、天津市、上海市、寧復回族自治區(qū)、西藏自治區(qū)、海南省、;
第四類:內(nèi)蒙古自治區(qū)、吉林省、云南省、陜西省、新疆維吾爾自治區(qū)、安徽省、廣西壯族自治
3.3? K-均值
3.3.1? K-均值聚類
如表4所示。
3.3.2? 結果分析
第一類:山東省、河南省;
第二類:河北、遼寧、黑龍江、江蘇、安徽、湖北、湖南、廣東、四川;
第三類:北京市、天津市、山西、上海市、海南、重慶市、貴州、西藏自治區(qū)、甘肅、青海、寧夏回族自治區(qū);
第四類:內(nèi)蒙古自治區(qū)吉林、浙江、福建、江西、廣西壯族自治區(qū)、云南、陜西、新疆維吾爾族自治區(qū);
3.4? 判別分析得出結果
判別分析是合適的統(tǒng)計分析方法,判別分析最基本的要求是:分組類型在兩組以上;每組案例的規(guī)模必須至少在一個以上。
表5結果顯示,通過初始判別預測,1組2個全部判對,2組7個全部判對,3組11個全部判對,4組11個全部判對,從而有100%的原始觀測被判對;在交叉驗證中,1組2個全部判對,2組6個判對、1個判錯給了1,3組11個全部判對、4組11個全部判對,從而有96.8%的原始觀測被判對。
反觀K-均值分類法,通過初始判別預測,有100%的原始觀測被判對;在交叉驗證中,有 90.3%的原始觀測被判對。故選用系統(tǒng)聚類(組間連接)分類合適。
3.5? 主成分分析
3.5.1? 數(shù)據(jù)準備
數(shù)據(jù)來源于上述表1數(shù)據(jù)。
3.5.2? 主成分分析結果
程序運行結果得到KMO抽樣適應性測度值:Kaiser-Meyer-Olkin=0.696,大于0.6,一般認為此值越大,做主成分分析的效果越好。
從表8中可得到只有前兩個成分的特征值大于0.9,即是3.185和0.958,所以選取兩個作為主成分。根據(jù)累積貢獻率超過80%的一般選取原則,主成分和主成分的累積貢獻率達到了82.849%的水平,表明原來5個變量反映的信息可由這兩個主成分反映82.849%。
從表9中可以看出,第一主成分基本支持了X2,X3,X4,X5,而第二主成分僅僅在X1上表示支持。該成分因子對各省的農(nóng)業(yè)發(fā)展有預報作用。第一主成分與牧業(yè)總產(chǎn)值(億元)、副業(yè)(農(nóng)林牧漁服務業(yè)總產(chǎn)值)總產(chǎn)值(億元)、農(nóng)業(yè)總產(chǎn)值(億元)高度正相關,因此第一主成分可以反映影響該省農(nóng)業(yè)發(fā)展的農(nóng)、牧、副動態(tài)發(fā)展因素,第二主成分與林業(yè)總產(chǎn)值(億元)高度正相關,因此直接反映影響各省農(nóng)業(yè)發(fā)展狀況的林業(yè)靜態(tài)發(fā)展因素。
3.5.3? 分析結論
因為本次研究是為了研究各省農(nóng)業(yè)發(fā)展的情況,我們可以看到第一主成分基本支持了X2,X3,X4,X5。第二主成分支持了X1,所以計算每個樣本在第一主成分和第二主成分方向的得分。
可以對數(shù)據(jù)進行標準化,并用每個樣本乘以第一成分得分矩陣,即得各樣本在第一主成分的綜合
4? 結論
采用統(tǒng)計學相關的分析方法對我國31個省、市、自治區(qū)就農(nóng)林牧副漁業(yè)各產(chǎn)值進行具體分析,并將我國31個省、市、自治區(qū)進行綜合得分排名。其中,得分為正值,表示該城市農(nóng)業(yè)高于平均水平;反之,表示該城市農(nóng)業(yè)發(fā)展低于平均水平。在農(nóng)業(yè)總產(chǎn)值(億元)、林業(yè)總產(chǎn)值這兩個提取的主成分上得分高于平均水平(即得分大于零)的是由山東、江蘇、廣東、河南、湖南、江西、湖北、河北、遼寧、福建、安徽、廣西、四川、黑龍江組成,代表著2013年農(nóng)業(yè)產(chǎn)值較高,農(nóng)業(yè)發(fā)展較好的省份,尤其是山東省,農(nóng)業(yè)總產(chǎn)值居首位;從結果可以看出,農(nóng)業(yè)產(chǎn)值受自然條件及教育科技發(fā)展等方面的影響,上海市、天津市、北京市是我國政治、經(jīng)濟文化發(fā)展較快的地區(qū),主要以第三產(chǎn)業(yè)為主,第一產(chǎn)業(yè)產(chǎn)值較低,而西藏自治區(qū)、青海省由手自然條件惡劣,生態(tài)環(huán)境脆弱,導致農(nóng)業(yè)產(chǎn)值較低。在農(nóng)業(yè)產(chǎn)值較高的省份,如山東省、河南省、河北省、四川省等除了自然條件因素較好外,教育與農(nóng)業(yè)技術的發(fā)展也為農(nóng)業(yè)的發(fā)展創(chuàng)造了較好的條件。
參考文獻
何曉群. 多元統(tǒng)計分析[M]. 北京: 中國人民大學出版社, 2011.
趙曉葵. 基于聚類分析的青海藏區(qū)社會經(jīng)濟發(fā)展水平評價研究[J]. 青海師范大學學報, 2010.
國家統(tǒng)計局《中國統(tǒng)計年鑒-2012年農(nóng)林牧漁業(yè)產(chǎn)值》.
高惠璇編著, 《應用多元統(tǒng)計分析》北京大學出版社, 2005. 1.
何亮. 主成分分析在SPSS中的運用[J].山西農(nóng)業(yè)大學學報, 2007(4): 44-46.
Abdul-Wahab SA, Bakheit CS, Al-Alawi SM (2005) Principal component and multiple regression analysis in modelling of ground-level ozone and factors affecting its concentrations. Environ Model Softw 20(10): 1263-1271.
YOSHIOKA Masataka, LIANG Hongbo, UEDA Naoya, IWATA Yu, TIAN Ye, ZHU Chi. Construction of BMI Power Assist System with the EEG-Torque Modele Using Principal Component Analysis[J]. The Proceedings of JSME annual Conference on Robotics and Mechatronics (Robomec), 2017, 2017(0).
薛薇. 基于SPSS的數(shù)據(jù)分析[M]. 北京:中國人民大學出版社, 2006.
唐功爽. 基于SPSS的主成分分析于因子分析的辨析[J]. 統(tǒng)計教育, 2007(2).
鞠英杰. SPSS統(tǒng)計分析研究的有利工具[J].統(tǒng)計與咨詢, 1999(6): 36.