国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于多元統(tǒng)計(jì)分析方法對(duì)我國不同省市自治區(qū)的發(fā)展水平初步分析

2015-03-25 13:22:40石榮平
長春大學(xué)學(xué)報(bào) 2015年10期
關(guān)鍵詞:自治區(qū)代碼聚類

李 華,石榮平

(長春大學(xué) 理學(xué)院,長春130022)

1 問題分析

根據(jù)參考文獻(xiàn)[1]第三部分內(nèi)容“社會(huì)主義和諧社會(huì)綜合評(píng)價(jià)指標(biāo)的設(shè)立”,參考其遵循的原則以及最終社會(huì)主義和諧社會(huì)綜合評(píng)價(jià)指標(biāo)體系所確立的因子,對(duì)于各省市自治區(qū)總體發(fā)展水平的研究,我們確立了經(jīng)濟(jì)、科技、文化和資源四大因子來衡量我國不同省市自治區(qū)綜合發(fā)展?fàn)顩r。通過中國統(tǒng)計(jì)網(wǎng)查詢,尋找到2012 年關(guān)于各省市自治區(qū)的四大因子25 個(gè)指標(biāo)的數(shù)據(jù),從指標(biāo)的基本性質(zhì)上分析,可以知道我們選取的指標(biāo)體系也具有較好的系統(tǒng)性、科學(xué)性、可比性和可操作性。由于指標(biāo)之間仍存一定的相關(guān)性,在構(gòu)建綜合評(píng)價(jià)的數(shù)學(xué)模型時(shí)必須充分注意到這一點(diǎn)。下面將分別介紹所選指標(biāo)的名稱和它們所代表的含義。

因子F1(經(jīng)濟(jì)因子)

(1)地方財(cái)政一般預(yù)算收入,單位億元,指標(biāo)代碼x1;

(2)地區(qū)生產(chǎn)總值,單位億元,指標(biāo)代碼x2;

(3)第一產(chǎn)業(yè)增加值,單位億元,指標(biāo)代碼x3;

(4)第二產(chǎn)業(yè)增加值,單位億元,指標(biāo)代碼x4;

(5)第三產(chǎn)業(yè)增加值,單位億元,指標(biāo)代碼x5;

(6)經(jīng)營單位所在地進(jìn)出口總額,單位千美元,指標(biāo)代碼x6;

(7)人均地區(qū)生產(chǎn)總值,單位元每人,指標(biāo)代碼x7;

(8)居民消費(fèi)價(jià)格指數(shù),以上年100 計(jì)算,指標(biāo)代碼x8。

因子F2(科技因子)

(1)規(guī)模以上工業(yè)企業(yè)新產(chǎn)品項(xiàng)目數(shù),單位項(xiàng),指標(biāo)代碼x9;

(2)規(guī)模以上工業(yè)企業(yè)專利申請(qǐng)數(shù),單位件,指標(biāo)代碼x10;

(3)國內(nèi)專利申請(qǐng)受理量,單位項(xiàng),指標(biāo)代碼x11;

(4)技術(shù)市場(chǎng)成交額,單位億元,指標(biāo)代碼x12;

(5)公有經(jīng)濟(jì)企事業(yè)單位專業(yè)技術(shù)人員數(shù),單位人,指標(biāo)代碼x13。

因子F3(文化因子)

(1)版權(quán)合同登記數(shù),單位份,指標(biāo)代碼x14;

(2)普通高等學(xué)校本??剖谟鑼W(xué)位數(shù),單位萬人,指標(biāo)代碼x15;

(3)教育經(jīng)費(fèi),單位萬元,指標(biāo)代碼x16;

(4)圖書出版種數(shù),單位種,指標(biāo)代碼x17;

(5)公共圖書館組織各類講座次數(shù),單位次,指標(biāo)代碼x18;

(6)藝術(shù)表演團(tuán)體機(jī)構(gòu)數(shù),單位個(gè),指標(biāo)代碼x19。

因子F4(資源因子)

(1)工業(yè)污染治理完成投資,單位萬元,指標(biāo)代碼x20;

(2)人均水資源量,單位立方米每人,指標(biāo)代碼x21;

(3)造林總面積,單位千公頃,指標(biāo)代碼x22;

(4)自然保護(hù)區(qū)占轄區(qū)面積比重,單位百分比,指標(biāo)代碼x23;

(5)森林覆蓋率,單位百分比,指標(biāo)代碼x24;

(6)廢水排放總量,單位萬噸,指標(biāo)代碼x25。

通過考察上面四個(gè)主要因子25 個(gè)指標(biāo)來評(píng)價(jià)我國各省市社會(huì)發(fā)展綜合情況。

2 數(shù)據(jù)處理分析

2.1 數(shù)據(jù)預(yù)處理

在所選取的基本指標(biāo)中,存在著各種不同類型、不同性質(zhì)、不同量綱和不同數(shù)量級(jí)的指標(biāo),從而使得各指標(biāo)的評(píng)價(jià)方向和價(jià)值都各不相同。對(duì)于不同類型:地方財(cái)政的一般預(yù)算收入等正程指標(biāo),我們希望它的取值越大越好;而廢水排放總量等逆程指標(biāo)我們則希望其取值越小越好。在不同性質(zhì)方面,例如居民消費(fèi)指數(shù)等一些指標(biāo)則是屬于區(qū)間限制指標(biāo),它只在某一區(qū)間中取值才屬正常。并且各個(gè)指標(biāo)的量綱一般是不一樣的,例如地區(qū)生產(chǎn)總值的單位是“億元”,人均水資源量是“立方米/人”,造林總面積是“千公頃”等其他的單位。有些指標(biāo)存在數(shù)值上相差巨大,即各個(gè)指標(biāo)不在同一數(shù)量級(jí)下,例如經(jīng)營單位所在地進(jìn)出口總額這類數(shù)據(jù)的數(shù)量都在千萬以上,數(shù)量級(jí)為7,而自然保護(hù)區(qū)占轄區(qū)面積比重的數(shù)量在一百以內(nèi),數(shù)量級(jí)為1,這樣不便于相互之間進(jìn)行比較。由于指標(biāo)存在著這些差異,所以在綜合評(píng)價(jià)中必須對(duì)其進(jìn)行標(biāo)準(zhǔn)化的變換。

2.2 數(shù)據(jù)挖掘分析

2.2.1 相關(guān)分析

本文采用數(shù)據(jù)有四大因子25 個(gè)指標(biāo),將不同指標(biāo)之間的聯(lián)系擴(kuò)展到兩組因子之間的相互依賴關(guān)系,考慮使用相關(guān)分析,典型相關(guān)分析能夠研究兩組變量之間相關(guān)關(guān)系的一種多變量統(tǒng)計(jì)分析方法,能夠真正反映兩組變量之間相互依賴的線性關(guān)系,分別對(duì)四大因子兩兩之間綜合指標(biāo)來反映兩者之間相關(guān)關(guān)系。

探究F1 與F2 之間相關(guān)關(guān)系:經(jīng)過卡方檢驗(yàn),發(fā)現(xiàn)前三對(duì)典型變量的相關(guān)系數(shù)是顯著的,即通過檢驗(yàn)。故我們只需分析前三對(duì)典型相關(guān)變量。同時(shí)由于r1=0.988,r2=0.947,r3=0.841,說明前三對(duì)典型變量之間分別有較高的相關(guān)性,r1和r2尤為明顯。

通過兩變量的典型載荷可以得到前三對(duì)典型變量的線性組合,分別記為u1與v1,u2與v2,u3與v3。在第一組典型變量中,u1為經(jīng)濟(jì)因子的線性組合,其中x3,x4和x5較其他變量有較大的載荷,這說明經(jīng)濟(jì)因子主要受第一、第二和第三產(chǎn)業(yè)增加值的影響。v1為科技因子的線性組合,其中x10和x13的載荷較大,說明這兩個(gè)因素對(duì)科技因子影響較大,并且對(duì)于經(jīng)濟(jì)的發(fā)展中工業(yè)企業(yè)專利申請(qǐng)數(shù)與公有經(jīng)濟(jì)企事業(yè)單位專業(yè)技術(shù)人員數(shù)對(duì)其有著一定的促進(jìn)作用。

根據(jù)以上方法依次也可以探究因子F1 與F3,F(xiàn)1 與F4,F(xiàn)2 與F3,F(xiàn)2 與F4,F(xiàn)3 與F4 的相關(guān)關(guān)系。由相關(guān)分析可以看出,對(duì)于四個(gè)因子來說,進(jìn)行兩兩因子分析,彼此之間都有很大的影響,除了經(jīng)濟(jì)因子外,對(duì)于突出影響的變量在兩兩因子分析中各不相同,但這也表明這些因子的有效性,同時(shí)讓我們對(duì)這些變量以及各因子有了基本的了解。

2.2.2 系統(tǒng)聚類分析

由于數(shù)據(jù)主要分四大因子,典型相關(guān)分析說明彼此之間都有各自突出的影響,若直接對(duì)所有指標(biāo)進(jìn)行聚類預(yù)想效果不會(huì)很好,為力求達(dá)到獨(dú)立性和準(zhǔn)確性,考慮從四個(gè)方面針對(duì)于不同省市自治區(qū)進(jìn)行系統(tǒng)聚類分析,進(jìn)行比較。由于定義類與類之間的距離不同產(chǎn)生了不同的系統(tǒng)聚類分析方法,不同的方法彼此之間有不同的優(yōu)缺點(diǎn)。經(jīng)過比較考慮選擇采用類平均法和離差平方和法使得結(jié)果更加精確穩(wěn)定。

2.2.2.1 類平均法

類平均法將兩類之間距離平方定義為這兩類元素兩兩之間的平均來計(jì)算距離,即

其遞推公式為:

分別對(duì)各因子變量按類平均法進(jìn)行聚類,得到表1:

表1 采用類平均法個(gè)因子分類

由上表可以看出,北京、上海、江蘇、浙江和山東五個(gè)省在經(jīng)濟(jì)、科技以及文化方面較其他省、市、自治區(qū)有較顯著差異,但在資源方面西藏自治區(qū)、山東省、內(nèi)蒙古自治區(qū)和青海省較其他省、市、自治區(qū)有較顯著差異,這是符合實(shí)際情況的,且通過四個(gè)方面比較山東省都有比較突出優(yōu)勢(shì)。

2.2.2.2 離差平方和法(Ward 法)

類內(nèi)離差平方和反映了各自類內(nèi)樣品的分散程度,如果兩類相距較近,則合并后所增加的離差平方和應(yīng)較小,否則應(yīng)較大。于是定義Gp和Gq之間的平方距離為:

其中,Gr=Gp∪Gq,類間距離的遞推公式為:

分別對(duì)各因子按Ward 法進(jìn)行聚類,運(yùn)行結(jié)果可以將經(jīng)濟(jì)與科技分別分三類,文化與資源分別分四類。同時(shí)也可以看出,寧夏回族自治區(qū)、海南省、青島省以及西藏自治區(qū)在經(jīng)濟(jì)、科技和文化方面要落后于其他省、市、自治區(qū),而在資源方面相比其他省分要充足。這也反應(yīng)了我國目前的狀況,南方沿海大部分地區(qū)經(jīng)濟(jì)文化等都十分發(fā)達(dá),而中西部資源充分但經(jīng)濟(jì)建設(shè)等方面要落后于其他地區(qū)。

2.2.3 主成分分析與聚類分析

2.2.3.1 主成分分析

結(jié)果比較發(fā)現(xiàn)通過Ward 法聚類結(jié)果要比類平均法聚類要更加恰當(dāng),且更加符合實(shí)際情況,但通過上述聚類兩者都不能很好地反應(yīng)各省市的綜合狀況,只能單方面的去描述。對(duì)于這種多項(xiàng)指標(biāo),且某些指標(biāo)之間存在很強(qiáng)的的共線性,若是將四個(gè)因子一起進(jìn)行聚類,由于相關(guān)性等突出影響我們需要重新組合成一組新的相互無關(guān)的綜合指標(biāo)來代替原來的指標(biāo)。對(duì)于這種情況我們考慮先用主成分分析進(jìn)行初步判斷,再依據(jù)主成分分析結(jié)果對(duì)其進(jìn)行聚類。

主成分分析(PCA)是將多指標(biāo)化為少數(shù)幾個(gè)綜合指標(biāo)的一種的統(tǒng)計(jì)方法,主要目的是降維。

通過計(jì)算相關(guān)矩陣,求相關(guān)矩陣的特征值和主成分負(fù)荷,計(jì)算貢獻(xiàn)率與累積方差貢獻(xiàn)率,求出主成分載荷,最終確定主成分。

按照累積方差貢獻(xiàn)率和碎石圖可以選取四個(gè)主成分。

進(jìn)一步計(jì)算主成分得分,由主成分得分得到綜合得分及排名。

綜合得分:以各主成分的方差貢獻(xiàn)率為權(quán),將其線性組合得到綜合評(píng)價(jià)函數(shù)

故由加權(quán)估計(jì)綜合得分,以各主成分的方差貢獻(xiàn)率占兩個(gè)主成分總方差貢獻(xiàn)率的比重進(jìn)行加權(quán)匯總,得出各省、市、自治區(qū)的綜合得分,即

就綜合得分來看,廣東、江蘇、山東、浙江、河南這5 個(gè)省的綜合狀況居于全國水平前列,西藏、青海、寧夏、海南和甘肅居全國平均水平之末。由于是考慮綜合水平,所以北京、上海這些中國一線城市主要是經(jīng)濟(jì)文體教育方面十分領(lǐng)先,但類似于資源這些方面并不突出相反處于全國最后,所以最終排名前列并不包括這類城市。

2.2.3.2 主成分分析后聚類

通過主成分分析只能得到各省、市、自治區(qū)的排名,缺乏對(duì)其整體的了解以及各自之間的聯(lián)系,考慮對(duì)主成分分析后數(shù)據(jù)進(jìn)行聚類分析。結(jié)合前面結(jié)果選擇用Ward 法進(jìn)行聚類。聚類圖如圖1:

圖1 綜合聚類圖

表2 主成分分析后綜合分類

由上表以及結(jié)合聚類圖可以看出,北京、山東、浙江、江蘇、廣東這五個(gè)省可以分為一類,其總體發(fā)展?fàn)顩r較其他省、市、自治區(qū)有顯著優(yōu)勢(shì),而西藏、貴州、甘肅、新疆、青海、海南和寧夏這七個(gè)省整體水平處于下游。說明我們要加強(qiáng)中西部發(fā)展,因?yàn)橘Y源對(duì)于一個(gè)國家來說就是燃料,要縮小內(nèi)部差距,提倡西部建設(shè),不能只片面的追求經(jīng)濟(jì)發(fā)展,要全面綜合發(fā)展。

3 分析評(píng)價(jià)

采用不同的方法從不同方面考慮得到的結(jié)果都大不一樣,很多時(shí)候需要結(jié)合實(shí)際去進(jìn)行主觀判斷,缺乏客觀性。但結(jié)合實(shí)際可以使我們也更加容易去理解和判斷,得到一般性結(jié)果。

在數(shù)據(jù)分析過程中不同的因子對(duì)最后結(jié)果影響很大,所以還有待進(jìn)一步處理,可能是綜合指標(biāo)體系建立不恰當(dāng)導(dǎo)致的,需要引入其他指標(biāo)使得指標(biāo)體系變得更加完整合理。

[1] 歐陽建國.社會(huì)主義和諧社會(huì)綜合評(píng)價(jià)體系研究[J].浙江社會(huì)科學(xué),2006(2):16-22.

[2] 劉孝超,黃承鋒,王亮.主成分分析在地區(qū)經(jīng)濟(jì)社會(huì)發(fā)展綜合評(píng)價(jià)的應(yīng)用[J].重慶交通大學(xué)學(xué)報(bào)(社科版),2007(4):67-70.

[3] 王斌會(huì).多元統(tǒng)計(jì)分析及R 語言建模[M]廣州:暨南大學(xué)出版社,2014.

[4] 薛毅,陳立萍.R 統(tǒng)計(jì)建模與R 軟件[M].北京:清華大學(xué)出版社,2007.

猜你喜歡
自治區(qū)代碼聚類
走進(jìn)神奇的漢特-曼西自治區(qū)
伙伴(2019年7期)2019-08-13 06:40:49
創(chuàng)世代碼
創(chuàng)世代碼
創(chuàng)世代碼
創(chuàng)世代碼
基于DBSACN聚類算法的XML文檔聚類
關(guān)于召開第18屆24省(市、自治區(qū))4市鑄造學(xué)術(shù)會(huì)議的(第一輪)通知
基于改進(jìn)的遺傳算法的模糊聚類算法
一種層次初始的聚類個(gè)數(shù)自適應(yīng)的聚類方法研究
自適應(yīng)確定K-means算法的聚類數(shù):以遙感圖像聚類為例
大邑县| 武宣县| 苍南县| 丹棱县| 商城县| 东丰县| 牟定县| 诸城市| 板桥市| 启东市| 墨玉县| 四子王旗| 保山市| 讷河市| 周口市| 潮州市| 德庆县| 滨海县| 建阳市| 乌拉特前旗| 广德县| 法库县| 顺平县| 安国市| 乐昌市| 肇东市| 镇坪县| 田阳县| 进贤县| 屏边| 威远县| 磐安县| 垫江县| 徐水县| 益阳市| 大港区| 崇明县| 涡阳县| 建瓯市| 沂水县| 青岛市|