国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于SPSS的我國(guó)各省市互聯(lián)網(wǎng)使用狀況分析

2019-10-08 09:03:43袁瑩靜陳婷陳龍
軟件 2019年2期
關(guān)鍵詞:互聯(lián)網(wǎng)技術(shù)聚類分析主成分分析

袁瑩靜 陳婷 陳龍

摘? 要: 隨著信息高科技的快速發(fā)展,互聯(lián)網(wǎng)技術(shù)將人類的文化傳播帶進(jìn)了一個(gè)嶄新的時(shí)代,即人們所稱為的網(wǎng)絡(luò)時(shí)代.我們幾乎每天都要與網(wǎng)絡(luò)打交道,它已經(jīng)成為日常生活中不可或缺的一部分,網(wǎng)絡(luò)已經(jīng)很大程度上改變了人們的生活。人們對(duì)信息的需求不斷增加,加大了人們的信息消費(fèi),而今互聯(lián)網(wǎng)已成為我們生活中不可缺少的東西,互聯(lián)網(wǎng)也正在潛移默化地影響著我們的生活方式、學(xué)習(xí)方式、交往方式。本文圍繞我國(guó)各省市的互聯(lián)網(wǎng)的使用狀況進(jìn)行分析,用聚類分析、主成分分析、對(duì)應(yīng)分析方法分析各省市的互聯(lián)網(wǎng)的使用情況,兼用SPSS軟件,以此得出數(shù)據(jù)分析的結(jié)果以及各省市在互聯(lián)網(wǎng)使用上的狀況的差異。

關(guān)鍵詞: 互聯(lián)網(wǎng)技術(shù);聚類分析;主成分分析;SPSS軟件

【Abstract】: With the rapid development of information technology, Internet technology has brought human cultural communication into a new era, which is called the Internet age. We have to deal with the Internet almost every day, and it has become impossible in daily life. Part of the gap, the Internet has largely changed people's lives. People's demand for information is increasing, and people's information consumption has increased. Today, the Internet has become an indispensable part of our lives. The Internet is also affecting our way of life, learning, and communication. This paper analyzes the use of the Internet in various provinces and cities in China, and analyzes the use of the Internet in various provinces and cities by cluster analysis, principal component analysis and corresponding analysis methods, and uses SPSS software to obtain the results of data analysis and the provinces and cities. Differences in the status of use of the Internet.

【Key words】: Internet technology; Cluster analysis; Principal component analysis; SPSS software

0? 引言

互聯(lián)網(wǎng)應(yīng)用正在中國(guó)的城市中迅速普及,已經(jīng)深入到人們的日常生活,并且直接影響了人們的觀念和行為。網(wǎng)絡(luò)正在改變傳統(tǒng)的媒介使用,正在改變?nèi)藗內(nèi)粘=涣鞣绞剑谝欢ǔ潭壬弦查_始改變政府和民眾交往的方式,并且作為一種開放的技術(shù),互聯(lián)網(wǎng)也正在對(duì)中國(guó)相對(duì)封閉的傳統(tǒng)、文化和體制產(chǎn)生深刻的影響。調(diào)查和研究互聯(lián)網(wǎng)網(wǎng)絡(luò)的使用現(xiàn)狀及其影響成為當(dāng)務(wù)之急。在當(dāng)今社會(huì)下,互聯(lián)網(wǎng)數(shù)據(jù)的統(tǒng)計(jì)有多個(gè)指標(biāo),隨著時(shí)代的變遷和網(wǎng)絡(luò)時(shí)代的迅速發(fā)展,指標(biāo)的時(shí)效性也會(huì)發(fā)生變化。因此本文以2017年中國(guó)統(tǒng)計(jì)年鑒統(tǒng)計(jì)的數(shù)據(jù),運(yùn)用聚類分析、主成分分析、對(duì)應(yīng)分析三種分析方法來分析數(shù)據(jù)指標(biāo)之間的內(nèi)在關(guān)系,從而分析出各省市在互聯(lián)網(wǎng)的使用下對(duì)各項(xiàng)指標(biāo)的應(yīng)用,進(jìn)而分析出各省市在互聯(lián)網(wǎng)的使用上數(shù)據(jù)的差別,分析出相應(yīng)的結(jié)論。

1? 相關(guān)理論方法

1.1? 聚類分析

聚類[1]分析指將物理或抽象對(duì)象的集合分組為由類似的對(duì)象組成的多個(gè)類的分析過程。聚類分析的原則是直接比較樣本中各事物之間的性質(zhì),將性質(zhì)相似的歸為一類,而將性質(zhì)差別比較大的分在不同類中,也就是說,同類事物之間的性質(zhì)差異小,類與類直接的事物性質(zhì)相差較大。描述樣本間的親疏程度最常用的是聚類,其中歐式距離[2]在聚類分析中用的最為廣泛。聚類的方法主要有系統(tǒng)聚類法,模糊聚類法,k-均值法,有序樣品聚類等。

1.2? 主成分分析

主成分分析[3](Principal component analysis)是由霍特林于1933年首先提出來的。主成分分析是利用的降維的思想,在損失很少的信息的前提下,把多個(gè)指標(biāo)轉(zhuǎn)化為幾個(gè)綜合指標(biāo)的多元統(tǒng)計(jì)方法。在對(duì)某一事物進(jìn)行實(shí)證研究時(shí),為了更全面、準(zhǔn)確地反映事物的特征及其發(fā)展規(guī)律、人們往往要考慮與其有關(guān)系的多個(gè)指標(biāo),這些指標(biāo)在多元統(tǒng)計(jì)學(xué)中也稱為變量。既然研究某一問題涉及的眾多變量之間有一定的相關(guān)性,就必然存在著起支配作用的共同因素。根據(jù)這一點(diǎn),通過對(duì)原始變量相關(guān)矩陣或協(xié)方差矩陣內(nèi)部結(jié)構(gòu)關(guān)系研究,利用原始變量的線性組合形成幾個(gè)綜合指標(biāo)(主成分),在保留原始變量主要信息的前提下起到降維與簡(jiǎn)化問題的作用,使得在研究復(fù)雜問題時(shí)更容易抓住主要矛盾。

1.3? 對(duì)應(yīng)分析

對(duì)應(yīng)分析[4](Correspondence analysis)也稱關(guān)聯(lián)分析、R-Q型因子分析,通過分析由定性變量構(gòu)成的交互匯總表來揭示變量間的聯(lián)系??梢越沂就蛔兞康母鱾€(gè)類別之間的差異,以及不同變量各個(gè)類別之間的對(duì)應(yīng)關(guān)系。

對(duì)應(yīng)分析的基本思想是將一個(gè)列聯(lián)表的行和列中各元素的比例結(jié)構(gòu)以點(diǎn)的形式在較低維的空間中表示出來。

它最大特點(diǎn)是能把眾多的樣品和眾多的變量同時(shí)作到同一張圖解上,將樣品的大類及其屬性在圖上直觀而又明了地表示出來,具有直觀性。另外,它還省去了因子選擇和因子軸旋轉(zhuǎn)等復(fù)雜的數(shù)學(xué)運(yùn)算及中間過程,可以從因子載荷圖上對(duì)樣品進(jìn)行直觀的分類,而且能夠指示分類的主要參數(shù)(主因子)以及分類的依據(jù),是一種直觀、簡(jiǎn)單、方便的多元統(tǒng)計(jì)方法。

對(duì)應(yīng)分析法整個(gè)處理過程由兩部分組成:表格和關(guān)聯(lián)圖。對(duì)應(yīng)分析法中的表格是一個(gè)二維的表格,由行和列組成。每一行代表事物的一個(gè)屬性,依次排開。列則代表不同的事物本身,它由樣本集合構(gòu)成,排列順序并沒有特別的要求。在關(guān)聯(lián)圖上,各個(gè)樣本都濃縮為一個(gè)點(diǎn)集合,而樣本的屬性變量在圖上同樣也是以點(diǎn)集合的形式顯示出來。

2? 數(shù)據(jù)獲取及分析

2.1? 數(shù)據(jù)來源

根據(jù)中國(guó)統(tǒng)計(jì)年鑒[5]公布的截止到2016年底我國(guó)31個(gè)省市互聯(lián)網(wǎng)使用狀況統(tǒng)計(jì)數(shù)據(jù),利用SPSS軟件將統(tǒng)計(jì)好的數(shù)據(jù)輸入得出以下分析。

2.2? 聚類分析

2.2.2? SPSS軟件分析

由圖1可以看出,廣東為第一類;北京為第二類;江蘇、浙江、山東為第三類;河北、河南,四川、安徽、湖北、遼寧、湖南、上海、福建為第四類;其余的為第五類。說明經(jīng)濟(jì)發(fā)達(dá)的省區(qū)如廣東、北京單獨(dú)分為了一類,浙江、江蘇等經(jīng)濟(jì)發(fā)展水平較高的地區(qū)歸為了一類[6]。

2.3? 主成分分析

利用31省標(biāo)準(zhǔn)化后的數(shù)據(jù)進(jìn)行分析,分析結(jié)果如表4所示。

由表4輸出結(jié)果看到,前兩個(gè)主成分y1,y2的方差占全部方差的比例為89.845%。我們就選取y1為第一主成分,y2為第二主成分,且這兩個(gè)主成分的方差和占全部方差的89.845%[7],即基本上保留了原來指標(biāo)的信息,這樣由原來的10個(gè)指標(biāo)轉(zhuǎn)化為 2個(gè)新指標(biāo),起到了降維的作用。

由圖2碎石圖可知,第二個(gè)及第三個(gè)特征值變化的趨勢(shì)已經(jīng)開始趨于平穩(wěn),所以,取前兩個(gè)或前三個(gè)主成分是比較合適的。這種方法確定的主成分個(gè)數(shù)與按累積貢獻(xiàn)率確定的主成分個(gè)數(shù)往往是一致的[8]。

對(duì)SPSS的因子分析模塊運(yùn)行結(jié)果輸出的成分矩陣的第i列的每一個(gè)元素分別除以第i個(gè)特征根的平方根,就得到主成分分析的第i個(gè)主成分的系數(shù),結(jié)果見表6。

由表7的得分中,有的省份的分?jǐn)?shù)是負(fù)數(shù),但并不表明這個(gè)省份的互聯(lián)網(wǎng)使用情況就是負(fù)的,這里的正負(fù)僅代表各省份與平均水平的位置關(guān)系[10],各省份的互聯(lián)網(wǎng)接入情況的平均水平算作零點(diǎn),這是我們?cè)谡麄€(gè)過程中將數(shù)據(jù)標(biāo)準(zhǔn)化的結(jié)果。

從表7可看到,廣東的互聯(lián)網(wǎng)的綜合使用情況最好,是第一名;浙江的互聯(lián)網(wǎng)的綜合使用情況為第二名;西藏的互聯(lián)網(wǎng)的綜合使用情況最差。

2.4? 對(duì)應(yīng)分析

上述表8給出了行和列記分的關(guān)系。慣例比例[11]代表各維度分別解釋總慣量的比例及累計(jì)百分比,從中可以看出第一維和第二維的慣量比例占總慣量的90.1%,因此可以選取兩維來進(jìn)行分析。

在SPSS的輸出結(jié)果中還給出了繪制最后疊加的散點(diǎn)圖所需的兩套坐標(biāo)。首先是關(guān)于行變量(地區(qū))的點(diǎn)坐標(biāo)表,例如北京(2.538,5.067),河北(–0.048,–0.708)等,如表9所示。

同樣地,列變量(互聯(lián)網(wǎng)變量)的點(diǎn)的坐標(biāo)表見輸出結(jié)果表10,例如互聯(lián)網(wǎng)寬帶接入端口(1.067, –0.860),互聯(lián)網(wǎng)撥號(hào)用戶(1.625,–0.360)等。

由以上兩張坐標(biāo)表可以得出如下疊加散點(diǎn)圖(見圖3)。從輸出結(jié)果圖3看出,我國(guó)的經(jīng)濟(jì)發(fā)達(dá)地區(qū),如廣東、江蘇等,主要在互聯(lián)網(wǎng)寬帶接入端口,移動(dòng)互聯(lián)網(wǎng)接入流量,移動(dòng)互聯(lián)網(wǎng)用戶和互聯(lián)網(wǎng)上網(wǎng)人數(shù)上對(duì)互聯(lián)網(wǎng)的使用占有較大比重;江西、安徽、遼寧、河北等主要在互聯(lián)網(wǎng)接入端口上分析出對(duì)互聯(lián)網(wǎng)的使用狀況,個(gè)別省區(qū),如上海、北京,浙江經(jīng)濟(jì)發(fā)展迅速,在互聯(lián)網(wǎng)的網(wǎng)頁(yè)數(shù),互聯(lián)網(wǎng)的撥號(hào)用戶、網(wǎng)站數(shù)和域名數(shù)上使用范圍普及廣。

從我國(guó)的目前的經(jīng)濟(jì)發(fā)展?fàn)顩r來看,大部分的省區(qū)都以逐漸的接入了互聯(lián)網(wǎng)寬帶,使用人數(shù)逐漸增多,互聯(lián)網(wǎng)的普及力度逐漸加大。隨著我國(guó)經(jīng)濟(jì)的不斷發(fā)展和進(jìn)步,這種省區(qū)之間的互聯(lián)網(wǎng)的使用情況也會(huì)發(fā)生一定的變化。

3? 結(jié)語(yǔ)

從統(tǒng)計(jì)分析結(jié)果上得出,廣東、浙江、江蘇的互聯(lián)網(wǎng)的綜合使用情況較好,互聯(lián)網(wǎng)在這些地區(qū)的

發(fā)展和使用情況領(lǐng)先于其他地區(qū)。當(dāng)前的時(shí)代屬于大數(shù)據(jù)時(shí)代[12],軟件測(cè)試面臨著很多的挑戰(zhàn).21世紀(jì)是信息化的時(shí)代,互聯(lián)網(wǎng)發(fā)展影響著世界各國(guó)的經(jīng)濟(jì)、政治、文化和社會(huì)的發(fā)展,同時(shí)推動(dòng)了社會(huì)生產(chǎn)生活和信息傳播的變革?;ヂ?lián)網(wǎng)為經(jīng)濟(jì)發(fā)展提供了平臺(tái),經(jīng)濟(jì)間的交流破除了空間與時(shí)間的限制,擴(kuò)大空間范圍,減少經(jīng)濟(jì)運(yùn)行成本。一個(gè)地區(qū)互聯(lián)網(wǎng)的使用情況可以很大程度的影響該地區(qū)的信息化程度,憑借互聯(lián)網(wǎng)的優(yōu)勢(shì)可以實(shí)現(xiàn)市場(chǎng)戰(zhàn)略優(yōu)化,帶動(dòng)地方經(jīng)濟(jì)收益持續(xù)增長(zhǎng)。同時(shí)互聯(lián)網(wǎng)的發(fā)展對(duì)于一個(gè)地區(qū)的經(jīng)濟(jì)戰(zhàn)略轉(zhuǎn)型提出了嚴(yán)格要求,把握互聯(lián)網(wǎng)經(jīng)濟(jì)趨勢(shì)是地方經(jīng)濟(jì)轉(zhuǎn)型的重點(diǎn)。根據(jù)分析結(jié)果顯示,互聯(lián)網(wǎng)寬帶接入端口、移動(dòng)互聯(lián)網(wǎng)用戶、移動(dòng)互聯(lián)網(wǎng)接入流量、互聯(lián)網(wǎng)上網(wǎng)人數(shù)、網(wǎng)站數(shù)這些因素在互聯(lián)網(wǎng)的發(fā)展和使用中起著很大的推動(dòng)作用。因此地方政府對(duì)于網(wǎng)絡(luò)的使用和發(fā)展中可以從以下幾個(gè)方面入手:首先對(duì)互聯(lián)網(wǎng)知識(shí)的普及是一個(gè)重要的方面,從公民入手,使得他們對(duì)于網(wǎng)絡(luò)的經(jīng)濟(jì)效應(yīng)有一定的了解;其次政府可以對(duì)互聯(lián)網(wǎng)的安裝和使用制定相應(yīng)的惠民政策;最后政府應(yīng)著重關(guān)注各地區(qū)的經(jīng)濟(jì)戰(zhàn)略轉(zhuǎn)型,以網(wǎng)絡(luò)經(jīng)濟(jì)為中心構(gòu)建新的格局,把握網(wǎng)絡(luò)經(jīng)濟(jì)改革的風(fēng)向。因此對(duì)于一個(gè)地區(qū)互聯(lián)網(wǎng)的普及可以著重從這些方面入手,進(jìn)而可以更好地推動(dòng)互聯(lián)網(wǎng)和經(jīng)濟(jì)發(fā)展的進(jìn)一步結(jié)合,使得經(jīng)濟(jì)的發(fā)展結(jié)構(gòu)得到轉(zhuǎn)型,經(jīng)濟(jì)發(fā)展水平得以提升。

參考文獻(xiàn):

杜淑穎. 基于大型數(shù)據(jù)集的聚類算法研究[J]. 軟件, 2016, 37(01): 132-135.

何曉群, 現(xiàn)代統(tǒng)計(jì)分析方法與應(yīng)用[M], 北京: 中國(guó)人民大學(xué)出版社, 1998.

趙海霞, 武建. 淺析主成分分析方法[J]. 科技信息, 2009(2).

對(duì)應(yīng)分析數(shù)學(xué)模型及其應(yīng)用, 陶鳳梅, 韓燕等[M]. 北京: 科學(xué)出版社, 2008.

中國(guó)統(tǒng)計(jì)年鑒. 北京: 中國(guó)統(tǒng)計(jì)出版社, 2017.

Bryan F. J. Manly. Multivariate Statistical Methods: A Primer. Chapman and Hall, 1986.

MacQueen, J. Some Methods for Classification and Analysis of Multivariate Observations, the 5th Berkley Symposium on Mathematics. Statistics and Probability, 1967.

張文宇, 王秀秀, 任露, 等. 改進(jìn)的主成分聚類分析法在教育信息化中的應(yīng)用[J]. 軟件, 2015, 36(7): 10-16.

王學(xué)仁, 王松桂. 實(shí)用多元統(tǒng)計(jì)分析. 上海: 上??茖W(xué)技術(shù)出版社, 1990.

袁志發(fā), 宋世德. 多元統(tǒng)計(jì)分析. 北京: 科學(xué)出版社, 2009.

G. A. F. Seber. Multivariate Observations. John Wiley & Sons, Inc., 1984.

張琪. 大數(shù)據(jù)背景下軟件測(cè)試的挑戰(zhàn)與展望[J]. 軟件, 2018, 39(6): 181-183.

猜你喜歡
互聯(lián)網(wǎng)技術(shù)聚類分析主成分分析
網(wǎng)絡(luò)時(shí)代大學(xué)生信仰教育問題探析
互聯(lián)網(wǎng)技術(shù)在廣播電視領(lǐng)域的應(yīng)用與探究
主成分分析法在大學(xué)英語(yǔ)寫作評(píng)價(jià)中的應(yīng)用
農(nóng)村居民家庭人均生活消費(fèi)支出分析
手機(jī)銀行發(fā)展過程中的相關(guān)問題研究
江蘇省客源市場(chǎng)影響因素研究
SPSS在環(huán)境地球化學(xué)中的應(yīng)用
考試周刊(2016年84期)2016-11-11 23:57:34
長(zhǎng)沙建設(shè)國(guó)家中心城市的瓶頸及其解決路徑
基于在線教育的大數(shù)據(jù)研究
基于省會(huì)城市經(jīng)濟(jì)發(fā)展程度的實(shí)證分析
江陵县| 永泰县| 温宿县| 盖州市| 延川县| 九台市| 迁安市| 会同县| 闻喜县| 大竹县| 滦平县| 抚州市| 罗城| 新巴尔虎左旗| 班玛县| 宕昌县| 黄陵县| 元谋县| 塔城市| 阜康市| 丰顺县| 龙井市| 商都县| 兴文县| 安吉县| 英超| 怀化市| 神池县| 黔西县| 喀喇沁旗| 应城市| 民乐县| 横峰县| 芦山县| 孟连| 乌拉特后旗| 泸水县| 镇远县| 怀集县| 于都县| 广东省|