黃文霞 李民
摘? 要: 本文主要分析北京、天津、河北、山西、遼寧、吉林、上海、江蘇、浙江、安徽、福建等11個地區(qū)的基本設施建設投資、消費價格指數(shù)、公共交通人數(shù)、AAAA級旅游景點數(shù)、住宿、餐飲業(yè)服務人數(shù)、接待入境旅游人數(shù)、旅游外匯收入、園林、綠地面積等8個因素對各地區(qū)旅游業(yè)發(fā)展的影響程度,根據(jù)2015年(中國統(tǒng)計年鑒)的相關數(shù)據(jù),首先進行相關分析,分析各變量之間的相關性,其次利用多元統(tǒng)計方法中的主成分分析方法和因子分析方法,借助SPSS軟件,提取出3個影響旅游業(yè)的主要因素最后構造這3個主要因素與8個可控因素之間的線性方程及綜合得分函數(shù),通過Excel計算出各個地區(qū)的綜合得分。
關鍵詞: SPSS;相關分析;主成分分析;因子分析
中圖分類號: TP391. 41? ? 文獻標識碼: A? ? DOI:10.3969/j.issn.1003-6970.2019.01.031
【Abstract】: This paper mainly analyzes the infrastructure construction investment, consumer price index, public transportation number, AAAA-level tourist attractions, accommodation, and accommodation in 11 areas including Beijing, Tianjin, Hebei, Shanxi, Liaoning, Jilin, Shanghai, Jiangsu, Zhejiang, Anhui, and Fujian. According to the relevant data of 2015 (China Statistical Yearbook), the relevant analysis of the number of catering service, the number of inbound tourists, the foreign exchange income of tourism, the garden and the green area will be analyzed and analyzed. The correlation between the variables, and then the principal component analysis method and factor analysis method in the multivariate statistical method, using the SPSS software to extract three main factors affecting the tourism industry, the final construction of these three main factors and 8 controllable The linear equation between the factors and the comprehensive score function are used to calculate the comprehensive scores of each region through Excel.
【Key words】: SPSS; Correlation analysis; Principal component analysis; Actor analysis
0? 引言
隨著我國的改革開放和繁榮發(fā)展,各地區(qū)旅游人數(shù)逐年增多,如何更好的發(fā)展旅游業(yè)是各地區(qū)面臨的一個重要課題。地區(qū)基礎設施的完善,經(jīng)濟的發(fā)展以及旅游資源的科學開發(fā)利用,管理水平的提高對旅游業(yè)的發(fā)展至關重要。本文利用2015年《中國統(tǒng)計年鑒》[3] 11個地區(qū)的基本設施建設投資、消費價格指數(shù)、公共交通人數(shù)、AAAA級旅游景點數(shù)、旅游服務設施情況、接待入境旅游人數(shù)、旅游外匯收入、園林、綠地面積這8個因素的數(shù)據(jù)資料。其中,從南方選取了四個地區(qū),包括江蘇、浙江、上海、福建;從中部選取了兩個地區(qū),包括山西、安徽;從北方選取了五個地區(qū),包括遼寧、吉林、北京、天津、河北。收集的原始數(shù)據(jù)如表1所示。
1? 相關分析
相關分析是適當?shù)慕y(tǒng)計指標衡量變量之間相關程度的強弱及相關的方向。相關分析包括了簡單相關分析、偏相關分析和距離相關分析。本文研究所
采用的是簡單相關分析,簡單相關分析是在兩兩變量之間進行的。不同類型的變量數(shù)據(jù),應采用不同的相關分析方法。
運用SPSS19.0軟件對表1中的數(shù)據(jù)進行相關分析,得到Pearson相關系數(shù)表如表2所示。
表2給出了Pearson相關系數(shù),它以一個矩陣的形式表示出來。從中可以看出,各變量之間的相關系數(shù)(r)都大于或者接近0.5,說明各變量之間是相關的。
2? 主成分分析
主成分分析[4–5]也稱主分量分析,是由霍特林于1993年首先出的。主成分分析是利用降維的思想,在損失很少信息的前提下,把多個指標轉(zhuǎn)換為幾個綜合指標的多元統(tǒng)計方法。通過主成分分析,可以從事物之間錯綜復雜的關系中找出一些主要成分,從而能有效利用大量統(tǒng)計數(shù)據(jù)進行定量分析,揭示變量之間的內(nèi)在關系,得到對事物特征及其發(fā)展規(guī)律的一些神層次的啟發(fā),把研究工作引向深入。
2.1? SPSS19.0進行主成分分析[6]
根據(jù)以對十一個地區(qū)8個因素的主成分分析得到,影響各地區(qū)旅游發(fā)展的第一主成分因素為旅游規(guī)模與收入方面的因素。旅游規(guī)模的擴大、旅游收入的增加能直接影響到區(qū)域旅游事業(yè)的發(fā)展;其次是區(qū)域消費與綠化建設對旅游業(yè)的影響,據(jù)目前來看,旅游消費對于人們選擇旅游地來說還是一個重要的影響因素。通過各地區(qū)的綜合因素得分的排序看到:北京、上海、江蘇、浙江是最強勢的地區(qū),這些地區(qū)有著很好的旅游資源與旅游環(huán)境。遼寧、福建、安徽這幾個地區(qū)在區(qū)域消費與綠化建設方面比較有優(yōu)勢,但是景點建設還不夠完善,旅游收入與規(guī)模偏低。天津、河北、山西等地區(qū)整體相對薄弱,還有很大的發(fā)展空間。
3? 因子分析
因子分析的思想始于1904年查爾斯·斯皮爾曼(Charles Spearman)對學生考試成績的研究。因子分析模型是主成分分析的推廣。它也是利用降維的思想,由研究原始變量相關矩陣內(nèi)部的依賴關系出發(fā),把一些具有錯綜復雜關系的變量歸結(jié)為少數(shù)幾個綜合因子的一種多變量統(tǒng)計分析方法。相比主成分分析,因子分析更傾向于描述原始變量之間的相關關系,因此,因子分析的出發(fā)點是原始變量的相關矩陣[9]。
運用SPSS軟件對原始數(shù)據(jù)進行因子分析,初始因子載荷矩陣(見表7)、公因子方差(見表7)。
由表9可知,因子分析一共提取了三個主成分,這三個主成分因子的特征值分別為 ;各因子的方差貢獻率分別為54.293%、、18.657%、13.652%;提取的三個主成分因子的累計方差貢獻率達到86.602%,即說明基本上保留了原來指標的信息。通過旋轉(zhuǎn)平方和載入,可知主成分1的貢獻率為35.069%,主成分2的貢獻率為33.602%,主成分3的貢獻率為17.931%。
為了解釋方便對因子進行旋轉(zhuǎn)得到旋轉(zhuǎn)后的因子載荷矩陣,如表10所示。
其中,因子得分為正值,表示該地區(qū)此因子表現(xiàn)高于平均水平;因子得分為負值,表示該地區(qū)此因子表現(xiàn)低于平均水平。由表11的分析結(jié)果,結(jié)合各地區(qū)在三個公共因子上的得分和綜合得分,即可對各地區(qū)的旅游發(fā)展狀況進行評價。綜合得分靠前的地區(qū)是江蘇、北京和上海,他們都擁有較好的旅游資源和環(huán)境。遼寧、福建、安徽這幾個地區(qū)在消費價格指數(shù)和園林綠地面積上比較占有優(yōu)勢,但是景點建設還不夠完善,旅游收入與規(guī)模偏低,需要加強景點建設,以吸引更多的游客。而天津、河北、山西等地區(qū)整體相對薄弱,還有很大的發(fā)展空間。
4? 主成分分析和因子分析的結(jié)果對比
根據(jù)兩種分析方法的結(jié)果,我們可以看出在各主成分(公共因子)所體現(xiàn)的指標略有不同,如表12所示。
從主成分分析和因子分析的綜合排名上看,兩者的排名雖然順序不一樣,但是大概的分段還是一致,北京、上海、江蘇、浙江都是前四名,遼寧、福建、安徽這幾個地區(qū)居中,天津、河北、山西這幾個地區(qū)靠后,故得出的結(jié)論基本一致。
5? 結(jié)論
根據(jù)本文對這十一個地區(qū)8個因素的多元統(tǒng)計分析,可以得到以下結(jié)論:
第一,影響各地區(qū)旅游發(fā)展的主要因素為旅游規(guī)模與收入方面的因素,旅游規(guī)模的擴大、旅游收入的增加能直接影響到區(qū)域旅游事業(yè)的發(fā)展。
第二,區(qū)域消費與綠化建設對旅游業(yè)的影響也比較重要,旅游消費對于人們選擇旅游地來說還是一個重要的影響因素。
第三,北京、上海、江蘇、浙江是最強勢的地區(qū),這些地區(qū)有著很好的旅游資源與旅游環(huán)境。
第四,遼寧、福建、安徽這幾個地區(qū)在區(qū)域消費與綠化建設方面比較有優(yōu)勢,但是景點建設還不夠完善,旅游收入與規(guī)模偏低。
第五,天津、河北、山西等地區(qū)整體相對薄弱,還有很大的發(fā)展空間。
參考文獻
何曉群. 多元統(tǒng)計分析[M]. 北京: 中國人民大學出版社, 2004.
賈俊平, 何曉群, 金勇進. 統(tǒng)計學[M]. 北京: 中國人民大學出版社, 2012.
中國國家統(tǒng)計局. 中國統(tǒng)計年鑒[R]. 北京: 中國統(tǒng)計出版社, 2015.
Javed A. Face Recognition Based on Principal Component Analysis[J]. International Journal of Image, Graphics and Signal Processing (IJIGSP), 2013, 5(2): 38.
He Lianghua. Multi-Dimension Principal Component Analy sis based on face recognition[J]. The Journal of New Indus tria lization, 2012, 2(1): 59-65.
何亮. 主成分分析在SPSS中的運用[J]. 山西農(nóng)業(yè)大學學報, 2007(4): 44-46.
何應婷, 等. SPSS統(tǒng)計分析[M]. 北京: 電子工業(yè)出版社, 2010.
薛薇. 基于SPSS的數(shù)據(jù)分析[M]. 北京: 中國人民大學出版社, 2006.
唐功爽. 基于SPSS的主成分分析于因子分析的辨析[J]. 統(tǒng)計教育, 2007(2).
田里. 旅游經(jīng)濟學[M]. 北京: 科學出版社, 2004.