顧 靜, 李 想, 李 娜, 江 暢
(南京郵電大學(xué)地理與生物信息學(xué)院,江蘇南京 210023)
基于統(tǒng)計分析的江蘇省霧霾影響因素研究
顧 靜, 李 想, 李 娜, 江 暢*
(南京郵電大學(xué)地理與生物信息學(xué)院,江蘇南京 210023)
為對江蘇省霧霾的治理提出有針對性、科學(xué)有效的措施,綜合運用多元統(tǒng)計分析、主成分分析和因子分析等方法,對江蘇省各地級市的霧霾影響因素和空氣質(zhì)量指標(AQI)的關(guān)系進行了對比分析。結(jié)果表明:江蘇省第二產(chǎn)業(yè)占比、面積和人均機動車擁有量與霧霾污染均呈負相關(guān)。最后提出江蘇省第二產(chǎn)業(yè)占比小和占地面積小的城市應(yīng)更加注重霧霾污染的防治,江蘇省人均機動車擁有量小的城市應(yīng)更加重視制定和執(zhí)行限制機動車排放的相關(guān)規(guī)定,江蘇省13個地級市應(yīng)更加注重霧霾防治的經(jīng)驗交流,進行多城市聯(lián)合治理霧霾。
霧霾影響因素;多元統(tǒng)計分析法;非參數(shù)檢驗;因子分析;主成分分析
霧霾不僅污染生態(tài)環(huán)境,還嚴重影響人類的身心健康。李金嵐[1]研究認為,霧霾天氣能見度較低,極易引發(fā)交通事故,危害人類生命財產(chǎn)安全。張軍強[2]研究認為,霧霾中的顆粒污染物不僅會引發(fā)心肌梗塞,造成心肌缺血或者損傷,還易使人產(chǎn)生悲觀情緒,甚至導(dǎo)致心理疾病。目前,各國學(xué)者對霧霾的研究主要集中于氣候特征、影響因素、危害和治理措施,尤其是對霧霾影響因素的研究較多。學(xué)者多從氣象和能源消費結(jié)構(gòu)2個方面對霧霾的影響因素進行研究。由于氣象存在許多不確定因素,因此筆者不予研究。在能源消費結(jié)構(gòu)方面,李振宇等[3]研究認為,煤、石油、天然氣等能源的消費是大氣污染物的主要來源。關(guān)于霧霾的影響因素,學(xué)者通過理論分析和統(tǒng)計分析進行了研究。但是理論分析僅停留在口頭,缺乏科學(xué)論證方法的支持,沒有說服力。王珊等[4]對1960—2012年西安地區(qū)霧霾日數(shù)與氣象因素變化規(guī)律進行了研究。徐相明等[5]對上海徐家匯和奉賢霧霾日數(shù)氣候變化特征進行了分析。整體來看,學(xué)者運用統(tǒng)計分析方法對霧霾影響因素的研究多停留在氣象學(xué)方面,對生產(chǎn)生活中污染源與霧霾的相關(guān)性研究較少。筆者通過選取2014年1月江蘇省各地級市各種可能影響霧霾產(chǎn)生因素及霧霾的相關(guān)數(shù)據(jù),分別運用多元統(tǒng)計分析法、主成分分析法和因子分析法對霧霾天氣成因進行定量分析,并提出緩解江蘇省霧霾現(xiàn)狀的建議,旨在為江蘇省霧霾防治提供科學(xué)依據(jù)與借鑒。
1.1 研究方法
1.1.1 Spearman相關(guān)系數(shù)檢驗。 利用非參數(shù)檢驗中的Spearman相關(guān)系數(shù)檢驗來判斷霧霾的主要影響因素。有效彌補霧霾的測度變量——空氣質(zhì)量指標(Air Quality Index,AQI)及其影響因素的分布事先未知的缺陷。Spearman相關(guān)系數(shù)設(shè)置如下:
(1)
相關(guān)系數(shù)γs的概率分布為
(2)
其中,
(3)
1.1.2 Kendall-τ相關(guān)系數(shù)檢驗。Kendall-τ相關(guān)系數(shù)可以用來表示正負相關(guān)性。為了使結(jié)果更加精確,同時采用非參數(shù)檢驗中的Kendall-τ相關(guān)系數(shù)檢驗與Spearman相關(guān)系數(shù)檢驗,共同判斷霧霾的主要影響因素。τ相關(guān)系數(shù)設(shè)置如下:
(4)
τ的概率分布為
(5)
其中,
(6)
1.1.3 多元線性回歸分析。多元線性回歸模型是指有多個解釋變量的線性回歸模型,用于解釋被解釋變量與多個解釋變量之間的線性關(guān)系,多元線性回歸的數(shù)學(xué)模型為
y=β0+β1x1+…+βpxp+ε0
(7)
式中,ε0為隨機誤差,滿足
E(ε0)=0,var(ε0)=σ2
(8)
對式(7)求期望,則有
E(y)=β0+β1x1+…+βpxp
(9)
(10)
1.1.4 主成分分析。主成分分析是通過對原始變量相關(guān)矩陣或協(xié)方差矩陣內(nèi)部結(jié)構(gòu)關(guān)系的研究,利用原有變量的線性組合,將具有相關(guān)性的多個原始變量形成幾個綜合指標(主成分)。這些主成分既可以反映原來多個變量的大部分信息,又互不重疊。主成分分析的每個主成分都是各原始變量的線性組合,即
Fi=∑X,i=1,2,…,p
(11)
其中,F(xiàn)i為主成分,X為原始變量,∑為協(xié)方差矩陣。
X=[X1X2…Xp]T
(12)
αi=[αi1αi2…αip]T
(13)
(14)
(15)
(16)
1.1.5 因子分析。 因子分析是將眾多原始變量濃縮成少數(shù)幾個公因子變量,使得公因子變量具有較強可解釋性的一種多元統(tǒng)計分析方法。若干個原始變量被分解成公因子的線性組合,即
Xi=ai1F1+ai2F2+…+aipFp+ei,i=1,2,2…,q
(17)
其中,F(xiàn)為公因子,aij為因子載荷,ei為特殊因子。
1.2 城市的選取 筆者選取了江蘇省南京、無錫、徐州、常州、蘇州、南通、連云港、淮安、鹽城、揚州、鎮(zhèn)江、泰州、宿遷13個地級市進行研究。
1.3 指標的選取
1.3.1 空氣質(zhì)量指標。選取2014年1月13個地級市每日的AQI數(shù)據(jù),并選擇將1月的AQI相加取平均值來反映該月的空氣質(zhì)量水平。
1.3.2 衡量城市規(guī)模的指標。GDP、面積和人口數(shù)量均來源于《江蘇省統(tǒng)計年鑒2014》。
1.3.3 衡量機動車排放污染的指標。機動車量、人均機動車保有量、單位面積機動車量。關(guān)于機動車輛,選取截至2013年12月的機動車保有量。由于江蘇省13個地級市的規(guī)模不同,為了增加可比性,通過2個間接指標來表示城市的機動車量情況,分別為單位面積機動車量和人均機動車保有量。其中,單位面積機動車量是為了將機動車量與城市面積規(guī)模相結(jié)合,人均機動車保有量是為了將機動車量與城市人口規(guī)模相結(jié)合。
單位面積機動車量(萬輛/ km2)=機動車量(萬輛)/各地面積(km2)
人均機動車保有量(輛/人)=機動車量(萬輛)/各地人口(萬人)
1.3.4 衡量工業(yè)排放污染的指標。包括第二產(chǎn)業(yè)增加值、第二產(chǎn)業(yè)占比、工業(yè)主要污染物排放量。第二產(chǎn)業(yè)是指按“三次產(chǎn)業(yè)分類法”劃分的國名經(jīng)濟中的一個產(chǎn)業(yè)部門。第二產(chǎn)業(yè)的企業(yè)大多是污染排放大戶,其生產(chǎn)規(guī)模在一定程度上能代表工業(yè)排放污染水平。
第二產(chǎn)業(yè)占比=各地第二產(chǎn)業(yè)增加值(億元)/各地GDP總值(億元)
對于工業(yè)排放污染,由于各個城市所處地區(qū)及經(jīng)濟發(fā)展水平不同,直接的第二產(chǎn)業(yè)增加值可比性不足,因此,筆者選取2013年第二產(chǎn)業(yè)增加值占GDP的比值來表示各地的工業(yè)規(guī)模。工業(yè)主要污染物排放量是指工業(yè)二氧化硫和工業(yè)煙粉塵排放量。這些數(shù)據(jù)來源于國家數(shù)據(jù)網(wǎng),筆者選取了2013年數(shù)據(jù)。
1.4 變量設(shè)置 根據(jù)“1.3”中的指標進行變量設(shè)置,如表1所示。
2.1 多元統(tǒng)計分析 繪制散點圖,觀察Xi(i=1~9)與Y(AQI)之間的關(guān)系(圖1)。從城市規(guī)模來看,AQI與人口、面積GDP都沒有明顯的線性關(guān)系或非線性關(guān)系(圖1a~c)。從機動車污染排放來看,機動車擁有量人均機動車擁有量與AQI沒有明顯的線性關(guān)系或非線性關(guān)系。但是AQI與人均機動車擁有量呈較明顯的負相關(guān)趨勢(圖1d~f)。從工業(yè)污染排放來看,第二產(chǎn)業(yè)增加值和工業(yè)主要污染物排放量與AQI都沒有明顯的線性關(guān)系或非線性關(guān)系。但是AQI與第二產(chǎn)業(yè)占比呈明顯的負相關(guān)趨勢(圖1g~i)。
2.2 統(tǒng)計檢驗 由于數(shù)據(jù)選取的是江蘇省13個地級市的單月數(shù)據(jù),難以完全根據(jù)散點圖判斷AQI與各影響因素的相關(guān)性。為了檢驗AQI和各潛在因素的相關(guān)性,采用非參數(shù)檢驗方法對各影響因素進行相關(guān)性檢驗。為了使結(jié)果更精準,采用Spearman相關(guān)系數(shù)和Kendall-τ 相關(guān)系數(shù)同時進行檢驗。相關(guān)性檢驗結(jié)果見表2。
由于Spearman 相關(guān)系數(shù)檢驗在第2類和第3類各有1個變量與Y顯著相關(guān),所以將選取Spearman 相關(guān)系數(shù)檢驗中的置信度(單側(cè))為0.01的結(jié)果并結(jié)合散點圖進行分析。從城市規(guī)模來看,X1、X2、X3與Y沒有相關(guān)性。由此可知,江蘇省霧霾的影響因素與城市規(guī)模無關(guān)。
表1 變量設(shè)置
圖1 各指標與AQI的關(guān)系Fig.1 Relationship between different indexes and AQI
從機動車污染排放來看,X4、X6與Y無顯著相關(guān)性,但X5有明顯的負相關(guān)趨勢。機動車擁有量絕對值多的城市一般都對機動車排放標準有著嚴格的規(guī)定和管理,如蘇州等城市。因此,機動車的絕對擁有量與AQI無顯著相關(guān)性。污染較嚴重的城市(如徐州等),人口較多,但機動車擁有量相對較少,而污染程度較輕的城市(如蘇州等),人口相對較少,但機動車擁有量相對較多,因此AQI與人均機動車擁有量呈負相關(guān)。
表2 顯著的變量及其檢驗相關(guān)系數(shù)
注:**表示在置信度(單側(cè))0.01水平顯著相關(guān);*表示在置信度(單側(cè))0.05水平顯著相關(guān)。
Note: * * indicated significant correlation at the 0.01 level of confidence (Unilateral); * indicated significant correlation at the 0.05 level of confidence (Unilateral).
從工業(yè)污染排放來看,AQI與X9和X8的絕對值均無關(guān)。但X7與AQI呈顯著負相關(guān)。通過數(shù)據(jù)對比和查閱資料發(fā)現(xiàn),江蘇省整體經(jīng)濟水平相對較高,近年來,對工業(yè)污染物的排放等紛紛加強整治措施,而江蘇省第二產(chǎn)業(yè)占比高的城市由于產(chǎn)值高,治理投資費用也相應(yīng)較大,即X7與AQI呈顯著負相關(guān)。對X5、X7和Y進行多元分析,回歸模型為
Y=β0+β1X5+β2X7
(18)
式中,β0、β1、β2為待估參數(shù)。
由已知數(shù)據(jù),利用SPSS進行回歸分析,結(jié)果表明,R2為0.503,擬合優(yōu)度較好,因此可接受該模型。由表3可知,該模型為
Y=161.804-21.368X5-18.852X7
(19)
表明人均機動車擁有量和第二產(chǎn)業(yè)占比越大的城市,霧霾治理效果越好,霧霾污染的可能性越小。
2.3 主成分分析和因子分析 以主成分分析法作為提取因子的方法,采用因子分析法進行分析,以X1~X9作為原始變量,結(jié)果見表4。由表4可知,X1、X2的特征值大于1.000,X3的特征值接近于1.000,且X1、X2、X3的累加貢獻度為96.058%,能夠解釋原始變量的大多數(shù)信息。因此,提取的3個公因子(F1、F2、F3)較為合理,使用這3個公因子對江蘇省13個地級市的霧霾影響因素進行分析。
表3 變量回歸結(jié)果
由于部分變量初始載荷矩陣的大小差異不顯著,因子的實際含義模糊不清,無法命名,因此使用方差最大正交旋轉(zhuǎn)法進行因子旋轉(zhuǎn),使得變量在某個因子載荷趨于1.000,其他趨于0。旋轉(zhuǎn)后的因子載荷矩陣如表5所示。由表5可知,公因子F1在X1、X3、X4、X5、X6、X8、X9的載荷較大,可以命名為除面積和第二產(chǎn)業(yè)占比外的其他公因子(簡稱為其他公因子);公因子F2在X2上的載荷較大,可以命名為面積因子;公因子F3在X7上的載荷較大,可以命名為第二產(chǎn)業(yè)占比因子。
由主成分分析法及表5可知,公因子F1、F2、F3的模型可分別用下式表示:
F1=0.890X12+0.981X3+0.984X4+0.829X5+0.842X6+0.950X8+0.915X9
(18)
F2=10.939X2
(19)
F3=0.915X7
(20)
表明F2與X1、X3、X4、X5、X6、X8、X9呈正相關(guān),即人口、GDP、第二產(chǎn)業(yè)增加值、主要污染物排放量、機動車與其他因子呈正相關(guān);F2與X2呈負相關(guān),即面積因子與面積呈負相關(guān);F3與X7呈正相關(guān),即第二產(chǎn)業(yè)占比因子與第二產(chǎn)業(yè)呈正相關(guān)。
表4 因子分析結(jié)果
表5 旋轉(zhuǎn)后的原始因子載荷矩陣
繪制提取的3個公因子與AQI的散點圖,如圖2所示。從圖2可見,F(xiàn)1、F3與AQI呈負相關(guān),F(xiàn)2與AQI呈正相關(guān)。由主成分分析和因子分析結(jié)果可知,X1、X3、X4、X5、X6、X8、X9與F7成正相關(guān),由圖2可知,F(xiàn)1與AQI呈負相關(guān),因此X1、X3、X4、X5、X6、X8、X9與AQI呈負相關(guān);F2與X2呈負相關(guān),與AQI呈正相關(guān),因此面積與AQI呈負相關(guān);F3與X7成呈相關(guān),與AQI呈負相關(guān),因此X7與AQI呈負相關(guān)。綜上可得,X1、X2、X3、X4、X5、X6、X7、X8、X9與AQI呈負相關(guān)。
筆者利用2014年1月江蘇省的AQI數(shù)據(jù),結(jié)合江蘇省統(tǒng)計年鑒的相關(guān)數(shù)據(jù),采用多元統(tǒng)計分析法和主成分分析、因子分析法相結(jié)合的2種方法,分別對江蘇省的主要霧霾影響因素進行了分析。第1種方法以反映霧霾嚴重程度的AQI作為Y,以城市規(guī)模、機動車排放、工業(yè)污染排放等9個變量作為X,分別與Y繪制散點圖,并進行非參數(shù)檢驗,分析它們之間的相關(guān)關(guān)系。然后對顯著的變量進行多元線性回歸分析,發(fā)現(xiàn)第二產(chǎn)業(yè)占比、人均機動車擁有量是顯著影響因素,具體表現(xiàn)為:①第二產(chǎn)業(yè)占比與霧霾污染呈負相關(guān),因為第二產(chǎn)業(yè)占比越大的城市對霧霾污染的治理越嚴格,措施越全面;②人均機動車擁有量與霧霾污染呈負相關(guān),這是由于人均機動車擁有量多的城市對機動車排放的規(guī)定嚴格,執(zhí)行力度更加徹底。
圖2 AQI與公因子的散點Fig.2 Correspondence analysis between AQI and components
第2種方法以主成分分析為提取公因子的方法,對城市規(guī)模、機動車污染排放、工業(yè)污染排放等9個變量進行因子分析,提取公因子,進而對公因子與AQI進行散點圖分析,最終得出城市規(guī)模、機動車排放、工業(yè)污染排放等9個變量與AQI呈負相關(guān)。
通過以上2種方法對江蘇省13個地級市的AQI影響因素進行分析,均得出第二產(chǎn)業(yè)占比、面積、人均機動車擁有量與AQI呈負相關(guān)。該結(jié)論有悖于常理。這是由于工業(yè)污染重、人均機動車多、面積大的城市雖然很容易出現(xiàn)霧霾,但這些城市已經(jīng)提前采取多項措施對霧霾進行防治,如南京在霧霾多發(fā)季,一些重污染企業(yè)常常停產(chǎn)。從該結(jié)論也可以看出,江蘇省霧霾較嚴重的城市(如南京等)的治理措施有效,江蘇省霧霾相對較輕的城市(如揚州、南通等)應(yīng)采取更為有效的治理措施,更加重視霧霾的治理與防治。
通過對以上分析,筆者提出如下緩解霧霾污染的有效方法:①第二產(chǎn)業(yè)占比小和占地面積小的城市應(yīng)更加注重霧霾污染的防治;②人均機動車擁有量小的城市應(yīng)更加重視制定和執(zhí)行限制機動車排放的相關(guān)規(guī)定;③江蘇省13個地級市應(yīng)更加注重霧霾防治的經(jīng)驗的交流,進行多城市聯(lián)合治理霧霾。
[1] 李金嵐.論霧霾天氣的成因危害及防治措施[J].資源節(jié)約與環(huán)保,2013(10):146.
[2] 張軍強.霧霾的現(xiàn)狀及治理措施[J].河南農(nóng)業(yè),2014(21):33-34.
[3] 李振宇,黃格省,李項杰,等.從能源消費結(jié)構(gòu)分析北京霧霾天氣成因及防治措施[J].古代石油石化,2013(6):12-16.
[4] 王珊,修天陽,孫揚,等.1960-2012年西安地區(qū)霧霾日數(shù)與氣象因素變化規(guī)律分析[J]. 環(huán)境科學(xué)學(xué)報, 2014,34(1): 19-26.
[5] 徐相明, 顧品強,李聰.上海徐家匯和奉賢霧、霾日數(shù)氣候變化特征分析[J]. 大氣科學(xué)研究與應(yīng)用, 2014(2): 55-64.
[6] 薛薇,SPSS統(tǒng)計分析方法及應(yīng)用[M].3版.北京:電子工業(yè)出版社,2013:186.
Research on the Influential Factors of Fog in Jiangsu Province Based on the Statistical Analysis
GU Jing, LI Xiang, LI Na, JIANG Chang*
(Nangjing University of Posts and Telecommunications, College of Geographic and Biologic Information, Nanjing, Jiangsu 210023)
In order to put forward targeted for fog haze of governance in Jiangsu Province, scientific and effective measures, multivariate statistical analysis method, principal component analysis, factor analysis and other methods are integrated to study relationship between AQI and haze influence factors of each city in Jiangsu Province. The result showed that the proportion of the second industry, area and per capita volume of motor vehicles of Jiangsu Province have a negative correlation with the fog and haze pollution . Finally, the second industry of Jiangsu Province area than small and should pay more attention to the city covers an area of prevention of haze pollution, vehicle ownership per capita in Jiangsu Province small city should pay more attention to the formulation and implementation of the relevant provisions of restrictions on vehicle emissions, 13 prefecture level cities in Jiangsu Province should pay more attention to the haze prevention of the exchange of experience, multi city joint governance haze.
Haze influencing factor; Multivariate statistical analysis; Non-parametric test; Factor analysis; Principal component analysis
顧靜(1995- ),女,江蘇連云港人,本科生,專業(yè):測繪工程。*通訊作者,講師,碩士,從事遙感信息的處理和應(yīng)用。
2016-09-30
S 181.3
A
0517-6611(2016)34-0105-05