張燕杰 Zeyi Lin 鄭煜
(東北林業(yè)大學,哈爾濱,150040) (University of Illinois at Urbana-Champaign) (東北林業(yè)大學)
責任編輯:張 玉。
空氣質量指數(shù)(AQI)是定量描述空氣質量狀況的無量綱指數(shù),是以空氣中能夠對人體造成危害的污染物為基礎的空氣質量評價體系[1]。許多學者對AQI 進行研究分析,并取得了許多重要的成果。A.Kumar et al[2-3]利用PCA 神經網絡、主成分回歸模型、時間序列回歸模型以及二者的結合,對新德里市每日AQI 進 行 預 測。M.Ahmadi et al[4]在 對2000—2009年德黑蘭市AQI、高速路發(fā)展情況以及汽車更新?lián)Q代情況進行研究表明,3 者之間有直接關系。高慶先等[5]在對中美兩國空氣質量研究現(xiàn)狀的對比分析中表明,雖然中國環(huán)境空氣質量標準的研究、制定和發(fā)布的時間較晚,但發(fā)展迅速,標準中所包含的污染物指標更全面,更加客觀的反映了中國空氣污染特征。詹長根等[6]運用GIS 空間分析工具,對武漢市AQI 的空間分布特征進行了研究,同時分別建立了AQI 與PM2.5、PM10、CO、SO2、NO2、O3的一元線性回歸方程,結果表明:6 項污染物均分別與AQI 呈高度相關,且PM2.5與AQI 的相關程度最大。
以上研究分析了各個空氣污染物與AQI 的直接作用,但并未分析空氣污染物對AQI 的間接作用。本研究建立了空氣污染物與AQI 的主成分回歸方程,確定了對AQI 起主要作用的空氣污染物。運用通徑分析方法,研究各個空氣污染物與AQI 間的相互關系,分析出空氣污染物對AQI 的直接作用和間接作用,從而確定了空氣污染物對AQI 的總作用,彌補了一元、多元回歸分析與相關性分析方法的不足。
哈爾濱位于中國東北部,屬于中溫帶大陸性季風氣候,四季分明,冬季寒冷干燥,主要依靠燃煤供暖。根據(jù)哈爾濱市環(huán)保局公布的數(shù)據(jù)顯示,2014年,哈爾濱市空氣質量超標達到123 d,占全年空氣質量超標總量的33.7%,其中:1—2月份哈爾濱市空氣質量超標為47 d(輕度污染13 d,中度污染18 d,重度污染16 d,嚴重污染2 d),占2 個月總時間的79.7%。
本文選取哈爾濱市環(huán)保局在環(huán)保網(http://www.hrbh bj.gov.cn/)公布的2014年1—2月份AQI實時監(jiān)測數(shù)據(jù)。每日對監(jiān)測數(shù)據(jù)進行收集整理,得到了AQI 的實時值以及PM2.5、PM10、CO、SO2、NO2、O3(1h)和O3(8h)共7 項污染物的實時質量濃度。
主成分回歸是W.F.Massy 于1965年根據(jù)主成分分析的思想提出了主成分回歸[7]。主成分分析是消除多維隨機變量各個分量間線性相關性以及變量系統(tǒng)降維的基本方法。在自變量間存在嚴重的多重共線性的情況下,主成分回歸能消除多重共線性,并且極大地提高模型的精度和可靠性,保留了相關性顯著的所有自變量。主成分回歸模型的建立方法如下。
(1)對數(shù)據(jù)進行標準化處理,并計算樣本數(shù)據(jù)X的相關陣R;
(2)求矩陣R 的前m 個特征值,以及m 個特征值所對應的特征向量,保留特征值大于1 對應的主成分,從而確定k 個主成分;
(3)將k 個主成分與因變量進行最小二乘回歸;
(4)返回到原來的參數(shù),得到因變量對原始自變量的主成分估計模型。
主成分回歸模型的檢驗:
(1)回歸方程的顯著性檢驗。對于給定的水平α,當F>Fp-1,n-p(α)時,認為回歸方程各個自變量與因變量有顯著的線性關系。
(2)回歸系數(shù)的顯著性檢驗。對于給定的水平α,當t>tn-p(α/2)時,認為回歸系數(shù)顯著。
相關性分析與多元回歸分析方法,僅可以分析出自變量對因變量的直接作用,不能分析自變量對因變量的間接作用。而通徑分析是研究變量間的相互關系,將相關系數(shù)進行剖分的統(tǒng)計方法。它不僅可以反映自變量對因變量的直接作用,還可以反映一個自變量通過其它自變量對因變量的間接作用,從而確定出自變量對因變量的總作用,彌補了相關性分析與多元回歸分析方法的不足。通徑分析一般方法與步驟如下。
(1)標準化線性回歸的正則方程為Rxxb*=Rxy。Rxx為x1、x2、…、xp的 相 關 陣;為xj對y 的直接影響作用,rjkb*k為xj通過xk對y 的間接影響作用;Rxy為x 對y 的相關陣。
(2)由方程Rxxb*=Rxy,得到通徑系數(shù)Rxy,其中R-1xx是Rxx的逆矩陣。
(4)xj對y 的總決策系數(shù)為
哈爾濱市每年1—2月份最寒冷,由于供暖的原因,空氣質量是1 a 中較差的月份。根據(jù)哈爾濱市2014年1—2月份AQI 實時數(shù)據(jù)及主要空氣污染物質量濃度數(shù)據(jù),對PM2.5(ρ1)、PM10(ρ2)、CO(ρ3)、SO2(ρ4)、NO2(ρ5)、O3(1h)(ρ6)、O3(8h)(ρ7)、AQI(Ⅰaq)之間的相關性及多重共線性進行分析(見表1、表2)。
表1 相關性分析
表2 多重共線性分析
由表1可見:AQI 與PM2.5、PM10、CO、SO2、NO2顯著正相關,AQI 與O3(1h)、O3(8h)顯著負相關;CO與PM2.5、PM10、NO2,O3(1h)與O3(8h),PM2.5與PM10,相關性極顯著。由表2可見:最大條件數(shù)為47.470,遠大于10,說明自變量間存在較強的多重共線性。由方差比例可知,PM2.5、PM10、CO 之間存在多重共線性,O3(1h)與O3(8h)之間存在強的多重共線性。對存在多重共線性的數(shù)據(jù),建立多元線性回歸模型將會擴大模型誤差并破壞模型的穩(wěn)健性;為消除自變量間的多重共線性,建立主成分回歸模型。
以AQI(Ⅰaq)為因變量,PM2.5(ρ1)、PM10(ρ2)、CO(ρ3)、SO2(ρ4)、NO2(ρ5)、O3(1h)(ρ6)、O3(8h)(ρ7)為自變量,建立主成分回歸模型(見表3~表5)。
表3 方差貢獻率
由表3提取出2 個特征值大于1 的主成分,其累計方差貢獻率達到85.771%,包含了變量的大部分信息;因此,可以提取2 個主成分Z1、Z2,建立主成分回歸建模。
表4 主成分得分系數(shù)矩陣
表5 主成分回歸模型系數(shù)
根據(jù)表5中主成分回歸模型中主成分的系數(shù),可得到標準化的主成分回歸方程:
將式(1)帶入到式(2)中,可得到因變量對原始自變量的主成分回歸模型:
由表5可見:主成分回歸系數(shù)進行顯著性檢驗的t 值,分別為18.852、7.605、0.239,主成分回歸方程系數(shù)檢驗顯著。主成分回歸模型進行顯著性檢驗,得到F=15.138>F6,52(0.01),主成分Z1、Z2與因變量之間線性關系很顯著。根據(jù)主成分回歸模型可知,回歸方程中系數(shù)最大的變量為CO,因此CO 對AQI 起著主要的作用。
對因變量AQI(Ⅰaq)與自變量PM2.5(ρ1)、PM10(ρ2)、CO(ρ3)、SO2(ρ4)、NO2(ρ5)、O3(1h)(ρ6)、O3(8h)(ρ7)進行通徑分析,結果見表6。
由表6可得,ρi對Ⅰaq的直接決定系數(shù):R21=90.1%,R22=41.8%,R23=58.9%,R24=0.7%,R25=0.02%,R26=11.9%,R27=4.1%。
ρi各相關路徑對Ⅰaq的決定系數(shù):R12=56.1%,R13=-72.3%,R14=4.3%,R15=-1.1%,R16=10.7%,R17=-5.8%;R23=-72.1%,R24=4.6%,R25=-1.2%,R26=12.2%,R27=-6.7%;R34=4.9%,R35=-1.2%,R36=12.1%,R37=-6.6%;R45=-1.2%,R46=3.7%,R47=-5.4%;R56=8.7%,R57=-6.8%;R67=18.3%?!?”表示限制作用[8]。
ρi對Ⅰaq總決定系數(shù):R2=R2i+Rik=82.8%,i、k=1、2、…、7。
剩余因素ε對Ⅰaq的直接影響作用:b*ε=
剩余因素ε對Ⅰaq的決定系數(shù)
表6 通徑分析結果
通徑分析結果表明:
(1)PM2.5對AQI 的直接作用最大,CO 對AQI的直接作用次之,對AQI 直接作用最小的為NO2。
(2)PM2.5通過CO 對AQI 所起到的間接作用,大于其他污染物通過CO 對AQI 的間接作用。PM10、SO2、NO2通過CO 對AQI 所起到的間接作用,均大于它們對AQI 的直接作用。
(3)對AQI 總作用最大的為PM2.5,PM10次之,總作用最小的為O3(1h)。
(4)PM2.5對AQI 的決策系數(shù)最大,PM2.5是主要決定性因素。
(5)PM2.5對AQI 的直接決定系數(shù)達到了90.1%,CO 對AQI 的直接決定系數(shù)為58.9%。
(6)剩余因素ε 對AQI 的決策系數(shù)為17.2%,表明還有其他因素對AQI 起到影響作用。
[6]對武漢市AQI 的空間分布特征進行了研究,得出PM2.5、PM10、CO、SO2、NO2、O3與AQI 呈高度相關,且PM2.5與AQI 的相關程度最大。本文不僅得出AQI 與PM2.5、PM10、CO、SO2、NO2呈顯著正相關,AQI 與O3(1h)、O3(8h)呈顯著負相關;而且分析出CO 與PM2.5相關性最顯著,相關系數(shù)達到了0.942。CO 與PM10相關性次之,相關系數(shù)為0.939。PM2.5、PM10、CO 之間存在多重共線性,O3(1h)與O3(8h)之間存在強的多重共線性。
參考文獻[6]分別建立了AQI 與PM2.5、PM10、CO、SO2、NO2、O3的一元線性回歸方程。本文根據(jù)相關性分析結果,建立了AQI 與PM2.5、PM10、CO、SO2、NO2、O3(1h)、O3(8h)的主成分回歸模型,主成分回歸方程的顯著性檢驗與系數(shù)顯著性檢驗均通過?;貧w方程中系數(shù),最大的變量是CO,表明CO 是影響AQI 的主要因素。
參考文獻[2]、[3]、[6],只給出了PM2.5、PM10、CO、SO2、NO2、O3對AQI 的直接關系。本文不僅討論了空氣污染物與AQI 的直接關系,而且運用通徑分析理論分析出了PM2.5對AQI 的直接作用最大,CO 對AQI 的直接作用次之;也分析出PM2.5對AQI的總作用及決策系數(shù)均最大。PM2.5、PM10、SO2、NO2通過CO 對AQI 的間接作用,均大于它們對AQI 的直接作用,CO 在對AQI 的間接作用中起到了重要的影響。7 項主要空氣污染物對AQI 的總決定系數(shù)為82.8%。PM2.5的形成過程中,CO 是影響PM2.5質量濃度變化的決定性因素[9];因此,降低大氣中CO的質量濃度,可以有效的控制PM2.5質量濃度,從而控制AQI 的值,改善空氣質量。
哈爾濱市1—2月份寒冷干燥,主要依靠燃煤供暖,供暖過程中煤的不完全燃燒將導致空氣中的CO質量濃度升高,CO 質量濃度升高是導致AQI 值的升高的原因之一。因此,提高煤炭的充分利用率,減少汽車尾氣排放量及控制工業(yè)生產過程中產生的廢氣量,將有利于降低AQI 值,提高空氣質量。
參 考 文 獻
[1] 高敏,仇天雷,賈瑞志,等.北京霧霾天氣生物氣溶膠濃度和粒徑特征[J].環(huán)境科學,2014,35(12):4415-4421.
[2] Kumar A,Goyal P.Forecasting of daily air quality index in delhi[J].Science of the Total Environment,2011,409(24):5517-5523.
[3] Kumar A,Goyal P.Forecasting of air quality index in delhi using neural network based on principal component analysis[J].Pure and Applied Geophysics,2013,170(4):711-722.
[4] Ahmadi M,Mahmoudi P.Tehran air quality index during 2000—2009[J].Asian Journal of Chemistry,2012,24(11):4871-4874.
[5] 高慶先,劉俊蓉,李文濤,等.中美空氣質量指數(shù)(AQI)對比研究及啟示[J].環(huán)境科學,2015,36(4):1141-1147.
[6] 詹長根,吳藝,韋淑貞,等.基于GIS 的武漢市AQI 時空分布規(guī)律研究[J].地理空間信息,2014,12(5):62-64.
[7] 郭呈全,陳希鎮(zhèn).主成分回歸的SPSS 實現(xiàn)[J].統(tǒng)計與決策,2011(5):157-159.
[8] 袁志發(fā),贠海燕.試驗設計與分析[M].中國農業(yè)出版社,2007:220-226.
[9] 鄭煜,鄧蘭.基于PLS1 的哈爾濱市PM2.5與空氣污染物相關性分析[J].生態(tài)環(huán)境學報,2014,23(12):1953-1957.