杜寶強 楊明亮 張金潤
【摘要】通過北京市34個國控監(jiān)測站點,建立0.5、1、1.5、2、3、4、5km的緩沖區(qū),應(yīng)用土地利用回歸模型(Land UseRegression,LUR)對北京市采暖季與非采暖季PM2.5濃度進行空間分布模擬,并采用留一交叉互驗法驗證模型精度。結(jié)果表明:采暖季LUR模型調(diào)整R2為0.799,模擬精度為0.7992,均方根誤差(Root Mean Square Error,RMSE)為6.66μg·m-3;非采暖季LUR模型調(diào)整R2為0.807,模擬精度為0.8198,均方根誤差為5.91μg·m-3,模型表現(xiàn)良好。從模擬結(jié)果來看,北京市PM2.5主要分布在東南部人口、交通密集的平原區(qū)域,整體呈現(xiàn)南高北低的狀態(tài)。
【關(guān)鍵詞】PM2.5;空間分布;土地利用回歸模型;北京市
〔中圖分類號]X513 〔文獻標識碼〕A 〔文章編號〕1674-3229(2021)04-0051-05
0 引言
隨著經(jīng)濟的快速發(fā)展,環(huán)境污染問題也隨之而來??諝鈩恿W(xué)直徑小于等于2.5微米的顆粒物PM2.5是造成霧霾天氣的主要原因[1]。對PM2.5濃度進行空間分布模擬有助于推進我國大氣污染治理。
目前國內(nèi)外對大氣污染物濃度模擬的方法主要有空間插值、氣溶膠反演、土地利用回歸模型等[2]。其中土地利用回歸模型(Land Use Regres-sion,LUR)的特點是基于多種可能對大氣污染物產(chǎn)生影響的變量進行回歸訓(xùn)練,可以用來確定大氣污染物與影響變量之間的關(guān)系,從而模擬城市地區(qū)大氣污染物的空間分布,并在一定程度上識別大氣污染物的成因,而且還具有模擬精度高、考慮因素廣、數(shù)據(jù)易獲取等優(yōu)點,已在歐美、日本等國家得到了廣泛應(yīng)用[3-4]。國內(nèi)對PM2.5濃度的研究主要集中在來源分析、化學(xué)特征、環(huán)境危害及健康影響等方面[2,5],對LUR模型應(yīng)用處于起步階段,國內(nèi)吳健生等[6]、許剛等[7]、漢瑞英等[8]運用LUR模型模擬了研究區(qū)內(nèi)年均PM2.5濃度,但卻少有學(xué)者對不同時間段PM2.5濃度以及影響因素進行研究。
本研究基于采暖季與非采暖季兩個時間段建立回歸預(yù)測模型,分析PM2.5濃度在采暖季與非采暖季的空間分布,進一步驗證了LUR模型的適用性,揭示了PM2.5濃度相關(guān)影響因素。為大氣污染防治、城市土地及道路規(guī)劃、公共衛(wèi)生管理提供了科學(xué)依據(jù)。
1 材料與方法
1.1 數(shù)據(jù)來源及預(yù)處理
1.1.1 PM2.5濃度與氣象數(shù)據(jù)
PM2.5數(shù)據(jù)來自北京市范圍內(nèi)34個國控站點2018年11月-2019年10月空氣質(zhì)量日值數(shù)據(jù)(數(shù)據(jù)來源中國環(huán)境監(jiān)測總站http://www.cnemc.cn/)。對數(shù)據(jù)進行統(tǒng)計計算,得到34個監(jiān)測站點的采暖季(11月-3月)與非采暖季(4月-10月)PM2.5濃度。氣象數(shù)據(jù)來自于國家氣象科學(xué)數(shù)據(jù)中心的中國地面氣候資料日值數(shù)據(jù)(http://data.cma.cn/),采集了北京市20個氣象站點2018年11月-2019年10月觀測數(shù)據(jù),包括氣壓、風速、氣溫、相對濕度、降水量5類,對數(shù)據(jù)進行計算統(tǒng)計得到采暖季與非采暖季的氣象數(shù)據(jù),并通過Kriging插值法對采暖季與非采暖季的氣象數(shù)據(jù)進行插值模擬,提取監(jiān)測站點所在位置的氣象數(shù)據(jù)作為氣象因子。
1.1.2 高程與人口數(shù)據(jù)
高程數(shù)據(jù)來自Earth Data的中國區(qū)域30m分辨率的數(shù)字高程模型(Digital Elevation Model,DEM)數(shù)據(jù),人口數(shù)據(jù)來自WorldPop全球高分辨率人口計劃項目(www.worldpop.org),提取監(jiān)測站點所在位置的高程及人口數(shù)量作為高程因子和人口因子。
1.1.3 土地利用與路網(wǎng)數(shù)據(jù)
土地利用數(shù)據(jù)來自清華大學(xué)宮鵬等2017全球10m分辨率土地利用數(shù)據(jù),將北京市土地利用類型分成農(nóng)田、森林、草地、灌木、濕地、水域、不透水面、裸地8類,路網(wǎng)數(shù)據(jù)來自于OpenStreetMap,提取數(shù)據(jù)中的高速公路、干道、一級公路、二級公路4類作為北京市的路網(wǎng)數(shù)據(jù)。本研究參考已有的LUR模型緩沖半徑設(shè)置[9-10],以監(jiān)測站點為中心,設(shè)置0.5、1、1.5、2、3、4、5km為緩沖半徑,以緩沖區(qū)內(nèi)各類土地的面積及各類道路長度作為土地因子和路網(wǎng)因子。北京市土地利用及路網(wǎng)分布如圖1所示。
1.2 研究方法
1.2.1 LUR模型構(gòu)建
本研究采用的LUR模型是基于監(jiān)測站的大氣污染物濃度對周圍多種可能對大氣污染物產(chǎn)生影響的變量,進行多元線性回歸的模型。LUR模型的基本形式如式(1):
y=α0+α1x1+α2x2+…+αnxn+β(1)
式中y為因變量,即本研究中采暖季與非采暖季PM2.5濃度值,x1,x2,…,xn為自變量,即本研究各類影響因子,α1,α2,…,αn為待定系數(shù),β為隨機變量。構(gòu)建模型分為以下3步:(1)在SPSS中將PM2.5濃度與各影響因子進行雙變量相關(guān)性分析,去除與PM2.5濃度相關(guān)性不顯著(p>0.05)的變量。(2)在剩余變量中去除與同類相關(guān)性最高影響因子相關(guān)(皮爾森系數(shù)r>0.6)的變量。(3)以PM2.5濃度為因變量,剩余的變量為自變量進行逐步線性回歸,得到的回歸方程就是LUR模型。
1.2.2 模型驗證
模型的驗證采用留一交叉互驗(leave-one-outcross validation)[11],將34個監(jiān)測站點劃分為訓(xùn)練集(33個)和驗證集(1個),通過對訓(xùn)練集(33個)站點進行多元線性回歸,得到驗證集(1個)站點的預(yù)測值,對比預(yù)測值和實測值,重復(fù)34次。這種方法雖然繁瑣,但可以有效驗證模型精度。最后通過調(diào)整R2、均方根誤差(Root Mean Square Error,RMSE)、模擬精度3項指標來驗證模型。
1.2.3 PM2.5濃度模擬
在ArcGIS中通過創(chuàng)建漁網(wǎng)把北京市劃分成1km×1km規(guī)則格網(wǎng)點,通過LUR模型計算出各格網(wǎng)點PM2.5濃度預(yù)測值,再利用Kriging插值法就可以得到北京市的PM2.5濃度空間分布。
2 結(jié)果與討論
2.1 PM2.5濃度統(tǒng)計
根據(jù)圖2可以看出北京市2018年11月-2019年10月PM2.5濃度變化趨勢,采暖季(11月-3月)PM2.5整體濃度偏高,計算可得采暖季PM2.5濃度為58pμg·m-3,嚴重超出國家二級標準。非采暖季(4月-10月)PM2.5濃度為37μg·m-3,相對采暖季有所下降,但也只有8月份滿足了國家二級標準,遠達不到世衛(wèi)組織標準。
2.2 雙變量相關(guān)性分析
在SPSS中將PM2.5濃度與各影響因子進行雙變量相關(guān)性分析,去除與PM2.5濃度相關(guān)性不顯著(p>0.05)的變量(如不透水面、溫度、三級公路等),剩余變量中去除與同類相關(guān)性最高影響因子相關(guān)(皮爾森系數(shù)r>0.6)的變量(如森林_1000m,灌木_1500m等),最后滿足多元線性回歸的變量如表1所示。從表1可以看出影響因子在采暖季與非采暖季下呈現(xiàn)的相關(guān)性不同,采暖季PM2.5濃度與農(nóng)田、氣壓、高速公路、二級公路呈正相關(guān);與濕地、水體、森林、灌木、風速、降水量、相對濕度呈負相關(guān)。非采暖季PM2.5濃度與氣壓、人口、干道、高速公路呈正相關(guān);與水體、森林、灌木、風速、降水量、相對濕度、DEM呈負相關(guān)。其中水體、森林、灌木、風速、降水量、氣壓、相對濕度、高速公路與采暖季和非采暖季PM2.5都呈現(xiàn)很高的相關(guān)性,說明北京市PM2.5濃度受這些因素影響很大。
2.3 LUR模型構(gòu)建及精度驗證
將滿足多元線性回歸的變量與PM2.5濃度進行逐步線性回歸,逐步線性回歸可以有效避免自變量共線性的可能。由于PM2.5濃度在采暖季出現(xiàn)較高的情況,為了分析其原因,本文建立了采暖季與非采暖季LUR模型。從表2可以看出,進入采暖季LUR模型的變量有風速、相對濕度、森林、濕地;進人非采暖季LUR模型的變量有風速、降水量、氣壓、干道、一級公路。其中風速均參與了兩個模型的建立,且與PM2.5濃度呈負相關(guān)性,原因是大風可以使空氣中的細顆粒物稀釋和擴散,顆粒物不容易堆積,從而降低了濃度[12]。相對濕度、森林、濕地參與了采暖季LUR模型的建立,且均呈現(xiàn)負相關(guān)性,原因是相對濕度高使得PM2.5顆粒物吸濕變大,加速顆粒物沉降,森林、濕地的植物具有凈化和吸附PM2.5的功能[13-14]。降水量、氣壓、干道、一級公路參與了非采暖季LUR模型的建立,其中降水呈現(xiàn)負相關(guān)性,原因是降水對PM2.5顆粒具有清除作用[15];氣壓、干道、一級公路呈現(xiàn)正相關(guān)性,原因是高氣壓時,天氣系統(tǒng)穩(wěn)定,PM2.5顆粒物擴散條件不好,以及機動車駕駛排放的尾氣以及揚塵[16-17]。
為了進一步驗證模型精度,本研究采用留一交叉互驗法,從圖3可知采暖季LUR模型的模擬精度為0.7992,非采暖季LUR模型的模擬精度為0.8198,模型的模擬精度整體表現(xiàn)良好。經(jīng)過對PM2.5的監(jiān)測值和預(yù)測值進行計算,得到采暖季均方根誤差為6.66μg·m-3,非采暖季均方根誤差為5.91μg·m-3。
表2 PM2.5多元線性回歸結(jié)果吳健生等[6]利用LUR模型模擬重慶市PM2.5濃度的調(diào)整R2為0.800;Wu等[18]利用LUR模擬北京市PM2.5濃度的精度的調(diào)整Rz為0.58,均方根誤差為9.31μg·m-3。與文獻[6]、[18]相比,本研究的LUR模型誤差更小、解釋度更高。
2.4 采暖與非采暖季PM2.5模擬
通過ArcGIS創(chuàng)建漁網(wǎng)把北京市劃分成1km×1km規(guī)格網(wǎng)點,利用LUR模型計算出各格網(wǎng)點PM2.5濃度預(yù)測值,再用Kriging插值法就可以得到北京市的PM2.5濃度空間分布。北京市的采暖季與非采暖季PM2.5濃度模擬如圖4所示,可以看出北京市的PM2.5污染主要集中在東南部人口、交通密集的平原區(qū)域。通過對比采暖季與非采暖季PM2.5濃度,發(fā)現(xiàn)采暖季的PM2.5污染尤其嚴重。
3 討論
(1)采暖季的逆溫天氣以及人口密集區(qū)污染物排放對PM2.5濃度的影響很大,但本研究沒有加入研究區(qū)內(nèi)重點廢氣排污企業(yè),未來可以考慮加入研究區(qū)重點廢氣排污企業(yè)等因素,進一步探索PM2.5的相關(guān)影響因素。
(2)本研究是基于國控監(jiān)測站點,通過LUR模型進行北京市的PM2.5濃度空間分布模擬,但由于國控監(jiān)測站點主要分布在城市區(qū),在一定程度上限制了模型精度,未來可以考慮加入分布在偏遠地區(qū)的省控、縣控監(jiān)測站點進行模擬。同時本研究采用的LUR模型是通過線性回歸的方法,對于復(fù)雜的大氣污染物,模型解釋力度還遠遠不夠,未來可以考慮使用非線性回歸的方法,或者加入深度學(xué)習(xí)算法改進LUR模型來進一步提升模型的解釋性。
4 結(jié)論
(1)2018年11月-2019年10月北京市PM2.5濃度整體偏高,采暖季(11月-3月)PM2.5濃度為58μg·m-3,非采暖季(4月-10月)PM2.5濃度為37μg·m-3,嚴重超出國家二級標準和世衛(wèi)組織標準。PM2.5濃度整體呈現(xiàn)采暖季高、非采暖季低的現(xiàn)象,這與采暖季處于逆溫天氣多發(fā)季節(jié)有很大關(guān)系。
(2)采暖季PM2.5濃度與農(nóng)田、氣壓、高速公路、二級公路呈正相關(guān);與濕地、水體、森林、灌木、風速、降水量、相對濕度呈負相關(guān)。非采暖季PM2.5濃度與氣壓、人口、干道、高速公路呈正相關(guān);與水體、森林、灌木、風速、降水量、相對濕度、DEM呈負相關(guān)。采暖季LUR模型的變量有風速、相對濕度、森林、濕地;非采暖季LUR模型的變量有風速、降水量、氣壓、干道、一級公路。
(3)采暖季LUR模型調(diào)整R2為0.799,模擬精度為0.7992,均方根誤差為6.66μg·m-3:非采暖季LUR模型調(diào)整R2為0.807,模擬精度為0.8198,均方根誤差為5.91μg·m-3,模型表現(xiàn)良好。
(4)北京市PM2.5濃度主要分布在東南部人口、交通密集的平原區(qū)域,整體呈現(xiàn)南高北低的狀態(tài),PM2.5濃度受地形地貌、人口活動、機動車駕駛、污染物排放的影響很大。
[參考文獻]
[1]常彥君,王進,許明,等.河北地區(qū)霧霾天氣下大學(xué)生健康路徑研究lJ].廊坊師范學(xué)院學(xué)報(自然科學(xué)版),2019,19(4):87-90.
[2]劉炳杰,彭曉敏,李繼紅.基于LUR模型的中國PM2.5時空變化分析[J].環(huán)境科學(xué),2018,39(12):5296-5307.
[3]HOEK G,BEELEN R,HOOGH K D,et al.A Review ofLand-Use Regression Models to Assess Spatial Variation ofOutdoor Air Pollution[J].Atmospheric Environment,2008,42(33):7561-7578.
[4]TANG R,BLANGIARDO M,GULLIVER J.Using BuildingHeights and Street Configuration to Enhance Intra UrbanPM10,NOx,and N02 Land Use Regression Models[J].En-vironmental Science&Technology,2013,47(20):11643-11650.
[5]江笑薇,任志遠,孫藝杰.基于LUR和GIS的西安市PM2.5的空間分布模擬及影響因素[J].陜西師范大學(xué)學(xué)報(自然科學(xué)版),2017,45(3):80-87+106
[6]吳健生,廖星,彭建,等.重慶市PM2.5濃度空間分異模擬及影響因子[J].環(huán)境科學(xué),2015,36(3):759-767
[7]許剛,焦利民,肖豐濤,等.土地利用回歸模型模擬京津冀PM2.5濃度空間分布[J].干旱區(qū)資源與環(huán)境,2016,30(10):116-120.
[8]漢瑞英,陳健,王彬.利用LUR模型模擬杭州市PM2.5質(zhì)量濃度空間分布[J].環(huán)境科學(xué)學(xué)報2016,36 (9):3379-3385.
[9]陽海鷗,陳文波,梁照鳳.LUR模型模擬的南昌市PM2.5濃度與土地利用類型的關(guān)系[J].農(nóng)業(yè)工程學(xué)報,2017,33(6):232-239.
[10]彭霞,佘倩楠,龍凌波,等.基于移動監(jiān)測和土地利用回歸模型的上海市近地面黑碳濃度空間模擬[J].環(huán)境科學(xué),2017,38(11):4454-4462.
[11]王睿哲,胡榮明,李朋飛,等.基于 LUR模型的PM2.5度空間分布監(jiān)測及分析[J].環(huán)境工程學(xué)報,2020,14(10):2843-2852.
[12]張南,熊黑鋼,葛秀秀,等.北京市冬季霧霾天人體呼吸高度PM2.5變化特征對氣象因素的響應(yīng)[J].環(huán)境科學(xué),2016,37(7):2419-2427.
[13]高振翔,葉劍,周紅根,等.江蘇省PM2.5和PM10時空變化特征及其與氣象因子的關(guān)系[J].環(huán)境科學(xué)與技術(shù),2020,43(7):51-58.
[14]康曉明,崔麗娟,趙欣勝,等.北京市濕地削減大氣細顆粒物PM2.5功能[J].生態(tài)學(xué)雜志,2015,34 (10):2807-2813.
[15]欒天,郭學(xué)良,張?zhí)旌?,?不同降水強度對PM2.5的清除作用及影響因素[J].應(yīng)用氣象學(xué)報,2019,30(3):279-291.
[16]王嫣然,張學(xué)霞,趙靜瑤,等.北京地區(qū)不同季節(jié)PM2.5和PM10濃度對地面氣象因素的響應(yīng)[J].中國環(huán)境監(jiān)測,2017,33(2):34-41,
[17]袁小燕,葉芝祥,楊懷金,等.成都市道路細顆粒物污染特征[J].環(huán)境工程學(xué)報,2015,9(9):4598-4602.
[18]Wu J,Li J,Peng J,et al.Applying Land Use RegressionModel to Estimate Spatial Variation of PM2.5 in Beijing,China[J].Environmental science and pollution researchinternational,2015,22(9):7045-7061.
[收稿日期]2021-06-02
[基金項目]空間天氣學(xué)國家重點實驗室開發(fā)課題(201909);安徽省高校自然科學(xué)基金重點項目(KJ2019A0103)
[作者簡介]杜寶強(1972-),男,中國電子技術(shù)標準研究院高級工程師,研究方向:能源與環(huán)境污染防治。
[通訊作者]楊明亮(1995-),男,安徽理工大學(xué)電氣與信息工程學(xué)院碩士研究生,研究方向:能源與環(huán)境污染防治。