劉妍月 李軍成
摘要:針對大氣中PM2.5濃度的空間表征問題,提出了一種基于距離反比加權(quán)法的克里金插值模型進行PM2.5濃度空間表征的方法。該方法根據(jù)各濃度監(jiān)測站點公布的PM2.5濃度實時數(shù)據(jù)以及谷歌地球、百度地圖中的地理信息,建立能夠表征整個城市PM2.5濃度的空間連續(xù)曲面,從而獲得整個城市各個角落的PM2.5污染情況。實例表明,基于距離反比加權(quán)法的克里金插值模型是一種有效的PM2.5濃度空間表征方法,從而為大氣中PM2.5污染的防控提供一定的決策依據(jù)。
關(guān)鍵詞:
PM2.5濃度;空間表征;克里金插值;距離反比加權(quán)法
DOI: 10.14068/j.ceia.2015.06.019
中圖分類號:X513文獻標(biāo)識碼:A文章編號:2095-6444(2015)05-0084-05
PM2.5雖然在大氣成分中含量很少,但對空氣質(zhì)量和能見度等有重要的影響,因此已成為我國環(huán)境污染防控最重要的對象之一[12]。2013年1月14日,亞洲開發(fā)銀行和清華大學(xué)發(fā)布的一份名為《邁向環(huán)境可持續(xù)的未來:中華人民共和國國家環(huán)境分析》[3]中指出,世界上污染最嚴(yán)重的10個城市之中有7個城市位于中國,中國500個大型城市中,只有不到1%達到世界衛(wèi)生組織空氣質(zhì)量標(biāo)準(zhǔn)??梢?,中國的環(huán)境污染已經(jīng)到了相當(dāng)嚴(yán)重的地步。
近年來,針對大氣中PM2.5濃度的空間表征問題,國內(nèi)外學(xué)者先后采用了反距離權(quán)重插值、多項式插值、克里金插值等傳統(tǒng)空間插值方法進行城市PM2.5濃度的空間表征研究[45]。為了進一步提高精度,Liao等人[6]運用3種克里金插值方法對PM2.5濃度進行了空間表征并對其模型精度進行了評價;Wu等[7]使用反距離權(quán)重插值、克里金插值和協(xié)同克里金插值等3種方法研究美國南加州森林大火前后空氣中的PM2.5濃度變化,結(jié)果顯示火災(zāi)之前反距離權(quán)重插值方法預(yù)測效果較克里格插值方法好;王敏等[8]在肯定BP人工神經(jīng)網(wǎng)絡(luò)預(yù)測模型可用于揭示PM2.5濃度空間變異特征的同時,也證實了其相對于普通克里格插值方法在固定空間點位準(zhǔn)確預(yù)測PM2.5濃度方面的優(yōu)勢。
目前國際上普遍采用大氣環(huán)境定點監(jiān)測的方式來獲取各城市的污染狀況,而各監(jiān)測點觀測結(jié)果只可以表征監(jiān)測點周邊一定半徑范圍內(nèi)的濃度情況,無法表征整個城市的污染狀況及其空間差異,因此,如何基于離散監(jiān)測站點的監(jiān)測濃度數(shù)據(jù)準(zhǔn)確地獲取整個城市污染連續(xù)空間曲面也成為一個亟待解決的關(guān)鍵問題。為此,本文試圖以普通克里金插值模型為基礎(chǔ),結(jié)合距離反比加權(quán)法來進一步優(yōu)化插值模型,提出一種基于距離反比加權(quán)法的克里金插值模型進行PM2.5濃度空間表征的方法,為解決基于稀疏監(jiān)測數(shù)據(jù)準(zhǔn)確來獲取城市PM2.5污染空間分布規(guī)律這一問題提供一種有效的方法。
1模型的建立
基于距離反比加權(quán)法的克里金插值模型進行PM2.5濃度的空間表征研究的基本流程如圖1所示。
1.1數(shù)據(jù)采集
建立PM2.5濃度空間曲面之前需要收集某地區(qū)各監(jiān)測站點的地理位置數(shù)據(jù)以及各站點公布的PM2.5濃度數(shù)據(jù)。本文采用的PM2.5濃度觀測數(shù)據(jù)來源于政府環(huán)境保護部門網(wǎng)站公布的PM2.5濃度實時數(shù)據(jù)。為了確保普通克里金插值方法預(yù)測PM2.5濃度的精度及后續(xù)精度評價工作的開展,數(shù)據(jù)將選用多組不同日期不同時刻的PM2.5濃度數(shù)據(jù)。地理信息數(shù)據(jù)是以經(jīng)緯度坐標(biāo)為基礎(chǔ)的特殊數(shù)據(jù)。在利用經(jīng)緯度計算距離時,兩點之間的過球心大圓距離最接近實際距離,所以在計算時使用的是球面距離,計算公式為:
d=2Rarcsinsin2△φ2+cosφscosφfsin2△λ2(1)
式中,φs、φf代表兩點的緯度;△φ和△λ分別代表緯度和經(jīng)度之間的差值;R為地球半徑。
在克里金插值模型中,考慮到計算的復(fù)雜性,本文是直接將緯度、經(jīng)度對應(yīng)直角坐標(biāo)的X軸,Y軸,假定每度經(jīng)度和緯度之間的距離都看成是相等的。直接用坐標(biāo)點之間的歐式距離代表現(xiàn)實中兩地的距離。每度代表的距離為111.32 km。這也相當(dāng)于使用了地圖投影中的圓柱投影。谷歌地球和百度地圖使用的就是圓柱投影。
1.2建立普通克里金插值模型
克里金(Kriging)方法[911]又稱空間局部插值法,是一種以變異函數(shù)理論和結(jié)構(gòu)分析為基礎(chǔ),在有限區(qū)域內(nèi)對區(qū)域化變量進行無偏最優(yōu)估計的一種方法??臻g數(shù)據(jù)通常是一系列采樣觀測值,分布往往很不規(guī)則,但用戶在某些情況下需要獲知相同區(qū)域內(nèi)未知觀測點的數(shù)據(jù),根據(jù)空間相關(guān)性原則,這些未知點與采樣點之間存在著空間上的相關(guān)性,通常情況下,距離越近的點,其特征值越相似,反之亦然,因此空間插值算法應(yīng)運而生,是通過已知點推求未知點的計算方法[1213]??死锝鸩逯档暮诵乃咀儺惡瘮?shù),其定義為[11]:
[HJ0][QH0][HT5”SS]環(huán)境影響評價第37卷[HT][KH-*8D][HJ]
[HJ0][QH0]第6期
劉妍月等:大氣中PM2.5濃度的空間表征方法研究
[HT][KH-*8D][HJ]
γh=12Nh∑Nhi=1Zμa-Zμa+h(2)
式中,Nh為距離相隔h的點對數(shù);Z是特征值;γh表示變異函數(shù)值。
由式(2)可知變異函數(shù)的核心思想是按照點對間的距離大小分組,對每一個組中的每一個點對進行插值計算,求算平均值,即可得到變異函數(shù)值。在普通克里金插值模型中,待測點的特征值是根據(jù)周圍的已知點的線性組合推求得出,可表示為:
Z*x=∑ni=1λiZxi(3)
式中,Z*x表示待測點x的估計值;Zxi表示x周圍觀測點xi的特征值;n為參與計算的觀測點的個數(shù);λi為權(quán)重系數(shù),表示各空間樣本點處的觀測值對估計值Zxi的貢獻程度,區(qū)域化變量Zx的數(shù)學(xué)期望E=Zx=m可以是已知的或未知的。因此,克里金插值方法可以簡單地表達為:
Zs=μs+s(4)
式中,s為不同位置的點,本文為經(jīng)緯度表示的坐標(biāo);Zs為s處的變量值,它可以分解為確定趨勢值μs和自然相關(guān)隨機誤差εs。
1.3基于距離反比加權(quán)法的克里金插值
距離反比加權(quán)法[14]可表示為:
Zx0=∑ni=1Zxiγxi,x0∑ni=11γxi,x0(5)
式中,Zxi為xi處的平穩(wěn)過程值;γxi,x0為x0與xi之間的變異函數(shù)值,用兩點之間的距離代替。
1.4獲取PM2.5濃度的空間曲面
獲取PM2.5濃度的空間曲面時,首先將整個區(qū)域劃分為網(wǎng)絡(luò),以某一頂點的濃度估計值代替整個網(wǎng)絡(luò)區(qū)域的PM2.5濃度值,根據(jù)關(guān)注區(qū)域內(nèi)已知點的坐標(biāo)及其濃度值,采用距離對數(shù)反比加權(quán)法計算已知點對未知點濃度值的影響因素,在此基礎(chǔ)上計算未知點的PM2.5濃度值。
2應(yīng)用實例
本文選取的研究范圍為湖南省長沙市,位于東經(jīng)111°53′~114°15′,北緯27°51′~28°41′,包括岳麓區(qū)、天心區(qū)、雨花區(qū)、望城區(qū)等長沙市區(qū),雖然未覆蓋長沙市全部地區(qū),但人口密度非常大。長沙市的面積為11819.5平方公里,但僅有10個PM2.5濃度監(jiān)測點,具體分布如圖2所示。
注:圖片來源于長沙市環(huán)境保護局網(wǎng)站。
圖2長沙市PM2.5濃度監(jiān)測站點分布
Fig.2Monitoring sites of PM2.5 concentration in Changsha city
依據(jù)PM2.5濃度以及污染指數(shù)可以大致將污染等級分為六級,如表1所示。
2.1長沙市PM2.5濃度數(shù)據(jù)與地理信息采集
本文采用的PM2.5濃度觀測數(shù)據(jù)來源于長沙市環(huán)境保護局網(wǎng)站公布的10個監(jiān)測點數(shù)據(jù),分別收集了2015年2月23日11:00時、2015年2月24日18:00時以及2015年2月25日15:00時三個不同日期不同時段的PM2.5濃度數(shù)據(jù),并從谷歌地球和百度地圖中逐個收集長沙市10個監(jiān)測站點的經(jīng)緯度,PM2.5濃度與座標(biāo)數(shù)據(jù)如表2所示。
2.2長沙市PM2.5濃度空間曲面的建立
2.2.1繪制監(jiān)測站點位置散點圖
利用采集的10個PM2.5濃度監(jiān)測站點的經(jīng)緯度數(shù)據(jù)可以繪制出其位置散點圖,如圖3所示。
2.2.2繪制PM2.5濃度空間曲面
利用采集的某時刻的PM2.5濃度實時數(shù)據(jù)結(jié)合克里金插值模型建立PM2.5濃度空間分布曲面,選取的數(shù)據(jù)為長沙市2015年2月23日11:00時的PM2.5實時濃度數(shù)據(jù),曲面上的每一個點都有一個(X, Y, Z),X, Y分別表示此點的緯度和經(jīng)度,Z表示此點的PM2.5濃度值,可以通過點擊鼠標(biāo)在任意位置查看,如圖4所示;圖5為克里金插值模型建立的空間曲面效果圖;圖6為基于距離反比加權(quán)法的克里金插值模型效果圖。
2.3誤差分析
假設(shè)研究變量為Z(x),依次刪去Z(x)在采樣點xi(i=1,2,…,N)處的屬性值Z(xi)(i=1,2,…,N),其他點的屬性值保持不變,利用剩下的N-1個點的屬性值,插值被刪除的采樣點上的屬性值Z*(xi),并對N個插值計算結(jié)果與實際的結(jié)果進行比較,進行誤差的統(tǒng)計學(xué)分析,具體誤差分析方案如下:
方案1:根據(jù)2015年2月23日11:00時的濃度數(shù)據(jù),去掉湖南中醫(yī)藥大學(xué)站點的濃度數(shù)據(jù),實際濃度為102 μm/m3。
方案2:根據(jù)2015年2月23日11:00時的濃度數(shù)據(jù),去掉伍家?guī)X站點的濃度數(shù)據(jù),實際濃度為73 μm/m3。
方案3:數(shù)據(jù)改為2015年2月24日18:00時濃度數(shù)據(jù),去掉火車站點的濃度數(shù)據(jù),實際濃度為126 μm/m3。
方案4:數(shù)據(jù)改為2015年2月24日18:00時濃度數(shù)據(jù),去掉沙坪點的濃度數(shù)據(jù),實際濃度為93 μm/m3。
方案5:數(shù)據(jù)改為2015年2月25日15:00時濃度數(shù)據(jù),去掉高開區(qū)點的濃度數(shù)據(jù),實際濃度為110 μm/m3。
方案6:數(shù)據(jù)改為2015年2月24日15:00時濃度數(shù)據(jù),去掉經(jīng)開區(qū)點的濃度數(shù)據(jù),實際濃度為107 μm/m3。
用PM2.5濃度數(shù)據(jù)對各種插值方法進行交叉驗證,其結(jié)果見表3。
由表3中可知,總體上來看,利用基于距離反比加權(quán)法的克里金插值模型進一步提高了插值精度。但是也要注意到,該模型在某些情況下仍存在相對較大的誤差,這是因為監(jiān)測站點的實時監(jiān)測數(shù)據(jù)本身存在一定的誤差,另外還存在著諸多影響PM2.5濃度的因素,如機動車尾氣、施工揚塵、火電廠分布等,這些因素都對PM2.5濃度數(shù)據(jù)存在一定的影響。適當(dāng)?shù)乜紤]這些因素對PM2.5濃度的影響可逐漸提高插值模型的精度。
3結(jié)語
本文提出了一種基于距離反比加權(quán)法的克里金插值模型進行PM2.5濃度空間表征的方法。該方法能在稀疏監(jiān)測數(shù)據(jù)輸入條件下獲得城市內(nèi)部PM2.5污染的空間分布規(guī)律。通過與其他一些方法進行比較發(fā)現(xiàn),本文提出的方法是一種有效的PM2.5濃度空間表征方法,從而為環(huán)境保護部門的工作、人們?nèi)粘5纳畛鲂刑峁┝艘欢ǖ膮⒖家罁?jù)。
參考文獻(References):
[1]邵龍義, 時宗波, 黃勤. 都市大氣環(huán)境中可吸入顆粒物的研究[J]. 環(huán)境保護, 2000, 1: 2429.
[2]Makkonen U, Hellen H, Anttila P, et al. Size distribution and chemical composition of airborne particles in southeastern Finland during different seasons and wildfire episodes in 2006[J]. Science of the Total Environment, 2010, 408(3): 644651.
[3]張慶豐. 邁向環(huán)境可持續(xù)的未來:中華人民共和國國家環(huán)境分析[M]. 北京: 中國財政經(jīng)濟出版社, 2012.
[4]Jerrett M, Burnett R T, Ma R J, et al. Spatial analysis of air pollutionn and mortality in Los Angeles[J]. Epidemiology, 2005, 16(6): 727736.
[5]Bayraktar H, Turalioglu F S. A kringing based approach for locating a sampling site in the assessment of air quality [J]. Stochastic Environmental Research and Risk Assessment, 2005, 19(4): 301305.
[6]Liao D, Peuquet D J, Duan Y, et al. GIS approaches for the estimation of residentiallevel ambient PM concentrations [J]. Environmental Health Perspectives, 2006, 114(9): 13741380.
[7]Wu J, Winer A M, Delfino R J. Exposure assessment of particulate matter air pollution before, during, and after the 2003 Southern California wildfires [J]. Atmospheric Environment, 2006, 40(18): 33333348.
[8]王敏, 鄒濱, 郭宇, 等. 基于BP人工神經(jīng)網(wǎng)絡(luò)的城市PM2.5濃度空間預(yù)測[J]. 環(huán)境污染與防治, 2013, 35(9): 6366.
[9]孫洪泉. 地質(zhì)統(tǒng)計學(xué)及其應(yīng)用[M]. 北京: 中國礦業(yè)大學(xué)出版社, 1990.